임상교육자를 위한 인센티브: 인센티브의 영향은 복잡하기에 조심해야 한다 (Med Educ, 2020)
Incentives for clinical teachers: On why their complex influences should lead us to proceed with caution
Katherine M. Wisener1 | Erik W. Driessen2 | Cary Cuncic3 | Cassandra L. Hesse4 | Kevin W. Eva5 

1 소개
1 INTRODUCTION

의욕적인 임상 교사를 모집하고 유지하는 것은 어려울 수 있다. 교사 수가 부족하거나 임상의가 수업 의욕이 없을 때 의대생과 전공의들의 교육의 질이 떨어질 수 있다. Suboptimal한 해결책은 지도자당 학생 수가 증가하거나 교육자가 소진에 굴복하는 등 Suboptimal한 학습 조건으로 이어진다. 학습자가 교육 의욕이 없는 임상의에게 배정되면 부정적인 역할 모델링이 가능해지고 피드백 대화가 상처가 되거나, 학생들이 동정심 있고 효과적인 간병인이 될 수 있는 모든 범위의 역량을 개발하는데 어려움을 겪을 수 있다. 그렇긴 하지만, 열정적이고 헌신적인 임상 교사들도 동기 부여 문제에 면역이 되지 않는다. 실습, 체계 및 교육 수요가 계속 증가함에 따라 임상의는 일상적인 교육 활동을 통합하는 데 어려움을 겪는 경우가 많습니다.
Recruiting and retaining motivated clinical teachers can be challenging.1, 2 When teacher numbers are insufficient, or when clinicians are not motivated to teach, the quality of education for medical students and residents can suffer. Suboptimal solutions lead to suboptimal learning conditions, such as increases in the number of students per preceptor or leading the educator to succumb to burnout. When learners are assigned to clinicians who are not motivated to teach, negative role modelling becomes likely and feedback conversations can become hurtful or leave students struggling to develop the full range of competencies that will make them compassionate and effective caregivers.3, 4 That said, even enthusiastic and dedicated clinical teachers are not immune to motivational issues. As practice, systemic and educational demands continue to increase, clinicians often struggle with incorporating educational activities into their day to day.

이러한 문제들은 일상적으로 의과대학들이 임상의들의 [교육 노력에 대한 인센티브와 보상]을 제공하는 방법을 찾도록 한다. 이에 따라 프로그램 리더들의 감사를 표시하기 위해 [금전적 보상, 교수상, 감사장 등]이 일반적으로 사용되고 있다. 불행하게도, 최근 리뷰에서, 우리는 인센티브가 종종 역효과를 낼 수 있다는 충분한 증거를 발견했고, 원하는 행동을 장려하기보다는 동기를 감소시켰다. 이러한 현상에 대한 여러 설명이 있으며 각 전경이 인센티브가 영향을 미치는 메커니즘이 다르기 때문에 이론 간 통합은 어렵다. 또한, 요약된 메커니즘은 반드시 상호 배타적이지는 않으므로, 다양한 맥락에서 인센티브가 수행하는 역할을 더 잘 이해하기 위해 [여러 관점을 민감한 개념으로 사용할 필요가 있음]을 시사한다. 예를 들어,

  • 심리학의 [인지 평가 이론가]들은 상award과 같은 외적인 인센티브가 그들이 가르치는 것으로부터 받는 즐거움에 의해 본질적으로 추진되는 사람들을 의욕을 잃게 할 수 있다고 주장한다.
  • 반면에, 조직 행동의 [형평성 이론가]들은 동기를 감소시키는 불공정에 대한 인식을 촉진하지 않기 위해 [자신이 투입하는 노력]과 비교하여 [적절한 규모의 인센티브]를 설정하는 것의 중요성을 강조한다.
  • 동기부여-행동경제학의 [군중이론가]들은 [이타적이라고 느끼는 것으로부터 받는 보상]을 감소시킬 수 있다는 두려움 때문에 자원봉사와 같은 [친사회적 활동에 인센티브를 주는 것에 대해 경고]한다.

These problems routinely lead medical schools to seek ways of providing incentives and rewards for clinicians’ teaching efforts. As a result, financial compensation, teaching awards and letters of appreciation are commonly used to demonstrate program leaders’ gratitude.5 Unfortunately, in a recent review, we found ample evidence that incentives can often backfire, reducing motivation rather than encouraging the desired behaviour.6 There are multiple accounts of this phenomenon and integration across theories is difficult as each foregrounds different mechanisms through which incentives have an influence. Further, the mechanisms outlined are not necessarily mutually exclusive, thereby suggesting the need to use multiple perspectives as sensitising concepts to better understand the role incentives play in divergent contexts.

  • Cognitive evaluation theorists from psychology, for example, argue that extrinsic incentives like awards can de-motivate those who are intrinsically driven by the pleasure they receive from teaching.
  • Equity theorists from organisational behaviour, in contrast, emphasise the importance of setting appropriately sized incentives in relation to the investment of effort one exerts, so as to not promote perceptions of unfairness that reduce motivations.
  • Motivation-Crowding theorists from behavioural economics caution against incentivising prosocial activities such as volunteering out of fear that doing so can reduce the reward one receives from feeling altruistic.

인센티브가 의도하지 않은(그리고 종종 부정적인) 결과를 초래할 수 있는 가변적인 방법을 고려할 때, 보건 전문 교육에서 인센티브의 영향력 메커니즘은 충분히 다루어지지 않았다. 몇몇 연구들은 동기를 탐구했고 다음을 발견했다. 

  • 임상의는 무엇보다도 내재적인 이유(예: 개인적 만족)로 가르친다. 
  • 다음으로, 가장 자주 그들은 전문적인 목표를 달성하기 위해 가르친다고 주장한다(예: 경력 향상). 
  • 대조적으로 목록에서 낮은 것은 외부적인 이유(예: 돈)이다. 

그러나 이 연구는, 위에서 언급한 문헌이 [특정 행동에 대한 동기가 straightforward한 일은 거의 없음]을 시사한다는 점을 고려할 때, [복잡한 문제에 대한 필요하지만 충분하지 않은 성찰]일 수 있다. [교육 인센티브에 대한 생각]을 조사하는 경우, [서로 다른 요인들이 상호작용하여 예상치 못한 결과의 가능성을 만들어내는 방법에 대한 뉘앙스를 생각할 기회나 자극 없이 설문에만 기반]했을 때, 복잡성은 쉽게 과소평가될 수 있다. 다른 분야에서 보았던 것처럼 인센티브 사용을 통해 의도치 않게 동기부여가 저하될 위험을 피하기 위해서는 인센티브가 임상교사에게 어떤 영향력을 행사하는지에 대한 더 깊은 이해가 필요하다.
Given the variable ways in which incentives can yield unintended (and often negative) consequences, the mechanism of their influence in health professional education has not been sufficiently addressed. Several studies have explored motivations and found that

  • clinicians teach for intrinsic reasons (eg personal satisfaction) first and foremost;
  • next, most frequently they claim to teach to meet professional goals (eg career advancement);
  • low on the list, in contrast, are extrinsic reasons (eg money).6 

This work, however, offers a necessary but perhaps not sufficient reflection of a complex problem given that the literature alluded to above suggests that motivations towards certain behaviours are rarely so straightforward. Complexity can easily be underappreciated when considerations of teaching incentives are based on surveys of what one perceives without opportunity or prompts to reflect on the nuances of how different factors interact to create the possibility of unanticipated consequences. To avoid the risk of unintentionally lowering motivation through the use of incentives, as has been seen in other fields, we need a deeper understanding of how incentives exert their influence on clinical teachers.

현재의 연구는 임상의들이 무엇이 가르치는 것을 유도driving하는지, 그들이 직면한 장벽, 그리고 그들이 과거에 어떻게 교육 인센티브를 인식했는지를 탐구함으로써 이 다음 단계를 제공한다. 우리의 목표는 인센티브가 어떻게 의미 있고 영향력 있는 지원으로 작용하도록 개발될 수 있는지 더 잘 이해하는 것이다. 이 문제를 연구하면서 우리는 다양한 다른 분야의 핵심 테이크아웃 메시지와 역사적으로 동기 부여에 영향을 미치는 인센티브의 불안정한 특성에 의해 안내되었다. 가장 중요한 연구 질문은 다음과 같습니다. 

  • (a) 임상교사의 관점에서 의학교육에서 경험하는 동기부여와 동기부여의 관계는 어떠한가?; 그리고, 
  • (b) 임상의들은 교육 동기에 영향을 미치는 인센티브의 역할을 어떻게 생각하는가? 

이러한 질문을 해결함에 있어 인센티브와 동기 간의 고유한 상호 작용이 임상 교사에게 어떻게 작용하는지에 대한 새로운 지식을 제공함으로써 임상의가 교육자 및 교육 관리자로서의 역할에서 프로그램 리더로서의 역할을 더 잘 지원할 수 있는 권장 사항을 생성하기를 바란다.
The current study offers this next step by exploring what is driving clinicians to teach, the barriers they face, and how they have perceived teaching incentives in the past. Our aim is to better understand how incentives can be developed to act as meaningful and impactful supports. In studying this issue we were guided by the key takeaway messages from a variety of other disciplines and the precarious nature with which incentives have been historically shown to impact motivation.6 The overarching research questions are:

  • (a) How is the relationship between motivation and incentives experienced in medical education from the perspective of clinical teachers?; and,
  • (b) How do clinicians view the role of incentives in influencing their motivations to teach?

In addressing these questions, we hope to contribute new knowledge around how unique interactions between incentives and motivations play out for clinical teachers, thereby generating recommendations that will better support clinicians in their roles as educators and educational administrators in their roles as program leaders.

2 방법
2 METHODS

2.1 설계 연구
2.1 Study design

[해석적 기술 방법론]을 사용하고 COREQ(Consolidated Criteria for Reporting Qualitical Research)를 따랐다. [해석적 기술]은 건강 연구자들이 일반적으로 질문하는 적용된 질문에 대한 탐구를 우선시하기 위해 근거 이론과 현상학의 원칙을 기반으로 하는 비교적 새로운 질적 접근법이다. [구성주의자적 세계관에 기반]한 해석적 서술은, 패턴을 포착하고 연구 중인 문제를 개선하기 위해 이해를 알릴 수 있는 서술을 생성하는 데 사용된다. 따라서 여러 현실이 존재하고, 각각이 개인에 의해 사회적으로 구성되고 문화적, 사회적 맥락에 의해 영향을 받는다는 것을 인정하면서 매우 집중하는 경향이 있다. 즉, 경험의 의미에 대한 이해는 참가자와 연구자가 공동으로 구성한다.
We used interpretive description methodology7 and followed the Consolidated Criteria for Reporting Qualitative Research (COREQ).8 Interpretive description is a relatively new qualitative approach that builds on the principles of grounded theory and phenomenology to prioritise exploration of the applied questions commonly asked by health researchers. Constructivist9 in worldview, interpretive description is used to capture patterns and generate description that can inform understanding for the sake of improving the problem being studied. It tends, therefore, to be very focused while acknowledging that multiple realities exist, each being socially constructed by individuals and influenced by cultural and social context.10 In other words, an understanding of the meaning of experiences is co-constructed by participants and researchers.

2.2 설정
2.2 Setting

브리티시컬럼비아 대학교(UBC)의 MD 프로그램은 2 + 2 (전임상실습 연수 + 임상실습 연수) 구조를 따르는 4년제 졸업생 등록 분산 프로그램이다. 4개의 지역 캠퍼스에서 제공되며, 각각의 캠퍼스는 더 큰 UBC 프로그램의 일부임에도 불구하고 뚜렷한 우선순위, 교수진, 제도적 문화를 가지고 있다. 대다수의 교사들은 임상 교수진으로 임명되어 있으며, 따라서 그들이 얼마나 자주 그리고 어떤 맥락에서 가르치는지에 대해 상당한 유연성을 가지고 있다. 이와 같이 교사들은 그들이 어디서 어떤 학습자를 가르치느냐에 따라 재정적이든 그 밖의 다양한 지원과 교수 인센티브를 받는다. 앨버타주 캘거리에 있는 커밍 의과대학의 한 명 외에 네 곳의 교수진이 모두 포함되었다. 프로그램의 분산 특성을 고려할 때, 인터뷰는 가능할 때 직접 수행되었고(참가자의 요청에 따라 클리닉, 병원 또는 기타 장소에서) 장거리 인터뷰는 전화 또는 화상 회의를 통해 수행되었다.
The MD program at the University of British Columbia (UBC) is a four-year graduate entry distributed program that follows a 2 + 2 (preclerkship years + clerkship years) structure. It is delivered at four regional campuses, each of which has distinct priorities, faculty and institutional culture despite being part of the larger UBC programme.11 A large majority of the teachers have clinical faculty appointments and, thus, have considerable flexibility in how often and in what contexts they teach; clinicians appointed to academic positions are expected to teach, but still often have flexibility with respect to how they contribute educationally. As such, teachers receive a variety of supports and teaching incentives, financial or otherwise, depending on where and which learners they teach. Faculty from all four sites were included in addition to one participant from the nearby Cumming School of Medicine in Calgary, Alberta. Given the distributed nature of the programme, interviews took place in person when possible (in clinic, hospital settings or other locations at the request of participants) and long-distance interviews took place over the phone or via videoconference.

2.3 참가자
2.3 Participants

정보가 풍부한 사례(학부와 대학원 모두에서 다양한 환경에서 강의한 것으로 알려진 임상 교수진)를 식별하기 위해 [목적적 샘플링 전략]이 사용되었다. 우리는 임상적 맥락(예: 입원 환자, 외래 환자)을 넘나들며 다양한 수준의 교육 경험을 가진 임상의를 추구함으로써 이질성을 극대화하기 위해 노력했다. 일부 참가자들은 임상 환경 외에 교실 환경에서도 가르쳤다. 수석 연구원은 알려진 임상의에게 이메일을 통해 임상의 네트워크에 참여 초대장을 배포할 것을 요청했다. 연구원과 접촉한 사람들은 인터뷰를 했다. 주제의 초기 개념화에 이의를 제기할 가능성이 있다고 생각되는 참가자들은 의도적으로 추구되었다. 예를 들어, 초기 응답자들은 교육에 매우 참여하고 유사한 인식을 기술했기 때문에, 관찰된 패턴에 도전하기 위해 교사 역할에서 사임한 임상의를 초대하기 위해 네트워크를 사용했다.
A purposeful sampling strategy was used to identify information-rich cases12 (clinical faculty known to have taught in a variety of settings, both undergraduate and postgraduate). We strove to maximise heterogeneity by pursuing clinicians who have taught across clinical contexts (eg inpatient, outpatient) and who had varying levels of teaching experience. Some participants taught in classroom environments in addition to clinical ones. The lead researcher asked known clinicians to disseminate a participation invitation to their clinician networks via email; those who contacted the researcher were interviewed. Participants thought likely to challenge early conceptualisations of themes were purposely sought. For example, early respondents were highly involved in teaching and described similar perceptions, so networks were used to invite clinicians who had resigned from teaching roles to challenge observed patterns.

2.4 데이터 수집
2.4 Data collection

인터뷰 가이드(부록 S1 참조)는 [동기와 인센티브 사이의 관계에 대한 다양한 관점을 제공하는 문헌 검토를 통해 확인된 다양한 이론을 사용하여 구성]되었다. 그러나 질문은 참가자들을 특정 견해로 유도하지 않기 위해 광범위하게 표현되었다. 또한, [민감 개념]으로 작용하는 이론에 의해 만들어진 가정에 도전하기 위한 노력으로 인터뷰 가이드의 반복적인 수정을 통해 데이터 자체에서 발생한 개념화를 수용하고 탐구했다.
An interview guide (see Appendix S1) was structured using the various theories identified through our literature review that offered different perspectives on the relationship between motivation and incentives.6 Questions, however, were phrased broadly to avoid directing participants to particular views. Further, conceptualisations that arose from the data themselves were embraced and explored through iterative modification of the interview guide in efforts to challenge assumptions made by the theories that served as sensitising concepts.

일반적으로, 인터뷰는 45-90분이 걸렸고 인구 통계와 교육 맥락을 포착하기 위한 몇 가지 질문으로 시작했다. 이어 개인의 교육에 대한 인식, 그들에게 제공되는 인센티브, 그들이 직면한 장벽, 그리고 그들이 교사로서 가치를 느낀다고 느끼는 지를 탐구하는 반구조적 질문을 했다. 인터뷰 가이드가 연구 목적에 효과적으로 부합하는지 여부를 평가하고, 질문이 참가자 풀에 있는 사람들과 어떻게 공명할지 결정하기 위해, 리드 연구자에게 알려진 임상의를 대상으로 두 번의 초기 인터뷰를 실시했다. 이러한 인터뷰에 이어진 디브리핑 토론 후 인터뷰 프로토콜을 약간 수정했을 뿐이므로 이러한 데이터는 분석에 포함되었다. 추가적인 작은 연구 가이드 수정은 연구팀이 녹취록을 검토한 후 인터뷰 내내 반복적으로 발생했고, 참가자들이 구조를 제기했을 때 조사자들이 미래의 참가자들과 함께 더 표적적인 방식으로 질문해야 한다고 생각하는 것에 주목했다. 마찬가지로, 프로빙 질문이 많은 토론을 유발하지 않을 때 변경이 이루어졌다. 인터뷰는 데이터가 포화된 것으로 나타난 후 3명의 참가자가 모집될 때까지 계속되었다(참가자의 교육 경험과 업무 맥락의 차이에 관계없이 연구 질문에 대한 새로운 관점을 밝히는 것을 중단했다).
In general, interviews took 45-90 minutes and began with several questions to capture demographics and teaching contexts. Semi-structured questions were then asked that explored individuals’ perceptions of teaching, incentives provided to them, barriers they face, and whether they felt valued as teachers. Two initial interviews were conducted with clinicians known to the lead researcher to pilot the interview guide, assess whether the guide was effectively aligned with the study purpose, and to determine how the questions would resonate with those in the participant pool. After a debrief discussion following these interviews, only slight modifications to the interview protocol were made, so these data were included in our analysis. Additional minor study guide modifications occurred iteratively throughout interviews after the research team reviewed transcripts and noted when participants raised constructs the investigators thought should be asked in a more targeted way with future participants; similarly, changes were made when probing questions did not yield much discussion. Interviews continued until three participants had been recruited after the data appeared to have saturated (ie stopped revealing novel perspectives on the research questions regardless of differences in participants’ teaching experience and work contexts).

2.5 데이터 분석
2.5 Data analysis

인터뷰 녹취록을 분석하기 위해 [해석적 서술 기법]이 사용되었으며, 여기에는 [데이터 해석, 연구 결과 합성, 패턴 및 관계 이론화]의 반복적인 단계가 포함되었다.
The interpretive description technique was followed to analyse the interview transcripts, which involved iterative phases of interpreting data, synthesising findings, and theorising patterns and relationships.13

처음 3개의 녹취록은 두 명의 조사관(KW, KE)에 의해 독립적으로 검토되었으며 초기 인상은 후속 인터뷰에서 인터뷰 가이드의 변경 사항을 알리는 데 도움이 되었다. 약 10개의 인터뷰가 완료된 후, 4명의 조사관(KW, ED, CC, KE)이 두 개의 대조적인 녹취록을 독립적으로 검토했다. 각각은(교수진 개발자 1명, 임상의 1명, 의료 교육자 2명) 개인적 경험과 맥락이 해석에 어떻게 영향을 미칠 수 있는지 식별하기 위해 [데이터에 대한 자신의 반응]을 문서화했다. 그런 다음 이러한 문서화된 반응을 종합적으로 논의하여 조사자들이 패턴을 식별하고 데이터에서 시사점을 도출하기 위해 유사하고 다양한 인상을 가진 곳을 식별했다. [반사성]에 대한 이러한 노력은 해석적 기술 방법론에 매우 중요하다.
The first three transcripts were reviewed independently by two investigators (KW, KE) and initial impressions helped to inform changes to the interview guide in subsequent interviews. After approximately ten interviews were completed, four investigators (KW, ED, CC, KE) independently reviewed two contrasting transcripts. Each (one faculty developer, one clinician and two medical educators) documented their own reactions to the data with effort to identify how their personal experiences and contexts might influence their interpretation. These documented reactions were then discussed collectively to identify where investigators had similar and divergent impressions for the purpose of identifying patterns and deriving implications from the data. Such efforts at reflexivity are critical to the interpretive description methodology.

그룹 토론에서 수집된 결과는 [초기 주제 구조]를 개발하는 데 사용되었으며, 이 구조는 4명의 조사관 모두가 두 개의 더 많은 녹취록을 코딩하는 데 사용되었다. 이 과정은 대본 코딩이 더 이상 추가 수정을 산출하지 않을 때까지 주제 구조와 인터뷰 가이드에 대한 지속적인 조정을 계속했다.
The collated output of the groups’ discussions was used to develop an initial thematic structure that was then used by all four investigators to code two more transcripts. This process continued with ongoing adjustments to the thematic structure and interview guide until transcript coding no longer yielded additional revisions.

마지막으로, 연구 보조자(CH)는 모든 대본을 읽고 주제 구조에 대해 체계적으로 코드화했다. 주 저자와의 매주 회의를 통해, 코드북을 적용하는 과제가 식별됨에 따라 [주제 구조에 대한 작은 조정]이 이루어졌다(예: 코드화된 데이터가 연구 질문과 관련성을 주장할 만큼 충분히 실질적이지 않은 경우 코드화된 일부 하위 테마가 중복된 것처럼 보이게 하거나 삭제되었을 때 일부 하위 테마가 병합되었다). 연구팀은 모든 코딩이 완료되면, 주제구조 내에서 각 주제로부터 일반적인 메시지를 외삽하는 동시에, 개별 참여자들 간의 주장의 차이를 설명하기 위한 [모순된contradictory 사례와 방법]을 모색했다. 이는 [연구 질문과 관련한 패턴, 불협화음, 경향, 시사점 등을 검토]하여 [주제의 의미를 종합하고 이론화]하기 위한 그룹 회의를 개최하는 등 [주제 설명]과 [예시 인용]을 검토하는 방식으로 진행되었다. [감사 추적]은 본 연구의 분석 단계 전반에 걸쳐 유지되었고, 우리의 분석 과정과 결과는 조사 결과를 개입의 출발점으로 직접 적용할 수 있는 방식으로 완료되었다. 
Finally, a research assistant (CH) read through all transcripts and systematically coded each against the thematic structure. Through weekly meetings with the lead author, minor adjustments to the thematic structure were made as challenges applying the codebook were identified (eg some subthemes were merged when coding made them appear redundant or dropped when coded data were not substantive enough to make claims of relevance to the research question). Once all coding was completed, the research team extrapolated the general message from each theme within the thematic structure while also seeking contradictory cases and ways to account for variations in claims between individual participants. This was done by reviewing theme descriptions and example quotes, with group meetings held to synthesise and theorise the meaning of themes through examination of patterns, dissonances, trends and implications in relation to the research questions. An audit trail was kept throughout the analytic phase of this work and the process and product of our analysis was completed in such a way that findings could be directly applied as a starting point for intervention.14

2.6 윤리
2.6 Ethics

윤리적 승인은 UBC의 행동 연구 윤리 위원회(H18-01109)에 의해 제공되었다.
Ethical approval was provided by the UBC’s Behavioural Research Ethics Board (H18-01109).

3 결과
3 RESULTS

16개의 인터뷰가 완료되었다. 참가자의 특기사항, 장소 및 실무연수는 표 1에서 확인할 수 있다.
Sixteen interviews were completed. A summary of participant specialties, locations and years in practice can be seen in Table 1.

인센티브의 영향을 이해하려면 먼저 무엇이 임상의를 교육으로(또는 교육에서 멀어지게) 만드는지 알아야 합니다. 따라서 우리는 교육 인센티브에 대한 참가자의 인식을 설명하기 전에 교육 결정에 영향을 미치는 개인 및 외부 요인에 대한 설명과 함께 그 복잡성(즉, 이러한 요인이 역할을 하는 미묘한 및 가변적인 방식)으로 시작한다. 
To understand the impact of incentives, we need to first know what drives clinicians towards (or away from) teaching. We start, therefore, with a description of personal and external factors influencing teaching decisions, along with their complexities (ie the nuanced and variable ways in which these factors play a role), before outlining participants’ perceptions of teaching incentives.

3.1 교수 결정에 영향을 미치는 요인
3.1 Factors influencing decisions to teach

표현된 동기부여 요인은 [개인적 요인(자신과 관련된)]과 [외부 요인(환경/상황과 관련된)]으로 분류되었다. [개인적인 요인]과 관련하여, 많은 사람들이 학생들과 그들의 교육 욕구에 근본적으로 영향을 미친 의학계 전반의 복지에 대해 [이타적unselfish 배려]를 표명했다. 예를 들어, 그들은 'pay it forward'할 의무를 느꼈고 미래의 의사들의 개발을 지원하는 것에 대한 열정이 깊이 뿌리내렸다. 많은 사람들은 또한 그들의 임상 지식의 인맥, 평판 또는 통화를 구축하고자 하는 열망을 표현했다.
Motivators participants expressed were categorised into personal factors (related to the self) and external factors (related to the environment/context). Regarding personal factors, many expressed unselfish regard for the welfare of students and the medical community at large that fundamentally influenced their desire to teach. For example, they felt a duty to ‘pay it forward’ and had deeply rooted passion for supporting the development of future physicians. Many also expressed desire to build connections, reputation or the currency of their clinical knowledge.

[외부 요인]과 관련하여, 많은 참가자들은 [학습자가 환자 치료를 더 효율적으로 할 수 있을 때] 또는 [임상 환경이 교육에 도움이 될 때(예: 학습자를 수용할 수 있는 적절한 물리적 공간이 있는 경우)]에 가르치는 데 더 동기부여가 된다고 공유했다. 시간이 너무 짧거나, 소득 손실이 너무 크거나, 학습자가 안전 위험을 제기하거나, 임상의가 가족의 요구를 균형 있게 해야 하는 필요성과 마찬가지로 동기 부여 장벽을 만들었는지 여부에 대한 선택권이 없다고 느꼈다.
Regarding external factors, many participants shared that they were more motivated to teach when learners could help make patient care more efficient or when their clinical environment was conducive to teaching (eg they had adequate physical space to accommodate learners). Feeling that time was stretched too thin, that income loss was too great, that learners posed safety risks or that the clinician did not have a choice in whether they taught created motivational barriers as did the need to balance family demands.

이러한 요인들은 시간이 지남에 따라 또는 환경 전반에 걸쳐 [정적인 것이 아니라], 경력과 삶의 단계를 통해 진화한 [역동적인 방식]으로 개인들에 의해 가중치가 부여되었다. 또한, 일부 요인들은 상당히 [선형적인 영향력]을 가지고 작동하는 것으로 설명되었지만(예: 더 많이 가르치는 것을 좋아할수록 더 많이 할 가능성이 더 높다), 동기 부여자의 존재가 항상 더 많은 교육으로 이어지지 않고 장벽의 존재가 항상 더 적게 작동하지 않는다는 점에서, 많은 요인들이 더 복잡한 방식으로 작동하는 것으로 보였다. 예를 들어, 어떤 요인들은 그들의 존재가 때로는 동기부여로 묘사되고 때로는 동기부여를 감소시키는 부정적인 요소들을 만들었다는 의미에서 [양날의 것]이었다. 예를 들어, 다른 요인에 따라, 임상의가 가르치는 의무감은 [어떤 순간에는 특권처럼 느껴지고, 다른 순간에는 부끄러운 의무처럼 느껴질 수] 있다. 여전히 다른 요인들은 [역전된 U자형 함수]로 더 잘 설명되어, 감소를 야기하기 전에 어느 정도 동기를 증가시키는 것처럼 보였다. 예를 들어, 한 사람의 지식이 시대에 뒤떨어지는 것에 대한 걱정은 참가자들의 교육 욕구를 증가시켰지만(학습자가 임상의를 최신 상태로 유지하는 데 도움을 줄 수 있기 때문에), 단지 어느 정도만; 그들의 전문 지식과 너무 동떨어진 느낌은 임상의가 가르치는 것을 단념시켰다. 표 2는 포괄적이지는 않지만 선형, 양날 및 U자형 요인에 대한 설명과 대표적인 인용문을 제공함으로써, 교육에 동기를 부여하거나 장벽을 만드는 요인을 단순히 나열하는 것의 부적절성을 보여준다.
These factors were not static over time or across environment, but were weighed by individuals in a dynamic manner that evolved throughout their career and life phases.

  • Further, while some factors were described as operating with a fairly linear influence (eg the more one likes to teach the more likely they are to do it), many factors appeared to operate in a more complex manner in that the presence of a motivator did not always lead to more teaching and nor did the presence of a barrier always lead to less.
  • To illustrate, some factors were dual-edged in the sense that their presence was sometimes described as motivating and sometimes created negatives that reduced motivation. For example, dependent on other factors, a clinician's sense of duty to teach could feel like a privilege in some moments and a begrudging obligation in others.
  • Still other factors seemed better described as an inverted U-shape function, increasing motivation to a point before causing a decline. For example, worry about one's knowledge being out of date increased participants’ desire to teach (because learners can help clinicians stay up to date), but only to a point; feeling too far from their expertise deterred clinicians from teaching.

Table 2, while not comprehensive, illustrates the inadequacy of simply listing factors that motivate or create barriers to teaching by providing descriptions and representative quotes of linear, dual-edged and U-shaped factors.

 

더욱 복잡해짐에 따라, 참가자들은 종종 [그들이 가르치는 것으로부터 얻는 이익]에 초점을 맞추어 특정 장벽을 제거했다. 보상에 대한 그들의 관점은 좋은 예를 제공한다. 참가자들은 대부분의 경우 가르치는 것이 수입을 잃는 결과를 가져온다는 것을 일반적으로 인정했지만, 'pay it forward'에 대한 의무감이 너무 강해서 많은 사람들은 가르치는 기회가 돈보다 더 가치 있는 'currency'와 동등하다고 묘사했다.
Adding further complexity, participants frequently rationalised certain barriers away by focusing on the benefits they derived from teaching. Their perspective on compensation provides a good example. While participants generally acknowledged that in most cases teaching results in a loss of income, the sense of duty to ‘pay it forward’ can be so strong that the opportunity to teach was described by many as equivalent to a ‘currency’ they valued more than money:

거기가 나를 위한 돈이 있는 곳이다. 그것은 제가 이 사람에게 무언가를 가르쳤고, 그 사람은 이제 다른 사람에게 그것을 가르치거나 무언가를 진단하고 변화를 일으켜 누군가의 삶에 영향을 미칠 것이라는 것을 아는 것입니다. 나에게는 풍요로움이 있다. (참가자 2)
That’s where the money is for me. It’s knowing that I’ve taught this person something and that person’s now going to either teach it to somebody else or maybe diagnose something and make a difference and have an impact in somebody’s life. To me that’s where the richness is. (Participant 2)


그러한 정당성은 단기적으로 효과가 있었지만, 참가자들은 장벽의 축적이 그들의 교육 능력이나 의지에 어떻게 영향을 미치는지 설명했기 때문에 동기부여는 역동적이었다. 그 결과, 개인의 영향력이 임상의에게 각기 다른 시점에서 영향을 미치기 때문에 [언제나 교수 감소teaching attrition를 초래하는 특정 요인]은 식별할 수 없었다. 일부 임상의들은 그들이 충분히 양보했다고 느꼈기 때문에 가르치는 것을 중단했지만, '티핑 포인트'는 대개 부정적인 경험이나 별개의 삶이나 경력 단계로 접어들면서 촉발되었다.
While such justifications worked in the short-term, motivations were dynamic as participants described how the accumulation of barriers impacted their ability or willingness to teach. As a result, it was not possible to identify particular factors that always led to teaching attrition as their individual influence affected clinicians differently and at different points in time. Some clinicians stopped teaching because they felt like they had given enough (ie it was time to take a step back), but the ‘tipping point’ was usually triggered by a negative experience or by entering a separate life or career stage:

나는 서비스 클리닉 비용이 있고 환자가 많다는 이유만으로 빨리 환자를 봐야 한다는 압박을 받을 때 특별히 가르치는 것을 좋아하지 않는다.
I don’t particularly like teaching when I have a fee for service clinic and I’m pressured to see patients quickly just because I have a lot of patients and because I need to get home to children and, like, motherhood and stuff. (15)


예를 들어, 그들이 직면한 장벽에도 불구하고 강의를 계속한 임상의들은 바쁜 가족 생활의 누적된 영향과 바쁜 임상 실습이 결국 교수직을 사임하게 될 것이라고 암시했다.
Those clinicians who continued to teach despite barriers they faced hinted that the cumulative impact of a busy family life in combination with a busy clinical practice, for example, would eventually lead to resigning from teaching commitments:

전반적으로 우리는 삶에 만족하고 있지만, 우리는 긴장하고 있다고 생각해요. 그리고 우리는 이것을 지탱할 수 없는 벼랑 끝에 와 있는 것처럼 느끼고 있다. (16)
I think overall, I think overall we’re, uh, happy with our lives but I think we’re feeling stretched…And we’re feeling like we’re on the brink where we can’t sustain this. (16)

이러한 복잡한 현실 앞에서 우리는 교육 인센티브가 어떻게 인식되고 궁극적인 소진과 교육 감소를 완화하는 데 사용될 수 있는지 고려해야 한다. 
It is in the face of such complex realities that we must consider how teaching incentives are perceived and might be used to mitigate against eventual burnout and teaching attrition.

3.2 교수 인센티브에 대한 인식과 교사의 가치관 형성에 미치는 영향
3.2 Perceptions of teaching incentives and their impact on making teachers feel valued

모든 참가자들은 [학생들의 평가]가 특히 중요한 인센티브를 창출했다고 지적했다. 또한, 그들은 특정 인센티브와 보상(예: 감사 편지, 교수 상, 선물 및 피드백)이 어떻게 그들이 교사로서 가치가 있다는 인식을 형성하는지 설명했는데, 이것이 그들의 가르치는 동기의 주요 동인으로 보였다. 그렇게 함으로써, 그들은 인정, 감사, 연결, 관계와 같은 구조를 중심으로 말하는 경향이 있었다. 그러나 참가자들이 이러한 인센티브를 설명하는 방식은 다시 미묘한 차이를 보이며 매우 가변적이었다. 예를 들어, 어떤 이들은 상을 원하지 않는다고 주장했고, 어떤 이들은 그들이 받은 상이 특히 의미 있는 것이라고 언급했다. 선생님으로서 가치를 느낀 사람들은 무엇이 그들을 그렇게 느끼게 하는지 명확하게 표현하는 데 어려움을 겪었고, 다른 사람들은 그들이 의대로부터 가치있게 여겨졌다고 느꼈는지조차 고려하지 않았다.
All participants indicated that students’ appreciation created particularly important incentivisation. In addition, they described how certain incentives and rewards (eg thank you letters, teaching awards, gifts and feedback) built perception that they were valued as a teacher, which appeared to be the primary driver of their motivation to teach. In doing so, they tended to speak around constructs like recognition, appreciation, connectedness and relationships. However, the way in which participants described these incentives were again nuanced and highly variable. For example, some insisted they did not want awards and some referenced the awards they received as being particularly meaningful. Some who felt valued as teachers had difficulties articulating what made them feel that way; others had not even considered whether they felt valued by the medical school.

이러한 변동성과 관계없이, 모든 참여자들은 [인센티브의 개념]과 [인센티브의 실행]을 구별하여, [선의의 인센티브조차도 역효과를 가져올 수 있음]을 나타냈다. 즉, 인정이 해를 끼치는 것보다 더 많은 이익을 주는 것이라면 인센티브의 전달이 인센티브 자체보다 더 중요했다. [긍정적으로 설계된 인센티브의 부정적인 영향]은 참가자들의 기억에서 두드러졌고, 몇몇 참가자들은 그들이 저평가되었다고 느낄 때 감정적이 되었다. 이러한 [의도하지 않은 결과]는 [사기]에 전반적으로 영향을 미쳤고, 참가자들의 [감사하는 마음과 유대감]을 감소시키는 동시에, 그들에게 [의미 있는 관계]를 위협했다. 인센티브는 일반적으로 [비인격적이거나, 불평등하거나, 비효율적이거나, 적절한 프레임 구성이 부족할 때] 의도하지 않은 결과를 이끌어내는 것처럼 보였다.
Regardless of this variability, all participants made a distinction between the notion of an incentive and its implementation, indicating that even well-intentioned incentives could backfire. That is, the delivery of an incentive was just as, if not more, important than the incentive itself if the acknowledgement was to do more good than harm. Negative impacts of incentives that were designed to be positive were prominent in participants’ recollections with several participants becoming emotional when discussing times they felt undervalued. Such unintended consequences impacted morale quite generally, reducing participants’ sense of appreciation and connection while threatening relationships that were meaningful to them. Incentives generally seemed to elicit unintended consequences when they were impersonal, inequitable, inefficient or lacked appropriate framing.


[비개인적]이라는 라벨은 참가자들이 그들의 교육 노력에 대한 인정을 받는 것에 감사했지만, 그들이 [구체적일 때]만 감사했다는 관찰을 반영한다. 개인적 속성이 부족한 감사 이메일이나 감사 편지는 적극적으로 받아들여지지 않았습니다.
The label of impersonal reflects observations that participants were grateful to receive acknowledgements of their teaching efforts, but only when they were specific. Thank you emails or appreciation letters that lacked personal attributes were not enthusiastically accepted:

당신은 이 무작위 이메일처럼 되고 그것에 첨부된 이름이나 어떤 것도 없지만, 그것은 '오 선생님이 되어주셔서 감사합니다'와 같습니다… (6)
you get like this random email and there’s no names attached to it or anything but it’s like 'oh thank you for being a teacher'… (6)

형식적인 편지라서 이름만 바꾸고 박사님이나 박사님도 바꾸고 있어요. 사실 마음에 안 들어요. 그냥 쓰레기통에 버립니다. 왜냐하면 저는 그것들이 정말로 아무 의미가 없다고 생각하기 때문입니다. (9
it’s a form letter so they’re just changing your name and Dr so and so or Dr so and so … I actually don’t like those. I just throw them in the trash bin … because I don’t think they really mean anything. (9)

극명하게 대조적으로, 의대로부터 '나는 그저 다른 원숭이로 대체할 수 있는 또 다른 원숭이처럼 느껴진다'고 말하면서 아무런 감사를 느끼지 못했던 한 의사는 [학생들의 몸짓에 깊은 감동을 받았고 그것이 그들이 그녀를 교육자로서 소중히 여기는 것을 보여주는 그들의 방식]이라고 느꼈다.
In stark contrast, one physician who felt no appreciation from the medical school, stating ‘I feel like just another monkey that's replaceable with a different monkey’, was deeply touched by a gesture from her students and felt that it was their way of showing they valued her as an educator:


수업이 끝날 무렵 나는 내 사무실로 갔고, 알다시피, 내가 가르쳤던 그룹의 감사 카드와 함께 [음료] 네 팩이 있었다. (13)
at the end of a course I went up to my office and there was, you know, a four pack of [drink] with a little thank you card from the group that I had taught. (13)


[임상 교사들에 대한 인정의 불평등]은 일부 감정을 간과하고 그들의 노력을 간과하게 만들었다. 이것은 승진, 지급, 직함, 그리고 상에 대해 논의할 때, 특히 다른 사람들이 그들이 덜 받을 자격이 있다고 여겨지는 것을 받는 것을 볼 때 나타났다. 예를 들어, 두 명의 참가자는 [의대가 승진을 할당하는 방법에 대한 공정성의 결여]에 대해 논의할 때 마지못해 고통을 표현했다.
Inequities in the acknowledgement of clinical teachers left some feeling overlooked and their efforts unnoticed. This came up when discussing promotions, payments, titles and awards, especially when others were seen to receive something for which they were perceived as less deserving. For example, two participants reluctantly expressed anguish when discussing the lack of fairness in how the medical school allocates promotions:

나는 이것에 대해 매우 구체적으로 말하고 싶지는 않지만, 가끔 당신이 프로그램에서 수년간 당신의 심혈을 기울이고 있었는데, 갑자기 전혀 기여한 바가 없는 사람이 특정한 지위, 특정한 신용 또는 특정한 [인정]을 얻는 일이 생긴다. 아마도 사람들은 단지 변화를 원하지만, 때때로 내가 과소평가된다고 느낀다. (16)
I don’t want to be very specific about this but sometimes in the program you put your heart and soul for so many years … and then someone who hasn’t contributed suddenly might get a particular position or a particular credit or a particular [acknowledgement] … maybe people just want change but sometimes you feel undervalued… (16)

나는 어떤 종류의 상도 바라지 않아, 정말로 그렇지 않아. 사실은 원하지 않아요. 하지만 당신이 그것에 대해 약간 냉소적이 된다는 것은 웃기는 일입니다, 음, 알다시피, 나는 이 상을 받은 사람이 학생들을 수치스럽게 하는 교육방식으로 학생들로부터 비난을 받았다는 것을 알고 있습니다. (8)
I’m not looking for an award of any kind, really I’m not. I don’t want it in fact. But it’s funny that then you get a bit cynical about it, like mmm, you know, I know that this person specifically that got an award has been criticized by students for teaching by shame. (8)


[행정절차의 비효율성]은 인센티브 자체에서 의미를 빼앗는 경향이 있었다. 이와 관련해 교수비 지급, 승진 검토 서류 요건, 지연된 피드백 과정 등이 여러 차례 제기돼 교사가 요구하는 노력이 때로는 보상받을 가치가 없는 경우도 있음을 시사했다. 비효율성으로 인해 시간이 많이 걸리는 다른 단계를 일정에 추가함으로써 좌절감을 초래했습니다.
Inefficiency with administrative procedures tended to take meaning away from the incentive itself. In this regard, payments for teaching, paperwork requirements for promotion reviews and delayed feedback processes were brought up multiple times, suggesting the effort required by the teacher was sometimes not worth the reward. Inefficiency caused frustration by adding another time-consuming step to schedules that are thinly stretched:

시간당 90달러를 받기 위해 백만 달러 상당의 서류 작업을 해야 한다고 의료진에게 요구하지 마세요. 사람들이 무엇을 얻을지 알고, 무엇을 할 것인지 알고, 무엇을 할 것인지 알고, 어떤 보상을 받을 것인지 알 수 있도록 잘 작동하고, 쉽게 작동하는 시스템을 만들기 위해 충분한 사람들을 고용하십시오. (12)
don’t ask clinical faculty to have to like do a million dollars’ worth of paperwork to get their $90.00 an hour or whatever it is. Have enough people hired to make a system that works and works well and works easily so that when people teach they know what they’re gonna get, they know what they’re committing to and they know what the rewards are gonna be. (12)

6개월 전에 레지던트들을 가르쳤기 때문에 피드백을 받을 수도 있지만, 피드백이 무엇을 기반으로 한 것인지, 아니면 우리가 어떤 주를 보내고 있었는지 전혀 모르겠습니다. (11)
I might get feedback now from teaching residents six months ago and I’m like well I have no idea [I: What that was …] what they’re basing that on [I: Right] or what kind of weeks we were having or … (11)


마지막으로, 보상금을 교육에 대한 'payment'로 규정하는 것은 단순히 '양동이의 물방울 하나'이라는 점에서 일부 사람들에게는 모욕적이었다. 참가자들은 더 많은 돈을 원하지 않았지만, 재정적인 인센티브의 틀이 실제로 무엇인지 더 잘 반영하도록 조정될 수 있다고 생각했다. 즉, 급여, 제스처 또는 감사의 상징적 표시입니다. 어쨌든, 급여는 교육에 필요하지만 충분하지 않은 인센티브로 보였고 개인적인 의사소통과 감사와 가장 잘 결합되었다고 느꼈습니다.
Finally, framing compensation as ‘payment’ for teaching was insulting to some given that it was simply a ‘drop in the bucket’. Participants did not want more money, but thought the framing of financial incentives could be adjusted to better reflect what it is in actuality—a stipend, a gesture or symbolic token of thanks. In any case, payment seemed to be a necessary but not sufficient incentive for teaching and was felt best combined with personal communication and appreciation:

사실, 그들은 그것을 보상compensation이라고 부르면 안 된다. 포기하는 비용을 지불하는 데 도움이 되는 제스처일 수도 있습니다. 사실은 돈이 들어가는 일이다. 이것은 감사의 표시입니다. 그리고 비용의 그저 일부를 갚아주기 위한 것입니다. 개인적으로 그렇게 표현하는 게 좋을 것 같아요 (9)
In fact, they shouldn’t even call it compensation. It could be, uh, a gesture to help defray the cost … that you’re giving up…It’s costing you money. This is a little gesture to thank you and just to help you defray some of the, some of the cost. [I: Right] I think that would be a better way to put it personally. (9)

4 토론
4 DISCUSSION

본 연구는 임상교사가 교사로서의 역할을 어떻게 보고 있는지, 교사가 직면하는 동기와 장벽, 인센티브가 교수동기에 어떤 영향을 미치는지에 대한 관점에 대한 심층적인 탐구를 통해 의료교육에서 동기와 동기의 불안정한 관계가 어떻게 형성되는지를 강조한다. 특히, 우리는 복잡하고 역동적인 방법으로 교수 동기를 가능하게 하고 억제하는 몇 가지 [개인적 요인과 환경적 요인]을 발견했다. 우리는 또한 인센티브가 종종 선의의 것이기는 하지만, 교사들의 [동기를 손상시키는 의도하지 않은 결과]를 초래할 수 있다는 것을 발견했다. 이러한 발견은 교육에 대한 임상의의 동기를 구축하고 유지하기 위한 인센티브 제도를 고려하고 있는 의대와 교육 지도자들에게 중요한 의미를 갖는다.
This study highlights how the precarious relationship between motivation and incentives is enacted in medical education through an in-depth exploration of how clinician teachers view their roles as teachers, the motivations and barriers they face, and their perspective on how incentives influence their motivations to teach. In particular, we found several personal and environmental factors that enable and inhibit teaching motivations in complex and dynamic ways. We also found that incentives, while often well-intentioned, can have unintended consequences that undermine teachers’ motivations. These findings have important implications for medical schools and educational leaders who are considering incentive schemes to build and sustain clinicians’ motivations towards teaching.

4.1 이론적 함의
4.1 Theoretical implications

서론에서 언급한 바와 같이, 보건 전문 교육 내의 인센티브에 대한 이전 연구는 대체로 이론적이었으며, 임상의가 교육에 대한 동기에 영향을 미치는 촉진자와 장애요인을 나열하는 데 초점을 맞추고 있다. 우리의 데이터는 이 접근법의 불충분함을 강조한다. 우리의 참가자들이 그들의 동기에 영향을 미치는 것으로 이름 붙인 많은 요소들은 다른 사람들에 의해 식별된 것들과 비슷했지만, 우리의 데이터는 [인센티브가 (단순한 목록이 제시하는 것보다) 어떻게 더 미묘한 차이와 가변성을 가질 수 있음]을 제시한다.

  • 하나의 요인이 맥락/개인에 따라 동기 부여 요인으로도 또는 장벽으로도 나타날 수 있다(표 2의 양날 패턴).
  • 어떤 요인은 어떤 지점까지 동기부여자 역할을 하지만, 일단 역치에 도달하면 장벽이 된다(역 U자형 패턴).

As noted in the introduction, previous research on incentives from within health professional education has been largely atheoretical, focused on listing facilitators and barriers clinicians perceive to influence their motivation towards teaching.6 Our data highlight the insufficiency of this approach. Many factors our participants named as influencing their motivations were similar to those identified by others, but our data suggest the way in which they have their influence to be more nuanced and variable than a simple list would suggest.

  • One factor can present itself as a motivator or as a barrier dependent on context/individual (the dual-edged pattern in Table 2);
  • some act as motivators up to a point, but then become barriers once a threshold is reached (the inverted U-shaped pattern).

따라서, 그들의 영향력은 그들의 상호작용과 주어진 맥락 내에서 요소들이 어떻게 경험되는지에 따라 달라질 것이기 때문에, 교육에 대한 동기부여나 장벽이 될 어떤 특정한 요소를 가정하는 것은 신중해야 한다. 이것이 와이즈너와 에바가 요약하고 서론에서 강조한 것처럼 [보건 전문 교육 외부에서 발견되는 다양한 이론적 관점을 완전히 통합하는 것이 어려운 이유]일 수 있다. [인센티브가 동기 부여에 어떻게 영향을 미치는지에 대한 설명의 가변성variability]은 경쟁적이거나 모순된 개념을 반영하기보다는, 맥락마다 다른 요소가 어떻게 적절히 전면에 나타나는지를 보여주는 것일 수 있다. 
As such, it appears prudent to be cautious in presuming any particular factor to be a motivator or barrier to teaching as their influence will depend on their interplay and how factors are experienced within a given context. This may be why it is so hard to fully integrate the different theoretical perspectives that are found outside of health professional education, summarised by Wisener and Eva and highlighted in the introduction.6 Variability in accounts of how incentives influence motivation may represent context appropriate foregrounding of different factors rather than reflecting competing or contradictory notions.

이전 검토에서 발견된 이론 관련 개념을 살펴보면, 우리의 데이터에서 특히 두드러졌던 것은 [형평성]이었다. 우리의 보건 전문 교육 맥락의 참가자들은 다음과의 [차이와 비교 측면]에서 (급여, 승진, 직함 및 상과 같은) 교수 인센티브에 대해 가장 자주 논의했다.

  • 다른 사람들이 받은 것,
  • 자신이 노력한 양
  • 다른 방식으로 얼마나 많은 수입을 올릴 수 있는지

그들은 재정적 인센티브의 절대적인 양에 대해서는 덜 논의했다. 이러한 성찰은 [개인이 투입(예: 노력, 시간 등)]이 [자신의 성과(예: 급여, 인식)]와 일치하지 않는다고 생각하면 고통을 느낄 것이라고 가정하는 [형평성 이론]이 특히 보건 전문 교육과 관련이 있음을 시사한다. 임상 교사들은 비교 가능한 상황에 있는 다른 사람들이 적은 노력으로 더 많은 것을 받는다고 느낄 수도 있고, 또는 그들은 가장 중요한 시스템(예: 의대)이 그러한 투입과 산출을 부당하게 결정한다고 느낄 수도 있다. 다시 말하지만, 이것은 인센티브화는 어떤 보상이 '좋은' 것인지 '나쁜' 것인지에 대한 것이 아니라, 보상이 [공정하고, 형평하며, 투명한지에 대한 것임]을 시사한다. 시스템 내(예: 특정 의대의 현장 또는 개인 간) 또는 시스템 간(예: 매우 다른 맥락에서 일하는 사람들과 관련하여)에서 그러한 비교가 이루어지는 정도는 두고 봐야 한다.
Looking across the theory-related concepts uncovered in that previous review,6 one that was particularly prominent in our data was that of equity. Participants in our health professional education context most often discussed teaching incentives such as payments, promotions, titles and awards in terms of disparities and comparisons

  • to what others received,
  • to the amount of effort exerted, or
  • to how much income they could be making in other ways.

They discussed the absolute amount of financial incentives to a lesser extent. These reflections suggest that Equity Theory,14 which posits that individuals will feel distressed if they deem their inputs (eg effort, time, etc) to be misaligned with their outcomes (eg salary, recognition), is a particularly relevant theory for health professional education. Clinician teachers may feel that others in comparable situations receive more for putting in less effort, or they may feel that the overarching system (eg the medical school) unfairly determines those inputs and outputs.15 Again, this suggests incentivisation is less about which rewards are ‘good’ or ‘bad’ and more about whether they are fair, equitable and transparent. The extent to which such comparisons are made within a system (eg across sites or individuals at a particular medical school) or across systems (eg in relation to those working in a highly different context) remains to be seen.

어쨌든, 참가자들이 종종 [장애물을 합리화한다는 것, 그리고 단점에도 불구하고 계속해서 가르친다는 것]은 우리에게 인식 불협화음의 힘, 즉 자신의 태도와 행동이 모순되는 상태를 상기시킨다. [인지 부조화 이론가]는 개인들이 주어진 행동에 대해 어떻게 느끼는지에 따라 행동할 필요가 있으며, 그들의 [행동을 바꾸기보다는 그들의 행동에 맞춰 태도를 바꿀 가능성이 더 높다]고 제안한다. 이 이론은 임상의가 그들의 [행동을 바꾸기 전]에(예: 재정적인 피해 때문에 가르치는 것을 그만두는 것) 자신의 [태도를 재구성]한 이유(예를 들어, 그들이 가르치는 것으로 돈을 잃지만 다른 사람들의 성공을 돕는 것으로 부자가 된다고 주장하는 것)을 설명한다. 
In any case, that participants often rationalised away barriers and continued to teach despite the drawbacks remind us of the power of cognitive dissonance, the state of one's attitudes and behaviours contradicting. Cognitive dissonance theorists16 suggest individuals have a strong need to act in accordance with how they feel towards a given behaviour and are more likely to change their attitude to match their behaviour than to change their behaviour. This theory offers an explanation as to why clinicians reframed their attitudes (eg saying that they lose money by teaching but arguing they gain richness in helping others succeed) before changing their behaviour (eg quitting teaching because of the financial toll).

우리는 [장벽을 극복하기 위한 메커니즘]으로, 임상의들의 [자체적인 불협화음 협상]에 의존할 수도 있지만, 장벽은 결국 (교육을 정당화하는 것이 더 이상 비용 가치가 없을 정도에 이를 수 있는) [누적적 효과]를 갖는 것으로 보이기 때문에 한계가 있다. 이것은 [불평등에 대한 인식과 교육 동기 부족을 완화하기 위해 실질적인 수준에서 무엇을 할 수 있는지에 대한 통찰력을 개발하는 것의 중요성]을 강화한다.
While we may be able to rely on clinicians’ negotiating their own dissonance as a mechanism to overcome barriers, there is a limit as barriers appear to have a cumulative effect that can eventually tip the scales to the point where justifying teaching is no longer worth the cost. This reinforces the importance of developing insights regarding what can be done on a practical level to mitigate perceptions of inequity and a lack of motivation to teach.

4.2 실천적 함의
4.2 Practical implications

[학습자와의 관계가 임상 교육자에게 중요한 동기 부여 요인을 만든다]는 주장만큼 우리 데이터에 만연한 감정은 거의 없었다. 이와 같이, 이러한 연구 결과가 시사하는 실질적인 변화 중 하나는 지도부나 기관에 의해 인센티브가 전달되는 하향식 과정으로 의학 교사에게 인센티브를 주는 것을 중단하는 것이다. 오히려 모든 참가자가 [학습자가 교수자를 어떻게 인식하는지]를 중요시한다는 점을 고려할 때, [어떻게 임상의가 학습자에게 긍정적인 영향을 주었는지에 대한 정보]를 받을 수 있는 적절한 메커니즘을 확보하는 것이 매우 유익한 노력이 될 수 있다. 학생들로 하여금 [학생을 가르치는 교수들이 들이는 노력을 장려하고 가능하게 만드는 학생의 역할을 충분히 인식하도록 돕는 것]은 임상의들이 그들의 교육 활동에서 보람을 느끼게 하는 [의미 있는 교사-학습자 관계]를 형성하는 데 특히 영향을 미칠 수 있다. 이러한 관계가 학습자를 효과적인 피드백 과정에 참여시키는 데 중요한 것으로 나타났다는 점을 고려할 때, 이러한 관계는 또한 교사에게 영향력 있는 방식으로 건설적인 피드백을 전달할 수 있을 것으로 기대할 수 있다. 교사-학습자 관계에 대한 대부분의 연구는 교사가 학습자의 이익을 위해 관계를 발전시키는 방법에 초점을 맞추고 있지만, 강사의 지속적인 교육 노력에 대한 학습자의 기여가 최적화되려면, [어떻게 피드백 프로세스의 진정성을 유지하는 학습자를 위한 가이드라인을 만들 것인가]가 추가 연구의 중요한 영역이다.
Very few sentiments were as prevalent in our data as claims that relationships with learners create important motivational drivers for clinician educators. As such, one practical change these findings suggest is to stop conceiving of incentivising medical teachers as a top-down process in which incentives are delivered by leadership or the institution. Rather, given that all participants valued how their learners perceive them, ensuring appropriate mechanisms are in place for clinicians to receive information indicating how they have positively impacted their learners could be a highly fruitful endeavour. Helping students appreciate their role in encouraging and enabling effort to be put forth by their faculty may be particularly impactful for generating the meaningful teacher-learner relationships that make clinicians feel rewarded in their educational activity. Given that such relationships have been shown important for engaging learners in effective feedback processes, they may be expected also to enable constructive feedback to be delivered to teachers when needed in a manner that is impactful rather than de-motivating. While most research on teacher-learner relationships focuses on how teachers might develop relationships for their learners’ benefit,17 how guidelines for learners might be generated that maintain the authenticity of feedback processes is an important area for further research if learners’ contributions to preceptors’ ongoing teaching efforts are to be optimised.

우리는 또한 [교사 지원teacher support]을 관리자의 특정한 행위라기보다는 활동의 프로그램으로 전략적으로 생각하는 것을 추천한다. 동기부여의 동적 특성은 어떤 개인에게든 항상 하나의 인센티브 제도로는 충분할 것 같지 않게 만들고, 따라서 모든 개인에게 동기부여가 되는 'one size fits all' 전략이 만들어질 수 있다고 상상하기 어렵다. [요인, 시간 및 맥락] 사이의 복잡한 상호작용 특성은 인센티브를 제공하여 동기를 형성하려고 할 때 특이하고 뉘앙스 있게 생각할 필요가 있음을 시사한다. 무엇이 사람들에게 동기를 부여하는지에 관한 일반적인 원칙에 주의를 기울이고(자기 결정 이론에 요약된 역량, 연결 및 자율성의 감정을 포함한다), 그러한 가치에 부합하는 지원과 인센티브를 개발하는 것이 가치 있다. 그러나 그렇게 하는 것은 임상 교사들이 [어설프게 구현된 인센티브 제도에 의해 의욕이 꺾이는 것]을 피하기 위한 일련의 전략을 필요로 할 가능성이 높다.

  • 학술 기관의 일원처럼 느끼고 싶은 임상의들에게, 교육 기관에 가입하거나 대학 자원에 접근할 수 있는 기회가 가장 큰 영향을 미칠 수 있다.
  • 연결을 구축하고자 하는 다른 사람들에게는 네트워킹과 지역사회 구축 기회가 특히 유익할 수 있다.
  • 다른 사람들은 여전히 어려운 학습자와의 만남에 직면하여 탄력성을 구축하는 지원을 요구할 수 있으며, 이는 교사들 사이에서 교사 정체성을 육성하고 실천의 공동체를 구축하는 데 초점을 맞춘 교수진 개발 제안이 가치를 증명할 수 있음을 시사한다.

We also recommend thinking of teacher support strategically, as a programme of activity rather than as a particular act on the part of an administrator. The dynamic nature of motivation makes it unlikely that one incentive scheme will always be sufficient for a given individual and, thereby, makes it foolhardy to imagine that a ‘one size fits all’ strategy could be created that would motivate all individuals. The complex nature of the interaction between factors, time and context suggests a need to think idiosyncratically and with nuance when trying to build motivation by offering incentives. It is valuable to pay heed to general principles regarding what motivates people (including feelings of competence, connection and autonomy, as outlined in self-determination theory 6) and to develop supports and incentives aligned with those values. Doing so, however, is likely to require an array of strategies to avoid clinician teachers feeling de-motivated by poorly implemented incentivation schemes.

  • For clinicians who want to feel like part of an academic institution, the opportunity to join teaching academies or access university resources might be most impactful.
  • For others who want to build connections, networking and community building opportunities might be particularly beneficial.
  • Others still may require support building resilience in the face of difficult learner encounters, suggesting that faculty development offerings focused on nurturing teaching identities and building communities of practice among preceptors could prove valuable.1819

어떤 전략(또는 이상적으로는 전략)을 채택하든 간에 [선의의 인센티브 제도의 의도하지 않은 결과]는 인센티브가 어떻게 조작되고 제공되는지에 대해 신중하게 생각할 필요가 있음을 시사한다. 임상의의 [동기를 훼손하는 방식의 인센티브 제공]은 지속적인 결과를 초래하고 냉소주의를 구축할 수 있다. [Generic하고 템플릿 기반의 서포트 레터]는 수신자가 개인 편지를 작성하는 데 걸리는 시간을 낭비할 가치가 없다는 신호를 보낼 수 있습니다. 동시에 교사 채용 문제가 인센티브 제공이 만병통치약을 제공하는 동기부여 문제로만 프레임되어서는 안 된다는 점을 인식해야 한다. 특정한 실무 환경이 다른 환경보다 더 많은 장벽을 만들 수 있다는 것을 인정하는 것은 중요하다. 비슷하게 어린 아이들을 갖는 것은 사무실에서 많은 시간을 보내는 것을 막을 수 있지만, 시간이 장애요인이 되는 정도는 가르치는 것에 대한 자신감과 학습자와의 개인적인 연결에 의해 영향을 받을 수 있다. 해결하기 쉬운 과제는 아니지만, 동기 부여를 찾기 위해 고군분투하는 사람들을 위해 장벽을 줄이기 위해 추가적인 노력을 투자할 가치가 있을 것이며, 임상의나 맥락에 대한 포괄적인 진술은 교육이 인식되는 방법에 영향을 미치는 많은 개별 현실을 간과한다는 것을 인식한다.
Regardless of what strategy (or, ideally, strategies) one adopts, the unintended consequences of well-intentioned incentive schemes suggest we need to think carefully about how incentives are crafted and delivered. Offering incentives in ways that undermine clinicians’ motivations can have lasting consequences and build cynicism. Generic and template-based letters of support can signal that the recipient is not worth the time it takes to craft a personal letter. At the same time, it must be recognised that teacher recruitment issues should not be solely framed as a motivation problem for which offering incentives provides a panacea. Acknowledging that certain practice environments (eg fee for service roles) can create more barriers than others (eg salaried clinicians working where residents can take some of the patient load) is important.20 Having young children, similarly, may prevent one from spending copious amounts of extra time in the office, but the extent to which time creates a barrier might be influenced by building confidence in teaching and personal connections with learners. While not an easy task to address, it is likely worth investing additional effort to reduce barriers for those who are struggling to find motivation, while recognising that blanket statements about clinicians or contexts overlook many of the individual realities influencing how teaching is perceived.

4.3 제한사항
4.3 Limitations

본 연구는 임상교사의 관점을 의도적으로 모색하였는데, 이는 임상교사가 기초과학자 및 사회과학자보다 학문적 의학을 떠날 가능성이 높기 때문이다. 이와 같이, 이 연구 결과는 더 보호된 수업 시간을 가질 수 있는 다른 유형의 교사들에게는 덜 관련이 있을 수 있다. 그들은 또한 개인이 교육적으로 기여하는지 또는 어떻게 기여하는지에 대한 통제력이 낮은 상황에서 덜 관련이 있을 수 있다. 그렇긴 하지만, 우리는 동기 부여를 위한 자율성의 중요성이 충분히 크다고 주장할 것이다. 일반적으로 교육의 질이 유지되려면 인센티브와 다른 형태의 지원의 영향을 고려하는 것이 중요할 것이다. 물론, 다양한 형태의 인센티브를 제공할 수 있는 능력은 사용 가능한 자원에 더 일반적으로 의존할 것이다. 참가자를 모집한 두 기관이 모두 고소득 국가에 존재한다는 점을 고려할 때, 식별된 일반 원칙이 주목할 가치가 있다고 예상하는 동안에도 참가자의 특정 경험은 저소득 환경으로 이전할 수 없을 수 있다. 마찬가지로, 우리의 연구 결과를 다른 기관에 적용하려는 사람들은 이러한 결과의 이전 가능성에 영향을 미칠 수 있는 다양한 교육 구조, 문화 및 보상 배치의 잠재력을 고려해야 한다. 현재 연구의 많은 참가자들은 다른 기관에서 일하고 가르쳤으며, 그들의 관점이 UBC의 맥락에 특정된다는 것을 거의 나타내지 않았지만, 그들 중 경제적 취약 지역에서 가르친 경험이 있는 사람은 거의 없을 것이다. 마지막으로, 교육을 그만두거나 교육 기회를 거절한 사람들을 참여자 풀에 포함시킴으로써 다양한 관점을 포착할 수 있었지만, 모집할 수 없었던 개인(예: 교육에 전혀 참여하지 않은 임상의)은 현재 연구에 반영되지 않은 더 강력한 관점을 가질 수 있다

This study purposely sought out the perspectives of clinician teachers because they are more likely to leave academic medicine than are basic and social scientists.21, 22 As such, the findings may be less pertinent to other types of teachers who may have more protected teaching time. They may also be less pertinent in contexts where individuals have less control over whether or how they contribute educationally. That said, we would argue that the importance of autonomy for motivation is sufficiently great, as a rule,6 that it will remain important to consider the influence of incentives and other forms of support any setting if teaching quality is to be maintained. Of course, the capacity to provide different forms of incentives will depend more generally on the resources available. Given that both institutions from which participants were recruited exist in high income countries, their particular experiences may not be transferable to lower income settings even while we anticipate that the general principles identified are worth heeding. Similarly, those attempting to apply our findings to other institutions should consider the potential for different teaching structures, cultures and compensation arrangements to impact on the transferability of these results. Many participants in the current study had worked and taught at other institutions and rarely did they indicate that their perspectives were specific to UBC’s context, but few of them are likely to have experience teaching in less economically privileged parts of the world. Finally, while we were able to capture multiple perspectives by including those who either quit teaching or who had turned down teaching opportunities within the participant pool, individuals who could not be recruited (eg clinicians who never engaged in teaching) may have stronger perspectives that are not reflected in the current study.

5 결론
5 CONCLUSIONS

요약하자면, 교육을 둘러싼 동기와 인센티브 사이의 복잡한 관계를 반복적으로 탐구하고 놀리려는 우리의 의도적인 노력은 임상 교사들에게 최상의 인센티브를 주는 방법에 대한 간단한 '레시피'를 밝히지 않았지만, 세 가지 핵심 메시지는 매우 중요해 보인다.

  • (1) 개인에게 고유한 방식으로 경험되며 시간이 지남에 따라 상황에 따라 변화할 수 있는 다양한 요인이 작용한다. 
  • (2) 임상 교사들은 일반적으로 아래와 같이 느낄 때 가치있게 여겨진다고 느끼고, 따라서, 가르치는 것에 동기를 부여받는다.
    • (a) 그들의 교육 노력에 대해 인정받고 감사받는 것 
    • (b) 학습자, 동료, 리더십 또는 의료 교육 커뮤니티와 연결되는 것 
    • (c) 그들은 의미 있는 교수자-학습자 관계를 맺는 것. 다른 임상의들은 다른 관계를 우선시할 수 있지만, [학습자들에 의한 인정과 감사]는 특히 영향을 미치는 것으로 보인다. 
  • (3) 해로운 것과 반대로 도움이 되기 위해서, 교수 인센티브는 [개인적이고, 공평하고, 효율적으로 제공]되고 주의를 기울이는 방식으로 설계되고 전달되어야 한다.

In sum, while our deliberate efforts to iteratively explore and tease apart the intricate relationships between motivation and incentives surrounding teaching have not revealed a straightforward ‘recipe’ for how to best incentivise clinical teachers, three key messages appear critical:

  • (1) There are a variety of factors at play that are experienced in ways that are unique to individuals and are subject to change over time and across contexts;
  • (2) Clinical teachers generally feel valued and, hence, motivated to teach, when they feel
    • (a) recognised and appreciated for their teaching efforts,
    • (b) connected to their learners, peers, leadership or the medical education community and
    • (c) they have meaningful teacher-learner relationships. While different clinicians may prioritise different relationships, recognition by and appreciation of learners appears particularly impactful;
  • (3) To be supportive as opposed to harmful, teaching incentives should be designed and delivered in ways that are personal, equitable, efficiently provided and framed with care.

 


Med Educ. 2021 May;55(5):614-624. doi: 10.1111/medu.14422. Epub 2020 Dec 9.

Incentives for clinical teachers: On why their complex influences should lead us to proceed with caution

Affiliations collapse

Affiliations

1Office of Faculty Development, Faculty of Medicine, The University of British Columbia, Vancouver, BC, Canada.

2Department of Educational Development and Research, Faculty of Medicine, University of Maastricht, Maastricht, The Netherlands.

3Department of Medicine, Faculty of Medicine, University of British Columbia, Vancouver, BC, Canada.

4Department of Educational and Counseling Psychology, and Special Education, Faculty of Education, Vancouver, BC, Canada.

5Department of Medicine, Centre for Health Education Scholarship, University of British Columbia, Vancouver, BC, Canada.

PMID: 33222291

DOI: 10.1111/medu.14422

Abstract

Introduction: When medical education programs have difficulties recruiting or retaining clinical teachers, they often introduce incentives to help improve motivation. Previous research, however, has shown incentives can unfortunately have unintended consequences. When and why that is the case in the context of incentivizing clinical teachers remains unclear. The purposes of this study, therefore, were to understand what values and motivations influence teaching decisions; and to delve deeper into how teaching incentives have been perceived.

Methods: An interpretive description methodology was used to improve understanding of the development and delivery of teaching incentives. A purposeful sampling strategy identified a heterogenous sample of clinical faculty teaching in undergraduate and postgraduate contexts. Sixteen semi-structured interviews were conducted and transcripts were analyzed using an iterative process to develop a thematic structure that accounts for general trends and individual variations.

Results: Clinicians articulated interrelated and dynamic personal and environmental factors that had linear, dual-edged and inverted U-shaped impacts on their motivations towards teaching. Barriers were frequently rationalized away, but cumulative barriers often led to teaching attrition. Clinical teachers were motivated when they felt valued and connected to their learners, peers, leadership, and/or the medical education community. While incentives aimed at producing these connections could be perceived as supportive, they could also negatively impact motivation if they were impersonal, inequitable, inefficient, or poorly framed.

Discussion/conclusion: These findings reinforce the literature suggesting that it is necessary to proceed with caution when labeling any particular factor as a motivator or barrier to teaching. They take us deeper, however, towards understanding how and why clinical teachers' perceptions are unique, dynamic and fluid. Incentive schemes can be beneficial for teacher recruitment and retention, but must be designed with nuance that takes into account what makes clinicians feel valued if the strategy is to do more good than harm.

신뢰와 위험: 의학교육을 위한 모델 (Med Educ, 2017)
Trust and risk: a model for medical education
Arvin Damodaran,1 Boaz Shulruf2 & Philip Jones3

 

서론
Introduction

의료, 위험 및 신뢰
Health care, risk and trust

의료는 본질적으로 복잡하고 위험한 사업이며, 임상의가 지속적으로 위험을 관리해야 한다. 임상 교사들도 마찬가지로 학생이나 후배 의사에게 임상 업무를 위임할 때마다 잠재적인 문제가 있다는 것을 이해한다. 기존의 역량 평가는 이러한 미묘한 결정을 내리기에 충분한 정보를 제공하지 못할 수 있지만, 특정 훈련생을 불신하거나 신뢰할 수 있는 결정을 내려야 한다. 신뢰는 임상의에게 생소한 어휘가 아니다. 비공식적으로, 의사들은 그들의 후배들과 또래들을 다음과 같은 간단한 질문으로 평가한다. '당신은 그들이 당신의 어머니를 돌볼 것이라고 믿겠습니까?' 이는 작업 공간 기반 평가를 재구성하는 방법을 나타내는 신뢰할 수 있는 전문 활동(EPA)의 직관성과 새로운 인기를 부분적으로 설명할 수 있다.
Health care is an inherently complex and dangerous business, in which clinicians are continually required to manage risk. Clinical teachers likewise understand there are potential problems each time they delegate a clinical task to a student or junior doctor. Conventional assessments of competency may not provide enough information to make these nuanced decisions,2 yet the decision to either distrust or trust a particular trainee to undertake a task must be made. Trust is not an unfamiliar vocabulary to clinicians. Unofficially, doctors rate their juniors and peers with the simple question: ‘Would you trust them to look after your mother?’ This may in part explain the intuitiveness and new popularity of entrustable professional activities (EPAs) as representing a way to restructure workplace-based assessments.3

의학 교육에서 '위임'이라는 단어의 바로 그 사용은 신뢰라는 개념에 새로운 초점을 가져왔다. 그러나 일단 이 개념을 도입하면 다음과 같은 많은 질문이 발생합니다.

  • 신뢰의 정의는 무엇입니까?
  • 우리는 어떻게 신뢰하거나 불신하는 결정을 내릴 수 있을까?
  • 신뢰에 대해 이야기하는 것이 평가와 역량의 전통적인 의학 교육 어휘보다 더 진실하고 의미 있는 대화인가?
  • 신뢰는 개인과 조직을 어떻게 상호 연결합니까?
  • 신뢰의 개념을 의료 커리큘럼에서 더 폭넓게 사용할 수 있는가, 아니면 그래야 하는가?

In medical education, the very use of the word ‘entrustment’ has brought new focus to the idea of trust. However, once we engage with the concept, many questions arise:

  • What definition of trust should we be using?
  • How do we come to a decision to trust or distrust?
  • Is talking about trust a more authentic and meaningful conversation than the conventional medical education vocabulary of assessment and competency?
  • How does trust interconnect individuals and organisations?
  • Can, or should, we use the concept of trust more widely in medical curricula?45

목적 및 방법
Aims and method

우리의 목표는 임상 교사 및 보건 교육 학자들에게 신뢰에 대한 문헌에 대한 광범위한 개요를 제공하고 신뢰, 위험 및 통제의 언어가 의학 교육의 현재 사고와 어떻게 교차할 수 있는지 탐구하며 잠재적인 질문 방향에 대한 제안을 하는 것이었다. 이는 체계적인 비판적 검토가 아닌 문헌의 서술적 개요로 제시된다.6, 7 다양한 데이터베이스(MEDLINE, ERIC [교육 자원 정보 센터], CINAHL [간호 및 제휴 건강 문헌에 대한 누적 지수], EMBASE, Proquest Central, Business Source Central 및 Google Scholar)를 사용하여 질문했다. 키워드 및 주제 검색에서 '신뢰', '의료', '건강', '교육'의 조합과 관련 참고문헌 및 인용문구가 손으로 작성되었습니다. 경영, 고등교육, 의학, 의료 교육 분야에서 신뢰trust 문헌에 대한 우수한 리뷰가 출판되었다. 이 논문의 목적은 이 연구를 강조하고 의학 교육 및 임상 커뮤니티를 위해 맥락화하는 것이었다. 우리는 환자-의사 또는 훈련생-감독자 관계와 같은 단일 관계로 초점을 제한하지 않고 여러 수준에서 관계를 포괄함으로써 폭을 위한 깊이를 희생했다. 
Our aim was to provide clinician-teachers and health education scholars with a broad overview of the literature on trust, exploring how the language of trust, risk and control might intersect with current thinking in medical education, and to make suggestions for potential directions of enquiry. This is presented as a narrative overview of the literature rather than a systematic critical review.6, 7 A variety of databases (MEDLINE, ERIC [Educational Resources Information Centre], CINAHL [Cumulative Index to Nursing and Allied Health Literature], EMBASE, Proquest Central, Business Source Central and Google Scholar) were interrogated using combinations of ‘trust’, ‘medical’, ‘health’ and ‘education’ in keyword and subject searches, and relevant references and citations were hand-searched. Excellent reviews of the trust literature have been published in the fields of management,8, 9 higher education,10 medicine11 and medical education.3, 12 The purpose of this article was to highlight this research and to contextualise it for the medical education and clinical community.13 We have sacrificed depth for breadth by encompassing relationships at multiple levels, rather than restricting the focus to a single relationship such as the patient–doctor or trainee–supervisor relationship.

우리는 의료 교육 및 의료에 대한 신뢰의 중요성을 설명하는 것으로 시작하여 외부의 의료로부터 신뢰 테마와 연구를 탐구한 후, 다시 돌아와 의료 교육 관계를 해체하는 데 관리 문헌의 모델이 어떻게 사용될 수 있는지 검토한다. 마지막으로, 우리는 신뢰가 더 광범위한 위험 관리 의제에 어떻게 부합할 수 있는지 살펴본다. 그러나 첫 번째 과제는 신뢰를 정의하는 것이다.
We begin on familiar ground by describing the importance of trust to medical education and health care, and then explore trust themes and research from outside health care, before returning to examine how a model from the management literature may be used to break down medical education relationships. Finally, we look at how trust may fit into the wider risk management agenda. The first task, however, is to define trust.

신뢰의 정의
Defining Trust

신뢰를 정의하는 특징은 [신뢰자가 위험을 인식하고 관계의 취약성을 받아들이는 것]이다. 신뢰는 [위험을 감수하기 위한 의식적인 결정]을 내리는 것을 포함하며, 이는 훈련생에게 직접적인 감독 여부가 있거나 없는 상황에서 임상 활동을 수행하도록 하는 과정에서 감독관이 해야 하는 일이다. 이 조치를 취함에 있어서, 감독자는 그녀의 환자뿐만 아니라 그녀의 명성도 위험에 처하게 한다. 담당 임상의의 이름은 환자의 침대 머리 위에 있습니다. 수술이 실패하거나 진단이 누락될 경우, 그녀는 개인적이고 잠재적으로 의학적인 법적 결과에 직면할 것이다. 이러한 [위험 평가]와 [취약성에 대한 자발적인 노출]은 [신뢰]와 [공정한 역량 인증]을 구별하는 것으로서, 특히 위험한 작업장에 적합할 수 있습니다. 사실, 기존의 학술 평가는 감독자가 임상 업무를 위임하기로 결정할 때 참조되지 않는 경향이 있다. 

The defining feature of trust is the trustor's appreciation of risk and acceptance of vulnerability in the relationship.14, 15 Trust involves making a conscious decision to take on risk, as a supervisor must do when letting a trainee carry out a clinical activity with or without direct supervision. In taking this action, the supervisor subjects her patient, as well as her own reputation, to risk. The supervising clinician's name is on the patient's bedhead. Should a procedure fail, or there be a missed diagnosis, she will face personal, potentially medico-legal consequence. This risk assessment and willing exposure to vulnerability differentiates trust from an impartial certification of competence, and may be particularly suited to the risky workplace. In fact, conventional academic assessments tend not to be referenced by supervisors when they decide to delegate clinical tasks.16

신뢰의 정의는 준비 상태로 볼 때 다음과 같이 표현된다. '신뢰는 다른 사람의 의도나 행동에 대한 긍정적인 기대를 바탕으로 취약성을 받아들이려는 의도를 포함하는 심리적 상태이다.' 이 정의는 상황별 및 작업별 특성을 생략하지만, 취약성의 정의 특성과 함께 신뢰자와 수탁자 간의 상호 의존성을 강조한다. 그러나 신뢰는, 특히 직장 관계에서, 직무 특이적이고 맥락에 따라 다르다. 특정 작업에서 '무엇을 할 것인가?'라는 질문을 추가하면, 공식은 'A는 B가 X하는 것을 신뢰한다'가 된다. Trustor(갑)는 Trustee(을)가 업무를 수행할 동기와 역량이 있다고 판단해야 한다.
A definition of trust when viewed as a state of readiness has been expressed as: ‘Trust is a psychological state comprising the intention to accept vulnerability based upon positive expectations of the intentions or behaviour of another.17 Although this definition omits context- and task-specificity, it highlights interdependence between trustor and trustee, along with the defining characteristic of vulnerability. Trust, however, is task-specific and contextual, particularly in workplace relationships. If we add, in a specific task, the ‘to do what?’ question, the formulation becomes ‘A trusts B to do X’.18, 19 The trustor (A) must judge that the trustee (B) has the motivation and competence to get the job (X) done.

위의 모든 것을 고려한다면, 정의는 다음과 같이 확장될 수 있다: 신뢰는 신탁업자가 취약성 및 위험의 수용을 요구하는 판단이며, 수탁자(개인 또는 조직)가 특정 조건에서 특정 작업을 수행할 수 있는 역량, 의지, 무결성 및 역량(즉, 신뢰도)을 가지고 있다는 것이다. 이 문서의 나머지 부분에 사용할 정의입니다.
Factoring in all of the above, the definition might be expanded to:

  • trust is a judgement by the trustor,
  • requiring the acceptance of resultant vulnerability and risk,
  • that the trustee (individual or organisation) has the competence, willingness, integrity and capacity (i.e. trustworthiness)
  • to perform a specified task
  • under particular conditions.

This is the definition we will use for the remainder of this article.

의료 교육 및 의료에 대한 신뢰
Trust in medical education and health care

교육생에 대한 감독자의 신뢰
Supervisors’ trust in trainees

신뢰는 교사-학생 관계의 핵심으로 여겨진다. 임상 훈련에서도 다른 공예와 마찬가지로 '점진적 독립'의 도제직이나 전통이 있다. 즉, 교육생들에게 감독관들이 점차 신뢰를 넓혀가면서 실제 업무 수행에 대한 자율성을 높일 수 있게 된다. 숙련된 상사는 위험을 허용 가능한 수준으로 유지하면서 훈련생의 역량과 자신감을 키워줍니다. 이상적으로, 훈련자의 학습 요구는 Vygotsky가 '근위 발달 영역'이라고 지칭한 도전에 의해 최적으로 충족된다. 각각의 신뢰 결정은 개별화되고 반복적이기 때문에, 정적 커리큘럼은 제한된 가치를 가진다. 이것은 직장에서의 학습 경험을 묘사하는 위치 학습과 숨겨진 커리큘럼과 같은 현대 이론과 일치한다. [교육병원에서의 학습]은 [실제 작업이 진행 중인 환경]에서 [실천 커뮤니티에 위치]하여 [경험적]이다. 학생은 합법적인 주변적 참여에서 시작하여 점차 이해와 참여도를 높이고 시간이 지남에 따라 의사 결정 과정의 중심이 됩니다. 이러한 이론과 완전히 일치하지만, 임상 과제를 위임하기 위한 복잡하고 다요인 결정을 이해하려면 [학습자의 머릿속]에서 벗어나 [(학습자의 요구는 보조적인 우선순위가 되는) 감독자의 머릿속]으로 들어가야 한다. 결국, 감독관은 신뢰자이다.
Trust is considered central to the teacher–student relationship.20, 21 In clinical training, as in other crafts, there is an apprenticeship or tradition of ‘progressive independence’.22 In other words, supervisors gradually extend trust to their trainees, allowing them increasing autonomy to perform real tasks in the workplace. A skilful supervisor encourages the trainee's developing competence and confidence, while keeping risks to an acceptable level. Ideally, the trainee's learning needs are optimally met by challenge in what Vygotsky referred to as the ‘zone of proximal development’.23, 24 As each trust decision is individualised and iterative, static curricula are of limited value. This is consistent with contemporary theories such as those of situated learning and the hidden curriculum, which describe the trainee experience of learning in the workplace.25 In teaching hospitals learning is experiential, situated in communities of practice in an environment in which real work is ongoing. The student starts off in legitimate peripheral participation,26 gradually increasing his understanding and engagement, and over time becomes increasingly central to the decision-making processes. Although it is entirely consistent with these theories, attempting to understand the complex and multifactorial decision to delegate clinical tasks takes us out of the learner's head and into the supervisor's, in which the learner's needs may well be a subsidiary priority. After all, the supervisor is the trustor.

[신뢰할 수 있는 전문 활동]은 [충분한 증거를 수집하고 평가]한 후 [훈련생에게 '위탁'할 수 있는 관찰 가능한 전문 작업을 선별하여 기술함]으로써 이러한 개념을 활용하는 새로운 접근법을 나타낸다. [EPA의 사용]은 임상의의 판단에 타당성을 추가하고 현재 작업장 평가에서 [원자성atomistic 체크박스]를 사용하는 것에 대한 우려를 해결한다.3 이러한 매력에도 불구하고 EPA를 개발하고 구현하는 최적의 방법은 아직 결정되지 않았다. 
Entrustable professional activities represent a novel approach that utilises these concepts by describing selected observable pieces of professional work that can be ‘entrusted’ to the trainee once sufficient evidence has been collected and assessed. The use of EPAs adds validity to the clinician's judgements and addresses concerns about current use of atomistic tick-boxes in workplace assessment.3 Despite these attractions, the optimal means of developing and implementing EPAs remain to be determined.27

EPA에서 '위임'이라는 단어의 의도적 사용은 어느 정도 탐구할 가치가 있다: 위임은 수탁자가 향후 활동을 수행할 수 있도록 하는 신탁 결정trust decision이 내려졌음을 의미한다. 한 사람이 다른 사람에게 특정한 일을 Entrusts한다. '위임'은 업무에 특화되어 있고 계약적이며, '신뢰'보다 개인적인 함축가 적다. 따라서 '위탁'이라는 단어를 사용하는 것이 교육생을 다룰 때, 특히 특정 업무와 행동에 대한 건설적인 피드백을 제공할 때 '신뢰'를 사용하는 것보다 더 나을 수 있습니다. 이러한 뉘앙스를 떠나 신뢰와 위탁의 구조는 불가분의 관계에 있다.
The purposeful use of the word ‘entrustment’ in EPAs deserves some exploration: entrustment implies that a trust decision has been made that will allow the trustee to undertake a future activity.18 One entrusts another to undertake a specific task. ‘Entrustment’ is task-specific and contractual, and has less personal overtones than ‘trust’. Using the word ‘entrustment’ may therefore be preferable to using ‘trust’ when dealing with trainees, particularly when giving constructive feedback around specific tasks and behaviours. Aside from these nuances, the constructs of trust and entrustment are inextricably linked.

우리는 감독 관계와 EPA를 신뢰에 대한 보다 일반적인 논의를 위한 친숙한 디딤돌로 사용해 왔다. 신뢰와 직업을 고려하고 더 광범위한 신뢰 문헌이 어떻게 유익할 수 있는지 살펴본 후에 우리는 훈련생-감독자 관계로 돌아갈 것이다.
We have used the supervisory relationship and EPAs as familiar stepping stones into a more general discussion of trust. We will return to the trainee–supervisor relationship after we have considered trust and the profession, and seen how the broader trust literature may be instructive.

환자가 의사를 신뢰하는 것
The patient's trust in the doctor

[환자-의사 신뢰 관계]는 치료 관계에 필수적인 것으로 간주되어 상당한 관심을 받아 마땅하다. 주치의에 대한 신뢰는 환자의 진료의욕, 민감한 정보공개, 조사나 관리의 취약성 수용에 영향을 미치며, 궁극적으로는 진료만족도에 영향을 미친다. 반대로, 일단 관계에 대한 신뢰가 깨지면, 환자들은 용서하거나, 다른 곳으로 가거나, 불평하거나, 의료-법적 절차를 시작하는 것을 선택할 수 있다. 의사들에 대한 신뢰를 높일 수 있는 개입에 대한 Cochrane 메타 분석은 주제에 대한 관심이 있지만, 어떤 접근법에서든 일관된 이익을 얻을 수 있는 증거가 아직 충분하지 않다는 것을 보여준다. 결국, 의사와 학생들이 항상 진실을 말하지 않기 때문에 불신은 정당화될 수 있다. 
The patient–doctor trust relationship, regarded as integral to the therapeutic relationship, has deservedly received significant attention. Trust in one's doctor impacts on the patient's willingness to seek care, disclose sensitive information and accept the vulnerability of investigations or management, and ultimately affects satisfaction with care.28, 29 Conversely, once there has been a breach of trust in the relationship, patients may choose to forgive, to go elsewhere, to complain or to initiate medico-legal proceedings.30, 31 A Cochrane meta-analysis of interventions that may increase trust in doctors demonstrates that although there is interest in the subject, there is as yet insufficient evidence for consistent benefit from any one approach.32 After all, distrust may be warranted as doctors and students do not tell the truth all the time.33, 34

의료계에 대한 환자의 신뢰
The patient's trust in the medical profession

[자신의 의사(일반적으로 매우 높은 것으로 평가됨)에 대한 신뢰]는 [의료 전문직이나 의료 시스템에 대한 신뢰(일반적으로 덜 높은 것으로 평가됨)]와 경험적으로 다르다. 의사나 의료 서비스에 의한 환자 신뢰의 우울할 정도로 정기적인 위반에 의해 공급되고 법적 수단이 요구되는 프로세스에서 직업과 기관에 대한 신뢰는 점점 더 도전받고 있다. 특히 미국의 [관리형 의료의 출현]과 [영국 국립 보건 서비스 의료 시스템]에 대한 신뢰의 침해와 관련하여, 우리의 [의료 시스템]과 [그 시스템에 공급하는 교육 기관]에 대한 사회적 신뢰가 하락하고 있다는 일반적 인식이 있다. 정부 정책을 알리기 위해 의료에 대한 국민의 신뢰에 대한 조사 기반 척도가 사용되어 왔다.
Trust in one's own physician (generally rated as very high) differs empirically from trust in the medical profession or health care systems (which is generally less high).29, 35 Trust in the professions and institutions is increasingly challenged in a process that is fed by depressingly regular breaches in patient trust by practitioners or health services and in which legal recourse is required.36 There is a perception of general decline in societal trust in our systems of health care and the educational institutions that feed into them, notably related to the advent of managed health care in the USA and perceived breaches of trust in the UK National Health Service health care systems.37-39 Survey-based measures of public trust in health care have been used to inform government policy.22

제약업계의 영향과 의사-연구자의 이해충돌로 의료업의 근간인 [과학·의학 연구에 대한 불신]도 커지고 있다. 환자가 반드시 의사의 제약 회사 계약이나 환자를 자금 지원 시험에 등록하기 위한 재정적 인센티브를 알 필요는 없다. 학술적 위법행위의 빈번한 사례가 저널 논문 철회를 증가시키고 있다. 하지만 이미 자신을 둘러싼 환경에서 다수의 학문적 경범죄를 인지하는 의대생들에게는 주목을 받지 못한다. 
Distrust is also increasingly expressed towards scientific and medical research, the foundation of the medical profession, because of the influence of pharmaceutical industry and physician-researcher conflicts of interest.40, 41 Patients are not necessarily made aware of doctor's pharmaceutical company engagements or financial incentives to enrol patients into funded trials.42 Frequent high-profile cases of academic misconduct drive an increasing number of journal article retractions.43 This is not lost on medical students, who perceive a multitude of academic misdemeanours in their own environments.44

신뢰 수준
Levels of trust

앞 단락에서 우리는 더 넓은 직업뿐만 아니라 개인으로서 의사들을 신뢰하는 몇 가지 위협에 대해 설명했습니다. 신뢰를 분석하려고 할 때, 사회적 또는 조직적 요인에서 대인관계 요인을 분리해내는 것이 분명히 중요하다. 어떤 하나의 신뢰 결정에서도 [대인관계와 조직적 결정 요인] 사이에 상호작용이 있을 가능성이 높다. 이를 위해, 문헌은 [대인관계, 조직 및 제도적 수준]을 참조하여 '신뢰 수준'의 개념을 도입한다.10 예를 들어,

  • 대인적 신뢰는 친구나 동료의 신뢰를 의미할 수 있다;
  • 조직적 신뢰는 임상 서비스, 의과대학 또는 대학에서의 신뢰를 의미할 수 있다.
  • 제도적 신뢰는 국가 차원에서 보건 또는 교육 시스템과 같은 시스템의 신뢰를 지칭할 수 있다.

In the preceding paragraphs we described some of the threats to trust in doctors as individuals, as well as in the wider profession. In attempting to analyse trust, it is clearly important to tease out interpersonal factors from social or organisational factors.31 In any one trust decision, there is likely to be an interplay between interpersonal and organisational determinants.45 To this end, the literature brings in the concept of ‘levels of trust’ with reference to interpersonal, organisational and institutional levels.10 For example,

  • interpersonal trust may refer to trust of friends or colleagues;
  • organisational trust may refer to trusts in a clinical service, medical school or college, and
  • institutional trust may refer to trust of systems such as health or education systems at a national level.

신뢰 연구자는 [신뢰 분석 수준]을 수준 간 또는 수준 간(예: 조직을 신뢰하는 개인)으로 구분합니다. [신뢰의 방향]도 변수다. 신뢰는 어느 방향으로든 확장될 수 있으며, 상호주의의 개념을 가져올 수 있다. [직접적인 상호주의]는 대인 신뢰의 기초가 될 수 있다. ['간접적 상호주의']라고 불리는 신뢰와 협력의 사슬은 조직의 신뢰를 이해하는 데 도움이 될 수 있다. [관계 초기]에는 [간접적 조직적 결정요인]이 지배적이며, 나중에는 개인적 접촉과 피드백이 증가함에 따라 [대인관계적 측면]이 신뢰관계를 지배하기 시작할 수 있다. 
Trust researchers distinguish levels of trust analysis8 as inter-level or cross-level (e.g. an individual trusting an organisation). The direction of trust is another variable. Trust can extend in either direction, bringing in the concept of reciprocity.8 Direct reciprocity may be the basis of interpersonal trust. Chains of trust and cooperation, referred to as ‘indirect reciprocity’, may be helpful in understanding organisational trust.46 It may be that early in relationships, indirect organisational determinates predominate, and that later, with increasing personal contact and feedback, interpersonal aspects begin to dominate trust relationships.

그림 1은 조직 수준으로 정렬된 의료 교육에 관련된 일부 실체를 고려한다. 신뢰는 각 실체, 각 상자 또는 상자 사이의 상호 작용에서 발생하는 역동적인 사회적 구조로 볼 수 있다.
Figure 1 takes into account some of the entities involved in medical education, arranged into organisational levels.8, 47 Trust may be viewed as a dynamic social construct arising from the interactions within each set of entities, within each box or between boxes, with either of the pair in the role of the trustor.

비록 단순하지만, 이 관계 지도는 이러한 팔의 어느 쪽이든, 관심을 덜 받은 팔들을 포함하여, 어느 방향으로든 탐험을 유도한다. 우리가 설명한 바와 같이, 의료 교육에 대한 최근의 관심은 [person box]에 있는데, 특히 [감독관이 교육생에 대한 신뢰를 어떻게 발전시키고 이것이 직장 평가로 어떻게 운영될 수 있는지]에 대해 향하고 있다. 그러나 신뢰는 다른 많은 의학교육 결정에 분명히 내포되어 있다. [평가, 진행, 학업 부정행위, 양호한 감독, 프로그램 평가, 성과 관리 및 승진 메커니즘]은 각각 관계 지도에서 제 역할을 합니다(그림 1). [상자 내부]와 [상자 사이]에서, 어느 방향으로든 화살표를 추가로 조사하면 연구를 위한 새로운 방법을 제시할 수 있습니다. 예를 들어 임상 서비스 또는 대학 의료 프로그램에 대한 임상 교사의 신뢰, 학생에 대한 환자의 신뢰, 임상 교사 또는 훈련 프로그램 또는 학생 또는 임상 교사에게 의료 시스템이 제공하는 신뢰에 초점을 맞출 수 있다.
Although simplistic, this relationship map does invite an exploration of any of these arms, in either direction, including those that have received less attention. As we have described, recent attention in medical education has been directed within the person box, particularly at how a supervisor develops trust in trainees12, 23 and how this may be operationalised as workplace assessment.48-50 However, trust is clearly implicit in many other medical education decisions. Assessment, progression, academic misconduct, good supervision, programme evaluation, performance management and promotion mechanisms each have their place in the relationship map (Fig. 1). Further examination of these arms in either direction, within and between boxes, may suggest novel avenues for research. For instance, focus could be brought to bear on the clinical teacher's trust in clinical services or university medical programmes, the patient's trust in students, clinical teachers or the training programme, or the trust afforded by health care systems in students or clinical teachers.

우리는 이제 신뢰를 정의하고 의학 교육을 제공하는 데 관련된 다양한 주체가 어떻게 이산적인 신뢰 관계를 가지고 있는지를 표현했다. 다음 섹션에서는 의료 교육에서의 적용으로 돌아가기 전에 더 광범위한 신뢰 문헌을 소개한다.
We have now defined trust and expressed how the various entities involved in delivering medical education have discrete trust relationships. In the next section, we introduce some of the wider trust literature, before returning to its application in medical education.

더 넓은 문헌에 대한 신뢰
Trust in the broader literature

신뢰 연구의 짧은 역사
A short history of trust research

의학교육은 신뢰에 대한 관심에서 고립되지 않는다. 잘 확립된 개념적이고 경험적인 작업이 많이 존재하며, 처음에는 사회과학에 의해 주도되고 나중에는 비즈니스와 경영에 의해 주도된다. 
Medical education is not isolated in its interest in trust. A great deal of well-established conceptual and empirical work exists, initially driven by the social sciences and later picked up by business and management.

갈등 해결의 선구자인 Morton Deutsch는 1950년대 [신뢰]와 [취약성을 감당하려는 의지] 사이의 연관성에 대해 언급하면서, [충족되지 않은 신뢰]는 결국 신뢰자trustor를 '불쾌한 결과로 인한 고통'으로 이끈다고 언급했다. 쿠바 미사일 위기의 아슬아슬한 미스를 정점으로 한 냉전은 극심한 불신을 배경으로 갈등 해결에 대한 관심을 자극했다. 당시 연구자들은 신뢰 연구가 신뢰를 얻은 것은 이 시기 이후라고 언급했다. 
Morton Deutsch, a pioneer in conflict resolution, commented on the link between trust and a willingness to take on vulnerability in the 1950s, noting that unfulfilled trust necessarily leads the trustor to ‘suffer an unpleasant consequence’.51 The Cold War, culminating in the near miss of the Cuban missile crisis, set a backdrop of intense distrust and stimulated interest in conflict resolution. Researchers of the time noted that it was after this period that trust research gained credibility.52, 53

도이치는 신뢰에 대한 사회심리학적 접근을 특징짓는 협동적 행동에 대한 실험적인 게임 모델인 잘 연구된 '죄수의 딜레마'의 초기 조사자였다. 그 죄수의 딜레마에 대한 변화는 여러 세대의 대학생들에게 가해져 왔다. 이 게임의 컴퓨터 시뮬레이션, 반복적인 형태는 이혼, 지정학 및 종의 진화만큼이나 다양한 관계에 대한 함의를 가진 협력 전략을 모델링하는 데 사용된다.
Deutsch was an early investigator of the well-studied ‘prisoner's dilemma’, an experimental game model for cooperative behaviour that characterises the social psychology approach to trust. Variations on the prisoner's dilemma have been inflicted on generations of college students. Computer-simulated, iterative forms of the game are used to model cooperation strategies54 with implications for relationships as diverse as those in divorce, geopolitics and the evolution of species.

20세기 후반부터 비즈니스, 경영, 마케팅 문헌은 '소비자 신뢰'와 '브랜드 충성도'과 같은 용어를 대중화하면서 그 자체로 연구 분야로서의 신뢰에 대한 관심이 높아지기 시작했다. 2008년 글로벌 금융위기의 조직적 실패는 '신뢰 회복'과 같은 새로운 연구 분야를 장려했다. 연구 간행물 원량의 증가는 신뢰가 자체 저널을 획득하는 결과를 낳았다. 
In the late 20th century, the business, management and marketing literature began to place increasing attention on trust as a research field in its own right, popularising terms such as ‘consumer trust’ and ‘brand loyalty’. The organisational failures of the 2008 global financial crisis encouraged new areas of study such as that of ‘trust repair’.9, 55 An increase in the raw volume of research publications has resulted in trust acquiring its own journal.56

세계화와 인터넷은 비즈니스 관계를 변화시켰습니다. 성공적인 기업은 기술 기반 신뢰 대리인을 고용하고 있으며, 그 선구적인 예로 [이베이의 구매자 및 판매자 신뢰 등급]을 들 수 있습니다. 상업 등급 웹 사이트의 의사 및 보건 서비스에도 유사한 등급이 점점 더 많이 적용되고 있습니다. 병원의 경우, 소비자 등급이 기존의 환자 경험 및 결과 측정과 잘 상관관계가 있다는 증거가 있다. 
Globalisation and the Internet have altered relationships in business: successful enterprises employ technology-based trust surrogates, a pioneering example of which is eBay's buyer and seller trust ratings.57, 58 Similar ratings are increasingly applied to doctors and health services on commercial ratings websites.59 In the case of hospitals, there is evidence that consumer ratings correlate well with conventional patient experience and outcomes measures.60

신뢰에 적용되는 연구 방법
Research methods applied to trust

신뢰에 대한 연구는 대부분 게임 실험('죄수의 딜레마'로 특징지어짐)과 설문조사의 범주에 속한다. [게임 실험]은 주로 [대인관계 신뢰]를 탐구하기 위해 고안된 반면, [조직에 대한 신뢰]는 [설문 조사]를 통해 가장 일반적으로 연구되었다. 기업, 정부, 학교 등 기관에 대한 신뢰를 조사하기 위해 다양한 조사도구가 활용되고 있다. 이러한 방법들 각각은 비판(일반성이 부족하다는 게임 실험과 너무 피상적이라는 조사)에 열려 있지만, 세 번째 옵션은 이해 계층을 추가할 수 있는 잠재력을 가지고 있다. 신뢰가 [창발적 사회적 구조]로 묘사될 수 있다면, 그것은 질적 방법을 선호하는 [구성주의 연구 프레임워크]에 잘 맞을 수 있다. 우리가 더 논의할 것처럼, 의료 교육에서 질적 방법은 Govaerts와 Van der Vleuten에 의해 제안되었고, 예를 들어 Hauer et al과 Kennedy et al의 연구에서 감독-훈련자 관계를 이해하기 위해 사용되었다. 
Research on trust has for the most part fallen into the categories of game experiments (characterised by the ‘prisoner's dilemma’) and surveys. Game experiments have largely been designed to explore interpersonal trust, whereas trust in organisations has been most commonly studied using surveys. A variety of survey instruments have been employed to examine trust in institutions such as businesses, government and schools. Although each of these methods is open to criticism (game experiments for their lack of generalisability and surveys for being too superficial19), a third option has the potential to add a layer of understanding. If trust can be described as an emergent social construct, it may be well suited to a constructivist research framework47, 61 favouring qualitative methods.62 As we will discuss further, in medical education qualitative methods have been suggested by Govaerts and van der Vleuten50 and used, for example, in the work of Hauer et al.23 and Kennedy et al.63 to understand the supervisor–trainee relationship.

이제 우리는 경영 문헌에서 나온 신뢰 모델로 눈을 돌리고 감독-연수생 관계에 대한 성찰을 사용하여 그 관련성을 설명한다.
We now turn to a model of trust sourced from the management literature and use reflections on the supervisor–trainee relationship to illustrate its relevance.

임상 감독에 신뢰 모델 적용
Applying a model of trust to clinical supervision

1995년 연구에서 메이어 등은 이전에 나왔던 개념적, 경험적 연구를 바탕으로 [신뢰에 대한 통합 모델]을 제안하였다. 신뢰의 다른 개념화도 있지만, 메이어 외 모델은 특히 강력하다는 것이 입증되었다. 원본 기사는 집필 당시 5300개 이상의 스코푸스 인용을 끌어모았다.
In their 1995 work, Mayer et al.15 proposed an integrative model for trust based on the conceptual and empirical research that had come before. Although there are other conceptualisations of trust,64 the Mayer et al.15 model has proved particularly robust. The original article15 has attracted more than 5300 Scopus citations at the time of writing.

이 모델은 그림 2에 재현되어 있습니다.
The model is reproduced in Fig. 2.


이 모델에서, 기본은 'A는 B가 X를 하는 것을 신뢰한다' 구조이다. 피드백 루프가 추가되어 정교하게 제작되었습니다. 이 모델은 구별되지 않은 신뢰의 관점을 세 가지 측면으로 분해한다: 

  • [일반적인 믿음 또는 성향]으로서의 신뢰. 
  • [취약성을 받아들이기 위한 결정]으로서의 신뢰
  • [관계에서 위험을 감수하는 행위]로서의 신뢰

시간이 지남에 따라 관계가 발전함에 따라, 미래의 신뢰 결정에 대한 피드백이 있습니다.

In this model, the basic ‘A trusts B to do X’18 structure of trust is elaborated, with the addition of a feedback loop. The model breaks down an undifferentiated view of trust into three aspects:

  • trust as a general belief or propensity;
  • trust as a decision to take on vulnerability, and
  • trust as the act of risk taking in a relationship.

As the relationship develops over time, there is feedback into future trust decisions.

모델을 탐구하기 위해, 우리는 [경험을 쌓을수록 더 위험하고 더 높은 위험의 임상 작업을 수행하도록 요청받는 trainee]라는 익숙한 예시로 돌아간다. 이 모델은 trainee에 대한 감독자의 신뢰개발에 대한 질적 연구에서 발견된 요인을 예측한다. 이러한 결정요인은 각각 다음과 관련된 몇 가지 범주로 분류된다. 

  • 수련생 (인식된 신뢰성의 다양한 trustee 요인) 
  • 감독자 (신탁자의 성향 및 신뢰의사), 
  • 상황 및 과제 (결과와 함께 위험을 감수하는 행위) 및 
  • 이전의 신뢰 에피소드에 영향을 받는 역동적 관계 (신탁자에게 과거 사건이 피드백함)

모든 것이 잘 되면 피드백 루프는 더 큰 신뢰로 이어져야 하고, 위험 업무를 독립적으로 처리할 수 있는 더 많은 책임을 수탁자에게 위임해야 한다.
To explore the model, we return to the familiar example of the trainee who is asked to perform riskier, higher-stakes clinical tasks with less supervision as he gains in experience. The model predicts the factors found in qualitative research on supervisors’ development of trust in trainees. These determinants fall into several categories pertaining to, respectively,

  • the trainee (trustee factors of perceived trustworthiness),
  • the supervisor (the trustor's propensity and willingness to trust),
  • the context and task (perceived risk and the action of risk taking with resultant outcomes) and, lastly,
  • their dynamic relationship influenced by previous trust episodes (outcomes feeding back to the trustor).1265 

If everything goes well, the feedback loop should lead to greater trust and to the delegation of more responsibility to the trustee to handle risky tasks independently.

우리는 A, B, X 요인에 대한 논의로 넘어간다.
We move on to a discussion of the A, B and X factors.

신뢰도
Trustworthiness

훈련을 진전시키고 점점 더 복잡한 임상 업무를 위임받기 위해서는 훈련자가 스스로를 '신뢰할만한trustworthy' 사람으로 투영해야 하며, 역량만으로는 충분하지 않다는 것이 명백하다. Trust(신탁자trustor가 위험을 감수하기 위한 판단)Trustworthiness(신뢰를 발생시키는 수탁자trustee의 인식된 특성)는 중복되는 특성에도 불구하고, 경험적으로 구별되는 구조이다. 실제로 일부 학자들은 우리가 'trust'보다는 'trustworthiness'에 관심을 가져야 한다고 주장한다. [신탁자의 선입견preconceived notion을 조작]하려 하기보다는, [자신의 신뢰도trustworthiness를 높이는 것]이 더 달성 가능한 목표이다.
To progress in training and to be delegated increasingly complex clinical tasks, we see that trainees must project themselves as ‘trustworthy’ and it is apparent that competence alone is not enough. Trust (a judgement to take on risk by the trustor) and trustworthiness (perceived qualities of the trustee that engender trust) are empirically distinct constructs despite their overlapping qualities.66 In fact, some scholars argue that we should be less concerned with ‘trust’ than with ‘trustworthiness’.19 Rather than manipulating the trustor's preconceived notions, increasing one's own trustworthiness is a more achievable goal.

여러 연구에서 [신뢰성의 결정 요인determinants of trustworthiness]을 조사했습니다. 이것들을 검토하면서, 메이어 등은 그 요소들이 [능력, 자비, 청렴]의 세 가지 원칙 범주로 합쳐질 수 있으며, 세 번째 범주 없이는 이 중 두 가지 범주로는 충분하지 않다고 제안했다. 이것은 건강 관리에 대한 연구와 일치한다. 환자의 의사 신뢰에 영향을 미치는 요인에 대한 정성적 탐구는 [의사 속성]을 [기술적 역량(능력), 대인관계(선행성과 무결성) 및 구조/직원(능력) 요인]으로 설명하는 세 가지 범주로 분류했다. 신뢰도 결정 요인을 분류하는 방법은 여러 가지가 있겠지만, 의료에서 유용한 공식은 [역량, 의지, 무결성 및 역량]일 수 있다.
Multiple studies have examined the determinants of trustworthiness. In reviewing these, Mayer et al. proposed that the factors could be coalesced into three principle categories of ability, benevolence and integrity,15 and that no two of these is enough without the third. This fits with the research in health care. A qualitative exploration of factors influencing patients’ trust in their physicians grouped physician attributes into three broad categories described as

  • technical competence (ability),
  • interpersonal (benevolence and integrity) and
  • structural/staffing (ability) factors.67 

Although there will be any number of ways to categorise trustworthiness determinants, in health care a useful formulation may be competence, willingness, integrity and capacity.

여기서의 근거는 다음과 같다. 

  • 규제 기관 및 교육자는 직무별 지식과 기술을 통합한 역량 개념에 익숙하다.
  • 의지는 위탁자에 대한 자선benevolence 의 구조와 유사하며 인식된 대인관계 기술을 포착한다(의학에서 자애benevolence 는 특별한 윤리적 의미를 갖는다).
  • 성실성은 전문성과 유사한 중요한 독립적 요소이며, 마지막으로,
  • 카파시티를 분리하는 것은 임상의가 최선의 의도로도 직면하는 시간과 자원의 압박을 더욱 분명하게 만든다.

The rationale here is:

  • regulatory bodies and educators are familiar with the concept of competence which incorporates task-specific knowledge and skills;
  • willingness is similar to the construct of benevolence towards the trustor and captures perceived interpersonal skills (whereas benevolence has a particular ethical meaning in medicine);
  • integrity is an important stand-alone factor with analogies to professionalism, and, lastly,
  • separating out capacity makes more explicit the time and resource pressures clinicians face even with the best of intentions.

임상의가 효과적으로 행동할 수 있는 역량은 조직적인 결정요인을 가지고 있다. 유능한 의사나 병원 서비스는 대기자 명단이 이미 서비스 불가능하기 때문에 새로운 환자를 볼 능력이 없을 수 있다. 임상의는 비슷한 배경을 가진 졸업생들과 혼합된 경험 때문에 자신을 증명할 기회가 있을 때까지 새로운 훈련생에게 일을 맡기는 것을 꺼릴 수 있다. 따라서 위험 계산에서 여러 신뢰 수준(즉, 대인 관계 및 조직 결정 요인)이 고려된다.
A clinician's capacity to act effectively has organisational determinants. A competent and willing surgeon or hospital service may not have capacity to see new patients as the waiting list is already unserviceable. A clinician may be disinclined to delegate a task to a new trainee until he's had a chance to prove himself because of mixed experience with graduates of a similar background. Multiple levels of trust (i.e. interpersonal and organisational determinants) therefore figure in any risk calculation.

조직은 그에 상응하는 신뢰도 결정요인을 가지고 있다고 볼 수 있다. Caldwell과 Clapham은 조직의

  • '능력'은 역량, 재정적 균형 및 질 보증에 의해 판단될 수 있으며,
  • '자애'는 정보에 대한 상호적 예의와 책임에 의해 판단될 수 있으며,
  • '성실성'은 모두 임상 서비스 관리자에게 친숙할 것이라고 주장한다.

Organisations may be viewed as having corresponding trustworthiness determinants. Caldwell and Clapham14 argue that

  • ‘ability’ in an organisation might be judged by competence, financial balance and quality assurance,
  • ‘benevolence’ by interactional courtesy and responsibility to inform, and
  • ‘integrity’ by legal compliance and procedural fairness, all of which will be familiar to clinical service managers.

신뢰 성향
Propensity to trust

[신뢰성Trustworthiness]은 [수탁자Trustee]의 특성을 나타내지만, 보다 완전한 신뢰 방정식은 [신탁자Trustor]의 성향과 위험성에 대한 이해가 필요하다. 기존의 의료 평가에서는 편향을 최소화하고 신뢰성을 높이기 위해 표준화 및 보정을 위해 모든 노력을 기울인다. 따라서 대부분의 평가는 신뢰와 위험에 대한 개별 임상 교사의 내재된 지향점을 경시하거나 무시하도록 설계되었다. 대조적으로, 메이어 외 모델은 우리에게 Trustor를 식별하고, 그의 독특한 의사 결정 과정을 이해하려고 시도할 것을 명시적으로 요청한다. 모든 Trustor는 신뢰에 대한 결정과 관련된 위험과 취약성에 자신을 노출시키는 데 있어 편안함이나 불안의 정도가 다르다. 이를 Trustor의 '신뢰 성향' 또는 수탁자의 '중개 렌즈'라고 표현하였다. [낮은 신뢰자]는 위협 메시지를 보고, [높은 신뢰자]는 지정된 시나리오에서 협력 메시지를 봅니다. 신뢰자의 성별, 나이 및 인종은 신뢰도에 대한 결정요인을 평가하는 방법에 차이를 만듭니다. 예를 들어, 젊은 응답자들은 '정직한 의사소통'의 가치를 더 높게 평가한다. 임상 감독자가 되는 것을 고려하고 있는 임상의가 선천적인 신뢰 성향에 따라 스스로 선택한다는 이론이 있을 수 있다.
Trustworthiness describes the characteristics of the trustee, but the more complete trust equation requires an understanding of the trustor's disposition and the risks. In conventional medical assessment, all effort is made to standardise and calibrate in order to minimise bias and increase reliability. Most assessments are therefore designed to downplay or disregard an individual clinical teacher's in-built orientation to trust and risk. By contrast, the Mayer et al. model15 explicitly asks us to identify the trustor and to attempt to understand his unique decision-making process. All trustors differ in their degree of comfort or anxiety in exposing themselves to the risk and vulnerability associated with making a decision to trust. This has been described as the trustor's ‘propensity to trust15 or the trustor's ‘mediating lens’.68 Low trustors see the threat message and high trustors see the cooperative message in any given scenario.69 The gender, age and race of the trustor make a difference in how he or she weights determinants of trustworthiness.68 For example, younger responders rate the value of ‘honest communications’ more highly. One might theorise that clinicians considering becoming clinical supervisors will self-select based on their innate propensity to trust.

작업 및 컨텍스트
Task and context

[위험]은 메이어 외 모델의 핵심이다. 리스크는, 그리고 그에 따라 신뢰 또한 상황에 따라 다르며 작업별로 다릅니다. 우리는 글로벌하게 신뢰를 제공하지 않습니다. 대신 다음과 같이 질문합니다. '어떤 작업을 위해, 어떤 상황에서?' '그들이 실패하면 어떤 결과가 초래됩니까?' 죄수의 딜레마에서 보듯 '블라인드 트러스트'는 악용될 가능성이 높다. Trustworthiness 만으로는 충분하지 않고, 위험 및 상황 결정 요인을 고려해야 합니다. 과업 특이성에 대한 명백한 예는 위장병 전문의는 대장 내시경 검사를 수행하지만, 방광 내시경 검사를 수행하지는 않는다는 것이다. 임상 작업장은 이보다 훨씬 더 미묘한 결정으로 가득 차 있다. [위험평가]는 [주니어 의사]에게 [임상적 판단능력의 학술적 평가에서 패스를 주는 (다음 교대로 넘어갈 수 있도록) 감독자의 행위]와 [팀의 아픈 환자를 평가하고 관리하기 위해 같은 레지던트를 혼자 두지 않도록 하는 행위 ]사이의 차이에서 볼 수 있다. 첫 번째 시나리오에서는 실제로 전공의를 이동시킴으로써 임상 위험이 감소합니다. 후자의 경우, 오진 및 잘못된 관리로 인해 환자에게 용납할 수 없는 위험이 있으며, 의료-법률적 결과를 초래할 수 있는 감독자에게 개인 위험이 있다. 특정 임상적 맥락에서 이러한 [위험 평가]를 기반으로 신뢰가 확장되거나 거부되는 것을 볼 수 있습니다.
Risk is key to the Mayer et al. model.15 Risk, and therefore trust, are context- and task-specific.14, 15 We do not globally proffer trust; instead, we ask: ‘For what task and under what circumstances?’ and ‘What are the consequences of them failing?’ ‘Blind trust’, as seen in the prisoner's dilemma, is likely to be taken advantage of. Trustworthiness is not enough: risk and situational determinants must be taken into consideration. An obvious illustration of task-specificity is trusting a gastroenterologist to perform a colonoscopy, but not trusting him to perform a cystoscopy. Clinical workplaces are filled with far more nuanced decisions than this. Risk assessment can be seen in the difference between a supervisor's act of giving a junior doctor a bare pass on an academic assessment of clinical judgement (so that he is moved on to the next rotation) and the act of ensuring that the same resident is not left alone to assess and manage the team's sick patients. In the first scenario, clinical risk is actually reduced by moving the resident along. In the latter circumstance, there is unacceptable risk to the patient of misdiagnosis and mismanagement, and there is personal risk to the supervisor with potential medico-legal consequence. We see that trust is extended or denied based on this risk assessment in a particular clinical context.

신뢰 문헌의 흥미로운 갈림길은 [신뢰]와 [불신]이 [동일한 연속체의 반대극]인지, 즉 본 논문에서 취한 입장인지, 아니면 높은 신뢰와 높은 불신이 공존할 수 있는 복잡한 관계를 허용하기 위해 [불신]과 [신뢰]가 [별도의 구조]로 존재할 수 있는지에 대한 의문을 제기해 왔다. 한 가지 예는 서로 경쟁하는 기업들이 (잠재적인 불신으로 인해) 지적 재산을 신중하게 보호하면서 특정 프로젝트(신뢰가 필요한)에 협력할 수 있는 시나리오이다. [복잡한 관계]는 의학에 아주 많으며, 예를 들어, 우리는 [서로 경쟁하는 의료 서비스 제공자나 연구자]들 사이에서 비슷하게 conflicted되는 관계를 볼 수 있다. 그러나 관계의 범위 내에서 특정 업무와 맥락에 초점을 맞춘 결정으로 신뢰를 모델링하면 [별도의 축으로 신뢰와 불신을 고려할 필요성]이 해소되는 경향이 있다.
An interesting fork in the trust literature has concerned the question of whether trust and distrust are opposite poles of the same continuum, which is the position taken in this paper, or whether distrust and trust may exist as separate constructs to allow for complex relationships in which high trust and high distrust may coexist.64, 70 One example is the scenario in which competitive corporations may collaborate on specific projects (which requires trust) while continuing to carefully guard their intellectual property (due to a measure of potential distrust). Complex relationships are abundant in medicine and we may see similarly conflicted relationships between competing health service providers or researchers, for example. However, the need to consider trust and distrust on separate axes tends to resolve if we model trust as a decision centred on a specific task and context within the span of the relationship.8

[Trustor를 식별]하면 우리는 그 또는 그녀의 개인적 위험을 이해할 수 있다. Kennedy 등은 훈련생들이 임상 감독관에게 도움을 요청하지 못한 중요한 안전 문제를 조사했습니다. 감독관이 교육생에 대한 신뢰를 어떻게 발전시키는지 이해하고자 했던 Hauer 등의 연구처럼, 이는 교육생-감독자 관계에 초점을 맞춘 훌륭한 기초 연구였다. 다시 말해, 훈련생의 결정에 영향을 미치는 요소들은 훈련생, 감독자 및 임상 상황과 관련된 요소들로 분류될 수 있다. 그러나 우려는 달랐다. 예를 들어, Kennedy 등의 연구에서, 주요 발견은 훈련생들이 너무 많은 질문을 하면 그들의 직업적인 신뢰도에 대해 걱정한다는 것이었다. 차이점은 관점에 있다. 하우어 등은 감독관을 위탁자로 배치하고, 그녀의 훈련생에게 임상 업무를 위임하기로 결정했다. Kennedy 등은 훈련생을 신뢰자로 배치하는데, 이 신뢰자는 자신을 판단하지 않고 감독관이 임상 조언을 해줄 것을 신뢰해야 한다. 훈련자가 인지하는 위험에는 환자에게 미치는 위험뿐만 아니라 자신의 전문적 신뢰의 상실이 포함된다.
Identifying the trustor enables us to understand his or her personal risks. Kennedy et al.63 investigated the important safety issue of trainees’ failure to ask their clinical supervisors for help. Like the work of Hauer et al.,23 which sought to understand how supervisors develop trust in their trainees, this was an excellent grounded study centred on the trainee–supervisor relationship. Again, the factors influencing the trainee's decision could be grouped into those related to, respectively, the trainee, the supervisor and the clinical circumstance. However, the concerns were different. For instance, in Kennedy et al.'s work,63 a principle finding was that trainees worry about their professional credibility if they ask too many questions. The difference is in the perspective. Hauer et al.23 place the supervisor as the trustor, deciding to delegate clinical tasks to her trainee. Kennedy et al.63 position the trainee as the trustor, who must trust the supervisor to give him clinical advice without judging him. The trainee's perceived risks include the loss of his own professional credibility, as well as the risk to the patient.

이 모든 것이 개인이 신뢰 결정이 필요할 때마다 신중한 스프레드시트를 배치한다는 것을 말하는 것은 아니다. 의사 결정의 측면들은 [숙고적인 것]이기보다, [감정적이거나 본능적]일 수 있다. 실제로 수십 년의 심리학 연구는 결정이 [느리고, 노력하고, 분석적인 사고][보다는 빠르고, 감정적이며, 본능적이지만 편향되기 쉬운 우리의 마음]에 의해 최소한의 노력으로 이루어지는 것을 선호한다고 말한다. 이들은 신뢰를 결정하는 데 있어 '정서적'과 '인지적' 요소로 설명되었다. 신뢰 연구의 또 다른 잠재적 방향은 신뢰자가 환자, 학생 또는 임상의인지에 관계없이 의사 결정의 정서적 요소를 이해하려는 노력을 포함할 수 있다.

All of this is not to say that an individual will lay out a careful spreadsheet each time a trust decision needs to be made. Aspects of the decision making may be more emotive or instinctive than deliberate. Indeed, decades of psychology research tell us that decisions are preferentially made with least effort by our fast, emotional, instinctive but bias-prone mind, rather than by slow, effortful, analytical thinking.71 These have been described as ‘affective’ and ‘cognitive’ components to determining trust.14 Another potential direction for trust research may involve trying to understand the affective component of decision making,8 whether the trustor is the patient, student or clinician.

리스크, 신뢰 및 제어 메커니즘
Risk, trust and control mechanisms

서론에서 지적했듯이, 공공, 임상의, 교육 기관 및 보건 시스템은 모두 위험에 대처해야 하지만 [신뢰]만이 유일한 선택은 아닙니다. 규제, 정책 및 치안 유지policing은 [대인 신뢰가 제한된 상황]에서 통제력을 제공할 수 있다. 이것은 마침내 위험을 다루기 위한 수단으로서 신뢰와 통제 메커니즘 사이의 상호 작용에 이르게 한다.
As we indicated in the introduction, the public, clinicians, educational organisations and health systems all need to deal with risk, but trust is not their only option. Regulation, policy and policing may offer control in contexts in which interpersonal trust is limited.72 This brings us finally to the interplay between trust and control mechanisms as means to deal with risk.

[시뮬레이션 이전 시대의 교육의 사례]는 [간호학]과 [의학]이 캐뉴레이션이나 비위관 배치와 같은 간단한 절차를 가르치는 경향이 있었던 방식의 차이를 의미한다.

  • [간호사]들은 공식적인 훈련, 역량 승인 및 재인증을 통해 보다 프로토콜 중심적인 과정을 따르는 반면,
  • [의사]들은 역사적으로 '하나를 보고, 하나 하고, 하나를 가르치는' 접근법이라고 일컬어지는 것에 대해 최소한의 지시만을 받았다.

틀림없이 이것은 [신뢰 대 통제 접근 방식]을 보여주며, 각각의 접근 방식에는 장단점이 있다. 둘 다 조직이나 단체가 위험을 다루기로 선택할 수 있는 방법이다.
An education example from the pre-simulation era refers to the difference in the ways in which nursing and medicine have tended to teach simple procedures such as cannulation or nasogastric tube placement.

  • Doctors were historically given minimal direction in what has been referred to as a ‘see one, do one, teach one’ approach,73 whereas
  • nurses often follow a more protocol-driven process with formal training, competency sign off and reaccreditation.

Arguably this illustrates trust versus control approaches, and there are pros and cons to each. Both are ways in which an organisation or group may choose to deal with risk.

조직 수준에서 [투명성과 책임성]은 우리의 기관 및 직업에서 점점 더 중요하게 인식되는 비즈니스 및 정부 원칙입니다. 고등교육 분야는 [제도적 규제 및 정부 차원]에서 [신뢰 대 통제 메커니즘]의 훌륭한 예를 제시한다. 시간이 지남에 따라, [외부 관리주의의 문화의 부상]과 [내부 통제의 상실]은 교육과 교육 분야에 종사하는 학자들 사이에서 증가하는 불만의 원천으로 언급되어 왔다. [외부 감사 및 핵심 성과 지표]와 같은 모니터링 시스템은 [신뢰와 자율성 상실]이라는 상응하는 [댓가를 치르면서 그 자체가 목적]이 될 수 있다. 이 현상은 영국과 호주에서 설명되지만, 다른 곳에서는 덜 명백할 수 있다. 다른 극단에서 핀란드의 교사들에 대한 신뢰 수준은 너무 높아서 정기적인 외부 검토가 필요하지 않다고 여겨진다. 
At an organisational level, transparency and accountability are business and government principles that are increasingly perceived as important in our institutions and professions. The higher education sector presents an excellent illustration of trust versus control mechanisms at the level of institutional regulation and government.10 Over time, a rise in the culture of external managerialism and the loss of internal control have been cited as sources of increasing dissatisfaction amongst academics engaged in education and in the education sector.74 Monitoring systems, such as external audit and key performance indicators, can become ends in themselves with a corresponding cost in loss of trust and autonomy. This phenomenon is described in the UK75 and in Australia,76 but may be less apparent elsewhere. Levels of trust in teachers in Finland, at the other extreme, are so high that routine external review is not deemed necessary.10

또한 [통제시스템은 의료 분야에서 점점 더 표준화]되고 있으며, 의료 전문가에 대한 이전 시대의 '존중과 맹목적인 신뢰'를 대체했다. 병원 기반 임상의는 이제 지속적인 전문 개발 및 전문적 재검증, 사고 보고, 근본 원인 분석 및 감사와 같은 [수많은 위험 관리 도구]에 익숙합니다. 의도는 일반적으로 양성으로 간주되고 데이터는 시스템 최적화를 주도하는 것으로 간주되지만, 그 결과는 [직업적 자율성과 신뢰의 침식]일 수 있다. [성숙한 시스템]은 [마땅할 때 신뢰]하고 [필요할 때 통제]하는 메커니즘을 모두 통합할 수 있지만, 동시에 똑같은 넓은 붓을 가지고 모든 사람을 색칠하고자 하며, 이는 분노를 일으킬 수 있습니다. 의료에 대해서 [신뢰를 갖는 통제 시스템]과 [자율성]의 최적의 상호 작용에 대한 검토가 필요하다. 신뢰, 통제 및 위험의 어휘는 이를 수행하기 위한 도구 중 일부를 제공할 수 있습니다. 
Control systems are also increasingly the norm in health care and have replaced a previous era's ‘deference and blind trust’ in health care professionals.77 Hospital-based clinicians are now familiar with a plethora of risk management tools, such as mandatory continuing professional development and professional revalidation, incident reporting, root cause analysis and audit. Although the intent is generally regarded as benign and the data as driving system optimisation, a consequence may be the perception of eroded professional autonomy and trust. A mature system may be able to incorporate both trust when it is deserved and control mechanisms when they are required, but at the moment the same broad brush is used to paint all comers, which has the potential to breed resentment. An examination of the optimal interplay of control systems with trust and autonomy in health care is required. The vocabulary of trust, control and risk may provide some of the tools with which to carry this out.

결론
Conclusions

위험 관리는 의심할 여지 없이 의료 제공과 의료 교육의 관계를 특징짓는다. [외부 감사 및 인증]과 같은 [선의의 통제 메커니즘]은 임상 환경에서 위험을 관리하도록 설계된 침해적인encroaching 존재이지만, 다른 접근 방식은 '신뢰'이다. EPA의 사용은 직장 기반 평가에서 신뢰를 탐구하는 한 가지 방법이다. 신뢰와 위험 또는 취약성 사이의 연관성은 사회과학 및 관리 문헌에서 분명하며, 환자-의사 관계에서 잘 기술되어 있지만 의학 교육 문헌에서는 이러한 연관성이 과소평가될 수 있다. 시뮬레이션에도 불구하고, 학생이나 훈련생이 수행하는 모든 임상 활동은 환자와 임상의에게 [어느 정도의 위험을 수반]한다. 그러므로 직장 학습과 평가에서 '신뢰'는 '역량'보다 더 진실하고 실용적인 어휘를 제공할 수 있다. 왜냐하면 위험은 명백한 고려사항이기 때문이다.
Management of risk undoubtedly characterises relationships in health care delivery and therefore medical education. Although well-intended control mechanisms, such as external audit and accreditation, are an encroaching presence designed to manage risk in clinical settings, another approach is ‘trust’. The use of EPAs is one way in which trust is being explored within workplace-based assessment. The link between trust and risk or vulnerability is clear in the social sciences and management literature, and although it is well-described in patient–doctor relationships, this association may be underappreciated in the medical education literature. Simulation notwithstanding, every clinical activity undertaken by students or trainees carries some risks for patients and clinicians. In workplace learning and assessment, ‘trust’ may therefore offer a more authentic and practical vocabulary than ‘competency’ because risk is an explicit consideration.


경영 문헌에서 나온 마이어 등의 강력한 신뢰 모델은 교육생에 대한 감독자의 신뢰 개발 보고와 일치한다. 예를 들어, 훈련생은 자신의 질문을 비판단적으로 처리할 수 있는 감독자에 대한 신뢰, 특정 임상 과제를 수행할 수 있는 환자의 신뢰, 적절한 졸업생을 제공할 수 있는 대학 프로그램에 대한 임상의사의 신뢰 등으로 표현되는 많은 다른 신뢰 관계가 있다. 가장 기본적인 수준에서 누가 신탁자인지, 누가 수탁자인지, 어떤 업무를 하는지 명확하게 기술하는 것이 도움이 된다. 각각의 관계는 대인관계와 조직적인 요소를 가지고 있다. 의료 및 의료 교육에서 [신뢰와 통제 메커니즘]을 이해하고 고려하는 것은 신뢰와 임파워먼트를 적극적으로 장려하면서, 위험을 성숙한 방식으로 관리하는 시스템의 개발로 이어질 수 있다.

Mayer et al.'s robust model of trust15 from the management literature is consistent with the reporting of supervisors’ development of trust in trainees. There are many other trust relationships in health care and medical education manifested by, for example, a trainee's trust in a supervisor to handle his questions non-judgementally, a patient's trust in her doctor to undertake a specific clinical task, or a clinician's trust in a university programme to deliver suitable graduates. At the most basic level, it is helpful to clearly delineate who is the trustor, who is the trustee, and for what task. Each relationship has interpersonal and organisational elements. Understanding and considered utilisation of trust and control mechanisms in health care and medical education may lead to the development of systems that maturely manage risk while actively encouraging trust and empowerment.

 

 


 

 

Med Educ. 2017 Sep;51(9):892-902. doi: 10.1111/medu.13339. Epub 2017 May 10.Trust and risk: a model for medical education

 

Affiliations collapse

Affiliations

1Prince of Wales Clinical School, Faculty of Medicine, University of New South Wales, Sydney, New South Wales, Australia.

2Office of Medical Education, Faculty of Medicine, University of New South Wales, Sydney, New South Wales, Australia.

3Office of the Pro-Vice-Chancellor (Education), University of New South Wales, Sydney, New South Wales, Australia.

PMID: 28493429

DOI: 10.1111/medu.13339

Abstract

Context: Health care delivery, and therefore medical education, is an inherently risky business. Although control mechanisms, such as external audit and accreditation, are designed to manage risk in clinical settings, another approach is 'trust'. The use of entrustable professional activities (EPAs) represents a deliberate way in which this is operationalised as a workplace-based assessment. Once engaged with the concept, clinical teachers and medical educators may have further questions about trust.

Objectives: This narrative overview of the trust literature explores how risk, trust and control intersect with current thinking in medical education, and makes suggestions for potential directions of enquiry.

Methods: Beyond EPAs, the importance of trust in health care and medical education is reviewed, followed by a brief history of trust research in the wider literature. Interpersonal and organisational levels of trust and a model of trust from the management literature are used to provide the framework with which to decipher trust decisions in health care and medical education, in which risk and vulnerability are inherent.

Conclusions: In workplace learning and assessment, the language of 'trust' may offer a more authentic and practical vocabulary than that of 'competency' because clinical and professional risks are explicitly considered. There are many other trust relationships in health care and medical education. At the most basic level, it is helpful to clearly delineate who is the trustor, the trustee, and for what task. Each relationship has interpersonal and organisational elements. Understanding and considered utilisation of trust and control mechanisms in health care and medical education may lead to systems that maturely manage risk while actively encouraging trust and empowerment.

학부의학교육 변화의 복잡성 탐색하기: 변화 선도자의 관점(Acad Med, 2018)
Navigating the Complexities of Undergraduate Medical Curriculum Change: Change Leaders’ Perspectives
Floor Velthuis, MSc, Lara Varpio, PhD, Esther Helmich, MD, PhD, Hanke Dekker, PhD, and A. Debbie C. Jaarsma, DVM, PhD 

학부 의학 커리큘럼을 갱신하는 것은 전 세계의 의과대학에서 정기적으로 반복되는 과정이다. 커리큘럼 변경을 제정하는 것은 여러 조직 구조(예: 대학 및 부속 병원)와 각 부서, 다양한 직원, 교수진 및 의사가 교육에 참여하는 복잡한 노력이다. 따라서 커리큘럼 변화는 (새로운 커리큘럼에 대해 나름의 기득권을 가진) 많은 이해당사자들을 포함한다. 이러한 복잡한 과정을 성공적으로 이끌기 위해서는 강력한 리더십 기술이 필요하다. 의학 교육에서 리더십 역할을 연구하는 문헌이 있지만, 커리큘럼 변경 과정에서 이러한 리더의 역할에 초점을 맞춘 연구는 거의 없다. 기관 지도자들이 학부 의료 교육과정 변화 과정을 어떻게 집행enact하고 지시direct하는지에 대한 학문적 관심은 거의 없었다. 이 리더십 작업은 커리큘럼 개혁이 상당한 인적, 재정적 자원을 필요로 하는 큰 과제이기 때문에 훨씬 더 많은 연구 관심을 필요로 한다. 커리큘럼 변경 리더는 불가피하게 직면하게 될 도전을 극복할 수 있는 충분한 준비가 되어 있어야 한다. 만약 우리가 리더들이 이러한 도전을 극복하기 위해 사용한 과정과 기술에 대해 더 잘 안다면, 우리는 미래의 리더들이 성공적으로 커리큘럼 변화를 가져올 수 있도록 더 잘 지원할 수 있을 것이다.
Renewing an undergraduate medical curriculum is a regularly recurring process at medical schools around the world. Enacting curriculum change is a complex endeavor1 involving multiple organizational structures (e.g., university and affiliated hospital[s]), each housing multiple departments and a variety of staff, faculty members, and doctors in training.1 Curriculum change thus involves many stakeholders, all with a uniquely vested interest in the new curriculum.2 Successfully spearheading such a complex process requires strong leadership skills. Although there is a body of literature studying leadership roles in medical education, little research has focused on these leaders’ roles in curriculum change processes.3,4 Little scholarly attention has been paid to how institutional leaders enact and direct undergraduate medical curriculum change processes. This leadership work requires much more research attention because curriculum reform is a high-stakes undertaking, requiring significant human and financial resources. Curriculum change leaders must be adequately prepared to overcome the challenges they will inevitably face. If we knew more about the processes and the techniques that leaders employed to overcome these challenges, we could better support future leaders to successfully bring about curriculum change.

의대 교육과정 변화와 관련된 과제에 대한 조사를 뒷받침할 수 있는 세 가지 문헌에는 다음이 있다.

  • 복잡성 이론(변화가 발생하는 과정과 맥락의 다면적 특성을 이해하기 위한 것)이다. 
  • 조직 변화 문헌(변경을 제정하는 데 사용되는 도구를 조사하기 위해) 그리고 
  • 이 조직 변화 문헌 중에서도 변화 리더십에 대한 문헌(변화 프로세스를 이끌고 관리하는 개인의 역할을 이해하기 위해)

세 과목 모두 커리큘럼 변화에 대한 연구에 정보를 줄 수 있지만, 우리는 리더의 관점에서 의료 커리큘럼 변화의 복잡성을 더 잘 이해하고, 개인이 이러한 복잡한 맥락을 어떻게 탐색하고 변화와 관련된 과제를 해결하는지에 관심이 있다. 따라서, 우리는 [변화 리더십 문헌]을 기반으로 합니다.
Three bodies of literature that can underpin investigations of the challenges related to medical school curriculum change are

  • complexity theory (to understand the multifaceted nature of the processes and contexts in which change occurs)5–7;
  • organizational change literature (to investigate the tools used to enact change)8; and within this organizational change literature,
  • the literature on change leadership (to understand the role of the individual who is leading and managing the change process).9–14 

Although all three subjects can inform research into curriculum change, we are interested in better understanding the complexity of medical curriculum change from the leader’s perspective, exploring how that individual navigates this complex context and deals with change-related challenges. Thus, we build on the change leadership literature.

이 연구분야에서는 [조직 변화를 가져오는 데 있어 변화 리더의 역할]을 강조한다. 우리는 [변화 리더]를 [학부 의료 커리큘럼을 갱신하거나 크게 변경할 책임이 있는 개인]으로 정의합니다. 변화 지도자를 연구하기 위한 제한된 양의 의학 교육 연구가 이용 가능하다. Bland 등은 의료 커리큘럼 변경의 리더가 "성공에 필수적인 거의 모든 다른 특징들을 통제하거나 실질적으로 영향을 미치기" 때문에 중요한 역할을 수행한다고 말한다. 그들은 중요한 변화 리더십 행동에 "주장적인 참여적, 문화적/가치적 영향을 미치는 행동들, '유연성'을 가지고, 다양한 인식적 프레임워크로 조직을 보고, 다른 사람들을 동원하여 변화 모멘텀을 유지하는 것"이 포함된다고 본다.
This literature emphasizes the role of change leaders in bringing about organizational change.9–14 We define a change leader as the individual primarily responsible for renewing or significantly changing an undergraduate medical curriculum. A limited amount of medical education research directed specifically at studying change leaders is available. Bland et al9 state that leaders of medical curriculum change fulfill a critical role because they “control or substantially influence nearly all the other features essential for success.”(p592) They identify important change leadership behaviors as including “assertive participative and cultural/value-influencing behaviors, to be ‘flexible,’ to view the organization through a variety of perceptual frames and to mobilize others to maintain the change momentum.”9(p580)

의학 교육의 변화 리더에 대한 최근의 경험적 연구는 주로 단일 의과대학에서 수행되었고, 주요 학부 프로그램 개정에 초점을 맞추지 않았다. 여러 기관의 리더가 직면한 과제를 더 잘 이해하기 위해, 본 연구는 여러 의과대학의 커리큘럼 변경 리더의 통찰력에 초점을 맞추고 있다. 우리는 커리큘럼 변경 리더들이 변화를 제정하는 과정을 어떻게 생각하는지, 그리고 그들이 그들의 노력에 성공하기 위해 의존하는 전략을 알고 싶었다.
Recent empirical studies about change leaders in medical education have predominantly been conducted at single medical schools3,4,15,16 and were not focused on major undergraduate program revisions. To gain a better understanding of the challenges faced by leaders across different institutions, our study focuses on insights from curriculum change leaders at multiple medical schools. We wanted to know how curriculum change leaders conceive of the process of enacting change, and the strategies they relied on to succeed in their efforts.

방법
Method

참가자
Participants

연구 참여자는 현재 네덜란드의 8개 대학 의료 센터(UMC) 중 하나에서 주요 학부 의료 커리큘럼 변경 프로세스를 주도하거나 최근에 주도했던 개인이었다. (이들은 알파벳 순서로 AMC [암스테르담], Erasmus MC [로터담], LUMC [라이덴], Maastrich UMC+ [마스트리히트 UMC], Radumbudnci [니즈메겐], UMCG [그로닝언], UMCU [위트레흐트] 및 VUMC [암스테르담]이다. 각 학교는 연간 평균 400명의 학생을 받아들인다.) 우리는 "주요 커리큘럼 변경"을 과정 수준에서 연간 정기적 조정에 관한 것이 아니라, [전체 커리큘럼]과 [커리큘럼에 관련된 조직]에 영향을 미치는 [중앙에서 조직되고 의도적으로 시작된 변경 프로젝트]로 정의한다. 7개의 UMC에서는 한 명이 이 위치에 있다고 보고했고, 1명의 UMC에서는 두 명이 이 선두 위치에 있다고 보고했다. 따라서, 우리의 연구는 8개의 UMC 모두를 대표하는 9명의 참가자의 데이터를 기반으로 한다. 변경 프로세스에 대한 일정은 그림 1 및 표 1을 참조하십시오.
Study participants were individuals who were currently leading or had recently led a major undergraduate medical curriculum change process in one of the eight university medical centers (UMCs) in the Netherlands. (These are, in alphabetic order: AMC [Amsterdam], Erasmus MC [Rotterdam], LUMC [Leiden], Maastricht UMC+ [Maastricht], Radboudumc [Nijmegen], UMCG [Groningen], UMCU [Utrecht], and VUmc [Amsterdam]. Each school accepts an average amount of ~400 students annually.) We define “major curriculum change” as changes that were not about the yearly, regular adjustments at course level, but were centrally organized, intentionally initiated change projects that affected the entire curriculum and organization involved in the curriculum. Seven UMCs reported having one individual in this position, and one UMC reported having two individuals in this lead position. Thus, our study is based on data from nine participants, representing all eight UMCs. For timelines of the change processes, see Figure 1 and Table 1.

네덜란드의 각 기관 내에는 서로 다른 조직 구조와 유사하거나 유사한 위치에 있는 사람들에 대한 서로 다른 이름과 책임이 있으며, 이는 그림 2에 요약되어 있다.
Within each institute in the Netherlands there are different organizational structures and different names and responsibilities for people in similar or comparable positions, which are summarized in Figure 2.

 

네덜란드의 각 UMC는 이사회에 의해 관리된다. 이사회에서 학장은 연구 및 학부 및 대학원 보건 전문가 커리큘럼을 담당합니다. 학장 아래 계층적으로 위치한 대부분의 기관에서 부교육장은 보건 전문 교육과정을 전체적으로 감독할 책임이 있다. 학장을 대신하여 대부분의 학원은 학부 의료 교육과정을 추가로 실행하고 감독할 책임을 지는 프로그램 책임자를 두고 있다. 이 직책 아래에는 일반적으로 의료 커리큘럼의 두 부분 중 한 부분의 내용, 품질 보증 및 일관성을 책임지는 두 명의 조정자가 있다. 

  • 학사 코디네이터(처음 3년 전 임상 의학 학부 과정), 
    석사 코디네이터(마지막 임상 3년 동안 학부 의학 프로그램)

Each UMC in the Netherlands is governed by a board of directors. On the board, the dean is responsible for research and the undergraduate and postgraduate health professions curricula. At most institutes, hierarchically positioned under the dean, the associate dean of education is responsible for overseeing the health professions curricula as a whole. On behalf of the dean, most institutes have a program director being responsible for further executing and overseeing the undergraduate medical curriculum. Below this position, there are—at a more daily, executive level—usually two coordinators who are responsible for the content, quality assurance, and coherence of one of two parts of the medical curriculum;

  • the bachelor’s coordinator (first three preclinical years undergraduate medical program), and
  • master’s coordinator (last three clinical years undergraduate medical program).

4명의 참여자는 프로그램 감독직 내에서 또는 프로그램 감독직과 더불어 변화를 선도하는 역할을 수행했으며, 3명은 학사 코디네이터로 활동했습니다. 나머지 참여자 2명은 위에서 약술한 바와 같이 정식 직책을 다하지 못하였으나 교육과정 변화를 주도하도록 요청받은 의학교육교육과정 교수였다. 모든 경우에 참여자들은 학장 또는 부교육장이 임명하여 학교의 교육과정 변경 과정을 이끌었고, 따라서 학장 또는 부학장에 대한 책임이 있었다. 모든 참가자(남성 8명, 여성 1명)는 의학교육과 의과대학에서 다양한 직책에서 상당한 경험을 했고, 여전히 전임상, 임상 또는 연구 부서의 선도적 직책에 있었다.
Four participants fulfilled the change-leading role within or in addition to their job as program director, and three as bachelor’s coordinator. The remaining two participants were professors in the medical education curriculum who did not fulfill a formal position as outlined above but were asked to lead the curriculum change. In all cases, participants were appointed by the dean or the associate dean of education to lead the school’s curriculum change process, and so were accountable to the dean or associate dean. All participants (eight males, one female) had substantial experience—in various positions—within medical education and the medical school, and were still or had been in leading positions in preclinical, clinical, or research departments.

데이터 수집
Data collection

2015년 12월부터 2016년 4월까지 한 연구원이 개별 대면 인터뷰를 진행했다. 인터뷰 프로토콜을 세분화하기 위해 다른 건강 전문직 교육과정 변경 참가자(즉, 목표 모집단 외부의 개인)와 세 번의 파일럿 인터뷰가 이루어졌다. 그 의정서는 네 부분으로 구성되었다. 인터뷰는 두 가지 시각화 프롬프트로 시작되었습니다. 

  • 첫 번째는 리더가 커리큘럼 변화를 어떻게 시각화했는지에 대한 짧은 그리기 연습이었습니다. 
  • 둘째, 참가자들에게 52개의 "브리핑 카드" 중에서 자신의 교육과정 변화 경험에 대한 감정이 공명하는 1개의 포토카드를 선택하도록 하였다. 이러한 시각적 기법은 참가자들이 커리큘럼 변경과 함께 전문적이고 개인적인 경험을 상기하도록 격려했다. 
  • 인터뷰의 세 번째 부분은 변화 과정과 맥락에 대한 참가자의 인식(예: 이해관계자 참여, 경험된 과제, 가속기 및 감속기)과 커리큘럼 변화 노력의 리더로서 리더의 경험(예: 준비, 개인적 원동력, 지원, 학습 내용)을 탐구하는 반구조화된 인터뷰 프로토콜을 따랐다.. 
  • 인터뷰의 네 번째 부분에서, 참가자들은 교육과정 변화의 이야기를 그린 다른 포토카드를 선택하도록 요청받았다. 
    이것은 인터뷰를 마무리하는 데 사용되었다. 

인터뷰는 1시간 반에서 2시간 동안 진행되었다. 모든 인터뷰는 녹음되었고 녹음 과정에서 익명으로 처리되었다. 시각적(즉, 도면과 선택된 카드)은 촬영되었지만 본 연구를 위한 분석에 통합되지 않았다. 그것들은 단순히 추가적인 연구 자료라기보다는 대화를 촉구하기 위한 것이었다. 선택한 사진의 유형과 그에 따른 설명을 독자에게 이해시키려면 보충 디지털 부록 1을 참조하십시오.
Working from a constructivist orientation,17 one researcher (F.V.) conducted individual face-to-face interviews between December 2015 and April 2016. Three pilot interviews took place with other health professions curriculum change participants (i.e., individuals outside our target population) to refine the interview protocol. The protocol consisted of four parts. The interviews started with two visualizing prompts.

  • The first was a short drawing exercise about how leaders visualized the curriculum change.
  • Second, participants were asked to choose 1 photo card from 52 “briefing cards”18 that resonated with their feelings about their curriculum change experience. These visual techniques encouraged participants to recall professional and personal experiences with curriculum change.
  • The third part of the interview followed a semistructured interview protocol exploring participants’ perceptions of the change process and context (e.g., involvement of stakeholders, challenges experienced, accelerators and decelerators of the process) and the leaders’ experiences as leader of the curriculum change effort (e.g., preparation, personal drives, support, lessons learned).
  • In the fourth part of the interview, participants were asked to select another photo card that depicted the story of curriculum change; this was used to wrap up the interview.

Interviews lasted 1.5 to 2 hours. All interviews were audio-recorded and rendered anonymous in the transcription process. The visuals (i.e., drawings and selected cards) were photographed but were not incorporated into the analysis for this study. They were simply meant as a prompt for the conversation rather than additional research material. To give readers an impression of the type of pictures chosen and the accompanying explanations, see Supplemental Digital Appendix 1, available at https://links.lww.com/ACADMED/A528.

데이터 분석
Data analysis

우리는 질적 내용 분석을 사용했는데, 이는 "데이터의 정보 내용을 요약하는 데 중점을 둔 역동적 분석(…)"으로 설명되었다. 데이터 분석은 데이터 수집과 동시에 이루어졌으며, 테마는 데이터로부터 귀납적으로 구성되었으며, 결과적으로 교육과정 변경 과정에 대한 참가자들의 개념과 그 변경을 성공적으로 수행하기 위한 전략에 대한 상세한 서술적 요약이 이루어졌다.
We employed qualitative content analysis, which has been described as a “dynamic form of analysis (…) oriented towards summarizing the informational contents of that data.”19(p338) Data analysis occurred concurrently with data collection, with themes being constructed inductively from the data, resulting in a detailed descriptive summary19 of participants’ conceptions of the process of curriculum change and their strategies for successfully carrying out that change.

인터뷰가 끝난 뒤 우리 연구팀 3명(F.V., H.D., A.J.)이 각 녹취록를 논의하는 것으로 데이터 분석이 시작됐다. 모든 데이터가 수집되면 4명의 연구자(F.V., L.V., H.D., A.J.)가 여러 팀 토론에 참여하여 초기 데이터 테마를 구성하였으며, Atlas.ti 소프트웨어 버전 7(Atlas.ti Scientific Software Development GmbH, Berlin)에서 데이터를 코딩하기 위한 출발점으로 사용되었다. 한 팀 구성원(F.V.)이 코딩 프로세스를 주도하고 데이터 샘플을 검토하였으며, 또한 주제와 상호 관계를 개선하는 데 기여한 두 명의 다른 구성원(H.D. 및 A.J.)과 함께 코딩 구조에 대한 진화하는 아이디어와 변화에 대해 정기적으로 논의했습니다. 이 회의들은 정확성을 보장하고 합의에 도달하기 위한 체계적인 점검이었다. 인터뷰가 네덜란드어로 진행되었기 때문에 우리 중 한 명(L.V.)은 원시 데이터의 코딩에 참여할 수 없었습니다. 팀 전체와 합의에 도달하기 위해, 우리는 정기적인 팀 회의를 열어 그 과정과 우리의 진화하는 해석에 대해 논의했습니다. 우리는 특히 개별 코드주요 주요 테마로 연결하기 위해 L.V.의 입력(예: 코드 정의와 포함 범위에 대한 질문, 코드 간 가능한 연결에 대한 질문 등)에 의존했다. 전체 과정 동안, 수석 연구원(F.V.)은 성찰 및 분석 메모의 개발에 주목했습니다. 이러한 노트는 팀 토론 중에 검토되고 검토되었습니다. 한 연구자(E.H.)가 이 후반 단계에서 팀에 합류하여 코딩 프로세스와 분석을 검토했다. 우리의 해석의 신뢰성을 높이기 위해, E.H.는 대본을 읽고 코드와 주요 주제를 다듬는 것을 도왔다.
Data analysis began with three members of our research team (F.V., H.D., and A.J.) discussing each transcript after the interview. Once all data were collected, four researchers (F.V., L.V., H.D., and A.J.) participated in several team discussions and constructed an initial set of data themes, which were used as a starting point for coding the data in Atlas.ti software, version 7 (ATLAS.ti Scientific Software Development GmbH, Berlin). One team member (F.V.) led the coding process and regularly discussed the evolving ideas and changes to the coding structure with two others (H.D. and A.J.), who also reviewed data samples and contributed to refining themes and interrelations. These meetings were systematic checks to ensure accuracy and to reach agreement. Because the interviews were conducted in Dutch, one of us (L.V.) was not able to participate in the coding of the raw data. To reach agreement with the whole team, we held regular team meetings to discuss the process and our evolving interpretations. We especially relied on L.V.’s input (e.g., asking questions about the code definitions and their scope of inclusion; about possible connections between codes, etc.) to link individual codes into major, overarching themes. Throughout the entire process, the lead researcher (F.V.) noted developing reflections and analysis memos. These notes were reviewed and vetted during team discussions. One researcher (E.H.) joined the team at this later stage and reviewed the coding processes and analyses. To enhance the trustworthiness of our interpretations, E.H. read the transcripts and helped refine the codes and overarching themes.

팀구성
Team composition

연구팀은 의학교육 분야(L.V., E.H., H.D., A.J.)의 선임 연구원 4명과 후배 1명(F.V.)으로 구성됐다. 원(F.V.)은 사회심리학에 대한 배경을 가지고 있으며, L.V.에 의해 연구면접을 수행하는 기술과 과정에 대한 교육을 받았다. One(L.V.)은 보건 전문 교육 분야의 부교수이자 경험 많은 질적 연구자입니다. 원(E.H.)은 질적 연구에 전문지식을 가진 노인 요양 의사이자 의료 교육자이다. 한 명(H.D.)은 주요 커리큘럼 변경 과정에서 교육 혁신 태스크 그룹을 주재하는 선임 교육자이고, 한 명(A.J.)은 보건 전문 교육 교수입니다.
The research team consisted of one junior (F.V.) and four senior researchers in medical education (L.V., E.H., H.D., A.J.). One (F.V.) has a background in social psychology and was trained by L.V. in the techniques and processes of conducting research interviews. One (L.V.) is an associate professor and an experienced qualitative researcher in the health professions education domain. One (E.H.) is an elderly care physician and medical educator with expertise in qualitative research. One (H.D.) is a senior educationalist chairing a task group on education innovation during a major curriculum change process, and one (A.J.) is a professor in health professions education.

번역
Translations

각 기록의 일부는 우리 팀 중 한 명이 영어로 번역했다. 두 명의 연구자(E.H.와 A.J.)가 이를 확인하기 위해 번역을 검토했습니다. 의심이 들 경우, 2개 국어를 할 수 있는 동료와 상담했다. 보고서에 사용된 인용문으로 작업할 때, 한 팀 구성원(L.V. 원어민)이 원고를 여러 번 편집하여 인용문을 포함한 텍스트의 변경 사항을 확인하고 제안했습니다. 우리 중 한 명(F.V.)은 새로운 문구가 네덜란드어 필사본 원본을 정확하게 반영하도록 하기 위해 항상 이러한 변경 사항을 확인했습니다.

Portions of each transcription were translated to English by one of our team (F.V.). Two researchers (E.H. and A.J.) reviewed the translations to confirm these. In case of doubt, a bilingual colleague was consulted. When working with quotes used in the report, one team member (L.V., a native English speaker) edited the manuscript several times, checking and offering suggested changes to the text including the quotes. One of us (F.V.) always verified these changes to ensure that the new phrasings accurately reflected the original Dutch transcripts.

The Dutch Association for Medical Education ethical review board approved this study (number 592).

결과.
Results

익명성을 지원하기 위해, 모든 참가자는 남성 성별로 언급된다. 예시적인 견적은 응답자 번호로 귀속됩니다.
To support anonymity, all participants are referred to in the masculine gender. Illustrative quotations are attributed by respondent number.

참가자들은 커리큘럼 변화를 많은 상호 작용 요소를 포함하는 동적이고 복잡한 과정이라고 설명했습니다. 한 참가자는 철도 건널목의 그림을 묘사하면서 "이 카드는 과정의 복잡성을 보여줍니다. 어떤 것으로 이어지기 위해 매우 많은 것들이 수렴되어야 합니다." (R5) 참가자들은 변화를 시행한 경험이 도전적이었다고 보고했습니다. 참가자들은 [많은 정보를 처리하고 여러 수준에서 다양한 채널을 통해 결정을 내려야 하는 협업 연습]으로 커리큘럼 변화를 경험했다.
Participants described curriculum change as a dynamic, complex process involving many interacting factors. As one participant stated when describing the picture he chose of a railroad crossing: “[This card] shows the complexity of the process; very many things need to converge to lead to something” (R5) (see Supplemental Digital Appendix 1, at https://links.lww.com/ACADMED/A528). Participants reported that the experience of enacting change was challenging. Participants experienced curriculum change as a collaborative exercise in which a lot of information had to be processed and decisions had to be made at many levels and via various channels.

우리는 모든 참가자가 직면한 세 가지 핵심 과제와 해결을 위한 몇 가지 관련 전략을 식별했다. [중심 과제]는 크고 다양한 이해 관계자들을 다루는 것이었습니다. 다른 두 가지 과제는 [이해당사자들의 저항을 다투는 것]과 [변화 과정을 이끄는 것]이었습니다. 참가자들은 다른 과제를 언급했지만 이러한 과제를 해결하기 위한 전략을 설명하지 않았다. 따라서 이러한 다른 과제는 이 보고서에 설명되지 않습니다.
We identified three core challenges faced by all participants, and several associated strategies for resolution. The central challenge was dealing with a large and diverse group of stakeholders. The other two challenges were contending with stakeholders’ resistance and steering the change process. Participants mentioned other challenges but did not describe strategies for addressing those challenges. Therefore, these other challenges are not described in this report.

과제 1: 다양한 이해 관계자의 대규모 그룹 대처
Challenge 1: Dealing with a large group of diverse stakeholders

참가자들은 커리큘럼 변화를 협업 연습으로 설명했습니다. 그러나 크고 다양한 이해관계자 그룹(예: 행정 직원, 교육자, 학생, 교사, 부서장, 내부 위원회, 이사)을 다루는 것은 어려웠다. 이 이해관계자들은 각기 다른 배경을 가지고 있었고 조직의 다른 부분을 대표했으며, 각각 다른 시기에 프로세스에 대한 이해관계를 가지고 있었다. 의료교육과정과 변화 제정 과정에 대한 이해관계자들의 시각은 달랐다. 이러한 [관점을 결합하는 것]은 리더가 직면해야 할 과제였습니다.
Participants described curriculum change as a collaborative exercise; however, dealing with the large and diverse groups of stakeholders (e.g., administrative staff, educationalists, students, teachers, department heads, internal committees, board members) was challenging. These stakeholders had different backgrounds and represented different parts of the organization, each having a stake in the process at different times. Stakeholders had different perspectives regarding the medical curriculum and the process of enacting change. Interweaving these perspectives was a challenge the leaders needed to face:

커리큘럼 변경은 많은 사람들이 자신의 특정 전문지식을 바탕으로 생각하는 힘입니다. 물론 그것은 매우 좋습니다. 그러나 어느 시점에서 결정이 내려져야 하고 당신은 그것을 엮어야 합니다. 원하는 모든 것이 가능한 것은 아니다. 도전은 다양한 배경을 가진 사람들을 하나로 모으고, 그들이 하나의 공동 제품을 만들도록 동기를 부여하려고 노력하는 것이다. (R4)
Curriculum change is a power play in which many people … think from their own specific expertise. Of course that is very good; however, at some point decisions have to be made and you have to interweave that; not everything one wants is possible.… The challenge is trying to bring people from various backgrounds together, trying to motivate them to make one, joint product. (R4)

참가자들은 변화에 대한 비전을 가진 이해 관계자들을 참여시키기 위해 다양한 전략을 사용했습니다. 예를 들어, 그들의 제안에 대해 [부학장, 학장 및/또는 이사회의 명확한 지지를 얻는 것]은 일부 참가자들에게 커리큘럼 변경에 필요한 전제 조건이었다.
Participants employed different strategies to get stakeholders on board with their vision for change. For instance, gaining explicit support of the associate dean, dean, and/or board for their proposals was, for some participants, a necessary precondition for curriculum change:

언제나 그렇듯이 이사회는 입장을 취해야 합니다. 그렇지 않으면 아무 일도 일어나지 않습니다. 조직을 이끄는 것은 이사회에서 시작됩니다. 그들은 그것을 전적으로 지지해야 한다. 그렇지 않으면 당신은 정말로 그것을 잊을 수 있다. 이들은 (a) 이러한 일이 발생하는 것이 중요하다고 생각하며 (b) 설계도*가 준비되었다면 자신의 설계도임을 전적으로 지지한다는 점을 전체 조직에 분명히 말해야 합니다. 그리고 내 청사진은 아니야. (R5)

As always … the board of directors needs to take a stance, otherwise nothing happens.… Getting the organization with you starts with the board of directors. They have to fully support it, otherwise you can really forget it. They have to speak out loud … to the entire organization that (a) they think that it is important that this happens, and (b) if the blueprint* is ready, that they fully support that this is their blueprint. And not my blueprint. (R5)

참가자들은 교육과정 변경 계획과 함께 최대 이해관계자 그룹인 교직원이 탑승해야 한다고 강조했다. 일부에서는 핵심 교직원들만 이미 100명에서 200명 정도라고 말했다. 참가자들은 이러한 이해 관계자들에게 변경 아이디어와 진행 상황에 대해 알려줌으로써 변경 일정의 초기 단계에서 교육 인력(병원 기반 임상 교사 또는 기초 과학 교사)을 포함하기 위한 전략을 개발했습니다.
Participants emphasized needing the teaching staff, the largest stakeholder group, on board with the curriculum change plans. Some stated that only the core group of teaching staff already numbered 100 to 200 people. Participants developed strategies for including the teaching staff (either hospital-based clinical teachers or basic science teachers) at an early stage in the change timeline, by informing these stakeholders about change ideas and progress:

저는 그것이 중요하다고 생각했습니다. 왜냐하면 당신은 그것을 병원에 폭탄처럼 떨어뜨리고 싶지 않기 때문입니다. 왜냐하면 그것은 잘 착륙하지 않을 것이기 때문입니다. 모두와 이야기를 나눠야 합니다. 사람들에게 지속적으로 알리고, 모든 것이 여전히 괜찮은지 확인합니다. 그것이 가장 중요하다고 생각합니다. (R6)
I thought that was important to do, because you don’t want to drop it like a bomb in the hospital, because then it will not land very well. You have to talk with everybody.… Continuously informing people, checking whether everything is still okay. I think that is the most important. (R6)

참가자들은 이해관계자들에게 계속 정보를 제공하기 위한 노력으로 회의를 조직하고, 웹사이트를 만들고, 뉴스레터를 썼다. 일부는 맞춤형 접근법으로 개별 이해관계자 집단을 의도적으로 다루는 것을 강조했다. 
Participants organized meetings, created websites, and wrote newsletters in their efforts to keep stakeholders informed. Some emphasized deliberately addressing individual stakeholder groups with tailor-made approaches:

학생들에게는 공식적인 시험이나 교육위원회와는 다른 이야기가 있었고, 또 다시 코디네이터와 교사들에게도 또 다른 이야기가 있었다. 아이디어와 함께: 커뮤니케이션은 대상 그룹에 집중되어야 하며, 그렇지 않으면 잘 작동하지 않습니다.(R7)
For students I had a different story compared to the formal exam and educational committees, and again another story for coordinators, as well as for teachers. With the idea: Communication should be focused on the target group; otherwise, it does not work well. (R7)

교육과정 변경 과정에서 [이해관계자가 조기에 참여할 수 있는 기회]를 만드는 것도 리더들이 채택한 전략이었다. 참석자들은 예를 들어 공론화 회의(최대 150명 참석)를 포함하여 초기 계획에 대한 논의를 창출하기 위해 대규모 활동을 조직하는 것에 대해 이야기했다. 초기 포함은 두 가지 목적을 달성하였다. 이해 관계자의 지식을 바탕으로 정보를 수집하고 헌신적 참여buy-in를 장려합니다. 이후 단계에서는 새로운 커리큘럼의 실제 개발 중에 여러 관점에서 입력을 자극하기 위해 의도적으로 여러 사람을 혼합한 작업 그룹과 같은 소규모 참여 노력이 수행되었습니다.
Creating opportunities for stakeholders to participate early on in the curriculum change process was another strategy that leaders employed. Participants talked about organizing large-scale activities to generate discussions about initial plans including, for instance, public discussion meetings (with as many as 150 people in attendance). Early inclusion served two aims: collecting input to build on stakeholder knowledge, and encouraging their committed buy-in. At a later stage, during actual development of the new curriculum, small-scale engagement efforts were implemented, such as working groups with a deliberate mix of people to stimulate input from multiple perspectives:

각 작업 그룹은 실제로 [교육과정]을 처리해야 하는 사람들로 구성되었다.… [A] 코디네이터, 선생님, 그리고 학생들의 혼합. 그리고 필요한 경우, 교육자, 평가 전문가 등 조직의 사람들이 이러한 관점에서 의견을 제시했습니다. 음, 그리고 마침내, 합의가 이루어졌다. (R7)
Each working group consisted of people who really had to deal with [the curriculum] in practice.… [A] mix of coordinators, teachers and students. And if necessary, people from the organization: educationalists, assessment experts … who delivered input from that perspective. Well, and finally, consensus was there. (R7)

최종 전략으로, 일부 리더들은 교육과정 내용 논의를 전문가들에게 맡겨, 이해당사자들의 전문성과 관점을 명시적으로 활용하면서 교육과정 변경 과정의 촉진자 역할을 수행했다. 이 전략은 사람들을 변화 과정에 참여시키는 것 외에도 변화에 대한 저항을 막거나 최소한 줄이는 데 도움이 되었습니다.
As a final strategy, some leaders acted as facilitators of the curriculum change process, explicitly harnessing stakeholders’ expertise and perspectives by leaving curriculum content discussions to the professionals. In addition to engaging people in the change process, this strategy helped prevent, or at least diminish, resistance to change.

과제 2: 저항에 대처하기
Challenge 2: Dealing with resistance

이해관계자를 상대할 때 참가자들은 [저항과 씨름]해야 했다. 새로운 교육과정의 방향이나 변화 과정에 대한 이해당사자들의 우려나 의견 불일치로 인해 저항이 촉발되었다. 보다 구체적으로 이해당사자의 불만은 [교육 일자리에 대한 우려, 새로운 교육과정의 질에 대한 우려, 그리고 그 직업들이 새로운 프로그램에 충분히 반영되었는지에 대한 우려] 등 많은 문제와 관련이 있었다. 참가자들은 저항을 예상함으로써 이러한 반대파를 능동적으로 관리했고, 그 순간에는 저항에 적극적으로 대처했다.
When dealing with stakeholders, participants had to contend with resistance. Resistance was triggered by stakeholders’ concerns or disagreements about the new curriculum’s directions or the change process. More specifically, stakeholder discontent was related to many issues, including concerns about educational jobs, worries about the quality of the new curriculum, and concerns about whether the professions were sufficiently reflected in the new program. Participants managed this opposition proactively by anticipating resistance, and in the moment by actively dealing with resistance.

저항을 예상하기
Anticipating resistance.

참가자들은 이러한 불만이 변화 과정에 미칠 수 있는 부정적 영향을 인식하고 있어 저항을 예상하고자 했다. 일부는 변화 과정의 초기에 "파괴적인 개인들"과 "완전히 보수적인 사람들" 그리고 "반대론자들"을 포함시켰다. 이 전략은 그러한 개인들의 잠재적인 미래 반대를 완화시킬 것으로 기대되었지만 그들의 비판적인 목소리로부터 이익을 얻는 데도 사용되었다.
Participants tried to anticipate resistance as they were cognizant of the negative effects that such discontent could have on the change process. Some described including the “disruptive individuals,” the “utterly conservative people,” and the “naysayers” early on in the change process. This strategy was expected to mitigate potential future opposition from those individuals but was also used to profit from their critical voices:

나는 감히 나에게 도전하는 사람들을 선택한다. 그렇지 않으면, 그것은 나에게 도움이 되지 않는다. (R1)
I choose [to engage] people who dare to challenge me; otherwise, it does not help me. (R1)

저항하는 이해당사자들의 buy-in를 유지하기 위해, 지도자들은 원래 사람들을 참여시키기 위해 의존했던 전략과 유사한 전략을 사용했다. 예를 들어, 저항을 예상하여 참가자들은 커리큘럼 변경 과정의 특정 요소(예: 새로운 커리큘럼의 청사진 또는 새로운 커리큘럼을 형성하는 기본 원칙)에 대한 합의를 모색했다. 변화 리더들은 조기 참여 기회와 이해관계자와의 지속적인 커뮤니케이션을 통해 이를 달성했습니다. [합의 형성]은 buy-in을 늘리는 방법으로 작용하여 미래의 저항을 감소시키는 것처럼 보였다.
To retain the buy-in of resisting stakeholders, leaders used strategies similar to those they relied on to get people on board originally. For instance, in anticipation of resistance, participants sought consensus around specific elements of the curriculum change process (e.g., the new curriculum’s blueprint, or the foundation principles shaping the new curriculum). The change leaders achieved this by creating early engagement opportunities and continuous communication with stakeholders. Consensus building seemed to work as a method to increase buy-in, thus diminishing future resistance.

저항에 대처하기
Addressing resistance.

저항을 예상하려는 노력에도 불구하고, 참가자들은 이해당사자들의 직간접적인 저항에 직면했다고 설명했다. 교육과정 변화 아이디어와 결정에 반대하는 이들이 직접적인 저항을 했다. 이러한 저항을 관리하기 위한 전략에는 [일대일 대화]를 통해 저항자들과의 대화를 모색하고, 저항에 대한 이유를 주의 깊게 듣고, 타협을 위한 협상을 하는 것이 포함되었다.
Despite efforts to anticipate resistance, participants described facing both direct and indirect resistance from stakeholders. Direct resistance came from those who were opposed to curriculum change ideas and decisions. Strategies for managing this resistance involved seeking dialogue with resisters via one-on-one dialogue; listening carefully to their reasons for resistance; and negotiating to a compromise:

더 잘 설명하기 위해 이 사람들에게 말할 것이다. 말하자면, 이것이 그 이면에 있는 생각이다. "이리 와… 생각해봐, 이것이 우리가 할 일이니까. 하지만, 만약 우리가 조금 조정해야 한다면, 우리는 반드시 그렇게 할 것입니다. 저는 현실적인 방법으로 여러분이 필요합니다. 그래서 만약 제가 오른쪽으로 간다면, 그리고 여러분이 정의상 왼쪽으로 가게 된다면, 우리는 해낼 수 없을 것입니다. 그래서 나는 당신이 나와 함께 조금 가줄 것을 요청합니다." 음, 그리고 그것은 대부분 매우 잘 작동됩니다. (R6)
I will talk to these people, to better explain it. To show: This is the idea behind it. “Come … try to think along, because this is what we are going to do. However, if we have to adjust a bit, then we will certainly do that.… I need you in a way that is realistic, so if I go right, and you will, by definition, go to the left, we are not going to make it. So I ask you to come along with me a bit.” Well, and that works very well most of the time. (R6).

일부 지도자들은 또한 [간접적인 저항]에 직면했다. 이 저항은 "숨겨진 역력과 움직이는 저전류"(R3)로 묘사되어 덜 눈에 띄었다. 그런 상황에서 사람들은 직접 변화 리더에게 친절했지만, 그가 없을 때 "내 밑에서 내 발을 즐겁게 때려눕히고 있었다"(R3)고 했다. 이러한 간접적인 저항은 이해당사자들이 리더를 우회하여 그들의 불만을 학장에게 직접 가져갔을 때도 나타났다.
Some leaders also faced indirect resistance. This resistance was less visible, described as “hidden counterforces and a mobilizing undercurrent” (R3). In such situations, people were kind to the change leader in person, but “they were cheerfully knocking my feet out from under me” (R3) when he was not present. This indirect resistance also manifested itself when stakeholders bypassed the leader and took their complaints directly to the dean.

대화와 협상이 통하지 않고 저항이 변화의 진보를 진정으로 방해했을 때, 변화 리더는 더 [공격적인 전략]을 사용했다. 한 참가자는 저항하는 개인들이 직면하는 상황을 변화시켜 그 저항자들이 공개적으로 변화의 진행을 방해하지 않도록 함으로써 상황을 전략적으로 재조정하는 것을 묘사했다. 또한, 일부 참가자들은 저항자들을 측면으로 이동시키거나 완전히 변화 과정 밖으로 이동시키는 것에 대해 설명하였다. 또 다른 반복되는 전략은 젊은 교수진과 새로운 교수진을 포함함으로써 그 과정을 부채질하는 것이었다. 한 사람이 말했듯이:
When talking and negotiating did not work and resistance truly hampered the change progress, the change leader employed more aggressive strategies. One participant described strategically realigning a situation to his benefit by shifting the context in which resistant individuals were confronted so that those resisters could not publicly hinder the progress of change. In addition, some participants described moving resisters to the sidelines or out of the change process entirely. Another recurring strategy was to fuel the process by including young and new faculty. As one said:

교육위원회를 포함하여 이 과정을 방해하는 사람들을 몇 번 해고했다. 그들은 그저 미루고 있었을 뿐이었다. 우리는 교육에 대해 다른 관점을 가진 전자의 "밑에 있는" 세대인 새로운 위원회를 설립했습니다. 그리고 그 순간부터 달리기 시작했다. (R7)
A few times I have dismissed people from their position who hindered the process, including an [educational committee],… they were merely delaying.… We established a new committee, a generation “underneath” the former, let’s say, who had a different perspective on education.… And from that moment on, it started running. (R7)

마지막으로, 일부 참가자들은 저항을 극복하기 위해 부학장, 학장 및/또는 이사회의 지원을 요청했습니다. 때때로 이 고위 지도자들은 특정 문제를 해결하는 방법을 생각하기 위한 울림판이나, [저항자들에게 그들의 의지를 강요할 수 있는 권위자 역할]을 했다. 학장이나 부학장의 중요성은 또한 변화 과정에 대한 그의 지지가 참가자들에 의해 도움이 되지 않는다고 인식되거나(예: 저항자들에게 접근하는 방법에 대한 상충되는 믿음) 전혀 존재하지 않을 때 분명했다. 예를 들어, 한 참가자는 조직의 구성원들이 비판을 표명했을 때 부학장이 자신의 계획과 결정을 즉시 훼손했다고 느꼈다.
Finally, some participants sought support from the associate dean, dean, and/or board to overcome resistance. Sometimes these higher-level leaders acted as sounding boards to think through ways of tackling specific problems, or as authorities who could impose their will upon resisters. The importance of the dean or associate dean was also evident when his or her support for the change process was not perceived to be helpful by participants (e.g., conflicting beliefs on how to approach resisters), or was not present at all. For example, one participant felt that the associate dean undermined his plans and decisions immediately when critiques were expressed by members of the organization:

"BOOOO!"라고 외치는 사람은 단 한 명이어야 했고 모든 것이 다시 바뀌어야 했습니다. (R3)
There had to be only one person screaming “BOOOO!” and everything had to change again. (R3)

지원 부족은 해결하기 어려웠지만, 참가자들은 부학장 또는 학장의 참여 여부를 전략적으로 선택함으로써 지지하지 않는 리더십에 대처하는 것을 묘사했다.
Although the lack of support was hard to solve, participants described dealing with unsupportive leadership by strategically choosing whether or not to involve the associate dean or dean.

과제 3: 변경 프로세스 주도
Challenge 3: Steering the change process

참가자들이 직면했던 세 번째 도전은 [변화 과정 운영과 관련된 어려움]과 관련이 있었다. 원하는 커리큘럼으로 가는 경로가 변경되고 변경의 정확한 최종 목표가 커리큘럼 변경 과정에서 종종 진화하고 있었기 때문에 운영 과정이 어려웠다.
The third challenge participants faced had to do with difficulties related to steering the change process. The steering process was difficult because the route to the desired curriculum changed and the precise end goal of the change was often evolving throughout the curriculum change process:

나는 또한 이것이 정확히 어디로 가고 있는지 또는 어떻게 해야 하는지 모른다. 하지만, 제가 염두에 두고 있는 것이 있고, 그 정도는 마진 정도입니다. 그런 다음 탐색을 해야 합니다. 제 말은, 그것은 과정의 일부이고, 미리 정해진 경로가 아니라는 것입니다. 나는 내가 가고 싶은 곳을 대충 알고 있고, 물론 더 구체적으로 말하는 것이다… 내 말은, 지금 나는 그것을 1년 전보다 더 정확하게 알고 있다. 그 불확실성으로 나는 살아갈 수 있어야 한다. (R5)
I also don’t know exactly where this is going or how it has to be done. However, I do have something in mind and that is approximately the margin, and then you have to navigate.… I mean, that is part of the process, it is not a predetermined route.… I know roughly where I want to go to, and [that] is of course getting more concrete … I mean, right now I know that more precisely than a year ago. With that uncertainty I have to be able to live. (R5)

또한 참가자들은 프로세스를 책임지고 있었으므로, [적극적으로 변화 프로세스를 지시]하는 동시에, [이해관계자들에게 변화를 지시할 수 있는 충분한 자유를 제공하고 프로세스의 성공에 투자되었다고 느끼는 것] 사이에서 균형을 찾아야 하는 필요성에 고심했다. 조직의 우수한 프로세스를 보호하는 것이 중요하다고 강조되었습니다.
Additionally, participants struggled with the need to find a balance between being responsible for the process and therefore actively willing to direct the change process, and at the same time providing enough freedom to stakeholders for them to direct change and so feel invested in the success of the process. Safeguarding a good process in the organization was emphasized to be important:

사람들이 저를 너무 과단성 있게 생각하지 않았으면 좋겠어요. 모두에게 충분한 공간을 주셨으니, 제가 그랬기를 바랍니다. 사람들은 듣기에 불충분하다고 느낄 수 있다. 아니었으면 좋겠는데... 사람들이 [충분한 공간]을 경험했더라면 좋았을 텐데. [그것은 중요하다] 왜냐하면 그것은 과정에 도움이 되기 때문이다. 만약 누군가가 아주 좋은 아이디어를 생각해냈을 수도 있지만, 내가 무언가를 밀고 나간다는 생각을 가지고 있다면, 그것은 그 과정에 좋지 않다. (R4)I hope people did not experience me as too decisive.… That you have given enough room to everyone, I hope I did that.… People may feel insufficiently listened to. I hope not … I wish people have experienced [enough room]. [That is important] because that benefits the process. If you have the idea that I push something through, while somebody might have come up with a very good idea, then that is not good for the process. (R4)

커리큘럼 변경 과정을 지시하기 위해 채택된 전략에는 함께 일할 "적절한" 사람을 선택하는 것이 포함되었습니다.
The strategies participants employed for directing the curriculum change process included selecting the “right” people to work together:

여러분이 끊임없이 하고 있는 것은 일을 성사시킬 사람들을 모으는 것입니다. (R1)
What you are constantly doing is bringing those people together that will make things happen. (R1).

예를 들어, "올바른" 사람들은 새로운 교육과정에 대해 같은 열정을 가지고 협력할 수 있는 사람들, 그리고 새롭고 신선한 아이디어를 가진 사람들이었다. 적절한 인재를 모으는 힘에 초점을 맞춘다는 점을 감안할 때, 일부 참가자들은 관계에 상당한 시간을 투자했습니다.
The “right” people were, for example, those who could collaborate with the same enthusiasm for the new curriculum, and those with new and fresh ideas. Given this focus on the power of bringing the right people together, some participants spent considerable time investing in relationships:

나는 나의 선생님들을 알고 있고 나는 의식적으로 젊은 인재를 찾고 있다. 학과장들에게 제안을 하고, 그 다음에 약속 일정을 잡으려는 젊은 직원이나 새로 임명된 교수들의 명단을 받습니다. 그래서 저는 젊은 인재와 응급처치 및 선임 교사들의 명단을 가지고 있습니다. [언제] 새로운 프로그램을 개발해야 합니다. 제가 필요한 사람을 정확히 알고 있습니다. (R1)
I know my teachers and I’m consciously looking for young talent. I ask for suggestions from department heads, then I get a list of names of young staff or newly appointed professors with whom I’m scheduling an appointment. So I just have a list available of young talent, as well as emeriti and senior teachers.… [When] we have to develop the new program I know exactly who I need. (R1)

참가자들이 사용한 또 다른 전략은 [변화 프로세스의 전반적 상황을 확인하는 것]이었습니다.
Another strategy participants used was making sure to have an overview of the change processes:

[과제는] 약속을 만들고, 약속을 유지하며, 프로세스를 모니터링하는 것과 관련이 있습니다. 낡은 교육과정이 변장하고 은밀히 되돌아오는 것이 아니라는 점을 감시해야 한다. 우리는 개발이 실제 의도했던 것에서 벗어나면 신호를 받고 싶다. (R9)
[The challenge is related to] creating commitment, retaining commitment, and monitoring the process.… We have to monitor that the old curriculum is not secretly returning in disguise. We want to get signals if the development drifts away from what was actually intended. (R9)

참가자들은 새로운 커리큘럼 콘텐츠 개발과 조직의 변화하는 과정에 적응하기 위해 노력했습니다. 교육과정 내용과 관련해서는 [리더, 교육과정변경팀원, 다양한 실무그룹 간 정기적인 '정렬 세션'을 구성해 일관성 있는 교육과정]이 이뤄지도록 했다. 조직의 변화하는 프로세스에 대해 최신 정보를 제공하기 위해 리더는 조직의 모든 수준에서 "느낌feelers"을 유지하고, 사람들과 위원회와 정기적으로 대화하며, 문제나 저항의 신호를 주의 깊게 들었습니다.
Participants sought to be attuned to the development of new curriculum content and to the organization’s changing processes. In relation to curriculum content, regular “alignment sessions” were organized between the leader, the curriculum change team members, and various working groups to ensure a coherent curriculum. To stay up-to-date about the changing processes in the organization, leaders kept “feelers” out at all levels of the organization, talking regularly with people and committees, listening carefully for signals of problems or resistance:

조직의 신호에 둔감해지는 것이 가장 큰 위험이라고 생각합니다. 왜냐하면 조직을 9월로 이동시키느라 바쁘기 때문입니다. 당신은 항상 주의 깊게 들어야 합니다. 그렇게 하지 않으면 맹목적으로 잘못된 방향으로 갈 것이다. 최종 목표를 염두에 두고 계속 적응할 수 있어야 합니다. (R5)
I think, getting insensitive to signals from the organization is the greatest danger because you are so busy with getting the organization on the move to reach September.… You always have to keep on listening carefully.… If you don’t do that you will go blindly in the wrong direction. You need to be willing to keep on adjusting, while still having the final goal in mind. (R5)

당면 과제 관리 및 전략 구현
Managing challenges and implementing strategies strategically

체인지 리더는 커리큘럼 변화를 가져오기 위해 몇 가지 전략에 의존했습니다. 비록 우리가 그 문제들을 별도로 설명했지만, 실제로는 그들은 다른 여러 새로운 이슈들과 함께 동시에 발생하면서 상호 작용했다. 
Change leaders relied on several strategies to bring about curriculum change. Although we described the challenges separately, in reality they interacted, taking place simultaneously, along with multiple other emerging issues.

커리큘럼 변화를 주도하는 복잡하고 지속적으로 발전하는 이 과정을 관리함에 있어, 리더들은 이해 관계자들과 변화 과정에 걸쳐 어떤 일이 일어나고 있는지 계속 알고 있어야 했습니다. 변화하는 상황과 개인의 반응에 대한 이러한 인식을 형성함으로써 리더는 [변화하는 상황에 맞게 전략을 수정]할 수 있었습니다. 
In managing this complex and continually evolving process of leading curriculum change, the leaders needed to remain aware of what was going on across stakeholders and the change processes. Creating this awareness of evolving situations and individuals’ reactions enabled leaders to modify their strategies to suit changing circumstances:

만약 여러분이 매우 생각만 한다면 여러분이 생각하는 것보다 훨씬 더 많은 것들이 여러분이 할 수 있는 역할을 할 수 있다는 것을 알아야 합니다. 예를 들어 프로세스 기반과 같이 A에서 B까지 체계적으로 말해 봅시다. 경우에 따라서는 올바른 버튼을 누르지 않았기 때문에 작동하지 않을 수 있습니다. 잘 되지 않으면 "이제 우리는 일을 바로잡을 것입니다."라고 말해야 합니다. 그러나 [상황]은 얼마나 자유를 주어야 하는지, 또는 얼마나 직접 결정을 내려야 하는지를 결정한다.… 이러한 대규모 조직에서는 어떤 경우에도 유연성이 중요합니다. (R2)
You have to be aware that a lot more can be playing a part than you possibly think if you only think very … let’s say systemically from A to B, like process based. Sometimes things … do not work because you apparently did not push the right button.… If it does not go well you have to say, “And now we are going set things right.”… However, the situation determines how much space you have to give freedom or that you have to be more direct [and make decisions].… Flexibility is, in any event, important in this kind of large organization. (R2)

논의
Discussion

본 연구에서는 변화리더들이 교육과정 변화를 제정하는 과정에 대해 어떻게 생각하는지, 그리고 그들이 그들의 노력에 성공하기 위해 의존하는 전략에 대한 이해를 발전시켰다. 이 지도자들은 여러 가지 도전으로 가득 찬 복잡한 과정으로 커리큘럼 변화에 대해 이야기했다. 특히 주목할 만한 세 가지 과제는 다음과 같았다.

  • 크고 다양한 이해관계자 그룹을 다루는 것
  • 저항과 다투는 것
  • 변화 과정을 지휘하는 것

이러한 과제를 관리하기 위해 지도자들은 여러 가지 다른 전략에 의존했습니다. 이러한 전략을 성공적으로 적용하기 위해, 변화 리더들은 진화하는 상황적 상황에 대한 인식을 유지하려고 노력했고, 이에 따라 그들의 전략을 조정하여 커리큘럼 변화를 이끌어냈다.
In this study, we developed an understanding of how change leaders conceive of the process of enacting curriculum change and the strategies they relied on to succeed in their efforts. These leaders talked about curriculum change as a complex process, fraught with several challenges. Three challenges of particular note were

  • dealing with the large and diverse groups of stakeholders;
  • contending with resistance; and
  • steering the change process.

To manage these challenges, leaders relied on several different strategies. To successfully apply these strategies, change leaders tried to remain aware of the evolving contextual situations and adapted their strategies accordingly to bring about curriculum change.

네덜란드의 모든 8개 UMC에 걸쳐 수행된 우리의 경험적 연구는, [커리큘럼 변경 과정이 선형적이고 질서 있고 예측 가능한 과정으로 전개되지 않는다]는 생각을 지지하고 확장한다. 대신 의과대학과 부속병원에서 커리큘럼 변경을 제정하는 것은 새롭고 복잡한 과정이다. 본 연구는 변화 리더가 직면한 주요 도전과 이를 처리하기 위해 활용했던 전략에 대한 보다 상세하고 경험적인 설명을 제공함으로써 의료 커리큘럼 변화로 성공하는 방법에 대한 Bland 등의 작업을 향상시킨다.

Our empirical study—conducted across all eight UMCs in the Netherlands—supports and extends the idea that the process of curriculum change does not unfold as a linear, orderly, and predictable process.8 Instead, enacting curriculum change in a medical school and its affiliated hospitals is an emerging, complex process. Our study enhances the work of Bland et al9 about how to succeed with medical curriculum change by providing a more detailed, empirical description of the main challenges faced by change leaders and the strategies they harnessed to deal with it.

우리는 주요 커리큘럼 변화의 복잡성을 탐색하는 과정의 중심은 [끊임없이 변화하는 상황 상황에 대한 인식을 유지하는 것]이라는 것을 발견했다. 변화 리더들은 무슨 일이 일어나고 있는지 알고, 대응에 어떤 행동을 취해야 하는지, 그리고 그 과정에 누구를 참여시켜야 하는지에 대한 결정을 내리기 위해 다양한 방법을 사용했습니다. 프로세스가 원하는 방향으로 진행되도록 하기 위해, 변화 리더들은 [새로운 상황의 요구를 충족]시키기 위해 전략을 수정했습니다. 이것은 전체 과정이 계획 없이 자발적으로 진화했다는 것을 말하는 것은 아니다. 대신, 우리의 분석은 단순히 커리큘럼 변화를 "계획하고 실행하는" 것이 변화를 실현하는 방법이 아니라는 것을 입증했다. 상황은 지속적으로 변화하며, 변화 리더는 상황 인식을 유지하고 성공을 보장하기 위해 전략을 조정해야 합니다.

We found that central to the process of navigating the complexities of major curriculum change was maintaining awareness of ever-changing contextual situations. Change leaders used a variety of methods to be aware of what was going on, to make decisions about what actions to take in response, and who to involve, at what time, in the process. To make sure the process was going in the desired direction, change leaders adapted their strategies to meet the demands of the emerging situations. This is not to say that the entire process was spontaneous, evolving without thoughtfully created plans. Instead, our analysis demonstrated that simply “planning and executing” curriculum change is not how change is realized. Situations continuously change, requiring the change leader to maintain situational awareness and to adapt strategies to ensure success.


이는 변화 리더십 문헌에 설명된 "성찰 전략"과 일치합니다. Van de Ven과 Sun은 더 선호되는 "행동 전략"보다는 리더에 대한 [성찰 전략]을 옹호합니다. 이들은 조직의 리더들이 변화하는 상황으로 인해 "고장(즉, 현실에서 보이는 것이 기대와 일치하지 않는 상황)"이 발생할 수 있다고 주장한다. 이는 변화 리더들이 [직면한 현실(즉, 새롭게 부상하는 상황)이 여전히 그들이 선택한 전략과 일치하는지 또는 그들이 새로운 현실에 맞추기 위해 전략을 조정할 필요가 있는지를 검토]할 필요가 있음을 의미한다. 이는 변화 지도자들이 [그들의 전략을 바꾸지 않고 대신 현실이나 관련자들을 바꾸려고 하는 "행동 전략"]과 대조적이다. 행동 접근법은 인기가 있지만, 종종 변화의 복잡한 맥락 앞에서 효과적이지 못하다. 변화 리더들의 인식과 [목표 지향적 유연성]은 '상황 인식' 개념에도 반향을 불러일으킨다. 이 개념의 핵심은 끊임없이 변화하는 복잡한 상황에 대처하는 데 있어 지속적인 인식과 유연성이 필요하다는 것입니다.
This aligns with the “reflection strategy” described in change leadership literature. Van de Ven and Sun20 advocate the reflection strategy for leaders to bringing about change in organizations, rather than the more favored “action strategy.” They argue that leaders in organizations are continuously confronted with changing circumstances and situations that could cause “breakdowns” (i.e., situations where what is seen in reality does not align with expectations). This means that change leaders need to examine whether the faced reality (i.e., the emerging situation) still fits with their chosen strategies or whether they need to adapt their strategy to align with the new reality. This stands in contrast to the “action strategy,” where change leaders do not alter their strategies but instead try to change the reality or the people involved. Although the action approach is popular, it often fails to be effective in the face of the complex contexts of change.20 The change leaders’ awareness and goal-directed flexibility also resonates with the concept of “situation awareness.”21,22 Central in this concept is the need for an ongoing awareness and flexibility in responding to ever-changing, complex situations.

이는 변화를 실현하기 위한 몇 가지 조직적 변화 관점과 전략에 대한 인식을 갖는 변화 리더의 중요성을 지적합니다. "어떤 하나의 이론적 관점도 항상 복잡한 현상에 대한 부분적인 설명만을 제공하기 때문에, 조직 생활에 대한 보다 포괄적인 이해를 얻는 데 도움이 되는 것은 서로 다른 관점 간의 상호 작용이다." 복잡한 커리큘럼 변경 과정을 탐색하기 위해서는 새로운 상황에 대한 성찰과 인식이 필수적이다. 의도된 결과에 도달할 확률을 높이기 위해 자신의 광범위한 전략 레퍼토리를 신중하게 적용하는 것은 변화를 실현하는 중요한 접근법이다. 
This points toward the importance of change leaders having an awareness of several organizational change perspectives and strategies to enact change: “It is the interplay between different perspectives that helps one gain a more comprehensive understanding of organizational life, because any one theoretical perspective invariably offers only a partial account of a complex phenomenon.”23(p510) To navigate the complex curriculum change processes, reflecting on and being aware of emerging situations is vital. Carefully adapting one’s broad repertoire of strategies to increase the probability that the intended outcomes are reached is an important approach to realize change.

강점과 한계/방법론적 반영
Strengths and limitations/ methodological reflections

단 한 명의 연구원(F.V.)이 모든 참가자 인터뷰를 수행했다. 그녀의 초보적인 지위와 연구에 대표되는 모든 조직 밖의 그녀의 위치는 참가자들이 대화에서 위협받지 않고 솔직하고 열린 대화를 지지할 수 있게 해주었다. 하지만, 그녀는 변화 지도자로서의 개인적인 경험을 가지고 있지 않다. 이는 다른 면접관(예: 변화를 시행한 경험이 더 많은 사람)이 탐구했을 수 있는 범위인 그녀의 조사 범위를 제한했다. 이 논쟁은 질적 연구에 내재되어 있다. 서로 다른 인터뷰어들은 다른 데이터를 수집할 것이다. 본 연구에서는 주요 조직변화를 선도하는 과제에 순진하게 대처하는 면접관을 두면 참여자들의 개인적인 생각, 느낌, 고민을 공유할 수 있는 개방적이고 풍부한 대화를 지원할 수 있을 것으로 느꼈다.
Just one researcher (F.V.) conducted all participant interviews. Her novice status and her position outside all the organizations represented in the study enabled participants to feel unthreatened in the conversation, supporting a frank and open dialogue. However, she does not have personal experiences as a change leader. This limited the scope of her probes, a scope that another interviewer (e.g., one with more experience enacting change) might have explored. This debate is inherent to qualitative research; different interviewers will gather different data. In this study, we felt that having an interviewer who was naïve to the challenges of leading major organizational change would support open and rich conversations in which participants could share their personal thoughts, feelings, and concerns.

또한, 최대 6년 전에 발생한 프로세스에 대한 질문을 받았을 때 사람들에 대한 [리콜 편견]이 있을 것이다. 그러나 장점은 잠시 후 과정을 되돌아보면 무엇이 가장 중요했고 무엇이 그렇지 않았는지에 대한 성찰과 비판적 사고를 할 수 있다는 것이다.
Additionally, there will be a recall bias for people when asked about processes that occurred up to six years ago. An advantage, however, might be that looking back on a process after a while allows for reflection and critical thinking about what was of utmost importance and what was not.

우리는 변화리더의 관점에서 교육과정 변화 제정 과정을 검토하기로 선택했지만, [교육과정 변화의 영향을 받는 사람들(예: 교육자)의 관점]을 탐구함으로써 동등하게 가치 있는 통찰력을 개발할 수 있었다. 다른 이해 관계자들과 함께 변경 과정을 연구하면 커리큘럼 변경의 복잡성에 대한 우리의 이해가 풍부해질 것이며 현재 진행 중인 연구 프로그램의 일부가 될 것이다. 
We chose to examine the process of enacting curriculum change from the perspective of the change leader; however, equally valuable insights could be developed by exploring the perspectives of those affected by the curriculum change (e.g., educators). Studying the change processes with other stakeholders would enrich our understanding of the complexities of curriculum change and will be part of our ongoing program of research.

우리 연구의 강점 중 하나가 다원적 접근이지만, 이번 연구 결과가 전 세계 다른 의과대학에 대표적일 것이라고 가정할 수는 없다.
Although one of the strengths of our study is the multi-institutional approach, we cannot assume that the findings will be representative for other medical schools around the world.

시사점
Implications

우리의 연구 결과는 다양한 방법으로 사용될 수 있다. 우리가 개발한 통찰력은 미래의 커리큘럼 변경 리더를 훈련하고 코칭하는 데 도움이 될 수 있습니다. 더 넓은 의미에서, 우리의 연구 결과는 의료 교육(예: 연구, 의료)과 관련된 다른 분야의 변화 지도자들에게 정보를 제공할 수 있다. 우리의 연구를 통해 발전된 통찰력은 미래의 교육과정 변화 리더들이 교육과정 변화 제정과 관련된 도전과제, 이러한 과제를 해결하기 위한 가능한 전략, 그리고 그 과정에서 그들 자신의 성찰과 상황 인식의 중요성을 더 잘 인식하도록 해야 한다.
The results of our study could be used in a variety of ways. The insights we developed could serve as resources for training and coaching future curriculum change leaders. In a broader sense, our findings might inform change leaders in other areas related to medical education (e.g., research, health care24). The insights developed through our research should make future curriculum change leaders more aware of the challenges involved in enacting curriculum change, the possible strategies to address those challenges, and the importance of their own reflections and situational awareness while in the process.

결론
Conclusion

의료 교육과정 변화를 제정하는 과정은 변화 리더들이 여러 가지 도전에 직면하는 복잡한 노력이다. 이러한 복잡한 프로세스를 탐색하기 위해 변화 리더는 몇 가지 전략에 의존합니다. 이러한 전략에 공통되는 중요한 기본 원칙은 [변화의 진보를 촉진하는 결정]을 내리기 위해 [현재와 새롭게 부상하고 있는 상황을 계속 인식하는 것]이었다.
The process of enacting medical curriculum change is a complex endeavor in which change leaders are faced with several challenges. To navigate in this complex process, change leaders rely on several strategies. An important underlying principle common across these strategies was remaining aware of current and newly emerging situations in order to make decisions that further the progress of change.

 

 


 

Acad Med. 2018 Oct;93(10):1503-1510. doi: 10.1097/ACM.0000000000002165.

Navigating the Complexities of Undergraduate Medical Curriculum Change: Change Leaders' Perspectives

Affiliations collapse

Affiliation

1F. Velthuis is a PhD student, Center for Education Development and Research in Health Professions, University Medical Center Groningen, Groningen, the Netherlands. L. Varpio is associate professor and associate director of research, Graduate Programs in Health Professions Education, F. Edward Hébert School of Medicine, Uniformed Services University of the Health Sciences, Bethesda, Maryland. E. Helmich is senior researcher, Center for Education Development and Research in Health Professions, University Medical Center Groningen, Groningen, the Netherlands. H. Dekker is senior educationalist, Center for Education Development and Research in Health Professions, University Medical Center Groningen, Groningen, the Netherlands. A.D.C. Jaarsma is professor of health professions education, Center for Education Development and Research in Health Professions, University Medical Center Groningen, Groningen, the Netherlands.

PMID: 29419547

DOI: 10.1097/ACM.0000000000002165

Abstract

Purpose: Changing an undergraduate medical curriculum is a recurring, high-stakes undertaking at medical schools. This study aimed to explore how people leading major curriculum changes conceived of the process of enacting change and the strategies they relied on to succeed in their efforts.

Method: The first author individually interviewed nine leaders who were leading or had led the most recent undergraduate curriculum change in one of the eight medical schools in the Netherlands. Interviews were between December 2015 and April 2016, using a semistructured interview format. Data analysis occurred concurrently with data collection, with themes being constructed inductively from the data.

Results: Leaders conceived of curriculum change as a dynamic, complex process. They described three major challenges they had to deal with while navigating this process: the large number of stakeholders championing a multitude of perspectives, dealing with resistance, and steering the change process. Additionally, strategies for addressing these challenges were described. The authors identified an underlying principle informing the work of these leaders: being and remaining aware of emerging situations, and carefully constructing strategies for ensuring that the intended outcomes were reached and contributed to the progress of the change process.

Discussion: This empirical, descriptive study enriches the understanding of how institutional leaders navigate the complexities of major medical curriculum changes. The insights serve as a foundation for training and coaching future change leaders. To broaden the understanding of curriculum change processes, future studies could investigate the processes through alternative stakeholder perspectives.

토마스 제퍼슨 대학의 지역의사부족지역 접근법의 교훈(Acad Med, 2022)
Lessons Learned as Thomas Jefferson University’s Rural Physician Shortage Area Program (PSAP) Approaches the Half-Century Mark 
Howard K. Rabinowitz, MD, Robert J. Motley, MD, Fred W. Markham Jr, MD, and Gillian A. Love, MD

 

[농촌 지역]의 의사 부족은 미국 의료에서 가장 지속적인 문제 중 하나이며, 농촌에 사는 사람들에게 심각한 건강상의 결과를 초래한다. 이는 [비농촌 지역]과는 대조적이며, 비농촌 지역에서는 경제적, 사회적 요인에 의해 진료에 대한 접근이 제한된다. 농촌 주민들 또한 비농촌 지역 주민들보다 더 늙고, 가난하고, 병들고, 의학적으로 보험에 들지 않는 경우가 더 많다. 농촌 지역은 미국 인구의 거의 20%를 차지하지만, 대도시 지역보다 의사(가족 의사 포함)의 1인당 공급량이 상당히 낮다. 농촌 주민의 약 3분의 1이 연방 지정 보건 전문 부족 지역(HPSA)에 거주하며, 대부분의 HPSA는 농촌 지역에 위치한다. 이 문제는 펜실베니아에서 분명히 볼 수 있는데, 거의 절반에 가까운 의사들이 단지 3개의 대도시 카운티(필라델피아 카운티, 그 교외의 몽고메리 카운티, 그리고 피츠버그의 앨러게니 카운티)에서 진료하고 있다. 인구의 거의 4분의 3이 다른 64개 카운티에 살고 있다. 그리고 현재 미국 의대생의 4% 미만이 시골이나 작은 마을의 실습에 들어갈 계획이기 때문에, 이 오랜 문제는 계속될 것 같다.   
The shortage of physicians in rural areas is one of the most enduring problems in U.S. health care, with serious health consequences for those living rural. This contrasts with nonrural areas, where access to care is more often limited by economic and social factors. Rural inhabitants are also older, poorer, sicker, and more often medically uninsured than those in nonrural areas. Rural areas contain almost 20% of the U.S. population but have a substantially lower per capita supply of physicians (including family physicians) than metropolitan areas. Approximately one-third of rural inhabitants live in federally designated Health Professional Shortage Areas (HPSAs), and most HPSAs are located in rural areas. This problem is clearly seen in Pennsylvania, where almost half of all physicians practice in just 3 large metropolitan counties (Philadelphia County, its suburban Montgomery County, and Pittsburgh’s Allegheny County), although almost three-quarters of the population lives in the other 64 counties. And with fewer than 4% of current U.S. medical students planning to enter rural or small-town practice, this longstanding problem is likely to continue. 1–6

이 문제를 해결하기 위해 토머스 제퍼슨 대학교의 시드니 킴멜 의과대학(이전 제퍼슨 의과대학)은 1974년에 시골 의사 부족 지역 프로그램(PSAP)을 개발하였다. 이 프로그램은 주로 펜실베니아에 있는 작은 마을과 시골 지역에서 가족 의사들의 공급과 유지를 증가시키기 시작했다. PSAP는 다음에 모두 해당하는 의대 지원자를 모집하여 선별적으로 입학시켰다. 

  • (1) 시골 지역이나 작은 마을(즉, 대도시 지역이 아니며, 그러한 지역의 통근 교외 지역이 아님)에서 자랐고, 
  • (2) 또한 비슷한 지역에서 가정의학을 실천하기 위해 헌신했다. 

To address this problem, Sidney Kimmel Medical College (previously Jefferson Medical College) at Thomas Jefferson University developed the rural Physician Shortage Area Program (PSAP) in 1974. The program set out to increase the supply and retention of family physicians in small towns and rural areas, primarily in Pennsylvania. The PSAP recruited and selectively admitted medical school applicants who both

  • (1) grew up in rural areas or small towns (i.e., not large metropolitan areas, and not commuting suburbs of those areas) and
  • (2) were also committed to practice family medicine in a similar area.

2009년, 이 프로그램은 시골과 작은 마을, 델라웨어 주에 필요한 의료 전문 분야를 계획하는 사람들을 포함하도록 초점을 확장했다. PSAP 신청자는 간단한 추가 신청을 완료하고 고향에 있는 개인으로부터 3통의 지원서를 제출한다. 제퍼슨은 펜실베니아와 델라웨어에 있는 8개의 학부 대학과 협력해서 이 프로그램을 위한 학생들을 모집하고 선발하는 것을 돕습니다.
In 2009, the program expanded its focus to include those planning any medical specialty needed in rural areas and small towns, and to the state of Delaware. PSAP applicants complete a brief additional application and submit 3 letters of support from individuals in their hometown. Jefferson works cooperatively with 8 undergraduate colleges and universities in Pennsylvania and Delaware to help recruit and select students for the program.

지난 48년 동안, 5명에서 15명 사이의 PSAP 학생들이 각 학년에 등록했습니다. 의과대학 내내, PSAP 학생들은 PSAP 교수진들의 소그룹(이 논평의 저자)에 의해 (정기 이메일, 월간 점심 회의, 개별 회의를 통해) 긴밀하게 멘토링되고 조언을 받는다. 그들은 또한 이전 PSAP 수업의 "빅 시브Big Sib" 멘토와 짝을 지어 의대 과정을 안내한다. PSAP 학생들은 핵심 임상 커리큘럼 동안 필라델피아 메트로폴리탄 지역 밖의 더 작은 지역사회에서 6주 동안 필수 로테이션을 수행해야 한다. 그들의 마지막 해 동안, 그들은 시골의 preceptorship이나 elective rotation을 하도록 장려된다. PSAP 학생들은 또한 의과대학 기간 동안 추가적인 재정 지원을 받을 자격이 있다. 이것은 보통 필요 기반 대출의 형태이다(최근에는 2개의 장학금이 설립되었지만). 그러나, 이 추가적인 지원은 전체 교육 비용의 아주 작은 비율만을 나타낸다. 졸업과 동시에 PSAP 학생들은 다른 학생들처럼 그들이 선택한 레지던트 프로그램에서 매치를 한다. 훈련을 마친 후, 비록 준수를 보장하기 위한 공식적인 메커니즘이 존재하지 않지만, 그들은 작은 마을이나 시골 지역에서 연습하도록 권장된다. PSAP에 대한 추가 세부 정보는 이전에 게시되었습니다.  PSAP가 이제 반세기 가까이 다가오면서, 우리는 여기서 요약하는 몇 가지 중요한 교훈을 배웠다.
During most of the past 48 years, between 5 and 15 PSAP students have enrolled in each class. Throughout medical school, PSAP students are closely mentored and advised (via regular email, monthly lunch meetings, and individual meetings) by the small group of PSAP faculty (the authors of this commentary). They are also paired with a “Big Sib” mentor from the previous PSAP class to help guide them through medical school. During their core clinical curriculum, PSAP students must take one of their required 6-week rotations in a smaller community outside of the Philadelphia metropolitan area. During their final year, they are encouraged to take a rural preceptorship or elective rotation. PSAP students are also eligible for additional financial aid during medical school. This is usually in the form of need-based loans (though more recently 2 scholarships have been established); however, this additional support represents only a very small percentage of the overall educational cost. Upon graduation, PSAP students match at the residency program of their choice, similar to all students. After completing their training, they are encouraged to practice in a small town or rural area, although no formal mechanism exists to ensure compliance. Additional details regarding the PSAP have previously been published. 1–16 As the PSAP now approaches the half-century mark, we have learned several important lessons, which we summarize here.

결과 연구가 필수적임
Outcomes Research Is Essential

많은 학술 기관들이 의사 인력을 형성하기 위한 프로그램을 시작하지만, 이러한 프로그램들이 항상 성공 여부를 결정하기 위해 평가되는 것은 아니다. 교육 프로그램 평가는 어려운 경우가 많아, 졸업 후 잘 나타나는 결과와 함께 긴 시간 프레임이 필요하다. 농촌 프로그램의 경우 수십 년 동안 변화하는 지역사회의 농촌 특성뿐만 아니라, 농촌에 대한 다양한 정의로 인해 평가가 저해되기도 한다. Jefferson에서 우리는 1964년 입학 수업 이후 학생과 졸업생들을 추적하고 배경, 성과 및 기타 변수에 대한 600만 개 이상의 데이터를 포함하는 Jefferson Longitial Study of Medical Education(JLS)의 존재로 인해 PSAP 결과 연구를 수행할 수 있었습니다.  이로써 PSAP 결과에 대한 15편의 논문(뉴잉글랜드 의학 저널 2편, 미국 의학 협회 저널 3편, 학술 의학 7편 포함)과 책 한 권이 출판되었다. 이 결과 연구를 통해 PSAP의 성공을 입증하고 이러한 성공으로 이어지는 프로그램 특성을 이해할 수 있습니다.
While many academic institutions initiate programs intending to shape the physician workforce, these are not always evaluated to determine whether they are successful. Educational program evaluation is often difficult, requiring long time frames with outcomes that occur well after graduation. For rural programs, evaluation is also hampered by various definitions of rural, as well as the changing rural character of communities over decades. At Jefferson, we were able to carry out our PSAP outcomes research due to the existence of the Jefferson Longitudinal Study (JLS) of Medical Education, which has tracked our students and graduates since the entering class of 1964, and contains over 6 million pieces of data on their background, performance, and other variables. 17 This has resulted in 15 published papers on PSAP outcomes (including 2 in the New England Journal of Medicine, 3 in the Journal of the American Medical Association, and 7 in Academic Medicine), and a book. 1–16 This outcomes research enables us to demonstrate the PSAP’s success and understand what program characteristics lead to this success.

PSAP는 다른 유사한 의과대학 시골 프로그램과 마찬가지로 작동한다.
The PSAP Works, as Do Other Similar Medical School Rural Programs

JLS의 데이터에 따르면 PSAP 졸업생은 2개의 서로 다른 코호트(1978-1991, 1992-2002)에서 온 것으로 나타났다. PSAP 졸업생은 비 PSAP 반 친구보다 농촌 가정의학을 실천할 가능성이 8.5-9.9배, 농촌 지역에서 어떤 전문분야를 실천할 가능성이 2.7-3배, 그리고 4-4.7배 높았다. 이 작은 프로그램은 1978년부터 1991년까지 미국과 국제 의대를 졸업한 펜실베니아에 있는 모든 시골 가정 의사들의 12%를 배출했다. 전반적으로, PSAP 졸업생들의 절대다수(84%)는 시골이나 작은 대도시 지역 또는 1차 진료 전문 분야 중 하나에서 실습하고 있었다. 비 PSAP 졸업생 중 2~3%만이 농촌 가정의학을 하고 있었다. 이 프로그램은 남녀 졸업생 모두에게 성공적이었다.

Data from the JLS have shown that PSAP graduates from 2 different cohorts (the graduating classes of 1978-1991, and 1992-2002) were 8.5 to 9.9 times more likely to practice rural family medicine than their non-PSAP classmates, 2.7 to 3 times more likely to practice any specialty in a rural area, and 4 to 4.7 times more likely to practice family medicine. This small program produced 12% of all rural family physicians in Pennsylvania who graduated from U.S. and international medical schools from 1978 to 1991. Overall, the vast majority (84%) of PSAP graduates were practicing either in a rural or small metropolitan area or in one of the primary care specialties; only 2% to 3% of non-PSAP graduates were practicing rural family medicine. 1,4 The program was successful for both men and women graduates of the program. 5

PSAP는 가장 인정받는 의과대학 농촌 프로그램  (대부분 발표된 결과 연구로 인해) 중 하나이지만, 유일하게 성공적인 프로그램은 아니다.  PSAP를 포함한 6개의 오랜 의과대학 농촌 프로그램을 통해 30년 동안 1,600명의 졸업생을 합친 결과, 졸업생 중 53%에서 64%가 농촌에서 일하고 있는 것으로 나타났다(농촌 사용 정의에 따라). 이 분석에 포함된 모든 프로그램은, 시골에서 실습할 가능성이 높은 학생들의 [식별된 코호트]와 [필수 시골 임상 커리큘럼]을 가지고 있었지만, 프로그램은 [공립학교와 사립학교 모두]에 위치했고, [국가의 여러 지역에 위치]하여 의료 교육에 대한 이러한 접근 방식이 다양한 환경에서 시골 의사들의 노동력 증대에 긍정적인 영향을 미칠 수 있음을 입증했다. 의대 농촌 프로그램도 국제 의대 졸업자(IMG)보다 해당 주의 농촌 가정의사가 더 많았다. 
While the PSAP is one of the most recognized medical school rural programs 18 (in large part due to its published outcomes research), it is not the only successful program. 19,20 Combined outcomes of 1,600 graduates over 3 decades from 6 longstanding medical school rural programs, including the PSAP, showed that a weighted average of 53% to 64% of their graduates were practicing rural (depending on the definition of rural used). 6,7 All programs included in this analysis had an identified cohort of students likely to practice rural and a required rural clinical curriculum, but the programs were situated in both public and private schools, and were located in multiple regions of the country, demonstrating that this approach to medical education can have a positive effect on the rural physician workforce in many settings. Medical school rural programs also accounted for more rural family physicians in their states than did international medical graduates (IMGs). 8

장기 보존이 승수에 미치는 영향
Long-Term Retention Has a Multiplicative Impact

"채용과 유지"가 자주 함께 언급되지만, 그것들은 매우 다른 결과를 나타낸다. [채용recruitment]과 비교하여, [보유retention]는 시골 의사 노동력에 [곱셈적인multiplicative 영향]을 미친다. 예를 들어, 35년 경력 동안 시골 지역에 머무르는 의사 1명을 훈련시키는 것은 각각 평균 7년 동안 머무르는 의사 5명을 훈련시키는 것과 유사한 영향을 지역사회에 미친다. PSAP 졸업생들의 장기 추적 조사에 따르면 PSAP 졸업생들의 약 70%가 처음 개업한 후 최소 20년에서 25년 동안 같은 지역에서 농촌 가정 실습에 머물렀으며, 추가로 10%가 이전에 다른 농촌 지역으로 이주한 것으로 나타났다.   
Although “recruitment and retention” are frequently mentioned together, they represent very different outcomes. Compared with recruitment, retention has a multiplicative effect on the rural physician workforce. For example, training 1 physician who stays in a rural area for a 35-year career has a similar impact on a community as training 5 physicians who each stay for an average of 7 years. Long-term follow-up of PSAP graduates has shown that approximately 70% of PSAP graduates have remained in rural family practice in the same area for at least 20 to 25 years after first located in practice, and an additional 10% had previously moved to another rural area. 9,10

입학이 가장 중요하다
Admissions Is Most Important

연구는 농촌 지역에서 자라는 것이 농촌 실습 장소를 선택하는 가장 강력한 예측 변수라는 것을 일관되게 밝혀냈다. PSAP 결과는 비슷하게 프로그램의 [입학 구성요소]가 성공의 약 4분의 3을 차지한다는 것을 보여주었다의대 입학 당시 알려진 세 가지 요인(농촌 지역에서 성장, 농촌 실습 계획, 가정의학 계획)은 30년 후 농촌 실천의 강력하고 부가적인 예측요인으로 나타났으며, 이는 다중 예측위험요인과 관상동맥 심장질환 사이의 잘 수용된 관계와 규모 면에서 유사하다. 의사 진료 장소에 영향을 미치는 것으로 알려진 수많은 요소들이 있지만, 많은 요소들은 의과대학 입학 후에 발생한다(예: 시골 교육과정, 거주 훈련 장소, 배우자와 가족 선호, 소득). 반면, [입학할 때 이 세 가지 강력한 요인의 존재]는 30년 후에 시골에서 실습하는 제퍼슨 졸업생들의 거의 80%를 식별해냈다. 시골 의사의 22%만이 이러한 예측 변수를 전혀 가지고 있지 않았다. 12 이러한 입학 요인이 시골 실습의 가장 강력한 예측 변수를 나타내지만, 다른 프로그램 구성 요소(즉, 멘토링, 시골 커리큘럼, 비슷한 배경을 가진 동료 그룹이 있음)는 PSAP 성공에 25%를 추가했고, 이는 실질적이고 매우 중요한 향상이다. 이 세 가지 구성 요소는 또한 PSAP 학생들이 프로그램의 가장 영향력 있는 부분으로 자주 언급합니다.
Research has consistently found that growing up in a rural location is the strongest predictor of choosing a rural practice location. PSAP outcomes have similarly shown that the admissions component of the program accounted for approximately three-quarters of its success. 11 Three factors known at the time of medical school matriculation—growing up in a rural area, plans for rural practice, and plans for family medicine—were found to be powerful and additive predictors of rural practice 3 decades later, similar in magnitude to the well-accepted relationship between multiple predictive risk factors and coronary heart disease. 21 Despite the numerous factors that are known to influence physician practice location, many of which occur after medical school matriculation (e.g., rural curriculum, residency training location, spouse and family preferences, income), the presence of these 3 powerful factors at matriculation identified almost 80% of all Jefferson graduates practicing rural 3 decades later; only 22% of rural physicians had none of these predictors. 12 While these admissions factors represent the strongest predictors of rural practice, other program components (e.g., mentoring, the rural curriculum, having a peer group with similar backgrounds) collectively added an additional 25% to the PSAP success, a substantial and very important increase. 11 These 3 components are also often mentioned by PSAP students as the most influential parts of the program.

시골에서 살기를 원하는 것이 농촌을 실천하는 결정의 핵심이다.
Wanting to Live Rural Is Key to the Decision to Practice Rural

시골과 도시 지역의 의사 부족 문제를 해결하는 것은 중요한 요구를 나타내기 때문에 종종 함께 그룹화된다. 그러나, 우리는 [도시 소외계층]을 돌볼 계획인 학생들과는 대조적으로, 농촌 지역에서 실습할 계획인 대부분의 학생들은 일차적으로 농촌 지역에서 [살기로 결정]한 뒤, 이에 따라 그들의 지역사회를 돌보고자 한다는 것을 발견했다. 그들은 종종 시골의 생활 방식을 원하고, 자기 자녀들이 시골 학교에서 교육받기를 원하며, 더 전문적인 자율성을 가지고 더 넓은 범위의 의학을 실천하기를 선호한다.  이는 돌봄을 제공하는 지역사회에서 덜 흔하게 살고, 교외 또는 선택된 도시 학교에 접근할 수 있는 더 교외 또는 도시 생활을 선호하며, 많은 사람들이 학업 보건 시스템에 고용되는 [도시의 취약urban underserved 지역]에서 실습할 계획과는 다르다. 
Addressing physician shortages in rural and urban areas are often grouped together, as they both represent important needs. However, we have found that, in contrast to students who plan to care for the urban underserved, most students who are planning to practice in rural areas primarily decide to live in a rural area, and thus to care for their community. They often desire a rural lifestyle, want to have their children educated in rural schools, and prefer to practice a broader scope of medicine with more professional autonomy. 13 This differs from those planning to practice in urban underserved areas, who less commonly live in the community where they provide care, often prefer a more suburban or urban lifestyle with access to suburban or select urban schools, and many are employed by academic health systems.

지원자의 진술된 의도만을 바탕으로 입학 당시에 미래의 의료행위 장소를 예측하는 것은 어렵지만, 이러한 진술된 실습 의도를 시골 배경과 연결하는 것이 PSAP 성공의 열쇠가 되었다. 대조적으로, [도시 배경]과 [도시의 underserved practice]을 연계하는 연구는 적다. 일부에서는 소득이 의사의 비농촌 진료 선택에도 주요 요인이라고 믿지만, 데이터는 농촌 의사가 비농촌 의사와 비교하여 비슷한 수준의 소득을 얻고, 주거비가 상당히 낮다는 점을 감안할 때, 실제로 생활비와 전문 의료비를 조정할 때 더 높은 소득을 가지고 있음을 시사한다.

Predicting future practice locale at the time of admission based only on the applicant’s stated intentions is difficult; however, linking this stated practice intent with rural background has been a key to the PSAP success. In contrast, there is less research linking urban background with urban underserved practice. While some believe that income is also a major factor in physicians’ choice of nonrural practice, data suggests that rural physicians earn similar levels of income compared with their nonrural counterparts and, given their substantially lower housing costs, actually have a higher income when adjusting for cost of living and specialty. 3

의과대학은 시골 의사 부족을 해결하는 데 중요한 역할을 할 수 있다.
Medical Schools Can Have a Critical Role in Addressing the Rural Physician Shortage

제퍼슨의 PSAP와 같은 [의대 시골 프로그램]은 시골 의사 부족 전체를 해결하지는 못할 것이지만, 많은 지역사회에 중요한 해결책이 될 수 있다. 그것들은 가장 성공적인 증거 기반 전략 중 하나이며, 결과적으로 시골 지역에서 개업하고 장기간 머무르는 의사의 비율이 높다. 시골 프로그램은 또한 더 적은 자원을 필요로 할 수 있다. 제퍼슨이 지원하는 PSAP의 비용은 주로 입학 과정과 커리큘럼의 지속적인 비용에 포함되어 있다. 멘토링, 교직원 2명 시간제, 행정지원 등에 추가 자원이 필요하다.

Medical school rural programs like Jefferson’s PSAP will not solve the entire rural physician shortage but can be a critical solution for many communities. They are among the most successful evidence-based strategies, resulting in a high percentage of physicians practicing and remaining long term in rural areas. Rural programs may also require fewer resources; the cost of the PSAP, supported by Jefferson, is largely built into the ongoing cost of the admissions process and curriculum. Additional resources are needed for mentoring, the partial time of 2 faculty, and administrative support.

이 문제를 해결하는 데 [의대 농촌 프로그램]의 중요한 역할 외에도, 고등학생과 대학생을 중심으로 한 [경로pathway 프로그램], [의대 농촌 임상 경험 확대], [농촌 전공의 프로그램] 등 다른 정책적 해법이 도움이 될 것이다. 국민건강봉사단 의사 공급 확대, 기타 대출상환 프로그램 확대, 농촌으로 유입되는 IMG 공급 확대, 농촌의사 변제 강화 등 다른 전략도 매우 중요하다. 의과대학 시골 프로그램에 대한 [주 및 연방 지원]은 이러한 프로그램의 지속과 확장을 위해 필수적이다. 예를 들어, 이러한 시골 프로그램에 대한 연방 지원은 [의사 연구자 부족 문제]를 해결하는(그리고 의대 시골 프로그램과 비슷한 수준의 성공을 거둔) 잘 지원된 [국립 보건 의료 과학자 훈련 프로그램]과 유사할 수 있다.  
In addition to the critical role of medical school rural programs in addressing this problem, other policy solutions, such as pathway programs focusing on high school and college students, expanding medical school rural clinical experiences, and rural residency programs, would be helpful. Other strategies, such as increasing the supply of National Health Service Corps physicians, expanding other loan repayment programs, increasing the supply of IMGs entering rural areas, and enhanced reimbursement for rural physicians, are also very important. State and federal support for medical school rural programs is vital for continuation and expansion of these programs. For example, federal support for these rural programs similar to the well-funded National Institutes of Health Medical Scientist Training Program that addresses the shortage of physician researchers (and which has a similar level of success as medical school rural programs) could go far in easing the rural physician shortage. 22

일부는 의과대학이 시골 의사 부족 문제를 해결하는 데 역할을 하는지 의문을 제기했지만, 의과대학이 중요하다는 가장 명확한 증거는 PSAP와 다른 유사한 프로그램의 결과이다. 특히 의대 입학전형은 누가 의사가 되는가에 직접적인 영향을 미친다. 전원생활을 할 가능성이 가장 높은 사람을 식별하기 위해, PSAP는 모든 지원자와 동일한 기준을 충족하지만 전원생활 배경과 전원생활 계획을 입증하는 자격을 갖춘 지원자를 우선적으로 입학시킨다. PSAP 졸업생들은 의과대학과 레지던트 교육 동안 그들의 동료들과 [비슷한 성과]를 거두었다. -그리고 반 친구들보다 시골에서 훨씬 [더 많이 practice]했다. 의과대학은 또한 학생들을 지도하고 조언하는 데 중요한 역할을 하며, 농촌 실습에서 경력을 노출하고 지원하기 위한 임상 회전을 제공한다. 예측에 따르면 미국의 모든 의과대학이 PSAP와 유사한 의과대학 시골 프로그램을 한 반에 10명의 학생으로 개발한다면, 이것은 현재 시골 의사들의 생산량을 두 배 이상 증가시킬 수 있다. 보유의 [곱셈적 효과]를 고려하면, 장기적인 영향은 훨씬 더 클 것이다. 심지어 [상대적으로 적은 수의 절대적인 수의 추가 의사들]도 많은 작은 마을에 불균형적으로disproportionately 긍정적인 영향을 미칠 것이다. 특히 제퍼슨의 PSAP는 미국 북동부 지역의 주요 대도시 지역에 위치한 사립 의과대학이 시골 의사들의 공급과 유지를 늘릴 수 있다면 이는 어느 의과대학에서도 할 수 있다는 것을 보여주었다.
While some have questioned whether medical schools have a role in addressing the rural physician shortage, the clearest evidence of their importance are the outcomes of the PSAP and other similar programs. The medical school admissions process in particular directly influences who becomes a physician. To identify those most likely to practice rural, the PSAP preferentially admits qualified applicants who meet the same standards as all applicants, but who also demonstrate a rural background and rural career plans. PSAP graduates performed similarly to their peers throughout medical school and during residency training 2,14—and have practiced rural much more frequently than their classmates. Medical schools also have a key role in mentoring and advising students, as well as providing clinical rotations to expose and support a career in rural practice. Projections show that if all U.S. medical schools developed medical school rural programs similar to the PSAP with 10 students per class, this could more than double the current output of rural doctors. 6 Considering the multiplicative effects of retention, the long-term impact would be far greater. Even a relatively small absolute number of additional physicians would have a disproportionately positive effect on many small towns. Jefferson’s PSAP in particular has shown that if a private medical school located in a major metropolitan area in the Northeast region of the United States can increase the supply and retention of rural physicians, then this can be done at any medical school.

결론
Conclusion

지난 세기의 대부분 동안, 일반 교육 위원회 (1924)가 후원한 시골 의사 부족에 대한 연구에 포함된 시골 의료행위에 관한 지배적인 신화는 다음과 같았다. "더 많은 시골 지역 학생들이 입학하면… 근본적인 인구 동향을 바꾸지 않고 열등한 의사만 배출할 것입니다."  그러나 현실은 정반대다. 지난 반세기 동안 Jefferson의 PSAP와 다른 많은 의과대학 시골 프로그램의 광범위한 경험과 결과 연구는 매우 유능한 시골 의사의 공급과 장기 보존을 증가시키는 데 그들의 성공을 분명히 보여주었다. 우리는 이 프로그램에서 우리가 배운 교훈과 그 결과가 이 중요하고 오랫동안 무시되어 온 건강 관리 문제를 해결하는 데 다른 사람들에게 가치가 있을 수 있기를 바란다.
For most of the past century, a prevailing myth regarding rural practice, included in a study of the rural physician shortage sponsored by the General Education Board (1924) was that “admitting more students from rural districts … would only produce inferior doctors without altering the underlying demographic trends.” 23 The reality, however, is exactly the opposite. Extensive experience and outcomes research from Jefferson’s PSAP and a number of other medical school rural programs over the past half-century has clearly shown their success in increasing the supply and long-term retention of highly competent rural physicians. We hope the lessons we have learned from this program, its students and graduates, and its outcomes can be of value to others in addressing this critical and long-ignored health care problem.

 

 


Acad Med. 2022 Sep 1;97(9):1264-1267. doi: 10.1097/ACM.0000000000004710. Epub 2022 Apr 19.

Lessons Learned as Thomas Jefferson University's Rural Physician Shortage Area Program (PSAP) Approaches the Half-Century Mark

Affiliations collapse

Affiliations

1H.K. Rabinowitz is professor emeritus, family and community medicine, and director emeritus, Physician Shortage Area Program, Sidney Kimmel Medical College at Thomas Jefferson University, Philadelphia, Pennsylvania.

2R.J. Motley is the Ellen M. and Dale W. Garber Professor of Family and Community Medicine and director, Physician Shortage Area Program, Sidney Kimmel Medical College at Thomas Jefferson University, Philadelphia, Pennsylvania.

3F.W. Markham is professor, family and community medicine, and associate director, Physician Shortage Area Program, Sidney Kimmel Medical College at Thomas Jefferson University, Philadelphia, Pennsylvania.

4G.A. Love is assistant professor, family and community medicine, and assistant director, Physician Shortage Area Program, Sidney Kimmel Medical College at Thomas Jefferson University, Philadelphia, Pennsylvania.

PMID: 35442906

DOI: 10.1097/ACM.0000000000004710

Abstract

To help increase the supply and retention of rural family physicians, Thomas Jefferson University initiated the Physician Shortage Area Program (PSAP) in 1974. The program selectively admits medical school applicants who both grew up in a rural area and plan to practice in a rural area. During medical school, PSAP students have ongoing mentoring and rural clinical experiences. As the program now approaches the half-century mark, this commentary summarizes several important lessons learned. First, outcomes research is critical, and program leaders have been able to publish 15 papers and a book about the PSAP and its outcomes. Second, these studies have shown that the program has been highly successful, with PSAP graduates 8.5-9.9 times more likely to enter rural family medicine than their peers, and that the PSAP contributed 12% of all rural family physicians in Pennsylvania. Other similar medical school rural programs have had comparable success, with more than half of all graduates combined (including PSAP graduates) practicing rural. Third, long-term retention has a multiplicative impact. Long-term retention of PSAP graduates in rural family medicine was greater than 70% after 20-25 years. Fourth, research has shown that the admissions component accounted for approximately three-quarters of the PSAP's success. Three factors available at the time of matriculation (rural background, plans for rural practice, and plans for family medicine) identified almost 80% of all Jefferson graduates in rural practice 3 decades later. Having a peer group with similar backgrounds, mentoring, and the rural curriculum were also very important. Fifth, wanting to live rural appears key to the rural practice decision. Finally, given that medical school programs like the PSAP produce substantial increases in the supply and retention of rural physicians while requiring modest resources, medical schools can have a critical role in addressing the rural physician shortage.

의과대학 교육과정의 질 개선 - 어떻게 접근해야 하는가? (Med Educ, 2022)
State of the science: Quality improvement of medical curricula—How should we approach it?
Susan Jamieson

 

 

1 소개
1 INTRODUCTION

의료 커리큘럼의 품질 향상(QI)은 커리큘럼 팀의 중요한 우선 순위이며 많은 이해 관계자(학습자, 교육자, 환자, 보호자, 특정 분야 및 전문성, 규제 기관 및 자금 제공자)에게 중요하다. 지속적인 QI는 외부 주도 인증 중심 커리큘럼 리뷰와는 구별되지만, 외부 주도형 커리큘럼 검토와 관련이 있다. 이 서술적 검토는 의료 커리큘럼의 QI에서 가정과 실천 중 일부를 탐색하고 커리큘럼 팀을 위한 권고안을 제시한다. 이 검토는 관련 MeSH 용어 또는 키워드 또는 이들의 조합을 포함하는 영어 전체 텍스트 기사에 대한 MEDLINE, EMBASE, PUBMED 및 ERIC 데이터베이스의 검색을 통해 식별된 의료 및 기타 보건 전문 교육의 문헌에 주로 기초한다. 다른 출처에는 예시적인 커리큘럼 프레임워크와 평가 보고서가 포함된다. 먼저 핵심 개념을 정의하고 설명합니다.
Quality improvement (QI) of the medical curriculum is an important priority for the curriculum team and is of consequence to many stakeholders: learners, educators, patients, carers, specific disciplines and specialities, regulators and funders. Continuous QI is distinct from, but feeds into, externally driven accreditation-focused curriculum reviews. This narrative review1 explores some of the assumptions and practices in QI of medical curricula and makes recommendations for curriculum teams. The review draws mainly on literature from medical and other health professions education, identified through searches of the MEDLINE, EMBASE, PUBMED and ERIC databases for English-language full-text articles that contained relevant MeSH terms or keywords, or combinations thereof. Other sources include exemplar curricular frameworks and evaluation reports. Key concepts are first defined and explained.

2 주요 개념과 매개변수
2 KEY CONCEPTS AND THE PARAMETERS OF THIS REVIEW

[퀄리티]은 기업의 '우수도의 척도'로 정의되어 왔다. 의료 커리큘럼(또는 프로그램)의 품질은 학습, 교육, 평가, 학습 환경 등의 [특정 표준specific standards]에 따라 평가된다. 이 표준은 다음과 같은 기관에 의해 설정될 수 있다.

  • 대학이나 대학과 같은 고등 교육 기관
  • 영국 왕립 대학과 같은 졸업후 의학 교육 제공자
  • 영국의 GMC(General Medical Council) 또는 세계 의학 교육 연맹(WFME)과 같은 지역 또는 글로벌 의료 교육 규제 기관

Quality has been defined as ‘a measure of the degree of excellence2 of an entity. The quality of a medical curriculum (or programme) is judged against specific standards of learning, teaching, assessment, learning environment and so on. These may be set

  • by higher education institutions, such as colleges or universities;
  • by providers of postgraduate medical education, such as the Royal Colleges in the United Kingdom; or
  • by local or global regulators of medical education, such as the General Medical Council (GMC) in the United Kingdom, or the World Federation of Medical Education (WFME).

 

  • [퀄리티 보증(QA)][규제/인정기관이 (퀄리티 표준에 대한 책무가 있는) 어떤 의료 커리큘럼이 퀄리티 표준이 충족되는 정도를 결정하는 과정]이다.
  • [퀄리티 개선(QI)]은 일반적으로 [커리큘럼 팀이 이해관계자 피드백을 사용하여 커리큘럼이 관련 표준을 충족하는지 여부를 결정한 다음, 인식된 결함을 해결하기 위한 새로운 활동 또는 기타 조치를 시행하고, 후속적으로 커리큘럼의 품질을 재평가하는 지속적인 프로세스]로 간주된다.
  • Quality assurance (QA) is
    • a process whereby regulatory/accrediting bodies determine the extent to which quality standards are met by medical curricula accountable to them.3 
  • Quality improvement is generally regarded as
    • a continuous process whereby curriculum teams
      • use stakeholder feedback to determine whether the curriculum meets relevant standards,
      • then implement new activities or other measures to address perceived deficiencies
      • and subsequently re-evaluate the quality of the curriculum.2 

프랭크 외 연구진은 [QA를 총괄적]이라고 구분하고, [QI를 형성적]이라고 구분한다. 의료 자체에서 QI는 [환자의 경험]을 향상시키고, [환자의 안전]을 개선하기 위해 상당한 초점을 맞추고 있다. 예를 들어, 미국의 경우, ACGME(Creditation Council for Graduate Medical Education)는 의사가 품질 향상과 관련된 역량을 입증하도록 요구한다.5 이에 따라 의료 학습자 및 실무자, 기타 의료전문가를 대상으로 품질향상의 원칙과 과정에 대해 교육하기 위한 품질향상 교육과정이 개발되었다. 그러나 본 검토의 초점은 [QI에 관한 커리큘럼]이 아니라, [의료 커리큘럼의 QI]에 있다.

Frank et al. distinguish between QA as summative and QI as formative.4 In healthcare per se, there is significant focus on QI to enhance the patient experience/improve patient safety. For example, in the United States, the Accreditation Council for Graduate Medical Education (ACGME) requires physicians to demonstrate competencies related to quality improvement.5 Accordingly, quality improvement curricula have been developed to teach medical learners and practitioners, and other healthcare professionals, about the principles and process of quality improvement.6-11 However, the focus of this review is not on curricula about QI, but on QI of the medical curriculum.

3 품질 개선 프로세스 개요
3 OVERVIEW OF THE QUALITY IMPROVEMENT PROCESS

의료 커리큘럼의 지속적인 QI를 위한 프로세스와 공통 메커니즘은 표준 의료 교육 텍스트에 상세히 설명되어 있습니다.2 연속 QI에 대한 [계획-실행-연구-행위(PDSA)] 사이클은 데밍에 기인한다. 켄라이트와 윌킨슨은 [계획-실행-평가-조사plan-implement-evaluate-investigate]의 순환이 되도록 의료 커리큘럼에 적용했다. 다양한 이해관계자는 일반적으로 프로세스의 시작점을 제공한다. 의료 커리큘럼의 QI의 주요 이해관계자 그룹은 전통적으로 의학 학습자 자체였지만, 다른 이해관계자(예: 동문 또는 선택 호스트)로부터 피드백을 구할 수도 있다. 의학 교육의 연속체에서의 커리큘럼의 위치(UG, PG, CPD)에 따라 구체적인 이해관계자 그룹이 변경되거나, 특정 그룹의 견해가 다소 좌우될 수 있다.
The process and common mechanisms for continuous QI of medical curricula are elaborated in standard medical education texts.2 The plan-do-study-act (PDSA) cycle for continuous QI is attributed to Deming.12 It has been adapted for the medical curriculum by Kenwright and Wilkinson to become a cycle of plan-implement-evaluate-investigate.2 The various stakeholders typically provide a starting point for the process. The main stakeholder group in QI of medical curricula has traditionally been medical learners themselves,13-15 but feedback may also be sought from other stakeholders, for example, alumni, or elective hosts.16, 17 Depending on where a particular curriculum is positioned on the continuum of medical education—undergraduate (UG), postgraduate (PG) or continuing professional development (CPD)—the specific stakeholder groups may change or the views of certain groups may hold more or less sway.


일반적으로 [설문조사]에 응답하거나, [포커스 그룹] 또는 [커리큘럼 위원회]에 참여함으로써 이해 당사자는 커리큘럼 또는 그 측면을 평가한다. 교육과정 팀은 평가를 검토하고 이에 대응한다. 여기에는 특정 문제에 대한 추가적 탐구가 포함될 수 있습니다. 예를 들어, 설문조사에서 부정적인 점수나 논평 뒤에 숨겨진 이유를 더 잘 이해하기 위해 포커스 그룹을 조직하는 것이 포함됩니다. 이유를 더 잘 이해했다면 다음과 같이 대응할 수도 있다.

  • 학습, 교육 및 평가를 위한 기존 규정을 바꾼다.
  • 학습 환경의 문제를 해결한다. 
  • 기존 규정의 변경이 적절하거나 실현 가능한지 여부에 대한 교육학적 또는 실용적인 판단을 내린다. 

중요한 것은, 커리큘럼 팀의 response에는 '루프 닫기closing the loop'가 포함되어야 하며, 여기에는 이해 관계자에게 결과를 전달하는 것이 포함되어야 한다. 교육과정의 다음 실행에서, 그 과정은 다시 시작된다.

Usually by responding to surveys, or participating in focus groups or curriculum committees, stakeholders evaluate the curriculum or aspects of it. Curriculum teams review the evaluation and respond to it. This may include further exploration of specific issues; for example, organising focus groups to better understand the reasons behind negative scores or comments in a survey. The response may include

  • making changes in existing provision for learning, teaching and assessment;
  • addressing issues in the learning environment; or
  • taking pedagogical or pragmatic decisions about whether changes in existing provision are appropriate or feasible.

Importantly, the response from curriculum teams should incorporate ‘closing the loop’,18 which includes communication of the outcome(s) to stakeholders. At the next run of the curriculum, the process begins again.

4 의과대학 교육과정의 QI 문제 
4 PROBLEMS WITH QI OF THE MEDICAL CURRICULUM

의료 교육과정의 지속적인 QI와 관련된 몇 가지 문제가 있다.

  • 첫째, 의료 교육 커뮤니티의 구성원들은 지리적 맥락 및/또는 UG 또는 PG 맥락에 포함되는지, 또는 학술 또는 임상 환경에 따라 QI를 설명하기 위해 다른 언어를 사용한다. 이것은 QI의 성격과 목적에 대한 서로 다른 용어들이 상충되는 개념화와 일치하는지 여부가 중요하다. 더욱이 대안적 용어(및 개념화)에 대한 인식 없이는 증거 기반에 완전히 관여하는 것이 어려울 수 있다.
  • 두 번째 문제는 의료 교육과정의 QI에서 무엇이 우선시되고 무엇이 이에 영향을 미치는지이다.
  • 셋째, 커리큘럼의 질을 향상시키기 위해 적절한 기준에 따라 커리큘럼을 평가하고 있는가?
  • 넷째, 정렬된 방법을 사용하고 있는가? QI에 대한 우리의 우선 순위와 방법론적 접근 방식이 이해 관계자가 발언할 수 있는 것에 영향을 미치기 때문에 이러한 문제가 중요합니다.
  • 마지막으로, 문헌에서는 커리큘럼 QI에 대한 공유된 소유를 지지한다. 하지만 우리는 어떻게 이것을 육성할 수 있을까요?

이 검토의 나머지 부분은 의료 커리큘럼의 QI를 특징짓는 가정과 실천 중 일부를 탐색하고 커리큘럼 팀에 권고함으로써 이러한 문제를 다룬다.


There are several problems relating to continuous QI of the medical curriculum.

  • Firstly, members of the medical education community use different language to describe QI, depending on their geographical context and/or whether they are embedded in an UG or PG context, or an academic or clinical environment. This matters if the different terminology aligns with conflicting conceptualisations about the nature and purpose of QI. Moreover, without an appreciation of alternative terminologies (and conceptualisations), it may be challenging to engage fully with the evidence base.
  • A second problem is what is prioritised in QI of the medical curriculum and what influences this.
  • Thirdly, in aiming to improve curricular quality, are we evaluating the curriculum against appropriate standards,
  • and—fourthly—using aligned methods? These issues matter, because our priorities and our methodological approach to QI impact which stakeholders have a voice.
  • Finally, the literature advocates shared ownership of curricular QI, but how might we foster this?

The remainder of this review addresses these problems, by exploring some of the assumptions and practices that characterise QI of medical curricula and making recommendations to curriculum teams.

5 QI의 개념화
5 DIFFERENT CONCEPTUALISATIONS OF QI

QI에 대해 이야기할 때 의학 교육계는 '동일한 언어'를 사용하는가? QI의 다른 개념화를 반영하는 만큼 중요한 다른 용어는 서로 다른 맥락에서 사용된다.

  • '질 개선quality improvement'이라는 용어는 [의료 환경]에서 흔히 사용되며, 일부 [교육 환경]에서 사용됩니다.
  • 그러나 다른 교육적 맥락에서 질 향상(quality enhancement, QE)이라는 용어가 대신 사용된다. 이것은 ['개선'이라는 단어에 대한 부정적인 함축]으로부터 벗어나는 움직임을 나타낸다:
    • 윌리엄스는 '[개선improvement]이란 종종 활동을 표준에 도달하는 과정을 가리키는 데 사용되는 반면, [향상enhancement]은 [이미 좋은 기준]을 더 높은 수준으로 끌어올리고, 강화하거나 확대하는 데 사용된다'고 주장한다.

Are we, the medical education community, ‘speaking the same language’ when we talk about QI? Different terminology is used in different contexts, which matters inasmuch as it reflects different conceptualisations of QI.

  • The term ‘quality improvement’ is commonplace in healthcare contexts and used in some educational contexts.
  • However, in other educational contexts the term quality enhancement (QE) is used instead.1920 This represents a move away from negative connotations of the word ‘improvement’:
    • Williams argues that ‘improvement is often used to refer to a process of bringing an activity up to standard whereas enhancement is about raising [an already good standard] to a higher degree, intensifying or magnifying it’.21 

QE 용어는 유럽 무대에서 학부교육과정 맥락에 널리 퍼져 있다. 실제로 네덜란드 단체의 최근 출판물에서 QI는 '지속적인 교육 질 향상'으로 묘사된다. QE는 교육 기관의 '퀄리티 문화'를 개발하는 데 초점을 맞추고 있다. 퀄리티 문화의 개념은 다음을 포함한다.

  • 공유된 가치, 집단적 책임, 제도적 자율성, 투명성, 효과성, 권한 부여를 통한 변혁적 능력

QE terminology is prevalent in undergraduate contexts in the European arena.22 Indeed, in a recent publication by a Dutch group, QI is described as ‘continuous enhancement of educational quality’.23 QE is focused on developing a ‘quality culture’ in the educational organisation.22-24 The concept of quality culture incorporates

  • shared values, collective responsibility, institutional autonomy, transparency, effectiveness and transformative ability through empowerment.22 

QE의 초점은 통제와 규정 준수가 아닌, [개발과 혁신]에 있습니다. [외부 QA]는 교육 기관의 [내부 QE(Quality QE)] 프로세스를 평가하는 데 초점을 맞추고 있으며, 교육 기관의 교육 수준 충족 여부를 판단하는 데 중점을 두고 있습니다. 개별 의료 커리큘럼의 이해 관계자가 QI에 대해 서로 다른 개념화를 가지고 있다면, 이는 과정에 대한 혼란, 박탈감 및 커리큘럼에 대한 의사 결정의 긴장감으로 이어질 수 있다.

The focus in QE is on development and innovation as opposed to control and compliance.24 External QA is focused on evaluation of the education provider's internal QE (QI) processes as opposed to judging whether curricular standards have been met.22 If stakeholders in an individual medical curriculum hold different conceptualisations of QI, this may lead to confusion about the process, feelings of disenfranchisement and tensions in decision making about the curriculum.

QI에 대한 용어가 달라지면 관련 증거 기반과의 참여에도 영향을 미칩니다.

  • '질 개선'을 검색하면 주로 북미 의료 커리큘럼 또는 프로그램의 문헌이 검색되며, 종종 졸업후 교육의 맥락이다.
  • '질 향상'을 검색하면 미국 바깥과 UG 문맥에서 더 많은 문헌을 확인할 수 있다.
  • 또한 '교육과정 평가'는 전통적으로 학문적 맥락에서 QI를 의미하는 데 사용되는 반면,
  • '프로그램(프로그램) 평가'는 북미적 맥락에서 더 일반적일 수 있다. 

The different terminology for QI also impacts engagement with the relevant evidence base.

  • Utilisation of ‘quality improvement’ in literature searches directs the searcher largely towards literature from North American medical curricula or programmes, often in a graduate context.
  • Utilising ‘quality enhancement’ identifies more literature from out-with the United States and from an UG context.
  • In addition, ‘curriculum evaluation’ is traditionally used to mean QI in academic contexts,
  • whereas ‘programme (program) evaluation’ may be more common in North American contexts.25

권장 사항: 교육 과정 팀은 QI의 개념화와 QI 구현 목적에 대한 담론에 참여하고 이를 이해 관계자에게 전달해야 합니다. QI에 대한 증거 기반을 검토할 때, 문헌에 대한 우리의 [검색과 해석]은 [서로 다른 용어와 개념화]를 반영해야 합니다.
Recommendations
: curriculum teams should engage in discourse about their conceptualisation of QI and their purpose in implementing QI and communicate this to stakeholders; and in reviewing the evidence base for QI, our searches for, and interpretation of the literature should reflect different terminologies and conceptualisations.

6 평가해야 할 사항에 대한 우선 순위와 관점
6 PRIORITIES AND PERSPECTIVES ON WHAT SHOULD BE EVALUATED

우리는 무엇을 평가해야 할까요? 커리큘럼의 품질에 대한 판단은 [이해당사자에 의해 평가되고 우선시되는 것]을 반영할 것이다. 이는 결과적으로

  • 사회의 특정 집단(환자, 보호자 및 납세자 포함), 기금 제공자, 규제 기관 및 전문 기관, 전문 분야 또는 교육 원칙에 대한 [책무성]을 반영한다.
  • 또는 그들 자신의 학습과 발전에 대한 [관심]을 반영할 수도 있다. 

What should we evaluate? Judgements about the quality of curricula will reflect what is valued and prioritised by stakeholders. This will in turn reflect their

  • accountability
    • to specific groups in society (including patients, carers and taxpayers),
    • to funders,
    • to regulators and professional bodies,
    • to their specialities or disciplines, or
    • to educational principles;
  • or concern for their own learning and progression.

따라서 평가자는 [커리큘럼의 특정 측면 또는 구성요소]에 대한 품질을 우선시할 수 있다. 예를 들면

  • 공공 및 환자의 참여 정도, 평가 프로그램, 학습을 위한 자원 등

Evaluators may therefore prioritise quality in specific aspects or components of the curriculum,

  • such as the degree of public and patient involvement,26 the programme of assessment27 or resources for learning.

이해당사자들은 또한 [교육과정이 무엇이어야 하는지]에 대해 다른 관점을 가질 수 있다. 커리큘럼 이론은 커리큘럼의 기본 목적에 따라 커리큘럼 설계에 대한 다양한 접근 방식을 알려준다.

  • 내용으로서의 교육과정(또는 syllabus),
  • 제품으로서의 교육과정,
  • 과정으로서의 교육과정
  • 실천으로서의 교육과정. 

Stakeholders may also have different perspectives on what a curriculum should be. Curriculum theory informs different approaches to curriculum design, based on the underlying purpose of the curriculum:

  • curriculum-as-content (or -syllabus),
  • curriculum-as-product,
  • curriculum-as-process and
  • curriculum-as-praxis.28 

 

  • [내용으로서의 교육과정 관점]은,교사 중심이며, 교육과정을 학습된 과목으로 본다. 
  • [제품으로서의 커리큘럼 관점]은, 랄프 타일러(Ralph Tyler)에서 유래하며, 커리큘럼이 무엇을 생산하고자 하는지에 초점을 맞춘다. 의학 교육에서 이것은 효과적인 의사가 될 것이다. 이러한 관점은 거의 틀림없이 성과 또는 역량 기반 의료 커리큘럼과 가장 밀접하게 일치한다.
  • [과정으로서의 교육과정 관점]은, Stenhouse에서 유래하며, 학습과 상호작용의 기회를 포함하여 교육과정 중 학습 과정에 관한 것이다. 그것은 학습자 개발에 초점을 맞추고 따라서 학습자 중심이다
  • The curriculum-as-content perspective is teacher-centric and sees curriculum as the taught subject matter.
  • The curriculum-as-product perspective, attributed to Ralph Tyler,29 focuses on what the curriculum aims to produce. In medical education this will be effective doctors. This perspective arguably aligns most closely with the outcomes- or competency-based medical curriculum.30 
  • The curriculum-as-process perspective, attributed to Stenhouse,31 is concerned with the learning process during the curriculum, including opportunities for learning and interaction. It focuses on learner development and is therefore learner-centred.32 

현대의학 커리큘럼은 효과적인 의사의 '제품'을 목표로 할 수도 있지만, 그들은 또한 학습 과정에 관심을 가지고 있으며, 그들의 의사들이 자기 주도적이고, 자기 통제적이며, 성찰적인 의사로 발전하기를 바란다. 여기에 커리큘럼의 질을 평가하는 데 파급력을 가지는 [긴장이 존재]한다. 이해당사자들이 커리큘럼의 목적에 대해 다른 관점을 가질 수 있기 때문이다. 또한 의료 커리큘럼이 [여러 표준 세트(예: 교육 및 전문 규제 기관)]를 충족해야 하는 경우, 특정 우선순위 또는 커리큘럼 철학이 다른 표준 세트보다 한 세트의 표준과 더 잘 일치할 수 있다. 영국에서, 학부의학교육에 있어서 이해관계자 우선 순위가 서로 다른 예는

  • [환자 안전에 대한 궁극적인 초점]이 [고부담 의사 면허 시험으로의 이행]을 주도했다는 것이다.
  • 반면, [고등교육의 일반적인 움직임]은 지속 가능한 평가를 향하고 있다(자기평가, 동료평가, 성찰, 포트폴리오 및 학습 활동 내 임베딩 평가를 포함하여 평생 학습을 용이하게 하는 평가).

Modern medical curricula may aim for the ‘product’ of an effective doctor, but they are also concerned with the process of learning, wanting their doctors to develop into self-directed, self-regulated, reflective practitioners. Herein lie tensions that can spill over into evaluating the quality of the curriculum, if stakeholders have different perspectives on the purpose of the curriculum. Also, where a medical curriculum must meet multiple sets of standards (e.g. those of educational and professional regulators), specific priorities or curriculum philosophies may align better with one set of standards than the other. An example of differing stakeholder priorities impacting UG medicine in the United Kingdom is that

  • an ultimate focus on patient safety has driven the implementation of a high-stakes medical licensing assessment33;
  • whereas the general move in higher education is towards sustainable assessment (that which facilitates life-long-learning, including self-assessment, peer- assessment, reflection, portfolios and embedding assessment within the learning activities).3435

[실천으로서의 교육과정 관점]에서는 '가치 있는' 것이 무엇이며, 이를 개선하기 위해 교육과정 내에서 변화가 필요한지에 초점을 맞추고 있다. 이는 다음에 부합한다.

  • [환자 중심의 의학교육]을 강조하는 것,
  • [교육과정의 포용성]을 강조하는 것,
  • [잠재 교육과정(교육경험의 일부이지만 정식 교육과정의 일부가 아닌 학습, 잠재적으로 후자와 상충되는 학습)에 의해 훼손되지 않은 것]을 강조하는 것

From the curriculum-as-praxis perspective, attributed to Grundy, there is a focus on what is ‘valuable’, and changes needed to enhance this within the curriculum.28 This is consistent

  • with a patient-centred focus in medical education,
  • with ensuring that the curriculum is inclusive, and
  • with ensuring it is not undermined by the hidden curriculum (learning that is part of the educational experience but not part of the formal curriculum, and potentially conflicting with the latter).

교육 과정의 질을 판단하는 사람들이 무엇을 중시하고 우선시하는가에 따라, 이해 당사자들은 교육 과정이 중심이 되어야 하는 곳(예: 학습자 또는 환자)에 대해 합법적으로 다른 관점을 가질 수 있다. Damodaran은 [학습자 중심성]의 개념이 의료교육에서 지나치게 우세해졌으며, 의료교육의 '최적 중심성optimal centeredness'은 의료교육의 다양한 단계마다 정당한 이유로 달라질 수 있다고 주장한다. 

Depending on what is valued and prioritised by those who judge curricular quality, and their conceptualisation of curriculum, stakeholders may legitimately hold different perspectives on where the curriculum should be centred (e.g. on the learner or the patient). Damodaran suggests the concept of learner-centredness has become overly dominant in medical education and that the ‘optimal centredness’ of the medical curriculum may legitimately vary at different phases of medical education.36

권장 사항: 커리큘럼 팀은 커리큘럼에서 무엇이 가치 있는지, 그 [목적 및 중심성]에 대해 논의할 기회를 만들어야 합니다. 커리큘럼의 통합 평가에서 특정 우선순위나 관점이 데이터 수집의 특정 에피소드를 형성할 수 있지만, 여러 출처의 데이터를 통합하고 반영해야 하는 커리큘럼 팀의 감독이 있어야 한다.
Recommendations
: curriculum teams should create opportunities for discussion about what is valued in the curriculum, its purpose and its centredness. In an integrated evaluation of the curriculum,23 although specific priorities or perspectives may shape a particular episode of data collection, there should be oversight by the curriculum team, who should synthesise and reflect on data from multiple sources.

7 품질기준에 대한  고려사항
7 CONSIDERATIONS ABOUT QUALITY STANDARDS

[퀄리티 지표]에는 커리큘럼 학습 목표, 학습 결과 및/또는 역량 제공이 포함된다. 이는 모든 이해관계자에게 커리큘럼에 포함되어야 하는 것을 명시하고 커리큘럼(및 이해관계자)이 판단될 수 있는 기준을 제공하기 때문이다. '학습 목표'와 '학습 결과'라는 용어는 때때로 상호 교환적으로 사용됩니다.

  • 그러나 [학습 성과]는 의도적으로 [학습자 중심적]이며, 학습자가 관련 지식, 기술 및 태도의 성취를 어떻게 보여줄 수 있는지를 명시하고, [학습의 폭과 깊이]에 대한 가이드를 제공합니다.
    • 예를 들어, '자원의 사용과 우선 순위를 지속적으로 개선하는 방법을 모색하는 것을 포함하여 실무(예: 계획, 실행, 연구, 행동 또는 행동 연구)를 개선하기 위한 품질 개선 원칙과 방법을 제시한다.' 
  • 대신, [학습 목표]는 [학습해야 할 자료]를 강조하지만, 종종 학습의 폭이나 깊이를 나타내지 않는다.
    • 예를 들어, '품질 개선의 원칙과 방법을 이해한다'. 
  • [역량]은 [특정 수준의 성과에 대한 성과를 특정 표준에 따라 명시]한다
    • 예를 들어, '질적 개선의 과학을 환자 치료 시스템 개선에 기여하기 위해 적용'한다. 

An indicator of quality includes the provision of curricular learning objectives, learning outcomes and/or competencies,37 because these specify to all stakeholders what should be included in the curriculum and provide standards against which the curriculum (and stakeholders) may be judged. The terms ‘learning objectives’ and ‘learning outcomes’ are sometimes used interchangeably.

  • However, learning outcomes are intentionally learner-centric, specifying how the learner will be able to demonstrate achievement of relevant knowledge, skills and attitudes, providing a guide as to breadth and depth of learning:
    • for example, ‘apply the principles and methods of quality improvement to improve practice (for example, plan, do, study, act or action research), including seeking ways to continually improve the use and prioritisation of resources’.38 
  • Instead, learning objectives emphasise the material to be learned, but often without indication of breadth or depth of learning;
    • for example, ‘understand the principles and methods of quality improvement’.39 
  • Competencies specify achievement at a particular level of performance, according to specific standards;
    • for example, ‘apply the science of quality improvement to contribute to improving systems of patient care’.40

현대의학 커리큘럼은 일반적으로 결과 기반 또는 역량 기반이라고 설명한다.30 QI는 다음에 초점을 맞출 수 있습니다

  • 성과 또는 역량이 적절한지 
  • 학습 활동과 학습 환경이 학습자가 성과 또는 역량에 부합할 수 있도록 하는지
  • 평가 시스템이 학교, 대학 또는 기타 기관이 학습자가 지정된 성과 또는 역량의 달성정도를 결정할 수 있도록 하는지

Modern medical curricula generally describe themselves as outcome-based or competency-based.30 QI might focus on ensuring

  • that the outcomes or competencies are appropriate;
  • that learning activities and the learning environment will allow learners to meet the outcomes or competencies; and
  • that assessment systems will allow schools, colleges or other institutions to determine the extent to which learners have achieved the specified outcomes or competencies.

[한 가지 긴장]은 규제 기관이 발표한 결과/역량이 종종 광범위하여, 지역적 해석을 위한 상당한 여지를 남겨둔다는 것이다. 이는 가용 자원과 기타 상황별 문제를 고려할 수 있는 커리큘럼 팀에게 유연성을 제공하지만, 의료 커리큘럼의 퀄리티의 차이가 커지는 원인 중 하나일 것으로 추정된다. [또 다른 긴장]은 의료 교육과정이 다른 기준들을 준수해야 할 수도 있다는 것이다. 예를 들어, 영국에서 UG 의료 커리큘럼은

  • 위임된 국가 정부 및/또는 고등 교육 부문의 규제 기관(the Office for Students in England)이 정한 표준뿐만 아니라
  • 전문 규제 기관이 정한 표준(Outcomes for Graduates specified by the GMC)에도 부합해야 한다.

이들 각 기관은 UG(의료) 커리큘럼의 목적에 대해 서로 다른 견해를 가지고 있을 가능성이 높으며, 과제는 [완전히 호환되지 않을 수 있는 서로 다른 표준 세트]를 충족하는 의료 커리큘럼을 제공하는 것이다.
One tension is that outcomes/competencies published by regulators are often necessarily broad, leaving considerable room for local interpretation. Although this affords flexibility to curriculum teams, who can take into consideration available resources and other contextual issues, it presumably is one source of varying quality in medical curricula. A further tension is that a medical curriculum may need to conform to different sets of standards. For example, in the United Kingdom, the UG medical curriculum must conform

  • not only to standards set by the devolved national governments and/or regulators of the higher education sector (e.g. the Office for Students in England, https://www.officeforstudents.org.uk/)
  • but also to standards set by the professional regulator (Outcomes for Graduates specified by the GMC38).

These respective organisations likely hold different views on the purpose of an UG (medical) curriculum, and the challenge is to provide a medical curriculum that meets different sets of standards, which may not be fully compatible.

[세 번째 긴장]은 [지역적으로 해석]될 수는 있지만, [모든 맥락에서 최소한의 숙련도를 보장하는 퀄리티 표준]의 필요성 사이에 존재한다. 일부 국가는 다른 맥락에서 표준을 그대로 채택하거나 변형하여 채택했다. 예를 들어, [대만 의학 인증 위원회(TMAC)]는 미국과 캐나다의 의대를 인증하는 의학 교육 연락 위원회(LCME)의 표준을 기반으로 2013년 표준을 개발했습니다. 다른 의료 교육 맥락에서 표준을 가져오는 것은 지역 문화 또는 해당 인구의 필요성 또는 우선순위를 충분히 고려하지 않을 수 있다. [장기적인 WFME 프로젝트]는 의료 교육의 다양한 단계에 대한 Global Standards for Quality Improvement of Medical Education 을 정의하는 것이었다. 이 기관의 웹사이트에는 각 단계의 권장 표준에 대한 링크가 있으며, 가장 최근의 것은 기초 의학 교육 표준의 2020년 버전이다. 그러나 QI에 대한 WFME 표준의 실제 적용에 대한 경험적 연구의 체계적인 검토에서, 저자들은 이러한 표준이 '서구적' 맥락을 지향하고 있을 수 있으며, WFME에서도 [지역적 맥락에 맞게 가이드를 조정하여 사용]할 것을 권장한다는 것을 인정했다.

A third tension exists between the need for quality standards that can be interpreted locally yet ensure a minimal proficiency across all contexts. Some countries have adopted or adapted standards from other contexts; for example, the Taiwan Medical Accreditation Council (TMAC) developed their 2013 standards based on those of the Liaison Committee of Medical Education (LCME), 41 which accredits medical schools in the United States and Canada. Importing standards from another medical education context may not sufficiently take account of local culture or the needs or priorities of that population. A long-term WFME project has been to define Global Standards for Quality Improvement of Medical Education for various phases of medical education. The organisation's website (https://wfme.org/standards/) has links to the recommended standards for each phase, the most recent of which is a 2020 version of the standards for basic medical education.42 However, in a systematic review of empirical research into the practical application of the WFME standards for QI,43 the authors acknowledged that these standards may be oriented towards ‘western’ contexts and that the WFME itself recommends they be used as a guide, adapted for local contexts.

최근 이 분야에 추가된 것은 [유럽 의학 교육 협회(AMEE)가 제공하는 ASPIRE 상의 기준]과 같이 전문 회원 협회가 정한 품질 표준이다. 이러한 상은 [품질을 인정하는 것]의 동의어인 '우수성 인정'을 목적으로 한다.
More recent additions to the field are quality standards set by professional membership associations, such as the criteria for ASPIRE awards offered by the Association for Medical Education in Europe (AMEE). These awards aim to ‘recognise excellence’ (https://www.aspire-to-excellence.org/), which is a synonym for recognising quality.

권장 사항: 커리큘럼 팀은 적절한 기준에 따라 커리큘럼을 평가해야 합니다. 의료 커리큘럼이 여러 표준 세트를 준수하는 경우, 커리큘럼 팀은 평가 활동에 어떤 표준을 사용하고 있는지 명시하고 적절한 조치가 사용되는지 확인해야 한다.
Recommendations
: curriculum teams must evaluate curricula against appropriate standards. Where medical curricula conform to multiple sets of standards, curriculum teams should be explicit about which standards are being used in any evaluation activity and ensure that appropriate measures are used.

8 QI에서의 방법론: 방법, 모델, 이론
8 METHODOLOGY IN QI: METHODS, MODELS, THEORY

[QI에 대한 적절한 방법론]에 대한 관점은 커리큘럼 팀이 QI를 [외부 QA를 위한 '드라이 런']으로 보는지, 아니면 [퀄리티 문화를 보장하는 수단]으로 보는지에 따라 영향을 받을 수 있습니다. 구체적인 쟁점으로는 학습자 조사의 우위성, 윤리적 평가, 의료 교육과정의 평가가 모델이나 이론의 적용에 의해 지시되는 범위 등이 있다.

Perspectives about appropriate methodology for QI will likely be influenced by whether curriculum teams see QI as a ‘dry run’ for external QA or as means of ensuring a quality culture. Specific issues include the dominance of learner surveys, ethical evaluation, and the extent to which the evaluation of medical curricula is directed by application of models or theories.

8.1 평가방법
8.1 Methods for evaluation

현대 학습자 중심 커리큘럼에서, [지속적인 QI]는 종종 기관 또는 국가 설문 조사를 사용하여 학습자 경험에 대한 정기적인 평가와 어느 정도 동의어가 되었다. 고등교육 분야에서는 [시장화 증가, 정부의 조사 데이터 사용, 그리고 학생들의 '소비자적 태도']가 조사 결과에 대한 '집착'으로 이어졌다. 전문 규제 기관은 학술 의학과의 긴밀한 관계를 가지며, 의료 교육의 연속성에 큰 영향을 미치는 전문 협회(예: AMEE)는 학계에 뿌리를 두고 있으므로, 학습자 설문조사의 사용이 의료 교육의 PG 및 CPD 단계로 확장되었다는 것은 놀라운 일이 아니다. 학습자 조사의 예로는 영국의 전국 학생 조사(NSS)가 있다. 
그리고 GMC의 PG 의료 훈련생과 트레이너를 위한 국가 훈련 조사(NTS)도 있다. 

In modern learner-centred curricula, continuous QI has become to some extent synonymous with regular evaluation of the learner experience, often using institutional or national surveys. In the higher education sector, increased marketisation, government use of survey data and possibly ‘consumerist attitudes’ of students have led to an ‘obsession’ with survey results.44 Professional regulators have close links with academic medicine, and professional associations with a major influence on the continuum of medical education (e.g. AMEE) have their roots in academia, so it is unsurprising that the use of learner surveys has extended into PG and CPD phases of medical education. Examples of learner surveys include the National Student Survey (NSS) in the United Kingdom, administered to all undergraduates in the final year of their studies45; and the GMC's National Training Survey (NTS) for PG medical trainees and trainers.46 

규제 기구는 (주제 영역, 분야 또는 전문성, 심지어 기관 간 비교를 허용하는 일반적인 Likert 유형 진술이 수반된) 정량적 도구를 선호할 수 있다. 그러나 이러한 진술은 이해관계자가 자신의 맥락에서 [해석하기 어렵거나], 학습자, 커리큘럼 팀 또는 기타 이해관계자에게 [가장 흥미롭고 중요한 문제를 다루지 않을 수] 있다. 아마도 이것이 네덜란드의 감사 조사 연구에서 교육 지도자들이 '내러티브한, 적시 피드백'에 대한 선호를 표명한 이유일 것이다. 후자는 코스/프로그램이 실행되는 동안 학습자가 커리큘럼 팀으로 보내는 피드백입니다. 잠재적으로, 그러한 평가는 학습자가 그들의 피드백에 대응하여 시행되고 있는 소규모 또는 예비적인 변화라도 볼 수 있다면 '루프 폐쇄'에 도움이 된다.

Regulators may favour such quantitative instruments, with generic Likert-type statements that allow for comparisons across subject areas, disciplines or specialities, even institutions, but such statements may be difficult for stakeholders to interpret in their context or may not address issues of greatest interest or importance to learners, curriculum teams or other stakeholders. Perhaps this is why educational leaders in a Dutch appreciative inquiry study expressed a preference for ‘narrative and just-in-time feedback’.24 The latter is feedback from learners to curriculum teams whilst the course/programme is running; potentially, such evaluation helps to ‘close the loop’ if learners can see even small-scale or preliminary changes being implemented in response to their feedback.

학습자 설문조사에서, [좋은 응답률을 달성하기 위한 방법론적 요구 사항]과 [윤리적 고려 사항] 사이에 긴장이 존재한다. UKUG의 맥락에서, 기관 KPI에는 NSS를 완료하는 특정 학과의 학생 비율이 들어있다. UG 학생 참여가 의무화될 수 없기 때문에, 학생들의 반응을 장려하고 교수진이 설문 조사를 촉진하도록 장려하는 것이 실제 상황이다. 아이러니하게도 [윤리적 교육 연구]에서는 인센티브를 주는 것이 권장되지 않음에도, NSS 설문조사 완료를 위해서 인센티브가 제공되기도 한다. 실용적인 차원에서, '피드백을 쫓는 것'은 학생들의 경험을 향상시키는데 직접적으로 도움이 될 수 있는 활동으로부터 시간이 걸린다. 영국의 PG 의료 훈련생과 트레이너의 경우, GMC의 온라인 가이드에는 '누가 이 설문을 작성해야 하는가?'이라는 제목의 섹션이 있기 때문에, NTS 완료에 대한 기대를 명확히 한다. 그럼에도 불구하고, 2021년에 32%, 2022년에 34%의 트레이너만이 응답했기 때문에 적어도 트레이너들에게 낮은 응답률은 여전히 문제로 남아 있다. 2021년 데이터 수집 당시 진행 중인 팬데믹과 비코로나 사례에 대한 후속 '캐치업'을 고려할 때 이는 놀라운 일이 아닐 수 있지만, 비응답 편향은 우려해야 한다.
With learner surveys, a tension exists between the methodological requirement to achieve good response rates, and ethical considerations. In the UK UG context, institutional key performance indicators include the percentage of students in a specific discipline that complete the NSS. Because UG student participation cannot be mandated, there is a veritable industry around encouraging students to respond and encouraging faculty to promote the surveys. It seems ironic that incentives are discouraged in ethical education research47 but sometimes offered for completion of the NSS survey. On a practical level, ‘chasing feedback’ takes time from activities that could directly feed into enhancing the student experience. For PG medical trainees and trainers in the United Kingdom, the language in the GMC's online guide to completion of the NTS makes expectations clear, because there is a section entitled ‘Who needs [my emphasis] to complete the survey?’.48 Nonetheless, low response rates remain an issue, at least for trainers, because just 32% of trainers responded in 2021 and 34% in 2022.49, 50 This may not be surprising, given the ongoing pandemic at the time of 2021 data collection, and the subsequent ‘catch-up’ on non-Covid cases, but non-response bias must be of concern.

학습자 설문조사가 여전히 지배적이지만, 점점 더 많은 자유 서술형 응답을 요구하는데, 이는 만족도 점수보다 커리큘럼 팀에 더 도움이 될 수 있다. 그러나 [이해당사자의 인식]을 진정으로 이해하고, 퀄리티를 높이기 위해서는, 커리큘럼 팀은 다음을 해야 한다.

  • 학습자에게 더 매력적일 수 있는 추가 형태의 데이터 수집을 활용한다.
  • 문제를 더 깊이 탐구할 수 있도록 허용한다.
  • 학습자에 대한 적시 응답을 촉진한다.
  • 다른 이해관계자에게 발언권을 준다.

또한, 커리큘럼 품질에 대한 '전체적인 개요'를 제공하기 위해 '다양한 도구와 절차의 삼각 측량'이 권장된다.
Although learner surveys still hold sway, they increasingly ask for free text responses, which can be more helpful to curriculum teams than per cent satisfaction scores. However, to genuinely understand stakeholder perceptions and enhance quality, curriculum teams should

  • utilise additional forms of data collection, which may be more engaging for learners,
  • allow for a deeper exploration of issues,
  • facilitate just-in-time responses to learners, and/or
  • give other stakeholders a voice.

Moreover, ‘triangulation of different instruments and procedures’ is advocated, to give ‘a holistic overview’ of curriculum quality.23

8.2 평가 모델
8.2 Evaluation models

[커리큘럼 평가 모델]의 적용은 [지속적인 QI]를 위하여 [데이터 수집, 방향성 제공, 매개 변수 정의, 체계적인 접근 촉진, '부분들의 관계' 지정 등]을 가이드할 수 있다. Coles와 Grant는 다음의 데이터를 삼각측량해야 하는 모델을 제안했다. 

  • 의도된 커리큘럼('서류상' 커리큘럼),
  • 전달된 커리큘럼('실행 된')
  • 경험된 커리큘럼

Application of a curriculum evaluation model may guide the collection of data for continuous QI, providing direction, defining parameters, facilitating a systematic approach, and specifying ‘a relationship of parts’.51 Coles and Grant proposed a model requiring triangulation of data from

  • the intended curriculum (the curriculum ‘on paper’),
  • the delivered curriculum (‘in action’) and
  • the curriculum experienced.25 

이것은 지역 사회 기반 의료 커리큘럼의 평가에 사용되어 왔다. 앤더슨 외 연구진은 커리큘럼에서 서로 다른 이해당사자들의 복잡성을 인식하기 위해 두 가지 모델을 사용하여 전문가 간 커리큘럼을 평가했다.

  • Biggs의 3P 모델([기존 요인], [교습 및 학습] 프로세스 및 [교습 및 학습] 제품]을 제시) 및 
  • 커크패트릭의 레벨(학습자 반응, 학습자 성과, 학습자 행동, 학습자 영향 [임상 결과]). 

Moreau56은 신세계 커크패트릭 모델에 의해 제공되는 가능성을 강조하지만 커크패트릭의 유형학은 고등 및 의학 교육 문헌에서 비판을 받아왔다. 

This has been used in evaluation of a community-based medical curriculum.52 In a bid to recognise the complexity of different stakeholders in the curriculum, Anderson et al.53 evaluated an interprofessional curriculum by drawing on two models:

  • Biggs' 3P Model (presage [pre-existing factors], process [of teaching and learning], and product [of teaching and learning]),54 and
  • Kirkpatrick's levels55 (learner reaction, learner performance, learner behaviour, learner impact [clinical outcomes]).

Kirkpatrick's typology has been criticised in the higher and medical education literature, although Moreau56 highlights the possibilities afforded by the New World Kirkpatrick Model.57

Stufflebeam은 '목표 지향, 테스트… 실험 설계'와 '책임성'에 대한 대안으로서 의사 결정과 개선을 지향하는 CIPP 평가 모델을 개발했습니다. CIPP는 4가지 다른 평가 초점을 나타내는 컨텍스트 입력 프로세스 제품을 나타냅니다. CIPP를 커리큘럼 평가에 적용하면

  • [상황 평가]니즈, 문제 및 개선 기회를 식별하기 위해 커리큘럼의 한 측면에 대한 데이터 수집과 같다. 
  • [투입 평가]가능한 해결책(예: 문헌, 전문가 및 혁신적 아이디어)을 탐색한다. 
  • 그리고 가능한 '해결 전략'의 구현은 각각 전략의 지속적인 구현과 전략 구현의 결과에 초점을 맞춘 [프로세스 평가와 산출 평가]로 이어질 것이다.

Stufflebeam은 '무엇을 해야 하는가'를 결정하는 것으로 그의 모델을 요약한다. 어떻게 해야 할까요? 지금 하고 있는 거야? 성공하고 있는가?' CIPP 모델은 널리 적용되었다. 예를 들어, 간호 커리큘럼의 한 측면(즉, 말기 의료에 대한 교육)과 관련 솔루션(교원 개입)을 평가하도록 조정되었다. 한편, 의료교육에서 사회적 책임성을 평가하기 위한 전주곡으로 사회적 책임 프레임워크를 분석하는 데 사용되어 왔다. 
As an alternative to models ‘oriented to objectives, testing … experimental design’ and ‘accountability’, Stufflebeam developed the CIPP evaluation model, oriented towards decision making and improvement.58 CIPP denotes context-input-process-product, representing four different foci of evaluation. Applying CIPP to curriculum evaluation,

  • context evaluations would equate to data collection on (an aspect of) the curriculum, to discern needs, problems and opportunities for improvement;
  • input evaluation would search for possible solutions (e.g. from the literature, experts and innovative ideas); and
  • implementation of a possible ‘solution strategy’ would lead to process and product evaluations, respectively focused on ongoing implementation of the strategy, and the outcomes of implementing the strategy.

Elsewhere Stufflebeam summarises his model as determining ‘What needs to be done? How should it be done? Is it being done? Is it succeeding?’.59 The CIPP model has been applied widely. For example, it was adapted to evaluate one aspect of a nursing curriculum (i.e. education on end-of-life care) and a relevant solution (teaching intervention)60; on the other hand, it has been used to analyse social accountability frameworks as a prelude to evaluating social accountability in medical education.61

8.3 이론에 근거한 평가
8.3 Theory-informed evaluation

[특정 이론]과 일치하는 평가 모델을 활용하여 지속적인 QI에 대한 이론 정보 접근 방식을 통해 의료 커리큘럼의 품질에 대한 더 큰 이해와 임베딩을 달성할 수 있다. 예를 들어,

  • Coles와 Grant의 모델은 [커리큘럼 이론]의 기초를 가지고 있다. 
  • [퀄리티 문화 이론]의 적용은 무엇이 품질 문화에 기여하는지에 대한 교육 지도자들의 관점에 대한 감사한 조사를 안내했다.
  • Anderson 등은 Biggs의 3P 모델과 Kirkpatrick의 수준을 사용한 것이 [복잡성 이론]과 일치한다고 가정했다.
  • Jorm과 Roberts는 기존 모델이 선형이고 의학 학습자의 고유한 경험을 포착하지 못한다는 것을 기반으로 새로운 평가 모델을 개발하기 위해 복잡도 이론을 사용할 것을 지지했다. [복잡성 이론]이 알려주는 평가 원칙에는 '집단적 감각 형성'과 다중 방법 참여 데이터 수집, '대학, 보건 시스템, 사회'의 영향 고려, 장기 및 임상 결과 측정 등이 있다. 

Greater understanding about, and embedding of, quality in medical curricula may be achieved through a theory-informed approach to continuous QI, utilising evaluation models aligned with specific theories.53 For example,

  • Coles and Grant's model has its foundations in Curriculum Theory2528;
  • whilst application of the Quality Culture Theory guided appreciative enquiry into educational leaders' perspectives of what contributes to a quality culture.24 
  • Anderson et al. posited that their use of Biggs' 3P model and Kirkpatrick's levels was consistent with Complexity Theory.53 
  • Jorm and Roberts have advocated using Complexity Theory to develop new evaluation models, on the basis that existing models are linear and fail to capture the unique experiences of medical learners.62 Principles for evaluation informed by Complexity Theory include
    • ‘collective sensemaking’,
    • multi-method participatory data collection,
    • taking account of influences from the ‘university, health system, society’, and
    • measurement of long-term and clinical outcomes.62

권고사항: 의료 교육 연구의 방법론적 교훈을 적용하고, 커리큘럼 팀은 데이터 수집 방법을 특정 평가 질문/초점에 맞춰야 align 한다. [여러 다른 이해관계자]로부터 데이터를 수집하기 위해 [여러 가지 방법]을 사용한다. 적절한 [평가 모델과 이론]을 사용하여 평가를 안내하고 조직합니다.

Recommendations: applying methodological lessons from medical education research, curriculum teams should align data collection methods to specific evaluation questions/foci; use multiple methods for data collection, from different stakeholders; and use appropriate evaluation models and theory to guide and organise evaluation.

9 지속적인 QI의 소유 및 참여
9 OWNERSHIP OF AND ENGAGEMENT WITH CONTINUOUS QI

양질의 커리큘럼을 보장하기 위한 [제도적 접근방식]은 이전 국가 학습자 설문조사의 결과에 대응하거나, 다음 국가 학습자 설문조사가 시행되기 전에 문제를 예측하기 위한 내부 설문조사를 설계하고 구현하는 데 초점을 맞출 수 있다. 기관은 분야 또는 전문 분야에 걸쳐 광범위한 관심사를 해결하기 위해 개입과 정책을 제정할 수 있다. 이해관계자 평가에 대한 이러한 '탑-다운'식의 일반적 응답은 QI의 소유권을 주요 이해관계자로부터 빼앗습니다. 형성적, 발달적 평가를 강조하고 QI와의 참여를 장려함으로써, 우리는 퀄리티 문화를 육성하고, 의료 교육과정의 질에 대한 주인의식을 높일 수 있을 것이다. 하지만 어떻게요?
Institutional approaches to ensuring quality curricula may focus on responding to outcomes from previous national learner surveys, or on designing and implementing in-house surveys to anticipate issues before the next national learner survey is administered. Institutions may enact interventions and policies to address issues of broad concern across disciplines or specialties. This ‘top-down’ generic response to stakeholder evaluation takes ownership of QI away from key stakeholders.23 By emphasising formative, developmental evaluation and encouraging engagement with QI, we may foster a quality culture and increase the sense of ownership in the quality of the medical curriculum.23 But how?


[학습자]에 대해서 지속적인 QI의 [적극적인 참여자로서의 가치]를 옹호하고 입증하는 문헌이 증가하고 있다. 단순히 설문 응답자로서가 아니라 설계, 데이터 수집 및 평가 해석에 적극적으로 참여하는 것이다. 클레멘틱은 학생들이 학습, 교육, 평가, 환경에 대한 직접적인 경험을 통해 QI와 관련된 자본을 가지고 있다고 주장한다. 학생은 다음과 같은 것을 통해 [지속적 QI]에 크게 기여할 수 있다. 63 

  • 경험에 대한 데이터를 제공
  • 거버넌스 구조에 참여
  • 양질의 교육을 위한 직접적인 옹호자 역할

There is a growing body of literature advocating and demonstrating the value of learners as active participants in continuous QI; not simply as survey respondents, but in the design, data collection and interpretation of evaluations. Klemencic argues that students possess capital relevant to QI, through their direct experience of learning, teaching, assessment and environment.63 

  • By providing data on their experiences, but also
  • by participating in governance structures, and
  • by acting as direct advocates for a quality education,

...they can contribute significantly to continuous QI.63 

기관 차원에서는 교육을 받은 학생 구성원이 QI 데이터를 생성하고 분석할 수 있는 [학생 평가 위원회]를 설립하여 거버넌스 구조에 대한 학생 참여를 촉진할 수 있습니다. 교수진은 성인 학습 이론, 교수 및 학습 전략, 피드백에 대한 모범 사례에 대한 지식을 공유하면서 멘토와 파트너 역할을 할 수 있습니다. 하버드 의대에서는 QI에 대한 학생 참여가 확대되어 학생 워킹그룹이 '교육과정의 다양성 제고'와 같은 정책 이슈나 우선순위를 다루는 프로젝트를 수행하게 되었다. Fetterman 등은 [권한 부여 평가 이론]을 적용하여 의대생, 교수진 및 관리자를 커리큘럼 평가에 협력자로 참여시켰다. 주요 특징으로는 '증거 문화 개발'과 '학습자 커뮤니티 구축'이 있으며, 여기서 '학습자'라는 표현은 교직원과 행정관에게도 적용된다.

Institutions can facilitate student participation in governance structures by establishing student evaluation committees whose members, with relevant training, can generate and analyse QI data.64 Faculty can act as mentors and partners, sharing knowledge about adult learning theories, teaching and learning strategies, and best practice in feedback.65 At Harvard Medical School, student participation in QI has been extended such that student working groups undertake projects to address policy issues or priorities such as ‘enhancing diversity in the curriculum’.65 Fetterman et al. applied the theory of Empowerment Evaluation to involve medical students, faculty and administrators as collaborators in curriculum evaluation: key features included ‘developing a culture of evidence’ and ‘cultivating a community of learners’, where ‘learners’ also applied to faculty and administrators.66

[지속적 QI]는 (커리큘럼 팀의 감독 및 통합에 의해) 전체적이어야holistic 하지만, [개별 이해관계자 수준]에서 [기여적 QI 활동 또는 프로젝트]를 목표로 할 수 있습니다. 그 대상으로는,

  • 특정 이해관계자 그룹의 요구를 식별하는 것(CIPP 모델의 상황) 
  • 혁신적인 솔루션을 식별하는 것(입력), 
  • 그런 다음 테스트 및 평가를 수행하는 것(프로세스 및 제품)

[교수 및 학습의 장학활동(SoTL)]에 대한 현재의 관심은 지속적인 QI에 교수진을 참여시킬 수 있는 기회를 제공한다. SOTL는 '탐구 결과를 공개함으로써 교수 관행을 발전시키는 학생 학습에 대한 체계적인 탐구'로 묘사되어 왔다. 그러나 SOTL 조사는 CIPP 모델별로 하나 또는 다른 평가 초점에 적합할 수 있다.
Although continuous QI should be holistic, with oversight and integration from the curriculum team,23 at the level of individual stakeholders, contributory QI activities or projects could be targeted towards

  • identifying needs of a specific stakeholder group (‘context’ in the CIPP model58),
  • identifying an innovative solution (input),
  • then piloting and evaluating it (process and product).

Current interest in scholarship of teaching and learning (SoTL) presents an opportunity to engage faculty in continuous QI.67 SoTL has been described as ‘systematic inquiry into student learning which advances the practice of teaching by making inquiry findings public’,68 but SoTL inquiry could also be well-suited to one or other foci of evaluation, per the CIPP model.58

보다 일반적으로, 퀄리티에 대한 [사전 예방적 임베딩]은 커리큘럼 구성 요소나 자원을 개발하는 데 있어 목표가 되어야 한다. 예를 들어, Huser 등은 [교육과정의 공동창조 개념]을 적용하여 의대생들에게 교육과정을 위한 온라인 자원을 생산하도록 멘토링하였으며, 온라인 자료의 품질에 대한 틀을 적용하는 것이 중요하다고 강조했다.
More generally, proactive embedding of quality should be a target in developing any curricular component or resource. For example, applying the concept of co-creation of the curriculum,23, 69 Huser et al. mentored medical students to produce online resources for the curriculum,70 stressing the importance of applying a framework for quality in online materials.71

권장 사항: 커리큘럼 팀은 감독 및 통합을 제공해야 하지만, 개별 QI 활동과 (예: SoTL) 프로젝트가 전체 QI에 데이터를 기여하도록 장려해야 합니다. 품질은 커리큘럼 구성 요소/리소스를 개발할 때 품질 프레임워크를 적용하여 사전적proactively으로 포함시켜야 한다.
Recommendations
: curriculum teams should provide oversight and integration, but encourage individual QI activities and (e.g. SoTL) projects to contribute data to holistic QI. Quality should be embedded proactively, by applying quality frameworks when developing curricular components/resources.

10 결론
10 CONCLUSIONS

특정 커리큘럼 맥락에서 [지속적 QI에 대한 투명성과 공유된 이해]를 달성하기 위해서는 담론이 필요하다. [지속적 QI]를 위해서는 다음이 필요하다. 

  • 특정 평가 질문/초점에 맞춘 데이터 수집 방법
  • 다양한 이해관계자로부터 데이터를 수집하기 위한 다양한 방법
  • QI에 대한 프레임워크를 제공하기 위한 적절한 평가 모델 및 이론.

[퀄리티 문화 접근 방식]을 수용하면 이해 당사자들이 경험하는 주인의식이 높아질 수 있습니다. 이 메커니즘은 다음을 포함한다.

  • QI에서 여러 이해 관계자가 협력할 수 있는 민주적-조직적 문화 조성 
  • [전체적-지속적holistic continuous QI]에 기여하는 QI 활동과 (예: SoTL) 프로젝트에 이해당사자를 참여
  • 커리큘럼 구성 요소 및 리소스의 (공동)창조 영역에 퀄리티를 사전 예방적으로 포함

Discourse is necessary to achieve transparency and a shared understanding of continuous QI in a particular curricular context. Continuous QI requires

  • data collection methods aligned to specific evaluation questions/foci;
  • multiple methods for data collection, from different stakeholders; and
  • appropriate evaluation models and theory to provide a framework for QI.

Embracing a quality culture approach may increase the sense of ownership experienced by stakeholders. Mechanisms include

  • creating democratic-collegiate cultures for multiple stakeholders to collaborate in QI;
  • engaging stakeholders in QI activities and (e.g. SoTL) projects that contribute to holistic continuous QI; and
  • proactively embedding quality in the (co-)creation of curriculum components and resources.

 

 


Med Educ. 2022 Aug 11. doi: 10.1111/medu.14912. Online ahead of print.

State of the science: Quality improvement of medical curricula-How should we approach it?

Affiliations collapse

Affiliation

1School of Medicine, Dentistry & Nursing, University of Glasgow, Glasgow, UK.

PMID: 35950304

DOI: 10.1111/medu.14912

Abstract

Introduction: Quality improvement (QI) of the medical curriculum is generally regarded as a continuous process of evaluating whether the specific curriculum meets relevant educational and professional standards, implementing new activities or other measures to address perceived deficiencies, and subsequently re-evaluating the quality of the curriculum. QI is of consequence to medical learners, educators, patients, carers, specific disciplines and specialties, regulators and funders.

Methods: To address how we should approach QI of medical curricula, a narrative review was undertaken, drawing mainly on medical/health professions education literature, identified through searches of the MEDLINE, EMBASE, PUBMED and ERIC databases, and also on exemplar curricular frameworks and evaluation reports. Assumptions and practices in QI of medical curricula were explored critically.

Results: The review compares alternative conceptualisations of QI; asks questions about priorities and perspectives in what we choose to evaluate; reflects on standards used to guide QI; critically discusses methods, models and theoretical approaches to the generation of evaluation data; and considers ownership of, and engagement with QI of medical curricula.

Conclusions: Recommendations for curriculum teams include that discourse is necessary to achieve transparency and a shared understanding of continuous QI in a particular curricular context. Continuous QI requires data collection methods aligned to specific evaluation questions/foci; multiple methods for data collection, from different stakeholders; and appropriate evaluation models and theory to provide a framework for QI. Embracing a quality culture approach may increase the sense of ownership experienced by stakeholders. Mechanisms include creating democratic-collegiate cultures for multiple stakeholders to collaborate in QI; engaging stakeholders in QI activities and (e.g. SoTL) projects that contribute to holistic continuous QI; and proactively embedding quality in the (co-)creation of curriculum components and resources.

온라인 의학교육에서 윤리적으로 가르치기: AMEE Guide No. 146 (Med Teach, 2022)
AMEE guide to ethical teaching in online medical education: AMEE Guide No. 146
Ken Mastersa , David Taylorb , Teresa Lodac and Anne Herrmann-Wernerd

 

서론
Introduction

COVID-19 및 긴급 원격 교육
Covid-19 and emergency remote teaching

2020년 코로나19 범유행으로 의료 교육이 대면 교수 및 학습에서 온라인 교수 및 학습으로 전례 없는 전환으로 이어졌다. 비록 의료 교육에서의 온라인 교수와 학습이 e-러닝의 형태로 수십 년 동안 존재했지만, 그것은 대개 세부적인 준비와 관리, 작은 단계, 파일럿 그리고 신중하게 통제된 성장으로 선행되어 왔다. 2020년 시프트는 달랐고 비상 원격 교육(ERT)으로 가장 잘 설명되었습니다.
In 2020, the Covid-19 pandemic led to an unprecedented shift in medical education from face-to-face teaching and learning to online teaching and learning. Although online teaching and learning in medical education had existed for several decades in the form of e-learning, it had usually been preceded by detailed preparation and management, small steps, pilots and then carefully-controlled growth (Ellaway and Masters 2008; Masters and Ellaway 2008). The 2020 shift was different and was best described as Emergency Remote Teaching (ERT) (Hodges et al. 2020).

Hodges 등이 설명했듯이 ERT(때로는 팬데믹 교육학)와 일반적으로 좋은 온라인 학습으로 간주되는 것 사이에는 많은 차이가 있지만, 본질적으로 ERT의 우선 순위는 교육 자료를 온라인으로 제공하고 연속성의 손실을 최소화하면서 수업을 시작하는 것이었다. 종종 교사들에 대한 지도가 거의 없는 상태에서, 목표는 [대면 교수 활동]을 온라인에 [동등한 것으로 대체함]으로써 가능한 한 [비슷하게 모방]하는 것이었다.

As explained by Hodges et al., there are many differences between ERT (sometimes called Pandemic Pedagogy (Schwartzman 2020)) and what is normally considered good online learning, but, in essence, the priority of ERT was to get the teaching materials online and get the classes up and running with as little loss of continuity as possible. Frequently, with little guidance to teachers, the aim was to mimic face-to-face teaching activities as closely as possible by replacing them with online equivalents (Stojan et al. 2021).

ERT는 필요했고, 많은 경우, 결과는 놀라웠다. 그러나, 문제는 신중한 사전 계획, 관리 및 파일럿의 사치 없이 일하는 것이 ERT의 요구 사항을 충족시키는 결과를 낳았지만, 일반적으로 e-러닝과 연관될 수 있는 확실한 기반이 부족하다는 것이다. 대부분의 경우, 상당히 이해할 수 있는 것은, 새로운 환경에서 학습의 반영과 확장을 위한 기회가 거의 없었다는 것이며, 불완전하게 해결된 문제들 중에는 온라인 학습에 내재된 윤리적인 문제들이 있다. Stojan 등의 검토는 많은 교사들이 윤리적 문제(특히 전염병으로 인해 교사 및 학습자에게 부과됨)에 대해 알고 있었음을 보여주지만, 이러한 복잡성에 대처할 수 있는 위치에 있는 경우는 거의 없었다. 또한 윤리적 딜레마에 대한 많은 해결책이 단기적인 것에 불과하다는 것을 깨달았다.
ERT was necessary, and, in many instances, the results were remarkable. A problem, however, is that working without the luxury of careful pre-planning, management and piloting has resulted in courses’ meeting the requirements of ERT, but lacking in the solid grounding that one would normally associate with e-learning (Stojan et al. 2021). In most instances, quite understandably, there was little chance for reflection and extension of learning in the new environment, and among the issues incompletely addressed are the ethical issues inherent in online learning. While Stojan et al.’s review does show that many teachers were aware of the ethical issues (specifically imposed upon teachers and learners because of the pandemic), they were seldom in a position to cope with these complexities. There was also the realisation that many solutions to ethical dilemmas were short-term only.

의료 e-러닝의 미래
The future of medical e-learning

비록 기관들은 대면 교육이 다시 한번 지배적인 교육 방식이 되는 미래를 바라볼 수 있지만, ERT의 경험은 온라인 교육이 가능하다는 것을 보여주었고, 어떤 경우에는 더 선호된다는 것을 보여주었다. 따라서 2020년 이전보다 더 큰 범위에서 e-러닝을 사용하고 싶은 교사와 학습자 모두의 욕구가 의심할 여지 없이 있을 것이다. (또한 COVID-19 변종, 미래의 새로운 바이러스 또는 더 나은 e-러닝으로 갑자기 전환해야 할 수 있는 다른 사건의 가능성을 고려해야 한다.) 하이브리드, HyFlex 또는 온라인을 막론하고, e-러닝의 형식이 무엇이든, 의료 e-러닝의 광범위한 사용은 ERT로 특징지을 수 있는 것보다 더 체계적이고 형식적일 것이다.

Although institutions may look to a future in which face-to-face education once again becomes the dominant mode of education, the experience of ERT has shown that online education is possible, and, in some cases, preferable, and so there will undoubtedly be a desire from both teachers and learners to use e-learning to an extent that was greater than pre-2020 (Stojan et al. 2021) (One should also consider the possibility of Covid-19 variants, future novel viruses or other events that may require a sudden shift to greater e-learning). Whatever the format of the e-learning, whether hybrid, HyFlex (Beatty 2007, 2019; Abdelmalak and Parra 2016), or entirely online, the widespread use of medical e-learning will become more structured and more formal than is characterised by ERT.

온라인 의료교육의 윤리
Ethics in online medical education

모든 의학 교육에서 윤리적 원칙(아래에서 더 자세히 설명)은 오랫동안 주목을 받아왔다. 공식적인 온라인 학습은 이러한 것들을 포함할 필요가 있을 뿐만 아니라, 온라인 환경이 새로운 윤리적 문제를 야기한다는 것을 인식해야 하며, 윤리적 의학 교육자는 이를 인식하고 온라인 교육이 윤리적으로 수행되도록 해야 할 것이다.
In all medical education, ethical principles (described in more detail below) have long received attention. Formal online learning not only needs to include these, but also has to recognise that the online environment introduces new ethical issues, and the ethical medical educator will need to be aware of these and ensure that online education is conducted ethically.

윤리적인 온라인 교육은 광범위한 교육적 이슈와 (때로는 흔한) 온라인 활동의 재평가를 필요로 한다. 예를 들어,

  • 코스 관리 정보 문서의 작성과 그러한 정보의 전달,
  • 기관이 관리하는 커뮤니케이션 시스템(예: LMS(Learning Management System)),
  • 기관 외부의 통신 시스템(예: 개인 또는 상업용 모바일 앱, 소셜 미디어)
  • 라이브 클래스 녹음,
  • 자료 접근성,
  • 전자 재료 품질(텍스트, 이미지, 비디오, 오디오 포함)
  • 라이선스,
  • 온라인 평가 및 감독,
  • 코스 평가 및
  • 학생 추적

Ethical online teaching requires a reassessment of a range of educational issues and (sometimes even common) online activities, such as

  • the construction of course administration information documentation, delivery of such information,
  • communication systems controlled by the institution (e.g. the Learning Management System (LMS)),
  • communication systems outside the institution (e.g. private or commercial mobile apps, social media),
  • live-class recording,
  • material accessibility,
  • electronic material quality (including text, images, video, audio),
  • licensing,
  • online assessment and proctoring,
  • course evaluation, and
  • student tracking.

또한 임상 교육 환경은 학생과 환자의 안전, 개인 정보 보호 및 기밀성을 포함하는 많은 새로운 복잡성을 열어준다.
In addition, the clinical teaching environment opens a host of new complexities involving student and patient safety, privacy and confidentiality.

그러나 이러한 활동과 관련된 윤리적 요구 및 관련 이상은 (의료 교육자들이 자신의 행동에 대한 현실적인 기대를 가지고 있고 과도한 부담을 갖지 않도록 하기 위해) [현실]에 맞춰 균형을 이루어야 한다.

These activities and the associated ethical needs and the associated ideals, however, should be balanced by reality, in order to ensure that medical educators have realistic expectations of their own behaviour and are not over-burdened.

 

이러한 가이드의 필요성 및 목적
The need for, and aim of, such a guide

안타깝게도, 윤리에 대한 언급이 거의 없는 온라인 교육을 다루는 전체 텍스트를 찾는 것은 드문 일이 아니다. 또한, 연구와는 달리, 의료 교육 기관이 온라인 강좌의 윤리를 구체적으로 검토하는 교육 윤리 위원회나 기관 검토 위원회(IRB)를 두는 것이 일상적이지 않기 때문에 온라인 강의로 전환하는 의료 교육자는 해결해야 할 윤리 문제에 대한 지침이 거의 남아 있지 않다.
Unfortunately, it is not unusual to find entire texts dealing with online education that have little mention of ethics at all. In addition, unlike research, it is not routine for medical education institutions to have Education Ethics Committees or Institutional Review Boards (IRBs) that specifically review the ethics of online courses, and so the medical educator transitioning to online teaching is left with little guidance on the ethical issues that need to be addressed.

온라인 의료 교육에서 윤리 지침이 필요하다는 점을 감안하여, 본 가이드의 목적은 

  • 교육자들이 온라인 교육이 최고의 윤리적 관행에 의해 가이드되도록 하기 위해
  • 전임상 및 임상 의료 교육자에게 온라인 의료 교육의 윤리 문제에 대해 경고하고,
  • 그들이 내려야 할 결정을 가이드하는 것이다.

In light of a need for ethical guidance in online medical education, the aim of this Guide is

  • to alert pre-clinical and clinical medical educators to the ethical issues in online medical education and
  • to guide them through the decisions that they will have to make
  • in order to ensure that their online teaching is guided by the best ethical practices.

이 가이드는 가장 일반적으로 인용되는 [윤리적 원리에 대한 일반적인 소개]로 시작하여, 의학 교사가 새로운 온라인 과정을 구성하거나 온라인 환경을 위해 기존 ERT 또는 대면 과정을 수정하면서 겪게 될 일반적인 과정의 노선을 따라 구성될 것이다. 계획, 건설, 전달 및 평가의 요소가 맥락을 형성하며 기술 활동 내에서 설정된다. 그러나 본 가이드의 초점은 이러닝의 모든 측면에 초점을 맞추는 것이 아니라, 관련 활동에 의해 제기되는 윤리적 문제와 온라인 의학 교육의 맥락에서 접근하는 방법에 초점을 맞출 것이다.
The Guide will begin with a general introduction to the most commonly-cited ethical principles, and will then be structured along the lines of the general process that a medical teacher would go through as they construct a new online course or modify an existing ERT or face-to-face course for the online environment. The elements of planning, construction, delivery, and assessment will form the context, and will be set within the technological activities; the focus of this Guide, however, will not be on all aspects of e-learning, but rather on the ethical issues that are raised by the related activities, and how to approach them within the context of online medical education.

온라인 의학 교육에 적용할 수 있는 광범위한 윤리
The broad ethical principles applicable to online medical education

본 가이드는 온라인 의료교육에서 윤리행위의 실질적인 구현에 초점을 맞추고 있지만, 가장 관련성이 높은 윤리원칙과 온라인 의료교육에 미치는 영향을 개정할 필요가 있다. 실용적인 사용을 위해 이 목록을 짧게 유지했습니다. 보다 자세한 내용을 위해 독자는 국제의료정보학협회(IMIA) 건강정보전문가 윤리강령 (International Medical Informatics Association 2016) 및 (Anderson and Simpson 2007)과 같은 아이디어를 도출한 다른 텍스트를 참조하기를 원할 수 있다.
Although this Guide focuses on the practical implementation of ethical behaviour in online medical education, it is necessary to revise the most pertinent ethical principles and their impact on online medical education. For practical ease of use, we have kept this list short. For more details, the reader may wish to consult other texts from which we have drawn ideas, such as the International Medical Informatics Association (IMIA) Code of Ethics for Health Information Professionals (International Medical Informatics Association 2016), and (Anderson and Simpson 2007).

  • 투명성, 공개 및 사전 동의: 과정 레이아웃 및 요구 사항에 대한 완전한 공개, 데이터 수집, 저장, 공유 및 필요한 경우 동의가 제대로 전달되도록 보장합니다.
  • 평등, 형평성, 다양성 및 접근성: 온라인 시스템이 학생들을 부당하게 차별하지 않도록 보장하고, 다양한 상황과 배경을 고려하며, 모든 학생들이 쉽게 교과서에 접근할 수 있도록 보장한다.
  • 과잉을 방지하라: 학생에 대한 필요한 정보만 수집되도록 보장하라.
  • 개인 정보 보호 및 보안: 교사와 기관이 개인 정보를 유지하고 학생과 환자에 대해 수집된 모든 정보를 안전하게 보호하기 위한 모든 합리적인 조치를 취하도록 보장하고 익명성을 유지합니다.
  • 해를 끼치지 마라: 히포크라테스(Hippocrates 1957)에서 따온, 이것은 의학에서 일반적인 지침 원칙이다; 현대 해석은 신체적 해와 심리적 스트레스를 다룬다.
  • 가능성: 그 기관이 성취할 수 있는 모든 것들로부터 윤리적 기준을 요구하도록 보장한다.

  • Transparency, disclosure and informed consent: ensuring that there is full disclosure about the course layout and requirements, gathering, storage, sharing of data, and ensuring that consent when required, is truly informed.
  • Equality, equity, diversity and accessibility: ensuring that the online system does not unfairly discriminate against students, take into account a diversity of circumstances and backgrounds, and ensures that the course materials are easily accessible by all students.
  • Guard against excess: ensuring that only necessary information about students is gathered.
  • Privacy and security: ensuring that the teacher and institution take all reasonable steps to keep private and secure all information gathered about students and patients, and maintains their anonymity.
  • Do no harm: taken from Hippocrates (Hippocrates 1957), this is a common guiding principle in medicine; modern-day interpretations cover physical harm and psychological stress.
  • Possibility: Ensuring that the institution requires an ethical standard from all that is possible to achieve.

아래 섹션에서는 이러한 항목과 특히 관련이 있는 영역을 살펴보겠습니다.

In the sections below, we will see the areas in which these are particularly relevant.

 

코스 계획
Course planning

법률, 지침 및 정책
Laws, guides and policies

코스를 설계하기 전에 코스 설계자는 윤리적인 코스 설계를 보장하기 위해 수용되어야 하는 다양한 표준을 알고 있어야 합니다. 이것들은 위에 열거된 가장 명백한 윤리적 문제와 관련이 있을 것이다. 다소 느슨하게, 이러한 표준은 [법률, 디자인 가이드 및 기관 정책]의 세 가지 그룹으로 나눌 수 있다.
Before designing a course, course designers should be aware of a range of standards that need to be accommodated in order to ensure the ethical course design. These will relate to the most obvious ethical issues as listed above. Rather loosely, these standards can be divided into three groups: laws, design guides, and institutional policies.

법률
Laws

[관련 법]은 나라마다 다르므로, 모든 교사에게 적용되지 않을 수 있다. 그러나 의학교사가 이러한 법의 관할권 밖에 있는 경우에도 강좌를 설계할 때 유용한 지침이 될 수 있다. 표 1은 가장 관련성이 높은 법률의 목록을 보여줍니다.
The relevant laws differ from country to country, and so may not be applicable to all teachers. Even when the medical teacher falls outside the jurisdiction of these laws, however, they can be useful guides when designing courses. Table 1 gives a listing of some of the most pertinent laws.

In addition, some training is available through the Kansas Accessibility Resource Network (KASN) (free, with registration) (https://ksarn.org/free-training/) and extra tips from the University of Minnesota (https://accessibility.umn.edu/what-you-can-do/start-7-core-skills).

설계 가이드 및 루브릭
Design guides and rubrics

법률 외에도, 자신의 진로를 형성하는 데 도움을 줄 수 있는 몇 가지 [안내서와 루브릭]이 있다. 이들 중 대부분은 전반적인 과정 설계를 위해 설계되었지만, 대부분의 세부 사항은 자료의 접근성에 초점을 맞추고 있습니다. 특히 가치 있는 세 가지는 다음과 같다.
In addition to laws, there are several guides and rubrics that can be used to help shape one’s course. Most of these are designed for overall course design, but many of the specifics focus on the accessibility of materials. Three that will be of particular value are:

  • 품질 문제(QM): (https://www.qualitymatters.org/. . . . . 이 사이트는 온라인 교육을 위한 매우 우수하고 포괄적인 도구 세트를 제공합니다. 최소한 고등 교육을 위한 그들의 루브릭(https://www.qualitymatters.org/qa-resources/rubric-standards/higher-ed-rubric. . . )은 개별 강사들이 자기 평가와 더 넓은 동료 평가를 위해 사용할 수 있다. 루브릭은 여행을 시작하는 사람에게는 부담스러울 수 있으므로 초보자는 천천히 진행하기를 원할 수 있습니다. ERT를 사용해 온 사람들에게는 QM 지침에 따라 귀하의 자료를 변환하는 것이 기본 윤리 기준을 충족하도록 하는 데 큰 도움이 될 것입니다(QM 사이트의 자료의 대부분은 무료가 아니며 저작권 제한).s가 존재하므로 사용자는 무엇을 사용할 수 있는지 알아야 한다).
  • 앤스티 앤 왓슨의 루브릭(앤스티 앤 왓슨 2018)도 매우 유용하며 크리에이티브 커먼즈(CC BY-NC-SA 4.0) 라이센스를 통해 구입할 수 있다.
  • QM 자료를 활용한 국가품질온라인학습표준(NSQ)(https://www.nsqol.org/. . . )도 심층 가이드를 제공한다.
  • Quality Matters (QM): (https://www.qualitymatters.org/. . . . ). This site provides an extremely good and comprehensive set of tools for online education. At the very least, their rubric for higher education (https://www.qualitymatters.org/qa-resources/rubric-standards/higher-ed-rubric. . . . ) can be used by individual instructors for self-evaluation and for broader peer-evaluation. The rubric might be daunting for somebody starting on the journey, so novices may wish to progress slowly; for those who have been using ERT, conversion of your material according to QM guidelines will go a long way in ensuring that your course meets basic ethical standards (Much of the material on the QM site is not free, and copyright restrictions exist, so users should be aware of what may be used).
  • Anstey and Watson’s rubric (Anstey and Watson 2018) is also very useful and is available through a Creative Commons (CC BY-NC-SA 4.0) licence.
  • National Standards for Quality Online Learning (NSQ) (https://www.nsqol.org/. . . . ) which uses the QM material, also offers in-depth guides.


기타 표준 및 루브릭에 대한 논의는 (Martin et al. 2017)을 참조하십시오. 강사들이 루빅 기반 교육 설계에서 벗어나면서, 그들은 그들의 자료를 형식화formalize하고 또한 이러한 많은 루빅 뒤에 있는 원리들을 이해하기를 원할 수 있다. 이러한 경우 관련 이론에 익숙해지기 위한 유용한 출발점이 될 것이다.
For a discussion of other standards and rubrics, see (Martin et al. 2017). As instructors move away from rubric-based instructional design, they may wish to formalise their material, and also understand the principles behind many of these rubrics. For these, useful starting points for familiarising oneself with the pertinent theories would be (Clark and Mayer 2003; Sandars et al. 2015; Picciano 2021).

제도적 정책
Institutional policies

대부분의 기관은 데이터 보호, 개인 정보 보호, LMS의 구체적인 사용 등 전자 시스템의 올바른 사용을 다루는 정책을 가지고 있으며, 이러한 정책들을 교사와 학생 모두 잘 알고 있어야 해당 기관이 운영하지 않을 수 있다.
Most institutions have policies covering the correct use of their electronic systems, including data protection, privacy, and the specific usage of the LMS. It is necessary for both teachers and students to be aware of these so that they do not run afoul of the institution.

또한 개별 부서 및 과정에는 허용 가능한 행동에 대한 [추가 규칙]이 있을 수 있습니다. 모든 관련자들이 이것들을 인식하도록 하는 것이 중요하다. 각 부서는 교사와 학생들에게 알려야 하며, 커리큘럼 문서도 이를 참조하는 것이 좋을 것입니다(아래 약술). (학과에 이러한 사항이 없다면 윤리 교사가 이를 공식화하는 데 도움을 줄 수 있습니다.)
In addition, individual departments and courses may have extra rules regarding acceptable behaviour. It is important that all concerned are made aware of these. Departments should inform their teachers and students, and it would be a good idea for curriculum documents to refer to these also (as outlined below) (If departments do not have these, then the ethical teacher could take a hand in formulating them).

그러나 이 모든 것에서 [윤리적 행동에 대한 욕구와 현실적인 기대의 균형]을 맞추는 것도 중요하다. 대표적인 두 가지 예는 다음과 같다.
In all of these, however, it is also crucial to balance a desire for ethical behaviour with realistic expectations. Two typical examples are:

  • 학생들이 다른 학생들로부터 투영된 용납할 수 없는 이미지에 노출되지 않도록 하는 것이 바람직하지만, 교사들은 우리가 온라인에서 가르칠 때, 우리는 학생들의 집에 있다는 것을 기억해야 한다. 결과적으로, 학생들이 그들의 삶의 측면의 이미지나 오디오를 의도치 않게 방송할 가능성이 있다. 그렇지 않으면 대면 교실에서 받아들일 수 없을 것이다. 이는 학생의 집에 있는 다른 사람들의 (고의적이거나 의도적이지 않은) 배경 간섭이나 단순한 잘못된 사건의 결과일 수 있습니다. 격한 반응보다는 교사와 기관의 이해심 있는 반응이 바람직할 것이다.
  • While it is desirable to ensure that students are not exposed to unacceptable images projected from other students, teachers should remember that, when we teach online, we are in students’ homes. As a result, it is possible that students will unintentionally broadcast images or audio of aspects of their lives that would otherwise be unacceptable in a face-to-face classroom. This might be the result of (intentional or unintentional) background interference from other people in the student’s home or a simple ill-advised event. An understanding reaction from the teacher and institution, rather than a fierce response, would be preferable.
  • [잘못된 생각ill-thought-out이나 광범위한 산업 소프트웨어 표준에 기반을 둔 제도적 온라인 행동 약관]은 교사와 학습자에게 심각한 결과를 초래할 수 있다. 예를 들어, [불쾌한 자료를 보내거나 받는 것]을 범죄로 만드는 것: 이것은 자동으로 LMS 과정 게시판이나 포럼에 게시된 메시지를 여는 것이 범죄라는 것을 의미한다. 따라서 범죄를 저지르는 것에 대한 유일한 확실한 예방 방법은 포럼에 게시된 내용을 절대 읽지 않는 것인데, 그렇게 되면 강좌의 교육적 가치를 즉시 떨어뜨립니다. 그런 정책이 존재한다면 이를 올바른 제도적 경로로 제기해 변화시키는 것이 현명할 것이다.
  • Institutional online behaviour terms and conditions that are ill-thought-out, or based on broad industry software standards, can have serious consequences for teachers and learners. For example, making it an offence to send or receive offensive material: this automatically means that opening such a message posted into the LMS course bulletin boards or forums is an offence. The only sure prevention method against committing an offence, then, is to never read anything posted into the forums, which immediately lessens the educational value of the course. If such policies exist, it would be wise to raise this with the correct institutional channels, so that they may be changed.

기관 행정 및 지원 구조
Institutional administrative and support structures

대면교육에서는 개별 교사가 혼자 근무하는 경우가 많고, 주변에는 행정 및 기술 인력이 상주해 학생들의 눈에 띄지 않는 경우가 많다. 그러나 온라인 교육에서 [교육 매체]는 윤리적 의무를 따르는 [테크니컬 및 기타 직원들]에 의해 통제되는데, 이것이 늘 교사의 교육적 필요와 일치하지는 않는다. 결과적으로, 아래에서 논의되는 많은 항목은 개별 교사 및 심지어 부서의 통제를 벗어날 수 있으며, [소프트웨어 및 파일 서버의 원활한 작동]이 주된 관심사인 다른 사람들과 신중하게 협상해야 할 필요가 있을 수 있다.
In face-to-face education, individual teachers frequently work alone, and administrative and technical staff are present on the periphery, frequently unobserved by students. In online education, however, the very medium of instruction is controlled by technical and other staff who may be guided by ethical imperatives that do not always align themselves with the pedagogic needs of the teachers. As a result, many of the items discussed below may be beyond the control of individual teachers and even departments, and may need to be delicately negotiated with others who see their prime concern as the smooth-functioning of software and file servers.

충돌 가능한 영역은 다음과 같습니다.
Areas of possible conflict may include:

  • 온라인 교육을 거의 받지 않은 교사와 학생들은 [끊임없이 변화하는 환경]에 적응하고 적응해야 한다.
  • 접근성을 용이하게 하기 위해 [추가적인 비표준 소프트웨어 및 플러그인, 글꼴, 레이아웃을 사용하고자 하는 교사의 욕구]는 LMS 주제 및 템플릿에 반할 수 있다.
  • 교원 및 학생에게 [자체 하드웨어 및 소프트웨어 기술]을 교수 및 학습에 사용하도록 요구하는 기관
  • 온라인 환경에 적용되고 효과가 있을 것으로 예상되는 [대면 교육에 적합하도록 발전된 기관의 시간표, 과정 섹션 및 강의 규모]
  • [필요한 지원을 하지 않으면서], 교원 및 학생에게 기관의 기준 준수 요구,
  • 윤리적 교육 윤리적 요건과 상충될 수 있는 [기관 및 교사의 데이터 관행].

  • Teachers and students who are largely untrained in online education having to adapt and adjust to an ever-changing environment;
  • Teachers’ desire to use extra non-standard software and plugins, fonts, layouts in order to ease accessibility, but which may be contrary to LMS themes and templates;
  • Institutions’ requiring teachers and students to use their own hardware and software technology for teaching and learning;
  • Institutions’ time tables, course sections and class sizes that have evolved to suit face-to-face teaching imposed into an online environment and expected to work;
  • Institutions’ demands for standards on teachers and students without supplying the necessary support, and
  • Institutions’ and teachers’ data practices that may conflict with ethical educationally ethical requirements.

임상 교육에서 환자와 관련된 다른 문제가 발생하며, 이 가이드의 뒷부분에서 다룹니다.

In clinical teaching, other issues around patients arise, and are dealt with later in this Guide.

소셜 미디어 및 타사 소프트웨어
Social media and third-party software

온라인 의학 교육은 소셜 미디어와 제3자 소프트웨어 및 웹 사이트를 사용함으로써 향상될 수 있는데, 일부는 일반적으로 교육적인 것으로 간주되지 않을 수 있으며, 일부는 다른 관할 지역의 윤리 원칙에 따라 지도될 수 있다. 독점, 자유 또는 오픈 소스 여부에 관계없이 소프트웨어 개발자와 공급업체는 소프트웨어 사용에 대한 데이터를 수집하기를 원할 수 있으며, 이러한 활동의 구체적인 내용은 소프트웨어의 약관에 묻혀 있을 수 있습니다. 의학교사와 기관은 이러한 조건을 인지하고, 이러한 조건에 기초하여 소프트웨어 적합성에 대한 결정을 내리는 것이 필수적이다. 학생들에게 우려할 만한 부분이 있다면 학생들에게 이를 알려야 한다.
Online medical education can be enhanced by the use of social media and third-party software and websites, some of which may not normally be considered educational, and some may be guided by ethical principles from other jurisdictions. Whether proprietary, free or open-source, software developers and vendors may wish to gather data about the use of their software, and the specifics of these activities may lie buried in the software’s Terms and Conditions. It is imperative that the medical teacher and the institution be aware of these conditions, and make decisions about the software suitability, based upon those conditions. If there are areas that may be of concern to students, the students should be made aware of this.

과정 설계 및 레이아웃
Course design and layout

투명성, 공개 및 사전동의 : 교육과정 개요
Transparency, disclosure and informed consent: Curriculum outline

물리적 과정 레이아웃을 고려하기 전에 [투명성, 공개 및 사전 동의]라는 윤리적 요구 사항을 충족해야 합니다. 이를 위해 [학생이 사용할 수 있는 커리큘럼 개요 문서]가 필요하며, 이를 통해 다음 사항을 명확하게 확인할 수 있습니다.
Before one can consider the physical course layout, it is necessary to meet the ethical requirements of transparency, disclosure and informed consent. To do this, one will require a Curriculum Outline document that is available to students, and clearly identifies:

  • 과목의 표준적 특징들: 코스 설명, 필수 조건, 학습 목표, 출석 정책, 평가 정보, 주별/모듈별 세부 정보, 학생 참여 기대치, 최소 기술 요구사항, 코디네이터/강사/연락처 세부 정보 및 시간
    • 만약 학생들이 다른 시간대에 있을 수 있다면, 스케줄은 그 모든 시간대에 시간을 주어야 한다(실용적이지 않을 정도로 많은 시간대가 있는 경우, 학생들이 접근할 수 있는 온라인 검색 테이블을 사용할 수 있다).
    • 서머타임이 있다면 고려하십시오.
  • The standard features of the course, such as the course description, pre-requisites, learning objectives, attendance policies, assessment information, week-by-week/module-by-module details, expectations of student participation, minimum technological requirements, and coordinator/instructor/s contact details and hours.
    • If students may be in different time zones, then schedules must give times in all of those time zones (If there are too many to be practical, then one can use an online look-up table that students can access).
    • Take into account any daylight-saving time changes.
  • [온라인 상호 작용, 에티켓, 세션 기록 및 공유]와 관련된 기관 및 과목 정책입니다
  • Institutional and course policies that relate to online interactions, netiquette, session recording and sharing.
  • 학생 데이터의 수집 및 저장에 관한 기관 및 과정 관행. 이 항목에는 다음이 포함됩니다. 수집되는 데이터는 무엇인지, 수집되는 이유는 무엇인지, 저장 방법, 기간 및 공유(제3자 포함), 사이트 간 추적 및 데이터 비활용 적용 여부.
  • Institutional and course practices regarding the gathering and storage of student data. This needs to cover:
    • which data are collected, why they are collected, storage methods, duration and sharing (including with and by third parties), and whether any form of cross-site tracking and data de-anonymisation are applied.

투명성에 대한 윤리적 요구 사항을 충족시키기 위해, 학생들이 코스 개요 문서를 읽었다고 가정할 것이 아니라, 학생들이 가능한 한 정보를 얻을 수 있도록 코스 시작 시 수업과 논의해야 합니다. 적절한 기간(예: 1~2주) 내에 학생들은 이 문서의 모든 용어를 이해한다는 것을 전자적으로 표시해야 합니다. 코스 기간 동안 본 문서에 대한 중요한 변경 사항이 학생에게 표시되어야 합니다.
To meet the ethical requirements of transparency, rather than assume that the students have read the Course Outline document, it should be discussed with the class at the beginning of the course, so that students can be as informed as possible. Within a reasonable period (e.g. a week or two), students should electronically indicate that they understand all the terms of this document. Material changes to this document during the course’s term should be indicated to the students.

투명성, 공개 및 사전 동의: 실행
Transparency, disclosure and informed consent: Implementation

윤리 지침이 이해되면 [물리적 과정 설계 및 레이아웃에 구현]되어야 합니다. 많은 경우, 온라인 교사는 LMS 또는 그들이 제한된 통제권을 가진 다른 시스템 내에서 일하고 있을 것이다. 이에 따라 개별교사가 달성할 수 있는 성과에는 한계가 있겠지만, 위의 제도행정 및 지원구조에 관한 절에서 보듯이, 때때로 변화를 협상할 수 있다. 어떤 경우에는 교사가 교육 디자이너와 접촉할 수 있지만, 이것은 표준이 아니며, 교사들은 흔히 스스로 작업해야 한다.
Once the ethical guidelines are understood, they need to be implemented in the physical course design and layout. In many cases, the online teacher will be working within an LMS or other system over which they have limited control. As a result, there will be limits to what the individual teacher can accomplish, but, as indicated in the section on Institutional administrative and support structures above, sometimes changes can be negotiated. In some cases, teachers may have access to instructional designers, but this is not the norm, and teachers have to frequently work by themselves.

그럼에도 불구하고, 할 수 있는 많은 것들이 있다. 이 절에서는 [평등, 형평, 다양성 및 접근성]의 윤리적 원칙도 적절하며, 교육이 테크놀로지, 특히 개인별로 구입해야하는 테크놀로지에에 의존할 때 취약하고 불리한 학생들에게 더욱 중요해진다는 것을 기억해야 한다. 대부분의 경우, 이러한 원칙은 기술적으로 적용하기가 상당히 쉬우며, 이러한 조치를 올바로 이행하면 코스 자료의 접근성에 상당한 영향을 미칠 수 있습니다.
Nevertheless, there are many things that can be done. In this section, ethical principles of Equality, Equity, Diversity and Accessibility are also pertinent, and one should remember that the vulnerable and disadvantaged students become even more so when education relies on technology, especially personally-financed technology. In most cases, these principles are reasonably technically easy to apply, and the correct implementation of these actions can have a significant impact on course material accessibility.

화면 레이아웃
On-screen layouts

  • 스크롤 대신 [탭]을 누릅니다. 일부 LMS는 학생들의 접근 속도를 늦추고 추가 대역폭을 사용하는 "죽음의 스크롤"로 알려져 있다. 탭으로 된 테마 또는 템플리트를 사용하면 학생 액세스 시간이 크게 향상되고 탐색이 쉬워집니다. 탭은 현재 주/주제, 이전 주/주제 및 검사와 같은 특수 항목을 나타내기 위해 컬러 코딩할 수도 있습니다.
  • Tabs instead of scrolling. Some LMSs are known for their “Scroll of Death” which slows student access and also uses extra bandwidth. Using a tabbed theme or template significantly improves student access times and eases navigation. Tabs can also be colour-coded to indicate the current week/topic, previous weeks/topics, and special items such as examinations.
  • 항목의 제목, 들여쓰기 및 간격. 이것들은 명확하게 읽을 수 있도록 나열된 항목이 많을 때 특히 중요하다
  • Headings, indentation and spacing of items. These are especially important when there are many items listed so that they can be clearly read.
  • 텍스트 글꼴 유형, 크기 및 색상. 색상은 모든 학생들이 본문을 쉽게 읽을 수 있도록 신중하게 사용해야 한다. 색상 조합 및 표준에 대한 일부 기술적 문제에 대한 소개는 WC3 지침(WC3 2016), 특히 섹션 1.4.1, 1.4.3, 1.4.4 및 (렐로와 빅햄 2017)을 참조하십시오. 보다 진보된 작업을 위해서는 재료 디자인 구글의 페이지(https://material.io/. . . )를 참조할 수 있다
  • Text font type, size and colours. Colours should be used carefully, ensuring that all students can easily read the text. For an introduction to some of the technical issues on colour combinations and standards, see the WC3 Guidelines (WC3 2016), especially Sections 1.4.1, 1.4.3 and 1.4.4 and (Rello and Bigham 2017). For more advanced work, Google’s page on Material Design (https://material.io/. . . . ) can be consulted.
  • 파일 형식 및 크기. 파일 형식과 파일 크기는 학생들이 액세스하는 파일에 필요한 소프트웨어와 다운로드에 대한 영향을 미리 알 수 있도록 항상 명확하게 표시되어야 한다
  • File types and sizes. File types and file sizes should always be clearly indicated so that students are forewarned of necessary software and download implications for files they access.
  • 비록 현재 연구가 결론을 내리지 못했지만, OpenDyslexic(https://opendyslexic.org/. . . )과 같은 무료 글꼴을 사용하는 것이 난독증을 가진 사람들이 더 쉽게 읽을 수 있도록 돕는다는 일화적인 보고가 있다. 난독증을 앓고 있는 학생들이 노트를 읽는 데 어려움을 겪고 있다면 글꼴과 플러그인을 설치하는 것을 추천할 수 있습니다.
  • Although the current research is inconclusive, there are anecdotal reports that using a free font like OpenDyslexic (https://opendyslexic.org/. . . . ) helps people who have dyslexia to read more easily. If you have students with dyslexia, and they are struggling to read your notes, then you may consider recommending they install the fonts and plugins.
  • 이렇게 생긴 글꼴은 굵은 글씨와 기울임꼴도 지원한다.
  • The font looks like this, and supports bold and italics also.
  • 특별 활동(퀴즈나 여분의 독서 자료 등)이 명확하게 표시되어야 한다
  • Special activities, such as quizzes and extra reading materials should be clearly indicated.
  • 화면 판독기는 이미지의 [<alt > 텍스트]를 읽을 수 있으므로 이미지를 명확하게 설명하기 위해 모든 이미지가 해당 텍스트를 포함해야 합니다. 이것은 항상 중요하지만, 이미지가 표준 텍스트 대신 사용되는 경우 특히 중요합니다. 이미지를 평가에 사용하는 경우, <alt > 텍스트가 질문의 답을 식별하지 않도록 주의해야 합니다
  • Screen readers can read the < alt > text on images, so all images should contain such text in order to clearly describe the image. This is always important, but especially so if images are used in place of standard, written text. If images are used in assessments, care should be taken to ensure that the < alt > text does not identify the question’s answer.
  • 가능한 경우 screen-reader를 사용하여 레이아웃을 테스트합니다. 유용하고 무료 화면 보호는 NVDA(https://www.nvaccess.org/. . . . . )이다
  • If possible, test the layout with a screen-reader. A useful and free screen-reader is NVDA (https://www.nvaccess.org/. . . . ).
  • 성별 문제, 특히 특정 성별 특정 대명사에 대한 선호가 고려되어야 한다. 임상 사례에서 성별은 관련 기준과 관련되어야 하며, 관련되지 않은 경우 균형을 유지해야 한다
  • Gender issues, especially a preference for particular gender-specific pronouns, should be considered. In clinical cases, genders should be related to pertinent criteria, and, where not relevant, should be balanced.
  • 전반적으로 직원, 학생 및 환자에 대한 논의는, 주제와 직접 관련이 없는 한 성별, 연령, 인종 등에 대한 구체적인 언급을 피해야 한다
  • Overall, discussions about staff, students and patients in general, should avoid specific references to gender, age, race, etc., unless they are directly pertinent to the topic.
  • 문화적으로 부적절한 온라인 교육에는 표준적이고 일반적인 모범 사례가 있을 수 있다. 문화적 민감성과 최상의 관행의 균형을 맞추기 위해(특히 관련 문화에 익숙하지 않은 경우) 문화 전문가와 학생들 스스로에게 상담해야 한다
  • There may be standard and common best practices in online education that are culturally inappropriate. To balance best practice against cultural sensitivity (especially if one is unfamiliar with the relevant culture), one should consult with cultural experts and with the students themselves.

코스 및 자료 접근성
Course and materials accessibility

학생들이 교재를 쉽게 접할 수 있도록 하는 것이 필수적이다. 의료 실무에서 오랫동안 인정되어 왔듯이(Maxwell 1984), 서비스에 대한 접근성은 복잡한 과정이다. 학생이 자료에 액세스할 수 있도록 다음 단계를 수행할 수 있습니다.
It is essential to ensure that the teaching materials are easily accessible by students. As has long been recognised in medical practice (Maxwell 1984), accessibility to a service is a complex process. In order to ensure student access to materials, the following steps can be taken:

소프트웨어
Software

  • [특수한 소프트웨어 도구]에 익숙하지 않은 학생은 강의 자료에 접근하고 참여하는 학생들의 능력에 즉각적인 부정적인 영향을 미칠 수 있습니다. 코스는 가능한 한 일반적으로 사용되는 도구를 사용해야 하며 새로운 도구에 대한 지침(노트 및 비디오 형식)을 제공해야 합니다. 또한 코스는 2개 이하의 동기식 비디오 교육 도구를 사용하도록 시도해야 한다.
  • Student unfamiliarity with special software tools will have an immediate negative impact on students’ ability to access and engage with the course materials. As far as possible, the course should require the use of commonly-used tools, and should provide instructions (in the form of notes and videos) on any new tools. Courses should also attempt to use not more than two synchronous video instruction tools.
  • 다양한 전달 방법과 도구를 사용하여 올바른 작업을 수행할 수 있지만, 특히 수업에서 도구를 동시에 사용할 때 학생들이 압도당하지 않도록 주의해야 한다
  • While a variety of delivery methods and tools can be used to ensure that the correct tool is being used for the correct task, care should be taken to not overwhelm students, especially when tools are used simultaneously in a class.
  • 학생들이 자료를 더 쉽게 활용할 수 있도록 비표준 파일 형식을 사용하지 않도록 주의해야 한다. 비표준 파일 형식을 사용하는 경우 해당 파일에 필요한 관련 무료 소프트웨어에 대한 링크가 제공되어야 하며, 해당 소프트웨어에 대한 기술 지원 및/또는 교육이 필요할 수 있습니다
  • To ensure that students can more easily utilise the materials, care should be taken to avoid non-standard file types. If non-standard file types are used, then links to the relevant free software required for those files should be provided, and technical support and/or training on that software may be required.
  • 비디오는 사용자의 선호에 따라 스트리밍과 다운로드가 모두 가능해야 한다
  • Videos should be available to be both streamed and downloaded to meet the preference of the users.
  • 품질 저하 없이 다운로드 시간을 줄이기 위해 파일 크기를 최소로 유지하도록 주의해야 합니다. 이는 다운로드 시간이 영향을 받을 때 시간 제한 평가 중에 사용되는 경우 특히 중요합니다. 다음은 파일 최적화에 대한 몇 가지 팁입니다(부록 1: 언급된 소프트웨어 사용 방법에 대한 기술 지침은 기술 "사용 방법"을 참조하십시오).
  • Care should be taken to keep file sizes to a minimum, in order to reduce download times, without compromising quality. This is especially important if these are used during time-restricted assessments when download times are affected. Here are some tips on file optimisation (See Supplementary Appendix 1: Technical “How To” for technical guidance on how to use the software mentioned):
    • 모호한 미디어 파일은 어댑터(Mac 및 Windows용) 도구를 사용하여 보다 일반적인 파일 형식으로 변환해야 합니다.
    • 이미지 품질을 저하시키지 않고 이미지를 줄여야 합니다. 무료 이미지 편집 소프트웨어 그림판.NET, Photopea 또는 TinyPNG를 사용할 수 있습니다. 게다가, 다소 빠르고 더러운 방법(유연성은 낮지만 기본은 한다)은 MS Office를 사용하는 것이다. 
    • PowerPoint 프레젠테이션을 비디오로 저장할 경우 화면 해상도를 낮추려면 파일 | 다른 이름으로 저장 대신 파일 | 내보내기를 사용하십시오.
    • 모든 비디오 파일에는 명확한 자막이 있어야 한다. 무료 오픈 소스 비디오 편집기 Kdenlive는 자막을 삽입할 수 있다.
    • 오디오 파일의 품질은 무료 오픈 소스 Audacity를 사용하여 향상될 수 있습니다.
    • Obscure media files should be converted into more common file types by using the tool Adapter (for Mac and Windows).
    • Images should be reduced without compromising image quality. Free image editing software Paint.NET, Photopea, or TinyPNG can be used. In addition, a rather quick-and-dirty way (with less flexibility, but it does the basics) is to use MS Office.
    • If saving a PowerPoint presentation as a video, use File | Export (rather than File | Save As) so that the screen resolution can be reduced.
    • All video files should have clear subtitles. The free, open-source video editor Kdenlive can insert subtitles.
    • The quality of audio files can be improved using free, open-source Audacity.
  • MS-Word에는 접근성 검사기가 내장되어 있습니다. 사용 방법과 MS-Word 문서에 보다 쉽게 액세스할 수 있도록 하기 위한 팁에 대한 자세한 내용은 https://support.microsoft.com/en-us/office/make-your-word-documents-accessible-to-people-with-disabilities-d9bf3683-87ac-47ea-b91a-78dcacb3c66d. . . .를 참조하십시오.
  • MS-Word has an in-built accessibility checker. For more details on how to use it and tips for making your MS-Word documents more accessible, see https://support.microsoft.com/en-us/office/make-your-word-documents-accessible-to-people-with-disabilities-d9bf3683-87ac-47ea-b91a-78dcacb3c66d. . . . .

언어와 문화
Language and culture

  • 준비된 자료의 [학생 언어 수준]은 수용되어야 한다. 이것은 명백한 피드백 없이 비동기 교육에 의존하기 때문에 특히 중요하다. 언어 확인의 경우, 언어 난이도를 확인하는 자동 시스템이 완벽하지는 않지만 유용하다. 자세한 내용은 부록 1을 참조하십시오.
  • Student language levels in prepared materials need to be accommodated. This is especially important because of the reliance on asynchronous teaching without obvious feedback. For language-checking, although automatic systems that check language difficulty are not fool-proof, they are useful. See Supplementary Appendix 1 for details.
  • 소재의 문화적 민감성은 수용될 필요가 있다. 특정 이슈는 특정 상황과 관련될 것이지만, 우리는 교사들에게 이슈에 대해 경고하는 과정을 시작할 몇 가지 논문을 추천할 수 있다. 여기에는 다음이 포함됩니다
  • Cultural sensitivities of material need to be accommodated. The particular issues will be related to the specific circumstances, but we can recommend a few papers that will begin the process of alerting teachers to the issues. These include (Liu et al. 2010; Torras and Bellot 2017; Kumi-Yeboah 2018).

재료의 부피
Volume of the material

  • 대면에서 온라인으로의 전환을 서두르는 가운데 대부분의 강사들은 자료를 모두 온라인으로 옮겼고 자료량도 거의 조정하지 않았다. 이것은 보건 전문가 자격을 얻기 위해 숙달되어야 할 자료이기 때문에 이해할 수 있다. 그러나 온라인 학습은 다른 수준의 집중력을 요구한다. 대면 회의와 온라인 회의 사이에 요구되는 집중도의 차이만 생각하면 되고 매일 몇 시간씩 온라인 수업을 듣는 것을 상상하면, 온라인 학습 피로감으로 이어진다. 이 때문에 전달량을 줄이고, 보다 간결하게 하며, 예시와 재미있는 일화를 적게 하고, 특히 1시간이 넘는 수업에서 쉬는 시간을 더 자주 줄 필요가 있다.
  • In the rush to convert from face-to-face to online, most instructors moved all their material online and made few adjustments to the amount of material. This is understandable, as the view is that this is the material that needs to be mastered in order to qualify as a health professional. Online learning requires different levels of concentration, however. One only has to think of the differences in the concentration required between face-to-face meetings and online meetings and imagine attending several hours of online classes every day, leading to online learning fatigue. For this reason, it is necessary to reduce the amount of material delivered, be more succinct, have fewer illustrative examples and interesting anecdotes, and give more frequent breaks, especially in classes that go over an hour.
  • 콘텐츠에 대한 논의는 시간, 특히 스크린 타임에 대한 논의로 이어진다. 팬데믹 이전에 연구자들은 연구 결과가 엇갈리지만 장시간 상영으로 인한 건강 영향에 대해 우려했다. 컴퓨터 비전 증후군(CVS), 디지털 눈의 피로(DES) 및 기타 신체적 문제가 광범위하게 연구되었으며, 일부는 화면 시간 연장과 강한 연관성을 보여주었다. 미국 검안학회는 20-20-20 규칙을 권장하고 있다("매 20분마다 20피트 떨어진 곳을 보려면 20초 휴식을 취하십시오."). 다른 많은 연구들은 의대생들의 과도한 인터넷 사용을 "중독"으로 규정할 정도로 의대생들이 온라인에서 보내는 시간의 양에 대해 우려했고, 현재의 취업 가이드는 매시간 5-10분 휴식을 권장하고 있으며, "이상적으로, 사용자는 휴식 시간을 선택할 수 있어야 한다."(HSE.d)
  • The discussion of content leads to a discussion of time, specifically screen-time. Before the pandemic, researchers were concerned about the health impact of prolonged screen-time, although the results of studies are mixed (Victorin 2018; Orben and Przybylski 2019; Lanca and Saw 2020). Computer vision syndrome (CVS), digital eye strain (DES) and other physical problems have been widely studied, and some have shown a strong association with prolonged screen-time (Sheppard and Wolffsohn 2018; Al Tawil et al. 2020; Sánchez-Valerio et al. 2020). The American Optometric Association recommends the 20-20-20 rule (“take a 20-second break to view something 20 feet away every 20 minutes”)(AOA n.d.). Many other studies were concerned about the amount of time medical students spent online, even to the point of labelling heavy Internet usage by medical students as an “addiction” (Masters et al. 2021), and current employment guides recommend a 5–10 minute break every hour, and “Ideally, users should be able to choose when to take breaks.” (HSE n.d.)
  • 스크린 타임 해악에 대한 이러한 우려를 고려할 때, 글로벌 의료 교육이 의료 교육 기관과 교사들에게 적합할 때 스크린 기반 학습으로 전환되어, 이전보다 훨씬 더 많은 온라인 시간으로 이어진 것은 이상하고 불안할 정도로 아이러니하다. 이전에는 수업 일정이 대면 시간을 위해 설계되었으며, 전환 과정에서 이러한 일정이 축소되었다는 징후는 없습니다. 스크린 타임 문제는 때때로 과장되었을 수 있고, "중독"은 제대로 정의되지 않은 것으로 나타났지만, 여전히 학생들이 화면을 보는 데 소비하는 시간의 양에 대한 우려가 있고, 윤리적인 의학 교사들은 그것을 인지해야 하며, 가능한 피해를 완화하기 위해서는 학생들(그리고 그들 자신)은 스크린 타임의 양이 적절할 필요가 있다. 
  • Given these concerns about screen-time harm, it is then strangely and disturbingly ironic that global medical education switched to screen-based learning when it suited medical education institutions and teachers, leading to far greater online time than before. Previously, class schedules had been designed for face-to-face time, and, in the transition, there is no indication that these were reduced (Stojan et al. 2021). While the screen-time issues may have sometimes been over-stated, and the “addiction” has been shown to be poorly defined, (Masters et al. 2021) there is still a concern about the amount of time students spend viewing a screen, and ethical medical teachers need to be aware of it, and require an appropriate amount of screen time from their students (and themselves), in order to mitigate possible harm.

제도적 문제 및 지원
Institutional issues and support

  • 운영 체제(OS)의 범위와 함께, 기관은 어떤 것이 지원되는지 명확하게 표시해야 하며, 개별 교사들은 모든 자료가 공식적으로 지원되는 모든 OS가 액세스할 수 있는 형식으로 되어 있는지 확인해야 한다.
  • With the range of Operating Systems (OSs), the institution needs to clearly indicate which are supported, and individual teachers must ensure that all materials are in a format that can be accessed by all of the officially-supported OSs.
  • 학생들이 필요로 하는 전문 소프트웨어는 가능한 한 무료이거나 대학 라이센스로 보장되어야 한다(웹 기반의 경우 다른 브라우저에서 소프트웨어를 테스트하는 것도 필요하다). 그렇게 하지 않으면 윤리적 학생을 처벌하거나 불법 복제(및 고위험) 소프트웨어 버전을 얻으려는 학생들의 비윤리적인 행동을 조장한다.
  • As far as possible, specialised software required by the students should be either free or covered by a University licence (If web-based, it is also necessary to test the software on different browsers). Failure to do so punishes the ethical student or encourages unethical student behaviour as they attempt to obtain pirated (and high-risk) versions of the software.
  • 인용, 참조, 저작권 문제를 고려할 필요가 있다. 대면 교육에서, 일부 자유는 받아들여지고 용서된다; 온라인 과정에서는, 이것들은 더 엄격하게 시행될 것으로 기대되며, 이것들을 지배하는 규칙들은 우리가 학생들에게 기대하는 기준과 같거나 더 높아야 한다. 특히 저작권 문제는 법적 영향을 미칠 수 있으므로 기관의 법무 부서에 대한 접근이 필요할 수 있습니다. 어떤 경우에는 기관이나 심지어 주에서도 LMS 내에 남아 있는 한 저작권으로 보호된 자료를 사용할 수 있는 특별한 권리를 가지고 있다.
  • Citing, referencing and copyright issues need to be considered. In face-to-face teaching, some liberties are taken and forgiven; in online courses, these are expected to be more strictly enforced, and the rules governing these should be of the same as, or higher than, the standard we expect from our students. Copyright issues, in particular, may have legal implications, so access to the institutions’ legal department may be required. In some instances, institutions or even states have particular rights to use copyrighted material as long as it remains within the LMS.
  • 위의 요점과 관련하여, 귀하가 생산하는 자료의 지적 재산, 기관의 다른 부분에서 생산된 자료 및 생성된 데이터에 관한 기관의 규칙과 법률을 숙지하는 것이 필수적입니다. 이 문제들은 당신의 자료 사용에 심각한 결과를 초래할 수 있기 때문에, 이러한 문제들에 대해 애매한 확신을 얻는 것만으로는 충분하지 않다. 이는 환자 데이터를 다룰 때 점점 더 중요해지고 있습니다.
  • Related to the above point, it is essential that you are familiar with your institutions’ rules and laws regarding the intellectual property of materials you produce, materials produced by other parts of the institution, and data that are generated. It is not enough to get vague assurances on these issues, as they can have serious consequences for your use of material. This becomes increasingly important when working with patient data.
  • ERT 동안, 많은 교사들은 온라인으로 가르치는 것이 그들의 교육 전략과 접근법에 대한 재평가를 필요로 하고, 온라인 가르치는 것은 그들이 훈련받지 않은 교육적 접근을 필요로 한다는 것을 깨달았다. 이에 따라 교육이론에 초점을 맞춘 교육 워크숍 및 기타 교육 개입이 요구될 것이다. 비록 제도적 지원에 초점을 맞추겠지만, 동료들의 동료 지지는 (non-judgmental한 방식으로 수행되는 한) 대학 지원의 접근과 함께 매우 귀중하다는 것이 입증될 수 있다. 이것들이 없다면, 교사들이 그들이 하고 있는 피해에 대해 알지 못한 채 그들의 예감을 따를 위험이 있다. 이는 교육 방법이 비표준 강의인 영역(예: PBL, TBL)에서 특히 중요합니다(이 가이드의 마지막 부분에서 조금 더 자세히 다룹니다).
  • During ERT, many teachers came to realise that teaching online required a reassessment of their teaching strategies and approaches, and online teaching requires educational approaches for which they were not trained. As a result, educational workshops and other training interventions focusing on educational theory will be required. Although the focus will be on institutional support, peer support from colleagues can prove invaluable, as long as it is performed in a non-judgmental manner, with the approach of collegial support. Without these, there is the risk that teachers will follow their hunches, without being aware of the damage they are doing. This will be especially important in areas where the teaching methods are non-standard lectures (e.g. PBL, TBL) (This is dealt with in a little more detail near the end of this Guide).
  • 위의 요점과 유사하게, 훨씬 더 많은 기술 지원과 교육을 이용할 수 있어야 합니다. 많은 직원이 스스로 기술적 트릭을 발견했지만, 부족한 부분을 보완하고 기술 사용에 대한 모범 사례로 전환해야 합니다. 그렇게 하지 않으면 기술 사용은 저조하고 심지어 유해한 결과를 초래할 것이다.
  • Similar to the point above, far greater technical support and training will need to be available. Many staff will have discovered technical tricks for themselves, but there is a need to fill in the gaps and also to move towards best practices in the use of technology. Failure to do so will result in technology use, but poor, and even harmful, use.

자신의 프로필 보안
Securing one’s own profile

물질적 접근성을 보장하는 것과는 다소 대조적으로, 보안을 유지하는 윤리적 필요성이 있다. ERT 동안, 교수자들이 [업무와 관련된 목적으로 개인 기기를 사용하는 것]을 발견했고, 이것은 새로운 우려를 낳았다. 수행할 단계는 다음과 같습니다.
Somewhat contrasted to ensuring material accessibility, there is the ethical imperative of maintaining security. During ERT, medical teachers found themselves using their personal devices for work-related purposes, and this introduced new concerns. Steps to take include:

  • 가정의 다른 거주자가 개인 기기를 사용할 수 없도록 하십시오. 기기가 있는 곳에서는 시간 초과와 함께 다른 프로파일이 존재하는지 확인하십시오.
  • 가정용 장치 및 계정은 업계 표준 암호로 보호되어야 하며, 정기적으로 변경해야 합니다(또는 암호가 손상된 것으로 의심되는 경우). 이는 온라인 교육 시스템에 액세스하는 데 점점 더 많이 사용되는 모바일 장치에서 특히 중요하다.
  • 특히 외장 드라이브에 저장된 경우 중요한 데이터는 모두 암호화해야 합니다.
  • 홈 네트워크가 제대로 보호되고(최소한 방화벽이 활성화되어야 함), Wi-Fi 모뎀에 대한 액세스가 암호로 보호되어야 하며 Bluetooth 연결은 사용 중일 때만 활성화되어야 합니다.
  • Ensure that private devices at home are not accessible to other residents in the home; where they are, ensure that different profiles exist on these, with time-outs.
  • Home devices and accounts must be secured with industry-standard passwords, and these should be changed regularly (or if you suspect they have been compromised). This is particularly important for mobile devices that are increasingly used to access online education systems.
  • All sensitive data, especially if stored on external drives, should be encrypted.
  • Ensure that home networks are properly secured (at the very least, the firewall should be activated), access to Wi-Fi modems should be password-protected, and Bluetooth connections should be activated only when in use.

 

상호 작용 방법
Methods of interaction

일반적으로 교육적 온라인 상호 작용에는 두 가지 방법이 있다. 

  • 동기식(일반적으로 Big Blue Button, Google Meet, Microsoft Teams 또는 Zoom과 같은 라이브 비디오 시스템을 통해 실시간 상호 작용), 일반적으로 대화형 강의 또는 대화형 강의의 형태(Stojan et al. 2021), 
  • 비동기식(예: 미리 만든 프레젠테이션 또는 비디오) 경우에 
  • 따라 두 가지를 동시에 사용할 수 있습니다.

In general, there are two methods of educational online interaction:

  • synchronous (live interaction, usually through live video systems like Big Blue Button, Google Meet, Microsoft Teams or Zoom), usually in the form of an interactive or non-interactive lecture (Stojan et al. 2021), and
  • asynchronous (e.g. pre-created presentations or videos).
  • In some cases, both might be used simultaneously.

각 형식은 해결해야 할 윤리적 문제를 제기하며, 이 중 일부는 물리적 현실에 의해 결정된다. 예를 들어, Binks 등의 연구는 많은 학생들이 동기식 수업을 선호한다는 것을 보여주었다. 그러나 이 연구는 미국과 영국의 매우 자원이 풍부한 의과대학 학생들 사이에서 수행되었으며, 주로 PBL을 교수법으로 사용했다. 따라서, 그들은 전 세계 모든 교사들의 현실을 반영하지 않을 수 있다. 이것은 학생들이 전통적으로 도시 지역보다 기술적으로 자원이 부족하고 정전과 인터넷 장애에 더 취약한 시골 지역에 위치한 경우에 특히 적절하다. 그 결과, 비디오나 오디오가 내장된 파워포인트(또는 라이브 강의가 녹음되어 LMS에 게시됨)로 사전 녹화된 강의가 선호되기도 한다.
Each format raises ethical issues that need to be addressed, and some of these are dictated by physical reality. For example, a study by Binks et al. (2021) indicated that many students preferred synchronous classes. That study, however, was performed among students from some extremely well-resourced medical schools in the USA and UK, mostly using PBL as their teaching method; as such, they may not reflect the reality for all teachers across the Globe. This is particularly pertinent if students are located in rural areas that are traditionally technologically less well-resourced than urban areas, and more susceptible to power outages and Internet disruptions. As a result, pre-recorded lectures, either as video or PowerPoint with embedded audio (or live lectures that are then recorded and posted to the LMS) are sometimes preferable (Mann et al. 2020; Nkomo and Daniel 2021).

윤리적 온라인 교육을 위해서는 두 가지 선택사항이 모두 고려되어야 한다. 동기식으로 가르칠 때, 교수자 자신의 윤리적 행동이 가장 중요하다. 비록 자신의 윤리적 행동이 자동적으로 학생들의 윤리적 행동으로 바뀔 것이라고 믿는 것은 순진하지만, 비윤리적으로 행동하고 학생들에게 윤리적 행동을 요구하는 것은 위선적이다. 고려해야 할 문제는 다음과 같습니다.
For ethical online teaching, then, both options have to be considered. When teaching synchronously, your own ethical behaviour is paramount. Although it would be naïve to believe that one’s own ethical behaviour will automatically translate into ethical behaviour by students, it is hypocritical to behave unethically and demand ethical behaviour from your students. Issues to consider are:

수업 전
Prior to the class

  • 출석, 주소 형식, 학생 및 환자 기밀 유지, 복장 규정, 행동, 마이크 및 비디오 설정, 참여, 휴식 등에 대한 모든 기대가 커리큘럼 개요(위에서 논의됨)에 명확하게 명시되어 있는지 확인합니다. 이 과정의 시작부에서, 학생들에게 수업에서 가장 중요한 것들을 상기시켜라.
  • Ensure that all expectations about attendance, forms of address, student and patient confidentiality, dress codes, behaviour, microphone and video settings, engagement, breaks, etc. have been clearly stated in the Curriculum Outline (discussed above). In the earlier part of the course, remind students of the most important of these in the class.
  • 세션을 녹화하려는 경우, 이 내용이 커리큘럼 개요에도 명시되어 있는지 확인하고 녹화를 켤 때 학생들에게 알려주십시오(많은 시스템에서 자동으로 녹화가 진행 중임을 알려주고 표시하지만, 이 내용도 구두로 명시해야 합니다). 일부 국가 및 기관은 정보에 입각한 동의와 관련하여 더 엄격한 법적 요구 사항(예: 종이)을 가지고 있을 수 있으며, 이러한 요구 사항 내에서 상호 작용을 수행해야 합니다.
  • If you intend to record the session, ensure that this is also stated in the Curriculum Outline, and advise your students when you turn on the recording (Many systems do automatically advise and display an indication that recording is in progress, but you should verbally state this, also). Some countries and institutions may have stricter (e.g. paper) legal requirements regarding informed consent, and you will need to conduct your interactions within those requirements.
  • 또한 커리큘럼 개요에 학생들의 활동 기록 및 학생들의 녹음 작업에 대한 행동에 대한 정보가 포함되어 있는지 확인합니다.
  • Ensure that your Curriculum Outline also contains information about students’ recording of activities, and their behaviour regarding what they may do with your recordings.
  • 초청된 모든 연사가 윤리적 문제에 대해 완전히 인식하고 이에 동의하는지 확인합니다.
  • Ensure that any invited speakers are fully aware of the ethical issues, and are in agreement with them.
  • 수업 시간보다 훨씬 전에 도착하여 수업 영역을 오픈할 시간을 가지십시오. 수업에 대한 링크가 작동하는지 확인합니다(테스트 학생 계정을 사용합니다. 일부 LMS에 있는 "학생 보기"를 신뢰하지 마십시오). 수업 중에 필요한 폴더, 파일 및 소프트웨어를 엽니다(특히 학생들을 기다리는 동안, 항상 마이크가 켜져 있고 화면이 브로드캐스트되고 있다고 가정하십시오. 그렇지 않으면 심한 충격을 받을 수 있습니다.)
  • Arrive well before the time, so that you have time to open the class area, check that the link to the class is working (use a test student account for this – do not trust the “Student View” that exists in some LMSs), and open up any folders, files and software that you will need during the class (A tip, especially while waiting for students: always assume that your microphone is on and your screen is being broadcast, otherwise you may have a nasty shock).
  • 일부 설정은 다른 기능에 영향을 미칩니다. 예를 들어 줌에서 포인트 투 포인트 암호화를 사용하면 컴퓨터에 녹화할 수 있지만 클라우드 녹화가 비활성화됩니다.
  • Be aware that some settings affect other functionality. For example, in Zoom, using point-to-point encryption disables cloud recording although recording to your computer is still possible.
  • 모든 파일을 다운로드하고 학생들이 수업 중에 다운로드하거나 액세스해야 하는 웹 사이트에 액세스합니다. 이렇게 하면 올바른 파일을 사용할 수 있고, 올바른 폴더에 파일을 저장할 수 있으며, 사이트가 작동하는지 확인할 수 있습니다. 개인 컴퓨터를 사용하는 경우 부적절한 파일이나 폴더가 표시되지 않는지 확인합니다.
  • Download any files and access any websites that you will require the students to download or access during the class – this will ensure that the correct files are available, that you can put them in the correct folders, and that sites are functioning. If you are using your personal computer, ensure that no inappropriate files or folders are visible.
  • 클래스에 대한 과정 이름과 주제를 제공하는 [보류 페이지]를 표시합니다(단순 PowerPoint 슬라이드일 경우에도). 이것은 학생들이 입장했을 때 올바른 수업에 있다는 것을 안심시킬 것이다.
  • Display a holding page (even if it is simply a PowerPoint slide) that gives the course name and topic for the class. This will reassure students that they are in the correct class as they enter.
  • 채팅 영역을 열고, 학생들이 문제가 있어 귀하에게 연락할 필요가 있을 경우 계속 주시하십시오(또한 학생이 교습 영역에 전혀 들어갈 수 없는 경우 다른 커뮤니케이션 채널을 모니터링해야 합니다).
  • Open the chat area, and keep an eye on it in case students are having problems and need to contact you (Also ensure that you monitor other communication channels, in case the students cannot enter the teaching area at all).
  • 모든 참가자를 "음소거"로 설정하지만, 선택한 경우 음소거 해제를 허용합니다.
  • Set all participants to “mute,” but allow them to unmute if they choose.

수업중
During the class

  • 비디오 카메라 전송에 대한 결정이 필요합니다. 비록 많은 학생들이 당신의 비디오 이미지를 보기를 선호하지만, 그것은 밴드 위드(band-with)를 사용하기 때문에, 수업을 시작하기 전과 시작할 때에만 카메라를 켜고 수업이 시작되면 그것을 끄기를 원할 수도 있다.
  • A decision will need to be made on your video camera transmission. Although many students prefer to see your video image, it does consume band-with, so you may wish to have your camera on only before and as you start class, and then turn it off once the class begins.
  • 학생 카메라 설정이 더 어렵습니다. 학생들의 카메라가 켜져 있으면 상호작용이 자주 개선되지만, 이것은 불필요하게 방해될 수 있다. 또한, 카메라를 켤 때 근로자들이 더 피곤하다는 연구 결과도 있다. 따라서 꼭 필요한 경우가 아니라면 학생들이 카메라를 끄도록 허용하는 것을 고려해야 한다. 여러분은 학교의 규칙, 개인적인 선호, 그리고 학생들의 바람의 균형을 맞출 필요가 있을 것입니다.
  • Student camera settings are more difficult. Although the interaction is frequently improved if students’ cameras are on, this may be unnecessarily intrusive. In addition, there is some research indicating that workers are more fatigued when cameras are on (“Zoom fatigue”) (Fauville et al. 2021; Shockley et al. 2021), so, unless it is absolutely necessary, one should consider permitting students to turn off their cameras. You will need to balance your institutions’ rules, personal preferences and the students’ wishes.
  • 채팅 영역에서 묻는 질문에 답할 때는 질문에 답하기 전에 항상 학생의 이름을 사용하십시오. 법적, 제도적 또는 합의된 형태의 주소가 있을 수 있으며, 이러한 것들이 따라야 한다.
  • When replying to questions asked in the chat area, always use the student’s name before answering the question. There may be legal, institutional, or agreed-to forms of address, and these need to be followed.
  • 때때로, 학생들은 의견을 말하거나 질문을 하기 위해 손을 들 것이다. 이 점이 만족스럽게 해결된 후, 학생은 들어올린 손(때로는 "legacy hand"이라고도 함)을 제거하는 것을 잊어버릴 수 있습니다. 이것은 학생에게 약간의 당혹감을 줄 수 있기 때문에, 요점이 해결된 후에, 선생님은 수동으로 손을 내릴 수 있다(이렇게 할 것이라는 것은 온라인 수업 에티켓의 일환으로 학생들에게 알려져야 한다).
  • Occasionally, a student will raise their hand to comment or ask a question. After the point has been satisfactorily addressed, the student may forget to remove the raised hand (sometimes termed a “legacy hand”). This can result in some embarrassment for the student, so, after the point has been addressed, the teacher can manually lower the hand (That the teacher will do this should be made known to the students as part of the online class etiquette).
  • 소규모 그룹 작업을 사용하는 경우, 사용자(또는 튜터)가 각 그룹에 유사한 시간을 할애할 수 있는지 확인하십시오.
  • If using any type of small group work, ensure that you (or tutors) are able to devote similar time to each group.

수업이 끝난 후
After the class

  • 수강생에게 개인정보 유출을 요구하는 경우, 종단간(또는 지점간) 암호화가 가능한 시스템을 사용하고, 최종 녹취록에서 편집이 필요한지 확인한 후 수강생에게 게시한다.
  • If the class requires students to divulge personal information, then use a system that permits end-to-end (or point-to-point) encryption, and check the final recording to see if it requires editing before posting it to the class.
  • 일부 동기화 시스템은 자동 또는 수동 실시간 캡션을 허용하고, 다른 동기화 시스템은 미팅 후에 사용할 수 있는 텍스트 스크립트를 만듭니다. 비록 그 녹취록은 오류가 있을 것이지만, 선생님이 분명하게 말한다면, 그것은 놀랍도록 정확하다 (그러나, 몇몇 이름들은, 문제가 있을 수 있다). 시스템의 특성을 고려할 때, 이것은 범죄를 일으킬 가능성이 낮다; 만약 그렇다면, 간단한 검색-바꾸기로 이러한 문제를 해결할 수 있다).
  • Some synchronous systems allow for automatic or manual live captions; others create a text transcript that is available after the meeting. Although that transcript will have errors, it is surprisingly accurate, if the teacher speaks clearly (Some names, however, may have problems. Given the nature of the system, this is unlikely to cause offence; if it does, then a simple Search-and-Replace can correct these).
  • 수업이 끝난 후 가능한 한 빨리 녹음(및 대화록 및 대화 파일)을 수업에 사용할 수 있도록 해야 합니다.
  • As soon as possible after the class, the recording (and the transcript and chat files) should be made available for the class.
  • 수업 중에 기밀 또는 기타 허용되지 않는 자료 공개가 이루어진 경우 게시하기 전에 비디오를 편집해야 합니다. 유용하고 무료인 비디오 편집자는 Kdenlive(https://kdenlive.org. . . . . )이다.
  • If, during the class, confidential or other unacceptable disclosure of material was made, then the video should be edited before posting. A useful and free video editor is Kdenlive (https://kdenlive.org. . . . ).


[비동기적]으로 가르칠 때는 파일 형식에 대한 위의 절을 참조하여 모든 파일을 볼 수 있도록 하십시오. 추가 사항:
When teaching asynchronously, please refer to the section above on file formats to ensure that all your files can be viewed. In addition:

  • 사전녹화의 목적은 선생님에게 상황을 더 쉽게 만드는 것이 아닙니다. 어떤 경우에는, 자신의 존재를 유지하고 모든 학생들에게 필요한 자료의 접근성을 유지하는 것이 훨씬 더 어려울 것이다. 즉각적인 학생 피드백이 없다면, 초보자들이 너무 일찍 녹음을 준비하는 것은 현명하지 못하다. 왜냐하면 학생 피드백은 교사가 미래의 녹화를 위해 녹음 오류를 쉽게 수정할 수 있게 할 것이기 때문이다.
  • The aim of pre-recording is not to make things easier for the teacher. In some cases, it will be a great deal harder to maintain one’s presence, and ensure that the necessary materials’ accessibility for all students is maintained. With no immediate student feedback, it is unwise for the novice to prepare recordings too far in advance, as student feedback will allow the teacher to easily correct recording errors for future recordings.
  • 너무 뒤처진 학생들은 따라잡는 데 큰 어려움을 겪을 것이기 때문에, 학생들의 활동을 추적하고 즉각적인 조치를 취하는 것은 필수적이다.
  • Tracking student activities, and taking immediate action, is essential (more on that below), as students who fall too far behind will have great difficulty in catching up.
  • 녹화의 시작 화면에는 예상 시간과 이 클래스와 관련된 기타 활동이 정확하게 표시되어야 합니다. 이를 통해 학생들은 각 세션에 대한 시간을 적절하게 편성할 수 있고, 또한 미리 세션을 적절하게 준비할 수 있도록 할 것이다.
  • The opening screen of the recording should give an accurate indication of the time expected, and any other activities that are associated with this class. This will allow students to properly budget their time for each session, and also to ensure that they can properly prepare for the session beforehand.

다른 교호작용도 고려해야 합니다. 정규 수업 외에도, 여러분은 다른 매체를 통해, 때로는 LMS에 내장되어 있고, 때로는 외부 매체를 통해 학생들과 상호 작용을 할 것입니다. 고려해야 할 몇 가지 사항은 다음과 같습니다.
Other interactions must also be considered. In addition to formal classes, you will have interactions with your students through other media, sometimes built into the LMS, and other times external. Some things to consider are:

  • 자료에서 언어 수준에 대한 참조가 이미 이루어졌다. 포럼과 이메일을 통해 학생들과 소통할 때, 특히 모국어가 아닌 사용자(또는 다양한 배경의 모국어 사용자)가 예의 바른 언어 신호를 종종 놓치고, 쓰여진 텍스트를 읽을 때 무례하게 보일 수 있다는 것을 기억해야 한다. 표현을 극도로 조심해라. 필러 문구(예: "유감스럽지만…")가 혼동을 일으키지 않도록 하십시오.
  • Reference has already been made to language levels in the materials. When communicating with students through forums and email, one must remember that courtesy language signals (which, in spoken interactions, would be identified in an audio tone) are often missed, especially by non-mother-tongue speakers (or mother-tongue speakers from a range of backgrounds), and may come across as rude when reading written text. Be extremely careful in your phrasing. Ensure that filler-phrases (e.g. “I’m afraid that….”) do not cause confusion.
  • 학생들의 의사소통을 읽을 때, 마음을 열고 무례하게 보이는 것에 대해 화를 내는 것을 늦추세요. 일반적으로 사람들은 낯선 언어를 사용할 때 메시지에 집중하는 경향이 있고, 문법과 예의를 잃는다. "Please"와 같은 단어는 때때로 단어보다는 어조에 내포되어 있으므로, "I want..."는 "Please may i have..."와 동등합니다. 대부분의 언어와 마찬가지로 영어에서도 비슷한 의미의 단어와 구(예: "상관없어"/"상관없어"/"내 문제가 아니야"/"내 잘못이 아니야") 사이에 중요한 차이점이 존재하며, 이러한 중요한 차이점들은 모두에게 즉시 명백하지 않다. 게다가, 구어와 문자의 구별이 항상 명확한 것은 아니다 (그래서 문자 메시지 약어를 제외하고, "gonna"와 "wanna"와 같은 단어들은 어떤 사람들에게는 부적절하지만, 다른 사람들에게는 완벽하게 받아들여질 수 있다). 가장 안전한 방법은 항상 그 사람이 범죄를 의도하지 않았다고 가정하는 것이다.
  • When reading your students’ communication, keep an open mind, and be slow to take offence at seeming rudeness. Generally, when people are using an unfamiliar language, they tend to focus on the message, and the grammar and courtesies are lost. Words like “Please” are sometimes implied in the tone rather than by a word, so “I want…” is an equivalent of “Please may I have…”. In English, as with most languages, there are important differences between similar-meaning words and phrases (e.g. “I don’t care”/“I don’t mind”; “It’s not my problem”/“It’s not my fault”), and these significant differences are not immediately apparent to all. In addition, the distinction between spoken and written is not always clear (so, apart from text-message abbreviations, words like “gonna” and “wanna” may be seen as inappropriate to some, but perfectly acceptable to others). The safest route is always to assume that the person does not intend offence.
  • 비기관 메시징 앱은 전화 번호를 자주 표시하므로 개인 정보 보호라는 윤리적 문제가 있을 수 있습니다. 특히 유용한 무료 앱은 Band(https://band.us/en. . . )로, 다른 메시징 앱처럼 작동하지만 전화번호는 표시되지 않으며 교사들에게 유용한 다양한 추가 기능을 갖추고 있다. 앱을 사용할 때(외부 소프트웨어와 마찬가지로) 데이터 공유 정책이 잘 이해되고 허용될 수 있도록 주의해야 한다.
  • Non-institutional messaging apps frequently display telephone numbers, so may have ethical issues of privacy. A particularly useful free app is Band (https://band.us/en. . . . ) which works like any messaging app, but does not display telephone numbers, and has a wide host of extra features that are useful for teachers. When using any app (as with any external software), one should take care to ensure that the data-sharing policies are well-understood and acceptable.
  • 개인 전자 메일도 사용할 수 있지만, 과정 내용에 대한 학생 질문에 답변할 때 주의해야 합니다. 부당하게 혜택을 받는 학생이 없도록 (학생을 식별하지 않고) 질문을 과정 포럼 메시지에 복사하여 붙여넣고, 그 다음에 답을 제시합니다. 이렇게 하면 모든 학생이 질문과 대답을 볼 수 있을 뿐만 아니라 전자 메일로 보낸 쿼리의 중복 수도 줄어듭니다.
  • Private email can also be used, but care should be taken when answering student questions about course content. To ensure that no student is unfairly advantaged, copy-and-paste the question (without identifying the student) into a course forum message, followed by the answer. This not only ensures that all students see the question and answer but also reduces the number of duplicates of emailed queries.
  • 학생들이 모이는 너무 많은 온라인 영역에 접근하는 것을 경계하라, 왜냐하면 그것은 "소름끼치는 나무집 효과"로 이어질 수 있기 때문이다.
  • Be wary of accessing too many online areas where your students congregate, as it can lead to the “creepy-treehouse effect.”

학생에 대한 피드백
Feedback to students

학생에 대한 피드백은 의학교육에서 중요한 부분이며, 온라인교육에서 더욱 중요한 역할을 한다. 왜냐하면 온라인교육은 학생들이 그 과정의 형성과 종합적 진행과 그들의 기술발달에 대해 제대로 알 수 있도록 하는 데 중요한 역할을 하기 때문이다. 이것은 과정의 많은 부분이 비동기적으로 학습되는 경우에 특히 중요하다. [학생의 발전을 보장하는 방식으로 피드백]을 수행하기 위해 다음과 같은 몇 가지 작업을 수행할 수 있습니다.

Feedback to students is a crucial part of any medical education (Harden and Laidlaw 2013), and is more so in online education, as it plays a vital role in ensuring that students are properly informed of their formative and summative progress in the course and their skills’ development. This is especially important if much of the course is taught asynchronously. To perform feedback in a manner that ensures student development, several things can be done:

  • 라이브로 일대일 세션을 진행할 수 있으며, 이러한 세션은 가치가 있다는 것을 증명할 수 있습니다. 고려해야 할 몇 가지 문제:
  • Live, one-to-one sessions can be held, and these can prove valuable. Some issues to consider:
    • 가상 오피스 아워를 설정합니다. 이는 강좌가 정해진 구조를 가지고 있으며, 학생들이 이를 활용해야 한다는 점을 강조할 것이다.
    • Set virtual office hours. This will emphasise that the course has a set structure, and students should utilise it.
  • 많은 경우, 토론이 심도 있게 진행될 것이고, 여러분과 여러분의 학생 모두 필기보다는 토론에 집중하고 싶어할 것입니다. 만약 학생이 당신이 녹음을 만드는 것에 만족한다면, 녹음을 만들고 가능한 한 빨리 그 학생과 공유하세요.
  • In many cases, the discussion will be in-depth, and both you and your student will want to concentrate on the discussion rather than taking notes. If the student is happy with your making a recording, then make one, and share it with that student as soon as possible.
  • 암호화. 이러한 세션은 일반적으로 성적, 개인 성과 및 개인 정보에 대한 토론을 포함하므로 종단 간 암호화가 권장된다.
  • Encryption. As these sessions will usually involve discussions around grades, personal performance, and possibly deeply personal information, end-to-end encryption is recommended.
  • 실시간 일대다 세션도 중요합니다.
  • Live, one-to-many sessions are also valuable:
    • 과제와 시험에 대한 일반적인 피드백을 제공하기 위해.
    • For giving general feedback on assignments and tests.
  • 일대일과 유사하게 가상 사무실과 녹화가 선호된다.
  • Similar to the one-to-one, the virtual office and recording is preferable.
  • 일반적인 정기적인 피드백도 중요한 역할을 합니다.
  • General, regular feedback also serves an important role:
    • 매주 또는 최소 2주(모듈이 더 긴 경우)여야 합니다.
    • This should be per week or, at the very least, fortnight (if modules are longer).
  • 이 과정이 텍스트일 필요는 없으며, 미리 녹음된 오디오 및/또는 비디오 피드백이 대부분 비동기적으로 학습되는 경우 더욱 유용할 수 있습니다.
  • This does not have to be text only, and pre-recorded audio and/or video feedback can be useful, more so, if the course is largely taught asynchronously.
  • 이를 통해 다음 주에 예상되는 내용을 간략하게 소개할 수 있습니다.
  • This can be used as a brief introduction of what to expect in the next week.

온라인 관리 및 상담
Supervision and counselling online

기관의 자원과 학생들의 선호에 따라 윤리 의학 교사의 접촉은 피드백을 넘어 더 깊은 감독과 상담의 영역으로 넘어가야 할 수 있다. 모든 기관은 자체적인 규칙과 정책을 가질 것이지만, 교사가 고려해야 할 몇 가지 요소들이 있다.

Depending on the institutions’ resources and students’ preferences, contact from the ethical medical teacher may have to go beyond feedback, and into areas of deeper supervision and counselling. Every institution will have its own rules and policies, but there are several factors that the teacher should consider:

  • 학생들과의 정기적이고 예정된 모임은 온라인 수업의 중요한 요소이다. 그들은 학생들이 단순히 그들 스스로 일하는 것이 아니라 조직적인 활동의 일부라는 것을 깨닫도록 돕고, 선생님들이 그들의 학생들을 이해하도록 돕는다. 그것은 또한 학생들에게 단순히 학문적이지 않을 수도 있는 문제나 문제들을 제기할 수 있는 기회를 준다. 이러한 문제가 일대일 대화에서 제기되면 도움이 됩니다.
  • Regular and scheduled meetings with students are an important element of online teaching. They help the student to realise that they are part of organised activity, not simply working on their own, and it helps teachers to understand their students. It also gives the students the opportunity to raise issues or problems which may not simply be academic. It is helpful if these issues are raised in a one-to-one conversation.
  • 때때로, 학생들과 직접 접촉할 때와 마찬가지로, 우리는 [개별 학생과 더 긴밀하게 다뤄져야 하는 이슈가] 그룹 환경에서 노출되었다는 것을 깨닫는다. 이것은 개인적으로 다루는 것이 가장 좋다. 다음 그룹 또는 독립 활동 기간 동안 "브레이크아웃 룸"에 학생을 초대하는 것으로 충분할 수 있습니다. 만약 이것이 학생에게 관심을 끌거나 더 자세한 토론이 필요할 수 있다고 생각한다면, 차라리 개인 채팅 메시지, 문자 메시지 또는 이메일을 통해 학생을 개인 일대일 세션에 초대하십시오.
  • Sometimes, just as in face-to-face contact with students, we realise that an issue has arisen, or been disclosed in a group setting which needs to be covered more closely with an individual student. It is best if this can be done privately. It might be sufficient to invite the student to join you in a “breakout room,” during the next period of a group or independent activity. If you feel that this may draw attention to the student, or may require a more detailed discussion, then rather invite the student to a private one-to-one session through a private chat message, text message or email.
  • 이러한 세션은 반드시 암호화되어야 합니다.
  • It is essential that these sessions are encrypted.
  • 대부분의 기관들은 비록 기관들이 여러분이 대화에 대한 세부 사항을 제공하기를 기대할지 여부에 따라 다르지만, 여러분이 학생과 대화를 나눴다고 말하는 기록을 만들 것이라고 예상할 것이다. 일반적으로 대면 회의에서 적용되는 것과 동일한 방식으로 적용되는 [세 가지 고려 사항]이 있습니다.
  • Most institutions would expect that you make a record saying that you had spoken with a student, although institutions vary as to whether they expect you to give any detail of the conversation. There are three considerations, that would apply in the same way that they would normally apply in face-to-face meetings:
    • 학생은 어떤 정보를 기록하려고 하는지, 어떻게 사용될지, 누가 볼지를 항상 알고 있어야 하며, 학생의 동의가 있어야만 진행할 수 있습니다.
    • The student must always know what information you are intending to record, how it will be used and who will see it, and you can only proceed with their consent.
    • 만약 여러분이 더 유능하거나 경험이 많은 동료에게 추천하는 것이 도움이 될 것이라고 생각한다면, 여러분은 여러분 자신에게, 그리고 그 학생에게 분명히 할 필요가 있을 것입니다.
    • You will also need to be clear to yourself, and to the student if you feel that a referral to a more competent or experienced colleague would be helpful.
    • 물론 학생들은 도움을 거절할 수 있다. 이 경우 지원이 제공되고 거부된 사실을 기록해야 합니다.
    • Students can, of course, refuse help. In which case you will need to record the fact that support was offered and declined.

보다 심층적인 접근성
Deeper accessibility issues

접근성의 중요한 윤리적 원칙은 이미 제기되었고, 그것은 위에서 논의된 것보다 훨씬 더 멀리 간다. 교재를 접근 가능하게 만드는 것이 첫 번째 단계이지만, 학생들이 필요한 교재에 접근할 수 있는 기술적 전문 지식, 훈련 또는 법적 권리가 없고 온라인 학습의 추가적인 상호 작용 요구를 이해하지 못하면 접근성이 저하됩니다. 다음 세 가지 문제를 더 자세히 고려해야 합니다.
The important ethical principle of accessibility has already been raised, and it goes much further than has been discussed above. Making teaching material accessible is the first step, but, if students do not have the technical expertise, training or legal right to access the required material, and do not understand the extra interaction demands of online learning, then accessibility is compromised. These three issues should be considered in more detail:

학생 기술 전문 지식
Student technical expertise

파일 및 사용 편의성에 대한 언급이 이미 이루어졌습니다. 모든 학생들이 자연스럽게 기술에 익숙하다는 것은 흔한 오류이다; 많은 학생들은 그렇지 않고, 많은 학생들은 그것에 관심이 없다. 또한, 일부 학생들은 고립된 지역에서 일하고 있으며, 컴퓨터 소프트웨어의 교육 자료에 쉽게 접근할 수 없거나 기술 지원을 받을 수 없을 것이다. 따라서, 학생들이 지원 자료와 교직원을 이용할 수 있는 것이 필수적이다. 많은 과제들이 휴일이나 밤늦게 제출되도록 설정되어 있기 때문에, 시간외 지원도 가능해야 한다(사실, 온라인 학생의 세계에서는 "근무시간"과 "시간외"의 개념이 막연히 익숙하지만 기묘하게 구식 개념이라는 것을 알아야 한다).
Reference has already been made to files and ease of use. It is a common fallacy that all students are naturally familiar with technology; many are not, and many have no interest in it. In addition, some students are working in isolated areas, and will not have easy access to instructional material on computer software or access to technical support. As a result, it is imperative that supporting material and staff are available to students. Given that many assignments are set to be submitted after holidays and/or late at night, after-hours support should also be available (In fact, the institution needs to be aware that, in the world of the online student, the concepts of “working hours” and “after-hours” are vaguely familiar, but quaintly old-fashioned concepts).

학생 동료 작업
Student peer-work

매우 상호작용적인 온라인 과정은 포럼이나 공식 과제 영역에서 많은 양의 학생 작업을 발생시킬 수 있다. 이것은 형식적인 학생 동료 학습, 복습 및 평가를 위한 기회를 제공하지만, 학생들은 관련된 과정에 대해 적절하게 훈련되고 지도되어야 한다. 인터랙티브 화이트보드, 파워포인트 프리젠테이션 등 다양한 수업방식이 온라인 수업환경에서 적용될 수 있으므로, 학생 튜터student tutors는 온라인 수업에서 학생들과 상호작용하는 방법과 관련 정보를 전달하는 방법에 대해 교육을 받아야 한다. 또한 학생과 학생 튜터는 온라인 교육에 사용되는 소프트웨어(예: 줌 또는 마이크로소프트 팀)에 익숙해야 한다.
Highly-interactive online courses can generate a large amount of student work, either in the forums or in formal assignment areas. This does offer the opportunity for formative student peer-learning, reviewing, and assessment, but students must be properly trained and coached in the processes involved. Student tutors should be trained on how to interact with students in an online course and how to deliver the relevant information to them as different ways of teaching can be applied in the online teaching setting like interactive whiteboards, PowerPoint presentations, etc. Further, students and student tutors should familiarise themselves with the software used in online teaching (e.g. Zoom or Microsoft Teams).

학생이 저작권이 있는 참조에 액세스
Students’ accessing copyrighted references

학생들이 구매해야 하는 값비싼 소프트웨어를 사용하는 것을 피해야 하듯이, 유료 벽 뒤에 숨겨진 텍스트나 기사를 참조하는 것도 피해야 한다. 많은 경우, 대안이 없지만, 대학 도서관이 대리 서비스를 통해 학생들이 그들의 자료에 온라인으로 접근할 수 있도록 해야 한다. 만약 이것이 이루어지지 않는다면, 학생들은 이 자료들에 접근하기 위한 다른 방법들을 추구할 것이다.
Just as one should avoid using expensive software that should be purchased by students, one should also avoid referring to texts and articles that are hidden behind paywalls. In many cases, there is no alternative, but the department should then attempt to ensure that the university library, through a proxy service, allows the students online access to their materials. If this is not done, then students will pursue other means to access these materials.

임상 교육 관련 문제
Issues specific to clinical teaching

환자들은 종종 임상 수업에서 중요한 부분이다. 온라인 교육에 환자를 포함할 때, 선생님들은 몇 가지 특별한 점을 고려할 필요가 있다. 기억해야 할 몇 가지 사항:

Patients are often a crucial part of clinical teaching. When including patients in the online teaching, some special points need to be considered by the teachers. Some points to remember:

  • 사용되는 소프트웨어는 데이터 보호의 형식을 충족해야 합니다(위에서 설명한 법률 및 정책 참조).
  • The software used has to fulfil the formalities of data protection (see reference to the laws and policies outlined above).
  • 교수자는 학생에게 각 세션에서 [환자 기밀]에 대해 상기시켜야 한다. 이것은 일반적인 기밀성을 넘어서며, [다른 사람이 학생과 함께 방에 있지 않도록 하는 것]과 [모니터의 배치]와 같은 문제까지도 포함합니다. 이러한 맥락에서, 학생들은 조용하고 방해받지 않는 장소에서 온라인 교육에 참여하도록 해야 한다.
  • Students should be reminded of patient confidentiality by the teacher at each session. This exceeds the usual confidentiality and includes issues like ensuring no other person is in the room with the student and the placement of the monitor. In this context, students should ensure that they participate in online teaching while in a quiet and undisturbed place.
  • 학생이 이 과정을 기록하는 것은 엄격히 금지되어 있다.
  • Student recording of the process is strictly prohibited.
  • 기관 녹화는 특별한 사정이 없는 한 금지되는 경우가 많다. 이러한 상황에서, 당신의 기관의 연구 윤리 원칙을 따르는 것이 가장 좋을 것이다.
  • Institutional recording is frequently prohibited unless special circumstances exist. Under these circumstances, it would be best to be guided by your institutions’ research ethics principles.
  • 모든 대학 규정 외에도 [LMS에 환자 비디오의 저장 및 제공에 관한 임상 현장별 규정]을 수용해야 한다.
  • In addition to any university regulations, clinical site-specific regulations concerning storage and provision of patient videos in the LMS must be accommodated.
  • 환자는 데이터 안전 또는 인간의 부정행위와 관련된 가능한 위험에 대해 informed 되어야 하며, 자신의 정체성을 보호하기 위해 취한 조치에 대해서도 알아야 한다(따라서, 정보에 근거한 동의 양식은 비록 조금 기술적이더라도 명시적이어야 한다).
  • The patient needs to be informed about possible risks connected to data safety or human misconduct and also informed about the steps taken to protect their identity (As a result, the informed consent form needs to be explicit, even if a little technical).
  • 환자들은 어떤 임상적 상황에서와 마찬가지로, 공동의 의사 결정 과정에 참여할 수 있도록 자신의 약속과 가능한 최악의 시나리오에 대해 완전히 알 필요가 있다.
  • Patients need to be fully informed about their commitment and possible worst-case scenarios so that they can engage in the shared decision-making process as they would in any clinical situation.
  • 어떤 형태의 온라인 병실 라운드에서든 교사와 학생의 개인 공간을 확보하는 것 외에도, [병원에 있는 사람들]은 종종 사생활(예: 침대 머리맡에 놓여 있는 사적인 편지)을 돌보는 것을 잊어버리기 때문에, 의도하지 않은 정보가 방송되는 것을 피하기 위해 환자의 개인 공간을 확보하는 데 많은 주의를 기울여야 한다.
  • With any form of online ward-rounds, apart from securing the personal space of the teacher and the student, great care must be taken to secure the patients’ private space, in order to avoid unintended information broadcast, as people in hospitals frequently forget to take care of their privacy (e.g. a private letter lying on the bedside table).
  • 개인 공간의 확보는 배경과 인근 환자 및 방문객으로부터 보호하는 것에도 적용된다. 대부분의 병원은 방마다 침대가 하나 이상 있고, 이웃과 방문객은 동의는커녕 자신도 모르게 촬영(혹은 엿듣기)될 수 있다.
  • The securing of the personal space also applies to the background and protecting nearby patients and visitors. Most hospitals have more than one bed per room, and neighbours and visitors could unintentionally be filmed (or overheard) without their knowledge, let alone consenting.
  • 더 기술적으로는, 온라인에서 병동회진을 가르칠 때, 다음과 같은 문제를 고려하기 위해 기술을 사전 테스트해야 한다. 
    • 임상 네트워크의 불안정성,
    • 교수 네트워크와 임상 네트워크의 잠재적 비호환성 
    • 장비의 휴대성이 주는 편리성(예: 모바일 태블릿 또는 전화)과 기능 저하(예: 테이블 또는 전화기의 마이크가 일반적인 병원 배경 소리에 대해 환자의 목소리를 명확하게 포착하기에 충분하지 않음)의 균형을 맞추는 것 
  • On a more technical note, when teaching online ward-rounds, one should pre-test the technology to take into account issues like
    • the instability of the clinical network,
    • potential incompatibility of the teaching network and the clinical one, or
    • balancing the convenience of easily transportable equipment (e.g. a mobile tablet or phone) against reduced functionality (e.g. microphone of the table or phone not good enough to capture a patient’s voice clearly against the usual hospital background sounds).

학생평가
Student assessment

정확하고 유효한 평가를 갖는 것은 의학 교육에서 오랫동안 우려되어 왔으며, ERT는 특히 원격으로 완료된 온라인 평가와 같은 추가적인 합병증을 도입하여 많은 교육자들이 공정성과 타당성의 균형을 맞추기 위해 고군분투하게 만들었다. 학년 가중치, 학생식별, 지속적이고 반복적인 평가를 다루려고 시도한 다양한 지침이 소개되었다. 또한, 다음에 한 우려가 있었다.

  • 평가 질문의 유형 (예: 교수진은 기존에 확립되어 있던, 과거에는 보호되었던 MCQ 은행을 잃음). 
  • 실습 시험(예: OSCE, OSPE, viva)을 더 많이 수행하는 방법 
  • 그룹 프로젝트 성적이 구성원들의 기여를 제대로 반영할 수 있도록 하는 방법

Having accurate and valid assessments has long been a concern in medical education, and ERT introduced further complications, specifically online assessments completed remotely, that left many educators struggling to balance fairness and validity. Various guidelines were introduced (e.g. (García-Peñalvo et al. 2021)) that attempted to deal with grade weightings, student identification, continuous and repeated assessment. In addition, there were concerns about

  • the types of assessment questions (e.g. faculty now losing their well-established and previously-protected banks of MCQs),
  • how to conduct more practical exams (e.g. OSCEs, OSPEs, vivas), and
  • how to ensure that group project grades properly reflected the members’ contributions.

아마도 온라인 평가와 관련하여 해결되지 않은 가장 큰 윤리적 문제는 온라인 프록터링이다. 온라인 프록터링(일반 비디오 도구 또는 전문 소프트웨어에 의한)은 ERT 동안 초기에 널리 채택되었지만 많은 학교가 프록터링 수행량을 제거하거나 줄일 정도로 교직원과 학생들로부터 반발을 샀다(Feathers 2021). 윤리적 문제는 감독에 관한 것이라기보다는(학생들이 캠퍼스에 있을 때 수행되기 때문에), 학생의 집, 종종 침실과 같은 개인적인 공간에서의 사건들을 감시하고 기록하는 것과 함께 오는 사생활 침해입니다. 일반적인 관행은 학생의 침실을 기웃거리며 전체 환경을 조사하는 것이다. 이것은 대부분의 윤리적 교사들에게 분명히 혐오스러울 것이다 (비록 "동의"가 주어질지 모르지만, 이 동의는 대체로 강요에 의해 주어진다: 만약 학생들이 동의하지 않는다면, 그들은 학위를 마칠 수 없을지도 모른다).

Probably the greatest unresolved ethical issue related to online assessment is online proctoring. Online proctoring (either by common video tools or by specialised software) was initially widely adopted during ERT but resulted in a backlash from faculty and students (Feathers 2021) to the extent that many schools removed or reduced the amount of proctoring performed. The ethical issue is not so much proctoring (because that is performed when students are on campus), but a breach of privacy that comes with monitoring and recording events in a student’s home, frequently their very personal spaces, such as bedrooms. A common practice would be to survey the entire environment, essentially snooping in a student’s bedroom; this would surely be abhorrent to most ethical teachers (Although “consent” may be given, this consent is largely given under duress: if students do not agree, they might not be able to complete their degree).

일부 기관은 감독 절차를 아웃소싱하기로 결정할 수 있으며, 이는 더 많은 윤리적 문제를 제기한다. 만약 기관들이 이것을 한다면, 그들은 그들의 윤리적 책임을 포기하지 않도록 보장해야 한다. 일부 시스템은 학생들의 머리(얼굴, 눈, 입술 포함) 움직임을 모니터링하기 위해 인공지능을 사용합니다. 이에 대한 윤리는 매우 섬세하며, 모든 경우 공정한 판단을 위해 훈련된 인간 감독관에게 경보가 전달되도록 해야 한다. 부정행위의 혐의가 있다면, 학생들이 학교에서 시험을 치르고 있을 때 따라야 할 표준 절차에 따라 처리되어야 한다.
Some institutions may decide to outsource the proctoring process, which then raises more ethical problems; if institutions do this, then they should ensure that they do not abrogate their ethical responsibility. Some systems use Artificial Intelligence to monitor students’ head (including face, eye and lip) movement. The ethics of this are extremely delicate, and, in all cases, one should ensure that any alarms are referred to a trained human proctor for fair adjudication. If there is a suspicion of cheating, then it should be dealt with according to the standard procedures that would be followed if the students were taking the examination on campus.

감독에 대한 가능한 대안은 오픈북 시험의 개념이다. 오픈 북 시험은 실행 가능하지만, 성공하기 위해서는 고려해야 할 몇 가지 문제가 있다. 그 중에는 다음이 있다.
A possible alternative to proctoring is the concept of an open-book exam. Open-book exams are viable, but, in order for them to be successful, there are several issues that need to be considered. Among these are:

  • 대부분의 사람들이 "closed book exam"이라고 말하기보다는 그냥 "시험"이라고 말할 정도로, closed-book 시험은 오랜 세월 동안 사용되어 왔기 때문에, 그것은 표준이다. 이에 따라 전체 기관의 교육과정 및 교육방법은 이를 대상으로 하고 있다.
  • Because closed-book exams have been used for so many years, they are the norm, to the extent that most people do not speak of “closed-book exams,” but just “exams.” As a result, the entire institution’s syllabus and methods of teaching are aimed at these.
  • 현재의 시험 일정과 방법론은 closed-book 시험을 대상으로 한다. 일정은 텍스트 협의가 없을 것이라는 가정 하에 특정 시간 프레임에 대해 설정된다. 지원이 필요한 답변을 강력하게 참조할 필요가 없는 질문이 설정된다. 실제로 현재 많은 검사는 자동화된 시스템(종이 기반 광학 마크 판독기 또는 LMS 또는 유사한 시스템을 통해)으로 표시됩니다. 윤리적 평가를 보장하기 위해, 개방형 도서 시험으로 전환하는 것은 완전히 다른 문제가 필요할 것이다. 또한 새로 훈련된(및 유료) 채점방안을 포함한 새로운 자원이 필요하다. 이것들이 없다면, 현재의 리소스로 수백 개의 시험 문제를 설정하고 채점해야 하는 엄청난 추가 부담이 지속 불가능하며, 문제 채점이 단순히 더 어렵고 불투명한 형태의 MCQ가 될 위험이 있다.

  • In addition, the examination schedule and methodology are aimed at closed-book exams. The schedules are set for a particular time-frame on the assumption that there will not be a consultation of texts; questions are set in which answers that need support do not have to be strongly referenced; indeed, many current examinations are marked by automated systems (either through a paper-based optical mark reader, or LMS or similar system.) To ensure ethical assessment, switching to open-book exams would require entirely different questions. In addition, new resources, including newly-trained (and paid) markers are required. Without these, the massive extra burden of setting and grading hundreds of exam questions with current resources is unsustainable, and there is the danger that the question-grading becomes a mark-to-the-rubric exercise, which is simply a more difficult and opaque form of MCQs.

임상 평가를 위해 OSCE는 제도적 관행에 영향을 받을 특정 문제를 제기한다. 위에서 제기된 윤리적 문제의 범위 외에도, 온라인 OSCE 실행에 대한 더 많은 정보를 제공한다면, 이 텍스트들은 가치가 있을 것이다.
For clinical assessment, OSCEs raise particular issues that will be impacted by institutional practices. Apart from the range of ethical issues raised above, more information on running online OSCEs, these texts will prove valuable: (Hannan et al. 2021; Hopwood et al. 2021; Shehata et al. 2021).

코스 동료 검토(교사)
Course peer-review (teacher)

온라인 의학 교사들이 윤리적으로 가르쳐야 하는 것처럼, 그들은 윤리적으로 동료 검토를 받을 권리가 있다. ERT 이전에 대부분의 교육 동료 검토는 대면 교수 활동을 목표로 했으며, 이러한 기대치와 측정 기준을 온라인 교사를 평가하기 위해 적용하는 것은 비윤리적이다. 이러한 측정 기준은 종종 온라인 교육의 요구를 무시하고, 부적절한 측면도 측정하기 때문이다. 몇 가지 예시적인 예가 있다.
Just as online medical teachers must teach ethically, they have the right to be peer-reviewed ethically. Prior to ERT, most educational peer-review was aimed at face-to-face teaching activities, and applying these expectations and metrics to evaluate the online teacher is unethical, as these metrics frequently ignore the demands of online teaching, and also measure inappropriate aspects. There are several illustrative examples:

  • 올바른 파일 형식에 대한 이전의 논의는 현실을 강조하지 않는다: 의료 온라인 교사들은 종종 격리되어 작업하고 있으며, 직접 대면 교육과는 무관한 새로운 기술을 스스로 배워야 할 필요가 있었다. 따라서, 정확하고 접근 가능한 파일 형식을 얻는 간단한 작업은 많은 교육자들에게는 벅찬 작업일 수 있습니다. [대면 교육에 기반한 동료 평가]는 대면 교육에서는 이런 것이 문제가 되지 않기 때문에 이를 무시한다.
  • The earlier discussion of correct file types does not emphasise the reality: frequently, medical online teachers are working in isolation, and have to perform file manipulation by themselves, needing to teach themselves new skills unrelated to face-to-face teaching. So, the simple act of getting correct and accessible file types may be a daunting task for many educators. Peer evaluation of face-to-face teaching ignores this because this is not an issue in face-to-face teaching.
  • [대면 교육에 기반한 동료 평가]는 교사가 제3자 커뮤니케이션 앱, 소셜 미디어, 온라인 커뮤니케이션을 사용하거나 "근무 시간" 외에 전자적으로 사용할 수 있는 것과 같은 [추가 접근성 이니셔티브]를 무시한다.
  • Peer-evaluation of face-to-face teaching ignores any extra accessibility initiatives such as teachers’ using third-party communication apps, social media, online communications, or their being available electronically outside “working-hours.”
  • 전자브레이크룸으로 고품질의 인터랙티브 온라인 수업을 성공적으로 만든 후, 다시 전체 수업을 하나로 모으는 것은 ,대면 수업에서 소규모 그룹 활동을 신속하게 할당하는 것보다 훨씬 더 어렵기 때문에, 소규모 그룹 작업에 전자브레이크룸을 사용하는 온라인 교사는 다르게 평가를 받을 필요가 있다.
  • Successfully creating high-quality and interactive online lessons with electronic breakout rooms and then bringing the entire class together again, is far more difficult than quickly assigning a small group activity in a face-to-face class, so the online teacher who uses electronic breakout rooms for small group work needs to be evaluated differently.
  • 또한 [단일 대면 이벤트]로 강의를 전달하는 것보다, 원활하고 중단 없는 고품질 강의 녹음을 만드는 것이 훨씬 어렵고 시간이 많이 소요됩니다.
  • It is also far more difficult and time-consuming to create a smooth, interruption-free, high-quality lecture recording than it is to deliver that lecture as a single face-to-face event.

아마도 훨씬 더 심각하게, 온라인 교사들이 공식적이고 동기화된 시간표 수업 시간을 줄이라는 권고를 따를 경우, 동료 평가자들이 업무량과 노력을 측정하기 위해 대면 시간표 일정을 사용할 경우 평가에 해로울 것이다. 온라인 교육에서 정규 시간 등가물(FTE)의 측정은 대면 교육과는 크게 다르며 동료 평가에서 인정받을 필요가 있다. 대부분의 경우, 50분 수업을 35-40분으로 줄이면서 질을 유지하고 학생들의 준비를 보장하는 과정은 엄청난 노력을 필요로 한다. 성공한 온라인 교사가 수업 시간을 줄이기 때문에 처벌받는 것은 윤리적으로 비양심적일 것이다.

Perhaps far more seriously, if online teachers follow the recommendation of reducing the formal, synchronised time-tabled class time, this will be detrimental to the evaluations if the peer-evaluators use face-to-face time-table schedules to measure workload and effort. The measurement of Full-Time Equivalents (FTEs) in online teaching is vastly different from face-to-face teaching and needs to be recognised in the peer evaluation. In most cases, the process of reducing a 50-minute class to 35–40 minutes, while retaining the quality and ensuring student preparedness requires enormous effort; it would be ethically unconscionable for the successful online teacher to then be penalised because they are teaching for less time.

기관이 온라인 동료 평가 전문가에게 접근할 수 있는 경우, 이를 사용해야 한다. 그러나 작업의 중요성을 감안할 때 이러한 작업을 쉽게 사용할 수 없을 가능성이 있으므로 평가 시트를 작성해야 합니다. 이 단계에서는 품질사항과 같은 문서 또는 위 항목을 기반으로 자체 개발한 목록을 사용하여 상황별 항목으로 보완할 수 있습니다. 문서 및 과정 레이아웃 외에도, 구성원은 다른 직원을 라이브 온라인 수업에 초대할 수 있을 만큼 편안해야 합니다(학생의 동의가 필요할 수 있지만, 필요하지 않은 경우, 최소한 학생들에게는 알려야 합니다). 그러나 이러한 문서는 대화의 기초가 되고, 의견을 제시하고, 질문을 하고, 어려움에 대한 질문을 제기하는 문서 프레임워크인 가이드여야 한다. 이 프로세스는 메시징 앱에서 온라인 토론을 통해 지원될 수 있습니다.

If the institution has access to experts in online peer evaluation, then these should be used. Given the enormity of the task, however, there is the likelihood that these are not easily available, and so evaluation sheets will need to be created. At this stage, documents such as the Quality Matters, or self-developed lists based on the items above and then supplemented with context-specific items can be used. In addition to the documentation and course layout, members should be comfortable enough to invite other staff to their live online classes (although student consent may be required; if not required, students should at least be informed). These documents should, however, be a guide, a document framework on which to base conversations, give opinions, ask questions, and raise questions about difficulties. This process could be supported with online discussions in messaging apps.

전반적으로, 그리고 대면 동료 평가와 유사하게, 이 프로세스는 멘토(가능한 경우)와 협력적인 협력의 분위기 내에서 수행되어야 하며, 보다 공식적인 프로세스를 구축하고, 계약 갱신, 승진 및 재직권의 목적으로 이러한 프로세스를 기관이 인정하도록 보장해야 한다.
Overall, and similar to face-to-face peer-evaluation, the process should be conducted within an atmosphere of supportive collegiality, perhaps with mentors (if available), building up to more formal processes, and ensuring that these are recognised by the institution for purposes of contract renewal, promotion and tenure.

온라인 환경의 장점은 동료 평가 그룹이 부서, 기관 또는 국가를 넘어 확장될 수 있다는 것입니다. 비록 외부 사람들이 환경을 완전히 이해하지 못할지라도, 그들의 관점은 여전히 유용할 것이다. 그러나 학생의 동의와 기밀을 보장하는 데 주의를 기울여야 한다.

The advantage of the online environment is that the peer-evaluation group can be expanded beyond the department, institution or even the country. Although external people may not have a full grasp of the environment, their perspective will still be useful. One would, though, have to take care in ensuring student consent and confidentiality.

학생 과정 평가
Student course evaluations

학생 과정 평가는 낮은 응답률로 인해 자주 문제가 되고 또한 남용될 수 있다. 전자 과정 평가의 낮은 응답률은 잘 문서화되어 있다. 또한 이러한 평가는 일반적으로 학기 말에 수행되기 때문에 학생들에게 직접적인 혜택이 없으며, 과정에 영향을 미치지 않을 수 있다(강좌가 다시 운영될 때쯤이면 많은 코멘트가 잊혀진다). 결과적으로, 이러한 평가는 종종 체크 박스 행정 연습이 될 수 있다.
Student course evaluations are frequently a problem because of low response-rate and they are also open to abuse. The low response-rate of electronic course evaluations is well documented (Guder and Malliaris 2013; Luo 2020). In addition, as these evaluations are typically performed at the end of the semester, they have no direct benefit for the students, and may not impact on the course (by the time the course is run again, many of the comments are forgotten). As a result, these evaluations may frequently become a check-box administrative exercise.

윤리적인 의학 교사는 학생들이 가장 큰 이익을 얻을 수 있을 때 학생 평가 코멘트를 사용하는 것을 목표로 해야 하며, 이것은 즉 [과정을 운영하는 동안]이다. 온라인 환경은 이러한 기회를 제공한다. 그러나 공식적인 평가를 반복하는 것보다, 더 좋은 방법은 매주 말(혹은 기껏해야 2주)에 학생들이 좋아하는 것, 좋아하지 않는 것, 잘 된 것, 잘 되지 않은 것에 대해 논평할 수 있는 하나의 개방형 질문을 하는 것이다.
The ethical medical teacher should aim to use student evaluation comments when they can have the greatest benefit to the course, and that is while the course is running. The online environment affords this opportunity. Rather than having repeated formal evaluations, however, the better way is to have a single, open-ended question at the end of each week (or fortnight, at most) in which students can comment on what they liked, did not like, they felt worked and did not work.

가장 큰 영향을 미치려면 양식이 익명으로 되어 있어야 하며, 모든 학생이 답을 볼 수 있어야 합니다. 익명 가시성은 과정 개선을 목표로, [과정의 "평가"가 동료들 간의 토론이 되는], 교사 동료 검토의 공동성에 대한 유사한 접근 방식을 장려한다. 또한 교사가 제멋대로 또는 불명확해 보이는 관리나 교육적 결정을 명확히 할 수 있도록 하며, 이러한 결정들은 불만 사항의 곪은 영역이 되기 전에 과정 초기에 해결된다(과목 종료 평가에 부당하게 반영될 수 있다).
For the greatest impact, the form should be anonymous, and the answers should be visible to all students. Anonymous visibility encourages a similar approach to the collegiality of the teacher peer-review, in which the “evaluation” of the course becomes a discussion among colleagues, with the aim of improving the course. It also allows the teacher to clarify seemingly arbitrary or obscure management or educational decisions, and these are addressed early in the course before they become festering areas of discontent (which may be unfairly reflected in the end-of-course evaluation).

또한 온라인 환경은 라이브 온라인 수업 중 또는 직후에 익명의 즉각적인 피드백을 허용한다. 이 작업은 의견조사 도구를 통해 수행할 수 있습니다. 이러한 도구는 많은 LMS, 비디오 도구 자체 내 또는 외부에 존재한다.
In addition, the online environment allows for immediate anonymous feedback during or immediately after live online classes. This can be performed through poll tools. Such tools exist in many LMSs, or within the video tool itself, or externally.

학생 모니터링 및 분석
Student monitoring and analytics

학생 활동 모니터링은 교육 피드백 고리의 중요한 구성 요소입니다. 대면교육에서는 일반적으로 신체 자세와 표정을 관찰하여 학생들의 주의력을 모니터링하는 것이 비교적 쉽다. 큰 반에서도, 특히 작은 반으로 쪼개졌을 때, 모니터링은 큰 노력 없이 할 수 있다.
Monitoring student activities is a crucial component of the educational feedback loop. In face-to-face education, it is generally relatively easy to monitor students’ attention by watching body posture and facial expressions. Even in large classes, especially when broken into small groups, monitoring can be done without much effort.

그러나 온라인 학습은 새로운 복잡성을 야기하며, 물리적 과정을 복제하려는 욕구는 일반적으로 교사들이 카메라와 여론 조사(라이브 세션), 전자 레지스터 및 파일 다운로드 추적을 주장하는 것과 같은 동등한 활동으로 이어진다. 일단 이러한 것들이 자리를 잡으면, 교육자들은 전자 세계가 실제로 온라인에서 학생 행동에 대한 데이터를 수집할 수 있는 훨씬 더 큰 기회를 제공한다는 것을 깨닫고, 이러한 것들이 점점 더 널리 사용되고 있다. 모니터링/분석 및 예측/개입에 초점을 맞추는 경우가 많습니다.
Online learning introduces new complications, however, and the desire to replicate the physical process usually leads to equivalent activities, such as teachers’ insisting on cameras and polls (in live sessions), electronic registers, and tracking file downloads. Once these are in place, educators realise that the electronic world actually offers a far greater opportunity to gather data about student behaviour online, and these become widely and increasingly used (Dietz-Uhler and Hurn 2013; Kew and Tasir 2021). The focus is frequently on monitoring/analysis and prediction/intervention.

그러나 해결해야 할 몇 가지 윤리적 문제가 있으며 모니터링 욕구가 [기본적 윤리적 원칙]을 무시하도록 허용되어서는 안 된다.

  • 데이터 수집에 대한 학생과 환자의 사전 동의,
  • 과도한 데이터 수집을 막는 것
  • 개인 정보 보호 및 보안
  • 요구와 가능한 것의 균형을 유지하는 것

목표는 [경찰식 감시]가 아니라 [교육 개선]이라는 점을 기억해야 한다.
There are, however, several ethical concerns that need to be addressed, and the desire to monitor must not be permitted to override basic ethical principles, such as

  • students’ and patients’ informed consent on data gathering,
  • guarding against excessive data-gathering,
  • privacy and security, and
  • balancing these demands against what is possible.

We need to remember that the goal is improved education, not police-style surveillance.

학생들이 이 과정의 모든 과정에 대해 알아야 한다는 것은 이미 문서의 초기 부분에서 다루어졌습니다. 그러나 우리는 또한 이러한 데이터의 윤리적 사용을 고려해야 한다. 때로는 정교한 인공지능 도구가 사용될 수 있지만, 대부분의 의학 교사들은 이러한 도구들에 쉽게 접근할 수 없다. LMS는 상당히 간단한 기술 수준에서 파일 다운로드 및 활동 완료를 추적할 수 있으며, 이러한 데이터를 간단한 공식으로 스프레드시트로 내보내면 교사가 학생이 수행한 필수 또는 권장 활동 비율을 알 수 있습니다. 거기에서 수동 또는 자동화된 과정 중 하나가 선택된 학생들에게 그들이 뒤쳐지고 있다는 것을 알리는 이메일을 보낼 수 있다.
That students should be aware of all these processes in the course, has already been addressed in the early part of the document. We also, however, have to consider the ethical usage of these data. Sometimes sophisticated Artificial Intelligence tools can be used, but most medical teachers do not have easy access to these. At a reasonably simple level of technology, LMSs can track file downloads and activity completion, and exporting these data into a spreadsheet with simple formula can inform the teacher of the percentage of required or recommended activities that have been performed by students. From there, either a manual or an automated process can send emails to selected students, informing them that they are falling behind.

이것은 매우 유용한 행정 기능이지만 윤리 의학 교사는 데이터가 어떻게 해석되는지 주의해야 하며, 이러한 데이터를 보통 "학습 분석"이라고 지칭하기 때문에 특히 중요하다. 불행하게도 널리 적용되는 이 용어는 때때로 접근된 파일의 수가 그 학생이 얼마나 많이 배웠는지를 선생님에게 말해준다는 것을 암시하는 것으로 해석된다. 파일 액세스와 활동은 학생 활동의 광범위한 징후를 제공할 수 있으며 무시해서는 안 되지만(따라서 위에서 설명한 것처럼 학생의 메일링), 학습은 다른 곳에서 발생할 수 있고 발생할 수 있다는 점도 고려해야 합니다. 분명한 점은 학생들이 자주 학습 그룹을 형성하기 때문에 한 사람이 필요한 파일을 다운로드하고 그룹 간에 공유할 수 있다는 것이다. 또한, 가능한 모든 것을 모으려는 유혹을 뿌리쳐야 하며, 과잉을 막기 위해 교사와 기관은 [필요한 것만을 모아야 한다]모든 IP 주소 뒤에는 실제 학생이나 환자가 있다.

This is an extremely useful administrative feature, but the ethical medical teacher needs to be careful about how the data are interpreted, and this is particularly important because these data are usually referred to as “Learning Analytics” (Dietz-Uhler and Hurn 2013). This unfortunately broadly-applied term is sometimes interpreted as implying that the number of files accessed tells the teacher how much the student has learned. While file accesses and activities can give a broad indication of student activity, and should not be ignored (therefore the mailing of students as described above), one should also take into account that learning can, and does, occur elsewhere: an obvious point is that students frequently form learning groups, so one person may download the necessary files and then share them among the group. In addition, the temptation to gather everything possible must be resisted, and, guarding against excess, the teacher and institution should gather only what is needed – behind every IP address is a real student or patient.

일단 수집된 데이터는 암호화에 의해 신중하게 보호되어야 하며, 익명 데이터의 익명화가 해제되지 않도록 주의해야 한다. 데이터는 제한된 시간 동안만 저장해야 합니다. 관련 법률과 정책이 이 기간을 결정하지만 지침이 없는 경우 일반적으로 3-5년은 합리적인 최대 시간으로 간주된다. 이러한 데이터가 공식적인 연구에 사용될 때, 새로운 윤리적 관심 영역인 윤리적 디지털 장학금이 열린다. 이 영역은 너무 커서 여기서 논의할 수 없으며 다른 AMEE 가이드에서 다루었습니다.

Once gathered, these data must be carefully protected by encryption, and care should be taken to ensure that anonymous data cannot be de-anonymised. Data should be stored for a limited time only: relevant laws and policies will determine this period, but, in the absence of guidance, 3–5 years is generally considered a reasonable maximum time. When these data are to be used for formal research, then a new ethical area of concern opens: ethical digital scholarship. This area is too large to be discussed here and has been covered in another AMEE Guide (Masters 2020).

 

레코드 콘텐츠 보관 및 관리
Archiving and managing the record content

비록 기관들이 공식적으로 과정을 "종료"하거나 "폐쇄"하더라도, 온라인 세계는 훨씬 더 오랜 시간 동안 학습 자료(라이브 클래스 녹화 포함)를 이용할 수 있는 기회와 기대를 제공한다. 온라인 학습에서 이에 대한 교육적 필요성은 수년 동안 인식되어 왔지만(Masters and Gibbs 2007), ERT는 이전보다 훨씬 더 큰 규모로 이 문제를 강요했다. 자료를 (모든 사람이 접근할 수 있는 것에서) 역사적 목적을 위해 보관하는 것으로 이동하는 과정에서 관리하는 것은, 기술적으로 어려운 과정은 아니지만, 특히 개인 정보 보호, 보안 및 접근성과 관련된 윤리적 문제를 야기한다. 장기 저장용량을 보유할 가능성은 낮으며, 보유하더라도 아래의 사항을 고려해야 한다.
Although institutions officially “end” or “close” courses, the online world offers an opportunity, and an expectation, for learning materials (including recordings of live classes) to be available for a much longer time. The educational need for this in online learning has been recognised for many years (Masters and Gibbs 2007), but ERT has forced the issue on a much larger scale than before. Managing the material as it shifts from being accessible to all to archived for historical purposes is not a technically difficult process, but it does introduce ethical problems, specifically related to privacy, security and accessibility. The institution is unlikely to have long-term storage capacity, and even if it does, the points below should be considered.

  • 자료는 폴더 및 기타 논리적 그룹에서 적절하게 식별되고 배열되어야 한다.
  • The material should be properly identified and arranged in folders and other logical groupings.
  • 민감한 재료(예: 등급)는 암호화해야 합니다.
  • Sensitive material (e.g. grades) must be encrypted.
  • 자료를 클라우드 서비스에 업로드해야 한다. 무료 클라우드 서비스가 존재하지만, 이러한 서비스들은 종종 저장 용량이 상당히 제한된다. 추가 공간을 구입할 수 있는 기관 자금이 없다면, 개별 교사들은 이 비용을 개인적으로 지불해야 할 수도 있다(또는 일부 서비스는 이메일 계정을 기반으로 공간을 할당하므로, 교사가 새로운 이메일 계정을 만들기를 원할 수도 있다). 그러나 교사가 교육기관을 떠날 경우, 장기 접근성을 교육기관과 협상해야 한다.
  • Material should be uploaded into cloud services. Although free cloud services exist, these are frequently quite limited in storage capacity. If institutional funds are not available for purchasing extra space, then individual teachers may have to pay for this privately (Alternately, some services allocate space based on email accounts, so the teacher may wish to create new email accounts). If the teacher leaves the institution, however, then long-term accessibility must be negotiated with the institution.
  • 저작권 및 자료의 가용성에 대한 제도적 정책이 수용되어야 할 것이다.
  • Institutional policies on copyright and the availability of materials will need to be accommodated.

앞길
The road ahead

가이드가 거의 끝나갈 무렵에 독자들은 제안을 적용하기 시작하기를 원할 수도 있지만, 이 문서가 그들의 어깨에 얹혀있는 엄청난 짐에 다소 압도될 수도 있다. 이 시점에서 [가능성]이라는 중요한 윤리적 원칙이 적용될 필요가 있다. [가능성]이란, 개인이나 기관이 모든 것을 하고 싶어하는 만큼이나, 시간을 포함한 자원이 제한적이라는 것을 인식한다.
As we near the end of the Guide, readers may wish to begin applying the suggestions, but may also feel rather overwhelmed by the immense load that this document appears to place on their shoulders. It is at this point that the important ethical principle of Possibility needs to be applied. Possibility recognises that, as much as a person or institution would like to do everything, resources, including time, are limited.


결과적으로, 작게 시작하세요: 모든 과정에서 모든 것을 한 번에 할 수 없습니다. 작은 코스를 선택하는 것부터 시작하여 위에 설명된 프로세스를 통해 최소한의 노력과 시간으로 달성할 수 있는 원칙을 적용합니다. 대부분의 경우 일부 작업은 이미 완료되었으며 형식화, 분류 및 문서화만 하면 됩니다. 해결하고자 하지만 지금은 할 수 없는 더 많은 리소스 집약적인 영역을 식별합니다. 플래그를 지정한 후 나중에 해당 플래그로 돌아갑니다. 과정을 여러 번 반복해야 할 수도 있고, 최종 제품을 구입하기 전에 다양한 다른 사람의 입력이 필요할 수도 있습니다. 작은 개선 하나하나가 여전히 개선이니, 앞에 놓인 과제에 굴하지 말고, 오히려 이미 걸어온 길을 인정하라.
As a result, start small: you cannot do everything at once in all your courses. Begin by selecting a small course, and work through the processes outlined above, applying those principles that can be achieved with minimal effort and time. In many cases, you will find that some of the work has already been done and simply needs to be formalised, categorised and documented. Identify other more resource-intensive areas that you would like to address, but cannot at the moment. Flag them, and return to them later. It may take several iterations of your course and may require input from a range of others before you have your final product. Every small improvement is still an improvement, so do not be daunted by the task ahead, and rather acknowledge the path already walked.

 

결론
Conclusion

대면 교수와 학습에서 ERT로 전환한 것은 많은 의학 교사들과 학습자들에게 갑작스럽고 가혹한 경험이었다. ERT가 가능한 한 빨리 콘텐츠를 제공하는 데 초점을 맞춘다는 것은 베스트 프랙티스가 항상 지켜지는 것은 아니라는 것을 의미했습니다. 교사와 학습자가 ERT 전보다 온라인 학습이 보편화되는 새로운 단계로 접어들면서 온라인 교수와 학습의 윤리적 문제를 해결해야 할 필요성이 대두되고 있다.

The transition from face-to-face teaching and learning to ERT was a sudden and harsh experience for many medical teachers and learners. ERT’s focus on delivering content as quickly as possible meant that best practices were not always followed. As teachers and learners move into a new phase in which online learning will become more common than before ERT, there is a need for the ethical concerns of online teaching and learning to be addressed.

본 가이드는 이러한 윤리적 문제를 강조하고 이러한 문제를 가장 잘 해결할 수 있는 방법을 제시했습니다. 목적은 ERT를 통해 윤리적 대면 교육에서 윤리적 온라인 교육에 이르는 과정을 완료할 수 있도록 의학 교사들이 지원하는 것입니다.This Guide has highlighted these ethical concerns and has shown how they can be best addressed; the aim has been to assist medical teachers to complete the process from ethical face-to-face teaching, through ERT, to ethical online teaching.

 


 

Med Teach. 2022 Apr 20;1-15. doi: 10.1080/0142159X.2022.2057286. Online ahead of print.

AMEE guide to ethical teaching in online medical education: AMEE Guide No. 146

Affiliations collapse

Affiliations

1Medical Education and Informatics Department, College of Medicine and Health Sciences, Sultan Qaboos University, Muscat, Sultanate of Oman.

2Professor of Medical Education and Physiology, Gulf Medical University, Ajman, United Arab Emirates.

3Tübingen Institute for Medical Education i.Gr. (TIME), University of Tuebingen, Tuebingen, Germany.

4Department of Internal Medicine VI/Psychosomatic Medicine and Psychotherapy, University Hospital Tuebingen, Tuebingen, Germany and Tübingen Institute for Medical Education i.Gr. (TIME), University of Tuebingen, Tuebingen, Germany.

PMID: 35443868

DOI: 10.1080/0142159X.2022.2057286

Abstract

The Covid-19 pandemic necessitated Emergency Remote Teaching (ERT): the sudden move of educational materials online. While ERT served its purpose, medical teachers are now faced with the long-term and complex demands of formal online teaching. One of these demands is ethical online teaching. Although ethical teaching is practiced in face-to-face situations, online teaching has new ethical issues that must be accommodated, and medical teachers who wish to teach online must be aware of these and need to teach ethically. This Guide leads the medical teacher through this maze of complex ethical issues to transform ERT into ethical online teaching. It begins by setting the context and needs and identifies the relevant fundamental ethical principles and issues. It then guides the medical teacher through the practical application of these ethical principles, covering course design and layout (including the curriculum document, implementation, on-screen layouts, material accessibility), methods of interaction (synchronous and asynchronous), feedback, supervision and counselling, deeper accessibility issues, issues specific to clinical teaching, and assessment. It then discusses course reviews (peer-review and student evaluations), student monitoring and analytics, and archiving. The Guide aims to be a useful tool for medical teachers to solidly ground their online teaching practices in ethical principles.

Keywords: ERT; Ethics; e-learning; emergency remote teaching; medical education; online teaching.

객관식 시험 자료의 사후 분석 - 고부담 시험 모니터링 및 개선: AMEE Guide No. 66 (Med Teach, 2012)
Post-examination interpretation of objective test data: Monitoring and improving the quality of high-stakes examinations: AMEE Guide No. 66 
MOHSEN TAVAKOL & REG DENNICK

 

 

서론
Introduction

시험 과정의 결과는 형식적으로, 피드백의 형태로, 또는 총괄적으로 수행에 대한 공식적인 판단으로 학생들에게 전달된다. 분명히, 학생과 대중의 요구를 충족시키는 출력을 생산하기 위해서는, 프로세스에 대한 입력을 정의, 모니터링 및 제어할 필요가 있다. 고전적 시험 이론(CTT)은 시험 후 분석에 대한 input이 학생의 관찰된 지식 및 역량에 영향을 미칠 수 있는 측정 오류의 원천을 포함하고 있다고 가정한다. 측정 오류의 원인은 테스트 구성, 관리, 점수 매기기 및 성능 해석에서 도출된다. 예를 들어, 지식 기반 문항 간의 품질 차이, 평가자 간의 차이, 후보 간의 차이, 목표 구조 임상 검사(OSCE) 내의 표준화된 환자(SP) 간의 차이 등이 있다.
The output of the examination process is transferred to students either formatively, in the form of feedback, or summatively, as a formal judgement on performance. Clearly, to produce an output which fulfils the needs of students and the public, it is necessary to define, monitor and control the inputs to the process. Classical Test Theory (CTT) assumes that inputs to post-examination analysis contain sources of measurement error that can influence the student's observed scores of knowledge and competencies. Sources of measurement error is derived from test construction, administration, scoring and interpretation of performance. For example;

  • quality variation among knowledge-based questions,
  • differences between raters,
  • differences between candidates and variation between standardised patients (SPs) within an Objective Structured Clinical Examination (OSCE).

고부담 검사의 품질을 향상시키기 위해 오류를 최소화하고 가능하면 제거해야 한다. CTT는 측정 오류의 출처를 최소화하거나 제거하면 관찰된 점수가 실제 점수에 근접할 것으로 가정한다. [신뢰성]은 검정의 측정 오차 양을 보여주는 핵심 추정치입니다. 간단한 해석은 신뢰성은 시험 자체와 그 자체의 상관관계라는 것이다. 이 상관 관계를 제곱하여 100을 곱하고 100에서 빼면 검정의 오차 백분율이 표시됩니다. 예를 들어, 시험의 신뢰도가 0.80이면 점수에 36%의 오차 분산(랜덤 오차)이 있습니다. 신뢰도 추정치가 증가할수록 오류에 기인하는 시험 점수의 비율이 감소합니다. 반대로 오차의 양이 증가하면 신뢰도 추정치는 감소합니다(Nunly & Bernstein).

To improve the quality of high-stakes examinations, errors should be minimised and, if possible, eliminated. CTT assumes that minimising or eliminating sources of measurement errors will cause the observed score to approach the true score. Reliability is the key estimate showing the amount of measurement error in a test. A simple interpretation is that reliability is the correlation of the test with itself; squaring this correlation, multiplying it by 100 and subtracting from 100 gives the percentage error in the test. For example, if an examination has a reliability of 0.80, there is 36% error variance (random error) in the scores. As the estimate of reliability increases, the fraction of a test score that is attributable to error will decrease. Conversely, if the amount of error increases, reliability estimates will decrease (Nunnally & Bernstein ).

일부 의과대학은 OSCE 검사를 모니터링하고 개선하기 위해 신뢰성 검사 및 항목 분석과 같은 정신계량학적 방법을 채택했지만(Lawson; Iramaneerat 등), 일반성 이론 및 래쉬 모델링과 같은 고급 정신계량학적 방법의 사용은 아직 널리 보급되지 않았다. 
Although some medical schools have adopted psychometric methods such as reliability testing and item analysis to monitor and improve OSCE examination (Lawson ; Iramaneerat et al. ), the use of advanced psychometric methods such as generalisability theory and Rasch modelling has yet to become widespread.

따라서 이 가이드의 목적은 몇 가지 예를 사용하여 전통적인 및 고급 심리측정법의 사용과 해석을 설명하는 것이다. 궁극적으로 독자들은 자신의 시험 데이터와 함께 이러한 방법을 사용하는 것을 고려할 것을 권장한다. 우리는 다른 곳(Tavakol & Dennick)에서 SPSS를 사용하여 객관적인 테스트에서 검사 후 데이터를 생성하는 방법을 설명했으므로, 이 기사에서는 이러한 방법에 대해 논의하지 않을 것이다. 객관적 테스트와 OSCE의 검사 후 데이터에 대한 전통적인 해석으로 시작한 후 현대 심리 측정 방법의 적용을 살펴볼 것이다. 우리는 후속 검사를 개선하기 위한 방법을 예시하기 위해 시뮬레이션 데이터를 사용할 것이다. 
Therefore, the objective of this Guide is to illustrate the use and interpretation of traditional and advanced psychometric methods using several examples. Ultimately, readers are encouraged to consider using these methods with their own exam data. We have explained how to generate post-examination data from objective tests using SPSS elsewhere (Tavakol & Dennick ), and therefore we will not discuss these methods in this article. We shall begin with the traditional interpretation of post-exam data from objective tests and OSCEs and then look at the application of modern psychometric methods. We will use simulated data to exemplify methods for improving subsequent examinations.

기본 사후검사 결과 해석
Interpretation of basic post-examination results

개별 질문
Individual questions

[기술 분석]은 시험의 원시 데이터를 요약하고 표시하는 첫 번째 단계입니다. 각 질문에 대한 분포 빈도는 누락된 질문의 수와 추측 행동의 패턴을 즉시 보여준다. 예를 들어, 문항에 누락된 응답이 식별되지 않은 경우, 이는 학생들이 좋은 지식을 가지고 있거나 일부 질문에 대해 추측하고 있었음을 시사한다. 반대로, 누락된 문제 응답이 있는 경우, 이는 시험을 완료하기에 부적절한 시간, 특히 어려운 시험 또는 부정적인 표시가 사용되는 것일 수 있습니다. 
A descriptive analysis is the first step in summarising and presenting the raw data of an examination. A distribution frequency for each question immediately shows up the number of missing questions and the patterns of guessing behaviour. For example, if there were no missing question responses identified, this would suggest that students either had good knowledge or were guessing for some questions. Conversely, if there were missing question responses, this might be either an indication of an inadequate time for completing the examination, a particularly hard exam or negative marking is being used (Stone & Yeh ; Reeve et al. ).

시험 문제의 평균과 분산은 우리에게 각 문제에 대한 중요한 정보를 제공할 수 있다. 이분법 문항의 평균은 0점 또는 1점으로 p로 표시된 정답 학생의 비율과 같다.

  • 이분법 문항의 [분산]은 문제 정답자 비율(p)에 오답자 비율(q)을 곱하여 계산한다.
  • 표준 편차(SD)를 얻기 위해, 우리는 단지 p × q의 제곱근을 구한다.

예를 들어, 객관식 시험에서 300명의 학생이 1번 문제를 맞혔고 100명의 학생이 1번 문제를 틀렸을 경우, 1번 문제의 p 값은 0.75(300/400)와 같으며, 분산과 SD 값은 각각 0.18(0.75 x 0.25)과 0.42가 됩니다. 

The means and variances of test questions can provide us with important information about each question. The mean of a dichotomous question, scored either 0 or 1, is equal to the proportion of students who answer correctly, denoted by p.

  • The variance of a dichotomous question is calculated from the proportion of students who answer a question correctly (p) multiplied by those who answer the question incorrectly (q).
  • To obtain the standard deviation (SD), we merely take the square root of p × q. 

For example, if in an objective test, 300 students answered Question 1 correctly and 100 students answered it incorrectly, the p value for Question 1 will be equal to 0.75 (300/400), and the variance and SD will be 0.18 (0.75 × 0.25) and 0.42 

SD는 주어진 질문 내에서 변동 또는 분산의 척도로 유용하다. SD가 낮으면 문제가 너무 쉬우거나 너무 어렵다는 것을 나타냅니다. 예를 들어, 위의 예에서 SD가 낮다는 것은 항목이 너무 쉽다는 것을 나타냅니다. 문제 1의 항목 난이도(0.75)와 낮은 항목 SD를 고려할 때 대부분의 학생들이 정답에 관심을 기울였기 때문에 항목에 대한 응답이 분산되지 않았다고 결론 내릴 수 있다. 평균이 분포의 중심에 있는 질문의 변동성이 높을 경우 질문이 유용할 수 있습니다.

 respectively. The SD is useful as a measure of variation or dispersion within a given question. A low SD indicates that the question is either too easy or too hard. For example, in the above example, the SD is low indicating that the item is too easy. Given the item difficulty of Question 1 (0.75) and a low item SD, one can conclude that responses to item was not dispersed (there is little variability on the question) as most students paid attention to the correct response. If the question had a high variability with a mean at the centre of distribution, the question might be useful.

 

총 수행능력
Total performance

각 문항별 평균과 SD를 구한 뒤 각 문항별 학생별 정답 합계를 구한 뒤 전체 수행의 평균과 SD를 계산하는 기존 수행분석을 할 수 있다. SPSS를 사용하여 히스토그램을 만들면 특정 검정의 표시 분포를 이해할 수 있습니다. 학생들의 점수는 정규 분포를 따르거나 왼쪽이나 오른쪽으로 치우치거나 직사각형 모양으로 분포할 수 있다. 그림 1(a)은 양의 치우친 분포를 보여줍니다. 이것은 단순히 대부분의 학생들이 낮은 점수에서 중간 점수를 가지고 있고 소수의 학생들은 상대적으로 높은 점수를 받았다는 것을 보여준다. 양의 치우침 분포에서는 모수와 중위수가 평균보다 크므로 대부분의 학생들에게 문제가 어려웠음을 나타냅니다. 그림 1(b)은 학생들의 점수가 음으로 치우친 분포를 보여준다. 이것은 대부분의 학생들이 중간에서 높은 점수를 받았고 소수의 학생들은 상대적으로 낮은 점수를 받았다는 것을 보여준다. 음으로 치우친 분포에서 모수와 중위수가 평균보다 작다는 것은 대부분의 학생들이 문제가 쉬웠음을 나타냅니다.

After obtaining the mean and SD for each question, the test can be subjected to conventional performance analysis where the sum of correct responses of each student for each item is obtained and then the mean and SD of the total performance are calculated. Creating a histogram using SPSS allows us to understand the distribution of marks on a given test. Students’ marks can take either a normal distribution or may be skewed to the left or right or distributed in a rectangular shape. Figure 1(a) illustrates a positively skewed distribution. This simply shows that most students have a low-to-moderate mark and a few students received a relatively high mark in the tail. In a positively skewed distribution, the mode and the median are greater than the mean indicating that the questions were hard for most students. Figure 1(b) shows a negatively skewed distribution of students’ marks. This shows that most students have a moderate-to-high mark and a few students received relatively a low mark in the tail. In a negatively skewed distribution, the mode and the median are less than the mean indicating that the questions were easy for most students.

 

그림 1(c)은 대칭 분포 곡선의 중심에 분포된 대부분의 표시를 보여준다. 이것은 절반의 학생들이 평균보다 높은 점수를 받았고 절반의 학생들이 평균보다 낮은 점수를 받았다는 것을 의미한다. 이 경우 평균, 모드 및 중위수는 동일합니다. 이 정보를 바탕으로 모드, 중위 또는 평균에 SD의 추정치를 더하지 않으면 시험이 어려운지 쉬운지 판단하기 어렵다. 우리는 다른 곳에서 SPSS를 사용하여 이러한 통계를 계산하는 방법을 설명했습니다.
Figure 1(c) shows most marks distributed in the centre of a symmetrical distribution curve. This means that half the students scored greater than the mean and half less than mean. The mean, mode and median are identical in this situation. Based on this information, it is hard to judge whether the exam is hard or easy unless we obtain differences between the mode, median or mean plus an estimate of the SD. We have explained how to compute these statistics using SPSS elsewhere (Tavakol & Dennick ; Tavakol & Dennick 2012).


예를 들어, 그림 2의 두 분포를 고려해 볼 것을 요청합니다. 그림 2는 두 시험에서 학생들의 모의 점수를 나타냅니다.

As an example, we would ask you to consider the two distributions in Figure 2, which represent simulated marks of students in two examinations.

두 마크 분포 모두 평균이 50이지만 다른 패턴을 보입니다. A시험은 20점 이하와 90점 이상으로 점수가 다양하다. 반면에 B시험은 어느 한 극단에서나 거의 학생들이 보이지 않는다. 이 정보를 이용하여 A검사는 B검사에 비해 이질적이고 B검사는 A검사에 비해 균질하다고 할 수 있다.
Both the mark distributions have a mean of 50, but show a different pattern. Examination A has a wide range of marks, with some below 20 and some above 90. Examination B, on the other hand, shows few students at either extreme. Using this information, we can say that Examination A is more heterogeneous than Examination B and that Examination B is more homogenous than Examination A.


시험 데이터를 더 잘 해석하기 위해서는 각 분포에 대한 SD를 구해야 합니다. 예를 들어, 두 시험의 평균 점수가 67.0이고 각각 6.0과 3.0의 다른 SD를 사용하는 경우, 3.0의 SD를 사용하는 검사는 6.0의 SD를 사용하는 검사보다 더 균질하고 따라서 성능을 측정하는 데 더 일관성이 있다고 말할 수 있습니다. SD의 가치에 대한 추가적인 해석은 학생들의 점수가 평균에서 얼마나 벗어난지를 보여주는가 하는 것이다. 이것은 단순히 평균을 사용하여 총 학생 점수를 설명할 때의 오류 정도를 나타냅니다. SD는 정규 분포에서 개별 학생의 상대적인 위치를 해석하는 데도 사용할 수 있습니다. 우리는 그것을 다른 곳에서 설명하고 해석했다.
In order to better interpret the exam data, we need to obtain the SD for each distribution. For example, if the mean marks for the two examinations are 67.0, with different SDs of 6.0 and 3.0, respectively, we can say that the examination with a SD of 3.0 is more homogenous and hence more consistent in measuring performance than the examination with a SD of 6.0. A further interpretation of the value of the SD is how much it shows students’ marks deviating from the mean. This simply indicates the degree of error when we use a mean to explain the total student marks. The SD also can be used for interpreting the relative position of individual students in a normal distribution. We have explained and interpreted it elsewhere (Tavakol & Dennick )

고전적 문항 분석의 해석
Interpretation of classical item analysis

과학 분야에서는 많은 정확성과 객관성으로 변수를 측정하는 것이 가능하지만, 다양한 교란요인과 오류로 인해 주어진 시험에서 학생들의 성과를 측정할 때 이러한 정확성과 객관성을 얻기 더 어려워진다. 예를 들어, 시험이 학생에게 시행된다면, 그 학생은 그 또는 그녀의 점수에 영향을 미치는 측정 오류로 인해 다양한 경우에 다양한 점수를 받게 될 것이다. CTT에서 주어진 시험에서 학생의 점수는 학생의 [실제 점수]와 [무작위 오류]의 함수이며, 이는 때때로 변동될 수 있다. 시험에 영향을 미치는 무작위 오류가 존재하기 때문에, 우리는 학생들이 무한정 시험을 치르지 않는 한 학생의 실제 점수를 정확하게 결정할 수 없다. 모든 시험에서 평균 점수를 계산하면 무작위 오류가 제거되어 학생의 점수가 결국 실제 점수와 같아집니다. 하지만 무한정 시험을 보는 것은 현실적으로 불가능하다. 대신 우리는 무한한 수의 학생(실제로 큰 코호트!)에게 모든 학생의 점수에서 일반화된 표준 측정 오차(SME)를 추정할 수 있도록 일단 시험을 치르도록 요청한다. SME는 우리가 다른 곳에서 논의된 각 학생의 실제 점수를 추정할 수 있게 해준다.

In scientific disciplines, it is often possible to measure variables with a great deal of accuracy and objectivity but when measuring student performance on a given test due to a wide variety of confounding factors and errors, this accuracy and objectivity becomes more difficult to obtain. For instance, if a test is administrated to a student, he or she will obtain a variety of scores on different occasions, due to measurement errors affecting his or her score. Under CTT, the student's score on a given test is a function of the student's true score plus random errors (Alagumalai & Curtis ), which can fluctuate from time to time. Due to the presence of random errors influencing examinations, we are unable to exactly determine a student's true score unless they take the exam an infinite number of times. Computing the mean score in all exams would eliminate random errors resulting in the student's score eventually equalling the true score. However, it is practically impossible to take a test an infinite number of times. Instead we ask an infinite number of students (in reality a large cohort!) to take the test once allowing us to estimate a generalised standard error of measurement (SME) from all the students’ scores. The SME allows us to estimate the true score of each student which has been discussed elsewhere (Tavakol & Dennick ).

신뢰성.
Reliability

여기서 관찰된 점수가 참 점수와 오류 점수의 합으로 구성되듯이, 시험에서 관찰된 점수의 분산은 [참 점수]와 [오류 점수]의 분산의 합으로 이루어지며, 이는 다음과 같이 공식화될 수 있다.
It is worth reiterating here that just as the observed score is composed of the sum of the true score and the error score, the variance of the observed score in an examination is made up of the sum of the variances of the true score and the error score, which can be formulated as follows:



이제 테스트가 동일한 코호트에 여러 번 시행되었다고 상상해 보십시오. 각 개인에 대한 관측된 점수의 분산 사이에 불일치가 있으면 각 테스트에서 테스트의 신뢰성이 낮아집니다. 검정 신뢰성은 [관찰된 점수의 분산]에 대한 [참 점수의 분산]의 비율로 정의됩니다.

Now imagine a test has been administered to the same cohort several times. If there is a discrepancy between the variance of the observed scores for each individual, on each test, the reliability of the test will be low. The test reliability is defined as the ratio of the variance of the true score to the variance of the observed score:

이 경우 관측된 점수 분산에 대한 실제 점수 분산의 비율이 클수록 검정의 신뢰성이 높아집니다. 식 (2)에서 식 (1)의 분산(참 점수)을 대입하면 신뢰도는 다음과 같습니다.
Given this, the greater the ratio of the true score variance to the observed score variance, the more reliable the test. If we substitute variance (true scores) from Equation (1) in Equation (2), the reliability will be as follows:

그런 다음 신뢰도 지수를 다음과 같이 재정렬할 수 있습니다.
And then we can rearrange the reliability index as follows:

이 방정식은 단순히 [측정 오차] 원인과 [신뢰도] 사이의 관계를 보여줍니다. 예를 들어, 랜덤 오차가 없는 검정의 경우 신뢰도 지수는 1이지만 오차의 양이 증가하면 신뢰도 추정치는 감소합니다.
This equation simply shows the relationship between source of measurement error and reliability. For example, if a test has no random errors, the reliability index is 1, whereas if the amount of error increases, the reliability estimate will decrease.

테스트 신뢰성 향상
Increasing the test reliability


신뢰도를 추정하기 위해 사용되는 통계적 절차는 크론바흐의 알파와 쿠더-리처드슨 20 공식(KR-20)이다. 검정 신뢰도가 0.70보다 작으면 항목-총 상관 관계가 낮은 문제를 제거하는 것을 고려해야 할 수 있습니다. 예를 들어 표 1과 표 2의 네 가지 질문에 대한 시뮬레이션된 SPSS 출력을 만들었습니다.

The statistical procedures employed for estimating reliability are Cronbach's alpha and the Kuder–Richardson 20 formula (KR-20). If the test reliability was less than 0.70, you may need to consider removing questions with low item-total correlation. For example, we have created a simulated SPSS output for four questions in Tables 1 and 2.

표 1은 4개의 질문에 대한 크론바흐의 알파 0.72를 보여준다. 표 2는 'Cronbach's Alpha if Item deleted'라는 제목의 열이 있는 항목-총 상관 통계를 보여줍니다. (항목-총 상관관계는 개별 질문 점수와 총 점수 사이의 상관 관계입니다.)

Table 1 shows Cronbach's alpha for four questions, 0.72. Table 2 shows item-total correlation statistics with the column headed ‘Cronbach's Alpha if Item deleted’. (Item-total correlation is the correlation between an individual question score and the total score).


시험의 네 번째 문항은 총 항목 상관 관계가 -0.51로, 이 특정 문항에 대한 응답이 총점과 음의 상관 관계를 가지고 있음을 의미합니다. 이 문제를 시험에서 제거하면 나머지 세 문제 중 알파가 0.725에서 0.950으로 증가하여 시험을 훨씬 더 신뢰할 수 있습니다.
The fourth question in the test has a total-item correlation of −0.51 implying that responses to this particular question have a negative correlation with the total score. If we remove this question from the test, the alpha of the three remaining questions increase from 0.725 to 0.950, making the test significantly more reliable.

표 3과 4는 질문 4를 제거한 후의 출력 SPSS를 보여줍니다.
Tables 3 and 4 show the output SPSS after removing Question 4:

 

표 3과 표 4는 문제 4를 시험에서 제거하면 알파 값이 크게 증가하는 영향을 보여줍니다.

Tables 3 and 4 illustrate the impact of removing Question 4 from the test, which significantly increases the value of alpha.

그러나 이제 문제 2를 제거하면 시험에 대한 알파 값이 완벽해집니다. 즉, 1은 시험의 각 문제가 정확히 동일한 것을 측정해야 한다는 것을 의미합니다. 여러 문항이 동일한 구성을 측정하는 등 시험에 중복성이 있음을 시사하기 때문에 반드시 좋은 것은 아니다. 이 경우 신뢰성을 훼손하지 않고 테스트 길이를 단축할 수 있습니다. 신뢰성은 검정 길이의 함수이기 때문입니다. 항목이 많을수록 검정의 신뢰성이 높아집니다. 
However, if we now remove Question 2, the value of the alpha for the test will be perfect, i.e. 1, which means each question in the test must be measuring exactly the same thing. This is not necessarily a good thing as it suggests that there is redundancy in the test, with multiple questions measuring the same construct. If this is the case, the test length could be shortened without compromising the reliability (Nunnally & Bernstein ). This is because the reliability is a function of test length. The more the items, the more the reliability of a test.


Cronbach의 알파와 KR-20은 검정의 신뢰성을 추정하는 데 유용하지만, [측정 오차의 모든 원인을 하나의 값으로 통합]합니다(Mushquash & O'Connor). 실제 점수는 관찰된 점수와 [다양한 출처에서 파생된 오류]를 더한 것과 동일하다는 점을 기억하십시오. 각 오차원의 영향은 일반성 계수로 추정할 수 있으며, 이는 실제 점수 모델의 신뢰도 추정치와 유사하다. 나중에 우리는 알려진 대로 일반화 가능성 이론 또는 G 이론을 사용하여 측정 오류의 원인을 식별하고 줄이는 방법을 설명할 것이다. 또한 이전 가이드에서는 문항 난이도, 문항 변별도 및 포인트 바이시리얼 계수를 CTT의 관점에서 설명하고 해석하였다. 
Although Cronbach's alpha and KR-20 are useful for estimating the reliability of a test, they conflate all sources of measurement error into one value (Mushquash & O'Connor ). Recall that true scores equal observed scores plus errors, which is derived from a variety of sources. The influence of each source of error can be estimated by the coefficient of generalisability, which is similar to a reliability estimate in the true score model (Cohen & Swerdlik ). Later we will describe how to identify and reduce sources of measurement errors using generalisability theory or G-theory as it is known. What is more, in our previous Guide (Tavakol & Dennick 2012), we explained and interpreted item difficulty level, item discrimination index and point bi-serial coefficient in terms of CTT.

본 가이드에서는 이러한 개념을 항목 특성 매개 변수(항목 난이도 및 항목 변별력)를 이용한 IRT(Item Response Theory)와 래쉬 모델을 이용한 모든 질문에 대한 학생 능력/성과의 관점에서 설명하고 해석할 것이다.
In this Guide, we will explain and interpret these concepts in terms of Item Response Theory (IRT) using item characteristic parameters (item difficulty and item discrimination) and the student ability/performance to all questions using the Rasch model.

인자분석
Factor analysis

[선형 요인 분석]은 시험 개발자가 문제 수를 줄이고 중요한 문제가 시험에 포함되도록 하기 위해 널리 사용된다. 예를 들어, 심장병학 강좌 소집자는 심장병학을 가르치는 데 관련된 모든 의학 교사들에게 시험을 위한 10개의 문제를 제공하도록 요청할 수 있다. 이 경우 100개의 질문이 생성될 수 있지만, 이 모든 질문은 동일한 개념 집합을 테스트하는 것은 아닙니다. 따라서 문제들 간의 상관관계 패턴을 파악하면 시험의 기본 요소를 대상으로 하는 관련 문제를 발견할 수 있다. 요인은 일련의 질문 사이의 관계를 나타내는 구인이며, 질문이 요인과 상관관계가 있을 경우 생성됩니다. 요인 분석 언어에서, 이는 요인 '적재loadings'를 의미한다. 요인 분석이 수행된 후, 관련된 질문은 특정 명명된 구조를 나타내는 요인에 로드됩니다. 따라서 적재량이 낮은 질문은 제거하거나 수정할 수 있습니다. 
Linear factor analysis is widely used by test developers in order to reduce the number of questions and to ensure that important questions are included in the test. For example, the course convenor of cardiology may ask all medical teachers involved in teaching cardiology to provide 10 questions for the exam. This might generate 100 questions, but all these questions are not testing the same set of concepts. Therefore, identifying the pattern of correlations between the questions allows us to discover related questions that are aimed at the underlying factors of the exam. A factor is a construct which represents the relationship between a set of questions and will be generated if the questions are correlated with the factor. In factor analysis language, this refers to factor ‘loadings’. After factor analysis is carried out, related questions load onto factors which represent specific named constructs. Questions with low loadings can therefore be removed or revised.

테스트가 단일 특성을 측정하는 경우, [부하가 높은 요인 하나]만 관찰된 질문 관계를 설명하므로 테스트는 단일 차원입니다. 여러 요인이 확인되면 검정은 다차원적인 것으로 간주됩니다.
If a test measures a single trait, only one factor with high loadings will explain the observed question relationships and hence the test is uni-dimensional. If multiple factors are identified, then the test is considered to be multi-dimensional.

[선형 요인 분석]에는 [탐색적 요인]과 [확인적 요인]의 두 가지 주요 요소가 있습니다.

  • 탐색적 요인 분석(EFA)은 검정 내의 기본 구성 요소를 식별하고 이들 사이의 모형 관계를 가정합니다.
  • 확인적 요인 분석(CFA)은 모형이 새 데이터 집합을 사용하여 데이터에 적합한지 여부를 검증합니다. 아래에서는 각 방법에 대해 설명합니다.

There are two main components to linear factor analysis: exploratory and confirmatory.

  • Exploratory Factor Analysis (EFA) identifies the underlying constructs or factors within a test and hypothesises a model relationship between them.
  • Confirmatory Factor Analysis (CFA) validates whether the model fits the data using a new data set. Below, each method is explained.

탐색적 요인 분석
Exploratory factor analysis

EFA는 앞에서 설명한 바와 같이 문제 간의 관계를 식별하고, 테스트에서 주요 요소를 발견하는 데 널리 사용된다. 시험 문제를 수정하거나 특정 지식 영역의 문제를 선택하는 데 사용할 수 있습니다. 예를 들어, 심장학 검사에서 관상동맥 심장 질환의 임상 징후를 검사하는 데 관심이 있는 경우, 이 영역에 로드load되는 질문을 단순히 찾습니다. 다음 시뮬레이션 예제는 50명의 학생이 10개의 문제를 출제하는 시험을 사용하여 시험에서 문제를 개선하는 방법을 보여줍니다. 이를 통해 시험 문제를 수정하고 강화하는 방법을 시연하고 관심 영역에 대한 loadings를 계산할 수 있다. EFA는 요인 식별뿐만 아니라 각 질문에 대한 '커뮤널리티communality'도 계산합니다. communality의 개념을 이해하기 위해서는 EFA 접근법 내의 분산variance(점수의 변동성)을 설명할 필요가 있다.
EFA is widely used to identify the relationships between questions and to discover the main factors in a test as previously described. It can be used either for revising exam questions or choosing questions for a specific knowledge domain. For example, if in the cardiology exam we are interested in testing the clinical manifestations of coronary heart disease, we simply look for the questions which load on to this domain. The following simulated example, using an examination with 10 questions taken by 50 students, demonstrates how to improve the questions in an examination. This allows us to demonstrate how to revise and strengthen exam questions and to calculate the loadings on the domain of interest. As well as identifying the factors EFA also calculates the ‘communality’ for each question. To understand the concept of communality, it is necessary to explain the variance (the variability in scores) within the EFA approach.

우리는 이미 기술 통계로부터 변수의 분산을 계산하는 방법을 배웠다. 요인 분석 언어에서 각 질문의 분산은 두 부분으로 구성됩니다. 한 부분은 'common variance'이라고 하는 다른 질문과 공유할 수 있는 것이 있고, 나머지는 '오류' 또는 '랜덤 분산'이라고 하는 다른 질문과 공유할 수 없습니다. 문항에 대한 communality은 특정 요인 집합으로 설명되는 분산의 값으로, 범위는 0에서 1.00 사이입니다. 예를 들어 랜덤 분산이 없는 문항은 1.00의 공통성을 가지며, 다른 문항과 분산이 공유되지 않은 문항은 0.00의 공통성을 가집니다. 문항 9(표 5)에 대한 communality은 0.85로, 즉 질문 9의 분산의 85%가 요인 1과 요인 2로 설명되며, 질문 9의 분산의 15%는 다른 문항과는 공통점이 없습니다. 
We have already learnt from descriptive statistics how to calculate the variance of a variable. In the language of factor analysis, the variance of each question consists of two parts. One part can be shared with the other questions, called ‘common variance’; the rest may not be shared with other questions, called ‘error’ or ‘random variance’. The communality for a question is the value of the variance accounted for by the particular set of factors, ranging from 0 to 1.00. For example, a question that has no random variance would have a communality of 1.00; a question that has not shared its variance with other questions would have a communality of 0.00. The communality shown for Question 9 (Table 5) is 0.85, that is 85% of the variance in Question 9 is explained by factor 1 and factor 2, and 15% of the variance of Question 9 has nothing in common with any other question.

SPSS의 각 질문에 대한 공유 분산을 계산하기 위해 SPSS(SPSS)에서 다음 단계를 수행합니다. 메뉴에서 'Analyse', 'Dimension Reduction' 및 'Factor'를 각각 선택합니다. 그런 다음 모든 질문을 '변수' 상자로 이동합니다. 설명'을 선택한 다음 '초기 솔루션'과 '계수'를 각각 클릭합니다. 그런 다음 '회전'을 클릭합니다. 'Varimax'를 선택하고 'Continue'를 클릭한 다음 'OK'를 클릭합니다. 표 5에서, 우리는 SPSS 출력의 시뮬레이션 데이터를 함께 결합했다.
To compute the shared variances for each question in SPSS, the following steps are carried out in SPSS (SPSS ). From the menus, choose ‘Analyse’, ‘Dimension Reduction’ and ‘Factor’, respectively. Then move all questions on to the ‘Variables’ box. Choose ‘Descriptive’ and then click ‘Initial Solution’ and ‘Coefficients’, respectively. Then click ‘Rotation’. Choose ‘Varimax’ and click on ‘Continue’ and then ‘OK’. In Table 5, we have combined the simulated data of the SPSS output together.

표 5는 [두 가지 요인]이 나타났음을 보여줍니다. 요인 1은 질문 9, 2, 6, 10, 4, 1, 3에서 우수한 하중을 나타내고 요인 2는 질문 7, 8에서 우수한 하중을 나타내므로 이러한 항목이 요인 1, 2와 강한 상관 관계가 있음을 알 수 있습니다. 0.71보다 큰 값을 가진 하중은 우수한 것으로 간주된다는 점에 유의해야 한다(0.71 × 0.71 = 0.50 × 100. 즉, 항목과 요인 간의 공통 분산 또는 항목 내 변동의 50%를 요인의 변동으로 설명할 수 있으며, 또는 변동의 50%를 항목과 요인에 의해 설명될 수 있다), 0.63(40% 공통 변동)은 매우 양호하며, 0.45(20% 공통 분산)는 적당합니다. 0.32(공통 분산 10%)보다 작은 값은 불량으로 간주되고 전체 검정에 덜 기여하므로 이러한 값을 조사해야 합니다. 
Table 5 shows that two factors have emerged. Factor 1 demonstrates excellent loading with Questions 9, 2, 6, 10, 4, 1 and 3 and Factor 2 demonstrates excellent loading with Questions 7 and 8, indicating these items have a strong correlation with Factors 1 and 2.

  • It should be noted that loadings with values greater than 0.71 are considered excellent (0.71 × 0.71 = 0.50 × 100; i.e. 50% common variance between the item and the factor, or 50% of the variation in the item can be explained by the variation in the factor, or 50% of the variance is accounted for by the item and the factor),
  • 0.63 (40% common variance) very good,
  • 0.45 (20% common variance) fair.
  • Values less than 0.32 (10% common variance) are considered poor and less contribute to the overall test and they should be investigated (Comrey & Lee ; Tabachnick & Fidell ). 

표 5는 또한 h2로 표시된 열의 각 질문에 대한 communalities 을 보여준다. 예를 들어, 질문 2의 분산의 92%는 EFA 접근법에서 나타난 두 가지 요인에 의해 설명된다. 가장 낮은 communalities 은 질문 5에 대한 것이며, 분산의 8%를 기소하는 것은 이 질문으로 설명된다. 30% 미만의 낮은 값은 문제의 분산이 식별된 요인에 로드된 다른 질문과 관련이 없음을 나타냅니다. 표 5에서 질문 5는 커뮤니티 수치가 가장 낮고 요인 1 또는 2에 로드되지 않았으므로 이 질문을 수정하거나 폐기해야 합니다.

Table 5 also shows communalities for each question in the column labelled h2. For example, 92% of the variance in Question 2 is explained by the two factors that have emerged from the EFA approach. The lowest communality is for Question 5, indicting 8% of the variance is explained by this question. Low values of less than 30% indicate that the variance of the question does not relate to other questions loaded on to the identified factors. In Table 5, Question 5 has the lowest communality figure and has not loaded onto Factors 1 or 2, suggesting this question should be revised or discarded.


표 5는 또한 EFA 접근법에서 확인된 [두 가지 요인에 의해 설명되는 분산 값]을 보여줍니다. 분산의 0.47은 인자 1로, 분산의 0.23은 인자 2로 설명됩니다. 따라서 분산의 0.70은 모든 질문에 의해 설명됩니다. 그러나 질문 5를 삭제하면 총 분산이 0.78로 증가할 수 있습니다. 표 5에 대한 추가 해석은, 대다수의 문제가 인자 1에 실려서 시험의 구인 타당도에 대한 수렴 및 변별의 증거를 제공한다는 것이다.

  • 인자 1에 대한 부하가 높기 때문에 테스트가 [수렴]된다고 주장할 수 있습니다.
  • 또한 요인 1에 적재된 문제가 요인 2에 적재되지 않았으므로 시험은 [변별]됩니다.

즉, 요인 2는 요인 1과 구별되는 또 다른 구성/개념을 측정합니다. 두 개의 인자가 확인되었으므로 두 개의 서로 다른 구조를 측정하기 때문에 각 인자에 대한 Cronbach의 알파 계수를 계산하는 것이 적절할 것입니다. 세 가지 이상의 요인에 적재되는 문항은 조사가 필요하다는 점에 유의해야 한다.

Table 5 also shows the values of variance explained by the two factors that have been identified from the EFA approach; 0.47 of the variance is accounted for by Factor 1 and 0.23 of the variance is accounted for by Factor 2. Therefore, 0.70 of the variance is accounted for by all of the questions. However, if we delete Question 5, we can increase the total variance accounted for to 0.78. A further interpretation of Table 5 is that the vast majority of questions have been loaded on to Factor 1, providing evidence of convergence and discrimination for the construct validity of the test.

  • We can argue that the test is convergent as there are high loadings on to Factor 1.
  • The test is also discriminant as the questions that have loaded on to Factor 1 have not loaded on to Factor 2.

This means that Factor 2 measures another construct/concept which is discriminated from Factor 1. Because two factors have been identified, it would be appropriate to calculate Cronbach's alpha co-efficient for each factor because they are measuring two different constructs. It should be noted that items which load on more than two factors need to be investigated.

확인적 요인 분석
Confirmatory factor analysis

CFA의 기술은 심리 검사를 검증하는 데 널리 사용되었지만 시험 문제의 심리학적 특성을 평가하고 개선하는 데는 덜 사용되었다. EFA 접근 방식은 시험 문제가 어떻게 연관되거나 기저 요인 영역과 연결되는지 밝힐 수 있다. 예를 들어, EFA 접근 방식은 100문항 시험의 내부 구조가 신체 검사, 임상 추론 및 의사소통 기술 등 [세 가지 기저 영역]으로 구성되어 있음을 보여줄 수 있다. 식별된 요인의 수는 가설 모형, 즉 요인 구조 모형의 성분을 구성합니다. 위의 예제에서 모형을 3-요인 모형이라고 합니다. CFA 접근법은 잠재(기본) 요인을 확인하기 위해 [EFA에 의해 추출된 가설 모델]을 사용한다. 그러나 모형 적합을 확인하려면 순환 논리circular argument를 피하기 위해 [새 데이터 세트]를 사용해야 합니다. 예를 들어, 같은 시험을 다른 학생 그룹이나 비교 가능한 학생 그룹에 적용할 수 있다.
The technique of CFA has been widely used to validate psychological tests but has been less used to evaluate and improve the psychometric properties of exam questions. The EFA approach can reveal how exam questions are correlated or connected to an underlying domain of factors. For example, an EFA approach may show that the internal structure of a 100 question test consist of three underlying domains, say physical examination, clinical reasoning and communication skills. The number of factors identified constitutes the components of a hypothesised model, the factor structure model. In the above example, the model would be termed a three-factor model. The CFA approach uses the hypothesised model extracted by EFA to confirm the latent (underlying) factors. However, in order to confirm model fitting, a new data set must be used to avoid a circular argument. For example, the same test could be administered to a different but comparable group of students.

따라서 교육자는 먼저 EFA를 사용하여 모델을 식별하고 CFA를 사용하여 테스트해야 합니다. 또한 이 접근 방식을 통해 교육자는 시험 문제와 구성 요소(Floys & Widman)를 수정할 수 있습니다. 예를 들어, EFA가 병력 시험과 신체 검사 문제로 구성된 시험에서 2-요인 모델을 공개했다고 가정합시다. 연구자는 문제의 심리학적 특성을 측정하고 모형의 전반적인 적합성을 검정하여 시험의 타당성과 신뢰성을 향상시키려 합니다. 이것은 가설 모델에 새로 입력된 샘플 데이터의 적합도를 결정하는 구조 방정식 모델링(SEM)을 사용하여 달성될 수 있다. [모형 적합성model fit]은 카이-제곱 검정 및 기타 적합 지수를 사용하여 평가됩니다. 다른 통계 가설 검정 절차와 달리 카이-제곱 값이 [유의하지 않으면], 새 데이터가 적합하고, 모형이 확인된 것이다. 그러나 카이-제곱의 값은 표본 크기를 늘거나 줄어드는 것에 달라지는 함수이므로 [다른 적합 지수]들도 조사해야 합니다. 이러한 지수는 비교 적합 지수(CFI)근삿값 평균 제곱 오차(RMSEA)입니다.

  • CFI 값이 0.90보다 크면 검사 데이터에 대해 심리적으로 허용 가능한 적합도를 나타냅니다.
  • RMSEA 값이 0.05보다 작아야 적합성이 양호합니다RMSEA가 0이면 모형 적합이 완벽하다는 것을 나타냅니다.
  • CFA는 SAS, LISREL, AMOS 및 Mplus와 같은 다수의 인기 있는 통계 소프트웨어 프로그램에 의해 실행될 수 있다는 점에 유의해야 한다.

Therefore, educators must first identify a model using EFA and test it using CFA. This approach also allows educators to revise exam questions and the factors underlying their constructs (Floys & Widaman ). For example, suppose EFA has revealed a two-factor model from an exam consisting of history-taking and physical examination questions. The researcher wishes to measure the psychometric characteristics of the questions and test the overall fit of the model to improve the validity and reliability of the exam. This can be achieved by the use of structural equation modelling (SEM) which determines the goodness-of-fit of the newly input sample data to the hypothesised model. The model fit is assessed using Chi-square testing and other fit indices. In contrast to other statistical hypothesis testing procedures, if the value of Chi-square is not significant, the new data fit and the model is confirmed. However, as the value of Chi-square is a function of increasing or decreasing sample size, other fit indices should also be investigated (Dimitrov ). These indices are the comparative fit index (CFI) and the root mean square error of approximation (RMSEA).

  • A CFI value of greater than 0.90 shows a psychometrically acceptable fit to the exam data.
  • The value of RMSEA needs to be below 0.05 to show a good fit (Tabachnick & Fidell ). A RMSEA of zero indicates that the model fit is perfect.
  • It should be noted that CFA can be run by a number of popular statistical software programmes such as SAS, LISREL, AMOS and Mplus.

이 논문의 목적을 위해, 우리는 그것의 용이한 사용을 위해 AMOS(모멘트 구조의 분석)를 선택한다. AMOS 소프트웨어 프로그램은 모형을 쉽게 만들고 카이-제곱 값과 적합 지수를 계산할 수 있습니다. 위의 예에서, 8문항의 시험은 역사 시험과 신체 검사라는 두 가지 요소를 가지고 있으며, 이 8문항의 분산은 이 두 가지 높은 상관관계 요인에 의해 설명될 수 있다. 테스트 개발자는 AMOS에서 2-요인 모델(경로 다이어그램)을 그려 모델을 테스트합니다(그림 3). 모델의 매개변수를 추정하기 전에 '보기'를 클릭하고 '분석 특성'을 클릭한 다음 '최소화 기록', 표준화 추정치, '다중 상관 제곱' 및 '수정 지수'를 클릭합니다. 견적을 실행하려면 맨 위의 메뉴에서 '분석'을 클릭한 다음 '견적 계산'을 클릭합니다.

For the purpose of this article, we choose AMOS (Analysis of Moment Structures) for its use of ease. The AMOS software program can easily create models and calculate the value of Chi-square as well as the fit indices. In the above example, a test of 8 questions has two factors, history-taking and physical examination and the variance of these eight exam questions can be explained by these two highly correlated factors. The test developer draws the two-factor model (the path diagram) in AMOS to test the model (Figure 3). Before estimating the parameters of the model, click on the ‘view’ and click on ‘Analysis Properties’ and then click on ‘Minimization history’, Standardised estimates, ‘Squared multiple Correlations’ and ‘Modification indices’. To run the estimation, from the menu at the top, click on ‘Analyze’, then click on ‘Calculate Estimates’.

 

출력은 표 6에 나와 있습니다. SEM은 질문과 요인 간의 계산된 상관 관계의 기울기와 절편을 계산합니다. CTT와 비교하자면,

  • 절편은 항목 난이도 지수와 유사하며
  • 기울기(표준화된 회귀 가중치/계수)는 변별도와 유사합니다.

The output is given in Table 6. SEM calculates the slopes and intercepts of calculated correlations between questions and factors. From a CTT,

  • the intercept is analogous to the item difficulty index and
  • the slope (standardised regression weights/coefficients) is analogous to the discrimination index.

 

표 6은 병력탐구 1번 문항이 쉬웠고, 신체검사에서 3번 문항이 어려웠다는 것을 알 수 있다. 표 6은 또한 병력 시험 문제 4가 전체 병력시험 점수에 기여하지 않는다는 것을 보여준다. 검사 데이터에 대한 적합 모형의 정도를 평가하기 위해 추가 분석이 수행되었습니다.
Table 6 shows that Question 1 in history-taking and Question 3 in physical examination were easy (intercept = 0.97) and hard (0.08), respectively. Table 6 also shows that Question 4 in history-taking is not contributing to overall history-taking score (slope = −0.03). Further analysis was conducted to assess degree of fit model to the exam data.

표 7에 초점을 맞추면 카이-제곱 값에 대한 유의성 결여(p = 0.49)는 새 표본에서 2-요인 모형에 대한 지지를 의미합니다. 표 7의 CFI 및 RMSEA 값을 모두 검토하면 2-요인 모형이 새 표본에 대한 검사 데이터에 가장 적합하다는 것이 명백합니다.
Focusing on Table 7, the absence of significance for the Chi-square value (p = 0.49) implies support for the two- factor model in the new sample. In reviewing values of both CFI and RMSEA in Table 7, it is evident that the two-factor model represents a best fit to the exam data for the new sample.



검사의 병력 청취 성분과 신체 검사 성분 사이의 관계에 대한 추가 증거는 가정된 2-요인 모델을 뒷받침하는 두 요인 간의 0.70 상관관계를 계산함으로써 드러난다. AMOS는 '출력 다이어그램 보기' 버튼을 클릭하여 요인/구성 요소 간의 상관 관계를 표시합니다. 또한 '텍스트 출력'에서 상관 관계 추정치를 볼 수 있습니다. 메인 메뉴에서 보기를 선택한 다음 '텍스트 출력'을 클릭합니다.

Further evidence for the relationship between the history-taking and physical examination components of the test is revealed by the calculation of a 0.70 correlation between the two factors, supporting the hypothesised two-factor model. It should be noted that AMOS will display the correlation between factors/components by clicking the ‘view the output diagram’ button. You can also view correlation estimates from ‘text output’. From the main menu, choose view and then click on ‘text output’.

일반화 가능성 이론 분석
Generalisability theory analysis

[신뢰성]은 학생들의 지식과 역량을 일관되게 측정하는 [테스트의 능력]과 관련이 있다는 점을 기억하시기 바랍니다. 예를 들어, 같은 항목과 같은 조건을 가진 학생들이 다른 경우에 같은 시험을 다시 본다면, 결과는 거의 같아야 한다. CTT에서 항목 및 조건은 획득된 점수와 관련된 측정 오류의 원인일 수 있습니다. KR-20 또는 크론바흐의 알파와 같은 신뢰성 추정치는 이러한 문항과 조건(시험의 측면facet이라고도 함)과 관련된 측정 오류의 잠재적 원인을 식별할 수 없으며, 각각을 구별할 수 없다.

We would ask you to recall that reliability is concerned with the ability of a test to measure students' knowledge and competencies consistently. For example, if students are re-examined with the same items and with the same conditions on different occasions, the results should be more or less the same. In CTT, the items and conditions may be the causes of measurement errors associated with the obtained scores. Reliability estimates, such as KR-20 or Cronbach's alpha, cannot identify the potential sources of measurement error associated with these items and conditions (also known as facets of the test) and cannot discriminate between each one. 

그러나 Lee J. Cronbach와 동료들이 개발한 일반화가능도 이론 또는 G-이론이라고 불리는 CTT의 확장은 테스트 생성자가 실제 점수를 해석하기 위한 측정 오류의 원천에 대한 더 명확한 그림을 얻을 수 있도록 이러한 측면을 인식, 추정 및 분리하려고 시도한다. 예를 들어, G이론을 사용하여 OSCE 검사 결과에 대한 단일 분석으로 모든 측면을 추정할 수 있으며, 잠재적으로 시험에서 오류를 발생시킬 수 있다. 측정 오차의 각 면에는 아래에 설명된 분산 분석(ANOVA) 절차를 통해 계산되는 분산 성분variance component이라는 값이 있습니다. 이러한 분산 성분variance component은 다음으로 시험의 신뢰성과 같으며 모든 측면에 걸쳐 학생들의 평균 점수를 일반화할 수 있는 G 계수를 계산하는 데 사용됩니다.
However, an extension of CTT called Generalisability Theory or G-theory, developed by Lee J. Cronbach and colleagues (Cronbach et al. ), attempts to recognise, estimate and isolate these facets allowing test constructors to gain a clearer picture of sources of measurement error for interpreting the true score. One single analysis of, for example, the results of an OSCE examination, using G-theory can estimate all the facets, potentially producing error in the test. Each facet of measurement error has a value associated with it called its variance component, calculated via an analysis of variance (ANOVA) procedure, described below. These variance components are next used to calculate a G-coefficient which is equivalent to the reliability of the test and also enables one to generalise students’ average score over all facets.

예를 들어 OSCE가 SP, 다양한 검사자 및 다양한 항목을 사용하여 12개 스테이션에서 학생들의 성과를 평가했다고 가정해 보십시오. [평가의 한 측면]으로서 SP, 심사관 및 항목과 이들의 상호작용(예: SP와 항목 간의 상호작용)이 고려할 수 있다. 학생이 OSCE에서 얻은 점수는 이러한 [측정 오류의 측면]에 영향을 받기 때문에 평가자는 각 측면에 의해 야기되는 오류의 양을 추정해야 한다. 또한, 우리는 학생들이 시험을 이용하여 그들의 시험 수행에 대한 최종 결정을 내리는 것을 조사한다. 이 결정을 내리기 위해서, 우리는 그 점수에 근거하여 각 학생에 대한 시험 점수를 일반화할 필요가 있다. 이것은 평가자들이 좋은 결정을 내리기 위한 수단으로서 점수의 신뢰성과 신뢰성을 보장해야 한다는 것을 나타낸다. 따라서 테스트에서 얻은 관측(취득) 점수와 관련된 오류의 구성을 조사할 필요가 있다. 그런 다음 G-이론 분석은 확인된 오류의 원인을 최소화하기 위해 테스트 생성자에게 유용한 정보를 제공할 수 있다. 이제 분산 성분에서 G-계수를 계산하는 방법을 설명하겠습니다.
For example, imagine an OSCE has used SPs, a range of examiners and various items to assess students' performance on 12 stations. SPs, examiners and items and their interactions (e.g. interaction between SPs and items) are considered as facets of the assessment. The score that the student obtains from the OSCE will be affected by these facets of measurement error and therefore the assessor should estimate the amount of error caused by each facet. Furthermore, we examine students using a test to make a final decision regarding their performance on the test. To make this decision, we need to generalise a test score for each student based on that score. This indicates that assessors should ensure the credibility and trustworthy of the score as means to making a good decision (Raykov & Marcoulides ). Therefore, the composition of errors associated with the observed (obtained) scores that gained from a test need to be investigated. G-theory analysis can then provide useful information for test constructors to minimise identified sources of error (Brennan ). We will now explain how to calculate the G-coefficient from variance components.

G-계수 계산
G-coefficient calculation

Facet의 분산 성분에서 G-계수를 계산하기 위해 검정 분석가는 전통적으로 ANOVA 절차를 사용합니다. ANOVA은 검사에 존재하는 [총 분산]을 측정 오차의 원인인 [두 개 이상의 성분]으로 분할하는 통계적 절차입니다. 조사자는 분산 분석 결과(예: SP, 항목, 평가자 등)에서 각 변동 소스의 계산된 평균 제곱을 사용하여 분산 성분을 결정한 다음 이러한 값에서 G-계수를 계산합니다.
To calculate the G-coefficient from variance components of facets, test analysers traditionally use the ANOVA procedure. ANOVA is a statistical procedure by which the total variance present in a test is partitioned into two or more components which are sources of measurement error. Using the calculated mean square of each source of variation from the ANOVA output (e.g. SPs, items, assessors, etc.), investigators determine the variance components and then calculate the G-coefficient from these values.

그러나 SPSS 및 통계 분석 시스템(SAS)과 같은 기타 통계 패키지를 통해 이제 테스트 데이터에서 직접 분산 성분을 계산할 수 있습니다. 이제 G-계수를 계산하기 위해 SPSS에서 직접 분산 성분을 얻는 방법을 설명하겠습니다. 사용되는 절차는 테스트의 facet 수에 따라 달라집니다. 아래 설명된 바와 같이 단일 패싯 및 다중 패싯 설계가 있습니다.
However, SPSS and other statistical packages like the Statistical Analysis System (SAS) now allow us to calculate the variance components directly from the test data. We will now illustrate how to obtain the variance components from SPSS directly for calculating the G-coefficient. The procedure used varies according to the number of facets in the test. There are single facet and multiple facet designs as described below.

단면 설계
Single facet design

[단일 facet 설계]는 테스트에서 측정 오류의 단일 소스만 검사하지만 실제로는 다른 요소가 존재할 수 있습니다. 예를 들어, OSCE 시험에서 오류의 원인으로서 검사자의 영향에 초점을 맞추고자 할 수 있다. G이론에서, 이를 일면 '학생(들)과 시험자(e)가 교차하는' 설계라고 한다: (s × e). 3명의 검사관이 5개 항목의 1-5 체크 리스트를 사용하여 3개의 서로 다른 스테이션에서 임상 학생의 코호트를 독립적으로 평가하는 OSCE를 고려해보자. 따라서 총 점수 범위는 5에서 25까지이며, 더 높은 표시는 각 스테이션에서 더 높은 수준의 성능을 나타냅니다. G이론을 이용하여 검사자들이 어느 정도의 측정 오차를 발생시키는지 알 수 있다. 그림 4의 SPSS 데이터 편집기에는 설명 목적으로 10명의 학생과 3명의 시험관만이 제시되어 있다.

A single facet design examines only a single source of measurement error in a test although in reality others may exist. For example, in an OSCE examination, we might like to focus on the influence of examiners as sources of error. In G-theory, this is called a one-facet ‘student (s) crossed-with-examiner (e)’ design: (s × e). Consider an OSCE in which three examiners independently rate a cohort of clinical students on three different stations using a 1–5 check list of 5 items. The total mark can therefore range from 5 to 25, with higher mark suggesting a greater level of performance in each station. Using G-theory, we can find out what amount of measurement error is generated by the examiners. For illustrative purpose, only 10 students and the three examiners are presented in the Data Editor of SPSS in Figure 4.

 

분석하기 전에 데이터를 재구성해야 합니다. 이를 위해 화면 상단의 데이터 메뉴에서 '구조조정'을 클릭하고 해당 지침을 따른다. 그림 5에는 재구성된 데이터 형식이 나와 있습니다.
Before analysing, the data needs to be restructured. To this end, from the data menu at the top of the screen, one clicks on ‘restructure’ and follows the appropriate instructions. In Figure 5, the restructured data format is presented.

 


[분산 성분]을 얻기 위해 다음 단계를 수행합니다.
To obtain the variance components, the following steps are carried out:

메뉴에서 '분석'과 '일반 선형 모형'을 각각 선택합니다. 그런 다음 '분산 구성 요소'를 클릭합니다. '점수'를 클릭한 다음 화살표를 클릭하여 '종속 변수'로 표시된 상자로 '점수'를 이동합니다. 학생과 시험관을 클릭하여 '임의 요인'으로 이동합니다. '분산 추정치'가 나타나면 확인을 클릭하면 결과에 대한 각 분산 소스의 기여도가 표 8과 같이 표시됩니다.

From the menus chooses ‘Analyse’, ‘General Linear Model’, respectively. Then click on ‘variance components’. Click on ‘Score’ and then click on the arrow to move ‘Score’ into the box marked ‘dependent variable’. Click on student and examiner to move them into ‘random factors’. After ‘variance estimates’ appears, click OK and the contribution of each source of variance to the result is presented as shown in Table 8.

표 8은 학생과 검사자와 관련된 추정 분산 성분이 각각 10.144와 1.578임을 보여줍니다. 전체 분산의 백분율로 표현하면 40.00%는 학생, 6.20%는 평가자에 의한 것임을 알 수 있다. 그러나 [학생들의 분산]은 학생 코호트 내에서 이러한 변동이 예상되기 때문에 측정 오차의 한 측면으로 간주되지 않으며, G이론 측면에서는 '측정 대상'(Mushquash & O'Connor)으로 불린다. 우리의 분석에 중요한 것은, 조사자들이 전체 변동성의 6.20%를 생성했다는 것을 나타내며, 이는 상당히 낮은 값으로 간주된다. 값이 높을수록 검사자가 시험에 미치는 영향에 대한 우려가 생깁니다. 잔차 분산은 특정 원인에 기인하지 않는 분산의 양이지만 서로 다른 면과 검정 측정 대상 사이의 교호작용과 관련이 있습니다. 이 예제에서는 분산의 53.80%인 13.656을 이 인자로 설명합니다.
Table 8 shows that the estimated variance components associated with student and examiner are 10.144 and 1.578, respectively. Expressed as a percentage of the total variance, it can be seen that 40.00 % is due to the students and 6.20 % to the examiners. However, the variance of the students is not considered a facet of measurement error as this variation is expected within the student cohort and in terms of G-theory, it is called the ‘object of measurement’ (Mushquash & O'Connor ). Importantly for our analysis, the findings indicate that the examiners generated 6.20% of the total variability, which is considered a reasonably low value. Higher values would create concern about the effect of the examiners on the test. The residual variance is the amount of variance not attributed to any specific cause but is related to the interaction between the different facets and the object of measurement of the test. In this example, 13.656 or 53.80% of the variance is accounted for by this factor.


표 8의 결과를 바탕으로, 우리는 이제 일반화 계수를 계산할 수 있는 위치에 있다. 이 경우 G-계수는 [학생 분산 성분]의 비율로 정의됩니다(표시됨). 
On the basis of the findings of Table 8, we are now in a position to calculate the generalisability coefficient. In this case, the G-coefficient is defined as the ratio of the student variance component (denoted 

) [학생 분산 성분과 잔차 분산의 합]에 대해 
) to the sum of the student variance component and the residual variance (denoted 

)를 심사관 수(k)로 나누고 다음과 같이 작성한다.
) divided by the number of examiners (k) (Nunnally and Bernstein ) and written as follows:

위에서 값을 삽입하면 다음과 같은 이점이 있습니다.
Inserting the values from above, this gives:

 

G-계수는 전통적으로 λ 2로 표현되며, 0에서 1.0 사이의 값을 갖는 잘 알려진 신뢰도 계수의 상대이다. (위에서 설명한 단일 면 설계의 G-계수는 (비이분성 데이터의 경우) 크론바흐의 알파 계수 및 (이분성 데이터의 경우) 쿠더-리처드슨 20과 동일하다는 점에 주목할 필요가 있다.) G-계수 값의 해석은 분산 성분에서 계산된 여러 오차원을 고려하여 검정의 신뢰도를 나타낸다는 것입니다. G-계수의 값이 높을수록, 우리는 학생들의 점수에 더 많이 의존할 수 있고(일반화할 수 있음) 연구 면study facet의 영향을 덜 받았다. 위의 예제에서 G-계수는 상당히 높은 값을 가지며 검사자에 대한 분산 성분은 낮습니다. 이는 수험생들이 채점에 큰 편차가 없었음을 보여주며, 학생들의 점수에 대한 자신감을 가질 수 있음을 보여준다.

The G-coefficient, traditionally depicted as ρ 2, is the counterpart of the well-known reliability coefficient with values ranging from 0 to 1.0. (It is worth noting that the G-coefficient in the single facet design described above is equal to Cronbach's alpha coefficient (for non-dichotomous data) and to Kuder–Richardson 20 (for dichotomous data). The interpretation of the value of the G-coefficient is that it represents the reliability of the test taking into account the multiple sources of error calculated from their variance components. The higher the value of the G-coefficient, the more we can rely on (generalise) the students’ scores and the less influence the study facets have been. In the above example, the G-coefficient has a reasonably high value and the variance component for examiners is low. This shows that the examiners did not have significant variation in scoring students and that we can have confidence in the students’ scores.

다면 디자인
A multi-facet design

OSCE 시험에는 심사관 외에도 고려해야 할 [여러 가지 잠재적 facet]이 분명히 있다. 예를 들어, 스테이션 수, SP 수 및 OSCE 체크리스트의 항목 수. 이제 이전 예에서 다면 설계 건물에 대한 분산 성분과 G-계수를 계산하는 방법을 설명하겠습니다. 이제 세 개의 스테이션 각각에는 SP와 학생 개개인의 종합 점수로 이어지는 5개 문항 체크리스트가 있습니다. 여기서 [시험관, 스테이션, SP 및 문항]은 학생 성과에 영향을 미칠 수 있으므로 측정 오류의 한 단면이다.
Clearly in an OSCE examination, there are a number of other potential facets that need to be taken into consideration in addition to the examiners. For example, the number of stations, the number of SPs and the number of items on the OSCE checklist. We will now explain how to calculate the variance components and a G-coefficient for a multi-facet design building on the previous example. Each of three stations now has a SP and a 5-item checklist leading to an overall score for each student. Here, examiners, stations, SPs and items can affect the student performance and hence are facets of measurement error.


그러나 현재 오류의 원인으로 숫자 항목의 영향에 관심이 있기 때문에 각 항목(i), 각 학생(s), 각 스테이션(st), 각 SP(sp) 및 각 검사자(e)에 대한 점수를 입력해야 합니다. 검사 데이터를 SPSS에 입력하고 재구성한 후 앞서 설명한 대로 분산 성분 분석을 수행합니다. 표 9는 OCSE 결과의 잠재적 측정 오류 소스에 대한 분산 성분의 가상 결과를 보여줍니다.
However, because we are now interested in the influence of the number items as a source of error, we need to input the score for each item (i), for each student (s), for each station (st), for each SP (sp) and for each examiner (e). After entering exam data into SPSS and restructuring it, analysis of variance components is carried out as described before. Table 9 shows the hypothetical results of variance components for potential sources of measurement error in the OCSE results.

표 9는 측정 오류의 원인 중 59.16%, 16.37%, 15.04가 각각 학생, 항목 및 검사자 간의 상호작용, 학생과 검사자 및 검사자 간의 상호작용에 의해 발생함을 보여준다. 다른 면들의 조합들 사이의 잔차 분산이 부족하다는 것은 이러한 상호작용으로 인해 학생 점수가 변동할 수 없으며 결과적으로 측정 오차로 이어지지 않는다는 것을 나타낸다. 표 9의 검사관에 대한 분산 성분 값(0.06)은 표 8(1.57)의 값과 다릅니다. 다면 행렬을 만들 때 모든 관측소에 대한 총점보다는 학생들의 개별 항목 점수를 사용하기 때문입니다. 이러한 결과는 또한 각 시험관이 학생에게 부여한 실제 점수(2.88%)에 대해 거의 이견이 없음을 나타낸다. 표 8에 나와 있는 각 면과 관련된 수치와 분산 성분의 값을 다음 방정식에 삽입할 수 있습니다.
Table 9 shows that 59.16 %, 16.37 % and 15.04 of the sources of measurement error are generated by interactions between student, item and examiner, interactions between student and examiner and student, respectively. The lack of residual variance between other combinations of facets indicates that student scores cannot fluctuate owing to these interactions and consequently they do not lead to any measurement error. The value for the variance component for examiners (0.06) in Table 9 differs from the value in Table 8 (1.57) because in creating the multi-facet matrix, we are using individual item scores from students rather than their total mark for all stations. These findings also indicate that there is little disagreement about the actual scores given to student by each examiner (2.88%). We can insert the values of the variance components and the numbers associated with each facet shown in Table 8 into the following equation:

 

분산 성분의 0 값은 삽입되지 않으므로 SP 및 스테이션을 제외합니다.

Zero values of variance components are not inserted, thus excluding SPs and stations.

이 예에서 G-계수는 높고 패싯의 분산 성분은 낮으므로 OSCE의 신뢰성은 매우 우수합니다. 특정 측면에 대해 더 높은 분산 성분 값이 발견되면 더 자세히 조사해야 합니다. 이로 인해 검사관에 대한 교육이 개선되거나 검사 목록 또는 스테이션 수의 항목을 수정할 수 있습니다. 이러한 가상 데이터로 나타난 높은 G 계수를 고려할 때, 우리는 원칙적으로 G의 상당히 높은 값을 유지하면서 개별 면에 대한 k의 값을 줄일 수 있으며, 따라서 OSCE 시험의 신뢰성을 유지할 수 있다. OSCE의 현실 세계에서, 이것은 단순화와 OSCE 심사 비용의 감소로 이어질 수 있다. Cronbach의 알파 통계량은 G에 대해 허용 가능한 값에 대해 0.7에서 0.95 사이의 다양한 견해를 가지고 있다. 검사 요인들이 측정 오류의 근원에 어떻게 영향을 미칠 수 있는지 보기 위해 일반화 방정식을 조작하는 이러한 능력은 [의사결정 연구 또는 D-연구]의 핵심에 있다. 따라서 G-이론과 D-연구는 Cronbach의 알파 통계를 측정하는 것만으로 숨겨진 검사에서 발생하는 다양한 과정에 대한 더 큰 통찰력을 제공한다. 이를 통해 평가자는 훨씬 더 구체적이고 증거에 기반한 방식으로 평가의 질을 향상시킬 수 있습니다.
In this example, the G-coefficient is high and the variance components of the facets are low, hence the reliability of the OSCE is very good. If higher values of variance components are found for particular facets, then they need to be examined in more detail. This might lead to better training for examiners or modifying items in checklists or the number of stations. Given the high G-coefficient shown with these hypothetical data, we could in principle reduce the values of k for individual facets whilst maintaining a reasonably high value of G and hence maintaining the reliability of the OSCE exam. In the real world of OSCEs, this could lead to simplifications and a reduction in the cost of OSCE examining. As for Cronbach's alpha statistic, there are different views concerning acceptable values for G ranging from 0.7 to 0.95 (Tavakol and Dennick , b). This ability to manipulate the generalisability equation in order to see how examination factors can influence sources of measurement error and hence reliability lies at the heart of decision study or D-study (Raykov & Marcoulides ). Thus G-theory and D-study provide a greater insight into the various processes occurring in examinations, hidden by merely measuring Cronbach's alpha statistic. This enables assessors to improve the quality of assessments in a much more specific and evidence-based way.

IRT와 래쉬 모델링
The IRT and Rasch modelling

테스트 생성자는 전통적으로 [CTT 모델]을 사용하여 테스트 테스트의 신뢰성을 정량화했습니다. 예를 들어, 항목 분석(항목 난이도 및 항목 식별), 전통적인 신뢰도 계수(예: KR-20 또는 Cronbach의 알파), 항목-합계 상관 관계 및 요인 분석을 사용하여 검정의 신뢰성을 조사합니다. 우리는 방금 어떻게 G 이론을 사용하여 신뢰도를 모니터링하고 개선하기 위해 검사 조건을 보다 정교한 분석을 할 수 있는지 보여주었다. CTT는 시험과 그 오류에 초점을 맞추지만, [학생들의 능력]이 시험 및 문항과 어떻게 상호작용하는지에 대해서는 거의 언급하지 않는다. 한편, IRT의 목적은 문항의 질을 향상시키기 위해 [학생의 능력]과 [문항의 난이도] 사이의 관계를 측정하는 것이다. 이러한 유형의 분석은 컴퓨터 적응 테스트(CAT)를 위한 더 나은 질문 뱅크를 구축하는 데도 사용될 수 있다.
Test constructors have traditionally quantified the reliability of exam tests using the CTT model. For example, they use item analysis (item difficulty and item discrimination), traditional reliability coefficients (e.g. KR-20 or Cronbach's alpha), item-total correlations and factor analysis to examine the reliability of tests. We have just shown how G-theory can be used to make more elaborate analyses of examination conditions with a view to monitoring and improving reliability. CTT focuses on the test and its errors but says little about how student ability interacts with the test and its items (Raykov & Marcoulides ). On the other hand, the aim of IRT is to measure the relationship between the student's ability and the item's difficulty level to improve the quality of questions. Analyses of this type can also be used to build up better question banks for Computer Adaptive Testing (CAT).

해부학 시험을 치르는 학생을 생각해 보세요. 학생이 항목 1을 올바르게 답할 수 있는 확률은 학생의 해부학적 능력과 항목의 난이도에 영향을 받습니다. 학생이 해부학 지식 수준이 높으면 1번 항목에 정답을 맞출 확률이 높다. 난이도가 낮은 항목(즉, 어려운 항목)의 경우 학생이 해당 항목을 올바르게 답할 확률은 낮습니다. IRT는 학생 시험 점수와 항목 난이도, 항목 판별, 항목 공정성, 추측 및 성별 또는 학년와 같은 기타 학생 속성과 같은 요인(파라미터)을 사용하여 이러한 관계를 분석하려고 시도한다. IRT 분석에서는 위의 parameters로 학생 능력의 교정을 나타내는 항목 맵뿐만 아니라 학생 능력과 올바른 항목 응답 확률 사이의 관계를 보여주는 그래프가 생성된다. 또한 나중에 설명하는 항목 및 학생에 대한 '적합' 통계를 보여 주는 표입니다.
Consider a student taking an exam in anatomy. The probability that the student can answer item 1 correctly is affected by the student's anatomy ability and the item's difficulty level. If the student has a high level of anatomical knowledge, the probability that he/she will answer the item 1 correctly is high. If an item has a low index of difficulty (i.e. a hard item), the probability that the student will answer the item correctly is low. IRT attempts to analyse these relationships using student test scores plus factors (parameters) such as item difficulty, item discrimination, item fairness, guessing and other student attributes such as gender or year of study. In an IRT analysis, graphs are produced showing the relationship between student ability and the probability of correct item responses, as well as item maps depicting the calibrations of student abilities with the above parameters. Also tables showing ‘fit’ statistics for items and students, to be described later.

다양한 형태의 IRT가 도입되었다. [항목 난이도]와 [학생 능력] 간의 관계만을 살펴보려면 단일 모수 로지스틱 IRT(1PL)를 사용한다. 이것은 1960년대에 이것을 추진했던 덴마크의 통계학자를 기리기 위해 라쉬 모델이라고 불린다. 래쉬 모형은 [개념적 능력]과 [항목 난이도]를 고려하여 학생이 문항에 올바르게 답할 확률을 평가합니다. 문항 변별도, 문항 난이도, 성별 또는 연구 년도와 같은 추가 매개 변수가 포함될 수 있는 경우 2-모수 IRT(2PL) 또는 3-모수 IRT(3PL)도 사용할 수 있다. 이 기사의 목적을 위해, 우리는 1PL 또는 래쉬 모델링에 집중할 것이다.
A variety of forms of IRT have been introduced. If we wish to look at the relationship between item difficulty and student ability alone, we use the one-parameter logistic IRT (1PL). This is called the Rasch model in honour of the Danish statistician who promoted it in the 1960s. The Rasch model assesses the probability that a student will answer an item correctly given their conceptual ability and the item difficulty. Two-parameter IRT (2PL) or three-parameter IRT (3PL) are also available where further parameters such as item discrimination, item difficulty, gender or year of study can be included. For the purposes of this article, we are going to concentrate on 1PL or Rasch modelling.


[래쉬 모델링]에서 학생들의 능력 점수 및 항목 난이도의 값은 해석을 쉽게 하기 위해 [표준화]된다.

  • 평균을 표준화하면 학생 능력 수준은 0으로, SD는 1로 설정된다.
  • 마찬가지로 평균 문항 난이도는 0으로, SD는 1로 설정된다. 

따라서 표준화 후 평균 점수 0점을 받은 학생은 평가 대상 항목에 대한 평균 능력을 갖게 된다. 1.5의 점수로, 학생의 능력은 평균보다 SD가 높은 1.5이다. 마찬가지로 난이도가 0인 항목은 평균 항목으로 간주되고 난이도가 2인 항목은 어려운 문항으로 간주됩니다. 일반적으로, 주어진 문항의 값이 양수이면 해당 항목은 해당 학생의 코호트에게 어렵고, 값이 음수이면 해당 문항은 쉽다.

In Rasch modelling, the scores of students’ ability and the values of item difficulty are standardised to make interpretation easier.

  • After standardising the mean, student ability level is set to 0 and the SD is set to 1.
  • Similarly, the mean item difficulty level is set to 0 and the SD is set to 1.

Therefore, after standardisation a student who receives a mean score of 0 has an average ability for the items being assessed. With a score of 1.5, the student's ability is 1.5, SDs above the mean. Similarly, an item with a difficulty of 0 is considered an average item and an item with a difficulty of 2 is considered to be a hard item. In general, if a value of a given item is positive, that item is difficult for that cohort of students and if the value is negative, that item is easy (Nunnally & Bernstein ).

학생 능력과 항목 난이도를 표준화하기 위해 표 10을 참고하여, 7명의 학생 해부학 시험에서 7개 항목에 대한 시뮬레이션된 이분법 데이터를 제시하여, 각 학생에 대한 학생 능력과 7개 항목의 난이도를 보여준다. θ라고 불리는, 학생의 능력을 계산하기 위해, 각 학생에 대해 부정확한 분수에 대한 올바른 분수의 비율의 자연 로그가 취해진다. 예를 들어 학생 2(θ2)의 능력은 다음과 같이 계산된다.
To standardise the student ability and item difficulty, consider Table 10, presenting the simulated dichotomous data for seven items on an anatomy test from seven students showing the student ability for each student and the difficulty level for each of the seven items. To calculate the ability of the student, which is called θ , the natural logarithm of the ratio of the fraction correct to the fraction incorrect (or 1 – fraction correct) for each student is taken. For example, the ability of student 2 (θ2) is calculated as follows:

이것은 학생 2의 능력이 평균 SD보다 0.89라는 것을 나타냅니다. b라고 불리는 각 항목의 난이도를 계산하기 위해, 각 항목에 대해 정확한 분수에 대한 잘못된 분수의 비율(또는 1 – 분수가 정확함)의 자연 로그가 계산됩니다. 예를 들어 항목 2의 난이도는 다음과 같이 계산한다.
This indicates that the ability of student 2 is 0.89 above the mean SD. To calculate the difficulty level of each item which is called b, the natural log of the ratio of the fraction incorrect (or 1 – fraction correct) to the fraction correct for each item is calculated. For example, the difficulty of item 2 is calculated as follows:

값이 -1.73이면 항목이 비교적 쉽다는 것을 나타냅니다. 이 표준화 프로세스는 모든 학생과 모든 항목에 대해 수행되며 Excel 스프레드시트(표 10)에서 쉽게 수행할 수 있습니다.
A value of −1.73 suggests that the item is relatively easy. This standardisation process is carried out for all students and all items and can easily be facilitated in an Excel spreadsheet (Table 10).

우리는 이제 [특정 능력을 가진 학생]이 [특정 항목 난이도를 가진 질문]에 정확하게 답할 확률을 추정하는 위치에 있다. 1PL의 경우 다음 방정식을 사용하여 확률을 추정합니다.
We are now in a position to estimate the probability that a student with a specific ability will correctly answer a question with a specific item difficulty. For 1PL, the following equation is used to estimate the probability:


여기서 p는 확률, θ 는 학생 능력, b는 항목 난이도입니다. 표 10을 참조하면, 학생 1의 능력은 평균 -0.28 SD 이하이며, 난이도 -1.73의 1번 문항이 정답으로 평균 이하이다. 위 공식을 기준으로 학생 1이 항목 1을 맞힐 확률은 [1/(1+e-(-0.28-(-1.73)))] = 0.12입니다. 학생 3의 능력 수준과 4번 항목의 난이도를 고려할 때, 학생이 3번 항목을 맞힐 확률은 [1/(1+e-(0.28-(0.28)] = [1/(1+e0)]입니다. = 0.50. 이는 학생 능력 수준과 항목 난이도가 일치할 경우 학생이 정답을 선택할 확률이 50%로 우연에 해당한다는 것을 보여준다
Where p is the probability, θ is the student ability and b the item difficulty. Referring to Table 10, the ability of student 1 is −0.28 SD below the average, and item 1, with a difficulty level of −1.73, was answered correctly, which is below the average. On the basis of the above formula, the probability that student 1 will answer item 1 correctly is [1/(1 + e−(−0.28−(−1.73))] = 0.12. Considering student 3's ability level and the difficulty of item 4, the probability that the student will answer correctly item 3 is [1/(1 + e−(0.28−(0.28))] = [1/(1 + e0)] = 0.50. This shows that if the level of student ability and the level of item difficulty are matched, the probability that the student will select the correct answer is 50%, which is equal to chance.

래쉬 분석의 기본 목표는 난이도와 학생 능력에 맞는 시험 항목을 만드는 것이다. 간단히 말해서, 학생들의 '똑똑함'은 항목의 '똑똑함'과 일치해야 한다.  표 11의 자료는 학생 능력과 항목 난이도의 관계를 더 자세히 조사하기 위해 표 10에서 추출한 자료와 위의 방정식을 사용하여 학생이 항목 난이도(b)로 항목 1에 답할 확률(p)을 정확하게 제시하였다.

The fundamental aim of Rasch analysis is to create test items that match their degree of difficulty with student ability. In simple terms, the ‘cleverness’ of the students should be matched with the ‘cleverness’ of the items. In order to further examine the relationship between student ability and item difficulty, the data in Table 11 shows the probability (p) that a student will answer item 1, with item difficulty (b), correctly given their ability (θ) using data taken from Table 10 and using the equation above.

 

문항 특성 곡선
Item characteristic curves

Rasch 분석에서, [문항 난이도]와 [학생 능력] 사이의 관계는 그림 6에 표시된 문항 특성 곡선(ICC)으로 그래픽으로 표현된다.
In Rasch analysis, the relationship between item difficulty and student ability is depicted graphically in an item characteristic curve (ICC) shown in Figure 6.

 

그림 6에서는 [문항 1]의 특성을 해석하기 위해 점선을 그립니다. -1.85의 능력을 가진 학생들이 이 질문에 올바르게 답할 확률은 50%입니다. 이것은 낮은 능력을 가진 학생들이 이 질문에 정확하게 대답할 수 있는 동등한 기회를 가지고 있다는 것을 암시한다. 또한 평균 능력(수치 = 0)을 가진 학생은 정답을 말할 확률이 80%입니다. 그 의미는 이 문제가 너무 쉽다는 것이다. 세타 축을 따라 어떤 항목이 곡선을 왼쪽으로 이동시키면 쉬운 항목이 되고, 어려운 문항은 곡선을 오른쪽으로 이동시킨다는 점에 유의해야 한다. 그림 8에 표시된 검사 분석에서 추출한 항목에 대한 ICC 곡선의 예는 그림 7에 나와 있습니다. 그림 7(a)는 어려운 문제(질문 101), 그림 7(b)는 쉬운 문제(질문 3)를 보여줍니다. 그림 7(c)는 평균 능력의 학생들이 정답을 낼 확률이 50%인 '완벽한' 문제(46번 문제)를 보여준다.
In Figure 6, dotted lines are drawn to interpret the characteristics of item 1. There is a 50% probability that students with an ability of −1.85 will answer this question correctly. This implies that student with lower ability have an equal chance of answering this question correctly. In addition, a student with an average ability (θ = 0) has an 80% chance of giving a correct answer. The implication is that this question is too easy. It should be noted that if an item shifts the curve to the left along the theta axis, it will be an easy item and a hard item will shift the curve to right. Examples of ICC curves for items taken from an examination analysis shown in Figure 8 are displayed in Figure 7. Figure 7(a) shows a difficult question (Question 101) and Figure 7(b) shows an easy question (Question 3). Figure 7(c) shows the ‘perfect’ question (Question 46) in which students of average ability have a 50% chance of giving the correct answer.

 

 

 

 

항목-학생 지도
Item-student maps

학생의 능력분포와 각 항목의 난이도는 항목-학생지도(ISM)에서도 나타낼 수 있으며, Winsteps®(Linacre, )와 같은 IRT 소프트웨어 프로그램을 활용하여 항목 난이도와 학생 능력을 함께 계산하여 표시할 수 있습니다. 그림 8은 지식 기반 테스트의 데이터를 사용하는 ISM을 보여줍니다. 지도가 두 쪽으로 갈라져 있다. [왼쪽]은 학생들의 능력을 나타내며, [오른쪽]은 각 문항의 난이도를 나타낸다. 각 학생의 능력은 '해시'(#)와 '점'(.)으로 표시되며, 문항은 문항 번호로 표시됩니다.

The distribution of students’ ability and the difficulty of each item can also be presented on an Item–student map (ISM). Using IRT software programmes such as Winsteps® (Linacre, ) item difficulty and student ability can be calculated and displayed together. Figure 8 shows the ISM using data from a knowledge-based test. The map is split into two sides. The left side indicates the ability of students whereas the right side shows the difficulty of each item. The ability of each student is represented by ‘hash’ (#) and ‘dot’ (.), items are shown by their item number. 

항목 난이도 및 학생 능력 값은 자연 로그를 사용하여 수학적으로 변환되며 측정 단위는 '로짓'이라고 합니다. 로짓 척도를 사용하면 값 간의 차이를 정량화할 수 있으며 척도의 동일한 거리는 동일한 크기입니다. 척도가 높을수록 항목 난이도와 학생 능력 모두 높아집니다. 'M', 'S', 'T' 문자는 각각 항목 난이도와 학생 능력의 평균, 표준 편차 1개와 표준 편차 2개를 나타냅니다. 항목 난이도의 평균이 0으로 설정되어 있습니다. 따라서, 예를 들어, 항목 46, 18, 28은 각각 0, 1, 그리고 -1의 항목 난이도를 갖는다. 로짓 능력이 0인 학생은 46, 60 또는 69번 항목에 올바르게 답할 확률이 50%입니다. 같은 학생이 항목 28과 62와 같이 덜 어려운 항목에 정확하게 답할 확률이 50% 이상이다. 또 같은 학생이 64번, 119번 등 더 어려운 항목에 정답을 맞출 확률은 50% 미만이다.
Item difficulty and student ability values are transformed mathematically, using natural logarithms, into an interval scale whose units of measurement are termed ‘logits’. With a logit scale, differences between values can be quantified and equal distances on the scale are of equal size (Bond & Fox ). Higher values on the scale imply both greater item difficulty and greater student ability. The letters of ‘M’, ‘S’ and ‘T’ represents mean, one standard deviation and two standard deviations of item difficulty and student ability, respectively. The mean of item difficulty is set to 0. Therefore, for example, items 46, 18 and 28 have an item difficulty of 0, 1, and −1 respectively. A student with an ability of 0 logits has a 50% chance of answering items 46, 60 or 69 correctly. The same student has a greater than 50% probability of correctly answering items less difficult, for example items 28 and 62. In addition, the same student has a less than 50% probability of correctly answering more difficult items such items 64 and 119.

그림 8의 ISM을 보면 이제 테스트의 속성을 해석할 수 있습니다. 

  • 첫째, 학생분포는 학생들의 능력이 평균보다 높은 반면, 절반 이상의 문항은 평균보다 낮은 어려움을 가지고 있다.
  • 둘째, [왼쪽 상단의 학생들]은 [오른쪽 하단의 문항]보다 '똑똑'하며, 이는 문항이 쉽고 도전적이지 않았다는 것을 의미한다.
  • 셋째, 대부분의 학생들은 오른쪽 상단에 잘 어울리는 항목과 왼쪽 아래에 학생이 없는 항목과 반대쪽에 위치한다. 하지만 101, 40, 86, 29번 항목은 너무 어려워서 대부분의 학생들이 할 수 있는 능력 밖이다.

By looking at the ISM in Figure 8 we can now interpret the properties of the test.

  • First, the student distribution shows that the ability of students is above the average, whereas more than half of the items have difficulties below the average.
  • Second, the students on the upper left side are ‘cleverer’ than the items on the lower right side meaning that the items were easy and unchallenging.
  • Third, most students are located opposite items to which they are well matched on the upper right and there are no students on the lower left side. However, items 101, 40, 86 and 29 are too difficult and beyond the ability of most students.

전반적으로, 이 예에서 학생들은 대부분의 문항보다 '더 똑똑하다'. 오른쪽 아래 사분면에 있는 많은 항목은 너무 쉬우므로 검사, 수정 또는 테스트에서 삭제해야 합니다. 마찬가지로, 어떤 항목들은 분명히 너무 어렵다. 래쉬 분석의 장점은 테스트 개발자가 항목의 심리학적 특성을 개선할 수 있도록 학생 및 항목 특성을 모두 캡슐화하는 다양한 데이터 디스플레이를 생성한다는 것이다. 항목을 학생 능력에 일치시킴으로써, 우리는 항목의 진실성과 유효성을 개선하고 컴퓨터 적응 테스트의 미래에 유용한 더 높은 품질의 항목 은행을 개발할 수 있다.
Overall, in this example, the students are ‘cleverer’ than most of the items. Many items in the lower right hand quadrant are too easy and should be examined, modified or deleted from the test. Similarly, some items are clearly too difficult. The advantage of Rasch analysis is that it produces a variety of data displays encapsulating both student and item characteristics that enable test developers to improve the psychometric properties of items. By matching items to student ability, we can improve the authenticity and validity of items and develop higher quality item banks, useful for the future of computer adapted testing.

결론들
Conclusions

OSCE 스테이션뿐만 아니라 객관적인 테스트는 학생들의 숙련도를 측정하는 데 사용되는 심리적으로 건전한 기기여야 하며 향후 이러한 검사 테스트의 실제 사용에 관심이 있는 의료 교육자에게 유용할 수 있다. 본 가이드에서는 객관적인 테스트 데이터에서 심리측정학적 값의 결과를 해석하는 방법을 간단하게 설명하고자 했다. 검사 테스트는 국가 및 지역 모두에서 표준화되어야 하며 우리는 이러한 테스트의 심리측정적 건전성을 보장할 필요가 있다. 제기될 수 있는 일반적인 질문은 우리의 시험 데이터가 학생들의 능력을 어느 정도까지 측정하느냐이다. 심리측정법을 이용한 시험 데이터의 해석은 어떤 과목에 대한 학생들의 역량을 이해하고 능력이 낮은 학생들을 식별하는 데 중심적이다. 또한, 이러한 방법들은 시험 검증 연구에 사용될 수 있다. 우리는 특히 심리측정학 방법에 대해 교육을 받지 않은 의학 교사들이 가상 데이터에 대해 이러한 방법을 실천한 다음 시험 데이터의 품질을 개선하기 위해 자체 실제 시험 데이터를 분석할 것을 제안합니다.
Objective tests as well as OSCE stations should be the psychometrically sound instruments used for measuring the proficiency of students and can be of use to medical educators interested in the actual use of these examination tests in the future. In this Guide, we tried to simply explain how to interpret the outcomes of psychometric values in objective test data. Examination tests should be standardised both nationally and locally and we need to ensure about the psychometric soundness of these tests. A normal question that may be posed is to what extent our exam data measure the student ability (to what extent the students have learned subject matter). The interpretation of exam data using psychometric methods is central to understand students’ competencies on a subject matter and to identify students with low ability. Furthermore, these methods can be employed for test validation research. We would suggest medical teachers, especially who are not trained in psychometric methods, practice these methods on hypothetical data and then analyse their own real exam data in order to improve the quality of exam data.

요약
Summary


본 가이드에서는 객관적인 시험 데이터의 검사 후 해석에 대해 설명하였다. 시험의 타당성과 신뢰성을 결정하기 위한 여러 가지 심리 측정 방법이 있다. CTT는 의학 교육자들이 시험에서 비정상적인 항목을 탐지하고 시험에서 학생들의 능력에 영향을 줄 수 있는 체계적인 오류를 식별할 수 있게 해준다. 요인 분석을 통해 의료 교육자는 관련 없는 항목을 줄이고 학생 역량과 관련된 항목과 구성 요소(요인) 내의 관계를 가정할 수 있습니다. 항목과 구성(테스트의 기본 내부 구조) 간의 관계에 대한 가설을 테스트하기 위해 CFA 및 구조 방정식 모델링을 도입했습니다. 크론바흐 알파는 전통적으로 시험의 신뢰성에 대한 추정으로 사용되지만, 시험에서 학생들의 관찰된 점수에 존재하는 측정 오차 출처의 조합을 평가하지는 않는다. 일반 가능성 연구를 사용하여 의료 교육자는 정확한 오류 위치를 표시한 다음 이를 격리하여 각 측정 오류의 출처의 차이를 추정할 수 있습니다. SPSS는 G-계수를 계산하기 위해 측정 오류의 원인을 측정하는 데 사용됩니다. CTT의 한계 중 하나는 특정 시험에서 서로 다른 능력을 가진 학생들이 특정 항목에서 어떻게 수행하는지 측정할 수 있는 기회를 제공하지 않는다는 것이다. 래쉬 모델링을 사용하는 IRT는 일련의 학생 코호트의 항목 능력과 학생 능력 사이의 관계를 다룰 수 있다. IRT를 사용하여 의학 교육자들은 기존 검사 검사의 심리학적 특징을 평가하고 항목에서 이상 징후를 제거할 수 있을 것이다. IRT를 사용하는 것은 또한 CAT로 이어지는 아이템 뱅킹을 개발하는 데 사용될 것이다.

This Guide has explained the interpretation of post-examination interpretation of objective test data. There are a number of psychometric methods for determining the validity and reliability of tests. CTT enables medical educators to detect abnormal items on a test and to identify systematic errors that may have influenced the student ability on a test. Factor analysis allows medical educators to reduce the irrelevant items, and to hypothesise relationships within items and constructs (factors) associated with student competence. We introduced CFA and structural equation modelling to test hypotheses about the relationship between items and constructs (the underlying internal structure of the test). Although Cronbach's alpha is traditionally used as an estimation of the reliability of a test, it does not assess a combination of source of measurement error that exists in observed scores of students on a test. Using Generalisability study, medical educators can show the exact position of error and then isolate it in order to estimate variance in each source of measurement error. SPSS is used for measuring sources of measurement errors to calculate G-coefficient. One of the limitations of CTT is that it does not provide the opportunity to measure how students of different ability on a particular test perform on a particular item. IRT using Rasch modelling can address the relationship between the item ability and student ability from a set of the student cohort. Using IRT, medical educators will be able to evaluate the psychometric features of existing examination tests and to remove anomalies in items. Using IRT will also employ to develop item banking in which turn leads to CAT.

 

 


 

Med Teach. 2012;34(3):e161-75. doi: 10.3109/0142159X.2012.651178.

Post-examination interpretation of objective test data: monitoring and improving the quality of high-stakes examinations: AMEE Guide No. 66

Affiliations collapse

Affiliation

1University of Nottingham, UK.

PMID: 22364473

DOI: 10.3109/0142159X.2012.651178

Abstract

The purpose of this Guide is to provide both logical and empirical evidence for medical teachers to improve their objective tests by appropriate interpretation of post-examination analysis. This requires a description and explanation of some basic statistical and psychometric concepts derived from both Classical Test Theory (CTT) and Item Response Theory (IRT) such as: descriptive statistics, explanatory and confirmatory factor analysis, Generalisability Theory and Rasch modelling. CTT is concerned with the overall reliability of a test whereas IRT can be used to identify the behaviour of individual test items and how they interact with individual student abilities. We have provided the reader with practical examples clarifying the use of these frameworks in test development and for research purposes.

 

수행능력 기반 평가에서 합격선 설정 방법: AMEE Guide No. 85 (Med Teach, 2014)
How to set standards on performance-based examinations: AMEE Guide No. 85
DANETTE W. MCKINLEY & JOHN J. NORCINI 

 

서론
Introduction

[합격선 설정Standard setting]은 [일반적인 수행 수준을 충족시키기 위해 필요한 지식과 기술의 수준]을 정의하거나 판단한 다음, [해당 수행능력 기준performancd standard에 해당하는 시험 점수 척도]에서 점수를 식별하는 과정이다. 표준 설정 절차는 직업 또는 교육 영역에 대한 역량의 개념 정의를 제공하고 개념을 운영하기 위해 사용된다. 역량의 개념적 정의를 고려할 때 역량에 기반한 의료교육에서 개발된 기준을 생각해보는 것이 도움이 된다. [이정표 또는 벤치마크] 개발에서 제공되는 기술 정보는 performance standard을 정의하는 데 도움이 될 수 있다. 
Standard setting is the process of defining or judging the level of knowledge and skill required to meet a typical level of performance and then identifying a score on the examination score scale that corresponds to that performance standard. Standard setting procedures are employed to provide a conceptual definition of competence for an occupation or educational domain and to operationalise the concept. When considering the conceptual definition of competence, it is helpful to think about the criteria developed in competency-based medical education. The descriptive information provided in the development of milestones or benchmarks (Holmboe et al. 2010) can be helpful in defining the performance standard.

[표준 설정 프로세스]는 [역량]에 대한 [개념적 정의]를 [통과 점수]라고 불리는 [조작적 버전]으로 변환하도록 설계되었다. [합격점수가 적절하다]는 검증은 [시험점수 해석의 타당성]을 뒷받침하는 증거를 수집하는 데 있어 또 다른 중요한 요소이다. 시험에 대한 합격 점수를 결정하기 위한 다양한 접근법이 개발되고 연구되었다.

The standard setting process is designed to translate a conceptual definition of competence to an operational version, called the passing score (Kane 1994; Norcini 1994). Verification that the passing score is appropriate is another critical element in collecting evidence to support the validity of test score interpretation (American Educational Research Association et al. 1999; Kane 2006). Various approaches to determining passing scores for examinations have been developed and researched.

본 가이드에서는 일반적으로 수행능력 기반 평가와 함께 사용된 방법에 대한 개요를 제공합니다. 다양한 평가 목적을 고려하는 것은 표준 설정 방법에 대한 논의를 위한 맥락을 제공하고, 이어서 보건 전문 교육에서 일반적으로 설정되는 다양한 유형의 표준에 대한 설명을 제공할 것이다. 표준 설정 프로세스에 대한 단계별 가이드가 제공됩니다.

In this Guide, an overview to the methods that have been typically used with performance-based assessments will be provided. A consideration of various assessment purposes will provide context for discussion of standard setting methods, followed by a description of different types of standards that are typically set in health professions education. A step-by-step guide to the standard setting process will be presented.

 

평가목적
Assessment purposes

교육에서, 훈련생들이 노력 분야에서 수행하는데 필요한 지식, 기술 및 태도를 얻고 있는지 여부를 평가하는 것이 종종 필요하다. "충분한 지식, 기술 및 태도"가 존재하는지 여부를 결정하기 위해, 평가 프로그램의 일부로 다양한 방법이 일반적으로 사용된다(Dijkstra et al. 2010). 보건 전문 교육에서는 지원자, 학생, 졸업생 및 실무자의 지식, 기술, 태도 및 능력을 평가하는 많은 접근법이 있다. 한동안 보건 전문 교육자들은 [적절하지 않더라도] 의사의 역량을 평가하기 위해 [사용 가능한 평가 방법]을 사용했다(Norcini & McKinley 2007). 예를 들어, 의사가 의료 팀과 효과적으로 의사소통할 수 있는 것이 중요하지만, 이러한 측면에 대한 평가는 [필기 시험]을 통해 적절하게 테스트되지 않는다. 여러 평가 방법이 개발 및 구현되었으며, [실제 상황에서 기대되는 수행performance와 연계된 성과에 기반한 평가]로 이동했습니다. 보건 전문가 교육에서 "실제" 환자의 불만을 묘사하도록 훈련된 일반인(SP)이 자주 사용된다. 이러한 유형의 평가는 수험자가 알고 있는 것이 아닌 자신이 할 수 있는 일(예: 신체검사를 올바르게 수행, 환자와 의사 소통)을 보여줄 수 있는 기회를 제공한다(Miller 1990).
In education, it is often necessary to evaluate whether trainees are attaining the knowledge, skills, and attitudes needed to perform in the field of endeavour. In order to determine whether “sufficient knowledge, skills and attitudes” are present, different methods are typically employed as part of a programme of assessment (Dijkstra et al. 2010). In health professions education, there are many approaches to assessing the knowledge, skills, attitudes and abilities of applicants, students, graduates, and practitioners. For some time, health professions educators used any available assessment method to evaluate the competencies of a doctor, even if they were not appropriate (Norcini & McKinley 2007). For example, although it is important for a doctor to be able to communicate effectively with the healthcare team, assessment of this aspect is not appropriately tested through the use of written examinations. Several methods of assessment have been developed and implemented, with a movement towards assessment based on performance that is tied to what is expected in practice. In the education of health professionals, standardised patients (SPs), lay people trained to portray complaints of “real” patients, are frequently used (e.g. Patil et al. 2003). This type of assessment provides examinees the opportunity to show what they can do (e.g. correctly perform a physical examination, communicate with a patient), rather than what they know (Miller 1990).

[수험생들이 무엇을 하는지 평가하는 방법]을 개발하는 데 있어서, 다른 방법, 또는 심지어 양식들의 조합도 사용되었다. 많은 의료 분야에서 차트 검토와 360도 평가를 포함한 다양한 직장 기반 평가의 사용이 도입되었다 (Norcini & Burch 2007). 이러한 평가는 일반적으로 품질 개선 척도로 사용되며 동료 검토, 실무 결과 평가, 환자 또는 고객 만족도 척도를 포함한다(Norcini 2003).
In developing methods that assess what examinees do, other methods, or even combinations of modalities, have also been used (Nestel et al. 2006). In many healthcare professions, the use of various workplace-based assessments, including chart reviews and 360 degree evaluations, have been instituted (Norcini & Burch 2007). These assessments are usually employed as quality improvement measures, and involve peer review, evaluation of practice outcomes, and patient or client satisfaction measures (Norcini 2003).

이용 가능한 다양한 도구들은 적어도 부분적으로 다른 평가 목표를 충족하도록 개발되었다. 평가 목표에는 다음을 결정하는 것이 포함될 수 있다.

  • 의대에 입학할 자격이 있는 사람(예: 입학 시험) 
  • 코스 요건이 충족되는지 여부(예: 강의실 시험) 
  • 학생이 다음 단계의 교육으로 진급할 준비가 되어 있는지 여부(예: 연말 시험)
  • 수험자가 전문직에 진출할 준비가 되어 있는지 여부(예: 면허 및 인증 시험) 
  • 응시자가 전문성의 증거를 보였는지 여부(예: 인증 유지)

The varieties of instruments that are available have been developed, at least in part, to meet different assessment goals. Assessment goals may include determining

  • who is eligible to enter medical school (e.g. admissions testing);
  • whether course requirements are satisfied (e.g. classroom testing);
  • if a student is ready to advance to the next level of training (e.g. end-of-year testing);
  • whether the examinee is ready to enter a profession (e.g. licensure and certification testing); or
  • whether the examinee has shown evidence of expertise (e.g. maintenance of certification).

일반적으로 [평가에서 얻은 점수]는 "적절한 지식, 기술 및 판단력을 사용하여 [실천 영역]을 정의하는 [encounters의 영역]에 걸쳐 [효과적인 전문 서비스]를 제공할 수 있는" 학생의 능력을 나타낸다고 가정한다. 점수는 종종 학생(또는 졸업생)이 직업에 들어가거나 계속 연습할 수 있는 지식과 기술을 충분히 습득했는지에 대한 결정(또는 해석)에 사용된다. 이러한 방식으로, 시험 점수는 사람들을 두 개 이상의 그룹으로 분류하는 데 사용된다(예: 시험 합격 또는 불합격). 시험 점수는 누가 추가적인 교육적 도움을 필요로 하는지, 시험 응시자가 다음 단계의 훈련을 계속할 것인지, 또는 시험 응시자가 관심 영역에서 숙달했는지에 대한 결정을 내리는 데 사용될 수 있다. 

The assumption is usually made that scores obtained from assessments provide an indication of a student's ability to “use the appropriate knowledge, skills, and judgment to provide effective professional services over the domain of encounters defining the area of practice” (Kane 1992, p. 167). Scores are often used to make decisions (or interpretations) regarding whether students (or graduates) have sufficiently acquired the knowledge and skills to enter, or continue practice in, a profession. In this manner, test scores are used to classify people into two or more groups (e.g. passing or failing an examination). Test scores can be used to make decisions about who needs additional educational help, whether the test-taker will go on to the next level of training, or whether the test-taker has achieved mastery in the domain of interest.

Kane(1992)은 [역량]을 [개인이 그 실천 영역에서 발생하는 다양한 상황을 처리할 수 있는 정도]로 정의했습니다(165쪽). 교육, 면허, 자격증 취득에서 평가는 지원자의 숙련도를 결정하는 데 사용된다. 예를 들어, 객관 구조화 임상 검사(OSCE)와 같은 수행능력 척도performance measures가 개발되면, 적절한 수행능력을 나타내는 특성의 정의를 포함하여, [도메인 기반 평가]와 관련된 원칙을 사용할 수 있다(Pell et al. 2010). 시험이 객관식 항목으로 구성되든, 과제 수행으로 구성되든, 목표가 한 개인과 같은 평가를 받는 다른 사람을 비교하는 것인지, 아니면 숙련도를 결정하는 것인지를 고려하는 것이 중요하다. 가이드의 다음 섹션에서는 이러한 다양한 목적과 관련된 표준 유형에 대해 설명합니다.

Kane (1992) defined competence as the extent to which the individual can handle the various situations that arise in that area of practice (p. 165). In education, licensure, and certification, assessments are used to determine the proficiency of candidates. For example, when performance measures such as the objective structured clinical examination (OSCE) are developed, principles associated with domain-based assessment, including definition of characteristics denoting adequate performance, can be employed (Pell et al. 2010). Whether the test consists of multiple-choice items or task performance, it is important to consider whether the goal is to compare an individual with others taking the same assessment, or to determine the level of proficiency. In the next section of the Guide, we discuss types of standards related to these different purposes.

합격선Standard의 종류
Types of standards

표준은 상대적(때로는 표준 참조라고 함) 또는 절대적(때로는 기준 참조라고 함)으로 분류할 수 있다(Livingston & Zieky 1982). 서로 평가를 받는 사람들의 비교를 바탕으로 제정되는 기준은 상대적인 기준이다. 예를 들어 합격점수가 합격자 수나 비율을 기준으로 정해지면 상대적인 기준이 된다. 이러한 유형의 표준 설정은 일반적으로 사용 가능한 자리가 제한된 취업 또는 교육 프로그램 입학을 위한 선택에서 사용된다. 고부담 시험(예: 졸업, 자격증, 자격증)의 경우, 시험 응시자 집단의 능력이 시간에 따라 달라질 수 있고, 평가 내용도 시점에 따라 달라질 수 있기 때문에, 상대적인 표준은 일반적으로 사용되지 않는다. 미리 결정된 합격 점수를 교육용(교실) 시험과 함께 사용할 경우, 해당 수업의 학생들의 능력과 주어진 시험의 난이도는 고려되지 않는다(Cohen-Schotanus & van der Vleuten 2010). 수험능력과 시험 난이도는 합격점수의 적절성에 대한 증거에 악영향을 미칠 수 있는 요인이다. 상대적 표준 설정 방법과 관련된 불이익을 피하기 위해, 절대적 표준 설정 접근법이 자격 증명 검사(즉, 면허증 또는 인증)에서 더 일반적으로 사용된다. 
Standards can be categorised as relative (sometimes called norm-referenced) or absolute (sometimes called criterion-referenced) (Livingston & Zieky 1982). Standards that are established based on a comparison of those who take the assessment to each other are relative standards. For example, when the passing score is set based on the number or percentage of examinees that will pass, the standard is relative. This type of standard setting is typically used in selection for employment or admission to educational programmes where the positions available are limited. With high stakes examinations (e.g. graduation, certification, licensure), relative standards are not typically used, because the ability of the groups of test takers could vary over time and the content of the assessment may also vary over time. When pre-determined passing scores are used with educational (classroom) tests, the ability of the students in the class and the difficulty of the test given are not considered (Cohen-Schotanus & van der Vleuten 2010). Examinee ability and test difficulty are factors that could adversely affect evidence of the appropriateness of the passing score. To avoid the disadvantages associated with the relative standard setting method, absolute standard setting approaches are more commonly used in credentialing examinations (i.e. licensure or certification).

합격하기 위해 정확하게 답해야 하는(또는 수행해야 하는) 시험 재료의 양을 결정하여 설정한 기준이 절대 기준이다. 예를 들어 객관식 시험의 75%를 맞혀야 합격할 수 있다면 그 기준은 절대적이다. 절대적인 기준을 사용할 경우, 모든 수험생이 시험에 합격하거나 불합격하는 결과를 초래할 수 있다.
Standards set by determining the amount of test material that must be answered (or performed) correctly in order to pass are absolute standards. For example, if the examinee must answer 75% of the items on a multiple-choice test correctly in order to pass, the standard is absolute. When absolute standards are used, it is possible that decisions made will result in all examinees passing or failing the examination.

표준 설정 및 성능 기반 평가
Standard setting and performance-based assessments

수행능력 기반 평가에는 몇 가지 표준 설정 방법이 사용되었다. 상대적인 기준은 원하는 결과에 기초하여 설정되며(예: 상위 75명의 지원자를 학교에 입학시키는 것) 따라서 더 쉽게 결정되기 때문에, 본 가이드는 절대적인 표준 설정 방법에 초점을 맞출 것이다(비교는 표 1 참조). 이러한 방법에는 시험 자료나 시험 수행에 대한 검토가 포함되며, 결과적인 합격 점수는 주제 전문가 그룹의 판단에서 도출될 수 있다. 절대 표준 설정Absolute standard setting 접근법은 [시험 중심] 또는 [시험자 중심]이라고 한다.(Livingston & Zieky 1982).

  • 시험 중심적인 방법을 사용할 때, 심사위원들은 시험 내용에 초점을 맞춘다. 앙고프(1971), 에벨(1972), 네델스키(1954) 방법은 시험 중심 표준 설정 방법의 예이다.
  • 이와는 대조적으로 수험생 중심의 방법을 사용할 때, 심사위원은 수험생들의 성적에 초점을 맞춘다. 이러한 방법에는 대조군, 경계선 그룹 및 경계선 회귀 방법이 포함된다(Livingston & Zieky 1982; Wood et al. 2006). 수험생 중심 방법에서 judge의 임무는 심사 결과가 표준을 충족하는 데 필요한 지식과 기술을 가진 사람을 묘사하는지 여부를 결정하는 것이다(예: 최소 역량).

Several standard setting methods have been used with performance-based assessments. Because relative standards are set based on the desired result (e.g. admitting the top 75 candidates to a school) and are, therefore, determined more easily, this Guide will focus on absolute standard setting methods (See Table 1 for comparisons). These methods involve review of examination materials or examinee performance, and the resulting passing scores can be derived from the judgments of a group of subject matter experts. Absolute standard setting approaches have been referred to as either test-centred or examinee-centred (Livingston & Zieky 1982).

  • When using test-centred methods, the judges focus on exam content. The Angoff (1971), Ebel (1972), and Nedelsky (1954) methods are examples of test-centred standard setting methods.
  • In contrast, when using examinee-centred methods, judges focus on the performance of examinees. These methods include contrasting groups, borderline group, and borderline regression methods (Livingston & Zieky 1982; Wood et al. 2006). The judges’ task in examinee-centred methods is to determine whether the performance they review depicts someone possessing the knowledge and skills needed to meet the standard (e.g. are minimally competent).

객관식 문제(MCQ)를 포함하는 시험과 관련된 시험 중심 및 수험자 중심 접근법의 측면은 이전 AMEE 가이드(Bandaranayake 2008)에서 제시되었으며, 이러한 접근법 중 일부를 OSCE에 적용하는 방법이 여기에 제시된다. 구체적으로, 우리는 앙고프, 경계선 그룹, 경계선 회귀, 대조 그룹 및 시뮬레이션된 OSCE 데이터를 사용한 표준 설정의 절충 방법에 대한 지침을 제공할 것이다. 가이드의 나머지 부분은 표준설정연구 준비, 표준설정연구 실시, 합격점수 생성, 표준실행 및 유지의 4가지 섹션으로 구분된다. 

Aspects of test-centred and examinee-centred approaches, related to examinations containing multiple choice questions (MCQs), were presented in a previous AMEE guide (Bandaranayake 2008), and the application of some of these approaches to the OSCE are presented here. Specifically, we will provide guidance for the use of the Angoff, borderline group, borderline regression, contrasting group, and compromise methods of standard setting using simulated OSCE data. The remainder of the Guide is divided into four sections:

  • preparing for the standard setting study,
  • conducting the standard setting study,
  • generating the passing score, and
  • implementing and maintaining standards.

표준 설정 스터디 준비
Preparing for the standard setting study

합격 점수를 결정하는 것은 일반적으로 평가 목적과 평가된 영역에 익숙한 그룹에 의해 수행된다. 이 그룹이 만나기 전에 완료해야 할 여러 단계가 있습니다. 첫째, 패널리스트를 모집할 필요가 있다. 객관성을 높이고 그럴듯한 합격 점수를 얻기 위해

  • 패널은 시험 내용 영역과 시험의 목적에 대해 잘 알고 있어야 한다(Jaeger 1991; Raymond & Reid 2001).
  • 또한, 그들은 시험 받는 학생들의 자격에 익숙해야 한다.
  • 마지막으로, 평가 방법에 대한 경험이 필수적이다.
  • 임상 숙련도에 대한 판단을 내리는 패널리스트는 해당 분야의 전문가여야 하며, 시험 통과에 따른 결과를 쉽게 이해할 수 있기 때문에 다양한 교육 단계에서 교육생들의 기대에 익숙해야 한다.

Determining the passing score is typically accomplished by a group familiar with the assessment purpose and the domain assessed. Before this group meets, there are a number of steps that should be completed. First, panellists need to be recruited. To increase objectivity and to derive plausible passing scores,

  • panellists should be knowledgeable about the examination content area and the purpose of the test (Jaeger 1991; Raymond & Reid 2001).
  • In addition, they should be familiar with the qualifications of the students being tested.
  • Finally, experience with the assessment method is essential.
  • Panellists who make judgments about clinical proficiency should be experts in the profession and should have familiarity with expectations of trainees at various stages of education, because they will readily understand the consequences associated with passing the test.

OSCE는 종종 임상 및 커뮤니케이션 기술을 시험하기 위해 사용되므로 OSCE에 평가자로 참여한 교직원이나 행정에 사용되는 자료(예: 점검표) 개발에 도움을 준 교직원은 표준 설정 회의에서 패널로 모집하는 데 이상적일 수 있다.

  • 예를 들어 의사의 의사소통 기술에 대한 표준을 설정하기 위해 의료팀의 다른 구성원(예: 간호 직원, 표준화된 환자 트레이너)을 심사위원으로 고려할 수 있다. 그들은 임상 환경에서 의사의 예상 성과를 잘 알고 있기 때문에 표준 설정 프로세스의 적절한 참여자가 될 수도 있다.
  • 성별, 전공(예: 소아과, 일반 의학) 및 전문 활동(예: 교수진 대 개업 의사)에 기초한 패널리스트의 [적절한 혼합]이 고려되어야 한다.
  • 이는 합격 점수가 직업에 들어갈 지원자를 식별할 때 특히 중요하다(예: 면허증). 

Because OSCEs are often used to test clinical and communication skills, faculty members who have participated in the OSCE as examiners or those who have assisted in the development of materials used in the administration (e.g. checklists) would be ideal for recruiting as panellists in the standard setting meeting.

  • To set standards for communication skills of physicians, for example, other members of the health care team could be considered (e.g. nursing staff, standardised patient trainers) as judges. Because they are familiar with the expected performance of physicians in clinical settings, they would also be appropriate participants in the standard setting process.
  • A suitable mix of panellists based on gender, discipline (e.g. paediatrics, general medicine), and professional activity (e.g. faculty vs. practicing physician) should be considered.
  • This is particularly important when the passing score identifies those candidates who will enter a profession (e.g. licensure).

패널리스트가 많을수록, 결과적인 합격 점수는 안정적일 가능성이 높다(Jaeger 1991; Ben-David 2000). 다만 대규모 그룹 경영에 대한 배려도 중요하다. 필요한 패널리스트의 수는 심사 결정과 관련된 결과, 표준 설정 회의를 완료하기 위한 합리적인 시간대를 검토하기 위한 수행 횟수 및 회의에 사용할 수 있는 자원과 같은 여러 요인에 의해 균형을 이루어야 합니다. 표준 설정 미팅은 적게는 4명, 많게는 20명의 패널리스트로 수행될 수 있습니다. 그룹이 크면 미팅 조정자는 더 많은 자료를 다룰 수 있도록 더 작은 그룹에 패널 목록을 할당할 수 있습니다. [결정 요인]은 미팅에 사용할 수 있는 자원(예: 공간, 진행자 수)입니다.

The more panellists there are, the more likely it is that the resulting passing score will be stable (Jaeger 1991; Ben-David 2000). However, consideration of management of a large group is also important. The number of panellists needed should be balanced by a number of factors: the consequences associated with examination decisions, the number of performances to review a reasonable time frame for completion of the standard setting meeting, and the resources available for the meeting. Successful standard setting meetings can be conducted with as few as four panellists or as many as 20. Having a large group will provide the meeting facilitator with the opportunity to assign panellists to smaller groups so that more material can be covered. The deciding factor will be resources (e.g. space, number of facilitators) available for the meeting.

회의를 조직하는 다음 단계는 패널리스트를 교육하는 데 사용할 자료를 준비하는 것입니다. 패널리스트 교육은 매우 중요하다. 수행능력 표준performance standard 에 대한 명확한 이해(예: 교정조치가 필요한 학생, 지도 실습 준비 졸업생, 비지도 실습 준비 전문가)를 개발하는 것이 필수적이다. performance standard 에 대한 이해를 증진시키기 위해, 전형적으로 [역량 기반 커리큘럼]의 일부인 기준은 매우 유용할 수 있다. 이러한 유형의 정보는 특정 맥락에서 그리고 보건 전문가 경력의 특정 단계에서 성과 표준을 구성하는 지식, 기술 및 능력을 설명하는 데 도움이 될 수 있다(Frank et al. 2010).
The next step in organising the meeting is preparing materials to be used in training the panellists. Panellist training is very important; developing a clear understanding of the performance standard (e.g. student in need of remediation, graduate ready for supervised practice, practitioner ready for unsupervised practice) is essential (Ben-David 2000; Bandaranayake 2008). To promote understanding of the performance standard, criteria that are typically part of a competency-based curriculum can be very useful. This type of information can assist in the delineation of the knowledge, skills, and abilities that comprise the performance standard in a particular context, and at a particular stage in a health professional's career (Frank et al. 2010).

교육을 지원하기 위해 시험 자료를 오리엔테이션의 일부로 사용할 수 있습니다. 예를 들어, OSCE의 표준 설정에 대한 오리엔테이션의 일부로서 패널리스트는 일부 스테이션을 수험생처럼 완수해볼 수 있다. 이를 통해 수험생의 입장에서 시험을 경험할 수 있다. 다음으로, performance standard를 정의하는 특성에 대한 논의가 이루어질 것이다. 마지막으로, 패널리스트는 선택한 방법을 연습할 수 있는 기회가 주어질 것이다.
To support training, examination materials may be used as part of the orientation. For example, as part of the orientation to standard setting for an OSCE, panellists could complete some of the stations as examinees. This allows them to experience the examination from the perspective of the examinee. Next, a discussion of the characteristics defining with the performance standard would be conducted. Finally, the panellists would be afforded the opportunity to practice the method selected.

가이드의 다음 섹션에서는 OSCE를 예로 들어 성능 평가에 대한 합격 점수를 설정하는 데 사용할 수 있는 방법을 제시한다. 이러한 방법은 일반적으로 OSCE 및 표준화된 환자 검사의 합격 점수를 얻는 데 사용됩니다. 각 섹션에서는 OSCE 또는 표준화된 환자 검사와 함께 사용되는 방법에 대한 연구를 인용한다. OSCE의 합격 점수를 도출하기 위한 세부 지침을 제공하기 위해, 우리는 5개의 OSCE 스테이션을 사용하여 50명의 학생을 위한 연말 시험을 위한 데이터를 생성했다. 50개 항목으로 구성된 객관식 시험을 위한 데이터도 생성되었다. 이 시뮬레이션 데이터 세트는 OSCE 시험을 위한 합격 점수를 개발하는 데 사용할 수 있는 여러 가지 방법을 설명하는 데 사용될 것이다.

In the next section of the Guide, we present methods that can be used to set passing scores for performance assessments, using the OSCE as an example. These methods are commonly used to derive passing scores for OSCE and standardised patient examinations (Norcini et al. 1993; Boulet et al. 2003; Downing et al. 2006). In each section, research regarding the method as used with OSCEs or standardised patient examinations is cited. In order to provide detailed guidelines for deriving passing scores for an OSCE, we generated data for an end-of-year examination for 50 students, using five OSCE stations. Data for a multiple-choice examination consisting of 50 items was also generated. This simulated data set will be used to illustrate a number of methods that can be used to develop passing scores for an OSCE examination.

표준 설정 미팅 진행 : 수정된 Angoff
Conducting the standard setting meeting: modified Angoff

체크리스트 항목
Checklist items

[수정된 앙고프]를 체크리스트의 각 항목에 대한 표준을 설정하기 위해 사용하는 연구가 몇 가지 수행되었다(예: 다우닝 외 2003, 2006). 이 과정을 위해서는 체크리스트와 평점 제공 양식 등 모든 패널리스트에 대한 사례 자료를 준비해야 한다. 미팅 진행자는 등급을 표시하는 방법(플립 차트, 프로젝터)이 필요하며, 데이터 입력을 위한 양식을 준비하고 가능하면 각 사례 체크리스트에 대한 스프레드시트를 설정해야 합니다. 이를 통해 간단한 데이터 분석을 통해 문항, 심사자, 사례의 평균을 계산할 수 있습니다. 이 방식을 사용할 때, 패널리스트는 체크리스트의 항목을 검토하며, 과제는 [OSCE 체크리스트에 대해서, 기술된 조치를 정확하게 수행할 수 있는 performance standard을 충족하는 수험자(예: 최소 능력자)의 비율을 추정하는 것]이다.

Several studies have been conducted where the modified Angoff was used to set standards for each item in a checklist (e.g. Downing et al. 2003, 2006). For this process, it is necessary to prepare case materials for all panellists, including checklists and a form for providing ratings. The meeting facilitator will need a way to display the ratings (flip chart, projector) and should prepare forms for data entry and, if possible, set up spreadsheets for each case checklist. This will permit simple analyses of the data, calculating averages for items, judges, and cases. In these studies, panellists review the items on the checklist, and the task is to estimate the percentage of examinees meeting the performance standard (e.g. minimally competent) who will correctly perform the action described in the OSCE checklist.

2는 고령 환자의 낙상 사례에 대한 샘플 체크리스트를 보여준다. 성능 표준에 대한 논의와 사례 자료의 발표에 이어, 패널리스트는 그룹으로 처음 5개의 체크리스트 항목을 검토할 것을 권고한다. 이 예제에서 항목 3에 대한 평가자 10과 13의 등급 사이에는 큰 차이가 있습니다. 정의와 등급 과제에 대한 합의에 도달하는 것을 목표로, [15% 이상의 불일치]에 대한 논의가 촉진될 것이다. 불일치 항목이 [15% 이상]이면 회의 후 점검항목에 내용 관련 문제가 있는지 검토해야 한다. 이 항목은 합격 점수 결정에서 제거되어야 할 수 있으며, 패널리스트가 토론한 내용은 해당 결정을 내리는 데 유용할 수 있습니다. 15% 이상의 불일치는 토론을 통해 해결할 수 없는 항목이 있을 수 있지만, 이러한 항목이 많으면 안 됩니다. 그룹 등급 및 토론 후 패널리스트는 나머지 체크리스트 항목을 독립적으로 진행할 수 있습니다.
Table 2 shows a sample checklist for a case of a fall in an elderly patient. Following a discussion of the performance standard, and presentation of case materials, it is recommended that the panellists review the first five checklist items as a group. In the example, there is a large difference between the ratings of raters 10 and 13 on item 3. Discussion of discrepancies of 15% or more would be facilitated, with the goal of reaching consensus on the definition and the rating task. If there are items with discrepancies of 15% or more, they should be reviewed after the meeting to determine if there is a content-related problem with the checklist item. This item may need to be removed from determination of the passing score, and any discussion the panellists have can be useful in making that decision. There may be some items where discrepancies of 15% or more cannot be resolved through discussion, but there should not be many of these items. After group rating and discussion, panellists can proceed through the remaining checklist items independently.

이 예제에 사용된 표에는 모든 패널 목록의 평균 등급이 표시됩니다. 사례case의 합격 점수를 도출하기 위해 모든 항목과 패널리스트의 평균 등급을 계산했다. 이 예에서 합격 점수는 67%입니다. 수험생이 체크리스트 항목 중 67% 이상을 정확하게 채우면 합격점을 받을 수 있다. 다음은 수정된 Angoff 방법을 사용하여 [단일 사례에 대한 합격 점수를 결정하는 단계]입니다. 이 프로세스는 OSCE 관리에 포함된 스테이션에 대한 모든 체크리스트에서 반복된다. 패널리스트가 등급 지정 프로세스를 완료하면 데이터 입력을 시작할 수 있습니다. 각 경우에 대한 스프레드시트를 사용하여 데이터 입력을 용이하게 할 수 있습니다. items과 judges의 평균을 계산하면 각 사례에 대한 컷 점수가 생성됩니다. 평가 결과의 점수 및 보고에 따라, 합격 점수는 [사례별 합격 점수case passing scores를 평균]하거나 또는 [OSCE 콘텐츠 영역(예: 이력 검사, 신체 검사, 커뮤니케이션)을 평균]하여 OSCE에 대해 계산할 수 있다.

The table used for this example shows the average rating across all panellists. To derive the passing score for the case, the average rating across all items and panellists was calculated. In this example, the passing score would be 67%. If examinees correctly complete 67% or more of the items on the checklist, they would achieve a passing score for that case. These are the steps associated with using the modified Angoff method to determine the passing score for a single case. This process would be repeated with all checklists for stations included in the OSCE administration. Once panellists have completed their rating process, data entry can begin. Data entry can be facilitated by using a spreadsheet for each case. Calculating the mean across items and judges produces a cut score for each case. Depending on the scoring and reporting of assessment results, passing scores can be calculated for the OSCE by

  • averaging case passing scores, or
  • OSCE content domains (e.g. history taking, physical examination, communication).

경우들
Cases

수정된 Angoff는 체크리스트 항목 수준에서 판단을 수집하여 사용되었지만, 패널리스트가 사례 또는 스테이션 수준에서 판단을 내리는 것이 더 일반적이다. 이 접근법의 한 가지 근거는 [체크리스트의 항목이 상호 연관되어 있다]는 것이다. [특정 질문을 하거나, manoeuvre 수행할 가능성]은 신체검사에서 [다른 질문이나 다른 발견]에 달려 있다. 앙고프가 사례 수준에서 실시될 경우 패널들의 과제는 OSCE 스테이션의 [점검표 내 개별 항목]이 아니라, [사례의 내용]에 따라 수행 기준을 충족할 수험생 비율을 추정하는 것이다. 또는 패널리스트에게 점검표 항목을 검토하고 [성능 표준을 충족하는 수험생(예: 최소 자격)이 충족할 것 같은 item의 비율]을 추정하도록 요청할 수 있다.
Although the modified Angoff has been used by gathering judgments at the checklist item level, it is more common to have panellists make their judgments at the case or station level. One rationale for this approach is that the items in a checklist are inter-related; the likelihood of asking a question or performing a manoeuvre is dependent on asking other questions or other findings in a physical examination (Ben-David 2000; Boulet et al. 2003). If the Angoff is conducted at the case level, the panellists’ task is making an estimation of the percentage of examinees who will meet the performance standard based on the content of the case, rather than the individual items within the checklist for the OSCE station (e.g. Kaufman et al. 2000). Alternately, the panellists can be asked to review the checklist items and estimate the percentage of items for which the examinees meeting the performance standard (e.g. minimally qualified) will get credit.


사례 자료는 패널리스트에 의해 검토되며, 데이터 입력 준비도 유사합니다. 그러나 표준 설정 프로세스의 일부로 분석할 사례 수에 따라 단일 스프레드시트를 사용할 수 있습니다. 표 3은 앞에서 언급한 시뮬레이션을 위한 샘플 스프레드시트 형식을 제공하며, 50명의 학생을 대상으로 한 연말 시험을 위한 5개의 OSCE 스테이션이 있다. 이 예제의 경우 5명의 심판이 있습니다. 다시 한 번 수행기준에 부합하는 수험생의 특성을 논의하고, 시험자료를 제시하고 검토하며 패널들이 채점 과제를 시작한다. 그 방법을 연습하는 것은 필수적이다. 우리의 예를 사용하면, 여섯 번째 사례가 패널들 간의 연습과 토론에 사용될 것이다. 이 경우 등급은 합격 점수를 생성하는 데 사용되지 않습니다. 모든 학생의 사례 점수(백분율 점수percent correct metric)는 표의 마지막 열에 표시됩니다. 만약 시간이 허락한다면, 패널리스트로부터 등급을 제출받은 이후에, 모든 학생들에 대해서 [스테이션에서 어떻게 수행했는지에 대한 정보]를 줄 수 있다. 그런 다음 패널리스트는 추정치estimates을 변경할 수 있습니다. Judges과 Stations의 평균을 계산하면 OSCE의 합격 점수를 얻을 수 있다.

Case materials are reviewed by the panellists, and the preparation for data entry is similar. However, a single spreadsheet may be used, depending on the number of cases to be analysed as part of the standard setting process. Table 3 provides a sample spreadsheet format for the simulation we mentioned earlier, with five OSCE stations for an end-of-year test of 50 students. For this example, there are five judges. Once again, the characteristics of the examinees meeting the performance standard are discussed, test materials are presented and reviewed, and panellists begin the rating task. Practicing the method is essential. Using our example, a sixth case would be used for practice and discussion amongst panellists. The ratings from this case would not be used to generate the passing score. The case scores (in percent correct metric) for all students are presented in the last column of the table. If time permits, panellists could provide their ratings and then be given information on how all students performed on the stations. They can then change their estimates. Calculating the mean across judges and stations provides the passing score for the OSCE.

표준 설정 미팅 실시: 경계 그룹
Conducting the standard setting meeting: borderline group


수정된 Angoff 접근법(체크리스트 항목 및 사례 수준)이 OSCE 및 표준화된 환자 검사의 합격 점수를 결정하는 데 일반적으로 사용되지만, 패널리스트는 항목별 학점을 받거나 사례를 정확하게 관리할 수 있는 [수험생의 비율을 추정하는 것이 어렵다]고 생각할 수 있다. OSCE와 함께 자주 사용되는 [시험 자료보다는 수험생 성과에 초점을 맞추는 방법]이 [경계선 그룹 방식]이다. 경계선 그룹 방법은 "경계선" 수험자의 특성(예: 지식, 기술 및 능력)을 식별해야 한다. ["경계선" 수험생]은 지식과 기술이 적절하지 않지만, 부적절하지도 않은 수험생이다. 평가 자료(또는 실제 시험자 성과)는 패널리스트에 따라 명확한 실패, 경계선 또는 명확한 합격으로 분류됩니다. 그런 다음 [통과 점수]는 [경계선 그룹의 중위수(즉, 50번째 백분위수) 점수]로 설정된다(예: Rothman & Cohen 1996).

While both modified Angoff approaches (checklist items and case level) are commonly used to determine passing scores in OSCE and standardised patient examinations, panellists may find the task of estimating the percentage of examinees meeting the performance standard who will receive credit for items or who will correctly manage the case challenging (Boulet et al. 2003). A method that focuses on examinee performance rather than examination materials that is frequently used with OSCEs is the borderline group method. The borderline group method requires the identification of the characteristics (e.g. knowledge, skills, and abilities) of the “borderline” examinee. The “borderline” examinee is one whose knowledge and skills are not quite adequate, but are not inadequate (Livingston & Zieky 1982). Assessment materials (or actual examinee performances) are categorised by panellists as clear fail, borderline, or clear pass. The passing score is then set at the median (i.e. 50th percentile) score of the borderline group (e.g. Rothman & Cohen 1996).

OSCE에서 사용된 이 방법의 수정 중 하나는 [OSCE 시행 중에 수집된 판단을 사용]하는 것이다. 이 수정안에서는 심판 패널이 사용되지 않으며, 대신 관찰자는 각 스테이션에 대한 합격 점수를 도출하는 데 사용되는 정보를 제공한다. 전문가(예: 의사, 교수진)가 OSCE 관측소 점수를 매기는 데 사용되는 경우, 본 성과를 "경계선"으로 간주할지 여부를 질문할 수 있다. 이 접근 방식은 [시험이 진행되는 동안 심사관의 판단을 모아서 시간을 절약]할 수 있다. 시험관이 성적이 경계선으로 간주되는 수험생을 식별하면 '경계선'으로 분류된 모든 수험생의 중간 점수를 찾아 합격 점수를 계산할 수 있다.
One modification to this method that has been used with OSCEs is to use the judgments gathered during the OSCE administration (e.g. see Reznick et al. 1996). In this modification, a panel of judges is not used; instead, observers provide information used to derive the passing score for each station. If experts (e.g. physicians, faculty members) are used to score the OSCE stations, they can be asked whether the performance they have seen would be considered “borderline.” This approach can save time by gathering examiners’ judgments while the examination is being administered. Once examiners have identified examinees whose performance is considered borderline, the passing score can be calculated by finding the median score of all examinees who were classified as “borderline.”

이 접근 방식을 설명하기 위해 표 4에 제시된 수정된 Angoff 접근 방식에 사용된 것과 동일한 데이터 세트를 사용할 것이다. 50명의 학생들이 시험을 보았고, 시험관들은 관측된 성능이 각 역에서 "명백한 실패", "경계선", "명백한 통과" 또는 "우수"인지 여부를 나타내는 등급을 제공했다. 50명의 학생들 중, 9명은 OSCE 역에서 "경계선" 공연을 보여준 것으로 생각되었다. 측점에 대한 합격 점수를 도출하기 위해 중앙값(즉, 50번째 백분위수) 점수가 계산되었다. 이 예제의 경우 합격 점수는 스프레드시트 소프트웨어를 사용하여 식별되었습니다. MEDIAN (C23, C26, C29, C36, C37, C42, C42, C43, G2, G6); 여기서 "C"와 "G"는 OSCE 점수가 위치한 열을 나타내며 숫자는 경계선 수험자의 점수를 나타내는 행을 나타낸다. 이 예에서는 중위 점수가 64%이므로 64% 이상의 점수를 받은 수험생이 해당 스테이션을 통과하게 됩니다.

To illustrate this approach, we will use the same data set used for the modified Angoff approach, which is presented in Table 4. Fifty students were tested, and examiners provided a rating indicating whether the observed performance was a “clear fail,” “borderline,” “clear pass,” or “superior” at each station. Of the 50 students, nine were thought to have demonstrated “borderline” performance at the OSCE station. To derive the passing score for the station, the median (i.e. 50th percentile) score was calculated. For this example, the passing score was identified using spreadsheet software: MEDIAN (C23,C26,C29,C36,C37,C42,C43,G2,G6); where “C” and “G” indicate the columns where OSCE scores are located and the numbers indicate the rows for the scores of the borderline examinees. In this example, the median score is 64%, so examinees with scores of 64% or higher would pass the station.

이 접근법의 수정은 캐나다 의학 평의회Medical Council of Canada 에 의해 사용되며, 6점 등급 척도가 사용된다: 열등, 열등, 국경 불만족, 국경 만족, 양호 및 우수. [경계선 불합격]과 [경계선 합격]으로 평가된 수험생의 평균 스테이션 점수는 스테이션에 대한 합격 점수를 도출하기 위해 계산된다. 이 [수정 경계선 그룹 방법]은 스테이션에 대해 "경계선" 등급을 받은 수험생이 충분히 있을 때 잘 작동한다. 그러나 합격점수의 안정성은 [경계선 불만족]과 [경계선 만족]으로 분류된 수험자 수에 따라 달라진다. 만약 적은 수의 수험생만이 "경계선"으로 평가된다면, 그들의 스테이션 점수의 평균을 바탕으로 합격 점수를 계산하는 것은 안정적이지 않을 것이다. 즉, 두 개 또는 세 개의 점수에서 도출된 컷 점수와 관련된 신뢰성은 매우 낮을 가능성이 높다.
A modification of this approach is used by the Medical Council of Canada (Smee & Blackmore 2001), where a six-point rating scale is used: inferior, poor, borderline unsatisfactory, borderline satisfactory, good, and excellent. The mean station score for those examinees rated borderline unsatisfactory and borderline satisfactory is calculated to derive the passing score for the station. This Modified Borderline Group Method works well when there are enough examinees who were rated “borderline” for the station. However, the stability of the passing score is dependent on the number of examinees in the borderline unsatisfactory and borderline satisfactory categories. If few examinees are rated “borderline”, then calculating the passing score based on the mean of their station scores are not likely to be stable. That is, the reliability associated with a cut score derived from two or three scores is likely to be very low.

이러한 잠재적 단점을 극복하기 위해 Wood 등이 [회귀 접근법]을 연구하였다. OSCE 점수의 전체(모든 응시자) 범위를 사용하는 것은 소수의 수험생만 참여한 경우에 특히 유용할 수 있다. 경계선으로 분류된 수험생의 수가 매우 적을 수 있기 때문에, 결과적인 합격 점수는 모든 점수를 사용했을 때보다 정확도가 떨어질 수 있다. 이 수정된 방법에서

  • [체크리스트 점수]는 종속 변수이며,
  • [등급rating]은 독립 변수입니다.

회귀 분석의 목적은 스테이션에서 "경계선"으로 분류된 수험생의 체크리스트 점수를 예측하는 것이다.
To overcome this potential disadvantage, a regression approach was studied by Wood et al. (2006). Using the entire range of OSCE scores can be particularly useful if only a small number of examinees have participated. Because the number of examinees classified as borderline could be very small, the resulting passing score could be less precise than if all scores were used (Wood et al. 2006). In this modification,

  • the checklist score is the dependent variable;
  • the rating is the independent variable.

The goal of the regression analysis is to predict the checklist score of the examinees classified as “borderline” for the station.

경계 회귀 분석 방법은 간단하며 Microsoft Excel 워크시트를 사용하여 수행할 수 있습니다. 이 방법에 대한 자세한 내용은 그림 1-5에 나와 있으며, 7가지 단계를 설명합니다.
The borderline regression method is straightforward, and can be done using a Microsoft Excel worksheet. Details on the method are provided in Figures 1–5, which depict a series of seven steps.

  • 1단계: OSCE 점수 및 검사자 등급에 대한 스프레드시트를 준비합니다.
  • 2단계: "데이터" 탭을 클릭하고 팝업 창이 나타나면 "데이터 분석"을 선택합니다. 선택할 분석 도구는 "회귀"입니다.
  • 3단계: "입력 Y 범위"를 식별합니다. 예측되는 항목입니다. 이 경우 C열의 OSCE 점수입니다.
  • 4단계: "입력 X 범위"를 식별합니다. 점수 예측에 사용할 항목입니다. 이 경우 D열의 "검사자 PF1"이 제공하는 등급이 선택된다.
  • 5단계: 분석 결과의 위치를 확인합니다. 이 예제에서는 스프레드시트에 "시트 3"이라는 이름을 지정했습니다. 회귀 분석 창(오른쪽 위)에서 확인을 클릭합니다.
  • 6단계: 회귀 분석("요약 출력")의 출력은 "시트 3"에 있습니다.
  • 7단계: 합격 점수를 도출하는 공식은 다음과 같습니다.
    • 통과 점수 = (정격* " × 변수 1") + 가로채기.
    • 이 예에서 합격 점수는 75.4 = (2 × 11.561) + 52이다.326
    • 여기서 2는 등급의 중위수이고, 11.561은 "× 변수 1"이며, 52.326은 절편이다.
  • Step 1: Prepare a spreadsheet of OSCE scores and examiner ratings.
  • Step 2: Click on the tab labelled “Data,” and when the pop-up window appears, select “Data Analysis.” The analysis tool you will select is “Regression.”
  • Step 3: Identify the “Input Y Range” – what will be predicted. In this case, it is the OSCE scores in Column C.
  • Step 4: Identify the “Input X Range” – what will be used to predict scores. In this case, the ratings provided by “Examiner PF1” in Column D will be selected.
  • Step 5: Identify the location for analysis results. In the example, we gave the spreadsheet the name “Sheet 3.” Click OK in the “Regression” window (upper right side).
  • Step 6: The output from the regression (“Summary Output”) is in “Sheet 3.”
  • Step 7: The formula for deriving the passing score is:
    • passing score = (median of ratings* “ × Variable 1”) + Intercept.
    • For this example, the passing score would be 75.4 = (2 × 11.561) + 52.326
    • where 2 is the median of the ratings, 11.561 is the “ × Variable 1”, and 52.326 is the intercept.

검토 결과, 스테이션의 평가자가 특히 가혹하다는(또는 관대하다는) 결론으로 이어지는 경우, 합격 점수는 추정의 표준 오차(요약 출력에 "표준 오차"로 표시됨)에 의해 조정될 수 있다.
The passing score could be adjusted by the standard error of estimation (labelled “Standard Error” in the Summary Output), if review leads to the conclusion that the examiner at a station was particularly harsh (or lenient).

 

 

표준 설정 미팅 수행: 대조 그룹
Conducting the standard setting meeting: contrasting groups


[대조 그룹 방법]을 사용하려면 패널리스트가 검사자의 작업을 검토하고, 수행능력을 [허용되는 것] 또는 [허용되지 않는 것]으로 분류해야 합니다. 교육에서, 시험 외부 정보는 수험자를 이러한 범주로 분류하는 데 사용된다(햄블턴 외 2000) 유사한 내용의 다른 조치들이 있을 때, [두 그룹의 수험생]을 확인한다. 그런 다음 성능 표준이 확립된 테스트의 점수를 사용하여 [분포(그룹별로 하나씩)를 생성]하고, [분포를 비교]하여 [중복 정도를 결정]한다. 이는 '유능하다'고 평가되는 각 항목별, 점수 수준별 수험생 비율을 표로 표시해 이뤄진다. 합격 점수는 수험생의 약 50%가 유능하다고 판단되는 지점이다. 
The Contrasting Groups method requires panellists to review examinee work and classify the performance as acceptable or unacceptable (Livingston & Zieky 1982). In education, information external to the test is used to classify the examinees in these categories (Hambleton et al. 2000). When other measures with similar content are available, two groups of examinees are identified. Then, scores from the test on which performance standards are being established are used to generate distributions (one for each group), and the distributions are compared to determine their degree of overlap. This is done by tabulating the percentage of test-takers in each category and at each score level who are considered “competent”. The passing score is the point at which about 50% of the test-takers are considered competent.

보건 전문 교육에서 검사 프로그램의 경우, OSCE에서 측정한 것과 동일한 기술을 평가하는 외부 조치를 찾기 어렵다. 의료 교육에서 가장 일반적으로 사용되는 변형은 패널이 [관심 측정(즉, OSCE 또는 표준화된 환자 검사)]에 대해, [패널이 검토한 수행능력]이 [수행능력 표준과 관련된 특성]을 충족하는지 여부를 결정하도록 하는 것이다. [대조 그룹 방법]을 변형한 한 가지 예는 수행능력을 "competent"으로 평가하는 심사위원 수를 시험 점수로 회귀시켜 합격 점수를 도출하고, 패널리스트의 50%가 성과를 유능하다고 평가하는 지점에서 합격 점수를 설정했다.

For examination programmes in health professions education, it is difficult to find an external measure that assesses the same skills as those measured in the OSCE. The variation most commonly used in medical education is to have panellists decide whether the performance they review on the measure of interest (i.e. the OSCE or standardised patient examination) meets the characteristics associated with the performance standard. One example of a variation on this approach derived the passing score by regressing the number of judges rating the performance as “competent” to the test scores, and set the passing score at the point at which 50% of the panellists rated the performance as competent (Burrows et al. 1999).

[대조 그룹 방법]의 또 다른 [변형]에서, 패널들은 시험 점수에 대한 지식 없이, 시험에서 수험자들의 성과를 판단했다. 그런 다음 통과 점수는 [두 점수 분포의 교차점]으로 식별되었다. 이전 예제를 사용하여 이 접근 방식의 사용을 설명하겠습니다. 50명의 학생들이 시험을 보았고, 시험관은 관찰된 성과가 "실패" 또는 "합격"으로 간주되는지 여부를 나타내는 등급을 제공했다. 표 5는 시험관이 "실패" 또는 "합격"으로 평가한 수험자의 점수 범위와 개수가 포함된 데이터 세트를 보여준다. "Examiner's Decision"이라는 라벨이 붙은 칸 외에, 해당 범위 내의 점수를 가진 총 응시자 수가 제공된다. 이 예에서 심사관의 등급은 점수 범위와 별개입니다. 대신, 점수는 다른 평가자가 작성한 체크리스트를 기반으로 한다고 가정하십시오. 그 결과는 평가자가 확인한 수험생들이 가장 낮은 점수 범위에서도 합격으로 고려했음을 보여준다. 'Pass rate'이란 칸은 합격점을 점수 범위 바로 위에 설정했을 경우 합격할 수 있는 수험생 비율을 표시한 것이다.
In another variation of the contrasting groups method, panellists judged the performance of examinees on the test of interest without knowledge of their test scores (Clauser & Clyman 1994). The passing score was then identified as the intersection of the two score distributions. We will illustrate the use of this approach using our earlier example. Fifty students were tested, and the examiner provided a rating indicating whether the observed performance was considered “failing” or “passing.” Table 5 shows the data set with score ranges and counts of examinees rated “fail” or “pass” by the examiner. In addition to the columns labelled “Examiner's Decision,” the total number of examinees with scores within that range is provided. In this example, the examiner's ratings are separate from the score range; instead, imagine that the scores are based on a checklist completed by another rater. The results show that the rater identified examinees considered passing even in the lowest part of the score range. The column labelled “Pass rate” is an indication of the percentage of examinees that would pass if the passing score was set just above the score range.

 

예를 들어 합격 점수를 50%로 맞추면 46명의 수험생이 합격하고 합격률은 92%가 된다. 그림 6은 점수 분포의 중첩을 보여줍니다. Clauser & Clyman(1994)이 연구한 접근 방식을 고려할 때, 교차점은 65%의 권장 합격 점수를 생성할 것이다. 65% 이상 수험생은 합격하고 64% 이하 수험생은 불합격한다.
For example, if the passing score was set at 50% correct, 46 examinees would pass, and the pass rate would be 92%. Figure 6 illustrates the overlap in the score distribution. Considering the approach studied by Clauser & Clyman (1994), the point of intersection would generate a recommended passing score of 65%. Examinees with score of 65% or higher would pass, and those with score of 64% or lower would fail.

 

 

시험 수준 합격 점수 결정
Determining examination level passing scores

성과 기반 평가에서 수행된 [각 과제]에 대해 합격 점수를 도출하는 방법을 검토했지만, 종종 [시험 수준]의 합격 점수가 필요하다.

  • 수험생이 시험한 [각 과제나 기술]에서 합격점을 받아야 하는 경우 기준은 접속적conjunctive이다.
  • 모든 직무 또는 기술에 걸친 성과를 고려할 경우, 표준은 보상적compensatory 이다.

Although we have reviewed methods that would derive passing scores for each task performed in the performance-based assessment, a passing score at the examination level is often needed.

  • If examinees must receive a passing score on each task or skill tested, the standard is conjunctive.
  • If performance across all tasks or skills is considered, the standard is compensatory (Haladyna & Hess 1999; Ben-David 2000).

각 작업의 통과를 요구할 것인지 아니면 성능을 전반적으로 고려할 것인지를 결정할 때 고려해야 할 몇 가지 요소가 있습니다.

  • 첫째, 수험생 수행능력은 과제마다 서로 다를variable 가능성이 높다. 즉, 각 수험생의 성적에 불일치가 있을 가능성이 높다. 수험자는 하나의 과제에서 다른 과제보다 더 나은 수행능력을 보여줄 것이다.
  • 또한 개별 과제에 대한 신뢰도reliability는 모든 과제에 대한 신뢰도reliability보다 훨씬 낮을 가능성이 높다.
  • [결합적conjuctive 표준]은 더 많은 수의 학생이 불합격하게 될 가능성이 높기 때문에, 시험에 불합격하는 결과와 재학생 또는 반복학습의 [로지스틱스]를 고려해야 한다(Ben-David 2000).
  • [보상적compensatory 표준] 설정에는 검사 점수를 도출하기 위해 모든 작업에 걸쳐 성능을 평균(또는 합계)하는 작업이 포함됩니다. 보상적 표준은 수험생들이 한 과제의 낮은 성적을 다른 과제의 더 나은 성과로 보상할 수 있도록 한다. [과제(또는 기술)가 서로 상관관계가 있는 정도]에 따라 보상적 결정과 연결적 결정에 대한 지원을 제공할 수 있다(Ben-David 2000).

When deciding whether to require passing each task or considering performance overall, there are several factors to consider.

  • First, examinee performance is likely to be variable from task to task. That is, there is likely to be inconsistency in the performance of each examinee. On some tasks, an examinee will have a better performance than on others.
  • In addition, the reliability of the individual tasks is likely to be much lower than the reliability across all tasks.
  • Because conjunctive standards are likely to result in a higher number of students failing, the consequences of failing the examination and the logistics of resitting or repeating instruction must be considered (Ben-David 2000).
  • Compensatory standard setting involves averaging (or summing) performances across all tasks to derive the examination score. Compensatory standards allow examinees to compensate for poor performance on one task with better performance on another. The degree to which the tasks (or skills) correlate with each other can provide support to the compensatory vs. conjunctive decision (Ben-David 2000).

또 다른 방법은 성적이 [수험생에게 어떻게 보고되는지]를 고려하는 것이다. 이 결정은 표준 설정 프로세스를 관리하는 사람들이 파생된 합격 점수를 어떻게 사용할지 결정해야 하기 때문에 중요하다.

  • 접속 모델에서는 수험생이 시험에 합격하기 위해서는 과제별 점수를 맞추거나 초과해야 한다.
  • 보상 모델의 경우 과제별 평균 합격 점수를 사용하여 시험 수준 합격 점수를 설정할 수 있습니다.

[OSCE 스테이션]의 경우, 업무 전반에 걸쳐 의사결정을 내릴 수 있지만(보상적), 각 기술(예: 의사소통, 임상적 의사 결정)을 통과해야 시험에 합격할 수 있다. 수험생에게 제공되는 피드백에 대한 고려는 시험 수준 합격 점수를 설정하는 데 보상, 접속 또는 조합이 사용될 것인지를 결정하는 데 중요한 역할을 할 것이다.

Another option is to consider how performance is reported to examinees. This decision is important because those managing the standard setting process will need to decide how the derived passing scores will be used.

  • In the conjunctive model, examinees must meet or exceed the score for each task in order to pass the examination.
  • For the compensatory model, the average passing score across tasks can be used to set the examination-level passing score.

With OSCE stations, it may be that decisions can be made across tasks (compensatory) but each skill (e.g. communications, clinical decision-making) must be passed in order to pass the examination. Consideration of the feedback provided to the examinees will play an important role in determining whether compensatory, conjunctive, or a combination will be used to set the examination level passing score.

절충 방법
Compromise methods

[표준 설정 패널 목록]의 결과가 합격 점수를 결정하는 데 가장 중요한 요소이지만, 시험에 적용될 최종 합격 점수를 결정하는 데 추가 정보가 종종 사용된다. 고려되는 정보의 한 가지 유형은 합격 점수에 대한 합격-불합격 비율이다. 호프스티(1983년), 뷰크(1984년) 및 드 그루이테르(1985년)가 제안한 타협적 접근법은 패널리스트들에게 합격 점수와 합격(또는 불합격) 비율을 모두 고려하도록 명시적으로 요청한다. 각 접근 방식은 심판들이 "허용되는" 통과 점수와 통과 비율을 구성하는 것에 대한 의견을 가지고 있다고 가정한다.
Although results from the standard setting panellists are the most important elements in determining the passing score, additional information is often used to determine the final passing score that will be applied to examinations (Geisinger 1991; Geisinger & McCormick 2010). One type of information that is considered is the pass–fail rate for the passing score. The compromise approaches proposed by Hofstee (1983), Beuk (1984), and De Gruijter (1985) explicitly ask the panellists to consider both the passing score and the passing (or failing) rate. Each approach assumes that the judges have an opinion about what constitutes an “acceptable” passing score and passing rate.


호프스티는 [선택된 합격 점수]는 [모든 가능한 합격 점수] 중 하나일 뿐이라고 제안했다. 또한 가능한 모든 불합격률을 표시할 수 있습니다. 패널이 이러한 데이터를 고려했는지 확인하기 위해 설정 중인 표준(예: 최소 역량, 숙련도 등)이 논의되고 심사 과정의 세부 사항이 검토되며 패널은 다음 4가지 질문에 답해야 합니다.

Hofstee suggested that the chosen passing score was only one out of a universe of possible passing scores. In addition, it is feasible to plot all possible failure rates. To ensure that panellists have considered these data, the standard that is being set (e.g. minimal competence, proficiency, etc.) is discussed, the details of the examination process are reviewed, and the panellists are asked to answer four questions:

  1. 수용가능한 최저 합격률은 얼마인가? (최소 불합격률, fmin)
  2. 수용가능한 최고 합격률은 얼마인가? (최대 불합격률; fmax)
  3. 합격으로 간주되는 최저 합격 백분율 정답 점수는 얼마입니까? (최소 합격 점수; kmin)
  4. 합격으로 간주되는 최고 합격 백분율 정답 점수는 얼마입니까? (최대 합격 점수; kmax)
  5. What is the lowest acceptable percentage of students who fail the examination? (Minimum fail rate; fmin)
  6. What is the highest acceptable percentage of students who fail the examination? (Maximum fail rate; fmax)
  7. What is the lowest acceptable percent correct score that would be considered passing? (Minimum passing score; kmin)
  8. What is the highest acceptable percent correct score that would be considered passing? (Maximum passing score; kmax)

네 개의 데이터 점은 모든 심판에서 평균을 내어 계산됩니다. 표준 설정 패널의 네 가지 판단에 따라 시험에서 모든 합격점수에 합격할 수 있는 수험자의 비율이 그래프로 표시되고 네 가지 데이터 포인트가 표시됩니다. 그림 7은 Hofstee 방법의 적용 예를 보여줍니다. 이 예제에서는 140명의 학생이 50개 항목의 연말 시험을 치렀습니다.

The four data points are calculated by averaging across all judges. The percentage of examinees that would pass for every possible value of the passing score on the test is graphed and the four data points are plotted, based on the four judgments of the standard setting panel. Figure 7 provides an example of application of the Hofstee method. In this example, 140 students took a 50-item end-of-year test.

 

차트의 곡선은 시험에서 백분률 점수에 기반한 예상 불합격률을 나타냅니다. 강사들은 위에 나타난 네 가지 질문을 받았다.
The curve in the chart shows the projected failure rate based on percent correct scores on the test. Instructors were asked the four questions that appeared above:

  1. 수용가능한 학생들의 최저 합격률은 얼마인가? 평균: 20%
  2. 수용가능한 학생들의 최고 합격률은 얼마인가? 평균: 30%
  3. 합격으로 간주될 수 있는 최저 허용 백분율 정답 점수는 얼마입니까? 평균: 60%
  4. 합격으로 간주될 수 있는 최고 허용 백분율 정답 점수는 얼마입니까? 평균: 75%
  5. What is the lowest acceptable percentage of students who fail the examination? Average: 20%
  6. What is the highest acceptable percentage of students who fail the examination? Average: 30%
  7. What is the lowest acceptable percent correct score that would be considered passing? Average: 60%
  8. What is the highest acceptable percent correct score that would be considered passing? Average: 75%



심사위원의 정보를 사용하여 두 가지 포인트를 표시합니다. 즉, 허용 가능한 최저 불합격률과 허용 가능한 최고 정답률 점수의 교차점과 허용 가능한 최저 정답률 점수의 교차점입니다(그림 7 참조). 이 두 점은 정확한 점수와 예상 고장률로 정의되는 곡선과 교차하는 선을 생성합니다. 통과 점수는 교차점에서 x축까지의 점선을 따라(올바른 점수 백분율) 찾습니다. 실패율은 교차점에서 Y축까지의 점선을 따라(실패율) 구합니다.

Using the information from the judges, two points are plotted: the intersection of the lowest acceptable fail rate and the highest acceptable percent correct score; and the intersection of the highest acceptable fail rate and the lowest acceptable percent correct score (see Figure 7). These two points create a line that intersects the curve that is defined by percent correct score and projected failure rate. The passing score is found by following the dotted line from the intersection to the x-axis (percent correct scores). The fail rate is found by following the dotted line from the intersection to the y-axis (percent fail).

Beuk(1984)는 Hofstee 방법을 수정하여 최종 합격 점수를 도출할 때 패널리스트들이 각각의 판단을 어느 정도까지 고려해야 하는지를 보고해야 한다고 제안했다. 즉, 패널들은 그들의 결정이 어느 정도 [수험생 중심적]이거나 [시험 중심적]인지에 대한 질문을 받는다. [합격 점수]와 [합격 비율]의 [평균]과 [표준 편차]가 계산된다. 평균 합격률과 평균 합격 점수가 표시됩니다. 이 두 점이 교차하는 점이 차트에서 식별됩니다. 절충안은 합격률의 표준 편차와 합격 점수의 표준 편차의 비율을 사용하는 것으로 구성된다. 점수의 분포가 기울기를 기준으로 생성된 선과 교차하는 점이 합격 점수를 구성한다. De Gruijter(1985)는 패널리스트에게 이 두 가지 판단에 대한 불확실성 수준에 대한 추가 질문을 제기할 것을 추가로 제안했다. 뵈크와 드 그뤼테르의 방법은 의학 교육에 대한 문헌에 보고되지 않았지만, 호프스티의 방법은 많은 연구자들에 의해 사용되어 왔다.
In a modification of Hofstee method, Beuk (1984) suggested that the panellists report to what extent each of their judgments should be considered in deriving the final passing score. That is, panellists are asked the degree to which their decisions are examinee-oriented or test-oriented. The means and standard deviations of both the passing scores and acceptable pass rates are computed. The mean passing rate and mean passing score are plotted. The point on the chart where these two points intersect is identified. The compromise consists of using the ratio of the standard deviation of pass rate to the standard deviation of passing score. The point where the distribution of scores intersects the line generated based on the slope constitutes the passing score. De Gruijter (1985) further suggested that an additional question be posed to panellists, that of the level of uncertainty regarding these two judgments. Beuk's and De Gruijter's methods have not been reported in the literature for medical education, but the Hofstee method has been used by a number of researchers.


쉰들러 외 연구진은 외과 임상실습생의 합격 점수를 설정하기 위한 호프스티 접근법의 사용에 대해 보고했다. 개별평가(객관식, OSCE, 실습 성적, 프로페셔널리즘 등급) 대신 임상실습생 전체에 대한 합격점수를 설정하는 것이 목표였기 때문에 표준설정위원회는 [호프스티 방식]의 사용이 적절하다고 판단했다. 서로 관련되어 있는 평가를 여러 개 사용하면 프로페셔널리즘이 부족하더라도, 보상적인 기준이 마련될 것이라는 결론을 내렸다. 패널리스트는 호프스티 방식의 네 가지 질문에 답하기 전에 루브릭과 시험 자료를 채점하고, 예년에 불합격한 학생뿐만 아니라 모든 학생에 대한 점수 분포를 검토했다. 저자들은 판사들 사이에 높은 수준의 동의가 있었고, 도출된 합격률이 이전의 사무직 데이터에 적용되었을 때 합리적이라는 것을 발견했다.

Schindler et al. (2007) reported on the use of the Hofstee approach to set passing scores for a surgery clerkship. Because the goal was to set a passing score for the clerkship as a whole instead of individual assessments (multiple-choice examinations, OSCEs, clerkship grades, ratings of professionalism) the standard setting panel determined that the use of the Hofstee method was appropriate. The use of multiple, related assessments led the group to conclude that compensatory standards would be set, although a breech in professionalism could result in failing. Panellists reviewed score distributions for all students as well as those who had failed in previous years, along with scoring rubrics and examination materials before they responded to the four questions in the Hofstee method. The authors found that there was a high level of agreement amongst the judges, and that the pass rate derived was reasonable when applied to previous clerkship data.

표준 설정 방법 선택
Selecting a standard setting method

많은 방법들이 이용 가능한 상황에서, 어떤 방법이 "최고의" 방법인지 결정하는 것은 어려워 보일 수 있다. 표준 설정 방법을 선택할 때 [실용적인 고려 사항]이 있습니다. 이 방법은 [정보에 기초한 판단]을 허용해야 한다. 수행능력 데이터에 비추어 [전문가의 판단을 허용하는 과정]이 바람직하다. 선택한 방법은 평가 목표와 밀접하게 일치해야 합니다. 그 방법은 과정에 참여하는 사람들의 사려 깊은 노력이 요구되어야 하며, 그것은 연구에 기초해야 한다. 마지막으로, 방법은 참가자들에게 설명하기 쉬워야 하며, 구현하기 쉬워야 한다.
With many methods available, it may seem difficult to decide which the “best” method is. When selecting a standard setting method, there are practical considerations to be made. The method should permit judgments that are based on information; processes that permit expert judgment in light of performance data are preferable. The method chosen should be closely aligned with the goal of assessment. The method should require thoughtful effort of those participating in the process, and it should be based on research. Finally, the method should be easy to explain to participants, and easy to implement.


[합격선 설정 연구]는 [권장합격점수]를 생성하며, [시험목적]과 [합격선 설정 프로세스]에 맞는 수행수준에 해당해야 한다는 점을 명심해야 한다. 예를 들어,

  • 시험이 [추가 훈련이나 교정조치가 필요할 수 있는 학생]의 식별에 사용되는 경우, [합격]은 [다음 단계의 학습에 준비가 된 학생] 그룹을 나타내며, [불합격]은 [과정을 반복해야하는 그룹]을 식별한다. 이 경우 성과 수준은 독립적 실무 역량에 해당하는 수준만큼 높지 않을 수 있다.
  • 만약 시험이 [졸업할 준비가 된 사람]을 선별하여 [감독하 진료]를 하는 환경에 들어가는 데 사용된다면, 시험을 [통과]한 사람들은 [감독하 진료에 들어갈 준비와 관련된 특징]을 가지고 있다. 이 시험들을 통과한 결과는 다른 의미를 가지며, 합격 점수의 최종 결정은 이러한 차이를 고려하게 될 것이다.

최선의 방법을 식별할 수는 없지만, 이 가이드에 기술된 실제 고려사항뿐만 아니라 테스트의 목적에 기초하여 선택해야 한다.

It is important to keep in mind that the standard setting study will generate a recommended passing score and that the score should correspond to a level of performance that meets the purpose for the test and the standard setting process. For example,

> if the test is used for identification of students who may need additional training or remediation, then passing denotes the group of students ready for the next phase of study, while failing identifies the group who may repeat the course. In this case the level of performance may not be as high as the level that corresponds to competence in independent practice.
> If the test is used to represent those who are ready to graduate, and enter a setting with supervised practice, those who pass the test possess the characteristics associated with readiness to enter supervised practice. The result of passing these tests has different meanings and the final determination of the passing score will take these differences into account.

While it is not possible to identify the best method, the selection should be based on the purpose of the test, as well as practical considerations delineated in this guide.

표준 구현
Implementing the standard

표준 설정 연구는 "권장" 합격 점수를 생성하기 때문에 [합격선 설정 프로세스의 결과를 구현하기 전]에 고려해야 할 추가적인 문제들이 있다. 내려야 할 중요한 결정 중 하나는 합격 점수가 [보상]점수가 될 것인가 아니면 [결합]점수가 될 것인가 하는 것이다.

  • OSCE 및 표준화된 환자 검사의 경우 일반적으로 여러 스테이션이 포함된다. 평가가 사례별로 평균(또는 합산)되는 경우, 합격 점수는 유사한 방식으로 생성되어야 한다(예: 사례들의 평균 또는 합산). 이 예에서 합격선은 [보상적]인 것으로 간주됩니다. 합격 점수를 충족하거나 초과한 사람은 합격할 것이며, 한 스테이션에서 저조한 성능은 다른 스테이션에서 더 나은 성능을 통해 보상될 수 있습니다.
  • 또는 각 사례/스테이션에 대해 합격 점수를 얻을 수 있으며, 평가를 통과하기 위해 정해진 수의 사례를 통과해야 한다는 추가 요구사항이 있을 수 있다. 이 경우 합격선은 [결합적conjuctive]일 것이다. 사례는 종종 임상 및 대인관계 기술을 모두 측정하기 때문에 이러한 기술 각각에 대해 합격 점수를 생성할 수 있으며, 합격 요건은 각 기술 영역에서 합격 점수를 충족하거나 초과해야 한다. 이 접근법도 [결합적]인 것으로 간주될 것이다.

Since the standard setting study will generate a “recommended” passing score, there are additional issues to be considered before implementing the results of the standard setting process. One important decision to make is whether the passing score will be compensatory or conjunctive. 

> For OSCEs and standardised patient examinations, several stations are typically included. If the assessment is averaged (or summed) across cases, the passing score should be generated in a similar fashion (i.e. averaged or summed across cases). In this example, the standard would be considered compensatory; those who meet or exceed the passing score will pass, and poor performance at one station can be compensated by better performance at another station.

>  Alternately, a passing score could be derived for each case/station, and an additional requirement could be that a set number of cases have to be passed in order to pass the assessment. In this case, the standard would be conjunctive. Because cases often measure both clinical and interpersonal skills, passing scores could be generated for each of these skills, and the requirement to pass would be to meet or exceed the passing score in each skill area. This approach would also be considered conjunctive.

합격-불합격 결정이 [보상적 결정]인지 또는 [결합적 결정]인지를 결정할 때, 이 영역에서 수행된 연구를 고려하는 것이 중요하다. 서로 다른 과제에 대한 성과는 상당히 가변적일 수 있으며(Traub 1994), 단일 사례에 대한 성과는 시험자의 능력을 신뢰할 수 있는 지표가 될 가능성이 낮다(Linn & Burton 1994).

  • 개별 스테이션에 기초한 [결합적 합격선]은 불합격율을 높이고 측정 오류로 인해 잘못된 결정을 내릴 수 있습니다.
  • 스킬 영역에 기반한 [결합적 합격선]에서도 불합격율이 높아지겠지만, [영역별 보상 없이] 영역별 합격점수를 충족하도록 요구하는 것이 타당하다.

When deciding whether the pass–fail decision will be compensatory or conjunctive, it is important to consider the research done in this area. Performance on different tasks can be quite variable (Traub 1994), and performance on a single case is not likely to be a reliable indicator of an examinee's ability (Linn & Burton 1994).

  • Conjunctive standards based on individual stations will result in higher failure rates, and can result in incorrect decisions due to measurement error (Hambleton & Slater 1997; Ben-David 2000).
  • While higher failure rates will also result from conjunctive standards based on skill area, it is reasonable to require that the passing score be met for each area without compensation in each area.

벤-데이비드(2000)는 보상적 및 결합적 합격선에 대한 결정을 내리는 데, [평가에 의해 측정된 구조]에 대한 고려가 필수적이라고 제안한다. [평가의 목적]과 [결과에 대한 피드백]은 의사결정에 포함시켜야 할 중요한 기준이다. 예를 들어, 수험생들이 신체검사 기동을 개선해야 하지만, 병력청취와 의사소통 능력이 충분하다는 것을 알게 하는 것은 매우 유용할 것이다. 이 경우 측정된 기량을 바탕으로 별도의 합격 점수를 정하는 것이 합리적일 것이다.
Ben-David (2000) suggests that consideration of the construct measured by the assessment is essential in making a decision about compensatory and conjunctive standards. The purpose of the assessment and the feedback given regarding the results are important criteria to include in making a decision. For example, it would be very useful to have examinees know that they need to improve their physical examination manoeuvres, but that their history taking and communication skills are adequate. In this case, it would be reasonable to set separate passing scores based on skills measured.

시험 결과를 [수험생과 다른 이해관계자에게 보고하는 형식]도 고려 대상이다. OSCE가 연말 평가로 관리되는 경우, 낙제 학생(및 강사)은 기술 향상에 노력을 집중할 수 있도록 강점과 약점의 영역에 대해 알고 싶어할 수 있다. 심지어 합격한 학생들도 그들이 개선할 수 있는 부분이 있었는지 알고 싶을 것이다. 피드백을 제공하는 것은 특히 낙제 수험생들에게 중요하다.
Another consideration is the format of reporting the results of the examination to test-takers and other stakeholders. If the OSCE is administered as an end-of-year assessment, students who fail (and their instructors) may want to know about areas of strength and weakness, so that they can concentrate their efforts on skill improvement. Even students who pass may want to know whether there were any areas in which they could improve. Providing feedback is important, particularly for failing examinees (Livingston & Zieky 1982; American Educational Research Association et al. 1999).

마지막으로, [합격자 비율]에 대한 고려가 필수적이다. 생성된 결정의 결과를 이해하는 것은 의사결정자들이 프로세스를 이해하고 지지하도록 보장하는 데 필수적이다. 표준설정회의 중 권장합격점수를 생성하는 것은 실현가능하지 않으므로, 이해관계자(예: 교직원, 부서장)와의 회의를 실시하여 연구결과를 알리고, 시사점(즉 합격 인원)을 제시해야 한다.
Finally, consideration of the percentage of examinees passing is essential. Understanding the consequences of the decisions generated is vital to ensuring that decision makers comprehend and endorse the process. It is not likely that it will be feasible to generate the recommended passing score during the standard setting meeting, so a meeting with stakeholders (e.g. faculty members, head of departments) should be conducted to inform them of the results of the study, and to present the implications (i.e. number passed).

합격선 유지
Maintaining the standard

회의를 수행하고 합격 점수를 생성하고 승인한 후에는, 다음 테스트 사이클에서 합격 점수를 어떻게 생성할 것인지 고려해야 합니다. 수험생의 성적과 시험 난이도가 행정마다 달라질 수 있기 때문에, 같은 합격점수도 시간이 지나면 같은 효과를 내지 못할 수 있다. 시험자료가 개정되면 다시 한 번 표준설정회의를 진행하는 것이 필수다. 시험자료가 변경되지 않더라도 수험생의 성적과 난이도는 물론 합격점수 시행의 결과(즉 합격률 변화)를 모니터링하는 것이 중요하다.

  • 시험이 쉬워지고(즉, 수험생이 더 높은 점수를 얻는 것) 합격 점수가 그대로 유지되면 합격률이 높아질 가능성이 높다.
  • 반대로 시험이 어려워지면 합격률이 떨어질 가능성이 높다.

정기적으로 시험과 관련된 변화를 고려하여 표준 정의와 합격 점수를 재검토하는 것이 좋다. 시험이 다음 수준의 훈련으로 진행되거나 독립적인 실무에 들어가는 것을 의미하는지 여부에 관계없이 수험자 자격을 결정하는 데 사용되는 경우 시험 성과를 모니터링하는 것이 필수적이다.
Once the meetings have been conducted and the passing score has been generated and endorsed, it is time to consider how the passing score will be generated for the next testing cycle. Because the performance of examinees and the difficulty of the test can change from administration to administration, the same passing score may not have the same effect over time. If test materials are revised, it is essential to conduct the standard setting meeting once again. Even if the test materials are not changed, it is important to monitor the performance of examinees and difficulty of the test, as well as the consequences of implementing the passing score (i.e. changes in passing rates).

  • If the test becomes easier (i.e. examinees obtain higher scores) and the passing score remains the same, the passing rate is likely to increase.
  • Conversely, if the test becomes more difficult, the passing rate is likely to decrease.

Revisiting the definition of the standard as well as the passing score in light of changes associated with the test on a regular basis is advised. Monitoring test performance is essential if the test is used for determining examinee qualifications, whether it means going on to the next level of training or entering independent practice.

결론들
Conclusions

[객관식 시험]과 [수행능력 기반 시험]에 대해 합격선 설정에 대한 광범위한 연구가 있지만, "올바른" 합격점수와 "최고의" 방법은 없다. 방법에 따라 결과가 달라집니다. 검사 목적과 표준 설정 작업에 사용할 수 있는 리소스에 따라 방법 선택이 달라집니다. 제시된 방법, 제공된 지침 및 사례들은 방법의 선정, 표준 설정 회의 준비, 회의의 실시 및 얻은 데이터의 분석, 표준의 구현 및 유지에 관한 결정을 알리기 위한 정보를 제공하기 위한 것이다.

Although there is extensive research on standard setting with both multiple-choice and performance-based tests, there is no “right” passing score, and no “best” method. Different methods yield different results. Selecting a method depends on the purpose of the examination and the resources available for the standard setting effort. The methods presented, the guidelines provided, and the examples given are meant to provide information to inform decisions regarding selection of a method, preparation for a standard setting meeting, conducting the meeting and analysing the data obtained, and implementing and maintaining the standard.

 


Med Teach. 2014 Feb;36(2):97-110. doi: 10.3109/0142159X.2013.853119. Epub 2013 Nov 20.

How to set standards on performance-based examinations: AMEE Guide No. 85

Affiliations collapse

Affiliation

1FAIMER, Research and Data Resources , USA.

PMID: 24256050

DOI: 10.3109/0142159X.2013.853119

Abstract

This AMEE Guide offers an overview of methods used in determining passing scores for performance-based assessments. A consideration of various assessment purposes will provide context for discussion of standard setting methods, followed by a description of different types of standards that are typically set in health professions education. A step-by-step guide to the standard setting process will be presented. The Guide includes detailed explanations and examples of standard setting methods, and each section presents examples of research done using the method with performance-based assessments in health professions education. It is intended for use by those who are responsible for determining passing scores on tests and need a resource explaining methods for setting passing scores. The Guide contains a discussion of reasons for assessment, defines standards, and presents standard setting methods that have been researched with performance-based tests. The first section of the Guide addresses types of standards that are set. The next section provides guidance on preparing for a standard setting study. The following sections include conducting the meeting, selecting a method, implementing the passing score, and maintaining the standard. The Guide will support efforts to determine passing scores that are based on research, matched to the assessment purpose, and reproducible.

머신러닝: 의학교육의 다음 패러다임 시프트(Acad Med, 2021)
Machine Learning: The Next Paradigm Shift in Medical Education
Cornelius A. James, MD, Kevin M. Wheelock, MD, and James O. Woolliscroft, MD

 

머신러닝(ML)은 데이터 간의 관계를 선험적으로 정의할 필요 없이 학습하는 인공지능(AI)의 한 형태다. ML은 팝업 광고를 추진하고, 아마존에서 구매를 제안하며, 자동화된 주식 거래 자금을 운영하고, 날씨를 예측하고, 다른 많은 작업을 수행합니다. 놀랄 것도 없이, ML의 임상 응용은 집중적인 개발의 초점이다. 예를 들어, 최근 미국 방사선과 대학 데이터 과학 연구소는 의료 영상과 관련된 미국 식품의약국(FDA)이 승인한 ML 알고리즘 48개를 열거했다.  ML 임상 프로그램의 고도화를 나타내는 것으로, 2018년 FDA는 당뇨병 망막병증 검출을 위해 안저 카메라인 IDx-dr과 결합된 최초의 자율 ML 시스템을 승인했다. ML에 대한 임상 응용 프로그램은 이미지 분석 이상으로 확장되었습니다. ClinicalTrials.gov은 진단에서 원하는 건강한 행동 강화에 이르는 광범위한 응용 분야에서 ML을 사용한 1,000개 이상의 연구를 나열합니다. 최근 ML 알고리듬은 COVID-19 양성 환자의 생명 징후를 실시간으로 모니터링하여 악화를 예측하고 결과를 개선하기 위해 조기에 개입을 시작하는 데 사용되고 있다. ML이 의료에 점점 더 통합됨에 따라, 의학교육자는 [임상의가 (적용 가능성을 결정하기 위해 마케터의 말에 의존하기보다는) ML 제품의 정교한 "소비자"가 될 수 있도록 지식 갖추게끔 하는 것]이 무엇보다 중요하다.

Machine learning (ML) is a form of artificial intelligence (AI) that learns the relationships between data without the need to define them a priori. ML drives pop-up ads, suggests purchases on Amazon, runs automated stock trading funds, predicts the weather, and performs many other tasks. Not surprisingly, clinical applications of ML are a focus of intense development. For example, recently, the Data Science Institute of the American College of Radiology listed 48 U.S. Food and Drug Administration (FDA)-approved ML algorithms related to medical imaging. 1 Indicative of the increasing sophistication of ML clinical programs, in 2018, the FDA approved the first autonomous ML system coupled with a fundus camera, IDx-dr, for the detection of diabetic retinopathy. Clinical applications for ML have expanded beyond image analysis; ClinicalTrials.gov lists over 1,000 studies employing ML across a broad spectrum of applications ranging from diagnosis to enhancing desired healthy behaviors. 2 Recently, ML algorithms have been used to monitor the vital signs of COVID-19-positive patients in real time to predict deterioration and to initiate interventions earlier to improve outcomes. 3 As ML is increasingly integrated into health care, it is of paramount importance that medical educators equip clinicians with the knowledge to be sophisticated “consumers” of ML products rather than dependent on the word of marketers to determine applicability.

보급률과 중요성은 증가하고 있지만 ML에서 파생된 알고리듬은 임상 실습이나 의학 교육에서 표준과 거리가 멀다. 의학에서 ML을 사용하는 윤리에 대한 의문이 있다. ML에 대한 의존도가 높아짐에 따라 의사 기술이 침식될지 여부 및 ML이 의사-환자 관계에 부정적인 영향을 미치거나 일부 의사를 완전히 대체할 가능성이 있다. 책임 위험, 지급 메커니즘 및 격차의 영속성과 관련된 우려는 실제로 ML 알고리듬을 더 폭넓게 수용하고 사용하지 않는 데 기여했다. ML의 역할과 가치에 대한 임상의와 교육자들의 불확실성에는 종종 회의론이 뒤따른다. 이러한 회의론의 대부분은 [ML이 무엇이고 임상 의사 결정에서 ML이 보완적 역할을 해야 하는지에 대한] 이해 부족 때문이다. 정밀 검사는 환자에게 최적의 치료를 제공하기 위해 필요하며, 무비판적인 수용이나 무관심은 피해야 한다.
Although growing in prevalence and importance, ML-derived algorithms are far from standard in clinical practice or in medical education. There are questions about the ethics of using ML in medicine: whether physician skills will erode with more reliance on ML as well as the potential for ML to negatively affect the physician–patient relationship or replace some physicians completely. 4,5 Concerns related to liability risks, payment mechanisms, and perpetuation of disparities have also contributed to the lack of broader acceptance and use of ML algorithms in practice. Clinicians’ and educators’ uncertainty as to the role and value of ML is often followed by skepticism. Much of this skepticism is due to a lack of understanding of what ML is and the complementary role it should play in clinical decision making. Scrutiny is necessary to provide optimal care for patients; uncritical acceptance or apathy must be avoided.

데이터 중심 환자 관리
Data-Driven Patient Care

의료 분야에서 ML의 미래를 도표화하는 데 있어 [증거 기반 의학(EBM) 운동]에서 배워야 할 교훈이 있다. 1990년대에 맥마스터 대학의 임상 역학자들은 의학의 관행을 객관적이고 과학적인 사업으로 바꾸는 것을 포함하는 패러다임 전환을 요구했다. 그들은 연구 설계, 역학 및 생물 통계의 연구 주제를 임상 치료의 최전선에 가져오고 임상의가 의학 문헌을 비판적으로 평가할 수 있도록 하는 방법을 설명했다. 이 스킬 세트는 임상의가 발표된 연구를 소비자에게 알리고 훈련 중에 획득한 전문가 의견이나 구식 정보에만 의존하지 않도록 하기 위해 고안되었습니다. 이 급진적인 생각은 저항에 부딪혔다. "모든 것을 아는" 주치의의 의견이 최선의 관행이라는 위계가 엄격한 시기에 나왔기 때문이다. 한때 참신하고 추상적인 개념이었던 EBM은 이제 고품질의 환자 치료를 위해 필수적인 것으로 간주되며 의학 교육의 주요 요소이다. 우리는 ML이 임상 실습에서 추상화에서 광범위한 적용으로 이동함에 따라 유사한 경로를 따를 것으로 기대한다.
In charting the future of ML in health care, there are lessons to be learned from the evidence-based medicine (EBM) movement. In the 1990s, clinical epidemiologists at McMaster University called for a paradigm shift that would include changing the practice of medicine into an objective, scientific enterprise. 6 They described a method to bring research topics in study design, epidemiology, and biostatistics to the front line of clinical care and equip clinicians to critically assess medical literature. This skill set is designed to help clinicians be informed consumers of published research and avoid relying solely on expert opinion or outdated information acquired during training. This radical idea was met with resistance as it came at a time when hierarchy, and the opinion of the “all-knowing” attending physician, were considered best practice. EBM, once a novel and abstract concept, is now deemed essential for high-quality patient care and is a staple in medical education. We expect ML to follow a similar path as it moves from abstraction to widespread application in clinical practice.

EBM과 ML은 실질적인 유사점을 공유한다. 진단, 예후 및 치료 결정을 알리기 위해 일반적으로 사용되는 예측 도구인 [임상 예측 규칙(CPR)]을 떠올려보라. 예시적인 예로는 CHADS2(울혈성 심부전, 고혈압, 75세 이상, 당뇨병, 허혈성 뇌졸중 전) 점수가 있다. 심방세동이 있는 환자의 뇌졸중 위험을 예측하고 항응고 결정을 내리는 데 널리 사용되었다. 이 CPR의 개발에는 엄격한 증거 기반 단계적 프로세스가 수반되었습니다.
EBM and ML share practical similarities. Consider clinical prediction rules (CPRs), which are predictive tools commonly used to inform diagnostic, prognostic, and therapeutic decisions. An illustrative example is the CHADS2 (congestive heart failure, hypertension, age ≥ 75 years, diabetes mellitus, prior ischemic stroke) score. It was widely used to predict the risk of stroke in patients with atrial fibrillation and guide decisions about anticoagulation. Development of this CPR involved a rigorous, evidence-based, stepwise process 7:

  • 도출 : 예측력을 이용한 진단검사, 이력, 신체검사 인자 파악
  • 좁은 검증과 넓은 검증: 처음에는 규칙이 파생 환경과 유사한 환경과 모집단에 적용되지만, 결국에는 다양한 임상 환경과 모집단에 적용됩니다.
  • 영향 분석: 규칙을 의사가 사용하고 환자 결과를 개선하며 비용을 절감한다는 것을 입증합니다.
  • Derivation: identification of diagnostic tests, history, and physical examination factors with predictive power
  • Narrow and broad validation: initially, the rule is applied in a setting and population similar to those in derivation, but eventually it is applied in varying clinical settings and populations
  • Impact analysis: demonstration that the rule is used by physicians, improves patient outcomes, and/or decreases costs


시간이 흐르면서 전문가들은 CHADS2 점수가 다른 중요한 위험요인을 고려하지 않았다는 우려를 나타냈다. 이로 인해 CHA2DS2-VASC(울혈성 심부전, 고혈압, 75세 이상, 당뇨병, 이전 허혈성 뇌졸중, 혈관 질환, 65-74세 이상, 성별) 점수가 개발되어 뇌졸중 위험을 보다 정확하게 평가할 수 있게 되었다. 이 시퀀스는 ML 알고리즘을 개발하는 데 사용되는 교육, 조정 및 검증 프로세스와 유사합니다. 마찬가지로 ML 모델은 더 많은 정보나 데이터를 사용할 수 있게 되면 정기적으로 재평가되고 수정되어야 한다. 그렇지 않으면 시대에 뒤떨어지고 무효화되며 무용지물이 될 위험이 있다.
With time, experts expressed concerns that the CHADS2 score did not consider other important risk factors. This led to development of the CHA2DS2-VASc (congestive heart failure, hypertension, age ≥ 75 years, diabetes, prior ischemic stroke, vascular disease, age of 65–74 years, sex) score, which provides a more accurate assessment of stroke risk. This sequence is comparable to the training, tuning, and validation process used to develop ML algorithms. Similarly, ML models must be regularly reevaluated and revised as more information or data are made available, or else they risk becoming outdated, invalid, and useless.

EBM은 임상 의학이 실행되는 방식에 근본적인 변화를 촉진했다. 우리는 ML에서 파생된 알고리듬이 의료에도 극적인 변화를 주도할 것으로 기대한다. 게놈 및 생리학적 바이오마커 결정과 강력한 계산 프로그램의 결합은 개인에 맞는 치료인 [정밀 의료]의 시대를 열었다. 진단 및 치료 옵션 선택에 상당한 영향을 미친 종양학에서 가장 발전된 것으로 추정되지만, 이 접근법은 지속적으로 증가하는 질병 스펙트럼에 적용되고 있다. 진정으로 개인화된 정밀 의료의 잠재력이 점점 더 현실화되고 있다. 개인화, 예측, 예방 및 참여형, 또는 "P4 의학"으로 구상되는 새로운 모델에 통합되고 있다. 정밀 및 예측 의학 개발의 중심은 ML로, 수백 또는 수천 개의 변수와 대규모 데이터 세트를 기반으로 복잡한 관계를 식별하는 수학적 접근 방식이다. 정밀의학과 예측의학의 잠재력이 점차 실현되고 있는 가운데 ML은 이미 특정 애플리케이션에 대한 수백 또는 수천 개의 알고리듬을 개발하는 데 사용되었다. ML은 매우 개별화된 방식으로 의사 결정을 강화하고 다양한 임상 상황에서 보완적인 역할을 할 수 있는 잠재력을 가지고 있다.
EBM has facilitated fundamental changes in the way clinical medicine is practiced. We anticipate that ML-derived algorithms will also drive dramatic changes in health care. The coupling of genomic and physiologic biomarker determinations with powerful computational programs has ushered in the era of precision medicine, care tailored to the individual. While arguably most advanced in oncology, where it has had a significant impact on diagnosis and the choice of therapeutic options, this approach is being applied across an ever-growing spectrum of diseases. Increasingly, the potential of truly individualized, precision medicine is becoming a reality. It is being incorporated in a new model that is envisioned as personalized, predictive, preventive, and participatory, or “P4 medicine.” 8–10 Central to the development of precision and predictive medicine is ML, an array of mathematical approaches to identify complex relationships based on hundreds or thousands of variables and massive datasets. While the potential of precision and predictive medicine is gradually being realized, ML has already been used to develop hundreds or thousands of algorithms for specific applications. ML has the potential to augment decision making in a highly individualized way and play a complementary role in a variety of clinical situations.

[EBM을 효과적으로 실천]하려면, 환자를 돌볼 때 EBM을 어떻게 사용해야 하는지 이해해야 한다. 마찬가지로 임상 치료에서 [ML 알고리듬의 역할과 적용 가능성]에 대한 충분한 이해가 없는 경우 이는 환자 결과에 부정적인 영향을 미칠 수 있다. EBM에 대한 이전의 비판은 그것이 "요리책cookbook" 의료라는 것이었다. 다시 말해, 비평가들은 (EBM에 대하여) [임상 전문 지식이나 환자 환경을 평가절하하거나 심지어 무시]하게 될 [medicine에 대한 일률적인 접근법]에 대해 우려했다. 마찬가지로 ML 애플리케이션을 사용할 때 불균형을 영구화할 수 있는 사회적 편견과 같은 문제를 피하기 위해 ML의 적절한 사용에 대한 이해가 필요하다. ML 알고리즘의 무비판적 적용을 피하여 suboptimal한 환자 치료를 피해야 한다.
The effective practice of EBM requires an understanding of how it should be employed when caring for patients. Likewise, if there is not an adequate understanding of the role and applicability of ML algorithms in clinical care, this could negatively affect patient outcomes. A prior criticism of EBM was that it was “cookbook” medicine. In other words, critics were concerned about a one-size-fits-all approach to medicine that would devalue, or even ignore, clinical expertise or patient circumstances. Similarly, an understanding of the appropriate use of ML is required to avoid problems such as social bias, which could perpetuate disparities when using ML applications. 11 Uncritical application of ML algorithms should be avoided to avoid suboptimal patient care.

데이터 인식 의사를 위한 기술
Skills for the Data-Aware Physician

[치료적 개입을 개발]하거나 [임상 실험을 설계]하거나 [ML 모델을 구축]하는 의사는 거의 없다. 그러나 모든 의사는 자신의 환자와 관련된 문헌을 효과적으로 획득, 평가 및 적용할 수 있어야 한다. 여기에는 ML에서 파생된 알고리즘 연구가 포함된다. 환자 치료에 영향을 미칠 수 있는 모든 개입과 마찬가지로 ML 모델은 효과와 안전성의 증거를 보여주기 위해 경험적 연구 연구를 통해 평가되어야 한다. [EBM의 기본 원리]는 ML 유래 모델을 포함한 고전적인 임상 연구와 연구에도 적용할 수 있다.

  • 연구 결과가 타당한가? 
  • 결과가 환자에게 적용/일반화될 수 있습니까? 
  • 연구 설계(예: 무작위 대조 시험, 코호트 연구, 사례-대조군 연구)가 질문 유형(예: 진단, 예후, 치료)에 적합한가?

Few physicians will ever develop a therapeutic intervention, design a clinical trial, or build an ML model. However, all physicians should be able to effectively acquire, appraise, and apply literature that is relevant to their patients; this includes studies of ML-derived algorithms. As with any intervention that may affect patient care, ML models must be evaluated with empirical research studies to show evidence of efficacy and safety. Basic tenets of EBM are applicable to classic clinical studies and studies including ML-derived models.

  • Are the results of the study valid?
  • Are the results applicable/generalizable to my patient(s)?
  • Is the study design (e.g., randomized controlled trial, cohort study, case–control study) appropriate for the type of question asked (e.g., diagnosis, prognosis, therapy)?

ML을 사용한 연구는 다음과 같은 [추가 질문]과 함께 제공됩니다. 

  • 시험/훈련 데이터의 양이 적절한가? 
  • 데이터셋 간에 중복되는 부분이 있습니까? 
  • 모델이 외부 데이터 세트에서 추가로 검증되었습니까? 
  • 이 알고리즘은 어떤 gold standard와 비교되고 있는가? 

Studies using ML come with additional questions:

  • is the amount of testing/training data adequate?
  • Is there any overlap between those datasets?
  • Was the model further validated on an external dataset?
  • To what gold standard is the algorithm being compared? 

이것들은 ML에 대한 임상 응용 프로그램을 평가할 때 임상의가 준비해야 할 몇 가지 질문들 중 일부에 불과하다. 
These are but a few of the questions clinicians need to be prepared to ask when evaluating clinical applications for ML. 12

ML 알고리즘 설계 및 배치에서 발언권을 가지려면 [임상의]가 [데이터 과학자]와 효과적으로 소통해야 한다. 의학이 그렇듯, ML 분야는 초보자들이 이해하기 어려운 언어로 가득 차 있다. 예를 들어, 많은 숨겨진 레이어가 있는 인공 신경망을 포함하는 "딥 러닝"은 올바른 임상 환경에서 다른 ML 접근 방식에 비해 상당한 성능 이점을 제공할 수 있다. 언뜻 보기에는 [딥 러닝을 사용하는 알고리즘]이 [딥러닝이 없는 알고리즘]보다 항상 선호되는 것처럼 보일 수 있다. 그러나 이러한 성능 향상은 알고리즘을 진정한 "블랙박스"로 바꾸는 비용을 수반한다. 숨겨진 레이어가 많은 복잡한 신경망은 [주어진 입력 집합]이 모델의 [아웃풋에 어떻게 영향을 미치는지 완전히 이해하는 것]을 (불가능하지는 않더라도) 어렵게 만든다. 이해할 수 있는 것은, 특히 의사가 모델의 권고에 동의하지 않을 때, 일부 임상의와 환자가 모델의 작동 방식을 이해할 수 없을 때 모델을 신뢰하지 않을 수 있다는 것이다.
To have a voice in the design and deployment of ML algorithms clinicians will need to communicate effectively with data scientists. As with medicine, the field of ML is packed with language that is puzzling to the uninitiated. For instance, “deep learning,” which involves artificial neural networks with many hidden layers, can offer significant performance benefits over other ML approaches in the correct clinical setting. At first glance, it may seem that an algorithm using deep learning is always preferable to one without it. However, this performance improvement comes at the cost of turning the algorithm into a true “black box.” Complex neural networks with many hidden layers make it difficult, if not impossible, to fully understand how a given set of inputs influences the outputs of a model. 13 Understandably, some clinicians and patients may not trust a model when they are unable to comprehend how it works, especially when the physician disagrees with the recommendation of the model.

의사는 또한 [ML 모델을 유효하고 유용하게 만드는 것]이 무엇인지 이해해야 한다. 예를 들어 앞에서 언급한 IDx-dr 모델은 다음 표준을 충족했습니다.
Physicians must also appreciate what makes an ML model valid and useful. For example, the previously mentioned IDx-dr model met the following standards:

  • 풍부한 훈련 데이터: 임상 시험에서 평가하기 전에, IDx-dr 알고리즘은 당뇨병성 망막병변 병변의 100만 개 이상의 사진을 사용하여 훈련되고 검증되었습니다. 일반적으로 ML 알고리듬은 수천 개의 데이터 포인트에 대해 훈련되어야 신뢰할 수 있다.
  • 잘 정의된 인풋: 알고리즘에 대한 입력인 안저 이미지는 환자와 기관에 걸쳐 고도로 표준화된다. 알고리즘이 주관적인 데이터 소스에서 수집된 입력에 의존할 때 알고리즘의 유효성은 어려움을 겪을 수 있다.
  • 명확한 gold standard의 존재: 이 알고리듬은 표준화된 채점 시스템을 사용하여 전문가 그룹의 해석에 대해 테스트하여 널리 받아들여지는 임상 표준과 일치하는지 확인했다.
  • 단순 예측을 넘어서는 목적: 알고리즘의 결과, 당뇨병 망막증의 유무는 임상적으로 의미가 있다.
  • Abundance of training data: Before evaluation in a clinical trial, the IDx-dr algorithm was trained and validated using over 1 million photographs of diabetic retinopathy lesions. Generally, ML algorithms need to be trained on thousands of data points to be reliable.
  • Well-defined inputs: The input to the algorithm, fundus images, is highly standardized across patients and institutions. When algorithms rely on inputs gathered from a subjective data source, the validity of the algorithm may suffer.
  • Presence of a clear gold standard: The algorithm was tested against the interpretation of a group of experts using a standardized scoring system, to ensure it agreed with widely accepted clinical standards.
  • Purpose beyond prediction: The result of the algorithm, presence or absence of diabetic retinopathy, is clinically meaningful.


마지막으로, 의사는 알고리즘의 성능이 임상 의사 결정에 통합하는 방법에 영향을 미치도록 허용해야 한다. ML 모델의 성능을 개념적으로 이해하기 위해서는 학습자가 [통계적 기반]이 필요하다. ML 문헌에는 EBM에서 일반적으로 사용되는 통계 개념과 약간 다르지만 개념적으로 관련이 있는 몇 가지 통계 개념이 포함되어 있다. 예를 들어, 양의 예측 값은 수학적으로 ML 용어의 정밀도와 동일합니다. 마찬가지로, 민감도는 리콜과 동일합니다. ML 모델 성능은 정밀도 및 회수로부터 도출된 F1 통계량을 사용하여 평가되는 경우가 많다. 이는 민감도와 특수성에서 도출된 수신기 작동 특성 곡선 아래의 면적과 유사하다. 이러한 통계는 임상 의사 결정에 지대한 영향을 미칠 수 있는 고유한 방법으로 성과를 측정합니다.

Finally, physicians must allow the performance of an algorithm to influence how they integrate it into clinical decision making. To conceptually understand the performance of ML models, learners need a foundation in statistics. ML literature contains some statistical concepts that are slightly different from, but conceptually related to, those commonly used in EBM. For instance, positive predictive value is mathematically equivalent to precision in ML parlance. Similarly, sensitivity is equivalent to recall. ML model performance is often assessed using the F1 statistic, which is derived from precision and recall. This is analogous to the area under the receiver operating characteristic curve, which is derived from sensitivity and specificity. These statistics measure performance in unique ways that can have a profound impact on clinical decision making.

지금이 바로 그 때다
The Time Is Now

의료 분야의 ML은 빠른 속도로 발전하고 있으며, 의사가 있든 없든 그렇게 하는 것으로 보입니다. 수많은 스타트업이 환자의 건강 증진을 약속하며 ML 기반 제품을 개발했다. 이로 인해 사업화에 대한 우려와 개발자들이 이익을 얻으려 할 때 발생할 수 있는 잠재적인 윤리적 문제로 이어졌다. 민간 기업이 점점 더 많은 양의 환자 데이터를 수집함에 따라, 일부 환자와 의사들은 누가 이러한 데이터를 실제로 소유하고 있으며, 그들이 무엇에 사용되는지, 그리고 데이터베이스가 가해자에 의해 해킹되었을 때 누구의 잘못인지 의문을 제기해왔다. 정보 기술자는 환자 정보 보호에 있어 자신이 수행하는 핵심 역할에 대한 책임을 져야 한다. 제약업계와 마찬가지로 의료 분야에서도 ML과 관련된 이해관계자가 많다. 서로 다른 이해관계자의 가치가 항상 일치하지는 않기 때문에 어떤 형태의 거버넌스와 규제가 필요하다. 아마도 우리는 유해한 알고리즘이 실제로 사용하도록 승인되지 않도록 하기 위해 정부 감독 기관이 개발되는 것을 보기 시작할 것이다. 교육자, 정책 입안자 및 일선 임상의와 같은 의사는 의학에서 ML과 관련된 윤리적 우려에 대한 안전장치 역할을 할 수 있는 독특한 위치에 있다. 우리가 환자를 보호해야 할 책임을 다하려면 이 맨틀을 차지해야 한다.
ML in health care is moving forward at a rapid pace, and it appears to be doing so with or without physicians. Numerous startups have developed ML-driven products promising to improve the health of patients. This has led to concerns about commercialization and potential ethical issues that may follow as developers attempt to profit. As private companies collect ever-increasing amounts of patient data, some patients and physicians have questioned who actually owns these data and determines what they are used for, and who is at fault when databases are hacked by perpetrators. Information technologists must be held accountable for the key role that they play in the protection of patient information. Similar to the pharmaceutical industry, there are many stakeholders involved in ML in health care. The values of different stakeholders are not always aligned, which makes some form of governance and regulation necessary. Perhaps we will begin to see government oversight agencies developed to ensure that harmful algorithms are not approved for use in practice. Physicians as educators, policy makers, and frontline clinicians are uniquely positioned to serve as safeguards against the ethical concerns related to ML in medicine. We must take up this mantle if we are to fulfill our responsibility to protect our patients.

의료계는 개인 차원에서도, 시스템 차원에서도 강력한 증거 기반이 있는 경우조차 변화에 적응하거나 새로운 권고안을 실행에 옮기는 속도가 느리다. 의학 교육도 비슷하게 뒤처지는 경우도 너무 흔하다. 학습자들, 그리고 더 나쁜 것은, 환자들이 의심할 여지 없이 이것 때문에 고통받았다는 것입니다. 수많은 의사들이 증거를 효과적으로 획득하고, 해석하고, 적용할 수 없는 상태에서 계속 연습하고 있다. 병동과 클리닉에 입학하는 현재 학습자들은 EBM에 확고한 기반이 없을 수 있는 의사들로부터 교육을 받고 있다. EBM은 의학 교육에서 확고한 기반을 가지고 있기 때문에, 미래 세대의 의사들이 교수 역할을 맡게 됨에 따라 개선될 가능성이 있다. 우리는 이러한 기술의 채택이 더 널리 퍼지기 전에 ML을 의료 커리큘럼에 능동적으로 통합함으로써 의학에서 ML에 대한 동일한 운명을 피할 수 있다. 이를 통해 새로운 의사가 ML 알고리듬에 참여하고 비판적으로 평가할 수 있다. 이들은 수동적 수급자가 아닌 ML을 의료에 통합하는 과정에서 적극적인 참여자가 될 것이다.

The medical community, on an individual level and a systems level, is slow to adapt to change or put new recommendations into practice even when they are based on strong evidence. 14 Too frequently medical education similarly lags. Learners, and worse, patients have undoubtedly suffered because of this. Countless physicians continue to practice with an inability to effectively acquire, interpret, and apply evidence. Current learners entering the wards and clinics are receiving instruction from physicians who may not have a solid foundation in EBM. Because EBM has a firm footing in medical education, this is likely to improve as future generations of physicians assume teaching roles. We can avoid this same fate for ML in medicine by proactively integrating ML into medical curricula before adoption of these technologies becomes more widespread. This will enable newer physicians to be ready to engage with and critically evaluate ML algorithms. They will be active participants in the process of integrating ML into health care rather than passive recipients.

대학원 의학 교육 인증 위원회, 의학 교육 연락 위원회 및 미국 의학 전문 위원회와 같은 조직은 의사가 실제로 ML 알고리즘을 적절하게 사용할 수 있도록 하기 위한 역량 개발에 착수해야 한다. 미국 의학 대학 협회와 미국 의학 협회는 의학 교육자들에게 현재와 미래의 의사들에게 AI 교육 프로그램을 제공할 것을 요구했다. 이 요청에 응답하고 기존 커리큘럼을 다시 생각해 볼 책임은 우리에게 있습니다. 데이터 중심 환경에서 의사가 실습할 수 있도록 가장 잘 교육하고 훈련하는 방법에 대한 결정이 내려져야 합니다.
Organizations such as the Accreditation Council for Graduate Medical Education, Liaison Committee on Medical Education, and American Board of Medical Specialties must begin to develop competencies to ensure that physicians are capable of appropriately using ML algorithms in practice. The Association of American Medical Colleges and the American Medical Association have called on medical educators to provide AI educational programming to current and future physicians. The onus is on us to answer this call and reimagine existing curricula. Decisions about how to best educate and train physicians to practice in a data-driven environment must be made.

ML을 커리큘럼에 통합
Integration of ML Into Curricula

ML 모델 설계의 수학적 및 기술적 복잡성을 고려할 때 모든 의사가 ML 전문가가 되기를 기대하는 것은 비현실적이다. 대신 학습자가 ML 알고리듬의 결과를 이해하고 임상 의사 결정에 통합하는 데 도움이 되는 높은 수준의 원칙에 초점을 맞춰야 한다. 이를 위해 학습자는

  • ML 분야에서 사용되는 전문 용어를 숙지하고 이해해야 하며,
  • ML이 해결에 가장 유용한 임상 문제의 유형을 인식하고
  • 다양한 유형의 모델의 성능 절충trade-off을 식별할 수 있어야 한다.

Given the significant mathematical and technical complexity of designing ML models, it is unrealistic to expect all physicians to become ML experts. Instead, focus should be on high-level principles that help learners understand and incorporate the outputs of ML algorithms into clinical decision making. To do so, learners should

  • be conversant with and understand the jargon used in the ML field,
  • recognize the types of clinical problems ML is most useful for solving, and
  • be able to identify the performance trade-offs of different types of models.

이를 위해 ML 콘텐츠를 기존 커리큘럼과 교육 프로그램에 신중하게 통합할 것을 제안한다. EBM과 ML 사이의 고유한 중복과 유사성을 고려할 때, ML 콘텐츠는 EBM 커리큘럼에 잘 맞을 것이다. 예를 들어, 진단 및 궁극적으로 치료 결정을 돕기 위해 사용되는 모든 도구와 마찬가지로 ML 진단 알고리듬은 사전 연구에서 골드 표준과 비교되어야 하며, 이 연구는 비판적으로 평가되어야 한다. 또한 ASCVD 위험 점수와 같은 심폐소생술에 대해 배울 때 위험 예측에 도움이 되는 ML 알고리즘의 사용에 대해 배우는 것도 마찬가지로 유익할 것이다. 예를 들어, COVID-19 양성 테스트의 위험을 예측하는 것입니다. 

To that end, we propose thoughtful integration of ML content into existing curricula and educational programming. Given the inherent overlap and similarities between EBM and ML, ML content would fit nicely into EBM curricula. For example, as with any tool used to aid in diagnostic and, ultimately, treatment decisions, an ML diagnostic algorithm must be compared with a gold standard in a prospective study, and this study must be critically appraised. Also, when learning about CPRs such as the ASCVD risk score, it would be equally beneficial to learn about the use of ML algorithms that aid in predicting risk; for example, predicting the risk of a positive COVID-19 test. 15,16 

ML 콘텐츠는 "Doctoring" 및 임상 기술 과정과 수평적으로 통합되어야 한다. 이렇게 하면 내용을 임상적으로 유지하고 학습자가 중심이 되어 학습자가 ML에 수반될 수 있는 과대 광고를 무시하고, ML의 적절한 사용을 인식하도록 교육하고, 환자를 돌보는 툴킷의 도구로 볼 수 있다. 교실에서는 개념이 너무 자주 중요하게 여겨지지만 병동과 클리닉에서는 이러한 개념의 활용이 입증되지 않는다. 다시 말해, 숨겨진 커리큘럼이 자리를 잡고, 학습자들은 의학의 특정 측면을 평가절하한다. 왜냐하면 이것이 그들이 실제로 "진짜 의사들"이 하는 것을 보기 때문이다(의식적이든 무의식적이든). 옛 속담에 있듯이: 
"행동이 말보다 더 크게 말한다." 이것은 ML을 실제로 적용하고 효과적으로 가르칠 수 있도록 의사를 의도적으로 훈련시키는 것의 중요성을 분명히 한다. 이러한 수직적 통합은 환자 치료에서 ML의 가치와 중요성을 강화하고 실제로 ML 프로그램을 효과적으로 사용하는 데 필요한 기술의 추가 개발로 이어질 가능성이 높다. 수직적 통합은 의사 경력에 걸친 적절한 종단적 통합에서만 발생할 것이며, 이는 지속적인 의학 교육과 교수 개발 프로그램의 형태로 이루어져야 한다.

ML content should be horizontally integrated with “Doctoring” and clinical skills courses. This would keep the content clinically based and learner centered to train learners to ignore the hype that can accompany ML, recognize the appropriate use of ML, and view it as a tool in their toolkit to care for patients. Too often, concepts are deemed important in the classroom, but utilization of these concepts is not demonstrated on the wards and clinics. In other words, the hidden curriculum takes hold, and learners devalue certain aspects of medicine because this is what they see “real doctors” do (consciously or unconsciously) in practice. As the old adage states: “Actions speak louder than words.” This makes clear the importance of intentionally training physicians to be capable of applying ML in practice and effectively teaching it. Such vertical integration is likely to lead to reinforcement of the value and importance of ML in patient care and further development of skills necessary to effectively use ML programs in practice. Vertical integration will only occur with appropriate longitudinal integration across physicians’ careers, which should come in the form of continuing medical education and faculty development programs.

마무리 비고
Concluding Remarks

의료 분야에서 ML의 사용이 증가함에 따라 의사와 의료 교육자는 핵심 이해 관계자가 되어야 한다. 우리가 얼마나 깊이 우리의 판돈stake을 땅에 박을지는 두고 봐야 한다. 의사가 ML 알고리즘의 개발 및 구현에 적극적인 목소리를 낼 것인가? 우리는 의사가 ML을 실제로 적용하도록 가르치기 위해 누구에게 의지할 것인가? 우리는 의학에서 또 다른 패러다임 전환의 한가운데에 있다. 의료 교육자는 증거 기반, 데이터 지향 및 환자 중심의 의사 교육에 도움이 되는 교육 프로그램을 제공해야 합니다. 이 요청을 무시하는 것은 현재와 미래의 의사들, 그리고 더 중요한 것은 우리가 돌보는 환자에게 해로울 것이다.

Physicians and medical educators need to be key stakeholders as the use of ML in health care increases. How deeply we drive our stakes into the ground remains to be seen. Will physicians be an active voice in the development and implementation of ML algorithms? Who will we rely upon to teach physicians to apply ML in practice? We are in the midst of another paradigm shift in medicine. Medical educators must embrace the call to deliver educational programs conducive to training evidence-based, data-conscious, and patient-centered physicians. Ignoring this call will prove detrimental to current and future physicians, and more importantly the patients for whom we care.

 


 

Acad Med. 2021 Jul 1;96(7):954-957. doi: 10.1097/ACM.0000000000003943.

Machine Learning: The Next Paradigm Shift in Medical Education

Affiliations collapse

Affiliations

1C.A. James is assistant professor, Departments of Internal Medicine and Pediatrics, University of Michigan Medical School, Ann Arbor, Michigan.

2K.M. Wheelock is an internal medicine house officer, Yale School of Medicine, New Haven, Connecticut.

3J.O. Woolliscroft is professor, Departments of Internal Medicine and Learning Health Sciences, and Lyle C. Roll Professor of Medicine, University of Michigan Medical School, Ann Arbor, Michigan.

PMID: 33496428

DOI: 10.1097/ACM.0000000000003943

Abstract

Machine learning (ML) algorithms are powerful prediction tools with immense potential in the clinical setting. There are a number of existing clinical tools that use ML, and many more are in development. Physicians are important stakeholders in the health care system, but most are not equipped to make informed decisions regarding deployment and application of ML technologies in patient care. It is of paramount importance that ML concepts are integrated into medical curricula to position physicians to become informed consumers of the emerging tools employing ML. This paradigm shift is similar to the evidence-based medicine (EBM) movement of the 1990s. At that time, EBM was a novel concept; now, EBM is considered an essential component of medical curricula and critical to the provision of high-quality patient care. ML has the potential to have a similar, if not greater, impact on the practice of medicine. As this technology continues its inexorable march forward, educators must continue to evaluate medical curricula to ensure that physicians are trained to be informed stakeholders in the health care of tomorrow.

학부의학교육에서 AI: 스코핑 리뷰(Acad Med, 2021)
Artificial Intelligence in Undergraduate Medical Education: A Scoping Review
Juehea Lee, Annie Siyu Wu, David Li, and Kulamakan (Mahan) Kulasegaram, PhD

 

 

지난 10년 동안, 인공지능(AI)은 끊임없이 증가하는 데이터와 컴퓨팅 능력으로 인해 빠르게 발전했다. AI는 이미지 인식, 음성 인식, 자막 생성과 같은 인지 작업을 모방하는 기계의 능력이다. 간단히 말해서, AI 모델은 다양한 작업에 대해 매우 정확한 예측을 하기 위해 대량의 데이터에서 패턴을 찾는 데 사용될 수 있다.  
Over the past decade, artificial intelligence (AI) has advanced rapidly due to an ever-increasing amount of data and computing power. 1 AI is the capability of a machine to imitate cognitive tasks such as image recognition, speech recognition, and caption generation. 2 Simply put, AI models can be used to find patterns in large quantities of data to make highly accurate predictions for various tasks. 3

의료 분야에서 AI는 의료 서비스 제공 방식, 의료 전문가들이 사용하는 도구, 환자와 의료 전문가의 전통적인 역할을 변화시킬 대규모 변화를 일으키는 시점에 임박해 있다. 기계 학습 알고리듬의 정확도는 수많은 작업에서 전문 의사의 정확도에 도달했거나 초과했다. 예를 들어 AI 시스템은 유방암 예측에서 인간 방사선사를 앞질렀고 평균 방사선사를 11.5%나 앞질렀다. 또 다른 AI 시스템은 피부과 의사 및 간호사보다 성능이 우수하고 피부과 의사와 비교하여 1차 진료에서 보이는 사례의 80%를 대표하는 26개의 공통 피부 상태를 식별할 수 있다. 
In medicine, AI is on the precipice of instigating large-scale changes that will transform how health care is delivered, the tools used by health care professionals, and the traditional roles of patients and health care professionals. 4,5 The accuracy of machine learning algorithms has reached or exceeded that of expert physicians on numerous tasks. For example, an AI system surpassed human radiologists in breast cancer prediction and outperformed the average radiologist by an absolute margin of 11.5%. 6 Another AI system could identify 26 common skin conditions representing 80% of cases seen in primary care with performance noninferior compared with dermatologists and superior to primary care physicians and nurse practitioners. 7

새로운 기술은 의학의 미래와 인간 의사의 역할에 대한 수많은 의문을 제기한다. 새로운 기술에 대한 관심이 증가하고 있음에도 불구하고, 의학 교육은 AI에서 만들어진 놀라운 돌파구를 따라가지 못했다. 그동안 여러 차례 실천요구가 있었지만 체계적인 증거가 부족했기 때문인지, 학부 의료교육(UME)에 AI 교육을 도입하는 데는 한계가 있었다. 의료 분야에서 AI의 채택이 계속 증가함에 따라, UME의 통합은 UME가 경력 초기에 가장 큰 의료 훈련생 그룹에 도달할 수 있기 때문에 향후 실무에 상당한 혜택을 제공할 것이다. AI가 어떻게 가르쳐지고 UME 커리큘럼에 통합되어야 하는지에 대한 이해는 가능한 가장 좋은 학술적 증거에 의해 인도되어야 한다. AI는 아직 의학 교육에서 비교적 새로운 개념이기 때문에, 증거가 어디에 있고 어떤 차이가 남아 있는지 판단하기 위해 문헌의 합성이 필요하다. 
New emerging technologies raise numerous questions about the future of medicine and the role of human physicians. Despite increasing interest in new technology, medical education has not kept pace with the remarkable breakthroughs made in AI. There have been several calls to action, 8–10 but adoption of AI training into undergraduate medical education (UME) has been limited, perhaps due to the lack of systematic evidence. 11 As adoption of AI continues to grow in health care, integration in UME will offer substantial benefits for future practice since UME can reach the largest group of medical trainees early in their careers. An understanding of how AI should be taught and integrated into UME curricula should be guided by the best available scholarly evidence. Since AI is still a relatively new concept in medical education, a synthesis of the literature is required to determine where the evidence is and what gaps remain.

이와 같이, 본 범위 검토의 목적은 AI 시대에 임상실습을 위해 학부생들을 훈련시키고 준비시키는 최선의 방법에 대한 주요 주제를 매핑하고 사용 가능한 문헌의 격차를 확인하는 것이었다. 본 연구의 결과는 의료교육계의 현재 관행을 알리고 향후 학문분야를 조명할 것이다.
As such, the objective of this scoping review was to map key themes and identify gaps in the available literature on how best to train and prepare undergraduate students for clinical practice in the age of AI. The results of this study will inform current practices and highlight future areas of scholarship for the medical education community.

방법
Method

범위 검토는 문헌의 포괄적인 검토를 통해 광범위하거나 탐구적인 연구 문제를 해결하는 것을 목표로 한다. 본 범위 지정 검토는 UME의 AI 교육 주제에 초점을 맞추고 있으며, 이 주제는 복잡하고 이전에 종합적으로 검토되지 않았기 때문에 범위 지정 검토를 사용하기로 결정했다. 우리의 방법이 신뢰할 수 있고 쉽게 복제될 수 있도록 하기 위해, 우리는 Arcsey와 O'Malley, Levac과 동료들이 제안한 방법론적 프레임워크를 따랐다. 
Scoping reviews aim to address a broad or exploratory research question through a comprehensive review of the literature. 12,13 This scoping review focuses on the topic of AI training in UME. We chose to use a scoping review as this topic is complex and has not been reviewed comprehensively before. 14 To ensure that our methods were reliable and could be easily replicated, we followed the methodological framework proposed by Arksey and O’Malley and Levac and colleagues. 12,13

연구 질문 식별
Identifying the research question

본 범위 검토의 주요 연구 질문은 "UME의 AI 훈련에 관한 기존 문헌에서 어떤 핵심 주제와 간극을 확인할 수 있는가?"였다. 구체적으로 본 범위 검토의 목적은 현재 문헌에서 UME의 AI 훈련에 관한 주요 주제를 요약하고 보급하는 것은 물론 잠재적인 연구와 학문을 파악하는 데 있었다.이 목표를 달성하기 위해 기계 학습, 딥 러닝, 자연어 처리와 같은 AI의 하위 도메인을 포함하여 AI를 광범위하게 정의하여 이용 가능한 문헌을 광범위하게 검색하였다. 이와는 대조적으로, 우리는 이 검토의 범위를 오직 UME로 제한했다. 우리는 대학원 또는 대학원 수준의 AI 교육이 전문성에 특화되어 모든 의학 학습자에게 적용되지 않는 개념이나 응용에 초점을 맞출 수 있을 것으로 기대했다. UME에 초점을 맞추어 모든 의학 학습자의 토대를 마련할 수 있는 의료 AI 교육에 대한 개념을 파악하고자 하였다.
The primary research question of this scoping review was: “What key themes and gaps can be identified in the existing literature on AI training in UME?” Specifically, the purpose of this scoping review was to summarize and disseminate key themes regarding AI training in UME in the current literature as well as identify potential research and scholarly priorities to advance AI curricular development in UME. 13 To meet this objective, we defined AI broadly, including subdomains of AI such as machine learning, deep learning, and natural language processing, to expansively search the available literature. In contrast, we restricted the scope of this review to UME only. We anticipated that AI training at the graduate or postgraduate level may be specialty-specific and focus on concepts or applications that are not applicable to all medical learners. By focusing on UME, we sought to identify concepts on medical AI education that could lay the groundwork for all medical learners.

관련 연구 확인
Identifying relevant studies

의료 사서의 도움을 받아 만들어진 우리의 검색 전략은 의료 주제 제목, 키워드 및 AI와 그 하위 도메인(예: 기계 학습) 및 UME(예: 임상 사무원, 의학 학생, 의학 학습자)와 관련된 텍스트 단어로 구성되었다. 초기 검색은 2019년 11월 25일 메들린, 엠베이스, 펍메드, 스코푸스, 에릭, 메드 에드 포털, 코크레인 라이브러리를 포함한 7개의 전자 데이터베이스에서 수행되었다. 검색은 2020년 7월 21일에 업데이트되었다. 검색은 2000년 1월 1일부터 영어 출판물로 제한되었다. 우리는 AI의 빠르게 진화하는 특성과 번역 서비스 접근 제한 때문에 각각 출판일과 언어별로 검색을 제한하기로 했다. 검색은 포함된 기사의 참조 목록을 손으로 검색함으로써 보완되었다.

Our search strategy, created with the help of a medical librarian, consisted of medical subject headings, keywords, and text words related to AI and its subdomains (e.g., machine learning) as well as to UME (e.g., clinical clerkship, medical student, medical learner). The initial search was conducted on November 25, 2019, in 7 electronic databases, including Medline, Embase, PubMed, Scopus, ERIC, MedEdPortal, and Cochrane Library. The search was updated on July 21, 2020. The search was limited to English publications from January 1, 2000, and onward. We chose to restrict the search by publication date and language due to the rapidly evolving nature of AI and limited access to translational services, respectively. The search was supplemented by hand-searching reference lists of included articles. The full version of the search strategy can be found in Supplemental Digital Appendix 1 at https://links.lww.com/ACADMED/B156.

스터디 선택
Study selection

모든 인용문은 코비던스 온라인 소프트웨어(호주 멜버른, 베리타스 헬스 이노베이션)를 사용하여 수입 및 관리되었다. 스터디 선택은 3단계로 수행되었습니다.

  • 첫째, 3명의 검토자가 연구 적격성을 결정하기 위해 독립적으로 제목과 초록을 선별하였다. UME에서 AI 훈련을 논의한 모든 연구가 포함됐다.
  • 둘째, 초기 제목과 추상적 심사에 이어 사후적으로 포함 및 제외 기준을 논의하고 개선했다.
  • 셋째, 포함 및 제외 기준을 사용하여 전체 텍스트 심사를 수행하였다. 갈등은 각 단계별로 논의와 합의를 통해 해결됐다.

All citations were imported and managed using the Covidence online software (Veritas Health Innovation, Melbourne, Australia). Study selection was performed in 3 steps.

  • First, 3 reviewers (J.L., A.S.W., D.L.) independently screened titles and abstracts to determine study eligibility. All studies that discussed AI training in UME were included.
  • Second, following initial title and abstract screening, we discussed and refined the inclusion and exclusion criteria post hoc.
  • Third, we performed full-text screening using the inclusion and exclusion criteria. Conflicts were resolved through discussion and consensus at each stage.

전반적으로 UME에서 AI 교육을 폭넓게 논의하면 검토 대상에 포함됐고, 다음 중 하나에 해당하면 제외됐다.
Overall, articles were included in the review if they broadly discussed AI training in UME. Articles were excluded if they:

  1. 대학원 또는 지속적인 의학교육에서 AI를 가르치는 것에만 집중한다.
  2. 골병리학 또는 제휴 의료 전문가에 대한 AI 교육에만 집중합니다.
  3. 의료 교육 커리큘럼의 주제와 반대로 의료 교육을 위한 도구로서 AI의 사용을 탐구했다.
  4. 회의 요약이 있거나 전체 텍스트 원고를 사용할 수 없는 경우. 출판 유형이나 방법론에 대한 다른 제한은 구현되지 않았다.
  5. Focused exclusively on the teaching of AI in postgraduate or continuing medical education;
  6. Focused exclusively on the teaching of AI in osteopathic medicine or for allied health professionals;
  7. Explored the use of AI as a tool for medical education as opposed to a topic within medical education curricula; or
  8. Were a conference abstract or where a full-text manuscript was not available. No other restrictions were implemented for publication type or methodology.

데이터 차트 작성
Charting the data

반복 프로세스를 통해 데이터 추출이 발생했습니다. 첫째, 데이터 차트의 '구조'양식을 사용하여 실시되었다. (J.L., A.S.W., DL)3비평가들 모든 full-text 기사가 데이터 형태 차트를 사용하는 데이터 뽑아 냈다. 그리고 우리는 그 반대가 결의 형태의 문헌에 증가한 친근감을 바탕으로 정제 형태의 일관성을 확보하기 위해 만났다. 토론에 따라서, 우리는 좀 더 다음 범주로 결과를 추출 칼럼 갈라지기:로 결정했다.

  • 왜(예:왜 AI의대생들을 준비하지 않도록 가르쳐야 한다? 학습목표는 무엇인가?) 
  • 무엇(예:의대생들에게 AI에 대해 무엇을 가르쳐야 한다?),. 
  • 누가(예를 들어, 강사들 누가 있을까?),. 
  • 어떻게(예를 들어, 어떻게 인공 지능을 교과 과정 의대생들에게 보내야 하는가?),. 
  • 어디(예:무엇을 정하는 인공 지능 교육 과정을 보내야 하는가?). 
  • 얼마나 잘(예:어떤 방법 AI교육 과정의 효율성을 판단하는 데 취해 진?). 

Data extraction occurred through an iterative process. First, data charting was performed using a structured form (see Supplemental Digital Appendix 2 at https://links.lww.com/ACADMED/B156). Three reviewers (J.L., A.S.W., D.L.) extracted data from all full-text articles using the data charting form. We then met to ensure consistency between forms, resolve disagreements, and refine the form based on increased familiarity with the literature. Upon discussion, we decided to further divide the results extraction column into the following categories:

  • why (e.g., Why should AI be taught to undergraduate medical students? What are the learning objectives?),
  • what (e.g., What should be taught to medical students about AI?),
  • who (e.g., Who would the instructors be?),
  • how (e.g., How should an AI curriculum be delivered to medical students?),
  • where (e.g., In what setting should an AI curriculum be delivered?), and
  • how well (e.g., What steps were taken to determine the effectiveness of AI curriculum?).

이들 범주들의 분배 지침에 의해 보고Evidence-based 연습 교육적 간섭과를 가르치는 것은(GREET),은 검증된 체크 리스트 교육적 도구의 증거를 연습하러 보고를 데이터 추출을 구성하는데 도움이 되기 위해 개발된 소식을 들었다. 업데이트된 데이터 추출 형태를 사용하여 3비평가들과 추출한 모든full-text 기사로부터 데이터 re-reviewed. 까지 합의에 도달했다 이 과정 반복되었다.

The division of these categories was informed by the Guideline for Reporting Evidence-based practice Educational interventions and Teaching (GREET), 15 a validated checklist developed for the reporting of educational interventions for evidence-based practice, to help organize data extraction. Using the updated data extraction form, 3 reviewers (J.L., A.S.W., D.L.) re-reviewed and extracted data from all full-text articles. This process was repeated until consensus was reached.

요약하고 그 결과를 보고 Collating.
Collating, summarizing, and reporting the results

연구 인구 통계 기술 통계를 사용하여 요약되었다. 추출된 질적 데이터는 Miles와 Huberman의 방법론에 의해 다음과 같이 주제분석을 이용하여 신흥주제로 묶었다. 먼저 각 전체 텍스트 기사 내에서 패턴과 공통 주제를 식별하기 위해 설명 코드를 할당했다. 우리는 여러 개의 설명 코드를 더 적은 수의 범주 또는 테마로 그룹화하는 패턴 코드를 생성하기 위해 코딩의 두 번째 주기를 수행했다. 그 다음, 우리는 매트릭스는 범주는 이전 단계에서 식별되는 각 기사 요약을 만들었다. 그 매트릭슨 다음 공통점과 기사들 사이의 차이고 노트 시각화 한장의 표로 줄었다. 우리는 마침내 범주를 커리큘럼 권장 사항으로 재구성하여 UME에서 AI에 대한 교육 개혁을 알리는 데 도움을 주었다.

Study demographics were summarized using descriptive statistics. Qualitative data from the extraction form were grouped into emerging themes using thematic analysis, informed by Miles and Huberman’s methodology, as follows. 16 First, we assigned descriptive codes to identify patterns and common topics within each full-text article. We performed a second cycle of coding to generate pattern codes that grouped multiple descriptive codes into a smaller number of categories or themes. Next, we created matrices summarizing each article according to the categories identified in the previous step. The matrices were then reduced into a single table, where commonalities and differences between articles were visualized and noted. We finally reframed the categories into curricular recommendations to help inform educational reform for AI in UME (see Figure 1).

 

결과.
Results

연구 특성
Study characteristics

우리의 검색의 22full-text 물품은 우리 최종 분석에 포함되었다 4,299 독특한 제목으로 확인했다. 이들 논문의 대부분은 원근법 논문(n = 18, 81.8%)이었으며, 같은 저자인 스티븐 A가 3편의 논문을 작성하거나 공동 집필했다. Wartman(표 1을 보). 다른 연구 설계(n=2, 9.1%)와 리뷰 케이스 스터디(nx1, 4.5%)고 기조 연설(nx1, 4.5%)이 포함되어 있다. 많은 기사가 미국에서 유래된(nx9일 전체 학생의 40.9%), 연구 설정 다양한 표현, 캐나다(nx4, 18.2%), 한국(n=2, 9.1%)프랑스(nx1, 4.5%), 인도(nx1, 4.5%), 네덜란드(nx1, 4.5%), 뉴질랜드(nx1, 4.5%), 오만(nx1, 4.5%), 파키스탄(nx1, 4.5%), 그리고 스페인(nx1,4를 포함했다.5%)(표 1을 보). 여기 우리는 중요 요점들 우리scoping 검토에서 파생된를 보여 준다.
Our search identified 4,299 unique titles, of which 22 full-text articles were included in our final analysis. 8–11,17–34 The majority of these articles were perspective pieces (n = 18, 81.8%), with 3 papers authored or coauthored by the same author, Steven A. Wartman (see Table 1). Other study designs include reviews (n = 2, 9.1%), a case study (n = 1, 4.5%), and a keynote speech (n = 1, 4.5%). While many articles originated from the United States (n = 9, 40.9%), there was a diverse representation of study settings, including Canada (n = 4, 18.2%), South Korea (n = 2, 9.1%), France (n = 1, 4.5%), India (n = 1, 4.5%), the Netherlands (n = 1, 4.5%), New Zealand (n = 1, 4.5%), Oman (n = 1, 4.5%), Pakistan (n = 1, 4.5%), and Spain (n = 1, 4.5%) (see Table 1). Here we present the key themes derived from our scoping review.

 

왜 의료 학생들 가르쳐야 한다? 어떻게 AI의학의 실제 영향을 줄까?
Why should medical students be taught it? How will AI affect the practice of medicine?

22개 연구 모두 [AI가 의료에 미치는 불가피한 영향]과 [AI의 적응과 통합]을 위한 의료교육의 필요성을 확인했다. 
All 22 studies identified the inevitable impact of AI on health care and the need for medical education to adapt and integrate AI. 8–11,17–34

대부분의 연구는 의료 영상 해석에서 의사보다 뛰어난 AI 시스템을 인용하면서 진단 및 예측 AI 도구가 의사 의사 의사 결정 과정에 미치는 임박한 영향에 대해 논의했다. 또한, 저자들은 현재의 AI 시스템이 매우 구체적인 패턴 기반 작업만 수행할 수 있지만, AI가 곧 의사의 의사 결정 과정에 더 광범위하게 영향을 미치도록 확장될 것이라는 데 동의했다. 예를 들어, 일부는 AI 시스템이 의사들의 최신 증거 기반 의약품을 제공하는 데 도움을 주기 위해 많은 양의 데이터를 통합하고 처리함으로써 의사들의 의사 결정 과정을 보완할 것이라고 가정했다. 대조적으로, 다른 사람들은 AI 시스템에 의한 의사들의 (거의) 완전한 교체를 가정하면서 AI의 파괴적인 잠재력을 주장했다. 19,29

Most studies discussed the imminent impact of diagnostic and predictive AI tools on physicians’ decision-making processes, 18,20,21,24,28,29,33 citing AI systems that outperform physicians in interpreting medical images. 17,19–21,24,25,31,32 Furthermore, authors agreed that while current AI systems can only perform highly specific, pattern-based tasks, 17,19–21,24 AI would soon expand to impact physician’s decision-making processes more broadly. For example, some posited that AI systems will complement physicians’ decision-making processes by amalgamating and processing large amounts of data 22,23,26,28,31–33 to aid physicians in providing the most up-to-date evidence-based medicine. 19,20,29 In contrast, others argued for AI’s disruptive potential, postulating the (almost) complete replacement of physicians by AI systems. 19,29

그 정도에 관계없이, 연구는 데이터 처리에 대한 도움을 받지 않는 의사의 어려움을 겪을 거라는 것에 동의했다. 한 가지 이유는 [지속적으로 증가하는 의학 지식] 때문이며, 다른 이유는 의사의 역할이 "정보를 가진" 사람에서 "정보를 관리하는" 사람으로 이동하기 때문이다.
Regardless of the extent, studies agreed on the difficulty of unaided physicians to data process given the ever-increasing medical knowledge 8–10,17,28–31,33 and the shift in physicians’ role as those who “have information” to those who “manage information.” 8–10,29

의학에서 AI의 통합이 임박하고 의료에 미치는 영향을 고려할 때, 저자는 의료 전문가들이 AI의 사용자이며 AI가 안전하고 적절하게 실제로 통합될 수 있도록 [AI 도구를 운전, 감독 및 평가drive, oversee, and evaluate]할 필요가 있다고 강조했다. 이에 따라, 저자들은 의과대학이 미래의 임상의에게 [AI와 함께 일하고, 관리하고, 상호작용하는 데 필요한 기술]을 가르칠 것을 주장했다. 나아가 맥코이 외 연구진과 콜라찰라마와 가그는 의과대학이 AI에 대한 학생들의 학문적 관심을 육성할 추가적인 책임이 있다고 주장했다.
Given the imminent integration of AI in medicine and its impacts on health care, authors highlighted the need for medical professionals to be users of AI and also drive, oversee, and evaluate AI tools to ensure safe and appropriate integration of AI into practice. 11,17,19,20,29,31,34 Accordingly, authors advocated for medical schools to teach future clinicians the skills needed to work with, manage, and interact with AI. 8–11,17–29,33,34 Furthermore, McCoy et al 27 and Kolachalama and Garg 11 argued that medical schools have an additional responsibility to nurture students’ academic interests in AI.

의대생들이 AI 시스템과 함께 일하기 위해 알아야 할 것은 무엇인가?
What will medical students need to know to work alongside AI systems?

많은 연구들이 학생들에게 임상 실습에서 AI에 대한 개념적 이해를 제공하는 임상 중심 커리큘럼인 UME에서 AI의 전반적인 학습 목표를 논의했다. 그러나 제한된 연구는 특정 AI 학습 목표와 커리큘럼 권장 사항을 다루었다. 마찬가지로, 미국 의학 협회와 같은 통치 기관들은 UME에 AI를 통합하라고 요구했지만, 그들은 구체적인 커리큘럼 권고안을 제공하지 않았다. 그럼에도 불구하고, 우리는 여러 논문에서 공통적인 5가지 핵심 AI 학습 목표를 제시한다(표 2 참조).
Numerous studies discussed the overall learning goals of AI in UME—a clinically focused curriculum providing students with a conceptual understanding of AI in clinical practice. 11,27–30 However, limited studies addressed specific AI learning objectives and curricular recommendations. Similarly, while governing organizations such as the American Medical Association made calls to integrate AI in UME, 35 they did not provide specific curricular recommendations. Nevertheless, we present 5 key AI learning objectives common to several papers (see Table 2).

 

AI 시스템 관련 작업 및 관리
Working with and managing AI systems.

대부분의 연구는 임상 실습에서 AI와 협력하고 관리하는 데 필요한 기술을 학생들에게 가르치기 위한 UME 커리큘럼의 필요성을 논의했습니다. 이것은 학생들의 육성을 포함했다.

  • (1) AI 접근 방식을 이해하는 데 중요한 기초 통계 개념의 이해 
  • (2) 기계 학습 및 자연어 처리와 같은 개념을 포함한 인공지능의 기본을 이해한
  • (3) AI 시스템의 응용, 유익성, 한계 및 위험에 대한 감사appreciation
  • (4) AI 시스템 운영 능력. 즉, AI 시스템이 데이터를 캡처, 처리 및 알고리즘에 적용할 수 있도록 AI에 의미 있는 인풋을 제공하는 능력  
  • (5) 임상 추론에 대한 AI의 영향에 대한 감사appreciation
  • (6) AI 결과(종종 확률)를 환자에게 의미 있게 전달하는 능력. 

Most studies discussed the need for UME curricula to teach students skills needed to work with and manage AI in clinical practice. This included fostering students’

  • (1) understanding of foundational statistical concepts critical to comprehending AI approaches 9,10,19,23,24,26,28,31,34;
  • (2) understanding AI fundamentals, 11,17–21,23,27,32–34 including concepts like machine learning and natural language processing;
  • (3) appreciation for the application, benefit, limitations, and risks of AI systems 8–11,18,19,21–23,27–30,34;
  • (4) ability to operate AI systems, that is, the ability to provide meaningful input to AI so that AI systems can capture, process, and apply the data to its algorithms 11,19,20,22,27,33;
  • (5) appreciation for the impact of AI on clinical reasoning 10,11,20–22,24,27; and
  • (6) ability to meaningfully communicate AI results (often probabilities) to patients. 8,9,27–29,34


[블랙박스 AI(우리가 이해하지 못하는 AI 시스템)]를 막기 위해서는, [ AI와 협력하고 관리하는 데 필요한 기술]이 필요했기 때문에 이는 많은 저자들에게 가치 있는 학습 목표였다. 블랙박스 AI는 두 가지 수준에서 다루어져야 한다. 

  • 1) 개발 중에, 투명한 AI 도구를 만들어냄으로써, 그리고 
  • 2) 구현 중, AI 시스템을 사용하는 의사가 AI의 의사 결정 프로세스를 이해하도록 보장한다. 

의사들은 그들이 이해하지 못하는 시스템에 의존해서 임상적 결정을 내릴 수 없다. 

This was a valuable learning objective for many authors as the skills needed to work with and manage AI were necessary to prevent black box AI20,23—an AI system we do not understand. Black box AIs must be addressed at 2 levels:

  • (1) during development, by creating AI tools that are transparent, and
  • (2) during implementation, ensuring that physicians using AI systems understand AI’s decision-making processes.

Physicians cannot rely on and make clinical decisions based on a system that they don’t understand. 20,23

AI 시스템의 윤리적 및 법적 영향.
Ethical and legal implications of AI systems.

10명의 저자는 [AI 시스템의 윤리적 및 법적 함의 이해]와 관련된 구체적인 학습 목표를 논의했다. 이것은 인공지능 시스템의 안전하고 정보에 입각한 사용을 보장하는 데 필수적인 것으로 여겨졌다. 구체적인 학습 목표는 다음과 같다.

  • (1) 학생들에게 인공지능 윤리에 접근할 수 있는 틀을 제공한다. 
  • (2) 책임 및 데이터 개인 정보 보호와 같은 중요한 AI 윤리 주제에 대한 논의를 촉진합니다. 

Ten authors discussed specific learning objectives related to understanding AI systems’ ethical and legal implications. 11,18,19,23,27,28,30,31,33,34 This was considered essential in ensuring safe and informed use of AI systems. Specific learning objectives include

  • (1) providing students with frameworks to approach AI ethics 27,28 and
  • (2) facilitating discussions of important AI ethics topics like liability and data privacy. 23,28,30,31,34

AI 시스템에 대한 비판적 평가.
Critical appraisal of AI systems.

8개의 연구는 학생들에게 [인공지능 시스템을 비판적으로 평가할 수 있는 기술]을 갖추는 것에 대해 논의했다. 여기에는 AI 도구와 주장의 과대광고 대 현실을 판단하고 평가하기 위한 비판적 평가와 증거 기반 의약에 대한 학생들의 이해를 함양하는 내용이 포함됐다.
Eight studies discussed equipping students with skills to critically appraise AI systems. 18,19,23,26–28,30,33 This included fostering students’ understanding of critical appraisal and evidence-based medicine to evaluate and assess the hype versus reality of AI tools and their claims.

질병에 대한 생물의학 지식과 병태생리학에 대한 지속적인 강조.
Continued emphasis on biomedical knowledge and pathophysiology of disease.

네 명의 저자들은 학생들의 [생물의학 지식을 계속 강조]할 필요성을 언급했지만, 세 명의 저자들은 다르게 주장했다. 린 20은 이를 적어도 새로운 AI 도구가 만들어지고 구현되는 향후 수십 년 동안 필수적인 학습 목표로 설명했다. 의사는 새로운 AI 도구가 주장하는 바를 평가하는 데 중요한 역할을 할 것이며, 이러한 새롭게 개발된 AI 시스템을 평가하기 위해서는 질병에 대한 생물의학 지식이 필수적이다.
Four authors addressed the need to continue emphasizing students’ biomedical knowledge, 20,22,25,26 in contrast to 3 authors who argued otherwise. 8,17,24 Lynn 20 explained this as an essential learning objective, at least in the next few decades where novel AI tools are created and implemented. Physicians will play a critical role in evaluating the claims made by novel AI tools, and biomedical knowledge of diseases is essential to appraise these newly developed AI systems.

전자 건강 기록으로 작업합니다.
Working with electronic health records.

전자 건강 기록(EHR)은 AI 시스템을 위한 데이터 수집의 주요 모드이다. 따라서 4명의 저자는 학생들에게 EHR 설계 원리 및 기술에 대한 지식을 제공하고, [EHR에 편향되지 않은 인풋]을 제공하기 위한 의료 커리큘럼의 필요성을 주장했다.
Electronic health records (EHRs) are the primary mode of data collection for AI systems. Thus, 4 authors 11,19,23,31 argued the need for medical curricula to provide students with knowledge of EHR design principles and skills to communicate and provide unbiased input to EHR (which will then be used by AI systems to inform its algorithms).

의대생과 미래의 임상의는 새로운 인공지능 기술에 의해 주도되는 관행 패러다임 변화로 인해 만들어진 새로운 역할을 충족시키기 위해 무엇을 알아야 할까?
What will medical students and future clinicians need to know to meet new roles created by changing practice paradigms as driven by emerging AI technologies?

22건의 연구 중 13건이 AI 기반 의료 변화에 대응해 의사가 육성해야 하는 [비 AI 역량]에 대해 논의했다. 이는 AI에 대응한 의사 역할의 자연스러운 진화이자 AI로 대체되는 것을 피하기 위한 필수 단계로 간주되었다. 구체적으로, 연구는 "독특한 인간 기술", 즉 다음과 같은 [AI 시스템으로 대체할 수 없는 기술]의 중요성을 논의했습니다.

  • (1) 자기반성과 
  • (2) 배려의 기술과 동정심, 의사소통, 그리고 공감과 같은 그것의 구성 요소들. 

Thirteen out of 22 studies discussed additional non-AI competencies physicians must foster in response to the AI-driven health care changes. 8–10,17,19,21–25,29,30,33 This was regarded as a natural evolution of physicians’ roles in response to AI and a necessary step to avoid being replaced by AI. Specifically, studies discussed the importance of “uniquely human skills,” that is, skills that cannot be replaced by AI systems such as

  • (1) self-reflection 25,30 and
  • (2) skills of caring and its components like compassion, communication, and empathy. 8–10,17,19,21–25,29,30,33

대부분의 연구는 자기반성과 보살핌의 기술에는 다음과 같은 특성이 있기 때문에 이것을 환영하는 변화로 간주했다.

  • (1) 가르칠 수 있고 측정할 수 있고 
  • (2) 근거 기반이 있다(환자 결과 및 의사 직무 만족도를 개선하는 데 효과가 있음을 입증하는 연구)

Most studies regarded this as a welcome change as self-reflection and skills of caring are

  • (1) teachable and measurable and
  • (2) evidence based—with studies demonstrating their effectiveness in improving patient outcomes and physician job satisfaction. 17

독특하게도 마스터스와 피녹 등은 AI 시스템이 이를 대체할 수 있기 때문에 공감조차도 의사의 유일한 역할이 아닐 수 있다는 점에 대해 논의했다. 그럼에도 불구하고, 두 저자들은 의사들에게 환자와 보다 효과적이고 공감적으로 소통할 수 있도록 향상된 의사소통과 상담 기술을 가르칠 필요가 있다고 강조했다. 
Uniquely, Masters 19 and Pinnock et al 21 discussed how even empathy may not be the sole role of physicians, as AI systems could replace it. Nevertheless, both authors emphasized the need for physicians to be taught improved communication and counseling skills to communicate more effectively and empathically with patients. 19,21

AI 커리큘럼은 어떻게 전달되어야 하는가?
How should an AI curriculum be delivered?

세 가지 연구가 AI 커리큘럼의 전달에 대해 논의했습니다. 그러나, UME에서 AI 커리큘럼을 가장 잘 제공하는 방법에 대한 명확한 합의가 없었다. 제공 권장 사항은 광범위하고(즉, 학습 목표에 특정하지 않고(Mcoy 등을 제외) 특정 교육 이론에 기초하지 않았다. 표 3에는 AI 시범 교육과정이 있는 의과대학 목록이 포함되어 있다.
Three studies 11,23,27 discussed the delivery of AI curricula. However, there was no clear consensus on how best to deliver an AI curriculum in UME. The delivery recommendations were broad (i.e., not specific to learning objectives—except for McCoy et al 27) and not based on a particular education theory. Table 3 includes a list of medical schools with pilot AI curriculum.

 

그럼에도 불구하고 3개 연구 모두 체험학습의 중요성을 강조했는데, 즉 학생들이 AI 도구를 이용해 직접 작업할 수 있는 기회를 제공하는 것이다. 22개 연구 중 2개 연구 11,27개는 소그룹 세션과 강의를 AI 기초를 가르치는 수단으로 사용하는 것을 논의했다. 맥코이 외 연구진과 파란제이 외 연구진은 각각 학생들에게 AI 기초를 가르치고 AI 윤리에 대한 이해를 함양하기 위한 e-모듈과 대화형 사례 기반 워크숍의 유용성을 강조했다.
Nevertheless, all 3 studies 11,23,27 highlighted the importance of experiential learning, that is, providing opportunities for students to work directly with AI tools. Two out of 22 studies 11,27 discussed using small-group sessions and lectures as a means to teach AI fundamentals. McCoy et al 27 and Paranjape et al 23 highlighted the utility of e-modules and interactive case-based workshops to teach students AI fundamentals and cultivate their understanding of AI ethics, respectively.

두 연구는 정보기술(예: 증거 기반 의학)에 초점을 맞춘 기존 커리큘럼에 AI 콘텐츠를 포함할 가능성에 대해 논의했고 학제 간 데이터 과학자와 같은 AI 커리큘럼의 잠재적 강사에 대해 논의했다. 
Two studies 11,23 discussed the possibility of embedding AI content into preexisting curricula focused on information technology (e.g., evidence-based medicine) and discussed potential instructors for AI curricula, such as interdisciplinary data scientists. 11,23

UME에 AI 커리큘럼을 도입하는 것과 관련된 어려움은 무엇인가?
What are the challenges associated with introducing an AI curriculum into UME?

6개의 연구는 AI 커리큘럼 도입과 관련된 과제를 강조했다. UME에서 AI 커리큘럼을 도입하는 데 장애물로는 [교수진의 저항, AI 인증 및 면허(예: USMLE) 요구 사항 부족, 제한된 커리큘럼 시간]을 논의하였다. 추가 장애에는 AI 핵심 역량의 부족, AI에 대한 교수 전문 지식의 부족, AI가 의료 제공에 어떤 영향을 미칠지에 대한 증거의 부족이 포함된다. 
Six studies 8–11,18,23 highlighted the challenges associated with introducing AI curricula. Studies discussed

  • faculty resistance,
  • lack of AI accreditation and licensing (e.g., USMLE) requirements, and
  • limited curricular hours

...as barriers to introducing AI curricula in UME. 8–11,23 Additional barriers include

  • lack of AI core competencies18 
  • lack of faculty expertise on AI, 11,23 and
  • lack of evidence regarding how AI will impact health care delivery. 23

문헌에 대한 방법론적 논평
Methodological comments on the literature

이번 검토에 포함된 22개 조항은 모두 의대생들이 AI를 의학에 접목할 수 있도록 대비할 필요성을 확인하고 AI 교육과정에 대한 권고안을 제시했다. 공통된 주제가 등장했지만, 권고사항 간의 불일치가 지적되었다. 예를 들어,

  • 존스턴, 리 외 연구진, 워트먼과 같은 저자들은 AI가 의료 전문가로서 임상의사를 대체할 것이라고 제안했다. 그런 만큼 의과대학은 기초과학을 강조하고, 늘어난 교육시간을 의사 소통 능력 등 의학의 '비분석적, 인문학적' 측면에 할애해야 한다고 주장했다.
  • 대조적으로, de Leon, Lynn, Srivastava 및 Waghmare와 같은 작가와 Park 등은 AI 도구에 대한 적절한 감독을 수행하고 유지하기 위해 기초 과학과 병리 생리학의 지속적인 우선 순위를 주장했습니다.

All 22 articles included in this review identified a need to prepare medical students for the integration of AI into medicine and put forth recommendations for an AI curriculum. While common themes emerged, inconsistencies between recommendations were noted. For example,

  • authors such as Johnston, 17 Li et al, 24 and Wartman 8 suggested that AI will replace clinicians as medical experts. As such, they argued that medical schools should deemphasize basic sciences and dedicate increased curricular hours for the “nonanalytical, humanistic” aspects of medicine, such as communication skills.
  • In contrast, authors such as de Leon, 25 Lynn, 20 Srivastava and Waghmare, 22 and Park et al 26 argued for continued prioritization of basic sciences and pathophysiology to work with and maintain appropriate oversight of AI tools.

22개 논문이 모두 수많은 교육과정 권고안을 제시한 반면 AI 교육과정 전달에 대한 논의는 22개 논문 중 3개 논문에 그쳤고, 평가방법에 대한 논의는 22개 논문 중 1개 논문에 불과했으며 학습성과에 대한 논의 기사는 없었다.
While all 22 articles presented numerous curricular recommendations, only 3 out of 22 articles discussed delivery of an AI curriculum, 11,23,27 1 out of 22 articles discussed methods of evaluation, 22 and no articles discussed learning outcomes.

마지막으로, 우리는 UME에서 AI 훈련에 대한 사용 가능한 문헌에서 연구 유형의 빈약한 표현에 주목했다. 22개의 기사 중 18개는 perspective였고, 22개의 기사 중 13개는 1~2명의 저자를 가지고 있었다. 22개 기사 중 4개가 서로 다른 의과대학에서 시행되는 AI 시범 교육과정을 설명하거나 참조하고 있지만(표 3 참조), 우리가 아는 한 GREET 체크리스트와 같은 검증된 보고 지침을 사용하여 UME에서 AI에 대한 교육 개입을 시범, 평가 및 보고한 연구는 없다. 마찬가지로, MedEdPortal에서는 UME에서 AI를 위한 완성된 교수 또는 학습 모듈을 찾을 수 없었다.
Finally, we noted a poor representation of study types in the available literature on AI training in UME. Eighteen out of 22 articles were perspective pieces, 8–11,17,19–26,28,29,32–34 and 13 out of 22 articles had 1 to 2 authors. 8–11,17–20,22,25,29,32,33 While 4 out of 22 articles 17,23,26,27 describe or reference pilot AI curricula implemented in different medical schools (see Table 3), to the best of our knowledge, there are no studies that have piloted, evaluated, and reported an educational intervention for AI in UME using validated reporting guidelines such as the GREET checklist. 15 Likewise, no completed teaching or learning modules for AI in UME were found on MedEdPortal.

논의
Discussion

이 범위 검토는 UME에서 AI 훈련과 관련하여 현재 이용 가능한 문헌을 요약하여 주요 주제를 매핑하고 현재 관행과 미래 연구에 정보를 제공할 수 있는 문헌의 격차를 강조한다.
This scoping review summarizes the currently available literature regarding AI training in UME, mapping key themes and highlighting gaps in the literature that can inform current practice and future research.

포함된 모든 기사는 2017~2020년 발간돼 의학 교육계의 AI에 대한 관심이 싹트고 있음을 반영했다. 포함된 모든 연구는 의료 제공에 AI가 미치는 영향을 포함하여 UME에 AI 커리큘럼을 도입하는 근거를 논의했습니다. 마찬가지로 모든 연구에는 AI 커리큘럼 내용에 대한 제안이 포함되었으며, 이를 통해 의학교육자들이 AI 커리큘럼을 개발할 때 고려해야 할 5가지 핵심 AI 테마를 도출하였다(표 2 참조). 그러나 연구 전반에 걸쳐 상당한 이질성이 있었고 학생들이 UME 기간 동안 어떤 AI 기술을 배워야 하는지에 대한 공감대가 부족했다. 각 기사는 AI 학습 영역의 하나 이상의 요소를 강조했으며, 5가지 주제를 모두 논의한 단일 연구는 없었다.
All included articles were published between 2017 and 2020, reflecting the budding interest in AI among the medical education community. All included studies discussed their rationale for introducing AI curricula in UME, including the impact of AI in health care delivery. Likewise, all studies included suggestions for AI curricular content, 8–11,17–34 and from it, we derived 5 key AI themes that medical educators should consider when developing AI curricula (see Table 2). However, there was considerable heterogeneity across studies and a lack of consensus regarding which AI skills students should learn during UME. Each article emphasized one or more elements of AI learning domains, with no single study discussing all 5 themes.

비슷하게, 22개의 연구 중 3개는 AI 커리큘럼 전달에 대해 논의했다. 다양한 AI 기술 세트에 맞춰 강의, e-모듈, 소그룹 학습 등 다양한 교육학적 접근법이 제시됐다. 모든 저자의 추천은 경험적 학습으로, 학생들에게 AI 도구로 직접 작업할 수 있는 기회를 제공했다. 그러나, 그들의 AI 전달 권장 사항을 알려주는 교육 이론이나 프레임워크를 명시적으로 논의한 연구는 없었고, 구현된 프로그램의 사례 연구를 포함하는 논문은 거의 없었다. 시범 프로그램의 몇 안 되는 사례 연구 중, 학생 만족도, 지식 습득 및 기술 이전과 같은 AI 커리큘럼의 결과에 대한 보고는 없었다. 평가의 부족과 AI 커리큘럼 전달 권장 사항 간의 이질성 때문에, 우리는 AI 커리큘럼을 가장 잘 전달하는 방법에 대한 합의를 추론할 수 없었다.
Similarly, 3 out of 22 of studies discussed AI curricula delivery. 11,23,27 Various pedagogical approaches were suggested, including lectures, e-modules, and small-group learning, in line with the diverse AI skill sets. Common to all authors’ recommendations was experiential learning—providing students with the opportunity to work directly with AI tools. However, none of the studies explicitly discussed educational theories or frameworks that informed their AI delivery recommendations, and very few papers included case studies of implemented programs. Among the few case studies of piloted programs, none reported on outcomes of their AI curriculum, such as student satisfaction, knowledge acquisition, and skill transfer. Due to the lack of evaluations and the heterogeneity among AI curriculum delivery recommendations, we could not extrapolate a consensus regarding how best to deliver AI curricula.

AI 커리큘럼 콘텐츠와 전달에 대한 합의 부족에는 여러 가지 요인이 작용했을 수 있다. 

  • (1) 이 범위 검토에 포함된 연구에서 확인된 장애요인으로 인해 AI 통합 노력이 부족 
  • (2) AI는 지난 10년 동안 괄목할만한 발전을 이룬 비교적 새로운 분야이다. —의료 교육자들은 AI가 의료 서비스 제공과 그에 따른 의료 교육에 어떤 영향을 미치는지 감사할 시간이 충분하지 않을 수 있습니다. 
  • (3) AI 커리큘럼 통합의 복잡성 —AI 통합 의료 분야에서 일하는 것은 간호 기술과 같은 비 AI 영역의 개선과 함께 AI 고유의 역량을 포함하는 복잡한 기술 세트를 필요로 한다. (즉, 공감과 소통).

Numerous factors may have contributed to the lack of consensus regarding AI curricular content and delivery:

  • (1) lack of AI integration efforts due to the barriers identified from studies included in this scoping review, 8–11,18,23 
  • (2) AI is a relatively new field with remarkable advances made within the last 10 years—medical educators may not simply had enough time to appreciate how AI will impact health care delivery and thus medical education, and
  • (3) the complexity of integrating AI curricula—working in AI-integrated health care requires complex skill sets that include AI-specific competencies along with improvements in non-AI domains such as skills of caring (i.e., empathy and communication).

따라서, 문헌에서 강조된 격차를 고려하여, 우리는 의학 교육자들이 UME에서 AI 커리큘럼을 제공하기 위해 취해야 할 세 가지 다음 단계를 제안한다.
Thus, in light of the highlighted gaps in the literature, we propose 3 next steps that medical educators should take in their efforts to deliver AI curricula in UME.

1. AI 교육을 위한 표준화된 핵심 역량 세트 생성
1. Create a standardized set of core competencies for AI training

[핵심 역량]은 개인이 적절한 표준으로 일련의 작업을 수행할 수 있도록 하는 지식 및 기술과 같은 속성들의 조합입니다. 따라서, 명목 집단 기술 또는 델파이 조사와 같은 합의 그룹 방법을 사용하여 개발된 일련의 역량은 다음과 같은 공유 언어를 제공할 것이다.

  • (1) 문학의 모순을 다루고, 
  • (2) AI 교육 커리큘럼 개발을 위한 프레임워크를 제공합니다. 
  • (3) 인증 및 면허 요건에 AI 기술을 포함시키기 위해 캐나다 의학 협회와 같은 조직에 옹호 노력을 알린다.

Core competencies are a combination of attributes like knowledge and skills that enable an individual to perform a set of tasks to an appropriate standard. 36,37 Thus, a set of competencies developed using consensus-group methods such as nominal group technique or Delphi surveys 38 will offer a shared language that

  • (1) addresses the inconsistency in literature,
  • (2) provides a framework for developing AI educational curricula, and
  • (3) inform advocacy efforts to organizations such as the Canadian Medical Association for the inclusion of AI skills in accreditation and licensing requirements.

2. 피드백에 대응하여 커리큘럼을 개선하고 개선하기 위해 목적적이고 계획적인 평가를 통해 유연한 증거 및 이론 정보를 가진 AI 커리큘럼을 개발하고 구현합니다.
2. Develop and implement flexible, evidence- and theory-informed AI curriculum with purposeful and planned evaluations to refine and improve the curriculum in response to feedback

이 범위 검토는 UME에서 AI 커리큘럼의 전달에 관한 문헌의 부족을 강조하지만, 모범 사례에 관한 방대한 의학교육 문헌은 증거 및 이론 정보 AI 커리큘럼의 개발을 안내할 수 있다. 한 가지 제안은 스타이너트 등이 알려주는 AI 커리큘럼 전달이다.

  • (1) 다양한 인공지능 기술을 가르치기 위한 다양한 교육 방법 (예: AI 윤리에 관한 미묘한 대화를 위한 토론 기반 튜토리얼 대 AI 기초를 가르치는 강의/모듈) 및 
  • (2) 경험적 학습—학생에게 AI 도구를 사용하여 작업하고 AI 기술에 대한 피드백을 받을 수 있는 기회를 제공합니다. 

궁극적으로, 다른 기초 및 준비 지식 영역과 마찬가지로, AI 훈련은 프로그램, 과정 및 세션 수준에서 효과적인 통합이 필요하다. AI를 임상 추론 및 기타 핵심 활동에 대한 교육과 적절히 통합하면 이러한 교육의 효율성을 높이고 과밀화를 제한하거나 현재 UGME 커리큘럼을 "팽창"시킬 수 있다. 
This scoping review highlights the paucity of literature regarding the delivery of AI curriculum in UME. However, the vast medical education literature regarding best practices 39–41 can guide the development of evidence- and theory-informed AI curriculum. One suggestion is an AI curricular delivery informed by Steinert et al, 39 comprising

  • (1) diverse education methods to teach diverse AI skills sets (e.g., lecture/modules to teach AI fundamentals versus discussion-based tutorials for nuanced conversations regarding AI ethics) and
  • (2) experiential learning—providing students with the opportunity to work with AI tools and receive feedback regarding their AI skills.

Ultimately, like other foundational and preparatory knowledge domains, AI training needs effective integration at the program, course, and session levels. 42 Integration of AI appropriately with teaching on clinical reasoning and other core activities may increase the efficacy of such teaching and limit overcrowding or “bloating” current UGME curricula. 43

게다가, 우리는 AI 커리큘럼을 만드는 핵심이 [완벽한 커리큘럼을 만드는 것]에 있는 것은 아니라고 가정한다. 대신, 학생과 교직원의 피드백에 반응하여 [커리큘럼에 대한 반복적 개선]을 촉진하기 위해 목적적이고 계획된 평가를 가진 유연하고 증거에 근거한 커리큘럼을 개발하는 것이다. AI 교육과정의 평가에는 학생의 태도 변화, AI 지식의 객관적 측정, 향후 훈련에서 새로운 AI 관련 기술 습득과 같은 종단적 결과 등이 포함될 수 있다.
Furthermore, we postulate that the key to creating an AI curriculum is not about creating the perfect curriculum. Instead, it is about developing a flexible and evidence-informed curriculum with purposeful and planned evaluations to facilitate iterative refinements to the curriculum in response to student and faculty feedback. Evaluations of AI curriculum can include self-reported changes in students’ attitudes, objective measures of AI knowledge, and longitudinal outcomes such as acquisition of new AI relevant skills in future training.

3. AI 및 UME에 대한 문헌의 보급, 기여 및 확장을 위해 AI 커리큘럼 콘텐츠 및 전달에 관한 연구 결과를 발표하려는 노력 증가
3. Increased effort to publish findings regarding AI curricular content and delivery to disseminate, contribute to, and extend the literature on AI and UME

우리의 범위 검토는 커리큘럼 내용, 전달, 특히 UME의 AI 훈련 평가에 관한 문헌의 부족을 확인했다. 우리는 의학 교육자들 사이에서 UME의 AI 커리큘럼 개발을 안내하고 발전시키기 위해 사용 가능한 연구 결과를 공유하고 발표하기 위한 연구와 헌신을 강화할 것을 지지한다.
Our scoping review identified a lack of literature regarding curricular content, delivery, and in particular, the evaluation of AI training in UME. We advocate for increased research and commitment among medical educators to share and publish available findings to guide and advance AI curricular development in UME.

제한 사항
Limitations

우리의 발견은 그것의 한계라는 맥락에서 해석되어야 한다. 영어로 작성된 연구만 포함하고 회색문학, 즉 미발표 문학이나 정부 보고서와 같은 비상업적 플랫폼에서 출판된 문학은 조사하지 않았다. 따라서, 우리는 우리의 검토와 관련된 추가 연구를 놓쳤을 수 있다. 또한, 우리의 검토는 UME에만 초점을 맞췄습니다. 따라서 이러한 설정이 AI 훈련을 위한 귀중한 학습 환경을 나타낼 수 있지만, 대학원이나 지속적인 의학 교육에 대해서는 논의할 수 없었습니다. 마지막으로, 우리의 주제 분석에 포함된 많은 기사들이 미국에 기반을 두고 있다는 점에 주목해야 한다. 확인된 주제와 통찰력은 다른 나라의 의료 훈련 프로그램에 적합해야 할 것이다.
Our findings should be interpreted in the context of its limitations. We only included studies written in English and did not examine gray literature, that is, unpublished literature or literature published in noncommercial platforms such as government reports. Thus, we may have missed additional studies relevant to our review. Furthermore, our review only focused on UME. As such, we could not discuss postgraduate or continuing medical education, although these settings may represent valuable learning environments for AI training. Finally, it should be noted that the many articles included in our thematic analysis are based in the United States. Identified themes and insights will need to be adapted for medical training programs in other countries.

결론들
Conclusions

AI는 의학에 중요하고 광범위한 영향을 미칠 수 있는 잠재력을 가지고 있다. 의학 교육은 학습자들이 이러한 잠재적인 변화에 대비해야 한다. UME는 AI 훈련과 의학에서 잠재적으로 독특한 역할을 한다.

  • (1) 의료 교육에 AI를 [조기]에 노출하고 통합할 수 있습니다. 
  • (2) 가장 [광범위]한 의학 학습자 집단에 도달할 수 있는 능력을 가지고 있다. 

이 범위 검토는 AI 커리큘럼 내용과 전달에 대한 중요한 고려 사항을 확인했지만, 문헌 내 유의미한 이질성과 낮은 합의도 확인되었다. 이 증거를 평가하고 조정하여 의학 학습자가 다가올 의학에서의 인공지능의 통합에 적절하게 대비하기 위해 추가 연구가 필요할 것이다.

AI has the potential to have significant and wide-sweeping impacts on medicine. Medical education must prepare learners for these potential changes. UME has a potentially unique role in AI training and medicine as it (1) allows for early exposure and integration of AI into medical education and (2) has the capability to reach the broadest medical learner population. While this scoping review identified important considerations for AI curricular content and delivery, significant heterogeneity and poor consensus within the literature was also identified. Further research will be needed to appraise and reconcile this evidence to adequately prepare medical learners for the forthcoming integration of AI in medicine.

 

 


 

Acad Med. 2021 Nov 1;96(11S):S62-S70. doi: 10.1097/ACM.0000000000004291.

Artificial Intelligence in Undergraduate Medical Education: A Scoping Review

Affiliations collapse

Affiliations

1J. Lee is a third-year medical student, University of Toronto, Temerty Faculty of Medicine, Toronto, Ontario, Canada.

2A.S. Wu is a third-year medical student, University of Toronto, Temerty Faculty of Medicine, Toronto, Ontario, Canada.

3D. Li is a second-year medical student, University of Ottawa, Faculty of Medicine, Ottawa, Ontario, Canada.

4K. Kulasegaram is associate professor, Department of Family and Community Medicine, University of Toronto and The Wilson Centre, University Health Network, Toronto, Ontario, Canada.

PMID: 34348374

DOI: 10.1097/ACM.0000000000004291

Abstract

Purpose: Artificial intelligence (AI) is a rapidly growing phenomenon poised to instigate large-scale changes in medicine. However, medical education has not kept pace with the rapid advancements of AI. Despite several calls to action, the adoption of teaching on AI in undergraduate medical education (UME) has been limited. This scoping review aims to identify gaps and key themes in the peer-reviewed literature on AI training in UME.

Method: The scoping review was informed by Arksey and O'Malley's methodology. Seven electronic databases including MEDLINE and EMBASE were searched for articles discussing the inclusion of AI in UME between January 2000 and July 2020. A total of 4,299 articles were independently screened by 3 co-investigators and 22 full-text articles were included. Data were extracted using a standardized checklist. Themes were identified using iterative thematic analysis.

Results: The literature addressed: (1) a need for an AI curriculum in UME, (2) recommendations for AI curricular content including machine learning literacy and AI ethics, (3) suggestions for curriculum delivery, (4) an emphasis on cultivating "uniquely human skills" such as empathy in response to AI-driven changes, and (5) challenges with introducing an AI curriculum in UME. However, there was considerable heterogeneity and poor consensus across studies regarding AI curricular content and delivery.

Conclusions: Despite the large volume of literature, there is little consensus on what and how to teach AI in UME. Further research is needed to address these discrepancies and create a standardized framework of competencies that can facilitate greater adoption and implementation of a standardized AI curriculum in UME.

현대의학은 식민지적 부산물이다: 의학교육연구의 탈식민지화 소개(Acad Med, 2021)
Modern Medicine Is a Colonial Artifact: Introducing Decoloniality to Medical Education Research
Thirusha Naidu, PhD, MClinPsych

 

 

카스마
Chasm

내 말 외에는 아무 말도 할 수 없어
I can speak no words but my own,
나는 내 목소리 외에는 아무 목소리도 낼 수 없다.
I can speak with no voice but my own
내 혀는 너의 귀에는 낯선 사람이다.
My tongue is a stranger to your ears
우리의 마음은 서로에게 닿는다.
Our minds reach towards each other
역사의 바다를 넘어
Over oceans of history
하지만 넌 내 마음의 의미를 절대 모를 거야.
But you will never know the meaning of my heart
영원히 너와 나는 수천명의 죽음을 맞이할 것이다.
In forever you and I will die a thousand deaths
우리 물질의 원자들은 끝없이 다시 결합할 것이다.
The atoms of our material will re-join endlessly
하지만 오늘은 안돼, 지금은 안돼.
But not today, not now
여기서 우리는 결코 삶의 동요를 공유하지 않을 것이다.
Here we will never share the sway of life.

—T. 나이두
—T. Naidu

의학 교육과 연구에서 사회 정의, 형평성, 다양성, 반인종주의로 향하는 현대의 변화는 적절한 이론적, 철학적 렌즈에 대한 탐구를 촉발시켰다. 현대 의학은 식민주의의 유물로, 현재 지배적인 구조와 행위자를 통해 강력한 인식론적 기반을 보존하고 재생하기 위해 조직된다. 의학에서의 [인식론적 혁명]은 [서양의 지식에 기반을 둔 현대 의학의 기초와 지식 생산]을 [의심하고 재상상]할 수 있는 학문과 교육에서 시작되어야 한다. 
The contemporary shift toward social justice, equity, diversity, and antiracism in medical education and research has prompted a search for appropriate theoretical and philosophical lenses. Modern medicine is an artifact of coloniality, organized to preserve and regenerate powerful epistemological foundations through currently dominant structures and actors. The epistemic revolution in medicine must begin with scholarship and education where modern medicine’s basis in Western knowledge and knowledge production can be questioned and reimagined.

페미니스트 이론과 비판적 인종 이론과 같은 [비판 이론]은 의학 교육에서 언어, 종교, 문화, 성별, 성별과 관련된 문제들을 설명하기 위해 대용물로 사용되어 왔다. 이러한 이론들은 의학을 실천하고 가르치고 연구하는 다양한 세계적 맥락에서 마주치는 [교차, 세대 간, 사회역사적 불평등]을 설명하지 않는다. 더욱이, 이러한 이론들은 억압적인 맥락이 어떻게 정체성, 자기 이미지, 관점을 형성하고 사람들이 그들 자신의 억압에 공모하도록 강요하는지 설명하지 않는다. 한 가지 유망한 접근법은 탈식민지화이다
Critical theories such as feminist theories 1 and critical race theory 2,3 have been used as a proxy to explain issues that pertain to language, religion, culture, gender, and sexuality in medical education. These theories do not account for intersectional, intergenerational, and sociohistorical inequities encountered in the multiplicity of global contexts in which medicine is practiced, taught, and researched. Moreover, these theories do not explain how oppressive contexts shape identities, self-image, and perspectives and coerce people to be complicit in their own oppression. One promising approach is the decoloniality.

박스 1에서 나는 탈식민지성의 몇 가지 핵심 개념에 대한 정의를 제공한다. 그런 다음 이러한 핵심 개념의 맥락을 제공하고 독자들이 고려할 수 있도록 탈식민지 관행에 대한 조치를 제안한다. 이러한 개념은 Association of American Medical Colleges Learn Serve Lead 2021 RIME에서 확장될 것이다.
In Box 1, I provide definitions of some key concepts in decoloniality. I then provide some context of these key concepts and suggest actions toward decolonial practice for readers to consider. These concepts will be expanded upon in the Association of American Medical Colleges Learn Serve Lead 2021 RIME Address.


Box 1 개념 개요
Box 1 Overview of Concepts


식민지화: 원주민의 몸과 마음을 억압하고, 토지, 노동, 자원을 유용하며, 식민자의 언어와 지식 및 교육 시스템을 강제하는 역사적 과정
Colonization: the historical processes of suppressing Indigenous peoples’ bodies, and minds, appropriating land, labor, and resources, and enforcing colonizers’ languages and knowledge and educational systems.

식민주의: 한 국가의 주권이 강대국을 제국으로 만드는 다른 국가의 힘에 의존하는 정치적, 경제적 관계.
Colonialism:
 a political and economic relation where the sovereignty of a nation rests on the power of another making the powerful nation an empire.

[식민성Coloniality]은 식민주의에서 생겨난 오랜 권력의 패턴이지만, 식민지 정권의 한계와 존재를 넘어 [문화, 노동, 관계, 지식 생산 등]을 규정한다. 식민성은 식민주의보다 오래 남아 존재하며, 책, 학문적 수행의 기준, 문화적 패턴, "상식", 자아 이미지, 자아에 대한 열망, 그리고 현대 경험의 다른 측면들에 보존되어 있다. 
Coloniality
 is the long-standing patterns of power that emerged from colonialism, but that define culture, labor, relationships, and knowledge production beyond the limits and existence of colonial administrations. Coloniality outlives colonialism and is preserved in books, the criteria for academic performance, cultural patterns, “common sense,” self-image, aspirations of self, and other aspects of modern experience. 5

[식민지적 권력 매트릭스]는 성차별주의, 가부장제, 자본주의 시장, 인종주의, 권위, 주관성으로 구성되어 있으며, 현대 세계 사회를 영구적으로 갈등하고 불안정한 상태에 있게 한다.
The colonial matrix of power
29 composed of sexism, patriarchy, the capitalist market, racism, authority, and subjectivity keeps modern global societies in a permanently conflictual and destabilized state.

[권력의 식민성]지식을 형성하며, [사람이 되는 것]의 의미를 결정한다. 이는 식민지배자colonizer들이 어떤 사람들과 집단을 비인간성의 영역에 할당하기 위해 휘두른다.
Coloniality of power
 shapes knowledge and determines what it means to be a person and is wielded by colonizers to assign some people and groups to the zone of subhumanity. 5,29

[탈식민지화]는 사고 방식, 언어, 삶의 방식, 그리고 세상에 존재하는 것을 재구성하기 위해 [지식의 전체 구조와의 연결을 끊어내는 것delinking]을 포함한다. [탈식민지화]는 원주민 지식 체계, 방법, 언어의 재구축, 재구조화, 재중심화를 전면에 두며, 반대로 [식민주의에 의해 야기되고 식민지에 의해 유지된 적자deficit]를 바로잡는 것을 전제로 한다.
Decoloniality
 involves delinking from the overall structure of knowledge to reconstitute ways of thinking, languages, ways of life, and being in the world. Decoloniality foregrounds reclaiming, reframing, and recentering of Indigenous knowledge systems, methods, and languages and correcting deficits created by colonialism and maintained by coloniality. 6,7,30


 

탈식민주의는 의학교육에서 덜 친숙한 접근법으로서, 식민지화의 역사적 영향에 저항하는 젠더, 인종, 이성애적 가부장제(동성애적, 남성적, 온정주의적 사고방식, 상황, 정체성 및 관계를 보고, 보고, 행동하고, 통제하는 방법) 대한 사회역사적, 지정학적, 경제적 관점을 중심으로 이론과 토론을 포함한다. 탈식민주의는 [억압]을 [교차, 다차원, 다체계, 제도적, 역사적, 자기 영속적]인 것으로 본다. 다음이 관찰되었다.

Decoloniality, a less familiar approach in medical education, encompasses theory and debate around sociohistorical, geopolitical, and economic perspectives on gender, race, and heteropaternalism (heterosexual, male, paternalistic ways of thinking, viewing, acting, and controlling contexts, identities, and relationships) resisting the historical effects of colonialization. Decoloniality sees oppression as intersectional, multidimensional, multisystemic, institutional, historical, and self-perpetuating. It has been observed that

… 평화와 정의를 표방하고 있는 한 세기 이상 된 서양의 의료 기관은, 그 성공이 식민주의의 야만적인 유산에 기초했다는 아픈 진실에 직면해야 한다. 
… any western medical institution more than a century old and which claims to stand for peace and justice has to confront a painful truth—that its success was built on the savage legacy of colonialism. 4

 

식민지 사람들은 [백인, 남성으로 대변되는 권력의 식민성]이 규정하는 인격적 이상을 이루기 위해 (언어, 민족성, 조상 지식, 자신의 몸에 대한 자부심 등) [자신의 일부분을 억압]할 수밖에 없다. [살아남기 위해 자아의 일부를 억압하는 영향]은 소외된 사람들에게 익숙한 희생이다. 식민지의 성공은 자신의 인간성을 부정하고, 유럽계 미국인의 우월성에 굴복하고, 그것을 재생산하도록 강요된 식민화된 민족에 의한 [무력한 재생산]에 달려 있다. 근대성Modernity이란, 식민주의의 현대적 반복으로서, 무엇이 [인간, 공간, 시간, 구조, 문화, 주관성, 객관성, 그리고 방법론]으로 간주되는지를 정의한다. 최근 캐나다에서 집단 묘지에 대한 보도가 나오면서 1800년대 이후 원주민 자녀들이 동화 정책의 일환으로 가족과 떨어져 거주 학교에 다닐 수밖에 없었다는 사실이 다시금 주목을 받고 있다. 이 잔인한 행동의 영향은 생존자들과 그들의 후손들 사이에 울려 퍼진다. 그러한 예는 식민지화가 정착된 세계 어디에서나 확산되며 이 논평의 범위를 벗어난다. 여기서 목적은 현대사회에서의 식민지화의 지속적인 영향에 대해 독자들을 양심시키고 비식민지화를 회복적 접근과 연구 실천으로 도입하는 것이다.
Colonized people are forced to suppress parts of themselves such as language, ethnicity, ancestral knowledge, and pride in their bodies to attain the ideal of personhood defined by the coloniality of power as White and male. The impact of suppressing parts of the self to survive is a familiar sacrifice to marginalized people. The success of coloniality hinges on its effortless reproduction, by colonized peoples who are forced to deny their humanity and submit to and reproduce Euro-American superiority. 5,6 Modernity, the contemporary iteration of coloniality, defines what is considered human, space, time, structure, culture, subjectivity, objectivity, and methodology reinforcing the colonial foundations that perpetuate the superiority of some versions of being human over others. 6,7 Recent reports of mass graves surfaced in Canada drawing attention again to the fact that since the 1800s, Indigenous children were forced to attend residential schools away from their families as part of an assimilation policy. 8 The effect of this brutal action reverberates among survivors and their descendants. Such examples proliferate wherever in world colonization took hold and are beyond the scope of this Commentary. Here, the aim is to conscientize readers to the enduring effects of colonization in the modern world and introduce decoloniality as a restorative approach and practice in research.

[탈식민지적 실천Decolonial praxis]은 반란, 위반, 식민지에 저항하는 것에 관한 것이다. 우리가 식민지를 영속시키기 위해 자기 검열에 세뇌되어 있기 때문에 그것은 기만적이고 은밀하게 느껴질 수 있다. 탈식민지화는 [인식, 숙의, 행동]의 세 가지 요소를 포함한다.

Decolonial praxis is about rebellion, transgression, and resisting coloniality. It can feel devious and surreptitious because we are indoctrinated to self-censor in the interests of perpetuating coloniality. Decoloniality in practice involves 3 elements: awareness, deliberation, and action.

[인식Awareness]은 자신의 정체성, 역사 및 맥락을 참조하여, [권력의 식민지적 매트릭스]에서 자기가 어디에 놓여 있는지 깨닫는 것을 말한다. 소외된 사람들은 [억압자의 시각]과 [자신의 시각]으로 세상을 바라볼 수밖에 없다. 흑인 여성이라고 밝힌 아야나 랭스턴은 의학교육에서 이러한 "이중 의식"을 되새기며 이렇게 말한다.
Awareness refers to positionality or realizing where you are placed in the colonial matrix of power with reference to your identity, history, and context. Marginalized persons are compelled to view the world from both the oppressors’ perspective and their own. Reflecting on this “double consciousness” 9 in her medical education, Ayana Langston, who identifies as a Black woman, says,

인체의 생리를 알면 알수록, 흑인의 몸에 대한 비하에 맞설 수밖에 없었다. 내가 진단, 치료, 의료 제공의 알고리즘을 더 잘 배울수록, 이 알고리즘은 결코 [나처럼 보이는 환]자를 치료하거나, 낫게 하거나, 구하거나, 보호하려는 것이 아니라는 것이 더욱 분명해졌다. 
the more I learned about the physiology of the human body, the more I was forced to confront the degradation of the Black body. The better I became at learning the algorithms for diagnosis, treatment, and delivery of health care, the more apparent it was that these algorithms were never meant to cure, heal, save, or protect any patient who looked like me. 10

[특권의 개인적 역사와 정체성]은 타인을 억압해온 [식민지적 권력 매트릭스]로부터 어떻게 이익을 얻었는지를 인식하는 것을 요구할 수 있다. 
A personal history and identity of privilege may require recognizing how one has benefitted from the colonial matrix of power that has oppressed others. 11

저는 매일같이, 제 의학 지식은 저와 닮은 사람들이 발견한 것에 기초하고 있다는 것을 떠올립니다. 그리고 가장 고통스러운 발견들 중 일부가 유색인종을 대상으로 한 비인간적이고 비협조적인 실험을 통해 이루어졌다는 것을 떠올리지 않을 수 없습니다.
I am reminded daily that my medical knowledge is based on the discoveries made by people who looked like me without being reminded that some of the most painful discoveries were made through inhumane and non-consensual experimentation on people of color. 11

[숙의Deliberation]는 [지배적인 구조의 해체를 이론화]하기 위해 [개인적인 역사를 성찰]하는 것을 포함한다. 탈식민지주의 페미니스트 학자 Gloria Anzaldua는 이것을 "독사 속으로 들어가는 것"이라고 부르며, "경계적 사고border thinking"에 참여하기 위해 우리 내부의 침묵되고 지워진 역사를 다르게 듣는다. 현대 서구 문화는 [합리성]과 [허구fiction]을 구별짓는 반면, 전통과 토착 문화는 [꿈과 상상력을 중시]한다. 탈식민지적 관점은 식민주의가 현대 지식 생산에서 배제된 관점을 통합한 권력의 식민지적 매트릭스 밖에서 이론과 인식론을 적용하는 것을 지지한다. [경계적 사고]는 식민지 권력 매트릭스의 억압적인 작동에 대한 실생활의 투쟁에 반응한다.  
Deliberation involves reflecting on personal histories to theorize the dismantling of dominant structures. Decolonial feminist scholar Gloria Anzaldua calls this “entering into the serpent” and listening differently to the silenced and erased histories within us to engage in “border thinking.” 12 Modern Western cultures draw a distinction between rationality and fiction while traditional and indigenous cultures value dreams and imagination. A decolonial perspective supports applying theories and epistemologies from outside the colonial matrix of power incorporating perspectives that coloniality excluded from modern knowledge production. Border thinking responds to real-life struggles against the oppressive operations of the colonial matrix of power. 13

탈식민지화 접근법에서 [행동Action]은 주류의 근간을 이루는 이론에 도전하는 것이다; 그들이 생성하는 질문, 그들이 지원하는 연구 방법, 그리고 그들이 사용하는 글쓰기 스타일은 적용 전에 비판적으로 검토되어야 할 중요한 행위이다.  
Action in decolonizing approaches challenges mainstream foundational theories; the questions they generate, the research methods they support, and the writing styles they employ as significant acts to be critically examined before application. 14

[탈식민지화(脫식민지화)]는 '동사verb'로 이해하는 것이 가장 적절하다. 이 동사는 [정치적, 규범적 윤리]와 [저항과 의도적 취소undoing의 실천(즉 부당한 관행, 가정, 제도를 반학습unlearning하고 해체하는 것)]을 수반하며, [대안적인 공간과 방법을 형성하고 구축하기 위한 지속적인 긍정적인 행동]을 수반한다.
Decolonizing, is best understood as a verb that entails a political and normative ethic and practice of resistance and intentional undoing – unlearning and dismantling unjust practices, assumptions, and institutions – as well as persistent positive action to create and build alternative spaces and ways of knowing. 15

연구에서의 탈식민지 행동은 [행위자를 바꾸는 것, 권력을 이동하는 것, 식민지 구조와 제도를 해체하는 것]을 포함한다. 이러한 동작은 [순차적이거나 독립적]인 것이 아니라 [교차적이고 동시적]이다. 의학 교육 연구의 학자 및 연구자들은 다음과 같은 방법으로 탈식민지 활동을 시작할 수 있다.
Decolonial action in research involves changing the actors, shifting power, and dismantling colonial structures and institutions. These actions are not sequential or independent, but intersectional and contemporaneous. Scholars and researchers in medical education research may begin decolonial action in the following ways.

배우를 바꾸는 것
Change the Actors

[배우들을 바꾸는 것]은 소외된 학자들의 연구를 인용하고 주류 잡지에 그들을 발표하도록 초대하는 것으로 시작할 수 있다. 소외된 학자들의 연구를 인용하는 것은 그들의 학문과 인식론을 뒷받침한다. 최근 랜싯 글로벌 헬스(누가 이야기를 하는가?)와 학술 의학(새로운 대화)과 같은, 영향력이 큰 저널에 글을 쓰도록 소외된 그룹의 저자들을 초대하여 지배적인 장학 플랫폼에 공간을 창출하려는 자극이 그러한 이니셔티브이다. 그러나 언제, 어떻게, 누가 말할 수 있는지를 결정delineating하는 것은 잠재적인 이익을 부정한다. 편집자들은 기꺼이 겸손을 받아들이고 권력을 포기해야 한다. 소외되고 대표성이 떨어지는 작가들이 특정 초대가 필요하도록 출판의 공간을 구성한다면 기존의 권력 구조는 강화된다. 그 공간이 전통적인 힘에 의해 유지되는 한, 그것은 진정으로 재정의될 수 없다. 억압받는 사람들의 목소리가 들릴 수 있도록 공간이 허락할 때 동맹이나 대변은 불필요하다.
Changing the actors might begin by citing marginalized scholars’ work and inviting them to publish in mainstream journals. Citing the work of marginalized scholars foregrounds their scholarship and epistemologies. The recent impetus to create space on dominant scholarship platforms by inviting authors from marginalized groups to write in high-impact journals such as the call by The Lancet Global Health (Who tells the story?) 16 and Academic Medicine (New Conversations) 17 are such initiatives. However, delineating what may be said, when, how, and by whom negates potential benefits. Editors must be willing to embrace humility and surrender power. 18,19 Existing structures of power are reinforced if the space of publication is constructed such that marginalized and underrepresented authors need a specific invitation. As long as the space is held by traditional power, it cannot truly be redefined. Allyship or speaking for and behalf of the oppressed is unnecessary when the spaces allow for their voices to be heard. 20


강력한 위치에 있는 자금 제공자, 편집자 및 연구원들은 그들의 조상, 위치 및 정체성의 특권에 대해 의문을 제기해야 한다. 상대적인 특권에 대한 의식적이거나 무의식적인 맹목은 적어도 새로운 대체 관점을 차단할 것이며, 최악의 경우에는 착취적이고 억압적일 수 있다. 특권에 직면하는 것은 고통스럽고 위협적일 수 있다. 이는 비생산적이고 억압에 대한 도발, 방어, 부정 또는 과도한 보상을 초래할 가능성이 있으므로 특권층에게 수치를 주는 것이 목적이 아니다. 기존의 인식론적 틀 안에서 자신의 특권을 부정하거나 설명하는 반응을 보일 수 있는데, 이는 초점을 잘 못 잡은 것이다. 바로 이러한 틀이 인종, 성별, 성별, 지리적 위치 및 언어와 관련된 특권을 만들고 유지하는 것이기 때문이다.
Funders, editors, and researchers in powerful positions must question the privileges of their ancestry, location, and identity. Conscious or unconscious blindness to relative privileges may at best block emerging alternate viewpoints and at worst be exploitative and oppressive. 11 Confronting privilege can be painful and threatening. The aim is not for the privileged to be shamed as this is unproductive and likely to provoke, defensiveness, denial, or overcompensating for oppression. Reactions can be to deny or explain one’s privilege within epistemic frameworks, which is pointless, as it is these very frameworks that create and maintain the privileges associated with race, gender, sexuality, geolocation, and language.

최근 의학 교육 연구의 경향은, 특권층과 직책의 저자들이 소외된 집단의 저자들을 사회 정의, 형평성, 인종 차별 및 차별에 대한 공동 저자로 초대하는 것을 보았다. 이것은 한편으로는 고무적이지만, 특권층 저가가 이미 주요 저자 직책(첫 번째와 마지막)를 담당하고 있거나, 어떻게 그리고 무엇을 써야 하는지에 영향을 미치는 경향은 [탈식민지적 실천]에 반대된다. 탈식민지 보호는 지적 작업을 이끄는 소외된 작가들을 촉진한다. 마찬가지로, 의학 교육 저널의 [백인 남성 편집자]를 역사적으로 특권을 가진 그룹의 [백인 여성 편집자]로 대체하는 것은 역사적 성차별을 조화시킬 수 있지만 [탈식민지적 실천]은 아니다.
A recent trend in medical education research has seen authors from privileged groups and positions invite authors from marginalized groups to co-author papers on social justice, equity, racism, and discrimination. While this is encouraging on one hand, the tendency for privileged authors to claim prime authorship positions (first and last) or to influence how and what should be written is counter to decolonial practice. Decolonial praxis promotes marginalized authors leading intellectual work. Similarly, replacing White male editors of medical education journals with White female editors from historically privileged groups may reconcile historical gender discrimination but not is not a decolonial practice.

연구력 변화
Shift Power in Research

의도된 청중은 연구가 어떤 방향으로 나아가고 그 결과로부터 누가 이익을 얻는지에 영향을 미칠 수 있다. [다수특권연구자가 참여한 컨퍼런스]에게 연구결과를 발표하는 것은 [동일한 내용이 소외계층에게 발표될 때]와는 다른 이슈에 초점을 맞출 것이다. 강력한 자금 출처는 연구 의제에 영향을 미친다. 상당한 기금은 서구가 지배하는 연구 초점과 패러다임을 복제하는 데 성공했음을 입증하는 연구자들에게 돌아간다. 자금 제공자들은 백인, 남성 또는 지배적인 국가에서 온 연구원들이 주도하는 파격적인 아이디어로 더 위험한 프로젝트에 자금을 지원해야 한다.

Intended audiences can influence what direction research takes and who benefits from the outcomes. Research findings presented at conferences of majority privileged researchers will focus on different issues than if the same research project were presented to marginalized people. Powerful funding sources influence research agendas. Significant funding goes to researchers demonstrating success in replicating Western-dominated research foci and paradigms. Funders must fund more risky projects with unconventional ideas, led by researchers who are not the White, male, or from a dominant country.

연구에서, [탈식민지적 실천]은 [식민지적 권력 매트릭스]의 맥락에서 누구와 협력할 것인지, 그리고 당신의 상대적 특권과 불이익이 무엇인지 질문하는 것을 수반한다. 이러한 상대적 특권을 염두에 두고, 누가 연구를 주도하고 있는지 물어볼 필요가 있을 것이다. 누가 누구를 참여하도록 초대했습니까? 그리고 각각에 대한 동기는 무엇인가? 특권 연구자는 소외 계층에서 연구를 하게 된 동기가 무엇인지 성찰할 필요가 있다. 화이트헤드 등은 다음과 같이 언급했다.

"관계의 본질을 설명하는 데 사용되는 언어에 세심한 주의를 기울이면, 의학 교육자들은 더 협력적이고 역량을 키우는 국제 파트너십으로 나아갈 수 있을 것입니다."
  • 이러한 [권력 격차]는 [이론 및 세상을 바라보는 방식]이 기원하는 장소에 어떻게 영향을 미치는가? 
  • 지배적인 서양 의학 연구자들은 방법론에서 [영성, 직관, 꿈 또는 상상력]을 얼마나 자주 고려합니까? 
  • 데이터와 연구 결과는 소외된 관점을 무시하거나 깎아내리면서 세계를 이해하는 서양의 방식을 재확인하는 근거 자료로 어떻게 활용되고 있는가?

In research, decolonial praxis entails interrogating who one chooses to collaborate with and what your relative privileges and disadvantages are in the context of the colonial matrix of power. With these relative privileges in mind, one would need to ask who is leading the research? Who has invited whom to participate? And what the motivation is for each? Privileged researchers need to reflect on what their motivations are for doing research among disadvantaged groups. Whitehead et al have noted that

“paying close attention to the language used to describe the nature of a relationship, medical educators may be able to move toward more collaborative, capacity-building international partnerships.” 21 
  • How do these power disparities impact on where the theories and ways of viewing the world originate from?
  • How often do dominant Western medical researchers consider spirituality, intuition, dreams, or imagination in their methodology?
  • How are data and findings are used as an evidence base to reaffirm Western ways of understanding the world while ignoring or diminishing marginalized perspectives?

식민성은 지배적인 지식, 사고, 이해(감정론), 연구(방법론)의 방식을 영속시키고 강화한다. 그리고 우리는

  • 우리가 [세상을 이해하는 것]이 어떻게 [우리의 몸에 묶인 감각과 그 너머로 확장]되는지 깨달아야 하고,
  • 우리가 인지하고 이해하는 방법은 [신체, 공간, 시간에 대한 지배적인 현대 서양의 과학적 개념화 너머로 확장]된다는 것을 깨달아야 한다.

연구에서 맥락과 데이터를 보고 이해하는 또다른 개념화 방법을 고려하기 위한 [방법론적 겸손]을 적용하는 것은, [다른 도구와 관점] 뿐만 아니라, 다양한 [데이터 처리 방법]도 필요하다.

Coloniality perpetuates and reinforces dominant ways of knowing, thinking, understanding (epistemology), and conducting research (methodology), and we must come to the realization that how we make sense of the world extends beyond our body-bound senses and how we perceive and understand extends beyond dominant modern Western scientific conceptualizations of the body, space, and time. Applying methodological humility by considering different ways of conceptualizing seeing and understanding contexts and data in research requires different tools and perspectives as well as varied ways of processing data. 22

구조물 및 기관 해체
Dismantle Structures and Institutions

[탈식민지적 실천]은 [대안적 형태의 글쓰기와 연구 결과]를 제시함으로써 공명을 찾을 수 있다. 여기에는 시, 산문, 시청각 및 혼합 매체 형태, 현장 작업에 앞선 의사소통 연구 또는 개념 작업의 형태 등이 있다. 최근 많은 영향력 있는 의학 저널에서 사회 정의, 형평성, 다양성 및 소외에 대한 개념 논문, 관점 논문, 수필, 논평, 사설 및 서한의 증가가 탈식민지 보호로 전환되고 있다. 이 작품들은 이전에 숨겨지고 베일에 싸인 인식론, 관점, 목소리를 소개한다. 풍자적인 글이나 시는 "가축화(길들여지기)domestication에 저항하는 방법"이다. 반란의 시는 지배적인 [식민지적 이분법] 너머로 글을 확장하기 위해 우리 내부의 "타인"을 포함한 타자성otherness에 관여한다. 

Decolonial praxis may find resonance through alternative forms of writing and presenting research findings. Poetry, prose, and audiovisual and mixed media forms of communicating research or conceptual work that precedes fieldwork. A recent increase in concept papers, perspective papers, essays, commentaries, editorials, and letters on social justice, equity, diversity, and marginalization in a number of high-impact medical journals is a turn toward a decolonial praxis. These works introduce previously hidden and veiled epistemologies, perspectives, and voices. Satirical writing or poetry are “a way to resist domestication—methodological and otherwise.” 23,24 Insurgent poetry engages otherness, including the “other” inside ourselves, to extend writing beyond dominant colonial binaries. 25

[자기 민족학]은 탈식민지적 실천으로 인식된다. 의대생 라샤이라 놀렌이 뉴잉글랜드 의학저널(NEJM)에 쓴 글은 다른 관점을 드러내면서 자신을 드러내는 사례다. 의학을 공부하는 흑인 여성으로서의 놀렌의 성찰을  탈식민지적으로 읽은 것은 의학의 기준점으로서의 흰 피부가 유색인종의 건강에 위험하다는 그녀의 깨달음을 보여준다. 그녀는 이러한 이중 의식을 인식하게 되고, 자신의 입장을 숙고하게 되며, [NEJM의 신식민지적 공간neocolonial space of NEJM]에서 자신의 글을 통해 행동하게 된다. 식민주의적 기관인 NEJM은 흑인 여성의 목소리가 들릴 수 있는 공간을 만들어 배우의 변화를 시작하였고, 검은 피부가 다르게 제시하는 대중적 깨달음을 위한 공간으로 자신을 재상상함으로써 작은 권력 이동을 시작하였다. 
그러나 La Shyra Nolen이 미국 흑인 여성들이 경험하는 의대 입학의 장벽을 극복하는 일을 하기 전에는 그렇지 않았다. 놀렌의 훈련된 분노는 새로운 것이 아니다. 그것은 그 신성한 공간에 초대된 적이 없는 종류의 경치를 나타낸다. 과거에는 이 구조 안에서 그녀의 목소리가 공명할 수 수 없었다. NEJM과 Nolen의 협력은 배우의 변화, 권력 이동 및 구조 해체를 향한 초기 단계를 나타낸다.

Autoethnography is recognized as decolonial praxis. 25 Medical student LaShyra Nolen’s writing in the New England Journal of Medicine (NEJM) is an example of revealing self while revealing another perspective. 26 A decolonial reading of Nolen’s reflection as a Black woman studying medicine reveals her realization that White skin as reference point in medicine is dangerous to the health of people of color. She becomes aware of this double consciousness, deliberates on her position, and acts through her writing in the neocolonial space of NEJM. The NEJM, an institution of coloniality, initiated a change of actors by creating the space for a Black woman’s voice to be heard, and a small shift in power by reimagining itself as a space for the public realization that black skin presents differently; but not before LaShyra Nolen did the work of overcoming the barriers to entering medical school experienced by Black women in the United States. 27,28 Nolen’s disciplined outrage is not new. It represents the kind of view that has been never invited into that hallowed space before. Her voice could not previously find resonance within this structure. 17NEJM and Nolen’s collaboration represents a nascent step toward changing the actors, shifting power, and dismantling structures.

이 기사에 요약된 원칙은 실제로 탈식민지화를 탐구하려는 독자들에게 입문서의 역할을 한다. 의식적인 인식, 숙의, 그리고 행동을 통해 의학 교육자들과 보건 전문가들은 현대 세계에서 번창하는 식민지 시대의 유물과 관행을 해체하기 시작할 수 있다.

The principles outlined in this article serve as a primer for readers endeavoring to explore decoloniality in practice. Through conscious awareness, deliberation, and action medical educators and health professionals can begin to dismantle colonial artifacts and practices that thrive in the modern world.

 


Acad Med. 2021 Nov 1;96(11S):S9-S12 doi: 10.1097/ACM.0000000000004339.

Modern Medicine Is a Colonial Artifact: Introducing Decoloniality to Medical Education Research

Affiliations collapse

Affiliation

1T. Naidu is head of clinical psychology, King Dinuzulu Hospital Complex, and a lecturer, Department of Behavioural Medicine, University of KwaZulu-Natal, Durban, South Africa.

PMID: 34380933

DOI: 10.1097/ACM.0000000000004339

Abstract

Modern medicine is an artifact of colonialism because the science that underpins modern medicine emerged from Western knowledge structures based on a history of colonialism. The author suggests the colonial roots of Western-based modern medicine must be reexamined. While there are various critical theories that may be applied in this reexamination, most do not adequately account for intersectional, intergenerational, and sociohistorical inequities encountered in the multiplicity of global contexts in practice teaching and research within medicine. The author presents decoloniality as a theoretical perspective from which to interrogate sociohistorical, geopolitical, and economic perspectives on gender, race, and heteropaternalistic influences in medicine emanating from a basis in colonially developed systems of knowledge production. The author offers definitions of relevant theoretical terms and suggests that decolonial praxis begins with an initial realization or awareness of one's position within the colonial matrix of power followed by the reflecting or deliberation, or a grappling with real-life struggles that are encountered in confronting the oppressive operations of the colonial matrix of power. Decolonial praxis involves action through challenging mainstream foundational theories-the questions they generate, the research methods they support, and the writing styles they employ. In medical education, this may involve changing powerful actors, such as medical journal editors and researchers, with historical privilege; shifting the balance of power in research spaces; and dismantling physical and intellectual structures and institutions established on colonial epistemologies.

바람직한 어려움: 의도적으로 도전적인 학습의 이론과 적용(Med Educ, 2022)
Desirable Difficulty: Theory and application of intentionally challenging learning
Adin Nelson1 | Kinga L. Eliasz2

 

 

1 소개
1 INTRODUCTION

보건 전문 교육생은 졸업하기 위해 광범위한 지식과 기술을 습득해야 하고, 유능한 임상의가 되어야 하며, 고위험 면허 및 자격증 시험에 합격해야 한다. 의료 지식이 기하급수적으로 증가함에 따라 의료 전문 교육(HPE)의 고유한 과제는 시간이 지남에 따라 더욱 심화됩니다. 이러한 압박은 교육자와 학습자 모두가 빠르게 변화하는 교육 환경에 적응하기 위해 매우 효과적인 학습 전략을 찾도록 합니다. 교육에 대한 효과적인 전략을 뒷받침하는 증거들이 점점 더 많이 등장했지만, 문학은 수십 년에 걸쳐 학문 분야를 넘나들고 종종 서로 떨어진 사일로에 빠집니다. 다양성이 핵심 아이디어에 타당성을 부여하지만, 그것은 또한 다른 분야의 연구자들과 교육자들에게 혼란을 줄 수 있다.

Health professions trainees must acquire an extensive body of knowledge and skills in order to graduate, become competent clinicians and pass high-stakes licencing and certification exams. That inherent challenge of Health Professions Education (HPE) only intensifies with time as medical knowledge continues to grow at an exponential rate.1 That pressure drives both educators and learners to seek out highly effective learning strategies to adapt to a quickly changing educational landscape. A growing body of evidence has emerged supporting effective strategies for education, but that literature spans decades, crosses scholarly fields and often falls into discrete silos. While that diversity lends validity to the core ideas, it can also sow confusion among researchers and educators in those different disciplines.

여러 분야와 맥락에 걸쳐 연구된 교육 전략의 한 가지 대표적인 예는 [더 어려운 학습 과정이 학습 결과를 향상시킬 수 있다]는 반직관적인 생각이다. 종종 [바람직한 어려움]으로 불리는 이 아이디어는 더 어려운 연습이 학습자에게 더 많은 인지적 노력을 요구하고, 더 많은 노력이 학습을 향상시킨다는 것을 시사한다. 이러한 어려움은 업무와 관련이 있을 수도 있고 아닐 수도 있다. 한 연구는 심지어 읽기 어려운 글꼴로 학습 자료를 제공하는 것만으로도 학습자의 해당 자료에 대한 기억력이 증가한다는 것을 발견했지만, 후속 연구는 정확한 효과를 복제하는 데 어려움을 겪었다. DD의 이점을 설명하는 문헌은 심리학, 인지과학, HPE 및 일반 교육을 포함한 많은 분야에서 등장했다.
One prime example of an educational strategy that has been studied across multiple fields and contexts is the counterintuitive idea that more difficult learning processes can enhance learning outcomes. This idea, often termed Desirable Difficulty (DD),2, 3 suggests that more difficult practice demands more cognitive effort from learners, and that increased effort enhances learning. These difficulties can be task related or not. One study even found that simply providing learning materials in a difficult-to-read font increased learners' memory of that material,4 although subsequent studies have had challenges replicating that exact effect. Literature describing the benefits of DD has emerged from many fields, including psychology, cognitive science, HPE and general education.

이 논문에서, 우리는 

  • (1) DD 효과를 이해하는 데 도움이 될 수 있는 이론과 프레임워크를 검토한다. 
  • (2) 이러한 기본 아이디어가 세 가지 일반적인 HPE 학습 전략에 대한 우리의 이론적 이해를 증진시킬 수 있는지 탐구한다. 
  • (3) DD 강화 학습의 향후 발전에 대한 시사점을 고려합니다. 

논문의 마지막 섹션에서, 우리는 DD 전략 조합의 가능한 추가 효과에 대한 새로운 문헌을 소개하고 DD가 HPE에서 학습을 극대화하기 위해 구현될 수 있는 방법에 대해 논의한다. 우리는 DD 효과에 대한 통일된 이론적 이해가 HPE를 향상시키고 증거 기반 교육과 학문의 다음 단계를 위한 토대를 마련할 것이라고 믿는다.

In this paper, we

  • (1) review theories and frameworks synthesised across those fields that can help us understand the DD effect,
  • (2) explore how those fundamental ideas can further our theoretical understanding of three common HPE learning strategies and
  • (3) consider implications for future developments of DD-enhanced learning.

In the final section of the paper, we introduce emerging literature on possible additive effects of combinations of DD strategies and discuss how DD can be implemented to maximise learning in HPE. We believe that a unified theoretical understanding of the DD effect will enhance HPE and set the stage for the next phase of evidence-based education and scholarship.

2 DD 효과의 인지적 및 이론적 기반
2 COGNITIVE AND THEORETICAL UNDERPINNINGS OF THE DD EFFECT

2.1 인간 기억의 메커니즘
2.1 Mechanisms of human memory

DD를 이해하기 위해서는 먼저 [인간 기억의 기본 메커니즘]을 검토해야 한다. 인간의 뇌는 단기 기억력이 제한되어 있다. 정보가 보존되기 위해 단기 기억에서 무제한 용량을 가진 [장기 기억]으로 인코딩된다. 장기 메모리에 저장된 정보를 이용할 수 있다고 하며, 그 정보의 내구성을 [저장 강도]라고 한다. 저장된 정보를 의식적으로 사용하기 위해서는 의식적인 단기 기억으로 상기해야 한다. 장기기억에서 쉽게 검색할 수 있는 정보는 [접근성]이 있다고 하며, 그 정보를 떠올리기 쉽다는 것은 [인출 강도]로 알려져 있다. 실용적인 측면에서, 우리가 '무언가를 알고 있는지'는 검색 강도를 가장 정확하게 반영합니다. 사용 가능한 메모리(즉, [저장 강도]는 양호함)가 있지만 액세스할 수 없는 메모리(즉, [인출 강도]는 낮음)가 있으면, 무언가를 알고 있지만 정보를 손끝으로 가져올 수 없다는 답답한 공통 경험을 하게 됩니다. 특정 정보의 검색 강도는 원하는 정보를 찾고 검색할 수 있는 [인출 단서—다른 저장된 메모리 간의 상황별 링크—]에 크게 의존한다. 

To understand DD, we must first review basic mechanisms of human memory. The human brain has limited short-term memory.5, 6 In order to be retained, information is encoded from short-term memory into long-term memory, which has unlimited capacity. Information stored in long-term memory is said to be available, and the durability of that information is termed storage strength.3 To use that stored information consciously, we must recall it into conscious short-term memory.7 Information that can be easily retrieved from long-term memory is said to be accessible, and the ease of recalling that information is known as retrieval strength.3 In practical terms, whether or not we ‘know something’ most accurately reflects retrieval strength. If a memory is available (i.e. has good storage strength) but is not accessible (i.e. has poor retrieval strength), that produces the frustrating common experience of feeling that you know something but not being able to bring the information to your fingertips. The retrieval strength of particular information depends largely on the retrieval cues—the contextual links between different stored memories—that allow us to find and retrieve desired information.7

2.2 기억에서 학습으로 전환
2.2 Pivoting from remembering to learning

교육자로서, 우리는 학습을 용이하게 하기 위해 기억력에 대한 이해를 적용하는 것을 목표로 한다. 학습은 넓게 '경험의 결과로 나타나는 정신적 표현이나 연상의 장기적인 변화'로 정의될 수 있으며, 이는 [장기적인 현상]이다. 학습은 새로운 정보를 단기 기억으로 받아들이고, 그것을 장기 기억으로 인코딩하고, 그 정보를 이용할 수 있게 하기 위한 검색 단서를 구축하는 다단계 과정이다. 자세한 내용은 Brown 등을 참조하십시오.
As educators, we aim to apply our understanding of memory to facilitate learning. Learning can be broadly defined as, ‘a long-term change in mental representations or associations as a result of experience’ (Ormrod,7 p. 20), and it is a long-term phenomenon. Learning is a multiphase process of accepting new information into short-term memory, encoding it into long-term memory and building retrieval cues to make that information available; for a detailed discussion, see Brown et al.8

학습의 첫 번째 단계는 [습득]이다; 학습자는 새로운 정보나 기술을 단기 기억으로 가져가고 그것을 반복적으로 실행한다. 그 반복을 흔히 [연습practice]이라고 한다. 취득 중 새로운 정보나 기술이 단기 기억에 저장되는 정도를 [성과performance]라 한다. 그러나 중요한 문제는 초기 성과가 보통 얼마나 많은 (장기적인) '학습'이 발생할지에 대한 신뢰할 수 있는 지표가 아니라는 것이다.
The first phase of learning is acquisition; the learner takes new information or skills into short-term memory and executes it repeatedly. That repetition is often referred to as practice. The degree to which that new information or skill is stored in short-term memory during acquisition is termed performance9; however, a key conundrum is that initial performance is usually not a reliable indicator of how much (long-term) ‘learning’ will occur.10

[내구적 학습]은 단기 기억에서 장기 기억으로 인코딩되는 정보에 따라 달라지며, 다양한 단계에서 다양한 방식으로 평가될 수 있다. [보존retention]은 연습이 끝난 후 학습자가 정보를 얼마나 잘 기억하거나 과제를 수행할 수 있는지를 의미하며, 습득 후 경과한 시간(예: 즉시 보존과 지연 보존)에 따라 차이가 있다. 운동 학습의 연구에서, [유지 테스트]는 학습자가 처음에 연습했던 조건과 맥락을 복제해야 한다. 보다 복잡한 수동 작업 또는 인지 학습에 대한 연구에서 순수 유지 테스트는 학습자에게 동일한 질문에 답하거나 이전에 연습한 정확한 작업을 수행하도록 요청할 수 있다.

Durable learning depends on information being encoded from short-term into long-term memory, and it can be assessed in various ways at different stages. Retention refers to how well the learner can recall the information or perform the task(s) after practice has concluded and it differs depending on the length of time that has passed since acquisition (e.g. immediate versus delayed retention). In studies of motor learning, a retention test must replicate the same conditions and context in which the learner initially practiced. In studies of more-complex manual tasks or of cognitive learning, a pure retention test might ask learners to answer the same questions or perform the exact task they previously practiced.

반면, [전이transfer]은 학습자가 [다른 맥락]에서 새로운 정보나 새로운 기술을 얼마나 잘 검색할 수 있는지를 의미합니다. (예: 다른 시험 조건 및/또는 약간 다른 작업). [보존retention]과 마찬가지로, 전송은 새로운 작업 또는 컨텍스트가 처음에 실행된 작업 또는 컨텍스트와 얼마나 다른지에 따라 [근거리 및 원거리 전이]로 더 세분화될 수 있다. 이러한 차이는 운동 학습의 통제된 연구에서 명확하게 정의될 수 있지만, [응용 환경]이나 [인지 작업]에서 분석parse하는 것은 훨씬 더 어렵다. 본 논문의 목적을 위해, 우리는 학습자가 [처음에 새로운 기술이나 정보를 습득한 후 어느 시점에 측정된 인출 강도]를 지칭하기 위해 '학습'이라는 용어를 사용할 것이며, 본 논문의 범위를 벗어나는 [즉각적 보존 또는 지연된 보존]과 [근전이 또는 원전이]을 구별하려고 시도하지 않을 것이다.

Transfer, on the other hand, refers to how well the learner can retrieve new information or a new skill in a different context (e.g. different testing conditions and/or a slightly different task).9 Like retention, transfer can also be further subdivided into near and far transfer depending on how much the new task or context differs from the initially practiced task or context.9 These distinctions can be clearly defined in controlled studies of motor learning, but they become much more difficult to parse in applied settings or for cognitive tasks. For the purpose of this paper, we will use the term ‘learning’ to refer to retrieval strength measured at some time after a learner initially acquires a new skill or piece of information, and we will not attempt to distinguish between immediate or delayed retention and near or far transfer, as that is beyond the scope of this paper.

2.3 새로운 불용 이론
2.3 New theory of disuse

새로운 불용 이론(NTD)은 DD의 유익한 효과를 설명하기 위해 인간 기억의 기본 메커니즘을 사용한다. 최근에 메모리가 리콜되지 않으면 해당 메모리에 대한 인출 단서retrieval cues가 희미해지기 시작합니다. 마찬가지로, 새로운 정보가 학습될 때, 이러한 새로운 기억들은 이미 사용 중인 인출 단서를 두고 서로 경쟁할 수 있고, 이러한 인출 단서들은 기존 기억에서 분리되고 새로운 기억으로 연결되도록 재목적화 될 수 있다. 메모리에 대한 인출 단서가 [사라지거나 재목적화]됨에 따라 해당 메모리의 [인출 강도]가 감소합니다. 더 다양하고 강력한 인출 단서가 있을수록, 기억은 희미해지는 것에 더 저항력을 갖는다. 즉, 더 큰 인출 강도를 가지고 있고, 여전히 접근 가능하고, 효과적인 학습이 일어났다는 것을 의미한다. 많은 DD 전략들은 원하는 메모리에 대한 [인출 단서]를 구축하고 강화하는 방법(특히 검색 연습, 간격 연습 및 인터리브 연습. 이 문서는 이 문서의 뒷부분에서 자세히 살펴봅니다)으로 이해될 수 있다. [의도적으로 어려운 학습 연습]을 위한 이러한 전략은 다양한 맥락에서 노력적인 기억을 요구한다. DD는 기존의 인출 단서를 강화하고 새로운 단서의 개발을 장려한다. 따라서 이러한 어려움은 개선된 장기 학습의 바람직한 결과를 낳는다.

The New Theory of Disuse (NTD)3 uses those underlying mechanisms of human memory to explain the beneficial effects of DD. When a memory has not been recalled recently, the retrieval cues to that memory begin to fade. Similarly, when new information is learned, those new memories may compete for retrieval cues already in use, and those retrieval cues may be dissociated from an existing memory and repurposed to link to a new memory. As the retrieval cues to a memory fade or are repurposed, the retrieval strength of that memory wanes. The more diverse and robust retrieval cues a memory has, the more resistant it is to fading; it has greater retrieval strength, it remains accessible, and effective learning has occurred. Many DD strategies—particularly retrieval practice, spaced practice and interleaved practice, which we explore in detail in later sections of this paper—can be understood as ways to build and strengthen retrieval cues to desired memories.8 These strategies for intentionally difficult learning practice demand effortful remembering across varying contexts. That strengthens existing retrieval cues and encourages development of new ones. Those difficulties thereby produce the desirable outcome of improved long-term learning.

2.4 과제 포인트 프레임워크
2.4 Challenge point framework

챌린지 포인트 프레임워크(CPF)는 과제 난이도와 학습 사이의 관계에 대한 또 다른 접근 방식과 추가 세부 정보를 제공한다. CPF는 과제 과제(즉, 난이도)와 장기 학습(그림 1 참조) 사이의 포물선 관계를 설명한다. 연습 과제가 너무 어렵거나 충분히 도전적이지 않을 때 학습은 빈약하며, 중간 최적 도전 지점에서 학습이 극대화된다. 그 최적점은 학습해야 할 [과제의 난이도]와 [개별 학습자의 기술 수준] 사이의 상호 작용에 달려 있다.

The Challenge Point Framework (CPF)10 provides another approach and additional detail to the relationship between task difficulty and learning. The CPF describes a parabolic relationship between task challenge (i.e. difficulty) and long-term learning (see Fig. 1). Learning is poor when practice tasks are either too challenging or not challenging enough, and learning is maximised at an intermediate Optimal Challenge Point. That optimal point depends on the interaction between the difficulty of the to-be-learned task and the skill level of the individual learner.10, 11

 

 

또한 CPF는 도전과제수행이 새로운 정보나 기술을 습득하고 장기 학습하는 동안 [성과performance에 어떻게 차별적으로differentially 영향을 미치는지] 구별한다. 간단한 작업은 완료하기 쉬우므로 즉각적인 성능이 높습니다. 작업 난이도가 높아지면 성능이 꾸준히 떨어진다. 특정 지점을 넘어서면, 그 과제는 너무 어려워서 학습자는 그것을 단순히 완성할 수 없다. 반면에 장기 학습은 낮게 시작하여 처음에는 과제 난이도와 함께 증가한다. 과제 난이도가 학습자의 최대 인지적 노력능력을 초과하는 수준으로 높아지면 학습은 정점을 지나가고, 학습에 있어 추가적인 도전요인이 줄어든다. 그 [피크(즉, 최적 도전 지점)는 과제가 학습자의 최대 인지 능력을 요구하지만 초과하지 않는 지점]이다. 과제 난이도가 [최소 난이도]에서 [최적 도전 포인트]로 갈수록 [학습은 증가]하지만 [수행은 감소]하므로, [학습이 최대치]에 도달했을 때 [수행은 이미 최대치에 훨씬 못 미친다].
The CPF also distinguishes how task challenge differentially affects performance during acquisition of new information or skills and long-term learning. Simple tasks are easy to complete, so immediate performance is high. As task difficulty increases, performance drops steadily. Beyond a certain point, the task is so difficult that the learner is simply unable to complete it. Long-term learning, on the other hand, starts low and initially increases with task difficulty. When the task difficulty increases to a level that exceeds the learner's maximum capacity for cognitive effort, learning passes its peak, and additional challenge causes decreases in learning. That peak (i.e. the Optimal Challenge Point) is the point at which the task demands but does not exceed the learner's maximum cognitive capacity. As task difficulty increases from minimal difficulty towards the Optimal Challenge Point, learning increases, but performance decreases, and so when learning reaches its maximum, performance is already well below its maximum.

과제 난이도가 학습과 성과에 미치는 차이를 [성과-학습 역설] 또는 [전이 역설]이라고 하며, 이는 의도적으로 도전적인 학습 과제(즉, DD 강화 커리큘럼)에 대한 많은 학습자의 혐오를 설명하는 데 도움이 될 수 있다. 학습자의 전문성expertise에 대한 자기 판단은 [연습practice 중 즉각적인 성과performance]에 크게 좌우되기 때문에, 최적 도전 지점에 가까운 [어려운 과제에 대한 낮은 성과]는 학습자가 효과적으로 학습하지 못하고 있다고 느끼게 만들 수 있다. [즉각적인 성능performance]이 떨어지는 것을 경험하면, [장기 학습 개선에 대한 이론적 기대]보다 부정적 경험이 커져서, [도전적인 학습 과제에 대한 동기를 감소]시킨다. 간단히 말해서, 학습자들은 그들이 못한다고 느끼는 과제들을 연습하는 것을 즐기지 않는다.

That differential effect of task difficulty on learning and performance is termed the performance-learning paradox10 or the transfer paradox,12 and it may help explain many learners' aversion to intentionally challenging learning tasks (i.e. DD-enhanced curricula). Learners' self-judgement of expertise largely depends on their immediate performance during practice, so poor performance on difficult tasks that fall near their Optimal Challenge Point may make them feel that they are not learning effectively. Experiencing poor immediate performance outweighs the theoretical expectation of improved long-term learning and reduces motivation for challenging learning tasks.13, 14 Put simply, learners do not enjoy practicing tasks that they feel they are bad at.

2.5 인지 부하 이론(CLT)
2.5 Cognitive Load Theory (CLT)

CLT는 지식과 기술 습득을 고려하는 또 다른 관점을 제공한다. CLT는 인간이 제한된 인지 능력을 가지고 있다는 생각에 중점을 두고 있으며, 이는 인지 부하의 세 가지 범주, 즉 내적 부하, 본유적 부하 및 외부 부하를 관리하기 위해 분할되어야 한다.

  • [내재적 부하]는 새로운 기술을 수행하거나 새로운 정보를 획득하는 내재적 인지 작업이다.
  • [본유적 부하(Germane load)]는 [새로운 정보를 장기 기억으로 통합하기 위한 인지적 노력 또는 더 쉽게 말하면 실제 학습의 작업]이다.
  • [외재적 부하]는 산만함을 이겨내 가면서, 여러 소스에 걸쳐 들어오는 정보를 통합하는 데 필요한 추가 작업이다.

CLT15 provides yet another perspective from which to consider knowledge and skill acquisition. CLT centres on the idea that human beings have limited cognitive capacity which must be divided to manage three categories of cognitive load: intrinsic load, germane load and extraneous load.

  • Intrinsic load is the inherent cognitive work of performing a new skill or acquiring new information.
  • Germane load is the cognitive effort of integrating new information into long-term memory or put more simply, the actual work of learning.
  • Extraneous load is the additional work required to integrate incoming information across multiple sources while ignoring distractors.16

CLT를 기반으로 한 교육 설계는 인지 과부하를 방지하고, 외부 부하를 최소화하여 [내재적 및 본유적 부하에 대한 학습자의 인지 능력]을 극대화하는 것을 강조한다. 내적 및 외부 부하의 합이 과도할 때(예: 복잡한 작업이나 정보 또는 지나치게 산만한 학습 환경에서), 학습자는 학습으로 이어지는 본유적 부하에 대한 인지 능력이 불충분하다.

  • 따라서 CLT 기반 안드라고지는 [작업을 단순화하여 내재적 부하를 줄이거나], [지침을 명확히 하고 산만함을 제거하여 외재적 부하를 줄이는 등] 과부하를 완화할 것을 제안한다.
  • 대조적으로, 내재적 부하가 낮을 때(예: 간단한 학습 자료 사용), 학습자는 일반적으로 높은 외재적 부하를 처리할 수 있으므로, 관련된 본유적 부하 및 결과 학습을 증가시키기 위해 의도적으로 내재적 부하를 증가시키는 것이 유용할 수 있다.

Instructional design grounded in CLT emphasises preventing cognitive overload and minimising extraneous load to maximise learners' cognitive capacity for intrinsic and germane load.17 When the combined intrinsic and extraneous loads are excessive (e.g. with complex tasks or information, or overly distracting learning environments), learners have insufficient cognitive capacity for the germane load that leads to learning;

  • CLT-based andragogy would then suggest relieving that overload by simplifying the task to decrease the intrinsic load or clarifying the instructions and eliminating distractions to decrease extraneous load.18 
  • In contrast, when intrinsic load is low (e.g. with straightforward learning material), learners can typically handle high extraneous loads,18 and it can even be beneficial to intentionally increase the intrinsic load in order to increase the associated germane load and the resultant learning.1617

2.6 DD의 기본이 되는 주요 이론적 개념 비교 및 대조
2.6 Comparing and contrasting key theoretical concepts underlying DD

NTD, CPF, CLT는 서로 다른 분야의 연구자들에 의해 특정 문맥을 위해 개발되었으며, 이러한 이론을 논의하는 기존 문헌은 이들을 무관한 아이디어로 취급한다. 그러나 HPE의 실용적인 학습 접근법을 이해하기 위해 그것들을 적용함에 있어, 우리는 이 세 가지 다른 이론적 관점에 걸쳐 짜여진 공통 핵심 원칙을 본다.
The NTD, CPF and CLT were developed for specific contexts by researchers in different fields, and the existing literature discussing these theories treats them as unrelated ideas. In applying them to understand practical learning approaches in HPE though, we see common core principles woven throughout these three different theoretical perspectives.

NTD는 인간 기억의 메커니즘(인출 단서의 희미화 및 강화)을 활용하여 연습 어려움과 학습 결과 사이의 긍정적인 관계를 설명한다. 학습자가 [희미해지기 시작한 기억]을 힘겹게 떠올릴 때, 그 기억의 검색 단서는 강화되고, 그 기억의 검색 강도는 향상된다.
The NTD3 capitalises on mechanisms of human memory—the fading and strengthening of retrieval cues—to explain the positive relationship between practice difficulty and learning outcomes; when a learner effortfully recalls a memory that has begun to fade, the retrieval cues to that memory are reinforced, and the retrieval strength of that memory is enhanced.

CPF는 두 가지 방식으로 그 아이디어를 확장한다. 

  • 첫째, CPF는 즉각적인 성과와 지연된 보존 또는 전이를 구별하고 연습 과제(따라서 과제가 요구하는 인지적 노력)의 어려움이 학습 과정의 두 단계에 다르게 영향을 미친다는 것을 인정한다. 
  • 둘째, CPF는 도전과 학습의 관계가 한결같이 긍정적인 것이 아니라 포물선적인 것이라고 제안한다. 연습이 너무 어렵거나 충분히 도전적이지 않을 때 학습은 빈약하며, 중간 최적 도전 지점에서 최대화된다.

The CPF10 expands on that idea in two ways.

  • First, the CPF distinguishes immediate performance from delayed retention or transfer and acknowledges that the difficulty of a practice task—and therefore, the cognitive effort the task requires—affects those two phases of the learning process differently.
  • Second, the CPF suggests that the relationship between challenge and learning is not uniformly positive but parabolic; learning is poor when practice is either too challenging or not challenging enough, and it is maximised at an intermediate Optimal Challenge Point.

CLT은 동일한 포물선 관계에 대해 다른 방식으로 접근한다: 과제가 인지 부하에 대한 학습자의 능력을 초과할 때 학습이 방해되며, 다른 극단적으로 너무 적은 인지 부하를 요구하는 과제도 효과적인 학습으로 이어지지 않는다. NTD와 CPF가 연습 작업의 전반적인 어려움만 고려하는 경우, CLT는 해당 과제를 [세 가지 범주의 인지 부하]로 구분하고 [총 부하]를 조정할 뿐만 아니라 보다 정확하게는 해당 부하의 다른 구성 요소를 균형 있게 조정함으로써 학습을 극대화할 수 있다고 제안한다. 세 가지 이론적 개념은 모두 연습 중 어느 정도와 유형의 난이도가 장기적인 학습 결과에 바람직한 영향을 미칠 수 있다는 핵심 관점을 공유한다.

CLT18 approaches that same parabolic relationship in a different way: learning is hindered when tasks exceed a learner's capacity for cognitive load, and at the other extreme, tasks that demand too little cognitive load also do not lead to effective learning. Where the NTD and the CPF only consider the overall difficulty of practice tasks though, CLT differentiates that challenge into three categories of cognitive load and suggests that learning can be maximised not only by adjusting the total load but also, more precisely, by balancing the different components of that load. All three theoretical concepts share the core perspective that a certain degree and type of difficulty during practice can have desirable effects on long-term learning outcomes.

3 HPE에서 일반적으로 사용되는 DD 전략
3 COMMONLY USED DD STRATEGIES IN HPE

DD를 만들기 위해 많은 교육 전략이 사용되었다. 본 논문에서는 HPE에서 공통적으로 사용되는 세 가지 DD 학습 전략에 초점을 맞춘다.

  • (1) 인출 연습(예: Larsen et al. 19), 
  • (2) 거리두기 연습(예: Kornell 및 Bjork20) 및 
  • (3) 인터리빙 연습(예: Lee와 Simon21) 

이러한 DD 학습 전략을 사용하는 많은 HPE 연구는 그들의 이론적 메커니즘을 명시적으로 탐구하지 않기 때문에, 우리는 이 논문을 점점 더 일반적인 교육 전략에 대한 이론적 이해를 증진시키는 데 도움이 되도록 구성했다. HPE의 교육자들이 DD를 성공적으로 구현하고 평생학습 습관을 증진시키기 위해서는 HPE 교육생들의 제한된 시간을 가장 효과적으로 활용하는 방법에 대한 의도적인 결정을 내리는 데 이론적 이해가 필수적이다.
Many instructional strategies have been used to create DD. In this paper, we focus on three DD learning strategies that are common in HPE:

  • (1) retrieval practice (e.g. Larsen et al.19),
  • (2) spaced practice (e.g. Kornell and Bjork20) and
  • (3) interleaved practice (e.g. Lee and Simon21).

Because many HPE studies using these DD learning strategies do not explicitly explore their theoretical mechanisms, we structured this paper to help advance a theoretical understanding of these increasingly common educational strategies. In order for educators in HPE to successfully implement DD and promote lifelong learning habits, a theoretical understanding is fundamental to making intentional decisions about how to most effectively use HPE trainees' limited time.

3.1 인출 연습
3.1 Retrieval practice

인출 연습은 HPE에서 인기를 얻고 있는 DD를 생산하는 한 가지 기술이다. 인출 연습은 학습자가 수동적으로 교과서나 노트를 다시 읽는 대신, 퀴즈나 복습 문제를 사용하여 새롭게 학습한 정보를 기억에서 적극적으로 검색하도록 장려하는 것을 포함한다. 교육적 설계 관점에서 이 전략은 [테스트 강화 학습]이라고도 하며, 근본적인 현상을 [테스트 효과]라고 합니다. 능동적 검색은 동일한 자료를 수동적으로 검토하는 것보다 더 어렵고 더 큰 인지 노력이 필요하므로 DD가 생성되고 학습이 향상된다. 개념적으로 장기 기억에서 정보를 적극적으로 호출하는 것은 해당 정보에 연결되는 검색 신호를 사용하며, 반복 사용은 검색 신호를 강화한다. 다른 맥락에서 기억을 검색하는 것은, 심지어 단순히 다른 단어를 사용하는 연습 문제를 사용하는 것조차도, 새로운 검색 단서를 구축할 수 있는 기회를 만든다. 검색 단서를 강화하고 구축하는 것은 학습해야 할 정보의 검색 강도를 개발하는 데 도움이 된다. 아리스토텔레스는 '반복적으로 무언가를 떠올리는 운동은 기억력을 강화시킨다'고 썼다.
Retrieval practice is one technique for producing DD that has become popular in HPE.22 Retrieval practice involves using quizzing or review questions to encourage learners to actively retrieve newly studied information from memory instead of passively re-reading textbooks or notes (see excellent summary in Brown et al.8). From an instructional design perspective, this strategy is also known as test-enhanced learning, and the underlying phenomenon is termed the testing effect.23 Active retrieval is more challenging and requires greater cognitive effort than passively reviewing the same material, hence DD is generated and learning is enhanced. Conceptually, actively recalling information from long-term memory uses the retrieval cues that link to that information, and repeated use strengthens those retrieval cues. Retrieving memories in different contexts, even simply by using differently worded practice questions, also creates opportunities to build new retrieval cues.8 Strengthening and building retrieval cues helps to develop the retrieval strength of the to-be-learned information. As Aristotle wrote, ‘Exercise in repeatedly recalling a thing strengthens the memory’ (quoted in Brown et al.,8 p. 28).

인출 연습은 HPE에서 오랜 역사를 가지고 있다. 전통적인 임상 교육은 학습자에게 지식을 탐구하기 위해 질문을 하는 교육자에게 크게 의존해 왔다. 이러한 유형의 가르침은 역사적으로 소크라테스식 방법으로 묘사되어 왔다. 그것은 때때로 '핌핑'이라고도 불리며 해징의 한 형태로 간주되지만, 이러한 뉘앙스를 탐구하는 것은 이 논문의 범위를 벗어난다. 검색 관행은 또한 환자 치료에 내재되어 있다: 모든 임상적 만남은 환자를 올바르게 진단하고 치료하기 위해 훈련자가 기억에서 정보를 인출해야 한다.
Retrieval practice has a long history in HPE. Traditional clinical teaching has relied heavily on educators asking learners questions to probe their knowledge. This type of teaching has historically been described as the Socratic method. It is also sometimes called ‘pimping’ and considered a form of hazing, but exploring these nuances is beyond the scope of this paper. Retrieval practice is also inherent to patient care: every clinical encounter requires a trainee to retrieve information from their memory in order to correctly diagnose and treat their patient.

인출 연습의 이점은 다양한 분야의 다양한 학습자들 사이에서 입증되었습니다. 예를 들어, 한 연구는 소아과와 응급의학 레지던트들을 무작위로 강의에 참여시키고, 한 주제에 대한 검토 유인물과 두 번째 주제에 대한 강의가 이어진다. 6개월 이상 지난 뒤 두 주제 모두 시험을 치렀을 때 주민들이 수동적으로 검토했던 과목보다 자신이 출제된 과목에서 평균 13% 높은 점수를 받았다. 중학교 이과생, 운동학부 학생, 대학원 약학부 학생, 의대 학생, 그리고 많은 다른 학습자들에서도 동일한 효과가 입증되었다.
The benefits of retrieval practice have been demonstrated among various learners across various fields. For example, one study randomised paediatrics and emergency medicine residents to participate in a lecture followed by a review handout on one topic and a lecture followed by a quiz on a second topic. When the residents were tested on both topics more than 6 months later, they scored an average 13% higher on the subject they were quizzed on than on the subject they had passively reviewed.19 The same effect has been demonstrated among middle school science students,24 undergraduate kinesiology students,25 graduate-level pharmacy students,26 medical students,22 and many other learners.27

3.2 간격 연습
3.2 Spaced practice

공간 학습(spaced learning) 또는 분산 연습(distributed practice)은 DD를 생산하기 위한 또 다른 일반적인 전략이다. 공간 연습은 학습(또는 공부)을 시간이 지남에 따라, 간격을 두고 여러 개의 짧은 세션으로 나누는 것을 포함한다. 시간 외 학습 세션 사이의 휴가는 자료에 대한 노출 사이에 발생하는 것을 일부 잊어버릴 수 있게 한다. 각 후속 스터디 세션에서 학습자는 작업 메모리에 원하는 정보를 적극적으로 다시 로드하고 재구성해야 합니다. DD의 관점에서, 빛바랜 기억을 회복하는 도전은 학습자의 인지 노력을 증가시키고 학습을 증진시킨다. 좀 더 기계적인 관점에서, 거리두기 연습은 기존 인출 단서가 약해지기 시작한 후 적극적으로 사용하여 기존 검색 단서를 강화하며, 다양한 맥락에서 장기 기억의 정보를 호출하여 새로운 검색 단서를 구축하도록 장려한다.
Spaced practice (also known as spaced learning or distributed practice) is another common strategy for producing DD. Spaced practice involves breaking up learning (or studying) into multiple shorter sessions spaced out over time. The time off between spaced-out learning sessions allows for some forgetting to take place between exposures to the material. At each subsequent study session, the learner must actively reload and reconstruct the desired information in their working memory (see review in Brown et al.8). From a DD perspective, the challenge of recovering those faded memories demands increased cognitive effort from the learner and boosts learning. From a more mechanistic perspective, spaced practice strengthens existing retrieval cues by actively using them after they have begun to weaken, and it encourages building new retrieval cues by recalling information from long-term memory in varying contexts.3

거리두기 연습은 또한 HPE의 임상 훈련에도 내재되어 있다. 특정 절차를 수행하거나 특정 상태를 한 번 치료한다고 해서 즉시 숙달되는 것은 아니다. HPE 학습자는 훈련 내내 동일한 진단을 받고 동일한 작업을 반복적으로 수행하며, 반복될 때마다 지식과 기술을 쌓는다.
Spaced practice is also inherent to clinical training in HPE. Performing a specific procedure or treating a particular condition once does not confer immediate mastery. HPE learners encounter the same diagnoses and perform the same tasks repeatedly throughout their training, and each repetition builds their knowledge and skills.

거리두기 연습의 학습 이점은 다양한 교육 맥락에서 입증되었다. 한 HPE 사례에서, 새로운 수술 기법을 배우는 외과 레지던트들은 단일 4시간 워크샵(대량 실습) 또는 4시간 연속 주간 워크샵(공간 실습)에 참여하도록 무작위로 처리되었다. 거주자가 한달 후 유지 테스트에서 다시 테스트되었을 때, 공간화된 연습 그룹은 다중 메트릭에서 대량 연습 그룹을 크게 능가했습니다. 공간 연습의 이점은 해부학, 전염병 및 비뇨기학을 다루는 인지 학습 과제에서도 입증되었으며 대학생에서 거주자, 동료 및 노인에 이르기까지 다양한 학습자와 함께 복제되었다.

The learning benefits of spaced practice have been demonstrated in a variety of educational contexts. In one HPE example, surgical residents learning a new surgical technique were randomised to participate in either a single 4-h workshop (massed practice) or a series of four, hour-long, weekly workshops (spaced practice). When the residents were retested on a retention test a month later, the spaced practice group significantly outperformed the massed practice group on multiple metrics.28 The benefits of spaced practice have also been demonstrated for cognitive learning tasks covering anatomy,29 infectious diseases30 and urology,31 and they have been replicated with a range of learners from college students20 to residents,31 fellows30 and older adults.32, 33

3.3 인터리브 연습
3.3 Interleaved practice

DD를 생성하기 위한 또 다른 일반적인 전략인 [교차(인터리브) 연습]단일 스터디 세션 내에서 서로 다른 주제를 번갈아 사용하는 것을 말합니다. 이 전략이 처음 연구된 운동 학습 문헌에서는 일반적으로 무작위 실습이라고 하는 반면, 심리학 및 교육 영역에서는 단순히 [인터리빙]이라고 한다. 교차 연습은 한 번에 하나의 주제에 집중하는 대신 주제 간의 지속적인 전환이 필요하며, 이는 초기 성능을 저하시키지만, 역설적으로 [상황적 간섭Contextual Interference]이라는 현상을 통해 장기적인 학습을 향상시킨다. 교차 연습의 유익한 효과를 설명하기 위한 두 가지 가설이 있다. 망각-재구성 가설은 인터리브 연습을 간격 연습에 비유한다.

  • 거리두기 연습은 자료에서 떨어진 시간을 사용하여 정보가 [단기 기억에서 사라지도록 수동적으로 허용]하는 반면,
  • 교차 연습은 새로운 주제를 그 자리에 도입함으로써 한 주제를 [단기 기억에서 적극적으로 밀어낸다].

Interleaved practice, another common strategy for generating DD, refers to alternating between different topics within a single study session (see review in Brown et al.8). In the motor learning literature, where this strategy was first studied, this is typically referred to as random practice, while in the psychology and education domains, it is referred to simply as interleaving. Instead of focusing on one topic at a time, interleaved practice requires constant switching between topics, which degrades initial performance but paradoxically improves long-term learning through a phenomenon termed Contextual Interference.34 There are two hypotheses to explain the beneficial effects of interleaved practice. The forgetting-reconstruction hypothesis likens interleaved practice to spaced practice:

  • where spaced practice uses time away from the material to passively allow information to fade from short-term memory,
  • interleaved practice actively forces one topic out of short-term memory by introducing a new topic in its place.21 

공간 연습과 마찬가지로 단기 기억에서 각 후속 주제를 떠올리거나 재구성하는 인지적 도전은 DD를 생성하고 학습을 강화한다. 간단히 말해서, 여러분이 여러 과목의 혼합을 동시에 공부할 때, 여러분은 그것들을 여러분의 마음 속에 똑바로 유지하기 위해 더 열심히 공부해야 합니다. 그 가설은 교차 연습이 다양한 인지적 맥락에서 정보를 단기 기억으로 다시 로드하는 데 적극적으로 사용함으로써, 인출 단서를 강화한다는 것을 시사한다. 대안 가설인 정교화-특이성 관점은 관련 주제 또는 과제에 대한 인터리빙 연습이 학습자가 [비교]를 하고, 그들 사이의 [대비]를 식별하도록 장려한다는 것을 시사한다. 주제 간의 이러한 대비는 종종 새로운 문제를 다룰 때 각 주제 내의 공통점보다 더 중요하다. 개념적으로, 장기 기억에서 서로 다른 정보 조각들 사이의 대조적인 링크들을 개발하는 것은 본질적으로 각 기억들의 집합을 다른 것에 대한 인출 단서로 사용한다.
As with spaced practice, the cognitive challenge of recalling or reconstructing each subsequent topic in short-term memory creates DD and enhances learning. Simply put, when you are simultaneously studying a mixture of multiple subjects, you have to work harder to keep them all straight in your mind. That hypothesis suggests that interleaved practice strengthens retrieval cues by actively using them to reload information into short-term memory in varying cognitive contexts.3 An alternative hypothesis, the elaboration-distinctiveness view, suggests that interleaved practice of related subjects or tasks encourages the learner to make comparisons and identify contrasts between them.3, 21 Those contrasts between topics are often more important than the commonalities within each topic when it comes to addressing novel problems.8 Conceptually, developing those contrasting links between different pieces of information in long-term memory essentially uses each set of memories as retrieval cues for the other.3

검색 연습 및 간격 연습과 마찬가지로 인터리브 연습은 HPE의 작업기반 임상 훈련에서 고유합니다. 어떤 임상의도, 어떤 임상의 훈련생도 매일 똑같은 일을 하지 않습니다. 각각의 새로운 환자들은 궁극적으로 다른 진단으로 이어지는 다른 증상을 보인다. 임상 실습의 무작위적 특성은 학습자에게 조건 간의 미세한 차이를 비교, 대조 및 식별할 수 있는 기회를 자동으로 제공합니다.
As with retrieval practice and spaced practice, interleaved practice is inherent to workplace-based clinical training in HPE. No clinician, and certainly no clinical trainee, does exactly the same thing every day. Each new patient presents different symptoms that ultimately lead to a different diagnosis. The random nature of clinical practice automatically provides learners with opportunities to compare, contrast and identify fine distinctions between conditions.

교차 연습의 이점은 또한 다양한 교육 환경에서 다양한 작업에 대해 입증되었다. 예를 들어, 의과대학 3학년 학생들이 복강경 수술 기술을 블록(즉, 한 번에 한 가지 기술을 연습하는 것) 또는 인터리브 일정에서 배우는 연구는 인터리브 연습을 사용하는 학생들이 작업을 더 빠르고 덜 가변적으로 완료한다는 것을 발견했다. 그 효과는 인지 과제와 다른 교육 환경에서도 입증되었다. 예를 들어, 한 연구는 무작위로 인터리브된 수학 문제를 연습하는 대학생들이 유형별로만 수학 문제를 연습하는 학생들보다 기말고사에서 훨씬 더 높은 점수를 받았다는 것을 발견했다. 비슷한 결과는 유화 화가나 조류 종을 식별하는 것을 배우는 성인들 사이에서도 발견되었다. 
The benefits of interleaved practice have also been demonstrated for a variety of tasks in a variety of educational settings. For example, a study of third-year medical students learning laparoscopic surgical skills under either a blocked (i.e. practicing one skill at a time) or an interleaved schedule found that the students using interleaved practice completed the tasks faster and with less variability.35 The effect has also been demonstrated for cognitive tasks and in other educational settings. For example, one study found that college students practicing randomly interleaved math problems scored significantly higher on a final exam than students practicing math problems exclusively by type.36 Similar results have also been found among adults learning to identify oil painters20 or bird species.37

3.4 DD 학습 전략 결합의 부가 효과
3.4 Additive effects of combining DD learning strategies

HPE의 검색 연습, 공간 연습 및 인터리브 연습에 대한 많은 기존 연구는 이러한 전략 중 하나에 초점을 맞추고 있다. 그러나 일부 연구는 이러한 전략의 조합을 조사했고, 많은 연구들이 긍정적인 효과를 보여주었다. 예를 들어, 여러 연구에서 [간격을 둔 인출 연습]을 테스트한 결과 표준화된 테스트에서 학습자의 성능이 향상되었습니다. :
Many existing studies of retrieval practice, spaced practice and interleaved practice in HPE have focused on just one of these strategies.20, 22, 25, 26, 31, 36, 38-41 Some studies have examined combinations of these strategies though, and many of them have shown positive effects. For example, several studies have tested spaced retrieval practice—a combined strategy of practice questions assigned to learners at spaced-out intervals—and found that it improved learners' performance on standardised tests.42, 43

여러 연구에서 개별적으로 유익한 학습 전략을 조합하면 부가적인 효과가 있음을 보여주었다. 예를 들어, 운동 과제 학습에 대한 연구에서 울프 등은 두 기술을 결합하면 어느 기술보다 성능이 향상되고 세 기술을 결합하면 훨씬 더 큰 효과가 있음을 발견했다. 인지 학습에 대한 일부 연구에서도 유사한 결과가 나왔다. 예를 들어 골격근해부학을 배우는 학부생들을 대상으로 한 연구에서 간격두기 연습을 사용한 학생과 인출연습을 사용한 학생 모두 어느 쪽도 사용하지 않은 대조군보다 우수한 성적을 보였지만, [간격두기 연습과 검색연습을 조합한 학생]이 최종시험에서 가장 높은 점수를 받았다. 유사한 연구는 [인출 연습과 인터리브 연습]의 부가적인 효과를 여러 생리학 텍스트에서 주요 주제를 합성하는 학부 학생들의 능력에 발견했다. 이론적 관점에서, 이러한 결과는 개별 학습 전략이 DD를 생성하고 학습을 증진시킨다면, 그러한 전략의 조합이 부가적인 효과를 가져 훨씬 더 많은 난이도를 생성하고 학습을 더욱 강화해야 한다는 것을 시사한다.

Several studies have shown additive effects from combinations of individually beneficial learning strategies. In studies of motor task learning, for example, Wulf et al. found that combining two techniques—both of which had already been shown to be individually beneficial—improved performance over either technique alone,44 and that combining three techniques had an even greater effect.45 Similar results have emerged from some studies of cognitive learning. For example, in a study of undergraduate students learning skeletal muscle anatomy, both students who used spaced practice and students who used retrieval practice outperformed controls who used neither, but students who used a combination of spaced practice and retrieval practice scored best of all on the final test.29 A similar study found additive effects of retrieval practice and interleaved practice on undergraduate students' ability to synthesise key themes from multiple physiology texts.46 From a theoretical standpoint, these results suggest that if individual learning strategies produce DD and boost learning, then a combination of those strategies should have an additive effect, producing even more difficulty, and further enhancing learning.

그러나 기존 연구의 결과는 보편적으로 긍정적이지 않았다. 다른 연구들은 개별적으로 유익한 학습 전략의 조합으로부터 추가적인 효과를 발견하지 못했다. 타이밍 예측에 대한 운동 학습 연구에서 학습자는 인터리빙 연습 또는 피드백의 자기 결정 중 하나에서 이익을 얻었지만 두 기술의 조합에서 추가적인 이점은 없었다. 인지학습 분야에서는 아벨과 로디거의 연구에서 검색연습이 외국어 어휘 학습에 대한 수동적 학습보다 월등히 우수한 것으로 나타났으나, 인터리브 연습 일정의 추가에 의해 그 효과가 수정되지는 않았다.
Results of existing studies have not, however, been universally positive. Other studies have found no additive effects from combinations of individually beneficial learning strategies. In a motor learning study of timing anticipation, learners benefited from either interleaved practice or self-determination of feedback, but there was no added benefit from a combination of both techniques.47 In the area of cognitive learning, a study by Abel and Roediger48 found that while retrieval practice significantly outperformed passive studying for learning foreign language vocabulary, that effect was not modified by the addition of an interleaved practice schedule.

CPF는 이러한 혼재된 결과를 이해하는 데 유용한 프레임워크를 제공할 수 있다. 우리가 DD 전략을 결합하면 누적 난이도가 발생한다고 규정한다면, 학습자가 CPF 곡선의 다른 영역에 빠지는 것으로 학습의 증가 또는 감소를 찾는 연구가 설명될 수 있다. 학습자가 최적 도전 포인트를 초과하지 않는 한(즉, 그림 1의 '학습' 곡선의 증가하는 왼쪽에 머무르는 한), DD 전략을 결합하면 총 난이도가 증가하여 학습에 있어 추가적인 개선이 이루어져야 한다. 반면에, 여러 DD 전략의 조합으로 인해 [누적된 난이도]가 학습자를 최적의 도전과제OCP 바깥으로 밀어낸다면 (즉, 그림 1에서 곡선의 감소된 우측으로 교차한다.) 우리는 그 조합이 어떤 개별 DD 전략보다 더 나쁜 학습 결과를 낳을 것으로 예상한다.

The CPF may provide a useful framework to understand these mixed results. If we stipulate that combining DD strategies produces cumulative difficulty, then studies finding either increases or decreases in learning can be explained by learners falling on different areas of the CPF curve.

  • As long as learners do not exceed their Optimal Challenge Points (i.e. they remain on the increasing left-hand side of the ‘learning’ curve in Fig. 1), combining DD strategies should lead to increased total difficulty, which should produce further improvements in learning.
  • If, on the other hand, the cumulative difficulty generated by a combination of multiple DD strategies pushes learners past their Optimal Challenge Points (i.e. they cross over onto the decreasing right-hand side of the curve in Fig. 1), we would expect the combination to produce worse learning outcomes than any individual DD strategy.

CPF는 개별 DD 전략과 이러한 전략의 조합 사이에 차이가 없음을 보여주는 결과를 유사하게 설명할 수 있다. 하나의 DD 전략(또는 전략의 조합)이 학습자를 최적 과제 지점 아래로 떨어뜨리는 난이도를 만들고, DD 전략의 조합(또는 다른 조합)이 학습자를 최적 과제 지점 이상으로 밀어낸다면, 두 시나리오 모두 동일한(차선의) 장기 학습 수준을 초래할 수 있습니다. 그림 1을 참조하면, 이러한 상황은 [동일한 높이]에서 모두 하부(유지/학습) 곡선의 두 점으로 설명될 것이다. —하나는 피크의 왼쪽에 있고 하나는 피크의 오른쪽에 있습니다. 또는 DD 전략의 조합이 추가 누적 난이도를 발생시킨다는 우리의 초기 규정이 정확하지 않을 수 있다. 그들의 구조와 메커니즘에 따라, 모든 DD 전략이 부가적인 방식으로 결합되지는 않을 수 있다.

The CPF can similarly explain results showing no difference between individual DD strategies and combinations of those strategies. If one DD strategy (or one combination of strategies) creates a degree of difficulty that puts learners below their Optimal Challenge Points, and a combination (or a different combination) of DD strategies pushes learners beyond their Optimal Challenge Points, then both scenarios could result in the same (suboptimal) degree of long-term learning. Referring to Fig. 1, this situation would be described by two points on the lower (retention/learning) curve—one to the left of the peak and one to the right—both at the same height. Alternatively, our initial stipulation that combinations of DD strategies produce additive cumulative difficulty may be incorrect. Depending on their structures and mechanisms, it is possible that not all DD strategies combine in additive ways.

4 신중한 교육 설계 결정을 통한 학습 향상
4 ENHANCING LEARNING THROUGH DELIBERATE INSTRUCTIONAL DESIGN DECISIONS

HPE 연습생들은 그들의 학습 시간에 극심한 제약을 받는다. 2011년 미국에서 근무시간 제한이 시행된 이후 전공의들은 주당 최대 80시간까지 근무할 수 있도록 제한되고 있으며, 이는 그들의 교육 경험에 직접적인 영향을 미치고 있다. 근무시간 제한은 교육자와 학습자 모두에게 매우 효과적인 학습 전략을 강조함으로써 전공의의 제한된 학습 시간을 최대한 활용하도록 도전해 왔다. 우리는 DD가 이러한 시간 제약 내에서 high-yield 학습을 설계하기 위해 이론 기반, 증거 기반, 실행 가능한 접근 방식을 제공한다고 믿는다. 그러나 기존 문헌과 관련 이론의 다양성으로 인해 임상의-교육자가 이러한 개념을 쉽게 적용할 수 있는 능력이 제한될 수 있으므로 혼란을 극복하고 HPE를 직접 향상시키기 위해서는 DD에 대한 통일된 개념적 이해가 필요하다.
HPE trainees face intense limitations on their learning time. Since the implementation of duty-hour restrictions in 2011 in the United States, residents are limited to work a maximum of 80 hours per week,49 and that has directly impacted their educational experience.50, 51 Duty-hour restrictions have challenged both educators and learners to make the most of residents' limited learning time by emphasising highly effective learning strategies. We believe that DD provides a theory-grounded, evidence-based, actionable approach to design high-yield learning within those time constraints. The diversity of existing literature and relevant theories may limit clinician-educators' ability to easily apply these concepts though, so a unified conceptual understanding of DD is needed to cut through the confusion and directly enhance HPE.

본 문서는 교육자와 학습자가 DD 접근 방식이 보다 효과적이고 효율적인 학습을 촉진하는 방법과 이유에 대한 기본적인 이해를 구축하는 출발점을 제공합니다. '왜'를 이해하면 교육자와 학습자가 신중한 교육 설계 결정을 바탕으로 교육 개입을 만들고, 구현하고, 관여하는 데 힘을 발휘할 수 있습니다. 교육자의 경우, 특정 교육 설계 결정이 더 큰 학습 성공을 가져올 수 있는 이유를 더 잘 이해하면 학습에 가장 적합한 전략을 사용하여 신중한 결정을 지원하는 데 도움이 됩니다. HPE 교육자와 교육생은 의도적으로 도전적인 학습 활동을 두려워해서는 안 된다. 학습자가 특정 연습을 즐기지 않거나, 초기 연습 동안 제대로 수행하지 못할 수 있다는 사실은 그것들이 효과적이지 않거나 바람직하지 않은 학습 경험이라는 것을 나타내지 않는다. 반대로, 학습자들이 열심히 공부하도록 강요하는 그러한 도전적인 연습들은 모든 것 중에서 가장 효과적인 학습 경험들 중 일부일 수 있다. DD의 이론적 토대를 이해함으로써 교육자는 학습자에게 최적의 도전을 제공하여 학습을 촉진하는 동시에 대신 해로울 수 있는 과도한 도전을 피할 수 있습니다. 학습자의 경우, '왜'를 이해하는 것은 의도적으로 어려운 연습을 통해 동기부여와 자신감을 유지하는 데 도움이 될 수 있다. 어려움을 극복하고 힘든 일을 수용하는 습관을 기르는 것은 또한 비동기식 온라인 교육이 보편화됨에 따라 점점 더 중요해지고 있는 평생의사적 실천과 자기조절 학습에 대한 HPE 교육생들의 준비를 한다. 
This paper provides a starting point for educators and learners to build a fundamental understanding of how and why a DD approach promotes more effective and efficient learning. Understanding ‘why’ allows educators and learners to be empowered at creating, implementing and engaging in educational interventions based on deliberate instructional design decisions. For educators, a better understanding of why certain instructional design decisions can produce greater learning success helps support deliberate decisions by using strategies that are most appropriate for learning. HPE educators and trainees should not be afraid of intentionally challenging learning activities. The fact that learners may not enjoy particular exercises, or that they perform them poorly during initial practice, does not indicate that those are ineffective or undesirable learning experiences. On the contrary, those challenging exercises that force learners to work hard may be some of the most effective learning experiences of all. By understanding the theoretical underpinnings of DD, educators can work to optimally challenge learners to facilitate learning while avoiding creating excessive challenges that will instead be detrimental. For learners, understanding the ‘why’ can help maintain motivation and self-confidence through intentionally difficult practice. Building the habits of overcoming difficulty and embracing hard work also prepares HPE trainees for the lifelong deliberate practice and self-regulated learning that are becoming increasingly important as asynchronous online education becomes more and more common.52, 53

5 결론
5 CONCLUSIONS

최근 몇 년 동안 많은 연구 논문, 교과서 및 워크샵에서 DD를 통한 효과적인 교육을 위한 구체적인 전략을 공개했습니다. 그러나 특정 DD 기술을 추천하는 출판물과 그러한 기술의 이론적 근거를 탐구하는 출판물 사이에는 극명한 구분이 있었다. 본 논문에서는 NTD, CPF 및 CLT의 세 가지 구별되지만 중복되는 관점에서 DD의 이론적 메커니즘을 탐색하고 이를 적용하여 HPE에서 일반적으로 사용되는 세 가지 증거 기반 DD 강화 교육 전략을 이해하였다. 인출 연습, 간격 연습 및 교차 연습. 우리는 우리의 연구가 과학 분야 전반에 걸쳐 이론과 어휘를 통합하여 특히 DD의 일반적인 것 및 [인출 연습, 간격 연습 및 교차 연습]에 대한 통일된 이론적 토대를 발전시켜 HPE에 가치를 더한다고 믿는다. 우리는 이러한 이론적 토대를 이해하는 것이 더 많은 교육자들이 이러한 접근 방식을 신중하게 적용하여 HPE 및 그 이상의 학습 결과를 향상시킬 수 있도록 힘을 얻는 데 도움이 되기를 바란다.

In recent years, many research papers, textbooks and workshops have publicised specific strategies for effective education through DD (e.g. Brown et al.8 and Winn et al.54). There has been a stark division between publications recommending specific DD techniques and publications exploring the theoretical grounding of those techniques, though. In this paper, we explored theoretical mechanisms of DD from three distinct yet overlapping perspectives—the NTD, CPF and CLT—and applied them to understand three evidence-based DD-enhanced instructional strategies commonly used in HPE: retrieval practice, spaced practice and interleaved practice. We believe our work adds value to HPE by integrating theories and vocabulary across scientific disciplines to advance a unified theoretical grounding for DD in general and retrieval practice, spaced practice and interleaved practice in particular. We hope that understanding these theoretical underpinnings will help more educators feel empowered to thoughtfully apply these approaches to enhance learning outcomes in HPE and beyond.

 

 


Med Educ. 2022 Aug 11. doi: 10.1111/medu.14916. Online ahead of print.

Desirable Difficulty: Theory and application of intentionally challenging learning

Affiliations collapse

Affiliations

1Department of Pediatrics, Weill Cornell Medicine, New York, New York, USA.

2New York University Grossman School of Medicine, New York, New York, USA.

PMID: 35950522

DOI: 10.1111/medu.14916

Abstract

Context: Health professions trainees must acquire a vast amount of clinical knowledge and skills, and a deliberate instructional design approach is needed to provide trainees with effective learning strategies. One powerful yet counterintuitive strategy that facilitates long-term learning is incorporating intentional difficulties during the learning process. Difficulties that require more effort from learners may impede short-term learning but are ultimately beneficial for long-term learning and are therefore termed Desirable Difficulties.

Objectives: In this cross-cutting edge paper, we describe the Desirable Difficulty effect from three theoretical perspectives originating in different fields, discuss common evidence-based Desirable Difficulty strategies used in Health Professions Education and explore emerging research that could further optimise Desirable Difficulty-enhanced learning for health professions trainees.

Methods: We synthesise theory and research from psychology, cognitive science and Health Professions Education literatures to further the understanding and application of Desirable Difficulties. We introduce three theoretical perspectives that provide a comprehensive overview of the theoretical underpinnings of the Desirable Difficulty effect: the New Theory of Disuse, the Challenge Point Framework and Cognitive Load Theory. We then illustrate how three common Desirable Difficulty strategies in medical education research-retrieval practice, spaced practice and interleaved practice-can be understood through these theoretical lenses. Finally, we provide relevant examples from the literature and explore emerging research in this area.

Conclusions: This paper summarises the theory and empirical research on Desirable Difficulties during the learning process, from explaining what they are and why they may be effective to how they have been applied in different contexts. We argue that providing educators and trainees with a comprehensive theoretical and applied understanding of Desirable Difficulty will promote deliberate instructional design decisions and lead to more effective learning.

의대생들에게 가르치는 것 가르치기: 내러티브 리뷰와 문헌에 기반한 권고(Acad Med, 2022)
Teaching Medical Students to Teach: A Narrative Review and Literature-Informed Recommendations for Student-as-Teacher Curricula
Alexandra Cohen, MDCM, Yvonne Steinert, PhD, and Elisa Ruano Cea, MDCM, MHPE

 

 

의료 훈련생은 훈련의 초기 단계에서 동료와 학습자를 가르치는 데 중요한 역할을 한다. [가르치는 역량]이 선천적인 것이 아닌 만큼 교육생들이 효과적인 교사가 되기 위해서는 교수 능력을 습득하고 발전시킬 수 있는 기회를 가져야 한다. 교육생들의 교직역할을 위한 준비의 중요성은 PGME(Postgradian Medical Education)에서 잘 확립되어 있으며, 여기서 전공의-교사 교육과정이 일반적으로 설명되고 시행되고 있다. 대조적으로, 대부분의 학부 의학 교육(UME) 프로그램에도 불구하고, 공식적인 교수 기술 훈련은 드물게 제공된다. 놀랄 것도 없이, 의대생들은 교사로서의 현재와 미래의 역할 모두에 대해 준비가 덜 되어 있다고 느끼고 있다고 한다. 

Medical trainees play a crucial role in teaching peers and learners at earlier stages in their training. 1,2 As the capacity to teach is not innate, trainees must have the opportunity to acquire and develop their teaching skills to become effective teachers. 3 The importance of preparing trainees for their teaching roles is well established in postgraduate medical education (PGME), where resident-as-teacher curricula have commonly been described and implemented. 4 In contrast, despite most undergraduate medical education (UME) programs engaging students in teaching roles, formal teaching skills training is infrequently provided. 5–7 Not surprisingly, medical students have reported feeling ill-prepared for both their current and future roles as teachers. 1

현재 전 세계적으로 역량 기반 의료 교육(CBME)으로의 전환은 또한 의과대학이 UME에서 교수 기술 훈련을 강화할 필요성을 지지한다. 특히, CBME는 학습자가 훈련 연속체를 따라 점진적으로 배열된 다양한 기술을 수행하는 데 역량을 보여줄 것을 요구한다.  의대생들이 교육을 진행하면서 맡게 되는 다양한 교육 책임과 PGME 초기에 전공의들이 종종 떠맡는 주요 교육 역할을 고려할 때, 학부 수준에서 공식적인 교육 기술 교육을 도입하는 것이 교육생들의 미래 책임에 더 적절하게 대비할 수 있을 것이다.
The current worldwide shift toward competency-based medical education (CBME) also supports the need for medical schools to enhance teaching skills training in UME. Specifically, CBME calls for learners to demonstrate competence in performing a variety of skills sequenced progressively along the training continuum. 8 Given the various teaching responsibilities assumed by medical students as they progress in their training and the key teaching roles that residents often assume early in PGME, 1,2 introducing formal teaching skills training at the undergraduate level would more adequately prepare trainees for their future responsibilities.

우리가 아는 한, Dandavino 등이 10년 전에 작성한 검토 기사 하나를 제외하고, CBME의 맥락에서 의대 학생들에게 이 주제를 가르치거나 검토하는 방법에 대한 포괄적인 권고를 하지 않았다. 더욱이, 학생 교사(SaT) 교육과정을 검토한 다른 두 출판물은 특히 UME에서 공식적인 교육 기술 교육에 집중하지 않았다. 그들은 또한 학생들이 어떠한 공식적인 준비도 받지 않고 교사 역할을 맡는 커리큘럼을 포함했기 때문이다.

To our knowledge, with the exception of one review article written over a decade ago by Dandavino et al, 3 no publications have made comprehensive recommendations for how to teach medical students to teach or examined this topic in the context of CBME. Moreover, the 2 other publications that have reviewed student-as-teacher (SaT) curricula 9,10 did not focus specifically on formal teaching skills training in UME, as they also included curricula wherein students assumed a teaching role without receiving any prior formal preparation.

문헌의 현재 상태에 비추어, 우리는 다음과 같은 질문을 제기했다. 의학 교육자들은 어떻게 하면 UME에서 PGME까지 연속체를 따라 교육자 역할을 위해 훈련생들을 가장 잘 준비할 수 있을까? 이 문제를 해결하기 위해 CBME의 맥락에서 SaT 커리큘럼 개발을 위한 문헌 정보 권장 사항을 제안하는 것을 목표로 공식적인 교수 기술 교육을 통합한 SaT 문헌을 종합적으로 합성하기 위한 서술적 검토를 실시했다.
In light of the current state of the literature, we posed the following question: How can medical educators best prepare trainees for their teaching roles along the UME to PGME continuum? To address this question, we conducted a narrative review 11–13 to comprehensively synthesize the SaT literature that incorporates formal teaching skills training, with the goal of proposing literature-informed recommendations for SaT curriculum development within the context of CBME.

방법
Method

이 섹션에서는 이 내러티브 리뷰를 위한 검색 전략 및 선택 과정, 포함 및 제외 기준, 데이터 추상화 및 합성에 대해 설명한다. 
In this section, we describe the search strategy and selection process, inclusion and exclusion criteria, and data abstraction and synthesis for this narrative review. 11–13

검색 전략 및 선택 과정
Search strategy and selection process

2020년 1월, 우리는 "학생을 선생님으로", "근접 동료 교육", "가르치기 위한 교육" 및 "가르치기 위한 교육"이라는 문구를 사용하여 Medline 및 Embase 데이터베이스를 검색했다. 또한 (의대생* 또는 연수생* 또는 학부생*) adj (교사 또는 교수), (학생* 또는 의대* 또는 학부* 또는 연수생*) adj (학습*) (교육, 의학, 학부) [MeSH] 또는 "학생, 의학] (MeSH) 및 ("교사 교육" [MeSH])을 사용했습니다.또한 검색을 통해 발견된 주요 기사를 사용하여 스코푸스에서 전방 인용 검색을 수행했다. 우리는 2020년 8월에 검색을 반복하여 그 사이에 발표된 관련 기사를 포함시켰다.
In January 2020, we searched the Medline and Embase databases using the phrases: “student(s) as teacher(s),” “near-peer teaching,” “teaching to teach,” and “teaching how to teach.” We also used the following search strings: (medical student* or trainee* or undergraduate*) adj (teacher or teach or teaching), (student* or medical student* or undergraduate* or trainee*) adj (learn* to teach*), and (“education, medical, undergraduate” [Medical Subject Headings (MeSH)] or “students, medical” [MeSH]) and (“teacher training” [MeSH]). In addition, we conducted a forward citation search in Scopus using key articles found through our search. We repeated our search (see Supplemental Digital Appendix 1 at https://links-lww-com-ssl.access.hanyang.ac.kr/ACADMED/B229) in August 2020 to include any relevant articles published in the intervening months.


두 명의 저자(A.C.와 E.R.C.)는 독립적으로 모든 기사의 제목과 초록을 검토하고 필요할 때 전면적으로 검토했다. 그들은 관련 기사를 선정하기 위해 아래에 설명된 포함 및 제외 기준을 적용하였고, 토론을 통해 분쟁을 해결하고, 필요할 경우 다른 저자(Y.S.)와 협의를 통해 해결하였다.
Two authors (A.C. and E.R.C.) independently reviewed the titles and abstracts of all articles and reviewed them in full when necessary. They applied the inclusion and exclusion criteria described below to select relevant articles, resolving disputes through discussion, and when necessary, through consultation with the other author (Y.S.).

포함 및 제외 기준
Inclusion and exclusion criteria

우리는 1985년에서 2020년 사이에 출판된 동료 검토 저널에서 의대 학생들을 위한 공식적인 교수 기술 훈련 주제를 다루는 영어 논문은 1985년에서 2020년 사이에 출판되었다. 우리는 SaT 문헌을 가능한 한 종합적으로 검토하고 지난 35년 동안 이 분야의 성장을 포착하기 위해 이 기간을 선택했습니다. 우리는 논평과 의견 기사를 배제했고, 학생들이 의료 교육생들을 가르치는 것과 무관한 기술을 가르치고 있는 연구는 제외했다. 우리는 또한 공식적인 교수 기술 교육이 없는 상태에서 근접 피어 교육이 이루어졌거나 제공된 교육이 설명되지 않은 연구를 제외했다. 선별된 기사를 모두 읽었으며, 참조 목록에서 포함 기준을 충족하는 추가 논문이 식별되었다.
We selected for review English-language papers in peer-reviewed journals published between 1985 and 2020 that addressed the topic of formal teaching skills training for medical students. We chose this time frame to review the SaT literature as comprehensively as possible and to capture the growth in this area over the past 35 years. We excluded commentaries and opinion pieces, as well as studies in which students were being taught skills unrelated to teaching medical trainees. We also excluded studies in which near-peer teaching took place in the absence of formal teaching skills training or in which the training provided was not described. Selected articles were read in full and additional papers meeting inclusion criteria were identified from their reference lists.

데이터 추상화 및 합성
Data abstraction and synthesis

두 명의 저자(A.C.와 E.R.C.)는 개입의 대상 독자, 기간, 커리큘럼 내용, 교수 및 평가 방법, 주요 보고 결과 등 관련 데이터를 추출하기 위해 포함 기준을 충족하는 모든 기사를 독립적으로 읽었다. 저자들은 또한 프로그램 평가를 위해 업데이트된 Kirkpatrick 모델을 사용하여 개별 SaT 개입의 결과를 분류했다. 그런 다음 모든 저자는 모든 연구 결과를 종합하고 CBME 문헌과 기타 결과 기반 교육 프레임워크를 통합하여 UME의 SaT 커리큘럼에 대한 구현 전략을 알렸다.

Two authors (A.C. and E.R.C.) independently read all articles that met the inclusion criteria to extract relevant data, such as the intervention’s target audience, duration, curriculum content, teaching and assessment methods, and key reported findings. The authors also categorized the outcomes of individual SaT interventions using the updated Kirkpatrick model for program evaluation. 14 All authors then synthesized all findings and integrated the CBME literature and other outcome-based educational frameworks to inform implementation strategies for SaT curricula in UME.

결과.
Results

중복을 제거한 후, 총 1,473개의 글이 우리의 문헌검색전략을 통해 확인되었으며, 이 중 43개의 글은 제목과 요약에 대한 철저한 검토와 함께 선정된 기사의 참조목록에 대한 검토를 거쳐 검토기준을 충족하였다(그림 1 참조). 이 중 33개는 다양한 의과대학에서 시행되는 특정 SaT 커리큘럼을 설명하고 평가하였다(부록 1 참조). 나머지 글에는 문헌 검토 3건, 의과대학 교수진 지도부 또는 의대생 설문조사 6건, 델파이 연구 1건 등이 포함됐다.
After duplicates were removed, a total of 1,473 articles were identified using our literature search strategy, of which 43 articles met the review criteria following a thorough examination of titles and abstracts, as well as a review of the selected articles’ reference lists (see Figure 1). Of these, 33 described and evaluated specific SaT curricula implemented at various medical schools (see Appendix 1). 15–47 The remaining articles included 3 literature reviews, 3,9,10 6 surveys of medical school faculty leadership or medical students, 5–7,48–50 and 1 Delphi study. 51

본 서사 검토 결과를 (1) UME의 SaT 커리큘럼 개요와 (2) SaT 커리큘럼 내용, 교수 양식 및 평가 방법의 두 부분으로 나누었다.
We divided the findings of this narrative review into 2 sections:

  • (1) overview of SaT curricula in UME and
  • (2) SaT curriculum content, teaching modalities, and assessment methods.

UME의 SaT 커리큘럼 개요
Overview of SaT curricula in UME


UME에서 SaT 커리큘럼의 보급률과 특성은 의과대학 교수 리더십에 대한 3개의 전국 설문조사에서 설명되었다. 대부분의 의과대학(89%–100%)은 학생들을 교사로 고용하지만(예: 동료 교사 또는 소규모 그룹 촉진자) 정규 교수 기술 교육은 덜 자주 제공된다(44%–82%). 더욱이, 그러한 훈련은 일반적으로 [본질적으로 선택적]이며, 대부분 상급생(즉, 의과대학 3학년 이상의 학생)에게 제공된다. 또한, 3개 국가 설문 조사 모두 시간 제약, 인력 제한, 주요 이해 관계자들에게 프로그램의 가치를 납득시키는 어려움, 학생 관심 부족 인식 등 [교육과정 구현에 대한 장벽]을 확인했다.

The prevalence and characteristics of SaT curricula in UME have been described in 3 national surveys of medical schools’ faculty leadership. 5–7 While most medical schools (89%–100%) engage their students as teachers (e.g., as peer tutors or small-group facilitators), formal teaching skills training is less frequently provided (44%–82%). Moreover, such training is usually optional in nature and is mostly offered to senior students (i.e., students in their third or higher year of medical school training). In addition, all 3 national surveys identified barriers to curriculum implementation, including time constraints, staffing limitations, difficulty in convincing key stakeholders of the program’s value, and perceived lack of student interest.

교수 기술 훈련은 6개 대륙의 의대생들을 대상으로 한 국제 설문 조사에서도 탐구되었다. 이 조사에서 응답자의 67%가 교사 역할(가장 일반적으로 P2P 상호 작용에서)에 참여한다고 답한 반면, 32%만이 교수 기술 교육을 받았다고 답했습니다. 교육 기술 교육은 고소득 국가(61%)에 비해 특히 중저소득 국가(82%)에서 가장 자주 강제적이지 않았다. 학생들이 교사 역할에 대해 스스로 보고한 준비는 사전 교육을 받은 것과도 관련이 있었다.
Teaching skills training was also explored in an international survey of medical students across 6 continents. 48 In this survey, while 67% of respondents reported engaging in the teacher role (most commonly in peer-to-peer interactions), only 32% reported having received teaching skills training. When offered, teaching skills training was most often noncompulsory, particularly in low- to middle-income countries (82%) as compared with high-income countries (61%). Students’ self-reported preparedness for the teacher role was also associated with having received prior training.


부록 1에 요약된 바와 같이 공식 교수 기술 교육을 제공한 33개의 발표된 SaT 커리큘럼을 검토할 때 유사한 결과가 확인되었다. 이러한 커리큘럼의 대부분은 상급 의대생(25/33)을 위해 개발되었으며, 본질적으로 선택 사항(27/33)이었다. 대부분의 커리큘럼은 [짧은 과정]으로 설명되었지만, 7개의 커리큘럼은 종단적인 경험으로 개발되었습니다. 이러한 종적 교육과정 중 2개는 의과대학 4년 전 과정에 걸쳐 진행되었으며, 나머지 5개는 3개월에서 2년까지 다양한 기간에 걸쳐 실시되었다. 저자들은 종단적인 과정 전달을 학생들이 과정 내용을 더 잘 동화시키고, 교수 기술을 연습하며, 교사로서의 역량을 키울 수 있는 유용한 전략으로 설명했다. 중요한 것은, 모든 저자들이 의대 학생들의 교사로서의 역할에 대한 준비를 강화할 필요성을 강조했다는 것이다. 

Similar findings were identified when reviewing the 33 published SaT curricula that provided formal teaching skills training, as summarized in Appendix 1. 15–47 The majority of these curricula were developed for senior medical students (25/33) 16,19–21,23–29,32,34–44,46,47 and were optional (27/33) 15,18,20–27,29–37,39–46 in nature. Most curricula were described as short courses, though 7 were developed as longitudinal experiences. 17,25,33,37,40,43,45 Of these longitudinal curricula, 2 spanned all 4 years of medical school, 17,33 and the remaining 5 were delivered over various periods of time, ranging from 3 months to 2 years. 25,37,40,43,45 The authors described longitudinal course delivery as a useful strategy for students to better assimilate the course content, practice their teaching skills, and develop their competence as teachers. 25,45 Importantly, all authors highlighted the need to enhance medical students’ preparation for their roles as teachers. 15–47

프로그램 평가를 위해 업데이트된 Kirkpatrick 모델의 4개 수준을 사용하여 발표된 33개 SaT 커리큘럼의 결과를 요약했다(그림 2 참조). 가장 일반적으로 측정된 결과는 학생 학습(레벨 2)이었다.

  • 리액션(레벨 1)과 관련하여 교육생들은 자신의 학습경험에 대한 만족도를 보고했으며, 교수기술교육과정 참여를 높게 평가했다. 
  • 학생 학습(레벨 2)과 관련된 조사 결과에는 다음이 포함되었습니다. 
    • 교육 원리에 대한 지식 증가
    • 미래의 교사 역할에 대한 자신감과 준비성의 향상 
    • 학문적 의학에서의 직업에 대한 이해나 관심을 증가
  • 행동의 변화(수준 3)는 자기보고가 가장 흔했다.
    • 7개의 연구에서, 학생들은 교수 기술의 향상을 보고했고,
    • 3개의 연구에서, 그들은 수업 자료를 그들의 교수실습에 적용했다고 보고했다.  
    • 8개 연구에서는 후배 학습자 및 교직원 감독관이 학생들의 교수능력을 높게 평가하였으며,
    • 1개 연구에서는 객관적 구조화 교수접촉(OSTe)에서 향상된 성과를 보였다.
  • 결과(레벨 4)는 2개 연구에서 탐색하였고,
    • 1개만이 학생의 학습자에게 긍정적인 영향을 미치는 것으로 나타났다.
    • 어떤 연구도 교수 기술 훈련이 학생 교사의 학습 능력에 미치는 영향을 조사하지 않았다.


Using the 4 levels of the updated Kirkpatrick model for program evaluation, 14 we summarized the outcomes of the 33 published SaT curricula (see Figure 2). The most commonly measured outcome was student learning (level 2). 15,17,20–22,24–29,33,36,37,40–43,45,46 

  • With regard to reaction (level 1), trainees reported satisfaction with their learning experiences and highly valued participating in a teaching skills training course. 16,17,19,21–23,25,26,28,32,35,37,39,41,44,45,47 
  • Findings pertaining to student learning (level 2) included
    • increased knowledge about teaching principles 15,17,42,45,46;
    • enhanced self-perceptions of confidence and preparedness for future teaching roles 15,20–22,24–29,33,37,40,42,45; and
    • increased understanding of, or interest in, careers in academic medicine. 20,22,24,36,41,43 
  • Changes in behavior (level 3) were most frequently self-reported. 15,18,20,22,24,33,39,45,46 
    • In 7 studies, students reported improvements in their teaching skills, 18,20,24,33,39,45,46 and
    • in 3, they reported having applied the course material to their teaching practices. 15,22,46 
    • In 8 studies, students’ teaching skills were rated highly by junior learners and/or faculty supervisors, 27,30,31,34,41,42,44,47 and
    • in 1 study, students demonstrated improved performance on an objective structured teaching encounter (OSTE). 22 
  • Results (level 4) were explored in 2 studies, 25,30 with only 1 documenting a positive impact on the students’ learners. 30 No studies examined the impact of teaching skills training on the student teachers’ abilities to learn.

 

이러한 결과는 이 서술적 검토에서 확인된 세 가지 검토 기사의 결과와 일치하며, 가장 흔히 보고된 결과는 [높은 학생 만족도]와 [과정 이수 후 스스로 생각하는 교수 기술 향상]이었다. 이러한 검토는 또한 학생들의 교수 기술 평가를 포함하여 커리큘럼 결과를 더 잘 평가할 필요가 있음을 강조했습니다.

These findings align with those of the 3 review articles identified in this narrative review, 3,9,10 whose most commonly reported outcomes included high student satisfaction and self-perceived improvement in teaching skills following course completion. These reviews also highlighted the need to better evaluate curricular outcomes, including assessing students’ teaching skills.

SaT 커리큘럼 내용, 교수 양식 및 평가 방법
SaT curriculum content, teaching modalities, and assessment methods

커리큘럼 내용.
Curriculum content.

문헌에 대한 우리의 검토는 SaT 커리큘럼 콘텐츠에 대한 다양한 이해 관계자들의 통찰력을 제공하는 많은 기사를 확인했다. 캐나다 의대생들을 대상으로 실시한 설문조사에서 수련자들은 다음의 교육 기술을 배우는데 관심이 있는 것으로 나타났다.  

  • 침대 머리맡 교육, 신체 검사 기술 가르치기, 소그룹 편의화, 멘토링 등

미국의 4학년 의대생들을 대상으로 실시한 또 다른 설문조사는 3가지 주제를 우선순위로 꼽았다.  

  • 피드백 제공, 문제해결 가르치기, 토론 리드하기 등 


Our review of the literature identified a number of articles that provide insights from different stakeholders regarding SaT curriculum content. 3,6,7,49–51 A survey conducted among Canadian medical students identified trainees’ interest in being taught the following teaching skills:

  • bedside teaching, teaching physical examination skills, small-group facilitation, and mentorship. 50 

Another survey, conducted among senior medical students in the United States, identified the following 3 topics as priorities:

  • providing feedback, teaching problem-solving, and leading discussions. 49

국가 델파이 연구에서, 미국의 의료 교육자 패널은 SaT 커리큘럼에 필수적이라고 여겨지는 5가지 콘텐츠 영역을 식별했습니다:

  • 침대 옆 교수와 임상 지도, 소그룹 교육, 사례 기반 교육, 피드백 제공, 의료 교육자로서의 전문직업성

In a national Delphi study, a panel of medical educators in the United States identified 5 content areas believed to be essential for SaT curricula:

  • bedside teaching and clinical precepting, small-group teaching, case-based teaching, providing feedback, and professionalism as a medical educator. 51 

문헌 검토에서, Dandavino et al. SaT 커리큘럼의 3가지 권장 목표: 

  • (1) 학생들에게 교육의 기본 원칙과 효과적인 가르침에 대한 지식을 제공
  • (2) 학생들의 교육 기술과 교육 전략 사용(예: 프레젠테이션, 선도적인 소규모 그룹, 임상 교육)을 향상
  • (3) 교육에 대한 긍정적인 태도를 육성한다(예: 교사 역할의 중요성 인식).

In their review of the literature, Dandavino et al 3 recommended 3 key SaT curricular objectives:

  • (1) to provide students with knowledge about the basic principles of education and effective teaching,
  • (2) to improve students’ education skills and their use of teaching strategies (e.g., giving presentations, leading small groups, clinical teaching), and
  • (3) to foster positive attitudes toward teaching (e.g., recognizing the importance of the teacher role).

교직원 리더십 설문조사를 통해 파악된 가장 일반적인 교육과정 내용 영역은 소그룹 촉진, 성인학습의 원칙, 효과적인 피드백 제공이었다. 마찬가지로, 발표된 SaT 커리큘럼에 일반적으로 통합된 주제에는 소그룹 촉진, 임상 교수, 성인 학습 이론, 피드백 및 평가가 포함되었다. 

The most common curriculum content areas identified through faculty leadership surveys were small-group facilitation, principles of adult learning, and providing effective feedback. 6,7 Similarly, topics commonly incorporated into the published SaT curricula included small-group facilitation, clinical teaching, adult learning theory, and feedback and evaluation. 15–47

교육 방식.
Teaching modalities.

이 검토의 제한된 수의 기사들은 SaT 커리큘럼에 가장 적합한 교육 방식에 대한 구체적인 권고안을 제시했습니다. 단다비노 등은 강의, 소그룹 토론, 온라인 모듈, 역할극 활동을 잠재적 교수양식으로 제시했다.
A limited number of articles in this review made specific recommendations regarding the teaching modalities that are best suited for SaT curricula. 3,5–7 Dandavino et al 3 suggested lectures, small-group discussions, online modules, and role play activities as potential teaching modalities.

3개의 교수진 리더십 설문조사에 따르면, 일반적인 교수 방식은 소그룹 업무, 강의, 역할극을 포함했다. 5-7 발표된 SaT 커리큘럼 중 교육 방식은 상당히 다양했으며,

> 특히 소규모 그룹 토론(14/33)과 강의 세션(14/33)이 일반적이었다. 이들 연구 중 3개 연구에서 학생들은 일방향 강의에 비해 대화형 학습(예: 소그룹 활동)을 선호하는 것으로 나타났다.

> 또한, 일부 커리큘럼은 역할극 활동(11/33), 성찰 연습(8/33), 워크숍(6/33), 온라인 모듈 및 자원(5/33), 학술 또는 교육 프로젝트(4/33) 및 교직원 관찰을 통한 학습(4/33)을 포함했다.

> 주니어 교육생들을 가르치는 실제 경험은 출판된 커리큘럼의 약 82%(27/33)의 구성 요소였다.  학생 교사들은 이러한 경험적 학습에 특별한 감사를 표시했으며, 많은 경우 교직원, 동료 및/또는 학생들의 학습자의 피드백과 결합되었다. 

According to 3 faculty leadership surveys, common teaching modalities included small-group work, lectures, and role play. 5–7 Of the published SaT curricula, teaching modalities varied significantly,

In 3 of these studies, students expressed a preference for interactive learning (e.g., small-group activities) as compared with didactic lectures. 20,29,45 In addition, some curricula involved

Practical experience in teaching junior trainees was a component of approximately 82% of the published curricula (27/33). 15,17–20,23–27,29–34,36–39,41–47 Student teachers indicated a particular appreciation for this experiential learning, 22,33,37–39,45,47 which in a number of cases was coupled with feedback from faculty members, peers, and/or the students’ learners. 15,17,19,20,23–25,27,29,31–33,36,38,39,43–45,47

평가 방법.
Assessment methods.

많은 평가 방법이 사용되었지만, 이 검토의 단 2개의 논문만이 의대생들의 교수 능력을 평가하기 위한 최선의 방법을 명시적으로 논의하였다.

  • Dandavino 등은 [자기평가 도구, 필기시험 문제, 학생들의 학습자의 피드백, 그리고 학생 교사의 관찰(예: OSTE)의 조합]을 통해 학습을 평가해야 한다고 제안했다.
  • 마찬가지로, Marton 외 9는 검토에서 [교육 기술을 OEST를 통해 평가하고, 숙련된 교수진의 관찰, 설문조사를 통한 학생 학습자의 피드백]을 통해 평가해야 한다고 권고했다.

이러한 방법의 한계도 강조되었는데, 여기에는 OEST의 비용과 시간이 많이 소요되는 특성, 학생들을 관찰하는 데 시간을 기꺼이 바치려는 교수진의 모집, 열악한 설문 응답률 등이 포함된다. 
Although many assessment methods have been used, only 2 articles in this review explicitly discussed the best methods for assessing the teaching skills of medical students. 3,9 

  • Dandavino et al 3 suggested that learning be assessed through a combination of self-assessment instruments, written examination questions, feedback from the students’ learners, and observation of the student teachers (e.g., OSTEs).
  • Similarly, in their review, Marton et al 9 recommended that teaching skills be assessed through OSTEs, observation by experienced faculty staff, and feedback from the students’ learners through the use of surveys.

Limitations of these methods were also highlighted, including the cost and time-consuming nature of OSTEs, the recruitment of faculty members willing to dedicate time to observing students, and poor survey response rates. 9

교수진 리더십에 대한 설문조사에 따르면 학생들의 교수 능력에 대한 평가는 매우 다양하다. 5-7 미국에서는 대부분의 교육 기술 교육 커리큘럼(95%)이 학생들의 교육 기술 평가를 포함하지만, 호주 프로그램의 36%에 대해서만 같은 말을 할 수 있다. 평가 방법 또한 다양하며, 학생들의 학습자의 피드백, 가르침에 대한 직접적인 관찰, 성찰 작업, 그리고 자기 평가 설문지를 포함한다. 또한 발표된 SaT 커리큘럼 중 직접 관찰(실시간, 비디오 테이프 교육 세션을 통한 또는 시뮬레이션된 환경에서)이 학생들의 교육 기술 평가 방법으로서 가장 많이 보고되었다. 이러한 직접적인 관찰에 수반되는 피드백은 학생 교사들에 의해 가치 있는 과정 구성 요소라고 추가로 설명되었다. 

According to surveys of faculty leadership, the assessment of students’ teaching skills is highly variable. 5–7 While in the United States, most teaching skills training curricula (95%) include the assessment of students’ teaching skills, the same can be said for only 36% of Australian programs. 5,7 Methods of assessment also vary and include feedback from the students’ learners, direct observation of teaching, reflective work, and self-assessment questionnaires. 6,7 Moreover, of the published SaT curricula, direct observation (in real-time, through video-taped teaching sessions, or in a simulated environment) was the most commonly reported assessment method of students’ teaching skills. 15,17,19,20,22–27,29–33,35,36,38,39,43–45,47 The feedback accompanying this direct observation was additionally described by student teachers to be a valued course component. 29,33,38,44

논의
Discussion

본 서사 검토의 목적은 현재 UME에서 [공식적 교수teaching 기술 교육]에 대해 알려진 내용을 탐색하여 SaT 커리큘럼 개발에 대한 정보를 제공하는 데 있었다. 우리의 연구 결과는 의대생들이 종종 교수 역할에 참여하지만, [공식적 교수 기술 교육]은 덜 자주 제공된다는 것을 확인시켜 준다. 교사 역할을 위한 준비를 제공하는 SaT 커리큘럼 중 대부분은 의대 4학년 학생들을 대상으로 하며 선택 과목이다. 또한, 이러한 커리큘럼의 약 5분의 1만이 종단적으로 전달되지만, 저자는 교육생들이 교재를 흡수하고, 교수 기술을 연습하고, 교사로서 역량을 키우는데 확장된 형식이 유용하다고 제안한다.

  • SaT 커리큘럼의 다양한 이점이 보고되었으며, 성과로는 긍정적인 학생 반응, 미래의 교사 역할에 대한 자신감 및 준비성 강화, 학술academic 진로에 대한 관심 증가 등이 있다.
  • 커리큘럼 구현에 대한 잠재적 장벽에는 시간 제약, 인력 제한, 프로그램의 가치에 대한 이해 관계자의 설득의 어려움, 학생 관심 부족이 포함된다.

또한, 기존 SaT 문헌은 SaT 커리큘럼 내용에 대한 다양한 이해 관계자의 통찰력을 제공하지만, 교수 양식 및 평가 방법과 관련된 모범 사례에 대한 출판은 적다.
The goal of this narrative review was to explore what is currently known about formal teaching skills training in UME to inform SaT curriculum development. Our findings confirm that while medical students often engage in teaching roles, formal teaching skills training is less frequently provided. Of the SaT curricula that provide preparation for the teacher role, most target senior medical students and are elective courses. Moreover, although only about one-fifth of these curricula are delivered longitudinally, authors suggest that an extended format is useful for trainees to assimilate the material, practice their teaching skills, and develop competence as teachers.

  • Various benefits of SaT curricula have been reported, and findings include positive student reaction, enhanced self-reported confidence and preparedness for future teaching roles, and increased interest in pursuing an academic career15–47 
  • Potential barriers to curriculum implementation include time constraints, staffing limitations, difficulty in convincing stakeholders of the program’s value, and perceived lack of student interest. 5–7 

In addition, although the existing SaT literature provides insights from various stakeholders regarding SaT curriculum content, less has been published regarding best practices with respect to teaching modalities and assessment methods.


우리의 연구는 저자들이 포괄적인 SaT 커리큘럼 권장사항의 예비 세트를 제공하는 Dandavino 등의 2007년 문헌 검토를 기반으로 한다. 우리는 그 사이에 발표된 SaT 커리큘럼뿐만 아니라 델파이 연구 및 이해관계자 조사와 같은 커리큘럼 권장 사항을 풍부하게 하는 다른 UME 중심 기사를 포함함으로써 그들의 문헌 검색을 확장했다. 우리의 연구 결과를 바탕으로, 우리는 CBME의 원칙에 부합하고 결과 기반 교육 프레임워크에 의해 정보를 제공하는 SaT 커리큘럼 개발을 위한 전략을 제안한다. 보다 구체적으로, 우리는 SaT 커리큘럼 채택에 관심이 있는 이해관계자 그룹이 고려할 수 있는 커리큘럼 내용, 교육 양식 및 평가 방법에 대한 권고사항뿐만 아니라 SaT 커리큘럼에 대한 4가지 가이드 원칙을 제안한다.

Our work builds on Dandavino et al’s 3 2007 review of the literature, in which the authors provide a preliminary set of comprehensive SaT curricular recommendations. We have expanded on their literature search by including SaT curricula published in the intervening years, as well as other UME-focused articles that enrich our curricular recommendations, such as a Delphi study and stakeholder surveys. 5–7,48–51 Based on our findings, we propose strategies for SaT curriculum development, which are aligned with the principles of CBME and informed by outcome-based educational frameworks. 8,52–54 More specifically, we propose 4 guiding principles for SaT curricula, as well as recommendations regarding curriculum content, teaching modalities, and assessment methods, which may be considered by stakeholder groups interested in adopting SaT curricula.

SaT 커리큘럼을 위한 가이드 원칙
Guiding principles for SaT curricula

SaT 커리큘럼에 대해 제안하는 4가지 지침 원칙은 다음과 같습니다.

The 4 guiding principles we propose for SaT curricula are:

  1. 교수 기술 훈련은 UME 수준에서 공식적으로 시행되어야 하며, 가능할 때마다 필수 커리큘럼 구성 요소가 되어야 한다. UME 프로그램이 일상적으로 학생들을 교사 역할에 참여시킨다는 증거에도 불구하고, 학생들은 종종 공식적으로 교육적 책임teaching responsibilities에 대한 준비가 되어 있지 않다. 우리의 문헌 검토에서 확인된 대부분의 SaT 커리큘럼은 선택 과목으로 제공되었다. 일부 UME 인증 기관이 교육을 훈련 기대치로 확인했다는 점을 감안할 때, 이 교육을 선택적으로 제공하거나 사전 교육 없이 학생들을 교사 역할에 참여시키는 것은 미래의 교사 역할에 대한 광범위한 준비를 보장하지 않는다. 또한, 교수직은 의무교육생이 대학원 연수 초기에 반드시 수행해야 하는 [의무적 책무]라는 점에서 학부 수준에서 이 분야에 대한 기초적 기술을 부여하는 것이 중요하다. CBME의 원칙에 따르면, 프로그램은 교육생들이 그들이 맡을 다양한 역할에 적절하게 준비되도록 보장할 책임이 있으며, 따라서 교수 기술 훈련은 이상적으로 UME 커리큘럼의 필수 구성 요소가 되어야 한다.
  2. Teaching skills training should be formally implemented at the UME level and should, whenever possible, be a compulsory curricular component. Despite evidence that UME programs routinely engage students in teaching roles, students are often not formally prepared for their teaching responsibilities. 5–7,48 Most SaT curricula identified in our literature review were offered as elective courses. Given that some UME accrediting bodies have identified teaching as a training expectation, 52–54 providing this training optionally or engaging students in teaching roles without prior training does not ensure widespread preparedness for future teaching roles. 3,5,7,16,28,47 Moreover, imparting foundational skills in this area at the undergraduate level is relevant given that teaching is a mandatory responsibility that medical trainees must undertake early in postgraduate training. 3,4 According to the principles of CBME, programs have the responsibility of ensuring that trainees are adequately prepared for the various roles that they will assume, 8 and as such, teaching skills training should ideally be a mandatory component of UME curricula.
  3. 교수 기술은 UME에서 PGME까지 연속체를 따라 종단적으로 그리고 점진적으로 가르쳐야 한다. 문헌에 기술된 대부분의 SaT 커리큘럼은 상급생에게만 제공되고 짧은 과정으로 제공되었지만, 그러한 커리큘럼은 이상적으로 의과대학의 모든 해에 걸쳐 있어야 한다. CBME 원칙에 따라, SaT 커리큘럼은 종단 연속체를 따라 점진적으로 배열된 다양한 교육 기술을 포함해야 하며, 따라서 trainee가 훈련을 진행하면서 겪을 것이라 가정하는 다양한 교육 역할을 반영해야 한다. 종단적 접근은 또한 교육 개념의 동화를 촉진하고 교육자가 교육 기술을 연마함에 따라 자신감을 형성할 수 있다. 25,45 예를 들어, 학생들에게 피드백을 제공하도록 가르치는 것은 효과적인 피드백의 이론과 원리에 대한 소개로 시작할 수 있다. 이후 세션에서는 다양한 환경에서 피드백을 제공하기 위한 다양한 전략을 다루어 교육생들이 레지던시를 시작할 때 이 책임을 더 잘 준비할 수 있도록 할 수 있습니다. undergraduate teaching skill 훈련 목표를 postgraduate teaching의 기대와 일치시키는 것 또한 3개의 발표된 SaT 커리큘럼의 저자들에 의해 목표로 강조되었다. 이러한 이상은 ACGME (Creditation Council for Graduate Medical Education) 후원 기관 2025 태스크 포스의 지지를 받고 있으며, PGME에 대한 미래 비전은 의과대학과 레지던트 간의 정렬을 강화하고 원활한 전환을 장려한다. 이 비전 내에서 UME 커리큘럼에 공식적으로 교수 기술 교육을 통합하면 대학원 교육이 보다 고급스럽고 전문화된 교수 역량을 목표로 삼을 수 있습니다.  
  4. Teaching skills should be taught longitudinally and progressively along the UME to PGME continuum. While most of the SaT curricula described in the literature were only delivered to senior students and were offered as short courses, such curricula should ideally span all years of medical school. 3,33,45 In line with CBME principles, SaT curricula should include a variety of teaching skills sequenced progressively along a longitudinal continuum, thus reflecting the different teaching roles that trainees assume as they progress in their training. 55 A longitudinal approach can also foster the assimilation of teaching concepts and build trainees’ confidence as they hone their teaching skills. 25,45 For example, teaching students to provide feedback could begin with an introduction to the theory and principles of effective feedback. A later session could address various strategies for providing feedback in different settings such that trainees would be better prepared for this responsibility upon beginning residency. Aligning undergraduate teaching skills training objectives with postgraduate teaching expectations was also highlighted as a goal by the authors of 3 published SaT curricula. 19,28,37 This ideal is supported by the Accreditation Council for Graduate Medical Education (ACGME) Sponsoring Institution 2025 Task Force, whose future vision for PGME encourages increased alignment and a smoother transition between medical school and residency. 56 Within this vision, formally integrating teaching skills training in UME curricula could allow postgraduate training to target more advanced, specialty-specific teaching competencies. 7
  5. SaT 커리큘럼 내용은 학교의 기존 커리큘럼 및 지역 맥락과 일치해야 한다. 내용은 의과대학의 교육과정 구조와 시간적으로 관련이 있어야 한다. 적절하고 상황에 맞는 기술을 가르치는 것은 교육생들이 훈련에서 특정 시간에 수행해야 할 교육 역할에 대비하는 데 도움이 될 것이다. 예를 들어, 특정 학교의 의대생들이 소그룹 리더가 될 것으로 예상된다면, 그들이 이러한 역할에 참여하기 전에 소그룹을 이끄는 것과 관련된 SaT 커리큘럼 내용을 가르쳐야 한다. 마찬가지로, 임상 교습과 관련된 전략은 임상 로테이션과 근접하게 배치하는 것이 가장 좋다. 또한, 학교의 기존 커리큘럼 내에서 SaT 이니셔티브를 통합할 수 있는 기회를 식별하면 시간 제약과 교직원 및 교육생 매수 등 구현에 대한 알려진 장벽을 해결하는 데 도움이 될 수 있다.
  6. SaT curriculum content should be aligned with a school’s preexisting curriculum and local context. Content should be temporally relevant to the structure of a medical school’s curriculum. Teaching pertinent and context-appropriate skills will help prepare trainees for the teaching roles they are expected to fulfill at specific times in their training. 3,28,57 For example, if medical students at a particular school are expected to be small-group leaders, then the SaT curriculum content relevant to leading small groups should be taught prior to them engaging in these roles. Similarly, strategies related to clinical teaching would be best placed proximal to clinical rotations. Furthermore, identifying opportunities to integrate SaT initiatives within a school’s existing curriculum could help address known barriers to implementation, namely, time constraints and faculty and trainee buy-in. 5–7
  7. 학생들이 교사 역할에 참여할 수 있는 [진정한 기회]가 SaT 커리큘럼에 통합되어야 한다. 경험 및 업무 기반 학습에 관한 문헌 57,58은 의대 학생들이 미래에 이러한 기술을 수행할 자연 환경을 밀접하게 반영하는 활동에 참여함으로써 이상적으로 학습 성과를 달성한다는 것을 시사한다. 실용적인 교수 경험은 많은 SaT 커리큘럼에 통합되었고 의대생들에게 가치 있는 것으로 알려져 있다. 이러한 경험적 학습을 촉진하는 진정한 교수 기회는 교육생들이 새롭게 습득한 기술에 대해 연습하고 피드백을 받을 수 있도록 정기적으로 SaT 커리큘럼에 통합되어야 한다.
  8. Authentic opportunities for students to engage in teaching roles should be incorporated into SaT curricula. The literature on experience- and work-based learning 57,58 suggests that medical student learning outcomes are ideally attained through participation in activities that closely reflect the natural environment in which they will be performing these skills in the future. Practical teaching experiences have been integrated into many SaT curricula 15,17–20,23–27,29–34,36–39,41–47 and are known to be valued by medical students. 22,33,37–39,45,47 These authentic teaching opportunities, which promote experiential learning, should be routinely incorporated into SaT curricula so trainees can practice and receive feedback on their newly acquired skills.

커리큘럼 내용, 교육 양식 및 평가 방법에 대한 권장 사항
Recommendations for curriculum content, teaching modalities, and assessment methods

커리큘럼 내용.
Curriculum content.

SaT 커리큘럼 내용은 여러 이해관계자의 관점에서 문헌에서 탐구되었다. 교수 기술 훈련에 대한 기대도 다양한 수준으로 UME 및 PGME 결과 기반 프레임워크에 통합되었습니다. 예를 들어, UME 수준에서 스코틀랜드 의사 프레임워크(스코틀랜드)와 내일 의사 프레임워크(영국)는 교육 결과에 교사 역할을 포함하지만 커리큘럼 내용에 대한 특정 권장 사항을 제공하지는 않는다. 미국의학교육연락위원회와 캐나다의학대학원 인가위원회는 모두 standards를 통해 의학생을 감독하거나 가르치는 사람(예: 전공의, 대학원생, 박사후 펠로우)이 "교습 및 평가에서 자신의 역할에 대해 준비되어야" 하며, 의과대학은 이러한 기술을 향상시킬 수 있는 자원을 제공해야 한다고 명시하고 있다. 그러나 이러한 표준은 의대생을 명시적으로 교사로 지칭하지 않으며 [특정 커리큘럼 권장사항]을 알릴 수 있는 지침을 포함하지 않는다.
SaT curriculum content has been explored in the literature from the perspectives of multiple stakeholders. 3,5,7,15–47,49,50 Expectations for teaching skills training have also been incorporated, to various degrees, into UME and PGME outcome-based frameworks. For example, at the UME level, the Scottish Doctor framework (Scotland) 54 and the Tomorrow’s Doctors framework (United Kingdom) 53 include the teacher role in their training outcomes, though they do not provide specific recommendations regarding curriculum content. Both the Liaison Committee on Medical Education in the United States and the Committee on Accreditation of Canadian Medical Schools in Canada indicate in their standards that individuals who supervise or teach medical students (e.g., residents, graduate students, postdoctoral fellows) should be “prepared for their roles in teaching and assessment” and that the medical school should provide resources to enhance these skills. 59,60 These standards, however, do not explicitly refer to medical students as teachers and do not include guidelines that could inform specific curricular recommendations.

PGME 수준에서 미국의 ACGME는 Outcome Project 내에 [전공의의 교수자 역할]과 관련된 훈련 기대치를 포함하지만, 이러한 기대치는 여러 역량에 포함되므로 교수 기술 커리큘럼 개발에 대한 제한된 input만을 제공한다. 이와는 대조적으로, 캐나다 왕립 의과대학(Royal College of Canada)의 CanMEDs 프레임워크는 전 세계의 많은 학부 및 대학원 의학 프로그램에 채택되어 왔으며, 교육생들이 Scholar role에서 졸업 전에 달성해야 하는 명확한 교수 역량을 개략적으로 설명하고 있다. 구체적으로, CanMEDs scholar role의 역량에는 다음이 있다.

  • 학습 활동 계획 및 전달,
  • 피드백 제공,
  • 학습자와 교사 평가 및 프로그램 평가,
  • 환자와 학습자를 위한 안전한 환경 촉진,
  • 역할 모델링 

At the PGME level, while the ACGME in the United States includes training expectations related to the resident’s teacher role within their Outcome Project, these are embedded within several of their competencies and therefore provide limited input for the development of teaching skills curricula. 61 In contrast, the CanMEDS framework of the Royal College of Physicians and Surgeons of Canada, which has been adopted by many undergraduate and postgraduate medical programs worldwide, 52,62 outlines clear teaching competencies that trainees must attain before graduation under the scholar role. Specifically, the competencies of the CanMEDS scholar role include

  • planning and delivering a learning activity,
  • providing feedback,
  • assessing learners and teachers and evaluating programs,
  • promoting a safe environment for patients and learners, and
  • role modeling. 52

도표 1에서는 주요 이해관계자가 제안한 SaT 커리큘럼 내용을 요약한다. 특히 의학교육자 및 의대생들이 제안하는 SaT 커리큘럼 내용은 대부분 CanMEDs 장학사 역할역량인 피드백 제공 및 학습활동 계획 및 전달에 포함된다. 또한 위에서 언급한 바와 같이, CanMEDs 프레임워크는 학습자와 교사를 평가하고 환자와 학습자를 위한 안전한 환경을 촉진하는 것을 포함한다. UME 훈련 목표를 기존 PGME 역량과 일치시키기 위한 목적으로, 우리는 이러한 주제에 대한 소개를 SaT 커리큘럼에 포함할 것을 제안한다.

In Chart 1, we summarize the SaT curriculum content that has been proposed by key stakeholders. Notably, most of the SaT curriculum content suggested by medical educators and medical students is encompassed within the CanMEDS scholar role competencies of providing feedback and planning and delivering a learning activity. Additionally, as noted above, the CanMEDS framework includes assessing learners and teachers and promoting a safe environment for patients and learners; with the goal of aligning UME training objectives with existing PGME competencies, we suggest that an introduction to these topics be included in SaT curricula.

[역할 모델링]은 CanMEDs 학자 역할에서 제안된 또 다른 콘텐츠 영역이다. UME에서 교육 역할 모델링에 대한 문헌은 희박하지만, 전공의 롤모델은 초기 교육 단계에서 학습자 훈련에서 핵심적인 역할을 하는 것으로 밝혀졌다. 전공의에게 능동적 롤모델링을 가르치는 것도 그들의 임상 교수 기술을 향상시키는 방법으로 제안되었다. 따라서, UME 수준에서 이 기술을 가르치는 것은 학생들이 동료 역할 모델로서의 현재 위치와 [전공의 롤모델]로서의 미래 위치에 대비하는 데 적절할 것이다. 
Role modeling is another content area proposed in the CanMEDS scholar role. 52 While the literature about teaching role modeling in UME is sparse, resident role models have been found to play a key role in the training of learners at earlier educational stages. 63 Teaching active role modeling to residents has also been suggested as a way to improve their clinical teaching skills. 64 As such, teaching this skill set at the UME level would be pertinent to prepare students for their current positions as peer role models and their future positions as resident role models. 25,65

의학교육자와 의대생 50명이 추가로 제안한 주제로는 의학교육자로서의 전문직업성, 멘토링 등이 포함됐다. 이 두 가지 개념은 미래 교육자로서 교육생의 정체성 형성에 역할을 하는 것으로 부각되었으며, 따라서 SaT 교육과정에 포함시키는 데 가치가 있을 것이다. 의대생들이 멘토 역할을 할 수 있도록 준비해야 할 필요성은 내일의 의사 프레임워크에서도 뒷받침된다. 
Additional topics proposed by medical educators 51 and medical students 50 included professionalism as a medical educator and mentorship. These 2 concepts were highlighted as playing a role in trainees’ identity formation as future educators, and as such, would be worthwhile for inclusion in SaT curricula. 46 The need to prepare medical students for their roles as mentors is also supported by the Tomorrow’s Doctors framework. 53

따라서 SaT 커리큘럼에 포함시킬 수 있는 다음 5가지 콘텐츠 영역을 권장합니다. 

  • (1) 학습 활동 계획 및 제공 
  • (2) 피드백 제공
  • (3) 교사와 학습자 평가
  • (4) 안전한 학습 환경 촉진 
  • (5) 의료 교육자로서 역할 모델링, 멘토링 및 전문직업성.

We therefore recommend the following 5 content areas for inclusion in SaT curricula:

  • (1) planning and delivering a learning activity;
  • (2) providing feedback;
  • (3) assessing teachers and learners;
  • (4) promoting a safe learning environment; and
  • (5) role modeling, mentorship, and professionalism as a medical educator.

교육 방식.
Teaching modalities.

이 검토의 연구는 의대 학생들이 SaT 과정에 대해 대화형 교수 전략(예: 소그룹 활동)을 선호한다고 보고했지만, 추가적인 증거는 학생들이 일방향 강의식 세션이 아닌 소그룹에서 자료를 가르칠 때 자기주도적 학습자가 되고 시험에서 더 나은 성과를 낸다는 것을 나타낸다. 이 리뷰에서 학생들은 또한 SaT 과정에 통합된 실질적인 교수 기회에 감사를 표했다. 이 전략은 경험 및 업무 기반 학습 문헌에 의해 더욱 뒷받침되는데, 이는 학생들에게 교수 경험을 제공하는 것이 그들이 그들의 교수 기술을 적용하고 통합하는 데 도움이 된다는 것을 나타낸다. 또한 실습경험과 의미있는 피드백 및 성찰을 결합하여 학생들의 학습을 향상시키는 것으로 나타났다.
 
While the studies in this review have reported that medical students prefer interactive teaching strategies (e.g., small-group activities) for their SaT courses, 20,29,45 additional evidence indicates that students become self-directed learners and perform better on examinations when material is taught in small groups rather than didactic sessions. 66,67 In this review, students also expressed appreciation for the practical teaching opportunities that were integrated into their SaT courses 22,33,37–39,45,47; this strategy is further supported by the experience- and work-based learning literature, which indicates that providing students with teaching experience helps them apply and consolidate their teaching skills. 57,58 Furthermore, coupling practical experience with meaningful feedback and reflection has been shown to enhance students’ learning. 17,19,24,25,45–47,57,68


따라서 우리는 [피드백과 성찰 기회가 내장된 진정한authentic 실습 교육 경험]뿐만 아니라, [소규모 그룹 토론, 대화형 강의 및 역할극 활동]과 같은 [다양한 상호작용형 교육 방식]을 통해 SaT 커리큘럼 콘텐츠를 학습할 것을 권장합니다. 이러한 권고안은 온라인 교육 및 학습을 향한 중요한 피벗이 있던 시기인 글로벌 팬데믹 동안 작성되었으므로 69 우리는 또한 과정 전달을 위해 웹 기반 모듈과 온라인 플랫폼을 고려할 것을 제안한다.

We therefore recommend that SaT curriculum content be learned through a variety of interactive teaching modalities, such as small-group discussions, interactive lectures, and role play activities, as well as authentic hands-on teaching experiences with built-in opportunities for feedback and reflection. As these recommendations were written during a global pandemic, a time in which there has been a significant pivot toward online teaching and learning, 69 we also suggest that web-based modules and online platforms be considered for course delivery.

평가 방법.
Assessment methods.

우리가 아는 한, 발표된 SaT 커리큘럼에 다양한 평가 방법이 사용되었지만, 의대 학생들의 교수 기술을 평가하기 위한 모범 사례를 명시적으로 평가한 연구는 없다. 그러나 이전 검토에서는 OSTE, 학생 교사의 직접 관찰, 학생의 학습자가 제공하는 피드백 및 자체 평가 도구를 사용할 것을 제안했다. PGME 수준에서 커버데일 등은 많은 자가 관리 설문지가 전공의의 교육 기술을 평가하는 유효하고 신뢰할 수 있는 수단이 될 수 있지만, 이러한 설문지는 교사와 학습자 사이의 복잡한 상호작용을 포착하지 못한다고 주장했다. 저자들은 최종적으로 OSTE가 가장 엄격하고 신뢰할 수 있는 평가 방법이라는 결론을 내렸다. 그러나 OSTE의 재정적 비용과 관리 부담은 고려해야 할 한계이다. 대안적 접근법은 교육생의 교육 기술을 직접 관찰하여 평가하는 것이 될 수 있으며, 이는 시기적절하고 효과적인 피드백과 결합되어 CBME 문헌에서 유용한 평가 방법으로 강조되었다.
To our knowledge, although a variety of assessment methods have been used in the published SaT curricula, no study has explicitly evaluated best practices for assessing medical students’ teaching skills. However, previous reviews have suggested using OSTEs, direct observation of student teachers, feedback provided by the students’ learners, and self-assessment instruments. 3,9 At the PGME level, Coverdale et al 70 argued that while many self-administered questionnaires may be valid and reliable means of assessing residents’ teaching skills, these questionnaires do not capture the complex interplay between teachers and learners. The authors ultimately concluded that the OSTE was the most rigorous and reliable assessment method. The financial costs and administrative burdens of OSTEs are, however, limitations which need to be taken into account. 9 An alternative approach could be to assess trainees’ teaching skills by direct observation, which coupled with timely and effective feedback, has been highlighted as a useful assessment method in the CBME literature. 8

따라서 우리는 OSTE 또는 다른 형태의 직접 관찰을 학생들의 교육 기술 평가에 포함할 것을 권고한다. 이러한 평가 전략을 교직원과 학생들의 학습자 모두의 피드백으로 보완하는 것도 도움이 될 것입니다.
We therefore recommend that OSTEs or other forms of direct observation be included in the assessment of students’ teaching skills. Supplementing these assessment strategies with feedback from both faculty members and the students’ learners would also be beneficial.

제한 사항
Limitations

이러한 검토는 비교적 적은 수의 관련 연구로 제한되는데, 이는 공식적인 교수 기술 훈련을 포함하는 SaT 커리큘럼을 가진 모든 의과대학이 자신의 경험을 설명하는 기사를 출판하는 것은 아니라는 사실로 설명할 수 있다. 다른 제한 사항으로는 영어로 제공되지 않는 기사를 제외하는 것과 검색 전략이 학술지 출판물로 제한되었다는 사실이 있다. 우리는 교사 역할을 명시적으로 통합하는 3가지 결과 기반 교육 프레임워크를 식별했지만, 회색 문헌에 대한 보다 포괄적인 검토는 우리의 발견과 권고 사항을 알릴 수 있었던 추가 프레임워크를 드러냈을 수 있다.
This review is limited by a relatively low number of pertinent studies, which can be explained by the fact that not all medical schools with SaT curricula incorporating formal teaching skills training publish articles describing their experiences. Other limitations include our exclusion of articles not available in English, and the fact that our search strategy was limited to academic journal publications. While we identified 3 outcome-based educational frameworks that explicitly incorporate the teacher role, 52–54 a more comprehensive review of the gray literature may have revealed additional frameworks that could have informed our findings and recommendations.

향후 방향
Future directions

앞으로, 공식적인 교수 기술 훈련을 포함하는 세로형 SaT 커리큘럼의 구현을 평가하는 연구가 필요하다. 업데이트된 Kirkpatrick 모델의 수준 3(행동)과 4(결과)를 목표로 하는 SaT 커리큘럼의 보다 강력한 프로그램 평가가 가치 있을 것이다. 행동 수준에서 프로그램 평가를 포함하는 많은 연구를 발견했지만, 그들의 연구 결과는 자기보고가 가장 흔했다. 단기 및 장기(예: 대학원 및 참석 직원 수준) 모두에서 학생 교사의 교육 능력과 커리큘럼 기여도에 대한 SaT 커리큘럼의 영향을 객관적으로 평가하는 것이 유익할 것이다. 또한 SaT 커리큘럼에 참여하는 학생들이 스스로 더 나은 학습자가 되는지를 조사하는 것도 흥미로울 것이다. 교수 기술 훈련이 학생들의 학습 성과에 미치는 영향을 추가로 조사하는 것은 또 다른 귀중한 탐구 영역이 될 수 있다. 지속가능성과 커리큘럼 구현에 대한 알려진 장벽을 해결하기 위한 전략뿐만 아니라 SaT 교수 양식 및 평가 방법에 대한 모범 사례에 대한 추가 연구는 커리큘럼 권장 사항을 추가로 제공할 것이다.

Moving forward, studies evaluating the implementation of longitudinal SaT curricula incorporating formal teaching skills training are needed. More robust program evaluations of SaT curricula targeting levels 3 (behavior) and 4 (results) of the updated Kirkpatrick model 14 would be worthwhile. Although we found many studies that included program evaluations at the level of behavior, their findings were most commonly self-reported 15,18,20,22,24,33,39,45,46; it would be beneficial to objectively evaluate the impact of SaT curricula on student teachers’ teaching skills and curricular contributions, both in the short- and long-term (e.g., at the postgraduate and attending staff levels). It would also be interesting to investigate whether students participating in SaT curricula become better learners themselves. Further examining the impact of teaching skills training on the learning outcomes of the students’ learners could be another valuable area of inquiry. Additional research on best practices for SaT teaching modalities and assessment methods, as well as on strategies to address sustainability and known barriers to curriculum implementation, would further inform curricular recommendations.

결론들
Conclusions

이 서술적 검토의 결과는 의과대학이 학생들의 현재와 미래의 교수 역할에 대해 더 잘 대비해야 한다는 것을 시사한다. 따라서 우리는 SaT 커리큘럼 개발을 위한 문헌 정보 및 CBME 정렬 권장 사항을 제안한다. 우리는 교수 기술 훈련이 UME에서 PGME까지 연속체를 따라 종단적이고 점진적인 방식으로 공식적으로 구현되어야 하며, 가능할 때마다 이 훈련이 의무화되어야 한다고 제안한다. 우리는 또한 SaT 커리큘럼이 의대의 기존 커리큘럼과 일치해야 하며 학생들이 교수 역할에 참여할 수 있는 진정한 기회를 포함해야 한다고 주장한다.
The findings of this narrative review suggest that medical schools should better prepare students for both their current and future teaching roles. We therefore propose literature-informed and CBME-aligned recommendations for SaT curriculum development. We suggest that teaching skills training should be formally implemented at the UME level in a longitudinal and progressive manner along the UME to PGME continuum and that, whenever possible, this training should be compulsory. We also argue that SaT curricula should be aligned with a medical school’s preexisting curriculum and include authentic opportunities for students to engage in teaching roles.

많은 면에서, 이제는 더 이상 [의대 학생들이 교수 기술 훈련으로부터 이익을 얻을 것인가]의 문제가 아니라, 의학 교육자들이 [어떻게 학생들이 teaching 역할에 가장 성공적으로 참여할 수 있도록 만들 수 있을까]의 문제이다. "가르치는 것이 두 번 배우는 것"이라면, 내일의 교사와 학습자 형성에 있어 교육생들에게 '가르치는 방법을 가르치는 것'은 핵심이다.

In many ways, it appears that it is no longer a question of whether medical students would benefit from teaching skills training, but rather how medical educators can enable them to engage in their teaching roles most successfully. If “to teach is to learn twice,” 71 then teaching trainees how to teach is key in the formation of the teachers and learners of tomorrow.

 


Acad Med. 2022 Jun 1;97(6):909-922. doi: 10.1097/ACM.0000000000004608. Epub 2022 May 19.

Teaching Medical Students to Teach: A Narrative Review and Literature-Informed Recommendations for Student-as-Teacher Curricula

Affiliations collapse

Affiliations

1A. Cohen was a fourth-year medical student, Faculty of Medicine and Health Sciences, McGill University, Montreal, Quebec, Canada, when conducting this review. She is now a first-year resident in pediatrics, Faculty of Medicine, University of Ottawa, Ottawa, Ontario, Canada; ORCID: https://orcid.org/0000-0001-9593-9093.

2Y. Steinert is professor of family medicine and health sciences education, Richard and Sylvia Cruess Chair in Medical Education, Institute of Health Sciences Education, McGill University, Montreal, Quebec, Canada.

3E. Ruano Cea is assistant professor of pediatrics, competency-based medical education faculty lead, and assistant program director, McGill General Pediatrics Program, and associate member, Institute of Health Sciences Education, McGill University, Montreal, Quebec, Canada.

PMID: 35108235

DOI: 10.1097/ACM.0000000000004608

Abstract

Purpose: Medical students play an important role as teachers. This narrative review synthesizes the student-as-teacher (SaT) literature that incorporates formal teaching skills training, with the goal of proposing literature-informed recommendations for SaT curriculum development within the context of competency-based medical education.

Method: In January and August 2020, the authors searched Medline and Embase and conducted forward citation searches in Scopus to identify articles from 1985 to 2020 related to teaching medical students to teach. Search terms included "student(s) as teacher(s)," "near-peer teaching," and "teaching to teach." The findings from selected articles were summarized and synthesized.

Results: Forty-three articles met the inclusion criteria: 33 papers describing specific SaT curricula, 3 literature reviews, 6 stakeholder surveys, and 1 Delphi study. While students often engage in teaching roles, formal teaching skills training is not always provided. Existing curricula are usually optional, delivered as short courses, and offered to senior students. Course content commonly includes topics related to planning and delivering learning activities and providing feedback. Of the numerous teaching modalities employed, students indicate a preference for interactive and experiential learning. Methods used to assess students' teaching skills vary; however, direct observation and feedback are valued assessment methods. Program evaluations have shown positive outcomes, including high student satisfaction and enhanced self-confidence as teachers.

Conclusions: Informed by these findings and outcome-based educational frameworks, the authors suggest 4 guiding principles for SaT curricula: (1) teaching skills training should be formally implemented in undergraduate medical education and should, whenever possible, be compulsory; (2) teaching skills should be taught longitudinally and progressively along the undergraduate to postgraduate continuum; (3) curriculum content should be aligned with a school's preexisting curriculum and local context; and (4) authentic opportunities for students to engage in teaching roles should be included. They also propose recommendations for curriculum content, teaching modalities, and assessment methods.

협력적 스킬 학습에 그룹 크기가 중요한가? 무작위대조군 연구(Med Educ, 2021)
Does group size matter during collaborative skills learning? A randomised study
Laerke Marijke Noerholk1 | Anne Mette Morcke2 | Kulamakan Kulasegaram3 | Lone N. Nørgaard4 | Lotte Harmsen4 | Lisbeth Anita Andreasen1,5 | Nina Gros Pedersen6 | Vilma Johnsson4 | Anishan Vamadevan1 | Martin Grønnebæk Tolsgaard1,4,7 

 

 

1 소개
1 INTRODUCTION

세계적으로, 의과대학들은 더 많은 수의 의대생들을 입학시키고 학급 규모를 늘림으로써 더 많은 의사들의 필요성에 대응하고 있다. 불행히도, 이러한 입학생 증가는 임상 훈련에 사용할 수 있는 한정된 자원을 고려할 때 학생들의 학습에 해로운 영향을 미칠 수 있다. 결과적으로, 교육자들은 특히 임상 기술을 배우기 위해 [기존의 일대일 견습생 모델]보다 교수 자원에 덜 의존하는 더 [비용 효율적인 교육 훈련 방법]을 요구해 왔다. 현재, 일선 연구는 학부 의료 교육에서 기술의 협업 학습 역할에 더 많은 초점을 맞추고 있다. 
Globally, medical schools are responding to the need for more doctors by admitting a greater number of medical students and increasing class sizes. Unfortunately, this increased intake may have detrimental effects on students' learning given the finite resources available for clinical training.1-3 As a result, educators have called for more cost-effective methods of training and instructional methods that rely less on faculty resources than the traditional one-to-one apprenticeship model, in particular for learning clinical skills. Currently, frontline research proposes an increased focus on the role of collaborative learning of skills in undergraduate medical education.4-6

[협력적 학습]은 '문제를 해결하거나 과제를 완료하거나 제품을 만들기 위해 협력하는 학습자 그룹'으로 정의됩니다. 최근의 연구는 시뮬레이션된 환경에서 [개별 학습]과 비교하여 [Dyad 학습(즉, 쌍으로 학습)의 형태로 하는 협력적 기술 학습]이 기술 보유를 개선하고 열등하지 않은 기술이 임상 작업 공간으로 전이된다는 것을 보여주었다. 또한, Dyad 학습은 유사하거나 더 나은 교육 결과를 생성하는 반면, 교육 자원의 절반만 요구하기 때문에 개별 학습보다 더 비용 효율적인 것으로 생각된다. 협력 학습의 긍정적인 효과는 [동료 관찰, 지식의 인지 공동 구성, 감소된 인지 부하, 사회적 상호 의존성 및 사회적 비교]와 같은 메커니즘을 통해 매개될 수 있다. 함께 일하는 학생들은 자기 효과성, 동기부여를 증가시키고 새로운 정보를 처리할 때 메타인지 능력을 향상시킴으로써 이익을 얻는 것으로 생각된다. 그러나 절차적 학습에 대한 우려는 협업 기술 학습과 관련된 [연습 시간 단축]이, 특히 [협력자의 수가 증가]할 경우, 시간이 지남에 따라 학습자의 학습에 부정적인 영향을 미칠 수 있다는 것이다. 임상 기술 훈련 중 장시간 실습 시간의 중요성은 이동 자동화를 달성하는 데 필수적이며, 이는 이전 테스트 성능을 향상시키는 것으로 다시 한번 입증되었다. 기술 훈련 중 협력자의 수가 학습자당 사용 가능한 실습 시간의 양에 영향을 미치기 때문에 학습 전이도 똑같이 손상될 수 있다.
Collaborative learning is defined as ‘groups of learners working together to solve a problem, complete a task or create a product’.7 Recent studies have shown that collaborative skills learning in the form of dyad learning (i.e. learning in pairs) compared with individual learning in a simulated setting leads to improved skills retention4, 8 and non-inferior skills transfer to the clinical workspace.9 In addition, dyad learning is thought to be more cost-effective than individual learning because it only requires half the instructional resources, while producing similar or better educational outcomes.10, 11 The positive effects of collaborative learning may be mediated through mechanisms such as peer observation,8 cognitive co-construction of knowledge,12 reduced cognitive load,5 social interdependence13 and social comparison.14 Students working together collaboratively are thought to benefit in terms of increased self-efficacy, motivation and by improving their metacognitive skills when processing new information.15, 16 Yet, concerns regarding procedural learning have been raised that the reduced hands-on time associated with collaborative skills learning may affect learners' learning negatively over time, in particular if the number of collaborators increase.15, 17 The importance of extended periods of hands-on time during clinical skills training is essential for achieving movement automaticity, which again has been shown to result in improved transfer test performances.18 As the number of collaborators during skills training will affect the amount of hands-on time available per learner, transfer of learning may be equally impaired.

협업 학습을 이해하기 위해 많은 다양한 이론이 제안되었지만, 이러한 설명 프레임워크에 대한 경험적 지원을 제공하기 위해 의학 교육 문헌에는 관찰 데이터가 거의 보고되지 않았다. 협업 학습 중 학습 활동을 이해하는 데 사용할 수 있는 한 가지 이론적 프레임워크는 ICAP 프레임워크이다. 이 프레임워크는 학습자가 학습하는 동안 서로 다른 인지 참여 모드를 반영하기 위한 명백한 행동을 기반으로 한다.12 네 가지 행동 모드는 수동적(P), 능동적(A), 건설적(C), 대화형(I)으로 설명되며, 각 모드는 학습 활동의 다른 예와 연관된다. ICAP 프레임워크는 학습 활동의 계층적 분포를 설명하는데, 여기서 [대화형 활동]이 [구성적 활동]보다 우수하고, 이는 [능동적 활동]보다 우수하며, 마지막으로 [수동적 활동]이 순서로 생각됩니다(I > C > A > P) 이와 같이, 협업 기술 학습에 대한 잠재적으로 반대되는 두 가지 가설이 기존 문헌에서 표현되었다.
Although many different theories have been proposed to understand collaborative learning, little observational data have been reported in the medical education literature to provide empirical support for these explanatory frameworks. One theoretical framework that can be used to understand learning activities during collaborative learning is the ICAP framework.12, 16 This framework is based on learners' overt behaviours to reflect different modes of cognitive engagement while learning.12 The four behavioural modes are described as passive (P), active (A), constructive (C) and interactive (I), and each mode is associated with different examples of learning activities. The ICAP framework describes a hierarchical distribution of learning activities, where interactive activities are thought to be superior to constructive activities, which are superior to active activities, that again are superior to passive activities (I > C > A > P). As such, two potentially opposing hypotheses for collaborative skills learning have been expressed in the existing literature.

  • [초기 실습] 중 공동 학습은 학생들의 다양한 수준의 공개 학습 활동으로 이어진다. 인지적 참여의 수준이 높을수록 학습 성과는 더 좋아진다.
  • 실습 중 [연습 시간을 줄이는 것]은 기술 학습에 부정적인 영향을 미친다.
  1. Collaborative learning during initial practice leads to different levels of overt learning activities in students. The higher level of cognitive engagement, the better learning outcomes.
  2. Decreasing the amount of hands-on time during practice has a negative effect on skills learning.

그러나 협력자의 수가 공개 학습 활동 또는 기술 학습에 어떻게 영향을 미칠 수 있는지에 대한 경험적 증거는 제한적이다. 이 연구는 그룹 크기가 기술 훈련 중 ICAP 활동과 후속 기술 이전에서 그룹 크기가 조정자 및/또는 학습 장애물로 작용할 수 있는지 조사하는 것을 목표로 했다. 우리의 연구의 맥락은 시뮬레이션 기반 초음파 훈련으로, 여러 임상 전문 분야에서 점점 더 관련성이 높아지고 있는 복잡한 절차 및 진단 기술을 나타낸다.

Yet, there is limited empirical evidence on how the number of collaborators may affect overt learning activities or skills learning. This study aimed to explore the impact of group size on ICAP activities during skills training and on subsequent transfer of skills to investigate whether increasing group size would serve as a mediator and/or a barrier to learning. The context of our study was simulation-based ultrasound training, representing a complex procedural and diagnostic skill that is becoming increasingly relevant in several clinical specialties.

연구 질문은 다음과 같습니다. 초음파 초보자 그룹에서 훈련 중 학습 활동과 관련하여 시뮬레이션 기반 초음파 훈련의 효과는 다이오드, 트라이아드 또는 테트라드(tetrad)에서 각각 무엇인가? 그룹 크기가 학습에 미치는 영향에 대한 통찰력을 얻는 것은 협업 기술 학습을 이해하는 데 사용되는 기존 이론에 대한 경험적 지원을 제공하는 데 도움이 될 수 있다. 또한, 그룹 규모가 스킬 학습 및 전송에 미치는 영향을 탐구하는 것은 향후 저렴한 고부가가치 스킬 교육을 제공하는 방법에 중요하다.

The research question was: In a group of ultrasound novices, what are the effects of simulation-based ultrasound training individually, in dyads, triads or tetrads with respect to learning activities during training and on subsequent skills transfer? Gaining insight into the impact of group size on learning may help provide empirical support for existing theories that are used to understand collaborative skills learning. Moreover, exploring the impact of increasing group size on skills learning and transfer is important to how we deliver low-cost high-value skills training in the future.

2 방법
2 METHODS

2.1 설정
2.1 Setting

이것은 전-후-전이 테스트 설정을 사용한 무작위 통제 시험이었다. 연구는 2019년 12월부터 2020년 10월까지 덴마크 코펜하겐 의학 교육 시뮬레이션 아카데미(CAMES)에서 수행되었으며 CONSORT 성명에 따라 보고되었다. 덴마크 수도 지역의 지역윤리위원회는 이 연구를 검토에서 면제했다. 의정서 번호: H-19063724. 

This was a randomised controlled trial using a pre-post-transfer-test set-up. The study was conducted between December 2019 and October 2020 at Copenhagen Academy for Medical Education and Simulation (CAMES), Denmark and was reported according to the CONSORT statement. The Regional Ethics Committee of the Capital Region of Denmark exempted the study from review, Protocol no: H-19063724. The study was registered at clinicaltrials.gov (NCT04167397). 

2.2 참가자
2.2 Participants

참가자들은 코펜하겐 대학의 의대 학생들이었다. 그들은 페이스북의 학생 모집 광고를 통해 모집되었다. 포함 기준은 덴마크어 숙련도와 일반 해부학 시험 합격이었다. 제외 기준은 이전의 초음파 경험과 산부인과/GYN 부서의 임상 경험이었다.
The participants were medical students from the University of Copenhagen. They were recruited via advertising on student fora on Facebook. The inclusion criteria were proficiency in Danish and a passed general anatomy exam. Exclusion criteria were prior ultrasound experience and any clinical experience from an OB/GYN department.

2.3 무작위화
2.3 Randomisation

참가자들은 1:1:1:1의 할당 비율로 개별, 다이아드, 트라이아드 또는 테트라드 훈련에 블록 랜덤화 되었다. 무작위화는 온라인에서 생성된 무작위 순열 블록을 사용하여 우리 기관의 독립 연구자에 의해 수행되었다. 코로나 19 봉쇄로 인해 일부 참가자들의 훈련은 취소되었다. 연구는 5개월 동안 중단되었고, 2020년 8월에 데이터 수집이 다시 시작되었다.

Participants were block randomised to individual, dyad, triad or tetrad training in a 1:1:1:1 allocation ratio. Randomisation was performed by an independent researcher from our institution using random permuted blocks generated online. Due to the COVID-19 lockdown, some participants' training sessions were cancelled. The study was paused for 5 months, and data collection started again in August 2020.

2.4 장비
2.4 Equipment

사전 및 사후 테스트는 복부 횡단 스캔 트레이너(영국 카디프, Medaphor, Ltd, Cardiff)를 사용하여 완료했습니다. 이 시뮬레이터에는 realistic force feedback을 제공하는 촉각 장치가 있습니다. 훈련 기간 동안, 참가자들은 임신 20-27주 동안 태아의 성장을 평가하는 연습을 했다. 교육 프로그램은 이전에 확립된 타당성 증거와 함께 내장된 자동 평가를 포함하는 9개의 모듈로 구성되었다.19 참가자들은 일관성을 보장하기 위해 비디오 교육을 통해 시뮬레이터와 과제를 소개받았으며 교육 중에는 더 이상의 지침instruction를 받지 않았다. 시뮬레이터는 각 모듈의 완료 후 이분법적인 피드백을 제공하며,(예: '태아 복부를 정확하게 확대했음')  참가자는 이를 읽고 토론할 수 있다. 필요한 경우 시뮬레이터에 대한 강사의 기술 지원이 제공되었습니다.
Pre- and post-tests were completed using the transabdominal ScanTrainer (Medaphor, Ltd, Cardiff, UK). This simulator has a haptic device that provides realistic force feedback. During the training, participants practised the assessment of fetal growth during gestational ages 20–27 weeks. The training programme consisted of nine modules containing built-in automated assessments with previously established validity evidence.19 The participants were introduced to the simulator and the tasks via video instruction to ensure consistency and received no further instruction during training. The simulator provides dichotomous feedback after the completion of each module (for example, ‘fetal abdomen correctly magnified’), which the participants were allowed to read and discuss. Technical assistance from the instructor regarding the simulator was provided if needed.

[전이 테스트]는 US/S Mentor 시뮬레이터(3D 시스템 의료, 미국 리틀턴)에서 수행되었습니다. 전송 테스트 시뮬레이터는 초음파 영상의 품질, 탐침을 다루기 위한 사용자 인터페이스, 그리고 마지막으로 초음파 스캔을 약간 더 어렵게 만들고자 태아를 고정이 아니라 움직이게 재현함으로써 훈련 시뮬레이터와 다르다. 시뮬레이터는 최적의 스캔 평면 또는 도움말 모듈에 대한 지침을 제공하지 않았습니다.

The transfer test was performed on the U/S Mentor simulator (3D systems health care, Littleton, USA). The transfer test simulator differs from the training simulator in terms of the quality of ultrasound images, the user interface for handling the probe and finally by reproducing a moving rather than a fixed fetus making the ultrasound scan slightly more difficult. The simulator provided no guidance regarding optimal scanning planes or help modules.

2.5 개입
2.5 Interventions

연구 설계는 그림 1에 설명되어 있습니다.

The study design is illustrated in Figure 1.




참가자들은 단일 훈련, 다이드 훈련, 트라이어드 훈련 또는 테트라드 훈련으로 무작위화되었다. 이들은 모두 개별 사전 테스트를 완료한 후 2시간 동안 서로 다른 그룹 크기로 교육을 받은 후, 스캔 트레이너에서 개별 사후 테스트를 수행했습니다. 7-10일 후, 그들은 U/S Mentor 시뮬레이터에서 개별 전송 테스트를 완료했습니다.

  • 사전 테스트: 참가자들은 두 번째 임신 3개월 경복부 초음파 및 태아 생체측정 측정(10분)에 대한 비디오 소개와 시뮬레이터에 대한 비디오 소개(15분)를 받았다. 그 후, 그들은 양두정경(BPD), 후두전두경(OFD), 전후복부경(APAD), 복부경(TAD), 대퇴골길이(FL)의 측정을 포함한 개별 사전 테스트를 완료했다.
  • 교육: 그런 다음 참가자들은 각각 다이오드, 트라이아드 또는 테트라드에서 태아 생체 인식 평가를 연습했다. 그들은 그룹의 크기에 상관없이 2시간의 정해진 시간 안에 훈련했다. 단체로 활동하는 참가자들에게는 단체로 훈련할 때 교대로 과제를 완료하고, 한 번에 한 명만 적극적으로 초음파 탐침을 다루도록 지도했다. 다른 참가자들은 이미지 동결, 측정값 획득, 제안, 질문 및 발견에 대해 논의할 수 있도록 허용되었습니다. 전체 교육 세션은 ICAP 프레임워크에 따라 학습 활동의 후속 코딩을 위해 비디오로 녹화되었다.
  • 테스트 후: 2시간의 교육 세션을 마친 직후, 참가자들은 그들이 훈련한 것과 동일한 시뮬레이터를 사용하여 사전 테스트와 동일한 개별 사후 테스트를 받았다.
  • 전이 테스트: 다음 7-10일 이내에 참가자들은 다른 시뮬레이터인 U/S Mentor 시뮬레이터(Sylel Ltd, Symbionix Ltd)에서 개별 전달 테스트를 수행하여 산부인과 2기 스캐닝 모듈에서 BPD, OFD, APAD, TAD 및 FL의 측정값을 얻었다. 그들은 두 가지 경우에 대해 측정을 수행했는데, 이 경우 태아는 스캔 중에 움직였고 다른 위치에 위치했다(뇌막 제시/브리치 제시). 참가자들은 각 사례를 완료하는 데 최대 15분이 주어졌습니다. 사후 테스트와 이전 테스트 사이의 시간 간격은 참가자 감소를 최소화하면서 유지뿐만 아니라 이전을 평가하기 위해 선택되었다.

The participants were randomised to either single, dyad, triad or tetrad training. They all completed an individual pre-test, then trained in different group sizes for 2 hours and subsequently performed an individual post-test on the Scantrainer. After 7–10 days, they completed an individual transfer test on the U/S Mentor simulator.

  • Pre-test: The participants received a video introduction to second trimester transabdominal ultrasound and fetal biometry measurements (10 minutes) and then a video introduction to the simulator (15 minutes). Subsequently, they completed an individual pre-test including measurements of biparietal diameter (BPD), occipito-frontal diameter (OFD), anterior–posterior abdominal diameter (APAD), transabdominal diameter (TAD) and femur length (FL).
  • Training: The participants then practised the assessment of fetal biometries individually, in dyads, triads or tetrads, respectively. They trained in a fixed time frame of 2 hours, regardless of group size. The participants working in groups were instructed that they should take turns completing the assignments when training in groups, and only one person should actively handle the ultrasound probe at a time. The other participants were allowed to help with freezing images, obtaining measurements, provide suggestions, ask questions and discuss findings. The entire training session was video recorded for subsequent coding of the learning activities according to the ICAP framework.
  • Post-test: Immediately after completing the 2-hour training session, the participants underwent an individual post-test identical to the pre-test using the same simulator as they trained on.
  • Transfer test: Within the next 7–10 days, the participants performed an individual transfer test on a different simulator, the U/S Mentor simulator (Symbionix Ltd, Israel), obtaining measurements of BPD, OFD, APAD, TAD and FL in an obstetric second trimester scanning module. They performed measurements on two cases, in which the fetus was moving during the scan as well as situated in different positions (cephalic presentation/breech presentation). The participants had a maximum of 15 minutes to complete each case. The time interval between post-test and transfer test was chosen to evaluate transfer as well as retention, while at the same time keeping participant attrition at a minimum.

2.6 결과
2.6 Outcomes

1차 결과는 전이 테스트 동안의 성과 점수였다. 2차 결과에는 시험 전/후의 수행평가 점수, ICAP 분포 및 그룹별 실습 시간이 포함되었다.
The primary outcome was performance scores during the transfer test. The secondary outcomes included performance scores on the pre- and post-test, ICAP distribution and hands-on time across groups.

2.7 성과 점수
2.7 Performance scores

모든 테스트 수행은 초음파 영상, 시뮬레이터 및 프로브 움직임이 시각화된 시뮬레이터에 직접 비디오로 녹화되었다. 두 명의 눈가림된 태아 의학 전문가는 각 성과를 초음파 기술의 객관적 구조 평가(OSAUS) 척도 및 전역 평가 척도(GRS)로 평가했습니다(부록 S1 참조). OSAUS 점수의 사용 및 해석에 대한 타당성 증거는 내용 증거, 대응 프로세스, 내부 구조, 다른 변수와의 관계 및 결과를 포함한 여러 이전 연구에서 수집 및 입증되었다. OSAUS 계측기에는 5포인트 리커트 척도로 평가되는 7개의 항목이 포함되어 있습니다. 첫 번째와 마지막 항목은 적절한 경우에만 평가되어야 하며, 우리의 연구는 시뮬레이션된 환경에서 이루어졌기 때문에, 이전 용도와 일치하는 항목 3-5개만 분석에 포함되었다. 또한 전문가들은 전체 GRS 점수를 5점 리커트 척도로 평가했습니다. GRS는 전문가 평가를 기반으로 하며 다양한 기술적 성과를 평가하는 데 사용되어 왔다. 두 이송 사례의 평균은 1차 결과 측정치를 만드는 데 사용되었다.
All test performances were video recorded directly on the simulators, where the ultrasound image, the simulator and the probe movements were visualised. Two blinded fetal medicine experts rated each performance on the Objective Structured Assessment of Ultrasound Skills (OSAUS) scale20 and a Global Rating Scale (GRS) (see Appendix S1). Validity evidence for the use and interpretation of OSAUS scores have been collected and demonstrated in several previous studies, including content evidence,21 response process, internal structure, relation to other variables and consequences.20, 22, 23 The OSAUS instrument includes seven items, which are evaluated on 5-point Likert scales. The first and last items should only be rated when appropriate,20 and because our study took place in the simulated setting, only items 3–5 were included in the analysis, consistent with previous uses.24-26 Additionally, the experts also rated an overall GRS score on a 5-point Likert scale. The GRS is based on an expert evaluation and has been used to evaluate various technical performances.27, 28 The mean of both transfer cases was used to create the primary outcome measures.

2.8 평가자 교육
2.8 Rater training


모든 수행평가는 두 명의 눈가림된 평가자에 의해 평가되었다. 전이 시험에서 2명의 평가자와 2명의 사례를 사용하는 것은 태아 생체측정 검사를 평가하기 위해 OSAUS 척도를 사용할 때 높은 평가자 간 신뢰성(등급 내 상관 계수 [ICC] = 0.89)을 입증한 이전 연구에 기초하여 선택되었다.
All performances were rated by two blinded raters. The use of two assessors and two cases on the transfer test was chosen based on a previous study demonstrating high inter-rater reliability (intraclass correlation coefficient [ICC] = 0.89) when using the OSAUS scale to assess fetal biometry examinations.20

우리는 태아의학 컨설턴트(LNN, LH)이거나 태아의학 박사(NGP 및 LAA)를 받은 총 4명의 평가자를 포함했다. 모든 평가자들은 매일 산부인과 초음파를 다루는 임상의로서 활동적이었다. 평가 전에 모든 평가자들은 시뮬레이터와 학생들이 완료해야 하는 과제를 모두 시도했다. 4명의 평가자들은 처음에 7개의 비디오(분석에 포함되지 않은 파일럿 비디오)를 개별적으로 평가했고, 2명씩 그룹을 지어 만나 평점의 불일치를 논의했고, 비디오의 선택된 부분을 함께 시청했다. 그 후 비디오는 4개의 그룹(A, B, C, D, 각 그룹의 24/25 참가자의 비디오)으로 나뉘었다. 모든 참가자는 평가자 2명이 평가한 영상 4개, 사전 테스트 1개, 사후 테스트 1개, 이전 테스트 2개를 받았다.
We included a total of four raters, who were either fetal medicine consultants (LNN, LH) or had PhDs in fetal medicine (NGP and LAA). All raters were active as clinicians working with obstetric ultrasound on a daily basis. Prior to rating, all raters tried both of the simulators and the assignments the students had to complete. The four raters initially rated seven videos individually (pilot videos, not included in the analysis) and met in groups of two to discuss any inconsistencies in their ratings and watched selected sections of the videos together. The videos were then divided into four groups (A, B, C and D, 24/25 participants' videos in each group). All participants had four videos evaluated by two raters, one pre-test, one post-test and two transfer tests.

2.9 ICAP 등급
2.9 ICAP rating

LMN은 Chi와 Willie의 프레임워크를 기반으로 [훈련 중 참가자들의 ICAP 활동]을 평가했다.12 ICAP 코딩 체계가 우리의 로컬 환경에 맞게 조정되었다. 예를 들어, '시뮬레이터 프로브 취급'을 능동적 행동의 예로 포함시킴으로써. 다양한 참여 모드를 숫자 버전으로 변환했습니다. 0 = 학습 활동 없음, 1 = 수동적, 2 = 능동적, 3 = 건설적, 4 = 대화적. 부호화 방식의 내용은 MGT, KK, LMN 간에 논의 및 개정되었으며, 최종 버전은 부록 S2에서 확인할 수 있다. 또한 개별 참가자별로 [체험 시간]을 별도로 등록했습니다. ICAP 등급은 연구 저자 중 두 명(LMN 및 MGT)에 의해 공동 평가되는 파일럿이 수행되었다. 평가자 간 합의는 한 평가자가 모든 평가를 완료할 수 있을 정도로 충분히 높았다. 모든 훈련 세션은 분 단위로 평가되며(참가자당 총 120회의 기간) 각 기간 동안 표시된 최고 수준의 ICAP 활동에 따라 점수가 매겨졌다.

LMN assessed participants' ICAP activities during training based on Chi and Wylie's framework.12 The ICAP coding scheme was adjusted to our local setting, e.g. by including ‘handling the simulator probe’ as an example of an active behaviour. We translated the different engagement modes into a numeric version with 0 = No learning activity, 1 = passive, 2 = active, 3 = constructive and 4 = interactive. The content of the coding scheme was discussed and revised between MGT, KK and LMN, and the final version can be seen in Appendix S2. Additionally, hands-on time was registered separately for each individual participant. A pilot was conducted, in which ICAP ratings were co-rated by two of the study authors (LMN and MGT). The inter-rater agreement was sufficiently high to allow one rater to complete all assessments. All training sessions then were rated minute by minute (a total of 120 time periods per participant) and scored corresponding to highest level ICAP activity displayed for each time period.

medu14791-sup-0002-appendix b_icap coding scheme_updated.pdf
0.15MB

2.10 통계적 분석
2.10 Statistical analyses

우리는 그룹 간의 Cohen d 1.0에 해당하는 크고 교육적으로 의미 있는 차이를 탐지하기 위해 연구를 수행했다. 90%의 검정력과 0.05의 α 값을 사용하여, 이는 각 연구 그룹의 22명의 참가자에 해당했다. 우리는 감소를 설명하기 위해 각 학습 부문에 25명의 학생을 포함시키는 것을 목표로 했다.
We powered our study to detect large and educationally meaningful differences corresponding to a Cohen's d of 1.0 between groups. Using a power of 90% and an α value of 0.05, this corresponded to 22 participants in each study group. We aimed to include 25 students in each study arm to account for attrition.

두 평가자의 점수 평균은 사전 테스트와 사후 테스트의 OSAUS 및 GRS 점수에 대해 계산되었다. 두 사례의 평균 전이 시험 점수가 계산되었다. 모든 점수는 최대 점수의 백분율로 계산되었습니다(최대 GRS 점수 = 5, 최대 OSAUS 점수 = 15).
The means of the two raters' scores were calculated for OSAUS and GRS scores on the pre- and post-tests. A mean transfer test score from the two cases was calculated. All scores were calculated as percentages of the maximum score (maximum GRS score = 5, maximum OSAUS score = 15).

Pearson 상관 계수는 실습 시간, 시험 전 점수 및 시험 후 점수를 포함한 다른 변수들이 전이 결과와 관련이 있는지 결정하기 위해 사용되었다. 우리는 전송 성능의 유의한 예측 변수에 대한 제어 우선 순위를 선택했다.
Pearson correlation coefficients were used to determine if any of the other variables including hands-on time, pre-test scores and post-test scores were associated with transfer outcomes. We chose a priori to control for significant predictors of transfer performance.

실험 전 점수를 공변량으로 조정한 경우와 조정하지 않은 경우를 사용하여 실험 대상 간 분산 분석(anova)을 사용하여 네 그룹 간에 일차 결과(평균 OSAUS 및 GRS 점수)를 비교했다. 사전 테스트와 사후 테스트의 평균 OSAUS 및 GRS 점수를 혼합 설계(2 × 2) 반복 측정 분산 분석을 사용하여 네 그룹 간에 비교함으로써 훈련의 주효과를 평가하고 훈련 유형(싱글/다이아드/트라이아드/테트라드)과의 상호작용에 대한 테스트를 수행했다. 효과 크기는 부분 eta 제곱(σp2)으로 계산되었습니다. 우리는 ICC, 일관성, 양방향 혼합 효과 모델(ICC(3,k))을 사용하여 ICAP 등급의 평가자 간 신뢰성을 계산했다. 29 GRS 및 OSAUS 데이터에 대한 별도의 일반화 가능성 분석을 수행했다.30 우리는 차별화 측면으로 참여자가 내포된 일반화 모델(랜덤화된 그룹)을 지정했다. 일반화의 측면은 사례 (2건)와 사례 (사례당 2건의 평가자)와 OSAUS 모델의 항목이었다. 우리는 (OSAUS에 대한) 설계 및 특정 사례 간, 평가자 간 및 항목 간 일반성 계수의 전반적인 신뢰성을 보고한다. 모든 통계 분석은 IBM SPSS Statistics 25를 사용하여 수행되었다.
The primary outcomes (mean OSAUS and GRS scores from the transfer test) were compared between the four groups using between-subjects analysis of variance (anova), with and without adjustment for pre-test scores as a covariate. The mean OSAUS and GRS scores from the pre- and post-tests were compared between the four groups using a mixed-design (2 × 2) repeated-measures anova to assess the main effects of training and test for interaction with the type of training (single/dyad/triad/tetrad). Effect sizes were calculated as partial eta squared (ηp2). We calculated the inter-rater reliability of the ICAP ratings using an ICC, consistency, two-way mixed-effects model (ICC (3,k)).29 We conducted separate generalizability analyses of GRS and OSAUS data.30 We specified the generalizability model with Participant nested in Group (randomised group) as the facet of differentiation. The facets of generalisation were Case (2 cases) and Rater nested in case (2 raters per case) as well as Item for the OSAUS model. We report overall reliability of the design and specific inter-case, inter-rater and inter-item (for the OSAUS) generalisability coefficients. All statistical analyses were conducted using IBM SPSS Statistics 25.

3 결과
3 RESULTS

이 연구는 총 111명의 참가자들을 네 가지 다른 훈련 조건에 무작위로 포함시켰다. 101명의 참가자들이 사전 테스트, 개입 및 사후 테스트를 완료했다. 트라이애드 그룹의 비디오 녹화 중 하나가 올바르게 저장되지 않았으며, 이 그룹에 대한 ICAP 등급이 완료되지 않았으며, 분석에서 전문가 등급만 평가되었습니다. 코로나 19 봉쇄로 인해 4명의 참가자가 후속 조치를 취하지 못했다. 참가자의 인구 통계는 표 1에 보고된다.
The study included a total of 111 participants randomised to the four different training conditions; 101 participants completed the pre-test, the intervention and the post-test. One video recording from a triad group was not correctly saved, and the ICAP ratings were not completed for this group, and only their expert ratings were evaluated in the analysis. Four participants were lost to follow-up due to the COVID-19 lockdown. The participant demographics are reported in Table 1.

3.1 1차 결과
3.1 Primary outcome

그룹 크기는 전이 테스트에서 OSAUS 점수 (F(3,93) = 1.94, p = 0.13, γp2 = 0.06) 또는 GRS 점수 (F(3,93) = 1.46, p = 0.23, γp2 = 0.05로 측정한 성능에 유의미한 영향을 미치지 않았다. 이러한 결과는 사전 테스트, 사후 테스트 또는 실제 시간을 공변량으로 조정할 때 변경되지 않았습니다. 실습 시간은 전이 성과 점수와 상관관계가 없었다.

Group size did not significantly influence performance measured by OSAUS scores (F(3,93) = 1.94, p = 0.13, ηp2 = 0.06) or GRS scores (F(3,93) = 1.46, p = 0.23, ηp2 = 0.05) on the transfer test, Table 2. These results did not change when adjusting for pre-test, post-test or hands-on time as a covariate. Hands-on time was not correlated with transfer performance scores.

3.2 2차 결과
3.2 Secondary outcomes

GRS 점수(OSUS 평균: 37.5% [12.0] 대 56.7% [16.8], F(1,93) = 113.9, p < 0.001, λp2 = 0.55, GRS 평균 [SD]: 36.8% [13.7,189] = F.18.1, P[SD]와 마찬가지로 모든 그룹에 대해 시험 전에서 시험 후까지 OSAUS 점수가 유의하게 향상되었다. 그룹 크기와 훈련 사이에 교호작용 효과가 없었습니다(F(3,93) = 1.04, p = 0.38, γp2 = 0.03). 표 2
OSAUS scores improved significantly from pre- to post-test for all groups as did GRS scores (OSAUS mean [SD]: 37.5% [12.0)] versus 56.7% [16.8]; F(1,93) = 113.9, p < 0.001, ηp2 = 0.55; GRS mean [SD]: 36.8% [13.7] versus 54.2% [18.9]; F(1,93) = 75.4, p < 0.001, ηp2 = 0.45). There was no interaction effect between group size and training (F(3,93) = 1.04, p = 0.38, ηp2 = 0.03), Table 2.

각 ICAP 활동에 소요된 시간의 분포는 학습이 없는 활동 범주인 그림 2(수동 [F(3,90) = 13,75, p = 0.001, µp2 = 0.31, 능동 [F(3,90)] = 139.28, p < 0.001, µp2 = 0.82, 구성적], [0.001, µp2 = 0.20], 0.20, 0.20, 0.30, 0.30, 0.30을 제외한 모든 학습 활동에 대해 그룹 간에 유의하게 달랐다. [F(3,90) = 43.17, p = 0.001, µp2 = 0.59] 학습 활동 없음 [F(3,90) = 1.65, p = 0.17, µp2 0 0.05].

The distribution of time spent in each ICAP activity was significantly different between the groups for all learning activities except for the no learning activity category, Figure 2 (Passive [F(3,90) = 13,75, p < 0.001, ηp2 = 0.31], Active [F(3,90) = 139.28, p < 0.001, ηp2 = 0.82], Constructive [F(3,90) = 10.73, p < 0.001, ηp2 = 0.26], Interactive [F(3,90) = 43.17, p < 0.001, ηp2 = 0.59], No learning activity [F(3,90) = 1.65, p = 0.183, ηp2 = 0.05]).

비학습 및 수동적 학습 활동(평균 0 + 1)에 보내는 시간은 그룹 크기에 따라 증가했다(평균[SD] 단수: 20.7[5.2], 다아드: 16.4[8.3], 트라이어드: 23.7[8.2], 테트라드: 29.5[7.2], F(3,90) = 13.75, p <0.001, µp2 = 0.31.2). 사후검정(Tukey)은 사분면체와 다른 모든 그룹 간에 범주 0 + 1에 소요된 시간의 백분율에서 유의한 차이를 보였다(단일: 8.78 [3.16–14.4], p = 0.001, p <0.04–11.6), p <0.001>, 트라이애드: 5.8 [0.04–11.6], p와 dyads (0.45%) 사이의 유의한 차이를 보였다. 7.27 [1.61–12.93], p = 0.006). 구성적 학습 활동과 대화형 학습 활동은 그룹 간에 상대적으로 일정했다(1,7% [3.9], 단일 그룹(1,7% [3.9], 다아드: 39.6 [13.3], 삼중항: 40.2 [9.7], 테트라드: 37.6 [8.8], F(3,90) = 78.38, p < 0.001,6202 = 72). 사후검증(Tukey)은 단일 그룹과 다른 모든 그룹 간에 범주 3 + 4(건설적 및 상호작용적)에 소요된 시간의 비율에서 유의미한 차이를 보였다(평균 차이 [95% CI] 다아드: 36.0 [28.7–43.3], p < 0.001], p <0.0–44.44.4], p < 0.001; tetrads: 34.1 [26.1.1.1.1.1], <p>.
Time spent in the non-learning and passive learning activities (category 0 + 1) increased with group size (mean per cent [SD] singles: 20.7 [5.2], dyads: 16.4 [8.3], triads: 23.7 [8.2], tetrads: 29.5 [7.2]; F(3,90) = 13.75, p < 0.001, ηp2 = 0.31), Figure 2. Post hoc testing (Tukey) showed significant differences in percentage of time spent in category 0 + 1 between tetrads and all other groups (mean per cent difference [95% CI]; singles: 8.78 [3.16–14.4], p = 0.001; dyads: 13.1 [7.6–18.5], p < 0.001; triads: 5.8 [0.04–11.6], p = 0.045) and between triads and dyads (mean per cent difference [95% CI]: 7.27 [1.61–12.93], p = 0.006). Time spent in the constructive and interactive learning activities (category 3 + 4) was relatively constant between groups compared with singles (mean per cent [SD] singles: 3.5 [3.9]; dyads: 39.6 [13.3]; triads: 40.2 [9.7]; tetrads: 37.6 [8.8]; F(3,90) = 78.38, p < 0.001, ηp2 = 0.72). Post hoc testing (Tukey) showed significant differences in percentage of time spent in category 3 + 4 (constructive and interactive) between singles and all other groups (mean per cent difference [95% CI] dyads: 36.0 [28.7–43.3], p < 0.001; triads: 36.7 [29.0–44.4], p < 0.001; tetrads: 34.1 [26.7–41.1], p < 0.001).


체험 시간의 양(각 참가자가 초음파 탐침을 다루는 훈련 시간의 백분율)은 그룹 크기가 증가함에 따라 감소하였다(단식: 58.4 [8.6], 다아드: 27.7 [5.7], 3사드: 17.0 [5.3], 테트라드: 13.7 [4.0], F(3,90) = 252.54, p <0.1,2p = 89). 특별 시험 후(Tukey)에 따르면 이 차이는 단일 그룹과 다른 모든 그룹(평균 백분율 차이 [95% CI] 다아드: 30.7 [26.1–35.3], p < 0.001], p < 0.001], tetrads: 44.6 [40.0–49.3], p < 0.001], p < 0.001], dyads: 10.7 % (3%), dymeads:0.0–49.3%) 사이에 통계적으로 유의했다. [6.0–15.4], p < 0.001; 사분면: 13.9 [9.4–18.5], p < 0.001], 그러나 삼분면과 사분면 사이는 아니다. (95% CI: 3.3 [-1.5–8.1], p = 0.29), 그림 2 및 3. 그룹 크기와 실제 시간은 음의 상관 관계가 있습니다(Pearson의 r = -0.86, p < 0.001).

The amount of hands-on time (percentage of the training time each participant was handling the ultrasound probe) decreased with increasing group size (mean per cent [SD]: singles: 58.4 [8.6], dyads: 27.7 [5.7], triads: 17.0 [5.3]; tetrads: 13.7 [4.0]; F(3,90) = 252.54, p < 0.001, ηp2 = 0.89). Post hoc testing (Tukey) revealed that this difference was statistically significant between singles and all other groups (mean per cent difference [95% CI] dyads: 30.7 [26.1–35.3], p < 0.001; triads: 41.4 [36.5–46.2], p < 0.001; tetrads: 44.6 [40.0–49.3], p < 0.001), between dyads and larger groups (mean per cent difference [95% CI] triads: 10.7 [6.0–15.4], p < 0.001; tetrads: 13.9 [9.4–18.5], p < 0.001) but not between triads and tetrads (mean per cent difference [95% CI]: 3.3 [−1.5 to 8.1], p = 0.29), Figures 2 and 3. Group size and hands-on time were negatively correlated (Pearson's r = −0.86, p < 0.001).

ICAP 등급에 대한 ICC(3,k)는 0.70(95% CI: 0.60–0.77)이었다. 우리 데이터의 일반화 이론 분석은 GRS 점수와 OSAUS 점수에 대한 사례 간 일반화 계수가 각각 0.84와 0.88로 높다는 것을 보여주었다. 사례 내 레이터 간 일반화 계수는 각각 0.72와 0.81이었다. 단일 사례 내 항목 간 일반화 계수는 0.75였으며, OSAUS 점수에 대한 비율은 0.75였다. GRS 점수에 대한 설계의 전체 신뢰도는 0.64이고 OSAUS 점수에 대해서는 0.60입니다.

The ICC (3,k) for the ICAP ratings was 0.70 (95% CI: 0.60–0.77). The generalisability theory analysis of our data showed that inter-case generalisability coefficients for the GRS and OSAUS scores were high at 0.84 and 0.88, respectively. Inter-rater generalizability coefficient within case was 0.72 and 0.81, respectively. Inter-item generalisability coefficient within a single case and rater for the OSAUS scores was 0.75. The overall reliability of the design for the GRS scores was 0.64 and 0.60 for the OSAUS scores.

4 토론
4 DISCUSSION

최대 4명의 참가자로 구성된 그룹 규모의 협업 기술 훈련은 실무 시간이 줄었음에도 불구하고 기술 전이skills transfer에는 부정적인 영향을 미치지 않았다. 모든 참가자들은 그룹 규모와 상관없이 훈련을 통해 약 15-20% 포인트를 향상시켰다. 이는 일부 참가자들이 혼자 훈련한 참가자들의 체험 시간의 25%에 불과했기 때문에 어느 정도 놀라운 일이다. 이러한 발견은 [협력적 기술 학습]의 긍정적인 효과가 더 큰 학습자 그룹으로 확장된다는 것을 증명함으로써 쌍으로 협력 학습을 포함하는 이전 연구와 일치하고 확장된다. 현재 의료 교육에서 협업 및 동료 학습 전략에 중점을 두고 있으며, 이러한 전략이 고부가가치 저비용 교육에 대한 수요를 어떻게 충족시킬 수 있는지도 포함된다. 시뮬레이션 기반 훈련에는 상당한 양의 자원(예: 강사 및 장비 비용)이 필요하며, 우리의 연구 결과는 학습 결과에 부정적인 영향을 미치지 않고 시뮬레이터: 학습자 비율을 줄임으로써 이러한 요구를 줄이는 데 도움이 될 수 있다.
Collaborative skills training in group sizes of up to four participants did not negatively impact skills transfer despite less hands-on time. All participants improved about 15–20 percentage points with training irrespective of group size. This is to some extent surprising because some participants had as little as 25% of the hands-on time of those who trained alone. These findings align with and expand on previous studies involving collaborative learning in pairs (dyad learning) by demonstrating that the positive effects of collaborative skills learning also expand to larger groups of learners.4, 8-10, 31 Currently, there is an increased focus on collaborative and peer learning strategies in medical education, including how these strategies may meet the demand for high-value low-cost education.15, 32 Simulation-based training requires a significant amount of resources (e.g. instructor and equipment costs among others), and our findings may help reduce these demands by decreasing the simulator: learner ratio without any negative effects on learning outcomes.


우리는 실습 시간을 줄이는 것과 다른 학습자를 관찰하고 상호 작용하는 시간을 늘리는 것 사이에 trade-off가 있을 수 있다고 제안한다. 우리의 연구에서, 건설적이고 상호작용적인 활동에 소비하는 시간은 다이아드, 트라이아드, 테트라드 간에 다르지 않았고, [다이아드 참가자]들이 [트라이아드 또는 테트라드 참가자들]보다 직접 체험하는 시간이 더 많았음에도 불구하고 여전히 유사한 학습 결과를 보였다. 이러한 발견은 참가자들이 협력적인 노력의 결과로 더 높은 수준의 인지 참여를 통해 줄어든 실습 시간을 보상하는 것처럼 보였다는 것을 나타낸다. 특히 초음파와 같은 절차적 기술을 훈련하는 동안 협력 학습이 유익하다는 것을 증명할 수 있다. 이러한 기술에는 [동시에 수행해야 하는 여러 작업(예: 프로브 조작, 기계 설정 조정 및 시각적 진단 작업에 참여하는 동안 환자와 통신)]이 포함되기 때문이다. 학습자 간에 과제를 분배하는 것은 학습자가 [인지 과부하 없이 학습에 계속 참여]할 수 있도록 하기 때문에 잠재적으로 유익한 전략이다. 다른 장점은 시각적 검색을 지원하고 숙련된 임상의가 일반적으로 두 번째 검사를 필요로 하는 해부학적 특징이나 병리학에 대해 논의하는 것을 포함할 수 있다.
We suggest that there may be a trade-off between decreasing hands-on time and increasing time spent on observation of and interactions with other learners. In our study, the time spent in constructive and interactive activities did not differ between dyads, triads and tetrads, and even though participants in dyads had more hands-on time than participants in triads or tetrads, they still had similar learning outcomes. These findings indicate that participants seemed to compensate for the reduced hands-on time through higher levels of cognitive engagement as a consequence of collaborative efforts. Specifically, during training of procedural skills such as ultrasound, collaborative learning can prove beneficial, as there are multiple tasks that should be performed simultaneously (e.g. manipulating the probe, adjusting machine settings and communicating with the patient while engaged in the visual diagnostic task). Distributing tasks between learners is a potentially beneficial strategy as it allows learners to stay engaged in learning without cognitive overload.5 Other advantages may include assisting visual search and discussing anatomical features or pathology that normally require a second look by an experienced clinician.

우리는 이전 연구에서 우리의 개입 시간(2시간)이 효과를 유도하기에는 충분하지만, 학습 곡선이 평평해져 (+4시간) 천장 효과로 이어지는 데 필요한 것보다 적다는 것을 알고 있다. 작업 시간 및 그에 따라 사용 가능한 실습 시간의 양은 일반적으로 학습의 가장 중요한 결정 요소이다. 그러나 우리의 연구에서, 협업 학습 중 [관찰]과 [고등 수준 ICAP 활동]은 줄어든 연습 시간보다 더 큰 효과를 갖는 것outweigh 으로 보였다. 그러나, [연습 시간]과 ICAP 활동은 모두 그룹 크기에 의해 교란되었기 때문에, 우리는 이 두 대립되는 힘이 연구에서 관찰된 학습 결과에 기여한 정도를 직접적으로 추론할 수 없다.

We know from previous studies that the duration of our intervention (2 hours) was sufficient to induce an effect but less than required for the learning curves to flatten (+4 hours) leading to a ceiling effect.19 Time-on-task and thereby the amount of hands-on time available are normally the most important determinants of learning; however, in our study, observation and higher-order ICAP activities during collaborative learning seemed to outweigh the reduced hands-on time. Yet, because hands-on time and ICAP activities were both confounded by group size, we cannot infer directly the extent to which these two opposing forces contributed to the learning outcomes observed in our study.

Shebilske 등의 최근 연구는 파일럿 훈련을 위한 비디오 과제를 학습할 때 개인, 다이아드, 트라이아드 및 테트라드 간에 유사한 학습 결과를 보여주었다. 저자들은 주로 그들의 결과의 원인을 [관찰]이 갖는 긍정적인 효과로 돌렸다. 관찰 학습은 (다른 이론들 중에서도) [미러뉴런 가설]에 의해 뒷받침되는데, [미러뉴런 가설]은 전운동 피질의 영역이 스킬의 수행과 관찰 동안 모두 활성화된다고 주장한다. 우리의 결과는 그룹 간 유사한 이전 결과에 대한 핵심 이유로 관찰을 지원하지만, 다른 사회적 및 상호 작용 메커니즘이 협업 복잡한 기술 학습, 특히 실용적인 기술 학습에 관여한다는 것을 제안함으로써 이 발견을 확장한다. [전통적인 ICAP 프레임워크]는 관찰을 수동적 활동으로 두는 반면, [임상 기술 훈련 중]에 이뤄지는 관찰은 [건설적이고 상호작용적인 활동의 기초 역할]을 하기 때문에 고차 학습 활동과 분리할 수 없다. 그러나 관찰은 참여의 인지적 수준에 관계없이 수동적 활동으로 분류되며, 이는 피로, 동기부여 또는 집중력 부족 또는 지루함의 결과로 수동적 활동과 비교될 수 없다. ICAP 프레임워크는 모든 종류의 학습 활동을 포함하도록 되어 있지만, 실제 기술을 학습하기 위한 관찰의 역할을 과소평가할 수 있다. 이러한 의미에서 관찰의 개념은 임상 기술 학습에서 그것의 역할을 완전히 이해하고 실용적인 기술 학습 동안 활동을 더 잘 개념화하기 위해 다양한 수준의 인지 참여를 포함하도록 확장될 필요가 있을 수 있다.

A recent study by Shebilske et al. demonstrated similar learning outcomes between individuals, dyads, triads and tetrads when learning a video task for pilot training.33 The authors primarily ascribed their results to the positive effects of observation.34 Observational learning is (among other theories) supported by the mirror neuron hypothesis, which claims that areas in the premotor cortex are activated both during the performance and observation of a skill.5, 31, 33, 35 Our results support observation as a key reason for similar transfer results between groups but expands this finding by suggesting that other social and interactive mechanisms are involved in collaborative complex skills learning, in particular for practical skills learning.15 While the traditional ICAP framework places observation as a passive activity,12 it is inseparable from the higher-order learning activities because it serves as a basis on which constructive and interactive activities unfold during clinical skills training. However, observation is categorised as a passive activity regardless of the cognitive level of engagement, which may not be compared with passiveness as a result of fatigue, lack of motivation or concentration or from boredom. Although the ICAP framework is supposed to cover all kinds of learning activities, it may undervalue the role of observation for learning practical skills. In this sense, the concept of observation may need to be expanded to include various degrees of cognitive engagement to fully understand its role in clinical skills learning and to better conceptualise activities during practical skills learning.

우리는 트라이애드 및 테트라드의 참가자들이 다이애드 및 단일 그룹의 참가자들보다 [비학습 및 수동 학습 범주(0 + 1)에] 더 많은 시간을 보낸다는 것을 발견했다. 이는 다이애드에 배정된 학습자 간의 헌신과 친밀도가 증가했기 때문일 수 있으며, 이는 그룹 크기가 증가함에 따라 감소할 수 있다.36 우리는 (잘못) 비학습 및 수동적 활동의 증가가 대규모 그룹의 기술 전이를 낮출 것이라고 예상했다. 이번 연구에서는 비록 그렇지 않았지만, 우리는 [[실습 시간의 양]과 [협력적 보상 효과] 사이의 균형]이 [더 큰 그룹(4명 이상의 학습자)]에 대해 어느 시점에서 피크가 될 것이라고 예상한다. 참가자가 동기를 유지하고 협업이 의미 있다고 생각하는 조건을 탐구하는 것은 이전 연구에서 학습자가 우려하는 원인이었으므로 [더 큰 크기의 그룹]을 다룰 때에는 고려해야 할 중요한 측면이다. 
We found that participants in triads and tetrads spent more time in the non-learning and passive learning categories (0 + 1) than the participants in dyads and single groups. This could be due to increased commitment and intimacy between learners in the dyad constellations, which may decrease with increasing group size.36 We (incorrectly) anticipated that the increase in non-learning and passive activities would have led to lower levels of skills transfer in the large groups. Although this was not the case, we expect that the balance between the amount of hands-on time provided and collaborative compensatory effects must at some point tip for larger groups (more than four learners). Exploring under which conditions participants remain motivated and consider it meaningful to collaborate is an important aspect to consider when dealing with larger group sizes as this has been a cause of concern voiced by learners in previous studies.37-39

4.1 강점/한계
4.1 Strengths/limitations

이 연구의 강점은 무작위 설계, 포함된 큰 표본 크기, 확립된 유효성 증거를 포함한 평가 점수 사용, 관심의 핵심 결과를 반영하기 위한 이전 테스트 사용 등이다.
Strengths of this study include the randomised design, the large sample size included, the use of assessment scores with established validity evidence and the use of transfer tests to reflect the key outcome of interest.

이 연구는 또한 몇 가지 한계를 가지고 있다. 우리는 초보자 및 복잡한 단일 임상 절차에 초점을 맞췄습니다. 향후 연구는 우리의 연구 결과가 [더 진보된 학습자]와 [다른 유형의 실제 기술]에서도 translate되는지 여부를 입증할 필요가 있다. (예: 단순 대 복잡한 기술 또는 진단 대 치료 절차). 대부분의 참가자들은 여성이었지만, 우리는 참가자들이 무작위화되고 이후 그들의 사전 테스트에서 동등하게 수행되었기 때문에 이 연구에서 성별에 초점을 맞추지 않기로 결정했다. 따라서, 우리는 이러한 맥락에서 성별의 영향에 대해 더 이상 논의하는 것이 적절하지 않다는 것을 발견했다. 학생들은 시뮬레이터에 의해서만 생성된 피드백으로 훈련했다. 지도받지 않은 연습은 강사의 감독 없이 과제를 오해하게 만들 수 있으며, 이는 더 큰 그룹이 오류와 오해를 바로잡는 데 불균일한 이점을 제공했을 수 있다. 우리는 4명의 참가자가 동기를 유지하기 위한 상한선이 될 것으로 예상했기 때문에 최대 4명의 참가자로 구성된 그룹 규모만 조사했다. 그룹 크기가 증가함에 따라 수동적이고 비학습 활동이 증가하는 것을 관찰했지만, 학습 결과가 악화되는 최적의 그룹 크기나 지점을 식별하지 못했다. 이를 위해, 우리는 여러 개의 큰 그룹을 포함하거나 이전 결과의 작은 차이를 입증하기 위해 표본 크기를 10배 증가시켜야 했는데, 둘 다 실현 불가능했을 것이다. 마지막으로, 우리가 검출하기 위해 연구에 동력을 공급한 크기보다 낮은 전이 테스트 성능에서 차이가 있었을 수 있다. 그러나 문제는 작은 차이가 일반적으로 이득이 큰 시뮬레이션 기반 의료 교육 분야 내에서 관련성이 있는지 여부이다.

The study also has some limitations. We focused on novices and on a single complex clinical procedure. Future research needs to establish whether our findings translate to more advanced learners and to different types of practical skills (e.g. simple versus complex skills or diagnostic versus therapeutic procedures). Most of the participants were women; however, we have chosen not to focus on gender in this study as the participants were randomised and subsequently performed equally on their pre-test. Therefore, we did not find it relevant to discuss the influence of gender any further in this context. The students trained with feedback only generated by the simulator. Uninstructed practice may lead to misunderstandings of the assignments without supervision by an instructor, which may have provided an uneven advantage for the larger groups to correct errors and misunderstandings. We only explored group sizes of up to four participants as we expected four participants to be the upper limit to remain motivated. While we did observe an increase in passive and non-learning activities with increasing group size, we did not identify an optimum group size or a point, in which learning outcomes worsened. To do this, we would have had to either include several larger groups or increase our sample size 10-fold to demonstrate small differences in transfer outcomes, both of which would have been infeasible. Finally, there may have been differences in transfer-test performances that were below the magnitude we powered our study to detect. The question is, however, if small differences are of relevance within the field of simulation-based medical education, where gains are usually large.

5 결론
5 CONCLUSION

최대 4명의 참가자로 구성된 그룹 규모의 협업 기술 학습은 실무 시간이 줄었음에도 불구하고 기술 이전을 손상시키지 않았다. 이 발견은 체험 시간 감소의 부정적인 효과를 능가하는 건설적이고 상호적인 학습 활동에 대한 보상적 전환과 결합된 관찰의 역할에 의해 설명될 수 있다.

Collaborative skills learning in group sizes of up to four participants did not impair skills transfer despite less hands-on time. This finding may be explained by the role of observation combined with a compensatory shift towards constructive and interactive learning activities that outweigh the negative effects of diminishing hands-on time.

 


Med Educ. 2022 Jun;56(6):680-689. doi: 10.1111/medu.14791. Epub 2022 Mar 16.

Does group size matter during collaborative skills learning? A randomised study

Affiliations collapse

Affiliations

1Copenhagen Academy for Medical Education and Simulation (CAMES), Copenhagen University Hospital - Rigshospitalet, Copenhagen, Denmark.

2Centre for Educational Development, Aarhus University, Aarhus, Denmark.

3Department of Family & Community Medicine, University of Toronto, Toronto, Canada.

4Center of Fetal Medicine, Department of Obstetrics, Copenhagen University Hospital - Rigshospitalet, Copenhagen, Denmark.

5Department of Gynecology and Obstetrics, Copenhagen University Hospital - Hvidovre, Copenhagen, Denmark.

6Fetal Medicine Unit, Department of Obstetrics and Gynaecology, Copenhagen University Hospital - Herlev, Copenhagen, Denmark.

7Department of Clinical Medicine, Faculty of Health and Medical Sciences, University of Copenhagen, Copenhagen, Denmark.

PMID: 35262226

PMCID: PMC9313549

DOI: 10.1111/medu.14791

Free PMC article

Abstract

Background: Collaborative skills learning in the form of dyad learning compared with individual learning has been shown to lead to non-inferior skills retention and transfer. However, we have limited knowledge on which learning activities improve collaborative skills training and how the number of collaborators may impact skills transfer. We explored the effects of skills training individually, in dyads, triads or tetrads on learning activities during training and on subsequent skills transfer.

Methods: In a randomised, controlled study, participants completed a pre-post-transfer-test set-up in groups of one to four. Participants completed 2 hours of obstetric ultrasound training. In the dyad, triad and tetrad group participants took turns actively handling the ultrasound probe. All performances were rated by two blinded experts using the Objective Structured Assessment of Ultrasound Skills (OSAUS) scale and a Global Rating Scale (GRS). All training was video recorded, and learning activities were analysed using the Interactive-Constructive-Active-Passive (ICAP) framework.

Results: One hundred one participants completed the simulation-based training, and ninety-seven completed the transfer test. Performance scores improved significantly from pre- to post-test for all groups (p < 0.001, ηp2 = 0.55). However, group size did not affect transfer test performance on OSAUS scores (p = 0.13, ηp2 = 0.06) or GRS scores (p = 0.23, ηp2 = 0.05). ICAP analyses of training activities showed that time spent on non-learning and passive learning activities increased with group size (p < 0.001, ηp2 = 0.31), whereas time spent on constructive and interactive learning activities was constant between groups compared with singles (p < 0.001, ηp2 = 0.72).

Conclusion: Collaborative skills learning in groups of up to four did not impair skills transfer despite less hands-on time. This may be explained by a compensatory shift towards constructive and interactive learning activities that outweigh the effect of shorter hands-on time.

환경-정규화: 맥락 속 혁신의 수명을 평가하기 (Acad Med, 2021)
Eco-Normalization: Evaluating the Longevity of an Innovation in Context
Deena M. Hamza, PhD, and Glenn Regehr, PhD

 

 

[교육 혁신]은 단순히 빈번한 실천이 아니라 보건직 교육에서 깊이 자리 잡고 있는 가치이다. 상대적으로 작은 지역적인 노력에서부터, 국가적, 그리고 심지어 세계적인 운동에 이르기까지, 우리의 건강 전문 교육 저널의 페이지는 혁신에 대한 공동체의 헌신에 대한 증거입니다. [혁신의 목적]은 우리의 현재 상태를 개선하거나 현 상태를 개선하는 것입니다. [혁신]은 [우리가 열망하는 목표]를 [우리가 원하는 의미 있는 결과로 이어질 것으로 기대되는 활동이나 제품]으로 바꾸는 방법입니다. 그러나 많은 혁신들은 달성하고자 했던 지속적인 변화를 깨닫지 못하고 있다. 일부는 그들의 열망적인 목적을 향해 계속 진화하고 있지만, 많은 사람들은 그들의 의도된 목표에서 문제적으로 벗어나기 시작하거나, 이전 상태로 발전하거나, 또는 완전히 중단된다. [포부]부터 [성공적인 구현], [의미 있고 지속적인 변화]에 이르기까지 [내구성이 뛰어난 다리]를 건설하는 것은 쉽지 않을 수 있으며, 이러한 어려움elusiveness은 복잡한 생태계에 변화를 도입하는 데 어려움이 있다는 것에서 유래한다.

Educational innovation is not just a frequent practice but a deeply held value in health professions education. From relatively small, local efforts to national and even global movements, the pages of our health professions education journals are a testament to the community’s commitment to innovation. The purpose of innovation is to make our current state better, or improve the status quo. Innovations are how we translate aspirational goals into activities or products that are anticipated to lead to the meaningful outcomes we desire. However, many innovations do not realize the lasting changes that they were intended to achieve. While some continue to evolve toward their aspirational purpose, many start to deviate problematically from their intended goals, devolve to the previous state, or are summarily halted altogether. The construction of a durable bridge from aspirations to successful implementation to meaningful and lasting change can be elusive, and this elusiveness stems from the difficulty of introducing change into a complex ecosystem.

[혁신]이 목표를 달성하는 데 성공한다고 가정할 수 없기 때문에, 각 혁신을 [맥락에서 평가하는 것]이 중요하다. 프로그램 평가의 중요성은 한동안 잘 이해되었지만, 접근 방식과 방법은 수십 년 동안 크게 변화했다.

  • [1980년대 이전]에 프로그램 평가는 주로 [실험 패러다임]에 의해 inform되었으며, 혁신이 의도한 결과를 달성했는지 여부를 결정하기 위해 통제된 연구를 사용했다.
  • [1980년대]부터 [현실세계에서 구현의 맥락적·변혁적 과정]을 이해할 필요가 있음을 인정한 [이론 중심의 평가]의 발전으로 전환했다.  "블랙박스 평가"라는 용어는 [성과만을 검토하는 평가 도구]가 [구현 노력의 내부 작업에 대한 증거]를 포착할 수 없다는 인식을 상징한다. 이것은 [구현에 대한 정보 부족]과 [혁신이 맥락 속에서 어떻게 기능하는지에 대한 정보 부족]이 [개선을 위한 의미 있는 노력]이나 [혁신의 지속, 수정 또는 중단에 대한 현명한 의사결정]을 방해했기 때문에 문제가 되었다. 더욱이, 평가에 대한 이러한 접근법은 종종 간과되었고, 아마도 의도하지 않은 불리한 결과에 영구화되거나 심지어 기여했다.

Because it cannot be assumed that an innovation will be successful in achieving its goals, it is important to evaluate each innovation in context. While the importance of program evaluation has been well understood for some time, the approaches and methods have shifted significantly over the decades.

  • Before the 1980s, program evaluation was predominantly informed by the experimental paradigm, using controlled studies to determine whether the innovation had achieved its intended outputs. 1–4 
  • Starting in the 1980s, there was a shift to the development of theory-oriented evaluations that acknowledged the need to understand the contextual and transformational processes of implementation in the real world. 5–7 The term “black box evaluation” symbolized the recognition that evaluation tools that merely examine outputs could not capture evidence about the inner workings of implementation efforts. 1,8,9 This was problematic since the lack of information about implementation, and how the innovation functioned in context, prevented any meaningful efforts at improvement or sensible decision making about continuing, modifying, or halting an innovation. Moreover, this approach to evaluation often overlooked, and perhaps perpetuated or even contributed to, unintended and adverse consequences. 10–13

따라서

  • [1990년대 이후], [실제 구현의 맥락]에서 혁신의 내부 작업을 검토하는 프로그램 모니터링 및 평가에 대한 접근 방식인 [구현 충실도]를 검토하는 방향으로의 움직임이 있었다.
    • [프로그램 평가의 충실도 모델]의 핵심 질문은, [새로운 프로그램, 지침, 절차 또는 도구의 활동이 의도한 대로 시스템에 통합되는지 여부]이다.
    • [충실도 측정]은 혁신의 도입, 구현 중 얻은 교훈, 그리고 변화의 예상 결과 사이에 다리를 놓는 것을 목표로 한다.
    • 보건직 교육에서 [구현 충실도]와 ["블랙박스 평가" 접근 방식을 넘어서는 것]에 대한 논의가 교과 개혁의 노력과 함께 재점화되었다.
    • 예를 들어, Van Melle과 동료들은 캐나다 전역에 도입된 커리큘럼 혁신의 핵심 구성 요소 구현의 충실도를 검토하기 쉽게 하는 안내 프레임워크를 개발했다. 또한 Onyura와 동료들은 맥락, 메커니즘 및 결과 사이의 관계를 평가함으로써 교수 개발 이니셔티브가 어떻게 그리고 왜 그 형태를 취하는지 탐구했다. 26
  • Thus, since the 1990s, there has been a movement toward examining implementation fidelity, an approach to program monitoring and evaluation that examined the inner workings of an innovation in the context of real-world implementation. 14 
    • The core question in the fidelity model of program evaluation is whether the activities of a new program, guideline, procedure, or tool are incorporated into a system as intended. 14–20 
    • Fidelity measures aim to build a bridge between the introduction of an innovation, lessons learned during implementation, and the anticipated outcomes of change. 21 
    • In health professions education, discussions about implementation fidelity and moving beyond “black box evaluation” approaches have reignited alongside efforts at curricular reform. 22–24 
    • For example, van Melle and colleagues have developed a guiding framework that facilitates examining the fidelity of implementing the core components of a curricular innovation introduced across Canada. 25 Additionally, Onyura and colleagues have explored how and why faculty development initiatives take their form by evaluating the relationship between contexts, mechanisms, and outcomes. 26

이 접근 방식은 프로그램 평가에 대한 우리의 생각을 발전시키는 데 의심할 여지 없이 중요했지만, 프로그램 평가 노력에서 [충실도를 검사하는 방법]은 [시간이 지남에 따른 혁신의 궤도에 대한 우리의 생각]을 무심코 제한할 수 있다. 예를 들어,

  • 충실도 평가는 평가 시점에 어떤 일이 일어나고 있는지에 대한 [심층적인 스냅샷]을 캡처하는 경향이 있습니다. 이러한 스냅샷은 [구현 단계의 우수한 단면]을 나타낼 수 있지만, 혁신을 제정하기 위한 [제도적 동기가 여전히 최고조에 있는 기간(구현 중)]에 초점을 맞추는 경향이 있다.
    • 따라서, 이 시기에는 자원(리더십의 적극적이고 목소리 높은 지원뿐만 아니라 재정, 물리적, 인적 자원 포함)은 여전히 이니셔티브에 많은 투자를 하고 있다.
    • 이것은 [기관의 주요관심 자원이 다른 곳에 할당될 때] 복잡한 시스템 내에서 어떤 일이 일어날지에 대한 결정적 질문을 제기한다.
  • 또한, 구현 조사의 충실도는 [프로그램이 의도된 대로 제공되고 있는지 여부]에 초점을 맞추는 경향이 있으며, 이는 [구현의 기계적 또는 행동적 측면]에 초점을 맞추는 것으로 이어진다. 이러한 초점은 이러한 행동이 나타내는 기본 가치의 채택을 반영하는 범위를 간과하거나 구현의 "감시 기간" 동안 교사와 학생이 수행하는 단순한 행위일 수 있다.

While this approach has been of undisputed importance in advancing our thinking about program evaluation, the methods by which fidelity is examined in program evaluation efforts may inadvertently limit our thinking about the trajectory of the innovation over time.

  • For example, fidelity assessment tends to capture in-depth snapshots in time about what is happening at the moment of the evaluation. These snapshots may represent an excellent cross section of the implementation phases, but they tend to be focused on the period when the institutional motivation for enacting the innovation is still at its peak (during implementation).
    • Thus, resources (including financial, physical, and personnel resources, as well as active and vocal support from leadership) are still being heavily invested in the initiative.
    • This raises the critical question of what will happen within a complex system when the institution’s attentional resources are allocated elsewhere.
  • Further, fidelity of implementation inquiries tends to focus on whether the program is being delivered as intended, which leads to a focus on the mechanical or behavioral aspects of implementation. This focus may overlook the extent to which these behaviors reflect an adoption of the underlying values that those behaviors are intended to represent, or are merely performative acts by teachers and students during the “surveillance period” of the implementation. 27

이는 [구현 단계에서 관찰된 행동]이 [의미 있고 오래 지속되는 변화를 나타내는지]에 대한 의문을 제기한다. 혁신의 75%는 시간이 지남에 따라 [명시적으로 포기]되거나, [점진적으로 양도]되며, 이는 종종 [변화 이니셔티브의 주기적인 재창조]로 이어진다. 이러한 [커리큘럼 리뉴얼의 회전목마]는 시스템 내의 모든 이해 당사자들에게 불편하고, 지치고, 의욕을 잃게 합니다. 따라서 현재의 충실도뿐만 아니라, [변화의 내구성 또는 수명에 대한 포괄적인 그림]을 생성하는 [구현 모니터링 및 평가에 대한 접근 방식]을 반성하고 진전시킬 필요가 있다. 홀과 동료들이 주장했듯이, 혁신의 구현을 검토하는 것은 "스프린트가 아닌 마라톤"으로 간주되어야 한다. 
This raises the question of whether the behaviors observed during implementation phases represent a meaningful, long-lasting change. It is estimated that 75% of innovations are explicitly abandoned or gradually devolve over time, which often leads to the cyclic reinvention of change initiatives. 28–30 This carousel of curricular renewal 31 is inconvenient, exhausting, and demotivating for all stakeholders within a system. Thus, there is a need to reflect on and advance approaches to monitoring and evaluating implementation that produce a comprehensive picture not only about current fidelity but also about the durability or longevity of the changes. As Hall and colleagues have argued, examining the implementation of an innovation must be considered a “marathon not a sprint.” 32

구현 과학 문헌에서 [지속 가능성(sustainability)]은 혁신의 잠재적 수명을 고려할 때 사용되는 일반적인 용어이다. 비록 공유 정의가 아직 개발되지 않았지만(최근 209개의 원래 연구 기사에 대한 검토에서 24개의 서로 다른 지속 가능성의 정의가 확인됨), [지속가능성]에 대한 가장 일반적인 이해는 [혁신의 전달delivery에 대한 지속적인 지원(예: 금융 및 인적 자본)]과 [원하는 결과의 지속적인 달성]을 포함한다. 33 그러나 현재까지 프로그램을 종단적으로 검토하는 출판된 연구는 상대적으로 적기 때문에, 기관의 관심이 다른 곳으로 향하였을 때 혁신이 효과적으로 지속(그리고 진화하는) 방법(그리고 그 이유)을 탐구하는 문헌은 거의 없다. 그러므로 혁신의 맥락에서 지속 가능성에 대한 대부분의 논의는 실행 단계를 넘어 [프로그램의 실천을 유지하는 데 필요한 지속적인 자원 할당의 메커니즘 제안]을 포함한다. 이러한 자원에 대한 초점 때문에 프로그램 수명(프로그램의 목표와 이러한 목표를 달성할 수 있는 실무에 대한 이해관계자의 지속적인 참여)의 사회학적 측면은 문제적으로 무시된다.
In implementation science literature, sustainability is a common term used when considering the potential longevity of an innovation. Although a shared definition has yet to be developed (in a recent review of 209 original research articles, 33 24 different definitions of sustainability were identified), the most common understanding of sustainability involves continued support for the delivery of the innovation (e.g., financial and human capital) and continued achievement of the desired outcomes. 33 To date, however, there have been relatively few published studies that examine programs longitudinally, so there is little literature exploring the ways in which (and reasons that) innovations continue (and evolve) effectively, deviate problematically, or devolve once institutional attention is directed elsewhere. Thus, most discussions of sustainability in the context of innovations involve proposed mechanisms of ongoing resource allocation needed to maintain the program’s practices beyond the implementation phase. Because of this focus on resources, the sociological aspects of program longevity (ongoing stakeholder engagement in the goals of the program and the practices that will achieve those goals) are problematically ignored.

[혁신의 (잠재적) 수명]을 보다 효과적으로 평가하는 새로운 모델이 필요하다. 본 논문의 목적은 구현 과학의 이론과 모델을 차용하고 구축하여 혁신의 수명을 평가하기 위한 대안 모델을 개발하는 것이다.
A new model that more effectively assesses the (potential) longevity of an innovation (and therefore increases the likelihood of longevity) is needed. The purpose of this paper is to develop an alternative model for evaluating the longevity of an innovation, borrowing from and building on the theories and models of implementation science.

방법
Method

이 접근 방식은 기존 이론과 프레임워크에서 확장되는 새로운 개념 모델을 도출하기 위해 분야에서 관련 문헌을 식별하려고 하기 때문에 비판적 문헌 검토가 우리의 목적에 가장 적합한 방법으로 결정되었다. 비판적 검토 방법론을 사용하여, 저자들은 시스템에 도입된 혁신의 수명을 탐구하기 위한 마커나 전략이 포함된 논문을 위해 구현 과학 문헌을 검색했다. 

A critical literature review was determined to be the most appropriate method for our purpose, since this approach seeks to identify relevant literature in a field to derive a new conceptual model that expands on existing theories and frameworks. 34 Using critical review methodology, the authors searched the implementation science literature for papers that contained markers or strategies to explore the longevity of an innovation once introduced into a system. 


대부분의 기사가 학술 문헌에서 발견되었지만, 일부 회색 문헌 출처는 지식 있는 동료들과의 상호작용과 구글 스콜라를 통해 확인되었다. 관련 논문을 확인한 후, 저자들은 개발 중인 진화하는 모델과 관련된 요소를 이해하고 탐구하는 관점이나 접근 방식을 제공할 수 있는 구현 과학 문헌의 모델을 식별하기 위해 참조 목록을 추적했다.
While most of the articles were found in the academic literature, some gray literature sources were also identified through interactions with knowledgeable colleagues and via Google Scholar. Having identified relevant papers, the authors traced reference lists to identify models in the implementation science literature that might offer perspectives or approaches to understanding and exploring factors relevant to the evolving model being developed.

결과
Results


이 비판적 검토와 관련된 세 가지 주요 구현 과학 모델이 식별되었다. NPT(Normalization Process Theory), CFIR(Consolidated Framework for Implementation Research), RMA(Reflective Monitoring in Action)의 개념을 통합하여 혁신의 잠재적 수명을 평가할 때 고려해야 하는 6가지 질문을 강조하는 프레임워크를 제공한다.
Three prominent implementation science models were identified as relevant to this critical review. Integrating notions from

  • Normalization Process Theory (NPT), 35 
  • the Consolidated Framework for Implementation Research (CFIR), 36 and
  • Reflexive Monitoring in Action (RMA), 37 

we offer a framework that highlights 6 questions that must be considered when evaluating the potential longevity of an innovation.

Normalization Process Theory (NPT): 새로운 프레임워크의 토대는 May와 동료들의 작업으로 시작되었는데, 그들은 [혁신]이 [조직 환경에 효과적으로 포함]되고 [전문적 관행에 통합]되는 정도에 따라 구현의 성공이 좌우될 것이라고 제안했고, 이를 [정상화normalization]라는 프로세스로 명명하였다. [정상화]의 핵심 특징에는 다음이 포함된다.

  • 변화의 추진력, 중요성 및 실천요강에 대한 공유된 이해(일관성)
  • 혁신 활동에 참여하고 모니터링함으로써 변화에 기여한다(참가자 참여). 
  • 새로운 관행을 수행하기 위한 상호 작용 및 관계 업무 (집단적 행동)
  • 변경사항의 영향을 평가하는 작업(성찰적 모니터링) 

이와 같이, NPT에서 기술혁신의 수명을 평가하는 것은 개인과 집단 간의 상호 작용을 조사하고 집단적 변화에 기여하는 능력과 자원을 평가하는 것을 포함한다.

The foundation for the new framework began with the work of May and colleagues, who have suggested that the success of an implementation will be dependent on the extent to which the innovation is effectively embedded in the organizational context and integrated into professional practices, a process they describe as normalization. 35,38 Core features of normalization include

  • the shared understanding of the impetus, importance, and practices of the change (coherence);
  • contribution to the change by participating in and monitoring the activities of the innovation (cognitive participation);
  • the interactional and relational work to perform new practices (collective action); and
  • the work of evaluating the impact of the change (reflexive monitoring). 35 

As such, in NPT, evaluating the longevity of an innovation involves examining the interactions between individuals and groups as they make sense of the work and appraise their capabilities and resources to contribute to collective change.

Consolidated Framework for Implementation Research (CFIR): 다른 관점에서 모니터링과 평가를 고려하면서, Damschroder와 동료들은 [구현의 성공]은 다면적이며, 개인의 작업 이상의 요소를 수반한다고 제안했다. 그들은 프로그램 평가자들이 [더 큰 변화의 생태계]를 보도록 안내하기 위해 CFIR을 개발했다. 따라서 CIFR 모델은 5개의 주요 도메인을 조사한다.

  • (1) 설계 품질 및 증거의 강도, 재판 가능성 및 변경사항의 인식된 상대적 우위성과 같은 혁신의 특성 
  • (2) 외부 정책, 압력, 요구 및 자원과 같은 "외부의" 설정 
  • (3) 조직의 구조, 문화 및 변화에 대한 준비와 같은 "내부의" 설정 
  • (4) 혁신과 자기 인식에 대한 지식과 신념과 같은 개인의 특성 
  • (5) 시스템에 변화를 도입하기 위해 사용되는 전략, 그리고 혁신 결과를 반영하고 평가하는 과정과 같은 구현 과정, 

Contemplating monitoring and evaluation from a different perspective, Damschroder and colleagues have proposed that implementation success is multifaceted and involves factors beyond the work of individuals. They developed the CFIR 36 to guide program evaluators to look at the larger ecosystem of change. Thus, the CIFR model examines 5 primary domains:

  • (1) the characteristics of the innovation, such as design quality and strength of evidence, trialability, and perceived relative advantage of the change;
  • (2) the “outer” setting, such as external policies, pressures, needs, and resources;
  • (3) the “inner” setting, such as the structure of the organization, culture, and readiness for change;
  • (4) individual characteristics, such as knowledge and beliefs about the innovation and self-efficacy; and
  • (5) the process of implementation, such as strategies used to introduce change into a system, and reflecting on and evaluating innovation outcomes. 36

Reflexive Monitoring in Action (RMA): 이 두 가지 프레임워크는 RMA 프레임워크에 의해 잘 보완될 수 있습니다.

  • 성찰적 모니터링은 [원하는 목표에 도달하기 위한 미래 계획을 dictate]하기 위해 [혁신에 대한 과거의 경험을 조사함]으로써 합리적인 행동을 촉진한다. 그러므로,
  • RMA는 [혁신의 야망]에 도달하기 위한 [장기적인 시스템 수준 변화를 달성]하기 위해, [집단적 반성의 사용]과 이러한 [반성에서 배우는 것]을 촉진한다.
  • RMA는 [혁신을 이행하는 사람들의 일상적 경험에 대한 면밀한 검토와 구현]을 넘어, [혁신을 지속하는 데 필요한 시스템 수준의 변화]를 발견하는 사이에서 진동한다.

RMA는 계획-실행-연구-행동 모델 및 의료환경의 기타 품질 개선 이니셔티브와 같은 [여러 다른 모니터링 및 평가 접근방식의 주기적 활동]과 유사하다. 그러나 이는 세 가지 측면에서 이러한 접근법과 다르다.

  • 첫째, 성찰적 모니터링은 시스템 내에서 [점진적 변화를 요구하는 혁신]보다는, [급진적 변환을 요구하는 혁신]에 이상적으로 적합하다. 
  • 둘째, RMA는 [단기간에 걸친 구현의 일부분]을 탐구하기보다는, [혁신의 장기적 야심적 목표]를 검토한다. 
  • 셋째, RMA는 [혁신 활동의 최적화]와 [이러한 활동을 혁신의 목표에 맞추는 것] 사이에서 흔들림으로써, 혁신의 수명을 조사한다. 이름에서 알 수 있듯이, [반사적 모니터링]은 반드시 초기 구현 기간 이후에 제정되어야 하는 지속적인 프로세스이다.

These 2 frameworks can be complemented well by the RMA 37 framework.

  • Reflexive monitoring promotes rational action by examining past experiences with an innovation to dictate future plans to reach desired goals. 39 
  • Thus, RMA promotes the use of collective reflection, and learning from these reflections, to accomplish long-term system-level change to reach the ambitions of the innovation. 37 
  • RMA oscillates between close examination of the everyday experiences of the people implementing an innovation and uncovering system-level changes that are needed to sustain the innovation beyond implementation. 37 

RMA resembles the cyclic activities of other monitoring and evaluation approaches, such as the Plan-Do-Study-Act model and other quality improvement initiatives in health care settings. 40 However, it differs from these approaches in 3 significant ways.

  • First, reflexive monitoring is ideally suited for innovations that require radical transformation rather than innovations that require incremental changes within a system. 37 
  • Second, RMA examines the longer-term aspirational goals of the innovation rather than exploring a segment of implementation over a short period of time. 37 
  • Third, RMA examines the longevity of the innovation by oscillating between optimizing the activities of the innovation and the alignment these activities with the goals of the innovation. 37 As implied by the name, reflexive monitoring is necessarily an ongoing process that should be enacted beyond the initial implementation period.

이러한 이론, 프레임워크 및 관행을 종합하면 성공적인 구현을 위한 지표는 [[시스템과 작업을 수행하는 사람들]이 [혁신의 특징 및 활동]과 [변화의 웅대한 포부]와 상호작용하는 방법]에 뿌리를 두고 있음이 명백하다. 이와 같이, 우리의 새로운 모델인 [환경-정규화] (즉, 개인 차원뿐만 아니라, 전체 생태계의 수준에서, 혁신의 가치와 실천의 정규화)는 변화의 잠재적 수명에 초점을 맞춘 구현 연구와 평가를 위한 지침 프레임워크의 형태로 이전 문헌의 확장이다. 

Putting these theories, frameworks, and practices together, it is evident that markers for successful implementation are rooted in how the system and people doing the work interact with both the features and activities of the innovation and the grand aspirations of the change. As such, our new model, Eco-Normalization (i.e., normalization of the values and practices of the innovation not just at the individual level but at the level of the entire ecosystem), is an expansion of previous literature in the form of a guiding framework for implementation research and evaluation that focuses on the potential longevity of change.

[혁신], [혁신이 내재된 제도적 시스템], [작업을 수행하는 개별 사람들] 사이의 상호작용을 조사함으로써, 에코-정규화 모델은 [구현된 혁신의 의미]와 [혁신의 수명에 영향을 미칠 수 있는 조건과 요소]를 체계적으로 탐구하는 프레임워크를 제공한다. 그림 1. 

  • 일차 수준 상호 작용은 이러한 열망과 각 3가지 구성 요소 사이의 상호 작용을 검토할 때 [변화의 포부]를 전면에 내세운다:
    • 혁신의 설계,
    • 이해관계자의 지역적 포부
    • 시스템의 포부(그림 1) 
  • 이차 수준 상호 작용은 일차 수준 상호 작용 사이의 더 복잡한 관계를 탐구하기 시작한다:
    • 혁신과 작업을 하는 사람들의 실천 사이의 양립성,
    • 시스템이 이해관계자에게 영향을 미치는 방식,
    • 그리고 혁신의 특징이 시스템의 특징과 어떻게 일치하는지. 

By examining the interactions between the innovation, the institutional system in which the innovation is embedded, and the individual people doing the work, the Eco-Normalization model offers a framework to systematically explore the conditions and factors that might affect the meaningfulness and longevity of an implemented innovation as depicted in Figure 1.

  • Primary-level interactions hold the aspirations of the change at the forefront when examining the interaction between these aspirations and each of 3 components:
    • the design of the innovation,
    • the local aspirations of stakeholders, and
    • the aspirations of the system (Figure 1).
  • Secondary-level interactions begin to explore more complex relationships between primary-level interactions:
    • the compatibility of the innovation with the practices of the people doing the work,
    • the ways in which the system impacts stakeholders, and
    • how the features of the innovation fit with the features of the system.

다양한 구성 요소가 1차 및 2차 상호작용 수준에서 정렬(또는 정렬되지 않음)되는 정도를 평가하면 에코 정규화 프로그램 평가의 기초를 이루는 [6개의 질문]이 생성됩니다.

Assessing the extent to which the various components align (or not) at the primary and secondary levels of interaction produces 6 questions that form the basis of an Eco-Normalization program evaluation.

 

 

일차 수준 상호 작용
Primary-level interactions

[변화의 포부]와 [혁신 설계] 간의 상호 작용: 설계한 대로 [혁신]이 [변화의 웅대한 포부]와 일치합니까?
Interactions between change aspirations and innovation design: Does the innovation, as designed, align with the grand aspirations of change?

[변화의 야심찬 목표]와 [혁신의 설계] 사이의 조정은 구현 성공의 중요한 특징이다. 예를 들어, 보건직 교육에서 [대망적 목표]는 개인화된 학습 문화의 개발을 포함할 수 있다. 그러나 이러한 웅대한 포부를 새로운 실천과 활동으로 혁신으로 번역translate 하는 것은 [무엇이, 왜 일어나는가에 대한 제안 또는 가정]인 [전략적 의도strategic intention]에 기초하며, 종종 [로직 모델 또는 프로그램 이론의 개발]이라는 형태로 설명된다. 이러한 가정은 구현 충실도의 평가와 유사한 프로세스를 통해 실제로 입증, 수정 또는 이의를 제기할 수 있다. 그러나 RMA의 원칙과 일관되게, [에코 정규화 모델]은 [혁신이란, 정적이 아니라, 끊임없이 변화하는 맥락에서 진화할 것으로 예상되는 일련의 역동적 특징이다]는 전제를 포함한다. 그러므로 혁신이 진화할 것으로 예상되는 현실을 고려했을 때, [환경-정규화]의 중요한 특징은, [혁신의 활동과 실천요강이 변화 뒤에 있는 거대한 포부의 달성을 촉진하거나 방해할 수 있는 방식으로 바뀌는지(혹은 어떻게 바뀌어가는지)]를 밝혀내는 [주기적인 모니터링]이다.

The alignment between the aspirational goals of change and the design of the innovation is a critical feature of implementation success. For example, in health professions education, grand aspirational goals may include development of a culture of personalized learning. However, translating these grand aspirations into an innovation with new practices and activities is founded on strategic intentions, which are propositions or assumptions of what is believed to happen and why, and often illustrated in the form of a logic model or development of a program theory. 24 These assumptions can be proven, modified, or contested in practice, through a process that might resemble the evaluation of implementation fidelity. However, consistent with the tenets of RMA, the Eco-Normalization model includes the premise that innovations are not static, but a set of dynamic features that are expected to evolve in ever-changing contexts. Thus, considering the reality that innovations are expected to evolve, a critical feature of Eco-Normalization is cyclic monitoring to uncover if/how the activities and practices of the innovation are being altered in ways that might facilitate or hinder achievement of the grand aspirations behind the change.

변경 포부와 시스템 간의 상호 작용: [시스템 목표]가 [변화의 거대한 포부]와 일치합니까?
Interactions between change aspirations and the system: Do the system goals align with the grand aspirations of change?

혁신은 일반적으로 [문화적, 절차적, 재정적, 구조적 뿌리가 깊은 확립된 내부 환경]에 통합된다. 예를 들어, 개별화된 학습personalized learning이 변화의 밑바탕에 있는 열망일 수 있다. (이것을 하려면 교육 및 학습에 더 많은 관심과 자원이 필요할 수 있다). 기관이 원칙적으로 이러한 포부에 동의할 수 있지만, 기관 지도자들은 이러한 포부를 [주주들에 대한 재정적 책임]과 같은 [다른 가치 및 포부]와 균형을 맞춰야 할 수도 있다. [재정적으로 수익성이 좋은 활동]에 우선순위를 두는 것은 [교육 및 사회적 책임의 우수성]을 암묵적으로 또는 명시적으로 박탈할 수 있다. 따라서, 각각을 따로 보면, 이러한 열망적 목표 각각은 시스템의 우선순위가 될 수 있다. 그러나, 다 모아놓고 본다면, [변화의 동기가 되는 가치]와 [시스템에서 독점적인 가치] 사이의 충돌은, 변화의 환경-정규화 또는 수명을 방해할 가능성이 있다.

Innovations are generally incorporated into established inner settings that have deep cultural, procedural, fiscal, and structural roots. For example, personalized learning may be an aspiration underlying the change (which might require greater attention and resources dedicated to teaching and learning). While the institution might agree with this aspiration in principle, institutional leaders might have to balance this aspiration against other values and aspirations, such as financial responsibility to shareholders. Prioritizing financially lucrative activities might implicitly or explicitly deprioritize excellence in education and social accountability. Thus, in isolation, each of these aspirational goals may be priorities of the system; however, in combination, the conflict between the values that underlie the motivation for change and others that are exclusive to the system has the potential to hinder Eco-Normalization, or the longevity, of the change.

변화의 열망과 작업을 수행하는 사람들 사이의 상호 작용: [이해 관계자의 지역적 열망]이 변화의 거대한 열망과 일치합니까?
Interactions between change aspirations and the people doing the work: Do the stakeholders’ local aspirations align with the grand aspirations of change?

[혁신 개발의 가정]은 [더 나은 교육적 실천을 통한 환자 치료 개선]과 같은 [위대한 포부]가 [현장의 일선 이해관계자(교사, 학생 및 행정 직원)의 국지적 포부]와 일치한다는 것이다. 그러나, 원대한 포부는 원칙적으로 변화를 살고 있는 사람들에 의해 지지될 수 있지만, 이러한 [원대한 포부]는 종종 [일상적 실천의 관심]에서는 매우 멀리 떨어져 있다. 이것은 변화를 위한 자극과 변화를 경험하는 사람들의 기능적 요구와 가치 사이에 틈을 초래할 수 있다.

  • 예를 들어, 더 큰 교육적 책임에 대한 원대한 포부는 임상 교사가 학습자에 대한 더 자주 또는 더 정확한 평가를 완료하도록 요구할 수 있다. 그러나 이것은 교사들에 의해 안전한 학습 환경을 개발하고 그들의 학습자와의 멘토 관계를 발전시키는 그들의 더 즉각적인 목표를 방해하는 "게이트 키핑" 관행으로 인식될 수 있다. 
  • 또 다른 예로, 큰 포부는 혁신이 실천에 대한 접근 방식을 개발하는 것을 촉진하는 적응형 전문가의 개발일 수 있지만, 학습자들은 불확실성의 맥락에서 문제 해결을 가르치는 노력을 거부하도록 지식 획득과 확실성을 중시하는 뿌리 깊은 정신적 모델을 가질 수 있다.

그러므로 개발자들의 힘이 미치지 못하는 곳에서, 열망은 [현장의 이해당사자이 가지는 국지적 비전, 가치 및 상대적 우선 순위]와의 충돌로 인해, 혁신이 문제적으로 이탈하거나 중단되어 변화의 의미 있는 수명을 방해할 수 있다.

An assumption in the development of an innovation is that grand aspirations, such as improving patient care through better educational practices, align with the local aspirations of frontline stakeholders on the ground (the teachers, students, and administrative staff). However, while the grand aspirations may be supported in principle by those who are living the change, these grand aspirations are often very far removed from the concerns of daily practice. This can lead to a chasm between the impetus for change and the functional needs and values of those experiencing the change.

  • For example, a grand aspiration of greater educational accountability might require clinical teachers to complete more frequent or more precise assessments of their learners, but this might be perceived by teachers as a “gatekeeping” practice that interferes with their more immediate goal of developing a safe learning environment and mentoring relationship with their learner.
  • As another example, a grand aspiration might be the development of adaptive experts such that the innovation promotes developing approaches to practice, but learners might have an ingrained mental model that values knowledge acquisition and certainty leading them to reject efforts to teach them problem solving in contexts of uncertainty.

Thus, the out-of-reach aspirations of developers may lead to the innovation deviating problematically or halting because of conflicts with the more local vision, values, and relative priorities of stakeholders on the ground, hindering meaningful longevity of the change.

 

이차 수준 상호 작용
Secondary-level interactions

시스템과 혁신 간의 상호 작용: 혁신은 변화의 포부를 이끌어낼 방식으로 시스템과 상호 작용합니까?
Interactions between the system and the innovation: Does the innovation interact with the system in a way that will lead to the aspirations of change?

[혁신의 구현]은 [시스템의 상호 관련 부분들의 집합]에 영향을 미친다. 기존 시스템에 혁신을 도입하려면 [조직 구조, 정책, 우선 순위, 도구, 인센티브 및 위임된 역할에 대한 변화]가 필요한 것이 논리적으로 보이지만, 이러한 측면 중 일부는 [숨겨지거나, 간과되거나, 우선순위로 여겨지지 않는다]. 이러한 요인의 우선 순위가 낮으면 혁신의 궤도에 상당한 영향을 미칠 수 있다.

  • 예를 들어, 혁신의 활동은 환자 치료 루틴에 대한 영향을 고려하지 않고 새로운 임상 커리큘럼을 도입하거나, 그 과정의 평가가 더 큰 평가 시스템과 어떻게 상호 작용할 수 있는지를 고려하지 않고 새로운 과정을 도입하는 것과 같이 시스템에서 양립할 수 없을 수 있다.

이러한 상호작용이 신중하게 고려되고 관리되지 않는다면, [혁신을 시스템 관행과 정책에 효과적으로 통합]하고자 할 때, (해결하기보다는) 문제를 만들 수 있다. 이러한 상황에서 [시스템 장벽]은 집단적 행동collective action을 방해할 수 있으며, 이는 혁신이 문제적으로 이탈하거나 중단되어, 성공적인 변화의 장수longevity를 방해할 수 있다.

The implementation of an innovation impacts the collection of interrelated parts of a system. While it seems logical that introducing an innovation into an existing system requires changes to organizational structures, policies, priorities, tools, incentives, and delegated roles, some of these aspects are hidden, overlooked, or not prioritized. Underprioritization of these factors can significantly impact the trajectory of an innovation.

  • For example, the activities of an innovation may not be compatible in the system, such as introducing a new clinical curriculum without considering its implications for patient care routines, or introducing a new course without considering how assessment in that course might interface with the larger assessment system.

Such interactions, if not carefully considered and managed, can create (rather than solve) problems for effective integration of the innovation into systemic practices and policies. In these circumstances, systemic barriers can hinder collective action, which can lead to the innovation deviating problematically or halting, preventing the longevity of successful change.

작업을 수행하는 사람과 혁신 간의 상호 작용: 그 혁신은 변화의 열망을 이끌어낼 일을 하는 사람들의 행동과 기관에 의미를 불러일으키는가?
Interactions between the people doing the work and the innovation: Does the innovation evoke meaning to actions and agency of the people doing the work that will lead to aspirations of change?

[구현 실패] 또는 [혁신의 수명 부족]의 책임은 종종 [일선 구현자]에게 있다. [혁신에 대한 지식과 기술]과 같은 [개인의 특성]은 종종 빠진 연결고리로 여겨진다. 예를 들어, 구현과 관련된 도전은 구현자들이 변화에 대한 자극과 혁신의 활동을 제정하는 방법에 대해 더 많은 지식, 기술 또는 설득력이 필요하다고 가정하는 보다 전문적인 개발 이니셔티브와 마주한다. 그러나, [행동을 이끄는 [의미와 가치]가 발달하는 것]을 방해할 수 있는 많은 동시적 요소들이 있다. 사실, 일선 구현자들은 변화에 대한 추진력과 개발자들이 설명한 대로 활동을 수행하는 방법을 인지하고 있을 수 있다. 그러나, [강제된 혁신]은 [국지적 열망과 기능적 우선 순위]와 일치하지 않으며, [Agency 및 Power의 감각을 억압하는 것]으로 인식된다. [Agency 및 Power]은 시스템 전반의 집단적 행동의 중요한 요소인 [책임과 관계]를 육성하기 때문에, 혁신을 구현할 때 필수적이다. 예를 들어, 구현을 용이하게 하는 행정 직원의 전문적 개발을 간과하고 혁신의 수령자를 적극적으로 참여시키는 것을 소홀히 하는 것은 그들의 기관, 권력 및 집단성에 영향을 미쳐 성공적인 변화의 수명을 단축시킬 수 있다.
Often, the onus of implementation failure or the lack of longevity of an innovation is placed on frontline implementers. The characteristics of individuals, such as knowledge and skills about the innovation, are frequently assumed to be the missing link. For example, challenges with implementation are met with more professional development initiatives that assume that implementers need more knowledge, skills, or convincing about the impetus for change and how to enact the activities of the innovation. However, there are many concurrent factors that may hinder the development of meaning and values that lead to action. In fact, frontline implementers may be cogently aware of the impetus for change and how to undertake the activities as described by the developers. But, the mandated innovation is perceived to be misaligned with local aspirations and functional priorities, and stifling to the sense of agency and power. Agency and power are imperative when implementing an innovation because they foster responsibility and relationships, which are critical ingredients of collective system-wide action. For example, overlooking the professional development of administrative staff facilitating implementation and neglecting to actively engage the receivers of an innovation can impact their sense of agency, power, and collectivity, derailing the longevity of successful change.

시스템과 작업을 수행하는 사람 간의 상호 작용: 시스템은 변화의 포부를 이끌어낼 방법으로 일을 하는 사람들을 지원합니까?
Interactions between the system and the people doing the work: Does the system support the people doing the work in ways that will lead to aspirations of change?

[혁신과 시스템의 호환성과 적응성]은 일선 구현자 또는 혁신 작업을 수행하는 사람들에게 낙수 효과를 준다. 예를 들어, [혁신에서 요구되는 활동]을 위해서는 [작업흐름을 재구성하거나, 새로운 도구를 사용하거나, 임상 업무에서 교육으로 시간을 재분배]해야 할 수 있다. [시스템이 경직되고 정적이어서 새로운 관행을 수용할 수 없는 경우], 이러한 관행이 일선 이해당사자들에게 추가적인 부담이 된다. [혁신에서 요구하는 새로운 활동의 집행을 지원하는 생태계]가 없다면, 이러한 활동은 [일련의 행정적 의식rituals으로 축소]되거나, [완전히 우회될 위험]이 있다. 이는 변화의 의도를 훼손하고 혁신의 문제적 편차와 중단을 촉진하여 성공적인 장기적 변화를 방해한다.
The compatibility and adaptability of the innovation and the system has a trickle-down effect to frontline implementers, or the people doing the work of the innovation. For example, the activities of an innovation may require the reorganization of workflows or the use of new tools and reallocation of time from clinical duties to teaching. If the system is rigid and static, and therefore unable to accommodate the new practices, then these practices become an added burden for frontline stakeholders. Without an ecosystem that supports the enactment of new activities of the innovation, these activities risk being reduced to a series of administrative rituals or bypassed altogether. This undermines the intentions of the change and promotes the problematic deviation and halting of the innovation, hindering successful long-term change.

논의
Discussion

제안된 [에코 정규화 모델]에서 혁신, 작업을 수행하는 사람 및 시스템은 [공생적]이지, [독립적인 것이 아니다]. 더욱이, 환경-정규화는 경직되기보다는 역동적인 미래 계획을 수용하고 장려하기 때문에, [혁신의 진화]는 실패의 징후라기보다는, 실행의 자연스러운 과정과 결과로 간주된다. 정체성, 역할 및 활동은 새로운 것을 구현하는 작업을 수행하는 동안 진화하지만, 혁신과 시스템 역시 변화의 수명을 촉진하기 위해 구현 중에 진화해야 한다.
In the proposed model of Eco-Normalization, innovations, the people doing the work, and the system are acknowledged to be symbiotic and not independent. Further, Eco-Normalization embraces and encourages forward planning that is dynamic rather than rigid, so the evolution of an innovation is considered a natural process and outcome of implementation rather than a sign of failure. While identities, roles, and activities evolve while doing the work of implementing something new, the innovation and system, too, need to evolve during implementation to promote the longevity of the change.

[에코 정규화]의 프레이밍은 [구현의 충실도와 무결성] 사이의 차이를 그리는 증가하는 대화와 호환된다. 대부분의 구현 과학 문헌은 충실도, 무결성 및 준수라는 용어를 동의어로 사용하지만, [구현 무결성]의 사용 가능한 대체 정의를 보면, [변화의 기저 철학 및 핵심 구성요소에 충실하면서, 지역 요구와 상황에 부합하도록, 혁신의 측면을 조정하고 수정할 수 있는 능력]을 반영한다. 실제로, [혁신의 성공적인 구현을 촉진하는 중요한 요소]에는 [맥락 속에서 혁신의 적응성과 호환성]이 포함된다. 36 

The framing of Eco-Normalization is compatible with a growing conversation drawing a distinction between fidelity and integrity of an implementation. While most implementation science literature uses the terms fidelity, integrity, and adherence synonymously, 39 the available alternate definitions of implementation integrity reflect the ability to adapt and modify aspects of an innovation to be compatible with local needs and circumstances, while remaining true to the underlying philosophy or core components of the change. 41,42 Indeed, significant factors fostering the successful implementation of an innovation include the adaptability and compatibility of the innovation in context. 36 

언뜻 보면, 혁신요소의 모든 가능한 조합과 결합을 생각하는 것은 위협적이거나 관리하기 어려워 보일 수 있다. 그러나 구현 단계 중 및 이후에 [6가지 중요한 평가 질문]을 반복적으로 하면, 혁신이 어떻게 그리고 왜 최종 형태를 취하는지, 그리고 그 최종 형태가 처음에 구상한 대로 변화의 가치와 목표를 계속 지원하는 정도에 대한 이해를 통해 증거를 발전시킬 수 있다. 그렇게 함으로써, [프로그램 평가]는 [혁신의 실천에 대한 충실도 또는 고수adherence의 스냅숏]에서 [적응, 수정, 열망적 목표의 수명을 포함한) 기술혁신의 적절성을 비판적이고 주기적으로 검토하는 성찰적 프로세스]로 진화할 것이다.

At first glance, thinking of the possible permutations and combinations of innovation components may seem threatening or unmanageable. However, asking the 6 critical evaluation questions iteratively, during and after the implementation phases, can advance an evidence informed understanding of how and why innovations take their final form as well as the extent to which that final form continues to support the values and goals of change as initially envisioned. As such, program evaluation will evolve from snapshots of fidelity or adherence to the practices of an innovation to a reflective process that critically and cyclically examines the appropriateness of the innovation, including adaptations and modifications, and the longevity of the aspirational goals.

[혁신]은 [번영적prosperous 성과]를 이끌어내기 위해 제안된 [전략적 의도]를 가지고 설계되는 반면, 이러한 전략이 [[광범위한 열망적 목적과 반대되는antithetical 방식]으로 [시스템의 가치 및 관행] 및 [현장의 사람들]과 상호작용할 것]이라는 것을 제안하는 증거를 인식하기 위해서는, [비판적 검토, 반성 및 합리적인 조치]가 필요하다. "블랙박스 평가"에서 [구현의 내부 작동에 대한 이해]로 나아가는 것은 [혁신의 성공에 대한 공동체의 이해]에 있어 중요한 진전이다. 

While innovations are designed with strategic intentions that are proposed to lead to prosperous outcomes, critical examination, reflection, and rational action are necessary to recognize evidence to suggest that these strategies will interact with values and practices of the system and those on the ground in ways that are antithetical to the broader aspirational goals. Progressing from “black box evaluations” to understanding the inner workings of implementation is a significant advancement in the community’s understanding of innovation success.

[구현 충실도] 및 [구현 무결성]에 대한 이러한 이해를 바탕으로, [에코 정규화 모델]은 프로그램 평가자들이 [적응 및 수정을 포함하여, 구현 중인 혁신에 대한 철저한 검토를 통해, 혁신의 수명을 더 잘 탐색할 수 있는 잠재력]을 가지고 있다.

  • 이 모델은 [혁신]을 [정적 관행의 집합]이 아니라 [역동적인 것으로 프레이밍]하며,
  • [시스템]과 [현장의 노동자]들을 [그들 자신의 목표와 의제를 가진 에이전트 파트너]로 다루며,
  • 이 모든 요소사이의 상호작용을 ['생태계'가 변화의 동요에 따라 "뉴 노멀"을 추구하는 것]으로 인정한다.

실제로, [환경 정규화]는 [변화의 생태계]를 신중하게 검토한다. 

  • 변화에 대한 거창한 대 지역의 열망, 
  • 혁신, 
  • 전략적 의도, 
  • 구현 작업을 수행하는 사람들, 그리고 
  • 시스템의 역할. 

Building on this understanding of implementation fidelity and implementation integrity, the Eco-Normalization model has the potential to enable program evaluators to better explore the longevity of innovations through fulsome examination of what is being implemented, including adaptations and modifications.

  • It frames the innovation as a dynamic rather than static set of practices,
  • it treats the system and the workers on the ground as agentive partners with their own goals and agendas, and
  • it acknowledges the interactions between all these factors as the ecosystem seeks its “new normal” following the perturbation of change.

Indeed, Eco-Normalization judiciously examines the ecosystem of change:

  • the grand versus local aspirations for change,
  • the innovation,
  • strategic intentions,
  • the people doing the work of implementation, and
  • the role of the system.

새로운 여정을 시작하며, [에코 정규화]는 혁신 경험을 비판적이고 주기적으로 평가하여 향후 경로가 원하는 목적지 방향으로 계속 이어질 수 있도록 보장합니다. 아직 개발 초기이긴 하지만, 우리는 혁신자들과 평가자들이 이 프레임워크를 통해 [구현과 변화의 생태계에 대한 또 다른 두루뭉술함]을 벗어나, 맥락적 혁신의 수명에 기여(또는 방해)하는 특징에 대한 이해를 심화시킬 수 있기를 바란다.

When embarking on a new journey, Eco-Normalization critically and cyclically appraises innovation experiences to ensure the upcoming path continues to lead in the direction of the desired destination. Although still early in its development, we hope that, through this framework, innovators and evaluators will be able to shed another layer of elusiveness about implementation and the ecosystem of change to deepen understanding of the features that contribute to (or hinder) the longevity of innovations in context.

 


Acad Med. 2021 Nov 1;96(11S):S48-S53. doi: 10.1097/ACM.0000000000004318.

Eco-Normalization: Evaluating the Longevity of an Innovation in Context

Affiliations collapse

Affiliations

1D.M. Hamza is an implementation scientist and the research and evaluation lead for postgraduate medical education, University of Alberta, Edmonton, Canada; ORCID: https://orcid.org/0000-0001-8943-2165.

2G. Regehr is professor, Department of Surgery, and scientist, Centre for Health Education Scholarship, Faculty of Medicine, University of British Columbia, Vancouver, British Columbia, Canada; ORCID: https://orcid.org/0000-0002-3144-331X.

PMID: 34348375

DOI: 10.1097/ACM.0000000000004318

Abstract

Purpose: When initiating an educational innovation, successful implementation and meaningful, lasting change can be elusive. This elusiveness stems from the difficulty of introducing changes into complex ecosystems. Program evaluation models that focus on implementation fidelity examine the inner workings of an innovation in the real-world context. However, the methods by which fidelity is typically examined may inadvertently limit thinking about the trajectory of an innovation over time. Thus, a new approach is needed, one that focuses on whether the conditions observed during the implementation phase of an educational innovation represent a foundation for meaningful, long-lasting change.

Method: Through a critical review, authors examined relevant models from implementation science and developed a comprehensive framework that shifts the focus of program evaluation from exploring snapshots in time to assessing the trajectory of an innovation beyond the implementation phase.

Results: Durable and meaningful "normalization" of an innovation is rooted in how the local aspirations and practices of the institutional system and the people doing the work interact with the grand aspirations and features of the innovation. Borrowing from Normalization Process Theory, the Consolidated Framework for Implementation Research, and Reflexive Monitoring in Action, the authors developed a framework, called Eco-Normalization, that highlights 6 critical questions to be considered when evaluating the potential longevity of an innovation.

Conclusions: When evaluating an educational innovation, the Eco-Normalization model focuses our attention on the ecosystem of change and the features of the ecosystem that may contribute to (or hinder) the longevity of innovations in context.

숫자는 요약하고, 글자는 설명한다: 위임 평정에서 코멘트를 평가와 피드백 목적으로 활용하기(Acad Med, 2021)
Numbers Encapsulate, Words Elaborate: Toward the Best Use of Comments for Assessment and Feedback on Entrustment Ratings 
Shiphra Ginsburg, MD, PhD, Christopher J. Watling, MD, PhD, Daniel J. Schumacher, MD, PhD, MEd, Andrea Gingerich, PhD, and Rose Hatala, MD, MSc 

 

 

단순성은 엄청나게 복잡하다. "사랑해"라는 문장을 생각해 보세요. —리처드 O. 무어, 침묵의 글쓰기, 2010

Simplicities are enormously complex. Consider the sentence “I love you.” —Richard O. Moore, Writing the Silences, 2010


위임 등급에 대한 아이디어는 기회와 경제성을 결합하기 때문에 유혹적이다. 감독관들은 매일 훈련생들에게 특정한 환자 치료 업무를 수행하도록 위탁하는 판단을 하며, 감독량은 다양하다. 이러한 자연발생적인 판단을 활용하여 의미 있는 전공의 평가를 진행하는 것은 어떨까요? 아이디어는 거부할 수 없는 단순성을 가지고 있습니다. 즉, 상사가 "직장의 교육생과 함께 일하고 결정을 내리는 방법"의 구성을 전공의 평가에 맞추는 것입니다. 그럼에도 불구하고, 겉보기에는 간단해 보이는 개념을 조작화하는 것은 매우 어려웠다.
The idea of entrustment ratings is seductive because it combines opportunity and economy. On a daily basis, supervisors make judgments to entrust trainees to carry out specific patient care tasks, with varying amounts of supervision. Why not harness these naturally occurring judgments to drive meaningful resident assessment? The idea has an irresistible simplicity: to align the construct of how supervisors “work with and make decisions about trainees in the workplace” with resident assessment. 1 And yet, it has been exceedingly difficult to operationalize such a seemingly straightforward concept.

일반적인 위임 등급 양식은 숫자 척도와 작성된 주석을 결합한다. 숫자 척도를 포함하는 것은 단순성, 캡슐화 능력 및 익숙함으로 인해 숫자에 끌리기 때문에 직관적으로 보인다. 숫자는 우리의 생물의학 세계의 많은 측면과 일치하는 객관성의 겉모양을 가지고 있다. 그러나 우리는 또한 숫자만을 사용하는데 있어서 한계를 알고 있는데, 이는 건조하고, 무균하며, 맥락상 세부사항이 결여되어 보일 수 있다. 숫자를 정당화하고, 풍부하게 하거나, 대체할 수 있는 가능성이 있는 단어를 추가한다. 단어는 숫자가 할 수 없는 새로운 정보를 제공한다. 그러나 누가 그 말씀을 읽고, 어떻게 해석하며, 그것으로 무엇을 할 것인가 ?
A typical entrustment rating form combines a numeric scale with written comments. Including a numeric scale seems intuitive, as we are drawn to numbers for their simplicity, their ability to encapsulate, and their familiarity. Numbers have a veneer of objectivity that aligns with many aspects of our biomedical world. But we also recognize the limitations in using numbers alone, which can seem dry, sterile, and lacking in contextual details. Enter words, which hold the potential to justify, enrich, or supplant the numbers. 2–4 Words provide novel information that numbers cannot. But who will read the words, how will they be interpreted, and what will be done with them?

단어 사용에 대한 간략한 설명입니다. "내러티브"라는 단어는 서면 평가 코멘트에 초점을 맞춘 많은 연구에서 사용되어 왔지만, 여기서는 특별히 그 사용을 피하기로 한다. [내러티브]는 [스토리를 내포]하고 있으며, 이는 [여러 주에 걸친 로테이션에서 관찰을 통합, 합성 및 문서화하는 것]이 목적인 [교육 내 평가 보고서(ITER)]에 초점을 맞춘 연구에 잘 들어맞는다. 그러나 대부분의 위임 등급에 포함된 코멘트는 단일 관찰된 만남과 관련이 있으며 설계상 훨씬 짧다. — 따라서 [이야기]라기보다는 [문자 메시지]에 가깝습니다. 예를 들어, 정신의학에서 완성된 신뢰할 수 있는 전문 활동(EPA) 양식 중 98%는 단 하나의 의견만 포함하고 있었다. 따라서 본 기사에서는 "주석" 또는 "단어words"를 사용함으로써, 위임 등급 양식의 단어가 "내러티브"라는 달성 불가능한 기준에 도달하지 않도록 할 것입니다.

A brief aside on the use of the term “words.” The word “narrative” has been used in many studies focused on written assessment comments, 2,5 but we will specifically avoid its use here. Narrative implies a story, and this fits well in research focused on in-training evaluation reports (ITERs), whose purpose is to integrate, synthesize, and document observations from a multiweek rotation. 4 The comments included with most entrustment ratings, however, are related to a single observed encounter and are by design much shorter—more like a text message than a story. For example, in psychiatry, 98% of completed entrustable professional activity (EPA) forms contained only a single comment. 6,7 Thus, throughout this article, we will refer to “comments” or “words” to avoid holding the words on entrustment rating forms to an unattainable standard of “narrative.”

위임 등급 양식을 구현함에 따라 다양한 문제가 발생했는데, 그 중 중요한 것은 학습자마다 숫자와 단어 모두 데이터의 바다에 빠져 있다는 것이다. 실제로 위임 등급은 교육생의 진도에 대한 종합 결정을 내리는 역량 위원회에 의해 여러 "낮은 이해" 평가를 함께 고려하는 프로그램 평가 시스템 내에서 사용되어야 한다. [프로그램적 평가]는 [다다익선]이는 암묵적인 가정과 함께 대량의 데이터 수집을 장려한다. 숫자와 단어의 강점과 한계를 풀면 이러한 데이터를 관리하고 이해하는 데 도움이 될 수 있습니다. 우리는 숫자와 단어가 서로 다른 어포던스를 가지고 있다는 것을 고려할 필요가 있다. 예를 들어, 숫자는 캡슐화하며, 단어는 정교화한다. 숫자와 단어는 학습자와 감독자에서 프로그램과 사회에 이르는 다양한 청중에게 말한다. 숫자와 단어는 [근본적으로 서로 다른 철학적 입장]을 반영하며, [숫자는 실증주의 또는 후기 실증주의 세계관]을 반영하고, [단어는 구성주의]에 더 부합한다. 8 숫자와 단어의 이중성을 더 복잡하게 만드는 것은 [위임 등급양식]에서 제공하고자 하는 - 때로는 상충하는 - [목적의 이중성(총괄적 평가와 발전적 피드백)]이다.
A variety of issues have arisen as we have implemented entrustment rating forms, not least of which is that we are drowning in a sea of data, both numbers and words, for each learner. Indeed, entrustment ratings are meant to be used within a system of programmatic assessment in which multiple “low-stakes” assessments are considered together by a competency committee, which makes summative decisions about trainees’ progress. Programmatic assessment encourages the collection of a large quantity of data, with an implicit assumption that more is better. It may help us to manage and understand these data if we unpack the strengths and limitations of the numbers and the words. We need to consider that numbers and words have different affordances; for example, numbers encapsulate and words elaborate. Numbers and words speak to different audiences ranging from learners and supervisors to programs and society. Numbers and words reflect fundamentally different philosophical positions, with numbers reflecting a positivist or postpositivist view of the world and words more aligned with constructivism. 8 Confounding the duality of numbers versus words is a duality of purposes that the entrustment rating forms are meant to serve—summative assessment and developmental feedback—which are sometimes at odds.

본 기사에서는 단어에 중점을 두고, 단어와 숫자의 목적, 장점, 한계를 검토하면서, 코멘트 형태의 위탁 등급에 초점을 맞출 것이다. 이러한 등급의 주요 과제를 강조하고 데이터의 바다에서 우리를 구해내고 해안으로 인도할 수 있는 몇 가지 향후 방향을 제안할 것입니다.
In this article, we will focus on entrustment rating form comments, examining the purposes, strengths, and limitations of numbers and words, with an emphasis on the words. We will highlight key challenges in these ratings and suggest some forward directions that may rescue us from the sea of data and bring us to shore.

누가 어떤 목적으로 숫자가 필요한가?
Who Needs Numbers and for What Purpose?


우리는 우선 [위임-관리 척도]의 숫자에 관심을 돌린다. 위임 등급 양식은 일반적으로 각 오름차순 번호를 앵커에 묶은 4점 또는 5점 척도를 사용하며, 이는 제공된 대부분의 감독량에서 최소의 감독량까지 개별적인 감독 판단 또는 결정을 나타낸다. 숫자는 실제로 위임 스케일에 필요한 것은 아니며, 숫자를 사용할 때, [내려진 특정 감독 결정에 대한 간략한 코드]를 나타내는 것으로 생각되어야 한다. 즉, 숫자는 [레이블] 역할을 하지만 카운트나 척도는 아닙니다. 14

We first turn our attention to the numbers on entrustment-supervision scales. Entrustment rating forms commonly use a 4- or 5-point scale with each ascending number tied to an anchor that represents a discrete supervisory judgment or decision ordered from most to least amount of supervision provided. 1,9–13 Numbers are not actually required for entrustment scales, but when they are used, they should be thought of as succinctly representing a shorthand code for a particular supervisory decision that was made; that is, the numbers serve as a label but not as a count or measure. 14

[위임 척도의 숫자]는 현재 내린 감독결정을 [효율적으로 문서화]하거나, 향후 어느 수준의 감독을 사용해야 할지에 대한 [선언을 기록]하는 데 사용될 수 있다. 번호는 프로그램, 관리 및 역량 위원회의 데이터 포인트로 사용할 수 있으며, 교육생에게는 "비망록aide memoire"으 사용할 수 있습니다. [총괄적 목적]으로 사용될 경우, 이 숫자는 [능력 증명]을 간결하게 문서화합니다. 숫자는 또한 대규모 데이터 세트의 정확한 수치 표현을 제공하기 위해 데이터 포인트를 안정적으로 결합, 필터링 및 요약할 수 있는 수학에 도움이 되지만, 이러한 방식으로 [위임-감독 숫자]를 처리하는 것은 논란이 있다. 1
The numbers on entrustment scales can be used to efficiently document a supervisory decision that was made in the moment or record a proclamation of which level of supervision should be used in the future. 1,15 A number can serve as a data point for the program, administration, and competency committees, and as an “aide memoire” for the trainee. When used for summative purposes, the number concisely documents proof of merit. 16 Numbers also lend themselves to mathematics that can reliably combine, filter, and summarize the data points to provide precise numerical representation of a large dataset, although treating entrustment-supervision numbers in this way is controversial. 1

불행히도, 수치 표현을 다시 고부담 감독, 진급, 역량 결정으로 변환하는 과정은 덜 명확하다. 이러한 계산은 [실습생의 활동, 환자, 감독자, 이들의 상호작용과의 engagement]와 [피드백], [결과] 등과 같은 [상황별 세부 정보를 제거한 숫자]를 사용한다. 바로 이 공허함barrenness이 우리로 하여금 단어 없이 숫자에 의존하는 것을 경계하게 만들고 피드백을 오로지 등급으로만 한정하지 않도록 주의하게 만든다. 다음 절에서 논의한 바와 같이, 서면 코멘트는 척도 상의 숫자(및 그 앵커)가 할 수 없는 정보를 제공한다.
Unfortunately, the process to translate a numerical representation back into high-stakes supervisory, progression, and/or competence decisions is less obvious. These computations use numbers stripped bare of the contextual details of the trainee’s engagement with the activities, patients, and supervisors, and their perceived responses to those interactions, feedback, and outcomes. It may be this barrenness that makes us wary of relying on numbers without words and cautions us against limiting feedback solely to ratings. 17 As is discussed in the following section, written comments offer information that numbers (and their anchors) on scales cannot.

의견이 필요한 사용자 및 목적은 무엇입니까?
Who Needs Comments and for What Purpose?

위임 등급 양식에 대한 코멘트는 다양한 기능을 제공할 수 있습니다.

  • 학습자의 관점에서, 코멘트는 [발달적 피드백]을 제공할 수 있습니다. 학습자는 구체적이고 실행 가능한 코멘트를 사용하여 학습 목표를 작성하고 교육이 진행됨에 따라 이러한 목표를 달성하는 과정에서 자신의 진행 상황을 반영할 수 있습니다. 18
  • 감독자의 관점에서, 외부검토의견은 [평가나 결정을 뒷받침할 수 있는 근거]를 제공하고 정당화할 수 있다. 코멘트는 또한 전문적인 행동의 특정 측면과 같이 숫자 척도로 표현되지 않을 수 있는 것을 포착하는 데 사용될 수 있다.
  • 평가 양식의 주석 상자는 프로그램에 메시지를 보내는 데 사용될 수 있으며, 때로는 교육생들이 체면을 차릴 수 있도록 하는 "코딩된" 언어를 사용한다. 프로그램의 관점에서, 코멘트는 점수보다 더 일찍 어려운 학습자를 식별하는 데 도움이 될 수 있으며, 점수와 함께 사용될 때 총결정을 변경할 수 있다.

종합하면, 코멘트는 [고부담 의사 결정]에 사용될 수 있는 [포트폴리오 또는 공식 기록의 일부]가 된다. 24 분명히, 이러한 목적 중 일부는 모순된다. 감독자가 의사 결정에 있어서 [그들의 말이 가질 수 있는 잠재적인 다운스트림 효과]를 고려하지 않고, 서면으로 건설적인 피드백을 제공하는 것은 어렵기 때문이다. 

The comments on entrustment rating forms can serve a variety of functions.

  • If we start from the learner’s perspective, comments can provide developmental feedback. Learners can use specific, actionable comments to create learning goals and reflect on their progress in meeting these goals as training progresses. 18 
  • From a supervisor’s perspective, comments can justify and provide context to support a rating or decision. Comments can also be used to capture what may not be represented in the numeric scales, such as certain aspects of professional behavior. 3,5 
  • Comment boxes on rating forms can be used to send messages to programs, sometimes by using “coded” language meant to allow trainees to save face. 19,20 From a program perspective, comments can help identify learners in difficulty earlier than the scores alone and can change summative decisions when used in combination with scores. 21–23 

In aggregate, comments become part of a portfolio or formal record that can be used for high-stakes decision making. 24 Clearly, some of these purposes are in conflict, as it is difficult for supervisors to provide constructive feedback in writing without considering the potential downstream effect their words might have when it comes to decision making. 20,25–27

서면 코멘트는 ITER와 OSCE 설정 모두에서 의사 결정과 관련하여 신뢰할 수 있고 타당한 것으로 나타났다. ITER 코멘트에 대한 한 연구는 코멘트가 숫자 점수보다 신뢰성이 높은 반면, 데이터가 덜 필요하다는 것을 발견했다. 2 서면 코멘트는 특정 등급과 관련된 맥락적 세부 정보를 제공하는 데 능숙하며, 더 긴 코멘트는 더 많은 특정 코멘트를 전공의로 하여금 더 가치 있다고 느끼게 할 수 있다. EPA 논평에 대한 데이터는 특별히 적지만, 일부 보고서는 이러한 논평이 ITER에서 일반적으로 보고되는 것보다 더 구체적이고 행동적이며, 그렇지 않으면 척도에 포함되지 않는 정보를 포착할 수 있다고 제안한다. 30 따라서 우리는 ITER "내러티브" 데이터를 위탁 등급 코멘트로 추정하는 데 주의를 촉구하지만, 초기 결과는 그것들이 유사하게 유용할 수 있음을 시사한다.
Written comments have been shown to be reliable and valid when it comes to decision making in both ITER and OSCE settings. 2,28,29 One study of ITER comments found that the comments have higher reliability than numeric scores, while requiring less data. 2 Written comments are good at providing contextual detail related to a particular rating, and longer, more specific comments can make residents feel more valued. 26,27 We have less data specifically on EPA comments, but some reports suggest that these comments are more specific and behavioral than what is usually reported on ITERs, 18 and they may capture information that is not otherwise included in the scales. 30 So while we urge caution in extrapolating from ITER “narrative” data to entrustment rating comments, early results suggest they may be similarly useful.

물론 서면 코멘트에 대한 수많은 비판도 있는데, 여기에는

  • 코멘트가 너무 모호하고 구체적이지 않아 유용하지 않으며 학습 향상으로 이어지지 않는 것으로 나타났다.
  • 관찰된 성과에 숫자 점수를 할당하는 것도 주관적인 행동이지만, 숫자에 비해 "너무 주관적인" 것으로 종종 조롱당한다. 33
  • "심리측정학"을 넘어서는 과정에서, 진자를 잘못된 방향으로 너무 많이 휘둘러 [숫자 점수의 적절한 사용을 과소평가하기 시작했다는 우려]가 표현되었다. 34
  • 마지막으로, 서면 평가 의견은 여성이나 과소대표된 소수민족과 같은 특정 집단에 해로울 수 있는 암묵적 편견을 재현하거나 촉진할 수 있다.

Of course there are numerous critiques of written comments as well, including that

  • comments are too vague and nonspecific to be useful and that they have not been shown to lead to learning improvement. 31,32 
  • In comparison to numbers, comments are often derided as being “too subjective,” even though assigning a numeric score to an observed performance is also a subjective act. 33 
  • Concerns have been expressed that in moving “beyond psychometrics,” we may have swung the pendulum too far in the wrong direction and have begun to undervalue appropriate use of numeric scores. 34 
  • Finally, written assessment comments can reproduce or promote implicit bias that can be harmful to certain groups, such as women or under-represented minorities. 35,36

댓글과 점수가 다른 것이 문제인가?
Is It a Problem That the Comments and the Scores Are Doing Something Different?


숫자는 학습자의 성과를 나타내는 [매력적인 줄임말]을 제공하지만, 코멘트는 [더 정교한 그림]을 약속한다. Holmboe 등은 숫자란 단지 코드일 뿐, 단어만이 제공할 수 있는 의미와 뉘앙스에 대한 애착이 없는 불완전한 것이라고 언급하면서, 평가 정보의 양적 요소와 질적 요소 사이의 더 나은 균형을 요구했다. 10 Cate와 Regehr가 지적한 바와 같이, 임상 학습 환경의 최전선에서 이루어지는 위임 결정은 본질적으로 [감독자에 의해 인식된 위험에 대한 판단]이 필요하다. 33 그들은 다음과 같이 지적하며, 이에 대해 유리한 의견을 제시한다. "프리셉터의 주관적 경험에 대한 설명만이 진정으로 방어할 수 있는 유일한 명제이다." 코멘트는 평가 등급에 대한 근거를 제공하고, 관찰된 특정 성과와 관련된 상황별 경고를 강조하며, 그 성과를 감독하는 경험을 명확히 함으로써, [숫자의 무뚝뚝함에 미묘함과 실질성을 더한다]. 사용 가능한 평가 데이터를 풍부하게 함으로써, 단어는 [공정성에 대한 인식을 개선]하고, [방어성을 강화]하며, 역량 위원회 설정에서 [그룹 의사 결정을 용이]하게 한다. 그러나 이 잠재력은 숫자와 단어가 [철학적으로, 그리고 목적을 중심]으로 정렬될 때 가장 쉽게 실현된다. 케인의 타당성 프레임워크를 사용하여, 이 경우 위탁 등급 양식(숫자와 단어 모두)을 사용하는 것은 향후 전공의에게 해당 작업을 맡길 수 있는지에 대한 판단을 제공하는 것이다. 숫자는 [관찰된 수행능력을 분류]하기 위해 쉽게 인식되고 쉽게 처리되는 [레이블]을 제공하며, 단어는 [해당 레이블의 선택을 설명하고 정당화]한다. 간단하죠.

While numbers offer an appealing shorthand for representing learner performance, comments promise a more elaborate picture. Holmboe et al called for a better balance between the quantitative and the qualitative elements of assessment information, noting that numbers are but a code, incomplete without attachment to the meaning and nuance that only words can offer. 14 As ten Cate and Regehr note, entrustment decisions made on the frontlines of the clinical learning environment inherently necessitate a judgment of perceived risk by the supervisor. 33 This, they argue, advantages comments, noting: “documentation of the preceptor’s subjective experience is the only truly defensible proposition.” 33 Comments add subtlety and substance to the bluntness of numbers by providing the rationale for an assessment rating, highlighting the contextual caveats related to a particular observed performance, and articulating the experience of supervising that performance. By enriching the assessment data available, words improve perceptions of fairness, bolster defensibility, and facilitate group decision making in competence committee settings. 37 This potential is most readily realized, however, when numbers and words are aligned both philosophically and around purpose. 8 Using Kane’s validity framework, 38 in this instance, the intended use of the entrustment rating form (both numbers and words) is to provide a judgment regarding whether the resident can be entrusted with that task in the future. The number provides a readily recognized and easily processed label to classify the observed performance, and the words explain and justify the choice of that label. Simple.

그러나 위임 등급 양식은 프로그램 평가에 깊이 포함되어 있으며, 프로그램 평가는 단어로부터 더 많은 것을 기대합니다. 프로그램적 방식의 평가는 [학습자의 성과를 평가하는 것]뿐만 아니라, [학습자의 발전을 촉진하는 것]을 목표로 한다. 위임 평정 양식의 문구는 [두 가지 목적]을 모두 충족시켜야 한다. 그 Words는 한편으로는 [판단이나 결정을 설명하고 합리화]해야 하며, 다른 한편으로는 [개선의 동기를 부여하기 위한 피드백과 코칭도 제공]해야 합니다. 케인의 타당성 프레임워크를 이 문제를 개념화하는 또 다른 방법으로 생각한다면, 단어에 의도된 용도는 유일하지 않다. 프로그래밍 방식의 평가에서 현재 운용되고 있는 이 단어는 [두 가지 목적]을 가지고 있다.

  • a) 학습자의 승진 결정에 기여하기 위해 총괄적으로 사용된다(숫자에 대한 의도된 용도와 일치한다). 
  • b) 학습자에게 개발 피드백을 제공한다.

But entrustment rating forms are deeply embedded in programmatic assessment, and programmatic assessment expects more from words. Programmatic assessment aims not only to assess learner performance but also to stimulate learner development. The words on entrustment rating forms must somehow serve both aims. They must explain and rationalize a judgment or decision on the one hand, while offering feedback and coaching to motivate improvement on the other. If we consider Kane’s validity framework as another way of conceptualizing this problem, there is not a single intended use for the words. 38 As currently operationalized within programmatic assessment, the words serve a dual purpose:

  • a) to be used summatively to contribute toward promotion decisions for learners (which aligns with the intended use for the numbers) and
  • b) to provide developmental feedback to learners.

이 [이중적인 기대]는 일을 엄청나게 복잡하게 만든다. Schut 등은 풍부한 서술적 피드백이 프로그래밍 평가의 개발 목표를 활용하는 데 중요하다고 지적한다. 그러나 [등급을 정당화하는 단어]가 동일하게 ["풍부한 서술적 피드백"]을 구성할 수 있을까? 아마 아닐 것입니다. 비디오화된 OSCE 성과에 대한 통제된 연구에서 Tavares와 동료들은 평가자들이 주로 모든 평가 과제를 총괄적인 것으로 간주하기 때문에, 총괄적이든 형성적이든 비슷하게 평가 과제를 수행한다고 보고했다. 따라서 평가자가 [코멘트의 의도된 목적과 관계없이 유사한 단어를 작성]하더라도, 이것이 평가에도, 피드백에도 [동일하게 효과적]일 수 있거나, [동일한 방식으로 해석될 수 있다]고 가정하는 것은 비약이 될 수 있다.

This double-barreled expectation complicates things immensely. Schut et al point out that rich, narrative feedback is critical to harnessing the developmental aims of programmatic assessment. 39 But can the same words that justify a rating also constitute “rich narrative feedback”? Probably not. Tavares and colleagues, in a controlled study of videotaped OSCE performances, reported that raters engage with assessment tasks similarly, whether they are intended as summative or formative, mainly because they consider all assessment tasks as summative. 40 Thus, it may be a leap to assume that even if assessors do write similar words regardless of the intended purpose of their comments, that their words can be equally effective as both assessment and feedback, or that they will be interpreted the same way.

최근의 한 연구는, 예를 들어, 평가 양식과 참조 서신에 나타날 때, 다른 목적으로 고려될 때, 같은 단어들이 다른 의미를 가질 수 있다는 것을 발견했다. 사실, Schut과 동료들은 이러한 긴장감을 문제 삼았고, 평가 과제의 발달적 목적에 세심한 주의를 기울이지 않는다면 학습이 방해될 수 있다고 제안했다. 41 그러한 세심한 주의를 기울이지 않으면, 학습자들은 [모든 관찰을 판단으로 인식하는 경향]이 있다. 학습자는 자신의 목적이 판단을 통과하기 위한 것인지 아니면 개발을 돕기 위한 것인지 여부에 따라 코멘트와 다르게 상호작용할 수 있습니다.

One recent study found that the same words may take on different meanings when considered for different purposes, for example, when appearing on an assessment form versus a reference letter. 20 Schut and colleagues, in fact, have problematized this tension, suggesting that learning may be stymied unless the developmental purpose of assessment tasks receives careful attention. 41 In the absence of such careful attention, learners tend to perceive all observations as judgment. Learners may interact with comments differently depending on whether they believe their purpose is to pass judgment or to aid development.

긴장 완화: 단어와 목적의 일치
Reconciling Tensions: Aligning Words With Purpose

어떻게 하면 발달적 마음가짐을 장려하면서, 위임 기반 평가 순간에 감독 결정을 포착하는 단순성에 충실할 수 있을까요? 캐나다 맥락에서 위임 기반 평가에 대한 2개의 연구에서, 전공의들은 EPA 평가의 필요한 양과 총괄적 의도가 전공의와 교수진 모두에게 "체크박스" 행위로 이어졌고, 피드백 대화의 품질을 희생시키면서 피드백 양을 증가시켰으며, 전공의와 감독자 관계를 긴장시켰다는 것을 인지했다. 전공의들은 또한 구두 피드백이 숫자와 서면 의견보다 더 큰 가치와 효용성을 가지고 있다는 것을 인식하여 때때로 학습 대화에 참여하기 위해 양식 작성 연습을 피했다. 이는 [평가 활동을 개발 활동과 분리]하고, [구어와 문어의 서로 다른 역할을 고려]하는 등, 아래에서 살펴볼 수 있는 몇 가지 흥미로운 잠재적 방향으로 이어진다.

How can we remain true to the simplicity of capturing supervisory decisions in entrustment-based assessment moments, while encouraging a developmental mindset? In 2 studies of entrustment-based assessments in the Canadian context, residents perceived that the required volume and summative intent of EPA assessments led to a “tick-box” exercise by both residents and faculty, increased the volume of feedback at the expense of lower-quality feedback conversations, and strained the resident–supervisor relationship. 42,43 Residents also perceived that verbal feedback had greater value and utility than numbers and written comments, so much so that they sometimes circumvented the form-filling exercise to engage in learning conversations. 42 This leads to some interesting potential directions forward which we explore below, including separating assessment activities from developmental ones and considering different roles for spoken versus written words.

위임 기반 평가에서 단어의 [발전적 가능성]을 활용하려면, 평가와 피드백을 위한 [이중 목적]이 최선의 방향인지 신중하게 고려해야 한다. 25 두 가지 목적을 가지는 경우, 결국 둘 중 하나도 충족하지 못할 수 있다. 개념적 수준에서, 타당성 주장의 다른 추론이 서로 다른 의도된 사용을 지원하기 위해 작용하기 때문에 이중 목적은 불가능해 보인다. 38 그러나, 우리 분야의 일부 사고 리더들은 이중 목적을 가능하다고 본다. 평가가 "둘 중 하나"가 아니라 "둘 다"가 될 수 있다는 것이다. 이 난제를 해결하는 것은 매우 중요하다.
If we wish to harness the developmental potential of words in our entrustment-based assessments, we must carefully consider whether dual purposing for both assessment and feedback is the best direction forward. 25 Dual purposing may end up not serving either intended use well. 25,44,45 At a conceptual level, dual purposes seem an impossibility as different inferences in the validity argument come into play to support different intended uses. 38 However, some thought leaders in our field see dual purposing as a possibility—that an assessment does not have to be “either-or” but rather can be “both-and.” 46 Sorting out this conundrum is crucial.

[1] 우리는 우리의 양식을 이중 목적화하는 것을 멈추고, 대신 숫자와 단어들을 평가의 명확한 목적에 맞추면 된다. 그런 다음 [쓰여진 단어]는 수치 등급에 대한 [맥락을 제공하고 정당화하는 데 사용]될 것이다. 대상 청중은 프로그램이며, 위임 등급 양식은 오로지 평가를 위한 것이 된다. 이 접근 방식에서, 우리는 그 만남을 form이 아닌 발전적 기회로 활용할 것이다. 다시 말해, 만남의 모든 측면이 평가의 초점을 제공할 필요는 없으며, 전공의와 관리자가 풍부하고 기록되지 않은 학습 대화를 할 경우 [구어]를 발전적으로 사용할 수 있다. 전공의가 원한다면, 그들은 [자신을 위한 메모]를 쓸 수 있는데, 그것은 그들이 개인적으로 간직할 수 있는 [대화의 기념품]이고, 나중에 자기 성찰과 발전을 자극하기 위해 끌어다 쓸 수 있다. 이 접근법은 학습자가 평가 맥락에서 '무대적 연기staged performances'에 참여하는 문제를 회피할 수 없으며, [직접 말로 논의된 내용]과 [양식에 글로 기록된 내용] 사이에 단절이 있을 경우 발생할 수 있는 잠재적 문제를 해결하지는 못하지만, [학습 대화]를 위한 공간을 열 수 있다. 49

We could stop dual purposing our forms and instead align the numbers and the words around the explicit purpose of assessment. Written words would then be used to justify and provide context for the numerical rating. The intended audience would be the program, and the entrustment rating forms would be solely for assessment. In this approach, we would harness the encounter as the developmental opportunity but not the form. In other words, not every aspect of the encounter would have to serve an assessment focus and, if the resident and supervisor engaged in a rich, unrecorded learning conversation, the spoken words could be used developmentally. If the resident wished, they could write notes for themselves—souvenirs of the conversation they could keep privately and draw on later to stimulate self-reflection and development. This approach would not get around the issue of learners engaging in staged performances during assessment contexts, 47,48 nor would it address the potential problems that might ensue if there is a disconnect between what is discussed in person and what is recorded on a form, but it would open a space for learning conversations. 49

[2] 이 [단일 목적 접근 방식] 내의 대안으로, 우리는 [위임 등급에 대해 별도의 평가자]를 채용하는 것을 고려할 수 있으며, 따라서 평가 조우(평가자가 수행)와 피드백 조우(감독자가 수행)를 명확히 구분할 수 있다. 이러한 분리를 통해 감독관들은 주민들의 진정한 코치가 될 수 있고, 전공의 개발을 촉진하기 위한 직접적인 관찰과 피드백 대화에 참여할 수 있다. 51 이 두 가지 접근 방식 모두 문화 변화의 필요성을 인식하고 있다. 의미 있는 학습 대화를 지원하려면 평가 및 피드백에서 [교사를 교육]하거나, [학습자가 성장 마인드를 채택하도록 장려하는 것] 이상이 필요합니다. 또한 효과적인 학습 대화가 이루어질 수 있는 장을 마련하는 [조직적 전략]을 의도적으로 채택할 것을 요구한다. 52
As an alternative within this single-purpose approach, we could consider employing separate assessors for the entrustment ratings, thus making a clear distinction between assessment encounters (conducted by assessors) and feedback encounters (conducted by supervisors). 16,50 This separation could free up supervisors to truly be coaches to the residents, engaged in direct observation and feedback conversations to foster resident development. 51 Both of these approaches recognize the need for culture change. Supporting meaningful learning conversations requires more than training teachers in assessment and feedback or encouraging learners to adopt a growth mindset. It also requires the deliberate adoption of organizational strategies that set the stage for effective learning conversations to occur. 52

[3] 이것은 우리가 숫자와 단어의 개별적인 강점을 이용하여, 명백하게 이중적인 목적을 달성하고 "both-and" 접근방식을 구현하는 세 번째 가능한 행동방침으로 우리를 이끈다. 숫자는 평가에 초점을 맞추지만, 단어는 평가와 피드백에 모두 사용되며, 프로그램은 단어의 목적과 의도된 사용을 명확하게 명시해야 한다. 논평이 제공할 수 있는 이중 목적을 최적화하기 위해서는 감독관이 작성하는 [일선 평가 양식에서 두 가지가 구별되어야] 한다. 도리와 동료들은 [코멘트 상자를 끝이 아니라 시작부에 두는 것]과 같은 평가 보고서에 대한 간단한 "넛지 개입"이 교사들이 제공하는 댓글의 세부 수준과 실행 가능성을 높일 수 있다는 것을 보여주었다. 이 작업을 바탕으로 목적과 의도된 청중을 다루는 위임 등급 양식에 대한 프롬프트를 포함할 수 있습니다. [평가 의견(관측을 설명하거나 등급을 정당화하기 위한 의견)] 또는 [피드백 의견(계속된 개발을 코칭하거나 구체화하기 위한 의견)]을 도출하기 위해 서로 별개의 프롬프트를 사용할 수 있다.

  • 전자에 대한 대상 청중은 역량 위원회이지만, 이러한 의견은 교육생에게 보일 것입니다.
  • 후자의 코멘트는 교육생을 위한 것이며, 우리는 이러한 코멘트가 역량 위원회에게는 숨겨져야 한다고 주장한다. 코칭은 학습자가 취약성에 대해 안전할 때 가장 잘 작동하며, 학습자에게 자신의 눈을 위한 데이터만 제공하면 그러한 안전감이 강화될 수 있습니다.

Which brings us to a third possible course of action, in which we leverage the separate strengths of numbers and words to explicitly dual purpose and embody a “both-and” approach. Numbers would remain focused on assessment, but words would be used both for assessment and for feedback, with programs having to clearly specify the purpose of the words and their intended use. To optimize the dual purposes that comments can serve, both would have to be distinct on the frontline assessment forms that supervisors complete. Dory and colleagues have shown that simple “nudge interventions” on assessment reports, such as putting the comment box first instead of last, can increase the level of detail and actionability of the comments that teachers provide. Building on that work, we could include prompts on entrustment rating forms that address purpose and intended audience. Different prompts could be used to elicit either assessment comments (those intended to explain observations or justify ratings) or feedback comments (those intended to coach or shape continued development).

  • The intended audience for the former is the competency committee, but these comments would be visible to the trainee.
  • The latter comments would be intended for the trainee, and we argue these could, and likely should, be hidden from the competency committee. Coaching works best when learners feel safe to be vulnerable, 53,54 and providing them with data for their eyes only may cement that sense of safety.

만약 감독관들이 [그들의 말이 오로지 학습자 개발을 지원하기 위한 것이라는 확신]을 가질 수 있다면, 그들은 덜 구속되고 따라서 더 정직하고 비판적인 의견을 쓸 수 있을 것이다. 그들의 코멘트는 학습자들이 성과에 대한 더 높은 관심을 갖는 결정을 내리는 데 사용될 것이라는 우려를 갖지 않고 개발의 다음 단계를 더 의미 있게 알려줄 수 있다. 이러한 명확한 목적을 달성하려면 시스템 변화가 필요합니다. 단순하게 교사나 학습자에게 특정 의견 집합을 평가로서 또는 피드백으로서 취급해야 한다고 말하는 것은 충분하지 않을 것이다. 증거에 따르면, 이런 것은 상호작용의 인식된 이해 관계나 생성된 평가 및 의견 모두에 큰 영향을 미치지 않을 것임을 시사하기 때문이다. 이러한 이중 목적을 달성한다는 것은 [두 가지 의견 세트가 서로 완벽하게 정렬되지 않을 수 있다는 것]을 의미한다. 하지만 (이 두 가지의) 정렬이 목표가 아닙니다.

  • [의사 결정자]는 신뢰할 수 있고 방어적인 결정을 내릴 수 있도록 학습자의 성과를 이해할 수 있는 단어가 필요합니다.
  • [학습자]는 자신의 발달 궤적에 맞게 조정되고 지속적인 개선을 지원하는 단어가 필요합니다.

각각에 대해 별도의 단어를 사용한다면, 두 가지 목적을 모두 잘 수행할 수 있습니다.
If supervisors can feel confident that their words are intended solely to support learner development, they might feel less constrained and therefore write more honest, critical comments. Their comments, in turn, might more meaningfully inform next steps in development, without learners harboring concerns that they will be used to render a higher-stakes decision about performance. Achieving this clarity of purpose would require system change. It would not be sufficient to simply tell teachers or learners that a particular set of comments should be treated as assessment or as feedback, as evidence suggests this would not have much effect on either the perceived stakes of the interaction or on the ratings and comments produced. 40,44 Achieving these dual purposes means that the 2 sets of comments may not be perfectly aligned with one another. But alignment isn’t the goal.

  • Decision makers need words that allow them to understand learner performance so they can make trustworthy and defensible decisions.
  • Learners need words that are tailored to their developmental trajectory and that support continued improvement.

Both purposes could be well served, with separate words for each.

프로그램적 평가와 문서화의 횡포
Programmatic Assessment and the Tyranny of Documentation

마지막으로 해결해야 할 문제는 각 학습자를 위해 생성되는 엄청난 양의 코멘트를 어떻게 해야 하는가이다. 프로그래밍 방식의 평가 프레임워크 내에서 시간이 지남에 따라 "대규모 정보"가 수집되며, 다양한 데이터 소스에서 의미를 만드는 시스템이 필요하다. 역량 위원회는 숫자 데이터만으로 결정을 내리기가 어려울 수 있지만 전공의 한 명당 수십 개 또는 수백 개의 의견을 읽고 해석하는 데 어려움을 겪을 수 있다. 이 문제에 대응하여, 일부 저자들은 자연어 처리와 같은 방법을 통해 단어를 숫자로 줄이는 방법을 탐구했다. 만약 우리가 프로그램에서 찾는 것이 [더 많은 주의를 필요로 하는 학습자들을 식별하는 "신호"나 "코드"]라면, 숫자가 효율적으로 요약될 수 있고 후속 검토에 집중할 수 있는 "1차 통과 필터" 역할을 할 수 있기 때문에, 이 목적에 대한 숫자 점수의 매력은 명백하다. 이 논리에 따라, 몇몇 연구자들은 [단어]에 대해서도, 컴퓨터 알고리즘을 사용하여 어려운 학습자들을 선별하거나 예측하면서 같은 일을 하려고 시도했다. 한 연구에서 키워드 알고리듬은 제안된 숫자 점수보다 어려움을 겪는 전공의를 더 많이 식별했지만, 이 접근법의 전반적인 실현 가능성과 유용성은 확립되지 않았다. 게다가 단어를 숫자로 줄이면 문맥과 설명 측면에서 단어가 제공할 수 있는 모든 잠재력을 잃게 된다. 우리는 단어를 있는 그대로 두고, 숫자를 사용하여 데이터에서 신호를 검색하고, 이러한 신호에 수반되는 단어를 읽어 그것들이 설명하는 평가 조우에 대한 컨텍스트를 제공하는 것을 강력히 지지한다.

A final problem to grapple with is what to do with the sheer volume of comments that are produced for each learner. Within a programmatic assessment framework, “massive information” is gathered over time 55 and necessitates a system to make meaning from a variety of data sources. Competency committees may find it difficult to make decisions based on numeric data alone, yet may struggle to read and interpret dozens or hundreds of comments per resident. In response to this problem, some authors have explored reducing words to numbers, through methods such as natural-language processing. If what one is looking for is a “signal” or “code” that identifies to the program those learners who need more attention, then the appeal of numeric scores for this purpose is obvious, as numbers can be summarized efficiently and can act as a “first-pass filter” that can help focus subsequent review. 34 Following this logic, several researchers have attempted to do the same with words, using computer algorithms to screen for or predict learners in difficulty. In one study, keyword algorithms identified more residents in difficulty than the numeric scores suggested, 56 but the overall feasibility and utility of this approach have not been established. Furthermore, reducing words to numbers loses all the potential of what the words might offer in terms of context and description. We strongly advocate to let words be as they are, to use the numbers to search for signals in the data, and to read the words that accompany those signals to provide context for the assessment encounters they describe.

역설적이게도, 프로그램 평가에서 해결하려고 했던 문제(충분한 평가 데이터가 아님)는 이제 새로운 문제를 만들어냈다: 
바로 [문서화의 횡포]이다. [피드백 순간]을 기록해야 하는 [평가 순간]으로 바꾸기 위해 학습자와의 모든 상호 작용을 요구한다면, 우리는 지도자와 전공의 사이의 발전적인 관계를 해친다. 평가 우위적인 컨텍스트는 학습을 위한 안전한 공간을 제거하고 평가 목적을 위해 전공의를 실제적이지 않은 공연적 수행(staged performance)으로 가이드할 위험이 있으며, 이는 의미 있는 피드백에 대한 가치가 낮다. 아마도 "더 많은 데이터가 더 낫다"는 가정에 의문을 제기하고, 더 적은 데이터(그러나 올바른 종류의 데이터)가 우리의 목적에 똑같이 잘 부합할 수 있다는 점을 고려해야 할 것입니다.

Paradoxically, the problem that programmatic assessment was trying to solve (not enough assessment data) has now created a new problem: the tyranny of documentation. If we require every interaction with a learner to turn a feedback moment into an assessment moment that must be recorded, we undermine the developmental relationship between supervisor and resident. An assessment-dominant context removes the safe spaces for learning and risks guiding residents toward inauthentic staged performances for assessment purposes, which are of low value for meaningful feedback. 47 Perhaps we should question the assumption that “more is better” and consider that less data—but the right kind of data—may serve our purposes equally well.

결론 Conclusion


공동체로서, 우리는 숫자와 단어가 모두 포함된 위임 등급 양식을 구현했는데, 각각의 목적과 용도에 대한 관심이 부족할 수 있습니다. [단어]가 [피드백을 위한 것]인지 [평가를 위한 것]인지에 대한 모호성 때문에, 고부담적 목적이 지배적인 경향이 있었기에, 단어를 평가로 처리하는 것이 디폴트였으며, 교육생은 진행 중인 개발에서 다음 단계를 수행하도록 의미 있게 도울 수 있는 기회를 확실히 잃어버렸다. [목적의 명확성]을 달성하는 쪽으로 우리의 에너지를 옮기고, 다른 접근 방식(단일 목적, 이중 목적)을 실험하여 평가와 피드백을 단어를 통해 달성할 수 있는지 여부와 방법을 이해하는 것이 앞으로 나아가는 데 도움이 될 수 있다. 위임 평정 양식은 프로그램 평가와 연계되어 있으며, [발달적 목적]을 장려하기 위해 프로그램 평가를 구현할 수 있는 방법을 전경화해야 한다. 그 중에서 가장 중요한 것은, 학습 대화가 일어날 수 있는 맥락으로서 학습자와 감독자 사이의 종적이고 신뢰적인 관계에 초점을 맞추는 것일 수 있다.
단어들은 [정교화하고, 문맥화하며, 교육instruct할 수 있는 엄청난 잠재력]을 가지고 있다. 이 잠재력을 실현하기 위해서, 우리는 그들의 의도된 용도를 분명히 해야 하고, 우리가 단어들을 [언제, 어떻게 모으는지]를 [왜 모으는지]와 일치시키기 위해 노력해야 한다. 우리는 교육자들이 단순히 피드백을 위해 일부 교육적 만남을 보존하고 모든 단어가 데이터가 될 필요는 없다는 점을 고려하도록 장려한다.

As a community, we have implemented entrustment rating forms with both numbers and words, with perhaps insufficient attention to the purpose and intended use of each. Because of the ambiguity as to whether the words are for feedback or assessment, the higher-stakes purpose tends to dominate and the default has been to treat words as assessment, which surely represents a lost opportunity for meaningfully helping trainees take the next steps in their ongoing development. Shifting our energies toward achieving clarity of purpose, and experimenting with different approaches (single purpose, dual purpose) to understand whether and how assessment and feedback may be achieved through words, may be a helpful way forward. Entrustment rating forms are linked with programmatic assessment, and we need to foreground the ways in which programmatic assessment can be implemented to encourage developmental purposes—of which the most important may be focusing on longitudinal, trusting relationships between learners and supervisors as the context in which learning conversations can occur. 39,57 Words have enormous potential to elaborate, to contextualize, and to instruct. To realize this potential, we must be crystal clear about their intended use and work toward aligning how and when we collect words with why. We encourage educators to preserve some educational encounters purely for feedback and to consider that not all words need to become data.

 


Acad Med. 2021 Jul 1;96(7S):S81-S86. doi: 10.1097/ACM.0000000000004089.

Numbers Encapsulate, Words Elaborate: Toward the Best Use of Comments for Assessment and Feedback on Entrustment Ratings

Affiliations collapse

Affiliations

1S. Ginsburg is professor of medicine, Department of Medicine, Sinai Health System and Faculty of Medicine, University of Toronto, scientist, Wilson Centre for Research in Education, University of Toronto, Toronto, Ontario, Canada, and Canada Research Chair in Health Professions Education; ORCID: http://orcid.org/0000-0002-4595-6650.

2C.J. Watling is professor and director, Centre for Education Research and Innovation, Schulich School of Medicine & Dentistry, Western University, London, Ontario, Canada; ORCID: https://orcid.org/0000-0001-9686-795X.

3D.J. Schumacher is associate professor of pediatrics, Cincinnati Children's Hospital Medical Center and University of Cincinnati College of Medicine, Cincinnati, Ohio; ORCID: https://orcid.org/0000-0001-5507-8452.

4A. Gingerich is assistant professor, Northern Medical Program, University of Northern British Columbia, Prince George, British Columbia, Canada; ORCID: https://orcid.org/0000-0001-5765-3975.

5R. Hatala is professor, Department of Medicine, and director, Clinical Educator Fellowship, Center for Health Education Scholarship, University of British Columbia, Vancouver, British Columbia, Canada; ORCID: https://orcid.org/0000-0003-0521-2590.

PMID: 34183607

DOI: 10.1097/ACM.0000000000004089

Abstract

The adoption of entrustment ratings in medical education is based on a seemingly simple premise: to align workplace-based supervision with resident assessment. Yet it has been difficult to operationalize this concept. Entrustment rating forms combine numeric scales with comments and are embedded in a programmatic assessment framework, which encourages the collection of a large quantity of data. The implicit assumption that more is better has led to an untamable volume of data that competency committees must grapple with. In this article, the authors explore the roles of numbers and words on entrustment rating forms, focusing on the intended and optimal use(s) of each, with a focus on the words. They also unpack the problematic issue of dual-purposing words for both assessment and feedback. Words have enormous potential to elaborate, to contextualize, and to instruct; to realize this potential, educators must be crystal clear about their use. The authors set forth a number of possible ways to reconcile these tensions by more explicitly aligning words to purpose. For example, educators could focus written comments solely on assessment; create assessment encounters distinct from feedback encounters; or use different words collected from the same encounter to serve distinct feedback and assessment purposes. Finally, the authors address the tyranny of documentation created by programmatic assessment and urge caution in yielding to the temptation to reduce words to numbers to make them manageable. Instead, they encourage educators to preserve some educational encounters purely for feedback, and to consider that not all words need to become data.

목적적 표본에서 신호를 추론하기: 역량 평가에서 맥락의 역할(Med Educ, 2022)
Inferring signs from purposeful samples: The role of context in competency assessment
Marise Ph. Born1,2 | Karen M. Stegers-Jager3 | Chantal E. E. van Andel3

 

1 소개
1 INTRODUCTION

임상 교육 동안, 의대생의 실습 적합성은 관습적으로 현실적인 학습 및 작업 환경에서 성과에 대한 편의 샘플을 사용하여 평가된다. 이러한 소위 직장 기반 평가에서 평가자는 예를 들어 환자와 상호 작용하는 동안 특정 상황에서 학생들의 지식, 기술 및 태도를 평가하기 위해 직접관찰을 사용한다. 그러나, 의과대학은 학생이 [특정한 관찰된 상황]에서 어떻게 수행하는지에 관심이 있는 것이 아니라, 학생들이 다른 상황에서 수행할 수 있는 능력에 대해 [일반화하기 위해 관찰]을 사용할 수 있는 정도에 관심이 있다.1 다르게 말하면, CanMEDs 프레임워크에 정의된 것과 같은 [의사로서 노동 시장에 진입하는 데 중요한 역량]에 대한 [학생들의 일반적인 상태standing]에 대한 평가를 제공하는 데 관심이 있다.2 따라서 교육 연구자들 사이에서, [현재 WBA의 편의 표본]이 의과대학이 끝날 때 학생의 [전반적인 의료 역량 프로필을 추정하는 데 적합한지]에 대한 문제가 제기되었다. 임상 평가는 종종 상황에 따라 제한되고 특이적이기 때문이다.

During clinical training, medical students' fitness for practice is customarily assessed using convenience samples of performance in realistic learning and working environments. In these so-called workplace-based assessments, raters use direct observation to appraise students' knowledge, skills and attitudes in a particular situation, for example, while interacting with a patient. However, medical schools are not so much interested in how a student performs in a specific observed situation but rather in the extent to which they can use the observation to generalise about the students' ability to perform in other situations.1 Put differently, they are interested in providing an estimation of students' general standing on the competencies important for entering the labour market as medical doctor such as those defined in the CanMEDs framework.2 Among educational researchers, the issue therefore has been raised of whether the current convenience samples of workplace-based assessments are appropriate for extrapolating a student's overall medical competency profile at the end of medical school, given that clinical assessments are often context bound and specific.

예를 들어, [하나 또는 두 개의 대인관계 상황을 관찰함]으로써 학생들의 [대인관계 기술에 대한 일반적인 결론]을 도출하는 것이 가능한지 궁금해 할 수 있다. 맥락특수성 다음으로 [다차원성]의 문제가 있다: 대부분의 학생-환자 상호 작용은 학생들이 여러 역량을 통합하고 수행할 것을 요구한다.1 작업장 기반 평가는 여러 역량을 통합적으로 평가할 수 있는 샘플을 제공하기 때문에 매력적이지만, 3 이러한 평가는 [개별 역량의 숙련도]를 구별하기 어렵게 만든다. 본 논문의 목표는 작업장 기반 평가의 편리한 샘플링보다 목적적합한 특성 분류법을 사용하여 어떻게 학생들의 일반적인 역량 프로파일을 보다 미묘한 방식으로 고려하기 시작할 수 있는지 조사하는 것이다. 우리는 또한 의사 수행의 어떤 요소가 의대생에서 평가하기에 시기상조이며, 의사 경력의 어떤 순간에 그것들을 측정하는 것이 적절해지는지에 대한 문제를 탐구한다. 심리학 분야에서 차용하여, 우리는 우리의 목표를 [(목적적인) 샘플]로부터 [징후(실습할 준비가 되었다는)를 추론]할 필요성으로 설정한다.

One may, for instance, wonder whether it is possible to draw general conclusions about students' interpersonal skills from the observation of one or two interpersonal situations. Next to context specificity, there is the issue of multidimensionality: most student–patient interactions require students to integrate and perform several competencies.1 Although workplace-based assessments are attractive because they provide samples that enable assessing multiple competencies in an integrated manner,3 these make it harder to distinguish mastery of individual competencies. This paper's goal is to examine how we might begin to consider students' general competency profiles in more nuanced ways by using a taxonomy of characteristics that can lead to purposeful rather than convenience sampling of workplace-based assessments. By implication, we also explore the issue of which elements of physician performance are premature to assess in medical students and at what moment in a doctor's career it will become appropriate to measure them. Borrowing from the discipline of Psychology, we frame our goal as the need to infer signs (that one is ready for practice) from (purposeful) samples.

실제 업무 수행 샘플을 사용하여 전문 역량을 평가하는 것은 [샘플 접근법]의 한 예로 간주될 수 있으며, 이는 대표적인 [성과 또는 행동의 샘플이 미래의 성과 또는 행동의 예측자로 사용되는 상황]을 가리킨다.4 표본 접근법은 일반적으로 [신호 접근법]과 대조된다. [신호 접근 방식]에서, (신호) 선택 맥락에서 일반적으로 적용되는 것처럼, 인지 능력 및 성격 특성(= 기호)과 같은 [구별 가능한 구성, 특성 또는 기술]이 성과를 예측하는 데 사용된다. 비록 건전한 평가가 성과를 예측하기 위해 성격 특성을 사용하는 것을 옹호하지는 않지만, [성적]조차도 인지 능력, 성격 특성 및 학습 능력에 영향을 받는 다면 [복합 측정]으로 간주될 수 있다. 5,6 마찬가지로, 개인에게 전문적인 활동을 맡기 위해 식별된 일반적인 조건은 능력, 성실성, 신뢰성 및 겸손이라는 점에서, [의과대학 시절에 취해진 척도]들이 간접적으로 [성격 특성을 포함할 가능성]이 있음을 시사한다.
The use of samples of performance from real practice to assess professional competence can be regarded as an example of the samples approach, which refers to a situation where a sample of representative performance or behaviour is used as a predictor of future performance or behaviour.4 The samples approach is usually contrasted with the signs approach. In the signs approach, as commonly applied in (personnel) selection contexts, distinguishable constructs, traits, or skills, such as cognitive abilities and personality traits (= signs) are used to predict performance. Although sound assessments do not advocate for the use of personality traits to predict performance, even grades can be considered multifaceted compound measures influenced by cognitive ability, personality traits and study skills.,5, 6 Similarly, the general conditions identified for entrusting individuals with a professional activity are ability, integrity, reliability and humility,7 further suggesting that measures taken during medical school are likely to, indirectly, include personality traits.

두 접근 방식 사이의 중요한 차이는 [샘플 접근 방식]에서 구인이 개별적으로 측정되지 않고 작업을 수행하기 위한 기술 레퍼토리를 입증하는 방법으로 통합 방식으로 측정된다는 것이다. 이 접근법의 강점은 [행동 일관성]의 개념에 있다: 행동 조치의 예측 타당성은 이 행동과 예측되는 미래 행동이 더 비슷할수록 더 높을 것이다.5 그러나, 이것이 바로 의대생들의 일반적인 능력 수준을 예측하는 것이 목표일 때 문제를 복잡하게 만드는 것이다.

  • [샘플]은 [특정 상황에서 수행능력]을 예측합니다. 그러면 [측정되지 않은 다른 상황]에서 [수행능력을 일반화]하려면 어떻게 해야 합니까?
  • 또 다른 단점은 [척도의 다면성] 때문에 학생이 [특정 상황에서 왜 성적이 떨어지는지] 명확하지 않은 경우가 많다는 것이다. 이렇게 하면 샘플은 진단 도구로서의 가치가 감소합니다.

그렇다면, 문제는 어떻게 우리의 샘플이 우리가 징후를 추론할 수 있도록 할 수 있는가 하는 것입니다.

An important difference between both approaches is that, in the samples approach, constructs are not measured separately, but in an integrated way by means of demonstrating a skills repertoire to perform a task. The strength of this approach lies in the notion of behavioural consistency: the predictive validity of the behavioural measures will be higher the more this behaviour and the to be predicted future behaviour are alike.5 However, this is exactly what complicates matters when the aim is to predict medical students' general competency level.

  • Samples predict performance in specific situations, so how do we then generalise to performance in other situations that were not measured?
  • Another disadvantage is that due to the multifaceted nature of the measures, it is often not clear why a student underperforms in a particular situation. This reduces the value of samples as diagnostic instruments.

So, the question is how can we ensure that our samples enable us to infer signs?

우리는 작업 분석의 결과로부터 MD의 직무에 필요한 KSAO(지식, 기술, 능력 및 값 8을 포함한 기타 특성)를 정의하는 것부터 시작하는 것이 중요하다고 주장할 것이다. 좋은 소식은 그러한 작업 분석이 이미 의료 분야에 대해 어느 정도 실시되었고, CanMEDs 및 ACGME 역량을 포함한 현재 의료 커리큘럼의 기초가 되는 역량 프레임워크의 정의로 이어졌다는 것이다.2, 9 여기서부터, 문제는 [임상실습 재직 중에 채취한 샘플]이 [다양한 맥락에서 예측될 수 있는 징후를 추론하기에 충분한 정보를 제공]하도록 어떻게 보장할 것인가 하는 것이다. 이 문제를 해결하기 위해, 우리는 스미스의 프레임워크를 사용하여 [개인의 특성]을 소위 보편성, 직업성 및 관계성의 범주로 분류한다. 이를 통해 [표본에서 신호로 추정하려고 할 때 맥락적 요인의 영향이 개별 특성의 범주에 따라 달라진다]는 것을 제안한다.

We will argue that it is important to start with defining the KSAOs (knowledge, skills, abilities and other characteristics including values8) that are required for the job of MD,2 resulting from work analysis. The good news is that—to some extent—such work analyses have already been conducted for the medical field and have led to the definition of competency frameworks underlying the current medical curricula, including CanMEDS and ACGME competencies.2, 9 From here, the question becomes how do we ensure that the samples we take during clerkship provide sufficient information to infer signs that will be predictive across various contexts. To address this issue, we use Smith's framework10 to classify individual characteristics into the so-called categories of universals, occupationals and relationals to propose that the effects of contextual factors when trying to extrapolate from samples to signs are dependent upon the category of individual characteristics.

이를 통해, 본 논문은, [역량의 다양한 측면이 어떻게 서로 다른 일반성을 갖는다고 생각될 수 있는지]를 탐구함으로써, [의과대학에서 직장 기반 평가의 현재 영역에 대한 비판적 검토][평가를 위한 목적적 샘플링 프레임워크]를 제공한다. [스미스의 프레임워크]는 평가와 인원의 선택이라는 맥락에서 개발되었으며 평가 조치의 내용과 향후 작업장 성과와의 관계 사이의 관계를 설명하기 위한 전반적인 관점을 제공한다. 평가에서 유용한 결과를 예측할 수 있는지 여부에 초점을 맞춘 유효성 모델입니다(cf). 보먼 외.11). Smith의 연구를 사용하기 위한 우리의 선택은 의대생들의 평가에서 도출될 수 있는 추론의 유형에 대한 그것의 관련성이다. 메식(Messick)의 것과 같은 다른 타당성 모델 12는 우리의 목적에 유용하기에는 너무 추상적인 것으로 간주되었다.
In doing so, this paper offers a critical review of the current domain of workplace-based assessment in medical school and a framework for purposeful sampling for assessment by exploring how different aspects of competence might usefully be thought of as having different generalisability. Smith's framework was developed in the context of assessment and selection of personnel and offers an overall view to explain relationships between the content of assessment measures and their relationships with future workplace performance. It is essentially a validity model, focusing on whether assessments can predict useful outcomes (cf. Borman et al.11). Our choice for using Smith's work is its relevance for the type of inferences that can be made from assessments of medical students. Other validity models, such as Messick's,12 were viewed as too abstract to be useful for our purposes.

2 작업 분석에서 임상 역량 평가까지
2 FROM WORK ANALYSIS TO ASSESSING CLINICAL COMPETENCIES

임상 역량을 식별하기 위해 일반적인 규칙이 특정 사례 집합에서 파생되는 귀납적 방법을 사용할 수 있다. 어떤 일련의 사례가 적절한지를 정의하기 위해, 종종 어떤 직업에 대한 일련의 중요한 요구 사항을 추출하기 위해 결정적 사건(예외적으로 좋은 행동과 나쁜 행동의 일화적 사건)이 사용된다.13 이것은 알려진 [가장 오래된 작업 분석 기법]이다.14 이 방법은 [최근에 졸업한 의사가 수행할 수 있는 일련의 전문적인 행위]를 공식화하기 위한 최근의 이니셔티브에서 볼 수 있다. 학부 커리큘럼과 관련된 이러한 이니셔티브는 대부분의 대학원 의료 교육 프로그램에서 신뢰할 수 있는 전문 활동(EPA)에 초점을 맞추는 방향으로 전환되었다.16 예에는 임상 상담과 동료와의 커뮤니케이션 및 협업이 포함된다.. 그런 다음 [제안된 전문 활동 세트]를 생성하면 임상 훈련 중에 어떤 샘플이 필요한지 결정하여 학생들의 이러한 활동 실행 능력에 대한 진술을 가능하게 한다. 이 방법에 내재된 위험은 구조물이나 역량이 표본에 의해 적절히 커버되지 않는다는 것이다. 역량은 [사람의 역량](예: 의학 지식, 의사소통 기술 및 전문적 태도)을 설명하는 반면, EPA는 [전문적 실무 단위](예: 복강경 담낭 절제술 수행 작업)이다.16 따라서 표본 추출이 적절하다는 것표본이 부족하지 않으며, 관련 없는 측면을 포함하지 않는다는 것을 의미한다.14

To identify clinical competencies, one could use an inductive method in which generic rules are derived from a set of specific cases. To define which set of cases is relevant, critical incidents—anecdotal incidents of exceptionally good and exceptionally poor behaviour—are often used to extract a set of critical requirements for a profession.13 This is the oldest work analysis technique known.14 This method can be seen in recent initiatives to formulate a set of professional activities that recently graduated medical doctors need to be able to execute.8, 15 These initiatives regarding undergraduate curricula followed a shift to focusing on entrustable professional activities (EPAs) in most postgraduate medical training programmes.16 Examples include clinical consultation and communicating and collaborating with colleagues. Generating a proposed set of professional activities then allows one to decide which samples are required during clinical training to enable statements about students' ability to execute these activities. A risk inherent in this method is that constructs or competencies are not adequately covered by the samples. Whereas competencies describe people's capacities (e.g., medical knowledge, communication skills and professional attitude), EPAs are units of professional practice (e.g., the task of conducting a laparoscopic cholecystectomy). 16 Adequate sampling, therefore, implies that samples are not deficient and do not contain irrelevant aspects.14

대안은 연역법으로, [특정 상황에 일반적인 규칙을 적용하는 것]을 의미한다. 임상 훈련의 경우, 이것은 필요한 샘플 세트가 속성 지향적 직무 분석(능력, 특성, 적성 등), 문헌 검토 또는 기존 이론에 기초하여 연역적으로 생성된다는 것을 의미한다.17 네덜란드 의대를 위한 최근 업데이트된 Raamplan에 설명된 CanMEDs 역량에 기초한 학부 의료 훈련을 위한 의도된 학습 결과는 그러한 직무 분석의 예를 제공한다. 그러나 주요 과제는 임상 교육 중에 이러한 모든 학습 결과를 의도적으로 평가하는 것이다. 이것은 학생들의 성적을 평가할 [다양한 상황들의 의도적인 표본 추출]이 필요하다. 
An alternative is the deductive method, which implies applying a general rule to a specific situation. For clinical training, this would mean that the set of required samples is generated deductively on the basis of an attribute-oriented job analysis (competencies, traits, aptitudes; e.g., Cook14), a literature review or an existing theory.17 The intended learning outcomes for undergraduate medical training based on the CanMEDs competencies described in the recently updated Raamplan for Dutch medical schools offers an example of such a job analysis.8 The main challenge, however, is to ensure that all these learning outcomes are intentionally assessed during clinical training. This requires deliberate sampling of various situations in which students' performance is going to be assessed.

사무직에서 연역적 접근법과 귀납적 접근법의 장점과 단점을 고려하여, 우리는 다음을 제안하고 Smith의 모델을 사용하여 하이브리드 방법이 어떻게 만들어질 수 있는지 탐구한다.
Given the described advantages and disadvantages of both the deductive and inductive approaches in clerkships, we propose the following and use Smith's model to explore how a hybrid method might be created:

  • 제안 1.모든 학습 성과가 임상실습 기간 중에 의도적으로 평가되도록 하려면, 즉 임상 훈련에서 샘플(작업장 기반) 평가에 대한 연역적 및 귀납적 접근 방식의 조합이 필요하다.
  • Proposition 1.To ensure that all learning outcomes are intentionally assessed during clerkships, a hybrid method is needed, that is, a combination of the deductive and inductive approach to sample (workplace-based) assessments in clinical training.

3 보편, 직업 및 관계
3 UNIVERSALS, OCCUPATIONALS AND RELATIONALS

의사로서 일하기 위해 요구되는 역량은 Smith의 모델에서 다양한 범주의 직업 특성에 속합니다.10 그는 [역량이 상황에 따라 달라지는 정도]에 초점을 맞추며 다음의 세 가지 직업 특성 영역을 구분합니다. 

  • 보편성, [모든 근로자에게 요구되는 특성]으로 상황에 의존하지 않는 보편성
  • 직업성, 즉 [특정 직업에 요구되는 특성]을 의미하지만 따라서 직무 관련 특성에 의존하는 다른 직업에는 해당되지 않는다
  • 관계성,[특정 조직 환경]에서 함께 일하는 습관적인 방법을 사용하는 데 필요한 관계입니다.

이제 각 범주에 적합한 역량에 대한 직관적인 예를 제시하고 행동의 샘플에서 부호(일반 역량에 대한 주장)를 추출하는 것이 쉬울지 문제가 있을지를 추론함으로써 이 세 가지 범주에 대해 더 심도 있게 논의할 것이다.

The competencies required to work as a doctor belong to different categories of job characteristics in Smith's model.10 He focuses on the degree to which competencies are context dependent, differentiating between the following three domains of job characteristics: 

  • universals, which are characteristics required by all working individuals and thus not context-dependent; 
  • occupationals, which refer to characteristics required by certain jobs but not others that, therefore, are dependent on task-related features of an occupation; and 
  • relationals, which are required in a specific organisational context with habitual ways of working together.

We will now discuss these three categories more in depth by offering intuitive examples regarding what competencies fit into each category and deducing, thereby, whether extracting signs (claims about general competencies) from samples of behaviour is likely to be easy or problematic.

4 유니버설
4 UNIVERSALS

[보편적 역량]은 여러 직업과 맥락에 걸쳐 관련이 있다. Smith의 인지 능력, 생명력(신체적, 정신적 에너지 18) 및 직업 정신(양심성 포함)에 대한 보편성 외에, 우리는 민첩성(일명 적응성 19)을 오늘날의 보편성으로 간주한다. 신기술과 환자 인구 변화를 통한 업무 변화는 직원들이 훨씬 더 적응력이 있어야 한다. 스미스는 보편성을 [모든 직업에 대해 0이 아닌 예측 타당성을 갖는 구인]으로 간주한다.
Universal competencies are relevant across jobs and contexts. Next to Smith's universals of cognitive capacities, vitality (physical and mental energy18) and work ethos (including conscientiousness), we also regard agility (aka adaptability19) as a present-day universal. Changes in work through new technology and changing patient populations require employees to be much more adaptable. Smith regards universals as constructs that would hold a nonzero predictive validity for all jobs.

그런 다음 문제는 특정 의료 작업 상황에서 '보편적' 행동을 샘플링하여 다른 의료 작업 및 환경에서 이러한 행동을 예측할 수 있는지 여부가 된다. 우리의 전제는 그러한 샘플링이 신뢰성 있고 구성 가능한 방식으로 수행된다면, 14 이것은 실제로 가능하다는 것이다.

  • 이 개념을 뒷받침하기 위해, 곤잘레스-뮬레 등의 메타 분석은 많은 직업 유형과 환경에서 일하는 성인들 사이의 [인지 능력]의 측정이 어떻게 일반적인 직업 성과를 강력하게 예측하는지 보여준다.
  • Koczwara 등은 종단적 연구에서 다양한 방법(GMA 테스트 및 상황별 측정)으로 측정한 졸업생 간의 [인지 능력]이 모의 환자 상담 및 GP 훈련에 사용되는 작업 관련 그룹 토론과 같은 의료 작업과 관련된 시뮬레이션 연습을 예측했다고 보고했다. 
  • 더욱이, He 등의 메타 분석은 직업과 수행 등급 유형에 걸쳐 예측되는 [성실성]의 척도를 보여주는 반면,
  • Hojat 등은 [성실성]이 의대와 의료 직업에서 수행에 대한 가장 강력하고 일관된 성격 예측 변수라고 보고한다.

The question then becomes whether sampling ‘universal’ behaviour in a specific medical work situation can predict this behaviour in any other medical work and setting. Our premise is that if such sampling is done reliably and in a construct-valid way,14 this indeed is possible.

  • In support of this notion, a meta-analysis by Gonzalez-Mulé et al.20 shows how measures of cognitive ability among working adults across many job types and settings strongly predict general job performance,
  • while Koczwara et al.21 in a longitudinal study, reported that cognitive ability among graduates as measured in diverse ways (a GMA test and more contextualised measures) predicted simulation exercises related to medical work, such as a simulated patient consultation and a work-related group discussion used for selection into UK-training for GP.
  • Moreover, a meta-analysis by He et al.22 shows measures of conscientiousness to be predictive across occupations and types of performance ratings,
  • whereas Hojat et al.23 report this trait to be the strongest and most consistent personality predictor of performance in medical school and in the medical profession.

이러한 발견은 이러한 구인의 예측 타당성이 직업과 작업 환경뿐만 아니라 이러한 [보편성]을 측정하는 방법 전반에 걸쳐 유지된다는 것을 시사한다. 우리는 활력, 민첩성 및 작업 기질과 관련된 메타 분석에 대해 잘 알지 못하지만, 이러한 개념에 대해 유사한 발견을 예측할 수 있다. 따라서 이는 우리를 다음과 같이 이끈다. 
These findings suggest that the predictive validity of these constructs holds not only across jobs and work settings but also across the way these universals are measured. Although we are not knowledgeable of meta-analyses related to vitality, agility and work ethos, we would predict similar findings for these concepts. This, therefore, leads us to the following:

  • 제안 2.특정 의료 작업 환경에서 인지 능력, 활력(신체적 및 정신적 에너지), 작업 윤리(양심성 포함) 및 민첩성인 [보편적 역량]의 [신뢰할 수 있고 구성 가능한 표본 추출]은 [다른 의료 작업 환경 또는 의료 직업으로 일반화]될 수 있다.
  • Proposition 2.Reliable and construct-valid sampling of universal competencies, which are cognitive capacities, vitality (physical and mental energy), work ethos (including conscientiousness) and agility, in a specific medical work setting is generalisable to any other medical work setting or medical occupation.



이 명제는 [신뢰할 수 있고 구성 가능한 방식]으로만 수행된다면, 보편성을 샘플링하는 방법이 특별히 중요하지 않다는 것을 암시한다. 즉, 증거 수집에 대한 여러 접근 방식(즉, 서로 다른 평가 방법)을 사용할 수 있지만, 모두 타당성 증거에 의해 뒷받침되어야 한다. 따라서 [감독자에 의한 평가]와 같은 전통적인 방법 외에, [상황 판단 시험]과 같은 다른 방법, 동료, 간호사, 환자 및 감독자와 같은 관련 [타인에 의한 360° 평가], 학생이 특정 과제를 실제로 실행하는 대신 [수행하는 방법을 설명하고 묘사]하는 'walk-throughs'가 사용될 수 있다. 평가 방법의 선택에 영향을 미치는 요소는 시간과 비용과 같은 것들에 의해 주도되어 매우 현실적일practical 수 있다. [상황, 맥락, 시간에 걸친 성격 특성의 안정성]은 성격 심리학자들 사이에서 논의의 문제로 남아 있는 복잡한 문제이지만, 26,27 [성실성]은 상대적으로 높은 수준의 안정성을 보여주는 경향이 있는 하나의 성격 구조이며, 이것은 그것이 평가의 일반화를 해치지 않고 많은 상황, 맥락, 시간에 평가될 수 있음을 시사한다.

This proposition implies that the way universals are sampled is not particularly important, provided it is done reliably and in a construct-valid way. In other words, multiple approaches to gathering evidence (i.e., different assessment methods) can be used, but all need to be supported by validity evidence. Therefore, next to traditional methods such as ratings by supervisors, other methods like situational judgement testing,24 360° ratings by relevant others such as colleagues, nurses, patients and supervisors,25 and ‘walk-throughs’ during which students explain and describe how they execute certain tasks instead of actually executing them14 could be used. Factors influencing the choice of assessment method then could be very practical, driven by things such as time and costs. While the stability of personality traits across situations, contexts and time is a complex issue that remains a matter of discussion among personality psychologists,26, 27 conscientiousness is one personality construct that tends to show a relatively high degree of stability, suggesting it is assessable in many situations, contexts and times without harming generalisation of the assessment.

5 직업적
5 OCCUPATIONALS

스미스에 따르면, 직업성은 [특정 직무나 직업과 관련된 특성]이다. 직업의 예로는 특정 직업에서 효과적인 수행을 가능하게 하는 특정 인지 능력(예: 수치적 또는 언어적 기술), 특정 지식 및 특정 성격 특성이 있다. 스미스는 이러한 낮은 수준의 능력이 [일반적인 인지 능력(보편적)과 상당히 겹치는 것]을 보여주며, 성과와 선형적으로 관련이 있다고 보고한다.

According to Smith,10 occupationals are characteristics that are relevant to particular jobs or occupations. Examples of occupationals are specific cognitive abilities (i.e., numerical or verbal skills), specific knowledge and certain personality traits that enable effective performance in a particular job. Smith reports that these lower-level abilities show considerable overlap with general cognitive ability (a universal) and are linearly related to performance.

[직무 클러스터링]은 종종 [직무 또는 직무 그룹에 특정 능력이 필요하다]는 개념으로 시작됩니다. 의사를 위한 [특정 인지 능력]의 예로는 [임상 추론]이 있는데, 이는 진단 및/또는 치료 계획에 도달하기 위해 환자 정보를 해석하는 보건 전문가의 인지 과정으로 간주될 수 있다. 임상 추론은 의심할 여지 없이 [의업을 정의내리는defining 특성]이기 때문에 의사의 ['일반적generic' 직업성occupational]으로 간주될 수 있다. 한편, 특정 의료 분야 간의 관련성이 다르기 때문에 ['특이적specific' 직업성]으로 간주될 수 있는 직업도 있다. 예를 들어 눈과 손의 협응을 생각해 보자. 이 협응은 특히 외과 분야와 관련이 있지만 일반 의학 분야에서는 덜 관련이 있다.
Job clustering often starts with the notion that jobs, or groups of jobs, require specific abilities. An example of a specific cognitive ability for doctors is clinical reasoning, which could be considered as the cognitive processes of health professionals through which they interpret patient information to come to a diagnosis and/or treatment plan. Clinical reasoning is arguably the defining characteristic of the medical profession28 and therefore can be considered as a ‘generic’ occupational for medical doctors. On the other hand, there are also occupationals that differ in their relevance between specific medical domains and therefore may be considered ‘specific’ occupationals. Think for example of eye–hand coordination, which is particularly relevant to the surgical disciplines, but less so for general medicine.

  • 제안 3. 의료의 경우, 직업은 모든 의사의 직업과 관련된 [일반적 직업성]과 특정 분야 내의 의사와 관련된 [특이적 직업성]으로 나눌 수 있다.
    Proposition 3.For the medical profession, occupationals can be divided into generic occupationals, which are relevant to all medical doctors' occupations, and into specific occupationals which are relevant for medical doctors within specific disciplines.

[일반적 직업성]의 범주에는 임상 추론, 진실성, 의사소통 기술(동료 및 환자와의 의사소통), 타인에 대한 관심, 스트레스 내성, 자기 중심적 학습 지향 등이 포함되지만 이에 국한되지는 않을 수 있다.
The category of generic occupationals includes, but may not be limited to, clinical reasoning, integrity, communication skills (communication with colleagues and patients), concern for others and for society, stress tolerance, self- and other-focused learning orientation.

[특이적 직업성]의 범주는 특정 분야에 따라 관련성이 있는 역량으로 구성된다. 여기에는 일반적인 직업의 하위 측면(예: 의사소통의 하위 측면으로서의 어린이와의 의사소통), 눈-손 조정/수동적 손재주(수술), 공간 인식(방사선학) 및 경계(마취)와 같은 역량이 포함된다.
The category of specific occupationals consists of competencies that are relevant depending on the specific discipline. These comprise competencies such as subfacets of generic occupationals (e.g., communication with children as subfacet of communication), eye–hand coordination/manual dexterity (surgery), spatial awareness (radiology) and vigilance (anaesthesia).

[일반적 직업성]과 [특이적 직업성] 사이의 차이를 고려할 때, 그렇다면 의과대학은 두 가지 유형 모두에 대해 어느 정도 그리고 어떻게 표본을 추출할 수 있는가 하는 문제이다. 의과대학이 학생들에게 광범위한 미래 업무 상황에 대비하도록 하기 때문에 의과대학 시절에는 임상적 추론과 같은 [일반적 직업성]에 집중하는 것이 논리적으로 보인다. 그러나 모든 의사가 임상 추론에 유능해야 한다는 데 동의하지만, 이를 정의하고, 가르치고, 평가하는 데 어려움이 존재한다.28 여기서 주요 쟁점은 이전과 마찬가지로 맥락 특이성이다. 즉, 임상 과제의 맥락은 학생의 수행과 필요한 임상 추론 유형에 영향을 미칠 것이다. 이는 [[특정 상황에서 (관찰된) 성과]를 통해 [일반적인 직업 임상 추론에서 역량]을 추정할 필요가 있음]을 의미한다. 하지만 어떻게 우리가 의과대학이 끝날 때 '임상추론'과 같은 일반적인 직업에서 일반적으로 유능하다는 것을 증명할 수 있도록 요구되는 구체적인 상황을 결정할 수 있을까요? 우리는 여기서 [샘플링에 대한 하이브리드 접근 방식]을 사용하는 것이 맥락과 과제에 걸친 의대생의 역량에 대한 진술을 개선하는 데 특히 유용할 것이라고 믿는다.
Given the distinction between generic and specific occupationals, the question then is to what extent and how can medical schools sample for both types. As medical schools seek to prepare students for a wide range of future work contexts, it seems logical to focus on generic occupationals, such as clinical reasoning, during medical school. But, while it is agreed that all medical doctors must be competent in clinical reasoning, challenges exist in defining, teaching and assessing it.28 The main issue here, as before, is context specificity29; that is, the context of the clinical task will have an influence on the student's performance and the type of clinical reasoning required. This implies that we need to estimate competence in the generic occupational clinical reasoning by means of (observed) performance in specific situations. But how do we decide on the specific situations that are required for us to be able prove at the end of medical school that a student is generally competent in a generic occupational such as ‘clinical reasoning’? We believe that here the use of a hybrid approach to sampling is likely to be particularly useful to help improve statements about medical students' competences across contexts and tasks.

위에서 언급한 바와 같이, [하이브리드 접근법]은 EPA의 형태를 취할 수 있는 일련의 '중요한critical' 전문 활동을 식별함으로써 [귀납적]으로 시작할 수 있다. 그러나 표본 추출에 유용하게 쓰려면 이러한 활동이 구체적이고 문맥화되어야 한다. 예컨대 [일반적인 활동으로의 임상상담]을 활용하기보다는 [신경학이나 정신과 상담]처럼 의대생들이 임상훈련 중 숙달해야 하는 다양한 유형의 임상상담을 생각할 수 있었다. 최근 핵심 EPA 임상 상담을 위해 [16개의 하위 활동], 이른바 [nested EPA]가 제안되었다. 따라서, 하위 활동 표본 추출이 특정 직업 평가에 특히 관련이 있다고 제안한다. 그 다음 질문은 [[특이적 직업성]이 지역화된localized 활동이나 상황]을 (우리의 궁극적 목표인) [일반적 직업성]에 대한 무언가를 추론하기 위해 어떻게 사용하느냐가 된다. 
As alluded to above, the hybrid approach could start inductively by identifying a set of ‘critical’ professional activities, which could take the form of EPAs. In order to be useful for sampling, however, these activities should be concrete and contextualised. For example, rather than using the generic activity clinical consultation, one could think of the different types of clinical consultations that medical students must master during clinical training, such as the neurological or the psychiatric consultation. Recently, as many as 16 subactivities, so-called nested EPAs, have been suggested for the core EPA clinical consultation.15 We propose, therefore, that sampling subactivities is particularly relevant for assessing specific occupationals. The question then becomes how we subsequently use activities or situations within which specific occupationals are localised, to infer something about generic occupationals, which after all is our goal?

여기서 샘플링 평가 상황에 대한 [연역적 접근법]을 추가하는 것이 유용하다. 설명하자면, 모든 의사들에게 중요하다고 여겨지는 또 다른 기술, 즉 의사소통 기술을 성찰해 보자. Van der Vleuten 등 30은 의사소통 기술이 매우 맥락특이적임을 고려할 때, 의사소통 평가에 대한 [프로그램적 평가 접근 방식]을 사용할 것을 제안하는데, 이는 학생들의 의사소통 기술의 [여러 샘플을 더 오랜 기간에 걸쳐 수집하기 위해 다양한 방법을 사용한다는 것]을 의미한다. 광범위한 샘플링에서 역량을 '일반화'하는 [귀납적 접근법]의 가치에 동의하지만, 우리는 의사소통 역량이 의미하는 것의 정신을 포착하는 활동의 적절한 샘플링을 보장하기 위해 [역량 프레임워크와 이론적 모델에 기초한 체계적이고 연역적인 접근법]이 이 종적 접근법에 중첩되는 것이 중요하다고 생각한다. 

Here, the addition of a deductive approach to sampling assessment situations becomes useful. To explain, let us reflect on another skill that is considered important to all medical doctors: communication. Given that communication skills are highly context specific, Van der Vleuten et al.30 propose the use of a programmatic assessment approach to communication assessment, which implies using different methods to collect multiple samples of students' communication skills over a longer period of time. Although we agree with the value of this inductive approach of ‘generalising’ competence from broad sampling, we think it is important that a systematic, deductive approach based on competency frameworks and theoretical models be overlaid on this longitudinal approach to ensure adequate sampling of activities that capture the spirit of what is meant by communication competence.

또 다른 예로, 스티븐스와 캠피온이 정의한 [팀워크 지식, 기술, 능력의 모델]을 생각해 보자. 갈등 관리 역량, 공유된 문제 해결 역량 및 커뮤니케이션 능력과 같은 대인 관계 역량으로 구성된 이 모델은 팀워크에 기반한 선택 절차에 대한 [상황 판단 테스트]를 연역적으로 설계하는 데 사용되었다. 이상적인 방법으로 활동을 샘플링하려면 환자 조합(즉, 학생이 접하는 환자의 양과 다양성)을 고려해야 합니다. DeJong 등이 제안한 바와 같이, 환자 조합을 개별 학생의 특정 학습 목표와 요구에 맞게 조정하는 것을 고려할 수 있다. 요컨대, [사건이나 상황에서만 시작하는 것]과는 대조적으로, [연역적 접근법]은 [의사소통의 일부 측면]은 [실제 임상 실무에서 직접 관찰하는 전형적 방법]이 아닌 [다른 방법으로 측정되는 것이 더 낫다]는 결론을 이끌어낼 수 있다.

Another example, consider the model of teamwork knowledge, skills and abilities defined by Stevens and Campion.31 This model, consisting of, among others, interpersonal competences like conflict management competences, shared problem solving competences and communication competences, was used to deductively design a situational judgement test for selection procedures based on teamwork.31 To sample activities in an ideal manner, the patient mix (i.e., the quantity and the diversity of the patients encountered by students) must be taken into account. As suggested by De Jong et al., we might want to consider tailoring the patient mix to specific learning goals and needs of individual students.32 In sum, in contrast to starting from incidents or situations only, the deductive approach may lead to the conclusion that some aspects of communication would better be measured in other ways than by the typical way of direct observation in real clinical practice.

  • 제안 4. [연역적 접근법]은 [일반적 직업성]의 신뢰할 수 있고 구인-타당한 샘플링을 지원하는 반면, [귀납적 접근법]은 [특이적 직업성]의 [구인-타당한 샘플링]을 지원하는 데 특히 유용하다.
    Proposition 4.A deductive approach supports reliable and construct-valid sampling of generic occupationals, whereas an inductive approach is particularly useful for supporting reliable and construct-valid sampling of specific occupationals.

스미스에 따르면, [어떤 비인지적 역량]은 특정 직업에서 성과를 향상시킬 수 있다. 일반적으로 회계사로서 수행하는데 중요한 속성이 소방관으로서 수행하는데 중요한 속성과 같을 가능성은 낮다. 하지만 의사들에게 어떻게 그럴 수 있을까요? 전문분야의 차이에도 불구하고 모든 의사들에게 중요한 비인지적 역량이 있는가? 그리고 전문분야에 따라 모든 의사가 아닌 일부 의사들에게 중요한 특성이 있는가? [직무 분석]을 사용하여, Patterson 등은 의사가 특정 적성을 가진 전문 분야와 일치하도록 보장하는 데 도움이 될 수 있는 (임상 지식과 학문적 성취를 넘어선) 광범위한 속성을 식별했다. 그들은 연구된 전문 분야 간의 차이점보다 [유사성이 더 많았지만], 서로 다른 전문 분야 전문가들 사이에서의 [인식된 중요성의 차이]는 역량 영역의 맥락 특이성을 나타낸다고 결론지었다. 

According to Smith, certain noncognitive competencies may enhance performance in particular occupations. Generally, it is unlikely that attributes that are important for performing as an accountant are the same as those important for performing as a firefighter. But how is that for medical doctors? Are there noncognitive competencies that are important for all medical doctors, despite their specialty, and are there such characteristics that are important for some, but not all doctors, depending on their specialty? Using job analyses, Patterson et al.33 identified a wide range of attributes beyond clinical knowledge and academic achievement that may help ensure that doctors are matched with a specialty for which they have a particular aptitude. They concluded that although there were more similarities than dissimilarities between the studied specialties, differences in perceived importance by professionals from the different specialties indicate context specificity of competency domains.

예를 들어, 소아과에서는 의사소통과 공감능력이 가장 중요한 것으로 평가되었고, 마취과에서는 진실성과 경계가 가장 높은 평가를 받았다. 소아과와 산부인과에서, 그리고 산부인과에서, 팀 참여는 마취보다 더 중요하게 여겨졌다. 관련성의 차이 다음으로, 전문 분야 간의 맥락의 차이는 요구되는 역량의 질적 차이로 이어진다. 33 이것은 의사소통과 같은 [일반적 직업성]이 [특이적 직업성]으로 분류될 수 있다는 것을 의미한다. 예를 들어, 대화 스타일을 어른에서 아이로 바꿀 수 있다는 것은 환자와의 사이코-성 문제를 논의할 수 있다는 것과는 다르다. 관련 역량 영역에 대한 전문 분야별 상황별 정보를 제공함으로써 다양한 전문 분야의 직무 분석은 평가 표본 추출뿐만 아니라 의대생의 자기 선택 및 진로 선택에도 정보를 제공할 수 있다. 그럼에도 불구하고, 의과대학은 그들의 졸업생들에게 다양한 대학원 훈련 프로그램을 준비시켜야 하기 때문에, 의대생들은 모든 의사들에게 중요하다고 여겨지는 역량에 걸쳐 최소한의 기준을 제시할 필요가 있다. 
즉, [일반적 직업성]은 [한 사람의 경력 초기에 특히 중요하다]는 것을 의미한다. 나중에 특정 전문 분야에서 우선순위로 확인된 도메인(즉, 특정 직업)을 해당 전문 분야의 선택 및 평가 절차를 설계하는 데 사용할 수 있다. 

As an example, within paediatrics, communication and empathy were rated as most important, whereas in anaesthesia, integrity and vigilance got the highest ratings. In both paediatrics and obstetrics and gynaecology, team involvement was considered more important than in anaesthesia. Next to differences in relevance, differences in context between specialties also lead to qualitative differences in required competences.33 This implies that a generic occupational like communication could be broken-down into specific occupationals. For example, being able to switch in conversation style from adult to child interactions is different from being able to discuss psycho-sexual problems with patients. By providing specialty-specific, contextualised information on relevant competency domains, job analyses for various specialties could not only inform assessment sampling but also self-selection and career choice of medical students. Nevertheless, as medical schools must prepare their graduates for a wide variety of postgraduate training programmes, medical students need to demonstrate a minimum standard across competencies that are considered important for all medical doctors, meaning that the generic occupationals are particularly important in the early stages of one's career. Later, domains that are identified as priorities in a particular specialty (i.e., the specific occupationals) could be used for designing selection and assessment procedures for that specialty.

  • 제안 5.
  • (a) 일반적 직업성은 의대생들을 위한 평가 절차를 설계할 때 특이적 직업성보다 더 많은 비중을 두어야 한다.
  • (b) 특이적 직업성은 의료 전공의의 선택과 평가 절차에서 일반적 직업성보다 더 많은 비중을 두어야 한다. 그러나 그들은 의대생들의 의학 전공 선택에도 사용될 수 있다.
    Proposition 5.
  • (a) Generic occupationals should be given more weight than specific occupationals in designing assessment procedures for medical students.
  • (b) Specific occupationals should be given more weight than generic occupationals in selection and assessment procedures for medical residents; they could, however, also be used for medical students' self-selection into medical specialties.

6 관계성
6 RELATIONALS

[관계성]은 [특정 업무 맥락과 관련된 특성]이다. 병원의 어느 부서에서는 의사와 그의 팀 간의 관계가 조화로울 수 있지만, 다른 부서에서는 팀 내의 관계가 매우 소송적litigious일 수 있다. 그러한 차이는 그러한 상황을 탐색하는 데 필요한 기술과 지식이 현저하게 다르기 때문에 성과에 현저한 영향을 미칠 수 있다. 결과적으로, [관계성]은 소위 [개인-조직 적합성]과 관련되며, [특정 개인과 특정 조직 맥락이 일치하는지 여부]를 조사하는 접근법을 요구한다. 개인-조직적 적합성에 대한 방대한 양의 연구가 업무와 조직 심리학자들에 의해 수행되었으며, 주로 가치, 즉 [개인의 가치]가 [특정 조직의 가치]와 일치하는지 여부에 초점을 맞추고 있다. Kristof-Brown 등.34와 Arthur 등.35에 의한 메타분석에 따르면 가치적합은 개인의 직무만족도, 이직률(부정적) 및 조직에 대한 헌신과 관련이 있다. 

Relationals, as Smith10 suggested, are characteristics that are relevant to specific work contexts. In one hospital department, the relationship between a medical doctor and his or her team can be harmonious but in another department relationships in a team may be very litigious. Such differences could have a marked effect on performance as the skills and knowledge required to navigate those situations differ markedly. Consequently, relationals concern the so-called person-organisation fit and demand an approach that investigates whether a specific person and a specific organisational context are a match. A vast amount of research into person-organisation fit has been conducted by work and organisational psychologists, mostly focusing on values, namely, whether a person's values are commensurate with the values of a specific organisation. Meta-analyses by Kristof-Brown et al.34 and Arthur et al.35 report that a values-fit is related to a person's job satisfaction, to turnover (negatively) and to commitment to the organisation.

[가치]의 예는 위신prestige을 위해 노력하고, 강한 성취 지향성을 가지며, 타인의 복지에 대한 헌신에 초점을 맞추는 것등이 있다.

  • 특정 학술병원은 선진화, 인지도, 사회적 지위를 중요하게 여기는 사람들을 끌어들이는 선진화와 명성의 가능성을 강조할 수 있다. 
  • 다른 병원은 환자 지향성이 강할 수 있으며, 위신보다 서비스 지향성을 더 중요시합니다. 
  • 또 다른 병원에서는, 직원들이 스스로 일하고 결정을 내릴 수 있도록 하는 독립성에 초점을 맞출 수 있으며, 이것은 강한 개인의 책임과 자율성을 선호하는 사람들에게 일치할 수 있다. 

Examples of values are striving for prestige, having a strong achievement-orientation, and a focus on commitment to the welfare of others.36 

  • A certain academic hospital may emphasise possibilities for advancement and prestige, which may attract people who find advancement, recognition, and social status important.
  • Another may be strongly patient oriented, valuing service orientation more than prestige.
  • In yet another hospital, the focus could possibly be on independence, allowing its employees to work on their own and make decisions, which may form a match for those who prefer strong individual responsibility and autonomy.

드 클레르크 외 연구진은 슈바르츠의 일반 가치 모델을 기반으로 다음과 같은 주제를 바탕으로 [조직을 위한 가치 모델]을 개발하였다. 

  • 자기 평가(예: 성취, 위신 및 권력), 
  • 변화에 대한 개방성(예: 자극과 자기 방향의 필요성), 
  • 자기 초월 (예: 사회적 헌신) 
  • 보수성 (예: 전통, 적합성) 

Based on the general values model of Schwarz,37 De Clercq et al.36 developed a values model for organisations, grounded on the underlying themes of

  • self-enhancement (e.g., achievement, prestige and power),
  • openness to change (e.g., need for stimulation and self-direction),
  • self-transcendence (e.g., social commitment) and
  • conservation (e.g., tradition, conformity).

Gennissen 등이 의대생들을 대상으로 한 최근의 정성적 연구는 이 학생들 사이에서 세 가지 직업 관련 가치발견했다. 

  • 성취와 자신의 일에 대한 인정과 관련된 직업 지향, 
  • 평생 자기 계발에 대한 지향, 
  • 일과 삶의 균형을 중시하는 지향

이 세 가지 가치에서 De Clerq 등의 [자기 강화]와 [변화에 대한 개방성] 테마는 쉽게 인식될 수 있다. 향후 연구는 De Clercq 등의 가치 모델, 즉 [자기 초월]과 [보수성]의 두 가지 다른 주제가 의대생에게 어느 정도 관련이 있는지 조사할 수 있다.

A recent qualitative study among medical students by Gennissen et al.38 found three career-related values among these students, namely,

  • a career orientation concerned with achievement and recognition of one's work,
  • an orientation towards lifelong self-development and
  • an orientation valuing work–life balance.

In these three values, De Clercq et al.'s themes of self-enhancement and openness to change can easily be recognised. Future research could investigate to what extent both other themes in De Clercq et al.'s value model, that is, self-transcendence and conservation, are relevant for medical students.

가치의 차이 외에도, 작업 환경은 높은 자원 대 낮은 자원 환경전자 성과 모니터링의 부재 또는 존재, 요구하는 속도와 같은 구조적 측면에서 다를 수 있다. 20, 39 이러한 요인들은 [조직과 개인에 의한 직무와 기술의 해석]에 영향을 미칠 수 있으며, 따라서 [이러한 해석이 공유되는 정도]에도 영향을 미칠 수 있다. 스미스에 따르면, [가치]와 [직무에 대한 공유된 해석]은 관계 범주에서 가장 관련성이 높은 하위 영역에 속한다.
Next to differences in values, work settings may differ in structural aspects, such as a high- versus low-resource environment, the absence or presence of electronic performance monitoring and needed speediness.20, 39 Such factors may influence the interpretation of the tasks and skills of the job by the organisation and by the individual, and thus the degree to which this interpretation is shared. According to Smith,10 values and the shared interpretation of the job are among the most relevant subdomains in the category of relationals.

우리는 가치, 이상과 원칙, 직업/과제 해석과 같이, [관계성] 측면에서 [특정 의료 환경과 의대생 사이의 일치성]이 학생의 [미래 업무 관련 웰빙]과 [특정 맥락에서 자신의 의료직에 대한 헌신]을 위해 중요하다고 믿는다. 그러므로, 임상실습은 학생들에게 [가치 프로필]의 관점에서 그들이 [일치하는 것을 경험하는지 여부]를 탐구할 기회를 주어야 한다. 향후 특정 병원 부서의 선발 절차에서 이 경기가 역할을 할 수 있다. 예를 들어, 의대생의 일과 삶의 균형 가치는 다른 병원 부서보다 한 병원 부서에 더 적합할 수 있다. 관계성에 초점을 맞추어 다음과 같이 제안한다.
We believe that congruence between a specific medical setting and the medical student in terms of relationals—values, ideals and principles and job/task interpretation—is important for the student's future work-related well-being and the student's commitment to one's medical job in a specific context. Therefore, clerkships should give students the opportunity to explore whether they experience a match in terms of their value profile. In future selection procedures in a specific hospital department, this match could play a role. To illustrate, it may well be that the work–life balance values of a medical student are more fitting for one hospital department than for another. Focusing on relationals, we therefore propose that:

  • 제안 6.
  • (a) 여러 설정(다양한 병원, 저자원 및 고자원 위치 등)에 걸친 임상실습은 의대생에게 한 편으로는 [De Clercq 등의 업무 관련 가치 모델과 직무/과제 해석 측면에서 그들의 가치] 사이에서 적합도를 경험할 기회를 주고,   
    다른 한편으로 [다른 설정을 특징짓는 값과 직무/과제 해석]사이에서 적합도를 경험할 기회를 줘야 한다.
  • (b) 가치 적합도와 공유 직무 해석 적합도는 특정 병원 환경에 대한 (자체) 선택에 영향을 미칠 수 있다.
  • Proposition 6.
  • (a) Clerkships across several settings (different hospitals, locations with low- and high resources, etc.) should provide medical students the opportunity to experience the degree of fit between
    • their values in terms of De Clercq et al.'s work-related values model and their job/task interpretation on the one hand, and
    • the values and job/task interpretations that characterise different settings on the other hand.
  • (b) The degree of value-fit and shared job-interpretation fit might inform (self-)selection for specific hospital settings.

이를 위해 의대생들은 임상연수를 진행하면서 [스스로 평가한 가치관][직무해석 프로필]을 개발해야 한다고 생각한다. 게다가, 우리는 그들이 특정 임상실습을 할 를 때, 그들이 그러한 환경에서 편안함을 느낄 수 있는지 여부를 성찰할 수 있도록 [[그들의 가치]와 [직무 해석] 사이의 [적합성 정도]]와, [그 특정한 맥락에 특징적인 가치와 직업 해석]에 대해 숙고할 것을 조언한다.
To this end, we think that medical students should develop their own self-assessed values and job interpretation profile39 while they conduct their clinical training. Furthermore, while they follow a particular clerkship, we advise that they reflect upon the degree of fit between their values and job interpretation, and the values and job interpretations that are characteristic for that specific context, to be able to reflect whether they would be able to feel at home in such an environment.

[관계성]과 관련된 중요한 이슈는, 의대생의 '적합fit' 척도가 [학생과 특정 병원 단위의 문화적 맥락 사이의 일치]를 포함하는지 여부이다. 이 적합성은 학생이 특정 감독자, 동료 팀 또는 성별, 생활 방식 또는 언어의 측면에서 [특정 인구학적 동질성 또는 이질성]을 갖는 '케미'를 의미할 수 있다. 우리는 (팀 및 병원 환경에 대한 학생의 적합도의 등급을 포함한) 관계성 표본을 다른 의료 작업(상황, 전문 분야, 병원)에 대해 일반화하는 것은 특히 위험하며, 지나친 단순화이기에 시도해서는 안 되는 것이라고 믿는다. 그 이유는 그러한 평점은 [주어진 작업 상황]에 대해서 [매우 맥락적이고 독특할 것]이기 때문이다.

An important issue connected to relationals is whether a measure of a medical student's ‘fit’ includes a match between a student and the cultural context of a specific hospital unit. This fit may refer to the student's chemistry with a specific supervisor, the team of colleagues34 or with a certain demographic homogeneity or heterogeneity in terms of gender, lifestyle or language.34 We believe that generalisation from samples of relationals, including ratings of the student's fit with the team and the hospital climate, to other medical work (contexts, specialisms, hospitals) to be particularly perilous, an oversimplification that should not be attempted. The reason for this is that such ratings will be too contextualised and unique for the work situation in which they were given.

이러한 평정 요소의 전형적인 예는 [호감]이다. 심리학에서의 대인 인식 연구는 [호감]이 소위 [관계 효과]의 영향을 강하게 받는, 타인에 대한 얼마나 근본적인 판단fundamental judgement인지를 명확하게 보여준다. [이 효과는 [특정 평가자]과 [특정 피평가자]의 조합에 고유]하므로, 정의에 따라 특정 개인의 특정 기준 밖에서는 관련이 없다. 특정 병원 단위의 등급을 일반화할 때 잠재적으로 복잡한 또 다른 요인은 [신뢰]의 관계이다. Jones와 Shah41 그리고 Campagna42 (Kenny40에서 인용된 바와 같이)에 의한 연구에서, [더 오랜 시간 동안 함께 일한 사람]들의 경우, 평가자의 신뢰도 등급의 변동의 큰 부분은 관계 변동에 기인할 수 있는 것으로 보인다. 다시 말해, 신뢰는 평가자와 피평가자의 Dyad에게 고유합니다. 따라서 특정 병원 단위에서 상당 기간 일자리 제의를 받아들일 때가 되어야만 해당 단위에만 고유한 관계가 관련성을 갖게 된다. 이러한 사고방식에 따라, 우리는 다음을 제안한다.

A classic example of such a rating component is liking. Interpersonal perception research from within psychology40 clearly shows how liking is a fundamental judgement made about others which is strongly influenced by the so-called relationship effect. This effect is unique to the combination of a specific rater and a specific ratee and therefore, per definition, is not relevant outside that particular dyad of individuals. Another potentially complicating factor in generalising ratings from a specific hospital unit is the relational of Trust. From studies by Jones and Shah41 and Campagna42 (as cited in Kenny40), it appears that for people who have worked together for longer periods of time, a large part of the variance in ratings of ratee's trustworthiness could be attributed to relationship variance. In other words, trust is unique to the dyad of the rater and the ratee. Therefore, only when it is time to accept a job offer at a particular hospital unit for a considerable period of time will relationals, which are unique to that unit, become relevant. Following this line of thinking, we propose the following:

  • 제안 7. 
  • (a) 임상실습 기간 중, 평가자는 [관계 효과와 관련된 요소(예: 호감, 신뢰 및 케미)]에 대한 등급을 부여하지 않아야 하며, [가치적합 및 직무 해석적합 평가]를 하지 않아야 한다.
  • (b) 그러나 이러한 [관계 효과]는 의과대학 졸업생이 [구직 신청을 하는 시점]에서는 관련성이 매우 높아진다.
  • Proposition 7.
  • (a) During clerkships, raters should refrain from giving ratings which include elements associated with the relationship effect (e.g., liking, trust and chemistry) and from value-fit and job interpretation fit evaluations.
  • (b) Such relationship effects, however, become highly relevant at the point in time when the medical graduate applies for a job.

따라서 임상실습 자격 동안 평정을 할 때, 평가자는 [전문 역량에 대한 등급에 영향을 미칠 수 있는 관련 없는 요인(예: 호감 및 내그룹 선호도)]을 인지하도록 훈련해야 한다.

When providing ratings during clerkships, therefore raters need to be trained to become aware of nonrelevant factors that may influence their ratings of professional competences (e.g., liking and in-group favouritism43).

7 Smith의 세 가지 범주 통합
7 INTEGRATING SMITH'S THREE CATEGORIES

본 논문은 의사로서 일하기 위해 필요한 세 가지 다른 범주의 특성이 구분될 수 있다는 주장으로 시작했다.

  • [보편성]은 모든 직업과 따라서 의사를 위한 것이다.
  • [직업성]은 모든 의사 직무에는 필요하나, 다른 직무에는 필요하지 않은 특성을 가리키며, 의사의 하위 집단에만 관련된 [특성의 하위 집합]을 포함한다.
  • [관계성]은 특정 상황에서 효과적인 수행을 가능하게 하는 특성을 가리킨다. 따라서 효과적인지 여부는 특정 조직에 따라 달라진다. 10

보편성에서, 직업성, 그리고 관계성으로 올수록, characteristics는 더 맥락 의존적이 된다. 이것은 능력에 대한 주장을 일반화하기 위해 [임상실습 자격 동안 등급의 샘플을 사용하는 것]이, 보편성universals들에게는 가장 쉽지만, 관계성relationals에 대해서는 주장된 귀납(또는 일반화를 자제)가 필요하다는 것을 의미한다.
This paper started off by arguing that three different categories of characteristics required to work as a doctor can be distinguished.

  • Universals hold for all jobs and therefore also for medical doctors;
  • occupationals refer to characteristics required for all medical, but not other, jobs and include a subset of characteristics that are relevant only to subpopulations of medical doctors;
  • relationals, in contrast, refer to characteristics that enable effective performance in particular settings, and which therefore are effective or not dependent on the specific organisation.10 

Moving from universals to occupationals to relationals, the characteristics become more context dependent. This means that using samples of ratings during clerkships to generalise to claims about competence will be easiest for universals, but will require argued induction—or refraining from generalisation—for relationals.

한 가지 주제인 정서affect는 이 모형을 사용하여 분류하기 어려운 상태로 남아 있습니다. 언뜻 보면, affect-relevant 상황은 관계적으로 보일 수 있다.

  • 예를 들어, 주어진 환경이 [작업 과부하 대 최적 작업량], [목표 파괴적 사건 대 중단 없는 목표 달성], 그리고 [권위주의적 대 개방적인 분위기]에 대해서 어떻게 특징지어지는가?
  • 에이전트성이 높은 학생(성취 지향)의 경우 특정 병원 풍토가 높은 모호성, 통제력 상실 및 업무 완료 장애로 특징지어지는지, 그리고 이러한 문제에 대처할 수 있는지 여부를 아는 것이 중요하다.
  • 이와 유사하게, 교감 지향성이 높은 학생들은 의사소통의 갈등과 환자와의 상호작용의 문제에 대해 특정 병원 문화가 어떻게 평가되는지, 그리고 그들이 그러한 문제에 대처할 수 있는지 알아야 한다.

One topic, affect,44 remains hard to categorise using this model. At first sight, affect-relevant situations may appear to be relationals.

  • For instance, to what extent is an environment characterised by work overload versus an optimal work volume, by goal disruptive events versus uninterrupted goal attainment, and by an authoritarian versus an open climate?
  • For students who are highly agentic (achievement oriented), it is important to be knowledgeable of whether a specific hospital climate is characterised by high ambiguity, loss of control and obstacles in completing their work tasks and whether they are able to cope with such issues.
  • Similarly, students who are highly communion oriented need to know how a particular hospital culture rates on issues of conflict in communication and problems in interactions with patients, and whether they can cope with such issues.

그러나, 우리가 보기에, 이러한 상황에 대한 정서적 반응affective reactions모든 의료 직업에 걸쳐 나타나는 특성일 가능성이 있는지, 특정 전문 분야 간에 차이가 있는지, 또는 특정 병원 부서 내의 분위기에 특이적인 것인지의 여부는 현 시점에서 반드시 명확하지 않다. 일단, 우리는 이러한 업무 특성을 교육생의 영향에 대한 보편적인 주장을 이끌어내기보다는 입사 지원 시 평가해야 할 [관계]로 취급할 것을 제안한다.

However, to our view, it is not necessarily clear at this point whether affective reactions to such situations44 are likely to be characteristics displayed across all medical occupations, differ between certain medical specialties, or are specific to the climate within a certain hospital department. For now, we suggest treating these work characteristics as relationals to be assessed during job applications rather than drawing universal claims about trainees' affect.


Smith10은 다른 맥락, 즉 인사 선택에 대해 일련의 선발 조치의 [예측 타당성predictive validity]이란 [척도에 의해 적용되는 특성 영역]과 [측정되는 도메인]의 함수라고 제안했다. 이를 위해 그는 대수 공식을 개발했다. 수정된 공식 버전은 우리의 목적, 즉 임상 훈련 중 학생들의 성과 평가에 대한 생각을 안내하는 데 사용될 수 있다. 이 개념에 따라, 우리는 다음과 같이 이 공식의 수정을 도출했다.

For a different context, namely, personnel selection, Smith10 proposed that the predictive validity of a set of selection measures is a function of the domain of characteristics covered by the measures and the accuracy with which the domain is measured. To this end, he developed an algebraic formula. A modified version of the formula can be used for our purposes, namely, to guide thinking about performance appraisal of students during clinical training. In line with this notion, we derived a modification of this formula, as follows.

대수적으로 의대생 보편성(U), 직업성(O) 및 관계성(R) 평가의 품질은 다음과 같이 설명할 수 있다. 이러한 역량의 평가의 관측 품질(QAC)은 세 도메인(U, O, R) 각각에 각각의 가중치(W;importance), 표본 추출 품질(S), 평가의 상호 주관성(I)을 곱한 함수이다. 이 공식에서, [W는 결정과 관련하여 도메인의 상대적 중요성]을 의미하지만, [S와 I는 측정의 정확성(즉, 데이터의 품질)의 특징]입니다. 즉, 수집된 데이터 포인트(예: 관찰 및 등급)의 샘플(S)이 도메인 내의 역량을 커버할 만큼 충분히 크고 대표적이며, 가능한 한 효과적으로 수행되었는지 여부(I)를 반영한다(예: 정보에 정통하고 경험이 풍부한 관찰자 대 직관적이고 순진하게 판단). 우리는 [상호 주관성]이 관심 의료 역량에 대해 더 현실적이라는 사실을 고려할 때 스미스의 "평가의 객관성(O)"을 대체하기 위해 상호 주관성을 사용했다. 이 공식에서 우리는 일반적 직업성(Og)과 특이적 직업성(Os)을 구분한다.

Algebraically, the quality of the assessment of medical students' universals (U), occupationals (O) and relationals (R) can be described as follows: the observed quality of the assessment of these competencies (QAC) is a function of the extent to which it measures each of the three domains (U, O and R) multiplied by their respective weight (W; importance), the sampling quality (S) and the intersubjectivity of the assessment (I). In this formula, W refers to the relative importance of the domain in relation to the decision to be made, whereas S and I are features of the accuracy of measurement (i.e., quality of the data). That is, they reflect whether the sample (S) of collected data points (e.g., observations and ratings) is large and representative enough to cover the competencies within the domain and whether or not that has been done as effectively as possible (I) (e.g., using informed and experienced observers vs. intuitive and naïve judgement). We used intersubjectivity to replace Smith's “objectivity (O) of assessment” given the fact that intersubjectivity is more realistic for the medical competencies of interest. In the formula, we distinguish between generic occupationals (Og) and specific occupationals (Os).

 

 

이 공식은 교육 프로그램 관리가 궁극적으로 책임지는 학생들의 평가의 질을 정당화하는 데 사용될 수 있다. 이는 U, O 및 R 역량에 부여된 중요성을 명시적으로 설명하고 사전 결정된 척도(예를 들어 -5[매우 나쁜 샘플링/상호 주관성]에서 +5[우수한 샘플링/상호 주관성]까지의 척도로)에서 평가의 샘플링 및 상호 주관성을 방어함으로써 수행된다(표 1).
This formula can be used to justify the quality of the assessment of students for which the educational programme management ultimately is responsible. This is done by explicitly explaining the importance given to the U, O and R competencies, and by defending the quality of sampling and intersubjectivity of the assessments on a predetermined scale (for instance on a scale from −5 [very bad sampling/intersubjectivity] to +5 [excellent sampling/intersubjectivity]) (Table 1).

아래 통합표(표 2)는 보편성, 직업성, 관계성을 평가하는 방법에 대한 개요를 제공합니다. 또한 각 역량 영역과 몇 가지 평가 권고사항에 대해 관련 일반성 문제를 어떻게 다룰 수 있는지 설명한다. 우리는 [보편성 범주](신뢰하게 측정된다면, 그리고 상대적으로 강력한 예측 타당성 계수를 가진다면)가 의료 분야의 선택과 평가에서 상대적으로 큰 비중을 가질 필요가 있다고 주장한다. 보편성에 초점을 맞추는 것은 우리가 집중하고 있는 임상 훈련의 의대생 모집단의 경우와 마찬가지로 '배치에 대한 결정이 지연될 가능성이 있을 때' 중요하다. [보편성]은 또한 "급속한 변화가 예상되는" 조건에서도 매우 적합하며, 10은 기술 및 과학 발전의 효과가 주어진 의료 전문가에게 특징적이지만 또한 한 국가 내의 의료 시스템에 대한 정부의 간섭 가능성을 감안한다. 어떤 곳에서는, 상당한 수의 의학 졸업생들이 의사 이외의 직업을 찾는다(예: 약학 및 정책 자문 45). 따라서 이런 경우, 정의상 [보편성]의 상대적 중요성이 강조된다. 물론, 모든 졸업생들의 절대 다수가 의사로서 직업을 찾는 것을 고려할 때, 우리의 관점에서도 [일반적 직업성]은 필수적이지만, 앞에서 주장했듯이, 관계성은 임상 훈련 동안 가중치가 낮아야 한다.
The below integrative table (Table 2) offers an overview of how, to our view, universals, occupationals and relationals can be assessed. It also illustrates how relevant generalisability issues can be dealt with for each competency domain, and several assessment recommendations. We maintain that the category of universals—if reliably measured and when having a relatively strong predictive validity coefficient—needs to have a comparatively heavy weight in selection and assessment for the medical profession. Focusing on universals is important when ‘decisions about placement are likely to be delayed’ (Smith10, 18), as is the case for the population of medical students in clinical training we are focusing on. Universals also are highly appropriate in ‘“turbulent” … conditions where rapid change is anticipated’,10 which is characteristic for the medical profession given effects of technological and scientific developments but also given the potential of governmental interference in the medical systems within a country. In some places, a substantial minority of medical graduates find jobs other than medical doctor (e.g., in pharmacy and policy adviserships45), training for which by definition highlights the relative importance of universals. Naturally, generic occupationals to our view are essential as well, given that the vast majority of all graduates find a job as medical doctor,45 whereas as argued before, relationals, in contrast, should receive a low weight during clinical training.



의대생들의 평가와 (자기-)선발 문제를 더 넓게 보고 그들의 미래 직업 성공을 예측하면, 많은 다른 요소들이 작용하게 될 것이다. 이러한 요소들 중에는 평가가 (법적으로) 모든 이해당사자에 의해 공정하고 적절하다고 보는지, 비용이 많이 들지 않지만 실용적인지, 그리고 학생들의 졸업이 기대되는 부분이 무엇인지 등이 있습니다. 이러한 요소들은 본 논문의 범위를 벗어나기 때문에 여기서 간단히 언급될 뿐입니다. 우리는 심리학 영역에서 나온 [스미스의 타당성 모델]이 의학생의 전문적인 기술 평가의 관련성relevance과 일반화가능성generalizability에 대한 질문을 프레임하는 새로운 방법을 형성한다고 믿는다. 제시된 제안은 실증적 연구에서 시험할 필요가 있을 것이지만, 우리는 그것들이 의과대학이 편의 표본에서 평가가 이루어지는 목적에 따라 안내되는 보다 목적 있는 표본으로 이동할 수 있도록 하는 유용한 출발점을 제공할 것으로 기대한다. 또한 이 세 가지 범주의 각 품질을 어떤 상황에서 어떻게, 얼마나 자주, 측정해야 하는지에 대한 의사결정을 지원해야 한다. 다시 말해서, 의학 졸업생들이 원하는 각각의 자질에 대한 숙달 정보를 제공하는 가장 적절한 데이터 출처는 무엇인가?

Taking a broader view on the issue of assessment and (self-)selection of medical students and predicting their future job success, many other factors will come into play. Among these are whether the assessments are seen as (legally) fair and appropriate by all stakeholders,14, 21 not too costly but practical, and what portion of students can be expected to graduate.47 These factors are only briefly mentioned here as they are beyond the scope of the present paper. We believe Smith's validity model, which emanated from the domain of psychology, forms a novel way to frame questions of the relevance and generalisability of professional skills assessment of students in medicine. The propositions put forward will need to be put to the test in empirical studies, but we expect them to provide a useful starting point to enable medical schools to move from convenience samples towards more purposeful samples guided by the purpose for which the assessments are being made. They should further help make decisions about how, how often and under which circumstances each of the qualities in these three categories has to be measured. In other words, what are the most appropriate sources of data to inform mastery of each of the desired qualities for medical graduates?

8 결론
8 CONCLUSION

보편성, 직업성 및 관계성으로 구성된 스미스의 프레임워크에서 추출하고 샘플과 부호의 구별을 사용하여, 우리는 (a) 임상실습 근무 중 평가 목적으로 샘플링하는 문제와 (b) 신호Signs에 대한 일반화가능성 문제에 대한 역량 영역 분할의 의미를 간략히 설명했다. 의과대학에서 표본 추출의 초점은 [일반적 직업성]을 평가하는 데 맞춰져야 한다. 그러나, 우리는 [특이적 직업성]일반적 직업성을 측정을 도울 수 있으며, 의대생들에게는 그들이 특정한 적성을 가지고 있는 미래의 직업 환경에 대해 정보를 주는 것에 도움이 될 수 있다고 추측한다. 학생들은 [특정 의료 환경에 대한 자신의 적합성을 자가 진단]하기 위해 관계성을 사용하는 것이 좋습니다. 보편성, 직업성 및 관계성에 대한 스미스의 공식을 채택하여 교육자가 의대생 평가의 질을 개념화할 수 있도록 지원한다.

Drawing from Smith's framework of universals, occupationals and relationals, and using the distinction between samples and signs, we outlined the implications of a division of competency domains for (a) issues of sampling for assessment purposes during clerkships, and (b) generalisability to signs. The focus of sampling in medical schools should be on assessing generic occupationals. However, we suspect that specific occupationals can help to measure generic occupationals and to inform medical students on future work contexts for which they have a particular aptitude. Students are advised to use relationals to self-assess their fit with specific medical settings. An adaptation of Smith's formula for universals, occupationals and relationals is provided to assist educators to conceptualise the quality of assessment of medical students.

 


Med Educ. 2022 Jan;56(1):117-126. doi: 10.1111/medu.14669. Epub 2021 Oct 5.

Inferring signs from purposeful samples: The role of context in competency assessment

Affiliations collapse

Affiliations

1Department of Psychology, Erasmus University Rotterdam, Rotterdam, The Netherlands.

2Optentia and Faculty of Economic and Management Sciences, North-West University, Vanderbijlpark, South Africa.

3Institute of Medical Education Research Rotterdam, Erasmus MC, Rotterdam, The Netherlands.

PMID: 34558107

DOI: 10.1111/medu.14669

Abstract

Context: Medical students' clinical competencies are customarily assessed using convenience samples of performance from real practice. The question is how these convenience samples can be turned into purposeful samples to extrapolate students' overall competency profile at the end of medical school, particularly given the context specificity of clinical performance. In this paper, we will address this issue of inferring signs from samples using insights from the discipline of psychology.

Theoretical perspective: We adapted Smith's theory of predictor validity of universals, occupationals and relationals to the context of clinical competency assessment. Universals are characteristics required by all working individuals and therefore not context dependent. Occupationals refer to characteristics required by certain jobs but not others and therefore are dependent on task-related features of an occupation. Relationals are required in a specific organisational context with habitual ways of working together.

Application: Through seven propositions, we assert that generalising from samples of assessed clinical competencies during clerkships to generic competencies (i.e., signs) is dependent on whether characteristics are universals, occupationals and relationals, with universals most and relationals least generalisable.

Conclusion: When determining what types of ratings to use to evaluate medical student competence, medical education has shown too little nuance in considering the degree to which particular characteristics are likely to be generalisable, approaching the issue in an all-or-none manner. Smith's distinction between universals, occupationals and relationals offers a promising way forward that has implications for assessment, student selection and career choice.

집단적 자기치유와 흔적: 군집지능은 어떻게 팀적응에 대해서 다르게 생각할 수 있게 해줄까? (Med Educ, 2020)
On collective self-healing and traces: How can swarm intelligence help us think differently about team adaptation?
Sayra M. Cristancho

 

1 소개
1 INTRODUCTION

가장 성공적인 팀은 변화에 원활하게 적응하는 팀이다. 이들은 끊임없이 변화하는 직무 환경에서 상충하는 목표와 요구를 탐색하는 동시에 시간 제약 증가, 리소스 감소 및 팀원 로테이션의 영향과 싸웁니다. 이것은 만성 질환의 만연, 흐릿한 진료 범위, 전문가 간 역학 및 임상 작업의 분산적 특성을 감안할 때 오늘날의 의료 팀이 직면하고 있는 현실이다. 이러한 특징들은 팀들이 공통의 방향을 찾는 것을 어렵게 만들 수 있는데, 특히 팀이 [항상 명확한 리더십을 가지고 있거나] [서로의 역할을 항상 완전히 이해하는 것]이 가능하다는 가정과 같은 전통적인 사고 방식에 너무 집착하는 경우 더욱 그렇다.

The most successful teams are those that seamlessly adapt to change. They navigate competing goals and demands within constantly changing workplace environments, all while battling the effects of increased time constraints, fewer resources and rotating team members.1 This is the reality that today's health care teams face given the prevalence of chronic conditions, blurred scopes of practice, interprofessional dynamics and the distributed nature of clinical work.2, 3 These features can make it challenging for teams to find common direction, particularly if teams remain too attached to traditional ways of thinking, such as the assumption that it is possible to always have clear leadership or to always fully understand each other's roles.4

효과적인 적응을 위해서는, 특히 고부담 환경(행동팀action team)에서 팀 구성원은 [진정한 집단 행동]이 목표라면 [개인적 아젠다] 추구를 포기해야 할 수 있다. 자연은 사회적 곤충, 어류, 조류 군락에서 볼 수 있는 놀라운 [집단 행동]의 예를 포함하고 있다. 생물학 문헌에서는 이러한 집단 행동을 '군집 지능Swarm Intelligence'이라고 한다. 비의료 산업은 기업 및 팀이 변화에 적응할 때 집단 행동에 참여하는 것을 돕기 위해 군집 지능의 원리를 활용하기 시작하고 있다. 그러나 군집 지능은 보건의료 팀 문헌에서 아직 명시적으로 고려되지 않았다. 따라서 본 논문에서, 저는 군집지능이 어떻게 건강관리 팀워크, 특히 팀 적응을 위해 고군분투하는 것을 알려줄 수 있는지 묻습니다. 이 개념적 탐구에서, 저는 집단 지성과 인간 팀워크에 대한 새로운 문학 단체를 끌어내어 어떻게 행동해야 할지에 대한 템플릿이나 모델을 만드는 것이 아니라, 우리 분야가 여전히 직면하고 있는 팀워크에 대한 뿌리 깊은 도전들에 대해 다르게 생각하도록 영감을 줍니다.

To adapt effectively, members of teams, especially in high-stakes settings (a.k.a action teams), might need to surrender the pursuit of their individual agendas if truly collective behaviour is the goal.1 Nature contains striking examples of collective behaviour as seen in social insects, fish and bird colonies. In the biology literature, this collective behaviour is known as Swarm Intelligence.5 Non-health care industries are beginning to draw on principles of swarm intelligence to help companies and teams engage in collective behaviour when adapting to change.6, 7 Swarm intelligence, however, has not been yet explicitly considered in the health care team literature. In this paper, I therefore ask, how can Swarm Intelligence inform our grappling with health care teamwork, in particular around team adaptation? In this conceptual exploration, I draw on the emerging body of literature on swarm intelligence and human teamwork not to craft a template or a model of how to behave, but rather for inspiration to think differently about some of the ingrained challenges around teamwork that our field is still encountering.

2 팀 적응에 대해 알고 있는 것은?
2 WHAT DO WE KNOW ABOUT TEAM ADAPTATION?

[팀 적응Team adaptation]은 도전을 성공적으로 헤쳐나가는 개인의 능력이다. 팀 적응에 대한 개념적이고 경험적인 연구가 풍부하다. 개념적 연구는 사용 가능한 개념적 프레임워크가 많아 더욱 두드러지지만, 점차 경험적 연구가 대두되고 있다. 특히, 핵심 개념 프레임워크는 세 가지 특정 영역에 대한 연구 노력을 안내했다.

  • 팀의 적응 능력, 
  • 실제 적응 과정
  • 팀 기능에 미치는 결과

Team adaptation is the ability of a group of individuals to successfully navigate challenges.8 There is a wealth of conceptual and empirical research on team adaptation. While the former is more prominent with a plethora of conceptual frameworks available,9, 10 empirical studies are emerging. In particular, key conceptual frameworks have guided research efforts around three specific areas:

  • the team's capacity to adapt,11 
  • the actual process of adaptation12 and
  • the consequences on the team's functioning.13 

이러한 [팀 적응]의 영역은 현재 저의 연구 관심사인 [액션 팀action teams]을 포함한 다양한 유형의 팀에서 탐색되고 있습니다. [액션팀]은 '긴급하고 매우 중요한 임무를 가진, 때때로 예측할 수 없는 상황에서, 즉흥성과 적응이 필요한 이벤트에 협력하는, 고도로 숙련된 전문가 팀'으로 특징지어진다. 팀 조정Team coordination, 리더십 및 신뢰는 액션팀의 영역에서 지속적으로 탐구되는 팀 적응의 차원 중 하나입니다.

  • 예를 들어, 군에서의 연구는 팀 리더가 진정한 것authentic으로 간주될 때, 그러한 리더의 행동은 팀 행동과 생산성에 긍정적인 영향을 미친다는 것을 입증했다.
  • 마찬가지로, 트라우마의 맥락에서, 리더 역할의 신속하고 반복적인 위임은 팀의 신뢰할 수 있는 수행 능력을 향상시키는 동시에 초보 팀 구성원의 기술을 구축하는 것으로 입증되었다.

한편, [암묵적인 조정implicit coordination(즉, 서로 직접 의사소통할 필요 없이 다른 팀 구성원의 요구를 예측하고 조정할 수 있는 능력)]이 과거에는 [액션팀에서 잠재적으로 문제가 있는 것]으로 제안된 반면, SWAT, 항해, 극지 탐험 팀들 간의 최근의 연구는 특정 비일상적인 임무들이 실제로 [암묵적인 조정]으로부터 이익을 얻는다는 것을 보여주기 시작하고 있다. 

These areas of team adaptation are being explored in various types of teams, including action teams—my current research interest. Action teams are characterised as, ‘highly skilled specialist teams cooperating in events that require improvisation and adaptation in sometimes unpredictable circumstances with urgent, highly consequential tasks’.1 Team coordination, leadership and trust are among those dimensions of team adaptation consistently explored in the realm of action teams.

  • For instance, research in the military has demonstrated that when team leaders are regarded as authentic, such individual behaviour positively influenced team behaviour and productivity.1415 
  • Similarly, in the context of trauma, a rapid and repeated delegation of the leadership role proved to enhance a team's ability to perform reliably while also building their novice team members’ skills.1 

And while implicit coordination (ie the ability to anticipate and adjust to other team members’ needs without having to communicate directly with each other) has been suggested as potentially problematic in action teams, recent research in the context of SWAT, sailing, polar expeditions teams among others is beginning to show that certain non-routine tasks actually benefit from it.16, 17

3 우리가 뭘 놓쳤지?
3 WHAT ARE WE MISSING?

현재 누락된 것은 팀 적응에 대한 [전체론적인 시각]이다. 기존 작업은 팀 적응의 요소를 서로 격리하여 탐색합니다. 우리는 [조각이 어떻게 서로 잘 맞는지]를 더 잘 이해할 필요가 있습니다.
What's missing is a holistic view of team adaptation. Existing work explores elements of team adaptation in isolation of one another; we need to better understand how the pieces fit together.

예를 들어, [팀 적응의 여러 차원(예: 리더십 대 조정) 사이의 관계]에 대한 질문은 거의 주목을 받지 못했다. 이 격차를 메우기 위해서는 현상에 대한 시스템적 관점을 취하는 대안적인 접근법이 필요할 것이다. 즉, 문제를 부품으로 분할한 다음 각 부품을 개별적으로 고정하기보다는, 부분parts과 환경 간의 상호 연결에 초점을 맞추어야 합니다. 이러한 적응에 대한 체계적 관점의 가장 좋은 예들 중 일부는 자연에서 발견된다. 침입자가 개미 군집의 일을 방해할 때, 한 마리의 개미의 행동을 관찰하는 것은 무슨 일이 일어나고 있는지를 밝히는 데 실패한다. 오히려, 우리는 식민지의 회복 노력을 목격하기 위해 [그들 모두를 함께 볼 필요]가 있다. 마찬가지로, 새떼의 경우, 서로의 위치와 속도에 대한 작은 조정으로 양떼가 매우 효율적인 조정된 패턴으로 함께 날 수 있게 해줍니다. 이러한 집단 행동은 집단 지능 분야의 기초를 형성한다. 

For instance, questions around the relationships among multiple dimensions of team adaptation (eg leadership vs coordination) have received little attention.3,8,18,19 Filling this gap will require alternative approaches that take on a systemic view of the phenomenon. That is, rather than fragmenting a problem into parts and then fixing each part separately, the focus should be upon the interconnections between the parts and their environment.20 Some of the best examples of this systemic view of adaptation are found in nature. When an intruder disrupts the work of an ant colony, looking at the behaviour of one single ant fails to reveal what's going on. Rather, we need to look at all of them together to witness the colony's recovery effort. Similarly, in a flock of birds, it is the little adjustments to each other's position and speed that allow the flock to fly together in very efficient coordinated patterns. These collective behaviours form the basis of the field of Swarm Intelligence.21,22

[군집 지능]의 관점에서, 문제에 대한 해결책은 군집 구성원들의 개별적 행동이 아니라, [집단 행동의 결과]이다. 집단행동은 네 가지 주요 원칙을 통해 달성된다.

  • 첫 번째 원칙은 [의사소통]입니다. 군집은 직간접적인 의사소통을 모두 사용한다. 인간이 언어를 사용하는 동안, 직접적인 의사소통을 위해, 떼는 촉각(개미의 경우 더듬이의 촉각)을 사용한다. 간접적인 의사소통의 경우, 인간은 신체 언어와 몸짓을 선호하지만, 무리들은 다른 사람들의 행동을 유도하기 위해 환경에 '흔적'을 남기는 것에 의존한다. 예를 들어, 만약 더 많은 개미들이 먹이를 주울 필요가 있다면, 먹이를 찾는 것을 책임지는 첫 번째 그룹은 다른 개미들이 먹이를 얻기 위해 어디로 가야 하는지를 알기 위해 사용하는 일종의 페로몬을 땅에 남겨둔다. 페로몬이 이 사건의 흔적입니다.
  • 이러한 형태의 의사소통은 군집 지능의 두 번째 원칙을 촉진한다. [인식], 즉 지역 환경에 적응하는 집단의 능력입니다. 일단 그 무리들이 자신이 처한 환경을 알아내면, 자기 결정이라고 불리는 세 번째 원칙이 일을 수행하는 데 사용됩니다.
  • [자기 결정]이란 각 개인이 특정 업무를 수행하는 동안 시스템의 잠재적 손상에도 주의를 기울이고, 경직된 위계질서나 중앙 통제를 고수하지 않고도, 필요에 따라 한 업무에서 다른 업무로 변경할 수 있다는 것을 의미한다. 이를 종합하면, [의사소통, 인식 및 자기 결정]은 군집 지능의 [가장 중요한 특징]을 실현한다. 그것은 군집 구성원들이 [상호 교환]할 수 있는 능력으로, 현재 한 작업을 수행하는 개인이 다른 작업을 수행하는 다른 개인을 대체할 수 있다.
  • 이러한 방식으로 집단은 네 번째 원칙인 [집단적 자기 치유] 행동을 보여주는데, 집단적 자기 치유 행동은 집단에게 실패에 대처하고 환경의 변화에 적응할 수 있는 능력을 제공한다.

From a swarm intelligence perspective, a solution to a problem emerges as the result of the collective action of the members of the swarm, not individual action. Collective action is achieved via four key principles.5, 23-25 

  • The first principle is Communication. Swarms use both direct and indirect communication. For direct communication, while humans use language, swarms use touch (eg the touch of the antennae in the case of ants). For indirect communication, while humans favour body language and gestures, swarms rely on leaving ‘traces’ in the environment to drive the behaviour of others. For instance, if more ants are needed to pick up food, the first group responsible for finding food leave a type of pheromones on the ground that other ants use to know where to go to get the food. Pheromones are the traces in this case.
  • These forms of communication facilitate the second principle of swarm intelligence: Awareness, which is the ability of the collective to remain attuned to its local surroundings.
  • Once the swarm figures out the environment it is in, the third principle called Self-determination is used to perform work. Self-determination means that while each individual is working on a particular task, they also attend to potential damage to the system and are able to change from one task to another as necessary without having to adhere to rigid hierarchies or central control. Taken together, communication, awareness and self-determination realise the most important feature of swarm intelligence. That is the ability of swarm members to be interchangeable, so that an individual currently performing one task can replace another individual performing another task.
  • In this way, the collective exhibits the fourth principle: Collective self-healing behaviour, which provides the swarm with the ability to cope with failure and to adapt to changes in the environment.

 

4 적응력이 뛰어난 의료팀을 어떻게 개발할 수 있는가?
4 HOW CAN WE DEVELOP HIGHLY ADAPTABLE HEALTH CARE TEAMS?

다른 산업 분야에서는, 인간이 개별적으로 똑똑할지라도, 집합적으로 우리는 개미, 벌, 물고기 군집처럼 효과적이지 않다는 것을 깨닫기 시작하고 있다. 이러한 패러다임의 변화는 이러한 산업들이 팀워크를 바라보는 [전통적인 기계적인 방식]이 그들에게 생존할 수 있는 전략적 이점을 제공하지 못한다는 것을 인식하면서 시작되었다. 사회적 곤충들이 집단적 수준에서 성공하는 방식에 영감을 받아, 그들은 대신 팀을 [초유기체]로 생각하는 쪽으로 방향을 틀었다. 초유기체(超有機體, )는 [동물의 사회적 단위]로, 분업이 전문화되어 있으며, 개인이 집단 없이는 오랜 시간 동안 스스로 생존할 수 없는 것을 말한다. 개미, 벌, 물고기 군집, 그리고 인간 사회는 모두 자연에 있는 초유기체의 예이다.
Other industries are beginning to realise that even though humans are smart individually, collectively we are not as effective as ants, bees and fish colonies.7 This paradigm shift began when those industries26, 27 recognised that traditional mechanistic ways of looking at teamwork were not giving them the strategic advantage to survive. Inspired by the ways social insects succeed at the collective level, they turned instead to thinking about teams as super-organisms. A super-organism is a social unit of animals, where division of labour is specialised and where individuals are not able to survive by themselves for extended periods of time but need the collective.7, 24 Ants, bees, fish colonies and human societies are all examples of super-organisms in nature.

인류의 급진적인 발전은 우리가 소리, 몸짓, 의식, 언어까지 '마커'를 사용하여 [소속belonging이라는 신호]를 보내기 시작했을 때 일어났다. 그 특징은 우리가 집단으로 [사회적으로 조직]될 수 있게 해주었고, 그것은 우리에게 [종족으로서 생존에 전략적인 이점]을 주었다. 이 특징을 공유하는 유일한 다른 동물 종은 사회적 곤충입니다. 사회적 곤충들은 5억년 동안 모든 종류의 변화를 통해 적응해 왔습니다. 그들은 기회를 이용하여 집단적으로 적응할 수 있는 타고난 능력을 통해 장애를 극복하고 탄력성을 유지함으로써 그들의 식민지를 이끈다. 팀 적응에 대한 우리의 사고에 영감을 주기 위해, 나머지 논문에서, 나는 군집 지능의 두 가지 원칙, 즉 추적 기반 커뮤니케이션과 집단적 자가 치유에 대해 확장해 나갈 것이다.

Humanity's radical breakthrough happened when we began signalling belonging through the use of ‘markers’ such as sounds, gestures, rituals, all the way to language. That feature allowed us to socially organise in groups, which has given us a survival strategic advantage as a species. The only other animal species that share this characteristic are social insects.21 Social insects have been adapting for 500 million years, through all kinds of change. They lead their colonies by capitalising on opportunity, riding out disturbance and staying resilient through their natural ability to collectively adapt. To provide some inspiration for our thinking around team adaptation, in the rest of the paper, I will expand on two principles of swarm intelligence: trace-based communication and collective self-healing.

4.1 추적 기반 통신은 집합적으로 적응하는 능력에 역할을 한다.
4.1 Trace-based communication plays a role in the ability to collectively adapt

우리는 [명확하고, 노골적explicit이며, 언어적인 의사소통이 효과적인 팀워크의 중요한 지표]라는 것을 알고 있습니다. 따라서, 의료 제공자의 교육은 [간접적인 의사소통이 수반하는 오해의 가능성] 때문에 [직접적인 언어 소통을 우선시]하는 경향이 있다. 그러나 [간접적인 의사소통이 대부분 문제라는 가정]은, 특히 우리가 지금까지 가지고 있는 것보다 더 넓은 의미에서 간접적인 의사소통을 생각할 때 재검토될 필요가 있다. 그리고 제 주장은 직접적인 의사소통을 없애자는 것이 아닙니다. 사회적 곤충이 인간보다 더 목적적으로 사용하는 추적 기반 의사소통 등 우리가 알아야 할 만큼 의식하지 못했던 대체 형태의 소통의 공간을 만드는 것이다.
We know that clear, explicit, verbal communication is an important marker of effective teamwork. Hence, the training of health care providers tends to prioritise direct verbal communication because of the potential for misinterpretation that indirect communication carries.28, 29 However, the assumption that indirect communication is mostly problematic needs to be revisited, in particular when we think of indirect communication in a broader sense than what we have so far. And my argument is not to get rid of direct communication. It is about making room for alternative forms of communication that we have not been as aware of as we should, such as trace-based communication, that social insects use more purposefully than humans.30

우리는 간접적인 의사소통이 보건의료에서 항상 문제가 되는 것은 아니라는 것을 안다. 연구는 [보디 랭귀지와 제스처]가 의미 있고 목적적인 방법으로 사용될 수 있다는 것을 보여주었습니다. 예를 들어, 팀의 흐름을 보존하면서 지도자의 관심을 끌기 위해서입니다. 군집 지능은 [흔적trace 기반 의사소통]이 간접 통신의 유용한 형태라는 것을 우리에게 가르쳐 준다. [흔적-기반 커뮤니케이션]은 다른 개미들이 페로몬을 사용하여 다른 개미들이 먹이를 찾는 곳을 안내하는 것과 같이 다른 개체들이 행동을 조정하도록 유도하기 위해 물체를 남기거나 환경을 수정하는 것에 의존한다. 인간에서, 간단한 예는 누군가 다른 사람(보통 배우자나 아이들)이 청소를 하도록 부엌 싱크대에 접시를 놓고 갈 때일 것이다. 그들이 그것을 하느냐 안 하느냐는 그들에게 달려 있지만, 요점은 메시지가 의도적으로 전달되었다는 것이다. 우리가 의식적으로 이러한 형태의 간접 커뮤니케이션을 수용하지 않는 것처럼 보이기 때문에, 나의 연구팀은 의료 전문가[저널 동료 검토에 따른 원고]의 추적 사용을 탐구했다. 비록 이러한 형태의 행동을 지칭하는 특정한 용어를 가지고 있지는 않지만, [타인과 소통하기 위해 흔적을 사용한다는 생각]은 이미 익숙하다는 것을 발견했다.

  • 예를 들어, 신생아 중환자실의 간호사들은 퇴원 과정 중에 신생아 전문의들이 일을 빨리 하도록 유도하기 위해 항상 침대 옆에 안검경(흔적)을 남겨둔다는 것을 발견했습니다. 퇴원할 때 아기의 눈을 확인하는 것은 흔한 습관이다.
  • 다른 경우에는 임상의가 팀 위계질서를 파괴하지 않고 급박한 상황에서 기동을 추구하거나 중지할 필요성을 팀장에게 전달하기 위해 특정 도구(예: 초음파)를 배치하거나 다른 도구(예: 주사기)를 제거했다.

전공이 무엇이든, 의료팀 구성원들은 서로 의사 소통하기 위해, [흔히 사용되지만 완전히 의식적이지는 않은 다양한 흔적]을 식별할 수 있었다.

We know that indirect communication is not always problematic in health care. Research has shown that body language and gestures can be used in meaningful and purposeful ways, for instance to attract a leader's attention while preserving team's flow.31 Swarm intelligence teaches us that trace-based communication is a useful form of indirect communication. Trace-based communication relies on leaving objects or making modifications to an environment to prompt other individuals to adjust their behaviour, such as ants using pheromones to guide other ants where to find food. In humans, a simple example would be when someone leaves dishes in the kitchen sink for another person (usually the spouse or the children) to clean. Whether they do it or not is up to them, but the point is that a message was delivered intentionally. Since we do not seem to consciously embrace this form of indirect communication, my research team explored the use of traces by health care professionals [manuscript under journal peer-review]. We found that while health care team members did not have a specific term for this practice, the idea of using traces for communicating with others was already familiar.

  • For instance, we found that nurses in the neonatology intensive care unit consistently leave an ophthalmoscope (a trace) by the bedside to prompt neonatologists to speed things up during the discharge process—checking the baby's eyes is a common practice upon discharge.
  • In other cases, clinicians placed certain tools (eg an ultrasound) or removed others (eg syringes) to communicate to the team leader the need to pursue or stop a manoeuvre during an acute situation without breaking the team hierarchy.

Regardless of the speciality, health care team members were able to identify a variety of traces commonly used, but likely not fully consciously, to communicate with each other.

이 경험적 탐구를 통해, 우리는 인간 사회 환경에서 [흔적을 구성하는 것]에 대한 정의를 제공하고, 의료 제공자들이 추적을 사용하도록 유도한 의도를 강조했으며, 흔적이 발견되어 커뮤니케이션을 생산적으로 향상시킨 상황의 종류를 식별했다. 우리는 [흔적]을 '다른 팀원의 행동을 촉구하기 위해 환경을 의도적으로 그리고 전략적으로 변조하는 데 사용되는 객체(표시, 신호)로 정의했다.

  • 인간이 아닌 유기체와 달리 인간은 흔적을 다른 방식으로 해석할 수 있으며, 따라서 추적은 의도된 행동을 촉진하거나 촉진하지 못할 수 있으며, 여러 가지 영향을 미칠 수 있다.
  • [흔적 반응trace response]은 생물학적인 것이 아니라 사회적인 것이며, 따라서 시간, 공간, 대인 관계에 의해 영향을 받는다.
  • 흔적은 시간, 공간 및 대인 관계에 의해 맥락에 묶여있어서, 짧은 시간만 유지되지만short-lived, 흔적-기반 의사소통은 팀이 변화하는 환경에 적응하는 데 도움을 준다는 점이 생산적이었다.

Through this empirical exploration, we offered a definition of what constitutes a trace in a human social environment, highlighted the intentions that prompted health care providers to use traces and identified the kinds of situations where traces were found to productively enhance communication. We defined a trace as ‘an object (mark, signal) that is intentionally and strategically used to modulate an environment in order to prompt action by another team member.

  • Unlike non-human organisms, humans can interpret traces in different ways, such that the trace may succeed or fail to prompt the intended action, and may have multiple effects.
  • A trace response is social, not biological, and is therefore influenced by time, space and interpersonal relations’.
  • While these traces were contextually bound by time, space and interpersonal relationships, which can make them short-lived, trace-based communication was nonetheless productive in helping a team adapt to changing circumstances.

의료 전문가들은 대체로 흔적 기반 의사소통의 꾸준한 사용을 기억하는 듯 보인다. '흔적'이 익숙함에도 불구하고, 그들은 그것에 대해 말하는 것을 불편해하여, '간접적으로 우리를 곤경에 빠뜨릴 가능성이 가장 높다'는 가정이 여전히 건강관리 문화에 뿌리박혀 있음을 보여준다. 집단 지성은 우리가 그러한 가정을 해체하는 데 도움이 될 수 있다.

Overall health care professionals seem able to recall industrious uses of trace-based communication. Despite their familiarity with traces, they were uncomfortable talking about it, indicating that the assumption that ‘indirect is most likely to get us into trouble’ is still ingrained in the culture of health care. Swarm intelligence might help us to dismantle such an assumption.

4.2 팀 적응을 활용한 집단적 자가 치유
4.2 Collective self-healing leverages team adaptation

[집단적 자가치유(collective self-healing)]는 군집 구성원이 상호교환interchangeable할 수 있도록 함으로써, 군집이 실패에 대처하고 변화에 적응하는 능력이다. 집단적 자가치유라는 개념은 [집단을 최전선]에 두고, 개인을 뒤로 밀어낸다. 곤충에서 집단적 자가치유는 자연스러운 능력이다. 왜냐하면 매우 하나의 개체는 원시적이기 때문이다. 인지능력이 없으며, 조직체계는 생물학적이며, 사회적이지 않기 때문이다. 개미들은 집단으로서 군체의 진행을 방해할 자유 의지나 의사결정 능력을 가지고 있지 않다. 하지만 인간은 그러합니다. 이것은 인간에서 [집단적인 자가치유]에 대한 어려워지는 이유이다. 인간 팀에서의 집단적 자가치유는 자연적인 특성이 아니다; 그것은 육성되고 개발되어야 한다.

Collective self-healing is the ability of the swarm to cope with failure and adapt to changes by permitting swarm members to be interchangeable. The concept of collective self-healing places the collective at the forefront and pushes the individual to the background. In insects, collective self-healing is a natural ability because individually, they are very primitive; they do not have cognitive capacity, and their organisational system is biological, not social. Ants do not have free will or decision-making capacity to disrupt the proceedings of the colony as a collective. But humans do, which creates challenges for collective self-healing. Collective self-healing in human teams is not a natural trait; it must be nurtured and developed.

지금까지, 그들의 팀에서 집단적 자가치유의 힘을 이용할 수 있는 분야는 거의 없었다. Sea, Air and Land(SEAL) 팀과의 연구는 분산된 리더십, 이전 경험, 팀 구성원 간의 신뢰, 적절한 위험 감수 및 혁신을 장려하는 관대한 문화 등 [적응력이 높은 팀]의 4가지 핵심 요소를 확인했습니다. 특히, SEAL 팀은 [분산된 리더십]을 활용하여 비인간 초유기체가 하는 것과 동일한 방식으로 집단적 자가 치유 능력을 가진 팀에게 부여한다. 

To date, few industries so far have been able to harness the power of collective self-healing in their teams. Research with Sea, Air and Land (SEAL) teams has identified four key elements of highly adaptable teams:

  • distributed leadership,
  • previous experience,
  • trust between team members and
  • a permissive culture that encourages appropriate risk-taking and innovation.32 

In particular, SEAL teams capitalise on distributed leadership to bestow teams with the capacity for collective self-healing in the same way as non-human super-organisms do.

중요한 것은, 초유기체super-organism 사회에서의 리더십은 전통적인 인간 팀과는 매우 다르게 보인다는 것이다. 예를 들어, 개미 군집에서는 외부 노동자의 30%가 세 개미의 하위 팀으로 조직될 때 '리드'한다. 리더 한 명과 전문가 두 명입니다. 각 하위 팀의 리더는 다른 두 팀의 작업을 안내하기 위해 큰 그림에 대한 정보를 수집하는 것을 책임진다. 그리고 그 반대로, 두 전문가는 지도자에게 지역 정보를 제공하여 그들의 지도자가 다른 지도자들과 소통할 수 있도록 하여 집단적인 수준에서 큰 그림을 유지한다. 이와 같이, 사회 곤충 사회의 지도자들은 명령과 통제를 하지 않는다. 그들은 글로벌 패턴을 찾고, 그들에게 목소리를 부여하고, 모듈러 팀을 구성해서 전체적으로 기능하도록 합니다. SEAL 팀은 이 전략을 성공적으로 채택하여 가장 가치 있는 지식, 경험 또는 이점을 가진 사람에게 권한을 이양할 수 있도록 했습니다. 

Importantly, leadership in super-organism societies looks quite different from traditional human teams. For instance, in ant colonies, 30% of outside workers ‘lead’ as the colony arranges itself in sub-teams of three ants: one leader and two specialists. The leader in each sub-team is in charge of gathering information about the big picture to guide the work of the other two. And vice versa, the two specialists provide local information to the leader so that their leader can communicate with other leaders to maintain the big picture at the level of the collective.7 As such, leaders in social insect societies do not command and control; they look for global patterns, give voice to them and knit their modular teams into functioning as a whole. SEAL teams have successfully adopted this strategy to allow authority to shift to whoever has the most valuable knowledge, experience or vantage point.32

최근 한 연구에서, 우리는 [분산된 리더십]이 팀 구성원을 [테스크 스와핑swapping tasks] 형태의 집단적 자가치유를 가능하게 하는 동일한 기술을 훈련시킴으로써 육성될 수 있다는 것을 발견했다.

  • 경찰 기동대 팀에서는 브라보 1, 브라보 2 그리고 브라보 3과 같이 [구성원들이 숫자로 식별되는 집단적 자가치유]를 볼 수 있다. 그래서, 만약 어떤 것이 브라보 2를 무력화시킨다면, 그 팀은 전체의 안전을 보장하기 위해 다른 팀원이 그 사람의 역할을 맡도록 해야 한다는 것을 안다.
  • 일부 병원 밖 팀에서도 유사한 패턴이 보인다는 것을 발견했다. 예를 들어, 병원 전 소생팀에서는 가능한 사람(구급병, 소방서, 경찰, 방관자 또는 학생)과 팀을 구성하여 리더 역할을 교환하는 형태의 집단적 자가치유가 이루어질 수 있다.

In recent explorations with my research team, we have found that distributed leadership can be fostered by training team members in the same skills which allows for collective self-healing in the form of swapping tasks [manuscript in preparation].

  • Collective self-healing is visible in police SWAT teams, where members are identified by numbers, like Bravo 1, Bravo 2 and Bravo 3, where Bravo 1 is the main leader. So, if something incapacitates Bravo 2, the team knows that they have to make sure another team member takes on that person's role to ensure safety of the whole.
  • We have found that similar patterns are visible in some out-of-hospital teams. For instance, in pre-hospital resuscitation teams where teams are made up with whoever is available (paramedics, fire department, police, bystanders or students), collective self-healing in the form of swapping of the leadership role can take place.

집단적 자가 치유 가능성에도 불구하고, 우리는 [엄격한 위계적 구조]가 [위기 상황에서 서로 교환interchangeable할 수 있는 팀의 능력을 탈선시킬 수 있다는 것]을 관찰하고 있다. 부분적으로는, 제 생각에, 그것은 사회적 행위자성social agency을 집행하는 인간의 능력과 관련이 있으며, 이는 곤충에는 없는 능력이다. 비록 군집 지능이 [사회적 행위자성 문제]를 명시적으로 다루지 않지만, 집단적 자가 치유 원리는 다른 인간 산업에서 입증되었듯이 매우 관련성이 있다. 사실, 그것은 우리에게 건강 관리 팀의 특수성에 특유한 방식으로 그것을 발전시킬 기회를 줍니다.

Notwithstanding the potential for collective self-healing, we are also observing that rigid hierarchies can derail a team's ability to be interchangeable in a time of crisis. In part, I speculate, it has to do with the capacity of humans to enact social agency—a capacity that does not exist in insects. Even though swarm intelligence does not explicitly deal with issues of social agency, the principle of collective self-healing remains highly relevant, as demonstrated by other human industries. In fact, it gives us the opportunity to advance it in a way that is unique to the particularities of health care teams.

5 의료에 대한 함의
5 IMPLICATIONS FOR HEALTH CARE

적응력이 높은 팀은 [위계 구조나 엄격한 역할 할당]보다, [효과적이고 적시의 작업 완료]를 우선시합니다. 의료 서비스 외부의 팀은 군집 지능의 원리를 활용하여 복잡한 문제를 집단적으로 적응하고 해결하는 팀의 능력을 향상시키고 있습니다. 저는 건강관리에 종사하는 사람들이 집단지성으로부터 영감을 얻어 끊임없이 변화하는 직장 환경을 탐색할 수 있는 팀을 어떻게 준비할지에 대해 다르게 생각할 수 있다고 믿습니다.

Highly adaptable teams prioritise effective and timely task completion over hierarchal structure and rigid role assignment. Teams outside health care are capitalising on principles of swarm intelligence to enhance their teams’ ability to collectively adapt and solve complex problems. I believe that we in health care can draw inspiration from swarm intelligence to think differently about how we prepare teams to navigate constantly changing workplace environments.

5.1 군집 지능은 우리에게 간접적인 의사소통을 위한 언어를 제공한다.
5.1 Swarm intelligence gives us language for indirect communication

의료 분야에서, 우리는 팀워크에서 명확하고 직접적인 의사소통을 촉진하는 방향으로 전진해 왔습니다. 이러한 진전의 부산물로서, 우리는 간접적인 의사소통과 효과적인 의료 팀에서의 그것의 위치를 강력하게 탐구하지 않았다. 결과적으로, 우리는 바디 랭귀지와 제스처를 뛰어넘는 간접적인 의사소통의 형태의 역할이나 목적을 아직 완전히 의심하지 않았다. 군집 지능은 우리에게 간접적 의사소통의 대안적 형태, 특히 [흔적 기반 의사소통]을 고려할 수 있는 언어를 제공한다.
In health care, we have made headway towards fostering clear, direct communication in teamwork (eg 33-35). As by-product of this progress, we have not robustly explored indirect communication and its place in effective health care teams. (eg 36, 37). Consequently, we have not yet fully interrogated the role or purpose of forms of indirect communication beyond body language and gestures. Swarm intelligence gives us language to consider alternative forms of indirect communication, in particular trace-based communication.

의료 팀 구성원은 훈련을 받고 직접 전달자가 되는 것을 선호하지만, 우리의 경험적 연구는 현재 [흔적]이 팀 커뮤니케이션에서 역할을 한다는 것을 보여준다. '흔적'이 간접적인 특성을 지니기 때문에, 우리가 흔적을 사용하는 것을 인정하는 것은 불편함을 야기할 수 있지만, 그것은 또한 특히 예기치 않은 상황에서 팀의 적응 능력을 향상시키는 데 있어 잠재적인 이익에 대한 풍부한 토론을 촉발시킬 수 있다. 예를 들어, '흔적'은 팀이 팀의 위계를 방해하거나 직접적으로 도전하지 않고 적응할 수 있는 방법이 될 수 있다. 생산적인 출발점은 디브리핑 대화에서 이 언어('흔적')를 점진적으로 도입하는 것일 수 있습니다. 팀은 구성원들에게 메시지를 전달하기 위해 '흔적'을 사용한 순간을 성찰하는 것을 고려할 수 있습니다. [흔적 기반 커뮤니케이션]을 이러한 대화의 표면으로 끌어내는 것은 팀이 의도성을 명확히 하고 상황적 과제에 대한 팀의 대응을 향상시킬 수 있는 행동 패턴을 발견하는 데 도움이 될 것이다.

While health care team members are trained and prefer to be direct communicators, our empirical research shows that traces currently play a role in team communication. Due to its indirect nature, acknowledging our use of traces may create discomfort, but it can also prompt rich discussions about its potential benefits for improving a team's ability to adapt, particularly in unexpected situations. For instance, traces might be a way for teams to adapt without disrupting or directly challenging the hierarchy of the team. A productive starting point may be to progressively introduce this language in debriefing conversations. A team might consider asking their members to reflect on moments in which they used a trace to convey a message. Bringing trace-based communication to the surface of those conversations will help teams clarify intentionality and uncover patterns of behaviour that may enhance a team's response to situational challenges. 

이를 통해 흔적 기반 통신을 성공적으로 통합한 다른 산업의 통찰력을 활용해야 합니다. 건설업계의 내부 벽을 쌓는 과정, 배치된 팀을 더 잘 훈련시키기 위해 매복작전에 대한 접근방식을 재설계하려는 군수업계의 노력, 예측과 의사결정을 최적화하기 위한 기술회사 유니콘 AI의 플랫폼 등이 대표적이다. 이러한 사례는 동일한 철학을 공유합니다.

  • 서로 직접 대화하지 않고도 개인은 작업 환경에 남겨진 흔적을 인식할 수 있고, 이것을 자신의 역할을 수행하는 데 사용할 수 있습니다. 예를 들어, 건물의 벽 프레임의 변화, 맞물림/사격/후퇴 패턴 또는 AI 플랫폼에 남겨진 개별 예측:

이러한 산업은 [흔적 기반 의사소통]을 심각하게 받아들이고, 그것이 얼마나 생산적이고 영향을 미칠 수 있는지를 인식하고 있습니다. 의료 팀의 고유한 복잡성을 감안할 때 흔적 기반 의사소통의 잠재적 힘을 활용하는 방법을 이해하기 위한 세심한 작업이 필요하다.

In so doing, we should draw on insights from other industries who have successfully integrated trace-based communication. Examples include the process of building interior walls in the construction industry,31 the military industry's effort to redesign their approach to ambush operations to better train deployed teams,27 or tech company Unanimous AI’s platform to optimise forecasts and decision making.38 These examples share the same philosophy:

  • without directly talking to each other, individuals become aware of traces left in their work environment—for instance, the changes in the wall frame of a building, the patterns of engage/shot/retreat or the individual forecasts left on the AI platform—and use them to carry out their part of the work.

These industries have taken trace-based communication seriously and recognise how productive and influential it can be. Given the unique complexities of health care teams, careful work is needed to understand how to harness the potential power of trace-based communication.

5.2 군집 지능은 팀워크를 강화하기 위해 집단적 자가 치유에 주의를 돌린다.
5.2 Swarm intelligence turns our attention to collective self-healing to enhance teamwork

의료 분야에서, 우리는 [팀이 예상치 못한 상황에 잘 적응할 수 있는 능력]을 개발할 수 있도록 어떻게 팀을 [상호 교환적으로 만들 수 있을 것인가]에 대한 문제와 씨름해 왔다. 군집 지능과 팀의 집단적 자가 치유 개념에서 얻은 통찰력은 우리가 아직 효과적으로 육성할 수 없는 팀 상호 교환성의 측면과 씨름할 수 있게 해줄 수 있다. 이것을 하기 위해서, 우리는 불편함에 앉아 보건의료 문화에 지속되어 온 오랜 믿음의 일부를 검토할 필요가 있다. 우리는 [위계 구조의 경직성]과 그것들이 [(위계의) 의도된 목적인 안전]에 진정으로 복무하고 있는지 다시 생각해 볼 필요가 있다. 특히, 우리는 작업 교환과 환자 안전에 대한 그것의 역할에 대한 우리의 믿음을 주의 깊게 검토할 필요가 있다.

In health care, we have struggled with the question of how to make teams interchangeable so that they develop a high capacity to adapt to unforeseen circumstances. Insights from swarm intelligence and the concept of collective self-healing in teams may enable us to grapple with aspects of team interchangeability that we have yet been unable to effectively foster. To do this, we need to sit in discomfort and examine some of the long-held beliefs that persist in the culture of health care. We may need to rethink the rigidity of our hierarchies and whether they are truly serving their intended purpose: safety. In particular, we need to carefully examine our beliefs around task swapping and its role in patient safety. 

과제 스와핑(특히 할당된 역할을 벗어난 경우)은 주로 안전을 위협하는 것으로 개념화되지만, 생산적이고 안전성을 촉진할 수 있는 경우가 있을 수 있다. 의료 및 기타 영역에서 안전은 정적이고 변하지 않는 실체가 아닙니다. 오히려, 의료 서비스 작업 과정에서 예기치 않은 도전을 포함하여 전개되는 사건들에 의해 형성됩니다. 안전성과 적응 사이의 관계는 확실히 맥락적이다. 예를 들어 [역할 교환]은 복잡도가 높은 작업에서 안전하지 않은 것으로 간주될 수 있지만, 복잡도가 낮은 작업이나 극한 상황에서는 선호될 수 있다. 즉, [안전성을 유지]하면서 [적응을 허용한다는 것]은 역설처럼 느껴진다. 세계가 코로나19 범유행과 싸우면서, 우리는 안전을 완전히 보장할 수 없다는 것을 받아들여야 하는 동시에 이동 중에 적응해야 한다.

While task swapping, particularly outside of assigned roles, is predominantly conceptualised as a safety threat, there may be instances where it can be both productive and safety promoting. Safety, in health care and other domains, is not a static, unchanging entity. Rather, it is shaped by the events that unfold—including unexpected challenges—in the course of the work of health care. And while the relationship between safety and adaptation is certainly contextual—for instance, swapping roles may deemed unsafe in high complexity tasks, it may be preferred in low complexity tasks or in extreme situations—maintaining safety and allowing adaptation for many, feels like a paradox. As the world fights the COVID-19 pandemic, we are forced to adapt on the go while having to accept that safety cannot be fully guaranteed.

이 역설은 거의 논의되지 않지만 문헌에서 새로운 것은 아니다. Aalmberti에 따르면, 다른 산업보다도 [의료 분야]에서는 [안전, 수행능력, 회복탄력성 사이에 트레이드 오프]가 있다. 그의 말에 따르면

  • '최고의 안전(부작용 발생률 낮음),
    높은 수행능력(긴 수명, 건강한 수명, 최고의 금전적 가치)과
    강한 회복탄력성(예상치 못한 상황에 대한 적응)은 잘 어울리지 않는다'

This paradox is not new in the literature, although it is rarely discussed. According to Amalberti, in health care more than in other industries, there is a trade-off between safety, performance and resilience. In his words,

  • ‘best safety (lower rate of adverse events),
    high performance (longer life, healthy life, best money value) and
    strong resilience (adaptation to the unexpected) do not go together very well’.39 

따라서, 이 세 가지를 모두 다 똑같이 달성하려는 목표는 실현 가능하지 않으며, 대신 '타협의 기술'을 적용할 필요가 있다. 그러므로 앞으로 나아가기 위해서, 우리는 적응을 위한 공간을 만들고자 하는 우리의 욕구와 안전을 위한 우리의 약속을 조화시키는 방법을 찾을 필요가 있을 것이다. 궁극적으로 적응은 안전을 강화한다. 여기서 군집 지능 유추는 영감을 줄 수 있습니다.

As such, aiming to achieve all three equally is not feasible; instead, we need to apply the ‘art of compromise’. To move forward, therefore, we might need to find ways to reconcile our desire to make space for adaptation with our commitment with safety. Ultimately, adaptation strengthens safety. Here is where the swarm intelligence analogy might become inspirational.

자연적으로 [집단적 자가치유]를 통해 집단에게 예상치 못한 위협에 무리들이 적응하는 동시에 개별 구성원들의 손실을 최소화할 수 있다. 사회적 곤충에서, 이것은 [분산된 리더쉽]에 의해 가능해진다. [분산형 리더십]은 특히 예상치 못한 상황에서 [위계가 팀의 행동을 형성하는 중요한 구조로 작동하는] 의료 서비스에 잘 들어맞지 않는다. 그러나 이러한 상황에서 팔로워쉽과 리더쉽은 특정 역할에 얽매이지 않고 행동(예: 주도적 수용, 상승 영향, 피드백 탐색 및 발언)과 관련이 있다는 사실도 알고 있다. [분산형 리더십]을 육성하려면 팀이 [공동의 목표를 달성하기 위해 협력할 수 있는 방식으로 리더십과 팔로워십의 행동을 배양]해야 한다. 이를 위해서는 상황의 요구에 따라 리더와 팔로워 행동을 교환할 수 있는 동적 구조가 필요하다. 분산형 리더십은 군에서 입증한 바와 같이, 그리고 의료 분야의 복잡성 학자들이 제안한 것처럼 팀별로 집단적 자가 치유 개발을 촉진한다. 

In nature, collective self-healing enables swarms to adapt to unexpected threats to the collective while minimising the number of individual members lost. In social insects, this is enabled by distributed leadership.7 Distributed leadership does not comfortably fit into health care, where hierarchies are important structures that shape the actions of teams, particularly during unexpected situations. However, we also know that during these situations, followership and leadership are not tied to specific roles but to behaviours (eg initiative taking, upward influence, feedback seeking and speaking up).40, 41 Fostering distributed leadership would require us to cultivate the behaviours of leadership and followership in a way that enables teams to work together to achieve a common goal. This requires a dynamic structure that allows for the swapping of leader and follower behaviours as per the demands of the situation. Distributed leadership nurtures the development of collective self-healing in teams, as demonstrated by the military,37 and as suggested by complexity scholars in health care.42

5.3 군집 지능은 사각지대가 없는 것이 아니다.
5.3 Swarm intelligence does not come without blind spots

집단 지성이 우리에게 팀에 집단적 자가치유를 주입하는 가능성을 받아들이도록 유혹하는 반면, 우리는 인간 본성의 독특성에 대해 비판적으로 반성해야 한다. 인간과 달리, 사회적 곤충들은 자율성, 권력, 그리고 에이전시의 문제와 씨름할 필요가 없다. 인간의 특징이 팀의 집단적 자가 치유 발전에 어떤 영향을 미치는지 이해하기 위해서는 사려 깊은 작업이 필요하다.
While swarm intelligence entices us to embrace the possibility of instilling collective self-healing in teams, we must critically reflect on the uniqueness of human nature. Unlike humans, social insects do not have to grapple with issues of autonomy, power and agency. Thoughtful work is needed to understand how human features impact the development of collective self-healing in teams.

인간 본성은 군집 지능의 원리의 통합에 도전장을 내밀지만, 다른 산업들은 우리에게 그것이 가능하면서도 성과가 있다는 것을 보여주었다. 보건의료와 마찬가지로 군military도 위계질서를 강하게 중시한다. 특정 맥락에서는 위계질서의 한계가 있음을 인식한 군military은 [군집 지능 원리를 통합]한 [팀에 대한 대안적 사고 방식]을 기꺼이 채택해 왔다. 이러한 노력이 도전이 없었던 것은 아니며, 군 당국은 모든 시나리오에서 효과가 있는 것은 아니라는 것을 인정했다. 군집지능은 Navy SEAL과 같은 [배치된 팀]에게 효과적인 조직 및 의사결정 전략이지만, [공동 운영 계획 프로세스]에는 적합하지 않았다. 이 경우에는, [경직된 위계질서에 의해 부여된 권력과 기관]이 정보를 안내하고, 분석을 수행하고, 직원 기능을 집중하고, 조직 목표를 향한 종속적 활동을 지시하는 것을 촉진한다.

While human nature poses a challenge to the integration of the principles of swarm intelligence, other industries have shown us that it is both possible and fruitful. Like health care, the military strongly values hierarchy. Recognising the limits of hierarchy in certain contexts, the military has been willing to adopt alternative ways of thinking about teams by incorporating swarm intelligence principles. This endeavour has not been without challenges and the military has acknowledged that it is not effective in all scenarios. While swarm intelligence has been an effective organisational and decision-making strategy for deployed teams such as the navy SEALs who must perform in remote places, it is not well suited for joint operational planning processes where the power and agency ascribed by rigid hierarchies facilitate guiding information, conducting analysis, focusing staff functions and directing subordinate activities towards the organisational objectives.27 

[군집지능] 원리를 군사산업으로 발전시키는 연구자들은, 군집지능이 이득이 되는 상황과 장소를 분별하기 위한 신중하고 지속적인 성찰적 실천을 요구한다. 보건의료에서, 우리는 군집 지능의 맹점을 보완하는 동시에 군집 지능의 장점을 증가시키기 위해 다른 이론과 관련된 강력한 인식론적 대화로부터 이익을 얻을 수 있다. 예를 들어, 우리는 집단 행동을 형성할 때 개개인성individuality(즉, 자율성, 창의성 및 행위자성)의 역할을 고려할 필요가 있다. 따라서, 우리는 팀의 집단적 자가치유를 독특하게 특징짓는 상호의존성에 대한 추가적인 견인력을 얻기 위해 무엇보다도 [심리적 안전, 관계적 행위자성, 이질적 체계heterarchy]로 눈을 돌릴 필요가 있을 수 있다. 

Researchers advancing swarm intelligence principles into the military industry call for caution and continuous reflective practice to discern the venues where swarm intelligence makes more good than harm.43 In health care, we might benefit from a robust epistemological conversation that entails engaging with other theories to augment the advantages of swarm intelligence while supplementing for its blind spots. For instance, we need to consider the role of individuality (ie autonomy, creativity and agency) as it shapes collective behaviour.44 Therefore, we might need to turn to psychological safety,45 relational agency46 or heterarchy,47, 48 among others, to gain additional traction on the interdependencies that uniquely characterise collective self-healing in teams.

팀워크에 대한 수십 년간의 연구는 [상호 교환성]과 [집단적 자가 치유]에 관한 문제에 있어서 바늘을 그리 많이 움직이지 않았다. 그러나 이러한 기능이 팀 적응력의 핵심입니다. 군집 지능은 우리에게 내재된 가정에 도전하는 불편함에 직면하도록 유도하기 때문에 유용한 비유와 건설적인 언어를 제공한다. 그리고 나는 우리가 지금까지 했던 모든 것을 버리고 개미처럼 행동해야 한다고 말하는 것이 아니다. 제 목표는 우리가 가능한 것과 그렇지 않은 것에 대해 말할 수 있도록 다른 사고방식에 대한 인식을 심어주는 것입니다. 따라서, 저는 이 대화가 우리를 어디로 데려갈지 기대합니다.

Decades of research on teamwork has not moved the needle very much on issues of interchangeability and collective self-healing. Yet these features are central to team adaptability. Swarm intelligence offers a helpful analogy—and a constructive language—precisely because it invites us to confront the discomfort of challenging ingrained assumptions. And I am not saying that we should abandon everything we have done so far and start behaving like ants. My goal is to bring awareness to a different way of thinking to help us talk about what's possible and what's not. As such, I look forward to where this conversation might take us.

 


Med Educ. 2021 Apr;55(4):441-447. doi: 10.1111/medu.14358. Epub 2020 Sep 8.

On collective self-healing and traces: How can swarm intelligence help us think differently about team adaptation?

Affiliations collapse

Affiliation

1Department of Surgery, Faculty of Education, Centre for Education Research & Innovation, Schulich School of Medicine & Dentistry, University of Western Ontario, London, ON, Canada.

PMID: 32815185

DOI: 10.1111/medu.14358

Abstract

Background: Health care teams are increasingly forced to navigate complex challenges to achieve their collective aim of delivering high-quality, safe patient care. The teamwork literature has struggled to develop strategies that promote effective adaptive behaviours among health care teams. In part, this challenge stems from the fact that truly collective adaptive behaviour requires members of the teams to abandon the human urge to act self-sufficiently. Nature contains striking examples of collective behaviour as seen in social insects, fish and bird colonies. This collective behaviour is known as Swarm Intelligence (SI). SI remains poorly described in the health care team literature and its potential benefits hidden.

Objective: In this cross-cutting edge paper, I explore the principles of SI as they pertain to systemic or collective adaptation in human teams. In particular, I consider the principles of trace-based communication and collective self-healing and what they might offer to team adaptation researchers in medical education.

Results: From a SI perspective, a solution to a problem emerges as a result of the collective action of the members of the swarm, not the individual action. This collective action is achieved via four principles: direct and indirect communication, awareness, self-determination and collective self-healing. Among those principles, trace-based communication and collective self-healing have been purposefully used by other industries to foster team adaptation. Trace-based communication relies on leaving 'traces' in the environment to drive the behaviour of others. Collective self-healing is the ability of the swarm to cope with failure and adapt to changes by permitting swarm members to be interchangeable.

Conclusions: While allowing teams to rely on indirect communication and to be interchangeable might create discomfort to our ways of thinking, teams outside health care are demonstrating their value to advance human teamwork. SI offers a helpful analogy and a constructive language for thinking about team adaptation.

침묵 또는 질문? 학생-중심 교육에서 토론 행동의 문화간 차이(Studies in Higher Education, 2014)
Quiet or questioning? Students’ discussion behaviors in student-centered education across cultures
Janneke M. Frambacha*, Erik W. Driessena, Philip Behb and Cees P.M. van der Vleutena

 

 

서론
Introduction

많은 연구들이 커뮤니케이션 스타일이 문화적 맥락에 따라 다르다는 널리 알려진 개념을 확인했습니다. 이는 학생들이 또래 및 선생님과 소통하는 방식에도 적용됩니다. 최근, 종래의 교사 중심의 대처와는 본질적으로 다른, 학생 중심의 교육을 도입하는 고등 교육 기관의 수가 세계적으로 꾸준히 증가하고 있다. 학생중심교육은 교사의 가르침보다는 학생의 학습에 초점을 맞추는 것을 목표로 하고 있다(캐논과 뉴블 2000). 교육기관들이 이 접근방식을 수용하는 것은 부분적으로 학생들이 평생학습, 비판적 사고, 동기 부여 및 독립적인 문제 해결 기술을 자극하는 것으로 여겨지는 그들 자신의 학습을 하도록 장려하기 때문이다. 학생 중심 교육의 교육 도구 중 하나는 학생들이 학습 주제, 문제 사례 또는 프로젝트에 대한 비판적인 토론에 적극적으로 참여할 것으로 기대되는 소그룹 작업입니다. 토론에 적극적으로 참여하는 것은 학생들의 협업 능력, 독립성, 동기 부여 및 비판적 사고를 향상시키는 것을 전제로 한다.

Many studies have confirmed the widely acknowledged notion that communication styles differ across cultural contexts (e.g. Gudykunst 2005; Hu and Fan 2011; Smith 2011). This also applies, by implication, to the way students communicate with their peers and their teachers (Hofstede 1986). In recent years, there has been a steady increase in the number of higher education institutions worldwide that have introduced student-centered education, which is intrinsically different from traditional teacher-centered approaches. The former aims to focus on students' learning rather than on teachers' teaching (Cannon and Newble 2000). Institutions embrace this approach partly because it encourages students to take charge of their own learning, which is assumed to stimulate lifelong learning, critical thinking, motivation, and independent problem-solving skills (Barrows 1996; Cannon and Newble 2000; Lonka and Ahola 1995). One of the educational tools in student-centered education is small group work, where students are expected to actively engage in critical discussions about learning topics, problem cases, or projects. Active participation in discussions is assumed to enhance students' collaborative skills, independence, motivation, and critical thinking (Del Favero et al. 2007; Schmidt and Moust 1998).

몇몇 작가들은 이러한 유형의 [상호작용적이고 독립적인 행동]이 개인주의와 언어적 상호작용에 대한 집중과 같은 전형적인 서구적 가치를 반영한다고 주장해왔다. 다른 문화의 가치들은 학생 중심의 접근법에 존재하는 서양의 가치들과 양립할 수 없을 수도 있다. 이는 학생 중심의 교육에서 다른 문화권의 학생들의 의사소통 스타일이 어떻게 표현되고 형성되는지에 대한 질문으로 이어지며, 이는 학생 중심의 고등교육에서 과정과 결과의 문화 간 차이를 밝혀줄 수 있다(아마 의도하지 않을 수도 있다). 연구에 따르면 학생 중심 교육에서 대화형, 팀 기반 및 교사 독립적인 토론은 [서구 이외의 환경에서 학습 접근법 및 커뮤니케이션 스타일에 부합하지 않기 때문에] 긴장을 유발할 수 있다. 학생 중심 교육에서 학생들은 목소리를 높이고, 질문을 하고, 다른 사람들의 의견에 도전하는 등 다소 적극적인 행동을 보일 것으로 예상되며, 이에 대한 학생들의 반응은 문화마다 다를 수 있으며, 이로 인해 학습 과정과 결과가 다른 방식으로 형성될 수 있습니다.

Several authors have contended that this type of interactive and independent behavior reflects typically Western values, such as individualism and a focus on verbal interaction (Altinyelken 2010; Frambach et al. 2012; Nguyen et al. 2009). Values of other cultures may not be compatible with the Western values residing in the student-centered approach. This leads to the question as to how the communication styles of students from different cultures are expressed and shaped in discussions in student-centered education, which might shed light on – possibly unintended – cross-cultural differences in processes and outcomes in student-centered higher education. Research has indeed indicated that interactive, team-based and teacher-independent discussions in student-centered education can cause tensions due to their not being consistent with learning approaches and communication styles in non-Western settings (Frambach et al. 2012; Gwee 2008; Khoo 2003; Wang, Harding, and Mai 2012). In student-centered education, students are expected to show rather assertive behaviors – such as speaking up, asking questions, and challenging the opinions of others – and students' responses to this may vary between cultures thereby shaping learning processes and outcomes in different ways.

특히 동서양의 문화에서 커뮤니케이션 스타일의 문화적 차이는 광범위하게 연구되어 왔다. 동양 문화는 개인주의로 여겨지는 서양 문화와는 대조적으로 종종 집단주의로 특징지어진다. 집단주의는 개인보다는 집단에 관심을 갖는 것, 집단 구성원의 상호의존성, 집단 규범과 가치관에 의해 형성되는 행동들을 말한다. 그러나 동서양의 [지역 내 문화적 다양성]은 [지역 간 문화적 다양성]보다 클 수 있으며, 집단주의 또는 개인주의로 직설적으로 특징지을 수 없다는 점에 유의해야 한다. 그러나 기존연구는 동양 문화에서는 [개인주의 문화의 보다 대립적이고 직접적이며 거침없는 스타일]보다, [조화로운 그룹 관계, 갈등의 회피, 간접적인 의사소통을 선호하는 경향이 있는 집단주의적 의사소통 스타일]을 일반적으로 선호한다는 것을 보여주었다. 따라서 개인주의 서양문화와 집단주의 동양문화의 구분이 학생 중심의 교육 논의에서 학생들에 의해 입증되는 의사소통 행동에서 문화 간 차이로 이어질 가능성이 높다고 가정하는 것이 타당해 보인다.

Cross-cultural differences in communication styles have been extensively researched, particularly in Eastern and Western cultures (e.g. Brew et al. 2011; Smith 2011; Yeung and Kashima 2012). Eastern cultures are often characterized as collectivistic, in contrast to Western cultures, which are regarded as individualistic (Hofstede 2001; Triandis 1995). Collectivism refers to being concerned with the group rather than the individual, interdependence of group members, and behaviors that are shaped by group norms and values (Hui and Triandis 1986). It should be noted though that cultural diversity within Eastern and Western regions can be larger than across, and they cannot be characterized straightforwardly as either collectivistic or individualistic. Previous research has, however, shown a general preference of Eastern cultures for collectivistic communication styles, which tend to favor harmonious group relations, avoidance of conflict, and indirect communication as opposed to a more confrontational, direct, and outspoken style of individualistic cultures (Brew et al. 2011; Oetzel et al. 2001; Smith 2011). Consequently, it seems logical to assume that the distinction between individualistic Western cultures and collectivistic Eastern cultures is likely to lead to cross-cultural differences in communicative behaviors demonstrated by students in discussions in student-centered education.

이 사회문화 연구는 서로 다른 문화 지역에 있는 3개 고등교육 기관의 학생 중심 교육에서 학생들의 의사소통 행동 전개와 토론 과정을 조사함으로써 이러한 문화 간 차이의 존재와 성격을 확인하려고 시도했다. 동아시아, 중동, 서유럽. 이와 같이, 이 연구는, 학생 중심 교육에서, 커뮤니케이션 스타일의 크로스 컬쳐의 차이가 어떻게 표현되고 형성되는지, 그리고 이것이 고등 교육에서 학생 중심 방법의 크로스 컬쳐 적용성에 어떻게 영향을 미칠 수 있는지에 대한 통찰력을 제공하는 것을 목표로 하고 있다.

This sociocultural study attempted to identify the existence and nature of such cross-cultural differences by investigating the discussion process and the development of students' communicative behaviors in student-centered education in three institutions of higher education in different cultural regions: East Asia, the Middle East, and Western Europe. This way, the study aims to provide insight into how cross-cultural differences in communication styles are expressed and shaped in student-centered education, and how this may impact on the cross-cultural applicability of student-centered methods in higher education.

문제 기반 학습
The case of problem-based learning

문제 기반 학습(PBL)은 이 사례 연구의 대상으로 선정된 학생 중심의 교육 모델입니다. 원래 서양에서 개발된, 더 구체적으로 1960년대 캐나다의 의학 교육에서 개발된 PBL은 비록 그 효과는 논란의 여지가 있지만, 전 세계의 다른 분야와 국가로 퍼져나갔다. PBL은 교사 중심의 강의 기반 교육 접근과 달리 학생들이 자신의 학습 과정을 지시하고 적극적으로 지식을 구축하며 문제 해결 및 팀 커뮤니케이션 기술을 개발하도록 장려함으로써 교육 과정의 중심에 놓입니다. 튜토리얼은 PBL에서 중심적인 역할을 하며, 이 기간 동안 소수의 학생들이 지식 전달자가 아닌 퍼실리테이터 역할을 하는 튜터의 도움을 받아 문제 사례로 제시된 학습 문제를 공동으로 논의합니다(Barrows 1996).
Problem-based learning (PBL) is the student-centered educational model that was selected as the object of this case study. Originally developed in the West, more specifically in medical education in Canada in the 1960s, PBL has spread to different disciplines and countries around the world (Barrows 1996; Gwee 2008; Savin-Baden 2000), though its effect remains controversial (Dochy et al. 2003; Kirschner, Sweller, and Clark 2006; Schmidt et al. 2009). In contrast to teacher-centered, lecture-based educational approaches, PBL places students at the center of the educational process by encouraging them to direct their own learning processes, construct knowledge actively, and develop problem-solving and team communication skills (Dolmans et al. 2005; Visschers-Pleijers 2006). Tutorials take a central role in PBL, during which a small group of students collaboratively discusses a learning issue presented as a problem case, aided by a tutor who acts as a facilitator rather than a knowledge transmitter (Barrows 1996).

PBL이 전 세계에 퍼져있음에도 불구하고, PBL의 문화 간 적용가능성에 의문이 제기되어 왔다.

  • Walker, Bridges, Chan(1996)은 중국 내에서의 PBL의 구현에 대한 연구에서 문화적 긴장이 그룹 역학, 토론 과정 및 커뮤니케이션 문제에 영향을 미치고 있으며, 중국 학생들은 공손함, 화합, 일치의 강한 의식을 보이고 있으며, 토론에서 직접적으로 논쟁을 도입하는 것을 꺼린다는 것을 발견했다.
  • Khoo(2003)는 대립에 대한 두려움, 권위에 대한 의존과 존중, 거침없는 것에 대한 혐오, 질문하는 것을 꺼리고, 수업 토론에 대한 낮은 참여 등 PBL과 양립할 수 없는 여러 아시아 문화 태도를 묘사했다. 그러나 그는 또한 강한 자기 훈련과 학생들 간의 협업 등 PBL과 상당히 양립할 수 있는 측면을 식별했다.
  • 또, Hussain씨등(2007)은, 아시아의 3개 대학에서 PBL에 대해 긍정적인 반응을 보이고 있지만, 동시에, PBL 세션에서는, 학생이 비판적인 사고를 전개하는 것을 억제하고 있어, 대립하지 않는 태도로 일관하고 있다. 그러나 그들은 서양 대학에서도 비판적 사고를 달성하는 것이 학생들에게 어려울 수 있다고 강조한다(Hussain et al. 2007)

Despite PBL's spread around the world, its cross-cultural applicability has been questioned.

  • In a study of the implementation of PBL in a Chinese context, Walker, Bridges, and Chan (1996) found that cultural tensions affected group dynamics, the discussion process, and communication issues, with Chinese students showing a strong sense of politeness, harmony, and conformity as well as reluctance to directly introduce arguments in the discussion.
  • Khoo (2003) described several Asian cultural attitudes that might be incompatible with PBL, such as fear of confrontation, dependency on and respect for authority, a distaste for outspokenness, reluctance to ask questions, and low participation in class discussions. He also identified aspects, however, that seem quite compatible with PBL, such as strong self-discipline and collaboration among students.
  • Also Hussain and others (2007) report positive reactions to PBL in three Asian universities, but at the same time they show inhibitions to students' development of critical thinking during PBL sessions, due to a non-confrontational attitude. However, they emphasize that in Western universities too the achievement of critical thought might be difficult for students (Hussain et al. 2007).


비서구권 환경에서의 PBL의 실시에 관한 연구는 동아시아에서 실시되고 있지만, 중동에서 실시되고 있는 몇 안 되는 연구에서는 PBL에 관한 유사한 과제나 어려움이 이 지역에서 발생하고 있으며, 적어도 부분적으로 문화적 요인에 기인하고 있는 것으로 보인다. 이러한 고려사항을 바탕으로 PBL은 본 연구에서 검토해야 할 토론 기반, 학생 중심의 교육 모델로 선정되었습니다.

Although the majority of studies on the implementation of PBL in non-Western settings has been conducted in East Asia, the few studies that were conducted in the Middle East suggested that similar issues and difficulties with PBL are encountered in this region, and that these seem to be, at least partially, attributable to cultural factors (Bridger 2007; Frambach et al. 2012; Mpofu 1999; Yazigi, Nemr, and Abou Jaoude 2004). Based on these considerations, PBL was selected as the discussion-based, student-centered educational model to be examined in this study.

사회문화적 접근법
A sociocultural approach

서구와 비서구 환경에서 학생 중심 교육에 대한 경험적 비교 연구가 부족하기 때문에, 문화뿐만 아니라 교육 및 가능한 다른 요소들이 학생들의 토론 행동에 미치는 영향을 탐구하기 위해 [사회문화적 접근법]을 사용했다. [사회문화이론]은 러시아 학자들, 특히 비고츠키(1978)의 연구에 기초하고 있으며, 다른 학자들, 예를 들어 로고프(1993)와 엥게스트롬(1999)의 연구에 대해 자세히 설명하고 있다. [사회문화이론가]들은 개인은 본질적으로 환경에 의해 영향을 받거나 중재되며, 환경을 벗어나서는 이해될 수 없다고 강조한다. 개인은 자신의 사회적, 문화적, 맥락적 환경을 지속적으로 [내면화]하면서, 동시에 자신의 내적 가치와 신념을 [외부화]함으로써 주변 환경에 영향을 미칩니다. 이러한 사회문화적 관점은 다음과 같은 질문으로 이어졌다: 세 문화권의 학생들은 그들의 문화적 배경을 외부화하고 동시에 PBL의 토론 측면을 내부화하는 것, 그리고 이것이 그들의 토론 행동과 기술을 어떻게 형성하는가?
Because of the paucity of empirical comparative studies of student-centered education in Western and non-Western settings, a sociocultural approach was used to explore the impact not only of cultural but also of educational and possibly other factors on students' discussion behaviors. Sociocultural theory is based on the work of several Russian scholars, notably Vygotsky (1978), on which others have elaborated, e.g. Rogoff (1993) and Engeström (1999). Sociocultural theorists emphasize that individuals are inherently influenced, or mediated, by their environment and cannot be understood outside of it (Rogoff and Chavajay 1995; Vásquez 2006). Individuals continuously internalize their social, cultural, and contextual surroundings, while at the same time influencing their surroundings by externalizing their inner values and beliefs (Engeström and Miettinen 1999). This sociocultural perspective led to the following research question: to what extent do students across three cultures externalize their cultural backgrounds and simultaneously internalize the discussion aspect of PBL, and how does this shape their discussion behaviors and skills?

위에서 설명한 바와 같이, 사회문화적 접근방식은 PBL과 학생들의 문화적 배경 외에 학생들의 토론 행동을 중재할 수 있는 다른 요소들을 고려할 수 있다. 흥미롭게도, [서양에서의 PBL의 실시에 관한 연구]도 PBL 과정의 문제점, 특히 소그룹 논의의 피상적인 문제를 밝혀냈다. 제도적, 조직적, 교육적 측면과 같은 문화적 요소 외에 더 많은 맥락적 요소들이 역할을 할 수 있다. 탐구적이고 개방적인 사회문화적 관점을 채택함으로써, 본 연구는 맥락적 요소를 폭넓게 포괄하여 문화 전반에 걸친 학생 중심의 고등교육에서 학생들의 토론 행동과 기술을 형성하는 영향을 포괄적으로 파악하는 것을 목표로 했다. 문제 기반 학습에서 학생들의 행동과 발전을 연구하기 위해 사회문화 이론을 어떻게 사용할 수 있는지에 대한 보다 광범위한 논의는 Frambach et al. 2012를 참조한다.

As remarked above, a sociocultural approach allows for consideration of other factors – besides PBL and students' cultural backgrounds – which might mediate students' discussion behaviors. Interestingly, research on the implementation of PBL in the West has also revealed problems with the PBL process, notably superficiality of small group discussions (Moust, Van Berkel, and Schmidt 2005). More contextual factors besides cultural ones may play a role, such as institutional, organizational, and curricular aspects. By adopting an explorative and open sociocultural perspective, this study aimed for broad coverage of contextual factors to build a comprehensive picture of the influences shaping students' discussion behaviors and skills in student-centered higher education across cultures. For a more extensive discussion of how sociocultural theory can be used to study students' behavior and development in problem-based learning see Frambach et al. 2012.

방법
Method

방법론
Methodology

이 연구를 이끈 사회문화적 관점과 일관되게, 참가자들은 자연스러운 환경에서 조사되었다. [비교적, 도구적 사례 연구](Stake 2000)는 특정 이슈를 [문화적 및 맥락적 설정을 포괄하는 전체적 현상]으로 조사할 수 있게 하면서, 여러 사례를 비교하면 사례 간의 차이와 유사성에서 발생하는 통찰력을 제공할 수 있기 때문에 이러한 목적에 적합하다고 간주되었다.

Consistent with the sociocultural perspective that guided this study, the participants were investigated in their natural setting. A comparative, instrumental case study (Stake 2000) was deemed suitable for this purpose, because it enables investigation of an issue as a holistic phenomenon, encompassing its cultural and contextual setting, while comparison of multiple cases could provide insight arising from differences and similarities across cases.

설정
Setting

PBL은 의학 교육(원래 개발된 분야)에서 가장 널리 사용되고 있기 때문에 이 연구는 의과대학에서 실시되었습니다. 정보 비교를 가능하게 하기 위해 서로 다른 비서양 환경의 서양 의과대학 1개와 의과대학 2개를 포함하기로 결정했다. 후자의 선발을 위해 9명의 국제 의학 교육 전문가에게 다음 기준을 충족하는 의대를 제안하도록 요청되었다.

  • (1) 비서양 문화 환경에서의 위치 
  • (2) 학부 커리큘럼에서 실질적인 교육 방법으로서의 PBL 
  • (3) 5년 이상의 PBL 커리큘럼 경험 

As PBL is most widely used in medical education – the discipline where it was originally developed – the study was conducted in medical schools. To enable informative comparisons, it was decided to include a Western medical school and two medical schools in different non-Western settings. For selection of the latter, nine international medical education experts were asked to suggest medical schools that met the following criteria:

  • (1) location in a non-Western cultural setting;
  • (2) PBL as a substantial teaching method in the undergraduate curriculum;
  • (3) more than five years of experience with PBL in the curriculum.

22개의 제안 중 11개는 모든 기준을 충족했으며, 그 중에서 홍콩의 의과대학과 중동의 아랍 지역의 의과대학이 서로 다른 동양 문화 지역에서의 위치에 따라 선택되었다. 중동학교는 익명을 원했기 때문에 국가적인 위치는 밝혀지지 않았다. 중동 국가들이 공유하고 있지만 문화적인 특징도 분명히 다르기 때문에, 문화적인 요소들과 다른 맥락적 요소들에 대한 두터운 서술이 중동이라는 용어의 폭을 극복하기 위해 사용되었다. 네덜란드의 한 의대를 서양의 사례로 선정한 것은 실용적인 이유에 의한 것이지만, 그 학교는 선정 기준 2와 3을 충족시켰지만, 필연적으로 기준 1에 불합격했다. 이 연구는 홍콩과 중동 학교의 윤리 심사 위원회에서 승인되었지만 네덜란드 학교에서는 승인할 필요가 없었다.

Eleven of 22 suggestions met all criteria, from which a medical school in Hong Kong and a medical school in the Arab part of the Middle East were selected based on their locations in different Eastern cultural regions. Since the Middle Eastern school wished to remain anonymous, its national location is not revealed here. Thick description of cultural and other contextual factors was used to overcome the wideness of the term Middle East, as Middle Eastern nations share but evidently also differ in cultural characteristics. The selection of a medical school in the Netherlands as a Western case was based on pragmatic reasons, but the school met selection criteria two and three, while of necessity failing criterion one. The study was approved by the ethical review boards of the Hong Kong and the Middle Eastern schools, while no approval was required for the study at the Dutch school.

표 1은 3개 학교의 PBL 측면을 몇 가지 나열한 것입니다. 설립 이래, 네덜란드와 중동의 학교에서는, PBL을 학부시절의 주요한 교육 방법으로 사용해, 교사 중심의 강의는 비교적 적었습니다. 홍콩학교는 1990년대 PBL을 전통적인 교사 중심의 교육과정에서 학생 중심의 교육과정으로 전환하는 것을 목표로 전반적인 교육과정 개혁의 일환으로 시행했다. 이 개혁으로 인해 강의 기반과 PBL이 혼재된 커리큘럼이 탄생했습니다.

Table 1 lists several PBL aspects for the three schools. Since their foundation, the Dutch and the Middle Eastern school had used PBL as the major educational method in the undergraduate years, with relatively few teacher-based lectures. The Hong Kong school had implemented PBL as part of an overall curriculum reform in the 1990s aimed at moving from a traditional teacher-centered curriculum to a student-centered one. The reform resulted in a hybrid curriculum that was partly lecture-based and partly PBL.

데이터 수집
Data collection

연구는 PBL의 문화 간 적용 가능성에 대한 광범위한 연구 프로젝트의 틀 안에서 이루어졌기 때문에, 데이터 수집 방법은 그룹 논의 외에 다른 PBL 측면에도 초점을 맞췄다. 각 기관에서는 2009년 11월부터 2010년 4월까지 1개월간의 현장조사 기간 동안 데이터가 수집되었다. 중동 및 홍콩 학교에서는 첫 번째 저자가 데이터를 수집하고 네덜란드 의과대학에서는 외부 연구 보조자가 데이터를 수집하여 해당 학교의 외부인이 데이터를 수집했음을 확인했습니다. 몇 가지 정성적 데이터 수집 방법을 사용했다.
As the study was conducted within the framework of a broader research project on the cross-cultural applicability of PBL (Frambach et al. 2012), data collection methods focused also on other PBL aspects besides group discussions. In each of the institutions, data were collected during one month of fieldwork between November 2009 and April 2010. In the Middle Eastern and Hong Kong schools, data were collected by the first author and in the Dutch medical school by an external research assistant to ensure that data collection was done by an outsider to the school in question. Several qualitative data collection methods were used.

첫째, PBL에 관여하는 학생, 튜터, 주요 스탭을 대상으로, 각각 평균 1시간씩, 총 88명의 심층 인터뷰를 실시했습니다. 인터뷰는 다음 질문을 중심으로 반구조화되어있었다.

  • PBL과 관련된 관행, 경험, 인식, 선호도 및 어려움
  • PBL 토론 세션 
  • PBL 및 PBL 토론에 대한 학생들의 적응적 행동 
  • 토론 및 기타 PBL 관련 기술 개발 
  • 연도별 변화 및 차이, 
  • 학생의 과거 교육 경험 
  • 문화적 및 기타 맥락적 요소의 특성, 의미 및 영향 

First, a total of 88 individual in-depth interviews were conducted with students, tutors, and key staff involved in PBL, lasting an average of one hour each. The interviews were semi-structured, with questions focusing on

  • practices, experiences, perceptions, preferences, and difficulties relating to PBL;
  • PBL discussion sessions;
  • adaptive behaviors of students in response to PBL and PBL discussions;
  • the development of discussion and other PBL-related skills;
  • changes and differences between year levels;
  • students' past educational experiences; and
  • the nature, meaning, and influence of cultural and other contextual factors.

참가자들은 구두 및 서면 동의를 요구받았고, 그들은 감사의 의미로 상징적인 선물을 받았다. 인터뷰는 오디오 녹음과 문자 그대로 녹음되었다.

The participants were asked to give oral and written informed consent, and they received a symbolic gift as gratitude. The interviews were audio recorded and transcribed verbatim.

인터뷰 참가자들은 남녀 학생, 서로 다른 PBL 그룹의 학생, 그리고 지역 환경에서 태어나고 자란 학생들을 포함하기 위해 의도적으로 모집되었다. 이것은 더 풍부한 비교 정보를 얻을 수 있을 것으로 기대되었기 때문에, 얼마 동안 다른 나라에서 살고 학교를 다닌 많은 학생들도 포함되었습니다. 경험된 어려움과 토론 행동과 기술에 대한 차이를 감지하기 위해 1학년과 3학년 학생 수가 거의 동일했다. 학생들은 강의와 PBL 세션에서 발표를 통해 모집되었다. 이 튜터들은 또한 다른 교육 배경을 가진 튜터들과 1학년과 3학년 때부터 튜터들을 포함시키기 위해 의도적으로 선발되었다. 표 2는 학생 및 튜터 샘플에 대한 인구통계학적 데이터를 보여줍니다. PBL과 관련된 핵심 인력은 눈덩이 샘플링을 통해 선발되었다. 각 기관에서는, 처음부터 PBL의 실시에 관여해, 다양한 코디네이트 역할을 완수해 온, (이전) 의학·교육부장, 의학교육부장, 및 스탭이 포함되어 있었다.
Interview participants were recruited purposively to include both male and female students, students from different PBL groups, and students born and raised in the local setting. A number of students who had lived and attended school in another country for some time were also included, because this was expected to yield richer comparative information. Approximately equal numbers of students from the first and the third year were included to detect differences with respect to experienced difficulties and discussion behaviors and skills. The students were recruited through announcements in lectures and in PBL sessions. The tutors were also selected purposively to include tutors with different disciplinary backgrounds, and tutors from the first and third year. Table 2 presents demographic data on the student and tutor samples. Key staff involved in PBL were selected through snowball sampling. At each institution they included (former) deans of medicine and/or education, directors of medical education departments, and staff who were involved in the PBL implementation from the beginning and had performed a range of coordinating roles.

 

둘째, 총 32개의 PBL 토론 세션이 관찰되었습니다. 토론 행동, 학습과 커뮤니케이션의 문화적 차이, 그리고 토론에 영향을 미칠 수 있는 다른 문맥적 요소에 초점을 맞춘 관찰 시트가 개발되었습니다. 관측치의 경우 첫 번째 및 세 번째 해의 서로 다른 PBL 그룹이 랜덤하게 선택되었습니다. 세션에 앞서, 연구자가 간략하게 소개되었고 학생들은 평상시와 같이 세션을 진행하도록 요구받았다. 연구자는 세션에 참여하지 않고 현장 메모를 하고 관찰 시트를 작성했다. 표 3은 세 기관에 걸쳐 관찰과 인터뷰가 어떻게 분포되었는지를 보여준다.
Secondly, a total of 32 PBL discussion sessions were observed. An observation sheet was developed which focused on discussion behaviors, cultural differences in learning and communication, and other contextual factors that might affect the discussions. For the observations, different PBL groups from the first and the third year were randomly selected. Before the session, the researcher was briefly introduced and the students were asked to conduct the session as usual. The researcher took field notes and filled in the observation sheet, without participating in the session. Table 3 shows how the observations and interviews were distributed over the three institutions.

 

셋째, PBL의 실시 및 적용에 관한 문서는 주요 직원으로부터 입수하였으며, 여기에는 학생용 안내 책자, 코스 일정, 문제 사례, 학생 평가를 위한 양식, 커리큘럼에 대한 정보, PBL의 일반적인 평가 등이 포함되어 있습니다. 마지막으로, 강의, 교무실, 여가 활동 중 참가자의 관찰을 통해 제도 및 지역 문화에 대한 추가적인 상황별 정보를 수집했다. 연구원들은 이 정보를 연구 저널에 기록했다.
Thirdly, documents about the implementation and application of PBL were obtained from key staff, such as information booklets for students, course schedules, problem cases, forms to evaluate students, information about the curriculum, and general evaluations of PBL. Finally, additional contextual information about the institutional and local culture was collected by participant observation during lectures, in faculty offices, and during leisure activities. The researchers recorded this information in a research journal.

 

데이터 분석
Data analysis

특정 단계별 주제 분석 유형인 템플릿 분석을 사용하여 데이터를 분석하였다(King 2004, 2010). Template Analysis에서는 [계층적으로 구조화된 테마로 구성된 일련의 코딩 템플릿]을 개발하여, 데이터에 반복적으로 적용하는 과정에서 [분석 진행에 따라 테마가 지속적으로 변경]된다. 그림 1은 다양한 템플릿과 관련 단계를 보여줍니다. 우선, 연구진은 학생들이 토론 세션에서 겪는 어려움이나 세션에 대처하기 위해 개발한 전략과 같이 분석에서 식별될 것으로 예상되는 선험적인 주제를 공식화했다. 첫 번째와 두 번째 저자는 인터뷰 녹취록의 하위 샘플을 이러한 주제로 독립적으로 코드화했다. 이 과정에서 새로운 주제를 식별하고, 기존 주제를 수정하고, 중복된 주제를 삭제했다. 코딩은 정성 데이터 분석용 소프트웨어 프로그램인 Atlas.ti 버전 6.2를 사용하여 수행되었습니다. 두 저자는 토론을 통해 주제 발생 및 해석에 대한 합의를 이룬 후 인터뷰 성적서의 절반에 적용되는 초기 코딩 템플릿을 개발했다.
Template Analysis, a specific step-wise type of thematic analysis, was used to analyze the data (King 2004, 2010). In Template Analysis a succession of coding templates consisting of hierarchically structured themes is developed and iteratively applied to the data with themes being modified continuously as the analysis progresses. Figure 1 presents the different templates and the related steps. To start with, the researchers formulated themes that were a priori anticipated to be identified in the analysis, such as difficulties that students encountered in the discussion sessions, or strategies which they developed to deal with the sessions. The first and second author independently coded a subsample of the interview transcripts with these themes, during which they identified new themes, modified existing themes and deleted redundant themes. Coding was performed using Atlas.ti Version 6.2 (Scientific Software Development, GmbH, Berlin, Germany), a software program for qualitative data analysis. After reaching agreement on the occurrence and interpretation of themes through discussion, the two authors developed an initial coding template, which was applied to half of the interview transcripts.

최종 템플릿이 개발되고 녹취록의 절반에 반복적으로 적용된 후, 연구원들은 PBL 토론의 긴장과 어려움, 학생들의 변화와 발전, 그리고 변화에 영향을 미치는 요소들에 대한 패턴, 원인, 빈도, 의미, 그리고 경도의 식별에 초점을 맞추면서 연구 결과를 해석했다.3개 기관 간의 비교 및 기관 간 및 기관 내 1학년과 3학년 간의 비교.

After the final template was developed and iteratively applied to the first half of the transcripts, the researchers interpreted the findings while focusing on the identification of patterns, causes, frequency, meaning, and salience with regard to

  • tensions and difficulties in PBL discussions,
  • students' change and development,
  • factors influencing student behaviors, and
  • comparisons between the three institutions and between first-year and third-year students across and within the institutions.

해석에서 얻어진 초점 템플릿은 증거확인을 위해 특히 주의를 기울여 나머지 절반의 녹취록에 적용되었으며, 관찰 시트, 현장 노트, 문서 및 연구 저널 분석에도 사용되었다. 최종 해석은 문화와 다른 문맥적 요소, 학생들의 의사소통 행동에서의 문화 간 차이, PBL 토론과 관련된 발전 사이의 관계를 포함하는 개념적 모델을 낳았다.

The focused template that resulted from the interpretation was applied to the remaining half of the transcripts with particular attention for disconfirming evidence, and was also used to analyze the observation sheets, field notes, documents and research journal. A final interpretation resulted in a conceptual model encompassing the relationships between cultural and other contextual factors, cross-cultural differences in students' communicative behaviors and development in relation to PBL discussions.

신뢰도
Trustworthiness

연구의 신뢰성을 높이기 위해 몇 가지 조치가 취해졌다.

  • 첫째, 여러 데이터 수집 방법을 통해 데이터의 삼각측량을 달성했습니다.
  • 둘째, 포화 상태가 될 때까지 데이터 수집을 계속했다.
  • 셋째, 코드화 과정은 반복적이었고, 검증되지 않는 증거에 대한 검색을 포함했으며, 두 연구자에 의해 독립적으로 수행되었다.
  • 넷째, 연구자의 편견에 대한 인식을 높이기 위해 연구자는 현장조사 중에 반사적인 연구일지를 작성했다.
  • 다섯째, 조사기관의 외부인 연구자가 수집한 자료로 참가자의 솔직한 답변을 유도할 수 있다고 가정했다.
  • 마지막으로 인터뷰 참가자 샘플 중 회원 체크를 실시했습니다. 예비 결과의 요약에 동의하고 코멘트를 제공할 것인지를 묻는 질문에 대해 확인 응답과 함께 몇 가지 추가 코멘트와 설명을 받았다. 후자는 데이터의 분석과 해석에서 고려되었다.

Several measures were taken to enhance the study's trustworthiness.

  • First, triangulation of data was achieved through multiple data-collection methods.
  • Second, data collection continued until saturation occurred.
  • Third, the coding process was iterative, included a search for disconfirming evidence, and was conducted independently by two researchers.
  • Fourth, to increase awareness of researcher bias the researchers kept a reflexive research journal during fieldwork.
  • Fifth, the data were collected by researchers who were outsiders to the institutions they investigated, as this was assumed to encourage participants to give honest answers.
  • Finally, a member check among a sample of the interview participants was conducted. In response to the question asking whether they agreed with summaries of preliminary results and would provide comments, confirmatory responses were received as well as some additional comments and clarifications. The latter were taken into account in the analysis and interpretation of the data.

 

결과.
Results

4개의 데이터 소스(인터뷰, 관찰, 문서 및 컨텍스트 정보)의 결과는 통합된 방식으로 표시됩니다. 이들 3개 학교의 학생들은 PBL을 내면화하고 문화적 배경을 다른 정도로 외부화하는 것으로 조사돼 토론 행태에서 문화 간 차이를 보였다. 토론에서 목소리를 높이고, 질문을 하고, 다른 사람에게 도전하는 행동은 네 가지 문화적 요인에 의해 영향을 받는 것으로 나타났습니다. 

  • (1) 불확실성과 전통, 
  • (2) 그룹 관계와 체면  
  • (3) 위계적 관계 및 
  • (4) 성취와 경쟁

The results from the four data sources (interviews, observations, documents, and context information) are presented in an integrated manner. Students of the three schools were found to internalize PBL and externalize their cultural backgrounds to different degrees, which led to cross-cultural differences in discussion behaviors. Behaviors of speaking up, asking questions, and challenging others in the discussion were found to be influenced by four cultural factors:

  • (1) uncertainty and tradition,
  • (2) group relations and face,
  • (3) hierarchical relations, and
  • (4) achievement and competition.

서양의 경우와 비교해 보면, 비서구권의 경우 이들 요인이 토의 과정에 더 큰 영향을 주었고, 대체로 부정적인 쪽이었다.
Compared with the Western case, the two non-Western cases showed a stronger impact of these factors, which generally had an adverse effect on the discussion process.

그러나 다음과 같은 6가지 맥락적 요인도 토론 행동을 억제하거나 강화하는 것으로 확인되었기 때문에 이러한 관계는 간단하지 않았다. 

  • (1) 선행 중등교육의 특성
  • (2) PBL 구현 범위, 
  • (3) 학생의 개인적인 특성, 
  • (4) 교육의 언어 
  • (5) 튜터의 행동 
  • (6) 평가 시스템 

This relationship, however, was not straightforward, as six other contextual factors were also found to either inhibit or enhance discussion behaviors:

  • (1) the nature of students' prior school education,
  • (2) the scope of PBL implementation,
  • (3) students' personal characteristics,
  • (4) language of instruction,
  • (5) tutor behavior, and
  • (6) the assessment system.

3개 학교에서 1학년부터 3학년까지의 학생들의 토론 행동과 기술, 그리고 그들의 발전은 문맥적 요소, 문화적 요소, PBL 토론 세션 간의 복잡한 상호작용에 의해 형성되었다. 개념 모델은 그림 2에 나와 있습니다. 이하에서는, 모델내의 다양한 요소 및 그 상호작용에 대해, 중요도가 아니고, 그 요소에 대해 설명합니다.또, 인터뷰의 인용문을 참조해 설명하겠습니다. 표 4는 토론 역학을 억제하거나 강화할 수 있는 상황적 요인의 가능성에 대한 자세한 개요를 제공한다.

In the three schools, the students' discussion behaviors and skills and their development from the first to the third year were shaped by complex interactions between contextual factors, cultural factors, and the PBL discussion sessions. The conceptual model is presented in Figure 2. Below, the different factors in the model and their interactions are discussed – not in order of importance – and illustrated by quotes from the interviews. Table 4 provides a detailed overview of the potential of the contextual factors to inhibit or enhance discussion dynamics.

 

 

불확실성과 전통
Uncertainty and tradition

중동의 경우, [불확실성의 감정]학생들이 토론에서 목소리를 내는 것을 방해하는 것으로 보인다. 특히 1학년 학생들은 PBL 토론회에서 불확실성을 경험했고, 이는 중등교육에서의 교사 중심적 성격으로 인해 악화되었다(아래 선행교육에 대한 설명 참조). 관련 사전 지식 없이 문제 사례를 논의해야 하는 것은 불확실한 감정을 불러일으켜 학생들이 목소리를 낼 수 없게 했다. 튜터의 설명대로:
In the Middle Eastern case, feelings of uncertainty appeared to inhibit students from speaking up in the discussion. First-year students in particular experienced uncertainty in the PBL discussion sessions, which was aggravated by the teacher-centered nature of their secondary school education (see the discussion on prior education below). Having to discuss a problem case without relevant prior knowledge gave rise to feelings of uncertainty, which prevented students from speaking up. As a tutor explained:

1학년은 학생들에게 어렵다. 그들은 많은 어려움에 직면해 있다. 교육제도는 중등학교의 제도와는 다르다. 토론회에서 그들은 아직 의학 지식이 없었기 때문에 매우 화가 났고 혼란스러웠다. 그래서 그들은 아무 말도 하지 않았다…. 그들은 아무 말이나 생각하는 것을 두려워한다. (중동 가정교사 5)
The first year is difficult to students. They face many difficulties…. The system of education is different from the system in secondary schools. In the discussion meeting, they were very angry and confused, because they did not yet have any medical knowledge. So they did not say anything…. They are afraid to say anything, to think. (Middle East tutor 5)

그러나 중동 학생들은 불안감에 대처하기 위한 [불확실성 저감 전략]을 개발하여 토론회에서 불확실성을 해소하였다. 예를 들어, 토론 세션 전에 선배 학생에게 문제 사례의 토픽에 대해 물어보았다(사례가 매년 조금씩 바뀌었기 때문에).이것에 의해, 상급생은 세션을 준비할 수 있었습니다. 또한, 일부 학생들은 실제 세션 전에 비공식 미팅을 조직하여 모든 학습 주제가 다루어졌는지 확인하고 누가 무엇을 말할 것인지에 대해 합의함으로써, 튜터와의 공식적인 토론 세션의 불확실성을 대부분 없앴다. 한 3학년 학생은 다음과 같이 말했다.
However, the Middle Eastern students developed uncertainty-reducing strategies to cope with their anxiety, thereby mitigating their feelings of uncertainty in discussion sessions. For example, before the discussion session, they asked about the topic of the problem case from senior students – since the cases changed only slightly year to year – which enabled them to prepare for the session. Also, some students organized informal meetings before the actual session, in which they checked if all the learning topics had been covered and agreed on who would talk about what, thereby eliminating most of the uncertainties for the formal discussion session with the tutor. A third-year student commented:

보고 세션 전에, 우리는 학급 그룹과 작은 미팅을 갖고 정보에 대해 논의하려고 합니다. 그래서 세션 전에 우리는 모든 학습 목표를 달성하려고 노력하고, 그 후에 세션에서는 모두가 모든 점에서 문제를 논의할 준비가 되어 있습니다.(중동 3학년)
Before the debriefing session, we have a small meeting with a group of the class and try to discuss the information…. So before the session we try to fulfill all the learning objectives and after that, in the session, everyone is ready to discuss the problem from all points. (Middle East third-year student 3)

 

홍콩에서도 학생 사이에 불확실성이 발견되었지만, PBL의 실시 범위(이하의 실시 범위에 대한 설명 참조)에 의해, 학생의 목소리를 억제하지 않는 범위까지 불안감을 경감할 수 있었다. 네덜란드의 경우, 불확실한 느낌도 있었지만, 다른 두 기관에 비해 덜했다. 네덜란드 1학년 학생들은 [예상되는 토론의 깊이]에 대해 불확실하다고 말했다. 인터뷰와 관찰의 또 다른 결과는 3학년 학생들이 1학년 학생들보다 적극적으로 참여하고 토론에 소통하는 데 더 자신감이 있다는 것이다.

In Hong Kong, uncertainty among students was also found, but the scope of PBL implementation (see discussion on the scope of implementation below) enabled students to reduce their anxiety to the extent that it did not inhibit them from speaking up. In the Dutch case, feelings of uncertainty were also present, but to a lesser degree compared with the other two institutions. First-year Dutch students indicated that they felt uncertain about the expected depth of the discussion. Another result from the interviews and observations was that in all three institutions, third-year students were more confident than first-year students in participating actively and communicating in the discussions.

중동의 경우 주로 발견된 요인은 [전통]이었는데, 이는 불확실성과 강하게 관련되어 있었다. [불확실성]이 모호한 상황과 더 연관이 있었다면, [전통]은 전통을 존중하여 변화를 반대하고, 온건하고 겸손하며, 독실한 태도를 자극하는 것이었다. 이것은 질문을 억제하는 효과가 있었다. 한 직원은 [전통적인 종교적 관점]이 학생들이 토론에서 질문하기를 꺼리는 데 어떻게 기여할 수 있는지를 설명했습니다.
A factor that was mainly found in the Middle Eastern case was tradition, which was strongly related to uncertainty – though the latter related more to ambiguous situations, whereas the former was about opposing change out of respect for tradition, and stimulating a moderate, humble, and devout attitude. This had the effect of inhibiting questioning. A staff member explained how a traditional religious perspective could contribute to students' reluctance to ask questions in the discussion:

이슬람에서는 [하람]이 금지되어 있고, 만약 당신이 그것을 저지르면, 당신은… 그것은 악마이며… 당신은 결코 낙원을 볼 수 없을 것이다. [할랄]은 정반대입니다.그것은 받아들일 수 있는 것입니다.그것은 좋은 일입니다.그리고 그렇게 하면 낙원에 가게 됩니다. 아이의 첫 번째 달갑지 않은 질문(예를 들어, 신에 대한 질문, 생명을 발견하려는 아주 어린 아이들의 매우 환상적인 질문을 알고 있다)과 함께, 우리는 그에게 이것은 하람이며 금지되어 있다고 말한다. "당신은 이 질문을 해서는 안 된다." 그래서 질문 자체가 금지되어 있습니다. 아기에게 이 말을 계속하면 얼마 후 그는 하람이나 할랄로 생명을 빼앗고 하람을 피하려고 한다.(중동 직원 5)

In Islam, Haram is prohibited, and if you commit it, you will go to … it is evil … you will never see paradise. Halal is the opposite, it is something acceptable, it is good to do, and if you do it, you will go to paradise. With the first unwelcome question from a child [referring to previous quote: questions about God for example, you know the very fantastic questions of the very young children trying to discover life], we tell him that this is Haram and this is prohibited, ‘you should not ask this question’. So the question itself is prohibited. When you keep telling your baby this, after some time, he takes life as Haram or Halal and he tries to avoid what is Haram. (Middle East staff 5)

그러나 중동과 홍콩 참가자들 모두 [전통적인 가치관이 사회 전반에 걸쳐 변화하고 있다]는 점에 주목했다(아래 위계관계에 대한 논의 참조).
However, it was noted by both Middle Eastern and Hong Kong participants that traditional values were changing throughout society (see the discussion on hierarchical relations below).

선행 교육 제도
Prior education system


중등교육이 전통적이고 교사 중심일수록, 토론에 참가하는 데 있어서 장해가 되는 것을 알 수 있었다(표4). 중등교육은 중동과 홍콩 응답자 모두에게 교사 중심이라는 특징이 있었다. 네덜란드의 중등학교는 보다 학생 중심적인 것이 특징이며, 네덜란드 학생들은 중고등학교 교육을 PBL 토론에 참여하는 데 장애물로 보지 않았다. 그럼에도 불구하고 그들은 PBL 시스템에 익숙해질 시간이 필요했다. 학생들이 어려움을 겪는 정도에 영향을 미칠 수 있는 측면은 나이였다. 표 2는 중동 학생들이 대학에 입학할 때 홍콩이나 네덜란드 학생들보다 평균 연령이 낮았고, 이것은 부분적으로 더 높은 불안감의 원인이 될 수 있다는 것을 보여준다.

The results indicated that the more traditional and teacher-centered the secondary education of students had been, the more obstacles they experienced to participating in discussions (Table 4). Secondary school education was characterized as teacher-centered by both the Middle Eastern and Hong Kong respondents. Dutch secondary schools were characterized as more student-centered, and Dutch students did not see their previous education as an obstacle to participating in PBL discussions. Nevertheless, they also needed time to get used to the PBL system. An aspect that might also be of influence on the degree to which students experienced difficulties was age. Table 2 shows that the Middle Eastern students had a lower average age than the Hong Kong and Dutch students when entering university, which might partly account for a higher level of anxiety.

흥미롭게도, 홍콩과 중동의 경우, 국제 중등학교에 다닌 경험이 있거나 서양의 교육 경험이 있는 학생(표2)은, 영어의 유창함이나 태도에 있어서, 보다 목소리가 큰 것이 특징이다. 이것은 선행 교육 경험의 영향을 강조한다. 홍콩의 한 가정교사는 다음과 같이 설명했다.
Interestingly, in the Hong Kong and Middle Eastern cases, students who had attended international secondary schools or who had had Western educational experiences (Table 2) were characterized as more vocal, in terms of both fluency in the English language and attitude. This underlines the influence of prior educational experiences. A Hong Kong tutor explained:

(국제 중등학교에 다녔던) 학생들은 표현과 의사소통을 매우 잘 합니다. 그들은 그곳에 갈 수 있는 것이 얼마나 중요한지 알고 있다. 많은 지역 학생들은 아직 그것을 모른다. '만약 뭔가를 알면, 객관식 문제도 풀 수 있고, 좋은 직업도 가질 수 있을 것'이라고 생각해요.(홍콩 가정교사1)
These students are very much coached to express and communicate…. They know how important it is to be able to go out there. Many local students don't know that yet. They think, ‘If I know it, I can do multiple choice and I will have a good career.’ (Hong Kong tutor 1)

 

실시 범위
Scope of implementation

그 결과, PBL 세션이 아니라 [강의를 통해 학습 내용을 많이 다룰수록], 학생들이 자신의 지식을 구축하기 위해 PBL 세션에서 비판적이고 심도 있는 토론에 참여할 가능성은 낮아졌습니다(표 4). Hong Kong School의 하이브리드 강의 기반 접근법(표 1)에서는 학생들은 종종 PBL 세션에서 [강의에서 배운 사실적 지식을 반복]했으며, [비판적인 질문을 하거나 기존의 견해에 도전함으로써 자신의 지식을 구축하려는 시도]를 하지 않았다. 한편, 홍콩 하이브리드 어프로치는 불확실성을 줄여, 학생들이 토론에서 목소리를 내는 것을 두려워하지 않게 했다. 왜냐하면 강의의 결과로서 사전 지식이 높기 때문이다.

The results indicated that the more learning content was covered in lectures instead of in PBL sessions, the less likely students were to engage in critical and in-depth discussions during the PBL sessions to construct their own knowledge (Table 4). In the hybrid, partly lecture-based approach of the Hong Kong school (Table 1), the students often repeated factual knowledge from the lectures in the PBL sessions rather than asking critical questions about it or trying to construct their own knowledge by challenging existing views. On the other hand, the Hong Kong hybrid approach reduced uncertainty, making students less afraid to speak up in the discussions, because of their higher degree of prior knowledge as a result of the lectures.

그룹 관계 및 체면
Group relations and face

중동 학생들은 그룹 관계에 강한 가치를 두는 것으로 밝혀졌는데, 이는 그들이 아직 다른 그룹 구성원을 알지 못한다면 토론에 참여하는 것을 불편하게 만들 수 있다.
Middle Eastern students were found to lay strong value on group relations, which could make them feel uncomfortable about taking part in the discussion if they did not know the other group members yet.

특히 1학년 때는 우리 반에 아는 사람도 없었고, 아는 학생도 없었다. 우리는 모두 수줍음을 많이 탔고, 토론 시간에 전혀 말을 하지 않았다, 그것은 좋지 않았다. 부끄러워서 말을 많이 안 했어요.(중동 3학년 2)
Especially in the first year, I didn't know the people in my class, I didn't know anyone of the students. We were all very shy, we didn't talk at all in the discussion session, that was not nice. I felt shy, I didn't talk too much. (Middle East third-year student 2)

 

하지만 잠시 후, 학생들이 친구가 되고 서로를 신뢰하게 되자, 그들은 참여에 더 자신감을 느꼈다. 학교는 이러한 그룹 포커스에 맞게 정책을 조정했고, 네덜란드에서는 6주, 홍콩에서는 1학기까지 그룹이 함께 지낼 수 있도록 허용되어 토론에 편안하게 참여할 수 있는 안전한 그룹 환경이 조성되었습니다. 반면 네덜란드 학생들은 6주마다 그룹을 바꾸는 것에 만족한다고 말했는데, 이것은 그들에게 지속적인 참여 도전을 의미했다.

After a while, however, when students became friends and grew to trust one another, they felt more confident in participating. The school had adapted its policy to this group focus, and groups were allowed to stay together for one year, as opposed to six weeks in the Dutch case and up to one semester in Hong Kong, which created a safe group environment to comfortably participate in discussions. Dutch students on the other hand indicated they were happy about changing groups every six weeks, which for them meant a continuous challenge to participate.

홍콩에서도 학생들이 집단 관계에 집중하는 것을 발견했는데, 이는 주로 학생들이 [다른 사람 앞에서 자신과 다른 사람들의 체면을 유지하는 것]에 대한 우려로 표현되었다. 이는 그들이 목소리를 높이고, 질문을 하고, 동료들에게 도전할 준비가 덜 되었다는 점에서 그들의 행동에 영향을 미쳤다. 예를 들어, 학생들은 [체면을 구기는 것]을 우려했기 때문에, 내용과 발음이 모두 정확하다고 확신할 때에만 무언가를 말할 것이라는 것을 의미한다.
In Hong Kong too, students were found to focus on group relations, which was mainly expressed in students' concern about maintaining their own and others' face in front of the group. This affected their behavior in that they were less ready to speak up, ask questions, and challenge their peers. For example, concern about losing face meant that students would only say something if they were sure it was correct, both content-wise and pronunciation-wise (see the discussion on language of instruction below).

중국인에게 체면은 매우 중요합니다. 얼굴이란 내가 일을 잘못하면 모두가 나를 비웃을 것이고 나는 기분이 안 좋을 것이라는 뜻이다. 저는 제 자신을 부끄럽게 했고, 학교 교육도, 부모님도 부끄럽게 했습니다. 아마도 그것은 말을 많이 하지 않는 것과 관련이 있을 것이다. 우리 부모님은 항상 나에게 수다를 떨기보다는 듣는 것이 더 낫다고 가르치셨다. 일반적으로 중국인들은 좀 더 내성적이다. 두 번째, 말을 할 때는 말을 잘 해야 합니다. 말을 잘 못하면 말을 못하는 두 가지 이유가 있다. 내 생각에 그 중 하나는 그들이 매우 당황한다는 것이다. 그래서 단어를 발음하는 대신 시도조차 하지 않는다.(홍콩 직원 1)
You see, for the Chinese, face is very important. Face means that if I do a poor job everyone will laugh at me, and I'll feel terrible. I have shamed myself; I've shamed my school education, my parents. Probably that is related to not speaking too much. My parents have always taught me it's better to listen than to blablabla. Generally the Chinese are more reserved. Secondly, if you speak, then make sure you speak well. If you can't speak well then there's a double reason for not speaking. I think an element of that is that they're very embarrassed. So instead of pronouncing a word they don't even try. (Hong Kong staff 1)

 

게다가 홍콩 학생들은 [질문을 하는 것]을 지식 부족을 드러내는 것으로 해석해서 질문하기를 주저했고, 이는 그룹 앞에서 체면을 구기는 것으로 인식됐다. 홍콩과 중동의 학생들도 조화롭고 우호적인 그룹 관계를 중시했기 때문에 그들의 [그룹 구성원의 체면 상실에 대해 걱정]했다. 그 결과, 그들은 동료들과 직접 대화하거나, 비판적인 질문을 하거나, 그들의 발언을 반대하거나, 토론회에서 그들의 행동에 대해 언급하는 것을 꺼렸다. 네덜란드 학생들은 그룹 관계보다는 토론 과정에 더 관심이 많았고, 그룹 구성원에 대한 비판을 더 기꺼이 표현하는 것으로 밝혀졌다.

Furthermore, Hong Kong students were hesitant to ask questions, because they interpreted this as revealing a lack of knowledge, which they perceived as loss of face in front of the group. Hong Kong and Middle Eastern students were also concerned about their group members' face loss, because they valued harmonious and friendly group relations. Consequently, they were reluctant to challenge their peers by directly speaking to them, asking them critical questions, opposing their statements, or commenting on their behavior in the discussion session. Dutch students were found to be more concerned with the discussion process than with group relations, and were more ready to express criticism of group members.

당신은 그저 '당신은 너무 많은 말을 하고 항상 방해하고 있는 것 같아요'라고 말한다. 그냥 그렇게 말해. 그리고 당신은 '나는 당신이 항상 준비가 잘 되어 있고 그룹에 대한 당신의 기여가 마음에 든다'고만 말한다. 그래, 그냥 솔직하게 말해. (네덜란드 3학년 2)
You just say, ‘I think you talk way too much and you are interrupting all the time’. You just say that. And also, you just say, ‘I think you are really well prepared always and I like your contributions to the group’. Yeah, you just say it honestly. (Dutch third-year student 2)

그러나 중동과 홍콩 학생들은 PBL의 목적과 과정에 익숙해진 반면, 토론에서 비판적인 발언을 할 준비가 되어 있었다.
However, while gaining familiarity with the purpose and process of PBL, Middle Eastern and Hong Kong students were more ready to make critical comments in the discussion.

글쎄요, 가끔 동료들에게 말하기 어려운 것도 있지만, 그것이 동료들에게 도움이 되기 때문에, 나는 그들에게 말하지 않으면 안 됩니다.(중동 1학년)
Well, sometimes there are some things that are hard to say to my colleagues, but it is for their own good, so I have to tell them. (Middle East first-year student 2)

마지막 블록의 튜터 선생님은 비판을 매우 강조했습니다. 그는 의사로서 다른 사람의 의견에 감탄하지 말고 비판적인 사고를 가져야 한다고 말한다. 때로는 그렇게 직접적으로 비판하는 것이 부끄럽지만, 나는 이것이 피할 수 없는 단계라고 생각한다.부끄럽거나 도망치려고 하지 말고 익숙해져야 한다고 생각한다.(홍콩 1학년 7)
My tutor of the last block, he emphasized criticism very much. He says that being a doctor, you should have critical thinking instead of admiring others' opinions…. Sometimes it embarrasses me to criticize so directly, but I think this is a step that you cannot avoid so we should get used to it, not feeling ashamed or trying to escape from it. (Hong Kong first-year student 7)

성격의 차이
Personality differences

세 기관 모두 학생 개개인의 토론 행태에서 큰 차이가 관찰되었다. 성별에 따른 차이(표 2)는 발견되지 않았다. 매우 조용하거나 매우 지배적인 학생들은 그룹에 의해 평가받지 못했다(표 4).

In all three institutions, large differences in discussion behaviors were observed between individual students. Differences based on gender (Table 2) were not found. Very quiet or very dominant students were not appreciated by the group (Table 4).

나는 아무도 말을 하지 않는 그룹에 속했다. 말을 시키려면 사람들을 가리켜야 한다.
I was in a group in which nobody said anything, you had to point at people to get them to talk. (Dutch third-year student 3)

몇몇은 꽤 지배적이고 그들은 단지 말을 많이 할 것이다. 그럼 목소리를 낼 기회도 없어. (홍콩 3학년 2)
Some are quite dominating and they will just talk a lot. Then you don't have a chance to speak up. (Hong Kong third-year student 2)

수업에 쓰는 언어
Language of instruction

토론 행동은 수업에 쓰는 언어에 의해서도 영향을 받았다(표 4). 홍콩 세션은 대부분의 학생들과 튜터들의 제2외국어인 영어로 진행되었고, 이는 영어 실력이 기준에 미치지 못한다고 느끼는 사람들에게 문제가 되었다. 대부분의 교사들은 영어 수준이 적절했지만, 학생 개개인에 따라 큰 차이가 발견되었다(현지 학생과 국제 중등학교에 다녔던 학생의 언어 차이는 아래의 선행 교육 제도에 대한 논의를 참조). 체면을 구기는 것에 대한 우려는, 비록 그들이 정말로 할 말이 있다고 느꼈을지라도, 단지 [어떻게 말해야 할지 모른다는 이유]만으로 이 학생들이 침묵하게 만들 것이다. 중동의 경우, 학생들은 세션 동안 비공식적으로 아랍어를 말할 수 있게 되었고, 이는 상호작용과 참여를 강화시켰다.
Discussion behaviors were also affected by the language of instruction (Table 4). The Hong Kong sessions were conducted in English, the second language of most students and tutors, which was a problem for those who felt their English fluency was not up to standard. While most tutors had an adequate level of English, large differences were found between individual students (see the discussion on the prior education system below for language differences between local students and students who had attended international secondary schools). Concerns about loss of face would cause these students to remain silent – even if they felt they really had something to say – just because they did not know how to say it. In the Middle Eastern case, the students were informally allowed to speak Arabic during the sessions, which enhanced interaction and participation.

계층적 관계
Hierarchical relations

홍콩과 중동의 경우, 위계적 관계에 초점을 맞춘 것이, 튜터에게 접근하는 방법에 있어서 학생들의 토론 행동에 영향을 주는 것으로 밝혀졌다. 1학년 학생에 대해 설명했듯이 학생들은, 자신보다는, 튜터를 지식의 원천으로 의존하는 경향이 있었다.

In the Hong Kong and Middle Eastern cases, a focus on hierarchical relations was found to influence students' discussion behaviors in terms of how they approached the tutor. Students were inclined to depend on their tutor as a source of knowledge, rather than on themselves, as this tutor explained about first-year students:

그들은 뭔가 말하고 싶거나 의논하고 싶을 때마다 나를 쳐다본다. 나는 그들에게 나를 보지 말라고 말하려고 한다. 나는 세션의 중심이 아니라 그들이 세션의 중심이다. 하지만 그들은 여전히 선생님이 모든 것의 중심이 되어야 하고, 답을 주는 사람이어야 하며, 그들보다 우위를 점해야 한다고 생각합니다. 지금도 이런 느낌이지만, 제가 말씀드린 것처럼 조금 지나면 그 반대의 느낌이 들 거라고 생각합니다.(중동 과외3)
Every time they want to say something or to discuss anything, they look at me. I try to tell them not to look at me. I am not the center of the session, they are the center of the session…. But they still feel that the teacher should be the center of everything, should be the one to give the answers, and should be the one who has the upper hand on them…. They still feel like this, but I think it will take a transition time, as I told them, after a while, you will feel the reverse. (Middle East tutor 3)

그 결과는 실제로 학생들이 토론하는 동안 튜터 대신 [스스로에게 의지하는 법을 점점 더 많이 배웠다는 것]을 보여주었다. 홍콩에서는 PBL 도입 이후 학생과 교직원 간의 관계가 전반적으로 위계성이 낮아지고 있다는 점에 주목했다.
The results did indeed show that students increasingly learned to depend on themselves instead of on the tutor during the discussions. In Hong Kong, it was noted that relations between students and staff had generally become less hierarchical since the implementation of PBL.

정말 좋은 건 지난 10년 동안 학생들이 날 보고 웃었다는 거야. 길거리와 병동에서 학생들이 저를 보고 웃는 것을 보고 '왜 저 남자가 저를 보고 웃는 거죠? 맞아, 그는 내 PBL 그룹에 있었어. 'X교수님 안녕하세요'라고 합니다. 대단하지 않나요? 옛날에는 X교수가 강의하는 것을 알면 내가 질문할까 봐 도망가려고 했을 것이다. (홍콩 직원 1)
What is so nice is that in the last ten years I've students smiling at me, you know. I see students smiling at me on the streets and on the wards, and I say ‘Why is that guy smiling at me? Oh yes, he was in my PBL group’. They say ‘Hi Professor X’. Isn't that nice? In the old days, if they know you're Professor X giving a lecture, they would be trying to run away, because they're afraid I would ask them a question. (Hong Kong staff 1)

중동과 홍콩의 사례에서 위계(및 그룹) 관계의 중요성의 또 다른 효과는 학생들이 튜터를 도전해서는 안 된다고 느꼈다는 것이다. 선생님에 대한 존경심은 학생들에 의해 높이 평가되었고, 학생들이 선생님에 대해 실제로 반대할지라도 공개적으로 반대하는 것은 무례한 것으로 간주되었다.
Another effect of the importance of hierarchical (and group) relations in the Middle Eastern and Hong Kong cases was that students felt the tutor should not be challenged. Respect for the teacher was valued highly by the students, and openly disagreeing with a teacher was considered disrespectful, even though students might actually disagree with the teacher.

나는 일반적으로 중국인들이 도전challenge하려는 의지가 적다고 생각한다. 그들은 끝까지 질문을 안 할 것이다. 그들이 반드시 독자 분께 납득이 가는 것은 아니지만, 그들의 의견 차이를 말하지 않을 수도 있습니다. 그것은 위계적 수준속에서 평온하다는 증거이다. 그들은 더 조용하다. (홍콩 가정교사 1)
I think Chinese people in general are less willing to challenge. They are the last ones to question. It is not that they are necessarily convinced by you, but they may not voice their disagreement. It is proof of serenity on hierarchical level. They are quieter. (Hong Kong tutor 1)

흥미롭게도, 홍콩과 중동의 경우, 응답자들은 그들의 사회가 전통적인 가치에서 벗어나고 있으며, 사람들은 더욱 목소리를 높이고 권위에 도전하려고 하고 있으며, 이는 토론이나 다른 곳에서 학생들의 행동에 반영되었다.
Interestingly, in both the Hong Kong and Middle Eastern cases, respondents characterized their society as moving away from traditional values, with people becoming more vocal and willing to challenge authority, which was reflected in students' behavior in the discussions and elsewhere.

확실히 90년대 이후 세대의 학생들은 권위에 도전할 용의가 훨씬 더 많다. (홍콩 과외 3)
Certainly the post-nineties generation of students is far more willing to challenge authority. (Hong Kong tutor 3)

이 세대의 학생들은 우리 세대와는 다르다. 그들 세대는 더 자신감이 있다…. 몰라, 우리는 노인들에 대해 더 존경심을 느꼈어. (중동 가정교사1)
Students in this generation are different from our generation. They are more confident as a generation…. I do not know, we felt more respect for the older people. (Middle Eastern tutor 1)
 
네덜란드의 경우, 튜터에 대한 비판적인 태도는 드물지 않았고, 심지어 몇몇 튜터는 격려하기도 했다.

In the Dutch case, a critical attitude towards the tutor was not unusual, and was even encouraged by some tutors

제가 항상 말하죠. 제 모든 그룹에게요. 예를 들어, 제가 어떻게 하고 있는지에 대해 동의하지 않는 것이 있다면, 그렇게 말씀하셔야 합니다. 그리고 학생들은 그렇게 한다. (네덜란드 과외 4)
I always say, every time to all of my groups, like, if there is anything you don't agree with, about how I'm doing it, you should say so. And students do that. (Dutch tutor 4)


네덜란드 사회는 일반적으로 비서구 사회보다 덜 위계적인 것으로 특징지어졌고, 이것은 학생들이 토론하는 동안 그들의 지도교사에게 접근하는 방법에 영향을 미쳤다고 주장되었다.
Dutch society was generally characterized as less hierarchical than non-Western societies, and it was argued that this affected how students approached their tutor during the discussions.

모든 사람이 평등하고 모든 사람의 의견이 중요하며 모든 사람이 발언권을 가지고 있기 때문이라고 생각합니다. 그리고 종종 임상의사이기도 하고 물론 제 위에 서기도 하지만 그 차이는 그리 크지 않습니다. 우리는 그를 비판하거나 비판적인 질문을 하지 않을 정도로 수줍음을 타지 않는다. (네덜란드 3학년 5명)
I think it is due to, everybody is equal and everyone's opinion is important and everyone has a voice…. And there is the tutor, who often is a clinician and of course he stands above me, but the gap is not very big. We are not so shy as to never dare to criticize him or never dare to ask a critical question. (Dutch third-year student 5)

 

튜터의 행동
Tutor behaviors

각 기관마다 튜터의 토론 진행 방법에 큰 차이가 있었고, 학생의 토론 행동에 큰 영향을 주었다. 학생이 발언할 기회가 전혀 없을 정도로 토론을 지배하고 있는 튜터도 있는 반면, 다른 튜터들은 학생들이 막혔을 때 토론을 자극하거나 설명하지 않고, 의욕이 결여된 채 수업 중에 소극적인 태도를 보였다. 어떤 행동도 학생들이 활발한 토론에 참여하도록 자극하지 않았다.
Within each of the institutions, large differences were found in the way tutors facilitated the discussion sessions, and this had a major impact on students' discussion behaviors. While some tutors dominated the discussion to the extent that students had no opportunity to speak at all, other tutors displayed a lack of motivation, remaining passive during the sessions, neither stimulating the discussion nor giving explanations when students got stuck (Table 4). Neither type of behavior stimulated students to engage in a lively discussion.

한때는 모든 토론을 직접 하는 튜터가 있었다. 그리고 우리는 그녀의 말을 잘 듣고 있었고, 우리는 그녀가 말하는 것에 대해 확신하고 있었지만, 우리는 토론하고 있지 않았습니다. 만약 튜터가 말하고 싶어 하면, 우리는 그녀에게 닥치라고 말할 수 없다. (중동 3학년 2)
I once had a tutor who would do the entire discussion herself. And we just listened to her, she was talking very well and we were convinced by what she was saying, but we were not discussing you know…. If the tutor just wants to talk we can't tell her or him to shut up. (Middle East third-year student 2)

성과와 경쟁
Achievement and competition

홍콩과 중동에서는, 응답자의 사회가 성취에 중점을 두는 것이 특징이며, 성공과 최고가 높이 평가되고 있다고 느끼고 있다.
In Hong Kong and the Middle East, respondents felt their society was characterized by a strong focus on achievement, and being successful and being the best were highly valued.

홍콩 학생이나 홍콩 선생님, 홍콩 학부모들이 성적과 시험 성적, 성적에 많은 스트레스를 주는 것은 일반적인 조건이라고 생각합니다. (홍콩 3학년 1)
I think it is a general condition that Hong Kong students or Hong Kong teachers or Hong Kong parents lay a lot of stress on your grades and the exam results, on your performance. (Hong Kong third-year student 1)

모든 학생은 자신의 커리어에서 가장 위대한 학생이 되고자 하며 훌륭한 교수가 되고자 한다. 우리 교수진에서 나는 최고의 의사가 되는 것을 꿈꾼다. (중동 3학년)
Every student seeks to be the greatest one in his career and wants to be a great professor. In our faculty, I dream of becoming the greatest doctor. (Middle East third-year student 3)

경쟁은 성취와 밀접한 관련이 있었고, 학생들은 그들의 또래들 사이에서 최고가 되기 위해 지속적으로 경쟁했다. 토론 세션 후 일부 학생들은 동료들과 정보를 공유하는 것을 꺼렸다.
Competition was closely related to achievement, with students continuously competing to be the best among their peers. A consequence for the discussion sessions was that some students were reluctant to share the information with peers.

학생들 중 최고가 되겠다는 생각을 하게 되면, 세션 사이에 발견한 정보를 비밀로 하게 된다.그걸 혼자만 알고 있는 거예요. 그들은 다른 학생들과 정보를 교환하는 것은 다른 학생들이 너보다 더 잘할 것이라고 생각한다. (중동 3학년)
The idea of being the best one on the list, or the top of the list, in the minds of some students is that you have to keep the information that you find between the sessions secret, you keep it to yourself. They think that exchanging information with other students will mean that the other students will be better than you. (Middle East third-year student 3)


성취와 경쟁의 문화적 요소들은 네덜란드 학생들 사이에서 덜 두드러지는 것으로 확인되었지만, 이 학생들 역시 시험에 초점을 맞춘 것으로 특징지어졌다. 그러나, 모든 기관에서, 궁극적으로 시험 지향의 초점이 어느 정도까지 토론 행동을 억제하거나 강화했는지를 결정하는 것은 평가 시스템의 특성이었다.

The cultural factors of achievement and competition were found to be less prominent among the Dutch students, although these students too were characterized as exam focused. In all the institutions, however, it was the nature of the assessment system that ultimately determined to what extent an exam-directed focus inhibited or enhanced discussion behaviors.

평가 시스템
Assessment system

토론 세션에서의 평가는 토론 행동에 영향을 미쳤다(표 4). 홍콩의 경우, 지도교사가 학생들의 참여와 의사소통 측면을 지속적으로 평가하여 학생들의 최종 성적에 기여하였다. 이 평가와 성취에 초점을 맞춘 결과, 홍콩 1학년 학생들은 토론에 참여할 것에 대한 불안감을 극복하고 동료들의 참여와 토론, 도전을 갈망하게 되었다.

Assessment during the discussion sessions influenced discussion behaviors (Table 4). In the Hong Kong case, the tutor continuously assessed students on participation and communication aspects, which contributed to students' final grades. As a result of this assessment and their focus on achievement, first-year Hong Kong students managed to overcome their anxiety about contributing to the discussions, and became keen to participate, debate, and challenge their peers.

처음 2년 동안은 말을 많이 할수록 점수가 높아지기 때문에 말하기 위해 싸우고 있다.(홍콩 3학년)
In the first two years … you are just fighting to talk, because the more you talk supposedly the higher the mark you get. (Hong Kong third-year student 4)

대부분의 학생들은 지속적인 평가에 집중한다. 그들은 항상 점수 때문에 걱정한다. 그래서 우리는 튜토리얼에서 무언가를 말해야 한다.그렇지 않으면 그날 점수가 나오지 않을 것이다.(홍콩 1학년4)
Most of the students focus strongly on the continuous assessment. They are always worrying about the scores… They say, ‘So we have to say something in the tutorial, otherwise there will no score that day.’ (Hong Kong first-year student 4)

반면 홍콩 3학년생은 1학년생보다 활동성이 떨어지는 것으로 나타났다. 그들은 PBL 평가에서 낙제하는 것은 사실상 불가능하다는 것을 알아냈다. 왜냐하면 매우 극단적인 경우에만 튜터가 학생들을 낙제시키기 때문이다. 이것은 학생들이 수업 시간에 열심히 할 필요가 없게 만들었다. 네덜란드 사례에서도 학생들은 세션에서 자신의 행동에 대한 평가가 실질적인 결과를 가져오지 않는다고 느꼈다. 중동의 경우, 학생들은 토론에 대한 기여의 내용에 대해 평가받지 못했다는 것을 깨달았기 때문에 목소리를 낼 수 있다는 자신감을 느꼈다.

Third-year Hong Kong students, by contrast, were observed to be less active than the first-year students. They had discovered that, in practice, it was virtually impossible to fail the PBL assessment, because only in very extreme cases tutors would fail students. This made it unnecessary for the students to try hard in the sessions. In the Dutch case too, students felt that the assessment of their behavior in the sessions had no substantial consequences. In the Middle Eastern case, students felt more confident to speak up as they realized they were not assessed on the content of their contributions to the discussion.

우선 나는 우리 반에서 말을 많이 하지 않았다. 하지만 그 후, 학위나 시험과 관련된 것이 아니라는 생각을 하게 되었습니다. 우리는 그 주제에 대해 우리가 알고 있는 것에 대해 자유롭게 말할 수 있을 뿐이다.(중동 3학년 10)
First I was not talking much in our class. But after, I got the idea that it is not something related to degrees and exams and something like that. We are just free to talk about what we know about that subject. (Middle Eastern third-year student 10)

 

논의
Discussion

주요 조사 결과
Main findings

이 연구의 목적은 PBL 토론에서 3개 문화에 걸친 학생들의 문화적 배경이 어떻게 표현되었는지, 그리고 이것이 학생들의 토론 행동과 기술을 어떻게 형성했는지 조사하는 것이었다. 학생들의 배경과 관련된 4가지 문화적 요소가 학생들에 의해 외부화 되어 토론 과정에 방해가 되었다. [불확실성과 전통, 그룹 관계와 체면, 위계적 관계, 성취와 경쟁]은 일반적으로 학생들이 토론에서 목소리를 높이고 질문을 하고 다른 사람들에게 도전하는 것을 방해하는 것으로 밝혀졌다. 다만, 중동의 경우는 그룹 관계에 초점을 맞추고, 홍콩의 경우는, 평가 제도의 성격과 함께 성과에 초점을 맞추고 있는 것으로, 논의의 역학 관계도 개선되고 있는 것을 알 수 있었다. 네덜란드 사례의 문화적 가치는 이 연구에서 확인된 네 가지 문화적 요인의 덜 존재하는 것을 반영하는 것으로 보였으며, 이는 일반적으로 토론 역학을 강화하는 것으로 밝혀졌다.
The aim of this study was to investigate how the cultural backgrounds of students across three cultures were expressed in the PBL discussions, and how this shaped students' discussion behaviors and skills. Four cultural factors related to students' backgrounds were externalized by the students, causing interference with the discussion process. Uncertainty and tradition, group relations and face, hierarchical relations, and achievement and competition were generally found to inhibit students from speaking up, asking questions, and challenging others in discussions. However, a focus on group relations in the Middle Eastern case and, in the Hong Kong case, a focus on achievement coupled with the nature of the assessment system were found to improve discussion dynamics as well. Cultural values in the Dutch case seemed to reflect a lesser presence of the four cultural factors identified in this study, which in general was found to enhance discussion dynamics.

이전의 연구에서는 이러한 [문화적 요소들이 의사소통 행동과 관련이 있다]는 사실도 밝혀졌습니다. 예를 들어, 황 교수와 다른 사람들(2003)은 체면 감퇴에 대한 우려와 질문하기를 꺼리는 것의 관계를 지적했다. 구디쿤스트의 문화 간 의사소통 이론은 불확실성, 집단 관계, 그리고 위계 관계 사이의 관계를 그리고 다른 한편으로는 낯선 사람이나 더 높은 지위의 사람들과의 의사소통에 대한 더 높은 수준의 불안감을 가정한다. Fassinger(1995)는 성취와 교실 상호 작용 사이의 관계를 보고했으며, 만약 학생들의 성적이 긍정적인 영향을 미칠 것이라고 인식한다면 학생들의 참여가 증가하였다. [불확실성과 전통]뿐만 아니라 [그룹 관계와 체면]이라는 문화적 요소는 각각 두 개의 개별적인 요소를 포함한다고 주장할 수 있다. 그러나 조사 대상 주제에 대한 상호 관련성이 높기 때문에, 본 연구에서는 문화 및 문화 요소를 분류하고 개념화할 수 있는 다양한 가능성과 관점이 존재함을 유의해야 한다.

Previous research has also found these cultural factors to be related to communication behaviors. Hwang and others (2003), for example, pointed to a relation between concern about face loss and reluctance to ask questions. Gudykunst's intercultural communication theory posits relationships between uncertainty, group relations, and hierarchical relations on the one hand and higher levels of anxiety about communicating with strangers or higher status persons on the other hand (Gudykunst 2005). Fassinger (1995) reported a relationship between achievement and classroom interaction, with students' participation increasing if they perceived it would have a positive effect on their grades. The cultural factor of uncertainty and tradition, as well as group relations and face, can be argued to include two separate factors each. Because of the high degree of interrelatedness with regard to the topic under investigation, however, in this study they were conceptualized as single factors, though it should be noted that a range of different possibilities and perspectives for categorizing and conceptualizing culture and cultural factors exists (e.g. Geertz 1973; Hofstede 2001; Trompenaars and Hampden-Turner 1998).

문화적 요인 외에도, 학생들의 토론 행동을 억제하거나 강화하는 6가지 맥락적 요인이 확인되었다. 모든 요소가 상호 관련성이 있기에, [문화적인 요소]와 [맥락적인 요소]를 구별한다는 것이 때로는 어려웠지만, 이 여섯 가지 요소는 문화보다는 [조직적인 결정이나 개인의 특징]과 더 관련이 있었다. 3개 기관 모두 중등 학교의 성격, PBL의 실시 범위, 학생의 인성, 지도 언어, 지도자의 행동, 평가 시스템이 논의에 영향을 미치는 것으로 나타났다.
In addition to cultural factors, six mediating contextual factors were identified that, depending on their nature, either inhibited or enhanced students' discussion behaviors. While the distinction between cultural and other contextual factors was sometimes hard to make considering the interrelatedness of all factors, these six factors related more to either organizational decisions or individual characteristics rather than culture. In the three institutions alike, the nature of the secondary school system, the scope of PBL implementation, students' personalities, language of instruction, the behavior of tutors, and the assessment system were found to impact on the discussions.

이것은 이전의 연구보고에 따르면 다음과 같은 강력한 영향력과 일치한다.

  • 중동 및 홍콩 학생을 대상으로 한 전통적인 교사 중심 및 시험 중심 중등학교
  • 서양 교육 모델에서 비서양 학생의 언어 문제
  • PBL 실행 범위, 학생 간의 성격 차이, 평가 시스템, 토론 세션에서 튜터의 주요 중재 역할의 중요성

This is consistent with previous research reporting the strong influence of

  • traditional, teacher-centered and exam-focused secondary schools on students in the Middle East and Hong Kong (Al Kadri et al. 2011; Bridger 2007; Chan 1999; Leung, Ginns, and Kember 2008);
  • language difficulties of non-Western students in Western educational models (Bridger 2007; Khoo 2003; Ladyshewsky 1996); and
  • the importance of the scope of PBL implementation, personality differences between students, the assessment system, and the major mediating role of the tutor in discussion sessions (Dochy et al. 2003; Dolmans et al. 2005; Moust, Van Berkel, and Schmidt 2005).

[개인 간 차이]가 [선호하는 의사소통 스타일에 대한 문화적 차이]보다 크다는 것을 발견한 이전 연구에서 [성격차이]의 역할이 더욱 강조되었다(Park et al. 2012).

The role of personality differences is furthermore emphasized by previous research that found individual variations to be larger than cultural variations in preferences for direct communication styles (Park et al. 2012).

현재의 연구는 맥락적 요인, 문화적 요인, 그리고 학생 중심의 교육 모델 사이의 상호작용이 학생들이 PBL의 토론 측면을 어떻게 내면화하고 결과적으로 그들의 토론 기술이 어떻게 발전하는지를 결정한다는 것을 보여주었다. 각 교육기관에서는 1학년에서 3학년으로 넘어감에 따라 이러한 능력이 증가하는 것으로 나타났다. 일반적으로 학생들은 자신감을 얻었고, 토론에 참여하고, 질문을 하고, 다른 사람의 발언이나 행동에 대해 비판하고, 이의를 제기하는 데 있어서 때로는 그들 자신의 대처 전략에 의해 도움을 받는 것을 더 편안하게 느꼈다. 그러나 토론행태와 기술발달률에서 3개 기관의 학생들은 상당한 차이를 보였다. 
The current study showed that interactions between contextual factors, cultural factors, and the student-centered educational model determined how students internalized the discussion aspect of PBL, and consequently how their discussion skills developed. In each of the institutions, these skills were found to increase as students moved from first to third year. Generally, students gained confidence and felt more comfortable – sometimes helped by their own coping strategies – in participating in the discussions, asking questions, and criticizing and challenging the statements or behaviors of others. The students at the three institutions differed considerably, however, in the rate of development of discussion behaviors and skills.

비서구 의과대학에서 [4대 문화요소의 영향]이 서구 의과대학보다 강하다는 것은, 일반적으로 비서구 학생들이 학생 중심의 토론에 더 많은 어려움을 겪었다는 것을 의미하며, 이는 교사 중심의 중등교육 시스템의 전통적인 특성으로 인해 더욱 커진 문제이다. PBL의 실시 범위에서의 두 비서방 기관 간의 차이는 토론 행동과 기술 개발의 차이를 고려했다. 홍콩에서의 하이브리드 실장은 학생들이 적극적으로 토론에 참여하도록 자극했지만, 중동(또는 네덜란드)의 경우와 같이 '온전한' PBL의 도입은 학생들이 토론을 통해 지식을 쌓도록 장려하여 학생들이 더 비판적으로 참여하도록 자극했다.정기적인 논의

The stronger impact of the four cultural factors in the non-Western schools compared to the Western school generally meant that students experienced more difficulty in engaging in student-centered discussions, a problem that was augmented by the traditional nature of their teacher-centered secondary school systems. The difference between the two non-Western institutions in the scope of PBL implementation accounted for differences in the development of discussion behaviors and skills. While the hybrid implementation in Hong Kong stimulated students to actively engage in discussions because the lectures reduced their feelings of uncertainty, the ‘full’ PBL implementation in the Middle Eastern case – and in the Dutch case – encouraged students to use the discussions to build knowledge, which stimulated them to engage in more critical discussions.

 

시사점
Implications

문화적 및 상황적 과제
Cultural and contextual challenges


이 연구결과는 [학생 중심 교육의 문화 간 적용 가능성에 대해 제기된 의구심]을 정당화한다. 그들은 또한 학생 중심의 토론 기반 교육 모델이 서구 문화보다 비서양 문화에서 더 많은 어려움이 많고, 학생들의 토론 행동과 기술 면에서 다른 과정과 결과를 초래한다는 것을 보여준다. 서구 사례와 두 개의 비서구 사례의 비교는 학생 중심의 토론에서 학생들의 행동과 기술에 영향을 미치는 [문화 간 차이의 개념적 모델]을 산출했다. 이 연구는 다른 맥락적 요소를 모델에 포함시킴으로써 [문화적인 요소]와 [연관된 맥락적 요소]의 주요 매개 역할을 강조하고, [문화적 요소와 토론 행동 및 기술 간의 관계가 간단하지 않다]는 가정을 정당화한다. 게다가 [맥락적 요인이 상당부분 관여한다는 것]은, 학생 중심의 토론 기반의 교육 방법이 [그 방법과 문화적 가치가 양립할 수 있는 서양 문화]를 포함하여, [모든 문화에서 어려움이 발생할 가능성]이 높으며, 여기에 [맥락적 요인이 더해져서 학생들의 적응을 복잡하게 할 수 있다]는 것을 암시한다. 그러나, 이러한 과제에도 불구하고, 이 연구는 다른 문화권에서 고등교육에서 학생 중심의 접근방식을 사용하는 것이 상당히 실현 가능하다는 것을 증명하는 것으로 보인다. 이 주장은 세 기관이 각각 10년 이상 이 모델을 적용해왔다는 사실에 의해 뒷받침된다. 분명히, 어려움은 학생 중심의 고등교육에서 문화적으로 다르고, 맥락에 따라 다르면서도 탄탄한 토론 과정과 공존할 수 있다.

The findings justify doubts that have been expressed (see the introductory discussion) about the cross-cultural applicability of student-centered education. They also show that a student-centered, discussion-based educational model poses more challenges in non-Western cultures than in a Western culture, leading to different processes and outcomes in terms of students' discussion behaviors and skills. The comparison of a Western case and two non-Western cases yielded a conceptual model of cross-cultural differences affecting students' behaviors and skills in student-centered discussions. By incorporating other contextual factors in the model, the study underscores the major mediating role of contextual factors in relation to cultural factors, and justifies the assumption that the relationship between cultural factors and discussion behaviors and skills is not straightforward. Moreover, the substantial involvement of contextual factors implies that a student-centered, discussion-based educational method is likely to pose challenges in any culture, including Western cultures in which cultural values might be compatible with the method, but other contextual factors could complicate students' adaptation. Despite these challenges, however, this study appears to demonstrate that it is quite feasible to use a student-centered approach in higher education in different cultures – a claim that is supported by the fact that the three institutions had each been applying the model for over a decade. Apparently, difficulties can coexist with cross-culturally different, context-specific, yet solid discussion processes in student-centered higher education.

개인주의의 복잡성-집단주의
The complexity of individualism–collectivism

이 연구는 집단주의적 동양문화와 개인주의적 서양문화의 구분이 학생들의 의사소통 행동에 반영되어 집단주의적 성향으로 인해 학생 중심의 교육이 비서양적 환경에서 더 많은 도전을 초래할 것이라는 기대를 확인하는 것으로 보인다. 이전의 연구는 [불확실성과 전통, 집단 관계와 체면, 위계 관계]와 같은 문화적 요소들이 모두 [집단주의]라는 문화적 개념과 관련이 있으면서, 상호 연관되어 있다는 것을 보여주었다. 하지만, 두 비서구적인 사례들은 또한 [경쟁과 성취]에 강한 초점을 두고 있었으며, 이는 종종 집단주의보다는 [개인주의]와 관련이 있다.
This study appears to confirm the expectation that a distinction between collectivistic Eastern cultures and individualistic Western cultures would be reflected in students' communication behaviors, and consequently, that student-centered education may pose more challenges in non-Western settings due to their collectivist orientation. Previous research showed that the cultural factors of uncertainty and tradition, group relations and face, and hierarchical relations are interrelated, while they were all related to the cultural concept of collectivism (Gudykunst 2005; Oetzel et al. 2001). However, the two non-Western cases were also characterized by a strong focus on competition and achievement, which is often associated with individualism rather than collectivism (Fontaine et al. 2008; Liao and Bond 2011).

이전의 많은 연구들은 [집단주의와 개인주의의 개념]이 일반적으로 생각하는 것보다 훨씬 더 복잡하다는 것을 시사했다. 예를 들어, 참여자들이 개인주의와 집단주의적 얼굴의 관심사 모두에서 높은 점수를 받은 홍콩의 연구들에서 증명되었다. 따라서, 어떤 사회는 어떤 측면에서는 집단주의로 정의될 수 있지만, 다른 측면에서는 개인주의로 정의될 수 있는데, 이것은 이 연구의 결과와 일치하는 것처럼 보인다. 문제는 이것이 토론 중심, 학생 중심 교육의 간문화적cross-cultural 구현에서 어떻게 이루어지느냐는 것이다. 본 연구의 결과는 성취의 개인주의적 요소에 초점을 맞추는 것이 집단주의적 요소의 효과를 완화할 수 있음을 보여준다. 다만, 이는 특정 맥락적 요소에 크게 의존적이며, 특히 평가 시스템이 그러하다. 추가 연구는 어떻게 집단주의와 개인주의적인 요소들이 문화 전반에 걸친 고등교육에서 토론 과정을 최적화하기 위한 균형으로 사용될 수 있는지 조사할 수 있다.

A number of previous studies has suggested that the concepts of collectivism and individualism are far more complex than is generally thought, as for example is evidenced by studies in Hong Kong, in which participants scored high on both individualism and collectivistic face concerns (Hwang, Francesco, and Kessler 2003; Liao and Bond 2011). Thus, some societies may be defined as collectivistic in certain aspects, but as individualistic in others, which seems consistent with this study's findings. The question is how this plays out in the cross-cultural implementation of discussion-based, student-centered education. The results of the current study suggest that a focus on the individualistic factor of achievement – which also other studies have found to be of major importance in Hong Kong and of influence on Hong Kong students (Brown and Wang 2011) – can mitigate the inhibiting effects of collectivistic factors, although this depends heavily on certain contextual factors, notably the assessment system. Further research might investigate how collectivistic and individualistic factors can be used as a balance to optimize discussion processes in higher education across cultures.

학습 접근법의 유연성
The flexibility of learning approaches

학생 중심 교육은, 비서구 환경에 있는 학생이나 교사와 특정의 과제에 직면하고 있는 것처럼 보이지만, 그 결과, 비서구권 학생은 어느 정도, 커뮤니케이션이나 토론에 관한 학습 행동을 서구 학생 중심 모델에 맞추어 조정하고 있는 것을 알 수 있다. 그러나 동시에, 비서양의 문화적 배경과 맥락적 배경은 이러한 행동과 기술의 개발을 방해할 수 있다. 흥미롭게도, 이전 연구들은 [서양에서 공부하던 중국 학생들]이 서양의 방식에 맞게 다른 학습 방식을 적응시킬 수 있거나, 적어도 [같은 과정을 중국에서 수강하는 학생들]보다 그들의 방식을 더 잘 적응시킬 수 있다는 것을 보여주었다. 그래서, 학생들이 다른 문화 환경에서 배우는 경우 그들의 학습 방식을 매우 바꿀 수 있는 반면, 그들 자신의 문화 환경(학습 및 토론 접근방식이 덜 유연하지만, 여전히 변화할 수는 있는)에 새로운 방법을 적용하면 더 많은 문제에 직면할 수 있다.

Although student-centered education seems to confront students and teachers in non-Western settings with specific challenges, the results indicate that non-Western students, to a certain degree, do adapt their learning behaviors in respect of communication and discussion to fit with the Western student-centered model. At the same time, however, a non-Western cultural and contextual background may inhibit the development of these behaviors and skills. Interestingly, previous studies have showed that Chinese students who were studying in the West were very capable of adapting their different learning approach to fit with the Western method (Gieve and Clark 2005; Gu and Schweisfurth 2006), or at least adapted their approaches more than students taking the same course in China (Wang, Harding, and Mai 2012). So, while students might be very able to change their learning approach when learning in a different cultural environment, they may encounter more problems when a new method is applied in their own cultural setting, in which their learning and discussion approaches seem to be less flexible, but still able to change.

제한사항 및 결론
Limitations and conclusions

본 연구의 한계는 자체 보고 인터뷰 데이터에 대한 의존도가 높다는 점이며, 이는 주의 깊게 해석되어야 한다. 그러나 데이터의 신뢰성은 서로 다른 소스 및 서로 다른 참가자 그룹의 데이터를 삼각측량함으로써 향상되었다. 두 번째 한계는 종적이 아닌 단면적 학생 표본이 개별 학생의 실제 장기 발달에 대한 조사를 방해했다는 것이다. 그러나 면접에서 3학년 학생들은 대학에 입학한 이후 그들의 발전에 집중하라는 요구를 분명히 받았다. 1학년이 된 기분이 어땠는지에 대한 그들의 기억은 연구에서 1학년 학생들이 표현한 견해와 대체로 일치했다.
A limitation of the study is its heavy reliance on self-reported interview data, which should be interpreted with caution. The trustworthiness of the data, however, was enhanced by triangulation of data from different sources and different groups of participants. A second limitation is that the cross-sectional rather than longitudinal student sample prevented investigation of the actual long-term development of individual students. However, in the interviews the third-year students were explicitly asked to focus on their development since their enrolment in university. Their recall of what it felt like to be a first-year student generally coincided with the views expressed by the first-year students in the study.

이 정성적 연구의 결과는 일반화에 도움이 되지 않는다. 그러나, 연구자는 관련 인자에 대한 두꺼운 설명을 제공함으로써 연구의 전이가능성이 향상되었기 때문에, 자신의 환경에 적용할 수 있다고 생각하는 측면과 시사점을 결과로부터 얻을 수 있다. 미래의 연구는 비슷한 문화적 환경뿐만 아니라 다른 다양한 상황에서 더 많은 사례를 조사할 수 있으며, 나아가 논의의 측면을 넘어 학생 중심 교육의 다른 측면에 초점을 맞출 수도 있다. 이 연구에서 제시된 개념 모델은 그러한 연구의 출발점이 될 수 있다.
The findings from this qualitative study do not lend themselves to generalization. However, researchers might take from the results those aspects and implications they deem applicable to their own setting, as the study's transferability was enhanced by providing thick description of the factors involved. Future research might investigate more cases in different as well as in similar cultural settings, and furthermore focus on other aspects of student-centered education beyond the discussion aspect. The conceptual model presented in this study could serve as a starting point for such research.

이번 연구결과는 여러 문화에 걸쳐 고등교육자들이 문화간cross cultural 차이에 대한 미래 연구는 [맥락적 요소의 역할]을 고려해야 하며, 특히 [문화적 요소의 영향을 중재하는 맥락적 요소]를 연구해야 한다. 다른 문화 발견의 맥락화를 통해 연구의 생태학적 타당성은 실제 상황에 더 잘 근접할수록 증가할 수 있다. 맥락과 문화의 영향에 초점을 맞춤으로써, 이 연구는 [학생 중심 교육]의 과정과 결과, 또는 학생의 행동과 기술이 [맥락]에 따라 다를 수 있다는 것을 인정하면서도, 학생 중심 교육의 문화 간cross-cultural 적용 가능성에 대한 증거를 제공했다.

The results of the current study emphasize that educationalists in higher education across cultures, and future research on cross-cultural differences in education should consider the role of contextual factors, specifically in mediating the effects of cultural factors. By contextualization of cross-cultural findings the ecological validity of a study can be increased as it better approximates real-life situations. By focusing on the influence of context and culture, this study has provided evidence for the cross-cultural applicability of student-centered education, although it should be accepted that its process and outcome, or students' behaviors and skills, are likely to differ across contexts.

 

 


Abstract

A tool used in student-centered education is discussion among students in small learning groups. The Western origin of student-centered education, coupled with cross-cultural differences in communication styles, may detract from its cross-cultural applicability. This study investigates how in student-centered education, students' cultural backgrounds are expressed in discussions and shape students' discussion behaviors and skills. A comparative case study using problem-based learning as a student-centered model was conducted in three medical schools located in East Asia, Western Europe and the Middle East. Four cultural factors were found to potentially cause students, especially those in the non-Western schools, to refrain from speaking up, asking questions, and challenging others in discussions. Six contextual factors mediated the influence of the cultural factors. The findings were incorporated in a conceptual model. The conclusion seems justified that student-centered education is feasible in different cultural contexts, but across these contexts, processes and outcomes are likely to differ.

 

학습자 동기부여를 촉진하기 위한 임상교육자의 가이드(AMEE Guide No. 137) (Med Teach, 2020)
The clinical educator’s guide to fostering learner motivation: AMEE Guide No. 137
Kayley M. Lyonsa , Jeff J. Cainb , Stuart T. Hainesc , Danijela Gasevicd and Tina P. Brocka

 

 

서론
Introduction

학습자의 의욕은, 학생으로부터 프로페셔널에 이르기까지, 그리고 강의실에서 시뮬레이션 실험실, 임상 배치에 이르기까지, 모든 교육 레벨에서 필수적입니다. 배우고자 하는 욕구가 없으면 학습자는 학습에 필요한 노력을 기울이지 않을 것이다. 강한 의욕을 가진 사람들은 더 많은 노력을 기울일 뿐만 아니라, 도전적인 개념이나 기술을 배울 때 생기는 불가피한 좌절에도 더 탄력적이다. 교실 안팎의 임상교육자는 학습활동 설계, 교육전략의 실시 및 긍정적인 학습환경의 조성을 통해 학습자의 동기부여에 중요한 역할을 합니다. 예를 들어, 건강 전문가 학생은 다양한 업무, 관리자의 열정, 그리고 그들이 받은 피드백의 질로 인해 배치에 더 많은 동기를 부여할 수 있습니다. 이 동기 부여로 인해 학생은 더 많은 책을 읽고, 추가적인 학습 활동에 참여하고, 더 나은 질문을 할 수 있습니다.
Learner motivation is essential at every level of education, from student to professional, and in every setting, from lecture halls to simulation laboratories to clinical placements. Without a desire to learn, learners will not put forth the necessary effort to learn (Bandura 1977; Cook and Artino 2016). Not only do individuals with strong motivation put forth more effort, but also they are more resilient to the inevitable setbacks that arise when learning challenging concepts or skills. Clinical educators, within and outside the classroom walls, play a key role in learner motivation through the design of the learning activities, implementation of instructional strategies, and creation of positive learning environments (Kusurkar et al. 2011b). For instance, a health professional student may find a placement more motivating due to the variety of tasks, enthusiasm of the supervisor, and quality of feedback they received. This motivation then may lead the student to read more, engage in additional learning activities, and ask better questions.


학습 과정에서 학습자의 노력, 관심 및 소유권에 영향을 미치는 것을 이해하려는 몇 가지 동기 부여 이론이 있습니다.
There are several motivation theories that attempt to understand what influences learner effort, interest, and ownership in the learning process.

  • 자기결정이론은 학습자의 자율성(자신의 행동에 대한 통제), 역량(자기효율성), 관계성(소속감 및 유대감)에 대한 요구가 충족될 때 내적 동기부여가 촉진된다고 가정한다(Ryan과 Deci 2000b).
  • 목표 지향 이론은 학습자의 성취 동기 부여에 영향을 미치는 것을 중심으로 합니다. 성과 목표(예: 높은 성적 획득)를 지향할 때, 학습자는 주로 다른 사람의 판단(예: 교육자의 평가)에 관심을 갖는다. 이와는 대조적으로, 숙달 목표 지향의 학습자는 학습한 내용의 본질적 가치에 의해 동기 부여됩니다.
  • 귀인 이론은 학습자의 성공과 실패에 대한 해석이 중요하다는 것을 시사한다. 학습자들은 다양한 정도의 성공 또는 실패를 개인적인 노력, 타고난 능력, 다른 사람, 그리고 운 탓으로 돌린다. 이러한 속성은 차례로 미래의 성공 가능성에 대한 그들의 미래 믿음에 영향을 미친다(Weiner 1985).
  • 기대-가치-비용 이론에 따르면, 동기 부여는 학습자가 성공할 것이라고 믿고(기대), 과제를 중요하게 인식하고(가치), 과제와 관련된 단점(비용)을 고려하는 정도에 의해 영향을 받는다(Barron and Hulleman 2015).
  • 상황학습이론Situative learning theory은 학생들이 사회적 지위에 대한 욕구에 의해 동기부여를 받는다고 가정한다. 상황 학습 이론에서 중요한 것은 의료 공동체에서 존경받는 구성원이 되고자 하는 학습자의 욕구를 이용하는 것이다.

  • Self-determination theory posits that internal motivation is fostered when learners’ needs are met for autonomy (control over one’s actions), competence (self-efficacy), and relatedness (sense of belonging and connectedness) (Ryan and Deci 2000b).
  • Goal-orientation theory centers around what influences the learners’ motivations for achievement. When oriented toward performance goals (e.g. earning high grades), learners are primarily concerned about the judgment of others (e.g. the educator’s evaluation). In contrast, learners with a mastery goal orientation, are motivated by the intrinsic value of what is being learned (Elliot and Hulleman 2017).
  • Attribution theory suggests that learners’ interpretations of their successes and failures are what matters. Learners attribute success or failure in varying degrees to personal effort, innate ability, other people, and luck. These attributions, in turn, influence their future belief in the likelihood of their future success (Weiner 1985).
  • According to expectancy value cost theory, motivation is influenced by the degree to which the learner believes they will be successful (expectancy), perceives the task as important (value), and considers the task-related downsides (costs) (Barron and Hulleman 2015).
  • Situative learning theory postulates that students are motivated by a desire for social standing. What matters in situative learning theory is tapping into the learner’s desire to be a respected member of the health care community (Lave and Wenger 1991).

학습자의 동기를 최적화하는 '실버블릿' 전략은 없지만, 70년 이상의 연구를 통해 학습자의 동기 부여에 대한 설득력 있는 증거가 제시되었습니다. 학습 의욕은 궁극적으로 학습자의 책임이지만, 교육자는 학습자의 동기 부여에 중요한 역할을 합니다. 저자는 스토리 사용, 사고방식 개입, 강사-학습자 관계 개선 등 학습자 동기를 높이기 위해 설계된 수많은 교육 개입을 요약했다(Lin-Siegler et al. 2016). 강사가 성공적으로 적용한 다른 전술로는 교육용 게임 사용(Klein과 Freitag 1991), 학습자와 관련된 콘텐츠 만들기(Frymier와 Shulman 1995), 관심을 끌기 위한 개념 트리 구현(Hirumi와 Bowers 1991) 등이 있다.
Although there is no ‘silver bullet’ strategy to optimise learner motivation, over 70 years of research has produced persuasive evidence on what motivates learners (Maslow 1943; Bandura 1977; Lepper et al. 2005; Cook and Artino 2016). Motivation to learn is ultimately the responsibility of learners; however, educators play an important role in influencing learner motivation. Authors have summarized numerous instructional interventions designed to increase learner motivation, including the use of stories, mindset interventions, and improving instructor-learner relationships (Lin-Siegler et al. 2016). Other tactics that instructors have applied successfully include using an instructional game (Klein and Freitag 1991), focusing on making content relevant to learners (Frymier and Shulman 1995), and implementing concept trees to gain attention (Hirumi and Bowers 1991).

임상 교육자의 과제
The challenge for clinical educators

보건 전문가 교육은 이론 기반의 입증된 학습 동기 부여 전략을 더 많이 적용하는 것으로부터 이익을 얻을 수 있습니다. 그러나, 학생 동기 부여 문헌의 대부분은 전문 용어에 익숙하고 학습 이론을 해석하는 데 익숙한 교육 심리학 독자들을 대상으로 하고 있다. 따라서 동기 이론과 연구는 많은 임상학 교육자들에게 덜 다가갈 수 있습니다. 또한, 학생 동기 부여 문헌은 크고 중복된다. 새로운 임상 교육자가 각각의 동기 이론이 학습 이론의 더 넓은 그림에 어떻게 들어맞는지 이해하는 것은 어려울 것이다. 또한, 임상 교육자는 다양한 교육 전략을 알고 있을 뿐만 아니라 각 교육 전략에 대해 누가, 무엇을, 어디서, 언제, 왜, 어떻게 이해해야 합니다. 이건 너무 벅찰 수 있어요.
Health professions education would benefit from a greater application of theory-based, research-proven learning motivation strategies. However, much of the student motivation literature is directed at an educational psychology audience who is familiar with the professional jargon and is comfortable with interpreting learning theory. Thus, motivation theory and research may be less approachable for many clinician educators. Also, student motivation literature is large and overlapping. It would be difficult for a new clinical educator to understand how each motivation theory fits into the broader picture of learning theories. Furthermore, to be successful, clinical educators need to not only know of a wide variety of instructional strategies, but also have an understanding of the who, what, where, when, why, and how for each instructional strategy. This can be overwhelming.

모티베이션 이론에 익숙한 은유 적용
Applying familiar metaphor to motivation theory

모티베이션 이론과 연구를 보다 접근하기 쉽게 하기 위해 모티베이션 이론과 연구를 의료 전문가에게 친숙한 언어로 번역했습니다. 약물요법 논문과 마찬가지로, 학생의 의욕을 촉진하기 위한 개입을 그 징후, 행동 메커니즘, 투여, 투여, 부작용, 모니터링 등을 기술한 전략 논문으로 분류했다. 표 1은 이들 용어를 비교한 것입니다.

To make motivation theory and research more approachable, we have translated motivation theory and research into language familiar to health professionals. Similar to medicine treatment monographs in drug compendia, we have categorized interventions for fostering student motivation into strategy monographs describing their indications, mechanism of action, administration, dosing, side effects, and monitoring. Table 1 compares these terminologies.

 

우리와 많은 다른 사람들은 과학을 배우는 것이 임상 과학보다 문화적이고 맥락에 의존적이라고 주장하지만(Brown et al. 1989), 임상 교육자들은 임상 과학에 대한 이해를 동기 부여 과학에 적용할 수 있다. 단순화하자면, 동기 부여는 소스, 프로세스, 영향력자 및 결과의 시스템으로 볼 수 있습니다. 동기 부여 결과(예: 노력)를 개선하는 최선의 방법은 [학습자 동기 부여와 관련된 요소를 신중하게 평가하고 목표로 하는 것]이다. 동기 부여에서 학습자의 행동과 관련된 요소는 학습, 과제, 환경, 동료 및 교육자에 대한 믿음일 수 있습니다. 예를 들어, 학생은 1차 진료에서 실습하기를 원하지만 중환자실에 대한 학습이 자신의 미래에 얼마나 중요한지 알지 못하기 때문에 중환자실 배치에 최소한의 노력을 기울일 수 있다. 따라서 의료 처치를 환자의 특징과 선호도에 맞게 개인화하는 것과 마찬가지로, 학습자의 동기를 개선하기 위한 전략은 시간이 지남에 따라 개인화되고 수정되어야 한다. 한 시점에서 학생에게 흥미를 주는 것은, 다른 시점에서는 효과가 없을지도 모른다. 한 학생에게 흥미로운 것은 다른 학생에게는 흥미롭지 않을 수 있다. 따라서 교육자는 학습자의 동기부여를 촉진하기 위한 전술의 종류뿐만 아니라 이러한 전술이 왜 어떻게 작동하는지 이해하는 것도 중요합니다.

Although we and many others argue that learning science is more cultural and context-dependent than clinical science (Brown et al. 1989), clinical educators can still apply their understanding of clinical science to the science of motivation. As a simplification, motivation can be viewed as systems of sources, processes, influencers, and outcomes. The best way to improve motivational outcomes (e.g. effort) is to carefully evaluate and target the factors related to learner motivation (Harackiewicz and Priniski 2018). In motivation, the factors related to learners’ behaviours may be their beliefs around learning, the task, the environment, their peers, and the educator. For example, a student may be putting forth minimum effort on a critical care placement because they want to practice in primary care and do not see how the learning about critical care will be important to their future. Therefore, akin to how medical treatments should be personalized to patient characteristics and preferences, strategies to improve learner motivation must be personalized and modified over time. What may engage students one day, may not work the next. What is interesting to one student, may not be interesting to another. Therefore, it is crucial for educators to not only know the types of tactics for fostering learner motivation but also to understand why and how these tactics work.

임상 교육자를 지원하기 위해 학습자의 동기를 촉진하는 개입을 Vansteenkiste 등의 작업에 따라 부분적으로 세 그룹으로 분류했다. 마찬가지로, 이러한 개입은 다양한 경로를 통해 학습자의 동기를 목표로 한다.

  • 동기 부여 강도 증가— 특정 행동에 대한 학습자 [동기 부여 상태(강력, 양)]를 증가시키기 위한 개입
  • 동기 부여 퀄리티 향상— 학습자의 [동기 부여 유형(즉, 활동에 참여하는 이유)]에 영향을 미치는 개입
  • 동기 부여 노하우 향상— 자신의 동기 부여를 위한 [전술과 전략에 대한 학습자의 지식]을 높이기 위한 개입(즉, 동기 부여 규제 전략).

To assist clinical educators, we have categorized interventions that foster learner motivation into three groups based, in part, by work from Vansteenkiste et al. (2009). In the same way, these interventions target learner motivation via different pathways:

  • Increasing motivation intensity—includes interventions to increase (i.e. strength, quantity) learner motivational state, willingness, and behaviour for a specific action (Vansteenkiste et al. 2009)
  • Enhancing motivation quality—includes interventions to influence the type of motivation for the learner (i.e. why they are engaged in the activity).
  • Improving motivation know-how—includes interventions to increase learner knowledge of tactics and strategies for motivating oneself (i.e. motivation regulation strategies).

 

다음 섹션에서는 기원, 메커니즘 및 결과를 포함한 각 치료 클래스의 기본 이론을 설명한다. 교육자가 사용할 수 있는 구체적인 전략(즉, 개입)과 이를 뒷받침하는 근거를 개략적으로 설명합니다. 임상 교육자가 다양한 환경(즉, 임상 배치, 강의실 및 온라인 학습)에서 개입을 구현하는 방법의 예를 설명한다. 각 섹션의 대응표에는 주요 용어, 표시, 일반 관리, 행동 메커니즘, 투여, 부작용, 모니터링이 정리되어 있다.

In the following sections, we describe the underlying theories of each therapeutic class including origins, mechanisms, and outcomes. We outline specific strategies (i.e. interventions) educators can use and the evidence to support them. We describe examples of how clinical educators may implement the interventions in different settings (i.e. clinical placements, the classroom, and online learning). In each section’s corresponding table, we outline key terms, indications, general administration, mechanism of action, dosing, side effects, and monitoring.

치료 클래스 1: 동기 부여 강도 증가
Therapeutic class 1: increasing motivation intensity

개요 및 이론적 기초
Overview and theoretical underpinnings

학습자 동기 부여의 강도(즉, 강도)는 다음에 의해 결정됩니다. 

  • 동기 부여 상태(예: '동기부여된 느낌이에요'),
  • 특정 행동을 보여주는 것(예: 참여)
  • 동기 부여 신념과 인식(예: '잘 할 자신이 있다')

The strength (i.e. intensity) of learner motivation is determined by

  • the motivational state (e.g. ‘I feel motivated’),
  • displaying certain behaviours (e.g. participation), and
  • holding motivational beliefs and perceptions (e.g. ‘I’m confident I will do well’).

[동기부여의 신념과 인식]은 다음과 같습니다.
Motivational beliefs and perceptions include:

  • 학습자의 과제 난이도 인식(McCaslin 및 Hickey 2001)
  • 과제의 중요성 (Wigfield 등 2017)
  • 교육자 배려에 대한 인식(1998년 Wentzel 및 Wigfield)
  • 학습자 흥미 (Renninger 및 Hidi 2011)
  • 자기 능력에 대한 인식 (Schunk and Pajares 2005).
  • Learner perceptions of task difficulty (McCaslin and Hickey 2001)
  • Task importance (Wigfield et al. 2017)
  • Perceptions of educator caring (Wentzel and Wigfield 1998)
  • Learner interest (Renninger and Hidi 2011)
  • Perceptions of self-competence (Schunk and Pajares 2005).

긍정적인 [동기 부여 신념과 인식]은 [동기 부여 상태, 참여 및 행동]으로 이어집니다.

  • [동기부여 신념과 인식]이 최적화되면 학습자는 학습에 대한 심층적 접근법을 사용하여 자신의 학습을 적응적으로 조절합니다. 예를 들어, 주제(예: 심장학)에 대한 관심이 발달한 학습자는 행동적으로 참여(예: 추가 자료 읽기)하고 해당 주제에 대한 미래 기회를 모색할 가능성이 높다. 학습자는 프롬프트 없이 질병 상태에 대해 읽고 추가적인 연습 기회를 요청할 수 있습니다.
  • [동기부여 상태와 행동]은 또한 [가르침instruction]과 [학습자 성취] 사이의 중재자 역할을 합니다. 예를 들어, 행동 참여도가 높은 학습자는 더 높은 점수와 시험 점수를 달성하고 인턴쉽을 달성하며 환자 치료에 긍정적인 영향을 미칠 수 있다.
  • [동기부여 신념과 인식]은 노력, 지속성 및 선택을 직접 예측하며, 이는 학교, 직장, 사회 환경 및 일상생활에서의 성공을 예측합니다(Marsh et al. 2017).

Positive motivational beliefs and perceptions lead to heightened motivational states, engagement, and behaviours (Wigfield and Guthrie 2000).

  • When motivational beliefs and perceptions are optimized, learners use a deeper approach to learning (Heikkilä and Lonka 2006) and adaptively regulate their own learning (Paris and Turner 1994). For example, a learner with a developed interest in a subject (e.g. cardiology) is more likely to be behaviourally engaged (e.g. reading additional materials) and seek future opportunities in that subject (Renninger and Bachrach 2015). The learner might read about a disease state without prompting and ask for additional practice opportunities.
  • Motivational states and behaviours also serve as a mediator between instruction and learner achievement (Wigfield and Guthrie 2000). For example, a learner with more behavioural engagement may then achieve higher marks and test scores, attain an internship, and positively affect the care of patients.
  • Motivational beliefs and cognitions directly predict effort, persistence, and choices (Wigfield et al. 2017), which, in turn, predict success in school, the workplace, social settings, and daily living (Marsh et al. 2017).

 

모티베이션 강도를 높이기 위한 네 가지 개입
Four interventions to increase motivation intensity

동기 부여 강도를 높이기 위해 임상 교육자는 다음을 수행해야 합니다.

  • 난이도가 적절한 학습 과제를 제공하다
  • 학습자의 호기심과 흥미를 불러일으키다
  • 열정을 모델링하고, 감정적 관심을 보여준다
  • 과제의 관련성 및 유틸리티를 생성

To increase the level of motivation intensity, clinical educators should:

  • Provide optimally challenging learning tasks
  • Spark curiosity and interest among learners
  • Model enthusiasm and show affective concern
  • Create task relevance and utility

학습자 동기 부여의 강도를 높일 수 있는 이 치료 그룹 아래의 네 가지 예시적 개입에 대해서는 보충표 S1을 참조한다. 이 치료 수업에서 다른 개입 유형과 예는 학습자의 관심 증가(Harackiewicz와 Priniski 2018)와 자신의 역량에 대한 인식을 위해 찾을 수 있다.
See Supplementary Table S1 for four exemplary interventions under this therapeutic group that can increase the intensity of learner motivation. Other intervention types and examples, under this therapeutic class, may be found for increasing learner interest (Harackiewicz and Priniski 2018) and perceptions of their own competence (Bandura 1997).

 

난이도가 적절한 학습 과제를 제공
Providing optimally challenging learning tasks

학습자의 [과제 난이도에 대한 인식]이 중요합니다. 교육자는 학습 과제를 선택하고 설계할 때 너무 쉽지도, 너무 어렵지도 않다는 Goldilocks 원칙을 따라야 합니다.이 원칙은 도전적이면서도 부담스럽지 않아야 합니다. 예를 들어, 배치 감독자는 학생이 검토할 수 있도록 할당한 환자의 수와 복잡성을 최적화하여 학생의 과제가 줄어들수록 난이도를 높일 수 있습니다. 교실에서 교육자는 질문의 난이도를 최적화할 수 있습니다. 과제가 너무 쉬우면 학습자는 지루해지지만 너무 어려워질 수 있습니다. 학습자는 자제하거나 정신적 지름길을 택할 수 있습니다. 이 원칙은 온라인 학습에도 적용된다. 온라인 학습을 설계하는 한 가지 방법은 비디오 게임 이후 온라인 학습을 모델링하는 것이다. 비디오 게임은 학습자가 쉬운 과제를 숙달한 후에 난이도를 높인다. 예를 들어 온라인 모듈은 더 어려운 콘텐츠로 넘어가기 전에 마스터 퀴즈를 요구할 수 있습니다.
Learner perceptions of task difficulty matters (Paris and Turner 1994; McCaslin and Hickey 2001). When selecting and designing learning tasks, educators should follow the Goldilocks Principle of not too easy and not too hard—a task should be challenging, but not overwhelming. For example, placement supervisors could optimize the number and complexity of patients they assign for students to review, assigning more difficulty as the challenge decreases for the student. In the classroom, educators could optimize the difficulty of the questions they ask. If the task is too easy, learners may become bored, yet with too much difficulty; learners may withdraw or take mental shortcuts. This principle is also applicable to online learning. One way to design online learning could be modelling online learning after video games. Video games increase the level of difficulty after learners master easier tasks. For example, an online module could require mastery quizzes before moving onto content that is more difficult and subsequently more difficult quizzes.

최적의 난이도는 '몰입'으로 이어질 수도 있습니다. 이는 학습자가 경험하는 동기 부여의 몰입 상태로서, 시간 감각을 잃는 것이다. 예를 들어, 학습자는 몇 시간 동안 저널 기사를 검색하면서 질문에 대한 답을 찾으려고 열중할 수 있습니다. 학습자가 최적으로 도전적인 과제를 성공시키면, 그 결과는 역량 자기 인식의 증가입니다(예: 자신감, 자기 효율성).

Optimal challenges may also lead to ‘flow’ (Csikszentmihalyi 1997); an absorbing state of motivation that learners experience, losing their sense of time. For example, a learner may become absorbed trying to find an answer to a question, searching journal articles for hours. When a learner succeeds over an optimally challenging task, the result is an increase in their competence self-perceptions (e.g. confidence, self-efficacy) (White 1959; Marsh et al. 2017).

호기심과 흥미를 불러일으키다
Sparking curiosity and interest


학습자의 [관심과 호기심이 유발]되면 개인적 관심사가 잘 발달될 수 있습니다. 교육자는 학습 경험을 시작할 때 참신함, 놀라움 및 토론을 통해 학습자의 흥미를 유발하는 방법을 파악할 수 있습니다. 예를 들어, 임상 감독관이 임상 논쟁을 논의할 때 학습자의 관심이 최고조에 달할 수 있다. 교실 교육자는 학생들이 답을 밝히기 전에 질문에 대한 답을 예측하게 함으로써 놀라움을 줄 수 있습니다. 온라인 학습에서는 참신함이 자주 사용됩니다. 사실, 새롭게 인식되는 것은 교육 기술에 대한 학습자의 동기를 예측합니다. 그러나 '새로움 효과novelty effect'는 시간이 지날수록 희미해지는 것으로 알려져 있다.

If learner interest and curiosity is triggered, it may lead to well-developed personal interests (Renninger and Hidi 2011). At the beginning of the learning experience, educators may identify ways to spark learner interest through novelty, surprise, and debate. For example, learner interest may be peaked when clinical supervisors discuss clinical controversies. Classroom educators can create surprises by having students predict answers to questions before they reveal the answer. For online learning, novelty is often used. In fact, perceived novelty predicts learner motivation for education technology. However, the ‘novelty effect’ is known to fade over time (Jeno et al. 2019).

열정 모델링 및 정서적 관심 표시
Modelling enthusiasm and showing affective concern

[교육자와의 관계 및 교육자에 대한 인식]으로 인해 학습자의 동기 부여가 증가할 수 있습니다. 학습자는 열정적인 교육자에 대한 선호도를 설명하는 경우가 많습니다(Mitchell 2013). 주제에 대한 관심은 특히 학습자가 그 사람을 존중하거나 관련시킬 때 전염될 수 있습니다. 일화적으로, 많은 학습자들이 전직 교사의 열정 때문에 직업, 특기 또는 연습 환경을 선택했다고 말한다. 많은 교육자들은 그들이 왜 어떤 주제를 즐기거나 그것이 중요하다고 믿는지에 대해 이야기를 나눌 때 그들의 열정을 드러낸다. 예를 들어, 많은 학습자들은 그들의 학습을 실제 환자들과 연결하는 이야기에 감동합니다.
Learner motivation may increase due to their relationship with and perceptions of the educator. Learners often describe their preference for enthusiastic educators (Mitchell 2013). An interest in a topic can be contagious, especially when the learner respects or relates to that person. Anecdotally, many learners indicate they chose a profession, specialty, or practice setting due to a former teacher’s passion. Many educators often reveal their enthusiasm when they share their stories for why they enjoy a topic or believe it is important. For example, many learners are moved by stories connecting their learning to real patients.

교육자-학습자 관계의 또 다른 동기부여 측면은 학습자가 자신의 [교육자가 자신의 행복을 얼마나 아끼고 있는지]를 믿는 것입니다. 학습자는 교육자가 인간으로서 자신을 돌본다고 믿을 때 무의식적으로 존엄성과 소속감을 느낀다. 품위와 소속감은 학생 동기 부여의 기본이다. 품위나 소속감이 없다면, 학습자들은 주저하고 학습 주제나 환경이 '그들에게 맞지 않는다'고 생각하기 쉽다. 임상 현장에서 임상 교육자는 학생들을 체크하고 어떻게 지내는지 물어봄으로써 보살핌을 보여줄 수 있다. 강의실 교육자는 학생들의 학업과 시간 관리에 대한 압박감을 이해한다는 것을 보여줄 수 있습니다.

Another motivating aspect of the educator–learner relationship is how much a learner believes their educator cares for their well-being. Learners subconsciously feel dignity and belonging when they believe their educator cares for them as a person (Baumeister and Leary 1995). Dignity and belonging are fundamental to student motivation. Without dignity or belonging, learners are likely to withdraw and think the learning topic or environment is ‘just not for them.’ In clinical placements, clinical educators could show caring by checking in with students and asking them how they are doing. Classroom educators could show they understand students’ studying and time management pressures.

과제 관련성 및 유틸리티 생성
Creating task relevancy and utility

학습 과제의 관련성과 유용성에 대한 학습자의 인식이 동기 부여의 강도를 결정합니다. 학습자는 과제 가치에 대한 인식을 가지며, 다음을 통해 판단됩니다.

  • 달성 가치 — 성공에 대한 상대적 중요성
  • 효용 가치 미래에 대한 중요성
  • 내재적 가치 — 작업에서 오는 지속적인 즐거움

The learner’s perceptions of the relevance and usefulness of the learning task determine the strength of their motivation (Eccles et al. 2005). Learners perceptions of task value and are determined by:

  • Attainment value—relative importance for succeeding
  • Utility value—importance for the future
  • Intrinsic value—inherent enjoyment from task

흔히 볼 수 있는 관행과는 달리, 학습자에게 작업의 가치를 말해주기 보다는 보여주는 것이 중요합니다. 학습자에게 과제의 중요성을 "말하면" 역효과가 날 수 있습니다. 대신 임상 교육자는 중요성을 보여주거나 학습자가 과제의 가치를 옹호하도록 해야 합니다. 예를 들어, 임상 교육자는 포괄적인 환자 기록을 가져가고 이것이 어떻게 환자 결과를 향상시키는지 보여줄 수 있다. 강의실 교사 또는 교육 기술은 학습자가 주제 또는 과제가 현재 삶 또는 미래에 중요한 이유를 묻는 질문에 응답하도록 할 수 있습니다(즉, 학습자가 과제 가치를 옹호하도록 함).

Contrary to commonly seen practices, it is important to show learners the value of the task rather than tell them. Telling learners the importance of the task can backfire (Harackiewicz and Priniski 2018). Instead, clinical educators should either show the importance or have the learner advocate for the task’s value. For example, a clinical educator might demonstrate taking a comprehensive patient history and show how this led to an improved patient outcome. A classroom teacher or educational technology could have learners respond to prompts asking them why a topic or task is important to their current lives or their future (i.e. have learners advocate for task value).

 

치료 클래스 2: 동기 부여 품질 향상
Therapeutic class 2: enhancing motivation quality

개요 및 이론적 기초
Overview and theoretical underpinnings

학습자 모티베이션의 질은 학습자의 사고방식, 목표의 원천 및 능력에 대한 속성에 따라 결정됩니다. 동기 부여의 질은 참여, 노력, 지속성 및 장기적인 성과와 관련이 있습니다. 동기 부여 품질을 향상시키는 개입은 학습자의 학습 능력을 향상시킵니다.

  • 역량의 가단성에 대한 신념(성장 마인드) (Dweck and Molden 2017)
  • 자율성(예: 내적 동기 부여) (Ryan 및 Deci 2000b)
  • 성과 목표와 균형을 이룬 내용 숙달을 향한 열망(즉, 숙달 목표와 성과 목표 지향) (Elliot 및 Hulleman 2017)
  • 전문직 또는 학교 내에서의 정체성 형성(1991년 Lave 및 Wenger)
  • 소속감 (1995년 바우미스터와 리어리)
  • 노력과 전략이 학업 실패/성공과 인과 관계가 있다는 믿음(즉, 적응적 인과 귀인)(Perry and Hamm 2017).

The quality of learner motivation is determined by learners’ mindsets, sources for goals, and attributions for their competence. Motivation quality is associated with engagement, effort, persistence, and long-term achievement. Interventions that enhance motivation quality increase the learner’s:

  • Belief that competence is malleable (i.e. growth mindset) (Dweck and Molden 2017)
  • Autonomy (e.g. intrinsic motivation) (Ryan and Deci 2000b)
  • Desire to achieve content mastery balanced with a focus on performance goals (i.e. mastery and performance approach goal orientation) (Elliot and Hulleman 2017), and
  • Identity formation within a profession or school (Lave and Wenger 1991),
  • Feelings of belonging (Baumeister and Leary 1995)
  • Belief that their effort and strategy are causally related to their academic failures and successes (i.e. adaptive causal attributions) (Perry and Hamm 2017).

종종 학습자 [동기 부여의 질적 변화]는 [동기 부여 강도의 증가]와 관련이 있으며, 이는 다시 성과를 예측한다. 예를 들어,

  • 내재적 동기(즉, 퀄리티)는 흥미, 흥분, 역량 자기 인식(즉, 강도)을 예측하여 [더 높은 지속성과 더 높은 성과]로 이어집니다.
  • [목표 지향]은 [학습자가 학습 과제, 행동 및 전략을 인식하고 경험하고 선택하는 방법]에 영향을 미칩니다.
  • 또한, [인과 귀인]은 [미래의 노력, 지속성 및 성과]를 결정합니다.

Often a shift in the quality of learner motivation is associated with increased motivation intensity, which in turn predicts performance.

  • For example, intrinsic motivation (i.e. quality) predicts interest, excitement, competence self-perceptions (i.e. intensity) that leads to greater persistence and higher performance (Ryan and Deci 2000b).
  • Goal orientations affect how learners perceive, experience, and choose learning tasks, behaviours, and strategies (Elliot and Hulleman 2017).
  • Also, causal attributions determine future effort, persistence, and performance (Perry and Hamm 2017).

 

모티베이션 품질을 높이기 위한 네 가지 개입
Four interventions to enhance motivation quality

학습자 동기 부여의 질을 높이기 위해 교육자는 다음을 수행해야 한다.

  • [자율성 촉진 및 구조화]
  • 학습자의 [정체성 모순]을 해소
  • 과제를 [일반적이고 개선 가능한 것]으로 프레이밍
  • 목표에 대한 [숙달적 접근]을 유도

To elicit a higher quality of learner motivation, educators should:

  • Promote autonomy and structure
  • Address learner identity contraindications
  • Frame academic challenges as common and improvable
  • Elicit a mastery approach to learning goals

학습자 동기 부여의 질을 높일 수 있는 이 치료 그룹 아래의 네 가지 예시적 개입에 대해서는 보충표 S2를 참조한다. 권한과 책임의 균형, 학습자가 학문적 성공과 실패를 해석하는 방법, 내재적 동기를 높이기 위한 전술, 전문 커뮤니티 내에서 학습자의 정체성을 확립하는 다른 개입 유형 및 사례를 찾을 수 있습니다.
See Supplementary Table S2 for four exemplary interventions under this therapeutic group that can enhance the quality of learner motivation. Other intervention types and examples may be found for balancing authority with accountability (Engle and Conant 2002), re-training how learners interpret academic successes and failures (Weiner 1985), tactics to increase intrinsic motivation (Kusurkar et al. 2011a) and establishing an identity for learners within a professional community (Lave and Wenger 1991).

자율성·구조화 추진
Promoting autonomy and structure

자율성과 구조를 촉진하는 전략은 외적, 내적 동기 부여에 영향을 미칩니다.

  • 외재적 동기 부여는 학습에 참여하려는 동기가 활동 외부에 있는 경우입니다.
  • 내재적 동기 부여는 학습자가 활동을 본질적으로 만족스럽고 흥미롭고 즐거운 것으로 볼 때 더 높은 품질의 동기 부여 유형입니다.

Strategies to promote autonomy and structure influence extrinsic and intrinsic motivation.

  • Extrinsic motivation is when the motive to engage in learning is external to the activity (Ryan and Deci 2000a).
  • Intrinsic motivation, a higher quality type of motivation, is when the learner views activities as inherently satisfying, interesting, and enjoyable.

학생들이 모든 학습 활동에 의해 내재적 동기를 부여받을 것이라고 믿는 것은 비현실적이다. 교육자는 학습자가 내재적 동기 부여를 받은 학습자와 유사한 방식으로 행동하도록 유도하는 외재적 동기 부여자motivator를 제공할 수 있습니다(Ryan 및 Deci 2000b). 외재적 동기는 연속체에서 발생한다.

  • 한 끝에서 학습자는 [외적인 보상이나 처벌 회피]에 의해서 동기 부여되며, 활동에 내재된 가치를 느끼지 못합니다.
  • 다른 끝에서 학습자는 [활동의 본질적 가치]를 분명히 인식하지만, 외부적 보상이 없을 때 자발적으로 활동을 시작하지는 않을 것이다.

학습 태스크에 대한 자율성과 선택의 폭을 넓힘으로써 학습자는 자신의 고유한 관심사에 따라 이러한 활동을 구체화할 수 있습니다(Ryan 및 Deci 2000b).

It is unrealistic to believe that students will be intrinsically motivated by all learning activities. Educators can provide extrinsic motivators that prompt learners to behave in ways that are similar to learners who are intrinsically motivated (Ryan and Deci 2000b). Extrinsic motivation occurs on a continuum.

  • At one extreme, the learner is only motivated by the extrinsic reward or avoidance of punishment and sees no inherent value in the activity.
  • At the other end of the continuum, the learner clearly sees the intrinsic value of the activity, but would not otherwise voluntarily initiate the activity in the absence of an extrinsic reward.

Offering greater autonomy and choice over learning tasks allows learners the opportunity to shape these activities around their intrinsic interests (Ryan and Deci 2000b).

보다 자율적인 형태의 외적 동기를 유도하기 위해, 교육자들은 [구조를 제공]하면서 학습자의 [자율성을 촉진]해야 한다. 이 두 가지 교육 방식은 antagonistic하지 않다. 예를 들어,

  • 임상에서는 수련생이 어떤 환자를 따르길 원하는지 선택할 수 있도록 허용할 수 있다(즉, 자율성). 그런 다음 수련생이 선택한 환자(즉, 구조)에 따라 자원을 사용하도록 지시할 수 있다.
  • 교실에서는 학생들이 자료를 배우고 성공하기 위해(구조) 적용할 수 있는 효과적인 학습 전략의 몇 가지 유형(즉, 자율성)을 설명할 수 있다.
  • 온라인 플랫폼에서는 교육자가 단계별 지시(구조)를 제공하고 학습자가 이를 자신의 이익에 적용할 수 있는 유연성(자율)을 가질 수 있습니다.

To elicit more autonomous forms of extrinsic motivation, educators should promote learner autonomy while providing structure (Jang et al. 2010). These two instructional styles are not antagonistic (Jang et al. 2010).

  • For example, a clinical supervisor may allow a trainee to choose which patients they would like to follow (i.e. autonomy) and then direct the trainee to resources depending on their choice (i.e. structure).
  • In the classroom, an educator could describe several types (i.e. autonomy) of effective learning strategies that students could apply to learn the material and succeed (i.e. structure).
  • In an online platform, educators could provide step by step directions (i.e. structure) and allow learners’ the flexibility to apply these to their own interests (i.e. autonomy).

학습자 정체성 모순 해결
Addressing learner identity contradictions

학습자 동기 부여의 가장 큰 요인 중 하나는 master practitioner로서의 정체성입니다. 학습자들은 미래 보건의료전문직으로서의 정체성을 지속적으로 형성하고 있으며, 보건의료전문직이 되는 것이 무엇을 의미하는지, 그리고 '좋은' 보건의료전문직이 되는 것이 무엇을 의미하는지를 생각한다. 이러한 자기-내레이션은 학생들이 취하는 연습과 그들이 내리는 결정에 영향을 미친다.

One of the largest drivers of learner motivation is their evolving identity as a master practitioner (Lave and Wenger 1991; McCaslin and Hickey 2001). Learners are continually forming their identity as a future health professional, what it means to be a health professional (e.g. a nurse, pharmacist), and what it means to be a ‘good’ health professional. These self-narrations influence the practices students take up and the decisions they make (Turner et al. 2014).

[모순]은 정체성 발달에 필수적이다. 교육환경과 누군가의 정체성 사이에는 모순이 있을 수 있다. 예를 들어, 만약 테크놀로지에 능숙하지 않다고 생각하면, 온라인 학습에 저항할 수 있다. 또한 학습자는 강의실이나 임상 환경 등 서로 다른 상황 간의 모순을 볼 수 있습니다. 보건 전문직 학생들은 궁극적으로 자신들을 미래의 의료종사자로 생각하기 때문에, 그들은 그들이 생각하는 어떤 수업 활동도 [관행의 규범에 위배된다고 생각한다면] 무시할 가능성이 높다. 교육자들은 그들이 교실에서 조언하는 것과 학생들이 실제로 관찰할 수 있는 것 사이의 모순에 대처하는 것이 중요하다. 임상실습에서 감독관은 [자신의 환경 또는 전문성]과 [학습자가 스스로를 구성원으로 간주하는 환경 또는 전문성] 사이의 모순을 해결할 수 있습니다. 예를 들어, 감염증의 임상 감독관은 덜 전문화된 진료 환경(예: 일차 진료소)에 대한 감염병 지식의 가치를 학습자에게 설명할 수 있다.
Contradictions are vital to identity development. There can be contradictions between an education setting and someone’s identity. For instance, if someone believes they are not adept at technology, they may resist online learning. Also, learners may see contradictions between different contexts such as in the classroom and in the clinical setting (Nolen and Ward 2008). As health professions students ultimately see themselves as future practitioners, they are likely to disregard any school activity they perceive contradicts the norms of practice. In the classroom, it is important for educators to address any contradictions between what they advise and what students may observe in practice. In clinical placements, a clinical supervisor may address contradictions between their setting or specialty and what setting or specialty the learners view themselves as a member. For example, a clinical supervisor in infectious disease may explain to their learners the value of infectious disease knowledge for less specialized practice settings (e.g. primary clinic).

학업 과제를 일반적이고 개선 가능한 것으로 구성
Framing academic challenges as common and improvable

교육자들은 성장 마인드를 이끌어내기 위해 [학업적 도전을 흔하고 개선 가능한 것]으로 프레이밍해야 합니다. 성장 마음가짐이란 학습자가 더 많은 노력과 더 나은 전략이 성과를 향상시킬 것이라고 믿는 것입니다. 반면 고정 마음가짐은 역량은 정적이며 학습자는 잘 수행하거나 잘하지 못할 수 있다는 믿음입니다. 학습자는 노력을 긍정적으로 보고 더 깊은 학습 전략(예: 자가 테스트)을 사용할 용의가 있기 때문에 성장 마인드는 더 높은 품질의 동기 부여로 이어집니다. 사고방식은 동기부여 목적과 신념의 네트워크를 형성한다. 표 2를 참조해 주세요.
Educators should frame academic challenges as common and improvable to elicit a growth mindset (Dweck and Molden 2017). A growth mindset is when the learner believes, often unconsciously, that greater effort and better strategies will enhance their performance. A fixed mindset, in contrast, is the belief that competence is static and that learners either have the ability to perform well or not. A growth mindset leads to higher quality motivation because learners view effort positively and are willing to use deeper learning strategies (e.g. self-testing) (Blackwell et al. 2007). Mindsets shape a network of motivational goals and beliefs. See Table 2.

 

교육자는 교육생에 대한 피드백을 통해 학업 과제를 구상합니다. 학습자의 현재 과제와 관련하여 흔한coomon 어려움을 설명해줄 수도 있습니다. 예를 들어, 학습자에게 교육자도 학생일 때에는 역시 어려움을 겪었다고 말할 수 있다(예: 거부, 시간 관리 미흡, 항생제 이해 어려움). 또한, 학습자에게 개선할 수 있는 방법에 대한 피드백을 제공하고 학습자가 '아직' 도달하지 못했다는 것을 알려주면 과제는 개선 가능한 것으로 분류될 수 있습니다.

Educators frame academic challenges through their feedback to trainees. They may frame challenges as common by relating to learners’ current challenges. For example, they could tell the learner that they also struggled (e.g. rejection, poor time management, difficulty understanding antibiotics) when they were at the learner’s level. Also, challenges can be framed as improvable by providing learners with feedback on how they can improve and letting learners know they are not there ‘yet.’

숙달 접근적 목표 지향 도출
Eliciting a mastery approach goal orientation

[성취 목표]는 학습자가 역량을 추구하는 근본적인 이유입니다. [성취 목표]는 접근 또는 회피에 맞춰질 수 있습니다. 접근 지향(성공에 접근하는 것)은 회피 지향(실패 회피)보다 더 동기 부여가 된다.

  • 접근 목표는 더 나은 수행, 기술 향상 또는 학습 시도와 같은 목표를 향해 노력하는 반면,
  • 회피 목표는 학생들의 외모가 나빠지거나 기술이 저하되거나 실패하는 것을 방지하는 것입니다.

Achievement goals are the underlying reasons why learners pursue competence (Elliot and Hulleman 2017). Achievement goals can be oriented toward approach or avoidance. An approach orientation (i.e. approaching success) is more motivating than an avoidance orientation (i.e. avoiding failure).

  • Approach goals are striving towards a goal such as performing better, improving skills, or attempting to learn, whereas
  • avoidance goals are when students’ motive is to prevent looking bad, a decline in their skills, or failure (Elliot and Hulleman 2017).

예를 들어, 접근 지향을 가진 학생은 '이 과제에서 90%를 받고 싶다'고 말할 것이며, 회피 지향을 가진 학생은 '나는 이 과제에서 나쁜 점수를 받고 싶지 않다'고 말할 것이다.

For example, a student with an approach orientation might approach an assignment by saying ‘I want to get a 90% on this assignment’ compared to a student with an avoidance orientation might say ‘I don’t want to get a bad grade on this assignment.’

달성 목표는 [숙달 지향]과 [성과 지향]으로 더욱 구분됩니다. 숙달 지향이 강한 학습자는 일반적으로 학습 의욕이 더 강합니다. 학생들은 그들의 전문지식을 발전시키기 위해 숙달 목표를 만드는 반면, 성과 지향은 표준에 대한 능력을 달성하거나 증명하려는 욕구로 이어집니다. 예를 들어, 학생은 좋은 점수를 받고 싶어서(즉, 성과 목표) 또는 더 나은 의사가 되고 싶어서(즉, 숙달 목표) 시험을 위해 공부할 수 있습니다.
Achievement goals are further separated into mastery and performance orientations. Learners with a strong mastery orientation are typically more motivated to learn. Students create mastery goals to develop their expertise; whereas performance orientation leads to a desire to attain or demonstrate competence relative to a standard (Elliot and Hulleman 2017). For example, a student may study for a test either because they want to get a good grade (i.e. performance goal) or because they want to become a better physician (i.e. mastery goal).

교육자는 [TARGET 모델]과 학생 중심의 개입을 통해 숙달된 접근 목표의 방향을 도출할 수 있다. 보충표 S2를 참조한다. 교육자들이 숙달된 접근 방식을 도출하는 가장 직접적인 방법 중 하나는 평가를 통해서이다.

  • 상벌은 성과 지향성을 이끌어냅니다.
  • 개선의 기회는 숙달 지향성을 촉진합니다.

예를 들어, 임상 감독자는 훈련생에게 지속적인 피드백을 제공하고 등급이나 표준이 아닌 전문 지식 개발을 중심으로 개선 기회를 제안할 수 있습니다. 마찬가지로, 교실 교사와 온라인 모듈은 개선을 위한 형성적인 피드백을 제공하는 기준, 단계적 및 중간점 평가를 작성할 수 있습니다.

Educators can elicit a mastery approach goal orientation through the TARGET model (Ames 1992) and student-focused interventions (Elliot and Hulleman 2017). See Supplementary Table S2. One of the most direct ways for educators to elicit a mastery approach orientation is through assessment.

  • Rewards and punishments elicit performance orientations.
  • Opportunities for improvement foster mastery orientations.

For example, clinical supervisors can provide trainees ongoing feedback and suggest opportunities to improve framed around developing expertise rather than grades or standards. Likewise, classroom teachers and online modules may create baseline, stepwise, and midpoint assessments that provide formative feedback for improvement.

Supplementary Table S2.docx
0.02MB

치료 클래스 3: 동기 부여 노하우 향상
Therapeutic class 3: improve motivation know-how

개요 및 이론적 기초
Overview and theoretical underpinnings

학습자는, 학습 과제를 의도적으로 증가시키거나 계속하는 것으로, 동기 부여의 레벨을 조절합니다(Wolters 2003). 동기 부여 노하우는 [학습자의 신념과 동기 부여에 대한 지식]과 관련이 있습니다. 여기에는 [학습자가 학습 동기를 얼마나 중요하게 생각하는지], [동기 부여가 어떻게 증가하고 유지되는지]에 대한 지식이 포함될 수 있습니다. 동기 부여 노하우에는 동기 부여 전략에 대한 지식뿐만 아니라 이러한 전술을 사용하는 방법, 시간 및 이유도 포함됩니다. 예를 들어, 동기부여가 떨어지면, 학습자는 자신에게 그 과제가 왜 중요한지를 상기시킬 수 있다.
Learners regulate their level of motivation by intentionally increasing or sustaining their effort in academic tasks (Wolters 2003). Motivation know-how relates to learners’ beliefs and knowledge of motivation. These may include how important learners believe motivation is for their learning and knowledge of how motivation is increased and sustained. (Wolters and Benzon 2013). Motivation know-how also includes knowledge of motivational strategies, as well as how, when, and why to use these tactics (Veenman et al. 2006). For example, when motivation wanes, learners may remind themselves why the task is important to them.

학습자에게 '노하우'(즉, 동기 규제)를 가르침으로써 학습자는 자신에게 동기를 부여하고, 지속하며, 노력을 늘릴 수 있는 더 나은 장비를 갖추게 될 것이다. 학습자가 적극적으로 동기를 조절하면 다음과 같이 됩니다.

  • 향후 행동에 대한 목표를 설정한다(Boekaerts 1996).
  • 자신의 동기 부여 상태, 신념 및 행동을 관찰한다(Wolters 및 Benzon 2013).
  • 의도적으로 동기부여량을 늘리고, 양질의 동기부여를 유도하는 전략을 수립한다(울터스·벤존 2013)
  • 미래의 성과를 조정하기 위한 과거의 동기 부여 상태, 신념 및 행동을 성찰한다(Hadwin et al. 2018).


By teaching learners motivation ‘know-how’ (i.e. motivation regulation), learners will be better equipped to motivate themselves, persist, and increase their effort (Kistner et al. 2010). When learners actively regulate their motivation, they:

  • Create goals for their future behaviour (Boekaerts 1996)
  • Observe their own motivational states, beliefs, and behaviours (Wolters and Benzon 2013)
  • Intentionally enact strategies to increase their motivation quantity and elicit higher quality motivation (Wolters and Benzon 2013)
  • Reflect on their past motivational states, beliefs, and behaviours to adjust future performance (Hadwin et al. 2018)

 

동기 부여 노하우를 개선하기 위한 두 가지 개입
Two interventions to improve motivation know-how

교육자는 다음을 통해 동기 부여 노하우를 개선할 수 있습니다.

  • 동기 조절 전략의 교육
  • 동기 조절을 모델링

Educators can improve motivation know-how by:

  • Teaching motivation regulation strategies
  • Modelling motivation regulation

표 3을 참조해 주세요. Wolters and Benzon (2013)은 또한 대학생들이 동기를 부여하기 위해 사용하는 다양한 유형의 전략을 연구하고 개요를 제시했습니다.
See Table 3. Wolters and Benzon (2013) have also studied and outlined different types of strategies that college students use to motivate themselves.

 

동기 조절 전략의 교육
Teaching motivation regulation strategies

동기부여 조절 전략을 사용함으로써, 학생들은 노력을 기울이고 교육 과제를 완료하려는 의지를 의도적으로 유지하거나 보완합니다. 이러한 전략은 다음과 같이 분류된다.

  • 환경 구조화,
  • 성과 목표의 조절,
  • 숙달 목표의 조절,
  • 자기 상벌,
  • 가치의 조절
  • 관심의 조절

Using motivation regulation strategies, students purposefully maintain or supplement their willingness to exert effort and complete an instructional task (Alexander et al. 1998; Wolters and Benzon 2013). These strategies have been classified as

  • environmental structuring,
  • regulation of performance goals,
  • regulation of mastery goals,
  • self-consequating,
  • regulation of value, and
  • regulation of interest (Wolters and Benzon 2013).

[환경 구조화] 전략에는 산만 제한, 설정 변경, 이상적인 시간에 공부하는 것이 포함됩니다. [자기 상벌]은 자신에게 학업을 마친 것에 대한 보상을 약속하는 것을 포함한다. 수행 목표, 숙달 목표, 가치 및 관심을 사용하여, 학생들은 의도적으로 상기시키고, 설득하고, 생각하고, 이러한 목표, 가치 또는 관심사와 연결시키는 데 관여합니다. 예를 들어, 학생은 의도적으로 학술 자료를 아는 것이 유용한 미래 상황에 연결할 수 있습니다. 대학생을 대상으로 한 조사에서, 학생들은 환경 구조화 전략과 성과 목표 전략을 가장 자주 보고하고, 작업 가치, 관심 또는 숙달 목표 전략을 덜 자주 보고했습니다(Wolters and Benzon 2013).

Environmental structuring strategies include limiting distractions, changing the setting, and studying at ideal times. Self-consequating includes promising oneself a reward for finishing academic work. Using performance goals, mastery goals, value, and interest, students purposefully engage in reminding, convincing, thinking, and connecting to these goals, values, or interest. For example, a student may purposefully connect the academic material to a future situation in which it would be useful to know the material. In a survey of college students, students most frequently reported environmental structuring strategies and performance goal strategies and less frequently employed task value, interest, or mastery goal strategies (Wolters and Benzon 2013).


학습자가 동기를 부여하는 데 어려움을 겪을 경우, 교육자는 무엇을, 언제, 왜, 그리고 어떻게 하는지를 포함한 동기 부여 전략에 대해 명시적으로 논의해야 합니다. 예를 들어, 교실 교육자는 온라인 학습 관리 시스템에 동기 부여 조절 전략을 강조하는 읽을거리를 게시할 수 있습니다. 임상 감독관은 학습자에게 장기적인 프로젝트 또는 학습(예: 보드 시험 학습)을 지속하는 방법을 가르칠 수 있습니다. 예를 들어, 그들은 학습자에게 언제, 왜, 그리고 어떻게 동기를 부여하는지 설명할 수 있다.

When learners have difficulty motivating themselves, educators should explicitly discuss motivation strategies including the what, when, why, and how (Veenman et al. 2006; Kistner et al. 2010). For example, classroom educators could post articles or readings highlighting motivation regulation strategies to their online learning management system. Clinical supervisors could instruct learners on how to persist with long-term projects or study (e.g. board exam studying). For example, they may explain to their learners when, why, and how they keep motivated.

동기 조절 모델링
Modelling motivation regulation

교육자는 동기 조절전략의 사용을 모델링하여 동기 조절을 암묵적으로 육성할 수 있다. 교육자가 전략을 사용하고 있다는 것을 명시적으로 언급하지 않더라도, [교육자의 행동]은 학습자가 동기 조절 행동과 전략을 채택하도록 이끌 수 있다. 예를 들어, 교실 교사는 게임화를 통해 학습의 지루한 측면을 더 즐겁게 만드는 전략을 모델링할 수 있다. 임상 감독관은 업무 가치의 조절을 모델링할 수 있다. 예를 들어, 환자 치료 활동 문서화와 관련된 비용(예: 시간, 노력)과 유익성(예: 팀워크 개선, 향후 방문을 위한 더 나은 데이터)이 비용을 초과하는지를 구두로 설명할 수 있다.
Educators may implicitly foster motivation regulation by modelling the use of motivation regulation strategies (Kistner et al. 2010). Without explicitly mentioning that the educator is using a strategy, an educator’s behaviour may lead learners to adopt motivation regulation practices and strategies. For example, a classroom teacher could model the strategy of making tedious aspects of learning more enjoyable through gamification. A clinical supervisor could model their regulation of task value. For example, they might verbalise the costs associated with documenting patient care activities (e.g. time, effort) and how the benefits (e.g. improved teamwork, better data for a future visit) outweigh the costs.

결론
Conclusion


동기 부여는 성공적인 배움의 열쇠입니다. 보건 전문 교육자들은 학습자 동기 부여의 중요성을 이해하고 있지만, 많은 교육자들이 동기 부여를 높이는 교육을 설계하고 전달하는 데 어려움을 겪고 있습니다. 다행히도, 학생들의 동기 부여에 긍정적인 영향을 미치는 것으로 증명된 증거 기반과 현장 검증 전략이 있다. 이 가이드는 약물 요약 비유를 사용하여 학습자 동기 부여의 강도를 높이고, 학습자 동기 부여의 질을 높이고, 학습자 자신의 동기 부여를 촉진하는 개입의 근거와 예를 제공한다.

Motivation is a key to successful learning. Health professions educators understand the importance of learner motivation; however, many have difficulty designing and delivering instruction that increases motivation. Fortunately, there are evidence-based and field-tested strategies that have been shown to positively influence student motivation. Using a drug compendia metaphor, this guide provides a rationale for and examples of interventions that increase the intensity of learner motivation, increase the quality of learner motivation, and promote learner regulation of their own motivation.

 

Interventions to Increase Motivation Intensity

Defining Key Terms Indications General Administration and Examples Mechanism of Action Dosing and Side Effects Monitoring Underpinnings / References
 
Providing Optimal Challenging Learning Tasks
 
Optimal challenge - When a learner perceives a task as challenging but not overly difficult For Whom?  All learners
 
Outcomes:
·   Improved competence perceptions
·   Use of deeper learning strategies
·   Deeper engagement
 
When? In situations that require deep learning or understanding
Increase task challenge (difficulty and complexity) by using real-world problems and constraints
 
Decrease task challenge by breaking down tasks into pieces, allowing more time, or providing support and hints (e.g., an iterative paper)
 
Continuously calibrate task challenge similar to video games - once learners master an easy level, they continue on to subsequently more difficult levels
 
Predict learners’ perceptions of task difficulty by understanding their goals, previous experiences, and capabilities (e.g., conducting a baseline survey or interview)
Learner perceptions of task challenge emerge in each moment, varying across learners and over time.
 
Optimally difficult tasks produce “flow” – a stimulating motivation state and concentration
With easy tasks, learners may experience boredom which limits learning
 
Difficult tasks may be inaccessible for learners, inviting withdrawal, resentment, and short cuts
Observe for deep vs. surface (i.e., going through the motions) engagement


Observe for learner emotions – bored (i.e., the task is too easy) vs. overwhelmed (i.e., the task is too hard)
Flow (Csikszentmihalyi 1997)
 
Theories of motivation and self-regulation, interventions to invite motivation and regulation (McCaslin and Hickey 2001; Paris and Turner 1994)
 
Sparking Curiosity and Interest Among Learners
 
Curiosity -  A natural desire to know more or engage in new situations because they are surprising or new


Situational Interest -  A content- specific state (e.g., I feel interested)
 
Personal Interest -  Content-specific trait (e.g., I am interested in chemistry)

For Whom? All learners, especially those that are not engaged


Outcomes:
·   Increased learner engagement and attention
·   If supported, sparking situational interest may evolve into personal interests
·   Increased effort and therefore, performance
 
When? At the beginning of learning and then consistently to develop learners’ personal interests
 
Gamification - Use principles from games including badges, levels, rewards, fail-safe environment, and friendly competition


Create novelty and variety: Get novel ideas for teaching by following educators on Twitter, reading blogs, or browsing through education websites


Create surprises by incorporating humour, unusual factors, Socratic questioning
 
Stimulate "friendly controversies" by asking learners to vote or debate positions


Connect content or activity to learners' current interests
Surprise creates a disequilibrium that learners are curious to explore until they reach equilibrium


What is interesting is always intrinsically motivating, but what is intrinsically motivating is not always interesting


Interest states decrease cognitive load, allowing learners to take on greater complexity and difficulty
Too much surprise or novelty may lead to feelings of being overwhelmed, inciting learners to disengage


"Novelty effect" - Learners are initially interested in novel education elements, but this fades as the novelty effect wears off
Observe for learners' attention or engagement


Inventory learners' personal interests
Theories of interest development and interventions to foster interest (Harackiewicz and Knogler, 2018)
 
Educator development on sparking interest (Oyler et al., 2016)

 

Defining Key Terms Indications General Administration and Examples Mechanism of Action Dosing and Side Effects Monitoring Underpinnings / References
 
Modelling Enthusiasm and Showing Affective Concern
 
Modelling - Learners implicitly pick up information through observing others’ thinking, actions, process, and the consequences of those actions

Enthusiasm -  An authentic expression of excitement for the topic or activity

 
Affective Concern -  Learners feel like the educator cares for their well-being and personal development
For Whom? All learners, especially those that may not be interested in the content or activity

Outcomes:

·   Higher ratings of educator effectiveness
·   Related to educator well-being
·   Increased learner participation, effort, and intrinsic motivation, leading to higher achievement
 
When? At the beginning to spark learners’ situational interest and after a difficult task
Enthusiasm for learning and affective concern for the learner should be shown  by instructors, near-peers (resident to a student), actual peers, and practicing professionals


Share stories of what the material or activity means to you
 
Conclude learning with a preview of what is to come next. This increases interest and demonstrates your enthusiasm to see the learners again.


Apply concepts using examples that are either interesting to you or the learners. At times, the educator’s enthusiasm may spark a new interest for learners.
 
(Re-)activate your own enthusiasm by thinking about how learners may use the content in the future or what initially engaged you in the topic.
Learners internalize the values and attitudes of those they admire and relate to

"Emotional contagion" – The emotions of one person can unconsciously influence others’ emotions.

 
Learners perceptions of educators’ affective concern for them contributes to learner feelings of belonging
Learners are adept at perceiving when an educator is being inauthentic or authentic.


Educators may develop burn-out or negative attitudes if they spend too much energy falsely maintaining enthusiasm. Optimally, learners should share in the responsibility of being enthusiastic.
 
“Distracting details” –Learners may disengage if they do not perceive the examples as relevant.
Learners generally comment on educator enthusiasm in learners evaluations of teaching

Observe for learners' attention or engagement
Educator development on enthusiasm (Mitchell, 2013)
 
Interventions to support feelings of belonging (Baumeister and Leary 1995)
 
 
Creating Task Relevance and Utility
 
Relevance - What learners believe is useful to their current personal lives

Utility - What learners believe will be useful in the future


For Whom? All learners


Outcomes:
·   Use of deeper-level learning strategies
·   Increased engagement and interest in the topic
·   Influences learners’ choice to pursue future opportunities
 
When?  In situations where  learners may question the value of the material or activity
Eliminate content that is not relevant nor useful for learners


Improve the "real world" nature of the tasks and activities (e.g., use real-world problems in class).


Task-value interventions” -
Show, don't tell! Show them examples (e.g., news stories, articles) of the relevance or usefulness of the content or activity.


"Saying-is-believing effect" -
The tendency for learners to believe messages that were freely advocated by the learner. For example, ask the learners, in discussion or in writing, why the content or activity is important to their own lives, others, or the community.
“Exchange value” – Learners constantly evaluate whether and to what extent to participate in an activity based on costs and benefits. For example, only studying material on the exam.

Learners determine importance by thinking about the "real world.” Is it realistic? Is it aligned with their goals? Is this what they need to know and be able to do?
If everything is labelled as important, then nothing becomes important

If learners don't think content or activity is relevant or useful, they will go through the motions (i.e., surface-level engagement)
Observe whether learners are going through the motions or going above and beyond (i.e., their level of engagement)
 
Inventory what learners perceive as relevant and useful
Expectancy-value-cost theory, interventions to improve task value
(Renninger and Hidi 2011; Harackiewicz and Priniski, 2018)
 
Communities of Practice theory (Lave and Wenger 1991)

 

Interventions to Enhance Motivation Quality

Defining Key Terms Indications General Administration and Examples Mechanism of Action Dosing and Side Effects Monitoring Underpinnings / References
 
Promoting Autonomy and Structure
 
Autonomy -    When learners wholeheartedly endorse their own actions. The opposite is controlling
 
Structure -  Providing clear information to learners about expectations and how to achieve learning outcomes. The opposite is chaos and confusion.
For Whom? All learners
 
Outcomes:
·   Intrinsic motivation
·   Self-reported and observed engagement
 
When? As often as possible
Provide learners with choices
 
Nurture learners personal interests and responsibility for their own learning
 
Direct learners with “can,” “may,” and “I invite you to” rather than “must,” “need,” and “should.”
 
Explain to learners what it takes to reach the desired outcomes
 
Provide consistent step-by-step directions and smooth transitions
When autonomy and structure are both provided, the basic human needs to feel autonomous and competent are supported
 
Autonomy Support
Activates learner interest, goals, curiosity, and sense of challenge
Learners will see their successes as earned by them and
 experience their own free will, resulting in intrinsic motivation
 
Structure Support
Learners feel greater control over academic challenges (i.e., internal locus of control), resulting in greater confidence (i.e., self-efficacy) 
Too much autonomy may require more educator oversight, coordination, and grading
 
Too little autonomy may lead learners to feel controlled and dependent, leading to frustration, boredom, and defensiveness
 
Too much structure may lead to boredom and reliance on structure
 
Too little structure leads to being overwhelmed, confused, or lost which may lead to taking short cuts and use of surface learning strategies
 
Observe or have learners report on their level of engagement
 
Observe for mediating processes—frustration, boredom, and surface learning strategies
 
Self-determination theory, interventions for supporting autonomy and competence (Ryan and Moller, 2018; Jang, Deci, Reeve, 2010)
 
Defining Key Terms Indications General Administration and Examples Mechanism of Action Dosing and Side Effects Monitoring Underpinnings / References
 
Addressing Learner Identity Contradictions
 
Identity contradictions -  Misalignments between one's identity and an activity. Also, contradictions between different contexts such as the classroom and clinical practice
 
For Whom? Leaners who hold an identity that contradicts with the content area or learning environment (e.g., a learner who does not identify with a specialty)
 
Outcomes:
·   Learner choices
·   Deeper engagement
·   Intrinsic motivation
 
When?  In situations that lead to identity contradictions
Bring in a speaker that learners identify with currently (near peer) or in the future (practicing professional). Have the speaker discuss the value of the activity
 
Create a hybrid across the two contradictions (e.g., having school-based faculty visit clerkships, having clinicians co-teach certain topics)
 
Address learners misconceptions that they internalized from previous experiences, popular culture, and their social network (e.g., through a class discussion)
 
A deep motive of learners is becoming a part of a community of practice (e.g., hospital, clinic). This drives their participation and choices in activities, formulating their identity
 
When a topic or activity contradicts a learners current identity, they will complete the least amount of work as possible. However, this mechanism can be overruled by appealing to learners' future identities, especially their identity to be a "good" health professional.
 
If a learner believes the educator is overinflating the importance of a topic, they may lose trust in the educator
 
If a learner believes the educator is telling them what to do or how to be, they may become defensive
Observing for surface versus deep engagement
 
Ask learners what they do not enjoy or value about the task - it might unearth identity contradictions
Situative motivation (Nolen et al., 2015)
 
Communities of Practice Theory (Lave and Wenger, 1991)
 
Motivational Filters (Horn and Campbell, 2015)
 
Framing Academic Challenges as Common and Improvable
 
Academic challenges -  Events that learners interpret as challenging or failure (e.g., low marks, critical feedback)
 
For Whom?
·    Those who may lack successful models (e.g., first-generation University students, under-represented identities)
·    Low performers who endorse a fixed theory of intelligence
(i.e., fixed mindset)

 
Outcomes:
·   Malleable theory of intelligence (i.e., growth mindset)
·   Increase feelings of belonging, leading to more intrinsic motivation
·   Increased marks and persistence
·   Decreased attrition
 
When? During tough transitions or first perceived failures
"Framing interventions"
·   Frame challenges as common and improvable (e.g., provide statistics or quotes from more senior learners illustrating that challenges to adjusting to the learning environment are common and can be overcome)
·   Share your personal stories of overcoming challenges in academia or practice
·   Have learners write about (or discuss) how to overcome academic challenges
 
"Mindset interventions"
Share and assign reading materials framing intelligence as malleable
 
Some learners will interpret challenges or failure as evidence that they lack intelligence, don't belong in an area, or are "just not a certain type of person" (e.g., critical care person)
 
Framing challenges as common supports learner belief that they belong even though they failed.
 
Framing challenges as improvable supports the belief that they can achieve but require more effort and better strategies
If the interventions are not provided during a period of transition or challenge, the interventions may be seen as another academic exercise
 
Listen to how learners discuss their challenges or failures. Do they see them as permanent or improvable? Common or unique to them?
 
Inventory learners implicit theories of intelligence (i.e., mindsets)
Interventions to support feelings of belonging and relatedness (Jang, Deci, Reeve, 2010; Baumeister and Leary, 1995)
 
Growth mindset interventions (Harackiewicz and Priniski, 2018)

 

Defining Key Terms Indications General Administration and Examples Mechanism of Action Dosing and Side Effects Monitoring Underpinnings / References
 
Eliciting a Mastery Approach Goal Orientation
 
Mastery approach goal orientation - The underlying reason or goal for learning is to further master a task or develop competence
 
Performance goal orientation -  The underlying reason or goal for learning is to outperform their peers (e.g., good marks, higher reputation)
 
For Whom? All learners
 
Outcomes:
·   Elicits a mastery approach goal orientation
·   Increased self-efficacy and interest
·   Improved marks
·   Decreased anxiety and failure avoidance
 
When? In situations where a mastery approach goal orientation is required for complex, long-term learning
The TARGET model for classroom structure
·    Tasks: Optimally challenging, interesting
·    Authority: Learners participate in decisions
·    Recognition: In a private setting
·    Grouping of learners: Mixed-ability
·    Evaluation: Based on self-improvement
·    Time: Flexible
 
"Student-focused" interventions
·    Reframe assessments as an opportunity to learn
·    Define goal orientations and have learners discuss the advantages of a mastery orientation
·    Teach deeper learning strategies (e.g., self-testing, explaining topics to others)
Learners may have both a mastery and performance orientation
 
Learners may have a performance orientation in one unit and a mastery orientation in another
 
Learners underlying reason(s) for learning (i.e., orientation) leads to different patterns of behaviour.
 
Mastery orientation leads to the use of deeper learning strategies, deep engagement, and seeing challenges as motivating.
 
Too much mastery without performance: Learners may lack the strategy or spend too much time on interesting material to attain higher performance
 
Too much performance without mastery: Learners may take short cuts or do the bare minimum, therefore decreasing their long-term learning needed to succeed in the future
 
If instruction on mastery goals is perceived by learners as only advising them to "try harder," they may feel defensive that the educator does not understand how hard they are trying
 
Have learners take a goal orientation inventory
 
Observe for expressions of their orientation (e.g., deep vs. surface level learning strategies)
 
Achievement goal orientation interventions (Ames, 1992; Elliot and Hulleman, 2017)

 


 

 

Med Teach. 2021 May;43(5):492-500.

 

 doi: 10.1080/0142159X.2020.1837764. Epub 2020 Nov 2.

 

The clinical educator's guide to fostering learner motivation: AMEE Guide No. 137

Affiliations collapse

Affiliations

1Faculty of Pharmacy and Pharmaceutical Sciences, Monash University, Parkville, Victoria, Australia.

2College of Pharmacy, University of Kentucky, Lexington, KY, USA.

3School of Pharmacy, University of Mississippi, Jackson, MS, USA.

4Faculty of Medicine, Nursing and Health Sciences, Monash University, Clayton, Victoria, Australia.

PMID: 33136450

DOI: 10.1080/0142159X.2020.1837764

Abstract

Motivation theory and research remain underused by health professions educators. Some educators say it can seem too abstract. To address this, we applied health care language to learner motivation theories. Using a familiar metaphor, we examined the indications, mechanism of action, administration, and monitoring of learner motivation interventions. Similar to the treatment monographs in medicine compendia, we summarized each motivation intervention in the form of a monograph. The purpose of this guide is for health professions educators to develop an understanding of when (i.e. indication) and how (i.e. mechanism of action) learner motivation interventions work. With this information, they can then access ready-to-implement strategies (i.e. administration) to increase their learner interest and assess the effects of these interventions (i.e. monitoring).

Keywords: Motivation; clinical educators; engagement; health professions students; medical students.

 

HPE연구의 네러티브 분석의 잠재력: 다섯 개의 분석적 렌즈(Med Educ, 2021)
The potential of narrative analysis for HPE research: Highlighting five analytic lenses
Abigail Konopasky1,2 | Lara Varpio1 | Renée E. Stalmeijer3

 

1 소개
1 INTRODUCTION

현대 보건의료전문직교육(HPE) 연구자들은 [여러 가지 고약한wicked 문제]에 직면해 있다1. 몇 가지만 열거하더라도, 전문가간 협력, 의학 학습에서의 수치심 경험, 소수자 의사와 훈련생에게 인종차별이 어떤 영향을 미치는지 등등이다. 이러한 문제들을 고약하게 만드는 이유 중 일부는 그것들이 사회적 특성social nature을 가지기 때문이다; 이러한 도전들에 관련된 개개인의 특별한 경험, 믿음, 선택은 그들이 그들 자신의 주관적인 해석이 수반되기 때문에, [확정적인definitive 공식이나 설명을 거부한다]는 것을 의미한다. 이러한 사회적 뿌리를 고려할 때, 질적 연구 방법은 HPE의 고약한 문제를 이해하고, 부분적으로는 맥락을 고려한context-bound 해결책을 만드는 데 도움이 될 수 있다. 

Contemporary health professions education (HPE) researchers are faced with a number of wicked problems1: interprofessional collaboration, experiences of shame in medical learning and how racism affects minoritised physicians and trainees, to note a few.2-12 Part of what makes these problems wicked is their social nature; the particular experiences, beliefs and choices of individuals involved in these challenges mean that they defy definitive formulation or explanation since the multiple people involved all bring their own subjective interpretations. Given these social roots, qualitative research methods can be helpful in understanding HPE's wicked problems and constructing some partial, context-bound solutions.13 

이러한 문제를 다루는 질적 분석은 가치 있는 통찰력을 만들어냈지만, 다수는 [유사한 질적 방법과 방법론]에 의존해 왔다.

  • 전문가간 협력에 대한 연구는 일반적으로 관찰, 인터뷰 및 포커스 그룹 방법의 조합을 사용하여 전문가간 협업을 가능하게 하거나 방해하는 요소를 푸는 정성적 접근법을 사용해 왔다. 
  • 수치심 조사는 일대일 인터뷰를 통해 수집된 데이터로 현상학을 활용했다. 
  • 의사와 훈련생에게 미치는 인종차별의 영향에 대한 탐구는 종종 비판적 이론의 관점에서 데이터를 수집하기 위해 일대일 인터뷰를 이용했다. 

분석적 측면에서 살펴보면, 이러한 고약한 문제에 대한 접근법은 [지속적인 비교 및 주제적 내용 분석]을 포함한다. 

Qualitative analyses addressing these problems have generated valuable insights, but many of them have relied on a similar set of qualitative methods and methodologies:

  • studies of interprofessional collaboration have generally used qualitative approaches using a combination of observation, interview and focus group methods to unpack what enables or hinders interprofessional collaboration.41214-16 
  • Investigations of shame have harnessed phenomenology with data collected via one-on-one interviews.67 
  • Explorations of racism's effects on physicians and trainees have also used one-on-one interviews to collect data, often from a critical theory perspective.8-101718 

Analytically, approaches to these wicked problems have included constant comparative and thematic content analysis, among others.

추가적이고 보완적인 통찰력을 제공하는 데 도움이 될 수 있는 분석 접근법의 또 다른 세트는, 사람들이 자신의 세계를 이해하기 위해 사용하는 [핵심적 도구]에 의존한다. 바로 네러티브(서사)이다. 브루너는 이야기는 개인이 '삶의 바로 그 사건들을 목적적으로 만드는' 원칙적인 수단이라고 주장했다. 그는 [사람들이 그들의 경험에 대해 가지고 있는 이야기]가 [인간이 의미를 만드는 기본적 과정에 대한 통찰력]을 제공한다고 믿었다.

Another set of analytic approaches that may help provide additional, complementary insights relies on a central tool many individuals use to make sense of their world: narrative.1920 Bruner argued that stories are a principle means by which individuals ‘purpose-build the very events of a life’1915; he believed the stories people have of their experiences offer insight into humans' basic meaning-making processes.

[내러티브 분석 방법(NA)]은 HPE 연구원들이 임상의 교육자와 HPE 학습자가 자신의 삶을 이해할 수 있는 내러티브 방법을 활용하고자 하기 때문에 귀중한 자산이 될 수 있다. 이러한 자산을 활용하려면 다양한 [NA 렌즈]가 제공할 수 있는 가능성을 검토하는 것이 도움이 될 수 있습니다. 분석적 렌즈analytic lenses는 질적 연구를 하는 특별한 '스타일'이다. 이론과는 달리, 그것들은 우리가 보는 것을 규정하지 않지만, Blumer의 [민감 개념sensitising concept]처럼, '어떤 방향에서 볼지를 제안'함으로써 질문과 주장을 형성한다.22

Methods of narrative analysis (NA) can be valuable assets as HPE researchers seek to tap into the narrative ways of knowing19 by which clinician educators and HPE learners may understand their lives. To harness these assets, it may be helpful to review the possibilities different NA lenses can provide. Analytic lenses are particular ‘styles’ of doing qualitative research21; unlike theories, they do not prescribe what we see but, like Blumer's sensitising concepts, ‘suggest directions along which to look’, shaping the questions asked and the claims made.22

이 연구 접근 논문은 NA 방법이 연구자들에게 제공할 수 있는 다섯 가지 분석 렌즈(전체론, 위치론, 언어론, 대리인, 순차론)를 강조한다. 우리는 사회과학 연구의 '서사적 전환narrative turn'을 검토함으로써 이 설명을 시작합니다. 그런 다음 HPE에서의 사용(과거 및 잠재력)과 한계에 대해 논의하는 다섯 가지 렌즈(홀리스틱, 위치, 언어, 대리 및 순차)를 각각 설명한다. 또한 렌즈에 액세스하는 데 사용할 수 있는 특정 NA 방법을 이해하기 위한 두 가지 접근 방식을 논의한다. 우리는 우리의 렌즈와 경험을 되새기며 NA의 약속과 편파성을 탐구함으로써 결론을 내린다.
This Research Approaches article highlights five analytic lenses NA methods can offer researchers: holistic, situated, linguistic, agentive and sequential. We preface this description by reviewing the ‘narrative turn’ in social science research.23, 24 We then describe each of the five lenses—holistic, situated, linguistic, agentive and sequential—discussing their use (past and potential) in HPE and limitations. We also discuss two approaches to understanding specific NA methods that can be used to access the lenses. We conclude by exploring the both the promise and partiality of NA, reflecting on our own lenses and experiences.

 

2 배경: '서사적 전환'
2 BACKGROUND: THE ‘NARRATIVE TURN’


1980년대 중반 제롬 브루너와 다른 사람들이 내러티브 연구의 정당성을 확고히 확립한 사회과학 연구의 '사서적 전환'을 이루었다. 그렇게 함으로써, 그들은 실증주의에 도전했고 (패러다임이나 범주적 방식 대신) 내러티브 방식의 지식을 장려했다. 학자들은 [내러티브에 대한of 연구]뿐만 아니라, [실천과 사건을 내러티브로as 해석하는 연구를 포함하는 서사적 탐구narrative inquiry]를 통해 이러한 지식을 탐구했다. 이후 학자들은 여러 연구 패러다임, 학문 분야, 방법론에 걸쳐 서사적 탐구를 사용해오면서, 사고의 서사적 모드의 가치를 인정하고 이용해왔다. 연구참여자들이 자신의 경험담을 어떻게 구성하는지를 연구하거나, 연구자들의 스토리텔링으로부터 전개drawing를 통해 참가자들을 더 잘 이해하게 된 것이다.
The mid-1980s marked the ‘narrative turn’ in social science research, when Jerome Bruner and others firmly established the legitimacy of narrative inquiry.23, 24 In so doing, they challenged positivism and promoted narrative—versus paradigmatic or categorical—ways of knowing.19, 23, 25, 26 Scholars explored these ways of knowing through narrative inquiry, which encompasses any study of narrative (or collections of narratives) as well as studies interpreting practices and events as narratives.20, 26, 27 Scholars have used narrative inquiry across multiple research paradigms, academic disciplines and methodologies, but they all value and harness this narrative mode of thinking, either studying how participants construct the stories of their experiences or drawing on researchers' storytelling to better understand participants.28-31

학자들이 서사적 분석(NA)에 대한 접근 방식을 개발한 것은 바로 이러한 방향에서이며, 서사적 탐구를 해나갈 지향orientation을 의미한다. NA 방법은 광범위하고 유연하게 해석하고 적용할 수 있으므로, 우리가 도출하거나 가리키려고 하는 [NA 방법의 목록]이란 존재하지 않는다. 대신 아래는 NA 문헌과 우리의 경험을 바탕으로 NA가 HPE 연구자에게 제공할 수 있는 렌즈 5개를 제공합니다. 각 렌즈는 데이터와 연구 맥락의 일부 측면을 강조하는 동시에 다른 부분을 강조하므로 연구 설계자는 그 중에서 신중하게 선택해야 한다.

It is from within this orientation that scholars develop their approach to narrative analysis (NA), that is, orientations through which they carry out a narrative inquiry. NA methods are wide-ranging and can be flexibly interpreted and applied, so there is no single list of NA methods we draw from or point to. Instead, below, based on the NA literature and our own experiences,23, 25, 26, 32 we offer five lenses NA can offer HPE researchers. Each lens highlights some aspects of the data and research context while deemphasising others, so research designers must carefully select from among them.

3 과정: 5개의 렌즈 장착
3 PROCESS: FIVE LENSES ON NA

NA의 [전체론적 렌즈holistic lens] 는 이야기의 지위를 복잡하고 통합된 단위로서 보존한다. 이 렌즈는 데이터를 별도의 청크나 테마로 분류하기 보다는 [하나의 이야기, 하나의 사건, 심지어 하나의 이야기와 사건의 시리즈 내에서의 연결]에 초점을 맞춘다. 내러티브에 대한 이 조감도 렌즈는 연구자에게 [데이터를 하나의 (또는 소수의) 해석으로 합성]하도록 요청하며, 아마도 [전체적인 주제, 도덕 또는 스타일]을 생성할 것이다. 이것은 프라이스와 동료들이 그들의 직업 선택에 대한 밀레니얼 간호사들의 설명에 대해 연구한 것과 같이 이야기 간 비교를 가능하게 한다(표 1 참조). 전체론적 렌즈는 각 [참가자의 이야기를 복잡하고 일관되게 이해]할 수 있게 해주었고, 프라이스와 동료들이 말하는 '참가자 이야기의 전체성과의 연결'을 유지했습니다.34 이 렌즈는 참가자의 이야기를 일관성 있게coherent 설명할 수 있게 해준다. [하나의 사건이나 순간이 네레이터에게 어떻게 영향을 미쳤는지]를 조사할 뿐만 아니라, [이야기의 모든 사건과 순간들이 어떻게 의미를 창조하기 위해 함께 작용하는지]를 보여준다.

The holistic lens on NA preserves the status of a story as a complex and integrated unit.23 Rather than categorising data into separate chunks or themes, this lens focuses on connections within a story, an event or even a series of stories and events that build a systematic whole.33 This bird's eye lens on narrative asks the researcher to synthesise data into a single (or small number of) interpretation(s), perhaps generating an overall theme, moral or style. This allows comparison across stories, as Price and colleagues34 did in their study of millennial nurses' accounts of their career choice (see Table 1). The holistic lens provided an understanding of each participant's story that was both complex and coherent, maintaining what Price and colleagues call, ‘ongoing connection to the wholeness of the participants' stories’.34 This lens allows for a coherent account of participants' stories, examining not just how one event or moment may have affected the narrator but how all the events and moments of a story work together to create meaning.

NA의 전체론적 접근법을 사용하는 연구자들이 해결해야 할 근본적인 과제는 '전체' 단위, 즉 '전체' 이야기를 기술하는 것이다. 즉, 전체론적인 NA 렌즈를 사용하는 학자들은 [분석해야 할 '전체'가 어느 정도인지 결정]해야 한다. 이 결정은 [길고 다부진 인생 이야기]부터, [단 몇 구절의 '작은 이야기']까지 매우 다양할 수 있다. 그리고, 미슬러의 주장처럼, 무엇이 이야기이고 무엇이 이야기가 아닌지를 묘사하는 선line과, 그 이야기를 어떻게 표현하는지는 해석 과정의 일부이다. 게다가, [연구자의 전체론적 관점]은 [참가자들이 그들의 이야기 전체를 보는 방식]과 일치하지 않을 수 있다. 따라서 전체론적 렌즈를 사용하는 학자들은 자신의 해석의 잠재적 우위에 대해 인식하고 NA 과정에 참여자를 포함하기 위해 노력해야 한다.
A foundational challenge that researchers using NA's holistic approach must contend with is delineating what is a ‘whole’ unit, a ‘whole’ story. In other words, scholars using the holistic NA lens must decide how much of a person's story is the ‘whole’ to be analysed. This decision can be highly variable, ranging from a long and multi-part life story down to ‘small stories’ of just a few phrases or sentences.32, 38 And, as Mishler argued, the lines delineating what is and is not a story and how to represent that story are part of the interpretative process.39 Moreover, a holistic researcher perspective may not align with the ways participants see the whole of their stories. Scholars using the holistic lens, then, must be aware of the potential primacy of their interpretations and work to include participants in the NA process.

NA의 [상황적 렌즈situated lens]는 개인이 내러티브를 형성하는 [특정 문화적 맥락]을 전경foregrounds으로 한다. 이 렌즈는 청중, 서술의 목적 또는 기능, 그리고 해설자들이 끌어 들이는 문화적 자원을 고려하여, 이러한 맥락에서 무엇이 논쟁되고 정규화되거나 '표준화'되는지를 이해하고자 한다. 이러한 관점에서, 이야기는 [그 문화에서 이용할 수 있는 서사적 자원을 사용하여, 화자와 청자에 의해 공동 구성된 것]으로 볼 수 있다; 연구자들은 네러티브가 그것이 말해지거나 집행되는 맥락context어떻게 연결되는지 완전히 탐구한다.41 예를 들어, 연구자들은 언제 그리고 어떻게 청자가 긍정하고, 이의를 제기하고, 심지어 이야기를 이어받는지 보기 위해 [화자와 청자 사이의 상호작용]에 초점을 맞출 수 있다. 이러한 상호작용을 추적하면서 연구자들은 공동 창작자들이 이야기를 그리는 [사회적 구성](예: 성별, 인종 또는 민족 정체성)과 [문화적 구성](예: 과로한 레지던트, 보조 간호사, 영웅적 외과의)에 관심을 기울인다.

The situated lens on NA foregrounds the particular cultural context(s) in which individuals create narratives.23, 40 This lens seeks to understand what is contested and what is normalized or ‘typified’31 in these contexts, considering audience, the purpose(s) or function(s) of the narrative and the cultural resources narrators draw upon.23, 40 From this perspective, stories can be seen as co-constructed by the teller and hearer using the narrative resources available in the culture; researchers fully explore how the narrative connects with the context in which it is told or enacted.41 For instance, researchers might focus on the interactions between teller and hearers to see when and how hearers affirm, contest or even take over the story.41 As they trace these interactions, researchers attend to social constructs (e.g., gender, racial or ethnic identity) and cultural constructs (e.g., the overworked resident, the supportive nurse and the heroic surgeon) on which story co-creators draw.23, 42 

Sargeant 등에 의한 연구는 상황적 렌즈를 사용하여 모의 환자들이 그들의 일에 대한 서사에서 의대생과 비교해서 자신들을 어떻게 위치시키는지position 탐구했다(표 1 참조). 이 위치 렌즈는 사회적, 문화적 신념과 구조가 그들의 세계에 대한 화자의 이해를 형성하는 방법에 대한 연구자들의 통찰력을 뒷받침했다. 이 연구에서 모의 환자들은 [가족]이라는 문화적 개념을 활용하여 [자신을 의대생들의 부모상parental figures]으로 이해했다.

A study by Sargeant and colleagues35 used a situated lens to explore how simulated patients position themselves vis-a-vis medical learners in their narratives about their work (see Table 1). This situated lens supported researchers' insights into the ways social and cultural beliefs and structures shape a narrator's understanding of their world. In this35 study, simulated patients drew on the cultural notion of family (among others) to understand themselves as parental figures to the medical learners.

그러나, 상황적 렌즈situated lens를 사용하는 다른 학문과 마찬가지로, 연구자들은 궁극적으로 분석, 해석, 그리고 궁극적인 연구 네러티브에서 [어떤 지역적, 문화적 맥락의 요소들을 전경에 둘지foreground]를 선택한다. 연구자는 자신의 경험, 문화적 배경, 이론적, 개념적 프레임워크에 영향을 받아 특정 서술이 수행하는 작업에 대한 연구자의 해석은 맥락의 [일부 측면을 지나치게 강조하여 다른 측면을 모호하게] 할 수 있다. 미슐러가 지적했듯이, 내러티브 학자들은 연구참가자들처럼 스토리텔러이다: '우리가 이야기를 발견하는 것이 아니라 이야기를 만드는 것이 분명하다. 우리는 분석적인 재설명을 통해 응답자들의 설명을 다시 말한다. 우리도 역시 스토리텔러이다….25
As with any scholarship using a situated lens, however, researchers ultimately choose which elements of the local and cultural context to foreground in the analysis, interpretation and eventual research narrative. Influenced by their own experiences, cultural background and theoretical and conceptual frameworks, researchers' interpretation of the work a particular narrative is doing may overemphasise some aspects of the context and obscure others. As Mishler noted, narrative scholars are, like their participants, storytellers: ‘It is clear that we do not find stories; we make stories. We retell our respondents' accounts through our analytic redescriptions. We, too, are storytellers …’.25

NA의 [언어적 렌즈linguistic lens]는 내러티브의 형식과 구조, 내용 모두를 질문한다. 인간 언어는 스토리텔링을 위한 단어, 구, 융통성, 의미의 무한한 잠재적 조합을 제공하는 문법적 자원을 제공하며, 이 렌즈는 화자들이 그 자원들에 대해 하는 선택을 조사한다.

  • 예를 들어, 거의 틀림없이 같은 정신 상태를 서술하더라도, '모른다'(즉, 나는 당신의 질문에 대답하는 데 필요한 지식이 없다)는 '당신[일반]은 알 수 없다'는 말과 다른 함축적 의미를 갖는다. (즉, 누구도 미래를 예측할 수 있는 지식을 가지고 있지 않다.)


NA's linguistic lens interrogates both the form and structure of a narrative as well as its content.40, 42 Human languages offer grammatical resources that provide an infinite number of potential combinations of words, phrases, inflexions and meanings for storytelling,43 and this lens examines the choices narrators make about those resources.40, 42, 44, 45 

  • For instance, while narrating what is arguably the same mental state, ‘I don't know’ (i.e., I haven't the knowledge required to answer your question) has different connotations from the statement ‘you [generic] just can't know’ (i.e., nobody has the knowledge to predict the future).46 

이러한 차이는 NA의 [언어적 렌즈]에 초점을 맞춘다. 언어적 렌즈의 중심적인 이점은 전문적인 딜레마의 의대생 내러티브에 대한 리스, 몬루제, 맥도날드 47의 연구에서 증명된 바와 같이 서술자narrator의 정체성에 대해 드러낼 수 있는 것이다. 한 학생의 딜레마에 대한 한 줄 한 줄 분석에서, 연구원들은 그녀가 괴롭힘의 피해자임에도 불구하고, 자신을 '매우 강한 여성'으로 구성하기 위해 어떻게 언어를 사용했는지를 보여주었다.47 이 언어 렌즈는 참가자가 그녀의 부정적인 경험에 대한 '통제'를 얻고' 그녀를 의사 커리어를 지속하게 하는 [정체성 작업identity work]을 하는데 어떻게 내러티브를 사용했는지를 강조하였다. 

These differences are brought into focus with NA's linguistic lens. A central benefit of the linguistic lens is what it can reveal about narrator identity,32, 40, 42 as demonstrated in Rees, Monrouxe, and McDonald's47 study of medical student narratives of professional dilemmas (See Table 1). In a line-by-line analysis of one student's dilemma, the researchers showed how she used language to construct herself as a ‘VERY strong woman’, despite being a victim of bullying.47 This linguistic lens highlighted how this participant used narrative to do the identity work of ‘gain[ing] control over her negative experience’ and persisting in her medical career.47

모든 연구 방향과 마찬가지로 NA의 언어 렌즈에도 한계가 있다. 

  • 첫째, 단어에만 집중하는 것은 다른 방법, 즉 억양, 몸짓, 또는 신체 위치 결정과 같은 부언어적 단서들로 전달되는 중요한 메시지들을 놓칠 수 있다. 전사된 단어에 대한 분석적인 집중은 '말하는' 다른 것들을 모호하게 할 수 있다.
  • 둘째, 데이터를 이산적discrete 언어 범주(예: 언어적 망설임 표식)로 분할함으로써, 연구자들은 내러티브의 전체적인overall 목적을 상실할 수 있다. 예를 들어 [전체론적 렌즈]또는 [상황적 렌즈]가 제공하는 잠재력을 포기하게 되는 것이다. 스털리 교수는 언어 렌즈와 같은 분석적이고 패러다임적인 접근은 '이상화의 경향에 있으며, 연구자들이 이야기를 사전 설정된 범주로 강제하도록 장려하고… [특정한 사회적 사건]에서 [구체적인 서술]이 어떻게 작용work하는지를 놓치고 있다'고 주장했다.

Like all research orientations, NA's linguistic lens has limitations.

  • First, a focus on the words alone can miss the important messages communicated in other ways, i.e., paralinguistic cues like intonation, gesture or body positioning. An analytic focus on the transcribed word can obscure the other things being ‘said’.
  • Second, by fragmenting the data into discrete linguistic categories (e.g., linguistic markers of hesitation), researchers may lose the overall purpose of the narrative, abandoning the potential that, for instance, a holistic or situated lens offers. Bleakley argued that analytical, paradigmatic approaches like that of the linguistic lens, ‘tend to idealisation, encouraging researchers to force stories into preset categories … missing how specific narratives work for specific social occasions’.20

NA의 [행위자적 렌즈agentive lens]행위자성agency, 즉 제약 조건 속에서 행동을 선택하고 실행할 때 인간의 의도적인 활동을 강조한다. 많은 학자들은 이야기를 하는 것을 [행위자적 행위agentic act]로 간주한다: 내레이터는 청자를 위하여, 그리고 청자와 함께 경험을 해석하고 평가한다. 이 렌즈는 이야기의 목적을 이해하기 위해 화자의 선택에 부분적으로 주의를 기울인다: 지금 이 서사적 행위자(또는 에이전트 그룹)는 무엇을 달성하려고 하는가? 
An agentive lens on NA highlights agency—i.e., the intentional activity of humans as they choose and execute actions amidst constraints.48, 49 Many scholars position telling a story as an agentive act: narrators interpret and evaluate experiences for and with the listener.23, 28, 29, 50 This lens attends to the narrator's choices in part to understand the purposes of a story: what is this narrative agent (or group of agents) trying to accomplish?23, 42, 50 

예를 들어, Caps와 Ochs는 고소공포증을 가진 참가자에 대한 그들의 분석을 어떤 객관적인 진실과의 일치보다는 서술자로서 그녀가 했던 해석적 작업에 초점을 맞췄다. 이 행위자적 렌즈는 [서술자 자신의 의도와 행동]뿐만 아니라 [그들이 타인의 의도와 행동을 어떻게 보는지]에 대한 이해를 지원한다. 예를 들어, Warmington과 McColl의 의대생들이 환자 치료 경험을 설명하는 방법에 대한 연구는 '행위자agency'이라는 단어를 명시적으로 사용하지 않았지만, 학생들을 행위자적 스토리텔러로 만들어 환자와 강사에 대한 '위치positioning'를 지정했다(표 1 참조). Warmington과 McColl의 참가자들은 일부 동의 절차를 무시한 것을 정당화하기 위해, 조건부로 자신의 스토리를 사용했다. 이 렌즈는 나레이터들이 이야기를 통해 만드는 수사적인 움직임rhetorical moves 을 강조합니다.

For example, Capps and Ochs42 focused their analysis of the participant with agoraphobia on her ‘struggle to achieve coherence and continuity’, on the interpretative work she did as a narrative agent rather than on her story's alignment with some ‘objective truth’. This agentive lens supports understanding not only of narrators' own intentions and actions, but also of how they see the intentions and actions of others. For example, Warmington and McColl's49 study of the ways medical students narrate patient care experiences, while not using the word ‘agency’ explicitly, framed the students as agentive storytellers, ‘positioning’ themselves vis-a-vis patients and instructors (see Table 1). Warmington and McColl's49 participants used their stories to justify, with reservations, ignoring some consent procedures (e.g., getting full consent for a medical student to practice rather than just implying it is not a choice). This lens highlights the rhetorical moves narrators make with their stories.

[행위자적 렌즈]는 참가자들의 의도적인 활동에 대한 통찰력을 제공할 수 있지만, 이러한 전략들은 또한 화자가 [기존의 규범과 담론에 의해 어떻게 위치지어지는지positioned by]를 반영한다. 서술형 에이전트는 그들이 자신을 발견하는 [상황과 구조에 의해 제약]을 받으므로, [행위자적 렌즈]를 사용하는 사람들은 또한 이러한 제약을 설명해야 한다. 게다가, 연구 내러티브를 구성할 때, 연구자도 자신의 행위자성을 행사한다는 사실이, 행위자적 렌즈를 더욱 복잡하게 만든다. 참여자의 내러티브를 분석하든, 사건과 경험에서 내러티브를 생성하든, 연구자들은 자신의 이야기에서 일부 내러티브 에이전시를 [공동 선택co-opt]한다.

While the agentive lens can provide insights into participants' intentional activities, these strategies also reflect how the narrator is positioned by existing norms and discourses (recalling the situated lens above).41 Narrative agents are constrained by situations and structures in which they find themselves, so those using an agentive lens must also account for these constraints.48, 49 Moreover, in constructing research narratives, scholars exercise their own agency, further complicating an agentive lens. Whether analysing participant narratives or creating narratives from events and experiences, researchers co-opt some narrative agency in their own telling.

마지막 렌즈 NA는 [순차적sequential 렌즈]이다: 이야기 세계(즉, 이야기 세계)와 경험 세계(즉, 삶의 세계)에서 사건의 순서를 의미한다. Riessman은 내러티브의 기본 정의에 [스토리 세계]와 [삶의 세계]의 순서를 모두 포함시켰다

  • '일시적으로 순서가 매겨지고 일련의 사건들을 요약하는 대화의 경계지어진 세그먼트'와 
    NA의 구별되는 특징인 '행동 순서에 대한 주의'를 취하는 것

The final lens NA offers is sequential: the ordering of events in a story (i.e., the story world) and in experience (i.e., the life world).41 Riessman included both story world and life world ordering in her basic definition of narrative:

  • ‘a bounded segment of talk that is temporally ordered and recapitulates a sequence of events’23 and took ‘attention to sequences of action’ to be the distinguishing feature of NA.23 

행동의 순서는 많은 사람들이 그들의 [세계를 이해하는 한 가지 방법]이며, 종종 시간적 순서로부터 [인과관계를 귀속]시킨다이야기 세계나 삶의 세계에서 [사건의 시퀀스]에 집중하는 것은 다음의 이해를 뒷받침한다.

  • 참가자들이 그들의 삶에서 다양한 사건과 개인을 어떻게 이해하는지,
  • 그들이 서로 어떻게 상호작용하는지, 그리고
  • 그들이 다른 사람들을 야기시키는 어떤 사건과 행동을 어떻게 경험하는지 . 

Sequencing of actions is one way many people make sense of their world, often imputing causality from temporal ordering.31, 40 Attending to the sequence of events—either in the story world or the life world—supports an understanding of

  • how participants understand the different events and individuals in their lives,
  • how they interact with each other and
  • how they experience some events and actions causing others.3140 

예를 들어, 신경외과 의사들의 이야기에서 질병 위신에 대한 요한네센의 연구에서, 그는 이러한 이야기들 - 파단, 진단, 치료 그리고 정상으로의 복귀 - 의 일련의 사건들이 [서양 문화에서 강한 남성적 영웅과 함께 영웅적 스토리]를 미러링한다고 주장했다. 이 경우, [순차적 렌즈]는 어떻게 신경외과의사들이 그들의 행동과 결과에 대해 상상하는지, 그리고신경외과의사로서의 정체성을 구축하는지에 대한 통찰력을 제공하면서 [특정한 유형type]의 이야기 구조를 드러낸다.37

For example, in Johannessen's study of disease prestige in neurosurgeons' narratives, he argued that the sequence of events in these narratives—rupture, diagnostics, treatment and return to normality—mirrored heroic stories with a strong masculine hero in Western culture (see Table 1).37 In this case, the sequential lens revealed a particular type of story structure, offering insight into how those neurosurgeons conceived of their actions and consequences, building prestige for their identity as neurosurgeons.37

[언어적 렌즈]와 마찬가지로 [순차적 렌즈]는 단편화를 초래할 수 있고, 내러티브의 전체적인 목적을 보는 데 어려움을 초래할 수 있다. 또한, [행위자적 렌즈]와 마찬가지로, 이 렌즈는 순서 선택에 있어 서술자narrator의 행위자성을 지나치게 강조할 수 있다. 게다가, 철학자 게일런 스트로슨은 과거와 현재 그리고 미래를 가로지르는 사람으로서의 자아를 기본적으로 직교적으로 이해하는 것은 모든 사람에게 선천적인 것은 아니라고 주장했다. 어떤 이들은 그들의 시간적 자아를 삽화episodic로 생각하기 때문에, 자신의 삶을 내러티브로 인식하지 못한다. 그러한 개인에게 순차적 선택은 근본적인 인과적 이해나 감각 형성 방법을 반영하지 못할 가능성이 높다.
Like the linguistic lens, the sequential lens can lead to fragmentation and difficulty seeing the overall narrative purposes. Also, like the agentive lens, this lens can overemphasise the agency of the narrator in making sequencing choices. Moreover, the philosopher, Galen Strawson,51 argued that the basic diachronic understanding of the self as someone who stretches across past, present and future is not innate to everyone. Some conceive of their temporal selves as episodic and, therefore, have no sense of their lives as narratives.51 For such individuals, sequential choices are likely not reflective of underlying causal understandings or ways of sense-making.


위의 설명에서 알 수 있듯이, 우리가 논의하는 5개의 NA 렌즈는 HPE 연구원들이 얻을 수 있는 다양한 종류의 잠재력을 가지고 있다. 이러한 잠재력을 설명하기 위해 분석적 접근법이 이 다섯 개의 렌즈에 해당한다고 믿는 다섯 개의 HPE 논문으로부터 위의 예를 제공했다. 우리는 표 1에 이것들을 요약한다. 독자에게 NA에 대한 다양한 접근방식을 제공하기 위해 다양한 방법론과 방법을 사용하는 다양한 국가에서 왔다.

As the descriptions above illustrate, the five NA lenses we discuss hold different kinds of potential that HPE researchers can harvest. In order to illustrate this potential, we offered examples above from five HPE articles whose analytic approaches, we believe, correspond to these five lenses. We summarise these in Table 1. They are from a variety of countries, using a variety of methodologies and methods to give the reader a diversity of approaches to NA.

4 렌즈에서 방법으로: 내러티브 분석 유형
4 FROM LENSES TO METHODS: NARRATIVE ANALYSIS TYPOLOGIES

우리가 위에서 사용한 예에서 알 수 있듯이, 전체론적, 위치적, 언어적, 행위자적 및 순차적 렌즈는 각각 잠재적인 이점과 한계를 제공한다. 그러나 이 렌즈들은 그 자체로 방법methods이 아니다. 플롯 분석, 대화식 서술 분석, 내러티브 분석에 대한 브라운 교육 가이드(BEGAN) 그리고 아마도 가장 널리 사용되는 접근법인 라보프와 왈레츠키의 구조 분석 등, 연구자들은 다양한 연구 질문을 다루기 위해 다양한 방법을 사용해 왔다

As the examples we use above demonstrate, the holistic, situated, linguistic, agentive and sequential lenses each offer potential benefits and limitations. But these lenses are not, themselves, methods: researchers have used various methods to address their research questions like plot analysis,52 dialogic narrative analysis,36 the Brown Educational Guide to the Analysis of Narrative (BEGAN)53 and, perhaps, the most widely used approach, Labov and Waletzky's structural analysis.35, 47, 54-56 Scholars have described different typologies to try to make sense of this variety of methods.20, 25, 26, 32, 41 

학자들은 이러한 다양한 방법을 이해하기 위해 다양한 유형학을 설명해왔다. 한 가지 접근방식은 NA 방법이 다루는 [내러티브의 '수준level']에 따라 분류하는 것이다. 

  • 예를 들어, 밤버그는 이야기 자체의 실제 텍스트, 텔러와 청자 사이의 상호작용적 공동 구성, 텔러와 청자가 각각 어떻게 자기 자신에 대한 특정한 개념을 별도의 분석 수준으로 '설립하고 보여주는'지에 접근했다. 밤베리는 각 수준에서 내용과 맥락을 단계적으로 해석함으로써 내러티브를 이해하게 된다.
  • 예를 들어, Warmington과 McColl은 '대화적 서술 분석'을 사용하여 밤버그의 세 가지 수준을 모두 조사했으며, 이야기 자체, 내레이터와 인터뷰 진행자 간의 상호작용, 그리고 전문적 정체성 내레이터가 스스로 만들어 내는 것을 조사하였다.

One approach is to classify NA methods according to which ‘level’ of the narrative they attend to.25, 41 

  • For instance, Bamberg41 approached the actual text of the narrative itself, the interactional co-construction of the narrative between teller and hearer, and how teller and hearer ‘establish and display particular notions of selves’ each as separate levels of analysis. Bamberg comes to understand narratives through stepwise interpretation of the content and context at each level.
  • Warmington and McColl,36 for instance, used ‘dialogic narrative analysis’ to examine all three of Bamberg's levels, examining the stories themselves, the interactions between narrators and interviewers, and the professional identities narrators were creating for themselves.

약간 다른 접근법으로 폴킹혼과 스털리(Starlyley)는 각각 역할 서사극에 기초하여 NA를 비슷하게 입력했다.

  • 내러티브가 연구자들이 생각think about하는 [패러다임적 분석]의 대상인지 여부  (예: 범주 분석 및 기사 정리)
  • 내러티브가 연구자들이 생각think with하는 [합성적 분석]의 산물인지 여부 (즉, 스토리 분석 및 새로운 스토리 작성)

In a slightly different approach, Polkinghorne26 and Bleakley20 each typologised NA similarly, based on the role narrative plays:

  • whether narratives are the object of paradigmatic analysis (i.e., categorical analysis and chunking up stories) that researchers think about or, instead,
  • whether narratives are the product of synthetic analysis (i.e., narrative analysis and creating a new story) that researchers think with.

이 접근법에서 NA의 일부 방법은 이야기를 데이터로 가져다가 분해break down한다. 반면 다른 사람들은 경험과 사건의 데이터를 사용하여 스토리를 만들어create 더 잘 이해한다. 지금까지 HPE 학자들은 (위에서 논의한 5개의 HPE 연구와 마찬가지로) 참가자들의 이야기를 이해하기 위해 NA 방법을 사용할 때 주로 전자의 접근법을 취했다. [이야기를 가지고 생각하는 것Thinking with stories]은, 패러다임적 접근법과 달리, 이야기를 단순 데이터로 환원하지 않으면서, 내러티브의 잠재적인 '감정적 영향'을 희생시키기 때문에 잠재적으로 강력하지만 개발되지 않은 방법론적인 도구이다.20

Within this approach, some methods of NA take stories as data and break them down, while others use the data of experiences and events to create stories to better understand them. Thus far, HPE scholars have mainly taken the former approach, using NA methods to make sense of participants' stories,20 as with the five HPE studies we discussed above (see Table 1).34-37, 47 Thinking with stories is a potentially powerful, but untapped, methodological tool for tackling HPE's wicked problems because, unlike a paradigmatic approach, it does not threaten to reduce stories to mere data, sacrificing the potential ‘affective impact’ of narrative.20

5 진주: 서사의 약속과 편파성
5 PEARLS: THE PROMISE AND PARTIALITY OF NARRATIVE

NA 렌즈(그리고 각 렌즈에 따르는 잠재적인 이점 및 제한 사항)를 선택할 때, 연구자들은 다양한 분석 방법(즉, 분석 및 합성 대 패러다임 분석의 수준)이 해당 렌즈를 어떻게 형성하는지 고려해야 합니다.

  • 예를 들어, 연구자들은 밤베르크의 상호작용적 수준의 분석을 통해 [상황적 렌즈]의 잠재적인 통찰력, 즉 사회 문화적 맥락이 어떻게 세계에 대한 나레이터의 이해를 형성하는가에 접근할 수 있다.
  • 또는, 학자들은 밤베르크의 스키마의 한 단계 아래로 내려가 [순차적 렌즈]에 대한 잠재적인 통찰력을 얻을 수 있으며, 텍스트 자체에서 어떤 사건의 시퀀스가 원인과 결과의 내레이터 구성에 대해 드러내는지를 이해할 수 있다.
  • 대조적으로, 정체성에 초점을 맞춘 한 단계 '상위' 분석은 [행위자적 렌즈]와 참가자들이 자신과 타인의 의도와 행동을 표현하기 위해 하는 수사적 움직임을 뒷받침할 수 있다. 

In choosing an NA lens—as well as the potential benefits and limitations that come with it—researchers must consider how various analytic methods (i.e., the level of analysis and synthetic versus paradigmatic analysis) shape that lens.

  • For instance, researchers could access the potential insights of a situated lens—an understanding of how social and cultural contexts shape narrators' understandings of the world—through Bamberg's41 interactional level of analysis.
  • Alternatively, scholars could go one level ‘down’ in Bamberg's schema to the textual level to gain the potential insights of the sequential lens, understanding what particular sequences of events in the text itself reveal about narrators' constructions of cause and effect.41 
  • In contrast, an analysis one level ‘up’, with its focus on identity, could support the agentive lens and the rhetorical moves participants make to represent their own and others' intentions and actions.41

 

  • 폴킹혼의 분석적 유형론을 본다면, [전체론적 렌즈]를 가지고 전체 스토리에 대한 복잡하고 일관성 있는 이해를 추구하는 사람들은 [참가자들의 경험을 재-스토리restorying하는 합성적 접근법]을 사용할 수 있다.
  • 반대로, [언어적 렌즈]를 통해 서술자들이 그들 자신과 그들의 세계를 표현하는데 있어서 내리는 선택들을 더 잘 이해하고자 하는 연구자들은 [패러다임적 분석]을 사용할 수 있다.

분석적 접근의 범위와 NA 렌즈의 다양성은 HPE 학자들의 연구 실습을 풍부하게 할 가능성이 있다.

  • Working from Polkinghorne's26 analytic typology, those seeking a complex and coherent understanding of a full story through the holistic lens might use a synthetic approach, restorying participants' experiences.
  • In contrast, researchers who want to better understand the choices narrators make in representing themselves, and their world through the linguistic lens might use paradigmatic analysis.26 

The range of analytic approaches and the variety of NA lenses hold the promise to enrich the research practices of HPE scholars.

그러나 여기서 설명하는 5개의 렌즈 중 어떤 것도 어떤 분석적 접근법에도 완벽하게 매핑되지 않으며, HPE의 고약한 문제에 대한 '기성품' 솔루션을 제공하지도 않습니다. NA 렌즈는 개념적 프레임워크, 특정 연구 질문, 수집된 데이터 및 수집 방법 및 대상과 일치하는 연구 설계로 의도적으로 짜여져야 한다. 또한 선택된 NA 렌즈는 연구자가 해결하고자 하는 문제 또는 질문과 일치해야 하며, 연구자가 설명하고자 하는 청중에게 말해야 한다. NA를 하는 것은 연구 조건에 특정한 [특정한 노력particularistic endeavour]이다. 스토리는 일종의 [상식적인 현실]을 창조하는 힘을 가지고 있는데, 린드는 이를 '보편적 사실성의 문제로 위장한 도덕성의 문제'라고 불렀다.

Yet, none of the five lenses we outline here map perfectly onto any analytic approach, nor do they offer ‘off the shelf’ solutions to HPE's wicked problems. The NA lenses must be deliberately woven into a study design, concordant with the conceptual framework, the specific research questions, the data collected and how and by whom it is collected. Furthermore, the NA lens selected must be congruent with the problem or question the researcher is trying to address, speaking to the audience for whom she is trying to address it. Doing NA is a particularistic endeavour, specific to the conditions of research.13 Stories have the power to create a kind of commonsense reality, what Linde40 called ‘an issue of morality disguised as an issue of universal factuality’. 

우리는 NA 방법과 렌즈도 이러한 힘을 가질 수 있다고 주장합니다. 방법과 렌즈를 선택했으니, '등장'하는 진리가 유일한 진실the truth이라고 믿기 쉽다. 예를 들어, 인종 차별 치료에 대한 흑인 의사의 이야기에 대한 [순차적 렌즈]는 반복된 경험들이 서로에게 쌓이는 방식을 강조할 수 있지만, 이것은 [행위자적 렌즈]로 더 명확해질 수 있는 인종 차별적 권력 구조에 대한 저항을 가릴 수 있다. 게다가, 이 렌즈들 중 어느 것도 참가자들이 경험하는 것을 진실로 드러내지 않을 것이고, 애초에 이야기를 하는 그들의 행위자성을 잠재적으로 감소시킬 것이다. 즉, 각각의 NA 렌즈는 무언가를 가리면서, 무언가를 드러낸다. 리스만은 이렇게 모함했다. '이야기적 진실은 항상 편파적이다- 어딘가에 열성적이고, 불완전하다'

We maintain that NA methods and lenses can also have this power. Having chosen a method and a lens, it is easy to believe that the truth that ‘emerges’ is the truth. For instance, a sequential lens on a Black physician's stories of racist treatment might highlight the ways repeated experiences build on each other, but this may mask the resistance to racist power structures that might be clearer with an agentive lens. Moreover, neither of these lenses may reveal what participants experience as truth, potentially diminishing their agency in telling the story in the first place. In other words, each NA lens both obscures and reveals. Riessman23 framed it this way: ‘Narrative truths are always partial—committed and incomplete’.

이 편파성은 이 작품의 작가로서 우리 각자에게도 적용됩니다. 우리는 우리의 이론적이고 방법론적이며 개인적인 렌즈를 이 작업에 가져옵니다.

  • 아비게일은 언어학자이자 교육심리학자이며 질적, 혼합적 방법 연구자이다. 연구자, 교사, 학부모로서, 그녀는 자신의 이야기 전달 기관인 개인적이고 전문적인 것을 받아들이는 법을 배우고 있다.
  • 라라는 이론가이자 질적 방법론자로 HPE의 다양한 주제를 탐구해 왔으며, 대부분은 개인이 집단과 함께 참여하는 근본적인 전제에 초점을 맞추고 있다. 그녀는 이야기를 연구를 공유하고, 행동에 영향을 미치며, 가정에 도전하는 강력한 수단으로 본다.
  • 르네는 교육학자, 이론가, 질적 방법론자이다. 그녀는 직장 학습, 직장 지도, 그리고 직장 내에서의 직업 간 학습과 교육 역학에 대해 글을 쓴다. 그녀는 깊고 의미 있는 학습과 이해를 제공하기 위해 가르치고 연구하는 이야기의 힘을 믿습니다.

This partiality holds for each of us as authors of this piece as well. We bring to this work our own theoretical, methodological and personal lenses.

  • Abigail is a linguist, educational psychologist and qualitative and mixed methods researcher who writes about experiences of agency. As a researcher, teacher and parent who has moved across fields and across the country, she is learning to embrace the agency of her own storytelling—personal and professional.
  • Lara is a theorist and qualitative methodologist who has explored a range of topics in HPE, most of which focus on the foundational premises through which individuals engage with groups and vice versa. She sees stories as powerful means of sharing research, of impacting actions and challenging assumptions.
  • Renee is an educationist, a theorist and qualitative methodologist. She writes about workplace learning, workplace guidance and the interprofessional learning and teaching dynamic within the workplace. She believes in the power of stories in teaching and research to provide deep and meaningful learning and understanding.

이런 경험들을 볼 때, 우리는 모두에게 있지 않을 수도 있는 이야기들에 힘과 효용을 돌릴 수 있고, 다른 사람들과는 다르게 NA의 렌즈를 볼 수도 있다. 우리가 제시하는 5개의 NA 렌즈와 마찬가지로, 우리만의 렌즈는 어떤 부분은 비추고 어떤 부분은 가립니다. NA에 대한 우리의 이야기는 모든 이야기와 마찬가지로 '경험된 현실 속에서 승리를 거둔 구성자'이다. 우리는 NA 렌즈를 사용하는 다른 사람들의 구성을 기다리고 있는데, 그들이 우리의 연구 문제를 가지고 우리의 분야로 나아가는 데 도움을 줄 수 있기를 바란다.

Given these experiences, we may attribute power and utility to stories that may not be there for everyone, and we may see the lenses of NA differently than others would. Just like the five NA lenses we present, our own lenses illuminate some areas and conceal others. Our story about NA, like all stories, is ‘a triumphant configurer of experienced reality’.42 We await others' configurations using NA lenses, with the hope that they can help us move forward as a field with our research problems, wicked or otherwise.


Med Educ. 2021 Dec;55(12):1369-1375.

 doi: 10.1111/medu.14597. Epub 2021 Aug 29.

The potential of narrative analysis for HPE research: Highlighting five analytic lenses

Affiliations collapse

Affiliations

1Center for Health Professions Education, Uniformed Services University, Bethesda, Maryland, USA.

2Center for Health Professions Education, Henry M. Jackson Foundation for the Advancement of Military Medicine, Bethesda, Maryland, USA.

3School of Health Professions Education, Department for Educational Development & Research, Faculty of Health, Medicine and Life Sciences, Maastricht University, Maastricht, The Netherlands.

PMID: 34291492

DOI: 10.1111/medu.14597

Abstract

Context: Health professions education (HPE) has increasingly turned to qualitative methodology to address a number of the field's difficult research problems. While several different methodologies have been widely accepted and used in HPE research (e.g., Grounded Theory), others remain largely unknown. In this methodology paper, we discuss the value of narrative analysis (NA) as a set of analytic approaches that offer several lenses that can support HPE scholars' research.

Methods: After briefly discussing the 'narrative turn' in research, we highlight five NA lenses: holistic, situated, linguistic, agentive and sequential. We explore what each lens can offer HPE scholars-highlighting certain aspects of the data-and how each lens is limited-obscuring other aspects. To support these observations, we offer an example of each lens from contemporary HPE scholarship. The manuscript also describes methods that can be employed in NA research and offers two different typologies of NA methods that can be used to access these lenses.

Conclusions: We conclude with a discussion of how different analytic methods can be used to harness each of the lenses. We urge the deliberate selection and use of NA methods and point to the inherent partiality of any NA approach. Reflecting on our position as narrative scholars, we acknowledge how our own lenses illuminate some areas and conceal others as we tell the story of NA. In conclusion, we invite other researchers to benefit from the potential NA promises.

학업적 어려움을 겪는 의과대학생 및 전공의를 위한 개입 (BEME Guide No. 56) (Med Teach, 2019)
Interventions for undergraduate and postgraduate medical learners with academic difficulties: A BEME systematic review: BEME Guide No. 56 
Miriam Lacassea , Marie-Claude Audetatb,c,d, Elisabeth Boileaue , Nathalie Caire Fonb, Marie-Helene Dufoura, Marie-Claude Laferrieref, Alexandre Lafleurg, Eve La Rueh, Shirley Leei,j, Mathieu Nendazc,k , Emmanuelle Paquette Raynardf, Caroline Simarda , Yvonne Steinertl and Johanne Theor^eta 

 

소개
Introduction

의료 훈련 프로그램은 까다롭다. 대부분의 의학 학습자들은 큰 어려움 없이 훈련을 마치는 반면, 10-15%는 프로그램을 진행하는 동안 약간의 문제를 경험하게 될 것이다(야오와 라이트 2000; 파우스티넬라 외). 2004; Reamy and Harman 2006; 예이츠와 제임스 2006). 학습자의 어려움은 의학 교육에서 다양한 수준에서 큰 영향을 미칠 수 있습니다. 교사들은 학습자들이 학업상의 어려움을 겪을 때, 특히 행동장애가 있는 경우, 낙담할 수 있다(Hicks et al. 2005). 기관 및 사회 수준에서, 어려움에 처한 학습자는 또한 환자 치료와 안전의 질에 심각한 영향을 미칠 수 있다(Hicks et al. 2005). 임상 교사는 부분적으로 증거 기반 교정조치 옵션에 익숙하지 않기 때문에 종종 불만족스러운 훈련생 성과를 보고하는 데 어려움을 겪는다(Yepes-Rios et al. 2016).

Medical training programs are demanding. Whereas most medical learners will complete their training without significant difficulties, 10–15% will experience some problem during their program (Yao and Wright 2000; Faustinella et al. 2004; Reamy and Harman 2006; Yates and James 2006). Learner difficulties can have a huge impact at various levels in medical education. Teachers may become discouraged when facing learners experiencing academic difficulties, particularly for those with behavioral issues (Hicks et al. 2005). At the institutional and societal levels, learners in difficulty can also have a serious impact on the quality of patient care and safety (Hicks et al. 2005). Clinical teachers often struggle to report unsatisfactory trainee performance, in part because they are not familiar with evidence-based remediation options (Yepes-Rios et al. 2016).

박스 1은 학업 어려움, 학부생, 대학원 교육생 및 교정에 대해 본 기사에서 사용된 작업 정의를 보고한다.
Box 1 reports the working definitions used in this article for academic difficulties, undergraduate students, postgraduate trainees, and remediation.

상자 1. 정의
Box 1. Definitions/Glossary

학업상 어려움이 있는 학습자
Learners with academic difficulties

  • "지식, 태도 또는 기술에 대한 문제로 인해 훈련 프로그램의 기대에 미치지 못하는 학습자"(Steinert 2008)
  • Learners who do not meet the expectations of a training program because of a problem with knowledge, attitudes, or skills” (Steinert 2008).

학부생
Undergraduate students

  • 의학박사 취득 과정에 있는 학습자.
  • Learners who are in the process of obtaining a medical degree.

대학원생
Postgraduate trainees

  • 이미 의사 학위를 소지한 학습자(주민, 인턴, 재단 의사)는 국가별 용어에 따라 사전 등록 하우스 담당자와 선임 하우스 담당자로 알려져 있다.
  • Learners who already have a medical degree, also known as residents, interns, foundation doctors – who were formerly known as pre-registration house officers and senior house officers – and specialty registrars, depending on each country terminology.

재교육
Remediation

  • "표준 교육과정을 넘어서는 추가 강의는 추가 강의가 없다면 해당 직업에 필요한 기술을 습득할 수 없는 학습자에게 개별화된 것이다."(게라시오, 푸르파리 등)
    다만 '학업적 어려움'은 다양한 개인·교육적·환경적 요인에 의해 발생할 수 있으며, 일부 '학업적 어려움을 겪는 학습자를 위한 개입'은 교정 개념을 넘어설 수도 있다.
  • Additional teaching above and beyond the standard curriculum, individualized to the learner who without the additional teaching would not achieve the necessary skills for the profession.” (Guerrasio, Furfari, et al. 2014). However, ‘academic difficulties’ may be caused by a range of individual, educational and environmental factors, and some “interventions for learners with academic difficulties” may go beyond the concept of remediation.


일부 교과서에는 의료 교육의 교정조치를 목표로 하는 다양한 개입이 요약되어 있지만(Guerrasio 2013; Kalet and Chou 2014) 이러한 연구에서 제안된 대부분의 개입은 전문가 권고사항이며, 발표된 연구에서 뒷받침되지 않는다. 
Some textbooks summarize various interventions aimed at remediation in medical education (Guerrasio 2013; Kalet and Chou 2014), but most of the interventions proposed in these works are expert recommendations, not supported by published studies.

  • 하우어 외. (2009)는 학부, 대학원 및 지속적인 의료 교육 수준에서 교정 개입에 대한 발표된 연구를 설명했다. 그들은 13개의 연구를 식별했으며, 주로 훈련생의 부족한 지식이나 임상 기술 또는 개업 의사의 표준 이하의 실천 성과를 교정하기 위한 소규모 단일 기관의 노력을 기술했다. 그러한 근거 부족으로, 그들은 교정조치에 대한 전략에 대한 다중 기관, 결과 기반 연구를 장려했으며, 향후 성과에 미치는 영향을 결정하기 위해 장기적인 후속 조치를 사용했다. 
  • 클레랜드 외 연구진(2013)은 특정 교정조치 개입이 작동한 방법과 이유를 명확히 하기 위해 이용 가능한 증거를 종합했다. 이들은 주로 의대생을 대상으로 한 31개 연구를 선정했는데 대부분의 개입이 시험이나 평가를 통과하기 위한 성과 향상에 초점을 맞추고 있으며 어떤 형태의 추가 지원이나 가르침이 학습 진전에 중요한지에 대한 통찰력은 제공하지 않는다고 결론 내렸다. 더 최근의 연구들은 일반적으로 더 나은 품질을 가지고 있었다. 

 

  • Hauer et al. (2009) described published studies on remediation interventions at the undergraduate, graduate, and continuing medical education levels. They identified 13 studies, primarily describing small, single-institution efforts to remediate deficient knowledge or clinical skills of trainees or below-standard-practice performance of practicing physicians. With such paucity of evidence, they encouraged multi-institutional, outcomes-based research on strategies for remediation, with the use of long-term follow-up to determine the impact on future performance.
  • Cleland et al. (2013) synthesized the available evidence to clarify how and why certain remediation interventions worked. They selected 31 studies, mostly targeting medical students, and concluded that most interventions focus on improving performance to pass an examination or assessment and provide no insight into what types of additional support or teaching are critical, in terms of advancing learning. More recent studies were generally of better quality.

이러한 리뷰는 학업상 어려움을 겪는 학습자를 위한 대부분의 개입이 전문가의 조언에 의존하며, 거의 평가되지 않은 것으로 보인다고 언급하고 있으며, 그들은 또한 학업상 어려움을 겪는 의학 학습자를 지원하기 위한 모범 사례를 안내하기 위한 증거가 부족하다고 결론지었다.

These reviews stated that most interventions for learners experiencing academic difficulties rely on expert advice and few appear to have been assessed; they also concluded that evidence was lacking to guide best practices to support medical learners with academic difficulties.

Cleland가 여러 데이터베이스에서 검색했지만, 의료 교육에 대한 일부 관련 데이터베이스(예: 교육 소스 및 PsycINFO)는 탐색되지 않았다. 그들의 문학 리뷰는 주로 교육 측정과 프로그램 평가에 초점을 맞췄다. 또한 두 문헌 리뷰 모두 커크패트릭 계층 구조만을 따랐으며(커크패트릭 1994), 컨텍스트, 입력, 프로세스 같은 프로그램 평가의 다른 측면은 다루지 않았다(스터플빔 2003).

Although Cleland searched in multiple databases, some relevant databases for medical education were not explored (e.g. Education Source and PsycINFO). Their literature review focused primarily on educational measurement and program evaluation. Furthermore, both literature reviews extracted their data following the Kirkpatrick hierarchy only (Kirkpatrick 1994), and did not address other aspects of program evaluation, such as context, input or process (Stufflebeam 2003).

 

교육 진단
Educational diagnosis

학부 또는 대학원 의료 훈련 및 교육 진단 중 학문적 어려움을 암시하는 요소는 의학 교육 문헌에 잘 설명되어 있다(Cariaga-Lo 등 1997; Stern 등 2005; Yates 및 James 2006). 의료 교육에서 어려운 학습 상황의 분석을 지원하는 대부분의 프레임워크(샤피로 외 1987; 고든 1993; 본 외 1998; 칸 2001; 미첼 외 2005)는 교육 진단 바퀴(Lacasse 2009)로 개조된 스타이너트(2008, 2013)에 의해 제안되어 요약될 수 있다.
Factors suggestive of academic difficulties during undergraduate or postgraduate medical training and educational diagnoses are well described in the medical education literature (Cariaga-Lo et al. 1997; Stern et al. 2005; Yates and James 2006). Most of the frameworks supporting the analysis of challenging learning situations in medical education (Shapiro et al. 1987; Gordon 1993; Vaughn et al. 1998; Kahn 2001; Mitchell et al. 2005) can be summarized by the one proposed by Steinert (2008, 2013), adapted as the Educational Diagnosis Wheel (Lacasse 2009).

이 프레임워크는 학습자가 학습 환경/시스템에서 교사와 상호 작용하는 학습에 대한 [사회 구성주의적 접근방식]을 참조한다. 학습자 문제에는

  • 학업적 어려움(기본, 임상, 절차적 또는 업무적 지식; 인지적(임상 추론 기술, 연구 기술, 시험 응시 기술), 대인관계, 구조적 또는 절차적 기술; 그리고 개인적, 대인관계 또는 직업적 태도
  • 개인 생활 문제 (건강, 배우자/가족, 금융, 문화 적응 및 사회 생활). 

This framework refers to a socio-constructivist approach to learning, where the learner interacts with a teacher in a learning environment/system. Learner issues involve

  • academic difficulties (fundamental, clinical, procedural or work setting knowledge; cognitive (clinical reasoning skills, study skills and test-taking skills), interpersonal, structural or procedural skills; and personal, interpersonal or professional attitudes) as well as 
  • personal life issues (health, spouse/family, financial issues, cultural adaptation and social life).

이러한 [개인 생활 문제]에 [교사 수준(개인 생활 문제 또는 교수 개발의 격차)] 또는 [환경/시스템 수준(학습 기후 또는 학습 조건)]의 어려움이 더해져서, 역량 개발 및 결과적인 학업 성공여부에 영향을 미친다. 그러나 학문적 어려움에 기여하는 학습에 대한 이러한 차원은 역량 문제를 설명하는 것이 아니라 그에 따른 교육 진단 및 계획 관리를 설명하는 데 도움이 되어야 한다(Lacasse 2009).

These personal life issues, together with difficulties at the teacher level (personal life issues or gaps in faculty development) or environment/system level (learning climate or learning conditions) often have an impact on competency development and resulting academic success. However, these dimensions around learning which contribute to academic difficulties should not excuse competence issues but help to explain the educational diagnosis and plan management accordingly (Lacasse 2009).

 

Conceptual frameworks underlying interventions for learners experiencing academic difficulties

이론적 관점에서 학문적 어려움을 겪는 학습자에게 대부분의 개입은 학습이론을 참조한다. 예를 들어, 행동의 피드백과 모니터링은 조작적 조건화(Skinner 1974)와 사회적 학습 이론(Bandura 1986)을 참조한다. 연관 학습 전략과 개념 매핑과 같은 인지적 방법은 정보 처리 이론(Miller 1956)과 인지 부하 이론(Sweller 1988)에서 영감을 받았다. 학습/재교육 계획 및 성찰적 실천은 성인 학습(Knowles 1984)과 경험적 학습(Kolb 1984)과 같은 인문주의 이론에서 영감을 받았다. 역할 모델링과 문제 기반 학습은 인지적 견습(Collins et al. 1987)과 위치 학습(Lave and Wenger 1991)과 같은 사회 구성주의 원칙을 따른다.
From a theoretical perspective, most interventions for learners experiencing academic difficulties refer to learning theory. For example,

  • feedback and monitoring of behavior refer to operant conditioning (Skinner 1974) and social learning theories (Bandura 1986);
  • cognitivist methods such as associative learning strategies and concept mapping are inspired by information processing theory (Miller 1956) and cognitive load theory (Sweller 1988);
  • learning/remediation plans and reflective practice are inspired by humanist theories such as adult learning (Knowles 1984) and experiential learning (Kolb 1984);
  • role modeling and problem-based learning follow socio-constructivist principles, such as cognitive apprenticeship (Collins et al. 1987) and situated learning (Lave and Wenger 1991).


그러나 학문적 어려움을 겪는 학습자를 위한 개입을 설명하는 대부분의 연구는 명확한 개념 프레임워크를 제공하지 않는다(클랜드 외 2013). 그럼에도 불구하고, 보건 직업 교육은 보건 전문가 실습 개발의 한 형태이고 보건 전문가 실습은 행동의 한 형태로 보일 수 있기 때문에, 교육 개입은 그들의 설계에서 행동 변화 이론과 전략을 이용해야 한다. 제안된 변화 메커니즘으로 개입 내용을 식별하는 데 도움이 되는 행동 변화 기법(BCT) 그룹을 지정하는 신뢰할 수 있는 방법이 개발되었다. 보충 표 1에 요약된 Michie의 BCT 택사노미(Michie et al. 2015)는 행동, 분야 및 관심 영역에 걸쳐 사용될 수 있는 합의된 신뢰할 수 있는 분류법이다. 이 분류법은 데이터 추출 및 분석 과정에서 개입을 분류하는 데 매우 유용하지만 의료 교육에서는 거의 사용되지 않았다(Duncan et al. 2012; French et al. 2012). 

However, most studies describing interventions for learners experiencing academic difficulties do not provide an explicit conceptual framework (Cleland et al. 2013). Nevertheless, since health professions education is a form of health professional practice development, and health professional practices can be seen as a form of behavior, educational interventions should take advantage of behavioral change theories and strategies in their design. A reliable method has been developed to specify groups of behavior change techniques (BCTs), which help to identify intervention content with their proposed mechanisms of change. Michie’s BCT Taxonomy (Michie et al. 2015), outlined in Supplemental Table 1, is a consensually agreed, reliable taxonomy that could be used across behaviors, disciplines and areas of interest. This taxonomy is very useful to classify interventions in a process of data extraction and analysis, but it has been rarely used in medical education (Duncan et al. 2012; French et al. 2012).

Table  SEQ Table \* ARABIC 1 – Definitions and examples of Behaviour Change Techniques groupings

 

Behaviour Change Techniques groupings Definition excerpts (selected from Michie et al., 2015) and adapted for the medical education context) Examples of interventions in the context of medical education
Antecedents (Accommodations) Restructure the physical/social environment; avoid/reduce exposure to cues for the behaviour; advise or arrange to use an alternative focus for attention to avoid triggers for unwanted behaviour; add objects to the environment in order to facilitate performance; alter body structure, functioning or support to facilitate behaviour change Reduced patient load
Associations Define environmental or social stimulus with the purpose of prompting or cueing the behaviour (with or without reward); withdraw gradually prompts to perform the behaviour; remove aversive stimulus; provide systematic confrontation with a feared stimulus to reduce response to a later encounter (exposure) Clinical reasoning exercises and associative learning
Comparison of behaviour Provide an observable sample of the behaviour; draw attention to others’ performance or perception of behaviour to allow comparison with the person’s own performance Demonstration and role modeling
Comparison of outcomes Present verbal or visual communication from a credible source in favour of or against the behaviour; advise the person to identify and compare pros and cons to change behaviour (including imagining future outcomes of both options) Comparing adverse event rates
Covert learning Advise to imagine performing the wanted/unwanted behaviour, followed by imagining a pleasant/an unpleasant consequence; prompt observation of the consequences for others when they perform the behaviour Imaginary punishment/reward, vicarious consequences
Feedback and monitoring Observe and record behaviour; monitor and provide feedback (self or others) Videotape review
Goals and planning Set or agree on a goal; select strategies to overcome barriers/increase facilitators; prompt detailed planning of performance; create behavioural contract Learning plan
Identity Identify as role model; suggest the adoption of a new perspective on behaviour to change cognitions or emotions about performance; draw attention to discrepancies between current or past behaviour and self-image in order to create discomfort Meeting with faculty advisor/mentoring to discuss professional identity
Natural consequences Provide information or emphasise the consequences or anticipated regret Call back patient if inappropriate management plan decided by the learner before discharge
Regulation Provide pharmacological support; advise on ways of reducing negative emotions to facilitate performance; advise on ways of minimising demands on mental resources to facilitate behaviour change Psychotherapy, pharmacotherapy, etc.
Repetition and substitution Practice the performance of the behaviour to increase habit/skill; prompt substitution of the unwanted behaviour with a wanted/neutral behaviour; repeat the wanted behaviour in an exaggerated way following an unwanted behaviour; set easy-to-perform tasks, making them difficult, but achievable (graded tasks) Repeated rotation
Reward and threat Provide material or social incentive as positive reinforcement to behaviour or outcome; self-incentive; inform that future punishment or removal of reward will be a consequence of performance of an unwanted behaviour Warning letter
Scheduled consequences Arrange for withdrawal of something valued or for aversive consequence if an unwanted behaviour is performed; arrange for reward following any approximation to the target behaviour, gradually rewarding only performance closer to the wanted behaviour; reward completion of behaviour; arrange for removal of an unpleasant consequence on performance of the wanted behaviour Probation
Self-belief Tell the person that they can successfully perform (persuasion about capability); advise to practise imagining performing successfully; focus on past success; prompt positive self-talk before and during behaviour Visualization techniques
Shaping knowledge Provide information; advise; elicit perceived causes of behaviour and suggest alternative explanations; Didactic sessions
Social support Advise on, arrange or provide emotional or practical support Peer tutoring
1 Goals and planning
Ex.: Remediation plan, learning plan/contract, clinical case scenarios/problem-based learning, written or verbal commitments (or contracts) of the learner regarding goals/outcomes
2 Feedback and monitoring
Ex.: Direct or indirect observation and feedback, Portfolio, Video viewing of the student’s performance (for self-monitoring or feedback purposes), Practice audit or other Self-assessment activities (related to clinical competence vs #13)
3 Social support
Ex.: Peer support groups, Mentoring
4 Shaping knowledge
Ex.: Teaching sessions, Lectures, Self-learning modules, Directed readings
5 Natural consequences
Ex.: Call back patient if part of management was inappropriate/ incomplete, Rewrite patient's record if not presented properly
6 Comparison of behaviour
Ex.: Bedside teaching, Role modeling (clinical teacher observation, videos, etc.), Peer-based learning, Providing data about the performance of other colleagues, physicians
7 Associations
Ex.: Prototypes, Checklists (used in the workplace) about the steps to follow
8 Repetition and substitution
Ex.: Repeated rotation/year, Simulation, Practice on models Step-by-step approach, Role playing, Peer-assisted learning (to practice history or physical examination skills)
9 Comparison of outcomes
Ex.: Discussion about outcome data from major medical organisations (e.g. WHO recommendations)
10 Reward and threat
Ex.: Warning letter
11 Regulation
Ex.: Psychotherapy, Meditation and stress reduction therapies, Pharmacotherapy
12 Antecedents
Ex.: Accommodations in the workplace or within the work team (e.g. reduced number of patients, reduced distractions, etc.), Accommodations during assessments (e.g. headphones or separated room, more time allowed, etc.)
13 Identity
Ex.: Teaching as a resident, Self-assessment of one’s values and strengths (in general, not clinical skills which is #2), Meeting with faculty advisor/mentoring to discuss professional identity
14 Scheduled consequences
Ex.: Suspension, Delinquent assignment or task
15 Self-belief
Ex.: Visualization techniques
16 Covert learning
Ex.: Discussions about medical errors/ cases of medical law suits, Discussions about potential consequences of a management plan for the patient

 

 

앞에서 설명한 교육 진단과 관련될 수 있는 16개 이하의 그룹을 분류함으로써 교육 개입에 대한 이해를 촉진한다.
It facilitates understanding of educational interventions by classifying those under 16 groupings, which can be associated with the educational diagnoses depicted previously:

  • 지식 형성을 이용한 개입은 지식 부족을 해결할 수 있다.
  • 행동 비교, 연관성, 반복 및 대체 또는 결과의 비교를 사용한 개입이 스킬 문제를 해결하는 데 도움이 될 것으로 보인다.
  • 자연스러운 결과, 예정된 결과, 보상 및 위협 또는 은밀한 학습에 기초한 개입은 태도 문제와 관련이 있는 것으로 보입니다.
  • 규정(의료/심리적 지원), 선행(숙박), 정체성 또는 자아 믿음에 초점을 맞춘 개입이 학습자의 개인적 문제에 도움이 될 수 있습니다.
  • 사회적 지원을 촉진하는 개입은 교사 및 환경/시스템 문제에 유용할 것이다.
  • 목표와 계획 또는 피드백 및 모니터링에 기반을 둔 개입을 교육적 진단을 다루기 위해 사용할 수 있습니다.
  • Interventions using Shaping knowledge could address Knowledge deficiencies
  • Interventions using Comparison of behavior, Associations, Repetition and substitution or Comparison of outcomes seem promising to address Skills issues
  • Interventions based on Natural consequences, Scheduled consequences, Reward and threat or Covert learning seem relevant for Attitude concerns
  • Interventions focusing on Regulation (medical/psychological support), Antecedents (accommodations), Identity or Self-belief could help with Learners’ personal issues
  • Interventions promoting Social support would be useful for Teachers’ and Environment/System problems
  • Interventions grounded on Goals and planning or Feedback and monitoring may be used to address any educational diagnosis.

목표
Objectives

이 검토의 목표는 학문적 어려움을 겪고 있는 학부(UG) 및 대학원(PG) 의학 학습자를 위한 개입을 식별하고, 이론 기반 개념 프레임워크와 연결하며, 사용에 관한 문헌 기반 권장 사항을 제공하는 것이다.

The goals of this review are to identify interventions for undergraduate (UG) and postgraduate (PG) medical learners experiencing academic difficulties, to link them to a theory-based conceptual framework, and to provide literature-based recommendations around their use.

방법들
Methods

이 체계적인 검토는 BEME의 체계적인 검토 프레임워크를 따랐다. 검토는 체계적 검토 및 메타 분석에 대한 선호 보고 항목(PRISMA)에 따라 보고된다(Moher 등). 2009) (부록 1 보충). 이 검토는 BEME Collaboration에 등록되고 승인되었습니다. 검토 팀은 수락된 BEME 검토 절차를 따랐다. 이 연구 프로토콜은 2017년 4월에 동료 검토, 등록 및 BEME 웹 사이트에 게시되었다(Lacasse et al.
This systematic review followed the BEME systematic review framework (http://www.bemecollaboration.org/Publications+Research+Methodology/). The review is reported in accordance with the Preferred Reporting Items for Systematic Reviews and Meta-analyses (PRISMA) (Moher et al. 2009) (Supplemental Appendix 1). This review was registered with and approved by the BEME Collaboration. The Review team followed accepted BEME review procedures. The study protocol was peer-reviewed, registered and published on the BEME web site in April 2017 (Lacasse et al. 2017).

소스 및 전략 검색
Search sources and strategies

이 체계적인 검토는 (1) 의료 교육, (2) 전문 역량 또는 어려움, (3) 교육 지원 등의 개념을 결합한 MEDLINE, CINAHL, ERMASE, ERIC Education Source 및 PsycINFO 데이터베이스를 조사했다. (사용된 키워드 및 자세한 검색 전략은 부록 2에 제시되어 있습니다.) 문헌은 1990년 1월 1일부터 2016년 12월 31일까지 20세기 마지막 10년 동안 현재의 역량 기반 의료 교육 프로그램의 개발이 시작된 이후 검색되었다(Carraccio et al. 2002).

This systematic review searched the MEDLINE, CINAHL, EMBASE, ERIC Education Source and PsycINFO databases combining the following concepts: (1) medical education, (2) professional competence or difficulty, and (3) educational support. (The keywords used and the detailed search strategy are presented in Supplemental Appendix 2.) The literature was searched from 1 January 1990 to 31 December 2016 since the development of current competency-based medical education programs arose during the last decade of the twentieth century (Carraccio et al. 2002).

의학 학습의 교정조치 옵션에 대한 이전 리뷰에서 검색된 기사(하우어 외) 2009; 클레랜드 외 연구진)이 선정 과정에 추가되었다. 색인화되지 않은 저널(페다고기 메디칼레, 이탈리아 의학 교육 저널, 국제 보건 교육 저널 데 에스콜라 바히아나 데 메디나 에 사우드 푸블리카) 레비스타 시엔시아스 드 라 살루드, 에듀카시온 메디카 수페리오르가 수색을 당했다. 또한 해당 분야의 전문가 3명에게 이메일로 연락하여 이 검토와 관련된 연구 결과를 공유했습니다.
Articles retrieved in previous reviews about remediation options in medical learning (Hauer et al. 2009; Cleland et al. 2013) were added to the selection process. Non-indexed journals (Pédagogie Médicale, Journal of Italian Medical Education, International Journal of Health and Education Journal de Escola Bahiana de Medicina e Saúde Pública. Revista Ciencias de la Salud, Educación Médica Superior) were hand searched. In addition, three experts in the field were contacted by email to share any study results relevant to this review.

스터디 선택 기준
Study selection criteria

이 검토의 초점은 학문적 어려움을 겪고 있는 학부 및 대학원 의학 학습자들을 위한 개입에 있습니다. 따라서, 포함되기 위해서는 다음과 같은 기준을 충족해야 한다.

  • 원본 연구 연구 또는 혁신 보고서
  • 의학 분야에서 비롯되었다.
  • 어려움에 처한 학부생 또는 대학원생에게 초점을 맞춘다.
  • 학업상 어려움을 겪는 학습자를 지원하기 위한 하나 이상의 개입 전략을 설명한다.
  • 적어도 한 가지 형태의 프로그램 평가를 포함해야 한다.

The focus of this review is on interventions for undergraduate and postgraduate medical learners experiencing academic difficulties. Therefore, to be included, articles needed to meet these criteria:

  • original research studies or innovation reports;
  • come from a medical discipline;
  • focus on undergraduate students or postgraduate trainees in difficulty;
  • describe at least one intervention strategy aimed at supporting learners with academic difficulties;
  • include at least one form of program evaluation.

기사는 평가방법론 없이 서술만 할 경우, 개입이 기술되지 않았거나 어려운 학습자를 위해 설계된 경우, 다른 건강관리 프로그램을 대상으로 한 경우, 영어, 프랑스어, 스페인어, 독일어, 이탈리아어 이외의 언어로 작성된 경우 제외됐다.

Articles were excluded if they were only descriptive without an evaluative methodology, if no intervention was described or if the intervention was designed for learners who were not in difficulty, if they were aimed at other healthcare training programs, or if they were written in languages other than English, French, Spanish, German or Italian.

중복 제거 후, 한 검토자(EL 또는 CS)가 검색 전략으로 식별된 모든 제목과 초록을 심사하고 명백히 관련이 없는 보고서를 삭제했다. 두 번째 검토자(ML)는 나머지 제목과 개요를 검토했다. 관련성이 의심스럽다면 이 단계에서 기사는 삭제되지 않았다. 잠재적으로 관련된 모든 인용문에 대해 전체 텍스트 기사가 검색되었습니다. 나머지 글(ML, CS)은 전문을 활용해 검토자 2명이 독자적으로 평가해 포함·제외 기준에 따라 심사 대상 선정 여부를 결정했다. 과정에서 차이가 발생하는 경우 세 번째 검토자(AL)에게 자문을 구했다. 주요 기사가 모두 포함되도록 선별된 기사의 참고 문헌을 검색했다.
After the removal of duplicates, one reviewer (EL or CS) screened all titles and abstracts identified by the search strategy and eliminated obviously irrelevant reports. A second reviewer (ML) reviewed the remaining titles and abstracts. In case of doubt as to their relevance, articles were not eliminated at this stage. Full-text articles were retrieved for all potentially relevant citations. Two reviewers independently assessed the remaining articles (ML and CS) using full texts and decided if they should be selected for the review based on the inclusion and exclusion criteria. A third reviewer (AL) was consulted if differences arose in the process. Bibliographies of selected articles were searched to ensure all key articles were included.

데이터 추출
Data extraction

각 기사에 대해 심사위원이 각 개입 전략(대상 교육진단 및 행동변화 기법 그룹화)과 프로그램 평가 설계에 대한 데이터를 추출해 결과물의 효과와 품질평가를 포함시켰다. 표준화 회의에서는 범위 지정 검색으로 식별된 5개 항목을 사용하여 데이터 추출 시트를 파일럿할 수 있습니다.
For each article, the reviewers extracted data about each intervention strategy (targeted educational diagnoses and behavior change technique groupings) and program evaluation design, including effectiveness of outcomes and quality appraisal. A standardization meeting allowed to pilot the data extraction sheet using 5 articles identified by a scoping search.

두 쌍의 무작위 검토자가 선택한 모든 전체 텍스트 기사에서 독립적으로 데이터를 추출하고 데이터 추출 시트의 관련 정보를 코딩했다. 데이터 추출은 온라인 데이터 추출 양식(부록 3 보충)에 의해 촉진되었다. 포함된 모든 연구의 코드화 후, 평가자 효과를 통제하기 위하여, 여러 코더 간의 연구 코드화 결과를 비교하여 평가자 간 신뢰도를 평가하였다. 연구 설정이 클래스 내 상관관계나 Cohen의 카파를 허용하지 않았기 때문에 각 개입 전략에 관련된 BCT에 대한 동의 백분율이 계산되었다. 프로그램 평가 유형 및 MMAT 지표에 대해 클래스 내 상관관계를 계산했습니다. 3개 조항은 검토자 파일럿의 일부이고 모두 평가했기 때문에 이 분석에서 제외되었다. 코딩의 불일치는 최종 결정을 위해 세 번째 검토자(ML 또는 CS)에게 제출되었다.

Two random pairs of reviewers independently extracted data from all full-text articles selected and coded the relevant information on the data extraction sheet. Data extraction was facilitated by an online data extraction form (Supplemental Appendix 3). After codification of all included studies, inter-rater reliability was assessed by comparing results of study codification between coders, distributed according to control rater effect. Percentage of agreement on BCT involved in each intervention strategy was computed since the study setting did not allow for intra-class correlation nor Cohen’s kappa. Intra-class correlation was computed for program evaluation types and the MMAT indicators. Three articles were excluded from these analyses as they were part of the reviewers' pilot and were rated by all of them. Discrepancies in coding were submitted to a third reviewer (ML or CS) for final decision.

행동 변화 기법 그룹화
Behavior change techniques groupings

각 개입 전략에 관한 데이터 추출은 미치의 BCT 분류법(Michie et al. 2015)을 따랐다. 이 분류법이 임상 교사에게는 직관적이지 않을 수 있기 때문에, 각 BCT 그룹에 대해 제안된 개입에 대한 논의를 통해 각 16개 그룹에 대한 정의를 공통적으로 이해할 수 있었다(보완 표 1). 검토자는 모든 기사에서 검색된 각 개입 전략에 대해 최대 3개의 BCT를 추출했다.
Data extraction regarding each intervention strategy followed Michie’s BCT Taxonomy (Michie et al. 2015). Since this taxonomy might not be intuitive to clinical teachers, a discussion around suggested interventions for each BCT grouping allowed for a common understanding of definitions for each of the 16 groupings (Supplemental Table 1). The reviewers extracted up to three BCTs for each intervention strategy retrieved from every single article.

프로그램 평가 및 결과의 중요성
Program evaluation and importance of outcomes

Issenberg 외 연구진(2005)과 Freeth(2005)가 제안하고 BEME 협력에 의해 체계적인 검토를 위한 채점 표준으로 채택된 Kirkpatrick의 훈련 성과 분류의 수정 버전은 프로그램 평가 데이터 추출 중 결과를 분류하는 데 도움이 되었다. 서로 다른 수준 간의 인과 관계나 계층을 가정하지 않았다. 다음 수준은 다음과 같습니다.
A modified version of Kirkpatrick’s classification of training outcomes proposed by Issenberg et al. (2005) and Freeth (2005), and adopted by the BEME collaboration as a grading standard for systematic reviews (Hammick et al. 2010), helped to classify the outcomes during extraction of program evaluation data, without assuming any causality or hierarchy between the different levels. These levels are:

  • 레벨 1: 반응;
  • 레벨 2A: 태도 변화;
  • 레벨 2B: 지식 및/또는 기술의 변화;
  • 수준 3: 행동 변화 (스태이너트 외 연구진(2012)이 제안한 자체 보고/관찰);
  • 레벨 4A: 직업관행의 변화
  • 레벨 4B: 환자에게 유익하다.

 

  • Level 1: Reaction;
  • Level 2A: Change of attitudes;
  • Level 2B: Change of knowledge and/or skills;
  • Level 3: Behavioral change (self-reported/observed, as suggested by Steinert et al. (2012));
  • Level 4A: Changes in professional practice;
  • Level 4B: Benefits to patients.


데이터는 또한 성과 평가 범위를 넘어 프로그램 평가를 고려하는 스터플빔의 2003년 CIPP 모델(컨텍스트/입력/프로세스/제품)을 사용하여 추출되었다. 이 모델은 평가에 대한 의사결정 중심 접근법으로, 프로그램 관리자에게 시스템적 정보를 제공한다(Fitzpatrick 등 2011).

  • 맥락은 요구 평가를 언급하고,
  • 투입은 비용과 실현 가능성을 수반하며,
  • 프로세스는 구현이 어떻게 전개되었는지 검토하고,
  • 산출은 여기에 제시된 결과를 커크패트릭의 분류 수준에 따라 설명합니다.

Data were also extracted using Stufflebeam’s (2003) CIPP model (context/input/process/product), which considers program evaluation beyond the scope of outcomes assessment. This model is a decision-focused approach to evaluation, providing systemic information for program managers (Fitzpatrick et al. 2011).

  • Context refers to needs assessments,
  • Input involves costs and feasibility,
  • Process examines how the implementation unfolded, and
  • Products describe the outcomes, presented here according to Kirkpatrick’s classification levels.

 

결과의 효과성
Effectiveness of outcomes

각 논문의 결과 효과를 요약하기 위해 (저자가 언급한 바와 같이) 두 명의 코드 작성자(ML, CS)는 이전에 확인된 결과(독립 논문 검토자에 의해)를 4점 척도로 분석했다: 유해/보고되지 않음(0), 결론이 나지 않음(1) 약간 효과적(예: 통계적으로 유의하지만 교육적으로는 유의하지 않음) (2) 또는 유효(3). 최종 점수를 놓고 두 코더 사이에 합의가 이루어졌다.
In order to summarize the effectiveness of outcomes in each article (as stated by the authors), two coders (ML, CS) analyzed the previously identified outcomes (by independent article reviewers) on a 4-point scale:

  • harmful/not reported (0),
  • inconclusive (1),
  • slightly effective (e.g. statistically significant, but not educationally significant) (2) or
  • effective (3).

Consensus was established between the two coders for the final score.

연구의 품질 평가
Quality appraisal of studies

포함된 각 연구의 품질은 혼합 방법 평가 도구(MMAT)를 사용하여 평가되었다(Pluye et al. 2011). 이 도구는 체계적인 혼합 연구 검토에 포함된 연구를 일관성 있게 평가 또는 설명하기 위해 설계되었기 때문에 선택되었다(이 검색 전략에서 예상된 원래의 정성, 정량 및 혼합 방법 연구를 포함한 검토).
The quality of each included study was assessed using the Mixed Methods Appraisal Tool (MMAT) (Pluye et al. 2011). This tool was chosen because it is designed for concomitantly appraising and/or describing studies included in systematic mixed studies reviews (reviews including original qualitative, quantitative and mixed methods studies, which were expected with this search strategy).

MMAT는 먼저 두 가지 질문으로 방법론적 품질을 선별한 다음 설계별 질문(질적 또는 정량적 연구의 경우 4개, 혼합 방법 연구의 경우 3개)을 한다. 그런 다음 정성 및 정량 연구에 대해 충족된 기준의 수(각 기준의 25%) 또는 혼합 방법 연구에서 가장 약한 구성요소의 품질에 해당하는 점수(100점 만점)를 계산한다.

The MMAT first screens methodological quality with two questions, and then asks design-specific questions (4 for qualitative or quantitative studies, and 3 for mixed methods studies). A score (out of 100%) is then calculated, corresponding to the number of criteria met (25% for each criterion) for qualitative and quantitative studies, or to the quality of the weakest component in mixed methods studies.

추출된 증거의 합성
Synthesis of extracted evidence

수석 검토자는 광범위한 유형의 개입에서 모든 유사한 개입 전략을 그룹화하기 위해 주제별 내용 분석을 수행했다. 예를 들어, 동료 주도 스터디 그룹이나 학생이 운영하는 강의 또는 복습 프로그램과 관련된 모든 개입 전략은 "동료 과외/지원" 유형의 개입으로 분류되었다. 성문화는 데이터 손실을 방지하기 위해 보수적이었고, 합성과 권고사항의 공식화를 촉진했다. 데이터 추출 과정이 끝나면, 수석 검토자는 각 검토자 짝pair이 추출한 데이터를 기반으로 각 개입 유형에 대한 주요 BCT를 식별했다.
The lead reviewer conducted a thematic content analysis to group all similar intervention strategies in broader types of interventions. For example, all intervention strategies involving peer-led study groups or student-run instruction or review programs were labeled as “Peer tutoring/support” type of intervention. The codification was conservative, to avoid loss of data while facilitating synthesis and the formulation of recommendations. At the end of the data extraction process, the lead reviewer identified the main BCT for each type of intervention based on the data extracted by each pair of reviewers.

각 유형의 개입은 관련 교육 진단(지식, 기술, 태도, 학습자, 교사 및 환경)에 매핑되었다. 대부분의 연구가 많은 진단과 개입을 포함했기 때문에, 일부 유형의 개입은 각 기사에서 다루는 일차적 교육 진단과 항상 관련이 있는 것은 아니었다. 후자는 세 명의 검토자(MHD, ML, AL)가 각 개입 유형을 관련 진단에 매핑하는 삼각 분류 프로세스를 안내했다. 추출된 데이터를 합성하기 위해 기술 분석이 수행되었다.
Each type of intervention was mapped to the relevant educational diagnoses (knowledge, skills, attitudes, learner, teacher, and environment). Since most studies involved many diagnoses and interventions, some types of interventions were not always relevant to the primary educational diagnoses addressed in each article. The latter guided a triangulated classification process where three reviewers (MHD, ML, AL) mapped each type of intervention to relevant diagnoses. A descriptive analysis was conducted to synthesize extracted data.

GRADE 지침에서 영감을 받은 접근 방식을 사용하여 각 개입 유형에 대한 권장 강도를 설정했다. 이러한 선택은 임상 교사들의 이해를 돕기 위해 도출할 수 있는 임상적 평행선을 기반으로 이루어졌다. GRADE 점수는 일반적으로 환자에 대한 의료 개입의 맥락에서 사용되기 때문에, 우리는 의료 교육 개입에 대한 접근방식을 채택했다. 강, 보통, 약, 매우 약의 4가지 권장 수준이 있습니다. 각 개입 유형에 대해, 권고의 강도는 그림 1에 기술된 접근방식을 사용하여 설정되었다. 세 명의 검토자(MHD, AL, MN)와 함께 권고의 강도에 대한 패널 블라인드 평가는 우수한 등급 내 계수 ICC(2,1) = 0.72(<0.001))로 권고의 강점을 확립하기 위한 이 논리적 접근방식의 파일럿 버전을 확인했다.

We used an approach inspired from GRADE guidelines (www.gradeworkinggroup.org) to establish a strength of recommendation for each intervention type. This choice was made based on the clinical parallel that can be drawn, to facilitate understanding by clinical teachers. Since the GRADE scores are typically used in the context of healthcare interventions for patients, we adapted the approach to medical education interventions. There are four recommendation levels: strong, moderate, weak and very weak. For each intervention type, the strength of recommendation was established using the approach described in Figure 1. Panel-blinded assessment of the strength of recommendations with three reviewers (MHD, AL and MN) confirmed the pilot version of this logical approach to establishing strengths of recommendation with a good intra-class coefficient ICC(2,1) = 0.72 (<0.001).

 

 

 

결과.
Results

기사 설명
Description of the articles

총 14,898개의 상영된 제목 중 68개의 글이 포함 기준(그림 2)을 충족했다: 학부(UG) 학습자와 대학원(PG) 학습자 26개. 세 개의 논문이 학부 및 대학원 학습자 모두를 포함했고, 따라서 하위 분석에 대한 두 그룹 모두에 포함되었다. 발행일은 1991년부터 2016년까지이다.

Of the 14,898 screened titles, 68 articles met the inclusion criteria (Figure 2): 45 articles involved undergraduate (UG) learners and 26 involved postgraduate (PG) learners. Three articles included both undergraduate and postgraduate learners, and were therefore included in both groups for subanalyses. The publication dates ranged from 1991 to 2016.

 
 

이 기사들은 총 47,082명의 학습자가 참여했으며, 가장 일반적으로 다음과 같은 교육적 진단을 제시하였다: 지식 부족(문서의 66.2%, UG: n = 23, PG: n = 22), 불만족스러운 기술(53.9%, UG: n = 20, PG: n = 18), 학습자 개인 문제(41.5%, UG: n = 21, 8: N att). 개입 전략은 교사 문제(3.0%)나 환경/시스템 문제(1.5%)를 수정하는 것을 목표로 하는 경우가 거의 없었다.
These articles involved a total of 47,082 learners, most commonly presenting the following educational diagnoses:

  • knowledge deficits (66.2% of the articles, UG: n = 23, PG: n = 22),
  • unsatisfactory skills (53.9%, UG: n = 20, PG: n = 18),
  • learner personal issues (41.5%, UG: n = 21, PG: n = 8) and
  • attitudinal concerns (26.2%, UG: n = 6, PG: n = 13).
  • Intervention strategies were seldom aimed at correcting teacher issues (3.0%) or environmental/systems issues (1.5%).

 

연구의 방법론적 품질
Methodological quality of the studies


그 연구의 방법론적 질은 다양했다. 평가 설계에는 9개의 정성 설계, 64개의 정량 설계(무작위 제어 3개, 비랜덤화 46개, 기술 15개) 및 5개의 혼합 방법 설계(질적 또는 정량 설계에 포함)가 포함되었다. MMAT 점수는 0%에서 100%까지 다양했다. MMAT에 대한 자세한 결과는 보충 표 2에 나와 있습니다. 전체 MMAT 점수는 평가자 간 신뢰성에 대해 비교되었다. 연구마다 달라지는 연구 설계에 의존했기 때문에 평가자 간 신뢰성은 각 개별 기준에 대해 계산될 수 없었다. 코더 간의 클래스 내 상관관계(2,2)는 0.27(p = 0.14)로 좋지 않았다(Koo 및 Li 2016).
The methodological quality of the studies was variable. The assessment designs involved 9 qualitative designs, 64 quantitative designs (3 randomized controlled, 46 non-randomized and 15 descriptive), and 5 mixed methods designs (also included in the qualitative or quantitative designs). MMAT scores varied from 0% to 100%. Detailed results for MMAT are provided in Supplemental Table 2. Total MMAT scores were compared for inter-rater reliability. Inter-rater reliability could not be computed for each individual criterion, as it was dependant on the study design, which varied across studies. Intra-class correlation (2,2) between coders was 0.27 (p = 0.14), which was poor (Koo and Li 2016).

질적 요소를 가진 9개의 설계 중 5개는 추가 평가 기준(수집 데이터로 해결할 수 있는 명확한 질문)을 충족했고, 따라서 점수(평균 = 41.2%, 범위 0-100%)가 매겨졌다. 질적 데이터의 출처는 5개 논문에 대한 연구 질문을 다루는 데 관련이 있었다. 다만 자료 분석 과정은 3개 논문에서만 관련성이 있었고, 3개 논문에서만 조사결과가 맥락과 어떻게 관련되는지를 적절하게 고려했다. 5개 논문 중 4개 논문에 연구자들의 영향과 연구 결과가 어떤 연관성이 있는지에 대한 적절한 고려가 있었다.
Five of the nine designs with a qualitative component met the criteria for further appraisal (clear question, which can be addressed by collected data), and were therefore scored (mean = 41.2%, range 0–100%). The sources of qualitative data were relevant to address the research question for the five articles. However, the process for analyzing data was relevant in only three articles, and how findings relate to the context was given appropriate consideration in only three of the articles. There was appropriate consideration given to how findings relate to researchers’ influence in four of the five articles.

세 가지 정량적 무작위 대조 연구는 100%의 점수를 받았다. 무작위화와 할당 은폐에 대한 명확한 설명, 완전한 결과 데이터, 낮은 철회/탈퇴.
The three quantitative randomized controlled studies had a score of 100%:

  • clear description of randomization and of the allocation concealment,
  • complete outcome data and
  • low withdrawal/drop-out.

46개의 정량적 비-무작위화 설계 중 29개가 점수를 계산할 수 있는 기준을 충족했다(평균 = 53.3%, 범위 0–100%). 이러한 보고서의 대부분은 모집에서 선택 편향을 최소화하고(n = 27), 노출/예방 및 예후에 관한 적절한 측정(n = 23), 그룹 간 차이(n = 19), 완전한 예후 데이터/허용 응답률(n = 26)을 가졌다.

Among the 46 quantitative non-randomized designs, 29 met the criteria allowing to calculate a score (mean = 53.3%, range 0–100%). Most of these reports minimized selection bias in their recruitment (n = 27), had appropriate measurements regarding the exposure/intervention and outcomes (n = 23), controlled for difference between groups (n = 19), and had complete outcome data/acceptable response rate (n = 26).

15개의 정량적 서술 설계 중 7개만이 점수를 계산할 수 있는 기준을 충족했다(41.2%, 범위 0~100%). 모두 연구 대상 모집단을 대표하는 관련 표본 추출 전략을 제시했고 허용 가능한 응답률을 보였다. 그러나 두 연구만이 적절한 측정(원점 명확, 유효 또는 표준)을 사용했습니다.
Only seven of the 15 quantitative descriptive designs met the criteria allowing us to calculate a score (41.2%, range 0–100%). All presented a relevant sampling strategy, representative of the population under study, and showed an acceptable response rate. However, only two studies used appropriate (clear origin, valid or standard) measurements.

마지막으로, 6가지 혼합 방법 설계 중에서 MMAT 점수는 4개 항목(66.7%, 범위 0-100%)에 대해 계산할 수 있다. 이들은 모두 연구 질문을 해결하기 위한 관련 설계를 가지고 있었고 질적 데이터와 정량적 데이터의 관련 통합을 입증했다. 그러나 질적 및 정량적 설계의 데이터를 삼각측량하고 관련 한계를 논의한 논문은 두 개뿐이었다.
Finally, among the six mixed methods designs, the MMAT score could be calculated for four articles (66.7%, range 0–100%). They all had a relevant design to address the research questions and demonstrated a relevant integration of qualitative and quantitative data. However, only two articles triangulated the data from the qualitative and quantitative designs and discussed the associated limitations.

 

개입에 대한 설명
Description of the interventions


선택된 논문은 총 261개의 전략(UG: n = 169, PG: n = 102)으로 구성되었고, 많은 (n = 77, 29.5%)은 둘 이상의 BCT를 포함했다. 가장 많이 사용된 BCT는 지식 형성(27.2% 개입 전략), 피드백 및 모니터링(19.5%), 반복 및 대체(15.3%)였다. 검색된 개입 전략 중 결과 비교 또는 은밀한 학습과 관련된 것은 없었다. 정체성(0.4%), 자연적 결과(0.8%) 또는 자아신뢰(1.5%)를 기반으로 하는 사람은 거의 없었다. 그림 3은 학부 및 대학원 학습자의 각 행동 변화 기법 그룹화를 사용한 개입 전략의 비율을 비교합니다. 무작위 검토자 쌍 간 합의 비율이 48.1%였기 때문에, 다른 의견에 직면했을 때 단일 세 번째 검토자(ML)가 최종 성문화 결정을 내렸다.

The selected articles comprised a total number of 261 strategies (UG: n = 169, PG: n = 102), and many (n = 77, 29.5%) involved more than one BCT. The most commonly employed BCTs were Shaping knowledge (27.2% of intervention strategies), Feedback and monitoring (19.5%), and Repetition and substitution (15.3%). None of the retrieved intervention strategies involved Comparison of outcomes or Covert learning. Very few built on Identity (0.4%) Natural consequences (0.8%) or Self-belief (1.5%). Figure 3 compares the proportions of intervention strategies using each Behavior Change Technique Grouping in undergraduate and postgraduate learners. Since the percentage of agreement was 48.1% between the random pairs of reviewers, a single third reviewer (ML) decided on final codification when facing divergent opinions.

 

109개의 다른 유형의 개입(UG: n = 84, PG: n = 58)으로 261개의 개입 전략을 분류했다. 부록 4는 주요 BCT와의 개입 유형, 교육 수준(학부/대학원) 및 관련 교육 진단에 대해 보고한 기사가 얼마나 되는지 보여준다.

We categorized the 261 intervention strategies in 109 different types of interventions (UG: n = 84, PG: n = 58). Supplemental Appendix 4 shows how many articles reported each type of intervention with their main BCT, with the training level where they were implemented (undergraduate/postgraduate), and the educational diagnoses for which they are relevant.

프로그램 평가 및 결과의 효과
Program evaluation and effectiveness of outcomes


Stufflebeam (2003) (그림 4)에 의해 제안된 프로그램 평가의 네 가지 측면을 이용한 프로그램 평가 데이터 추출(Kirkpatrick의 네 가지 수준 중 적어도 한 가지에 대한)은 97%에서 식별되었다.

  • 맥락에 대한 평가를 제공하는 연구(22%)는 대부분 평가 데이터를 필요로 하거나 개입 개발의 기초가 되는 목표를 설명했다.
  • 개입 개발과 구현에 필요한 자원(입력)은 기사의 22%로 보고되었다. 일부 집중된 개입 전략은 짧지만(약 10분) 빈번한 조치를 포함했다(Drake et al. 2015). 다른 프로그램들은 평균 30시간의 교수 시간 책무를 보고했다(Guerrasio 및 Aagaard 2014; Gerratio, Garrity 등. 2014). 관련된 비용은 상당히 다양하며 대부분 의과대학 또는 학생 보험(Segal et al. 1999; Laatch 2009; Rowland et al. 2012; Gerasio and Aagard 2018)으로 충당되었다. 그러나 일부 학교에서는 추가 등록금이 요구되었다(Sayer et al. 2002). 이 검토에서는 상업적 출처로부터의 어떠한 자금도 식별하지 못했다.

Program evaluation data extraction using the four aspects of program evaluation suggested by Stufflebeam (2003) (Figure 4) identified products/outcomes (for at least one of the four levels of Kirkpatrick) in 97% of the articles.

  • Studies providing an assessment of context (22%) mostly presented needs assessment data or described the goals underlying intervention development.
  • The resources (Input) needed for intervention development and implementation were reported in 22% of the articles. Some focused intervention strategies involved short (about 10 minutes) but frequent actions (Drake et al. 2015). Other programs reported mean faculty time commitment of up to 30 hours (Guerrasio and Aagaard 2014; Guerrasio, Garrity, et al. 2014). The costs engaged varied significantly, and were covered mostly by medical schools or student insurance (Segal et al. 1999; Laatsch 2009; Rowland et al. 2012; Guerrasio and Aagard 2018); however, extra tuition was demanded in some schools (Sayer et al. 2002). This review did not identify any funding from commercial sources.

마지막으로, 도입 프로세스에 대한 보고 기사(25%)에서는 주로 프로그램 참여자 수(Dowell 등 2006; Brokaw 등 2011; Sanche 등 2011; Stegers-Jager 등 2013; Platt et al. 2007; Rowland 등)와 그들의 특성(DeVoe 등 2007; 2012)이 논의되었다.9; Yaghoubian 등 2012; Malakoff 등 2014; Bierer 등 2015; Bhatti 등 2016). 또한 참석률 또는 프로그램 성공 예측 변수(Rehm and Rowland 2005; Winston et al. 2014; Brennan and McGrady 2015)와 개선을 위한 제안(Guerrasio and Aagard 2018)도 제시하였다.

Finally, articles reporting on their implementation process (25%) discussed mostly the number of participants in their programs (Dowell et al. 2006; Brokaw et al. 2011; Sanche et al. 2011; Stegers-Jager et al. 2013; Platt et al. 2014), their characteristics (DeVoe et al. 2007; Rowland et al. 2012) and the strategies that were used (Segal et al. 1999; Yaghoubian et al. 2012; Malakoff et al. 2014; Bierer et al. 2015; Bhatti et al. 2016). They also presented some predictors of attendance or program success (Rehm and Rowland 2005; Winston et al. 2014; Brennan and McGrady 2015), as well as suggestions for improvement (Guerrasio and Aagard 2018).

 

논문의 68%(n = 46)는 프로그램 평가 설계에 대한 하나 이상의 개입(다중 구성요소 개입)을 평가했다. 프로그램 평가 데이터에 대한 클래스 내 상관 관계(이원 랜덤 효과 모델)는 -0.18에서 0.71까지 다양했습니다(M = 0.29).
Sixty-eight percent of the articles (n = 46) assessed more than one intervention in their program evaluation design (multi-component interventions). Intra-class correlation (two-way random effects model) for program evaluation data varied from −0.18 to 0.71 (M = 0.29).

뒷받침하는 증거의 질과 결과의 중요성에 관계없이, 대부분의 논문은 각 연구의 저자들이 언급한 결론에 기초하여 효과적인 결과(64.7%) 또는 약간 효과적인 결과(20.6%)를 보고했다. 단 10.3%의 기사만이 결론을 내릴 수 없는 뒷받침 데이터를 가지고 있었다. 한 기사는 6-8주 교정조치 임상 배치가 serial OSCE 전체에 걸쳐 성능 저하로 이어진다는 것을 입증하는 유해한 결과를 발견했다(Pell 등 2012). 두 개의 논문(Dowell 등 2006; Audetat 등 2011)은 결과를 보고하지 않았다. 클래스 내 계수는 우수한 평가자 간 신뢰도를 보여주었습니다 (ICC [2,1–4]= .97, 페이지 <. 01).
Regardless of the quality of supporting evidence and importance of outcomes, most articles reported effective (64.7%) or slightly effective (20.6%) outcomes, based on the conclusions stated from the authors of each study. Only 10.3% of the articles had inconclusive supporting data. One article found harmful outcomes, demonstrating that a 6–8-week remediation clinical placement led to a performance decline across serial OSCEs (Pell et al. 2012). Two articles (Dowell et al. 2006; Audetat et al. 2011) did not report any outcomes. Intra-class coefficient revealed an excellent inter-rater reliability (ICC[2,1–4]= .97, p <. 01).

 

권고사항의 강점이 있는 중재
Interventions with strengths of recommendations

공동 연구 참가자 수, 평균 가중 커크패트릭 수준 및 각 권장 사항의 강도를 계산할 수 있는 합동 효과는 보충 부록 4(보조 디지털 콘텐츠)에 설명되어 있다. 개입 유형 83명(76%)은 30명 이상의 공동 참여자를 포함했고, 67명(61%)은 가중 평균 커크패트릭 수준 결과가 2.5/4이었으며, 50명(46%)은 가중 평균 효과 점수가 2/3를 초과했다.
The pooled number of study participants, the mean weighted Kirkpatrick level and the pooled effectiveness that allowed us to compute the strength of each recommendation are described in Supplemental Appendix 4 (supplemental digital content). Eighty-three types of interventions (76%) involved a pooled number of participants over 30, 67 (61%) had a weighted mean Kirkpatrick level outcomes ≥2.5/4, and 50 (46%) had a weighted mean effectiveness score over ≥2/3.

24가지 유형의 개입이 "강력" 권고 기준을 충족했고(표 1에서 사용 가능), 48개는 "보통", 26개는 "약함", 11개는 "매우 약함"으로 등급이 매겨졌다.
Twenty-four types of interventions met criteria for “Strong” recommendations (available in Table 1), 48 were graded as “Moderate”, 26 as “Weak” and 11 as “Very weak”.

계산을 검증하기 위해, 우리는 세 명의 검토자에게 (각 기준에 대한 컷오프를 알지 못하면서) 그들의 판단에만 기초하여 권고의 강도를 평가하도록 요청했다. 평가자 간 신뢰성(클래스 내 상관 관계)은 0.71이었고 검토자의 권고 수준과 계산된 수준 사이의 상관 관계는 0.71에서 0.75까지 다양했다(p < 0.0001).

To validate the computation, we asked three reviewers to appraise the strength of recommendation based solely on their judgement (not being aware of the cutoffs for each criterion). The inter-rater reliability (intraclass correlation) was 0.71 and correlations between reviewer's recommendation levels and our computed level varied from 0.71 to 0.75 (p < 0.0001).

 
 

각 BCT 그룹 하에서 이러한 권고사항의 분포는 그림 5에 제시되어 있다. 각 교육 진단에 대한 각 권고사항의 강도의 빈도는 그림 6과 같다.
The distribution of these recommendations under each BCT grouping is presented in Figure 5. The frequency of the strengths of each recommendation for each educational diagnosis is illustrated in Figure 6.

 

 

 

보충 표 3과 4는 학부 및 대학원 학습자 모두에게 기여요소를 완화하는 것을 목적으로 하는 개입 유형과 학업상 어려움을 해결하기 위한 개입 유형을 요약한 것이다. 이들은 각각의 주요 BCT에 따라 분류된 109가지 유형의 개입을 각 훈련 수준에 따라 별도로 계산한 권장 강도와 함께 관련 교육 진단에 매핑한다.

Supplemental Tables 3 and 4 summarize the types of interventions aimed at relieving contributing factors and those for remediating academic difficulties, for both undergraduate and postgraduate learners. They list the 109 types of interventions classified under their respective main BCT, mapped to the relevant educational diagnoses with their strength of recommendation calculated separately for each training level.

BCT의 각 그룹에 대해 검색된 개입 유형은 아래(알파벳순)에 설명되어 있으며, 정의의 핵심 요소(보완 표 1)를 호출하고 어떤 교육 진단을 위해 권장되었는지 명시한다. 아래 제시된 권고사항의 강점은 학부 및 대학원 학습자를 위한 중재안 풀링에서 비롯되며, 따라서 보충 표 3 및 4와 다를 수 있습니다.
The types of interventions retrieved for each group of BCT are described below (alphabetical order), recalling key elements of their definition (Supplemental Table 1) and specifying for which educational diagnoses they were recommended. The strengths of recommendations presented below result from pooling of interventions for undergraduate and postgraduate learners, and may therefore differ from Supplemental Tables 3 and 4.

 

선행 사례 - 환경 재구성
Antecedents - restructuring the environment

선행 BCT 그룹의 대부분의 개입 유형은 학습 환경 문제(n = 9) 또는 학습자 개인 문제(n = 7)를 다루었다. 두 가지는 지식 또는 기술 부족을 교정하는 것을 목표로 했다. 보충 표 1에 정의된 바와 같이, 이 BCT 그룹은 물리적/사회적 환경을 재구성하여 행동에 대한 단서에 대한 노출을 방지/축소하거나 환경 또는 기타 형태의 지원을 통해 성능을 촉진하는 데 초점을 맞추고 있습니다.
Most types of interventions in the Antecedent BCT grouping addressed learning environment issues (n = 9) or learner personal issues (n = 7); two were aimed at remediating knowledge or skills deficits. As defined in Supplemental Table 1, this BCT grouping focuses on restructuring the physical/social environment to avoid/reduce exposure to cues for the behavior or add objects to the environment or other forms of support in order to facilitate performance.

학습 환경을 개선하기 위한 권고안에는 커리큘럼 내용 검토(n = 1, Strong), 관련 타이밍으로 과정 일정 조정(n = 1, Strong), 처음 2년 동안 접촉 시간 단축(n = 1, Strong)이 포함되었다(Slavin et al. 2014). 커리큘럼 감압(n = 3, Strong) (McCahan 1991; Kies and Freund 2005; Sikakana 2010), 일정/시간 요구 수정(n = 1, 보통) (Reamy and Harman 2006) 및 환자 부하 감소(Aud et al. 2011)와 같은 일부 유형의 개입은 작업량을 줄이는 것을 목표로 했다. 다른 이들은 표준 조정된 시험 수행 데이터(n = 1, Strong)와 합격/불합격 등급 시스템(n = 1, Strong) 제거와 같은 평가 정책의 재구성 작업에 초점을 맞췄다(Slavin et al. 2014). 오직 한 환경 변화(브레넌과 맥그레이디 2015년)(n = 1, 온건)건강 증진을 장려함에 집중했다. 

Recommendations to improve the learning environment involved curriculum content review (n = 1, Strong), rescheduling a course at a relevant timing (n = 1, Strong) and reducing contact hours across the first two years (n = 1, Strong) (Slavin et al. 2014). Some types of interventions aimed to reduce workload, such as curriculum decompression (n = 3, Strong) (McCahan 1991; Kies and Freund 2005; Sikakana 2010), modified schedule/ease time demands (n = 1, Moderate) (Reamy and Harman 2006) and reduced patient load (n = 1, Very weak) (Audétat et al. 2011). Others focused on restructuring assessment policies, such as eliminating norm-referenced exam performance data (n = 1, Strong) and pass/fail grading system (n = 1, Strong) (Slavin et al. 2014). Only one focused on environmental changes encouraging health promotion (n = 1, Moderate) (Brennan and McGrady 2015).

이 검토서는 [학습자의 개인적인 문제]를 수용하는 많은 종류의 조정을 확인했다. 

  • 예를 들어, 학습 장애 또는 주의력 저하 장애를 가진 학부 학습자는 커리큘럼 감압(n = 3, Strong)(McCahan 1991; Kies and Freund 2005; Sikakana 2010), 시험 추가 시간(n = 2, Medium)(Walter and Croen 1993; Segal et al 1999), 필기 작성 지원, 별도의 객실 좌석(n = 1, 보통)(Walter and Croen 1993)의 도움을 받을 수 있다. 
  • 대학원 수준에서 개입 유형에는 지시하는 조용한 영역(n = 1, 중간)(Katz et al 2013), 환자 부하 감소(n = 1, 약한)(Audetat et al 2011), 원정/중간 회전 제한(n = 1, 중간)(Reamy and Harman 2006)이 포함되었다.

This review identified many types of accommodations for learners’ personal issues. For example, undergraduate learners with learning disorders or attention-deficit disorders could benefit from curriculum decompression (n = 3, Strong) (McCahan 1991; Kies and Freund 2005; Sikakana 2010), extra time on tests (n = 2, Moderate) (Walter and Croen 1993; Segal et al. 1999), assistance with note taking (n = 1, Moderate) (Segal et al. 1999) and separate room seating (n = 1, Moderate) (Walter and Croen 1993). At the postgraduate level, types of interventions involved a quiet area for dictating (n = 1, Moderate) (Katz et al. 2013), reduced patient load (n = 1, Weak) (Audetat et al. 2011) and limits on away/elective rotations (n = 1, Moderate) (Reamy and Harman 2006).


코스 연장 같은 방식으로 환경 구조 조정(n = 2, 스트롱)(버치(알. 2007년;Sikakana 2010년)또는 백업 범위에 대한 요구(n = 1, 온건)(블럼 버그(알. 1995년)겨냥하고 있는 한편으론 지식과 기술 어려움으로에서 대학생 배웁니다.

Restructuring the environment with interventions such as course extension (n = 2, Strong) (Burch et al. 2007; Sikakana 2010) or backup coverage for calls (n = 1, Moderate) (Blumberg et al. 1995) aimed to remediate knowledge and skills difficulties, as studied in undergraduate learners.

 

규칙- 학업적 어려움에 기여하는 기저 조건을 어떻게 관리할 것인가
Regulation - how to manage underlying conditions contributing to academic difficulties

규제는 부정적인 감정을 줄이거나 행동 변화를 촉진하기 위해 정신적 자원에 대한 요구를 최소화하기 위해 다양한 약리적 또는 비약리적 지원을 포함한다. 개입의 이 여단 전투단의 모든 검색된 유형 학습자들의 개인적인 문제에 초점을 맞추었다. 이 여단 전투단 그룹 아래의 가장 일반적으로 검색된 것 counseling/support(n = 10, 온건)(월터와 Croen 1993년, 시걸(알. 1999년, 파월은 2004년;Reamy과 하르멘 2006년; 클 릴랜드(알. 2010년;브로코도 방송계에 있는 2011년;Mysorekar 2012년;Yaghoubian(알. 2012년;Bhatti(알. 2016년, 스파크스(알. 2016년), 의료 평가 및psychological/psychiatric 있었다. 치료(시걸(알. 1999년; 클 릴랜드(알. 2010년;브로코도 방송계에 있는 2011년;Bhatti(알. 2016년)과 스트레스 훈련(대화형 세션)(n = 3, 스트롱)(맥그래디(알. 2012년;브레넌과 맥그레이디 2015년;브레넌(알. 2016년)management/well-being(n = 4, 온건). 다른 개입 행복한 탄력과 명상 프로그램(n = 1, 스트롱)(Slavin(알. 2014년), 육체적 훈련(n = 1, 온건)(파월은 2004년), 휴식(n = 1, 온건)(파월은 2004년)과 명상(n = 1, 온건)(브레넌과 맥그레이디 2015년), 모든 개인적인 어려움의 경영에 도와 주어라. 어떤 경우에는, 학습자들 약물 남용 재활에서(n = 2, 스트롱)(Reamy과 하르멘 2006년;Bhatti(알. 2016년)에게 좋을 것이다. 공식적인 psychomotor/learning 평가 및 치료(n = 1, 스트롱)(Bhatti(알. 2016년) 같은 일부 신경 심리학적 치료, 그 임상 추론 등 인지 기능 장애를 가진 도움이 될 것이다. 시각적 처리 적자 같은 신체적 문제와 배우고 싶은 사람 시각 훈련(n = 1, 온건)(월터와 Croen 1993년)에서 도움이 될 거예요. 거주 학생 지원 서비스에(n = 1, 온건)( 클 릴랜드(알. 2010년)또한 중요한 지원 전략이다. 휴학(n = 1, Strong)(Bhatti 등 2016)도 많은 학습자에게 도움이 될 수 있으며 개인적인 문제가 해결되거나 통제된 후 다시 학습할 수 있습니다.

Regulation involves various pharmacological or non-pharmacological support to reduce negative emotions or minimize demands on mental resources to facilitate behavior change. All retrieved types of interventions for this BCT focused on learners’ personal issues. The most commonly retrieved ones under this BCT grouping were psychological/psychiatric counseling/support (n = 10, Moderate) (Walter and Croen 1993; Segal et al. 1999; Powell 2004; Reamy and Harman 2006; Cleland et al. 2010; Brokaw et al. 2011; Mysorekar 2012; Yaghoubian et al. 2012; Bhatti et al. 2016; Sparks et al. 2016), medical evaluation and therapy (n = 4, Moderate) (Segal et al. 1999; Cleland et al. 2010; Brokaw et al. 2011; Bhatti et al. 2016) and stress management/well-being training (interactive sessions) (n = 3, Strong) (McGrady et al. 2012; Brennan and McGrady 2015; Brennan et al. 2016). The other interventions promoting well-being were a resilience and mindfulness program (n = 1, Strong) (Slavin et al. 2014), physical exercise (n = 1, Moderate) (Powell 2004), relaxation (n = 1, Moderate) (Powell 2004) and meditation (n = 1, Moderate) (Brennan and McGrady 2015), that all assist in the management of personal difficulties. In some cases, learners would benefit from substance abuse rehabilitation (n = 2, Strong) (Reamy and Harman 2006; Bhatti et al. 2016). Some neuropsychological interventions, such as formal psychomotor/learning assessment and therapy (n = 1, Strong) (Bhatti et al. 2016) will help those with cognitive skills difficulties including clinical reasoning. Learners with physical problems, such as visual processing deficits, might benefit from visual training (n = 1, Moderate) (Walter and Croen 1993). Referral to student support services (n = 1, Moderate) (Cleland et al. 2010) is also an important support strategy. A leave of absence (n = 1, Strong) (Bhatti et al. 2016) may also benefit many learners and allow them to come back to learning after their personal issues are resolved or controlled.

목표 및 계획 – 학습 계획 및 계약
Goals and planning – learning plans and contracts

목표와 계획을 사용하는 대부분의 개입 유형은 지식, 기술 또는 태도 문제에 적용될 수 있습니다. 이들은 종종 학습/교화 계획(n = 5, 약함)(Chur-Hansen 1999; Rowland 등 2012; Katz 등 2013; Gerrasio, Garrity 등, 2014; Bier et al. 2015) 또는 교정 프로그램/도구(n = 4, Strong, 2002)으로 접근한다. 목표를 설정하거나 합의하고 학습을 위한 전략과 자원을 선택합니다. 학습 계획(n = 4, 중간)과 함께하는 교수 자문 회의(Harthun et al. 2005; Borman 2006; Reamy and Harman 2006; Enriquez Vilapana et al. 2008)는 학습자와 교수진 간의 행동 계약을 만드는 핵심이다. 또한 능동적 학습 전략(n = 2, 약함)(Chur-Hanzen 1999; Katz et al. 2013)과 자율적 학습(n = 1, 중간)(Walter and Croen 1993)은 학습자의 책임감과 자존감을 장려하기 위해 종종 사용된다. 또한 경향적 관심사는 시뮬레이션(n = 1, 보통)을 통한 개별 교정 훈련에 잘 반응한다(게라시오 및 아가드 2018).
Most types of interventions using Goals and planning can be applied to any of knowledge, skills or attitude concerns. These are often approached with a learning/remediation plan (n = 5, Weak) (Chur-Hansen 1999; Rowland et al. 2012; Katz et al. 2013; Guerrasio, Garrity, et al. 2014; Bierer et al. 2015) or remediation program/tool (n = 4, Strong) (Sayer et al. 2002; Brokaw et al. 2011; Sanche et al. 2011; Guerrasio et al. 2018), encouraging learners and teachers to set or agree on a goal and select strategies and resources for learning. Faculty advisor meeting with learning plan (n = 4, Moderate) (Harthun et al. 2005; Borman 2006; Reamy and Harman 2006; Enriquez Vilapana et al. 2008) is a key in creating behavioral contracts between learners and faculty. Moreover, active learning strategies (n = 2, Weak) (Chur-Hansen 1999; Katz et al. 2013) and self-regulated learning (n = 1, Moderate) (Walter and Croen 1993) are often used to encourage learner responsibility and self-esteem. Attitudinal concerns also respond well to individual remedial training with simulation (n = 1, Moderate) (Guerrasio and Aagard 2018).

교직원 및 동료 사회 지원
Faculty and peer social support


이 검토는 학습 커뮤니티(n = 1)와 사회적 이벤트(n = 1)을 사회적 지원 BCT가 포함된 학습 환경을 교정하기 위한 개입을 지원하는 강력한 권고사항으로 식별했다.

This review identified learning communities (n = 1) and social events (n = 1) (Slavin et al. 2014) as strong recommendations supporting interventions to remediate the learning environment involved the Social support BCT.

많은 저자들이 과외 및 학업 보조(n = 11, Strong)를 연구했다(Magarian and Campbell 1992; Walter and Croen 1993; Segal 등 1999; Enriquez Vilapana 등 2008; White 등). 2009; Cleland et al. 2010; Sikakana 2010; Brokaw et al. 2011; Yaghoubian et al. 2012; Bhatti et al. 2016; Sparks et al. 2016), 멘토링(n = 3, Strong) (Plat et al. 2014; Slabin et al. 2014; Bhi et et al. 2014; 2016), 동료 튜터링, 2016), 그리고 (Bhatti = 2016) 및 (Bhuident) (2016) (Bhupport (2016) (Batti = 7). 학습자의 개인적 문제와 학업적 어려움에 대한 지원으로 Miller 2014; Suranjana 등 2015). 

Many authors studied tutoring and academic assistance (n = 11, Strong) (Magarian and Campbell 1992; Walter and Croen 1993; Segal et al. 1999; Enriquez Vilapana et al. 2008; White et al. 2009; Cleland et al. 2010; Sikakana 2010; Brokaw et al. 2011; Yaghoubian et al. 2012; Bhatti et al. 2016; Sparks et al. 2016), mentoring (n = 3, Strong) (Platt et al. 2014; Slavin et al. 2014; Bhatti et al. 2016) and peer tutoring/support (n = 7, Moderate) (Hesser and Lewis 1992; Sawyer et al. 1996; Strayhorn 2000; DeVoe et al. 2007; Stegers-Jager et al. 2011; Miller 2014; Suranjana et al. 2015), as a support for learners’ personal issues and academic difficulties.

그러나 이 검토에서 회수된 사회적 지원 개입의 대부분은 지식, 기술 및/또는 태도에 초점을 맞췄다. 학습 세션은 튜토리얼 (n = 4, Strong) (Walter and Croen 1993; Schwartz and Loten 1998; Sayer et al. 2002; Sikakana 2010), 소그룹 학습(Sayer et al. 2002; Burch et al., 2013; Winston = 2014) 또는 그룹 연구(n)의 형태로 진행되었다. 성취도가 높은 학생의 배정(n = 1, 중간)을 포함하는 동료 기반 학습(Enriquez Vilapana 등 2008)도 도움이 될 수 있다.
However, the majority of social support interventions retrieved in this review focused on knowledge, skills and/or attitudinal concerns. Learning sessions took place in the form of tutorials (n = 4, Strong) (Walter and Croen 1993; Schwartz and Loten 1998; Sayer et al. 2002; Sikakana 2010), small-group learning (n = 3, Moderate) (Sayer et al. 2002; Burch et al. 2013; Winston et al. 2014) or group study (n = 3, Moderate) (Walter and Croen 1993; Shokar 2003; Rowland et al. 2012). Peer-based learning involving assignment of high-performance students (n = 1, Moderate) (Enriquez Vilapana et al. 2008) can also be helpful.

더 넓게 보면, 시갈 외 연구진(1999)이 설명한 것과 같은 학업 지원 프로그램(n = 1, 중간)은 학업상 어려움을 겪는 학습자를 지도하기 위한 많은 전략을 결합할 수 있다.

More broadly, an academic support program (n = 1, Moderate) such as the one described by Segal et al. (1999) can combine many strategies to guide learners with academic difficulties.

지식 형성… 등
Shaping knowledge… and more

이 그룹 지정에도 불구하고 이 그룹은 지식 문제 이상의 문제 해결을 지원했습니다. 검색된 모든 개입 유형(n = 15)도 기술을 대상으로 했고, 7개도 태도 문제와 관련이 있었다.
Despite its designation, this grouping supported remediation of more than knowledge issues. All retrieved types of interventions (n = 15) also targeted skills, and seven were also relevant for attitudinal concerns.

공식적인 오리엔테이션 프로그램(n = 1, 보통) 또는 시험 응시 기술 훈련(n = 2, 매우 약함)과 같은 일부 유형의 개입은 학습을 촉진하는 것을 목표로 했다.
Some types of interventions aimed at facilitating learning, such as a formal orientation program (n = 1, Moderate) (Blumberg et al. 1995), or test-taking skills training (n = 2, Very weak) (Walter and Croen 1993; Shokar 2003).

이 리뷰는 필수 컨퍼런스(n = 3, Strong) (Magarian and Campbell 1992; Yaghoubian et al. 2012; Slabin et al. 2014), 교육 세션(n = 5, Strawhorn et al. 1991; Hardy 1999; 2016)과 같은 잘 알려진 지식 형성 방법을 검색했다. 1991; Chur-Hanssen 1999; Winston 외 2014).

This review retrieved well-known methods of shaping knowledge such as required conferences (n = 3, Strong) (Magarian and Campbell 1992; Yaghoubian et al. 2012; Slavin et al. 2014), didactic sessions (n = 5, Weak) (Pickell et al. 1991; Hesser and Lewis 1992; Hardy 1999; Strayhorn 2000; Bhatti et al. 2016) and workshops (n = 3, Weak) (Pickell et al. 1991; Chur-Hansen 1999; Winston et al. 2014).

일부 저자들은 토론(n=1, 중간) (Pickell 등 1991), 임상 포럼(n=1, 매우 약함) (Hesser 및 Lewis 1992), 시험 후 행동 검토(n=1, 약함)(Rowland 등 2012)와 같은 의미 있는 학습을 촉진하는 전략을 제안했다.
Some authors proposed strategies promoting meaningful learning, such as discussions (n = 1, Moderate) (Pickell et al. 1991), clinical forums (n = 1, Very weak) (Hesser and Lewis 1992) and a review of behaviors after an exam (n = 1, Weak) (Rowland et al. 2012).


연구 보조는 지시/교정된 읽기/읽기 과제(n = 10, 중간)의 형태로 조사되었다(Magarian and Campbell 1992; Edeiken 1993; Shokar 2003; Gregg et al. 2008; 2010; LaRochelle et al. 2012; Yaghoubian et al. 2012; 2013).동일한 주제에 대한 몇 가지 텍스트를 요약할 수 있는 rner) (n = 1, 매우 약함) (Aud evolent et al. 2011), 연구 기술 훈련 (n = 8, 약함)(Harroll and Lee-Tyson, 1994; Hardy 1999; Segal et al. 1999; Powell 2004; 2012; Ste-jgers 2012; 2013).(n = 1, 약함) (Sayer et al. 2002) 또는 테스트를 사용한 연구 세션 (n = 1, 보통) (Reamy and Harman 2006). 많은 연구들이 사설 연구보다 더 나은 권고 강도에 도달했다(n = 4, 매우 약함) (Hesser 및 Lewis 1992; Sayer 등 2002; Shokar 2003; Kosir 등 2008). 

Study assistance was investigated in the form of directed/structured readings/reading assignments (n = 10, Moderate) (Magarian and Campbell 1992; Edeiken 1993; Shokar 2003; Gregg et al. 2008; Aeder et al. 2010; LaRochelle et al. 2012; Yaghoubian et al. 2012; Burch et al. 2013; Platt et al. 2014; Drake et al. 2015), compared readings (asking the learner to summarize a few texts on the same subject) (n = 1, Very weak) (Audétat et al. 2011), study skills training (n = 8, Weak) (Hesser and Lewis 1992; Carroll and Lee-Tyson 1994; Hardy 1999; Segal et al. 1999; Powell 2004; Mysorekar 2012; Stegers-Jager et al. 2013; Miller 2014), study guides/course notes produced by tutors to support learning sessions (n = 1, Weak) (Sayer et al. 2002) or study sessions with tests (n = 1, Moderate) (Reamy and Harman 2006). Many reached a better strength of recommendation than Private study (n = 4, Very weak) (Hesser and Lewis 1992; Sayer et al. 2002; Shokar 2003; Kosir et al. 2008).

지식, 기술 및 태도를 안내하는 것 외에도, 준비 과정/준비 과정/준비 과정(n = 4, Strong)(Tekian and Hruska 2004; Grumbach and Chen 2006; Sikakana 2010; Burch et al. 2013)은 또한 소수자/장애 학생 및 취약자원의 교육적 배경의 학습자와 같은 학업 어려움에 대한 개인적 위험 요소를 가진 학습자를 지원하는 것을 목표로 한다..
In addition to guiding knowledge, skills and attitudes, preparation courses/programs (n = 4, Strong) (Tekian and Hruska 2004; Grumbach and Chen 2006; Sikakana 2010; Burch et al. 2013) aimed at also supporting learners with personal risk factors for academic difficulties, such as minority/disadvantaged students and learners from under-resourced educational backgrounds.

연관성 – 임상 추론 교정
Associations – clinical reasoning remediation

임상 추론 교정을 위한 많은 유형의 개입이 BCT의 협회 그룹에 의해 나타났다.
Many types of interventions for remediation of clinical reasoning appeared under the Associations group of BCT.

첫째, 임상 추론 어려움이 학습자의 학습 장애, 인지 개입/중간(n = 5, 중간) (Walter and Croen 1993; Laatch 2009; Winston et al. 2010; Klamen and Williams 2011; Katz et al. 2013)과 같은 개인 문제로 인해 발생할 경우 임상 문제 해결을 강화하는 데 도움이 될 수 있다. 인지 기술에 주로 초점을 맞춘 다른 유형의 개입에는 문제 기반 학습(n = 4, 보통)이 포함된다(Pickell et al. 1991; Magarian and Campbell 1992; Camp et al. 1994; Burch et al. 2007), 큰 소리로 추론(n = 2, 매우 약함)(Walter and Croen 1993; Audet et et et et al. 2011; Audent, 2011), 상황 학습(nual)이 포함된다. 2011). 가설 생성, 데이터 수집, 진단 및/또는 임상 상태 관리를 개선하기 위한 임상 상관 관계(n = 1, 보통) (Pickell 등) 표준화된 임상 추론 교정 계획(n = 1, Strong)(Guerrasio 및 Aagaard 2014)은 학부 및 대학원 학습자 모두에게 효과적인 것으로 입증되었다. 과학적 글쓰기(n = 1, 보통) (Hardy 1999)와 질문쓰기(n = 1, 매우 약함) (Aeder et al. 2010)도 합성 기술을 개발하기 위한 전략으로 나타났다.

First, if clinical reasoning difficulties result from learners’ personal issues such as learning disorders, cognitive intervention/rehabilitation (n = 5, Moderate) (Walter and Croen 1993; Laatsch 2009; Winston et al. 2010; Klamen and Williams 2011; Katz et al. 2013) can help reinforcing clinical problem solving. Other types of interventions focusing mostly on cognitive skills include problem-based learning (n = 4, Moderate) (Pickell et al. 1991; Magarian and Campbell 1992; Camp et al. 1994; Burch et al. 2007), reasoning out loud (n = 2, Very weak) (Walter and Croen 1993; Audetat et al. 2011), contextual learning (n = 2, Very weak) (Walter and Croen 1993; Chur-Hansen 1999) and clinical correlations (n = 1, Moderate) (Pickell et al. 1991), to improve hypothesis generation, data collection, diagnosis and/or management of clinical conditions. Standardized clinical reasoning remediation plan (n = 1, Strong) (Guerrasio and Aagaard 2014) proved to be effective in both undergraduate and postgraduate learners. Scientific writing (n = 1, Moderate) (Hardy 1999) and question writing (n = 1, Very weak) (Aeder et al. 2010) also appeared as strategies to develop synthesis skills.

특정 고위험 의료 조건에 대한 서면 임상 프로토콜 개발(n = 1, 중간)(Blumberg 등 1995)은 고품질 의료의 일관된 전달을 촉진하거나 유도할 목적으로 환경적 또는 사회적 자극을 강조했다.

Development of written clinical protocols (n = 1, Moderate) (Blumberg et al. 1995) for specific high-risk medical conditions highlighted environmental or social stimuli with the purpose of prompting or cueing consistent delivery of high-quality care.

행동 비교 – 역할 모델링
Comparison of behaviors – role modeling

시연(n = 1, 보통)과 DVD 시청(n = 1, 보통)에서 예상된 바와 같이 학습자 자신의 성과와 비교할 수 있는 다른 사람의 성과나 행동에 대한 인식을 토론할 수 있는 기회가 역할 모델링 활동으로 제공되었다(LaRochelle et al. 2012). 일부 동기부여 활동(예: 의료 전문가를 그림자처럼 보이게 하는 하계 인턴십) (n = 1, 보통) (Tekian and Hruska 2004) 또한 학업상 어려움을 겪을 위험이 있는 학습자를 위한 예방 전략으로 역할 모델링을 사용한다.
Opportunities to discuss others’ performance or perception of behavior to allow comparison with the learner’s own performance were provided by role modeling activities, as expected in demonstration (n = 1, Moderate) (Pickell et al. 1991) and DVD viewing (n = 1, Moderate) (LaRochelle et al. 2012). Some motivational activities (e.g. summer internships allowing to shadow a medical professional) (n = 1, Moderate) (Tekian and Hruska 2004) also use role modeling as a preventive strategy for learners at risk of developing academic difficulties.

반복 및 대체
Repetition and substitution


어떠한 개입도 원치 않는 행동을 원하는/중립적인 행동으로 대체하는 것을 촉진하는 것으로 보이지 않았다. 하지만, 많은 사람들은 다양한 맥락에서 반복을 사용했습니다.

No intervention seemed to prompt substitution of the unwanted behavior with a wanted/neutral behavior. However, many used repetition, in various contexts.

감독 관행(n = 6, 중간), [(Pickell et al. 1991; Hardy 1999; Sayer et al. 2002; 2010; Audetat et al. 2011; Pell et al. 2012), 고의 관행(Guerrasio, Garrity, et al., 2014), 시뮬레이션(n = 2)(LaRochelle et al. 2012)는 다양한 상황에서 지식을 사용하고 다양한 기술을 연습하며 적절한 태도를 보여줄 수 있는 반복적인 기회를 제공했다. 이전 과정 내용 반복(n = 1, 보통) (Burch et al. 2013), 실험실 (n = 1, 중간) (Pickell et al. 1991), 신체 검사 실습 세션 (n = 1, 중간) 및 의사소통 훈련 (n = 2, 약한)과 같은 일부 유형의 개입이 집중되었다. 다른 유형의 개입에는 보충 훈련 (n = 5, 중간) (Edeiken 1993; Dowell 등 2006; Reamy and Harman 2006; Cleland 등 2010; Brokaw 등 2011) (Kies 및 Freund Rohm 2005)과 같은 보다 일반적인 전략이 포함되었다. 2012; Yaghoubian et al. 2012) 및 때로는 새로운 사이트(n = 1, 보통)에서 발생하였다(Reamy and Harman 2006). 

Supervised practice (n = 6, Moderate) [(Pickell et al. 1991; Hardy 1999; Sayer et al. 2002; Cleland et al. 2010; Audetat et al. 2011; Pell et al. 2012), deliberate practice (n = 1, Moderate) (Guerrasio, Garrity, et al. 2014), simulation (n = 2, Moderate) (Cleland et al. 2010; Guerrasio and Aagaard 2014) and standardized patient exercises (n = 1, Moderate) (LaRochelle et al. 2012) provided repeated opportunities to use knowledge, practice various skills and demonstrate appropriate attitudes in varying contexts. Some types of interventions were focused, such as repetition of previous course content (n = 1, Moderate) (Burch et al. 2013), laboratories (n = 1, Moderate) (Pickell et al. 1991), physical examination practice session (n = 1, Moderate) (Pickell et al. 1991), and communication skills training (n = 2, Weak) (Chur-Hansen 1999; Hardy 1999). Other types of interventions involved more general strategies, like supplemental training (n = 5, Moderate) (Edeiken 1993; Dowell et al. 2006; Reamy and Harman 2006; Cleland et al. 2010; Brokaw et al. 2011), which lasted up to a year (n = 6, Moderate) (Kies and Freund 2005; Rehm and Rowland 2005; Brokaw et al. 2011; Dupras et al. 2012; Pell et al. 2012; Yaghoubian et al. 2012) and sometimes took place at a new site (n = 1, Moderate) (Reamy and Harman 2006).


봉사 기회(n = 1, Strong)(Slavin 등 2014), 종단적 일렉티브(n = 1, Strong)(Slavin 등 2014) 또는 연구(Strong)(Tekian 및 Hruska 2004; Slavin 등 2014)를 제공하면/습관 통합에 초점을 맞춘 상황별 학습을 촉진하여 유지율을 높일 수 있다.

Offering service opportunities (n = 1, Strong) (Slavin et al. 2014), longitudinal electives (n = 1, Strong) (Slavin et al. 2014) or research (Strong) (Tekian and Hruska 2004; Slavin et al. 2014) may increase retention by promoting contextual learning, focusing on consolidation of habits/skills.

시험 준비는 다양한 형식으로 나타났다. MCAT 준비 (n = 1, 보통) (Hardy 1999), 검토 과정/강좌 (n = 4, 약함) (Reamy and Harman 2006; Gregg et al. 2008; Kosir et al. 2008; Burch et al. 2013), 시험 연습 (n = 3, 매우 약함) 2003 Kosarok. 실패 후 벌점이 없는 2차 시험(n = 1, 약함)(슈워츠 및 로텐 1998)이 가능한 옵션으로 연구되었다.
Exam preparation appeared in various formats: MCAT preparation (n = 1, Moderate) (Hardy 1999), review course/session (n = 4, Weak) (Reamy and Harman 2006; Gregg et al. 2008; Kosir et al. 2008; Burch et al. 2013), practice for exams (n = 3, Very weak) (Shokar 2003; Kosir et al. 2008; Aeder et al. 2010). After exam failure, a second-chance exam without penalty (n = 1, Weak) (Schwartz and Loten 1998) was studied as a possible option.

피드백 및 모니터링
Feedback and monitoring

피드백과 모니터링 기법은 이 그룹 내의 10가지 유형의 개입으로 교정 상황에서 잘 문서화되었다.
Feedback and monitoring techniques were well documented in remediation contexts, with ten types of interventions in this grouping.

대부분의 피드백 개입은 학부 및 대학원 학습자의 지식, 기술 또는 태도 문제(n = 11, 중간)에 대해 연구되었다(Blumberg et al. 1995; Chur-Hansen 1999; Sayer et al. 2002; Harthun et al. 2005; Borman 2006; Aeder et al. 2010; Cleland et al. 2010; Rowland et al. 2012). 2014; 바티 외 2016). 웹 기반 피드백(n = 1, 중간)(Drake et al. 2015)은 지식 또는 기술 문제를 해결하기 위한 기술 지원 피드백의 한 예입니다. 사전 테스트/사후 테스트 검사(n = 1, 약함) 및 키징(n = 4, 보통)과 같은 전략은 특정 지식 또는 기술에 대한 피드백을 제공했다. 비디오테이프 검토(n = 3, 약함) (보먼 2006; Reamy and Harman 2006; Rowland et al. 2012) 및 직접 관찰(n = 1, 매우 약함)(Audetat et al. 2011)은 기술이나 태도에 대한 형성적 의견을 용이하게 할 계획이다. 

Most feedback interventions were studied for knowledge, skills or attitude problems in both undergraduate and postgraduate learners (n = 11, Moderate) (Blumberg et al. 1995; Chur-Hansen 1999; Sayer et al. 2002; Harthun et al. 2005; Borman 2006; Aeder et al. 2010; Cleland et al. 2010; Rowland et al. 2012; Katz et al. 2013; Guerrasio, Garrity, et al. 2014; Bhatti et al. 2016). Web-based feedback (n = 1, Moderate) (Drake et al. 2015) was an example of technology-supported feedback to remediate knowledge or skills issues. Strategies such as pretest/posttest examinations (n = 1, Weak) (Rowland et al. 2012) and quizes (n = 4, Moderate) (Pickell et al. 1991; Borman 2006; Gregg et al. 2008; Kosir et al. 2008) provided feedback on specific knowledge or skills. Videotape review (n = 3, Weak) (Borman 2006; Reamy and Harman 2006; Rowland et al. 2012) and direct observation (n = 1, Very weak) (Audetat et al. 2011) intend to facilitate formative comments on skills or attitudes.

이 검토에서 검색된 모니터링 개입은 서비스 책임자가 이끄는 거주 달빛잡이들과의 분기별 회의를 통해 지식 및/또는 기술의 습득을 도왔다(Blumberg et al. 1995). 기술과 태도 문제는 비공식 토론(n = 1, 중간)(듀프라스 외 2012) 또는 지정된 간격으로 체크인하고 학생 학장 및 기타 학교 관계자와 개방된 커뮤니케이션 라인을 유지해야 하는 요구 사항(n = 1, 중간)(Brokaw 외 2011)을 통해 해결되었다.

Monitoring interventions retrieved in this review assisted the acquisition of knowledge and/or skills through quarterly meetings with resident moonlighters led by the service chief (n = 1, Moderate) (Blumberg et al. 1995). Skills and attitudinal concerns were tackled using informal discussion (n = 1, Moderate) (Dupras et al. 2012) or through a requirement to check-in at specified intervals and maintain open lines of communication with the Dean of Students and other school officials (n = 1, Moderate) (Brokaw et al. 2011).

성찰의 중요성(n = 1, 중간)(Gerrasio, Garrity 등 2014)은 궁극적인 관행 변화에 대한 피드백 통합을 보장하는 데 있어 핵심으로 보였다.
The importance of reflection (n = 1, Moderate) (Guerrasio, Garrity, et al. 2014) seemed a key in ensuring feedback integration for eventual changes in practice.

보상 및 위협
Reward and threat


경고 서한(n = 2, 보통)을 보내는 것(Brokaw 등 2011; Dupras 등 2012)은 향후 처벌 또는 보상 제거가 원치 않는 행동 수행의 결과라는 것을 알리는 역할을 했다. 비전문적 행동(n = 1, 약함)을 문서화하는 포인트 시스템(Malakoff et al. 2014)은 특별히 경향적 관심사를 대상으로 하는 드문 유형의 개입 중 하나였다.

Sending a warning letter (n = 2, Moderate) (Brokaw et al. 2011; Dupras et al. 2012) served to inform that future punishment or removal of reward would be a consequence of the performance of an unwanted behavior. A point system to document unprofessional behavior (n = 1, Weak) (Malakoff et al. 2014) was one of the rare types of intervention targeting attitudinal concerns specifically.

자연적 결과
Natural consequences

이 그룹에서는 오직 두 가지 유형의 개입만이 나타났으며, 둘 다 기술 교정을 목적으로 했다. 품질 보험 조정자(n = 1, 보통)의 일일 관리 검토(Blumberg 등 1995)는 고위험 의료 조건에 대한 거주자의 감독 및 성과를 개선했다. 비전문적 행동을 반성하거나 사과하기 위한 독립 프로젝트(n = 1, 중간)(Brokaw 등 2011)의 완료도 태도 변화와 관련이 있는 것으로 보였다.
Only two types of interventions appeared under this grouping, both aimed at remediating skills. Daily management reviews by a quality insurance coordinator (n = 1, Moderate) (Blumberg et al. 1995) improved supervision and performance of moonlighting residents around high-risk medical conditions. Completion of an independent project (n = 1, Moderate) (Brokaw et al. 2011) to reflect on, or apologize for, unprofessional behavior also appeared relevant for changing attitude.

예정된 결과 - 심각하고 지속적인 어려움
Scheduled consequences – for severe and persistent difficulties


학업 해고 정책(n = 1, 중간)의 시행(Steger-Jager 외 2011)과 같은 학습 환경 개입은 진전 우려가 발생할 경우 기대와 결과를 명확히 하는 것을 목표로 한다.

Learning environment interventions, such as the implementation of an academic dismissal policy (n = 1, Moderate) (Stegers-Jager et al. 2011), aim to clarify expectations and consequences if progress concerns occur.

이 BCT에 따른 개입 유형에는 학습 요구와 목표, 역량 개발 전략 및 기대 충족 실패 시 결과를 정의하는 학습 계약 (n = 5, 약함)이 포함되었다(Sayer et al. 2002; Brokaw et al. 2011; Katz et al. 2013; Sparks et al. 2016; Gerasio and Aagard 2018). 그러한 결과에는 비행 배정 또는 과제(n = 1, 보통) (Brokaw 등 2011), 보호 관찰 (n = 2, 보통) (Dupras 등 2012; Batti 등 2016), 해고/학업 철회 (n = 2, 보통) (Brokaw 등 2011; Dupras 등 2012) 및 궁극적으로 학교 정학으로부터 오는 2012년이 포함된다. 이러한 개입은 주로 기술과 태도와 관련된 어려움을 목표로 했습니다. 
Types of interventions under this BCT included learning contracts (n = 5, Weak) (Sayer et al. 2002; Brokaw et al. 2011; Katz et al. 2013; Sparks et al. 2016; Guerrasio and Aagard 2018), defining learning needs and objectives, strategies to develop competencies, and consequences if there is a failure to meet expectations. Such consequences include delinquent assignment or task (n = 1, Moderate) (Brokaw et al. 2011), probation (n = 2, Moderate) (Dupras et al. 2012; Bhatti et al. 2016), dismissal/voluntary withdrawal (n = 2, Moderate) (Brokaw et al. 2011; Dupras et al. 2012) and, ultimately, suspension from school (n = 1, Moderate) (Brokaw et al. 2011). These interventions mainly targeted difficulties related to skills and attitudes.

검색된 개입이 없는 BCT 그룹화
BCT groupings without retrieved interventions


결과, 정체성, 자아 신뢰 및 비밀 학습의 비교에 따라 개입이 검색되지 않았다.

No intervention was retrieved under Comparison of outcomes, Identity, Self-belief and Covert learning.

결과 운영
Operationalizing the results

이 BEME 검토의 결과를 운영하기 위해, 대부분의 임상 교사들은 학업상 어려움을 겪는 학습자와 직면하는 구체적인 교육 진단에 따라 개입을 모색할 가능성이 높다. 그림 6은 각 교육 진단에 따른 권고 강도와 함께 각 BCT 그룹 내에서 회수된 교정조치 개입의 분포를 보여준다. 여러 유형의 개입이 하나 이상의 진단에 대해 나타난다. 연구 결과는 또한 무료로 이용할 수 있는 앱(iOS 및 Android용)인 MedEd Dx Tx에도 제시되어 있으며, 여기에는 각 교육 진단에 대한 연구된 개입과 권장 강도가 나열되어 있다.
To operationalize the results from this BEME review, most clinical teachers are likely to search for interventions according to the specific educational diagnoses they are facing with their learners with academic difficulties. Figure 6 illustrates the distribution of the retrieved remediation interventions within each BCT grouping, with their strength of recommendation under each educational diagnosis. Many types of interventions appear for more than one diagnosis. The study results are also presented in MedEd Dx Tx, an app (for iOS and Android) available for free, which lists the studied interventions and their strength of recommendation for each educational diagnosis.

 

논의
Discussion

이 검토는 학업상 어려움을 겪고 있는 학습자를 위한 109가지 개입 유형을 식별하고 검색된 각 개입에 대한 권장 사항을 설정했습니다. 이 주제에 대한 마지막 두 가지 검토가 2008년에 수행된 이후 의료 교육의 교정조치 개입에 대한 지식을 업데이트한다(하우어 외). 2009년) 및 2012년(Cleland et al. 2013)으로, 학부 및 대학원 의료 교육생 모두를 포함하는 더 넓은 관점을 제공한다. 또한 대학원 의료 연수생들 사이의 성과를 식별하고 교정할 때 직장 기반 평가의 사용을 조사한 최근 BEME 리뷰를 기반으로 한다(Barrett et al. 2016).
This review identified 109 types of interventions for learners experiencing academic difficulties, and established recommendations for each of the retrieved interventions. It updates the knowledge on remediation interventions in medical education since the last two reviews on the subject were conducted in 2008 (Hauer et al. 2009) and 2012 (Cleland et al. 2013), offering a broader perspective that includes both undergraduate and postgraduate medical trainees. It also builds on a recent BEME review which examined the use of workplace-based assessment in identifying and remediating performance among postgraduate medical trainees (Barrett et al. 2016).

[미치 분류법]은 처음에 의료 및 환자 교육 상황에 맞게 설계되었지만(Michie 등. 2015), 대부분의 BCT 그룹이 적어도 하나의 개입과 일치하기 때문에 의학 교육에서 학문적 어려움을 겪고 있는 학습자에게 개입을 위한 좋은 프레임워크로 보인다. BCT 분류법에 따라 학문적 어려움을 겪는 학습자를 위한 개입 지도를 작성하는 것은 이러한 개입의 내용을 식별하기 위해 이론적 관점에서 도움이 됩니다. 
Even though Michie’s taxonomy was initially designed for healthcare and patient education contexts (Michie et al. 2015), it seems to be a good framework for interventions for learners experiencing academic difficulties in medical education, since most BCT groupings matched at least one intervention. Mapping interventions for learners experiencing academic difficulties under the BCT taxonomy is helpful from a theoretical perspective to identify the content of these interventions.

▷ 행동 개입이 가장 일반적이었다. 자극에 이어 대응(피드백 및 모니터링, 보상 및 위협, 자연/예약 결과)을 제공하는 학습 환경(환경 조정)은 역량 기반 교육의 맥락에서 교정조치에 대한 좋은 이론적 기반이 되는 것으로 보인다(Carraccio et al 2002; Sh).에르비노 외 2010). 피드백과 모니터링은 대학원 학습자의 개입에 비례적으로 더 일반적으로 사용되었는데, 이는 아마도 대학원 교육이 주로 임상 환경에서 일대일 교육을 수반하기 때문일 것이다(라마니 및 라인스터 2008).

Behavioral interventions were the most common: adjusting the learning environment (Antecedents), providing stimuli with opportunities for practice (Repetition and substitution) followed by response (Feedback and monitoringReward and threatNatural/Scheduled consequences) appear to be good theoretical bases for remediation in the context of competency-based education (Carraccio et al. 2002; Sherbino et al. 2010). Feedback and monitoring was proportionally more commonly used in postgraduate learners’ interventions, probably because postgraduate training predominantly involves one-on-one teaching in the clinical environment (Ramani and Leinster 2008).

 Association의 하위로 분류되는 것 등의 인지주의 개입은 특히 임상 추론 기술 어려움의 관리와 해당 주제에 대한 최근 AMEE 가이드(Audetat et al 2017)를 목표로 했다. 

Cognitivist interventions such as those under Associations were particularly targeted towards the management of clinical reasoning skills difficulties and in line with a recent AMEE guide on the subject (Audetat et al. 2017).

Regulation BCT에 따른 이번 심사에서 확인된 인본주의적 개입은 학습자 중심의 접근을 촉진하고 자기주도적 학습을 주장해 학업상 어려움을 겪는 학습자를 지원하기 위한 학습계획(목표 및 계획 수립)의 중요성을 강화했다.

Humanist interventions, identified in this review under the Regulation BCT, promoted a learner-centered approach and insisted on self-directed learning, reinforcing the importance of learning plans (Goals and planning) in supporting learners with academic difficulties.

 마지막으로 사회구축주의적 접근법[사회적 지원]과 [행동비교]에서 학업상 어려움을 겪고 있는 학습자를 위한 개입으로 권장된다. 놀랍게도 학업상 어려움을 겪는 학습자를 위한 학부 개입으로 행동 비교가 비례적으로 더 잦았는데, 이는 임상교사들이 특히 이 정도의 훈련에서 관찰과 시연을 중시하기 때문일 것이다. 그러나 역할 모델링은 모든 수준의 교육에서 학습자의 전문적 개발을 위한 중요한 프로세스입니다(Passi et al 2013).

Finally, socio-constructivist approaches are slightly less common but still moderately recommended as interventions for learners experiencing academic difficulties, under Social support and Comparison of behaviors. Surprisingly, comparison of behavior was proportionally more frequent as an undergraduate intervention for learners with academic difficulties, maybe because clinical teachers particularly value observation and demonstrations at this level of training. However, role modeling is an important process for the professional development of learners (Passi et al. 2013), at all levels of training.

 

극소수의 개입만이 16 BCT로 분류될 수 없었다.

Very few interventions could not be classified among the 16 BCT. 

결과의 비교 검색된 개입에 대한 주요 BCT 중에 없었다. 감독자는 부정적인 결과가 발생하지 않도록 해야 하기 때문에 이 기법은 환자 안전 문제에 의해 제한될 수 있다. 그럼에도 불구하고, 이 BCT를 사용하는 일부 개입은 의료 교육에 효과적이지만(예: 웹 기반 감사 및 피드백 모듈 Boggan et al 2017)) 학업상 어려움을 가진 학습자를 위해 특별히 테스트되지는 않았다. 

▷ Comparison of outcomes never matched as a major BCT for the retrieved interventions. This technique might be limited by patient safety issues, since supervisors should not allow adverse outcomes to occur; nevertheless, some interventions using this BCT are effective in medical education (e.g.: web-based audit and feedback module (Boggan et al. 2017)), but were not tested specifically for learners with academic difficulties. 

은밀한 학습은 원하는/원하지 않는 행동을 수행하는 것을 상상하는 방법으로 이해되며, 즐거운/불쾌한 결과를 상상하거나 다른 사람이 그 행동을 수행할 때 그 결과를 관찰하도록 유도한다. 어떤 면에서는 성찰적 실습과 유사한 접근법이며, 학업상 어려움을 겪는 학습자에게 유용할 수 있다. 

 Covert learning, understood as a way to imagine performing the wanted/unwanted behavior, followed by imagining a pleasant/unpleasant consequence, or by prompting observation of the consequences for others when they perform the behavior, is in some ways a an approach similar to reflective practice, and could probably be useful for learners with academic difficulties. 

자아신뢰는 이 검토에 대한 어떠한 개입도 주요 BCT로 구체적으로 식별되지 않았다. 그러나 능력과 시각화 기술에 대한 설득은 심리적 지원을 포함하는 규정 개입에 사용되었을 수 있다. 

 Self-belief was not specifically identified as a major BCT in any intervention in this review; however, persuasion about capability and visualization techniques might have been used in the Regulation interventions involving psychological support.

마지막으로, 정체성 BCT가 어떠한 개입과도 일치하지 않는다는 사실에도 불구하고, 지도된 성찰, 개인적 서술의 사용 및 역할 모델링(Wald et al 2015)을 포함한 [전문직 정체성 형성]의 핵심 요소는 자기 분야의 "소속감"을 느끼지 않는 일부 학습자의 삶을 변화시킬 수 있다. 게다가, 행동 비교는 (졸업후는 아니지만) 학부 학습자의 개입에 대한 주요 BCT로 사용되었습니다. 성찰적 모방과 함께 역할 모델링을 사용하는 개입은 의학 교육에서 설명되었으며(Benbassat 2014), 행동의 비교를 이용했다. 따라서 학문적 어려움을 겪는 대학원 학습자를 지원하기 위한 목적으로 특별히 유사한 개입을 사용하는 어떠한 논문도 발견하지 않은 것은 놀라운 일이다.

 Lastly, despite the fact that the Identity BCT did not match any intervention, key elements of professional identify formation including guided reflection, use of personal narratives and role modeling (Wald et al. 2015) might change the lives of some learners who do not feel they “belong” to their discipline. Besides, Comparison of behavior was used as the main BCT for interventions in undergraduate but not postgraduate learners. Interventions using role modeling with reflective imitation have been described in medical education (Benbassat 2014) and do use comparison of behavior; it was therefore surprising to find no article using similar interventions specifically aimed at supporting postgraduate learners experiencing academic difficulties.


상자 2와 3은 각 교육 진단에 대한 관련 개입과 함께 교육 시나리오를 보여줍니다.

Boxes 2 and 3 illustrate teaching scenarios with the relevant interventions for each educational diagnosis.


박스 2.
Box 2.

학부 학습자와의 교육 시나리오
Teaching scenario with an undergraduate learner


브라이언은 21살 의대 2학년 학생입니다. 그는 부모님과 함께 살고 있으며 대학 농구팀의 멤버입니다. 당신은 지난 3개월 동안 그의 문제 기반 학습 코스에서 튜터였습니다. 본 학습자에게 다음과 같은 많은 문제가 있음을 알게 되었습니다.
Brian is a 21 years old, 2nd year medical student. He lives with his parents, and is a member of the university basketball team. You have been his tutor in a problem-based learning course over the last 3 months. You have noticed many issues for this learner:

  • 당신이 방금 설명한 물리병리학 또는 약리학의 개념에 대한 질문을 자주 한다.
  • 보통 강의 시간에 책상 위에 누워있고, 종종 폭력적인 지문이 있는 티셔츠와 홀리진을 입습니다.
  • 질문을 하거나 자신의 의견을 말하기 위해 동료들을 방해하는 경향이 있습니다.
  • 신체검사 연습 시간에 모하메드나 리쵸와 절대 팀을 이루지 않는다. 거의 항상 메리와 함께 일하는데, 메리는 수업 전에 DVD에서 다양한 기술을 보고 인내심을 갖고 가르쳐준다.
  • 정기적으로 지각하고, 사전 통보 없이 마지막 수업을 빠졌습니다.
  • 숙제: 요청한 요약본보다는 지연되고 긴 연속본이 나왔으며, 일부 문장에는 의대 2학년 때 교육과정의 일부가 아닌 복잡한 개념이 담겨 있었다.

  • Often asks questions about physiopathology or pharmacology concepts you have just explained.
  • Commonly lies over his desk during teaching sessions, often wears t-shirts with violent prints as well as holey jeans.
  • Tends to interrupt colleagues to ask a question or give his opinion.
  • Never teams up with Mohamed or Lee-Chow during physical exam practice sessions. Almost always work with Mary, who patiently teaches him how to perform the various maneuvers as she saw them on the DVD that was to be watched before class.
  • Is regularly late, and missed last class without advanced notice.
  • Homework: delayed, long continuous text rather than the requested summary, and some sentences contained complex concepts that are not part of the curriculum in second year medical school.

그는 피드백을 잘 수용하지 않고, 끊임없이 자신의 어려움을 정당화합니다

He is not very receptive to feedback, and constantly justifies his difficulties.

교육 진단:
Educational diagnoses:

  • 학습자: 건강? (주의력 결핍 장애나 다른 학습 장애? 약물 남용?), 사회적? (교육 일정에 따라 학습 시간이 제한됨).
  • 구조적(학습 계획)과 절차적 기술(신체검사 기동) 문제.
  • 대인관계(인종주의?)와 전문적(표절주의?) 태도 문제.
  • Learner: health? (attention deficit disorder or other learning disorder? drug abuse?), social? (study time limited by training schedule).
  • Structural (study planning) and procedural skills (physical exam maneuvers) issues.
  • Interpersonal (racism?) and professional (plagiarism?) attitude issues.

이 BEME 검토에서 관련 개입의 선택:
Selection of relevant interventions from this BEME review:

  • 공식적인 사이코모터/학습 평가 및 치료(강력), 의학적 평가 및 치료(중간), 학생 지원 서비스(중간)에 대한 의뢰(중간)
  • 교육/학습 시간 균형에 도움이 되는 커리큘럼 압축 풀기(강력).
  • 프로그램 책임자(중도)와의 비공식 토론.
  • 학습 계약(약함).
  • 학습 기술 훈련(약함)
  • 멘토링(강력), 성취도가 높은 학생 배정(약함)입니다.
  • 비전문적 행동(약함), 반성(중간), 독립 프로젝트 완료(중간): 예: 비전문적 행동의 영향에 대한 문헌 검토(중간), 경고 편지(중간), 체납 할당 또는 업무(중간), 지정된 간격으로 체크인해야 하는 요건 및 개방된 커뮤니케이션 라인을 유지합니다.학생부장 또는 다른 학교 관계자(중도)와의 의견 교환.
  • Formal psychomotor/learning assessment and therapy (strong), medical evaluation and therapy (moderate), referral to student support services (moderate).
  • Curriculum decompression (strong) to help with training/study time balance.
  • Informal discussion with program director (moderate).
  • Learning contract (weak).
  • Study skills training (weak).
  • Mentoring (strong), assignment of high performance student (weak).
  • Point system to document unprofessional behavior (weak), reflection (moderate), completion of an independent project (moderate): eg.: write literature review about impact of unprofessional behavior, warning letter (moderate), delinquent assignment or task (moderate), requirement to check-in at specified intervals and maintain open lines of communication with Dean of Students or other school officials (moderate).

상자 3. 대학원 학습자와의 교육 시나리오
Box 3. 
Teaching scenario with a postgraduate learner


엘레나는 42세의 국제 졸업생입니다. 그녀는 4년 전에 당신의 나라로 이민을 갔어요. 그녀는 이민 가기 전에 6개월 동안 이비인후과 전문의로 연습했습니다. 한 달도 안 된 당신 도시로 이사왔죠 그녀는 미혼이고 아이가 없지만 250km 떨어진 마을에 가족이 있다. 그녀는 이제 막 가정의학과 레지던트 교육을 시작했고, 임상 선생님들은 몇 가지 어려움을 알아차렸다.

Elena is a 42 years old international graduate. She immigrated in your country 4 years ago. She practiced as ear, nose and throat specialist for 6 months before immigrating. She just moved in your city less than a month ago. She is single, has no children, but has family in a town 250 km away. She has just started her family medicine residency training, and clinical teachers have noticed some difficulties:

  • 환자와의 만남을 위한 의제를 설정하기가 어렵습니다.
  • 온정주의적 접근.
  • 현재 질병에 대한 집중력 없는 역사, 일반적인 주임 불평에 대한 조기 종결.
  • 공통적인 문제의 관리를 위한 1차 진료 지식 부족.
  • 환자를 항상 이해하는 것은 아니다; 영어가 모국어가 아니기 때문에 언어적 도전.
  • 환자가 말할 때도 환자 기록을 검색하는 데 많은 시간을 소비합니다. 이로 인해 일정이 지연됩니다.

  • Difficulty to establish agenda for patient encounter.
  • Paternalistic approach.
  • Unfocused history of present illness, premature closure for common chief complaints.
  • Lack of primary care knowledge for management of common problems.
  • Does not always understand the patient; linguistic challenge since English is not her first language.
  • Spends lots of time searching through patient records, even when patient is speaking; this causes delays in her schedule.

그녀는 약간의 어려움이 있다는 것을 알고 있습니다. 그녀는 자신의 시간 관리 문제를 모든 것이 자신의 새로운 것(보건 시스템, 작업 환경, 지역 자원)에 기인한다고 말한다. 이것은 그녀가 당직일 때 훨씬 더 명백하다. 그녀는 통찰력이 있고 피드백을 환영합니다.

She is aware that she has some difficulties. She attributes her time management issues to the fact that everything is new to her (health system, work environment and local resources). This is even more obvious when she is on call. She has good insight and welcomes feedback.

교육 진단:
Educational diagnoses:

  • 학습자: 문화적 적응(언어 포함), 소셜 네트워크, 건강? (임상적 추론 어려움을 설명하는 신경심리학적 진단?)
  • 지식 문제 설정 임상 및 작업
  • 임상적 추론과 대인관계 기술 문제.
  • Learner: cultural adaptation (including language), social network; health? (neuropsychological diagnosis explaining clinical reasoning difficulties?).
  • Clinical and work setting knowledge issues;
  • Clinical reasoning and interpersonal skills issues.

이 BEME 검토에서 관련 개입의 선택:
Selection of relevant interventions from this BEME review:

  • 공식 오리엔테이션 프로그램(중간)
  • 예를 들어 영어 강좌를 듣기 위해 학생 지원 서비스(중간) 및 휴가(강력)을 추천합니다.
  • 공식적인 사이코모터/학습 평가 및 치료(강력), 인지적 개입/재활(중간)
  • 학습 계획(중간), 멘토링(강력)튜터링 및 학업 보조(강력), 동료 튜터링 및 지원(중간)과 함께 교수 자문 회의.
  • 과정/세션(약함), 지시/구조화된 판독(중간), 개인 학습(매우 약함)을 검토합니다.
  • 그룹 스터디(약함), 커뮤니티 학습(강함).
  • 피드백(중간)
  • 표준화된 환자 운동(중간)
  • 정규 프로그램을 재통합하기 전에 감독된 실습(중간), 비디오테이프 검토(약함), 직접 관찰(매우 약함), 서면 임상 프로토콜(중간), 호출에 대한 백업 커버리지(중간), 보충 교육(중간)
  • 큰 소리로 추론(매우 약함), 표준화된 임상 추론 교정 계획(강력).
  • 커뮤니케이션 기술 훈련(약함), 시연(중간) 등 환자 중심 치료를 제공하는 방법을 예로 들 수 있습니다.
    학문적 어려움에 기여하는 요소를 목표로 하는 개입
  • Formal orientation program (moderate).
  • Referral to student support services (moderate) and leave of absence (strong), for example to take English courses.
  • Formal psychomotor/learning assessment and therapy (strong), cognitive intervention/rehabilitation (moderate).
  • Faculty advisor meeting with learning plan (moderate), mentoring (strong), tutoring and academic assistance (strong) and peer tutoring and support (moderate).
  • Review course/session (weak), directed/structured readings (moderate), private study (very weak).
  • Group study (weak), learning communities (strong).
  • Feedback (moderate).
  • Standardized patient exercises (moderate).
  • Supervised practice (moderate), videotape review (weak) or direct observation (very weak), written clinical protocols (moderate), back-up coverage for calls (moderate), supplemental training (moderate) before reintegrating regular program.
  • Reasoning out loud (very weak), standardized clinical reasoning remediation plan (strong).
  • Communication skills training (weak), demonstration (moderate), for example: how to provide patient-centered care.

학문적 어려움에 기여하는 요소를 목표로 하는 개입
Interventions aimed at factors contributing to academic difficulties

학습환경
Learning environment

칼레 외 연구진(2017)이 언급한 바와 같이 교정조치는 일반적으로 개인의 관점에서 고려되어 왔다(피교정자 ± 교정자). 그러나, 그것은 본질적으로 맥락에 위치하기도 합니다. 본 리뷰는 Antecedents를 의학교육에서 학업상 어려움을 겪고 있는 학습자를 위한 가장 일반적인 BCT 그룹 중 하나로 파악함으로써 이러한 학습자를 지원하기 위한 학습 환경 재구성의 중요성을 강조합니다. 실제로 클레랜드 외 연구진(2018)은 다음을 제안했다.
As mentioned by Kalet et al. (2017), remediation has typically been considered from the perspective of the individuals (remediator ± remediated). However, it is also intrinsically situated in context. By identifying Antecedents as one of the most common group of BCTs for learners experiencing academic difficulties in medical education, this review reinforces the importance of restructuring the learning environment to support these learners. Indeed, Cleland et al. (2018) suggested:

의료 문화가 [개인의 실패를 교정하는 것]에 대한 생각에서 보다 [전체론적이고 능동적인proactive 모델]로 변화하면서, [의료 프로그램의 제도적이고 구조적인 측면]은 교육적 동맹에서 다양한 교육 및 사회적 배경의 학생들을 지원하기 위해 조정되고 설계된다.
a shift in the culture of medicine from thinking about remediating individual failings to a more holistic and proactive model, where institutional and structural aspects of a medical programme are aligned and designed to support students from a range of educational and social backgrounds in an educational alliance.

그러나 학습 환경에 초점을 맞춘 대부분의 개입 유형은 단일 연구에서 나타났다(Slavin et al. 2014). 본 연구에서 저자들은 커리큘럼 변경이 미치는 영향을 평가하고 학부 학습자들에게 긍정적인 결과를 찾아냈습니다. 따라서 특히 대학원 학습자에게 어려운 학습 환경을 지원하는 학습 환경 개입에 관한 문헌은 부족한 것으로 보인다. 추가 연구는 예를 들어 학습 지침의 보편적 설계(CAST 2018)에 명시된 대로 모든 학습자에게 다양한 참여, 대표 및 표현 수단을 제공하여 어려움에 처한 의료 학습자를 교정하기 위한 유리한 환경을 조성하기 위한 프로그램 또는 병원 수준의 개입을 고려해야 한다.

However, most of the types of interventions that focused on the learning environment emerged from a single study (Slavin et al. 2014). In this study, the authors assessed the impact of curriculum modifications and found positive outcomes for undergraduate learners. The literature therefore seems to be scarce about learning environment interventions to support learners in difficulty, particularly for postgraduate learners. Further research should consider interventions at the program or hospital levels to create a favorable environment for remediating medical learners in difficulty, for example by providing multiple means of engagement, of representation and of expression for all learners, as stated in the universal design for learning guidelines (CAST 2018).

선생님.
Teacher

이 검토는 교사별 개입 또는 교직원 개발 개입의 영향에 초점을 맞춘 두 가지 유형의 개입만을 발견했습니다. 그러나 교수 관행 강화를 위한 의료 교육에서 교수개발의 효과는 잘 문서화되어 있으며(Steinert et al. 2006; Steinert et al. 2016), 여러 저자가 의료 교사와 교육자를 위한 역량 프레임워크를 제안했다(Harris et al. 2007; Srinivasan et al. 2011; Irby 2014; Walsh et al. 2015). 추가적인 연구는 구체적인 교수진 개발 노력을 조사하고 학업상 어려움을 겪는 학습자에게 미치는 영향을 평가해야 합니다.
This review found only two types of interventions focusing on the impact of teacher-specific interventions or faculty development interventions. However, the effectiveness of faculty development in medical education to enhance teaching practices is well documented (Steinert et al. 2006; Steinert et al. 2016), and several authors have proposed competency frameworks for medical teachers and educators (Harris et al. 2007; Srinivasan et al. 2011; Irby 2014; Walsh et al. 2015). Further research should look into specific faculty development efforts and assess their impact on learners with academic difficulties.

학습자
Learner

이 검토에서는 학습자의 개인적 문제를 관리하는 데 도움이 되는 37가지 유형의 개입이 발견되었습니다. 대부분은 선례나 규정 BCT에 속했다.
This review found 37 types of interventions to help manage learners’ personal issues. Most were under the Antecedents or Regulation BCT.

학업 성공에 영향을 미칠 수 있는 학습자의 [개인적 문제]에 관한 문헌에는 건강, 배우자/가족, 재정, 문화 적응 및 사회 생활과 관련된 다양한 어려움의 원인이 기술되어 있다(Lacasse 2009). 학습자가 학업 난관에 집중하기 전에 사생활 문제를 해결할 수 있도록 하려면 휴학이 필수적일 수 있다.

The literature on learners’ personal issues that may affect academic success describes various sources of difficulties, usually related with health, spouse/family, finances, cultural adaptation and social life (Lacasse 2009). A leave of absence may be essential to allow the learner to resolve personal life issues before concentrating on academic difficulties.

건강 문제의 관리는 주로 Regulation BCT 분류에 따른 개입 유형에 의존한다. 여기에는 의료 또는 심리 상담과 재활(인지, 심리 운동, 시각 훈련, 약물 남용 등), 웰빙을 촉진하는 수용과 개입(신체 운동, 스트레스 관리, 회복력 및 마음 챙김 프로그램)이 포함된다. 이는 국가, 병원, 프로그램 및 비근로 수준에서 훈련생 복지를 다루기 위해 책임을 맡은 이해관계자들에게 알리기 위한 최근 권고사항과 일관된다(Ripp et al. 2017). 배우자/가족, 재정, 사회생활 문제에 대한 지원은 종종 가용 자원을 잘 알고 있는 학생 지원 서비스에 의해 제공될 수 있다.
Management of health issues rely mostly on the types of interventions under the Regulation BCT grouping. This includes medical or psychological consultations and rehabilitation (cognitive, psychomotor, visual training, substance abuse, etc.), accommodations and interventions promoting well-being (physical exercise, stress management, resilience and mindfulness program). This is coherent with recent recommendations at the national, hospital, program, and non-work levels meant to inform stakeholders who have taken up the charge to address trainee well-being (Ripp et al. 2017). Assistance for spouse/family, finances, and social life issues can be provided by student support services, who often know available resources very well.


국제 의학 졸업생이 흔하게 학습 장애에 직면했음에도 불구하고, 이 리뷰는 [문화적 적응]을 촉진하기 위한 개입을 평가하는 소수의 논문만을 발견했다. 위험에 처한 학습자를 위한 일부 사전 교육 프로그램은 문화적 적응에 유용할 수 있으며, 이는 국제 졸업생의 주요 과제이다(Chen 등 2011; Lineberry 등 2015; Kehoe 등 2016). 하지만, 이번 리뷰에서는 특별히 국제 졸업생들을 중심으로 학업적인 어려움을 겪고 있는 학습자들을 위한 개입은 나오지 않았습니다.

Despite commonly encountered learning difficulties in international medical graduates (Samuelowicz 1987; Zulla et al. 2008; Hashim 2017), this review found few articles assessing interventions to facilitate cultural adaptation. Some prematriculation programs for at-risk learners can be useful for cultural adaptation, which is a major challenge for international graduates (Chen et al. 2011; Lineberry et al. 2015; Kehoe et al. 2016). However, interventions for learners experiencing academic difficulties specifically oriented towards international graduates did not come out in this review.

 

학업상 어려움 해결
Remediation of academic difficulties

검색된 중재 유형의 대부분은 복합적인 지식/스킬 장애를 가진 학습자를 대상으로 연구되었으며, 또한 태도 문제와 관련이 있는 경우가 많았다.
The majority of the retrieved types of interventions were studied in learners with combined knowledge/skills difficulties; they were also often relevant to attitudinal problems.


지식, 기술 및 태도 관심사의 조합을 목표로 설계된 개입에 대한 가장 강력한 권고는 [사회적 지원]과 [목표 및 계획] 아래에 제시되었다.
[학습 계획 및 목표 지향] 교정 도구 또는 프로그램은 자기주도학습 이론을 기반으로 하고 학습자의 참여와 동기를 촉진한다(Knowles et al. 2005).
[사회적 지원]과 관련된 개입 유형(동료 또는 교직원 과외 및 멘토링, 튜토리얼 또는 그룹 스터디와 같은 소규모 그룹 학습)은 사회 구성주의와 의료 교육에서 실천 공동체 조성의 중요성에 의해 뒷받침된다.

The strongest recommendations for interventions designed to target a combination of knowledge, skills and attitudinal concerns appeared under Social support and Goals and planning. Learning plans and goal-oriented remediation tools or programs build on self-directed learning theory and promote learner engagement and motivation (Knowles et al. 2005). The types of interventions involving social support (peer or faculty tutoring and mentoring, small group learning such as tutorials or group study) are supported by socio-constructivism and the importance of creating communities of practice in medical education.

지식.
Knowledge

[지식을 형성하는 것]은 약한 권고의 비율이 가장 높은 BCT 그룹이었다. 이러한 유형의 개입은 지식만을 대상으로 하지 않았으며, 대부분은 관련 [기술이나 태도 문제]가 있는 학습자에게 사용된다. 이는 지식 부족만 고립되어 생기는 일은 거의 없다는 사실로 설명될 수 있다(Gerrasio, Garrity 등). 따라서 [지식을 형성]하려는 노력은 보다 포괄적인 기술을 개발하기 위한 다른 개입과 결합함으로써 강화될 수 있다(Schuwirth 2009).
Shaping knowledge 
was the BCT grouping with the highest proportion of weak recommendations. None of these types of interventions was targeted at knowledge only, most being used in learners with associated skills or attitude problems. This might be explained by the fact that knowledge deficits are rarely isolated (Guerrasio, Garrity, et al. 2014). Thus, endeavors to shape knowledge may be enhanced by combining them with other interventions aimed at developing more generic skills (Schuwirth 2009).


지시된 독서, 개인 연구, 교육 세션/컨퍼런스, 과정 확장 및 학습 가이드/과정 노트와 같은 [지식 형성] BCT 그룹 하에서 개입의 유형은 해부학, 생리학 및 약학과 같은 [기초 지식 통합]과 관련이 있는 것으로 보인다.
Types of interventions under the Shaping knowledge BCT grouping such as directed readings, private study, didactic sessions/conferences, course extension, and study guides/course notes seem relevant for fundamental knowledge consolidation such as anatomy, physiology and pharmacology.

[임상적 또는 절차적 지식]도 이러한 개입으로부터 이익을 얻을 수 있지만, 보충 훈련뿐만 아니라 아침 보고서나 다른 의미 있는 학습 활동에 참석함으로써 더욱 풍부해질 수 있다. 검토 과정은 교육 중 주요 시간에 지식의 통합을 지원합니다.

Clinical or procedural knowledge will also benefit from these interventions, but may also be enriched by attendance at morning reports or other meaningful learning activities, as well as supplemental training. Review courses support integration of knowledge at key times during training.

[작업 환경에 대한 지식]은 대부분 지도 실습과 과외의 장점을 가진 사회적 지원에 의존한다.

Knowledge of work setting relies mostly on social support, with the advantages of supervised practice and tutoring.

기술들
Skills

Associations BCT 그룹 아래의 개입 유형은 임상 추론 결손과 같은 [인지 능력 결손]을 관리하는 데 도움이 되었다. 이러한 전략은 최근 AMEE 가이드(Aud affixed et al. 2017)의 많은 권고사항과 일치하며, 학습에 대한 정보 처리 이론 및 기타 인식론적 접근법과도 일치한다(Torre et al. 2006). 백업 커버리지 또는 역할 모델링 또는 반복을 포함하는 다른 전략과 같은 수용도 임상 기술 교정과 관련이 있다. 마지막으로, 학습/시험 능력 부족은 대부분 형성되는 지식 개입과 동료 튜터링 및 지원을 사용하여 관리할 수 있다.
The types of interventions under the Associations BCT grouping were helpful in managing cognitive skills deficits such as clinical reasoning deficits. These strategies are consistent with many recommendations from a recent AMEE guide (Audétat et al. 2017); they are also congruent with information processing theory and other cognitivist approaches to learning (Torre et al. 2006). Accommodations such as back-up coverage or other strategies involving role modeling or repetition are also relevant for clinical skills remediation. Finally, study/test-taking skills deficits can be managed using mostly shaping knowledge interventions and peer tutoring and support.

[대인관계 및 절차적 기술]의 교정은 직접 관찰 또는 비디오 테이프 검토를 통해 얻은 피드백에 의해 촉진된다. 놀랍게도 임상 교육에서 직접 관찰의 중요성을 인식했음에도 불구하고 이러한 유형의 개입은 이 검토에서 두 번만 나타났다(Kogan 등 2017). 또한 교정 개입으로서의 직접 관찰의 영향에 대한 문헌이 부족하다. 실험실, 표준화된 환자 운동 및 시뮬레이션을 통한 반복은 또한 습관 형성을 장려할 것이다. 마지막으로, 의사소통 능력 훈련은 대인관계 능력의 발달에 초점을 맞춘다.
Remediation of interpersonal and procedural skills is facilitated by feedback obtained through direct observation or videotape review. Surprisingly, these types of interventions appeared only twice in this review, despite the recognized importance of direct observation in clinical teaching (Kogan et al. 2017). Furthermore, the literature is scarce about the impact of direct observation as a remediation intervention. Repetition through laboratories, standardized patient exercises and simulation will also encourage habit formation. Finally, communication skills training focuses on the development of interpersonal abilities.


[구조적 기술]에는 연습 관리와 시간 관리가 포함됩니다. 이 난이도 범주와 관련된 개입은 이 검토에서 거의 검색되지 않았다. 이는 리더십/관리 역량의 달성이 훈련 후반에 기대되거나(Lacasse 등 2014), 훈련 중에 우선되지 않기 때문일 수 있다(Quince 등 2014; Gonzalo 등 2016). 그러나 리더십 훈련을 위한 이니셔티브는 개업 의사들에게 인기가 있다(Frich et al. 2015).

Structural skills involve practice management and time management. Few interventions relevant to this category of difficulty were retrieved in this review. This might be because the achievement of leadership/management competencies are expected later in training (Lacasse et al. 2014), or are not prioritized during training (Quince et al. 2014; Gonzalo et al. 2016). Initiatives for leadership training are, however, popular for practising physicians (Frich et al. 2015).

태도
Attitude

동기부여의 부족과 관련된 [개인적인 태도 문제]는 때때로 [직업 선택에 대한 의심]과 관련이 있다. 직업상담사가 개입한 정황이 포착되지 않아 그 영향은 알려지지 않은 것으로 보인다. 그러나 이러한 어려움은 적절한 교수진 지도와 멘토링을 통해 해결할 수 있다(Indyk et al. 2011). 놀랍게도 학습자 정체성 또는 전문적 역할을 대상으로 하는 개입(Cruess 등 2014)이 검색되지 않았으며, 이는 향후 연구에서 탐색하기에 좋은 방법일 수 있다.
Personal attitude problems
 associated with a lack in motivation are sometimes related to doubts about career choice. The impact of interventions involving career advisors do not seem to be known, since no such intervention was retrieved. However, such difficulties can be addressed through appropriate faculty guidance and mentoring (Indyk et al. 2011). Surprisingly, no interventions targeting learner identity or professional role (Cruess et al. 2014) was retrieved, which might be good avenues to explore in future studies.

무례한 행동이나 전문가 간 협업 어려움과 같은 [대인관계 태도 문제]는 지도 연습, 빈번한 피드백 및 학습 계약에 문서화된 예정된 결과를 통해 가장 잘 해결될 수 있다.
Interpersonal attitude
 concerns, such as disrespectful behavior or interprofessional collaboration difficulties, might be addressed best through supervised practice, frequent feedback, and scheduled consequences documented in a learning contract.

대인관계 태도 우려에 대해 식별된 전략은 [전문직업적 문제]에도 사용될 것이다. 그러나 비전문적 행동을 문서화하는 포인트 시스템 또는 특정 간격으로 학교 관계자에 체크인해야 하는 요구 사항(Brokaw 등 2011)과 같은 일부 더 구체적인 유형의 개입을 할 수도 있다.
The strategies identified for interpersonal attitude concerns will also be used for professional issues; however, some more specific types of interventions such as a point system to document unprofessional behavior (Malakoff et al. 2014) or a requirement to check-in at specified intervals with school officials (Brokaw et al. 2011) can also be implemented.

요약하자면, 학업상 어려움을 겪는 의학 학습자를 지원하기 위해서는 우선 가능한 모든 교육적 진단을 파악해야 한다. [환경, 교사 및 학습자 개인의 문제]는 [지식, 기술 또는 태도와 관련된 학문적 어려움]을 설명하지만, 그것을 용서해주지excuse는 않는다. 이 검토는 각 교육 진단에 매핑된 일련의 개입에 대한 이론적 기초에 대한 통찰력과 권고의 강점을 통해 그 사용에 대한 지침을 제공한다.

In summary, supporting medical learners with academic difficulties first involves to identify all possible educational diagnoses. Environment, teacher and learner personal issues explain, but do not excuse academic difficulties involving knowledge, skills or attitudes. This review provides insight about the theoretical bases for a set of interventions mapped to each educational diagnosis, and guidance for their use through strengths of recommendation.

제한 사항 검토
Review limitations

이 검토에는 몇 가지 제한이 있습니다. 단일 전략을 평가한 연구가 거의 없어 학업상 어려움을 겪고 있는 학습자에 대한 개별 개입의 효과를 보고하기는 어렵다. 많은 논문이 다중 성분 개입을 평가했기 때문에 어떤 성분이 개별적으로 효과적인지 알기 어렵다. 이러한 경우에는 일부 개입에 대한 후광효과가 있다. 예를 들어, 환경 재구성(예: 환경 재구성)을 포함하는 BCT의 강력한 권고사항 수가 가장 많다. 추가 연구는 무엇이 정확히 효과적인지 더 잘 이해하기 위해 개입을 격리하려고 노력해야 한다.
This review has some limitations. It is difficult to report on the effectiveness of individual interventions for learners experiencing academic difficulties since few studies evaluated a single strategy. Many articles assessed multi-component interventions, therefore making it difficult to know which components are individually effective. In such cases, there is a halo effect for some interventions – for example, the BCT involving environment restructuration (antecedents) has the highest number of strong recommendations; however, most of the types of interventions in this category come from the same multi-component study. Further studies should try to isolate interventions to get a better understanding of what exactly is effective.

둘째, 커크패트릭의 모델을 평가 프레임워크로 선택한 것에 대한 비판이 제기되었다. 문제는 불완전성(개별 또는 문맥적 요인을 고려하지 않음), 인과관계 가정, 그리고 결과 수준이 상승함에 따라 정보의 중요성이 증가한다는 가정에 대해 보고되었다(Bates 2004). Yardley와 Dornan(2012)은 다음과 같이 보고했다.

Second, the choice of Kirkpatrick’s model as an evaluation framework has been criticized. Issues have been reported around its incompleteness (not considering individual or contextual factors), the assumption of causality, and the assumption of increasing importance of information as the levels of outcomes are ascended (Bates 2004). Yardley and Dornan (2012) reported that:

빠르게 나타나고 고전적인 실험 설계 내에서 쉽게 관찰되는 [비교적 단순한 훈련 개입]을 평가할 때 [Kirkpatrick] 수준은 학습자(특히 환자) 이외의 중요한 수혜자에게 주의를 돌릴 수 있지만 […] 복잡한 교육 개입에는 적합하지 않다.왜냐하면, 가장 중요한 결과는 장기적으로만 확인가능하고, 프로세스 평가가 […] 결과 평가만큼 중요하기 때문이다.
when evaluating relatively simple training interventions, the outcomes of which emerge rapidly and are easily observed within classical experiment designs, the [Kirkpatrick] levels can direct attention to important beneficiaries other than learners (notably patients) […], however they are […] unsuitable for […] education interventions which are complex, in which the most important outcomes are longer-term, and in which process evaluation is as important as […] outcome evaluation.

그것이 우리가 또한 결과 평가의 범위를 넘어 프로그램 평가를 고려하는 스터플빔(2003)의 CIP 모델(컨텍스트/입력/프로세스/제품)을 사용하여 데이터를 추출한 이유이다. 이를 통해 학업상 어려움을 겪는 학습자에게 필요한 사항, 자원 및 개입의 구현에 대한 흥미로운 통찰력을 제공했다.
That is why we also extracted data using Stufflebeam’s (2003) CIPP model (context/input/process/product), which considers program evaluation beyond the scope of outcomes assessment. This provided interesting insight about needs, resources and implementation of interventions for learners with academic difficulties.


무작위 검토자 짝 사이에서 평가자 간 일치도가 낮았다. 복수의 무작위 검토자 쌍을 사용하면 처음에는 데이터 추출 클러스터가 감소하여 검토자 효과에 대한 통제(잠재적 편향)가 감소하는 것으로 생각되었다. 그러나 이는 아마도 각 검토자의 전문지식이 다양하고 많은 검토자 간에 합의에 도달하는 것이 더 낮았기 때문에 평가자 간 합의를 낮출 수 있었다. 도전적인 현재 검토에서 이 문제를 극복하기 위해 코딩의 불일치를 제3의 검토자(ML 또는 CS)에게 제출하여 최종 결정을 내렸다. 또한 중재 전략의 효율성을 위한 코드화는 평가자 간 합의가 우수한 고유한 검토자 쌍(ML, CS)에 의해 수행되었다.

Inter-rater agreement was poor between reviewer random pairs. The use of multiple random pairs of reviewers was initially thought to reduce clusters of data extraction and therefore control for reviewer’s effect (potential bias); however, this might have led to lower inter-rater agreement, probably because the expertise of each reviewer varied and that reaching consensus between high numbers of reviewers is challenging. To overcome this issue for the current review, discrepancies in coding were submitted to a third reviewer (ML or CS) for final decision. Additionally, codification for effectiveness of intervention strategy was performed by a unique pair of reviewers (ML, CS), where the inter-rater agreement was excellent.

방법론적 품질에 대한 ICC도 좋지 않았다. 두 가지 요인이 평가자 간 신뢰도를 방해했을 수 있습니다. 먼저 MMAT는 두 개의 전형 문항으로 시작하므로 제시된 두 가지 기준 중 한 가지가 충족되지 않으면 나머지 문항은 기각되고 점수는 0%가 된다. 이러한 맥락에서 심사자 중 한 명이 심사 기준이 충족되었다고 간주하고 다른 한 명은 그렇지 않거나 확신하지 못하는 경우 점수 귀속에서 상당한 차이를 초래했을 수 있다. 둘째, 임상의와 연구원의 검토자들은 다양한 방법론적 배경을 가지고 있었다. 일부 방법론적 문제에 대한 다양한 의견을 극복하기 위해 방법론적 배경이 강한 검토자(CS) 중 한 명이 최종 MMAT 점수를 수정했다.
Intra-class correlation was poor for methodological quality. Two factors may have hindered inter-rater reliability. First, since the MMAT starts with two screening questions, if one of the two criteria presented is not met, the other questions are dismissed and the score is 0%. In this context, when one reviewer considered the screening criteria met and the other did not or was unsure about it, it may have led to substantial differences in scores attribution. Second, clinician and researcher reviewers had diverse methodological backgrounds. To overcome divergent opinions on some methodological questions, one of the reviewers (CS) with strong methodological background revised the final MMAT scoring.

결론
Conclusion

실천에 미치는 영향
Implications for practice


이 리뷰는 학업상 어려움을 겪는 학부 및 대학원 의학 학습자를 지원하기 위해 가장 효과적인 문헌 기반 개입을 장려하고, 프로그램 평가 격차를 파악하여 해당 분야의 추가적인 교육 연구를 촉진한다. 임상 교사 및 교육자에게 평가, 멘토링 및 교수진 개발 목적으로 사용할 문헌 기반 개입의 레퍼토리를 제공합니다. 다양한 BCT에 따라 제안된 분류는 임상 교사 및 교육자가 각 개입에 대한 이론적 기초를 더 잘 이해하고, 따라서 이들의 구현을 용이하게 하기 위한 것이다. 마지막으로, 의사가 유능하고 안전한 환자 진료를 제공하도록 훈련하는 것을 목표로 현재의 교육 프레임워크와 전략에 맞는 가장 효과적인 학습자 개입을 선택하는 데 도움이 될 것이다.

This review encourages the use of the most effective literature-based interventions to support undergraduate and postgraduate medical learners with academic difficulties, and helps identification of program evaluation gaps to stimulate further educational scholarship and research in the field. It provides clinical teachers and educators with a repertoire of literature-based interventions to use for assessment, mentoring and faculty development purposes. The proposed classification under various BCTs is intended to help clinical teachers and educators to better understand the theoretical bases for each intervention, and therefore facilitate their implementation. Finally, it will help them choose the most effective interventions for learners in difficulty that are aligned with current educational frameworks and strategies, with the objective of training physicians to be competent and provide safe patient care.

연구에 미치는 영향
Implications for research

학문적 어려움을 겪고 있는 학습자를 위한 개입의 추가 개발은 복잡한 행동 변화 개입과 관련 이론의 근본적인 내용을 더 잘 이해하고 혁신적인 전략에 유망할 수 있는 미개척 BCT를 테스트하기 위해 효과적인 BCT를 기반으로 구축되어야 합니다. 장학금 노력도 철저한 프로그램 평가의 중요성을 강화해 추천의 강점을 계산할 수 있는 데이터를 늘려야 한다. 또한 추가적인 연구는 구체적인 환경 개입과 교수진 개발 노력에 대해 조사하고 학업상 어려움을 겪는 학습자에게 미치는 영향을 평가해야 합니다.

Further development of interventions for learners experiencing academic difficulties should build upon effective BCTs to understand better the underlying content of complex behavior change interventions and the associated theories, and test the unexplored BCTs which might be promising for innovative strategies. Scholarship efforts should also reinforce the importance of thorough program evaluation to increase data allowing us to compute the strengths of recommendations. Further research should also look into specific environmental interventions and faculty development efforts and assess their impact on learners with academic difficulties.


Med Teach. 2019 Sep;41(9):981-1001.

 doi: 10.1080/0142159X.2019.1596239. Epub 2019 May 12.

Interventions for undergraduate and postgraduate medical learners with academic difficulties: A BEME systematic review: BEME Guide No. 56

Affiliations collapse

Affiliations

1Department of Family Medicine and Emergency Medicine, Université Laval , Quebec City , Canada.

2Department of Family Medicine and Emergency Medicine, Université de Montréal , Montreal , Canada.

3Family Medicine Unit (UIGP), University of Geneva , Geneva , Switzerland.

4Department of Family and Emergency Medicine, Université de Sherbrooke , Sherbrooke , Canada.

5Library, Université Laval , Quebec City , Canada.

6Department of Medicine, Université Laval , Quebec City , Canada.

7Department of Education, Université Laval , Quebec City , Canada.

8Department of Family and Community Medicine, University of Toronto , Toronto , Canada.

9Unit of Development and Research (UDREM), University of Geneva , Geneva , Switzerland.

10Canadian Medical Protective Association , Ottawa , Canada.

11Department of Medicine, University Hospitals , Geneva , Switzerland.

12Institute of Health Sciences Education, Faculty of Medicine, McGill University , Montreal , Canada.

PMID: 31081426

DOI: 10.1080/0142159X.2019.1596239

Abstract

Background: Clinical teachers often struggle to report unsatisfactory trainee performance, partly because of a lack of evidence-based remediation options. Objectives: To identify interventions for undergraduate (UG) and postgraduate (PG) medical learners experiencing academic difficulties, link them to a theory-based framework and provide literature-based recommendations around their use. Methods: This systematic review searched MEDLINE, CINAHL, EMBASE, ERIC, Education Source and PsycINFO (1990-2016) combining these concepts: medical education, professional competence/difficulty and educational support. Original research/innovation reports describing intervention(s) for UG/PG medical learners with academic difficulties were included. Data extraction employed Michie's Behavior Change Techniques (BCT) Taxonomy and program evaluation models from Stufflebeam and Kirkpatrick. Quality appraisal used the Mixed Methods Appraisal Tool (MMAT). The authors synthesized extracted evidence by adapting the GRADE approach to formulate recommendations. Results: Sixty-eight articles met the inclusion criteria, most commonly addressing knowledge (66.2%), skills (53.9%) and attitudinal problems (26.2%), or learner personal issues (41.5%). The most common BCTs were Shaping knowledge, Feedback/monitoring, and Repetition/substitution. Quality appraisal was variable (MMAT 0-100%). A thematic content analysis identified 109 interventions (UG: n = 84, PG: n = 58), providing 24 strong, 48 moderate, 26 weak and 11 very weak recommendations. Conclusion: This review provides a repertoire of literature-based interventions for teaching/learning, faculty development, and research purposes.

용어의 공통된 이해를 통해 보건의료전문직교육의 과학을 발전시키기: "패컬티"라는 단어의 내용분석(Perspect Med Educ, 2022)
Advancing the science of health professions education through a shared understanding of terminology: a content analysis of terms for “faculty”
Pim W. Teunissen · Anique Atherley · Jennifer J. Cleland · Eric Holmboe · Wendy C. Y. Hu · Steven J. Durning · Hiroshi Nishigori · Dujeepa D. Samarasekera · Lambert Schuwirth · Susan van Schalkwyk · Lauren A. Maggio 

 

 

소개
Introduction

용어 및 개념의 정의적 명확성이 없다면, 보건 전문직 교육(HPE) 분야의 연구자와 교육자는 오해를 초래할 위험이 있으며, 분야의 진척을 늦추고, 새로운 연구자들이 학문적 대화에 참여할 가능성을 제한한다[1]. 2021년에도 이 경고는 여전히 울려 퍼진다. 용어의 명확성 또는 공유된 이해는 HPE 전반에 걸쳐 여전히 모호하다. 예를 들어, HPE 저자들은 출판된 문헌[2, 3] 내에서 주요 개념(예: 교수 도구, 역량 기반 의료 교육)을 정의하는 가변성과 연구 팀 내에서조차 정의적 차이를 발표했다. 이 저자들은 또한 이러한 합의 부족이 의사소통의 오류에 기여하고, 주제에 대한 suboptimal한 연구를 이끌며, 이전 연구를 기반으로 하는 연구자들의 능력을 복잡하게 만들 수 있다고 강조했다. 우리의 다양한 작가 팀 내에서, 우리는 비슷한 깨달음에 도달했습니다.

Without definitional clarity of terms and concepts, researchers and educators in health professions education (HPE) research risk misunderstandings, slow the progress of the field, and limit the possibility for newcomers to engage in scholarly conversations [1]. In 2021, this warning still resonates. Clarity or a shared understanding of terminology remains elusive across HPE. For example, HPE authors have published on variability in defining key concepts (e.g., teaching tools, competency-based medical education) within the published literature [2, 3] and definitional differences even within research teams [2,3,4]. These authors also highlighted that this lack of agreement can contribute to miscommunication, lead to suboptimal research on a topic, and complicate the researchers’ ability to build on previous research. Within our diverse author team, we arrived at a similar realization.

우리의 정의적 부조화에 대한 관찰은 특정한 주제에서 비롯된 것이 아니라, 오히려 건강 전문가와 HPE 연구를 수행하는 사람들을 설명하는 데 사용되는 여러 용어와 관련이 있다. 우리의 대화는 이것이 많은 주제와 개념에 걸쳐 퍼지는 오해를 만들고 복제한다는 것을 나타내었다. 예를 들어, faculty으로 통용될 수 있는 용어와 관련하여, 우리의 유럽 작가들은 "주치의attending physician"라는 용어에 익숙하지 않은 반면, 북미에 있는 우리 중 일부는 "specialist registrar"이라는 용어에 익숙하지 않았다. 따라서 본 연구는 본 연구의 목적을 위해 [보건전문직 학습자의 교육에 기여하기 위한 교육, 평가, 멘토링, 지도와 같은 활동에 참여하는 사람(또는 사람 그룹)]으로 정의한 다양한 faculty 용어를 조사한다.
Our observation of definitional disharmony stemmed not from a particular topic, but rather related to the multiple terms that are used to describe people engaged in training health professionals and those conducting HPE research. Our conversations indicated that this creates and replicates misunderstandings that ripple across many topics and concepts. For example, regarding terms related to what may be colloquially known as faculty, our European authors were unfamiliar with the term “attending physician”, whereas those of us in North America were unfamiliar with the term “specialist registrar”. Thus, this current study investigates varieties of faculty terminology, which we defined for the purposes of this study as a person (or group of people) who engage in activities, such as teaching, assessment, mentoring, and/or supervision, intended to contribute to the education of learners in the health professions.

Faculty가 이것에 대한 일반적인 이름이지만, 같은 (개인의) 집단을 묘사하기 위해 임상 감독관, 교사, 교관, 주치의 또는 임상 직원과 같은 다른 용어들을 생각해 내는 것은 상상력이 거의 필요하지 않다.

  • 그 결과, 학부 의료 프로그램의 '직장 기반 교수자'에 대한 연구와 '주치의'에 대한 또 다른 연구는 마치 서로 다른 그룹을 연구한 것처럼 보일 수 있다. 그러나, 다른 용어를 사용함에도 불구하고, 모집단 서술에 대해 세심히 살펴보면, 대학 프로그램의 직장 기반 교사들이 부속 병원의 주치의와 같다는 것을 알 수 있다.
  • 반대로, 두 개의 teach-the-teacher에 초점을 맞춘 연구가 관련이 있는 것처럼 보일 수 있다. 그러나, 더 면밀한 조사를 통해 한 연구는 생물의학 과학자들에게 초점을 맞춘 반면, 다른 연구는 간호사들을 연구했음을 알 수 있다. 

While faculty is a common name for this, it takes little imagination to come up with other terms—clinical supervisor, teacher, preceptor, attending physician, or clinical staff—to describe the same (groups of) individuals.

  • As a result, a study on workplace-based teachers in an undergraduate medical program and another study on attending physicians might appear to study different groups, and yet, despite using different terms, a careful examination of the population description might reveal workplace-based teachers in an undergraduate program to be attending physicians at an affiliated hospital.
  • Alternatively, two studies focusing on teach-the-teacher programs might seem related. However, closer inspection could show faculty in one study focused on biomedical scientists while another examined nurse practitioners. 

우리 분야에서 [연구 참여자들의 다양성]이, [연구 참여자 풀을 설명하는 데 필요한 명확한 지침의 부족]과 결합되어, 기존 연구를 기반으로 축적해가는 우리의 능력을 저해하고, 연구 정보에 입각한 이론의 발전에 대한 기여를 저해하고, 최적의 교육적 실천의 제공을 저해한다.

Our field’s diversity of research participants, combined with a lack of clear guidance on what is helpful in describing one’s research participant pool, inhibits our ability to build on previous work, contribute to the development of research-informed theory, and provide optimal educational practice.

이 연구에서 우리는 세 가지 목표를 가지고 있다:

  • 1) 생물의학 문헌(HPE 논문 포함)에서 "faculty"을 설명하기 위해 사용되는 용어를 분석하고 보고한다.
  • 2) 과학 출판물에 자신의 연구 참가자를 설명할 때 연구자와 교육이 포함해야 하는 주요 측면에 대한 지침을 템플릿 형식으로 제공한다.
  • 3) HPE의 다른 주요 용어를 탐색하는 데 사용할 수 있는 반복 가능한 연구 방법을 제공한다(예: 우리가 구어적으로 의대생 및 레지던트라고 부르는 사람들을 풀어주는 것).


In this study, we have three aims:

  • 1) to analyze and report the terminology used to describe “faculty” throughout the biomedical literature (including HPE papers),
  • 2) to offer guidance on key aspects, in template form, that researchers and educations should include when describing one’s research participants in scientific publications, and
  • 3) to provide a replicable study method that can be utilized to explore other key terms in HPE (e.g., to unpack those who we colloquially call medical students and residents).

 

방법들
Methods

우리는 교수진이라고 불리는 개인 또는 집단의 사람들을 묘사하는 데 사용되는 특정 단어의 존재를 식별하기 위해 저널 기사 초록의 내용 분석을 수행했다.
We conducted a content analysis of journal article abstracts to identify the presence of specific words used to describe individuals or groups of people referred to as faculty.

"faculty"이라는 용어에 대한 다양한 지리적, 문화적 관점을 제공하기 위해 다양한 배경을 가진 글로벌 작가 팀을 구성하였습니다. 작가들의 다양한 지리적 위치 때문에 팀은 2018년과 2019년 유럽 의학 교육자 협회(AMEE) 연례 회의에서 직접 만나 원격 회의 소프트웨어를 통해 팀 미팅을 개최하여 프로젝트에 대한 업데이트를 제공하고 데이터의 코딩 및 분석에 대한 피드백을 받았다.
To provide a variety of geographical and cultural perspectives on the term “faculty”, we assembled a global author team with diverse backgrounds (for the distribution of the research team see Fig. S1 in Electronic Supplementary Material [ESM]). Due to authors’ diverse geographical locations, the team met in-person in 2018 and 2019 at the annual meeting of the Association of Medical Educators of Europe (AMEE) and held team meetings via teleconferencing software to provide updates on the project and receive feedback on the coding and analysis of the data.

2018년 9월 11일 PubMed에서 2007년과 2017년 사이에 출판된 의학 주제 제목(MeSH)에서 “faculty, dental”, “faculty, medical”, “faculty, nursing”, and “faculty, pharmacy” 을 포함한 좀 더 구체적인 MeSH 용어를 색인화한 기사를 검색하였다(부록 전자 참조). 국립 의학 도서관은 교수진을 "중등교육기관에서 학문적 지위를 가진 교육 및 행정 직원"으로 정의한다[5]. 우리는 검색에서 다양한 논문을 제공하지만 전문 인덱서가 "faculty"에 대해 결정한 MeSH 용어를 사용하기로 결정했다. 우리는 이 검색이 연구 교수진 또는 우리의 목표와 관련된 참가자를 언급한 모든 논문의 완전한 개요를 제공하는 것은 아니라는 것을 인정한다. 우리는 글로벌 관점을 포착하기 위해 언어를 기반으로 검색을 제한하지 않았지만, 데이터에 있는 용어가 최신인지 확인하기 위해 지난 10년으로 검색 범위를 제한했다. 향후 연구자들이 데이터베이스 액세스 우려 없이 우리의 방법을 복제할 수 있도록 무료 데이터베이스인 PubMed를 유일한 데이터베이스로 활용했다. 또한 단일의 일관된 엔티티(즉, 국립 의학 도서관)에서 생성된 MeSH 인덱싱의 일관성을 활용하기 위해 PubMed에만 초점을 맞췄다.

We searched PubMed on September 11, 2018, for articles published between 2007 and 2017 that were indexed with the Medical Subject Heading (MeSH) “faculty” and related, more specific MeSH terms including “faculty, dental”, “faculty, medical”, “faculty, nursing”, and “faculty, pharmacy” (see the Appendix in the Electronic Supplementary Material [ESM] for our search strategy). The National Library of Medicine defines faculty as “teaching and administrative staff having academic rank in a post-secondary educational institution” [5]. We decided to use MeSH terms that would provide a wide variation of papers from our search, but that were determined by professional indexers to be about “faculty”. We acknowledge that this search does not provide a complete overview of all papers that research faculty or that mentioned participants that are relevant to our aims. We did not limit our search based on language to ensure we captured global perspectives but did restrain it to the last decade to ensure that the terminology in our data was recent. We utilized PubMed, a freely available database, as our only database to enable future researchers to replicate our method without database access concerns. Additionally, we focused solely on PubMed, in order to take advantage of the consistency of MeSH indexing, which is generated from a single, consistent entity (i.e., the National Library of Medicine).

검색에서 검색된 인용문을 첨부한 메타데이터와 함께 엑셀에 다운받아 데이터 관리를 하였습니다. 메타데이터는 추상적인 텍스트(모두 영어로 되어 있음), 출판 연도, 저널, 언어, 제1저자의 위치를 포함했다. LM은 모든 제목과 초록을 선별하여 초록이 없는 인용과 faculty에 대한 역사적 서술은 제외했다.
We downloaded the citations retrieved from our search with the accompanying metadata into Excel for data management. Metadata included the abstract text (all of which is in English), publication year, journal, language, and the first author’s location. LM screened all titles and abstracts to exclude citations without abstracts and those that were historical descriptions of faculty members.

검색 결과 5,436건의 인용문이 검색됐으며, 이 중 초록이 없거나 역사적 성격의 문헌 2,082건을 제외했다. 따라서 최종 샘플에는 3,354건의 인용이 포함되어 있었습니다. 우리는 추상적인 텍스트에 초점을 맞춘 반복적인 데이터 추출 접근법을 취했다. 우선, PT와 LM은 초기 초록 검토와 토론에 따라 교수진을 위한 광범위한 작업 정의를 고안했습니다. PT와 LM은 무작위로 선정된 35개의 인용문의 추상적인 텍스트를 조사했고 각 추상 용어와 교수진을 언급한 간략한 설명에서 추출했다. 그들은 그들의 발견에 대해 토론했다. 이 예비 데이터 추출을 기반으로, 우리는 추상화에서 "faculty" 용어를 추출하는 팀의 프로세스를 안내하기 위해 초기 작업 정의를 개발했습니다. PT와 LM은 faculty를 "다른 사람이나 집단의 발전에 영향을 미치는 어떤 종류의 활동에 참여하는 사람 또는 집단"으로 정의했다. 이 작업 정의를 사용하여 7명의 프로젝트 팀 구성원(PT, LM, AA, SD, WH, JC, SvS)은 무작위로 선정된 144개의 고유한 초록으로부터 독립적으로 faculty 용어를 추출했습니다. 또한 데이터 추출을 교정하기 위해 팀원들은 동일한 초록 중 10개를 조사하여 총 154개의 초록에서 데이터를 추출했다.

The search retrieved 5,436 citations, of which we excluded 2,082 articles that did not include abstracts or were of a historical nature. Thus, our final sample included 3,354 citations. We took an iterative data extraction approach, which focused on the abstract text. To begin, PT and LM devised a broad working definition for faculty following an initial abstract review and discussion. PT and LM examined the abstract text of 35 randomly selected citations and extracted from each abstract terms and brief descriptions that referred to faculty. They discussed their findings. Based on this preliminary data extraction, we developed an initial working definition to guide our teams’ process of then extracting “faculty” terms from the abstracts. PT and LM defined faculty as: “a person or group of people who engage in some sort of activity that is intended to impact the development of another person or group”. Using this working definition, seven project team members (PT, LM, AA, SD, WH, JC, SvS) independently extracted faculty terms from 144 randomly selected, unique abstracts. Additionally, to calibrate our data extraction, team members examined 10 of the same abstracts, resulting in data extracted from a total of 154 abstracts.

PT, LM, AA는 컨퍼런스 콜을 통해 만나 그룹 용어 추출 결과와 실무 지침에 대한 피드백을 논의하였습니다. PT, LM, 그리고 AA는 개별적으로 중간 해석을 개발하고 논의했습니다. 다음으로, 모든 팀원들은 이 개정된 지침(예: 개인사를 기술하는 논문이나 조직단위를 교수진으로 기술하는 논문 등)을 사용하여 용어를 추출하도록 다시 요청받았다. 10명의 프로젝트 팀 구성원(PT, LM, AA, SD, JC, LS, HN, DS, EH 및 SvS)과 1명의 다른 사람(SvS와 함께 일하는 연구 보조)은 무작위로 선정된 40개의 고유한 초록으로부터 독립적으로 용어를 추출하여 440개의 코드화된 초록을 만들었다. 따라서 이전의 노력과 결합하여, 저자들은 이제 594개의 초록으로부터 faculty에 대한 279개의 고유한 용어를 추출했는데, 이는 표본의 총 추상 수(n = 3,354)의 17.7%에 해당한다. 최종 코딩 라운드가 작업 범주와 분석 출력에 큰 변화를 주지 않았다는 것을 알았기 때문에 우리는 여기서 멈췄다. 우리는 106개의 초록을 "null"(17.8%)로 식별했다.
PT, LM, and AA met via conference call to discuss the results of the group’s term extraction and feedback on the working guideline. PT, LM, and AA individually developed and then discussed interim interpretations. Next, all team members were again invited to extract terms using these revised guidelines (e.g., code abstract as “null” if it should be excluded with an explanation, such as: a paper describing a personal history or one describing an organizational unit as faculty [no research participants]). Ten project team members (PT, LM, AA, SD, JC, LS, HN, DS, EH, and SvS) and one other person (a research assistant working with SvS) independently extracted terms from 40 randomly selected, unique abstracts resulting in 440 coded abstracts. Thus, in combination with earlier efforts, the authors had now extracted 279 unique terms for faculty from 594 abstracts, which represented 17.7% of the total number of abstracts in our sample (n = 3,354). We stopped at this point as we noticed that the final coding round did not yield any major alterations in our working categories and analysis output. We identified 106 abstracts as “null” (17.8%).

Google Sheet를 사용하여 기술 통계의 계산을 포함하여 분석을 구성하고 용이하게 했습니다. 우리는 각 초록을 제1저자의 위치를 분류하기 위해 지리적 영역에 할당했습니다.
We used Google Sheet to organize and facilitate the analysis, including the calculation of descriptive statistics. We assigned each abstract to a geographical region to categorize the first authors’ location.

우리는 내용 분석을 사용하여 추출된 용어의 패턴과 테마를 식별했다. 내용 분석을 다음과 같이 설명된다: "질적 데이터를 환원하여 의미를 만들려는 노력으로서, 많은 질적 자료가 소요되며, 핵심 일관성 및 의미를 식별하려고 시도한다." 우선, PT, AA, 그리고 LM은 패턴이나 테마를 식별하기 위해 추출된 모든 용어를 독립적으로 여러 번 읽는다. 그 후 예비 테마는 세 번의 전화 회의 통화에서 집합적으로 논의되었고, 이는 용어 구성을 위한 작업 프레임워크로 이어졌다. PT는 콘퍼런스 콜과 국제 콘퍼런스에서 직접 미팅을 통해 작성자 팀에 이 프레임워크를 제시하여 작성자 팀의 데이터 추출 경험과 문화적 관점에 반영되도록 하였다. 별다른 변화는 필요하지 않았다.

We used content analysis to identify patterns and themes in the extracted terms. Content analysis is described as a “qualitative data reduction and sense making effort that takes a volume of qualitative material and attempts to identify core consistencies and meanings” [6, p. 541]. To start, PT, AA, and LM independently read all extracted terms multiple times to identify patterns or themes. Preliminary themes were then discussed collectively in three teleconference calls, which resulted in a working framework for organizing the terms. PT presented this framework to the author team via conference call and an in-person meeting at an international conference to ensure that the framework resonated with the author team’s experience of data extraction and their cultural perspectives. No significant changes were necessary.

결과.
Results

요약본은 처음에 추출된 3,354개의 기사에서 93개국 중 54개국을 대표하는 제1저자에 의해 작성되었다. 우리 표본의 기사는 주로 영어로 작성되었으며(90.9%) 260개 저널에 게재되었다. 코드화된 594개의 초록 중 대다수(n = 346)는 북미에 기반을 둔 제1저자(58.25%)에 의해 출판되었으며(전자 보충 자료 [ESM]의 표 S1 참조), 그 중 305개는 미국과 캐나다에 있었다(n = 41).
Abstracts were written by first authors representing 54 of 93 countries in the 3,354 articles initially extracted. The articles in our sample were predominantly written in English (90.9%) and published in 260 journals. Of the 594 abstracts coded, the majority (n = 346) were published by first authors based in North America (58.25%) (see Table S1 in Electronic Supplementary Material [ESM]), of which 305 were located in the United States and Canada (n = 41).

저자들은 279개의 독특한 용어를 사용하여 594개의 초록에서 총 954번 코딩된 "faculty"를 기술했다. 이 954명 중 가장 많이 사용되는 용어는 교수 또는 교수 구성원을 포함했다(n = 252; 26.4%). 표 1을 참조하십시오. 예를 들어, 한 연구는 "카라치의 의대생과 사립 및 공립 의대 교수진의 표절에 대한 지식과 인식을 평가하기 위한 것"으로 그 목적을 설명했다. 또한 교수진 또는 교수진/s는 71번 코딩되었다(예: [임상] 교수진). 교수진(교직원 포함)과 교수진(교직원 포함)은 전체 코드의 33.8%를 차지한다. 교사/s(n = 59; 6.2%)와 의료 교육자/s(n = 26; 2.7%)에 대한 코드가 잘 표현되어 모든 코드의 거의 10%를 차지했다.
Authors described “faculty” using 279 unique terms coded a total of 954 times in the 594 abstracts. Of these 954, the most frequently used terms included faculty or faculty member/s (n = 252; 26.4%); see Tab. 1. For example, one study described its purpose as: “To assess knowledge and perceptions of plagiarism in medical students and faculty of private and public medical colleges in Karachi” [7, underlining added]. Additionally, [adjective] faculty or faculty member/s was coded 71 times (e.g., [clinical] faculty). Together, faculty (including faculty member/s) and [adjective] faculty (including faculty member/s) accounted for 33.8% of all codes. Codes for teacher/s (n = 59; 6.2%) and medical educator/s (n = 26; 2.7%) were well represented, accounting for almost 10% of all codes.

전체 표본과 유사하게, 우리는 [지리적 영역]에 걸쳐 저자들이 사용한 용어의 일정 수준 변화를 관찰했다(ESM의 부록 참조). 예를 들어, 유럽과 중앙아시아, 중남미, 카리브해에서 사용되는 최고 용어는 "교사"였다. 특히 사하라 이남 아프리카에서는 10개의 용어가 모두 한 번씩 추상적으로 코딩되어 상위 용어를 결정할 수 없었습니다.
Similar to the overall sample, we observed some level of variation in the terms used by authors across geographical regions (see Appendix in ESM). For example, the top term used in Europe & Central Asia and Latin America and the Caribbean was “teachers”, whereas, in all other regions, the top term was faculty/faculty members. Notably, we could not determine top terms in sub-Saharan Africa as all ten terms were coded once in abstracts from that region.

44%의 초록은 한 개 이상의 용어를 사용하는 연구 집단을 언급했습니다. 예를 들어, 한 초록은 참가자들의 교수와 학습 개념을 이해하기 위한 연구를 묘사하고 참가자들을 "의료 교사", "교사", "교직원"으로 분류했다. 평균적으로 각 초록에는 1.74개의 단어로 코딩되었으며, 단일 초록에는 1~6개의 단어로 구성되었다. 특히, 우리는 같은 주제에 관한 출판물에서도 저자들이 교수 모집단을 설명하기 위해 다른 용어를 사용했다는 것을 관찰했다. 예를 들어 전문직업성에 초점을 맞춘 세 가지 초록에서 의료 교사[8], 의사[9], 교수진[10]의 사용을 관찰했다.
Forty-four percent of abstracts referred to the study population using more than one term. For example, one abstract described a study to understand participants’ conceptions of teaching and learning and labeled the participants as “medical teachers”, “teachers”, and “faculty”. On average, each abstract was coded with 1.74 terms related to faculty with a range of 1–6 terms for any single abstract. Notably, we observed that even in publications on the same topic, authors used different terms to describe faculty populations. For example, in three abstracts focused on professionalism we observed the use of: medical teachers [8], physicians [9], and faculty [10].

우리는 초록과 식별된 용어에 대한 내용 분석을 바탕으로 저자들이 역할 유형에 따라 교수진을 언급하는 것을 관찰했습니다. 우리는 네 가지 역할을 식별했다

  • 건강관리에서의 역할(예: 의사, 의사),
  • 교육에서의 역할(예: 교육자, 교사),
  • 학계에서의 역할(예: 교수, 교수) 또는
  • 학습자와의 관계에서의 역할(예: 멘토, 감독자).

ESM의 S2 및 추출된 모든 용어 목록은 ESM의 부록을 참조하십시오.

Based on our content analysis of the abstracts and identified terms, we observed that authors referred to faculty based on role types. We identified four types of roles: roles in healthcare (e.g., doctor, physician), roles in education (e.g., educator, teacher), roles in academia (e.g., faculty member, professor), or roles in relationship to the learner (e.g., mentor, supervisor); see Fig. S2 in ESM and, for a list of all terms extracted, see the Appendix in ESM.

교직원을 설명하기 위해 여러 용어를 사용하는 것 외에도, 하나의 추상화에서 역할 범주를 가로지르는 용어가 포함된 사례를 확인했습니다. 예를 들어, 어떤 초록은 다음과 같이 읽힌다. "… 독일 괴팅겐 의과대학의 의학 교수에 관련된 의사들이 임상 교사의 교육 능력에 대한 그들의 견해를 다루는 온라인 설문조사를 완료하도록 초대되었다. 또한 교육학적 교육에 참여하려는 의사의 동기가 평가되었다. [11, 밑줄 추가]. 이 예제는 의료와 교육 모두에서 참여자의 역할을 설명하는 용어를 사용하여 학습자에게 지식이나 기술을 전달하는 동일한 그룹의 개인의 이름을 지정합니다.
In addition to using multiple terms to describe faculty, we identified instances in which a single abstract included terms that cut across our role categories. For example, one abstract reads as follows: “… physicians involved in medical teaching at Göttingen Medical School, Germany, were invited to complete an online survey addressing their views on clinical teachers’ educational skills. In addition, physicians’ motivation to engage in pedagogical training was assessed” [11, underlining added]. This example uses terms that describe participants’ roles in both health care and education to name the same group of individuals imparting knowledge or skills to learners.

논의
Discussion

우리는 "다른 사람이나 그룹의 발전에 영향을 주기 위한 어떤 종류의 활동에 참여하는 사람 또는 집단"을 설명하는 데 사용되는 279개의 고유한 용어를 식별했다. 이들은 교수진부터 교사, 트레이너까지 다양했다. 우리는 다양한 용어의 사용이 역할 유형과 관련된 네 가지 범주 중 하나에 매핑될 수 있다는 것에 고무되었다: 의료 역할, 교육 역할, 학계에서의 역할 또는 학습자와의 관계. 우리는 또한 동일한 연구에서 동일한 그룹을 설명할 때 많은 초록들이 둘 이상의 용어 또는 둘 이상의 역할에 대한 참조를 사용한다는 것을 관찰했다.
We identified 279 unique terms used to describe a person or group of people who engage in some sort of activity intended to impact another person or group’s development. These ranged from faculty to teacher to trainer. We were encouraged that the varied use of terms could be mapped to one of four categories related to role type: role in healthcare, role in education, role in academia, or relationship to learner. We also observed that many abstracts used more than one term, or reference to more than one role, when describing the same group in the same study.

우리가 관찰한 높은 수준의 변동은 특정 주제와 관련된 정의적 명확성에 초점을 맞춘 관련 연구의 발견과 일치한다[2, 3]. 예를 들어 CBME의 정의를 연구하는 연구자들은 80개 논문의 표본에서 19개의 정의를 식별했다[2]. 우리의 연구 결과는 또한 HPE scholarship의 역할과 조직 구조를 설명하는 다양한 용어의 문제에 직면한 Varpio와 동료들의 연구와 일치한다[12]. 우리는 가장 자주 사용되는 용어와 관련하여 전 세계 지역 간의 유사성을 보았지만, 우리는 이러한 용어들이 이러한 국가들에서 다른 것을 의미하기 위해 사용될 수 있다는 것을 받아들여야 한다.
The high level of variation we observed aligns with findings of related studies focused on definitional clarity related to specific topics [2, 3]. For example, researchers studying definitions of competency-based medical education identified 19 definitions in a sample of 80 articles [2]. Our findings also align with research by Varpio and colleagues, who encountered a problem of differing terminologies describing HPE scholarship roles and organizational structures [12]. We observed cultural variation in terms used, though we saw similarities across world regions regarding terms used most frequently; one must accept that these terms could be used to mean different things in these countries.

영어가 모국어가 아닌 일부 국가에서는 "faculty"라는 용어가 동일한 개념을 설명하기 위해 다른 방식으로 사용된다. 예를 들어 일본에서는 '시도이'와 '교인'이라는 단어가 'faculty'과 비슷한 의미로 쓰이지만 문화적인 차이로 인해 의미가 다르다. 'faculty'의 정의에 대한 국제 공동 연구가 더 발전하려면 세계 각지에서 동일한 개념을 설명하기 위해 다른 단어를 사용하는지 조사할 필요가 있다.
In some countries where English is not the native language, the term “faculty” is used in a different way to describe the same concept. In Japan, for example, the words “Shidoi” and “Kyoin” are used in a similar sense to “faculty”, but they have different meanings due to cultural differences. If international joint research on the definition of “faculty” is to be further developed, it is necessary to investigate the use of different words to describe the same concept across world regions.

의학 교육의 이론 구축 및 협력에 대한 시사점
Implications for theory building and collaboration in medical education

의사소통에 영향을 미치는 오해는 [문화간 협력 상황에서 관련 개념과 용어에 대한 공유된 이해가 부족하기 때문]일 수 있다[13]. 연구자와 교육자가 다양한 방식으로 용어를 사용할 경우, 이는 오해를 불러일으키고 현장에 대한 진행과 독자/연구자의 참여를 방해한다. 따라서 명확한 용어가 부족하기 때문에 기존 연구를 기반으로 하는 것이 어려워집니다. 이것은 국제 협력을 위협합니다. 국제 연구팀과 HPE를 발전시켜 공동으로 이론을 세울 수 있도록 하려면 다양한 맥락에서 서로 다른 용어가 어떻게 다른 의미를 가질 수 있는지를 이해하는 방법을 찾는 것이 중요하다. 이를 위해 저자는 [협업을 촉진]하고, [HPE 연구자들이 보유한 많은 학문적 전통에서 발생하는 문제를 완화]하기 위해 이론, 추론 및 가치를 더 잘 표현해야 한다[14]. 또한 이론적 프레임워크는 연구에 점점 더 많이 통합되어야 하며, 우리는 더 이전 연구를 기반으로 해야 한다[15]. 이것은 정의적인 명확성 없이는 하기 어렵지만, 한 분야로서 우리는 발전하고 있다. 예를 들어, 학자들은 최근 어떻게 사회 학습 이론이 보건 직업 교육에서 지식을 진보시키고 더 나아가 실천을 안내하기 위한 출발점으로 사용되고 있는지 탐구했다[16]. 이 연구를 통해 우리도 언어를 통한 지식 증진, 실천 지도, 협업 촉진에 대한 이러한 생각들에 기여하고 있습니다. 과정과 결과뿐만 아니라 HPE 연구 내 그룹도 기술하는 공유 언어가 필요합니다.
Misunderstandings affecting communication could be due to a lack of a shared understanding on related concepts and terminology in intercultural collaboration settings [13]. When researchers and educators use terms in varied ways, this potentiates misunderstanding and hampers progress and reader/researcher engagement in the field. Thus, it becomes difficult to build on existing research due to a lack of clear terminology. This threatens international collaborations. If we want to advance HPE with international research teams and enable them to jointly build theory, it is critical that we find ways of understanding how different terms may mean different things in varied contexts. To achieve this, authors need to better articulate theories, reasoning and values to facilitate collaboration and mitigate issues arising from the many academic traditions held by HPE researchers [14]. Further, theoretical frameworks should be increasingly incorporated in research, and we should build more on previous research [15]. This is difficult to do without definitional clarity, but as a field we are making progress. For example, scholars have recently explored how social learning theory has been used as a starting point to advance knowledge and further guide practice in health professions education [16]. With this present study, we too contribute to these thoughts on advancing knowledge, guiding practice, and facilitating collaboration through language. A shared language describing not only processes and outcomes but also the groups within HPE research is necessary.


이론과 관련된 공유 이해를 위해 노력하듯이, teachers과 students를 표현할 때 사용하는 용어들이 글로벌한 이해를 촉진해야 서로의 작품을 정확하게 해석할 수 있다. 서로의 연구 결과를 토대로 관심 있는 현상에 대한 공통된 이해를 발전시키기 위해 종종 무시되는 전제조건은 [누가 유사한 현상을 연구했는지를 인식하는 것]이다. 우리는 이제 독자들에게 어떤 지역에서 통칭적으로 "faculty"로 알려진 사람들을 포함하는 연구 집단을 묘사할 수 있는 템플릿을 제공한다.

Just as we strive for shared understanding related to theories, the terms we use to describe our teachers and students must facilitate global understanding, so we can accurately interpret each other’s work. An often-neglected prerequisite for building on each other’s research findings and developing a shared understanding of phenomena of interest to health professions education is recognizing who has studied similar phenomena. We now offer readers a template to describe a research population that includes people colloquially known as “faculty” in some regions.

템플릿 제안
Template proposal

의학 교육은 다양한 학문적 전통을 따르는 연구자들과 함께 "용광 냄비"로 묘사되어 왔다. 이러한 "냄비"를 문화적, 지역적 변화에 더하면 진정한 공유는 어려울 수 있다. 따라서 HPE에서 교수진 또는 기타 모집단을 설명하는 공유 접근 방식에 더 가까이 다가가기 위해 연구원과 교육자가 faculty-관련 역할을 설명할 때 사용할 수 있는 템플릿(그림 1)을 제시한다. 이 템플릿은 연구 참가자를 설명하기 위해 용어를 사용하는 기존 관행을 유지하며, 이 용어를 더욱 적합하게 만든다(그림 1 참조). 논문 본문뿐만 아니라 초록에서도 연구 참여자들을 기술할 수 있는 구조가 마련되기를 기대한다. 또한, 우리는 이 명확한 설명이 향후 HPE에서 문헌의 협업과 해석에 도움이 될 수 있도록 제안한다. 우리는 연구 참여자가 누구인지, 그들의 역할은 무엇인지, 그리고 그들의 전문성 수준/영역을 명시하는 것이 개인의 해석에 중요하다고 믿는다. 그것은 또한 연구자들이 이전의 연구를 기반으로 하는 것을 용이하게 하여, 특정 분야의 지식의 본체를 성장시킬 것이다. 구어적으로 "faculty"으로 알려진 사람들을 묘사하기 위해 사용될 수 있는 모든 독특한 용어들의 단일 정의는 어려울 것이다. 대신 혼란을 최소화하기 위해 연구 참가자에 대한 명시적인 설명을 제안한다.

Medical education has been described as a “melting pot”, with researchers hailing from a variety of academic traditions [14]. Adding this “pot” to cultural and regional variation, true shared understanding may be difficult. Thus, in an attempt to bring our field closer to a shared approach to describing faculty or other populations in HPE, we present a template (Fig. 1), which we propose researchers and educators can use when describing participants in a faculty-related role. This template maintains the existing practice we saw of using a term to describe research participants and another which further qualifies that term (see Fig. 1). We hope it will provide a structure to describe research participants not only in the body of articles, but also in abstracts. Additionally, we propose this clear description could assist future collaboration and interpretation of literature in HPE. We believe being explicit about who research participants are, what their role is, and their level/area of expertise is crucial to individual interpretation. It will also facilitate researchers building on previous studies, thereby growing the body of knowledge in a particular field. Single definitions of every unique term that can be used to describe those who are colloquially known as “faculty” will be difficult. Instead, we suggest explicit descriptions of research participants to minimize confusion.

 

이 템플릿(그림 1)에 기초하여, 논문의 메소드 섹션에 있는 완성된 예는 다음과 같다.
Based on this template (Fig. 1), a completed example in the methods section of a paper might read as follows:

우리는 서인도 대학 의대 3학년 학생들의 과정 코디네이터로 활동하는 711명의 전임 의사들을 포함했다. 이 의사들은 소아과, 수술, 그리고 의학을 포함한 다양한 전문분야에서 왔다.
We included 711 full-time physicians who act as course coordinators for third year medical students at The University of The West Indies. These physicians are from varied specialties including paediatrics, surgery, and medicine.

전체 템플릿을 사용하는 것이 항상 가능하거나 실용적이지는 않을 수 있으며 특정 요구에 맞게 조정할 수 있습니다. 예를 들어, 초록에서는 예제의 첫 번째 문장만 사용하고 메소드 섹션에 대한 자세한 내용을 남길 수 있습니다. 연구 참여자들은 또한 연구 질문의 보고에 종종 묘사된다. 템플릿을 사용하여 연구 질문을 다음과 같이 설명할 수 있다: "따라서, 본 연구는 다음과 같은 연구 질문에 답하는 것을 목표로 했다. 주니어 임상의 교육자들은 침상에서 가르치는 데 있어 자신의 역할을 어떻게 보고 있습니까?" 이 예에서 알 수 있듯이, 제안된 템플릿은 연구 참여자들이 건강 관리에 대한 역할, 교육에서의 역할, 학계에서의 역할, 학습자와의 관계와 관련된 정보를 명확하게 보고하는 것을 목표로 한다.

Using the full template may not always be possible or practical, and it can be adapted for specific needs. For instance, in an abstract, one might use only the first sentence from the example and leave further details for the methods section. Research participants are also often described in the reporting of research questions. Using the template, a research question could be described as follows: “Thus, this study aimed to answer the following research question: How do junior clinician educators view their roles in teaching at the bedside?” As this example shows, the suggested template aims to clearly report information related to the research participants’ role in healthcare, their role in education, their role in academia, and their relationship to learners.

장점 및 한계
Strengths and limitations

우리의 접근 방식에서, 우리는 미국 국립 의학 도서관이 MeSH "faculty"로 기사를 색인화한 방법을 기반으로 체계적으로 초록을 식별했다. 우리는 미국에 기반을 둔 인덱서가 자신의 작업에 의도치 않게 문화적 편견을 도입했을 수 있다는 것을 인지한다. 우리의 코딩에서, 우리는 106개의 추상들을 "null" 또는 교수진과 관련된 용어가 없는 것으로 확인했습니다. 따라서 인덱싱에 불일치가 있을 수 있습니다. 우리의 샘플을 모으기 위해, 우리는 그것이 자유롭게 이용할 수 있는 자원이기 때문에 일부러 PubMed를 선택했습니다. 그러나 모든 의학 교육 저널을 포함하는 것은 아니며 따라서 특정 국가 또는 지역에서 영향력이 있을 수 있는 저널을 포함하는 것은 PubMed만의 문제가 아니다.

In our approach, we systematically identified abstracts based on how the United States (US) National Library of Medicine indexed articles with the MeSH “faculty”. We recognize that the US-based indexers may have inadvertently introduced their own cultural biases into their work. In our coding, we identified 106 abstracts as “null” or without terminology related to faculty. Taken together, this suggests that there may be some inconsistencies in indexing. To gather our sample, we purposely chose PubMed as it is a freely available resource. However, it does not include coverage of all medical education journals and thus of journals that might be influential in specific countries or regions, an issue not unique to PubMed.

우리가 영어로 된 출판물(일부)만 사용했기 때문에, 우리는 비영어 배경의 작가들이 모국어 개념을 영어로 번역해야 했다는 것을 인정해야 한다. 이것은 종종 단순한 번역 그 이상이며, trans- 또는 심지어 deculturation과 관련될 수 있다. 그럴 경우 우리의 콘텐츠 분석에는 불완전한 도메인과 예가 포함될 수 있지만, 이는 단 하나의 단어보다는 연구 참가자들의 설명에 템플릿을 사용하자는 우리의 제안을 더 강화해줄 것이다.
As we used only (parts of) publications in English, we have to acknowledge that authors from non-English backgrounds had to translate their native language concepts into English. This is often more than merely a translation and may involve a trans- or even deculturation. In that case, our content analysis may contain incomplete domains and examples, but it reinforces our plea to use a template for the description of research participants rather than a single word.

나아가 비영어권 국가의 의학교육 문헌에서 얼마나 많은 논문이 '교양'과 유사한 단어를 사용하고 있는지, 또 어떤 용어가 사용되는지, 영어에서 포착되지 않은 의미를 어떻게 더할 수 있는지 파악할 수 없었다. 비영어권 국가의 교수진과 관련된 용어에 초점을 맞춘 연구는 국제 공동 연구의 일환으로 향후 수행될 필요가 있다.

Furthermore, we were unable to determine how many papers in medical education literature in non-English speaking countries use words similar to “faculty”, what other terms are used, and how they may add meanings that are not captured in English. Research focusing on terms related to faculty in non-English speaking countries needs to be carried out in the future as part of international joint research.

결론
Conclusion

우리는 HPE를 다루는 것을 포함하여 생물의학 문헌에서 거의 600개의 초록에서 교수 관련 용어의 다양한 사용을 식별하고 설명했다. 우리는 이 용어를 네 가지 주요 교수 역할에 매핑하고 연구 참가자를 설명할 때 사용할 수 있는 템플릿을 제공하기 위해 사용했다. 이것은 HPE에서 일반적으로 사용되는 용어에 대한 공통된 이해를 향한 단계이다. HPE 내의 다른 용어의 변동 정도를 조사하고 템플릿을 사용하고 테스트하기 위해 다른 연구자들이 우리의 방법론을 채택하도록 초대한다.
We identified and described the varying use of faculty-related terms in almost 600 abstracts from biomedical literature, including that covering HPE. We mapped the terms to four key faculty roles and used them to offer researchers a template for use when describing research participants. This is a step toward shared understanding of commonly used terms in HPE. We invite other researchers to adopt our methodology to investigate the extent of variation in other terms within HPE, and to use and test our template.


 

Perspect Med Educ. 2022 Jan;11(1):22-27.

 doi: 10.1007/s40037-021-00683-8. Epub 2021 Sep 10.

Advancing the science of health professions education through a shared understanding of terminology: a content analysis of terms for "faculty"

Affiliations collapse

 

Affiliations

1Maastricht University Medical Center, Maastricht, The Netherlands. p.teunissen@maastrichtuniversity.nl.

2School of Health Professions Education (SHE), Faculty of Health Medicine and Life Sciences, Maastricht University, Maastricht, The Netherlands. p.teunissen@maastrichtuniversity.nl.

3School of Health Professions Education (SHE), Faculty of Health Medicine and Life Sciences, Maastricht University, Maastricht, The Netherlands.

4Western Sydney University, Sydney, Australia.

5LKC School of Medicine, Nanyang University Singapore, Singapore, Singapore.

6University of Aberdeen, Aberdeen, UK.

7Accreditation Council for Graduate Medical Education, Chicago, IL, USA.

8Center for Health Professions Education and Department of Medicine, Uniformed Services University of the Health Sciences, Bethesda, MD, USA.

9Center for Medical Education, Nagoya University, Nagoya, Japan.

10Centre for Medical Education (CenMED), National University of Singapore, Singapore, Singapore.

11Ministry of Health Singapore, Singapore, Singapore.

12Flinders Health and Medical Research Institute, Prideaux at Flinders University, Adelaide, Australia.

13Centre for Health Professions Education and Faculty of Medicine and Health Sciences, Stellenbosch University, Stellenbosch, South Africa.

PMID: 34506010

PMCID: PMC8733114

DOI: 10.1007/s40037-021-00683-8

Free PMC article

Abstract

Introduction: Health professions educators risk misunderstandings where terms and concepts are not clearly defined, hampering the field's progress. This risk is especially pronounced with ambiguity in describing roles. This study explores the variety of terms used by researchers and educators to describe "faculty", with the aim to facilitate definitional clarity, and create a shared terminology and approach to describing this term.

Methods: The authors analyzed journal article abstracts to identify the specific words and phrases used to describe individuals or groups of people referred to as faculty. To identify abstracts, PubMed articles indexed with the Medical Subject Heading "faculty" published between 2007 and 2017 were retrieved. Authors iteratively extracted data and used content analysis to identify patterns and themes.

Results: A total of 5,436 citations were retrieved, of which 3,354 were deemed eligible. Based on a sample of 594 abstracts (17.7%), we found 279 unique terms. The most commonly used terms accounted for approximately one-third of the sample and included faculty or faculty member/s (n = 252; 26.4%); teacher/s (n = 59; 6.2%) and medical educator/s (n = 26; 2.7%) were also well represented. Content analysis highlighted that the different descriptors authors used referred to four role types: healthcare (e.g., doctor, physician), education (e.g., educator, teacher), academia (e.g., professor), and/or relationship to the learner (e.g., mentor).

Discussion: Faculty are described using a wide variety of terms, which can be linked to four role descriptions. The authors propose a template for researchers and educators who want to refer to faculty in their papers. This is important to advance the field and increase readers' assessment of transferability.

Keywords: Content analysis; Faculty terminology; Literature study.

무대에서 연기하기: 직접관찰에 관한 전공의의 인식(Med Educ, 2017)
Staging a performance: learners’ perceptions about direct observation during residency
Kori A LaDonna,1 Rose Hatala,2 Lorelei Lingard,3 Stephane Voyer2 & Christopher Watling4

 

 

소개
Introduction

레지던시 프로그램은 학습자가 유능하고 안전하며 독립적인 실무자가 되기 위한 필수 기술을 갖추고 졸업하도록 직접 관찰('마스터' 임상의가 관찰하고 견습생에게 피드백을 제공하는 전략)을 사용합니다. 직접 관찰은 두 가지 목적을 달성할 것으로 기대된다.

  • 첫째, 모든 프로그램이 수행해야 하는 학습자 성과에 대한 평가를 뒷받침할 것으로 기대된다.
  • 둘째, 학습자가 학습목표를 달성할 수 있도록 지도하기 위해 형성적 피드백과 코칭의 기초가 되어 학습을 지원한다.

Residency programmes use direct observation (a strategy in which the ‘master’ clinician watches and provides feedback to the apprentice) to ensure that learners graduate with the requisite skills to be competent, safe and independent practitioners.1, 2 Direct observation is expected to serve two purposes.

  • First, it is expected to underpin the assessment of learner performance that all programmes must conduct.
  • Second, it is supposed to support learning by serving as a basis for formative feedback and for coaching, in order to guide learners toward meeting their learning objectives.34 

증거는 Miller의 평가 계층 구조 중 가장 높은 수준에서 학습자의 의료 전문성, 기술 또는 절차적 기술, 커뮤니케이션7, 전문성을 포함한 다양한 임상 역량을 평가할 때 직접 관찰의 타당성과 신뢰성을 강력하게 뒷받침한다. 그러나 평가에서 확립된 유용성과는 대조적으로, 교육생의 학습, 환자 치료 결과 및 직업적 정체성 형성에 대한 직접 관찰의 영향은 널리 연구되지 않았다. 직접 관찰에서 생성된 피드백이 교육생의 학습과 성과를 향상시킨다는 것을 뒷받침하는 증거는 제한적이다.19 학습에 가치가 있을 만큼 충분한 빈도로 직접 관찰이 발생하지 않을 수 있으며, 개별 역량을 평가하기 위해 직접 관찰을 사용하는 것은 '의사 발전을 형성하는 데 있어 이러한 역할의 근본적인 의미와 상호 연관성'을 놓칠 수 있다. 직접적인 관찰이 학습에 어떤 영향을 미치는지에 대한 더 나은 이해가 시급하다.
Evidence strongly supports the validity and reliability of direct observation in assessing a range of clinical competencies, including learners’ medical expertise, technical or procedural skills,5, 6 communication7 and professionalism,8 at the highest levels of Miller's assessment hierarchy.9, 10 By contrast with its established usefulness in assessment, however, the influence of direct observation on trainees’ learning, patient care outcomes and professional identity formation has not been widely studied11-15; there is limited evidence to support that feedback generated from direct observation improves trainees’ learning and performance,12, 16-18 or that it improves patient safety and care.19 Direct observation may not occur with enough frequency to be valuable for learning,20, 21 and using direct observation solely to assess individual competencies may miss ‘the underlying meaning and interconnectedness of these roles in shaping physician development’.13 A better understanding of how direct observation influences learning is urgently needed. 

하지만 '직접 관찰'이 정확히 무엇인가요? 그렇게 널리 지지된 접근법의 경우, 의학 교육에서의 사용에 초점을 맞춘 기사에서도 거의 정의되지 않는다. 우리는 [직접 관찰]을 학습자가 자신의 지식과 기술을 임상 실습에 어떻게 적용하는지에 대한 이해를 높이기 위해 학습자가 수행하는 것을 관찰하는 능동적인 과정으로 정의한다. 직접 관찰은 종합적 또는 형성적 목적에 기여할 수 있으며, 객관적 구조 임상 검사(OSCE)와 미니 임상 검사(mini-CEX)와 같은 공식화된 평가 컨텍스트에서 평가가 표현 목표가 아닌 비공식 코칭 지향 컨텍스트에 이르기까지 다양한 환경에서 사용될 수 있다. 관찰 기반 종합 평가 도구는 연구의 많은 관심을 끌었지만, 직접적인 관찰은 학습자의 강점과 약점을 파악하고, 지속적인 발달 피드백을 지원하고, 학습자가 확인된 결함을 해결하기 위한 실행 계획을 수립하는 데 도움이 될 수 있고 형성적인 역할을 해야 한다. 관찰은 한마디로 코칭의 기초를 형성하지만 [효과적인 코칭을 지원하는 관찰 전략]은 여전히 불충분하게 정의되어 있습니다. 
But what exactly is ‘direct observation’? For an approach so widely endorsed, it is rarely defined, even in articles firmly focused on its use in medical education. We define direct observation as the active process of watching learners perform in order to develop an understanding of how they apply their knowledge and skills to clinical practice. Direct observation can serve either summative or formative purposes, and it may be used in a variety of settings, ranging from formalised assessment contexts like the objective structured clinical examination (OSCE) and the mini-clinical examination (mini-CEX), to informal coaching-oriented contexts in which assessment is not the express goal.22 Observation-based summative assessment tools have garnered the bulk of research attention,23, 24 but direct observation can and should play a formative role 9 in identifying learners’ strengths and weaknesses, to support continuous developmental feedback and to help learners create an action plan to address identified deficiencies. Observation, in short, forms the basis for coaching; however, the observational strategies that support effective coaching remain inadequately defined.25

이러한 이해의 차이에도 불구하고, 직접적인 관찰은 교육학적인 의미를 지니게 하고 교육자들은 교육적인 영향이 크다고 가정하는 경향이 있다. 그러나 학습자들은 정말 관찰받고 싶어하는지에 대해서는 덜 확신하는 것으로 보인다. 왜 그런지 이해하지 못하면, 우리는 이론에서 실제보다 더 잘 통할 수 있는 교육 전략을 자랑할 위험이 있다. 직접 관찰의 사회문화적 측면에 대한 우리의 최근 탐구는 전공의들의 양면성을 설명할 수 있는 한 가지 단서를 발견했다. 관찰을 요청하는 것은 종종 학습자들에게 있다. 

Despite these gaps in understanding, direct observation makes pedagogic sense and educators tend to assume that its educational impact is high.26 Learners, however, appear to be less convinced that they want to be observed.17 Without understanding why, we risk trumpeting an educational strategy that may work better in theory than it does in practice. Our recent exploration of the sociocultural aspects of direct observation revealed one clue that may explain residents’ ambivalence21: the onus is often on learners to ask for observation.

그러나 의학이 교육되고 실천되는 임상 기관에 내재된 문화적 가치인 효율성과 자율성에 충돌하기 때문에 학습자들은 꺼린다. 만약 학습자가 관찰이 직접적으로 교육이나 직업적 발전을 향상시킨다고 확신하지 못하고 관찰을 요청하는 것이 그들의 직업적 신뢰도에 부정적인 영향을 미칠까 걱정한다면, 학습자가 관찰받는 것에 대해 이중적이거나 심지어 반대하는 것은 놀라운 일이 아닐지도 모른다. 

Learners are, however, reluctant because asking to be observed conflicts with efficiency and autonomy, cultural values embedded in the clinical institutions where medicine is taught and practised.21 If learners are not convinced that observation directly enhances their education or professional development, and if they worry that asking for observation will negatively impact their professional credibility,21, 27 then it is perhaps not surprising that learners are ambivalent about, or even opposed to, being observed.10

그러나 우리는 모든 학습자가 직접적인 관찰에 대한 양가적이라고 특징지어서는 안 된다. 일부 학습자들에게는 신뢰받는 선배들의 관찰이 자신감을 높이고 임상 능력을 향상시켰다. 이 뉘앙스는 탐구를 필요로 한다. 직접 관찰이 학습을 촉진시키기를 바란다면 관찰자의 존재나 목적이 학습자의 전문성 발달에 영향을 미치는지 등 관찰을 가치 있게 하는 조건을 이해해야 한다. 학습자가 직접 관찰이 학습과 전문성 개발에 미치는 영향을 어떻게 인식하는지 탐색하는 것이 보다 성공적인 구현을 위한 전략 개발의 첫 번째 단계입니다. 따라서 본 연구의 목적은 직접 관찰이 수행, 행동 및 학습에 미치는 영향을 포함하여 훈련 중 관찰된 거주자의 경험을 탐구하는 것이었다.

We must not characterise all learners as ambivalent about direct observation, however. For some learners, being observed by trusted senior colleagues buoyed their confidence and improved their clinical skills.28-30 This nuance demands exploration. If we hope that direct observation will promote learning, we need to understand the conditions that make observation valuable for learners, including whether or not an observer's presence or purpose impacts learners’ professional development. Exploring how learners perceive the impact of direct observation on their learning and professional development is the first step to developing strategies for more successful implementation. Thus, the purpose of this study was to explore residents’ experiences of being observed during their training, including their perceptions of the impact of direct observation on their performance, behaviour and learning.

방법들
Methods

우리는 CGT31, 32를 사용하여 레지던트 교육 동안 학습자의 직접적인 관찰 경험을 탐구했습니다. CGT는 연구자와 참가자의 경험과 관점이 기초적인 사회적 과정에 대한 의미가 어떻게 구성되는지에 영향을 미친다는 것을 인지한다(예: 대학원 의료 훈련 중 관찰). 이 연구는 3명의 임상 교육자(CW, RH, SV)와 수사학(LL) 및 보건과학(KL)에 대한 전문 지식을 갖춘 2명의 박사 학위 교육 연구자에 의해 수행되었다.

We used a constructivist grounded theory approach (CGT)31, 32 to explore learners’ experiences with direct observation during their residency training. CGT recognises that researchers’ and participants’ experiences and perspectives influence how meaning is constructed about a basic social process (e.g. being observed during postgraduate medical training); this research was conducted by three clinician educators (CW, RH and SV) and two PhD-trained medical education researchers with expertise in rhetoric (LL) and health sciences (KL).

슐리치의학전문대학원(슐리치)의 모든 레지던트들이 일대일 면접에 참여할 수 있도록 초청하는 채용 이메일을 발송했다. 22명의 교육생(n = 12명의 여성), 다양한 전문분야(응급의학 [n = 2], 가정의학[n = 2], 외과[n = 3], 소아과[n = 1], 정신과[n = 4], 신경과[n = 2], 방사선학[n = 1], 내과[n = 1] 및 내과 n = 7 PGY 3–5, 2명의 임상 동료)가 반구조화 인터뷰에 참여하기로 동의했다. 인터뷰 동안 한 인터뷰 진행자(KL)는 참가자들에게 훈련 프로그램에서 직접 관찰의 목적과 역학을 설명하고, 관찰된 경험을 되새기며, 직접 관찰이 학습과 전문적 발전에 미치는 영향을 설명하도록 요청했다. 직접 관찰은 여러 형태를 취하기 때문에 참가자에 대한 직접 관찰을 의도적으로 정의하거나 특정 유형의 관찰로 논의를 제한하지 않았다. 대신 참가자들에게 일반적으로 관찰된 작업의 측면, 누가 자신의 작업을 관찰하고 어떤 형태의 직접 관찰이 필요한지를 설명하도록 요청하였다(예: 직접 관찰, 비디오, 양방향 거울 등). 모든 인터뷰는 분석 전에 음성 녹음, 문자 그대로 옮겨지고 비식별화 되었다.
We sent a recruitment e-mail inviting all residents at the Schulich School of Medicine and Dentistry (Schulich) to participate in one-to-one interviews. Twenty-two trainees (n = 12 females) representing a variety of specialties (including emergency medicine [n = 2], family medicine [n = 2], surgery [n = 3], paediatrics [n = 1], psychiatry [n = 4], neurology [n = 2], obstetrics and gynaecology [n = 2], radiation oncology [n = 1] and internal medicine [n = 5]) and training levels (n = 13 PGY 1 or 2; n = 7 PGY 3–5, two clinical fellows) consented to participate in semi-structured interviews. During the interviews, one interviewer (KL) asked participants to describe the purpose and mechanics of direct observation in their training programme, to reflect on their experiences of being observed, and to describe the impact of direct observation on their learning and professional development. Because direct observation takes many forms, we purposefully did not define direct observation for participants, or limit discussion to a particular type of observation. Instead participants were asked to describe the aspects of their work that were typically observed, who observed their work and what form direct observation took (e.g. in-person observation, video, two-way mirror, etc.). All interviews were audio-recorded, transcribed verbatim and de-identified prior to analysis.

데이터 수집과 분석은 반복적으로 수행되었다. 우리는 3단계 코딩 과정 동안 지속적인 비교 분석을 수행했다.

  • 첫째, KL과 CW는 자주 발생하는 초기 코드를 식별하기 위해 처음 두 개의 녹취록을 독립적으로 코드화했다. KL과 CW는 관찰 정의, 관찰 접근법, 관찰자의 정체성, 관찰에 대한 기대, 관찰의 시스템 도전 또는 촉진자, 관찰의 의미(감정적 반응과 피드백 신뢰도 포함)를 포함한 예비 테마를 개발하기 위해 초기 코드를 함께 통합했다.
  • 그런 다음 KL은 예비 테마를 사용하여 다음 세 가지 대본의 적합성과 관련성을 테스트하기 위해 코드를 작성했다. 예비 분석을 정교하게 하기 위해 이론적 샘플링을 사용하여 직접 관찰에 대한 추가 관점을 얻었다. 구체적으로, 우리는 슐리치의 두 명의 임상 동료와 시범 관찰 및 피드백 프로그램에 참여한 브리티시컬럼비아 대학교(UBC)의 네 명의 내과 레지던트들을 인터뷰했다. 슐리치 임상 연구진은 체류 후 훈련에서 직접 관찰의 역할을 설명할 수 있었고, UBC 참가자들은 그들의 지식이나 기술을 평가하기보다는 전문적 개발을 코칭하기 위해 고안된 혁신적인 접근법과 일반적인 직접 관찰 관행을 비교하고 대조할 수 있었다.
  • 인터뷰 가이드는 또한 지속적인 비교 분석 동안 개발된 분석 통찰력에 초점을 맞추도록 진화했습니다. 예를 들어, 인터뷰가 진행됨에 따라 참가자들은 관찰에 대한 다양한 접근법(예: 종합 평가 또는 코칭을 위한 관찰)을 구별하고 훈련 중에 어떤 접근법을 경험했는지 논의하도록 유도되었다. 추가 인터뷰를 통해 다른 통찰이 드러났을 수도 있지만, 학습자의 관찰 경험을 이해하기에 충분하다고 판단했을 때 데이터 수집을 중단했습니다.33

Data collection and analysis were conducted iteratively; we engaged in constant comparative analysis during the three-stage coding process.

  • First, KL and CW independently coded the first two transcripts to identify frequently occurring initial codes; together KL and CW consolidated initial codes to develop preliminary themes, including defining observation, approaches to observation, the observer's identity, expectations for observation, system challenges or facilitators of observation, and implications of observation (including emotional responses and feedback credibility).
  • KL then used the preliminary themes to code the next three transcripts to test their fit and relevance. To elaborate our preliminary analysis we used theoretical sampling31 to gain additional perspectives about direct observation. Specifically, we interviewed two clinical fellows at Schulich and four internal medicine residents at the University of British Columbia (UBC) who had participated in a pilot observation and feedback programme.22 The Schulich clinical fellows were able to describe the role of direct observation in post-residency training; the UBC participants were able to compare and contrast usual direct observation practice with an innovative approach designed to coach professional development, rather than to assess their knowledge or skill.
  • The interview guide also evolved to focus on analytical insights developed during constant comparative analysis. For instance, as the interviews progressed, participants were prompted to distinguish between the various approaches to observation (e.g. observation for summative assessment or observation for coaching) and to discuss which approaches they had experienced during their training. Although additional interviews may have revealed other insights, we ceased data collection when we determined that our findings were sufficient for understanding learners’ experiences of being observed.33

모든 연구자들이 일련의 회의에 참여하여 데이터를 검토하고, 주제를 다듬고, 범주를 개발하고, 직접 관찰이 학습에 미치는 영향을 해석했다. 특히, 연구팀은 참가자들이 관련성이 있지만 구별되는 두 가지 생각을 분명히 밝혔다고 이론화했다. 

  • (i) 기관 및 전공 특이적 사회적, 조직적, 문화적 영향이 대학원 교육에서 직접 관찰의 수행방식에 영향을 미쳤다. 
  • (ii) 직접 관찰이 개별 학습자에게 미치는 영향이 다양하였다. 

All researchers participated in a series of meetings to review data, to refine themes, to develop categories and to interpret the impact of direct observation on learning. Specifically, the research team theorised that participants articulated two related, yet distinct ideas:

  • (i) that institutional and specialty-specific social, organisational and cultural influences impacted how direct observation played out in their postgraduate training, and
  • (ii) that direct observation variably impacted individual learners.

따라서 연구팀은 시스템 수준과 개별 학습자 수준에서 직접 관찰을 이해하기 위해 두 가지 분석을 수행했다. 전자의 분석은 다른 곳에서 보고된다. 이 분석에서는 관찰이 자신의 성과와 행동에 미치는 영향에 대한 개인의 인식에 초점을 맞춘다. 모든 연구 절차는 웨스턴 대학교 연구 윤리 위원회의 승인을 받았다.
Consequently, the team conducted two separate analyses to understand direct observation at the level of the system and at the level of the individual learner. The former analysis is reported elsewhere21; in this analysis, we focus on individuals’ perceptions of the impact of observation on their own performance and behaviour. All research procedures were approved by the Western University Research Ethics Board.

 

결과.
Results

참가자들에게 직접적인 관찰은 양날의 검이었다. 대부분의 참가자들은 자신감을 강화하고 사각지대를 드러내는 데 도움이 되는 중요한 교육 전략이라고 특징짓지만, 관찰자의 존재가 자신의 행동을 변화시킬 수 있는 다양한 방법을 설명하기도 했다. 관찰자는 정서적 불편함을 조성하고, 학습자의 임상 성과를 변경하며, 학습자-환자 관계를 손상시킬 수 있다. 이러한 의도하지 않은 결과에 기여하는 것은 학습자가 관찰을 평가로 간주하는 광범위한 경향이 있었으며, 이는 관찰 중 자신의 행동뿐만 아니라 관찰자가 자신의 의학적 전문성과 임상 기술에 대한 진정한 묘사를 보고 있다는 확신에도 영향을 미쳤다.

For participants, direct observation was a double-edged sword. Most participants characterised it as an important educational strategy that helped them to bolster their confidence and to reveal their blind spots, but they also described a range of ways in which the presence of an observer might alter their behaviour. Observers could create emotional discomfort, alter a learner's clinical performance and compromise the learner–patient relationship. Contributing to these unintended consequences was a pervasive tendency for learners to regard observation as assessment, which influenced not only their behaviour during observation, but also their confidence that observers were seeing an authentic portrayal of their medical expertise and clinical skill.

의도하지 않은 결과: 정서적 불편
Unintended consequence: emotional discomfort

참가자들은 보통 자신 있게 잘할 수 있는 과제나 절차를 수행하는 것이 관찰되는데, '그렇다면 내가 매우 불편한 일이라면, 누군가 나를 지켜보는 것에 대한 스트레스는 일반적으로 내가 평소보다 더 잘하지 못하게 만들 것이다.'(P9) 대다수의 참가자는 관찰을 통해 자의식을 느끼거나, 주요 정보를 '땀 흘리거나'(P15) '허우적거리거나'(P7) 임상 검사의 구성 요소를 잊어버렸다.
Participants were typically at ease being observed doing a task or procedure they could confidently perform well, ‘but, then, if it's things that I'm very uncomfortable with, the stress of having someone there watching me will typically make me perform worse than I normally would’ (P9). For the majority of participants, being observed made them feel self-conscious, made them ‘sweat’ (P15) or ‘fumble’ key information (P7), or made them forget components of the clinical examination:

 

나는 감시당하고 있을 때 훨씬 더 산만하게 느껴진다. 내가 무엇을 해야 하는지 정확히 알고 있지만, 누군가가 나를 지켜보고 있다는 것을 알게 되면, 나는 갑자기 훨씬 더 걱정된다 - 내가 무엇을 잊었는가? 다음에 할 일이 뭐죠? 반면 혼자 있을 때는 5초 정도 시간을 갖고 머릿속을 다시 가다듬어야 한다고 거의 느낄 정도입니다. 하지만, 만약 내가 감시당하고 있다면, 내 머릿속에 침착하고 집중하기가 훨씬 더 힘들어.(P18)
I feel a lot more scatterbrained when I'm being watched. I know exactly what I'm supposed to do, but knowing someone is watching me, I'm just all of a sudden a lot more worried - What did I forget? What's next? Whereas when I'm on my own, I almost feel it's okay if I need to take 5-seconds and regroup in my head. But, if I'm being watched, it's just so much harder to keep calm and focused in my head.(P18)

 
참가자들은 누군가(의사, 의대생, 간호사 또는 환자)가 항상 지켜보고 있다는 것을 인정했지만 관찰자의 존재에 따른 영향은 달랐고, 관찰받는 것은 일반적으로 관찰자가 [동일한 진료 범위]를 가지고 있거나 [공식적인 평가를 할 수 있는 위치]에 있다고 인식되는 경우에만 불안감을 유발했다. 교수진이 관찰하는 것은 스트레스를 주는 것으로 묘사되었고, 순환 과정 동안 다수의 임상의 관찰자를 두는 것은 특히 불안감을 유발할 수 있다. 한 정신과 레지던트는 다음과 같이 설명했다.
Participants acknowledged that someone (a physician, a medical student, a nurse or a patient) was always watching, but the impact of the observer's presence differed, and being observed was typically only anxiety-provoking if the observer was perceived to have the same scope of practice or to be in a position to provide a formal assessment. Being observed by faculty members was described as stressful, and having multiple clinician observers over the course of a rotation could be particularly anxiety-provoking because learners had to tailor their style to what they perceived each observer was expecting to see. A psychiatry resident described that:

 

… 모든 사람들은 특정한 방식으로 일을 한다 … 어떤 사람들은 당신이 과거 정신의학 역사에 집중하기를 기대한다. 어떤 사람들은 당신이 그들(환자)이 어떻게 양육되었는지에 초점을 맞추기를 원한다. 그래서 그 사람이 무엇을 찾고 어떻게 접근하는 것을 좋아하는지를 알게 되면, 그것은... 쉬워진다.
… everyone does things a certain way … certain people expect you to focus … on … past psychiatric history. Some people want you to focus on how they (patients) were raised. And so once you know what that person is looking for and how they like to approach things, it becomes … easier. (P18)

이런 지적은 전공의들이 관찰받는 불편함뿐만 아니라, 특정 관찰자를 위한 공연의 필요성에도 고군분투하고 있으며, 두 가지 투쟁 모두 진정되는 데 시간이 걸릴 수 있음을 시사하는 것으로 보인다.
This comment seems to indicate that residents not only struggle with the discomfort of being observed, but also with the need to stage a performance for a particular observer, and both struggles can take time to abate.

 

영향: 수행능력
Impact: performance

참가자들은 대부분 관찰자가 자신의 성과를 관찰할 뿐만 아니라 평가한다고 가정했기 때문에, 관찰자를 기쁘게 하기 위해 자신의 임상 스타일을 쉽게 변경했다. 그들은 그들의 '성적'이 그들의 공식적인 평가, 영구적인 기록, 그리고 심지어 그들의 훈련이나 경력 승진에 영향을 미칠 수 있다고 의심했다. 따라서 참가자들은 관찰을 코칭으로 개념화하는 경우가 거의 없었다. 대신, 관찰자가 있는 것은 진료실의 게슈탈트를 [실제 환자와의 만남]에서 [OSCE 스테이션과 유사한 것]으로 변형시켰으며, 참가자들은 코치가 아닌 점수를 매기는 것처럼 연기를 묘사했다. 관찰자 앞에서, 참가자들은 '기본적으로 해야 할 일들의 방식인 뛰어난 수완의 규칙'을 따름으로써 '더 신중하고 반성적인… 의대 스타일' (P1)이라고 보고했다. '예를 들어, 호흡기 검사의 일부로 간주되는 특정한 기술들이 있는데, 제가 그것들을 높은 수율을 발견하지 못했기 때문에 자주 그렇게 하지는 않을 것입니다. 그러나 만약 내가 관찰되고 있다면, 나는 내가 훨씬 더 철저해야 한다고 생각한다.' (P20) 따라서 관찰받을 때 목표는 [환자 중심 치료]에서 [성과 중심 치료]로 전환되었고 가상 체크리스트의 완성이 되었다. 관찰된 것이 어떻게 그의 임상적 접근 방식을 바꾸었는지를 묻자, 참가자 3은 '나는 아마도 더 철저한 질문을 할 것이다… 장기적으로 상관없는 질문들… 아마도 상관없는 질문들, 단지 내가 그 확인란에서 모든 것을 하고 있는 것처럼 보이기 위해서'라고 말했다.

Participants readily altered their clinical style to please the observer because most assumed that the observer was not only watching their performance, but also grading it. They suspected that their ‘grade’ could have implications for their formal assessment, permanent record, and even their training or career advancement: ‘I think we're assessed every day … It's a frame of how good you are at your job and how much you know … but there's always the possibility that it could be punitive’ (P16). Consequently, participants rarely conceptualised observation as coaching. Instead, having an observer present transformed the gestalt of a clinic room from a real-world patient encounter into something resembling an OSCE station, and participants described performing as though they were being graded, not coached. In the presence of an observer, participants reported being ‘more cautious and reflective … sort of medical school style’ (P1) by following ‘examsmanship rules which are basically the ways you are supposed to do things …’ (P10). ‘There are certain techniques that are considered to be part of the respiratory exam, for instance, that I probably don't do that often because I don't find them high yield. But if I am being observed, I think I will err to be much more thorough’ (P20). Thus, when observed, the goal shifted from providing patient-centred care to performance-centred care and the completing of an imaginary checklist. When asked how being observed changed his clinical approach, participant 3 said, ‘I'd probably ask more thorough questions … that have no bearing in the long run … probably irrelevant questions, just to look like I'm doing everything under the sun in that check box’.

의도하지 않은 결과: 환자와의 관계
Unintended consequences: relationship with patients

관찰자의 존재는 또한 신중하게 구성된 레지던트-환자 관계의 역동성을 방해할 수 있다. 레지던트들은 그들이 환자 개개인의 필요에 따라 그들의 품행과 언어를 맞춤으로써 환자들과의 관계를 발전시켰다고 설명했다. 일부 참가자들은 환자와의 일상적인 의사소통 방식을 설명했으며, 종종 유머를 사용하여 신뢰를 발전시키고 환자를 편안하게 만들었다. 그러나 관찰자가 있는 경우 참가자들은 [보다 공식적인 접근법]을 취하기 위해 일반적으로 쓰던 대화 방식을 포기할 수 있다.
The presence of an observer could also disrupt the dynamic of carefully constructed resident–patient relationships. Residents described that they developed a rapport with patients by tailoring their demeanour and language to each patient's needs. Some participants described using a casual and relatively informal communication style with patients, often invoking humour to develop trust and to make the patient feel comfortable. However, having an observer present could cause participants to forgo their typical conversation style for a more formal approach:

 

그래서 가끔 환자들과 꽤 격의 없이 지내요. 어린 환자들한테는 말을 써요. 18살인데 자살 충동을 느끼는 것처럼요. 그러니까, 오늘 하루 잘 보내고 계시진 않겠죠. 만약 내가 다른 사람에 의해 관찰받는다면, 나는 그들과 그렇게 말하지 않았을 것이다… 하지만 농담이나, 나쁜 말장난, 또는 그런 종류의 것에 약간 수용적인 몇몇 환자들은, 내가 모르는 사람들에 의해 관찰되었다면, 아마도 나는 그렇게 하는 것을 망설일 것이다.

So sometimes I'm fairly casual with patients. With young patients, I do use language, like if they're 18, and they're feeling suicidal, I'll say things like, so you're having a pretty (expletive) day, eh, it's not going so well. If I was being observed by strangers, I wouldn't talk like that with them … But some patients who are receptive to joking around a little bit, or a bad pun, or that kind of thing, if I was being observed by people I didn't know, then I probably would be hesitant to do that. (P1)


참가자들은 또한 관찰자가 있는 경우 환자가 민감한 정보를 노출할 가능성이 낮다는 것을 인지했다. '1대1일만 되면 환자들이 조금 더 마음을 열 것 같아요' 방에 사람이 너무 많으면 많은 정보를 누설할 때 조금 불안해진다."(P15)고 했다. 참가자들은 또한 특히 관찰자가 자신의 연구를 수정하거나 비평하기 위해 개입할 경우 환자가 의사 관찰자와 상호 작용하고 신뢰하게 될 것이라고 우려했다. '… 어쩌면 그들은 더 이상 나를 믿지 않을지도 모른다… 아마도 이제 그들은 "글쎄, 나는 너와 말하고 싶지 않다. 나는 네 실수를 고쳐주는corrected 사람과 이야기하고 싶다."라고 말할 것이다. (P10)

Participants also perceived that patients were less likely to reveal sensitive information if there was an observer present: ‘I feel patients will open up a little bit more … when it's just one-on-one. If there are too many people in the room, it's making them a little bit nervous when they're divulging a lot of information” (P15). Participants also worried that patients would be more likely to interact with, and trust, the physician observer, particularly if the observer stepped in to correct or critique their work: ‘… maybe they don't trust me anymore … maybe now they're going to say, “well I don't want to talk to you I want to talk to the person that corrected you”’ (P10).

진위성의 결여를 인지하고 있다.
A perceived lack of authenticity

학습자가 불안, 평가 중심의 성과 또는 학습자-환자 관계의 변화와 관련하여 자신의 일상 관행에 대한 변화를 인지하는 것은 관찰된 것이 진정성이 있는지에 대한 의문을 불러일으켰다. 학습자들은 관찰이 그들이 직업의 과제를 실제로 수행하는 방법을 포착하기 위한 것이라는 것을 이해했지만, 많은 사람들은 관찰이 이러한 목적을 달성했는지에 대해 의문을 제기했다.
Learners’ recognition of alterations to their usual practices, related to anxiety, assessment-oriented performance or changes in the learner–patient relationship, raised questions about whether what was observed was authentic. Although learners understood that observation was intended to capture how they actually carry out the tasks of their profession, many questioned whether observation achieved this aim:

 

나는 그들이 반드시 당신의 일상적인 접근법에 대한 평가를 받는다고 생각하지 않는다. 그러나 당신의 접근법이 어떻게 보일지에 대한 이해는 얻고 있다고 생각한다. 제 생각엔 그들은 아마 그것에 대해 꽤 잘 알 것 같아요. (P20)
I don't think they're getting, necessarily, the assessment of your day-to-day approach, but of your understanding of what an approach would look like. I think that they probably get pretty good insight into that. (P20)

참여자들은 관찰자 효과의 영향이 관찰자들에게 그들이 [실제로 일하는 방식을 반영하지 않는 인상을 주었다]고 인식하였다.
Participants perceived that the impact of an observer effect created an impression for observers that was not reflective of how they actually worked:

 

… 저는 보통 제가 독립적으로 평가를 할 때, 그 시점에서 저는 그렇게 많은 불안감을 가지고 있지 않기 때문에, 그렇게 많이 잊어버리지 않는 것처럼 느껴지지만, 제가 누군가의 감시를 받고 있지 않다는 것을 알 때 제 생각을 모으는 것이 더 쉽다고 느낍니다.
… I do feel that normally when I am independent doing my assessment, because I don't have as much of an anxiety level at that point, I don't seem to forget as much … but I feel like it's easier for me to gather my thoughts when I know that I'm not being watched by someone. (P14)

 

불안으로 인한 실수는 특히 좌절감을 주었는데, 그 이유는 '내가 실제로 무언가를 하는 것이 관찰되는 매우 드문 순간에 내가 꽤 잘한다고 느끼는 것을 보여줄 기회를 날려버린 것 같았기 때문이다.' (P8)
Anxiety-induced mistakes were particularly frustrating because ‘… it felt like I had sort of blown off this opportunity to demonstrate that, in a very rare moment where I was actually being observed doing something that I felt that I was reasonably good” (P8).

 

기여요인자
Contributing factors

[직접 관찰이 실제로 무엇이고 무엇을 하려는 의도인지 명확하지 않은 점]은 관찰자의 목적, 관찰자의 역할, 관찰자와 학습자가 어떻게 행동해야 하는지에 대한 의문을 불러일으켰다. 많은 사람들에게 임상 기술을 관찰하는 것은 드물고 예측할 수 없는 일이었다. 한 참가자가 지적한 바와 같이, 직원이 우연히 그곳에 있을 때, 또는 직원이 마음속으로 그 질문에 답하기 위해 특정한 질문을 가지고 있거나 신체적인 부분을 관찰하는 경우가 아니라면 말이다. … 그러한 기술들은 거의 많이 관찰되는 경향이 없다.'(P19). 비록 참가자들은 직접 관찰이 평가 목적으로 발생해야 한다는 것을 인식했지만, 그 발생조차도 불확실할 수 있다. '직접 관찰에 대해 작성해야 할 평가 양식을 가지고 있지만, 나는 그것들이 일반적으로 수행되지 않으며, 수행되지 않아도 어떠한 영향도 없다는 것을 알게 되었다.'(P10) '무소식이 희소식'이라는 암묵적 가정이 있었고, '관찰받지 않음'은 역량이 있음을 시사했다. 따라서 [관찰자의 예상치 못한 출현]은 관찰이 무작위로 발생하는지, 또는 관찰자의 존재가 문제나 결핍을 나타내는지에 대한 의문을 일으켰다.

 


Lack of clarity about what direct observation actually was and what it was intended to do raised questions about its purpose, the observer's role, and how observers and learners should behave. For many, observation of their clinical skills was uncommon and unpredictable: as one participant noted, unless ‘… you fortuitously happen to be there when a staff is there…or if the staff has a particular question and observes part of your history, or physical, in order to answer that question in their mind … those skills don't tend to be observed nearly as much’ (P19). Although participants recognised that direct observation was supposed to happen for assessment purposes, even there its occurrence could be uncertain: ‘we have these evaluation forms that we are supposed to fill out about direct observation but I find that they're not usually done and there are no repercussions if they're not done’ (P10). There was an implicit assumption that ‘no news is good news’, and that a lack of observation was indicative of competence. The unexpected appearance of an observer, therefore, raised questions about whether observation occurred randomly, or if the presence of an observer signalled a problem or deficiency:

제가 특정 클리닉에 있었는데, 같은 병력과 신체검사를 반복해서 하면서 좋은 반응을 얻지 못하는 동안 계속 관찰을 받고 있었다고 가정해 봅시다. 그러면 저는 좌절하게 됩니다. 왜 와서 날 관찰하냐고 물었거든 무슨 문제라도 있어? 문제가 생기면 왜 말을 안 하는 거죠? 만약 매번 교수가 관찰하러 온다면… 아마도 내가 뭔가를 놓치고 있었던건지 궁금할 것 같다(P5)
Let's say I was in a particular clinic, and I was constantly being observed while I did the same history and physical over and over and over and not getting good feedback, then I would get frustrated. Because, I'm like, okay, why are you coming in and observing me, is there an issue? If there's an issue, why aren't you telling me?… If they came in every single time … I would probably say am I missing something? (P5)

[직접 관찰의 예측 불가능성]으로 인해 참가자들은 관찰자의 목적이 감독, 평가 또는 코칭인지 구별하기 어려웠다. 관찰자의 깜짝 등장은 자신의 존재 목적에 대한 명확한 기대의 부족과 맞물려 역할의 모호성과 상당한 정서적 불편함을 유발했다.
The unpredictability of direct observation made it difficult for participants to discern whether the observer's purpose was to supervise, to assess or to coach. The surprise appearance of an observer, coupled with a lack of clear expectations about the purpose of his or her presence, triggered role ambiguity and significant emotional discomfort.

참가자들은 관찰되는 것과 감독받는 것을 구별했지만, 이 용어에 대한 정의는 다양했고, 참가자들은 관찰자의 역할을 둘러싼 불확실성을 강조하면서 각 역할을 구별하는 것을 명확히 표현하기 위해 고군분투했다. 일반적으로 참여자들은 감독을 '효율성'(P13)을 보장하거나, 실수를 포착하기 위한 '안전망'(P19)으로 사용하기 위한 '일이 제대로 되게 하기 위한' '적극적'(P10) 과정으로 개념화했다. 참가자들의 경우, 감독관은 환자의 관리와 의료 지식과 기술을 가르치는 것을 직접 책임졌다. 감독의 특징은 필요한 상황이 되면 감독자가 구두 또는 물리적으로 take over할 수 있다는 기대였다.

Participants differentiated between being observed and being supervised, but their definitions of these terms were variable, and participants struggled to articulate what made each role distinct, highlighting the uncertainty surrounding the observer's role. In general, participants conceptualised supervision as a pragmatic ‘active’ (P10) process that was ‘about getting the job done’ (P13), to either ensure ‘efficiency’ or to use as a ‘safety net’ (P19) to catch mistakes. For participants, a supervisor was directly responsible for a patient's care and for teaching medical knowledge and technique. A feature of supervision was an expectation that the supervisor might verbally or physically take over if the situation required it:

… 내가 분만을 할 직원 몇 명이 생각나는데 특히 내가 좀 더 젊었을 때는 너희 개인 공간에 있을 거야 왜냐면 너희들은 이 우글거리는 아기 주위에 몰려있거든 그리고 그들은 "줄을 만지고, 줄을 더듬고, 어깨를 만지고"라고 말하곤 합니다. 아니면 "그걸 만지지 마세요."라고 말할 것입니다. 가끔 손을 쓸어내리곤 했죠
… I can think of some staff, where I'll do a delivery and especially when I was more junior, they would be sort of right in your personal space because you're all crowded around this crowning baby. And they'd be like, “feel for the cord, feel for the cord or get the shoulder” and they're sort of telling you, or “don't touch that”. You'd have, from time to time, your hands swatted away. (P8)

이와는 대조적으로, [관찰]은 일반적으로 학습을 용이하게 하고 전문적인 개발을 코칭하기 위한 '불간섭' 활동으로 간주되었다. 이 경우 직접 관찰은 학습자가 주도적으로 참여할 수 있는 기회를 제공하고, 스킬을 연습하고, 서비스 제공에 대한 피드백을 받도록 되어 있었다. 그러나 종종 특정 임상적 만남에 대한 명확한 기대는 일반적으로 협상되지 않아 학습자들이 그들이 감독받고 있는지 관찰되고 있는지에 대해 불확실하게 된다. 결과적으로 참가자들은 기본적으로 관찰을 평가로 보고 그에 따라 수행했다.
By contrast, observation was generally considered a ‘hands off’ activity intended to facilitate learning and to coach professional development. In this case, direct observation was supposed to afford learners the opportunity to take the lead, and to practice skills and to receive feedback about their service provision. Often, however, clear expectations for a particular clinical encounter were not typically negotiated, leaving learners uncertain about whether they were being supervised or observed. Consequently, participants defaulted to viewing observation as assessment, and performed accordingly:

 

나는 환자와 이야기를 시작했지만 우리가 같이 상담을 하는 건지 아니면 내가 컨설팅을 담당하는지 불분명했고 그는 그냥 뒤로 물러날 생각이었다. 그래서 시작은 했는데 그냥 저 혼자만 그런 생각을 하고 그가 거기 있다는 사실에 정신이 팔려 끔찍한 역사를 쓰게 된 건 아닌가 하는 생각이 들었어요. 너무 아팠어요. 그래서 결국 그는 그 자리를 물려받았다. 그리고 나서 그는 말했다. "오, 그건 정말 이상했어. 구술시험과 같은 OSCE 상황에서 당신을 관찰하는 것 같았어요. 그리고 저는 정말 그렇게 느꼈어요. 하지만 제 생각엔 사전beforehand에 용어가 명확하지 않았기 때문인 것 같아요... (P8)
I started talking with the patient but I was unclear of whether we were doing the consult together, or whether I was responsible for doing the consult and he was just going to step back. So I kind of started but then I sort of second guessed whether it would just be me and just having those thoughts and being distracted by the fact that he was there and I wasn't sure what his role was, led me to do a terrible history. It was so painful. So then he eventually took over… And then afterwards he had said, ‘Oh that was really strange. It was kind of like I was observing you in an OSCE situation, like an oral structured exam’ and I was like yeah, that's really what it felt like but I think it was because the terms were not necessarily clear beforehand … (P8)

완화 요인
Mitigating factors

직접 관찰과 관련된 당면 과제에도 불구하고 학습자가 관찰 경험에서 학습 가치를 이끌어낸 사례도 인지했다. 일부 사람들에게는 관찰받는 동안 느끼는 '높아진 불안감'은 임상 상황의 스트레스를 시뮬레이션하는 데 유용했다.
Despite the challenges we identified related to direct observation, we also recognised instances where learners drew learning value from their experiences of being observed. For some, the heightened anxiety they felt while being observed was useful, as it simulated the stress of clinical situations:

 

… 관찰은 당신이 실제 사람을 돌본다면 가질 수 있는 아드레날린을 완전히 대체한다고 생각한다. 당신이 책에서 읽은 실제 사례를 기억하도록 도와주는 기억의 정서적 요소, 관찰되는 것의 정서적 요소… 나는 그것을 기억한다… (P1)
… observation, I think, totally replaces that adrenaline that you would have if you were looking after a real person … the affective component of memory that helps you remember real cases, that have been stuff you read in the book, that affective emotional component of being observed … I remember that stuff … (P1)

다른 사람들에게는 신뢰할 수 있는 관찰자가 자신의 연구를 지켜보도록 한 경험이 '자신감 쌓기'(P19)와 안전하고 유능한 임상의로 발전하는 데 매우 중요했다. '모르는 것을 모르는 것은 매우 위험하다.'[P8], 참가자들은 절차 기술을 숙달하고 자신의 '사각지대'(P8)를 식별하기 위해 관찰이 필요하다고 설명했다. 사실, 관찰되지 않는 것은 불안감을 유발할 수 있습니다. 한 참가자는 보다 빈번한 직접 관찰이 그녀의 기술에 대한 의구심을 어느 정도 누그러뜨렸을 것이라고 추측했다.
For others, the experience of having a trusted observer watch their work was critical for ‘building confidence’ (P19) and for ensuring that they were developing into safe, competent clinicians. ‘Not knowing what you don't know is very dangerous’ [P8], and participants described that being observed was necessary for mastering procedural skills and for identifying their ‘blind spots’ (P8). In fact, not being observed could be anxiety-provoking. One participant surmised that more frequent direct observation might have assuaged some of her doubts about her skill set:

저는 다른 면에서는 제 역량에 대해 매우 자신감을 가지고 있지만, 제가 이것을 제대로 하고 있는지 모르겠다고 말하는 부분이 있기 때문에… 저는 누군가가 저를 보기 전에 3학년이 되거나 졸업할 때까지 기다리지 않고 싶습니다. 지금 하는 게 낫다고 생각해서 제 자신이 부족하다고 생각하는 게 아니라 제가 제대로 하고 있는지 잘 모르겠어요. (P10)
I feel very confident with my competence in other respects but I feel that because I have not been observed there is a part of me that says I don't know if I'm doing this right … I don't want to wait until I'm in third year or graduated before someone watches me and says, ‘she's doing it that way?’ I think it's better to have it done now so I would say there is a part of me that feels unclear, not that I don't think I'm competent but I really don't know if I'm doing it right. (P10)

우리의 분석은 관찰자 효과를 완화하는 요인이 그러한 긍정적인 경험이 어떻게 만들어질 수 있는지를 이해하는 데 중요할 수 있음을 시사한다. 관찰되는 것에 대한 불안 요소가 항상 있었지만, 관찰을 일상적인 일로 보는 참가자들에게 정서적 불편은 그렇게 마비되지 않은 것처럼 보였다. 참가자 1은 "나는 관찰에 매우 익숙하다… 나는 항상 관찰된다"고 진술했다. 따라서 관찰이 임상 실습의 [정상적이고 비교적 빈번하며 기대되는 부분]이라고 인식한 전공의에게는, 관찰과 관련된 수행 불안은 긍정적인 학습 결과를 가져왔다. 그렇지 않은 사람들에게는, 정서적인 불편함이 그들의 성과에 부정적인 영향을 미쳤다: '나는 그것이 참신한 경험이라는 사실에서 많은 것이 나온다고 생각한다. 그것은 당신을 당신의 게임에서 약간 벗어나게 합니다.' (P20). [관찰자의 행동]과 [학습자와의 관계]는 관찰자 효과를 완화시킬 수 있다. 관찰자들은 신중하게 선택되었고 명확한 기대와 긍정적이고 직업적인 관계를 맺는 사람을 찾는 것은 편안한 만남을 위한 발판을 마련했다.
Our analysis suggests that factors that mitigate the observer effect may be important in understanding how such positive experience can be created. Although there was always an element of anxiety about being observed, emotional discomfort did not seem as paralysing for participants who viewed observation as a routine occurrence. Participant 1 stated, ‘I'm so used to observation … I'm always observed’, so for this participant, and for others who perceived that observation was a normal, relatively frequent and expected part of clinical practice, the performance anxiety associated with being observed had positive learning outcomes. For others, emotional discomfort negatively impacted their performance: ‘I think a lot of that comes from the fact that it is a novel experience. It does throw you off your game a little bit’ (P20). The observer's behaviour and his or her relationship to the learner could also mitigate the observer effect. Observers were carefully chosen and finding one who set clear expectations and a positive, professional relationship set the stage for a comfortable encounter:

 

그때의 차이는 그 특정 교사와 좋은 관계를 맺었고, 그 사실을 인지하고 있었고, 그런 일이 일어나고 있다는 것을 알고 있었기 때문에 정신적으로 대비할 수 있었을 것이라고 생각합니다. 왜냐하면 제가 좀... 제가 그 스태프들과 좋은 관계를 맺고 미리 알고 있지 않았다면 아마 불안감을 불러일으켰을 것입니다. (P22)
I think the difference in that case might have been that I'd had a good relationship with that particular preceptor at that point, and I was aware of it, I knew it was happening, so I could be prepared mentally for that. Because I felt it was a little … it probably would have been anxiety-provoking if I hadn't had such a good relationship with that staff, and known about it in advance. (P22)

일부 참여자는 관찰자의 행동이 경험의 유용성에 미치는 영향을 인식하고 관찰자가 효과적일 수 있는 방법을 제안하였다.

Some participants recognised the impact of an observer's behaviour on the usefulness of the experience and suggested ways that an observer might be effective:

 

저는 입을 다물 수 있는 능력이 좋은 관찰자를 만든다고 생각합니다. 왜냐하면 끊임없이 끼어들면 더 이상 관찰하지 않기 때문입니다. 그러니까 조용히 지켜볼 수 있어야 할 것 같아요. 그리고 나서, 여러분이 보고 있던 것을 어느 정도 분해할 수 있습니다. 그래야 좋은 것뿐만 아니라 나쁜 것도 볼 수 있습니다. 그리고 꼭 나쁜 점이 없다면, 어떻게 하면 더 좋은 것을 만들 수 있는지 보세요. 우리는 항상 더 잘 할 수 있으니까요. (P3)
I think the ability to shut up makes a good observer, because if you're constantly interjecting, you're not observing anymore. So, I think you have to be able to be quiet and watch. And then, really be able to sort of break down what you were seeing, so that, not only can you see the good, but you can see the bad as well. And if there's not something that's necessarily bad, see how to make something better, because we can always be doing better. (P3)

 

논의
Discussion

관찰 행위가 사건의 결과를 바꾼다는 것은 과학적 원리이다.
It's a scientific principle that the act of observation is changing the outcome of an event. (P21)

 

직접 관찰은 교육생들이 단계적 또는 실제 임상적 만남에서 어떻게 수행하는지 확인할 수 있는 귀중한 기회를 제공하고, 학습자들이 자신의 장단점을 파악할 수 있도록 피드백을 만들 수 있도록 도와준다. 특히, 작업 환경에서 학습자를 관찰하는 것은 '학습자가 알고 있는 것을 넘어 실제로 무엇을 하는지 볼 수 있는 기회를 제공하는데, 이는 기본적으로 자격을 갖춘 의사를 교육하는 데 필수적이다'. 그러나, 우리의 연구 결과는 관찰자의 존재가 학습자의 임상 행동을 변경하는 의도하지 않은 결과도 발생시켜 관찰된 성과가 실제로 무엇을 하는지 정확하게 반영하는지 의문을 갖게 한다는 것을 시사한다. 자체 성과에 대한 진정성이 의심되므로 관찰자가 신뢰할 수 있더라도 해당 성과에 대해 받는 피드백의 신뢰성은 떨어질 수 있다고 추측한다. 관찰자 효과는 다른 환경에서 잘 연구되지만, 우리의 연구는 의학 교육 담론에서 제한적이지만 영향력 있는 역할에 대해 확장되며, 부분적으로 전공의가 관찰받는 것에 대해 갖는 양면성을 설명할 수 있다.34
Calls to increase the amount of direct observation in postgraduate medical education make intuitive sense; direct observation offers a valuable opportunity for educators to see how trainees perform during staged or real-world clinical encounters, and to craft feedback to help learners identify their strengths and weaknesses.2 Specifically, observation of learners in workplace settings ‘offers the opportunity to see beyond what they know and into what they actually do, which is fundamentally essential to training qualified physicians’.10 However, our findings suggest that the presence of an observer also creates unintended consequences that alter learners’ clinical behaviour, leading them to question whether their observed performance accurately reflects what they actually do. With the authenticity of their own performance in doubt, we speculate that the credibility of the feedback they receive on that performance may be diminished, even if the observer is trustworthy. The observer effect is well studied in other settings, but our research expands on its limited, yet impactful, role in the medical education discourse and may explain, in part, the ambivalence residents have about being observed.34

유능하고 환자 중심적인 의사가 되기 위해서 학습자는 

  • 기술적 합리성(닥터링 작업에 필요한 '교과서' 지식 및 절차적 기술)을 익히고 
  • 전문적인 예술성(전문가들이 직장 기반 경험과 의학의 역학을 종합하여 의사 기술을 연습하는 방법)을 연마해야 한다. 

Becoming a competent, patient-centred physician requires learners
▶ to master technical rationality (the ‘textbook’ knowledge and procedural skills required to do the work of doctoring) and
▶ to hone professional artistry (the way experts practice the art of doctoring by synthesising the mechanics of medicine with workplace-based experience).3536 

우리는 관찰되는 것에 대한 학습자의 양면성은 [학습 방법]과 [직업적 정체성을 개발하는 방법]과 관련된 인식론적 긴장과 관련이 있다고 제안한다. 즉, 학습자의 수행 목표는 중요도가 감소하는 세 가지 수준으로 계층적으로 구성된다. 

  • 자신의 자아 개념(또는 존재 방법), 
  • 의사 과업을 숙달 
  • 의사 과업을 학습.

We suggest that learners’ ambivalence about being observed is related to epistemological tensions pertaining to how they learn and to how they develop their professional identities. That is, learners’ performance goals are hierarchically organised at three levels of decreasing importance:

  • their self-concept (or ways of being),
  • mastering the tasks of doctoring and
  • learning the tasks of doctoring.3738 

참가자들은 자율학습과 서비스 제공의 시행착오를 통해 기술적 합리성과 전문적인 예술성을 크게 연마했다고 인식했으며, 직접 관찰의 목적은 [과제 평가와 과제 학습을 평가하는 것]이라고 가정했다. 그들은 관찰이 자신의 개인적 또는 직업적 발전을 위한 것이라고 생각한 적이 거의 없다. 따라서 관찰을 받는 것은 참가자들의 [자율성]과 [성장하는 자아 개념]과 충돌하기 때문에 상당한 정서적 불편함을 야기했다. 결과적으로, 참가자들은 그들의 관찰자에게 깊은 인상을 주기 위해 공연을 해야 한다는 압박감을 느꼈다.

Participants perceived that they largely honed their technical rationality and professional artistry35, 36 through the trial and error of autonomous learning and service provision; they assumed that the purpose of direct observation was to assess tasks and their task learning. They rarely, if ever, thought of an observation as being for their personal or professional development. Being observed, therefore, created significant emotional discomfort because it conflicted with participants’ autonomy21 and burgeoning self-concept, because it was perceived as relatively novel and because it was almost always perceived as a high-stakes proposition.39 Consequently, participants felt pressured to stage a performance to impress their observer.

우리의 발견은 문학에 두 가지 새로운 기여를 한다. 

  • 첫째, 참가자들은 관찰과 감독을 구별하는 데 어려움을 겪었고, 따라서 관찰자의 역할과 목적에 대해 불확실했다. 그럼에도 불구하고, 관찰자의 존재는 그들이 평가받고 있다는 것을 암시했다. 
  • 둘째로, '관찰자 효과'는 접수된 피드백의 신뢰성을 훼손할 수 있는 방식으로 그들의 성능을 변화시키는 것으로 인식되었다.

Our findings make two novel contributions to the literature.

  • First, participants had difficulty distinguishing between observation and supervision, and they were therefore uncertain about the observer's role and purpose. Regardless, the presence of an observer signalled for them that they were being assessed.
  • Second, an ‘observer effect’ was perceived to alter their performance in a way that could undermine the credibility of the feedback received.

 

관찰자들은 '관찰'하고 있는가, 아니면 '감독'하고 있는가?
Are observers ‘observing’ or ‘supervising’?

참석자들은 직접 관찰이 무엇인지, 무엇을 하려는 것인지에 대한 기대는 종종 명확하게 표현되지 않았다고 설명했다. 그들은 다음을 거의 알지 못했다.

  • 관찰이 언제 일어날지,
  • 관찰이 어떻게 전개될지,
  • 관찰자의 목적이
    • 지식과 기술을 평가하는 것인지,
    • 환자의 안전을 보장하는 것인지,
    • 전문적 개발을 육성하는 것인지

Participants described that expectations of what direct observation is, and what it is intended to do, were often not clearly articulated. They rarely knew

  • when an observation would occur,
  • how the observation would unfold, and
  • whether the observer's purpose was
    • to assess their knowledge and skill,
    • to ensure patient safety or
    • to nurture their professional development.

즉, 학습자들은 자신이 관찰되고 있는지 감독되고 있는지 확신하지 못했습니다. 지도와 관찰은 별개의 교육 전략이지만, 그 용어들은 문헌과 실제로 서로 교환적으로 사용된다. 상당히 중복되는 부분이 있지만 감독과 관찰의 차이를 이해하려면 전경에 있는 내용, 관찰자와 학습자 사이의 거리, 교육학적 역할을 누가 수행할 수 있는지에 주의를 기울여야 한다.

In other words, learners were unsure whether they were being observed or supervised. Supervision and observation are distinct curricular strategies, yet the terms are used interchangeably in the literature and, we suspect, in practice. Although there is considerable overlap, making sense of the differences between supervision and observation requires paying attention to what is foregrounded, to the distance between the observer and the learner, and to who is able to fulfill pedagogical roles.

[감독]이란 '의사가 환자를 관리하는 맥락에서 개인적, 전문적, 교육적 발전에 관한 문제에 대한 모니터링, 지도 및 피드백 제공'을 말한다. 감독은 환자 안전을 우선시한다. 비록 책임감이 있고 점진적인 독립성을 가지고 있지만, 훈련생들이 '가장 책임감 있는 의사'에 의해 감독될 것이라는 기대가 있다. 감독자는 자신이 하는 일의 한 요소로 직접 관찰을 사용하지만, 감독자는 멀리 떨어져 있거나, 물리적으로는 존재하지 않는 경우도 있다

반면, [직접 관찰]은 관찰자가 학습자가 어떻게 수행하는지 적극적으로 관찰한다는 것을 의미하지만, 그러나 모든 관찰자가 반드시 교육생을 감독supervising할 책임이 있는 것은 아니다. 다양한 관찰자(예: 환자, 제휴 보건 전문가, 주니어 교육생 등)가 학습자 성과를 관찰하고 의견을 제시할 수 있다; 비록 환자 안전이 종종 직접 관찰의 중요한 부분이지만, 학습자의 교육과 전문적인 개발이 더 중심일 때도 있다.

Supervision is ‘the provision of monitoring, guidance and feedback on matters of personal, professional and educational development in the context of a doctor's care of a patient’.40 Supervision prioritises patient safety40; there is an expectation that trainees will be supervised by the ‘most responsible physician’, albeit with graduated responsibilities and progressive independence.41, 42 Supervisors use direct observation as one component of what they do, but supervision may also occur at arm's length, sometimes without the supervisor being physically present.

By contrast, direct observation implies that an observer is actively watching how learners perform; not all observers, however, are necessarily responsible for supervising trainees. Learner performance may be watched, and perhaps commented on, by a range of observers (e.g. patients, allied health professionals, junior trainees, etc.); although patient safety is often an important piece of direct observation, a learner's education and professional development sometimes take centre stage.

그러나 주치의는 일반적으로 감독과 관찰의 이중적인 역할을 하며, 관찰자와 피관찰자 모두에게 그 불분명하다. 중복이 발생하기 때문에 혼란이 지배하고 참가자들의 혼란은 직접적인 관찰을 학습에 가치 있는 것으로 인식하는지 여부에 직접적인 영향을 미치는 것처럼 보였다.

However, attending physicians typically have the dual role of supervising and being asked to observe, and the delineations are opaque both for observers and for those being observed. Because overlap occurs, confusion reigns and participants’ confusion seemed to directly impact whether or not they perceived direct observation as valuable to their learning.

감독, 코칭, 종합평가 등 직접 관찰은 훈련의 모든 단계에 자리 잡고 있지만, 관찰은 평가와 불가분의 관계에 있다는 참가자들의 여전한 인식에 놀랄 수 밖에 없었다. 하지만 그렇게 되면 안 된다. 관찰의 목적에 대한 관찰자의 의도와 기대보다, [학습자가 관찰자의 의도된 목적을 어떻게 인식했는지]가 더 중요하다. 참가자들은 임상 작업을 능숙하고 독립적으로 수행할 수 있다고 신뢰할 수 있는지 여부를 측정하기 위해 직접 관찰되었음을 인지했다. '코치로서의 관찰자'는 전공의가 관찰받은 경험과는 정반대처럼 보였다. 결과적으로 관찰의 목적과 기대에 대한 명확성의 부족은 그들의 역할의 모호성을 악화시켰다. 즉, 관찰자가 있는 곳에서 참가자들은 학습자로서 행동해야 할지 의사로서 행동해야 할지 몰랐다.

Although direct observation, for supervision, for coaching or for summative assessment, has a place at all stages of training, we were struck by participants’ lingering perceptions that observation was inextricably linked to assessment. But perhaps we shouldn't be. The observer's intentions and expectations for the observation's purpose matter less than what learners’ perceive the observer's intended purpose to be.43 Participants perceived that they were directly observed to gauge whether or not they could be trusted to competently and independently perform clinical work44; ‘the observer as coach’ seemed antithetical to their observation experiences. Consequently, lack of clarity about the purpose of and expectations for the observation exacerbated their role ambiguity; in other words, in the presence of an observer, participants did not know whether to behave as a learner or as a doctor.

전공의들은 직접 관찰이 그들의 직업적 발전과 반비례적으로 관련이 있다고 가정했다고 추측한다. 즉, 참가자들이 점진적인 독립성을 얻음에 따라, 그들은 직접 관찰이 그들의 일상적 임상 작업에서 물러날 것으로 예상하였다.21 직접 관찰이 오직 그들의 전문적 개발을 지도하는 데 사용될 수 있다는 것이 참가자들에게는 믿기 어려워 보였기 때문에, 임상의-관찰자가 갑자기 등장하는sporadic 모습은 [참가자들이 경계를 늦추지 않도록 알람을 울리는 깜짝 이벤트]로 인식되었다. 그래서 전공의는 자동으로 [평가(피평가자) 모드]가 기본이 되었다고 설명했습니다. 구체적으로 참가자들은 'doing'에 초점을 두거나, 임상적 사실을 이해하고 있거나 임상 기술을 수행하기 위한 '교과서' 접근법을 알고 있다는 것을 입증하고자 했다. 반대로, 자신의 'being' 또는 '예술을 과학적 의학에 통합하는 방법'을 보여주는 것은 억제하였다. 우리의 연구 결과는 관찰자의 존재가 훈련생의 수행 방식을 변화시킨다는 일화적 증거를 뒷받침하는 경험적 연구를 제공한다.47
We speculate that participants assumed that direct observation was supposed to be inversely related to their professional development. In other words, as participants earned progressive independence, they expected that direct observation would recede from their everyday clinical work.21 Because it seemed implausible to participants that direct observation might be used solely to coach their professional development, the sporadic appearance of a clinician-observer was perceived as a surprise that sounded an alarm for participants to be on guard. In response, participants described that they automatically defaulted to performing in assessment mode. Specifically, participants focused on doing or demonstrating that they understood clinical facts or that they knew the ‘textbook’ approach for performing a clinical skill, and suppressed their being, or how they integrated art into the science of medicine.45, 46 Our findings provide empirical research to support anecdotal evidence that the presence of an observer changes how trainees perform.47

'관찰자 효과'
The ‘observer effect’

서로 다른 기대와 접근 방식은 성과에 대한 다른 인식을 초래할 수 있으며, 관찰되는 것은 행동을 변화시키는 것으로 잘 알려져 있다. 호손 효과는 20세기 초 시카고의 웨스턴 일렉트릭 전화 공장에서 조명, 휴식, 관찰을 포함한 업무 변수가 직원 성과에 어떤 영향을 미치는지 측정한 일련의 연구를 통해 처음 설명되었다. 변수를 조작하는 방법과 관계없이, 연구자들은 관찰이 근로자의 생산성에 상당한 영향을 미치고 그들의 성과에 영향을 미친다고 결론 내렸다.54 노련한 건강관리 전문가도 관찰자 효과에 면역이 되지 않는다. 임상의는 '단순이 연구가 진행되고 있다는 사실'만으로도, 자신의 진단 및 처방 행동을 변경하고, 손 위생 프로토콜과 임상 관행 권장사항을 더 잘 준수한다. 행동 변화는 임상의가 평소 임상 환경에서 관찰된 경우에도 관찰자의 불편함을 최소화하려는 시도와 무관하게 발생한다. 동료 임상의가 관찰하는 것은 관찰자 효과의 영향을 강화할 수 있으며, 불편함은 성과나 행동을 변화시키는 강력한 동기가 될 수 있다.
Different expectations and approaches can lead to different perceptions of performance,48, 49 and being observed is well known to change behaviour.50-56 The Hawthorne, or observer, effect was first described after a series of early 20th century studies at the Western Electric telephone factory in Chicago, which measured how workplace variables, including illumination, rest and observation, impacted employee performance.53 Regardless of how they manipulated variables, researchers concluded that being observed significantly influenced workers’ productivity and altered their performance.54 Even seasoned health care professionals are not immune to the observer effect. Clinicians alter their diagnostic and prescribing behaviours52 and demonstrate better compliance with hand hygiene protocols55 and clinical practice recommendations56 ‘merely as the result of being studied’.52 Changes in behaviour occur even if clinicians are observed in their usual clinical environments, and regardless of the observer's attempts to be unobtrusive or to minimise their discomfort.56 Being observed by a fellow clinician may intensify the impact of the observer effect, and discomfort may be a strong motivator for changing performance or behaviour.56

연구에서 관찰자 효과는 부분적으로 인위적인 연구 조건에 기인하며, 결과에 대한 잠재적인 설명 또는 제한으로서 통제되거나 인정된다. 그러나 문헌에 따르면 직장 기반 관찰의 목적은, 학습자가 자연주의 임상 환경에서 어떻게 수행하는지 보기 위한 [시험 설정의 인위성]을 회피하는 것이다. 대신, 의학 교육 및 연구에서 직접 관찰은 부분적으로 직접적인 관찰과 효과적인 피드백 사이의 추정된 관계 때문에 참조 표준 교육 및 평가 전략으로 널리 가정된다. 피드백은 학습의 기반으로 간주되지만 피드백의 효과는 [신뢰성credibility]에 달려 있습니다. 학습자가 피드백을 신뢰할 수 있는 것으로 인식하려면 피드백이 중심이 되는 활동을 관찰해야 하며 관찰자가 신뢰할 수 있어야 합니다. 본 논문의 기여는 신뢰성credibility의 또 다른 핵심 요소가 [관찰된 성능의 인식된 진정성perceived authenticity]임을 발견했다는 데 있다.
In research, an observer effect is attributed, in part, to artificial study conditions, and it is either controlled for, or acknowledged, as a potential explanation for, or limitation of, the results.50, 51, 57, 58 The literature suggests that the purpose of workplace-based observation is, however, to circumvent the artificiality of exam settings to see how learners perform in a naturalistic clinical environment; the potential for an observer effect to influence workplace learning and performance is rarely considered. Instead, in medical education and research, it is widely assumed that direct observation is a reference standard teaching and assessment strategy, in part because of the presumed relationship between direct observation and effective feedback. Feedback is considered a foundation of learning,59 but the effectiveness of feedback relies on its credibility. For learners to perceive feedback as credible, the activities upon which the feedback is centred should be observed,60 and the observer must be trustworthy.18, 60-62 Our paper's contribution is in uncovering another key element of credibility: the perceived authenticity of the observed performance.

시사점Implications

피드백이 학습에 영향을 미치려면 학습자의 자체 평가 및 목표와 일치해야 합니다. DeNisi와 Kluger는 학습자가 과제나 과제 학습을 자신의 자아 개념에 대한 비판으로 다루기 위한 피드백을 해석할 때 부정적인 반응을 보인다는 이론을 세웠다. 우리는 피드백이 속임수라고 주장한다. 직업적 정체성의 침해는 고통스러우며, 참가자들에게는 [관찰받는 것]이 [자신의 독립성과 기술에 대한 가정]과 충돌할 때 스트레스와 불안감을 자극한다. 따라서 관찰자의 피드백에 대한 학습자의 반응에 부정적인 감정이 나타날 수 있지만, 우리는 관찰자의 존재가 학습자의 자아 개념에 가장 큰 위협이 된다고 추측한다. 즉, 학습자가 의사로서 했을 행동을 반영하지 않는 학습자로써의 성과를 '준비'했다고 인식한다면, 그 거짓된 수행에서 생성된 피드백을 가치 있게 여기지 않을 수 있습니다.
For feedback to impact learning, it must align with a learner's self-assessment and goals60, 63; DeNisi and Kluger theorise that learners’ respond negatively when they interpret feedback intended to address task or task learning as a critique of their self-concept.37 We contend that feedback is a red herring. Violations of professional identity are distressing,46 and for participants, being observed became stressful and anxiety provoking when it clashed with their assumptions about their independence and skill. Therefore, although negative emotions may manifest in learners’ responses to an observer's feedback,37, 38 we speculate that it is the appearance of an observer that poses the greatest threat to a learner's self-concept, and in turn, to learners’ receptivity to feedback. In other words, if learners perceive that they ‘staged’ a performance as a learner that doesn't reflect what they would have done as a doctor, they may be unlikely to value feedback generated from that inauthentic performance.

우리는 [인식된 관찰자 효과]가 [유용한 피드백이 부족하다는 학습자의 인식]을 부분적으로 설명할 수 있다고 제안한다. 학습자가 보다 철저하고 세심한 방식으로 수행하도록 하기 위해 [관찰자가 가하는 암묵적인 압력]이 학습에 가치가 있을 수 있지만, 교육자는 관찰자 효과가 학습자의 수행에 대한 인식을 진실한authentic 것에서 비진실한inauthentic 것으로 옮겨갈 위험이 있고, 결과적으로 피드백의 신뢰성을 저해시킨다. 만약 참가자의 인식이 정확하다면, 임상의사 교육자에게 '실제적 수행authentic performance'를 평가하는 것은 불가능하지는 않지만 특히 어려운 일이 된다.

We suggest that a perceived observer effect may partly explain learners’ perceptions that useful feedback is scant.56 Although there may be learning value in the implicit pressure exerted by an observer to make learners perform in a more thorough and meticulous way, educators must recognise that an observer effect risks moving the learner's perception of their performance from authentic to inauthentic, thus minimising the credibility of feedback they receive. If participants’ perceptions are accurate, then assessing an ‘authentic performance’ is difficult, if not impossible, for clinician educators. 

의사 소통자, 건강 옹호자 및 전문적 역할을 관찰하고 평가하는 것은 특히 문제가 될 수 있다. 예를 들어 환자 중심의 의사소통에는 즉흥성이 필요하다. 전공의들이 평소 환자를 볼 때에는, 각각의 환자에게 그들의 의사소통 방식을 맞추었다고 묘사했다. 그러나 관찰자 앞에서 그들은 형식적이고 형식적인 접근법을 채택하는 것을 설명했고, 임상의 교육자들이 직접 관찰을 통해 의사소통과 다른 핵심 역량을 검증적으로 평가할 수 있는지에 대한 의문을 제기했다.

Observing and assessing the communicator, health advocate and professional roles may be particularly problematic. For instance, patient-centred communication requires improvisation64; in their usual practice, participants described tailoring their communication style to each patient. In the presence of an observer, however, they described adopting a formal and formulaic approach, raising questions about whether it is possible for clinician educators to authentically evaluate communication and other key competencies through direct observation.

우리는 직접적인 관찰이 중요하지 않거나 헛된 것이라고 제안하는 것이 아니다. 평가에서 직접 관찰의 역할은 가치 있고 잘 설명되어 있습니다. 주니어 레지던트들에게 의사로서 체크리스트 작업을 하는 것은 유용하다; 그러나 시니어 레지던트들은 그들이 발전하는 역량을 전문적인 정체성에 통합할 수 있도록 도움을 주는 코칭을 필요로 한다. '학생들이 자신이 누구인지, 자신이 누구인지, 그리고 누가 될 수 있도록 돕기 위해 지속적이고 종적으로 노력하는 것에 중점을 두어야 한다. 실제 성과와 평가에 대한 인식에 영향을 미치는 '관찰자 효과'의 잠재성에도 불구하고, 직접적인 관찰은 임상 교육자가 학습자가 의사 업무를 수행하는 방법을 확인하고 학습자가 안전하고 유능한지 평가하는 최선의 방법으로 남아 있다.10 일부 참가자는 관찰되는 것을 중요하게 여겼다. 관찰자가 자신의 '실시간' 의사결정과 환자 및 동료와의 상호작용을 보는 것이 학습에 유리하다고 설명했다. 이러한 참가자들에게 직접적인 관찰은 그들의 학습과 직업 발달에 긍정적인 영향을 미치는 중요하고 심지어 중요한 교육 전략이었다.

We are not suggesting that direct observation is unimportant or futile. The role of direct observation in assessment is valuable and well described. For junior residents, being observed doing the checklist work of doctoring is useful; however, senior residents require coaching to help them integrate developing competencies into a professional identity and ‘the emphasis should be on trying continuously and longitudinally to help students to find out who they are, who they are becoming, and who they wish to become’.65 Despite the potential for an ‘observer effect’ to impact perceptions of authentic performance and assessment, direct observation remains arguably the best way for clinician educators to see how learners do the work of doctoring, and to assess whether learners are safe and competent.10 Some participants valued being observed and described that having an observer see their ‘real-time’ decision-making and interactions with patients and colleagues was advantageous for their learning. For these participants, direct observation was an important, even critical, educational strategy that had a positive impact on their learning and professional development.21

우리는 직접 관찰이 학습에 지속적으로 긍정적인 영향을 미치려면 임상의사 교육자들이 직접 관찰을 개념화하고 참여하는 방법에 대해 다르게 생각할 필요가 있다고 제안한다. 학습에 대한 직접 관찰의 신뢰성과 가치를 극대화하려면 다음 세 가지 기능이 필요합니다. 

  • (i) 학습자는 관찰자를 신뢰하고 좋은 관계를 가져야 한다. 
  • (ii) 관찰자는 예상을 분명하게 표현해야 한다. 
  • (iii) 관찰이 평가와 연결되어 있을 때와 연결되어 있지 않을 때 명확해야 한다.

We are suggesting that for direct observation to consistently have a positive impact on learning, clinician educators need to think differently about how they conceptualise and engage in direct observation. To maximise the credibility and value of direct observation for learning, three features are required:

  • (i) learners must trust, and have a good relationship with, the observer,22 
  • (ii) the observer must clearly articulate expectations, and
  • (iii) it should be clear when observation is connected with assessment and when it is not.

 

나아갈 길
A way forward

역할의 모호성을 피하고, 불확실성과 수행에 대한 불안을 줄이고, 진위성에 대한 인식을 완화하기 위해, 관찰자는 [학습자의 의료 전문지식을 평가하는 것]인지 또는 [학습자의 전문적 개발을 코칭하는 것]인지 명확히 표현하는 것이 필수적이다. 즉, 관찰자는 학습자가 의사로서 업무수행 방식을 평가하는 것이 목표인지, 의사가 되는 방식을 육성하는 것이 목표인지를 학습자를 위해 명확히 해야 한다. 브리티시컬럼비아 대학의 임상의-과학자들은 최근 진정한 임상 환경에서 관찰과 피드백을 정상화하고 평가를 강조하지 않으며 학습자와 교사 모두에게 프로그램의 코칭 의도를 명확하게 설명하는 유망한 코칭 기반 피드백 프로그램을 시범 운영했다. 비록 이 혁신적인 프로그램은 유망하지만, 물류 문제를 해결하고 레지던트 프로그램 전반에 걸쳐 유사한 혁신을 성공적으로 구현하기 위한 전략을 고안하기 위해서는 더 많은 작업이 필요하다. 특히 임상의사 교육자들은 임상적, 학술적 의무에 대한 과중한 부담을 안고 있어 이러한 유형의 관찰 프로그램이 필요로 하는 시간 동안 바쁜 스케줄에 공간을 내기가 어렵다. 학습자에게 도움이 되고 교육자에게 실현가능하기 위해서는 관찰자의 존재에 익숙해지기 위해 얼마나 자주, 그리고 얼마나 오랫동안 직접적인 관찰을 해야 하는지에 대한 더 나은 증거가 필요합니다.

To avoid role ambiguity, to reduce uncertainty and performance anxiety and to mitigate perceptions of inauthenticity, it is imperative for observers to clearly articulate if their purpose is to assess learners’ medical expertise or to coach learners’ professional development. In other words, observers must clarify for learners whether their goal is to assess how a learner does the work of a physician or to nurture the ways he or she becomes a physician. Clinician-scientists at the University of British Columbia recently piloted a promising coaching-based feedback programme 22 built on normalising observation and feedback in authentic clinical settings, de-emphasising assessment and clearly articulating the coaching intent of the programme to both learners and teachers. Although this innovative programme is promising, more work is required to address logistical issues and to devise strategies to successfully implement similar innovations across residency programmes. Specifically, clinician educators are overburdened with clinical and academic duties, rendering it difficult to make room in their busy schedules for the time this type of observation programme requires. To be helpful for learners and to be feasible for educators, we also require better evidence about how frequently, and for how long, direct observation needs to occur for learners to become accustomed to the presence of an observer.

또한 신뢰할 수 있는 관찰자가 되는 것이 무엇을 의미하는지에 대한 인식을 넓힐 필요가 있다. 참가자들은 참가자들이 그들의 행동을 변화시키는 정도가 누가 지켜보는가에 따라 다르다고 보고했다. 참가자들은 의사가 아닌 다른 사람이 보고 있을 때 더 진실하게 수행했다(고 인식했다). 멀티소스 피드백 연구는 직장 기반 평가가 학습자 성과에 영향을 미친다는 가장 확실한 증거를 제공하기 때문에 환자와 가족을 의료 교육 및 평가에 참여시키는 타당성과 신뢰성을 탐구하는 연구는 시기적절하고 중요하다. 예를 들어 환자와 가족 구성원은 학습자 성과(예: 교과서의 의료 지식 또는 절차 기술)의 특정 측면에 대해 신뢰할 수 있는 피드백을 제공할 수는 없겠지만, 학습자가 자신의 요구를 충족하는 방식으로 소통하거나 옹호하는지 여부에 대한 피드백을 제공할 자격이 있다. 환자와 가족이 의료 교육 및 평가에 보다 의미 있게 참여할 수 있는 가능성을 평가하려면 추가 증거가 필요하다.

Another way forward is to broaden perceptions about what it means to be a credible observer. Participants reported that the degree to which participants altered their behaviour depended on who was watching; participants performed, or perceived that they performed, more authentically when someone other than a physician was watching. Because multisource feedback research provides the most robust evidence that workplace-based assessments impact learner performance,66 research exploring the feasibility and credibility of engaging patients and families in medical education and assessment is timely and critical. For instance, although patients and family members may not be able to provide credible feedback about certain aspects of learner performance (e.g. textbook medical knowledge or procedural skills)67 they are qualified to provide feedback about whether or not learners communicate with or advocate for them in ways that meet their needs. Additional evidence is required to assess the feasibility of more meaningfully engaging patients and families in medical education and assessment.

제한사항Limitations


우리의 연구 결과는 두 개의 캐나다 학술 센터에서 거주자들의 경험을 설명하며, 따라서 다른 환경에 대한 일반화를 의도하지 않는다. 이것은 인식에 대한 연구인데, 이는 학습자가 관찰자를 참석시킴으로써 자신의 수행이 부정적으로 변했다고 인식할 수 있지만 실제로는 그렇지 않을 수 있다는 것을 의미한다. 마찬가지로, 그들은 직접 관찰이 그들이 인식하는 것보다 더 많이 지시하더라도 교육적 가치나 영향을 거의 제공하지 않는다고 인식할 수 있다. 이러한 가능성에도 불구하고 학습자의 인식은 중요합니다. 인식은 피드백이 반향을 일으킬 가능성에 영향을 미치며 임상 교육자는 피드백을 관찰하고 작성할 때 잠재적인 관찰자 효과에 대한 인식을 사용할 수 있습니다. 임상의사 교육자들이 자신의 존재가 학습자 성과에 영향을 미친다고 인식하는지 여부를 탐구하는 연구도 필요하다.

Our findings describe the experiences of residents at two Canadian academic centres and are therefore not intended for generalisation to other settings. This is a study of perceptions, which means that learners might perceive that their performance has been altered negatively by having an observer present, but it may not actually be. Similarly, they might perceive that direct observation offers little educational value or impact, even if it directs them more than they recognise. Notwithstanding these possibilities, learners’ perceptions matter; perceptions influence the likelihood that feedback will resonate and clinician educators can use their awareness of a potential observer effect when they observe and when they craft their feedback. Research exploring whether or not clinician educators perceive that their presence impacts learner performance is also warranted.

결론 Conclusion


관찰자 효과 또는 관찰자가 있을 때 발생하는 의도하지 않은 결과가 있다. [학습자의 성과를 변화시킬 수 있으며, 직접 관찰의 진정성과, 그에 따른 피드백의 인식된 신뢰성에 대한 의문]을 갖게 한다. 직접 관찰의 참신함에 대한 인식은 그들의 성과가 평가되고 있다는 인식과 결합되어 참가자들이 그들의 작업에 접근하는 방식을 바꾸는 상당한 스트레스와 불안감을 야기했다. 참가자들이 관찰자 앞에서 자신이 평가받고 있다고 느낀 것은 놀라운 일이 아닐 것이다. 참가자들에게 관찰자의 존재는 [스트레스와 불안감을 유발]하며, 본의 아니게 그들의 [역할 모호성을 악화]시켜, 그들의 [직업적 정체성 형성을 둘러싼 긴장]을 강화시킬 수 있다. 이 두 가지 경험 모두 관찰되는 것에 대한 양면성을 영속시키는 전반적인 불편감에 기여한다. 우리는 직접적인 관찰이 중요하지 않다고 말하는 것이 아니다. 그러나 우리는 교육자들이 관찰자 앞에서 어떻게 레지던트가 수행하는지가 독립적인 의사로서 실제로 하는 일을 반영하지 못할 수 있으며, 이는 관찰과 수행자의 피드백이 그들의 학습에 얼마나 가치 있다고 느끼는지에 미치는 파급 효과를 인식해야 한다고 제안한다.

The observer effect, or the unintended consequences that happen when an observer is present, may alter learners’ performance, raising questions about the authenticity of direct observation and the perceived credibility of the feedback that arises from it. The perceived novelty of direct observation, coupled with perceptions that their performance was being graded, created significant stress and anxiety that altered how participants approached their work. It is perhaps not surprising that participants felt that, in the presence of an observer, they were being assessed. For participants, the presence of an observer is stressful and anxiety-provoking and may unintentionally exacerbate their role ambiguity, intensifying tensions around their professional identity formation. Both of these experiences contribute to an overall sense of discomfort that perpetuates ambivalence about being observed. We are not suggesting that direct observation is unimportant. But we are suggesting that educators need to be aware that how residents perform in the presence of an observer may not reflect what they actually do as independent practitioners,68 and that this has a ripple effect on how valuable they feel the observation and attendant feedback is to their learning.

 

 


 

 

Med Educ. 2017 May;51(5):498-510.

 

 doi: 10.1111/medu.13232. Epub 2017 Feb 28.

 

Staging a performance: learners' perceptions about direct observation during residency

Affiliations collapse

Affiliations

1Centre for Education Research & Innovation, Schulich School of Medicine and Dentistry, Western University, London, Ontario, Canada.

2Department of Medicine, University of British Columbia, Vancouver, British Columbia, Canada.

3Department of Medicine and Centre for Education Research & Innovation, Schulich School of Medicine and Dentistry, Western University, London, Ontario, Canada.

4Department of Clinical Neurological Sciences and Centre for Education Research & Innovation, Schulich School of Medicine and Dentistry, Western University, London, Ontario, Canada.

PMID: 28247495

DOI: 10.1111/medu.13232

Abstract

Context: Evidence strongly supports that direct observation is a valid and reliable assessment tool; support for its impact on learning is less compelling, and we know that some learners are ambivalent about being observed. However, learners' perceptions about the impact of direct observation on their learning and professional development remain underexplored. To promote learning, we need to understand what makes direct observation valuable for learners.

Methods: Informed by constructivist grounded theory, we interviewed 22 learners about their observation experiences. Data collection and analysis occurred iteratively; themes were identified using constant comparative analysis.

Results: Direct observation was widely endorsed as an important educational strategy, albeit one that created significant anxiety. Opaque expectations exacerbated participants' discomfort, and participants described that being observed felt like being assessed. Consequently, participants exchanged their 'usual' practice for a 'textbook' approach; alterations to performance generated uncertainty about their role, and raised questions about whether observers saw an authentic portrayal of their knowledge and skill.

Conclusion: An 'observer effect' may partly explain learners' ambivalence about direct observation; being observed seemed to magnify learners' role ambiguity, intensify their tensions around professional development and raise questions about the credibility of feedback. In turn, an observer effect may impact learners' receptivity to feedback and may explain, in part, learners' perceptions that useful feedback is scant. For direct observation to be valuable, educators must be explicit about expectations, and they must be aware that how learners perform in the presence of an observer may not reflect what they do as independent practitioners. To nurture learners' professional development, educators must create a culture of observation-based coaching that is divorced from assessment and is tailored to developing learners' identities as practitioners of both the art and the science of medicine.

전문직 정체성 형성 및 촉진을 위한 의학교육 현황과 고려점(KMER, 2021)
Current Status and Directions of Professional Identity Formation in Medical Education 
한희영, 서보영

Heeyoung Han, Boyung Suh
서던일리노이대학교 의과대학 의학교육학과

Southern Illinois University School of Medicine, Springfield, IL, USA

 

 

서 론

의학교육은 의사 양성을 궁극적 목표로 하는 교육과정을 개발하고 발전시키는 것을 지향한다. 의사 양성을 위한 교육과정에서 학생들에게 무엇을 중점적으로 가르쳐야 하는지에 대한 논의는 역량(competence) 또는 행동(doing) 중심 패러다임의 의학 지식습득을 위한 교육과정, 비판적 인지적 기능을 중심으로 하는 임상추론 기술(clinical reasoning skills) 습득을 위한 교육과정을 거쳐, 최근에는 존재(being) 중심 패러다임을 주축으로 한 전문직 정체성 형성(professional identity formation)을 위한 교육과정으로 활발하게이루어지고 있다[1-3].

의학교육에서 전문직 정체성 형성은 일반인이 의사라는 특정 역량을 갖춘 전문가가 되는 과정에서 경험하는 근본적인 정체성 변화를 의미하며, 이는 그저 단순한 개념이 아닌 개인의 정체성 발달, 사회화 학습 등 여러 사회과학 이론 및 개념을 통합하여야만 설명할수 있는 복잡한 개념이자 과정으로 보아야 한다[4]. 이러한 맥락에서여러 의학교육 학자들은 전문직 정체성 형성에 대한 개념을 전문성(professionalism) 교육과 구별하여 여러 가지 각도로 논의해 왔다. 우선 그들은 전문성 교육이 전문직 정체성 형성에 상당 부분 기여하지만, 전문성은 전문직 정체성 형성과 동일 개념은 아님을 강조하고있다[1]. 의사의 전문성은 의사에게 기대되는 사회적으로 합의된보편적 가치관, 역량, 전문가들의 행동양식 등을 의미하는 개념인반면, 전문직 정체성은 한 개인이 사회적으로 의사에게 기대되는 가치관, 역량, 규범 등을 내면화하는 여러 단계의 과정에서 생성되는 자아의 발현이다. 개인이 한 전문직의 기능을 수행할 때 다양한상황에 따라 변형될 수 있지만 근본적으로 따라야 할 양식이나 기본 가치관이 이미 존재한다는 것이 전문성 교육의 관점이다. 한편, 전문직 정체성 형성은 개인의 다양한 정체성을 근간으로 특정 전문 직업인이 되면서 재구성되는 개인과 사회가 함께 상호적으로 구성하는(co-constrution) 과정에 대한 관점을 지닌다. 전문직 정체성 형성은 크게 두 가지 측면, 즉 개인의 심리적 발달 및 집단적 사회화(socialization) 과정을 통해 설명될 수 있다. 보편적으로 좋은 의사,이상적인 의사에 대한 사회적 기대가 있지만, 전문직 정체성 형성은 개인적 정체성과 사회화라는 과정 속에서 역동적인 상호작용을 거치면서 형성되기에 다중적이며 절충 가능한 특징을 갖는다[1,2,5,6].

전문직 정체성 형성을 묘사하기 위한 이론적 틀은 Kegan [7]의 인간발달과정이론을 주로 사용하고 있다. Kegan [7]의 이론은 다음과 같이 6단계로 묘사되며, 이 중에서 초기 2단계 및 마지막 단계에해당하는 가정 및 개인 간 관계를 제외한 조직 내에서의 사회화에 초점을 둔 세 가지 단계, imperial, interpersonal, 그리고 institutional단계를 선택적으로 취한 것으로, 대부분의 연구에서 이것을 사용하고 있다[5,8].

  • Incorporative(1단계): 인간이 태어나서 주로 보육자에 의존되는 유아기 단계
  • Impulsive(2단계): 가족구성원과 또래집단과의 관계를 인지하기 시작하는 단계
  • Imperial(3단계): 사회적으로 기대되는 전문직 역할을 인지하지만 성찰이 부족하고 자기중심적인 단계
  • Interpersonal(4단계): 다양한 시각들을 성찰할 수 있고 타인의 자신에 대한 시각을 고려하여 자신의 이기적 생각을 져버릴수 있는 단계
  • Institutional(5단계): 자기 스스로 성찰을 통해 사회적 원리를 선택 및 취합하여 편집된 자기 자신만의 원리나 기준을 바탕으로 전문가로서 기능하고 활동하는 단계
  • Interindividual(6단계): 연인이나 부부와 같이 자율성 및 자기실현에 근거하여 개개인 간의 친밀한 관계를 성립하는 단계

 

Cruess [5]은 이 세 가지 단계에 근거하여, 전문직 정체성은성별, 인종, 종교, 문화, 교육, 사회적 경제적 배경, 일상적 경험등 이미 존재하는 개인의 정체성들이 의과대학을 입학하면서 겪게되는 사회화 과정을 통해 의과대학생에서 전공의 그리고 전문의로서의 정체성을 형성한다고 설명하고 있다. Lewin [8], 특히 Kegan[7] 이론의 변화적(transformative) 발달과정에 초점을 두었는데, 개인은 각 단계에서 상황을 이해하는 데 사용하는 특정 관점(lens)이있으며, 그 관점은 새롭게 또는 더 복잡한 것으로 발달하고 그로 인하여 세상을 이해하는 깊이와 너비도 변화한다고 설명하고 있다. 이는 내면적인 과정이며 이것이 전문직 정체성 형성을 이해하는데 근본적 개념으로 사용되고 있다

이러한 전문직 정체성 형성의 중요성과 관심으로 이를 구체적이고 분명하게 발달시키려는 요구가 증대되고 있다. 여러 문헌 연구를 살펴보면, 전문직 정체성 형성을 촉진하는 교수학습전략으로 공통적으로 추천되는 것은 환자를 돌보는 경험, 롤모델, 반성적 사고및 작문, 그리고 공동체 소속감 발달 등이다[5,6,9,10]. 전문직 정체성 형성은 점진적인 진전보다는 의과대학 입학, 졸업, 진료 실행등과 같은 특정 경험을 중심으로 새롭게 변형(transformation)하는과정을 통해 이루어진다[1,2,6,10]. 또한 전문직 정체성 형성을 촉진하기 위해 숨은 교육과정(hidden curriculum)의 역할을 강조하기도하였다[9,11]. 이들의 연구가 전체적인 전문직 정체성 형성의 특징 및 연구의 방향을 제시한 반면, 궁극적으로 어떠한 교수학습전략이 제공되고 평가되고 있는지에 대한 연구는 미미한 편이다. 특히 전문직 정체성 형성에서 학생들의 다양성, 즉 인종, 문화, 성별, 성적지향성, 나이, 그리고 사회경제적 배경 등을 고려하여 어떻게 교수학습전략이 사용되고 있는지에 대한 연구는 미미한 실정이다[9,11]. 이에 본 연구는 의학교육에서 전문직 정체성 형성을 효과적으로달성하기 위한 교육방법과 평가전략은 어떤 것이 있고 어떻게 현장에 적용되고 있는지 문헌연구를 통해 의학교육의 현황을 기술하고자한다. 또한 이를 통한 전반적인 의학교육이나 의료 현장의 변화및 향후 발전방향을 소개하고자 한다.

 

연구대상 및 방법

 

본 연구는 다음과 같은 과정을 거쳐 문헌연구를 실행하였다. 우선,대부분의 의학교육 저널이 등재되어 있는 Web of Science를 선택하여, professional identity formation’ ‘medical education의 검색어 조합으로 2021127일 기준으로 시간적 제약 없이 문헌을검색하였다. 이 결과 282개 문헌이 검색되었다. 문헌 선택기준은(1) 주요 내용이 전문직 정체성 형성이어야 하며, (2) 의과대학 학생및 전공의 등 학습자를 대상으로 하며, (3) 경험연구 또는 사례연구를실행한 문헌을 선택하였다. 단 전문직 정체성 형성과 관련된 주제를논의하였지만 교수방식을 탐구하지 않은 단순한 오피니언이나 논평은 제외되었다. 이 선택기준을 바탕으로 제목 검토 후 124개 문헌,그 후 논문 초록 검토 후 85개 문헌을 전체 본문 검토를 위해 추려내었다. 85개 전체 본문 검토 후 문헌연구, 개념적 논문 그리고 교수자전문직 정체성 형성을 제외한 37개 문헌을 분석대상으로 최종적으로 선정하였다. 주제에 대한 문헌검색 및 선택에 대한 일련의 과정은Figure 1에 도식화하여 제시하였다.

본 연구팀은 의학교육 내에서 어떠한 교육방법 및 평가전략을통해 전문직 정체성이 형성되고 있는가를 연구하고자 각각 37개 경험연구 문헌을 독립적으로 검토하고 도출되는 내용을 주제분석(thematic analysis) 방법을 이용하여 분석하였다[12]. 연구팀은 각문헌에서 보고된 전문직 정체성 형성 교육방식, 대상, 지역, 평가 등에 대한 협력적 코딩작업을 통해 초기 문헌분석을 진행하였다.이 과정에서 연구팀은 6회에 걸친 논의를 통해 도출된 내용의 범주에대한 합의를 이루었다. 도출되는 내용의 범주를 기준으로 구분되는문헌들을 다시 역으로 검토하면서 반복적으로 보여지는 내용 및관계성을 중심으로 통합하는 작업을 하였다. 문헌검토 중에서 알게된 책이나 다른 관련 문헌을 필요에 따라 함께 검토하였다. 협력적문헌분석을 촉진하기 위한 두 가지 연구도구로는 각 문헌에 대한코딩작업을 위한 Google Sheets와 분석적 메모작성을 위한 Google Docs가 사용되었다.해당 문헌검토 및 분석을 통해 도출된 결과는 간략한 기술통계를시작으로 전문직 정체성 형성을 위한 교육방법에 대한 기술적인내용을 우선 보고하고, 모든 문헌을 다시 검토한 후 도출한 주제를중심으로 중요 개념 및 시사점을 본론(결과)에 기술하였다. 전문직정체성 형성을 위해 실시되고 있는 의학교육 방법의 주요 현황과시사점은 Table 1에 기재하였다[13-44].

 

결 과

의과대학생 및 전공의를 대상으로 한 전문직 정체성 형성과 관련된 37개 경험연구가 보고된 지역은 70% 이상이 미국을 중심으로한 북미지역, 22%가 서부 유럽, 그리고 나머지 지역에서 보고된논문은 연구지의 중복상태를 고려하더라도 16%에 불과하였다. 네덜란드와 대만을 비교연구한 Helmich [45]의 연구를 제외하고는동아시아에서 보고된 경험적 논문은 찾아볼 수 없었다. 즉 현재까지 의사 전문직 정체성 형성에 대한 실증적 이해는 북미 및 서부유럽의지배적인 시각에서 거의 독점적으로 이루어져 왔다.

연구방법 측면에서 살펴보면, 혼합연구(mixed methods)를 포함하여 99% 이상이 질적 연구방식으로 이루어진 논문들이었다. 교육과정의 효과를 추론하는 양적 연구방법은 거의 찾아볼 수 없었다. 교육방법을 기준으로 분석하였을 때 30%의 논문은 특정 교육전략을 사용하지 않고자연적 상태에서 교과과정을 거치면서 형성되는 의사로서의 정체성에 대한 학생들의 시각을 인터뷰를 통하여 보고한 연구였다. 일상적교과과정 이외에 특정 교육활동을 준비하고 실행하고 보고한 논문은중복 사용을 고려했을 때 개인 또는 그룹 자기성찰(46%), 예술 과목(11%), 그리고 코칭, 시뮬레이션, 환자 가정방문 등과 같은 각종교육활동(22%)을 보고한 논문들이었다.

 

1. 교육방법

1) 자기성찰 활동(self-reflection)

전문직 정체성 형성 교육방법 중 가장 보편적으로 쓰이는 방법이 자기성찰 혹은 성찰적 작문이다. 이는 아무리 많은 특별한 교육과정혹은 프로그램을 도입하더라도 개인적인 혹은 집단 차원의 깊은성 찰의 기회와 과정이 전문직 정체성 형성에 필수적인 요소이기때문일 것이다[4,13,15,20].

자기성찰을 촉진하는 방법으로는 자기성찰일기를 작문하게 하거나 음성으로 기록하게 하는 과제를 내어줌으로써 일상 속에서 성찰의 공간을 확보하게 하는 노력들이 대부분이었다[13-21]. 자기성찰일기는 일상적 경험, 때로는 혼란스러운 경험, 그로 인한 감성적인반응 및 성찰, 그리고 견해 및 행동의 변화와 같은 성찰과정을 드러내는 방법이 되어왔다[16]. 일부 자기성찰활동을 장기적이고 지속적인성찰의 습관으로 기르고자 하는 방법도 제시되었다. 학생들의 자기성찰이 한 번 혹은 단기간에 일어나 끝나는 활동이 아니라, 포트폴리오와 같은 지속적인 기록시스템을 사용하여 학생들이 임상실습 전후로 성찰활동을 지속하고 또한 학기말이 되면 자신의 그동안의 성찰과정을 다시 초인지적으로 성찰할 수 있게 함으로써 지속적인 성찰의 습관으로 자리잡을 수 있도록 도와주는 접근방법이었다[15,17,21].

성찰을 촉진하는 방법은 여러 가지 질문법 또는 서술적 피드백등을 사용한 guided reflection이었다[43]. 질문법은

  • “의사가 된다는것은 어떤 의미인가?”와 같이 주관적인 의미 창출(subjective meaning making)에 대한 질문,
  • “자격을 제대로 갖춘 의사가 되기위해 스스로에게 기대하는 바는 무엇인가?” 또는 “모범적인 프로페셔널리즘을 갖춘 의사에 대해 생각해보고 왜 그 사람을 롤모델로택하였나?”와 같은 사회적으로 기대되는 의사상에 대한 성찰을 유도하는 질문, 그리고
  • “기존 관념이나 생각을 돌아보게 하는 놀라운순간은 어떤 것이고, 그것으로 자신이 어떤 의사가 되어가고 있다고 생각하나?”와 같이 전문직 역량 영역과 관련하여 겪은 강렬하고도 중대한 순간을 포착하고 변혁적(transformative) 성찰을 위한 질문으로 그 범주를 나누어 살펴볼 수 있었다[16,19,20].

개인적인 생각을 바탕으로 하는 작문이나 오디오 성찰저널과 같은 과제물이 없더라도, 학생 또는 전공의들은 소그룹토의를 통해동료 및 교수진과 정기적으로 모여 자신들의 경험 및 성찰을 구두로나누는 활동도 보고되었다[22-25]. Wald [20]은 상호적인 성찰적 작문(interactive reflective writing)을 활용한 교과과정의 예를제시하였는데, 그 중 소그룹 협동성찰 및 전문직 간 교수진(interprofessionalfaculty)의 피드백 활동을 중심으로 학생들이 환자를돌볼 때 경험한 도전 혹은 어려움에 대해 직업적 환경 내에서 드러나는 자신들의 가치, 태도, 감정에 대해 돌아보게 되고, 이를 그룹내에서 토론하고 이해하도록 하는 것이었다.

 

2) 단일 선택과정(elective courses)

일반적인 의학교육과정에서 제공하지 않지만 의사 전문직 정체성 형성에 중요한 경험이 될 주제를 중심으로 선택과정이나 단편적과정으로 제공하는 사례도 보고되었다[22,26-31]. 한 예로, ReisWald [29]는 제2차 세계대전 중 의학과 의료인의 도덕적 실패에대하여 명료하게 인식하고 성찰을 통해 학생들의 환자들에 대한인 도주의적인 면모를 강화하기 위한 ‘유대인 대학살과 의학’ 교육프로그램을 제공하였다. 이는 민감하지만 중요한, 그러나 일반적 의학교육에서 다뤄지지 않는 유대인 대학살이라는 주제를 다루면서 의사로서 당면할 수 있는 사회정치적 가치관과 갈등, 그 과정에서 형성되어갈 그들의 정체성을 주목적으로 하고 있다. 이러한 과정은 의사의 전문직 정체성은 역사적 사건이나 사회적으로 이슈가 되는 사건들과 동떨어져 있는 것이 아니라 한 지역사회 또는 더 나아가 세계적인 사회역사적 맥락에서 성찰되고 형성될 수 있음을 제시하고 있다.

또 다른 선택과정으로는 학생들의 예술활동을 찾아볼 수 있었다.일반적으로 의학교육과정이 인지적 기술적 학습을 주요 내용으로하는 반면, 학생들의 정체성 형성은 그들의 느낌과 감성을 통하여표현되고 발달할 수 있다. 그러나 인지적 기술적 학습에 치중한교육과정에서 학생들의 감성과 느낌을 심도 있게 탐색할 공간이부족한 것이 사실이다. 이에 단일과정으로 예술적 창작활동을 제공하여 학생들의 내면적 감성을 표현하고 공유하는 사례도 보고되었다[32-35]. 예들 들면, 학생들이 의학 만화를 읽고 그룹으로 토론하고 자신이 의사가 되어가는 과정을 만화로 표현하거나[32], 의술을 익히는 동안 억누르게 되는 인간적 혹은 개인적 가치를 그림으로 표현하고 이를 또한 글로 설명하는 미술치유 선택과목(healer’s art elective)에 대한 사례도 보고되었다[34]. 그림을 통한 방법 외에가면(mask)이 가지는 내적 외적 정체성의 상징적인 표현과정을사용하여, 학생들이 직접 가면을 예술적으로 장식하거나 가면의 내외면에 이상적인 의사의 모습과 현재 자신의 모습을 표현하는 사례도 있었다[33,35]. 이와 같은 가면을 이용한 방식은 개인의 정체성과의사가 되어가면서 얻어지는 정체성 간의 탐색, 갈등, 혼동 등과같은 다양한 감성을 자연스럽게 이끌어내고 탐색하는 기회를 열어주는 데 효과적인 방법으로 사용할 수 있는 주목할 만한 방법 중 하나이다. 이러한 비언어적인(nonverbal) 예술활동에서 학생들은 언어로표현할 수 없었던 복잡하고 심오한 감성적 경험을 심리적으로 안전함을 느낄 수 있는 공간과 방법으로 표현함으로써 자신의 정체성형성을 표현하고 공유할 수 있다.

환자를 보는 일이 일상인 전공의에게 있어서 일상에서 벗어나는 단일과정은 거의 찾아볼 수 없었으나, 그 중에 보고된 사례는 교수진 및 동료들과의 협력적 커뮤니티를 형성하여 바쁘게 돌아가는 임상경험 속에서 놓칠 수 있는 성찰의 기회를 확보하고자 하는 노력들이었다[22,25,26]. 집단토론과 다양한 영역의 세미나를 통해 개인의 가치와 직업적 가치의 통합을 추구하는 과정[25], 병원업무에서 겪는어려움과 직업적 개발사안을 전문직 간 그룹 내에서 소통하며 도움을 받는 또 다른 형식의 포럼프로그램[26], 그리고 교실을 기반으로한 교육프로그램 안에서 비형식적사회적 상호작용과 멘토링에 초점을 맞춘 레지던트를 위한 교육과정 등이 보고되었다[22].

 

3) 환자 경험 및 의료현장 경험

검토된 거의 모든 문헌에서 공통적으로 보여지는 의사 전문직정체성 형성을 위한 교육과정의 경험은 직간접적 환자 경험 및 의료현장 경험이었다. 임상 전 과정에 있는 학생들이 의료현장이 아닌환자의 집이나 지역사회에서 환자와 그들의 가족들을 만나 관계를형성하는 동안 환자의 삶과 질병을 이해함으로써 의사로서의 정체성을 형성하는 데 도움을 줄 수 있다[27,30]. 이를 위한 구체적인 사례로, 상급 학생들의 코칭을 받은 1학년 학생들이 환자의 집을 방문하여 환자와 대화를 나누며 중증 환자로 살아가는 그들의 삶의 모습속에서 나타나는 질병의 영향 등을 배우는 동안 일어나는 정서적경험을 통해 전문직 정체성 형성을 도울 수 있다는 연구가 보고되었다[30]. 또한 만성질환을 앓는 환자 혹은 환자의 가족들이 의과대학생의 멘토로서 오랜 기간 환자의 관점과 경험을 학생들에게 공유하고, 이와 같은 환자와의 관계형성이 의사가 되어가는 정체성 형성을위한 의미 있는 경험으로 보고되기도 하였다[27]. 즉 이러한 연구들은 공식적인 의료현장에 투입되지 않는 임상 전 과정 학생들일지라도 지역사회에 존재하는 환자 경험을 직간접적으로 경험하게 함으로써 미래 의사로서 갖게 될 전문직 정체성을 투영할 수 있는 기회를주는 것을 강조하고 있다.

한편, 임상실습과정 중에 있는 학생들이 지역사회를 기반으로한 의료현장에서 환자를 돌보는 동안 겪는 경험은 전문직 정체성형성을 위한 너무도 근본적이고 필수적인 교육과정이다. 이러한 이유로 많은 연구자들은 어떠한 추가적인 교육과정 없이 임상실습기간동안 학생들의 정체성 형성을 질적인 방법으로 연구하였다[36-39].이들 연구 중에서, 특히 임상실습 경험을 통한 개인 차원의 전문직정체성 형성과 더 나아가 환자, 환자의 가족, 지역사회에 대한 책임의식을 촉진하는 방안과 그 사례에 주목할 필요가 있다[24,40,43]. 즉 의사의 전문직 정체성이 병원 오피스에 한정하여 기능하는 것이아니라 지역사회와 연계된 그들의 전문직으로서의 역할과 정체성을성찰하도록 하는 것이다. 예를 들면, 지역사회 기반의 종적 통합임상실습(longitudinal integrated clerkships) 과정을 통해 학생들이 시골 지역의 환자 및 환자 가족들에 대해 장기적으로 알아가고 그들의건강에 직결된 의료서비스에 직간접적으로 개입하도록 돕는 방법이존재한다[24]. 아울러 이민자나 난민, 또는 교도소와 같은 의료서비스의 사각지대에 놓인 사회적 약자 그룹의 환자를 돌보는 기회를 제공하여 공평한 의료서비스와 돌봄(equitable care)에 대한 경험을강화하는 방법이 제시되었다[40].

전공의들의 전문직 정체성 형성과 관련한 환자 경험은 의과대학생의 경험과는 사뭇 다르다. 전공의들의 환자 경험은 일상적인 업무로 자리잡고 있기에, 이들의 정체성 형성에는 단순히 환자 경험보다는 의료현장에서의 직접적인 ‘의사결정,’ ‘책임,’ 그리고 ‘자율성’이라는 상호연결된 개념들을 제공하는 환자 경험을 주축으로 정체성형성이 이루어진다[42,46]. 즉 전공의들은 점진적으로 환자에 대한 책임과 자율성을 얼마나 부여받는가에 따라 환자의 건강에 관여한직접적인 의사결정을 할 수 있고, 이러한 의사결정권이 증대됨에따라 그들의 의사로서의 전문직 정체성도 형성될 수 있다.

 

2. 주요 개념 및 시사점

전문직 정체성 형성을 위한 교육과정에 대한 문헌을 분석하면서도출된 공통된 개념 및 시사점을 아래와 같이 기술하고자 한다.

1) 비형식적 ․ 부가적 학습의 중요성

전문직 정체성은 비형식적 학습환경에서 부가적으로 형성되며, 의학교육자는 이러한 비형식적 부가적 학습(informal and incidental learning)의 중요성을 인지하여 전반적인 교육환경(learning culture)이 학생들의 정체성 형성을 위하여 심리적으로안전하고 풍부한 경험을 제공하는 토대로 자리잡도록 노력해야 한다. 의학교육에서 어떤 교육전략을 취하든, 학생들은 나름대로의 의사로서 정체성을 발견하고 형성해나갈 것이다. 전문직 정체성 형성은 유기적이고 비선형적으로 발달하며 장기적인 과정이며 숨은교육과정의 영역이다[2,21]. 이에 기존의 처방적 사고에 기초한 교육과정을 제공하는 것에 초점을 두는 것이 아니라 개방시스템적 사고에 기초하여 학습자의 개인적사회적 발달과정을 신뢰하고 교육자와 학습자가 상호유기적으로 일상화된 성찰과정에서 피드백 반응에 기초한 대화를 지속한다는 데 중점을 두어야 할 것이다.

반면, Holden 등[4]은 전문직 정체성 형성을 위한 교육체계로서6개 영역과 30개의 하위영역을 정의하고, 이것을 지원하는 공식과목, 워크숍, 반성적 작문활동, 지역봉사학습, 임상실습, 멘토링, 문화체험 등과 같은 활동을 해야 한다고 제시하였다. 그러나 이들은 정체성 형성을 위한 교육활동이라고 하여 하는 것이 아니라 학생들이 환자를 돕는 의사가 되기 위해 필요한 지식, 기술, 태도 등을 함양하기 위한 활동으로 이를 통한 의사로서의 정체성 형성은 부가적(incidental)으로, 비형식적(informal)으로 얻어지는 것으로 인식되어야 할 것 이다. 예를 들어, 지역봉사학습을 대하는 학습자는환자의 환경과 건강을 체험을 통해 깊이 있게 알아가는 것이 주목적이며 전문직 정체성 형성은 부가적인 학습경험이 되어야 할 것이다.학생들이 자신의 전문직 정체성 형성을 위해 지역봉사를 한다는것은 주객이 전도된 상황으로 오도되는 것이다. 지역봉사학습을 통해 학생들은 환자의 어려운 상황에 공감하고 동정심을 느끼다가도감당할 수 없는 압도적인 상황에 처하면 오히려 환자와의 감정적거리를 두려는 마음을 경험하는 등 스스로에게 질문을 던지고 여러방향으로 내적 가치의 변화를 경험한다[15]. 즉 지역봉사학습 활동이 전문직 정체성 형성을 가져오는 교육활동이라기보다는 학생들이 의사가 되어가는 장기적이고 혼돈적인 과정에서 환경과 상호작용하면서 동시에 내면적으로 자신의 의사로서의 정체성을 성찰할 수있는 비형식적 부가적 학습환경으로 인식해볼 수 있다.

반성적 작문활동을 연구한 여러 논문들도 반성적 작문활동이 전문직 정체성 형성을 유발하는가라는 처방적이고 인과관계에 대한어떠한 충분한 증거를 제시하지 않았다. 학생들의 전문직 정체성형성은 이미 개인적 사회적 여러 경험을 통해 일어나는 현상이고,반성적 작문활동이나 인터뷰, 토론 등은 그 개인의 내면에서 발생하는 정체성 변화를 관찰할 수 있는 하나의 방법으로 볼 수 있다.예를 들어, 만화를 사용한 반성적 사고에 대하여 연구한 Green [32]의 연구도 전문직 정체성 형성에 대한 효용성에 대하여 참여자의자기평가 또는 의견을 기반으로 한 자료분석이었기에 어떠한 인과관계를 주장할 수는 없다.

이에 단순한 처방적 패러다임에서 벗어나 학습자의 전문직 정체성 형성의 필연적 발생과 그 과정의 복잡성과 개방적 시스템과의 상호작용의 중요성을 인식하고, 학습자가 처하는 교육환경과 의료문화를 정체성 형성을 보다 유의미하고 지속할 수 있는 비형식적 부가적 학습환경으로 고려해야 할 것이다[21].

2) 일상적이고 실제적인 환자 경험

의미 있는 환자 경험은 여러 문헌에서 의사의 전문직 정체성 형성에 필요한 경험이라고 설명하고 있다. 그렇다면 어떤 환자 경험이중요한가? Javis-Selinger [43]grounded theory에 기초한 질적 연구를 통해 정체성 형성에 대한 개념적 과정을 발견하고 보고하였는데, 그들은 임상실습을 하는 학생들의 정체성 형성은 어떤 상황(context)에서 성찰을 불러일으키는 특정 경험을 할 때, 기존의 경험과 형성된 가치관이 촉매작용과 같이 의식적으로 자신의 정체성을다시 되돌아보는 기능을 한다고 설명한다. 특히 이때 자신의 현재의 정체성(being)과 미래의 정체성(becoming)이 역동적으로 절충하는과정을 통해서 학생들의 전문직 정체성이 형성된다고 설명하고 있다. 이러한 경험 중에서 인지적 불안정(cognitive disequilibrium)을 야기하는 세 가지 계기가 되는 것이 있으며, 그것은 의과대학에입학하여 일반 학생에서 의과대학생이 되는 것, 임상실습 경험, 실제의료사업 경험, 의료활동을 하는 의사들과 같이 일하는 경험 등 매우 일상적인 의사의 경험들이다[47].

물론 학생들의 일상에서 접하지 못하는 존재하는 실제를 경험하게 하기 위해 개발도상국가에의료봉사를 가도록 한다거나 가난한 중증환자의 집에 직접 방문하여환자의 환경을 직접 관찰하게 하거나 유대인 학살과 같은 내용을의료윤리 향상을 위해 성찰하도록 하는 등 급진적으로 기존 가치에서 벗어나(disoriented) 변화(transformation)하는 과정을 통해 의사로서의 정체성을 성찰하도록 하는 사례도 보고되었다[16,29,30]. 그러나 의과대학생들은 입학하여 단지 의사복을 입는 것만으로도 또는 해부학 시간에 시체 해부를 경험하는 것으로도 의사로서의 정체성을 되돌아본다[17,18]. 임상실습 등을 통해 의사가 된다는것을 간접적으로 관찰하고 롤모델을 통해 자신의 미래를 상상하게된다[24,27,40]. 의과대학에서 전공의가 되는 과도기적 학년인 4학년 학생들은 3학년 임상실습 때와 비교하여 역할이 보다 환자를돌보는 중요한 일에 근접함으로써 팀 소속감을 느끼며 의사로서의 정체성을 형성한다[39]. 전공의가 되어 환자를 돌보는 일에 직접적으로 관여하게 될 때는 자신들의 증대되는 환자에 대한 의사결정활동과 증대되는 자율성 및 책임감 같은 일상적이고 실제적인 의사들의 일을 하면서 전문직 정체성이 발달한다[41,42]. 즉 학생들은 전문직 정체성 형성과정에서 상당한 가치관의 변화를 겪기도 하는데, 그것은 어떤 특수한 경험을 해야 얻는 것이 아니라, 의과대학에서 경험하는 모든 활동과 의사가 되는 과정 자체가 일상적이지만 그안에 특별함을 발견하고 정체성을 형성해 나간다.

학생들은 자신들이 가지고 있는 의사상과 실제 자신들이 하는일들이 일치하는지 지속적으로 성찰하고 그 과정에서 발생하는 일상에서의 불균형 또는 균형이 그들의 의사로서의 정체성 형성에 중요한 역할을 한다[44]. 예를 들어, 임상실습을 하는 학생들은 텔레비젼드라마에서 나오는 역동적인 의사상에 대한 기대감이 있다면 실제로상당한 시간을 환자 의료기록을 위한 문서작성에 보낸다는 것에놀라기도 할 것이다. 외과 전공의가 만약 경제적으로 어려운 고도비만의 당뇨병 환자의 발톱을 깎는 일을 한다면 왜 자신들이 의사인데이런 하찮은 일을 하냐고 이런 일을 하러 의사가 된 것은 아니라고생각할 것이다. 그러나 본 연구팀의 저자 중 한 명은 환자 경험이풍부한 어떤 노년의 내과 의사가 발톱깍이를 들고 직접 그러한 환자의 발톱을 정리해주는 모습을 관찰한 적이 있다. 이 의사는 발톱관리가 그 환자의 건강에 중요하나 직접할 수 없는 상황을 인지하고그것이 의사로서 당연히 해야 하는 일이라고 여긴 것이다. 이 예에서학생이나 외과 전공의가 겪는 정체성이 미숙한 것이고, 경험 많은 내과 의사가 생각하는 정체성은 완성된 것이라고 보는 것이 아니라,일상적 경험에 따라 환자를 이해하는 여러 방식이 질적으로 다름을의미한다[2]. 이런 이유로 전문직 정체성 형성에 있어서 일상적이고실제적인 환자 경험은 매우 중요하며, 학생들은 자신의 기존 의사상과 일상의 일을 지속적으로 수행해 가면서 발견하는 정체성을 비교해 가며 여러 번의 변화과정을 거치는 것으로 이해되어야 할 것이다.

 

3) 학생 개인의 배경과 감성발달의 중요성 및 사회심리적으로 안전한 교육환경 조성

전문직 정체성 형성을 이해하고 조장하고자 하는 과정에서 개인의 배경(background)과 감성발달(emotional development)의 중요성을 인지할 필요가 있다[19,20]. 이는 의학교육자들이 학생들 개개인에 대하여 깊이 있게 알아가는 것과 더불어 학생들이 개인의 정체성을 공유하는 데 어떠한 사회심리적 두려움이 없는 교육환경을제공하는 것이 얼마나 중요한가라는 너무도 근본적인 교육의 원리를되돌아보게 한다. 의과대학에 진학하는 대부분 학생들은 우월한 사회경제적 배경을 가지고 있고, 이로 인해 공유되는 지배적인 문화는시골 출신이거나 어려운 가정형편에 놓인 학생들의 존재 및 그들의다른 경험에 대하여 이야기하는 것을 거의 암묵적으로 억제하여왔다[48]. 가난한 환자, 마약중독 환자, 결손가정 환자, 이민자 환자,교육수준이 낮은 환자 집단과 의사 집단을 암묵적으로 이분화하여 이러한 개념을 이야기할 때 그러한 환경과 배경을 가진 학생들의존재에 대하여 사려 깊게 고려하지 않는다. 이에 그들의 전문직정체성 형성에 대한 교육 실제 및 연구도 매우 미미한 상황이다[49]. 미국의 예를 들면 흑인 학생들에게 자신이 흑인이라는 것은 그들에게 매우 중요한 정체성의 요소이기 때문에 그들이 의사가 되어가는과정에서 이것을 고려하지 않거나 오히려 부정적인 관점으로 투영된의사 전문직 정체성을 형성하게 된다면 이를 조장한 교육환경은매우 우려되는 교육환경이라고 볼 수 있다[11]. 이처럼 의학교육환경에서 학생들의 진정한 자아(authentic self)와 다양성을 배제한 암묵적으로 조성된 사회심리적 환경은 학생들의 의미 있는 전문직정체성 형성을 위해 지양되어야 할 것이다.

전문직 정체성 형성에서 중요한 과정으로 여겨지는 전환학습(transformative learning)의 관점으로 볼 때 학생들이 의사로 성장하는 중에 겪는 여러 경험 가운데 이러한 개인의 다양한 상황과 감성적 반응은 매우 중요한 성찰의 토대가 되며 미래의 관점 및행동 변화에 매우 필수적인 영역이다[16]. 예를 들어, 학생들이 의사가 되는 경험을 하면서 자신도 모르게 가지고 있던 자신의 다른집단에 대한, 예를 들면, 정신질환 환자에 대한 비뚤어진 시각 또는편견을 마주하게 되었을 때 겪는 갈등은 인지적 반응이라기보다는 내면적 감성의 분투이자 감성의 변화로 볼 수 있다[19]. 감성의 발달은 인지적인 학습보다는 예술적 활동을 통해 표현되기도 한다. 앞서 살펴본 바와 같이 Joseph [33]은 학생들에게 가면을 만드는 예술활동을 하게 했을 때 학생들은 자신의 기존의 개인의 정체성과 의사가 되는 정체성의 불일치에서 오는 감성적 갈등을 표현하였다. 이처럼 성찰의 토대가 되는 감성적 분투와 변화를 표현하고 나눌 수있는 개방적 교육환경이 필요하다.

거시적인 문화 측면에서 기존의 전문직 정체성 형성을 논의하거나 연구한 논문들은 대부분 북미 및 유럽에서 발표되어 왔다는 점,동양과 서양의 전문직 정체성이 다를 수 있다는 Helmich [45]의연구를 고려할 때 문화를 포함한 학생 개인의 배경 그리고 감성발달을 명료하게 고려한 교육환경의 제공이 학생들의 전문직 정체성형성에 가장 근본적이고 중요한 요소로 자리잡아야 함을 알 수 있다. 이에 학생들이 각기 다른 사회경제적 배경 혹은 자신의 감성적 반응을 어떠한 부정적 관점(stigma)에 대한 걱정 없이 공유하고 성장의 바탕으로 사용할 수 있는 안전한 학습환경(safe learning environment)의 조성이 요구된다

 

4) 평가에 대한 재고

전문직 정체성 형성에 대한 평가는 몇몇 문헌에서 논의하고 있지만, 전문직 정체성 형성의 개념이 다면적이고 교육방식 자체가 발달단계에 있기에 아직 뚜렷한 방향성을 가지고 평가를 실행하는 사례를 찾기가 어려운 상황이다. 기존의 역량 중심 교육과정의 ‘행동’을 근간으로 하는 평가방식전문직 정체성 형성에 있어서 ‘존재’라는 개념을 평가하는 데 적용할 수 없으므로, 기존의 평가 개념의 틀을벗어난 새로운 방식의 평가가 고려되어야 한다[2]. 이는 비록 사과를 바구니에 담을 수 있지만 사과쥬스를 바구니에 담을 수 있다고 주장할 수 없는 이치와 비슷한 것이다.

Holden [4]은 전문직 정체성 형성을 고려한 평가의 개념은 역량과 같이 순차적으로 발달하는 선형적 형태를 갖지 않는 전문직정체성 형성의 특성을 고려할 때 평가의 표준을 정립하여 대조하는방식은 맞지 않는다고 설명하고 있다. 그러나 그들조차도 실제적평가방식을 제안할 때는 objective structured clinical examination,반성적 사고 작문, 설문지, 포트폴리오 등과 같은 일반적인 평가방식을 조정해서 전문직 정체성 형성을 평가할 수 있다는 다소 모순된의견을 제시하였다.

우선 전문직 정체성 형성에 대한 평가의 개념을 교육과정 중 학생의 진전(progress) 여부에 대한 성공/실패라는 의사결정을 위한 것으로 정의하지 않아야 한다. 오히려 장기적이고도 다면적이며 비선형적인 전문직 정체성 형성과정을 촉진하고 조장하는 의미에서의 평가에 역점을 두어야 할 것이다. 이는 앞서 말한 바와 같이 전문직정체성 형성의 내용과 과정과 관련하여 모든 학생에게 일률적으로적용되는 표준이 있는 것이 아니기에, 각 학생의 개인적 정체성,사회적 배경, 직업적 관심사 등을 고려한 상당히 개인화된(personalized) 발달을 장기적인 관점으로 지속 가능하게 하고자하는 평가의 철학과 방향성이 마련되어야 할 것이다.

아울러 역량중심 교육과정의 평가의 개념에서 오는 혼돈을 피하기 위해 전문직정체성 형성에 대한 ‘평가’라는 용어가 적당한지 재고할 필요가 있다 .자기주도학습을 예로 들면, 개인이 학습을 주도적으로 지속하고 성취할 수 있는 역량은 어떤 한 시점에 관찰하여 평가할 수 있는 정적인개념이기보다는 학습의 과정 중에 변화하고 발달되는 역동적이자 초인지적 개념으로 여길 수 있다. 이에 이를 형식적으로 평가하기보다는 개인의 특정 상황에서의 과정을 관찰, 추적하고 필요에 따라 지침을 제공하는 것에 더 의미가 있는 것이다. 따라서 이와 비슷한본질을 지닌 전문직 정체성 형성에 대한 평가 및 교정(remediaion)에대해서도 개념의 재정립이 필요하며, 이를 위한 교수개발(faculty development) 및 교수학습문화에 대한 재고가 필요하다[1].

 

고 찰

연구팀은 본 종설연구를 통해 의사 전문직 정체성 형성을 위한의학교육 현황과 방향(고려점)을 문헌연구 방식을 사용하여 탐구하였다. 해당 연구의 주요 결론은 전문직 정체성 형성을 위한 별도의 교과과정은 존재하지 않으며, 오히려 학생들이 지역사회나 학생 개인의 삶의 영역을 포함한 의학교육 환경 내의 일상적 교과과정과 단일과정 또는 특정 경험, 그리고 의사로서 점진적으로 맡게 되는책임 및 책무를 시행하면서 필연적으로 의사 전문직 정체성을 형성해 나간다는 것이다. 또한 이는 개인 차원의 경험이면서 동시에사회적으로 더불어 형성되는(co-construced) 개념이자 과정이기에학생들의 개인적 배경, 학교에서 제공되는 교수학습환경, 의사 직업문화가 다각적으로 고려되어야 할 것이다. 전문성(professionalism)또는 의사됨됨이와 같이 일반적으로 사회적으로 기대되는 정체성이 획일적으로 존재한다기보다는 그러한 사회적 기대와 직업 내 공동체에서 형성하는 의사의 정체성에 대한 기대가치와 개인 스스로의 환경과 동기에 기반한 개인 정체성의 상호작용으로 형성되기 때문에 다양한 형태로 존재하는 개념으로 보아야 할 것이다[50].

이에 교육방식에 있어서도 따로 전문직 정체성 형성을 위한 커리큘럼이 따로 존재하지 않고 일반 의과대학 교육과정에서 비공식적으로 그 기능이 기대되는 숨은 교육과정으로 존재한다. 학생들은 다양한 환자 경험에서 발생하는 인지적 감성적 반응을 토대로 때로는 가치관과 행동의 양상에 급진적인 변화(transformation)를 경험하면서 의사로서의 정체성을 지속적이고 장기적인 과정에서 형성해나가는 것으로 이해할 수 있다.

한편, 지난 수십 년 동안 의학교육 분야의 전문직 정체성 형성에대한 연구가 이루어져 오고 있지만, 이 영역의 연구는 아직 미숙한단계에 머물러 있다. Kegan [7]의 이론이 해당 주제에 대한 대부분의연구에서 사용되는 가운데 학습자의 전문직 정체성이 어느 발달단계에 있는가라는 선형적 논리에 기반한 연구들이 주를 이루는 현 상황에서 Kegan [7]의 이론은 다면적이고 비선형적인 전문직 정체성형성에 대한 심도 있는 이해를 돕는 데 한계점을 가진다. 이에 보다 포괄적이고 다양한 이론적 논의 및 토대가 앞으로 활발하게 요구된다. 더욱이 해당 주제에 대한 대부분의 연구가 미국을 비롯한 서구권에서 보고되었기에 의사의 전문직 정체성에 대한 개념 및 형성과정에 대한 시각도 서구적 관점에 한정된 점 또한 해당 영역의 연구들이아직 발달단계에 머물러 있음을 짐작하게 하는 요인이다. 서양과 동양의 문화적 차이를 고려할 때 서구권 및 미국에서 주장하는 교육방식을 여과 없이 들여와 자국의 의학교육에 적용하기보다는 한국의의료계 및 더 나아가 지역사회에서 지향하는 의사의 전문직 정체성이 어떠한 모습으로 형성되어야 바람직한지에 대해 숙고하여 분별력있게 수용할 필요가 있다. 전문직 정체성 형성에 대한 평가 개념및 체계 역시 아직 정립되지 않았으며, 새로운 평가 패러다임과다양한 교육철학에 기초한 연구들이 앞으로 더욱더 요구될 것으로예상된다.

본 연구는 다음과 같은 한계점을 가지고 있다. 첫째, 해당 주제에대해 문헌을 검색할 당시 사용한 키워드의 제한적 사용으로 인해논의내용의 범주에 해당하나 검색에서 제외되었을 가능성이 있다.즉 만약 문헌검색 시 다른 검색어(: doctor identity, identity development)를 사용함으로써 다른 문헌이 도출되었을 수 있다. 둘째, 영문 검색어 조합을 이용했기 때문에 한국을 비롯한 비영어권국가의 저널에서 출판된 문헌이 제외되었을 가능성이 있다.

후속연구 주제로 다양한 의료환경에서 종사하는 의사들 및 의학교육 교수진의 전문직 정체성 형성에 대해 연구를 고려할 필요가있다. 본 연구는 의과대학생 혹은 레지던트에 국한하였지만, 의사정체성 형성의 연장적, 변화적인 특성을 감안할 때 평생의학교육(continuing medical education)과 관련하여 여러 다양한 분야에서 종사하는 의사 또는 교수진의 전문직 정체성 형성 및 발전에 대한지속적 연구와 논의는 학습자의 정체성 형성을 더 깊이 있게 이해할수 있는 토대가 될 수 있기 때문이다. 또한 한국 의학교육의 상황과학습문화에 적합한 전문직 정체성 형성을 위한 교육과 평가전략에대한 연구가 필요하다. 예를 들어, 한국의 의료상황에서 교수진이 형성한 의사 정체성 혹은 학생들과의 관계 또는 의학교육 환경이미래 의사가 될 학생들의 전문직 정체성을 형성하는 데 어떠한 영향을 미치는지, 더 나아가 이러한 전문직 정체성 형성이 학생들 개개인,환자, 의료기관 및 서비스에 어떠한 영향을 미치는가에 대한 연구가필요할 것이다. 이를 위해서는 보다 다양한 이론과 연구방법을 이용한 학제 간 연구가 유용할 것으로 보인다.

끝으로, 학생 개개인들이 어떠한 전문직 정체성을 형성해 나가느냐는 장래의 의료계 또는 의학교육의 집단적 전문직 정체성을 투영하는 거울이라 할 수 있다. 즉 전문직의 이해관계에 편하여 사회의요구와 동떨어진 단절된 전문직 정체성이 우세하다면 그 안에서길러지는 미래 의사들의 정체성도 동일하게 단절된 형태로 형성될가능성이 많다. 이러한 이유로 의학교육과정과 이를 기획하고 운영하는 학교와 교수진은 우리가 속한 지역사회의 다양한 구성원들의 모습과 그들이 절실히 필요로 하는 의료서비스의 내용이 끊임 없이변화하고 있음을 늘 염두에 두어야 한다. 또한 학생들이 이에 상응하는 다양한 정체성을 겸비한 다양한 모습의 의사가 되어 환자들과지역사회를 질병과 보건 이슈로부터 보다 자유롭게 할 수 있는 기회와 방법을 학생들에게 제공하기 위해 각고의 노력을 기울일 필요가있다. 예를 들어, 만성질환 등 복잡한 의료필요에 대응하기 위한전문직 간 학습기회 확대, 어려운 의료상황에서 필요한 리더십과협동에 대한 격려, 지역사회 내에서 의료 및 불평등 문제를 다루며 구성원들의 옹호자로서 역할을 감당할 수 있는 기회 제공, 나아가팬데믹 등 국가적 혹은 국제적인 보건위기를 창의적으로 접근하고해결하는 능력 함양을 촉진하는 노력이 필요할 것이다. 이러한 의학교육 환경 안에서 학생들은 스스로, 또한 동료들 및 교수진과 더불어의학을 배우는 중에 자신만의 고유하고도 다양한 전문직 정체성을형성할 수 있을 것으로 기대하는 바이다.

 

 


Professional identity formation (PIF) is an essential concept in professional education. Many scholars have explored conceptual frameworks of PIF and conducted empirical studies to advance an understanding of the construct in medical education. Despite its importance, it is unclear what educational approaches and assessment practices are actually implemented in medical education settings. Therefore, we conducted a literature review of empirical studies reporting educational practices for medical learners’ PIF. We searched the Web of Science database using keywords and chose 37 papers for analysis based on inclusion and exclusion criteria. Thematic analysis was conducted. Most empirical papers (92%) were from North America and Western Europe and used qualitative research methods, including mixed methods (99%). The papers reported the use of reflection activities and elective courses for specific purposes, such as art as an educational activity. Patient and healthcare experiences were also found to be a central theme in medical learners’ PIF. Through an iterative analysis of the key themes that emerged from the PIF studies, we derived the following key concepts and implications: (1) the importance of creating informal and incidental learning environments, (2) ordinary yet authentic patient experiences, (3) a climate of psychosocial safety in a learning environment embracing individual learners’ background and emotional development, and (4) the reconceptualization of PIF education and assessment. In conclusion, research on PIF should be diversified to include various cultural and social contexts. Theoretical frameworks should also be diversified and developed beyond Kegan’s developmental framework to accommodate the nonlinear and dynamic nature of PIF. Keywords: Educational activities, Hidden curriculum, Physician identity, Professional development, Self-reflection

한국 의사의 역사적 정체성 형성 (KMER, 2021)
The Formation of the Historical Identity of Korean Doctors
여인석
In-sok Yeo
연세대학교 의과대학 인문사회의학교실 의사학과
Division of Medical History, Department of Humanities and Social Medicine, Yonsei University College of Medicine, Seoul, Korea

 

 

서 론

최근 coronavirus disease 2019 유행 상황에서 의료인들에 대한 사회적 관심이 커지고 있다. 이러한 와중에 불거진 몇 가지 정책적이슈들에 대한 의사들의 반발은 사회적 비난의 대상이 되기도 했다.구체적으로는 의사들의 파업에 대한 비난이었다. 핵심은 생명을 다루는 의료인이 자기 직종의 이익을 위해 환자 곁을 떠나는 것이 정당화될 수 있느냐는 것이다. 사회가 바라보는, 혹은 기대하는 의사와 의사 스스로가 생각하는 의사 사이에 생기는 간극에서 유래하는 갈등이다. 이러한 갈등은 2000년대 초에 있었던 의약분업사태에서도 분출되었다. 의사는 무엇이며 어떠한 존재가 되어야 하는가? 우리는 이 질문을 다시금 진지하게 제기하지 않을 수 없다.

의사 개인의 윤리적 일탈행위나 혹은 의사 파업과 같은 집단적행위가 사회적 비난의 대상이 되는 경우 어김없이 등장하는 수사가 ‘히포크라테스 선서’의 정신과 의학교육에서 인성교육 강화의 필요성이다. 그러나 엄밀히 말해 이 두 가지 요청은 성격이 다르다. 히포크라테스 선서는 의사의 직업윤리에 관한 내용이고, 인성교육에 대한 요구는 일반적인 의미에서 착한 심성을 가진 의사를 만들어야한다는 것이다. 교육을 통해 착한 사람을 만든다는 것은 성선설과성악설의 역사 깊은 논쟁은 차치하더라도, 전문지식을 배우는 고등교육기관인 대학에서 인성교육을 하는 것이 시기적으로 적절한가의문제와 함께 그것이 달성 가능한 현실적인 목표인가에 대한 의문도 불러일으킨다.

교육을 통한 달성 가능성의 측면에서 본다면 착한 심성의 함양보다는 직업적 윤리의식의 함양이 실현 가능성이 더욱 높은 목표라할 수 있다. 그렇다면 직업적 윤리의식은 어떻게 함양될 수 있을까?그것은 의사는 이러저러해야 한다는 당위성의 강조나 주입만으로는이루어지기 어렵다. 투철한 직업윤리는 직업정체성에 대한 투철한인식에서 나온다. 따라서 의사라는 전문직의 직업윤리 교육은 전문직정체성 형성에 관한 교육이라는 우회로를 통해 더욱 효과적으로 이루어질 수 있다. 여기서 다시 직업적 정체성 형성의 문제가 제기된다.

다만 여기서 혼란을 피하기 위해 개념적으로 구별해둘 것이 있다. 일반적으로 전문직의 직업적 정체성 형성은 개인에 초점을 맞춰한 개인이 교육과 수련, 그리고 직업활동의 경험을 통해 전문직업인으로서 정체성을 형성해가는 과정을 말한다. 즉 한 개인이 기존의 전문가 집단에 자신을 동일시해나가는 과정이라 할 수 있다. 그에 비해 이 글에서 말하는 역사적 정체성 형성이란 역사적 과정을통해 형성된 의료직의 집단적 자기의식을 말하며, 이 집단적 자기의식이 역사적 과정을 통해 변화를 거치며 형성되어왔다는 것이다.

어떤 대상의 정체성은 어떻게 형성되는가? 그것은 그가 가진 개인적 집단적 경험의 총체로부터 형성된다. 달리 말해 오늘날 그를만든 역사적 경험이 그의 정체성을 이룬다고 할 수 있다. 한 개인의 정체성은 출생 이후 그의 개인사적 경험을 통해 형성된다. 마찬가지로 의사의 정체성 또한 이 직업의 역사적 경험을 통해 형성된다고할 수 있다. 그런데 개인으로서의 의사는 의사라는 직업의 역사적변천과정을 직접 경험한 것이 아니다. 따라서 그것은 의사란 직종의역사적 형성과정에 대한 이해를 통해 간접적인 방식으로 정체성형성에 관여하게 된다. 그것은 마치 한국인으로서의 정체성이 한국사에 대한 이해를 통해 형성될 수 있는 것과 같다. 요컨대 의사라는 직업적 정체성은 의사라는 직업의 역사적 형성과정을 이해함으로써자연스럽게 얻게 되는 자신에 대한 자각이라 할 수 있다. 따라서 우리는 역사 속에 나타나는 의료인의 모습을 통해 의사는 무엇이며,또 어떠한 존재가 되어야 하는가에 대한 통찰을 얻을 수 있을 것이라생각한다.

한국 전근대사회 치료자의 정체성

1. 사제적 정체성

의사라는 용어에는 일반적 의미와 특수한 의미가 공존한다. 우리는 다른 사람의 질병을 치료해주는 사람을 포괄적으로 의사라고말하기도 한다. 그러나 특수한 의미로 사용하는 의사라는 말은역사적 용어로서 제한적 의미를 그 안에 담고 있다. 그것은 치료에 종사하는 많은 의료직 가운데 의료법이 규정하는 특정 직종을 지칭하는 법률적 용어이기도 하다. 오늘 한국사회에서 사용하는 의사라는 말에는 의과대학을 졸업하고 국가가 발급한 면허를 가진 사람,나아가서는 큰 병원에서 인턴, 레지던트를 거치는 수련 경험을 쌓은사람 등의 의미가 포함되어 있다. 달리 말해 병든 사람을 치료하는일을 하는 여러 종류의 사람들 가운데 법률이 요구하는 특정한 자격을 충족하여 국가가 부여하는 자격증을 가진 사람을 현대 한국사회에서 의사라고 부른다. 여기서 치료하는 기능은 시대에 무관하게일반적인 것이지만, 요구되는 자격은 근대 이후 서구사회가 만들어온 역사적이고 특수한 것이다. 따라서 이러한 자격에 대한 요구가 존재하지 않았던 고대사회에서 활동했던 사람을 의사라고 부르기에는 적절치 않고, 다만 병든 사람을 치료하는 사람이라는 의미에서 치료자라고 부르는 것이 적절할 것으로 여겨진다[1].

자격과는 무관하게 현대 한국사회에도 치료에 종사하는 많은 종류의 사람들이 있는 것과 같이 고대사회에도 많은 종류의 치료자가 있었다. 의학이 발달하지 않았던 고대사회에서는 특히 종교적 치료자들의 비중이 컸을 것이다. 여기서 말하는 종교적 치료자란 샤머니즘적 치료자와 새롭게 중국에서 유입된 불교의 사제인 승려를 들수 있다. 실제로 삼국유사 삼국사기에는 승려들이 치료활동을 수행하는 기사들이 다수 기록되어 있다. 그뿐 아니라 전통적인 주술적 치료자와 치료승이 일종의 경쟁관계를 형성하고 있는 모습도이들 기록에서 찾아볼 수 있다[2].

환자에 대한 치유가 종교에서 중요한 부분을 차지한다는 사실은복음서에 나타나는 예수의 많은 치유 기사와 석가모니가 대의왕(大醫王)으로 불렸음을 통해서도 잘 알 수 있다. 종교적인 치유는 단순히고대사회에만 이루어졌던 것은 아니다. 첨단의과학이 발전한 오늘날에도 종교적 치유행위는 여전히 사라지지 않고 행해지고 있다. 치유는 인간을 육체적으로만이 아니라 정신적으로도 회복시킨다는 함의도 갖고 있다. 따라서 종교적 색채가 없는 현대의학적 치료라할지라도 그것을 단순히 기계적 수리로 보지 않는다면 치유행위에 종교적 차원은 여전히 존재한다고 볼 수 있다. 그런 의미에서 고대사회에서 사제들이 수행했던 치유행위의 종교적 차원을 오늘날의 세속적 치료자들도 여전히 공유하고 있다고 볼 수 있다. 그런 의미에서 의료인은 ‘사제적 정체성’을 갖고 있다고 말할 수 있을 것이다.

보다 적극적으로 말한다면 오늘날의 의사는 사제적 정체성을 가져야 한다고 말할 수도 있다. 의사의 치료행위가 단순히 고장난 기계를 고치는 것이 아니라면, 다시 말해 의사가 치료하는 환자를 기계로 보지 않는다면, 자신의 치료행위가 환자에게 가지는 전인적차원을 고려해야 한다는 의미에서도 사제적 정체성은 적극적으로 요청된다고 할 수 있다. 이것은 치료를 특정 종교와 연결시키라는의미가 아니라 의학적 치료 자체가 가지는 전인적 의미를 회복할필요가 있다는 의미에서 하는 말이다.

 

2. 관료적 정체성

동아시아 전근대사회의 특징 중 하나는 동시대의 서구사회에 비해 관료제가 발달한 점이다. 이러한 점은 의료인의 사회적 존재방식에도 영향을 미쳐 의료를 담당하는 관료가 중국에서는 춘추시대에,우리나라에는 삼국시대부터 존재했다. 관료제는 한국사를 통해 점차 정비되고 확대되었으므로, 조선에 이르면 중앙정부에 의료를 담당하는 조직이 상당히 분화된 형태로 존재하게 된다. 그리고 정부에서는 시험을 통해 우수한 의료인력을 선발하고 이들을 의료관료로 활용했다. 한편에서는 이러한 시험을 오늘날의 의사국가고시의 선구적 형태로 보기도 한다. 그러나 시험을 본다는 사실은 동일하지만시험의 성격과 목적이 다르므로 이를 동일시하는 것은 적절치 않다. 의사국가고시는 자격시험이다. 따라서 이에 통과하지 못하면 의료인의 자격을 사회적으로 인정받지 못하므로 의료행위를 할 수 없다. 반면, 조선시대의 시험은 선발시험으로 정부가 필요로 하는 분야의우수한 인재를 뽑기 위한 관료 선발시험이었다[3]. 조선사회에서 시험을 통해 고급관료가 되는 것은 입신양명의 대명사로 누구나 선망하는 것이었고, 의료인도 마찬가지다. 그러나 시험에 합격해 관료가되는 것이 명예로운 일이기는 했으나 시험의 합격 여부와 의료활동의 가능 여부는 무관했다. 뒤에서 자세히 설명하겠지만 전근대의의료인과 근대의 의료인이 구별되는 가장 큰 차이점은 국가에 의한자격부여이다. 전근대사회에서는 본인의 능력과 의사만 있으면 누구나 의료활동을 할 수 있었지만, 근대국가에서는 국가가 부여하는자격을 획득하지 못하면 의료활동을 할 수 없다. 이러한 결정적차이는 의사의 정체성 형성에도 큰 영향을 미친다.

관료로서의 의료인에 대한 논의를 조금 더 확장해보자. 조선시대의 관료로 활동할 수 있었던 의료인은 전체 의료인 중에서 아주소수에 불과했다. 그러나 역사를 통해 살펴보면 전체 의료인의 관료화가 이루어지는 경우도 있다. 가깝게는 과거 사회주의 국가의 의료인들이 국가에 소속된 공무원으로 일한 사례가 있다. 멀리는 고대이집트에서 의료인은 신전 소속이었다[4]. 고대 이집트는 제정일치사회로 종교조직이 곧 정치조직이었으므로 이는 곧 관료에 해당한다. 반면, 고대 그리스의 의사는 자유직으로 여기저기를 떠돌아다니는 편력의가 일반적인 형태였다[5]. [관료로서의 의료인]과 [자유직으로서의 의료인]이라는 의료인의 두 가지 대표적인 사회적 존재 형태가 이미 고대사회에서부터 존재해왔음을 알 수 있다. 이러한 사회적인 존재 양태의 차이는 의료인으로서 정체성 형성에도 큰 영향을미친다. 의사는 아픈 사람을 치료하는 사람이라는 본질적 특성을가진다. 그러나 의사가 어떤 사회적 입장에서 의료행위를 수행하는가는 의료를 시술하는 의사의 태도뿐 아니라 의사의 정체성에도적지 않은 영향을 미친다. 따라서 의료인의 정체성 형성에 대한논의를 위해서는 의료인이 어떤 사회적 입장에서 의료활동을 하는가도 중요한 고려사항이 되어야 할 것이다.

 

3. 유의(儒醫)적 정체성

유의(儒醫)란 유학자로서 유교적 교양만이 아니라 의학에 대한지식도 갖추어 자신과 주변 사람들을 치료해주는 지식인을 말한다. 유학자가 의학을 공부하게 된 결정적 계기는 중국 송대(宋代)의 과거제 실시와 관련이 있다. 송나라는 불교와 도교가 번성했던 이전의 당나라와는 달리 유교적 이념에 근거한 국가 건설을 목표로 했다.이를 위해 과거제를 실시하여 유교적 교양을 갖춘 인재를 선발하여국가를 운영하는 관료로 활용하였다. 그런데 과거로 선발할 수 인원은 소수에 그쳤으므로, 과거를 위해 유교적 교양을 쌓았던 많은지식인은 특별한 직업이 없이 지낼 수밖에 없었다. 이들 중 차선책으로 의학을 공부하는 사람들이 나타났다. 송대의 재상 범중엄(范仲淹,989–1052)의 유명한 말 “좋은 재상이 될 수 없으면 좋은 의사가되겠다”는 말은 이러한 배경에서 나왔다[6]. 중국에서도 의료인의 사회적 지위는 높지 않았기 때문에 학문적 소양을 갖춘 인재들이의업을 선택하지는 않았다. 그러나 과거제 시행이라는 사회적 변화와 함께 유교적 교양을 갖춘 지식인들이 대거 의학을 공부하기 시작했고, 그 덕분에 중국의학사에서 송대는 획기적 의학발전이 이루어진 시기로 기록되고 있다. 의술은 백성을 구제하는 지식과 기술이므로 유교적 이념을 사회적으로 펼치는 데 적합한 분야이다.

유교 국가였던 조선에서도 유학자가 의학을 공부하는 것은 특별한 일이 아니었다. ‘마과회통(麻科會通)’과 같은 홍역 전문 의서를직접 편찬했던 정약용이 대표적 유의일 것이다. 호학(好學)의 군주였던 정조도 할아버지 영조의 치료방법을 두고 내의원 의관들과 토론을 벌일 정도로 의학에 조예가 깊었고, 스스로 의서를 편찬하기도했던 유의였다. 그런데 유의는 오늘날의 관점에서 본다면 비직업적 의료행위자이자 무자격 의료행위자로 사회적인 비판의 대상이 될수 있으나, 의료에 대한 접근성이 좋지 않았던 조선사회에서는 오히려 유의의 활동이 장려되는 측면이 있었다[7]. 특히 효가 강조된조선의 유교사회에서 부모님의 건강을 보살펴드리기 위해 자식으로서 의학지식을 가지는 것은 바람직한 일이었다.

비직업적인 유의의 시술은 영리나 의료에 대한 금전적 반대급부를 전제로 한 것이 아니었다. 그것은 지식인으로서의 사회적 책임의식에서 나온 의료활동으로 보는 것이 적절할 것이다. 조선은 요즘처럼 전문적 의료인을 쉽게 접할 수 있을 정도로 의료인이 많은 사회가아니었다. 또 의료인은 사회적 지위가 높지 않았으므로 요즘처럼우수한 인재들이 몰리는 직업도 아니었다. 이처럼 사회가 필요로하는 의료를 제공할 수 있는 인력이 양과 질에서 턱없이 부족한조선사회에서 그 공백을 줄이는 데 기여한 것이 유의라고 할 수있다. 글을 아는 지식인이 유교적 교양만이 아니라 책을 통해 의학적지식까지 습득하여 의료적 혜택을 받지 못하는 주변 사람들에게도움을 주는 것은 지식인의 사회적 책임의식에서 나온 것이라 할수 있다.

유의의 의료활동을 오늘날의 관점에서 무자격자의 비전문적 의료시술이라고만 평가한다면 의사의 정체성 형성과 관련해 참고할내용이 없을 것이다. 그러나 우리는 유의의 활동을 영리 목적이나 금전적 반대급부를 기대하지 않고 지식인의 사회적 책임의식에서유래하는 이타적 의료행위로 평가할 수 있다. 그렇게 본다면 현대사회의 대표적 전문직 지식인으로서 의사가 가져야 할 사회적 책임의식의 중요한 측면을 조선시대 유의를 통해서 재발견할 수 있을 것으로 생각한다.

 

근대적 의료인의 등장

일반적으로 한국사에서 근대적 의료인이란 1876년 개항 이후서양의학 교육을 받은 의료인을 말한다. 서양의학의 교육이라는 측면에서만 본다면 비록 결실을 맺지 못했으나 1886년부터 제중원에서는 학생을 선발하여 의학교육을 실시하였고, 에비슨은 1895년부터 의학교육을 시작하였다[8]. 그런데 근대적 의료인과 전근대적 의료인의 차이는 그들이 습득한 의학지식의 내용만이 아니라 제도적 차원에서 국가에 의한 공인과 의료행위에 대한 배타적 권리 부여가 핵심이다. 국가가 자격을 부여하는 사람만이 의료활동을 할 수 있다는 것은 근대적 개념으로 전근대의 한국사회뿐 아니라 동아시아에서는 찾아볼 수 없는 개념이었다. 의료인에 대한 이러한 근대적 개념이우리 사회에 들어오고 자리를 잡은 것은 백여 년 남짓에 불과하다. 이러한 개념이 사회적으로 제도화된 것은 1900년에 공포된 ‘의사규칙(醫士規則)’을 통해서이다.

이 규칙은 한국의 역사상 최초로 의사의 정의를 법률적으로 규정하고 있다는 점에 큰 의미가 있다. 의사규칙의 제1조는 “醫士는 의술을 慣熟하여 天地運氣와 脈候診察과 內外景과 大小方과 藥品溫凉과鍼灸補瀉를 통달하여 對症投劑하는 자(제1조)로 규정한다. 내용적으로는 한의에 대한 것이다. 그러나 제2조에서는 의과대학과 약학과를 졸업하고 국가가 주관하는 시험에 합격한 사람을 의사로 규정하며, 그 외의 사람들이 의료행위를 하는 것을 금지하고 있다. 1조는당시 실제로 활동하고 있던 전통의료인을 지칭한 것이라면 제2조는아직 국내에서 배출되지는 않았으나 앞으로 배출될 미래의 의사를염두에 둔 조항이라 할 수 있다. 의사규칙에서 전통의료인과 근대의학을 공부한 의료인을 모두 같은 용어,  의사(醫士)로 지칭하고있는 것은 당시의 현실을 반영하고 있다고 할 수 있을 것이다.

여기서 의사의 한자가 현재 우리가 사용하는 ‘醫師’가 아니라 ‘醫士’임이 눈에 띈다. ‘醫士’가 아닌 ‘醫師’가 근대적 의료인을 지칭하는공식적인 용어로 쓰인 것은 일제강점기에 들어서이다. 1913년에총독부가 공포한 의사규칙(醫師規則)이 이를 공식화한 것이다. 그러나 의사(醫師)라는 용어가 일본에서 만든 용어는 아니다. 의사(醫師)는 고대 중국의 주나라와 당나라, 그리고 우리나라에서는 고려시대에 의료에 관한 일을 맡아보던 관직의 명칭으로 쓰였다(高麗史77, 百官志, 外職). 조선왕조실록에도 조선전기(태조성종) 7회의 사용례가 나타나고 있는데, 대개 중앙의 의료 관련 관직에 있는의원을 지칭할 때 쓰고 있다. 또 영, 정조 시대에도 2회의 사용례가있다. 한편, 醫士는 청나라 태의원에서 일하는 의관의 명칭이었다.우리나라에서는 특별히 관직명으로 사용된 적은 없다. 다만 왕조실록에서는 조선전기에 중앙의 의료 관련 관직에 있는 의원을 지칭하는 말로 醫師와 혼용되어 쓰였는데, 숙종 이후에는 醫士의 사용례가 없다. 1900년에 반포된 의사규칙에서 醫師를 쓰지 않고 醫士를쓴 것이 한국의 전통을 반영한 용어의 선택이라고 보는 견해도 있으나[9], 고려나 조선에서도 醫師란 용어를 쓴 용례들이 있는 것으로보아 그렇게 보기는 어렵다.

명칭이야 어떠하든 중요한 것은 대한제국 이래 국가가 의료행위의 배타적 권리를 면허를 통해 의사에게 보장해주었다는 사실이다. 국가가 허가한 사람만이 의료행위를 할 수 있다는 것은 우리나라뿐아니라 동아시아 전통세계에서는 존재하지 않던 개념이었다. 면허제도를 통해 소수의 허가받은 사람만이 의료행위에 종사할 수 있게된 상황은 의사가 전문직으로 자리잡는 데 중요한 역할을 했으며, 그에 따라 의사의 사회적 지위를 높이는 데에도 크게 기여했다. 잘 알려진 바와 같이 조선시대의 의료인은 사회적 신분이 높지 않은 중인 계층이었다. 이는 과학기술을 상대적으로 낮게 평가하는 사회적 분위기에서 유래했으며, 그에 따라 특정 기술분야 전문가의 사회적 지위가 유교적 교양을 갖춘 보편적 지식인보다 낮은 결과를 초래했던 것이다. 이러한 양상은 유교적 보편교양이 전문적 기술지식보다 사회적으로 높은 평가를 받은 것에도 원인이 있지만, 의료행위에 진입장벽이 없다는 것, 다시 말해 누구나 의료행위를 할 수 있다는 사실도 중요한 원인이다.

조금 맥락은 다르지만 19세기 미국에서 의학교육기관이 난립하여, 사실상 누구나 원하기만 하면 의사가 될 수 있는 상황이었다. 그러나 플렉스너 보고서를 통해 이들 교육기관에 대한 냉정한 평가가 이루어지고, 이를 토대로 의학교육에 대한 질적 요구수준이 높아졌다[10]. 그에 따라 난립하던 부실한 의학교육기관들은 정리가 되고, 일정한 수준 이상의 충실한 의학교육을 제공할 수 있는 기관만이살아남았다. 이는 달리 말하면 의학교육을 받을 수 있는 진입장벽이높아졌으며, 따라서 배출되는 의사의 수도 제한됨을 의미한다. 이러한 배타적 질 관리를 통해 의사들의 사회적 지위도 이전에 비해높아졌다는 것이 일반적 평가이다[11].

20세기 이후 한국사회에 도입된 의사면허제도는 근대적 의료제도 도입의 한 부분으로 이루어졌다. 그러나 앞서 살펴본 바와 같이허락된 사람만이 의료행위를 할 수 있다는 것은 전통사회에서는존재하지 않던 관행이었다. 반면, 서양에서는 국가가 의료행위자에 대한 면허를 공식적으로 부여한 것은 19세기 근대국가의 성립 이후이지만, 그 이전에도 지방 권력에 의해서나 혹은 길드적 전통에따라 배타적 의료행위에 대한 허가의 오랜 역사가 있었다. 아울러의사는 의료시장에서 여러 관련 직종들과 경쟁을 하며 의료시장내에서 배타적 영역을 확보해 나갔다. 서구사회에서 의사직이 형성되는 과정에서 이루어진 이러한 역사적 경험은 의사직의 직업적정체성을 형성하는 중요한 바탕이 되었다. 이러한 정체성은 오랜기간에 걸쳐 사회와 상호작용을 함으로써 형성된 것으로, 거기에는 배타적 의료행위의 허가라는 특권에 상응하는 사회적 책임의식도 포함되어 있다.

이에 비해 한국사회의 의사는 의료행위의 배타적 허가라는 특권이 근대화의 과정에서 위로부터 갑자기 주어졌다. 다시 말해 법률에 의해 배타적 의료행위의 권리를 가진 의사라는 전문직이 새롭게창조된 것이다. 이는 이미 존재하던 사회적 관행을 법률로 공식화하는 과정이 아니라, 법률적 규정을 통해 과거에 존재하지 않던 새로운사회적 관행을 만들어내는 것이라 할 수 있다. 서구사회에서 면허의사의 등장이 전자의 과정에 해당한다면, 한국사회에서 면허의사의 등장은 후자에 해당한다. 한국사회의 의사는 전문직으로서 스스로의 정체성을 형성하는 데 필요한 역사적 경험의 부재 속에 등장했다. 물론 한국사회에 근대적 의사가 등장한 이후 100여 년간 쌓아온역사적 경험은 서구사회에 비해 일천하지만 중요한 자산이다. 지난100여 년간의 역사적 경험이 오늘날 한국사회에 존재하는 의사의정체성을 형성하고 있기 때문이다. 따라서 지난 역사적 경험에 대한비판적 성찰을 통해 한국사회가 요청하는 바람직한 의사의 모습을만들어가는 것이 오늘날 한국사회의 의사가 당면한 과제라 할 수있다.

결 론

의사는 현대사회의 대표적인 전문직이다. 전문직이란 달리 표현하면 진입장벽이 높은 직업을 말한다. 의사의 경우 장기간의 교육과수련, 그리고 면허와 같은 것들이 누구나 의료행위를 할 수 없게만드는 요인으로 작용한다. 주로 근대 이후 생겨난 이러한 외형적특성은 의사의 직업적 정체성에 중요한 부분을 차지한다. 다른 한편 내용적으로 보았을 때 의사의 정체성에서 핵심을 이루는 것은 치료자로서의 정체성이다. 오늘날 한국사회의 의사는 [치료자]라는 보편적 정체성이 진입장벽이 높은 [전문직]이라는 특수한 역사적 정체성과 결합된 결과이다. 위에서 우리가 살펴본 바와 같이 치료자의보편적 정체성은 상이한 사회적  역사적 조건과 결합하여 다양한방식으로 나타난다. 과거 한국의 역사 속에서 치료자가 가졌던 여러가지 전근대적 면모들은 근대적 의료인의 출현과 함께 사라지는것은 아니다. 전근대사회에서 치료자가 가졌던 여러 정체성 가운데의사의 활동과 역할 속에 적극적으로 수용해야 할 부분들도 있다고보인다.

오늘날 한국사회는 의사에 대해 높은 수준의 윤리의식을 요구한다. 이러한 요구는 의료라는 행위의 특성에서 유래하는 부분도 있지만, 전문직으로서 강한 사회적 책임에 대한 요구이기도 하다. 전문직의 직업윤리 함양은 단순히 당위적인 덕목의 부과, 이상적인 의사상의 제시, 혹은 현실성이 적은 인성교육의 강조 등으로 이루어지기어렵다. 투철한 직업윤리는 직업적 정체성에 대한 분명한 자각에서 유래한다. 의사의 전문직 정체성 형성과 이에 대한 자각을 위해서는교육의 역할이 중요하며, 다양한 내용과 방법이 교육에 활용될 수있을 것이다. 다만 어떤 대상의 정체성은 역사적 경험의 과정 속에서형성된다는 점에서 의사직의 역사적 형성과정에 대한 내용이 교육의중요한 부분으로 포함되어야 할 것으로 생각된다.

 

 

 


In modern society, doctors are a representative example of professionals—that is, doctors are members of an occupation with high barriers to entry. For doctors, long-term education, training, and licensing are factors that make it difficult to enter medical practice. These external characteristics, which have mainly arisen in the modern era, play an important part in the professional identity of doctors. Nonetheless, the core of the doctor’s identity is the identity of the healer. In today’s Korean society, the universal identity of doctors as healers results from a combination of the special historical identity of professionals with high entry barriers. Korean society currently demands a high level of ethical awareness from doctors. These demands are partly derived from the nature of the practice of medical care, but they also reflect demands for strong social responsibility as professionals. It is difficult to cultivate professional ethics simply by imposing legitimate virtues, presenting an ideal model, or emphasizing moral education that is not fully realistic. A deep-rooted sense of professional ethics stems from a clear awareness of professional identity. Education plays an important role in the formation and awareness of doctors’ professional identity, and various types of content and methods can be used in education. However, since the identity of an entity is formed through the process of historical experience, it is thought that the historical process of the formation of doctors as a profession should be included as an important part of education.

 

Keywords: Confucian doctors, Healer, License, Professionals

 

 

보건전문직 교육에서 질적 에고 네트워크: 나를 타인과의 관계 속에서 잡아내기(Med Educ, 2022)
Qualitative ego networks in health professions education: Capturing the self in relation to others
Laura Nimmon1 | Anique Atherley2

 

 

1 소개
1 INTRODUCTION

우리의 단결성과 함께 차별성을 깨닫는 것은 상호의존성을 보는 것이다
The combination of realizing our distinctiveness along with our unity is seeing interdependence

샤론 살츠버그
Sharon Salzberg



우리는 [다른 사람들과의 상호작용]을 통해 바로 우리의 자아 의식을 도출할 것을 제안한다.1 학생, 교수진, 행정 직원, 간호사 및 제휴 건강 전문가 등 보건 직업 교육의 모든 개인은 학습 경험의 본질을 만드는 관계와 교차 사회 서클을 통해 연결된다. 그루펜 등은 상호작용을 학습 환경의 사회적 구성 요소로 설명한다.2 '모든 사회적 관계는 학생들이 학습 환경 내에서 무엇을 어떻게 배우고 그들의 인식과 경험을 형성하는지에 영향을 미친다.' 이러한 학습 환경의 차원을 가시적으로 표현하기 위해, HPE 학문은 HPE 공간에서 사회적 프로세스의 영향과 관련하여 누가 그리고 어떻게 영향을 미치는지 포착할 수 있는 우아한 연구 접근법을 필요로 한다. 참가자들의 소셜 네트워크의 시각적 매핑은 HPE 문헌,3-5에서 주목을 받고 있지만 이 연구 접근법의 토대는 거의 주목을 받지 못했다.
It is suggested that we derive our very sense of self through interactions with others.1 All individuals in health professions education (HPE)—students, faculty, administrative staff, nurses and allied health professionals—are connected through relationships and intersecting social circles that create the essence of learning experiences. Gruppen et al describe these interactions as the social component of the learning environment.2 ‘All these social relationships influence what and how students learn and shapes their perceptions of and experiences within the learning environment (pp. 970)’. To render this dimension of the learning environment visible, HPE scholarship requires elegant research approaches that can capture the who and how in regards to the influence of social processes in HPE spaces. Visual mapping of participants' social networks is gaining traction in the HPE literature,3-5 yet the underpinnings of this research approach has received little attention.

[의미 있는 연결]은 [실제, 상상 또는 가상 가상 세계의 사람들에게 중요한 어떤 종류의 행동] 없이는 실현materialize될 수 없다. 본 State of the Science 논문에서, 우리는 학습 상황 및 사회적 맥락과 관련하여 개인의 자신에 대한 인식을 시각적으로 매핑하는 질적 자아 네트워크 분석 접근법을 소개한다. ego 네트워크와 personal network라는 용어는 종종 번갈아 사용된다. 본 논문에서, 우리는 참여자들의 사회적 연결에 대한 인식을 나타내기 위해 자아 네트워크라는 용어를 채택한다. 따라서 에고는 '자아' 또는 '나'로서 경험되고 인식을 통해 외부 세상과 연결된다.
Meaningful connection cannot materialise without some sort of action that matters to people in actual, imagined, or virtual-simulated worlds.6 In this State of the Science paper, we introduce a qualitative ego network analysis approach that visually maps individuals' perceptions of their self in relation to learning situations and social context. The terms ego network and personal network are often used interchangeably.7 In this paper, we adopt the term ego networks to represent participants' perceptions of their social connections. Ego is thus experienced as ‘self’ or ‘I’ and connects with the external world through perception.

많은 방법론들이 참가자들의 사회 세계를 탐구할 수 있다. [질적 자아 네트워크] 접근은 암묵적인 사회적 지식의 표현을 강화하기 위해 잘 배치된 시각적 방법이다. 이 접근법은 자신의 관점에서 자신의 사회적 환경을 반영하도록 자극한다.8 자아 네트워크 시각화는 질적 데이터와 결합하여 풍부하고 복잡하고 깊은 통찰력을 얻으면서 연구자가 관찰하지 못할 수 있는 숨겨진 관계 데이터를 고유하게 드러낼 수 있다.9 개인의 행동과 신념은 [현실 그 자체]보다는 [자신이 살고 있는 사회 세계에 대한 인식]에 의해 좌우되기 때문에 사람들의 관계에 대한 관점이 중요하다. 참가자의 주관적 사회 경험을 시각적으로 포착하면 연구자와 기관이 다양한 예상치 못한 사회 경계에서 교육 경험이 어떻게 생성되는지, 타인에 대한 인식이 행동, 태도, 가치 및 기회에 어떻게 영향을 미치는지 알 수 있다. 
Many methodologies can explore participants' social worlds. A qualitative ego network approach is a visual method well positioned to enhance expression of tacit social knowledge. This approach stimulates reflections of one's social environment from one's vantage point.8 Ego network visualisations, combined with qualitative data, can harvest rich, complex, deep insights, while uniquely revealing hidden relational data that the researcher may not observe.9 People's viewpoint of their relationships is important to capture because individuals' behaviours and beliefs are conditioned by their perception of the social world they inhabit, rather than by reality itself.10, 11 Visually capturing participants' subjective social experiences can reveal to them, researchers and institutions how educational experiences are created across diverse unanticipated social boundaries and how perceptions of others influence behaviour, attitudes, values and opportunities.12

본 논문에서, 우리는 구조적 및 비구조적 참여자가 생성한 질적 자아 네트워크 접근 방식을 보여준다. 그런 다음 우리는 질적 자아 네트워크 접근법에 대한 비판적 반영과 논문의 균형을 맞춘다. 우리의 목표는 초보자와 노련한 연구자들이 질적인 자아 네트워크 접근법을 탐색할 수 있도록 돕는 것이다. 이 접근법을 도입하는 것은 HPE 분야가 자기, 사회 및 상황의 상호연결을 확대하기 위해 노력하고 있기 때문에 특히 시기적절하다.
In this paper, we showcase structured and unstructured participant-generated qualitative ego network approaches. We then balance the paper with our critical reflections of a qualitative ego network approach. Our goal is to help novice and seasoned researchers navigate a qualitative ego network approach. Introducing this approach is particularly timely as the field of HPE works towards enlarging understanding of the interlacing of self, society and situation.

2 SNA가 무엇입니까?
2 WHAT IS SNA?

사회관계망분석(SNA)은 물리, 생물학, 경제, 공중보건, 사회학, 수학, 국가안보와 같은 과학의 다양한 분야에 의해 형성된다. SNA 접근법은 유기적으로 성장하여 수많은 이론, 모델 및 응용 프로그램을 아우르고 있다.13 SNA는 매력적이고 다양한 진화를 겪었지만, 접근방식을 특징짓는 다양한 개념과 방법이 있다. 이러한 기원은 그래프와 행렬 대수 이론, 사회측정학 및 인류학 방법의 혼합에서 비롯된다. SNA 학자들은 개인을 자율적이고 고립된 것으로 보지 않는다. 대신, 개인은 맥락화된 환경에 상호 의존적으로 위치한다. SNA는 HPE 맥락에서 역동적인 사회적 상호작용을 포착하기 위해 고유하게 배치된 연구 접근법이다. SNA는 개인이 특정 사회 문화 환경에서 배우고 일할 때, 인간 상호 작용은 그들이 접하는 제약과 기회 그리고 그들의 행동과 믿음을 형성한다는 전제에서 시작합니다.11 학습자는 사람, 그룹, 팀, 조직과 사회에 내재된 적극적 행위자active agent입니다. SNA는 일반적으로 발전소 및 인간 유전자와 같은 다른 엔티티가 포함되었지만, 인간 사이의 연결에 초점을 맞춘다.16
Social network analysis (SNA) is shaped by diverse branches of science such as physics, biology, economics, public health, sociology, mathematics and national security, to name only a few. SNA approaches have organically grown to encompass numerous theories, models and applications.13 Although SNA has undergone a fascinating and eclectic evolution, there are different strands of concepts and methods that characterise the approach. These originations derive from a blend of graph and matrix algebra theory, sociometric and anthropological methods.14 SNA scholars do not see individuals as autonomous and isolated; instead, individuals are interdependently situated in contextualised settings. SNA is a research approach uniquely positioned to capture dynamic social interactions in HPE contexts. SNA starts with the premise that when individuals learn and work in specific social and cultural settings, human interactions shape the constraints and opportunities they encounter and their behaviours and beliefs.11 Learners are active agents who are embedded with people, groups, teams, organisations and societies. SNA typically focuses on connections between humans,15 although other entities have been included such as power stations and human genes.16

2.1 SNA: 패러다임
2.1 SNA: A paradigm

[패러다임]은 과학에 대한 특정한 접근을 정의하는 개념, 실천 그리고 언어로 구성된다.17 SNA 패러다임의 기반이 되는 것은 [사회 구조를 형성하는 관계의 패턴]에 대한 관심이다.18

  • 이 패러다임을 함께 [온톨로지]는 사회세계가 관계형이기 때문에 관계를 통해 현실이 나타난다는 지향이다. 
  • 소셜 네트워크 학자들은, 사회적 관계가 사회 구조 내에서 서로 상호작용할 때, 사회적 유대의 본질과 역학을 이해함으로써 지식이 생성되는 [인식론적 입장]을 채택한다. 
  • [공리적]으로 SNA는 본질적으로 상호의존성을 중요시한다. 그러므로 구속력 있는 가정은 인간관계가 인간 경험의 본질을 형성한다는 것이다. 놀랄 것도 없이, SNA의 분석 단위는 관계입니다.


A paradigm consists of the concepts, practices and language that define a particular approach to science.17 What underpins a SNA paradigm is an interest in the patterns of relationships that form social structure.18 

  • The ontology that threads this paradigm together is an orientation that the social world is relational thus reality emerges through relationships.
  • Social network scholars adopt an epistemological position where knowledge is generated through understanding the nature and dynamics of social ties (ie social relations) as they interact with each other within a social structure.19 
  • Axiologically, SNA intrinsically values interdependence. Therefore, a binding assumption is that relationships form the essence of the human experience. Not surprisingly, the unit of analysis in SNA is the relationship.5

2.2 SNA의 이질성
2.2 The heterogeneity of SNA

Isba 등은 의학 교육지의 이전 호에서 SNA가 HPE.5 SNA 분야에 대한 근본적인 질문에 답변할 수 있는 방대한 잠재력은 HPE 환경에서 학습에 대한 관계의 이해에 관련된 사회 현상을 조명하기 위해 양적 및 질적 접근법20으로 확장될 수 있다고 언급했다. 정량적 SNA는 네트워크에서 위치와 연결을 통계적으로 측정한다.21

  • [정성적 SNA]는 관계의 주관적 의미를 탐구하는 반면,
  • [혼합 방법 SNA] 접근법은 네트워크의 구조적 차원 및 사회적 프로세스와 상호작용의 기본 의미를 강조한다. 

Isba et al in a previous issue of Medical Education remarked the vast potential for SNA to answer questions fundamental to the field of HPE.5 SNA can extend across quantitative and qualitative approaches20 to illuminate social phenomenon pertinent to understanding the role of relationships on learning in HPE settings. Quantitative SNA statistically measures positions and connections in networks.21 Qualitative SNA explores the subjective meaning of relationships.20 While mixed methods SNA approaches emphasize the structural dimensions of networks and the meaning underlying social processes and interactions.20, 22

SNA 연구의 유형학은 연구 질문에 따라 세 가지 수준의 분석으로 구성된다: 

  • 자아 또는 노드 수준(개인의/자신의 관계), 
  • 관계쌍 수준(두 사람 간의 관계),
  • 전체/네트워크 수준(특정 사회 공간에서 개인 간의 다중 상호 연결 관계).11 

이러한 수준은 의미, 크기, 밀도, 집중화, 넥타이 강도, 교량, 시간 경과에 따른 변화를 포함하여 소셜 네트워크 차원의 다양한 문서화와 분석을 용이하게 한다.

The typology of SNA research is organised into three levels of analysis depending on the research question:

  • ego or node level (an individual's/self's relationships),
  • dyad level (relationships between two people) and
  • whole/network level (multiple interwoven relationships between individuals in a particular social space).11 

These levels facilitate a variety of documentation and analysis of social network dimensions, including meaning, size, density, centralisation, tie strength, bridges, betweenness and change over time.

SNA는 이론적 및 방법론적으로 사용될 수 있는 패러다임이다. 복잡한 용도를 고려할 때, 연구자들은 연구 철학, 방법론적 선택, 데이터 수집 절차 사이의 정렬과 관련하여 많은 선택을 한다. 그림 1은 SNA 연구원이 SNA를 사용할 때 내릴 수 있는 결정을 설명하는 손더스 등의 인기 있는 연구 양파를 적용한 것이다.

  • 그림 1은 이론이 연구 설계에 따라 SNA 작업을 동적으로 뒷받침할 수 있는 방법에 대한 명시적인 고려를 허용한다.
  • 또한, 그림 1은 연구 질문에 답하는 데 사용할 수 있는 다양한 SNA 데이터 수집 기술을 강조한다. 예를 들어, 시각 지도(즉, 소시오그램)는 근거이론 연구 및 민족학 연구에서 데이터로 사용되어 왔다. 25 다른 사람들은 SNA 이론의 요소를 '차용'하고 건강을 둘러싼 사회적 상호 작용 패턴을 탐구하기 위해 질적 자아 네트워크 방법을 채택한 종적 민족학 연구 설계를 기술했다.27

이론 통합, 데이터 수집 접근법 및 분석 기술의 복잡한 이질성을 광범위하게 설명하는 것은 본 논문의 범위를 넘어선다. 특정 관계 중심 연구 질문을 해결하기 위해 SNA 접근법의 범위에 대한 이해를 확대하고자 하는 사람들을 위해, 우리는 이러한 상세한 보급형 자원을 제안한다. 
SNA is a paradigm that can be employed theoretically and/or methodologically. Given its complex use, researchers make a number of choices as it relates to the alignment between their research philosophy, methodological choices and data collection procedures. Figure 1 is an adaptation of the popular research onion of Saunders et al23 which describe the decisions SNA researchers can make when employing SNA.

  • Figure 1 allows explicit consideration of the ways in which theory can underpin SNA work dynamically depending on the research design.
  • Moreover, Figure 1 emphasises the variety of SNA data collection techniques that can be employed to answer a research question. For example, visual maps (ie sociograms) have been used as data in grounded theory research24 and ethnographic research.25 Others have described a longitudinal ethnographic study design where they ‘borrowed’26 elements of SNA theory and employed qualitative ego network methods to explore patterns of social interaction around health.27 

It is beyond the scope of this paper to describe broadly the complex heterogeneity of theory integration, data collection approaches and analytic techniques. For those who want to expand understanding of the range of SNA approaches to address specific relationally focused research questions, we suggest these detailed, entry-level resources.11, 20, 28-30

 
 

3 HPE의 정성적 SNA 접근법
3 QUALITATIVE SNA APPROACHES IN HPE

[SNA에 대한 정성적 접근법]은 초기 단계이며 HPE에서 충분히 활용되지 않는다. 이 접근법은 관계에서 어떻게 권력, 지위, 의미, 감정 및 정체성이 나타나며, 어떻게 학습 환경의 인식과 경험을 형성하는지에 관심이 있다. 상호작용의 품질에 대한 관심은 의사소통, 행동, 지식, 자원 및 혁신이 어떻게 나타나고 철저한 사회적 관계와 심지어 조직으로 흘러가는지를 강조할 수 있다. [정성적 SNA 접근법]은 연구자들이 네트워크의 구조(예: 유대가 존재하거나 존재하지 않음)를 고려할 뿐만 아니라 사회적 유대의 생성, 변동성, 역학 및 의미를 탐구할 수 있게 한다. 

Qualitative approaches to SNA are nascent and underutilised in HPE. This approach is interested in the ways power, status, meanings, emotions and identities emerge in relationships and shape perceptions and experiences of the learning environment. Attention applied to the quality of interactions can highlight how communication, behaviour, knowledge, resources and innovation emerge and flow thorough social relations and even organisations.31 Qualitative SNA approaches allow researchers not only to consider the structure of a network (eg ties are present or absent) but also to explore creation, variability, dynamics and meanings of social ties.20

SNA를 수행한다고 해서 연구자들이 질적인 툴킷을 놓아야 하는 것은 아니다. 질적 소셜 네트워크 연구자들은 이러한 관계의 본질과 결과를 탐구하기 위해 다양한 질적 데이터를 수집한다. SNA에서 사용할 수 있는 질적 데이터 수집 방법의 몇 가지 예로는 개별 인터뷰, 포커스 그룹, 참가자 일지, 인구 통계 데이터, 현장 관찰 및 아카이브 소스가 있다. SNA 시각화 기법은 일반적으로 인간의 시선을 피할 수 있는 관계의 가시적 패턴을 렌더링하는 데 사용된다. 
Engaging in SNA does not mean that researchers have to let go of their qualitative toolkits.32 Qualitative social network researchers collect a variety of qualitative data to explore the nature of relationships and outcomes of these relationships. Some examples of qualitative data collection methods that can be used in SNA include individual interviews, focus groups, participant diaries, demographic data, field observations and archival sources.28 SNA visualisation techniques are typically used to render visible patterns of relationships that would otherwise escape the human gaze.33

이와 같이, SNA 질적 접근법은 HPE 학습 환경에 내포된 도전적이고 걱정스러운 사회적 복잡성을 이해하는 데 도움이 되도록 잘 포지셔닝되어 있다. 또한 SNA에 대한 질적 접근법은 학습자가 다양한 사회적 환경을 어떻게 그리고 왜 횡단하는지 이해하여 [사회적 맥락의 인식적perceptual 경계]를 확장하는 데 도움이 될 수 있다. 예를 들어, 옴스 등의 정량적 SNA 연구는 비공식적인 학생 대 학생 사회적 상호작용이 의대생의 학습과 강하게 연관되어 있다는 것을 발견했다. 그러나, 저자들은 어떻게 비공식적인 사회적 상호작용이 학생들의 학습을 촉진시키는지에 대한 질적 접근법이 필요하다고 강조했다. 또 다른 연구에서는 질적인 소셜 네트워크 데이터를 통해 학자들이 어떻게 주로 학문적 발전 교육 맥락 밖에서 정서적, 학문적, 전문적인 지원을 개발했는지를 밝혀냈다.35 따라서 질적 SNA는 공식적인 교육 환경 외부의 숨겨진 의미 있는 관계를 발굴할 수 있다.

As such, SNA qualitative approaches are well positioned to help us understand challenging and fraught social complexities nested in HPE learning environments. Moreover, qualitative approaches to SNA can help us understand how and why learners traverse different social landscapes, expanding our perceptual boundaries of social context. For example, the quantitative SNA research of Hommes et al discovered that informal student to student social interactions are strongly associated with medical students' learning.34 However, the authors emphasised that qualitative approaches are needed to unpack how informal social interaction facilitate student learning.34 In another study, qualitative social network data have revealed how academics developed a range of emotional, academic and professional support mostly outside the academic development teaching contexts.35 Qualitative SNA can thus unearth hidden meaningful relationships outside of formal educational settings.

4 HPE의 질적 자아 네트워크
4 QUALITATIVE EGO NETWORKS IN HPE

많은 질적 접근법이 HPE 맥락에서 개인의 사회적 경험에 대한 통찰력을 얻기 위해 사용되어 왔다. 예를 들어, 민족학, 현상학 서술 조사 또는 기초 이론. 더욱이, 사진, 드로잉, 풍부한 그림, 픽터 기술 및 비디오와 같은 다양한 시각적 방법이 vi를 위한 방법으로 도입되었다.참가자의 경험을 충실히 담아냅니다. HPE 연구에서 자아 네트워크 접근법이 점점 더 많이 채택되고 있지만, 3, 4는 질적 자아 네트워크 접근법의 기초와 기술을 깊이 탐구한 최초의 논문이다.

Many qualitative approaches have been used to gain insights into individuals' social experiences in HPE contexts—for example, ethnography,36 phenomenology37 narrative inquiry38 or grounded theory.39 Moreover, a variety of visual methods such as photovoice, photography, drawings, rich pictures, Pictor technique and video have been introduced as ways to visually capture the experiences of participants.9, 40, 41 Although ego network approaches are increasingly employed in HPE research,3, 4 this is the first paper that delves deeply into the underpinnings and techniques of a qualitative ego network approach.

[자아 네트워크(즉, 자기 중심) 접근법]은 자아ego(참여자)]에 의해 정의된다; 자아는 지향적인 초점orienting focal point이고, 이 사람은 네트워크의 구성을 정의한다. 관계(SNA 용어에서 유대ties라고 함)는 종종 자아와 다른 사람들 사이의 선으로 표현된다.18 따라서, [자아 네트워크의 유대관계]는 [초점 참여자focal participants]에 대한 연결에 의해 추진된다. 이 접근법은 지역 사회 구조의 의미와 역학을 강조하면서 타인과의 상호작용과 관계에 대한 개인의 인식을 드러낸다. 자아 네트워크의 데이터는 양적, 질적4 또는 혼합된 방법을 사용하여 얻을 수 있다.3 표 1은 HPE에서 자아 네트워크를 탐구하기 위한 양적, 질적 및 혼합 방법의 비교를 제공한다.

An ego network (ie egocentric) approach is defined by the ego (ie the participant); the ego is the orienting focal point, and this person defines the composition of their network. Relationships (called ties in SNA terminology) are often represented by lines between the ego and others.18 Thus, the inclusion of ties for ego networks are driven by the connections to the focal participant. This approach reveals an individual's perception of their interactions and relationships with others, emphasising the meaning and dynamics of their local social structures.28 Data on an ego network can be obtained either quantitatively,42, 43 qualitatively4 or using mixed methods.3 Table 1 provides a comparison of quantitative, qualitative and mixed methods approaches to explore ego networks in HPE.

 

질적 자아 네트워크 접근은 개인의 경험의 본질을 형성하는 관계의 의미와 본질에 대한 연구 질문, 데이터 수집 전략 및 분석을 유도한다. 질적 자아망 접근법에 참여하는 사람들은 모든 질적 보고에서 예상되는 투명성과 명확성을 동일하게 보고해야 한다. 이 접근법이 엄격하거나 절차적 접근법보다 유연한 경향이 있기 때문에 질적 자아 네트워크 접근법을 보고할 때 특히 중요하다.25 패러다임 및 이론적 토대, 방법론적 선택, 연구 접근법, 네트워크 수준, 시간 차원 및 데이터를 포함하여, 방법에 대한 명시적이고 투명한 보고를 권장한다.(그림 1 참조). 소셜 네트워크 연구의 이질성을 고려할 때, 다른 사람의 맥락과 더 넓은 문헌에 대한 신뢰도, 관련성 및 이전 가능성에 대한 판단을 용이하게 하기 위해서 방법에 대한 광범위한 보고가 중요하다.44

A qualitative ego network approach orients the research question, data collection strategies and analysis towards the meaning and nature of relationships that form the essence of individuals' experiences. Those engaging in qualitative ego network approaches must report the same transparency and explicitness expected of all qualitative reporting.44 This is particularly important when reporting qualitative ego network approaches as this approach tends to be flexible rather than rigid or procedural.25 In particular, we encourage explicit and transparent reporting of methods including paradigmatic and theoretical underpinning, methodological choices, research approach, level of networks, time dimension and data (see Figure 1). Given the heterogeneity of social network research, extensive reporting of methods is critical in order to facilitate judgements about the trustworthiness, relevance and transferability to other's context and to the broader literature.44

 

4.1 Ego 네트워크 시각화
4.1 Ego network visualisation

[자아 네트워크 시각화]는 [네트워크에 대한 개인의 인식]을 묘사한다(예: 의대생들의 네트워크 내 누가 초기 중요한 임상 경험의 의미를 형성하는지).45 본질적으로, 자기 네트워크 소시오그램은 연구 참여자들이 경험하는 사회세계를 복제하고 미리 결정된 포함 기준(연구자가 부과한 사회적 경계)을 넘어 확장될 수 있다.32 우리의 연구에서 참가자들은 네트워크 경계 측면에서 흥미로운 범위를 조명했다. 이러한 사회적 경계는 제도적 교육 환경을 넘어 친구와 가족의 영향을 포함한다. 
Ego network visualisation portrays an individual's perception of their network (eg medical students' descriptions of who in their network shapes meaning of early significant clinical experiences).45 In essence, ego network sociograms replicate the social world experienced by research participants and can extend beyond predetermined inclusion criteria (ie researcher imposed social boundaries).32 In our own work, participants have illuminated intriguing range in terms of their networks' boundaries. These social boundaries have spanned beyond institutional educational settings to include influences of friends and family.3, 4, 45

자아 네트워크 시각화는 다른 시각적 방법과 유사하게 질적 데이터의 유일한 출처로 독립적일 수 있지만, 질적 SNA 연구자는 종종 인터뷰 및 다른 형태의 질적 데이터 수집(예: 관찰)을 통해 더 깊은 이해를 추구한다. 인터뷰는 특히 자아의 주관적 관점에서 사회문서에 묘사된 특정 관계의 본질, 기능, 역학, 복잡성, 의미를 풀어내는 데 유용하다.47
Although an ego network visualisation could standalone as a sole source of qualitative data similarly to other visual methods,9 qualitative SNA researchers often seek a deeper understanding through interviewing3, 4, 45, 46 and other forms of qualitative data collection (eg observations).27 Interviews are particularly useful to unpack the nature, function, dynamics, complexity and meaning of specific relationships depicted in sociograms from the subjective perspective of ego.47

[이름 생성 기법]은 종종 양적(조사) 또는 질적(면접 질문) 방법을 사용하여 도출된 개인의 소셜 네트워크를 탐색하기 위한 출발점으로 사용된다. 예를 들어, 면접을 위한 접근법은 참가자들에게 관심 있는 현상과 관련하여 누구와 상호작용하는지 물어본 다음 그 관계의 본질을 더 깊이 탐구하는 것이다. [이름 생성 기술]은 연구원과 참가자들을 소셜 네트워크의 풍부한 시각적 표현으로 이끈다. 이러한 소셜 네트워크 시각화(사회그램)는 연구자 또는 참가자가 생성한 시각 자료일 수 있다.9 시각화는 인터뷰 진행자가 인터뷰 중에 참가자와 대화할 때 참가자 또는 연구자가 생성할 수 있다. 또한 시각화는 인터뷰 후 또는 데이터 분석 시 생성될 수 있다.

Name generation techniques
are often used as starting points to explore individuals' social networks whether elicited using quantitative (surveys) or qualitative (interview questions) methods.48 For example, an approach for interviewing is to ask participants who they interact with around a phenomenon of interest and then explore more deeply the nature of those relationship. Name generation techniques lead researchers and participants towards rich visual representations of social networks. These social network visualisations (sociograms) can be researcher- or participant-generated visuals.9 Visualisations can be created by the participant or researcher as the interviewer is conversing with participants during an interview. Moreover, the visualisations can also be created after the interview or when analysing data.

전형적으로, 자기 네트워크 소시오그램은 [참가자들이 인터뷰 중에 네트워크 연결(이름 생성)을 나열하는 것]에서 발생하는 반면, 연구원은 이러한 [관계의 성격과 의미에 대해 인터뷰를 통해 조사]한다. 참가자 또는 연구자가 인터뷰 도중 제작한 비주얼 맵핑은 인터뷰만으로 촬영하기 어려운 미처 듣지 못한 참가자들의 통찰력을 자극할 수 있다. 게다가, 참가자들은 우리의 이해를 증진시키는 소시오그램에 대한 그들의 서술적 반응을 편집하고 재편집 할 수 있습니다. 구성원 확인Member checking은 특히 연구자가 생성한 경우 참가자의 지도가 그들의 경험을 정확하게 포착할 수 있기 때문에 연구자에게 실현 가능한 경우 사용된다.

Typically, ego network sociograms arise from participants listing their network ties (name generation) during the interview, whereas the researcher probes through interviewing into the nature and meaning of these relationships. The visual mapping produced during the interview by the participant or researcher can stimulate insights from participants that are unrehearsed and difficult to capture using only interviews.9, 40 Moreover, participants can edit and re-edit their narrative response to the sociogram that enriches our understanding.49 Member checking is used if this is feasible for the researcher as it can ensure participants' maps accurately capture their experience, particularly if researcher generated.

연구원은 일반적으로 SNA 소프트웨어를 사용하여 ego 네트워크를 만들거나, 참여자가 자신의 ego 네트워크를 생성할 수 있습니다. 참가자들이 사회적 관계를 묘사하기 위해 화살표를 사용하는 [픽터 기법]과 명백한 유사점이 있다. 그러나 자아 네트워크 접근법은 사회적 환경의 차원을 나타내는 다양한 기술과 전략을 유도하기 때문에 덜 제한적일 수 있다. 참가자는 종이와 컬러 펜을 사용하여 종이 조각에 자아 네트워크를 만들어 네트워크의 다각적인 표현을 할 수 있다. 참가자는 또한 형태, 선 너비 및 화살표와 같은 특징을 사용하여 연결의 차원을 시각적으로 강조할 수 있다.50 예를 들어 참가자와 다른 사람 사이의 개념적인 거리 또는 영향의 강도.

The researcher can create the ego network typically using SNA software,27 or participants can generate their own ego network.34 There are some overt similarities to the Pictor technique where participants use arrows to depict their social connections.941 However, an ego network approach can be less restrictive because it incites a range of techniques and strategies to represent dimensions of one's social environment. Participants can use paper and coloured pens to create their ego network on pieces of paper, rendering a multifaceted representation of their network. Participants can also use features like shapes, line width and arrows to visually highlight dimensions of connection.50 For example, conceptual distance between the participant and others or intensity of influence.

자아 네트워크를 만드는 정해진 방법은 없으며, 자아 네트워크 소시오그램을 생성하기 위해 많은 창의적인 접근법이 사용되어 왔다. 더욱이, 자아 네트워크 데이터는 유연하게 분석되며 연구자의 기술에 어느 정도 의존한다. 예를 들어, 주제 분석, 상시 비교 분석,4 콘텐츠 분석 또는 서술 분석을 사용하여 자아 네트워크 비주얼과 인터뷰 데이터를 통합하고 해석하는 것이 합법적일 것이다. 데이터 수집은 반복적일 수 있지만, 이는 예상이 아니며 연구자의 설계와 시간에 따라 달라진다. 다음에서는 연구에서 채택한 서로 다른 질적 자아 네트워크 접근법의 두 가지 심층 사례를 소개한다.

There is no prescribed way to create an ego network and many creative approaches have been used to generate ego network sociograms. Moreover, ego network data are analysed flexibly and depend to some extent on the skillset of the researcher. For example, it would be legitimate to use thematic analysis,3 constant comparative analysis,4 content analysis or narrative analysis to integrate and interpret ego network visuals and interview data. Data collection can be iterative, but this is not an expectation and depends on the design and time affordances of the researcher. In the following, we showcase two in-depth examples of different qualitative ego network approaches we have employed in our research.

4.1.1 예 1: 참여자가 생성한 자아 네트워크에 대한 구조화된 접근법
4.1.1 Example 1: Structured approach to participant-generated ego networks

한 연구에서,3 Atherley 등은 학부 의대생들의 임상 훈련으로의 전환 경험에 영향을 미치는 소셜 네트워크를 탐구했다. 애설리 등은 주관주의적인 이론 정보 귀납적 접근법(그림 1 참조)을 채택했으며, 이는 이론이 연구 설계의 모든 측면을 알려줬다는 것을 의미한다. 그들은 임상 환경으로 전환하는 8명의 의대생들의 소셜 네트워크의 구조와 경계를 고려하기 위해 실습 이론의 환경으로부터 민감한 개념과 함께 연구 설계를 알리기 위해 SNA 패러다임을 사용했다.
In one study,3 Atherley et al explored the social networks impacting undergraduate medical students' experiences transitioning to clinical training. Atherley et al employed a subjectivist fully theory-informed inductive approach (see Figure 1), which means the theory informed all aspects of the study design.51 They used a SNA paradigm to inform the study design alongside sensitising concepts from landscapes of practice theory52 to consider the structure and boundaries of social networks of eight medical students transitioning to the clinical environment.


애설리 등은 반구조적 인터뷰 동안 자아 네트워크(즉, 사회그램) 생성을 위한 템플릿으로 동심원3 방법을 사용했다. 네트워크 맵에 대한 이러한 '구조화된' 접근방식은 때때로 참여자들이 네트워크 데이터를 도출하는 다른 방법보다 선호한다. 참가자들은 먼저 임상실습으로 들어가는 전환 경험에 영향을 미친다고 생각되는 사람들의 목록을 만들었다. 애설리 등은 참가자들이 나타낼 수 있는 동점자의 수에 제한을 두지 않았다. 그런 다음, 참가자들은 [네 개의 빈 동심원]이 있는 큰 종이를 사용하여 소셜 네트워크의 구성원을 서클에 성찰적으로 배치하여 그들의 영향력에 대해 인지된 강도를 강조할 수 있었다(표 1, Colum 3). 가장 안쪽의 원은 참여자에게 가장 큰 영향을 미치는 사회적 유대를 나타내며, 가장 바깥쪽 원은 참여자들이 전환 경험에 가장 적은 영향을 미친다고 인식하는 사람들을 나타내었다(표1, 3열). 이 접근법은 동심원 구조로 인해 네트워크의 비교 가능성을 촉진했다. 더욱이, 인터뷰는 참가자들이 왜 네트워크 내의 인물을 선택했는지와 그 관계가 전환에 어떤 영향을 미치는지에 대해 깊이 탐구할 수 있게 해주었다.50

Atherley et al employed the method of concentric circles3 as a template for ego network (ie sociogram) creation during semi-structured interviews. This ‘structured’ approach to network maps50 is sometimes preferred by participants over other methods of eliciting network data.50 Participants first made a list of anyone they deemed to influence their transitioning experiences entering clerkships (ie name generation). Atherley et al placed no limitation on the number of ties that participants could indicate. Then, using large paper with four empty concentric circles, participants reflectively placed members of their social network on these circles being able to highlight the perceived strength of their influence (Table 1, Colum 3). The innermost circle represented social ties who had the most impact on the participant, and the outermost circle represented those who participants perceived had the least impact on their transition experiences (Table 1, Column 3).3 This approach facilitated comparability of networks due to the concentric circle structure. Moreover, interviews allowed deep dive into why participants chose the persons in their networks and in what ways the relationship impacted the transition.50 Participants could not use shapes and colours when creating their ego network that may have inhibited their agency in terms of the visualisation expression of their social network.50

애설리 등은 사회적 영향에 대해 논의하고 유대관계가 참가자들의 전환 경험에 어떻게 도움이 되었는지 또는 방해가 되었는지를 이해하기 위해 반구조적인 인터뷰 가이드를 사용했다. 참가자들은 인터뷰가 진행되는 동안 언제든 사회적 유대감을 더할 수 있도록 격려받았다. 4개월 후, 이러한 데이터 수집 절차를 반복하여 초과 근무 시 변경된 사항을 포착했습니다. 그들은 인터뷰를 녹음하기 위해 오디오 녹음기와 비디오 카메라를 사용했다. 애설리 등은 참가자들이 자아 네트워크 연결에 대해 말할 때 어떤 유대관계를 참조하고 있는지 확인할 수 있었기 때문에 비디오 녹화는 대화 내용의 해석을 도왔다.

Atherley et al used a semi-structured interview guide to discuss social influences and understand how ties helped or hindered participants' transition experiences.3, 50 Participants were encouraged to add social ties at any time during the interview. Four months later, these data collection procedures were repeated to capture any changes overtime. They used an audio recorder and video camera to record the interviews. The video recording aided interpretation of transcripts as Atherley et al could identify which ties participants were referencing as they spoke about their ego network connections.

Atherley 등은 혼합된 방법 접근법을 사용했다. 그들은 먼저 네트워크의 구조를 정량적으로 분석하고 피어슨의 카이-제곱 통계를 사용하여 모든 관계의 역할 구성을 비교했다. 이를 통해 저자들은 학생들이 임상 훈련으로의 전환에 영향을 미친 것으로 인식되는 유형의 사람들의 구성을 확인할 수 있었다. 그런 다음 그들은 서술적 정량적 데이터와 함께 해석을 하기 위해 면접 성적표, 소시오그램, 비디오 녹취에 대한 반복적 정성 분석을 실시했다. [(실행 환경의 민감sensitizing 개념을 활용한) 주제 분석]은 시간 차원을 염두에 두고 모든 네트워크 맵의 인간 간 비교 및 대인 비교 가능성을 촉진했다. 양적 및 질적 데이터의 통합을 통해 애설리 등은 [유대관계 유형(예: 의사 대 가족 대 간호사) 간에 관계의 강도가 어떻게 달라지는지], 그리고 [ego까지의 거리]를 탐색할 수 있었다. 이 연구는 임상 훈련으로 전환하는 의대생들의 사회 환경에 대한 새로운 지식을 제공했습니다. 자아 네트워크 접근법의 사용은 의대생이 의존하는 사람들의 다양성, 발생하는 관계의 역동적인 변화 및 유대관계가 일종의 감정적 또는 도구적 지원을 제공하는지에 따라 참여하는 의도적인 네트워크 관리 학생을 식별하는 데 매우 중요했다.3

Atherley et al used a mixed methods approach to our analysis.3, 30 They first quantitatively analysed the structure of the networks and compared the composition of roles of all ties using Pearson's chi-square statistic. This allowed the authors to see the composition of the types of people students perceived impacted their transition to clinical training.3 They then conducted iterative qualitative analysis of interview transcripts, sociograms and video recordings to make interpretations alongside the descriptive quantitative data.3 Thematic analysis, utilising sensitising concepts from landscapes of practice, facilitated intrapersonal comparison of all ties and interpersonal comparability of the network maps, all while bearing the dimension of time in mind. Through integration of the quantitative and qualitative data, Atherley et al were able to explore the distance to ego, how the strength of relationships varied between types of ties (eg doctors vs family vs nurses). The study provided new knowledge on the social environment of medical students transitioning to clinical training.53 The use of an ego network approach was critical for identifying the diversity of people medical students depend on, the dynamic changes in relationships that occur and the deliberate network management students engaged in depending on whether a tie provided some kind of emotional or instrumental support.3

4.1.2 예 2: 참여자가 생성한 자아 네트워크
4.1.2 Example 2: Participant-generated ego networks

또 다른 예로, 버클리와 님몬은 교수들의 관계가 가르치는 것에 대한 학습에 어떻게 영향을 미치는지 탐구했다. 참가자들은 나이, 학력, 교직 경력에 대한 정보가 포함된 짧은 인구 통계 설문지를 작성하도록 요청 받았다. 이어 반구조적인 면접질문이 이어졌다. 여러 차례의 인터뷰 질문 후, 참가자들은 [교육에 대한 학습에 영향을 미치는 동료들의 네트워크의 자아 네트워크(즉, 사회그램)]를 그리도록 지시받았다. 버클리와 님몬은 프롬프트로 사용할 모의 ego 네트워크를 제공했고, 넥타이의 두께와 노드 크기의 중요성을 강조하는 방법에 대한 지침이 제공됐다. 예를 들어, 더 두꺼운 넥타이는 더 가까운 관계를 나타내고, 점박이 넥타이는 더 단편적인 관계를 나타냅니다. 자아 네트워크가 그려지고 나면(표 1, 2열), 참가자들은 인터뷰의 나머지 시간 동안 자신의 소셜그램에 나타난 관계의 특징을 구두로 특징짓고 확장하도록 요청받았다. 따라서, 사회문헌은 이러한 관계가 참가자들의 가르침에 대한 학습에 미치는 영향에 대한 추가적인 의문을 제기하는 서술적 자극제 역할을 했다.
In another example, Buckley and Nimmon4 explored how teaching faculty's relationships influenced their learning about teaching. Participants were asked to fill out a short demographic questionnaire that included information about, age, educational background and years of teaching experience. This was followed by semi-structured interview questions. After several interview questions, participants were instructed to draw an ego network (ie sociogram) of the network of colleagues that were influential in their learning about teaching. Buckley and Nimmon provided a mock ego network to use as a prompt, and instructions were provided about ways to emphasise the significance of thickness of ties and of size of nodes. For example, thicker ties represented closer relationships, and dotted ties represented more fragmented relationships. Once the ego networks were drawn (Table 1, Column 2), the participants were asked to verbally characterise and expand upon the features of the relationships represented in their sociograms during the remainder of the interview. The sociograms thus functioned as a narrative stimulus for further questioning on the influence these relationships had on participants' learning about teaching.


녹취록은 [문항, 패턴, 구조 분석]의 세 단계로 반복적으로 분석되었다. 질적 데이터 분석에 대한 이 접근법은 반복적 비교 접근 방식을 이용한다. 지도와 이미지의 요소(크기, 두께, 거리)는 비교 시각 데이터로서 분석 내내 사용되어 대본에 제공된 참가자들의 서술적 설명을 증가시켰다. 예를 들어, 참여자 동료들 사이의 연결고리의 유무에 주목하는 것은 인식된 동족 관계나 공동체 의식에 대한 참가자들의 설명을 강화했다. 또한 인구통계학적 데이터는 연령, 교육 경력 및 전문적 배경과 같은 참가자의 배경을 맥락화했다. 여러 데이터 소스의 코딩과 분석은 비선형적이었으며 궁극적으로 정보를 crystalize하고, 이해를 심화시키는 데 도움이 되었다.

The transcripts were analysed iteratively in three stages: item, pattern and structural analysis.54 This approach to qualitative data analysis draws on a constant comparative approach. The maps and the elements of the image (sizes, thickness and distances) were used throughout analysis as comparative visual data to augment the narrative descriptions of participants provided in the transcripts.40 For example, noting the presence or absence of bridging ties between participant colleagues on their sociograms reinforced participant descriptions of perceived collegial connections or sense of community. In addition, the demographic data contextualised the participants' backgrounds, such as age, years of teaching experience and professional background. The coding and analysis of multiple sources of data was non-linear and ultimately helped crystallise and deepen understanding of the information.4

[SNA 패러다임 지향]은 연구 설계에 정보를 제공했으며, 이는 주관주의적인 이론 정보 귀납 접근법으로 설명된다. 따라서 연구는 관계형 환경 내에 존재하는 참가자에게 주의를 기울여 설계되었다. 그러나 데이터 분석의 후반 단계에서 비고츠키의 사회 학습 이론은 이 연구의 중심 통찰력 중 하나가 된 동료들의 학습을 위한 발판으로 기능하는 동료들을 보기 위해 통합되었다.4 이것은 문헌에서 주관주의 이론-정보 귀납적 데이터 분석 접근법으로 설명된다. 이러한 복잡한 이론 사용은 SNA 연구(그림 1 참조) 또는 해당 문제에 대한 질적 연구에서 이론을 사용하는 보편적인 방법이 없음을 보여준다.55
A SNA paradigmatic orientation informed the study design, which is described as a subjectivist fully theory-informed inductive approach.51 The study was thus designed with attention placed on the participant existing within a relational environment. During the latter stages of data analysis, however, Vygotsky's social learning theory was integrated to view colleagues functioning as a scaffold for their learning which became one of the central insights of this work.4 This is described in the literature as a subjectivist theory-informing inductive data analysis approach.51 This complex use of theory demonstrates that there is no universal way to use theory in SNA studies (see Figure 1) or in any qualitative study for that matter.55 Buckley and Nimmon's use of multiple theories employed at different stages of the study helped them see and interpret the phenomena from a variety of perspectives.55


이 연구는 궁극적으로 교수 개발 문헌에 있는 개별 교수진에 대한 기존의 집중에서 벗어나 관심을 돌리게 했다. 대신, 통찰력은 교수 참여자들의 광범위한 관계적 맥락의 가치를 강조하고 비계층적 집단 학습으로 교수 개발의 개념화를 활성화했다.4

The study ultimately deflected attention away from the traditional focus on individual faculty present in the faculty development literature. Instead, the insights highlighted the value of the broad relational context of faculty participants and revitalised conceptualisations of faculty development as non-hierarchical collective learning.4

 

5 Ego 네트워크 접근법의 비판적 성찰
5 CRITICAL REFLECTIONS OF AN EGO NETWORK APPROACH

 

시각적 방법의 많은 한계와 강점은 HPE 문헌에서 우아하게 포착되었다.9 우리는 질적 자아 네트워크 접근법에 참여할 때 연구자가 고려할 수 있는 몇 가지 고유한 제한과 이점을 반영하여 이 대화에 기여한다.
Many of the limitations and strengths of visual methods have been elegantly captured in the HPE literature.9 We contribute to this conversation by reflecting on some of the unique limitations and affordances a researcher might consider when engaging with qualitative ego network approaches.

5.1 암묵적 가정
5.1 Implicit assumptions

우리는 이러한 유형의 시각적 매체가 [누구를 포함하거나 제외하는지에 대한 접근성 측면]에서 우리가 하는 가정을 유념해야 한다. 본 연구에서는 선진국 의과대학 학생 또는 교수진이 참여했습니다. 따라서, 참가자들은 고등 교육을 받았고 문해력을 갖추었다. 그러나 위의 예1에서 일부 참가자들은 제2외국어로 영어를 사용했다. 영어를 제2외국어로 사용하는 참가자들이 인터뷰에 임하면서 시각지도를 만드는 것이 부담스러울 수 있다는 점에서 민감했다. 따라서, 우리는 참가자들이 먼저 지도를 만들고, 이어서 그들의 유대에 대해 인터뷰하도록 했습니다. 이 토론에서 참가자들은 그들의 지도를 조정할 수 있었습니다. 게다가, 사회 세계에서 개인의 자아에 초점을 맞춘 접근법을 사용하는 것은 [암묵적으로 유럽 중심적]일 수 있다. 예를 들어, 어떤 문화들은 그들 자신을 사회적 세계의 중심에서 보지 않고 오히려 상호 연결된 사회 시스템 안에서 서로 연결되어 있는 것을 볼 수 있다. 따라서 이러한 접근법이 자아와 자아에 대한 초점을 통해 지배적인 유럽중심적 세계관49에 어떻게 특권을 부여할 수 있는지 평가하는 것이 중요하다.

We must be mindful of the assumptions we make in terms of accessibility of this type of visual medium and who it includes and excludes.49, 50 In our studies, the participants were medical students or faculty members at medical schools in developed countries.3, 4 Thus, the participants were highly educated and literate. However, in Example 1 above, some participants spoke English as a second language. We were sensitive that participants who spoke English as a second language may find it burdensome to create a visual map while engaging in an interview. Thus, we had participants first create their maps, followed by interviewing them about their ties; during this discussion, participants were able to adjust their map. Further, it may be implicitly Eurocentric to use an approach that focuses on the individual self in their social world. For example, some cultures may not view themselves in the centre of a social world50 but rather may see themselves interwoven in an interconnected social system. It is thus critical to evaluate how this approach may privilege a dominant Eurocentric worldview49 through a focus on ego and self.

5.2 사회적 경계의 고심
5.2 Grappling with boundaries of the social

참여자들에 의해 명명된 사회적 유대관계가 명명된 사람들에 의해 보답되는지를 이해하는 측면에서 자아 네트워크 접근법에는 제약이 있다. 예를 들어 의대생 엘리사가 또래지원망의 핵심멤버 4명을 말했는데, 이렇게 명명된 또래가 엘리사의 양방향 지원을 받는지는 알 수 없다. 따라서 자아 네트워크 접근법은 문제의 소셜 네트워크에 대해 우리가 알 수 있는 것에 경계를 부과한다. 연구자가 누가 누구와 함께 연구하는지 이해하기 위해 의대 1학년 전체 코호트를 탐색하고자 한다면, [자아 네트워크 접근]은 제한적일 것이다. 대신에 소셜 네트워크의 가장 중요한 구조적 관점을 포착하기 위해 완전한 (전체) 네트워크 접근법을 사용할 수 있다. 이 전체 네트워크 접근방식은 일반적으로 정량적 접근방식으로 사용된다.5

There are constraints with an ego network approach in terms of understanding whether the social ties named by participants are reciprocated by those named. For example, if a medical student Elisa names four core members of her peer support network, but we cannot know if the peers who are named experience reciprocated bidirectional support from Elisa. The ego network approach thus imposes boundaries on what we can know regarding the social network in question. If a researcher wished to explore an entire first year medical school cohort to understand who studies with who, an ego network approach would be limiting. Instead, a complete (ie whole) network approach could be employed to capture an overarching structural view of a social network. This whole network approach is commonly employed as a quantitative approach.5

5.3 스냅샷 적시
5.3 A snapshot in time

참여자들의 사회 세계에 대한 인식을 [물화된reified 것, 정적인 것]을 표현한다고 받아들이면 한계가 생깁니다. 사회적 관계는 연구자에 의해 집계되고 별개의 과거 사건들로 분석됩니다. [사회적 관계]를 [연속적 시간 속에서 개념화하는 것]이 더 적절할 수 있는데, 이는 '네트워크가 어떻게 자극에 의해 발달하거나 느리고 꾸준히 구축될 수 있는지, 또는 질서와 혼돈의 순간을 혼합하는 반복적인 의식 행동을 어떻게 반영할 수 있는지'를 설명하기 때문이다.

A limitation arises if we accept representations of participants' perceptions of their social world as reified and static. Social relations are aggregated by the researcher and analysed as discrete past events. It may be more appropriate to conceptualise social relations in continuous time, as it accounts for how ‘networks may develop by spurts or build slowly and steadily, or how they may reflect repeated ritual behaviours that mix moments of order and chaos’.56(p1209) 

역동적 사회 관계는 관계적 속도pace(예: 초, 주, 수십 년) 또는 관계의 변화 속도(예: 빠르고 느리며 가속화)의 차원을 포함하며, 종종 불규칙성의 흔적을 포함한다. 관계의 속도와 변화는 각각의 독특한 사회적 맥락에 따라 달라지며 관계의 유형에 따라 달라진다. [질적 자아 네트워크 접근법]을 발전시키기 위해서는, 연속적인 관계형 사건이나 연속적인 사회적 과정으로 전개되는 상호작용으로 구성된 시간의 연속적인 해석 개념을 끌어내는 것이 유익할 수 있다. 예를 들어, 이 관점은 우리가 이해하는데 도움을 줄 수 있다. 

  • (a) 자신과 그들이 살고 있는 사회 세계에 대한 참가자들의 해석의 중첩되고 변화하는 특성 
  • (b) 상호 작용은 학습 환경에서 시간을 보내는 것을 의미한다. 

Dynamic social relations contain dimensions of relational pace (eg seconds, weeks and decades) or rate of change in relations (eg fast, slow and accelerating), often containing traces of irregularities.57 The pace and change in relationships will depend on each unique social context and vary across types of relationships.56 To advance a qualitative ego network approach, it may be beneficial to draw on a concept of continuous renditions of time, which consists of sequential relational events or interactions that unfold as a continuous social process.57 This perspective can help us understand, for example,

  • (a) the overlapping and changing nature of participants' interpretations of self and the social world they inhabit and
  • (b) interactional meaning making across time in the learning environment.

우리는 시공간 교차가 본질적으로 모든 사회적 존재에 관여한다는 개념에 동의한다.58 다중 시간 척도 분석을 달성하기 위해, 한 가지 아이디어는 [시간을 경험하는 국지적이고 특이하며 맥락에 의존하는 방법]을 포착하는 [사회적 시간 이론]을 통합하는 것이다. '사회적 시간' 관점은 일상 생활의 관계 리듬을 예견한다. 이 렌즈는 선형 시계/기계 시간에 대한 일반적인 방향 외에 자아의 관계 경험에 대한 이해를 확장할 수 있다.59 더욱이, [종단적 질적 자아 네트워크] 연구는 고정되고 이산적인 시간의 순간에서 발생하는 사회적 관계를 렌더링하는 한계를 극복할 수 있다.60

We concur with the notion that time–space intersections are essentially involved in all social existence.58 To achieve a multiple timescale analysis, one idea is to integrate a social theory of time that captures local, idiosyncratic, context-dependent ways of experiencing time.59 A ‘social time’ perspective foregrounds the relational rhythms of everyday life. This lens can stretch our understanding of the ego's relational experience outside of the prevailing orientation towards linear clock/machine time.59 Moreover, longitudinal qualitative ego network research may overcome the limitations of rendering social relations as occurring in fixed, discrete moments of time.60

5.4 사회적 기억력 과제
5.4 Social memory challenges

리콜 또는 소셜 메모리는 자아 네트워크 데이터 수집과 관련된 특정 과제이다. 일반적으로 사람들은 과거의 사회적 상호작용이 중요하지 않은 경우(즉, 강한 유대감)에 대해 부정확하게 보고하는 경향이 있다. 게다가, 어떤 사람들은 그들이 그 전 주에 비해 이전 24시간 동안 누구와 소통했는지에 관한 최근의 사건들을 더 정확하게 기억할 수 있다. 다른 사람들은 참여자들의 주변 세계를 인식하는 다양한 능력은 그 자체로 흥미로운 통찰력이며, 직장 성과와 같은 결과에 대한 결과를 설명할 수 있다고 제안했다. 관찰 데이터는 연구된 사회 현상에 대한 이해를 심화시킬 수 있다. 예를 들어, 다양한 관찰 데이터는 초점 참여자가 [중요한 연관성으로 명명할 때 누락된 사람들]을 포착할 수 있다. 이것은 그 발견에 대한 신용을 떨어뜨리는 것이 아니라, 엄격함을 강화시켜주며 사회 현상에 대한 다면적인 이해를 강화할 수 있다.65
Recall or social memory is a specific challenge in respect to ego network data collection. Generally, people tend to be inaccurate in reporting past social interactions unless they are important (ie strong ties).61 Moreover, some people can more accurately recall recent events regarding who they communicated with in the previous 24 h compared with the week before.62 Others have proposed that participants' varying ability to perceive the world around them is an interesting insight in itself and can explain consequences for outcomes like workplace performance.63, 64 Observational data may deepen understanding of the social phenomenon studied. For instance, divergent observational data may capture people the focal participant neglects to name as important ties. This does not discredit the findings but can enhance rigour and enrich multifaceted understanding of a social phenomenon.65

5.5 사회적인 것을 드러냄
5.5 Revealing the social

자아 네트워크 접근법이 눈에 보이지 않는 것을 만드는 '마법'을 펼치지만, 개인 간 연결성을 드러내는 음험한 효과가 나타날 수 있다. 예를 들어, 참가자는 자신의 자아 네트워크를 만들 때 또는 연구자가 참가자에게 네트워크의 표현을 생성하고 보여줄 때, 고립과 외로움을 깨닫게 될 수 있다. 연구자들은 참가자들이 정서적 고통을 나타내는 경우 윤리위원회의 승인을 받은 지원 계획을 세워야 한다. 우리는 참가자들이 그들의 자아 네트워크를 만들고 그들의 사회적 유대에 대한 질문을 받는 것에서 약간의 여유를 발견했다는 것을 언급할 가치가 있다. 연구참여자는 종종 자신이 구축, 해체 또는 유지해온 관계의 의미를 깊이 성찰한다. 참여자들은 사회적 지지의식을 자극하고 체계적이고 구조적인 인식을 함양할 수 있는 사회적 관계를 성찰함으로써 이익을 얻는다. 우리의 데이터 세트 중 하나에서 의대생이 자신의 소셜 네트워크를 고민하면서 어려운 시기에 기댈 수 있는 사람을 발견했다.3 다른 사람들도 마찬가지로 스트레스가 많은 과도기 동안 소셜 네트워크 지도가 치료 전략이 될 수 있다는 것을 발견했다. 더 넓은 HPE 방법론 문헌에서는 다양한 시각적 방법에 참여하는 참가자의 치료적 이점도 보고된다. 

Although an ego network approach does its ‘magic’ by making visible the invisible, there can be insidious effects of revealing connections between individuals. For example, participants can become aware of isolation and loneliness when creating their ego network or if the researcher generates and shows the participant a representation of their network.33 Researchers should have a plan for support approved by ethics boards should participants signal emotional distress. It is worth mentioning that we have found some affordances in participants creating their ego networks and being asked questions about their social ties. They often deeply reflect on the meaning of the relationships they have built, dissolved or maintained.3, 45 Participants benefit from reflecting on their social relationships that can stimulate a sense of social support,66 and foster systemic and structural awareness.8, 67 In one of our datasets, a medical student, in contemplating his social network, discovered who he could lean on during difficult times.3 Others have similarly found that mapping one's social network can be a therapeutic strategy during stressful transitional periods.67 In the broader HPE methodological literature, the therapeutic benefits of participants engaging in various visual methods is also reported.68

5.6 SNA에 대한 연구원-참가자 관계
5.6 Researcher–participant relationships in SNA

마지막 과제는 소셜네트워크 연구자들의 존재감이 중립과 거리가 멀다는 것이다. 경우에 따라, 참여자들은 그들의 자아 네트워크의 연관성으로 연구자를 지명할 수도 있다. 연구자가 연구가 이뤄지는 사회적 맥락과 관련이 있다면 그럴 가능성이 높다. 예를 들어, 그녀의 연구가 이루어진 연구소와 제휴했던 애설리는 그녀의 연구에서 이것을 경험했다. 두 명의 참가자는 임상실습에 들어갔을 때 전환 경험을 설명하면서, 애설리(Atherley, 그녀는 종적 연구에서 데이터를 수집하고 있었다)를 의미 있는 것으로 나타냈다.3 이로 인해 애설리는 의대생들의 사회관계망에서 자신의 현장 노트에 성찰적으로 반응하게 되었다.

A final challenge can be that social network researchers' presence is far from neutral.33 In some instances, participants could name the researcher as a tie in their ego network. This may be likely if the researcher is affiliated with the social context where the research takes place. For example, Atherley, who was affiliated with the institution where her research took place, experienced this in her research. Two participants represented their relationship with Atherley (she was collecting data with them in a longitudinal study) as meaningful when describing their transition experiences when they entered clerkships.3 This led Atherley to be reflexive in her field notes of her embeddedness in the medical students' social networks.

시간이 지남에 따라 소셜 네트워크에 참여자와 함께 반영하면 연구자-참여자 관계가 긴밀해질 수 있다. 애설리는 자신의 사회적 위치가 그녀가 기대했던 것보다 더 진실로 연구 목표를 달성할 수 있도록 더 깊은 대화를 촉진시켰다는 것을 인정했지만, 이것은 또한 의도하지 않은 결과를 가져올 수 있다. 연구자와 참여자의 긴밀한 관계는 참여자들이 의도치 않게 참여를 계속해야 한다는 의무감을 느끼게 할 수 있다. 더욱이, 이 접근법에서 발생하는 친밀감은 한 번의 연구 인터뷰보다 연구자-참여자 관계를 더 복잡하게 만들 수 있다. 질적 자아 네트워크 접근법은 특히 참여자들이 자신의 사회적 현실을 반영하는 것을 수반하기 때문에 이러한 접근 방식을 채택할 때 고려해야 할 중요한 문제이다.

Reflecting with participants on their social networks over time could result in an intimate researcher–participant relationship. Although Atherley acknowledged that her social positioning facilitated deeper conversations that allowed her to meet her research aims more authentically than she had anticipated, this could also have unintended consequences. Close researcher–participant relationships could lead to participants unintentionally feeling obligated to continue their participation.4749 Moreover, the intimacy generated in this approach may complicate the researcher–participant relationship more than a single research interview would.4749 These are all important issues to consider in employing this approach, particularly because a qualitative ego network approach involves participants holding a mirror up to their social realities.

6 향후 HPE 연구에서의 질적 자아 네트워크 접근법
6 QUALITATIVE EGO NETWORK APPROACHES IN FUTURE HPE RESEARCH

[질적 자아 네트워크 접근법]은 학습 환경의 사회적 측면에 대한 이해의 공백을 발굴하고 새로운 깊이 있는 통찰력을 제공할 수 있다. 
Qualitative ego network approaches can unearth voids in our understanding of the social aspects of the learning environment and offer new depths of insight.69

[질적 자아 네트워크 접근법]으로 답할 수 있는 연구 질문들이 풍부하다. 탐구할 만한 흥미로운 영역 중 하나는 특정 교육이나 업무 공간에서 조직 구조에 대한 통찰력을 제공할 수 있는 연결된 개인들로부터의 다중 자아 네트워크를 조사하는 것일 수 있다. 질적 자아 네트워크 접근법은 [정보 흐름을 도와주고 다른 사람의 태도와 행동에 영향을 미치는 주요 인물]을 탐지할 수 있다. 이러한 개인(중개자/중개자)은 네트워크에서 잘 연결되거나 느슨하게 연결될 수 있다. 우리의 연구에서, 우리는 (학생 기구가 투표한) 관리 역할의 의대생이 중개 역할을 한다는 것을 발견했다.3 이 학생은 임상실습으로 전환하는 학생들에게 자주 정보를 공유했고 중요한 책임을 지는 사회적 권력의 위치에 있었습니다. [브로커]들이 서로 연결된 사회적 위치에서 잘 지원되고 훈련될 수 있도록 브로커들을 눈에 띄게 만드는 것은 교육 기관에 필수적일 수 있다. 그러나 민감하고 비밀스러운 소셜 네트워크 맵과 조직 구조와 기능의 구체적인 시각 자료로부터 이익을 얻을 수 있는 교육 기관과 공유해야 하는지 여부 사이에 긴장이 있다. 다른 시각적 방법론자들이 지적한 바와 같이, 사회그램sociogram과 같은 이미지는 [참가자]와 [구경꾼]을 더 식별 가능하게 할 수 있다.9

There are abundant research questions that could be answered using a qualitative ego network approach. One exciting area to explore could be examining multiple ego networks from connected individuals which can provide insight into the organisational structure in specific educational or work spaces.70 A qualitative ego network approach could detect key people who help information flow and have influence on attitudes and behaviours of others. These individuals (ie mediators/brokers) can be well connected or loosely connected (ie weak tie) in networks.3, 20 In our research, we discovered that a medical student in an administrative role (voted by the student body) had a broker role.3 This student frequently shared information to students transitioning to clerkship and was in a position of social power bearing important responsibilities. Rendering brokers visible could be vital to the educational institution so that brokers themselves are well supported and trained in their interconnected social position. A tension, however, is between the sensitive and confidential social network maps and whether they should be shared with educational institutions that could benefit from concrete visuals of their organisational structures and functions.33 As noted by other visual methodologists, images such as sociograms can render participants and bystanders more identifiable.9

질적 자아 네트워크 접근법이 포착할 수 있는 관심을 거의 받지 못하는 또 다른 흥미로운 현상은 의료 훈련이 발생하는 기관 내외에서 [학습자의 소셜 네트워크를 의도적으로 개발하고 다양화하는 것]이다. 예를 들어, 교육 설계의 변화가 학생들의 소셜 네트워크를 변화시키는지 또는 어떻게 변화시키는지 이해하기 위해 질적 자아 네트워크 접근법을 적용하는 것은 흥미로울 수 있다. 훈련 참여의 결과로 네트워크 개발을 시각화하면 훈련의 성과를 기존처럼 [인지 및 태도 개발]에만 두던 것에서, [전략적 네트워크 구축과 이용]으로 지배적 초점을 확대할 수 있다. 일부는 심지어 시간이 지남에 따라 네트워크 규모가 증가하거나 네트워크가 더 연결되면 신입에서 전문가로의 성공적인 전환을 나타낼 수 있다고 제안했다. 이와 같이, 시간에 따른 훈련생의 사회관계망과 문서화된 그러한 관계의 질적 특성은 지식 이전과 사회통합의 지표가 될 수 있다.67

Another intriguing phenomenon that receives little attention that a qualitative ego network approach could capture is the intentional development and diversifying of a learner's social network within and outside the institution of where medical training occurs.3, 45 It might be interesting, for example, to apply a qualitative ego network approach to understand whether or how a change in educational design changes students' social networks and shapes student learning in a variety of contexts.34, 71 Visualising network development as a result of participation in training could expand the dominant focus on training outcomes on cognitive and attitude development towards strategic network building and utilisation.67 Some have even suggested that an increase in network size or a more connected network over time could indicate a successful transition from newcomer to expert.72 As such, a trainee's social network and the qualitative nature of those ties documented over time could be an indicator of knowledge transfer and social integration.67

7 결론
7 CONCLUSION

본 논문은 학습 환경에서 타인과 관련하여 자신과 관련된 설득력 있는 질문에 대답하는 데 있어 이 분야를 발전시키기 위해 질적 자아 네트워크 접근법의 사려 깊고 적절한 사용을 촉진하기를 바란다. 질적 자아 네트워크 접근법은 HPE 상황에서 경험이 사회에 의해 형성되고 형성되는 방법에 대한 풍부한 참가자의 성찰을 수집한다. 우리는 특정 HPE 상황에서 자신과 사회가 어떻게 상호 작용하는지를 자세히 설명하면서 질적 자아 네트워크 접근법을 이용한 의도적이고, 임팩트 있고, 활력을 주는 연구를 기대한다.

We hope this paper fosters thoughtful and appropriate use of qualitative ego network approaches to move the field forward in answering compelling questions related to the self in relation to others in the learning environment. A qualitative ego network approach harvests rich participant reflections of how their experiences in HPE situations are shaped by and shape society. We look forward to intentional, impactful and invigorated research using qualitative ego network approaches as we elaborate how self and society in specific HPE situations interact.

 


 

Med Educ. 2022 Jan;56(1):71-81.

 doi: 10.1111/medu.14663. Epub 2021 Sep 22.

Qualitative ego networks in health professions education: Capturing the self in relation to others

Affiliations collapse

Affiliations

1Centre for Health Education Scholarship, University of British Columbia Faculty of Medicine, Vancouver, British Columbia, Canada.

2Academy of Teaching and Learning, Ross University School of Medicine, Barbados Campus, Bridgetown, Barbados.

PMID: 34490649

DOI: 10.1111/medu.14663

Abstract

Introduction: Our very sense of self emerges through interactions with others. As part of this State of the Science series on Self, Society, and Situation, we introduce a qualitative ego network research approach. This research approach offers insights into the self's (the ego's) interpretation of and relation to named others in the social network in question.

Purpose: Visual mapping of participants' social networks is gaining traction, yet this research approach has received no focused attention in the health professions education (HPE) literature. A qualitative ego network approach is a compelling research approach because it uniquely maps participants' perceptions of the complex social world they are embedded in. Although many methodologies can explore participants' social world, ego networks can enhance expression of tacit knowledge of one's social environment and encourage reflection. This approach, combined with other qualitative data, can also reveal hidden relational data that the researcher may not observe or consider. To demonstrate its value as a visual methodology, we will showcase two examples of qualitative ego network studies. We then balance the paper with some critical reflections of this research approach.

Conclusions: A qualitative ego network approach holds potential for deepening understanding of the self in relation to society and situation in future HPE research. We look forward to intentional, impactful and invigorated research using a qualitative ego network approach as we tackle unknowns about how self and society in specific HPE situations interact.

자기자신을 넘어: 의과대학생의 자기조절학습에서 공동조절의 역할 (Med Educ, 2020)
Beyond the self: The role of co-regulation in medical students’ self-regulated learning
Derk Bransen1 | Marjan J. B. Govaerts2 | Dominique M. A. Sluijsmans3 | Erik W. Driessen2

 

 

 

1 소개
1 INTRODUCTION

자기조절학습(SRL)은 의사의 핵심 역량이자 환자 진료 보호에 필수적인 역량으로 간주된다. 1, 2 따라서 많은 의료 커리큘럼은 SRL 기술을 개발하는 의대생들을 지원한다. 자기 조절 학습은 일반적으로 주기적인cyclic 과정으로 설명되며, 종종 목표를 설정하고 그 목표를 향한 발전을 모니터하기 위한 전략의 후속적 채택에 의해 촉발되며, 성찰과 새로운 학습 목표의 공식화에 관여한다.2, 3 그러나 연구 결과에 따르면 학생들은 종종 임상 작업장 환경의 예측 불가능하고 역동적이며 지저분한 성격의 결과로 임상 학습 환경에서 학습을 규제하기 위해 고군분투한다.4, 5
Self-regulated learning (SRL) is considered a core competence of physicians and one that is essential to the safeguarding of patient care.1, 2 Many medical curricula therefore support medical students in developing SRL skills. Self-regulated learning is generally described as a cyclical process, often triggered by the formulating of goals and the subsequent employment of strategies to achieve and monitor advancement towards those goals, followed by engagement in reflection and the formulation of new learning goals.2, 3 Research findings, however, indicate that students often struggle to regulate their learning in clinical learning environments as a result of the unpredictable, dynamic and messy nature of clinical workplace settings.4, 5

일찍이 1989년부터, SRL에 대한 환경 제약 및 지원의 중요성이 문서화되었다.6 그 이후로 의대생의 SRL이 상황에 따라 달라지고, 사회적으로 파생된다socially derived는 개념은 꾸준히 힘을 얻고 있다. [병원 부서의 학습 분위기, 이용 가능한 학습 기회, 다른 사람들과의 사회적 상호 작용]은 학생들의 SRL에 영향을 미친다. 또한 의료 교육생은 사회적 및 맥락적 요인에 따라 다양하게 SRL 전략을 사용한다.
As early as 1989, the importance of environmental constraints and affordances to SRL was documented.6 Since then, the notion that medical students’ SRL is context-dependent and socially derived has steadily gained momentum.7, 8 Learning climates of hospital departments, available learning opportunities and social interactions with others seem to influence students’ SRL,9 and medical trainees variably use SRL strategies, depending on social and contextual factors.10 

의대생의 SRL에 대한 사회적 상호작용의 잠재적 영향은 공동조절학습(CRL)의 개념으로 구체화된다. CRL에서 학습자는 환경에 있는 다른 개인들과 함께 자신의 인식, 동기, 행동을 조절한다.14 CRL에는 [네트워크 속 학생들과 다른 사람들 사이의 사회적 상호작용]이 필수적인데, 이를 통해서 SRL 개발과 같은 학습 과정이 매개 또는 분배되기 때문이다. CRL의 개념은 [사회문화적 학습이론]을 반영한다. 사회문화적 학습이론은 학습자가 환경에 의해서 지속적으로 영향을 받는다는 것을 강조하며, 동시에 맥락적 주변환경을 공동-생산하고 공동-창조함을 강조한다.
The potential impact of social interactions on medical students’ SRL is embodied in the concept of co-regulated learning (CRL). In CRL, learners regulate their cognitions, motivation and behaviour together with other individuals in the environment.14 Essential to CRL are social interactions between students and others in their networks, through which learning processes, such as SRL development, are mediated or distributed.15 The concept of CRL reflects sociocultural learning theories that emphasise that learners are continuously influenced by their environment when simultaneously co-producing and co-creating the contextual surroundings in which they learn and work.16 

학습 활동에 공동으로 참여함으로써, 의료 환경에서 학생과 동료는 서로의 메타인지 및 인지 활동을 중재하고, 개인의 독립적인 SRL 행동의 개발 및 표시를 촉진하거나 제한한다.17 최근 연구에서 밝혀진 바에 따르면 SRL에 대한 의대생의 참여는 시간이 지남에 따라 변화하며, 직장 환경에서 다른 학생들의 역할과 상호 작용에 대한 인식에 영향을 받는다. 이것은 CRL의 과정이 학생들의 자기조절 능력의 발달에 영향을 미칠 수 있다는 것을 보여준다.

By jointly engaging in learning activities, students and co-workers in health care settings mediate one another's metacognitive and cognitive activities, facilitating or constraining individuals’ development and display of independent SRL behaviours.17 Findings from a recent study show that medical students’ engagement in SRL changes over time and is influenced by their perceptions of the roles of, and interactions with, others in the workplace setting.11 This illustrates that processes of CRL may influence the development of students’ ability to self-regulate.

사회적 상호작용을 주요 요소로 하는 CRL이 직장 기반 학습 환경에서 SRL 발전에 어떻게 영향을 미치는지 조사하면 학생들이 임상 환경에서 SRL을 실제로 어떻게 개발하는지 더 깊이 이해하는 데 기여할 것이다. 
Examining how CRL, with social interactions as its main element, influences SRL development in workplace-based learning environments will contribute to a deeper understanding of how students actually develop SRL in clinical settings. 

2 방법
2 METHODS

2.1 방법론
2.1 Methodology

우리는 임상실습의 CRL과 SRL 사이의 관계에 대한 의대생의 인식을 탐구하기 위해 정성적 접근법을 사용했다. 데이터 수집과 데이터 분석은 구성주의 근거이론의 원리에 의해 반복적으로 수행되었다.18, 19 구성주의 기반 이론을 사용하메 있어서, 우리는 연구진이 SRL과 CRL에 이론적, 그리고 실무적인 배경이 있음을 인정한다. 또한 자료 수집 및 분석은 SRL과 CRL의 주요 개념에 informed되었다.
We used a qualitative approach to explore medical students’ perceptions of relationships between CRL and SRL in clinical clerkships. Data collection and data analysis were conducted iteratively, informed by principles of constructivist grounded theory.18, 19 Using constructivist grounded theory, we acknowledged the research team's theoretical (DB, EWD, DMAS, MJBG) and practical (DB, EWD, DMAS, MJBG) backgrounds in SRL and CRL, and data collection and data analysis were informed by key concepts in SRL and CRL.

2.2 설정
2.2 Setting

우리는 네덜란드 마스트리히트 대학의 의학 학부 프로그램(마스터 학위)에서 이 연구를 수행했다. 마스터스 프로그램은 학술 병원 및 부속 교육 병원의 다양한 병원 부서에서 12주에서 22주 사이의 임상 실습으로 3년 동안 이루어진다. Masters 프로그램은 역량 기반 의료 교육의 원칙에 따라 설계되었으며, 캐나다의 전문가를 위한 의료 교육 지침(CanMED)의 역할을 가장 중요한 프레임워크로 사용한다. 20 학생의 SRL은 프로그램 전체에 걸쳐 포트폴리오와 멘토에 의하여 supported된다. 일상직장감독관이 배치돼 다양한 직장 환경에서 학생들의 학습을 지원하고 지도한다. 
We conducted this study in the undergraduate programme (Masters degree) in medicine at Maastricht University, the Netherlands. The Masters programme comprises 3 years of clinical clerkships lasting between 12 and 22 weeks, in various hospital departments in an academic hospital and affiliated teaching hospitals. The Masters programme is designed according to the principles of competency-based medical education, using the roles of the Canadian Medical Education Directives for Specialists (CanMEDS) as its overarching framework.20 Students’ SRL is supported throughout the programme by a portfolio and a mentor. Daily workplace supervisors are assigned to support and guide student learning in various workplace settings.

각 임상실습 시작 전에, 학생들은 그들의 개인적인 학습 목표를 설명하는 학습 계획을 세우고 그들의 멘토와 사무직에 배정된 지도자들과 이것에 대해 논의합니다. 임상실습의 마지막에 학생들은 멘토와 협업하여 자신의 경험과 포트폴리오에 업로드된 피드백을 되새기고 다음 단계의 훈련을 위한 새로운 학습 목표를 수립한다. 학습 계획은 학생의 포트폴리오에 포함되며, 이 외에도 포트폴리오에는 평가 데이터(예: 피드백 양식 및 테스트 결과), 경험에 대한 성찰, 학생이 자신의 개인적 및 전문적 개발을 모니터링하는 데 중요하다고 생각하는 모든 정보 등이 들어간다.

Before the start of each clerkship, students formulate a learning plan that describes their personal learning goals and discuss this with their mentor and the supervisors assigned for that clerkship. At the end of each clerkship, students collaborate with their mentors to reflect on their experiences and the feedback uploaded to the portfolio and formulate new learning goals for the next phase of training. Learning plans are included in students’ portfolios, as are assessment data (eg feedback forms and test results), reflections on experiences, and any information students deem valuable for monitoring their personal and professional development.21

2.3 참가자 및 샘플링
2.3 Participants and sampling

전체적으로 석사과정 학생의 79%가 여학생이다. 임상 훈련의 해와 성별의 다양성을 보장하기 위해 Masters 프로그램에 등록한 의대생들을 의도적으로 표본으로 추출했다(표 1). 학생들은 이메일을 통해 참여하도록 초대되었다. 최초 초대 후 2주 후에 리마인더가 발송되었습니다. 10번의 인터뷰 후, 우리는 데이터 포화도를 달성했고 구성된 주제와 그들의 관계에 대한 적절한 이해를 얻었다고 판단했다. 참가자들은 10유로의 상품권을 받았습니다.
Overall, 79% of students in the Masters programme are female. We purposively sampled medical students enrolled in the Masters programme to ensure variety in year of clinical training and gender (Table 1). Students were invited to participate via e-mail. Reminders were sent 2 weeks after the initial invitation. After 10 interviews, we considered that we had achieved data saturation and had gained an adequate understanding of the constructed themes and their relationships. Participants received a gift voucher for €10.

 

2.4 데이터 수집
2.4 Data collection

2018년 2월과 6월 사이에, 제1저자(DB)는 50분에서 75분 사이의 반구조적 인터뷰를 실시했다. 연구팀은 목표수립과 전략설계원리, 모니터링, 자기성찰 과정, CRL(학생들이 참여하는 관련 사항, 상호작용의 성격) 등 SRL의 핵심 개념을 반영한 인터뷰 가이드를 개발했다. 사전 동의를 얻은 후, 제1저자(DB)는 학생들에게 SRL에 대한 설명을 제공했다. 인터뷰의

  • 첫 번째 부분은 임상 환경에서 [SRL에 참여하는 방법에 대한 관점]을 얻는 것을 목표로 했고,
  • 두 번째 부분은 [SRL 기술의 발달에 대한 사회적 상호작용의 영향]에 대한 학생의 인식에 초점을 맞췄다.
  • 마지막 부분은 [SRL과 CRL의 개발 측면]에 초점을 맞췄다.

Between February and June 2018, the first author (DB) conducted semi-structured interviews that lasted between 50 and 75 minutes. The research team developed an interview guide informed by key concepts of SRL, such as goal formulation and strategy design principles, monitoring and self-reflection processes, as well as CRL (relevant others with whom students engaged, as well as the nature of their interactions). After obtaining informed consent, first author (DB) provided students with a description of SRL.

  • The first part of the interview then aimed to obtain the student's perspectives on how he or she engaged in SRL in the clinical setting;
  • the second part focused on the student's perceptions of the impact of social interactions on the development of SRL skills.
  • The final part of the interview focused on developmental aspects of SRL and CRL (Appendix S1).

인터뷰 동안, 인터뷰 진행자는 학생들이 묘사한 행동에 대한 상세한 예시와 설명을 제공하도록 유도했다. 인터뷰 가이드는 동시 데이터 분석을 통해 인터뷰 사이에 반복적으로 업데이트되었습니다. 모든 인터뷰는 테이프에 녹음되어 그대로 옮겨졌다.

During interviews, the interviewer prompted students to provide detailed examples and explanations of behaviours they described. The interview guide was updated iteratively between interviews, informed by concurrent data analysis. All interviews were tape-recorded and transcribed verbatim.

2.5 데이터 분석
2.5 Data analysis

데이터 수집과 분석은 반복적인 과정을 따랐고, 데이터 수집과 데이터 분석이 서로 정보를 제공할 수 있도록 했다. 제1저자(DB)와 연구보조자(CN)는 CRL 및 학생들의 SRL 발달과 관련된 개념을 포착하기 위해 독립적으로 1-3번 대본을 읽고 코드화했다.
Data collection and analysis followed an iterative process, allowing data collection and data analysis to inform each other. The first author (DB) and a research assistant (CN) independently read and coded transcripts 1-3 line by line to capture concepts related to CRL and students’ development of SRL.


초기 코딩 스킴에서 코드는 학습 목표의 공식화, 피드백 및 피드백 수신 요청, 학생들이 CRL 과정에 참여하는 중요한 다른 사람들의 세부 사항과 같은 다양한 SRL 및 CRL 행동을 기술했다. 또한 임상 훈련 단계와 같은 SRL 개발과 관련된 요소들과 영향을 미치는 요소들도 포함되었다.

  • 코딩 프레임워크는 합의에 도달할 때까지 비교되고 논의되었다.
  • DB는 4-11번 대본을 코딩하는 데 코딩 스킴을 활용, 연구팀과 지속적인 비교와 논의를 통해 코딩 프레임워크를 지속적으로 다듬었다.
  • 연구팀은 이후 코드를 분류하고 축 코딩을 통해 주제 간 관계를 파악했다.
  • 연구팀은 분석 마지막 단계에서 선택적 코딩을 활용해 [CRL이 학생들의 SRL 발달에 미치는 영향에 대한 이론]을 개발했다.
  • 이 과정을 용이하게 하기 위해 DB는 주제, 하위 주제 및 관계를 제시하는 개념 맵을 만들었고, 연구팀 회의 때 이것을 이론 개발을 가이드하는 데 사용했다
  • 또한 DB는 데이터 분석 전반에 걸쳐 메모에 성찰, 아이디어, 해석을 담았다.
  • 데이터 분석은 질적 연구 소프트웨어 atlas.ti의 지원을 받았다.

In the initial coding scheme, codes described various SRL and CRL behaviours such as the formulation of learning goals, asking for feedback and feedback reception, and details of the significant others with whom students engaged in CRL processes. Also included were factors related to and influencing the development of SRL such as the phase of clinical training.

  • Coding frameworks were compared and discussed until consensus was reached.
  • DB used the coding scheme to code transcripts 4-11, continuously refining the coding framework through constant comparison and discussion of findings with the research team.
  • The research team subsequently categorised codes and identified relationships between themes through axial coding.
  • During the final stage of analysis, the research team used selective coding to develop theory about the influence of CRL on students’ SRL development.
  • To facilitate this process, DB constructed concept maps, presenting themes, sub-themes and their relationships, which were used during research team meetings to guide theory development.
  • DB furthermore captured reflections, ideas and interpretations in memos throughout the data analysis.
  • Data analysis was supported by the qualitative research software atlas.ti (ATLAS.ti Scientific Software Development GmbH, Berlin, Germany).

2.6 반사율
2.6 Reflexivity

우리의 방법론적 접근법에서 의미는 연구 참가자, 생성된 데이터 및 연구팀의 해석을 통해 구성된다. DB는 업무와 조직심리학을 전공한 학력이 있는 박사후보자다. MJBG와 EWD는 Maastricht 대학교에서 Masters 프로그램의 평가 측면 개발에 참여하는 의학 교육자 및 연구원이다. DMAS는 전문적인 평가, 커리큘럼 설계, 학생의 평가 실무 참여 등이 주요 분야인 교육 연구원이다. 마스트리히트 대학교는 협력적이고 자기주도적인 학습이 중추적인 역할을 하는 문제 기반 학습(PBL) 철학으로 특징지어진다. EWD와 MJBG는 상당한 시간 동안 이 설정 내에서 작동해 왔으며 DB는 PBL 원칙에 따라 공식적인 교육을 받았다. DB는 메모와 필드 노트를 사용하여 데이터 수집 및 분석 전반에 걸쳐 보기와 해석을 캡처했습니다.
Within our methodological approach, meaning is constructed through interactions with research participants, the data generated, and their interpretation by the research team. DB is a PhD candidate with an educational background in work and organisational psychology. MJBG and EWD are medical educators and researchers involved in the development of the assessment aspect of the Masters programme at Maastricht University. DMAS is an education researcher whose main areas of expertise are professional assessment, curriculum design and student involvement in assessment practices. Maastricht University is characterised by its problem-based learning (PBL) philosophy, in which collaborative and self-directed learning play pivotal roles. EWD and MJBG have worked within this setting for substantial lengths of time and DB has had formal education according to PBL principles; these backgrounds may have influenced their views on CRL and SRL and how these may be related. DB used memos and field notes to capture views and interpretations throughout data collection and analysis.

3 결과 
3 RESULTS

데이터로부터, 우리는 학생들의 SRL의 세 가지 주요 변화를 구성할 수 있었고, 이는 학생들이 사무직을 통해 진행됨에 따라 CRL에 대한 학생들의 참여에 동시에 영향을 미치고 영향을 미쳤다.

  • 첫째, 학생들은 [CRL에 참여하는 사람]에 대한 변화를 표현하였다. 임상실습 [시작 시에는 동료]들에게 중요한 역할을 부여하고, 프로그램이 끝날 때 [임상의 롤 모델]에 대한 선호도를 높였다.
  • 둘째, 초보 학생의 SRL은 주로 [외부적인 환경적 단서]에 의해 추동되는 반면, 경험이 쌓인 학생의 SRL은 [내재적 단서와 자기 동기 부여]에 의해 점점 더 추진되었다.
  • 마지막으로, 조절행동은 [업무 지향적 접근법]에서 [전문적인 역량과 정체성 형성]에 초점을 맞춘 보다 [포괄적인 접근법]으로 전환되었다.

From the data, we were able to construct three major shifts in students’ SRL, which were simultaneously influenced by and exerted influence on students’ engagement in CRL as they progressed through clerkships.

  • Firstly, students expressed a shift with regard to whom they involved in CRL, bestowing an important role on peers at the start of clerkships and increasing their preferences for clinician role models towards the end of the programme.
  • Secondly, novice students’ SRL was mainly externally driven by cues in the environment, whereas experienced students’ SRL was increasingly driven by intrinsic cues and self-motivation.
  • Finally, regulatory behaviours shifted from a task-oriented approach towards a more comprehensive approach that focuses on professional competence and identity formation. 

3.1 동료와의 상호 작용에서 임상의사의 역할 모델과의 상호 작용
3.1 From interacting with peers to interacting with clinician role models

학생들은 임상실습 과정 동안 누구와 함께 CRL에 engaged with 했는지에 대한 변화를 묘사했다. 프로그램을 시작할 때, [동료들과의 상호작용]은 여러 가지 목표를 달성하며 중요한 역할을 했다. 초보 학생들은 임상실습에서의 기대와 기회에 대해 확신이 없어서, 새로운 학습 환경에 대한 이해를 발전시키기 위해 서로 의지한다고 말했다.
Students described a change with regard to whom they engaged with in CRL over the course of clerkships. At the start of the programme, interactions with peers played an important role, serving several goals. Novice students indicated being unsure of clerkship expectations and opportunities and thus relying on one another to develop an understanding of the new learning environment:

 

내가 또한 당신이 이곳에 처음 왔을 때 정말 좋아하는 것은 다른 인턴[동료 학생]들이 항상 당신을 데리고 다니며 길을 안내해주고, 또한 당신이 이 문제를 가장 잘 해결할 수 있는 방법을 알려준다는 것이다.
What I also really like when you're new to a place is that other interns [fellow students] always take you along, show you the way, and also point out how you can best tackle this here. (Student 2, Year 2)

추가적으로, 초보 학생들은 학습 목표를 세우거나, 학습 전략과 학습 기회의 선택을 고려할 때 서로 의지하는 경향이 있었다.
Additionally, novice students tended to rely on one another to create a frame of reference in order to formulate learning goals, and to think about learning strategies and selection of learning opportunities:

 

당신은 어느 정도 기준점이 있습니다. 예를 들어, 여러분(동료 학생들)은 이렇게 한다는 것이다. 아니면 그것이 중요하다고 생각하거나, 여러분은 이미 알고 있습니다. 글쎄, 나도 그걸 알아야 할 것 같은데, 어떻게 하는 거야?
You have a frame of reference, more or less. Like, you [fellow students] do it like this or think that is important or you already know it. Well, maybe I should know it too, so how do you do it? (Student 1, Year 2)


따라서 또래와의 상호작용은 학생들의 지식이나 기술 숙련도의 격차를 노출시켰고, 그들이 이러한 [격차를 해소]하기 위한 목표와 전략을 수립하는 데 도움을 주었다.
Interactions with peers thus exposed gaps in students’ knowledge or skill proficiency, helping them to formulate goals and strategies to address these gaps.

비록 초보 학생들에게는 또래간의 상호작용이 새로운 학습 환경에서 길을 찾고 더 편안하게 느끼도록 도와주었지만, 학생들은 각각의 새로운 임상실습에서 새로운 환경에 적응하며 경험을 쌓았다. 시간이 지나면서, 그들은 의료업무에 점점 더 많이 참여했고, 이것은 그들이 무엇을 배우길 원하거나 배워야 할 필요가 있는지를 더 확고하게 이해하는 데 도움을 주었다. 경험이 쌓인 학생들은 학습의 조절을 위해 다른 source에 의존한다고 보고했고, 주치의나 레지던트 같은 임상의사 롤모델을 언급했다. 이러한 역할 모델은 피드백 제공을 통해 학생들의 SRL 행동에 영향을 주었지만, 특히 의사들과의 [상호 작용과 관찰에 기초한 자기 성찰]을 자극함으로써 영향을 미쳤다.
Although peer interactions helped novice students to navigate and feel more comfortable in the new learning environment, students gained experience in adapting to new environments with each new clerkship. Over time, they participated increasingly in health care tasks, which helped them to develop a firmer grasp of what they wanted or needed to learn. Experienced students reported that they then relied on other sources to help regulate their learning, referring to clinician role models such as attending physicians and residents. These role models influenced students’ SRL behaviour through the provision of feedback, but especially through the stimulation of self-reflection based on interactions with and observations of these physicians:

 

원칙적으로 의사는 3년 동안 당신의 롤모델이다. 당신은 의사를 관찰하면서 내가 어떻게 그럴 수 있을까, 나는 이런 의사가 되고 싶은가, 아니면 다른 사람이 되고 싶은가 하는 생각을 하게 된다. 그리고 이 모든 다양한 전문가들을 만나면서 여러분은 자신만의 의사를 만들게 됩니다. 예를 들어, 여러분이 되고자 하는 의사들에 대한 아이디어를 말이죠. (9학년, 2학년)
In principle, the physician is your role model for 3 years, so you observe him and think, how would I do that and do I want to be this kind of doctor or do I want to be another kind? And through meeting all these different specialists, you create your own, let's say, [idea of the] physician you want to become. (Student 9, Year 2)

3.2 외적 조절동인에서 내적 조절동인으로
3.2 From external regulatory drivers to internal regulatory drivers


프로그램을 시작할 때, 학생들의 SRL은 대부분 외부에서 추동되는 것처럼 보였다. 초보 학생들은 임상실습에 시작 시 학습 목표를 세울 때 [포트폴리오 지침]을 따르고 [다른 사람의 의견input]에 의존하는 것을 묘사했다. 그러나, 그들은 또한 이러한 학습 목표가 특정 환경에서 학습 가능성과 잘 맞지 않는다는 것을 발견했고, 이는 학습 계획으로부터 멀어지게 만들었다. 프로그램의 첫 임상실습 동안, 학생들은 그들이 반응적으로 학습 목표와 전략을 조정할 수 있도록 돕기 위해 [실제 직장 내의 다른 사람들]에게 의존했다. 예를 들어, [레지던트들과 의사]들은 학생들이 무엇을 중요한 학습 목표로 생각해야 하는지에 대해 명확한 방향을 제시함으로써 그들의 학습을 조절하는 것을 도왔다.

At the start of the programme, students’ SRL seemed to be largely externally driven. Novice students described complying with portfolio instructions and relying on input from others when formulating learning goals prior to a clerkship. Quite often, however, they also found that these learning goals were not well aligned with learning affordances in a specific setting, which led to feelings of detachment from their learning plans. During the first clerkships of the programme, students then depended on others in the actual workplace setting to help them reactively adjust learning goals and strategies. Residents and physicians, for example, helped students regulate their learning by providing clear and explicit directions on what they thought were important learning goals:

 

네, 물론 의사가 '야, 이거 재밌는거야'거나 '임상실습 끝날 때까지 할 수 있어야 해'라고 말한다면, 당연히 동의해야죠. (학생 11, 1학년)

Yes, of course if a doctor says, ‘Hey, this is fun to do’ or ‘You should be able to do this by the end of the clerkship,’ then of course, you go along with it. (Student 11, Year 1)

 
특히 작업장 관리자는 이러한 측면에서 중요한 역할을 하는 것으로 보입니다.
Workplace supervisors in particular seemed to play important roles in this respect:

 

당신은 항상 직장 상사와 수다를 떨고, 그들은 다음과 같은 말을 합니다. "우리는 당신이 이것저것 배우고, 당신의 사무직에서 이것저것 벗어나기를 기대합니다." 이러한 [기대]를 미리 목표에 반영하지 않았다면, [이제부터라도] 고려해보겠다고 생각할 것입니다. (학생 10, 1학년)
You always chat with your workplace supervisor, and they say things like: ‘We expect you to learn this and that, and get this and that out of your clerkship.’ If you haven't already factored these [expectations] into your goals beforehand, then you think, okay, I'll take them into account [now]. (Student 10, Year 1)





자기조절학습은 학생과 의사가 [공동활동에 협력하는 상황]에 기반을 둔 경우도 많았다. 학생들은 일부 의사들이 그 활동activity에 대해 지속적으로 질문을 던졌고, 이는 지식이나 기술 숙련도의 격차를 드러냈다고 보고했다. 이를 통해 학생들은 학습 활동과 프로세스의 방향을 설정하고, 격차를 해소할 수 있었습니다.
Self-regulated learning was also often grounded in situations in which a student and a physician were cooperating in a joint activity. Students reported that some physicians consistently posed questions about the activity, which uncovered gaps in knowledge or skill proficiency. This helped students to direct their learning activities and processes and bridge the gaps:

 

수술실에 있을 때 [외과의가 해부학에 대해 여섯 가지 질문을 하는데 딱 한 가지 대답만 할 수 있다면] 집에서 해야 할 일이 있다는 것을 알게 될 것이다.
When you're in the operating room, and the surgeon asks six questions on anatomy and you can only answer one, then you sure know you have something to do at home. (Student 9, Year 2)

 

따라서 초보 학생들의 SRL은 [학습 환경 속 다른 사람들]에 의해 주로 시작되는 것처럼 보였다.
Novice students’ SRL thus seemed to be predominantly initiated by others in the learning environment.


시간이 지남에 따라 학생들이 자신에게 기대되는 것이 무엇인지 더 잘 이해하게 되면서, 그들은 점점 더 그들이 되고자 하는 의사 유형에 대해 생각하기 시작했고, 학습에 필요한 정보를 제공할 수 있는 다른 사람들을 찾고 선택하는 사회적 센서를 개발했다. 다양한 건강 관리 환경을 경험하고 그들이 발전하는 직업적 정체성에 대해 점점 더 인식하게 되면서, 경험이 많은 학생들은 CRL에 다른 사람들을 참여시키는 데 있어 더 이니셔티브를 가질 수 있는 것처럼 보였다. 학생들은 점점 더 조절 활동을 '책임질take charge' 의지와 능력이 있는 것처럼 보였다. 그들의 개인적인 학습 욕구를 인식하면서, 그들은 관련 있는 다른 사람들에게 그들의 학습을 조절하는 것을 도와달라고 적극적으로 요청하는 데 더 자신감이 있는 것처럼 보였다.
Over time, as students gained a better understanding of what was expected of them, they increasingly began to think about the type of physician they wanted to become and developed social sensors that helped them look for and select suitable others to provide input for their learning. Having experienced a variety of health care settings, and as they became increasingly aware of their developing professional identity, experienced students seemed better able to take the initiative in engaging others in CRL. They seemed increasingly willing and able to ‘take charge’ of regulatory activities. Appreciating their personal learning needs, they seemed more confident in actively asking relevant others to help them regulate their learning:

 

내과 실습 중, 어느 날은 진짜 이렇게 물어봤다.
어려운 대화가 있거나, 전할 나쁜 소식이 있다면, 알려주세요. 제 학습 목표거든요.
(6학년, 3학년)

Then once I really did ask, on [the clerkship in] internal medicine, if there is a difficult conversation, or there's bad news to deliver, please let me do it because it's my learning goal. (Student 6, Year 3)



학생들은 자신의 학습을 지원하기 위해 CRL에 참여할 수 있는 정도는, [목표 설정]과 [이러한 목표를 달성하기 위한 전략 수립과 같은 SRL 기술을 사용할 의지]와 [충분한 자신감]이 있는지 여부에 달려 있다고 보고했다. 즉, [배우고 싶은 것을 확실히 파악하여 학습을 통제]했을 때, 학습 기회를 선택하거나 만들기 위해 환경에서 다른 사람을 참여시키고 동원할 수 있는 용기를 더 쉽게 발견했다고 학생들은 설명했다.

Students reported that the extent to which they were able to engage in CRL to support their learning depended on whether they were willing and sufficiently confident to use SRL skills such as goal setting and the devising of strategies to achieve these goals. That is, students explained that when they took control of their learning based on a firm grasp of what they wanted to learn, they more readily found the courage to engage and mobilise others in the environment to select or create learning opportunities:

 

저는 제 자신의 학습을 많이 통제할 수 있다고 느낍니다. 이니셔티브를 가지고 배우고 싶다는 것을 보여주는 것이다.
그리고 또한 질문을 하고, 할 일을 요구하거나, 제안을 하는 용기를 갖는 것.

I do feel that I can control it [my own learning] a lot. By taking the initiative and showing that you want to learn. And also having the courage … to ask questions and to ask for things to do, or to come up with suggestions. (Student 1, Year 2)

3.3 특정업무에서 전문역량 및 전문성 개발까지
3.3 From specific tasks to professional competence and professional development

학생들은 학습 조절의 초점이 임상실습을 하는 동안 달라졌다고 지적했다. 초보자들은 업무 지향적이라고 묘사했다. 즉, 목표 설정은 [높은 수준의 세분화]가 특징이며, 초보자는 [명확하게 구분된 학습 목표를 달성]하는 데 중점을 두었다. 
Students indicated that the focus of the regulation of learning shifted over the course of clerkships. Novices described being task-oriented. That is, goal setting was characterised by high levels of granularity; novices focused strongly on attaining clearly demarcated learning goals (and on formulating learning goals): 

의사를 위한 프레임워크 계획[CanMEDs 프레임워크]을 살펴본다. 
그것은 역량에 따라 세분화되며, 그 하위 역량은 특정한 요소로 나뉜다.

I look at the framework plan for physicians [CanMEDS framework]. It's subdivided into competencies and those sub-competencies are divided into specific components. (Student 10, Year 1)

 
따라서 초보자의 경우 CRL은 [좁게 정의된 과제별 학습 목표를 수립하고 성찰]하는 것에 [다른 사람(동료 및 멘토)을 주로 참여]시켰다. 결과적으로, 자기 성찰은 대부분 [공식화된 학습 목표의 달성 여부에 대한 평가]로 구성되었다
For novices, CRL thus mainly entailed engaging others (peers and mentors) in formulating and reflecting on narrowly defined, task-specific learning goals. Consequently, self-reflection most often consisted of an evaluation of whether or not formulated learning goals were attained.
경험이 쌓인 학생들은 임상실습 통해 발전하면서 경험을 쌓으면서, [현실적이고 실현 가능한 학습 목표]를 수립할 수 있을 뿐만 아니라 [학습 목표의 초점을 보다 포괄적인 의료 전문성의 측면]으로 이동시켰다고 보고했다. 즉, 경험 많은 학생들은 초보자들이 적용한 [높은 수준의 세분성]을 뛰어넘는 학습 목표를 세우고, [목표 설정과 자기 성찰에 대한 더 넓은 접근법]을 채택했다. 따라서, 경험 많은 학생들의 학습 목표는 [전문적인 발달과 정체성 형성의 수준]까지 올라갔다.
Experienced students reported that, as they gained experience by progressing through clerkships, they not only became more capable of formulating realistic and feasible learning goals, but they also shifted the focus of their learning goals on to more comprehensive aspects of medical expertise. That is, experienced students formulated learning goals that transcended the high level of granularity applied by their novice counterparts, and adopted a broader approach to goal setting and self-reflection. Thus, the learning goals of experienced students rose to the level of professional development and identity formation:

 

첫 임상실습에서는 구체적인 학습 목표, 상황을 개선하기 위해 더 신경을 쓰고,
마지막 임상실습에서는 어떻게 하면 전반적으로 좋은 의사가 될 수 있을까에 더 신경을 씁니다.
그러면 저는 더 이상 구체적인 사항들에 신경 쓰지 않습니다.
저는 제가 어떤 의사가 되고 싶은지, 어떤 전문 분야에서 일하고 싶은지, 그것을 이루기 위해 제 선택을 어떻게 direct할 수 있는지에 대해 더 신경을 씁니다. (6학년, 3학년)

In your first clerkship, you are more concerned with specific learning goals, to improve things, and in your last clerkship you are more concerned with how do I become a good doctor in general. Then I'm no longer bothered by the specifics […] I'm more concerned with the kind of doctor I want to be, what specialism I want to work in, and how I can direct my choices to achieving that. (Student 6, Year 3)

4 논의
4 DISCUSSION

이 연구는 임상 작업 공간 환경에서 CRL에 대한 의대생의 인식을 탐색하고 학습 환경에서 다른 사람과의 상호작용이 학생의 SRL 발달에 어떤 영향을 미치는지 조사하는 것을 목표로 했다. 우리의 연구 결과는 시간이 지남에 따라 CRL과 SRL에 대한 학생들의 참여가 변화하고 학습 환경에 대한 인식과 경험의 변화와 직업적 정체성 개발에 영향을 받는다는 것을 보여준다. 우리의 연구 결과는 세 가지 주요 변화가 시간 경과에 따른 학생들의 발전에 핵심임을 시사한다. 

  • (a) CRL 파트너 선정의 변화: 동료에서 임상의 롤모델로 이동
  • (b) SRL 행동의 변화: 초보 학생은 외부적으로 주도되나, 경험이 풍부한 학생은 내부적으로 주도되며 타인에게 신중하고 proactive하게 참여를 유도하는 경향이 있음
  • (c) 조절 초점의 변화: 학습자가 [잘 정의된 과제와 과제 요구 사항]에서 [전문직 정체성 발달과 관련된 전문 역량에 대한 광범위한 관점]으로 이동

This study aimed to explore medical students’ perceptions of CRL in clinical workplace settings and to investigate how interactions with others in the learning environment affect the development of students’ SRL. Our findings show that students’ engagement in CRL and SRL changes over time, and is influenced by changing perceptions and experiences of the learning environment and the development of a professional identity. Our findings suggest that three major shifts are key to students’ development over time:

  • (a) a shift in the selection of CRL partners, which moves from peers to clinician role models;
  • (b) a shift in SRL behaviours, which tend to be externally driven in novice students and become internally driven and involving of the deliberate, proactive engagement of others in more experienced students; and
  • (c) a shift in regulatory focus as learners move from well-defined tasks and task requirements to a broader view of professional competence in relation to the developing of a professional identity.

 

본 연구의 연구 결과는 이전 연구의 결과를 입증하고 의대생의 SRL 개발에는 임상 환경에서 사회적 상호 작용의 중요함을 강조한다. 이는 Berkhout와 동료들의 연구 결과와 일치하여, 현재의 연구 결과는 학생들의 SRL에 대한 다른 사람들의 영향이 초보 학생들과 경험 많은 학생들 사이에 다르다는 것을 시사한다.

  • 초보 학생들이 주로 동료들에 의존하여 학습 환경을 탐색하는 데 도움이 되는 frame of reference을 공동-생성하는 반면,
  • 경험이 많은 학생들은 통제력을 얻고, 경험이 많은 다른 임상의 롤 모델과 상호 작용하며, 점점 더 자신의 학습을 서포트하기 위한 목적의 공동 조절 활동에 이들을 참여시킨다.

The findings of our study corroborate those of previous research and stress the importance of social interactions in clinical settings for the development of medical students’ SRL. Aligned with findings from the study by Berkhout and colleagues,11 the current findings suggest that the influence of others on students’ SRL differs between novice and experienced students.

  • Whereas novice students mainly rely on peers to co-create a frame of reference to help them navigate the learning environment,
  • experienced students learn to take control, to interact with clinician role models as more experienced others and to increasingly engage these in co-regulatory activities to support their own learning.

또한 참가자들은 자신이 배우고자 하는 것과 이러한 목표의 달성이 전문적인 역량 개발에 어떻게 기여할지에 대한 명확한 견해를 갖게 된다면 다른 사람들을 학습에 더 쉽게 참여시킬 수 있을 것이라고 보고했다. 이러한 결과는 SRL과 CRL 사이의 관계가 상호적이라는 것을 시사한다

  • SRL 기술은 다른 사람과의 상호작용을 통해 개발되는 반면 
  • SRL 기술의 숙달mastery은 학생들이 학습과 역량 개발을 위해 의미 있는 CRL에 능동적으로 참여할 수 있도록 한다. 

Participants furthermore reported that they could more readily engage others in their learning if they had developed a clear view about what they wanted to learn and how the achievement of these goals would contribute to the development of professional competence. These findings suggest relationships between SRL and CRL are reciprocal:

  • SRL skills develop through interactions with others,
  • whereas the mastery of SRL skills increasingly enables students to proactively engage in meaningful CRL to enhance their learning and competence development.

[개인이 되고자 하는 의사 유형에 대한 성찰]뿐만 아니라, [의료 업무에 대한 적극적인 참여]는 학생들이 일과 학습 환경에서 다른 사람들과의 상호작용을 통해, [학습을 점점 더 잘 조절하고 기꺼이 조절하는 학습자]로 발전하는 데 영향을 미치는 중요한 촉진 요인으로 보인다.

Active participation in health care tasks, as well as reflection on the type of physician the individual wants to become, seem to be important facilitating factors, influencing students’ development into learners who are increasingly able and willing to regulate their learning through interactions with others in the work and learning environments.

본 연구의 참가자들은 [(학습과 일이 얽혀 있는 학습 환경으로서의) 임상 환경]에 대한 깊은 이해에 [자신의 학습을 조절할 수 있는 능력]이 달려있음을 분명히 나타냈다. 학생들은 임상실습 내에서 학습 기회에 대한 이해가 부족할 경우, 학습 목표를 설정해야 할 때 도전과 좌절이 반복된다고 보고했다. 그 결과, 학생들은 [실제 진행되는 학습과 업무 경험]뿐만 아니라 [레지던트, 의사, 동료들과의 관찰과 협상]을 바탕으로 [목표를 지속적으로 조정하고 다듬어야 한다]고 느꼈다. 이러한 발견은 [임상적 맥락에서 목표를 설정]할 때, 목표가 현실적이고 달성가능하려면, [학생과 감독자 사이의 협상과 감독자의 참여]를 필요로 한다는 이전 연구의 결과와 일치한다.22, 23
Participants in our study clearly indicated that the ability to regulate their own learning depended on their having a deep understanding of the clinical setting as a learning environment in which learning and work are intertwined. Students repeatedly reported being challenged as well as frustrated when tasked with setting learning goals if their understanding of the learning opportunities within clerkships was insufficient. In consequence, students felt they were then forced to continuously adjust and refine their goals based on observation of and negotiation with residents, physicians and peers, as well as on actual learning and work experiences. These findings are in line with those of previous studies which showed that goal setting in clinical contexts requires negotiation between students and supervisors and engagement from supervisors if goals are to be realistic and attainable.22, 23

우리의 연구 결과는 또한 학생들이 임상실습 환경에서 [팀에 포함되는 정도와 속도]가 [피드백을 요청하거나 의료 업무에 대한 자신의 적극적인 참여를 협상함]으로써, 다른 사람들을 학습 조절에 능동적으로proactive하게 참여engage시키는 능력에 영향을 미친다는 것을 보여주었다. 이는 특정 업무 환경에서는 CRL 기회를 활용하기 위해 학생을 CoP(실천 공동체)에 장기간 포함하도록 촉진해야 함을 시사할 수 있다. 
Our findings also showed that the extent to which and the pace at which students are embedded in teams in clerkship environments influenced their ability to proactively engage others in the regulation of their learning through the solicitation of feedback or by negotiating their own active participation in health care tasks. This may suggest that we need to facilitate the prolonged inclusion of students into communities of practice (CoPs) to capitalise on the opportunities for CRL in specific work settings.24 

CoP에서 개인은 일반적으로 목표를 공유하고, 이러한 목표를 달성할 수 있는 최선의 방법에 대한 대화를 함으로써, 서로로부터 배우고, 이에 따라 서로의 지식과 기술을 지속적으로 심화시킨다. CoP는 동료들과 더 경험이 많은 다른 사람들을 학습 조절에 참여시킬 수 있는 기회를 만들 뿐만 아니라, 직무과 의료의 질에 대한 토론에 참여할 수 있는 기회를 제공하고, 학생들이 의사가 되기 위해 무엇이 필요한지에 대한 성찰을 자극하여, 전문직 정체성 형성과 SRL의 발달을 지원한다.

In CoPs, individuals typically engage in learning from and with each other by sharing goals and having conversations about how best to achieve these goals, and thereby continuously deepening one another's knowledge and skills.25 Not only do CoPs create opportunities to engage peers and more experienced others in the regulation of learning, but they also offer opportunities to engage in discussions about the quality of work and health care, stimulating students’ reflections on what it takes to be and become a medical doctor and thereby supporting their professional identity formation and subsequent development of SRL.

본 연구의 발견뿐만 아니라 이전 연구에 근거하자면, 동료들은 목표 설정에서 학생들을 지원하고 학습 환경의 기회와 기대에 익숙해질 수 있기 때문에, 초보 학생들의 SRL 개발에 중요한 역할을 수행하는 것으로 보인다. 동료 지원 학습(PAL)은 또한 학생들의 전문직 정체성 형성에 기여하는 것으로 나타났다. 따라서 우리는 예를 들어, [초보 학생과 더 경험이 많은 학생들 사이에 학습과 협력 관계를 형성]함으로써 CoP 내에서 PAL을 자극하는 데 더 많은 주의를 기울여야 할 수 있다. PAL에는 양방향의 서포트가 수반되기 때문에, CoP 내에서 PAL을 자극하면 학습자의 코칭과 교수 능력을 키우는 추가적인 이점이 있다.29

Based on the findings of our study, as well as findings from previous research,11 peers seem to fulfil important roles in novice students’ development of SRL because they can support students in goal setting and familiarise newcomers to opportunities within and expectations of the learning environment. Peer-assisted learning (PAL) has furthermore been shown to contribute to students’ professional identity formation.26, 27 We therefore may need to pay more attention to stimulating PAL within CoPs, by, for example, forming learning and working partnerships between novice and more experienced students. As PAL entails bidirectional support,28 stimulating PAL within CoPs will deliver the added benefit of developing learners’ coaching and teaching skills.29

전반적으로, 우리의 연구 결과는 SRL이 CRL에 내장되어 있다는 개념을 뒷받침하며, 이러한 생각은 탄력을 받고 있다. 현재 연구는 학생들의 SRL 발달에 있어 '자신을 넘어서beyond the self'를 바라볼 필요성을 강조한다. 우리의 발견은 SRL 개발을 포함한 직장 학습workplace learning이 항상 다른 사람과의 상호 작용에서 발생하며, 학생들의 SRL은 항상 CRL에 대한 참여를 수반한다는 것을 나타내는 [사회 문화 학습 이론] 내의 필수 개념을 반영한다. 학생들은 타인으로부터 '자율적으로' '독립적으로' 배우는 학생으로 발전한다기보다는, 자기 조절 학습자로의 변화하면서 [CRL에 참여하는 방식과 타인을 학습에 의도적이고 의미 있게 참여시키는 능력]이 증가하였다.
Overall, our findings support the notion of SRL as being embedded in CRL, an idea gaining momentum.30 The current study highlights the need to look ‘beyond the self’ when examining and facilitating students’ SRL development. Our findings reflect essential notions within sociocultural learning theories, indicating that workplace learning, including the development of SRL, always occurs in interactions with others, and that students’ SRL always involves engagement in CRL. Rather than developing into students who learn ‘autonomously’ and ‘independently’ from others, students’ transformation into self-regulated learners is reflected through significant changes in the way that they engage in CRL and their increasing ability to purposively and meaningfully engage others in their learning to support their development of competence.

능력 SRL이 상황에 따라 다르다는 것이 점점 더 인정되고 있지만, 종종 여전히 학습자의 독립성과 자율성을 강조하고 강조한다.31, 32 본 연구는 이러한 아이디어에 문제를 제기하며, SRL 발달뿐만 아니라, 임상 작업 공간 환경에서 사회적 상호작용에 내재된 SRL 발달을 고려할 것을 지지한다. 학생들의 [SRL 개발]을 [CoP에서 CRL에 참여하는 능력의 개발]로 개념화하는 것은 [임상실습을 조직하고 의대생들에게 학습을 조절하도록 교육하는 방법]에 중요한 함의를 갖는다. 예를 들어, 우리는 학생들이 여러 개의 짧은 블록식 로테이션을 통해 순환하는 현재의 의료 훈련 모델을 재고해야 할 수도 있다. 

Although it is increasingly acknowledged that SRL is context-dependent, research often still emphasises and underscores learner independency and autonomy.31, 32 The present study challenges this idea and instead advocates for considering SRL, as well as SRL development, as being embedded in social interactions in clinical workplace settings. Conceptualising the development of students’ SRL as the development of students’ ability to engage in CRL in CoPs has important implications for how we organise clinical clerkships and how we educate medical students to regulate their learning. For instance, we may need to reconsider current models of medical training in which students rotate through multiple short-block rotations.

오히려, 우리는 학생들이 CoP의 중심으로 이동하고 CRL의 기회를 완전히 이용할 수 있도록 하기 위해 종단적 통합임상실습에서 건강 관리 팀 내에서, 안전하고 신뢰할 수 있는 종단적 관계의 개발을 촉진해야 한다. 나아가 학생들이 [직무환경에서 학습을 조절할 수 있는 학습자]로 발전할 수 있게 하려면, 목표 설정, 자기 평가, 성찰과 같은 스킬에 대한 훈련과 코칭뿐만 아니라, 무엇보다 [피드백 탐색 및 타인을 학습 대화에 관여시키는 것]과 같이 [CRL에 참여할 수 있는 스킬]에 주의를 기울여야 할 수 있다. 의학교육의 시작부터 SRL이 CRL에 내재되어 있다는 것을 인정하면, 학생들이 직무환경에서 학습을 최적화하도록 더 잘 준비하는 데 도움이 될 수 있으며 의료 교육 및 연구가 진정으로 'self'의 수준을 넘어설 수 있도록 도울 수 있습니다.

Rather, we should facilitate the development of safe and trusting longitudinal relationships within health care teams in longitudinal integrated clerkships,33 for example33 to allow students to move towards the centre of the CoP and to fully capitalise on opportunities for CRL. Furthermore, in order to help students develop into learners who are able to regulate their learning in workplace settings, we may not only need to offer training and coaching in skills such as goal setting, self-assessment and reflection, but first and foremost to pay attention to the skills that enable students to engage in CRL, such as feedback seeking and engaging others in learning conversations. Acknowledging from the outset of medical training that SRL is embedded in CRL may assist us in better preparing students to optimise their learning in workplace settings, and may help medical education and research to truly move beyond the self.

4.1 제한사항
4.1 Limitations

이 연구는 참가자 11명의 제한된 샘플로 수행되었습니다. 대부분의 학생(9명)은 임상 2년차 또는 마지막 해에 등록되었다. 이는 이러한 학생들이 임상 훈련을 시작할 때 자신의 행동과 생각을 소급적으로만 설명할 수 있었다는 것을 의미하며, 이는 그들을 기억 편향에 취약하게 만들었을 수 있다. 공동규제학습과 SRL은 추상적인 이론적 구성인데, 학생들이 실용적으로 이야기하기 어려웠을 수 있다. 면접 가이드를 구성하면서, 연구팀은 질문들을 최대한 구체적으로 공식화하려고 시도했다. CRL은 학생들이 깨닫는 것보다 더 널리 퍼져 있을 수 있으며, CRL의 많은 부분이 숨겨져 있거나 암시적일 수 있다. 예를 들어, 면접이 끝난 후 몇몇 학생들은 [보통은 면접에서 논의된 개념에 대해 그다지 많은 생각을 하지 않는다]고 언급했다. 비슷한 맥락에서 참가자들이 자발적으로 참여했기 때문에, 이는 자신의 학습에 대해 적극적으로 생각한 학생들만이 참가에 동의했다는 의미일 수 있다.

This study was conducted with a limited sample of 11 participants. Most (nine students) were enrolled in the second or final years of clinical training. This means that these students were able to describe their behaviour and thoughts at the start of clinical training only retrospectively, which may have made them susceptible to memory bias. Co-regulated learning and SRL are abstract theoretical constructs, which students may have found difficult to talk about in practical terms. In constructing the interview guide, the research team attempted to formulate the questions as concretely as possible. It may be that CRL is more prevalent than students realise, and much of CRL may be hidden or implicit. For example, some students indicated after the interview had finished that they did not usually give very much thought to the concepts discussed in the interview. In a similar vein, participants were self-selected volunteers, which may imply that only students who actively thought about their learning agreed to participate.

5 결론
5 CONCLUSIONS

본 연구는 SRL과 SRL 개발이 [임상 직무 공간 환경의 사회적 상호작용과 CRL]에 내재되어 있다는 아이디어를 강조한다. 우리는 CRL이 구조적으로 임상실습에 내장embed되어 있음을 인정하고, [자기조절능력]이 [학습 프로세스를 지원하기 위해 다른 사람들과 의미 있는 상호작용을 할 수 있는 능력]을 의미한다는 것을 인정할 때, 비로소 의대 학부생의 SRL 개발을 지원할 수 있을 것이다. 의대생들의 평생학습자 전환을 촉진하기 위해서는 학습자들의 CRL 참여를 지원하고 조직해야 합니다. 역량 기반 의료 교육의 경우, 초보 학생과 더 경험이 많은 학생과 의료 전문가 사이의 직장 파트너십을 장려하기 위해 의대생들을 CoP에 포함시키는 방법을 재고해야 한다는 것을 의미한다. 임상 환경에서 CRL의 기회를 활용함으로써, 우리는 학생들이 전문 경력 동안 급변하는 의료 시스템에서 학습을 최적화하고 고품질 관리를 제공할 수 있는 의료 전문가로 발전하는 데 필요한 학습 기술을 더 잘 준비할 수 있을 것이다.

Our study emphasises the idea that SRL and SRL development are embedded in social interactions and CRL in clinical workplace settings. We can support medical undergraduates’ development of SRL when CRL is structurally embedded in clerkships, acknowledging that the ability to self-regulate implies the ability to engage in meaningful interactions with others to support learning processes. In order to facilitate medical students’ transformation into lifelong learners, we therefore need to support and organise learners’ engagement in CRL. For competency-based medical education, this means that we should reconsider the ways by which we include medical students in CoPs in order to encourage workplace partnerships between novice students and more experienced students and health care professionals. By capitalising on the opportunities for CRL in clinical settings, we may be able to better equip students with the learning skills they need to develop into health care professionals who are able to optimise their learning and provide high-quality care in rapidly changing health care systems throughout their professional careers.

 

 


Med Educ. 2020 Mar;54(3):234-241.

 doi: 10.1111/medu.14018. Epub 2019 Dec 1.

Beyond the self: The role of co-regulation in medical students' self-regulated learning

Affiliations collapse

Affiliations

1School of Health Professions Education, Maastricht University, Maastricht, the Netherlands.

2Department of Educational Development and Research, Faculty of Health, Medicine and Life Sciences, Maastricht University, Maastricht, the Netherlands.

3Research Group Professional Assessment, Zuyd University of Applied Sciences, Heerlen, the Netherlands.

PMID: 31788840

PMCID: PMC7065189

DOI: 10.1111/medu.14018

 

Abstract

Context: Medical students are expected to self-regulate their learning within complex and unpredictable clinical learning environments. Research increasingly focuses on the effects of social interactions on the development of self-regulation in workplace settings, a notion embodied within the concept of co-regulated learning (CRL). Creating workplace learning environments that effectively foster lifelong self-regulated learning (SRL) requires a deeper understanding of the relationship between CRL and SRL. The aim of this study was therefore to explore medical students' perceptions of CRL in clinical clerkships and its perceived impact on the development of their SRL.

Methods: We conducted semi-structured interviews with 11 purposively sampled medical students enrolled in clinical clerkships at one undergraduate competency-based medical school. Data collection and analysis were conducted iteratively, informed by principles of constructivist grounded theory. Data analysis followed stages of open, axial and selective coding, which enabled us to conceptualise how co-regulation influences the development of students' self-regulation.

Results: Data revealed three interrelated shifts in CRL and SRL as students progressed through clerkships. First, students' CRL shifted from a focus on peers to co-regulation with clinician role models. Second, self-regulated behaviour shifted from being externally driven to being internally driven. Last, self-regulation shifted from a task-oriented approach towards a more comprehensive approach focusing on professional competence and identity formation. Students indicated that if they felt able to confidently and proactively self-regulate their learning, the threshold for engaging others in meaningful CRL seemed to be lowered, enhancing further development of SRL skills.

Conclusions: Findings from the current study emphasise the notion that SRL and its development are grounded in CRL in clinical settings. To optimally support the development of students' SRL, we need to focus on facilitating and organising learners' engagement in CRL from the start of the medical curriculum.

Keywords: clinical education; development; professional; qualitative research methods.

의학교육에서 학술연구경험에 대한 실재주의적 리뷰 (Med Educ, 2020)
A realist review of scholarly experiences in medical education
Marian Cornett1 | Claire Palermo1 | Megan J. Wallace2,3 | Basia Diug4 | Bernadette Ward5

 

 

1 소개
1 INTRODUCTION

지난 10년 동안 의과대학은 핵심 교육의 일부로 [연구 방법]과 [증거 기반 의학]을 점점 더 많이 통합해 왔다.1 수업을 통해 연구 방법을 가르치는 것 외에도, 수많은 기관들이 [학문적 경험]을 수용하고embrace 있다. 세계적으로, 학문적 경험은 기관마다 다르며 종종 학문적 위치, 학문적 프로젝트, 학문적 집중 또는 학문적 집중이라고 불린다. 우리는 '학술 경험scholarly experience'이라는 용어를 여러 의과대학에서 사용하는 다양한 용어를 포괄하기 위해 매우 중요한 용어로 사용해 왔다. 이러한 경험은 [독립적인 학습]을 육성하고, [핵심 연구 스킬을 개발하는 것]을 목표로 한다.1 연구 방법 훈련은 증거 기반 의학의 평생 실습을 가능하게 하고 학문적 또는 연구 활동적 임상의의 비율을 증가시키기 위한 의료진의 준비에 매우 중요한 것으로 인식되어 왔다. 
Over the last decade, medical schools have been increasingly incorporating research methods and evidence-based medicine as part of their core teaching.1 In addition to teaching research methods via coursework, numerous institutions have embraced scholarly experiences.1, 2 Globally, scholarly experiences differ between institutions and are often termed, scholarly placements, scholarly projects, scholarly intensives or scholarly concentrations.1 We have used the term ‘scholarly experiences’, as an over-arching term to encompass the various terminologies used by different medical schools. These experiences aim to foster independent learning and develop key research skills.1 Research methods training has been recognised as critical for the preparation of the medical workforce to enable the lifelong practice of evidence-based medicine and to increase the proportion of scholarly or research-active clinicians.1, 3

[학문 활동Scholarly activity]은 [특정 주제에 대한 상세하고 사려 깊은 조사]로 정의된다. [학문적 경험]은 학생들이 학문적 기술을 개발할 수 있도록 지원하는 광범위한 단기 및 장기 경험이다. 예를 들어, 여기에 포함되는 기술에는 한 분야에서 더 깊은 지식을 얻고, 새로운 지식을 창조하며, 학습 평가를 하고, 자기 주도 학습과 구술 및 문서 커뮤니케이션 기술을 습득 등이 있다.

Scholarly activity is defined as a detailed and a thoughtful examination of a subject.4 Scholarly experiences describe a range of short- and long-term experiences that support students to develop scholarly skills, for example, gaining a greater depth of knowledge in a field, creating new knowledge, learning evaluation and, self-directed learning and oral and written communication skills.5 

[학문적 경험]대한 접근법은 단일하지 않다. 이들은 내용 및 학습 성과와 감독 상호작용이 다양하며 기간(몇 주에서 몇 년)을 포함한 다양한 특성을 가지고 있다.

  • 일부 경험은 선택적 또는 자발적 경험에 비해 커리큘럼에 전념하는 시간이 필수적입니다.1 이러한 특성은 필요한 인프라 수준, 경험의 내용과 집중, 감독 준비 및 책임뿐만 아니라 커리큘럼 내의 위치에도 영향을 미칩니다. 예를 들어,
    • 어떤 학생들은 그들의 학문적 경험을 위해 주제를 선택하고, 개별적으로 또는 그룹의 일부로서 경험에 참여한다.
  • 일부 학문적 경험은 연구 (실험실 또는 임상)에만 초점을 맞춘다;
    • 반면 어떤 학문적 경험의 범위는 더 넓어서, 공공 보건, 의료 교육, 문헌 검토, 커뮤니티 프로그램 등에 초점을 맞춘 경험을 포함한다.
  • Supervision arrangement에는 학술 연구 스텝, 멘토 또는 임상 감독관이 포함되며, 학생 지도감독에 대한 시간은 할당되기도 하고, 그렇지 않기도 한다.

There is no one singular approach to these experiences. They have varying characteristics, including duration (from a few weeks to several years),6, 7 with varying content and learning outcomes and supervisory interactions.8, 9 

  • Some experiences are compulsory with dedicated time in the curriculum versus elective or voluntary experiences.1 These characteristics affect the level of infrastructure required, the content and focus of the experience, supervision arrangements and responsibility, as well as the position within the curriculum. For example,
    • some students can choose the topic for their scholarly experience89 and work individually or as part of a group.10 
  • Some scholarly experiences remain solely focused on research (laboratory or clinical);
    • however, others have a broader scope and include experiences focussed on quality improvement, public health and medical education, literature reviews and community programmes.11 
  • Supervision arrangements include academic research staff, mentors or clinical supervisors.12-14 with time allocated (or not) for student supervision.1516

의학에 대한 학문적 경험이 광범위한 활동을 포함하는 것으로 인정되지만, 현재까지 의대생 학문적 경험에 대한 연구는 주로 다음에 초점을 두고 있다.

  • 연구 성과물(예: 동료 검토 출판물, 포스터, 컨퍼런스 프레젠테이션), 
  • 연구에 대한 관심/참여(예: 박사 등록)
  • 학생들의 학술적 경험에 대한 만족감

While scholarly experiences in medicine are acknowledged as encompassing a broad range of activities,5 to date, the research about medical student scholarly experiences has largely focused on

  • research outputs (eg peer-reviewed publications, posters, conference presentations),
  • subsequent interest/participation in research (eg PhD enrolments) or
  • student satisfaction with their scholarly experience.

2017년 학술적 경험에 대한 체계적인 검토는 내부 프로젝트 보고서를 완료하거나 공동저자/첫 번째 저자의 동료 검토 출판물, 교수진 및 국가 또는 국제 컨퍼런스에서 포스터 및 구두 프레젠테이션을 수행한 학생의 비율 측면에서 결과를 보고했다.1 학문적 경험이 [어떻게 학문적 기술을 쌓는지]에 대한 복잡성을 탐구하는 연구는 없었고, 학문적 경험이 어떻게 다양한 결과를 가져오고, 어떤 상황에서 어떤 결과로 이어지는지를 탐구하는 어떠한 증거도 없었다.

A 2017 systematic review of scholarly experiences reported outcomes in terms of the proportion of students who completed internal project reports or had co-authored/first-authored peer-reviewed publications, undertaken poster and oral presentations to faculty and at national or international conferences.1 There has been no research exploring the complexities of how the scholarly experiences build scholarly skills nor has there been any evidence syntheses that explores how scholarly experiences lead to a range of outcomes and under what circumstances.

교육은 평가하기가 어렵기로 악명높다. [학문적 경험] 역시 그것이 구현되는 [다양한 설정과 구조와 결합되며, 시간의 경과에 따라 지속적으로 변화]하기 때문에, 본질적으로 [학습 목표 및 관련 학술적 성과물 달성과 관련된 특성]을 식별하기 어렵게 만들었다. Havnaer 등에 의해 개발된 로직 모델에 따르면

  • 입력(시간, 돈, 시설, 장비 및 기술)이
  • 활동(학생 학술 작업, 감독, 학사 감독, 관리자 지원)과 연관되어
  • 산출물(학생 수, 시간 및 직원 시간)을 내고, 궁극적으로는
  • 결과물(연구 지식, 기술, 태도, 행동과 학술적 결과물)을 만들어낸다.

Education is notoriously difficult to evaluate, and combined with the diverse settings and structures in which scholarly experiences are implemented, changes over time17 have made it inherently difficult to rigorously identify the characteristics that are associated with achieving learning objectives and associated scholarly outputs. The logic model, developed by Havnaer et al,1 suggests

  • inputs (time, money, facilities, equipment and technology) are associated with
  • activities (student scholarly work, supervision, academic oversight, administrator support) to achieve
  • outputs (student numbers, hours and staff time) and ultimately
  • outcomes (research knowledge, skills, attitudes, behaviours and scholarly outputs).

[학문적 경험]이 어떻게 [학문적 산출물]로 이어지는지를 설명하는 다른 문헌과 결합한다면, 이 로직 모델은 [학문적 경험의 평가에 정보를 제공하고, 이러한 요소들이 경험에서 어떻게 운영되는지, 그리고 학문적 경험 결과 달성에 미치는 영향을 탐구하기 위한] 예비 이론preliminary theory 이다. 중요한 다음 단계는, 로직 모델을 하나의 이론으로 검증하는 것이다.

Combined with other literature that describes scholarly experiences leading to scholarly outputs,2, 5, 18 this logic model is a preliminary theory to inform evaluations of scholarly experiences, explore how these factors are operationalised across experiences and their influence on achieving scholarly experience outcomes. Testing the logic model as a theory is an important next step.

이 리뷰는 의대생들의 학문적 경험이 어떻게, 왜, 어떤 상황에서 결과를 도출하는지 이해하기 위해 현실주의 접근법을 사용하여 기존 문헌을 종합하는 것을 목표로 한다. 보다 구체적으로, 다음과 같은 질문에 답하고자 하였다. 

의대생들의 학문적 경험은 왜, 어떻게, 어떤 상황에서 다양한 결과를 낳는가?

This review aims to synthesise existing literature using a realist approach to understand how, why and in what circumstances medical student scholarly experiences produce outcomes. More specifically, the review sought to answer the question:

‘Why, how and under which circumstances do medical student scholarly experiences produce a range of different outcomes?’

2 방법
2 METHODS

2.1 연구 설계
2.1 Study design

현실주의 검토인 연구 설계는 Pawson's five stages of realist review를 따랐다.

  • (a) 범위 명확화(개념 마이닝 및 이론 개발),
  • (b) 증거 검색,
  • (c) 연구 선택,
  • (d) 데이터 추출,
  • (e) 데이터 합성

보고는 RAMESES를 따랐다.  
The study design, a realist review, was guided by Pawson's five stages of realist review:

  • (a) clarifying scope (concept mining and theory development);
  • (b) searching for evidence;
  • (c) study selection;
  • (d) data extraction; and
  • (e) data synthesis,

19, 20 and was reported following the Realist and Meta-narrative Evidence Synthesis: Evolving Standards (RAMESES) for realist syntheses.21 

검토에 대한 현실주의 접근법은 [복잡한 개입이 왜 작동하고 왜 작동하지 않는지 이해]하기 위해 문헌을 검토하는 체계적인 접근 방식을 취한다. 19 현실주의 접근법은 이론 주도적theory-driven이어서, 이론의 개발이 이 과정을 시작부분부터 가이드한다.

  • 개입Intervention은 [메커니즘의 작용을 통해 결과를 이끌어내기 위해 제안된 프로그램 또는 실험]이며, 현실주의 접근 이론은 이러한 기본 메커니즘을 식별하고 설명하는 것을 목표로 한다. 개입과 기본 메커니즘 사이의 관계와 개입의 결과는 복잡하고 미묘한데 맥락적 변화에 민감하다.19
  • 맥락Contexts물질적 자원과 사회적 구조 또는 특정 환경 내의 요소일 수 있다. 맥락은 또한 개입, 이해관계자 상호 관계, 제도적 준비 또는 더 넓은 문화적, 경제적 및 사회적 환경에 참여하는 개인을 지칭할 수 있다.
  • 메커니즘Mechanism일반적으로 숨어있으며, 맥락적 변화에 민감하며, 특정 결과를 산출한다.22 성과와의 관계에 있어서 메커니즘은 성과를 일으킬 수도 있고, 그렇지 않을 수도 있다. 

Realist approaches to reviews take a systematic approach to reviewing the literature to unpack and understand why complex interventions do or do not work.19 Realist approaches are theory-driven with theory development guiding the process from the outset, with data extraction and synthesis key aspects of theory refinement.

  • Interventions are the programme or experiment proposed to lead to outcomes through the action of mechanisms and theory of realist approaches aims to identify and explain these underlying mechanisms. The relationship between interventions and the underlying mechanisms and the outcomes of the intervention are complex, nuanced and sensitive to contextual variations.19 
  • Contexts may be material resources and social structures or the elements within a particular setting.22 Context can also refer to individuals participating in an intervention, stakeholder interrelationships, institutional arrangements or wider cultural, economic and/or societal settings.23 
  • Mechanisms are typically hidden, sensitive to contextual variations and produce certain outcomes.22 In their relationship to outcomes, mechanisms can either cause, or not, the outcome.24 

결국, 현실주의 검토자들이 일차적으로 관심을 갖는 것은 [상황 (C), 메커니즘 (M), 결과 (O) 구성으로 알려진 개입, 맥락, 메커니즘 및 결과 사이의 관계]이다. 19 현실주의 합성은 이론을 다듬기 위해 CMO 구성 전반에 걸쳐 [데미-규칙성]이라고 불리는 패턴을 식별하는 것을 목표로 한다.

In the end, it is the relationships between interventions, context, mechanism and outcomes, otherwise known as Context (C), Mechanism (M), Outcome (O) configuration, that is of primary interest to realist reviewers.19 Realist syntheses aim to identify patterns, termed demi-regularities, across CMO configurations to refine the theory.

 

2.2 범위 명확화
2.2 Clarifying scope

인턴(1학년) 의사로 이어지는 의무compulsory 의대생 학구적 경험에 초점을 맞춘 연구만 포함됐다. [비필수Optional 연구 프로그램](예: 명예, 석사 또는 박사) MBBS/PhD, MBChB/PhD, MD/PhD 또는 대학원 의료교육(전공 수련 과정)은 자발적 프로젝트(의과대학 교육과정 바깥에서 진행되는 것)과 마찬가지로 제외되었다. [비필수이고 자발적인 학문적 기회에 참여하기로 선택한 학생]들은 의대생 전체 코호트와 다른 특성을 가질 가능성이 높으며, 이는 우리의 현실주의적 합성으로부터 결과를 편향시키거나 결과의 일반성을 제한할 수 있다. 학부(학교가 직접 운영)와 의학전문대학원(학사 학위 이후)의 연구가 포함되었다.

Only studies focusing on compulsory medical student scholarly experiences that lead to an internship (1st year) doctor were included. Optional research programmes (eg Honours, Masters or PhD (eg. MBBS/PhD, MBChB/PhD, MD/PhD) or post-graduate medical education (ie medical speciality training) were excluded, as were voluntary projects (outside of the medical curriculum). Students who select to participate in optional and voluntary scholarly opportunities are likely to have different characteristics from the entire cohort of medical students, which could bias the outcomes, or limit the generalisability of the outcomes, from our realist synthesis. Studies of both undergraduate (direct from school) and graduate (after initial degree) entry medical schools were included.

현실주의 접근법의 중심인 것처럼, 우리는 합성을 테스트하기 위해 문헌의 예비 분석에 기초한 초기 프로그램 이론initial programme theory을 개발했다. 이 이론은 Havnaer 등에 의해 개발된 논리 모델을 기반으로 개발되었으며 학문적 경험의 효과에 대한 다른 기존 리뷰에 의해 칭찬받았다. 이러한 리뷰를 바탕으로, 우리의 [초기 프로그램 이론]은 

  • 성과: 경험의 결과로 달성된 학문적/연구적 지식, 기술, 태도, 행동 및 프로젝트 성과물(포스터, 출판물, 프리젠테이션)의 개발로 정의했다.

이러한 검토를 바탕으로, 우리의 [초기 프로그램 이론]은 성과는 다음의 경우에 달성된다는 것이다.

  • 맥락: 시간, 돈, 시설, 장비 및 기술 측면에서 연구 지원이 제공되고,
  • 메카니즘: 학생들이 학술 활동에 참여하고, 양질의 감독, 교육 관리oversight, 관리자 지원 등이 있을 때,

As is central to realist approaches, we developed an initial programme theory based on preliminary analysis of the literature to test our synthesis. This theory was developed based on the logic model developed by Havnaer et al1 and complimented by the other existing reviews of the effectiveness of scholarly experiences .2, 18 Based on these reviews, our initial programme theory defined

  • outcomes as the development of scholarly/research knowledge, skills, attitudes, behaviours and project outputs (eg posters, publications, presentations) that were achieved as a result of the experience.

Based on these reviews, our initial programme theory was that these outcomes were achieved

  • when research support is provided in terms of time, money, facilities, equipment and technology, proposed as contexts,
  • through students engaging in scholarly work, with quality supervision, academic oversight, administrator support, proposed as mechanisms.

 

2.3 증거검색
2.3 Searching for evidence

 

2.4 스터디 선택
2.4 Study selection

 

2.5 데이터 추출
2.5 Data extraction

세 명의 저자가 데이터 추출에 참여했다. 데이터 추출 표를 만들었고, 여기에는 다음을 포함하였다.

  • 연구 특성(예: 저자, 출판 연도, 연구 방법론),
  • 맥락,
  • 학문적 경험 또는 개입의 세부 사항: 이론, 메커니즘, 결과 및 CMO 구성을 포함한 

Three authors were involved in data extraction. A data extraction table whereby

  • study characteristics (eg author, publication year, study methodology),
  • contexts,
  • details of scholarly experiences or intervention including any theory, mechanisms, outcomes and any CMO configurations

처음에는 데이터가 풍부한 5개 연구에서 데이터를 추출하여 이 추출 표를 시험해 본 후 경미한 수정이 이루어졌고 나머지 연구가 완료되었다. 그런 다음 나머지 연구의 데이터를 이 표를 사용하여 중복 추출했다.

...was created. Initially, data from five data-rich studies were extracted to trial this extraction table after which minor modifications were made and the remaining studies completed. Data from the remaining studies were then extracted in duplicate using this table.

2.6 데이터 합성
2.6 Data synthesis

28개 연구와 22개 학문적 경험의 데이터는 36개의 CMO 구성뿐만 아니라 C, M, O에 걸친 패턴에 대해 조사되었다. 우리는 더 빈번한 패턴을 식별하기 위해 CMO 구성에 걸쳐 C-M과 M-O의 일관성을 찾았다. 또한 초기 프로그램 이론과 구성이 어떻게 관련되는지도 고려했습니다. 흔하게 사용되지 않는 CMO 구성은 수정된 프로그램 이론의 개발을 지원하기 위해 사용되지 않았다. [CMO 구성 패턴]을 식별하고 초안을 작성하였다. 이러한 구성 패턴은 [초기 프로그램 이론]과 비교하였고, 차이가 무엇인지 검토하였고(예: 상황 또는 메커니즘으로서의 돈), 현실주의 방법에 기반한 토론을 하여, [최종 CMO 구성 패턴]으로 합의되었다. 수정된 프로그램 이론에 inform하기 위하여, 학문적 경험에 대해 설명하거나 발견을 설명하는 데 사용되는 모든 이론(중간 범위 이론)을 식별하였다.
The data from all 28 studies and 22 scholarly experiences were then examined for patterns across C, M and O as well as the 36 CMO configurations. We looked for consistency of C-M and M-O across the CMO configurations with the aim of identifying more frequent patterns. We also considered how the configurations related to our initial programme theory. CMO configurations that were not common were not used to support the development of the modified programme theory. The identified CMO configuration patterns were drafted. These configuration patterns were then compared to the initial programme theory, differences noted (eg money as context or mechanism), debated based on realist methods, and final CMO configurations patterns agreed. Any theories used to inform the scholarly experience or explain the findings (mid-range theories) were identified for potential use to inform the modified programme theory.

3 결과
3 RESULTS

총 6294개의 레코드가 4개의 데이터베이스에 걸쳐 검색되었으며 중복이 제거되면 4590개의 레코드가 다운로드되었다. 참조 목록이나 Google Scholar 검색에서 식별된 추가 스터디는 없습니다. 초기 심사 후 75개 레코드의 전체 텍스트 검토가 완료되었고 47개 추가 논문이 제외되었다(그림 1).
A total of 6294 records were retrieved across four databases, and once duplicates were removed, 4590 records were downloaded. No additional studies were identified from reference lists or from the Google Scholar search. After initial screening, full-text review of 75 records was completed and 47 additional papers excluded (Figure 1).

 





28개 연구의 22개 학문적 경험이 현실주의 검토에 포함되었다(표 S2). 10개(12개 논문)가 미국에서 왔고, 호주와 터키에서 각각 2개, 사우디 아라비아, 인도, 캐나다, 일본, 남아프리카, 스웨덴, 수단12, 네덜란드에서 각각 1개 논문이었다. 나머지 6개 연구는 혼합 방법, 감사, 35 사전 사후, 예비 코호트 또는 정성 설계를 포함한 다양한 접근방식을 적용했다.

Twenty-two scholarly experiences from 28 studies were included in the realist review (Table S2). Ten (12 articles) were from the USA,7, 30 two from each of Australia31, 32 and Turkey6, 13 and one from each of Saudi Arabia,15 India,10, 33 Canada,9, 34 Japan,35 South Africa,36 Sweden,37-40 Sudan12 and the Netherlands.41 Sixteen programmes (20 studies) used a cross-sectional study design.7, 9-12, 29-31, 33, 34, 36-41 The other six studies applied a variety of approaches including mixed methods,6, 13 audit,35 pre-post,32 prospective cohort14 or qualitative35 designs.

코호트 규모는 오클랜드 대학교 윌리엄 보몬트 의과대학의 47명에서 마스트리히트 대학교의 320명까지 다양하였으며, 학문적 경험의 역사는 1년에서 40년 이상이었다. 모든 학문적 경험은 학문적 경험의 이전이나 도중에 학문적 경험 내에서 가르치는 연구 방법을 통합했고, 모든 것은 학문적 경험으로서 연구 프로젝트를 포함했다.
Cohort sizes ranging from 47 at Oakland University William Beaumont School of Medicine27 to 320 at Maastricht University,41 and the history of scholarly experiences ranged from 1 to 40+ years. All scholarly experiences integrated research methods teaching within the scholarly experiences, either before or during the scholarly experiences, and all involved a research project as the scholarly experience.

학문적 경험의 구성요소에 대한 만족도는 설문조사, 성찰적 비평, 인터뷰로 측정되었다.35 연구 지식과 기술의 발전은 자기 보고서 조사, 인터뷰, 성찰 또는 시험을 통해 측정되었다.10 데이터의 초점은 (감독관이나 의과대학이 아닌) 학생 경험에 있었다. 경험적 학습, 40 사회문화적 학습37, 38, 위치적 학습을 포함한 세 가지 학문적 경험만이 이론을 기술했다.32
Satisfaction with components of the scholarly experiences was measured by survey6, 41 and reflective critique8, 40 or interview.35 The development of research knowledge and skills was measured by self-report survey, interviews, reflections7, 9, 17, 27, 32-35 or by tests.10 The focus of data was on student experiences, not supervisors or the medical school. Only three scholarly experiences described theories including experiential learning,40 socio-cultural learning37, 38 and situated learning.32

합성을 통해 확인된 5가지 주요 구성 패턴이 있는 36개의 개별 CMO 구성(표 S2)은 다음과 같습니다.
Thirty-six individual CMO configurations (Table S2) with five main configuration patterns identified through the synthesis, as follows:
  • 연구문화(맥락)가 잘 갖춰진 의과대학에서, 관련성이 있고 가치(메커니즘)가 있는 학문적 경험을 할 때, 이는 학생들이 다양한 연구능력에 대한 능력과 자신감을 키우는(결과)로 이어진다.
  • 의과대학이 기관과 직원 모두에게 많은 배려regarded를 받는 학문적 경험(컨텍스트)을 가지고 있을 때, 잘 뒷받침되고 구조화된 학문적 경험(메커니즘)은 학생들에게 폭넓은 연구능력에 대한 능력과 자신감을 길러준다(결과물).
  • 학생과 감독자 모두가 학문적 경험에 참여할 수 있는 충분한 시간(컨텍스트)이 주어지면, 양질의 감독(메커니즘)은 학생들이 프로젝트를 완료하고 학문적 산출물을 생산할 수 있는 능력(성과)을 향상시킨다.
  • 학생과 감독자 모두가 학문적 경험에 참여할 수 있는 충분한 시간(컨텍스트)이 주어지면, 학생들이 연구 프로젝트를 완수할 수 있는 능력에 대해 지지와 자신감(자기효능감)을 느낄 때(메커니즘), 이는 학문적 산출물과 출판(성과)으로 이어진다.
  • 의대생들이 자율성을 가지고, 흥미롭고 관련 있는 프로젝트를 선택할 수 있는 능력이 있을 때(맥락), 학문적 경험은 관련이 있고 가치 있는 것으로 여겨지며(메커니즘), 이는 연구에 대한 더 많은 관심과 추구(결과)로 이어진다.

 

  1. When a medical school with a well-established research culture (context) has a scholarly experience that is seen as relevant and of value (mechanism), this leads to students developing ability and confidence in a wide range of research skills (outcome).
  2. When a medical school has a scholarly experience that is highly regarded by both the institution and staff (context), a well-supported and structured scholarly experience (mechanism) leads to students developing ability and confidence in a wide range of research skills (outcome).
  3. When adequate time is available for both students and supervisors to engage in scholarly experiences (context), quality supervision (mechanism) leads to students having enhanced ability to complete projects and produce scholarly outputs (outcome).
  4. When adequate time is available for both students and supervisors to engage in scholarly experiences (context) and students feel supported and more confident in their capacity to complete research projects (self-efficacy) (mechanism), this leads to scholarly outputs and publications (outcome).
  5. When medical students have the ability to choose projects that are interesting and relevant with autonomy (context), the scholarly experience is seen as relevant and of value (mechanism) and this leads to an interest in and pursuit of further research (outcome).

 

학술적 경험의 주요 성과는 다음으로 일관되게 보고되었다. 

  • 학술적 성과물(학술지에 원고를 출판하거나 컨퍼런스에서 발표)
  • 미래 진로로서 연구에 대한 흥미
  • 지식 및 기술 향상 

어떤 연구도 학생 경험과 관련된 시스템 변화, 환자 또는 커뮤니티 결과를 보고하지 않았다. 핵심 메커니즘은 지원, 구조 및 감독에 대한 '자원resources'과 자기 효능감 및 연구를 관련있고 가치있게 여기는 '추론reasoning'이었다.

The key outcomes of the scholarly experiences were consistently reported as

  • scholarly outputs (publishing manuscripts in journals, or presenting at conferences),638 
  • interest in pursuing research in their future career81314161725-2729 and
  • increased research knowledge and skills.632-34363940 

No studies reported any system change, patient or community outcomes linked to the student experience. The key mechanisms were ‘resources’ of support, structure and supervision and ‘reasoning’ being self-efficacy and seeing research as relevant and of value.

[맥락-기계 관계C-M relationship]에서, 세 가지 주요 특징은 지속적으로 긍정적인 결과로 이어졌다. 여기에는

  • 보호된 시간,
  • 양질의 슈퍼비전
  • 학술경험 수행을 어떻게 할지에 대한 자율성 정도.

Across the range of contexts-mechanism relationships, three key features consistently led to positive outcomes. These included

양질의 슈퍼비전에는 독립적인 작업을 지도하고 감독하며 진행 상황을 모니터링하고 품질 피드백을 제공하는 똑똑한 지도교수knowledgeable supervisors가 포함되어 있다. 학생들이 다른 학위로부터의 연구 경험을 가지고 있거나 프로젝트를 수행하기에 시간이 충분하지 않아 연구 기술을 얻지 못하는 부정적인 결과를 가져온 연구는 단 한 가지뿐이었다.9

Quality supervision included having knowledgeable supervisors who guided and oversaw independent work, monitored progress and provided quality feedback. Only one study resulted negative outcomes where students did not gain research skills due to having previous experience in research from another degree or inadequate time to undertake the project.9

초기 프로그램 이론을 바탕으로, 우리는 다음과 같은 수정된 프로그램 이론을 우리의 발견을 종합하여 제안한다(그림 2).
Building on our initial programme theory, we propose the following modified programme theory as a synthesis of our findings (Figure 2).

 

4 논의
4 DISCUSSION

이 연구는 의대생들의 학문적 경험이 다양한 결과를 낳는 이유, 방법, 상황에 대한 수정된 이론을 설명한다. 우리의 연구 결과는 학문적 경험이 연구별 기술, 연구 산출물 및 미래 연구 경력 관심사를 개발하는 수단으로 작용할 수 있다는 이전의 리뷰의 보고서와 일치한다. 이번 현실주의 검토는 [결과를 달성하기 위한 메커니즘]으로, 학생들이 [연구의 가치를 깨달아야 하며], [연구 자기효능감을 구축해야 할 필요성]을 강조하였고, 이는 학문적 경험이 효과적인 이유에 대한 [초기 프로그램 이론]에 추가되었다. 연구 문화를 조성하고, 학문적 경험을 중시하며, 학생들이 경험을 통해 어느 정도의 선택권을 행사할 수 있는 조직의 맥락에서 성과를 달성했다. 학문적 경험이 어떻게 작용하는지에 대한 이 수정된 이론은 의대생들을 위한 학문적 경험을 디자인하기를 원하는 사람들에게 중요한 학습을 제공한다.

This study describes a modified theory as to why, how and under which circumstances medical student scholarly experiences produce a range of different outcomes. Our finding are consistent with reports from earlier reviews1, 2, 18 that scholarly experiences can act as a means to develop research-specific skills, research outputs and future research career interests. This realist review adds to our initial programme theory of why scholarly experiences are effective by highlighting the need for students to see the value of research and build research self-efficacy as mechanisms for achieving outcomes. Outcomes were achieved in contexts of organisations that foster a research culture, that value the scholarly experience and where students were able to exert some choice over the experience. This revised theory of how scholarly experiences work provides important learnings for those wishing to design scholarly experiences for medical students.

이러한 학문적 경험의 목표 범위를 고려할 때, '올바른' 커리큘럼 모델은 없는 것이 분명하다. 다양한 규모와 역사를 가진 국제 의과대학에 걸친 이러한 문헌을 종합하면, 학술적 경험은 [시간을 들여야]하며, 동시에 [학문적 경험과 양질의 지도감독을 위한 적절한 지원]이 필요함을 시사한다. 학생들의 일과 통합 학습 경험의 리뷰에서도 [시간]이 학습 성공의 핵심 요소인 것으로 나타났다.42
Given the range of objectives of these scholarly experiences, it is clear there is no ‘right’ curriculum model. This synthesis of literature across international medical schools of varied size and history1, 2, 18 has shown that experiences must dedicate time together with adequate support for the scholarly experience and quality supervision. Time has also been shown to be a key factor in learning success in reviews of student work-integrated learning experiences.42

[양질의 지도감독quality supervision]이 연구 성공의 열쇠로 인정되지만, 우리의 연구 결과는 이전에 연구 감독에 대한 열쇠로 식별된 '문화화enculturation'와 '해방emancipation'의 역할을 강조한다.44 다른 맥락에서 양질의 지도감독자의 속성이 식별되었다.45 그러나, 성과를 더욱 향상시키기 위해서, 학문경험의 지도교수자들이 이 메커니즘을 어떻게 촉진할 수 있는가에 대한 추가 연구가 필요하다

While quality supervision is acknowledged as key to research success,43 our findings highlight the role of ‘enculturation’ and ‘emancipation’ previously identified as key to research supervision.44 The attributes of quality supervisors in other contexts have been identified.45 However, how supervisors of scholarly experience curricula can foster these mechanisms to further enhance outcomes warrants further exploration.

현재까지 이 분야의 많은 연구는 [연구 출판물]과 [학생 만족도]를 포함한 학문적 경험의 결과에 초점을 맞추고 있다. 실제로, 이 합성에 포함된 대부분의 학술적 경험은 출판물과 같은 [전통적인 연구 성과]에 초점을 맞췄다. 출판물은 보조금을 신청하고 국제적인 인정을 받기 위해, 그리고 대학들이 국제 대학 순위를 높이기 위해 필요로 하는 높은 가치의 산출물이며, 이는 결국 양질의 직원과 학생들을 끌어들인다. 그러나 의료진의 관점에서는 [비판적, 분석적, 그리고 학문적 기술을 전문직업적 실천professional skill으로 번역translate할 수 있는 졸업생]을 양성하는 것 또한 중요하다.

To date, much of the research in this area has focused on the outcomes of scholarly experiences including research publications and student satisfaction. Indeed, most of the scholarly experiences included in this synthesis focussed on traditional research outputs such as publications. Publications are highly valued outputs required by researchers applying for grants and to gain international recognition and by universities to increase their international university rankings, which in turn attracts high-quality staff and students. However, from a medical workforce perspective, it is also important to develop graduates who can translate critical, analytical and scholarly skills into professional practice.46 

전 세계적으로 [학문적 경험]을 포함하는 의과대학이 늘어나고 있고, 이는 의과대학생들이 의학 연구 환경에 노출될 기회를 제공한다. 이를 통해서 학생들의 연구 기술 능력과 자신감을 향상시키고, 연구에 대한 관심이 높아지며, 궁극적으로는 의사-과학자의 부족을 해결할 수 있는 잠재력을 가지고 있다. 다만, 이미 과밀화된 의과대학 커리큘럼에서 무엇을 우선순위에 둘 것인지를 놓고 긴장이 존재한다. 학문적 경험을 이수하는 것이 임상 술기 연습과 같은 다른 콘텐츠에 전념할 수 있는 능력을 축소시키기 때문이다. 개념-기반 커리큘럼은 나아가야 할 방법이 될 수 있다.47

The inclusion of scholarly experiences globally provides the opportunity for medical students to have exposure to the medical research environment, to increase students ability and confidence in research skills and interest in research, which in turn, has the potential to address the shortage of clinician-scientists.1, 2 Tensions exist for priorities in already overcrowded medical school curricula regarding completing a scholarly experience as it reduces the ability to devote to other content such as practicing clinical skills. A concept-based curriculum approach may be a way forward.47

이 합성에서 검토된 모든 학문적 경험 프로그램은 [연구research]에 초점을 맞췄다.

  • 두 개의 경험은 지역사회 건강 요구에 기반한 연구 관련 프로젝트였지만 여전히 연구에 초점을 맞추고 있었다.
  • 이러한 지역사회 기반 경험의 성과는 연구 기술과 컨퍼런스 프레젠테이션 또는 간행물 개발에 초점이 맞춰져 있었지만, 정책 및 관행의 변화와 같은 임상적으로 중요한 다른 결과도 도출할 수 있었다. 그러나 이들은 보고되지 않았다. 

All the scholarly experience programmes reviewed in this synthesis were focussed on research.

  • Two experiences1132 were research-related projects based on community health needs but still had a research focus. While the focus of outcomes of these community-based experiences was on developing research skills and conference presentations or publications, they could have also resulted in other clinically important outcomes such as changes to policy and practice; however, these were not reported.

많은 의료 전문분야에서, [지속적인 등록]은 의료인이 [자신의 의료행위 및 근무중인 시스템]의 [질 보증 및 질 개선 활동]을 수행하는 것에 달려 있다. 따라서 의료 훈련의 관점에서, 학생들을 [임상적 실천의 개선으로 이어지는 질 보증이나 질 개선 방법론에 대해 훈련]시키고, [교육 개선으로 이어지는 활동]을 다루는 [학술적 경험]은 전통적인 연구 결과만큼 높게 평가되어야 한다. 이러한 종류의 경험에 참여하는 것이 연구 경험이 미래 연구에 대한 참여 욕구를 증가시키는 것과 유사한 방식으로 질 향상/교육 활동에 참여하고 싶은 욕구를 증가시켰는지도 명확하지 않다. 우리는 학문적 경험에 대한 향후 평가가 그러한 활동의 결과에 대한 별도의 분석을 포함할 것을 권고한다. 우리의 리뷰에서 주목할 만한 또 다른 gap은, 학생들이 이러한 경험을 수행하는 과정에서 발생하는 [부정적인 결과] 및 [감독관, 의과대학, 보건의료서비스 관점에서의 성과 측정]이 부족하다는 점이었다. 의대생 학문적 경험이 [다른 이해관계자들에게 미치는 영향]과 [어떤 메커니즘이 부정적인 결과를 유발하는지]를 탐구하기 위해 추가 연구가 필요하다.

In many medical specialties, continuing registration is dependent upon the clinician undertaking quality assurance and improvement activities of their own practice and of the system within which they work.48 From a medical training perspective therefore, scholarly experiences that train students in quality assurance or improvement methodologies and lead to improvements in clinical practice, or activities that lead to educational improvements, should be valued just as highly as traditional research outputs. It was also not clear whether participation in those sorts of experiences created an increased desire to be involved in quality improvement/educational activities in a similar way that the research experiences increased the desire for engagement in future research. We recommend that future evaluations of scholarly experiences include a separate analysis of the outcomes from those activities. The other notable gap in the literature that would have been valuable in our review was a lack of negative outcomes and measurement of outcomes for supervisors, medical schools and the health services where the students are undertaking these experiences. Further research is needed to explore the impact of medical student scholarly experiences on these other stakeholders and what mechanism trigger negative outcomes.

이 연구의 강점은 체계적인 문헌 탐색입니다. 포함된 연구는 대부분 단면적이고, 편의성 샘플링을 사용하고, 결과를 자체 보고했으며, 맥락과 메커니즘에 대한 제한된 설명 깊이를 포함하고, 중간 범위 이론이 부족하여 잠재적으로 학문적 결과를 산출하기 위한 인과 경로에 대한 더 깊은 이해를 방해했다. 중간 범위 이론(예: 경험 학습 이론 또는 변혁 학습 이론)의 사용은 이러한 [초기 프로그램 이론]을 강화하고, 합성을 더욱 뒷받침했을 수 있다. 학문적 경험과 관련된 부정적인 결과에 대한 데이터가 제한적이거나 없는 연구에서 긍정적인 결과에 초점을 맞추는 것도 한계이다. 이 검토에서 개발된 프로그램 이론을 테스트하기 위해서는 [의대생 학문적 경험에 대한 현실주의적 평가]가 필요하다.
The strengths of this study include the systematic literature search. The included studies were mostly cross-sectional, used convenience sampling, self-reported outcomes, contained limited depth of description about the contexts and mechanisms, and lacked mid-range theory, potentially preventing a more in-depth understanding of the causal pathways to produce scholarly outcomes. The use of mid-range theory (for example, experiential learning theory or transformative learning theory) may have strengthened this initial programme theory and supported the synthesis further. The focus on positive outcomes in the studies, with limited or no data on negative outcomes associated with scholarly experiences, is also a limitation. A realist evaluation of medical student scholarly experiences is needed to test the programme theory developed in this review.

5 결론
5 CONCLUSIONS

의대생들을 위한 학문적 경험이 깊이 있는 지식과 연구능력을 키우고, 연구성과를 내고, 향후 연구진로에 대한 관심을 지원하는 수단으로 작용할 수 있다. 학생들이 경험을 중시하는 연구 문화를 가진 조직 내에서 경험에 참여할 자율성과 보호된 시간을 가질 때, 이러한 결과는 실현된다. 학생들이 연구를 관련성 있고 가치 있는 것으로 간주하고 학생의 자기 효능을 기르는 양질의 감독, 구조 및 지원에 대한 접근은 이러한 결과의 성취를 창출한다. 학문적 경험의 성과를 평가하는 향후 연구는 부정적인 성과긍정적인 성과에 대해 보고해야 하며, 비전통적인 연구 경험의 성과(예: 그것이 제공되는 품질 개선 경험)와 임상적 실천과 교육에 미치는 영향을 평가해야 한다. 감독관, 의과대학 및 보건 서비스 기관에 대한 성과도 평가되어야 합니다. 이것이 실현된다면, 학문적 경험에 의해 달성되는 결과에 대한 훨씬 더 전체적인 이해가 이루어질 것입니다.

Scholarly experiences for medical students can act as a means to develop in-depth knowledge and research skills, research outputs and support future research career interests. When students have autonomy and protected time to engage in the experience within an organisation with research culture that values the experience, these outcomes are realised. Access to quality supervision, structure and support where students see research as relevant and valuable and build student's self-efficacy generate achievement of these outcomes. Future research evaluating the outcomes of scholarly experiences should report on negative and positive outcomes, evaluate the outcomes from non-traditional research experiences (like quality improvement experiences, where they are offered) and the impact on clinical practice and education. The outcomes for supervisors, medical schools and health services should also be evaluated. If this is realised, a much more holistic understanding of the outcomes that are achieved by scholarly experiences will be achieved.

 


 

 

 

Med Educ. 2021 Feb;55(2):159-166.

 

 doi: 10.1111/medu.14362. Epub 2020 Sep 22.

 

A realist review of scholarly experiences in medical education

Affiliations collapse

Affiliations

1Monash Centre for Scholarship in Health Education, Faculty of Medicine, Nursing and Health Sciences, Monash University, Melbourne, VIC, Australia.

2The Ritchie Centre, Hudson Institute of Medical Research, Melbourne, VIC, Australia.

3Department of Obstetrics and Gynaecology, Faculty of Medicine, Nursing and Health Sciences, Monash University, Melbourne, VIC, Australia.

4School of Public Health and Preventive Medicine, Faculty of Medicine, Nursing and Health Sciences, Monash University, Melbourne, VIC, Australia.

5School of Rural Health, Faculty of Medicine, Nursing and Health Sciences, Monash University, Bendigo, VIC, Australia.

PMID: 32888210

DOI: 10.1111/medu.14362

Abstract

Context: Scholarly experiences have been increasingly employed to support the development of scholarly skills for medical students. How the characteristics of the various scholarly experiences contributes to scholarly outcomes or the complexities of how the experiences build skills warrants further exploration.

Objectives: To identify how medical students' scholarly experiences lead to scholarly outcomes under what circumstances.

Methods: A realist review was conducted with a search of Ovid MEDLINE, CINAHL, Scopus and ERIC databases using the terms "medical student" and "scholarly experience" and related synonyms. Studies involving the engagement of medical students in a range of compulsory scholarly experiences including quality improvement projects, literature reviews and research projects were included. Key data were extracted from studies, and realist analysis was used to identify how contexts and mechanisms led to different outcomes.

Results: From an initial 4590 titles, 28 studies of 22 scholarly experiences were identified. All were primarily focused on research-related scholarly experiences. Organisational research culture that valued research, dedicated time, autonomy and choice of experience were found to be key contexts. Adequately supported and structured experiences where students can see the value of research and quality supervision that builds student's self-efficacy were identified as mechanisms leading to outcomes. Outcomes included increased research skills and attitudes, scholarly outputs (eg publications) and future interest in research or other scholarly endeavours.

Conclusions: The design of scholarly experiences for medical students needs to ensure protected time, adequate supervision and autonomy, to achieve scholarly outcomes. Much of the focus is on research and traditional outcomes with little known about the role or outcomes associated with other scholarly work.

CBME에서 프로그램적 평가와 프로그램 평가의 관계 탐색(Med Teach, 2020)
Exploring the connections between programmatic assessment and program evaluation within competency-based medical education programs
Katherine A. Moreaua,b

 

프로그램적 평가와 프로그램 평가는 역량 기반 의료 교육(CBME) 프로그램에서 필수적인 개념이다. 

  • 프로그램적 평가는,
    • [평가에 대한 하나의 접근방식으로서, 훈련기간 전체에 걸쳐 학습자의 진행률과 역량을 평가하기 위한 정보의 지속적인 수집, 분석, 집계 및 삼각측량]을 포함한다.
    • 프로그램적 평가에서 측정의 대상은 [개별 학습자]입니다.
    • 여러 출처의, 다양한 평가 도구를 사용하는 것에 의존하여, 학습자의 성과와 개선 영역에 대해 학습자와 멘토에게 정보를 제공한다.
  • 반대로, 프로그램 평가
    • '프로그램에 대한 판단을 내리고, 프로그램 효율성을 개선하며, 미래 프로그래밍에 대한 결정을 알리기 위한 프로그램의 활동, 특성 및 결과에 대한 체계적인 정보 수집'이다(23 페이지).
    • 프로그램 평가에서 측정의 대상은 [프로그램 자체]이다.
    • 프로그램 평가는 올바르게 수행될 경우 필요한 프로그램의 유형, 프로그램의 구현, 프로그램 개선을 위한 영역 및 프로그램 결과의 달성(또는 부족)에 대한 중요한 정보를 제공한다(Cook 2010).

Programmatic assessment and program evaluation are essential concepts within competency-based medical education (CBME) programs.

  • Programmatic assessment,
    • an approach to assessment, involves the continuous collection, analyses, aggregation, and triangulation of information to assess a learner’s progress and competence throughout his/her training (Schuwirth et al. 2017; Schuwirth and Van der Vleuten 2019).
    • The object of measurement in programmatic assessment is the individual learner.
    • It relies on the use of various assessment tools, from multiple sources, to inform the learner and mentor(s) about the learner’s achievements and areas for improvement (Schuwirth and Van der Vleuten 2019).
  • Conversely, as Patton (1997) notes, program evaluation is ‘the systematic collection of information about the activities, characteristics, and outcomes of programs to make judgments about a program, improve program effectiveness, and/or inform decisions about future programming’ (p. 23). The object of measurement in program evaluation is the program itself. Program evaluation, when done correctly, provides vital information about the types of programs needed, the implementation of programs, areas for program improvement, and the attainment (or lack thereof) of program outcomes (Cook 2010).

프로그램 평가와 프로그램 평가를 구별하고 두 개념 사이의 연결을 강조하기 위해 더 많은 연구가 필요하다. 그러한 탐구는 CBME 프로그램 내에서 프로그램 평가와 프로그램 평가의 사용 및 편익을 극대화하는 데 도움이 될 것이다.

need further exploration in order to distinguish between programmatic assessment and program evaluation as well as highlight the connections between the two concepts. 

 

프로그램적 평가의 평가
Evaluating programmatic assessment

[프로그램적 평가]는 목표, 투입, 활동, 산출 및 성과가 있다는 점에서 (교육)프로그램과 유사하다. 따라서 확립된 프로그램 평가 모델 또는 접근방식을 사용하여 프로그램 평가를 평가할 수 있다(Gandomkar et al. 2015). 예를 들어, 연구자들은 새로운 커크패트릭 모델(Moreau 2017) 또는 기여 분석(Moreau and Eady 2015; Van Melle 등 2017)이 CBME 프로그램의 평가와 프로그램 평가의 확장에 효과적일 것임을 강조했다.

Programmatic assessment resembles a program in that it has objectives, inputs, activities, outputs, and outcomes. Therefore, it is feasible to evaluate programmatic assessment using established program evaluation models or approaches (Gandomkar et al. 2015). Researchers have highlighted, for example, that the New World Kirkpatrick Model (Moreau 2017) or contribution analysis (Moreau and Eady 2015; Van Melle et al. 2017) would work well for the evaluation of CBME programs and by extension for the evaluation of programmatic assessment.

  • [새로운 커크패트릭 모델]은 교육 프로그램과 관련하여 참가자의 반응, 학습행동뿐만 아니라 프로그램으로 인해 결과(즉, 특정 결과)가 발생하는 정도를 평가한다. 이 모델을 프로그램적 평가의 평가에 사용한다면, 예를 들어 다음을 평가하는 데 초점을 맞출 것입니다.
    • 학습자가 프로그래밍 평가가 유익하고 훈련에 적합하다고 생각하는 정도,
    • 프로그래밍 평가가 학습자의 지식, 기술 및 주어진 영역에 대한 자신감에 영향을 미치는 정도
    • 학습자가 훈련과정에서 프로그램적 평가에서 수집한 정보를 활용하는 정도
    • 프로그램적 평가가 학습자가 목표한 교육 성과를 달성하는 데 도움이 되는 정도.
  • The New World Kirkpatrick Model evaluates participants’ reactions, learning, and behaviours in relation to a training program as well as degree to which results (i.e. specific outcomes) occur because of a program (Kirkpatrick and Kirkpatrick 2016; Moreau 2017). When using it to evaluate programmatic assessment, the focus would be on evaluating, for instance,
    • the degree to which learners think the programmatic assessment is beneficial and relevant to their training,
    • the extent to which the programmatic assessment influences learners’ acquisition of knowledge, skills, and confidence in given areas,
    • the level to which learners use information collected in the programmatic assessment in their training, and
    • the degree to which the programmatic assessment helps learners achieve their targeted educational outcomes (Kirkpatrick and Kirkpatrick 2016).
  • 대안적으로, 이론 기반 평가 접근법인 [기여 분석]은, 프로그램을 특정 결과에 변화를 가져오기 위해 다른 변수와 함께 작동하는 [인과 패키지]의 일부로 본다.
    • 프로그램적 평가의 평가에 기여 분석을 사용한다면, [관찰된 학습자 성과에 대한 프로그램적 평가의 기여도를 평가]하는 데 초점을 맞출 것이다.
    • 이 접근법으로, 프로그램 평가가 학습자 성과의 변화를 가져오는 데 있어서, 다른 요인 및 CBME 프로그램(예: 멘토링 등)의 개입과 함께 작동하는 [인과적 패키지의 필수적인 부분임을 보여주는 증거 수집]에 중점을 둘 것이다(Mayne 2012; Moreau and Eady 2015).
  • Alternatively, contribution analysis, a theory-based evaluation approach, views programs as parts of causal packages that work together with other variables to bring about changes in specific outcomes (Mayne 2012; Moreau and Eady 2015).
    • When using contribution analysis, to evaluate programmatic assessment the focus would be on evaluating the contribution that the programmatic assessment has made to the observed learner outcomes.
    • With this approach, the emphasis would be on collecting evidence to show that the programmatic assessment is an essential part of a causal package that works together with other factors and interventions in the CBME program (e.g. mentorship, academic half days) to bring about changes in learner outcomes (Mayne 2012; Moreau and Eady 2015).

선택된 평가 모델 또는 접근방식이 프로그램 평가에서 제기되는 주요 질문에 영향을 미치겠지만, Schwirth와 Van der Vleuten(2019)은 프로그램 평가에서 질문된 평가 질문에 정보를 제공할 수 있는 프로그램 평가의 네 가지 원칙을 기술하는 것도 주목할 가치가 있다. 평가 이러한 원칙은 프로그래밍 방식의 평가가 다음을 포함해야 함을 시사한다.
While the selected evaluation model or approach will influence the major questions posed in the evaluation of programmatic assessment, it is worthwhile to also note that Schuwirth and Van der Vleuten (2019) describe four principles of programmatic assessment that, in turn, can inform the evaluation questions asked in the evaluation of programmatic assessment. These principles suggest that programmatic assessment should involve:

  • (1) 평가 정보의 삼각측량을 가능하게 하기 위한 복수의 평가 도구 사용
  • (2) 학습자의 종단적 평가
  • (3) 신뢰할 수 있는 정성 및 정량 평가 데이터를 생성하기 위한 다중 및 품질 평가 전략
  • (4) 학습자와 멘토가 사용할 수 있는 의미 있는 피드백(슈워스 및 반 데르 블뢰텐 2019).

 

  • (1) the use of multiple assessment instruments in order to enable the triangulation of assessment information;
  • (2) longitudinal assessments of a learner;
  • (3) multiple and quality assessment strategies in order to produce qualitative and quantitative assessment data that is credible; and
  • (4) meaningful feedback for a learner and his/her mentor(s) that they can use (Schuwirth and Van der Vleuten 2019).

 

이러한 원칙을 고려할 때, [프로그램적 평가의 평가]를 위한 질문은 다음을 포함할 수 있다.

  • (1) 프로그래밍식 평가는 여러 평가 도구를 어느 정도 사용하는가?
  • (2) 프로그래밍식 평가는 각 학습자에 대한 종방향 평가를 수집합니까?
  • (3) 프로그래밍 방식 평가는 신뢰할 수 있는 정성 및 정량 평가 데이터를 수집하고 사용하고 있는가? 그리고
  • (4) 프로그래밍 방식의 평가는 학습자와 멘토에게 어느 정도 의미 있고 유용한 피드백을 제공하는가?

Given these principles, relevant questions for the evaluation of programmatic assessment could include:

  • (1) To what extent does the programmatic assessment use multiple assessment instruments?
  • (2) Does the programmatic assessment collect longitudinal assessment for each learner?
  • (3) Does the programmatic assessment collect and use both credible qualitative and quantitative assessment data? and
  • (4) To what extent does the programmatic assessment generate meaningful and useful feedback for the learner and his/her mentor(s)?

 

CBME 프로그램 평가를 위한 프로그램적 평가 사용
Using programmatic assessment for the evaluation of CBME programs

프로그램적 평가에서, [각 학습자에 대한 개별 평가]는 [학습자의 훈련 필요성 또는 성취에 대한 결정]을 내리기 위해, [각 학습자의 진행 상황과 역량에 대한 전체적인 설명]을 제공하는 [포트폴리오 또는 문서집dossier]의 일부가 된다(Schuwirth, et al. 2017; Schuwirth 및 Van der Vleuten 2019). [학습자가 평가를 분석하고 응답할 수 있도록 도와주는 코치 또는 멘토의 관찰] 외에, [포트폴리오 또는 문서집] 역시 [교육자가 CBME 프로그램의 평가에 사용할 수 있는 공식 및 비공식 정보의 저장소]를 제공합니다. 
In programmatic assessment, individual assessments of each learner become part of, for example, a portfolio or dossier that provides educators with a holistic depiction of each learner’s progress and competencies in order to make decisions about his/her training needs or accomplishments (Schuwirth, et al. 2017; Schuwirth and Van der Vleuten 2019). These portfolios or dossiers, in addition to the observations of coaches or mentors who help the learner analyze and respond to the assessments, provide a repository of formal and informal information that educators can then use for the evaluation of CBME programs.

[프로그램적 평가를 통하여 여러 학습자에 대하여 수집된 정보의 모음]은 CBME 프로그램 내의 커리큘럼과 학습 환경의 품질에 대한 통찰력을 제공할 수 있다(Van der Vleuten et al. 2015). CBME 프로그램의 성공과 단점을 강조할 뿐만 아니라 교육 효과의 귀중한 지표가 될 수 있다(미국 교육 연구 협회 외 2014). 예를 들어, 프로그램 평가에서 수집된 정보가 

  • 대다수의 학습자가 특정 분야에 대한 지식, 기술 및 자신감을 습득하기 위해 고군분투하고 있다는 것을 보여준다면, CBME 프로그램 내의 교육자들은 변화가 필요한지 확인하기 위해 교육 및 평가 실습을 검토하기를 원할 수 있다.
  • 특정 학습자 그룹 간에 일관되게 관찰된 차이(예: 성별, 인종, 언어 능력 등)를 보인다면, CBME 프로그램은 이러한 차이를 최소화하기 위해 변경이 필요한지 확인하기 위해 다시 한번 교육 및 평가 관행을 검토하고자 할 것이다.

The aggregation of information collected in programmatic assessment across learners can provide insight on the quality of curricula and learning environments within CBME programs (Van der Vleuten et al. 2015). It can be a valuable indicator of educational effectiveness as well as highlight the successes and shortcomings of CBME programs (American Educational Research Association et al. 2014). For instance,

  • if the information collected in programmatic assessment illustrates that the majority of learners are struggling to acquire knowledge, skills, and confidence in a specific area, educators within a CBME program may want to examine their teaching and assessment practices to see if changes are needed.
  • Furthermore, if the information collected in programmatic assessment shows consistently observed differences among specific groups of learners (e.g. classified by gender, race, language proficiency) then a CBME program would again want to examine their teaching and assessment practices to see if changes are necessary to minimize such differences (American Educational Research Association et al. 2014).

 

CBME 프로그램을 평가할 때, 특히 프로그램 평가를 위한 자원이 제한된 경우, [오로지 프로그램 평가를 목적으로 새로운 정보나 데이터를 수집]하기보다는, 기존 프로그램 정보(즉, 일상적인 프로그램 운영에서 수집된 정보)의 사용을 극대화하는 것이 필수적이다. 대부분의 CBME 프로그램에서는 프로그램적 평가가 필수이고, 이 평가가 프로그램 내 학습자에 대한 다양한 정보를 포함하고 있다는 점을 고려할 때, CBME 프로그램 평가에서 이를 핵심 정보 출처로 활용하는 것은 논리적이며 재정적으로 책임있는 접근이다. 이 기존 정보를 활용하면 데이터 수집 피로감뿐만 아니라 프로그램 평가 부담을 최소화할 수 있다. 또한 평가 정보를 쉽게 이용할 수 있고 프로그램의 일상적인 운영에서 지속적으로 수집 및 업데이트되기 때문에 CBME 프로그램의 평가 능력을 향상시키고 프로그램 평가를 더 자주 수행할 수 있다. 그러나 프로그램에 대한 포괄적인 이해를 얻기 위해서는, CBME 프로그램을 평가할 때는 [프로그램적 평가에서 수집된 정보]를 [기존의 다른 출처의 정보와 결합]하는 것이 중요하다.
When evaluating CBME programs, especially those with limited resources for program evaluation, it is essential to maximize the use of existing program information (i.e., information collected in the day-to-day program operations) rather than collecting new information or data for the sole purpose of program evaluation. Given that programmatic assessment is a staple within most CBME programs, and that it includes a plentiful array of information on learners within a program, it is logical and financially responsible to use it as a key information source within the evaluation of CBME programs. The usage of this existing information can minimize the burden of program evaluation as well as data collection fatigue. It can also enhance the evaluation capacities of CBME programs and enable them to do program evaluations more frequently because the evaluation information is readily available and continuously collected and updated in the day-to-day operations of the programs. However, when evaluating CBME programs, it is important to combine the information collected in programmatic assessment with other existing sources of information in order to obtain a comprehensive understanding of the programs.

전체적으로 CBME 내에서 [프로그램적 평가]와 [프로그램 평가]는 중요한 역할을 하고 있으며, CBME가 의도한 대로 운영되고 있는지 확인하고 개선점을 판단하기 위해서는 [프로그램적 평가를 평가하는 것]이 중요합니다. 또한 프로그램적 평가에서 수집된 정보를 사용하는 것이 필수적인데, 그래야 CBME 프로그램에 대한 판단에 필요한 정보를 얻을 수 있으며, CBME 프로그램을 개선할 수 있고, CBME 프로그램의 향후 방향을 가이드할 수 있기 때문이다. [프로그램적 평가]와 [프로그램 평가]는 별개의 개념이며, 각각이 CBME 프로그램 내에서 특정 기능을 수행하지만, 적절히 도입된다면 서로를 보완하고 CBME 프로그램의 전반적인 효과에 기여할 수 있다.

Overall, programmatic assessment and program evaluation have important roles within CBME. It is important to evaluate programmatic assessment in order to ensure that it is operating as intended and to determine needed improvements in it. Moreover, it is imperative to use the information collected in programmatic assessment to inform judgments about CBME programs, improve CBME programs, and guide future directions for CBME programs. While programmatic assessment and program evaluation are distinct concepts and serve specific functions within CBME programs, they, when employed appropriately, can complement each other and contribute to the overall effectiveness of CBME programs.

 

 


Med Teach. 2021 Mar;43(3):250-252.

 doi: 10.1080/0142159X.2020.1841128. Epub 2020 Nov 2.

Exploring the connections between programmatic assessment and program evaluation within competency-based medical education programs

Affiliations collapse

Affiliations

1Faculty of Education, University of Ottawa, Ottawa, Canada.

2Centre for Research on Educational and Community Services, University of Ottawa, Ottawa, Canada.

PMID: 33136458

DOI: 10.1080/0142159X.2020.1841128

Abstract

Programmatic assessment and program evaluation are both important within competency-based medical education (CBME) programs. Given this importance, there is value in evaluating programmatic assessment as well as using the information collected in programmatic assessment for the evaluation of CBME programs. In order to help facilitate these two activities, this paper distinguishes between programmatic assessment and program evaluation as well as highlights the connections between them. In doing so, it shows that programmatic assessment and program evaluation, when employed appropriately, can complement each other and contribute to the overall effectiveness of CBME programs.

Keywords: medicine; Assessment; evaluation.

+ Recent posts