간접 환자돌봄의 교육적 가치 최적화하기 (Med Educ, 2022)
Optimising the educational value of indirect patient care
Danielle O'Toole1 | Marina Sadik1 | Gabrielle Inglis1 | Justin Weresch1 | Meredith Vanstone1,2

 

1 소개
1 INTRODUCTION

환자 치료의 활동은 환자와 직접 상호작용하는 시간에 국한되지 않는다. 일반적인 의사는 50% 이상의 시간을 간접 환자 치료 활동(IPCA) 또는 대면상호작용이 필요하지 않은 치료 작업에 소비합니다. IPCA는 비동기 업무, 사무실 외부 방문 및 데스크톱 의료라고도 할 수 있다. 표 1은 전자건강기록(EHR)의 '수신함' 관리 등 IPCA의 여러 가지 범주의 예를 제공한다. 여기에는 영상 및 실험실 결과 검토 및 관리, 상담 노트, 양식 작성 및 처방된 의약품의 보충이 포함된다.
The activities of patient care are not confined to time spent directly interacting with a patient. A typical physician spends more than 50% of their time on indirect patient care activities (IPCA), or care tasks that do not require a face-to-face interaction.1-3 IPCA may also be called asynchronous tasks, activities outside of office visits and desktop medicine.4-7 Table 1 provides examples of several different categories of IPCAs, such as managing the ‘inbox’ of the electronic health record (EHR), which includes reviewing and managing imaging and laboratory results, consult notes, completing forms and refilling prescribed medications.


EHR의 채택과 관련하여 IPCA에 들어가는 시간도 증가했다. EHR은 의료 전, 치료 중 및 치료 후 의료 정보에 대한 신속한 액세스를 제공하기 때문에 2008년과 2012년 사이에 임상 실습에 널리 채택되었다. EHR의 잠재적 이점에도 불구하고, 기술의 통합은 과제를 가져왔다. 

  • 환자-의사 상호 작용의 변화,
  • 치료의 의미 있는 측면에서의 주의 산만,
  • 의료진에게 사무 업무를 재배포하고 새로운 업무를 창출(예: 의약품 조정, 데이터 입력 및 전자 처방).

일부 활동 유형의 작업량을 줄였습니다. (예: 처방 및 일부 실험실 관련 작업) 
어떤 활동의 작업량은 늘어났다. (예: 예방 관리 작업 및 다른 받은 편지함 항목 검토)

이에 따라, EHR은 의료 행위를 재구성하여 IPCA에 소요되는 시간을 전반적으로 증가시켰다.
The time requirements of IPCAs have increased in relation to the adoption of EHRs.1, 8-11 The EHR was widely adopted into clinical practice between 2008 and 2012,7 because it provides rapid access to medical information before, during and after care with aims of improving quality care and safety.12-14 Despite the potential benefits of the EHR, the integration of technology has brought about challenges, including

  • altering patient–physician interaction,
  • distracting from meaningful aspects of care,
  • redistributing clerical tasks to the clinician and creating new tasks (e.g. medication reconciliation, data entry and electronic prescribing).41215-18 

It has reduced the workload of some types of activities (e.g. prescribing and some lab-related tasks), while increasing others (e.g. preventative care tasks and reviewing other inbox items).3, 7, 19, 20 Accordingly, this technology has re-shaped medical practice, resulting in an overall increase in the time spent on IPCAs.1, 8-11

IPCA는 많은 전문분야와 관련이 있다. 예를 들어, 심장내과, 내과, 정형외과 전문의들도 마찬가지로 시간의 50%를 간접적인 환자 활동에 사용한다. 정신과, 집중치료, 응급의학에서도 같은 경향이 보고되고 있다. 이러한 결과는 호주, 독일 및 영국을 포함하여 EHR 사용이 일반적인 고소득 국가에서 일관된다. IPCA는 특히 가정의에게 부담이 될 수 있다. 가정의학과 의사는 환자의 '메디컬 홈'인 만큼 다른 의사가 지시한 조사와 치료를 검토하고 관리하는 경우가 많아 자주 호출된다. 일반 가정의의의 경우, EHR의 출현은 환자와 함께 보내는 매 시간마다 컴퓨터에서 1~2시간씩, 진료 시간 외(오전 8시~오후 6시)에 소요되는 평균 1.5시간의 추가 EHR 시간을 의미했다.
IPCAs are relevant to many specialties. For example, cardiology, internal medicine and orthopaedic specialists similarly spend 50% of their time on indirect patient activities.3 The same trend has been reported in psychiatry,21 intensive care22 and emergency medicine.23, 24 These findings are consistent across high income countries where EHR use is common, including Australia,25 Germany26 and the United Kingdom.23 IPCAs may be especially taxing for family physicians. As the patient's ‘medical home’, family physicians who are often called to review and sometimes manage the investigations and treatments ordered by other physicians. For the average family physician, the advent of EHRs has meant 1–2 hours on the computer for every hour spent with patients, and an average of 1.5 hours of additional EHR time spent outside of clinic hours (8 AM–6 PM).4, 27

IPCA의 증가하는 부담은 의사의 일과 삶의 균형이라는 지속적인 도전을 악화시켜 직무 만족에 영향을 미치고 번아웃을 증가시킨다. 의학 교육자들은 학습자들이 그들의 경력 전반에 걸쳐 지속 가능한 방식으로 IPCA를 처리할 수 있도록 준비해야 하는 해당 과제에 직면해 있다. 학습자가 이러한 작업을 관리하는 방법을 배우는 것의 중요성을 인식하지 못할 수 있다는 증거가 있으며, 한 연구에서 전공의는 임상 문서 요구 사항이 과도하며, 그로 인해 환자 치료에 직접 참여할 수 있는 시간을 단축하고 더 가치 있다고 인식되는 교육 활동에 참여할 수 있는 기회가 줄었다고 보고했다. [직무 만족도와 일과 삶의 균형을 모두 유지하면서, 고품질의 환자 치료의 균형을 유지하는 방식으로 IPCA를 관리하는 방법]을 배우는 것이 중요함에도 불구하고, 이 분야의 교육자들을 지도하기 위한 교육 연구는 거의 수행되지 않았다. 훈련에서 이러한 IPCA의 영향과 이 중요한 교육을 가장 잘 제공하는 방법을 이해하는 것은 주민들이 이 중요한 역량을 획득하도록 돕는 중요한 부분이다.
The growing burden of IPCAs exacerbates the perennial challenge of work-life balance for physicians, affecting job satisfaction, and increasing burnout.28-35 Medical educators face the corresponding task of preparing learners to handle IPCAs in a sustainable way throughout their career. There is evidence that learners may not appreciate the importance of learning how to manage these tasks, with residents in one study reporting that clinical documentation requirements are excessive, compromising time to participate in direct patient care and decreasing opportunities to participate in educational activities perceived as more valuable.36 Despite the importance of learning how to manage IPCAs in a manner that balances high quality patient care while maintaining both job satisfaction and a work–life balance, little educational research has been conducted to guide educators in this area. Understanding the impact of these IPCAs in training and how best to deliver this vital education is an important part of helping residents obtain this critical competency.

교육 프로그램이 IPCA의 교수와 위임을 어떻게 최적화할 수 있는지 더 잘 이해하기 위해, 우리는 가정의학과에 위치한 질적 연구를 수행하여 미래의 실습을 위해 가족 의사를 적절하게 준비시켰다. '가족의학 거주자, 최근 졸업생 및 임상 감독관은 [간접 환자 치료 활동의 교육적 영향과 중요성]을 [어떻게 인식]하고 있는가?'
To better understand how education programmes may optimise the teaching and entrustment of IPCAs, we conducted a qualitative study located in the discipline of Family Medicine to adequately prepare family physicians for future practice, asking ‘How do family medicine residents, recent graduates and clinical supervisors perceive the educational impact and importance of indirect patient care activities’?

2 방법
2 METHODS

2.1 설계 연구
2.1 Study design

이것은 임상 교육 요구 사항 탐색과 같은 사회적 과정 연구에 적합한 방법론인 [구성주의 근거이론 연구]입니다. 이 방법론의 구성주의적 기반은 [학습자가 자신의 일의 맥락을 이해할 수 있는 다양한 방법을 강조]하며, 다음과 같은 힘에 의해 형성된다

  • 교육 정책(예: 인증 요건 및 시험),
  • 직업 및 작업 환경의 암묵적이고 명시적인 규범,
  • 가정의가 된다는 것은 무엇을 의미하며, 가정의가 어떤 유형의 일을 해야하는지에 대한 사회적 기대

근거 이론이 요구하는 데이터 수집과 분석 사이의 반복을 통해 우리는 한 그룹의 예비 통찰력을 바탕으로 다음 라운드에서 데이터 수집을 구축하고 형성하여 우리의 조사에 응답하고 심화시킬 수 있었다.

This is a constructivist grounded theory study,37 a methodology appropriate for the study of a social process such as navigating a clinical education requirement. The constructivist underpinnings of this methodology highlighted the different ways that learners may understand the context of their work, shaped by forces such as

  • education policy (e.g. accreditation requirements and exams);
  • implicit and explicit norms of the profession and work environment;
  • social expectations about what it means to be a family physician and what kind of work family physicians should do.

The iteration between data collection and analysis required by grounded theory allowed us to build on preliminary insights from one group, building and shaping data collection in the next round to respond to and deepen our inquiry.

2.2 연구 상황
2.2 Study context

이 연구는 캐나다 도시에 위치한 단일 가정의학 레지던트 프로그램의 맥락에서 수행되었다. 의료 거주자는 가정의학과 의사가 되기 위해 2년간의 일반 전문의 교육 프로그램을 이수하며, 일부에서는 3년차 고급 기술 교육을 선택적으로 받을 수 있습니다. 이 대규모 레지던트 프로그램은 의학-박사 대학과 연계되어 있으며, 매년 3개의 훈련장에서 200명의 레지던트들을 수용한다. 2개의 교육장은 학계 가정의학 실습과 연계되어 있으며, 1곳은 지역사회에 기반을 둔 여러 가정의학 실습이 있다.

  • Academic practices는 의료 전문가의 교육과 가르침이 교수진의 역할의 큰 부분을 차지하는 의과대학과 관련된 것이다. 이러한 practice에서, 교수진 의사는 일반적으로 매일 2~3명의 학습자를 감독한다.
  • 지역 사회 practice는 지역 사회 내의 일반적인 가정의학 관행이며 의사는 일반적으로 한 번에 한 명의 학습자를 감독한다.

This study was conducted in the context of a single Family Medicine residency programme located in urban Canada. Medical residents complete a 2-year generalist training programme to become Family Physicians, with an optional third year of enhanced skill training available to some. This large residency programme is affiliated with a medical-doctoral university, admitting 200 residents each year across three training sites. Two training sites are affiliated with academic family medicine practices, and one with multiple community-based family medicine practices.

  • Academic practices are those associated with a medical school, where education and teaching of health care professionals are a large part of the role of faculty physicians. In these practices, faculty physicians typically supervise two to three learners each day.
  • Community practices are general family medicine practices within the community and physicians typically supervise one learner at a time.

2.3 이론 렌즈
2.3 Theoretical lens

본 연구에서는 [Billett의 직장 학습 이론]민감 개념으로 사용하였다. [민감 개념]은 연구 중인 현상에 대한 연구자들의 생각에 INFORM하는 배경 아이디어입니다. 직장 학습 이론은 연구를 시작할 때 선임 연구원(MV)에게 알려졌고, 이는 작업의 개념화와 설계 방식에 영향을 미쳤다. 이 이론은 [작업장이 교육 기회를 제공]하는데, 이 [교육기회는 학습자가 효과적으로 학습하기 위해 확인하고 참여하도록 선택해야 하는 것]이라는 우리의 가정을 형성했다. [학습 기회의 식별]은 교육 및 조직 구조의 지도와 직장에 존재하는 다른 사람들의 입력에 의해 형성된다.

  • 이 이론적 렌즈는 IPCA를 학습자와 그들의 임상 교사들에게 [인식될 수도 있고 그렇지 않을 수도 있는 교육적 어포던스]로 생각하는 우리의 생각에 영향을 미쳤다.
  • [인터뷰 가이드의 구축과 개선 과정]에서, 이 이론은 학습자가 학습 기회에 대해 인식하고 결정하는 방법, 그리고 직장에서 어떤 선호도가 식별을 장려하거나 바람직한 특정 학습 기회를 만드는지에 대해 조사하기로 한 우리의 결정에 영향을 미쳤다.
  • 우리는 분석 중에 이 이론이 직장 학습에 대해 제공한 배경 문맥을 넘어 이 이론에 명시적으로 관여하지 않았다.

We used Billett's workplace learning theory as a sensitising concept in this work.38 Sensitising concepts are background ideas, which inform the researchers' thinking about the phenomenon under study.39 Workplace learning theory was known to the senior researcher (MV) at the onset of the study, influencing the way the work was conceptualised and designed. This theory shaped our assumptions that workplaces offer educational opportunities that learners must both identify and choose to engage with to learn effectively.38 The identification of learning opportunities is formed by the guidance of educational and organisational structures and the input of others present in the workplace.38 

  • This theoretical lens influenced our thinking of IPCA as an educational affordance that may or may not be recognised by learners and their clinical teachers.
  • During the construction and refinement of the interview guide, this theory influenced our decision to probe about the way that learners recognise and make decisions about learning opportunities, and what affordances in the workplace encourage the identification or make desirable particular learning opportunities.
  • We did not engage explicitly with this theory during analysis, beyond the background context it provided about workplace learning.

2.4 참가자
2.4 Participants

직장 학습의 맥락적 특성으로 인해 본 연구는 단일 가정의학 레지던트 프로그램을 중심으로 진행되었으며, 현재 학습자, 현 교육자 및 지난 5년 이내에 졸업한 동문들을 모집합니다. 대상자는 현재 가정의학과 전공의('거주자')와 이 프로그램에서 지도자 역할을 하는 임상의-교육자('교육자') 및 지난 5년 이내에 이 프로그램을 졸업한 가정의사('초기 직업의사')이다.
Due to the contextual nature of workplace learning, we conducted this study around a single family medicine residency programme, recruiting current learners, current educators and alumni who have graduated within the past 5 years. Eligible participants were

  • current family medicine residents (‘residents’),
  • clinician-educators who have a preceptor role within this programme (‘educators’), and
  • family physicians who graduated from this programme within the past 5 years (‘early career physicians’).

2.5 샘플링 및 모집
2.5 Sampling and recruitment

우리는 세 참가자 그룹 각각에 대해 서로 다른 샘플링 전략을 사용했다. 프로그램 사무소에서 발송된 이메일, 프로그램 리드 전공의, 임상 공간의 포스터, 공동 저자 팀의 그룹 학습 세션 시작 시 이루어진 연구에 대한 발표를 통해 전공의를 모집했다. 잠재적 거주 참가자는 연구 보조자나 선임 저자(MV)에게 연락하도록 요청하여 그들의 신원이 의사 공동 저자에게 알려지지 않도록 했다. 처음 5년간 의사는 프로그램 동문들을 위한 온라인 페이스북 그룹들과 연구팀의 전문 네트워크를 통해 이메일을 통해 모집되었다. 교육자들은 연구팀이 보낸 이메일을 통해 모집되었다. 
We used different sampling strategies for each of the three participant groups. Residents were recruited through e-mails sent from the programme office and lead residents of the programme, posters in clinical spaces and announcements about the study made at the beginning of group learning sessions by the co-author team. Potential resident participants were asked to contact the study research assistant or senior author (MV) so their identities were not known to physician co-authors, who may have held a position of authority over them. Physicians in the first 5 years were recruited through online Facebook groups for programme alumni and by e-mail through the professional networks of the research team. Educators were recruited through e-mails sent by the research team.

우리는 [편의 샘플]로 시작했고, 예비 데이터 수집을 이론적으로 관련된 초기 데이터 분석에서 식별되어감에 따라서 참여자 임상 경험(위치, 임상 실습 및 기간)의 다양성을 보장하기 위해 [목적적이고 이론적으로 정보에 입각한 접근 방식]으로 이동했다. 
We started with a convenience sample and after preliminary data collection moved to a purposeful, theoretically informed approach to ensure diversity in participant clinical experience (location, clinical practice and duration), as these aspects were identified in initial data analysis as theoretically relevant.

이것은 [근거 이론 연구]였기 때문에, 우리는 데이터 충분성에 대한 판단을 안내하기 위해 [이론적 포화] 개념을 사용했다. 우리는 [이론에 기여하는 범주의 완전성]과 [이론적으로 지시된 유형의 샘플링 완료]와 관련해서 [이론적 포화]를 이해한다. 포화 식별은 데이터 분석 전반에 걸쳐 발생하는 프로세스로, 여러 분석가와의 논의를 통해 운영됩니다. 각 범주가 잘 개념화되어 있고, 식별된 이론이 모든 관련 데이터를 설명할 수 있다는 것을 확인한 후, 분석 그룹은 [전반적으로 보면, 이론에 아무것도 추가되지 않을 것]이기 때문에 [새로운 데이터 수집의 return이 감소한다]는 데 동의했다. 이 시점에서 우리는 코호트 및 수련 장소와 관련해서 [이론적으로 관련된 일부 관점]이 샘플에 강하게 존재하지 않는다는 점에 주목했다. 이러한 관점을 포함하기 위해 추가 자료를 찾았지만, 참여자의 다양성을 확대하기 위해 완료된 새로운 인터뷰는 새로운 분석 방향을 제시하지 못했다. 
As this was a grounded theory study, we used the concept of theoretical saturation to guide our judgements of data sufficiency.37, 40 We understand theoretical saturation to relate to the completeness of categories that contribute to a theory, and the completion of theoretically-indicated types of sampling. The identification of saturation is a process occurring throughout data analysis, operationalised through discussion with multiple analysts. After identifying that each category was well conceptualised, and the identified theory could account for all relevant data, the analytic group agreed that new data collection had diminishing returns, as it would not necessarily add anything to the overall theory.40 At this point we noted that some theoretically-relevant perspectives, related to cohort and training site, were not strongly present in the sample. We sought additional data to include these perspectives, but new interviews completed to expand the diversity of participants did not suggest new analytic directions.

2.6 데이터 수집
2.6 Data collection

데이터는 포커스 그룹과 개별 인터뷰를 통해 수집되었다. 포커스 그룹은 경력 단계별로 동질적이었다. 인터뷰와 포커스 그룹은 MV, MS, 그리고 연구 조수에 의해 촉진되었다. 이 개인들은 모두 질적 연구에 대해 훈련된 비-의사이며, 참가자들에게 알려지지 않은 여성들이다. 개별 인터뷰는 스케줄링이 참가자의 포커스 그룹 가입을 허용하지 않거나 참가자가 인터뷰에 대한 선호도를 표시한 경우에 수행되었다. 각 참가자 그룹에 대해 별도의 인터뷰 가이드(보충자료로 포함)를 개발하고 데이터 수집이 진행됨에 따라 다듬었다. 인터뷰 가이드는 문헌, 가정의학과 교사 및 학습자로서의 실제 경험, 연구 중인 문제에 대해 레지던시 프로그램에 제출한 피드백을 바탕으로 다학제 팀에 의해 개발되었습니다. 예비 포커스 그룹의 통찰력을 사용하여 미래 참가자의 모집 및 데이터 수집을 구체화하면서 한 번에 한 참가자 그룹에 초점을 맞추기 위해 데이터 수집을 단계화했다. 인터뷰 가이드는 초기 분석 통찰력을 반영하고, 이론적으로 관련된 문제에 대해 프로빙하고, 조사 범위를 세분화하기 위해 수정되었다. 전공의들은 우리의 처음이자 마지막 그룹이었기 때문에 우리는 프로젝트 진행 중에 발전한 새로운 분석 통찰력을 확인할 수 있었다.
Data were collected via focus groups and individual interviews. Focus groups were homogeneous by career stage. The interviews and focus groups were facilitated by MV, MS and a research assistant. These individuals are all women trained in qualitative research, non-physicians and unknown to the participants. Interviews were conducted when scheduling did not permit participants to join a focus group, or where the participant indicated a preference for an interview. Separate interview guides (included as supplementary material) were developed for each participant group and refined as data collection progressed. Interview guides were developed by our multi-disciplinary team based on literature, practical experience as family medicine teachers and learners, and feedback submitted to the residency programme about the issue under study. We staged our data collection to focus on one participant group at a time, using insight from preliminary focus groups to shape recruitment and data collection of future participants. Interview guides were amended to reflect initial analytic insights, to probe about theoretically relevant issues, and to refine the scope of inquiry. Residents were our first and our last group, so we could affirm emerging analytic insights that developed over the course of the project.

2.7 데이터 분석
2.7 Data analysis

데이터 분석은 구성주의 근거 이론을 상징하는 단계적 프로세스로 진행되었습니다. 이는 초기 데이터가 수집되는 즉시 시작하여 예비 통찰력을 향후 데이터 수집에 inform하는 것이다. 여러 분석가개방형 귀납적 코딩에 참여하여 팀 전체와 만나 잠재적인 집중 코딩에 대한 아이디어를 논의했습니다. 이 미팅을 통해 식별된 범주는 추가 코딩 라운드에서 운영되었으며, 이를 통해 우리는 집중적인 코딩 스키마를 생성하도록 조정, 확장 및 정교해졌다. 이 코딩 스키마의 적용은 연역적(귀납적 코딩을 통해 개발된 스키마를 적용)귀납적(확장, 정제, 정교화) 사이에서 다양한 코딩 과정을 통해 이루어졌다. [귀납적]에서 [연역 – 귀납적]으로의 이러한 움직임은, 우리의 분석이 데이터에 기반을 두도록 보장했다. 이러한 과정을 통해 테마를 귀납적으로 파악하였다. 우리는 연구 질문에 직접적으로 반응하는 주제를 개발하여 [교사 및 학습자의 경험을 설명]하는 것과 관련된 주제와 [가정의학의 교수 및 학습 개선을 위한 제안] 사이의 균형을 이루기 위해 노력했다. 
Data analysis proceeded in a staged process emblematic of constructivist grounded theory, beginning as soon as initial data were collected so preliminary insights informed future data collection. Multiple analysts engaged in open inductive coding, meeting with the whole team to discuss ideas for potential focused coding. The categories identified through this meeting were operationalised in an additional round of coding, through which we refined, expanded and elaborated to produce a focused coding schema. Application of this coding schema was accomplished through multiple rounds of coding that varied between deductive (applying the schema developed through inductive coding) to inductive (expanding, refining and elaborating schema). This movement from inductive to deductive–inductive ensured that our analysis remained grounded in the data. Through this process, themes were inductively identified. We developed themes, which were directly responsive to the research question, striving to achieve a balance between those relevant to describing the experiences of teachers and learners and those relevant to suggestions for improving teaching and learning in family medicine.

2.8 윤리
2.8 Ethics

이 연구는 해밀턴 통합연구윤리위원회(11547)의 승인을 받았으며, 모든 참여자는 각 데이터 수집 세션 시작 시 전자적으로 그리고 구두로 사전 동의를 제공하였다. 우리는 연구팀의 의사 교육자와 거주자 참여자 사이의 권력 불균형을 잠재적 윤리적 문제로 식별했다. 상주 참가자를 보호하기 위해, 우리는 의사 연구 팀원들이 원본 오디오 파일이나 확인된 녹취록을 포함하여 상주 참가자를 식별할 수 있는 정보에 접근하지 못하도록 보장했다.
This study was approved by the Hamilton Integrated Research Ethics Board (11547), and all participants provided informed consent electronically and again verbally at the beginning of each data collection session. We identified the power imbalance between the physician educators on the research team and the resident participants as a potential ethical issue. To protect resident participants, we ensured that physician research team members did not have access to any information which would identify resident participants, including original audio files or identified transcripts.

3 결과
3 RESULTS

우리는 19명의 거주자(R), 16명의 의사(P), 7명의 경험 있는 의사 교육자(E)로부터 인터뷰 및 포커스 그룹 데이터를 수집했다. 각 포커스 그룹에 3~6명의 참가자가 참여한 가운데 6개의 개별 인터뷰와 11개의 포커스 그룹을 실시하였다. 가정의학 실천 유형의 광범위한 다양성으로 인해, 우리는 표 2-4에 practice 유형을 학문적, 공동체적, 비전통적인 것으로 요약했다. '비전통적 행위'은 예를 들어 병원 의사, 입원 환자 정신 건강 기관, 사망 의료 지원, 완화 치료 및 교도소 보건/교정 시설과 같은 집중적인(제너럴리스트가 아닌) 행위을 의미한다. 참여자 인구통계 정보는 표 2-4에서 확인할 수 있다.
We collected interview and focus group data from 19 residents (R), 16 physicians in the first 5 years of practice (P) and 7 experienced physician educators (E). We conducted 6 individual interviews and 11 focus groups with three to six participants in each focus group. Due to the broad variability of family medicine practice types, we have summarised practice types in Tables 2–4 as academic, community and non-traditional. ‘Non-traditional practices’ refer to focused (rather than generalist) practices, for, for example, hospitalist, in-patient mental health unit, Medical Assistance in Dying, Palliative care and prison health/correctional facilities. Participant demographic information can be found in Tables 2–4.

우리는 먼저 모든 그룹의 참가자들이 [IPCA가 가정의사로서의 경력 기간 동안 반드시 지녀야 하는 무게로 작용한다]는 분석 결과에 대해 논의한다. 다음으로, 우리는 그들의 경력 초기에 그 무게를 부담으로 보았고, 더 많은 경험 있는 그룹들이 그 무게는 가정의학에서 지속 가능한 경력을 쌓는 데 필요한 힘을 기를 수 있는 기회라고 어떻게 이해했는지 설명한다. IPCA 작업을 부담 또는 강도 훈련으로 느끼게 하는 이유에 대한 이러한 논의에서 참가자들은 몇 가지 악화 및 완화 요인(모호한 기대, 작업량 불평등에 대한 인식, 환자 및 작업에 대한 교수 및 친숙함)을 식별했으며, 이는 차례로 논의된다. 우리는 표준화, 점진적 도입, 작업량에 대한 투명성, 명시적 교육 및 피드백과 경계 설정 등 IPCA의 교육 가치를 최적화하는 방법에 대한 거주 프로그램에 대한 참가자 권고를 설명함으로써 이 섹션을 마무리한다.

We first discuss the analytic finding that participants in all groups identified IPCA work as a weight they must carry for the duration of their career as family physicians. Next, we describe how those earlier in their career viewed that weight as a burden, and more experienced groups understood that weight to be a chance to develop the strength needed for a sustainable career in family medicine. In these discussions of what made IPCA work feel more like a burden or strength training, participants identified several exacerbating and alleviating factors (ambiguous expectations, perceptions of workload inequity, teaching and familiarity with patients and tasks), which are discussed in turn. We conclude this section by describing participant recommendations to residency programmes about how to optimise the educational value of IPCAs: standardisation, gradual introduction, transparency about workload, explicit teaching and feedback and boundary setting.

3.1 IPCA의 무게: 부담 또는 근력 훈련?
3.1 The weight of IPCAs: Burden or strength training?

모든 참가자들은 그들의 실천 단계에 관계없이 IPCA가 가정의학의 필요하지만 불쾌한 부분이라는 인식을 공유했다. 그들은 IPCA가 환자 치료를 위해 필요하다는 것을 인식했지만, 끝이 없어 보이는 서류작업의 '과중한 책임'(P6)도 설명했다. 참가자 그룹이 분화된 곳은 이 무게를 짊어지는 것의 성격과 영향을 [부담]으로 보았는지, 그들의 경력 동안 [이 무게를 짊어지는 데 필요한 힘이나 힘을 기를 수 있는 기회]로 보았는지에 대한 것이다.
All participants, no matter their stage of practice, shared the perception that IPCAs are a necessary but unpleasant part of family medicine. They recognised that IPCAs are required for patient care, but also described the ‘crushing responsibility’ (P6) of the seemingly never-ending stream of paperwork. Where participant groups diverged was how they framed the nature and impact of carrying this weight, as either a burden or an opportunity to develop the strength needed to carry this weight throughout their career.

[전공의들과 초기 직업 의사들]은 IPCA의 중요성을 교육 기회보다는 부담으로 강조했다. '그것은 나에게 어떤 교육적 가치보다 훨씬 더 많은 스트레스를 주었다.' (R12) 그들은 이러한 활동에 소비하는 시간이 학습, 일과 삶의 균형, 웰빙, 그리고 다른 교육 목표를 달성하는 능력을 저해하는 방법을 기술했다. '나는 확실히 그것이 압도적이라고 느낀다. 나는 그것이 지속가능하다고 느끼지 않는다'(P7). 그들이 이 무게를 견디기 위해 개발한 전략에는 늦게까지 머무르거나 휴가 기간을 사용하여 이러한 작업을 수행하는 것이 포함되어 있었다. '휴가시간을 이용해 매주 하루씩 전일제 가정의학과를 쉬었습니다'(R9)
Residents and early career physicians emphasised the weight of IPCAs as a burden rather than an educational opportunity: ‘it provided me way more stress than any educational value’ (R12) They described the ways that time spent on these activities impeded their learning, work–life balance and wellness, and ability to achieve other educational goals: ‘I definitely feel like it's overwhelming. I don't feel like it's sustainable’ (P7). The strategies they developed to carry this weight included staying late or using vacation time to accomplish these work tasks: ‘I've used my vacation time to take one day off every week of full-time family medicine’ (R9).

[독립의료를 하는 참가자]들은 IPCA의 무게에 대해 전공의들과 다르게 말했다. 그들은 이러한 업무가 환자 치료와 가족 의사의 업무 일부를 위해 필요하다는 것을 더 잘 인식했다. '당신이 이 양식을 완성할 때 당신은 당신의 환자에게 자금이나 자원 같은 것에 대한 접근권을 주는 것이고, 당신은 당신이 그들과 마주 앉아 있을 때보다 모든 면에서 혹은 그 이상으로 당신의 환자를 돕고 있는 것이다.'(E4)
Participants who were in independent practice spoke differently about the weight of IPCAs than residents. They were more apt to recognise that these tasks are necessary for patient care and part of the work of a family physician: ‘when you complete this form you are giving your patient access to funding or resources or whatever, you're helping your patient every bit as much or maybe more than when you're sitting face-to-face with them’ (E4).

[의사 경력 첫 5년 동안 의사]들은 레지던트 시절 IPCA 작업의 이점을 현재 진료에 반영했습니다. 'ODSP [Ontario Disability Support Program] 양식에는 분명히 재간finesse이 있습니다. 바보같이 들리지만, 그것들을 작성하면서 전공의로서 배우는 art가 있습니다. … 레지던트로서 그런 걸 알아내서 엉덩이를 박살내면서 시간을 보내서 다행이다, 그래, 스태프가 되면서 부담이 줄었다(P5).' 이 학습의 일부는 IPCA의 업무 스타일 변경을 포함하여, IPCA의 부담을 다루기 위한 전략을 개발하는 것이었다. 
Physicians in the first 5 years of their career recognised the benefits of the IPCA work they did in residency to their current practice: ‘There's obviously a finesse to ODSP [Ontario Disability Support Program] forms, it sounds silly to say but there is an art to filling them out and learning those things as a resident is helpful. … I'm glad that I spent time as a resident figuring that stuff out and busting my butt, then yeah, it reduced the burden when I became staff’ (P5). Part of this learning was developing strategies to deal with the burden of IPCAs, including changing their practice style:

'우리가 실제로 '지혜로운 선택'[불필요한 의학적 조사와 개입을 줄이기 위한 캠페인]과 같은 것들을 따르고, 검사와 조사 횟수를 줄인다면, [우리는 환자들과 더 많은 개인적, 신체적 접촉]을 할 뿐만 아니라, 들어오는 다른 데이터로부터도 부담을 덜 수 있을 것이다'(E7)
If we actually followed things like Choosing Wisely [campaign to reduce unnecessary medical investigation and intervention], and decreased the number of tests and investigations and things like that, we would not only have more personal, physical contact with our patients, but we would also have less burden from other data that is coming in’ (E7)

대부분 이러한 전략과 교훈은 실용적인 방법으로 학습되었으며, 많은 의사들은 [IPCA를 지속 가능한 방식으로 관리하는 방법을 배우는 것]이 전공의의 중심 학습 목표라고 설명했다. '나는 그들을 설득하려고 노력하며, 지금 일을 잘 하면, 앞으로 보상이 있을 것이다.(P7)' 여기서, 우리는 모든 직업 단계의 교육자들이 [전공의 수련에서 IPCA의 무게]를 [부담으로 인식할 뿐만 아니라, 오랜 경력을 위해 자신을 훈련할 수 있는 기회로 인식]하고 있음을 확인했다. '그것보다 더 중요한 것은 우리 모두가 마라톤을 할 수 있는지 확인하고 그 과정에서 우리의 건강과 건강을 해치지 않도록 하는 것이다.'(E1)
Mostly, these strategies and lessons were learned in a practical way, and many physicians described that learning how to manage IPCAs in a sustainable way is a central learning objective for residents: ‘I do try to convince them, put the work in now and it will pay dividends moving forward’ (P7). Here, we identified that educators of all career stages perceive the weight of IPCAs in residency not solely as a burden, but also as an opportunity to train oneself for a long career: ‘more important than that is making sure we can all do the marathon and that we don't burn out and compromise our health and wellness in the process’ (E1).

3.2 악화 및 완화 요인 
3.2 Exacerbating and alleviating factors

참가자들은 IPCA가 부담스럽다는 데 일관되게 동의했지만, 그러한 부담을 악화시키거나 완화하는 조건도 설명했다.
While participants consistently agreed that IPCAs are burdensome, they also described conditions that exacerbate or alleviate that burden.

3.2.1 모호한 기대치
3.2.1 Ambiguous expectations

전공의와 최근 졸업한 직원들은 [모호한 기대]를 요인으로 식별하여 IPCA의 부담을 가중시켰다. 실천에서 독립하기 전에, 전공의들은 그들의 지도자들의 목표, 우선순위, 과정을 따라야 한다. 이 영역에 대한 명확하고 일관된 지침이 없으면 IPCA 부담이 증가합니다. '당신은 또한 특정 시간대에 그것을 끝내야 한다는 압박감을 느끼지만, 만약 그것이 당신의 물건이라면 당신은 "나는 이것을 내일 볼 것이다"와 같을 수 있다.(P5)
Residents and recently graduated staff identified ambiguous expectations as a factor, which exacerbated the burden of their IPCAs. Before becoming independent in their practice, residents must follow the goals, priorities and processes of their preceptors. Without clear and consistent instructions in this area, IPCA burdens are increased: ‘You also feel the pressure to get it done on a certain timeline, whereas if it was your own stuff you could be like “I'll look at this tomorrow”’ (P5).

3.2.2 작업량 형평성에 대한 거주자의 인식
3.2.2 Resident perceptions of workload equity

전공의 집단 특유의 또 다른 악화 요인은 할당된 작업의 양이나 강도에서 [전공의 간의 불평등한 차이]에 대한 인식이었다. 예를 들어, 농촌 실무에서 일하는 거주자들은 그들의 IPCA 부하가 학계 가족 보건 팀 내에서 일하는 거주자들보다 훨씬 적다고 보고했다. 일부 참가자들은 이를 [지도교사preceptor]의 선택 때문이라고 보았다. '운이 좋게도 어떤 지도교사를 얻었는지에 따라 얼마나 많은 사람들이 받은 편지함을 관리해야 하는지에는 큰 차이가 있었습니다. 우리는 같은 사이트에 있었고 같은 수의 환자를 보았지만 일부 사람들은 다른 사람들보다 받은 편지함과 바쁜 업무에 훨씬 더 많은 시간을 보냈다.'(P1)
Another exacerbating factor unique to the resident group was perceptions of inequitable differences between residents in the volume or intensity of assigned work. For example, residents working in rural practices reported that their IPCA load was much less than those working within academic family health teams. Some participants attributed this to preceptor choice: ‘there were huge discrepancies in how much people had to manage the inbox based on what preceptor they got lucky enough to get. We were at the same site and seeing the same population of patients yet some people spent significantly more time on their inbox and busy work than others did’ (P1).

[작업을 관리하는 데 사용할 수 있는 리소스]에서도 비슷한 불평등이 발견되었습니다. 일부 관행은 전공의가 IPCA 업무를 다른 사람에게 위임할 수 있도록 허용한 반면, 다른 관행에서는 전공의가 직접 이 작업을 하도록 했다. 전공의들은 지도교사가 할 수 있는 방식으로 업무를 위임하는 것이 허용되지 않아 업무량이 증가하고 만족도가 감소했다고 보고했다. 
'라벨을 인쇄하기 위해 프린터를 찾고 환자의 소변을 적신 다음 그것을 보내고 포장하기 위해 뛰어다니는 것은 거주 시간을 잘 사용하지 않습니다. 실제로 그럴 사람이 있어야 하고, 대부분의 클리닉에는 있지만, 우리에게는 없습니다.'

A similar inequity was seen in the resources available to manage this work. Some practices permitted residents to delegate IPCA tasks to others, while in other practices residents were required to do this work themselves. Residents reported that not being allowed to delegate work in the way their preceptors were able to do increased their workload and decreased their satisfaction: ‘It's not a good use of resident time to be running around trying to find a printer to print off labels, to then dip that patient's urine, to then send it off and package it up. There actually should be someone to do that, and in most clinics, there is, but for us, there's not’ (R9).

3.2.3 교육
3.2.3 Teaching

[모든 경력 단계의 교육자]들은 [전공의를 가르치는 데 필요한 시간, 인내심, 코칭]이 그들 자신의 IPCA 부담을 악화시킨다는 것을 확인했다. 전공의들은 그 일을 맡음으로써 IPCA 직원들의 요구를 완화하고 있다는 것을 인식했지만, 교육자들은 전공의들에게 위임하는 것은 시간, 인내, 유연성이 필요하다고 설명했다. '내가 원하는 방식으로 교육하는 것은 매우 시간이 많이 걸리기 때문에, 내가 해야 할 약간의 투자와 균형을 이루게 된다.' (E2)
Educators of all career stages identified that the time, patience, and coaching required to teach residents exacerbated their own IPCA burden. While residents perceived that they were alleviating the IPCA demands of staff by taking on that work, educators described that delegating to residents required time, patience and flexibility. ‘Teaching, if done in the way that I like to do it, it's very time consuming and so it balances out a bit of the investment that I do to have some tasks taken off my plate.’ (E2).

3.2.4 친숙함(환자, 진료소 및 전문 지식)
3.2.4 Familiarity (patients, clinic and expertise)

[환자와 친숙하지 않은 것]은 [전공의] 뿐만 아니라 [대리의사 직무locum work(다른 사람의 업무를 인계받거나 명단을 구축)로 인해 환자와 친숙하지 않을 수 있는 경력 첫 5년 동안 의사]의 IPCA 업무량을 악화시켰다. 의료진의 의사는 자신이 잘 알고 있는 환자의 경우 스스로 주문한 결과를 검토하는 데 있어 효율성을 설명했습니다. '또한 일단 실습을 하고 나면 환자를 잘 알게 되는 이점이 있기 때문에, 그러한 요소들은 환자를 좀 더 낫게 만드는 데 도움이 됩니다.'(P1)
Not being familiar with a patient exacerbated the workload of IPCAs for residents as well as for physicians in the first 5 years of their career who may not be familiar with patients due to locum work, taking over someone else's practice or building their roster. Staff physicians described the efficiency in reviewing results they ordered themselves, for a patient they were well-familiar with ‘You also have the benefit of knowing your patients well once you're out in practice, so those factors help make it a bit better.’ (P1).

3.3 권장 사항
3.3 Recommendations

참가자들은 IPCA에 대한 전공의 교육 경험을 개선하기 위한 전공의 프로그램에 대한 권고 사항을 제공했습니다. 참가자들은 프로그램이 [IPCA에 대한 전공의 참여를 표준화하고 학습자와 교사 모두에게 지침과 기대를 명확하게 전달할 것]을 권고했다. '교육 목표와 기대는 무엇인가에 대한 유닛의 집단적 메시지가 있다는 것이 중요하다.' (E5) 이는 교육 현장 전반의 IPCA 워크로드에 대한 인식된 불평등을 개선하기 위한 방법으로 간주되었습니다. 전공의들은 또한 프로그램이 학습자에게 IPCA를 완료하기 위한 [전용 시간]을 제공할 것을 권고했다. [전용Dedicate 시간]은 전공의가 직무의 다양한 구성 요소를 학습할 때 담당 의사와 동일한 업무량을 수행하는 데 필요한 추가 시간을 설명하는 데 도움이 될 것이다.
Participants provided recommendations to residency programmes for improving the resident educational experience with IPCAs. Participants recommended that programmes standardise resident involvement in IPCAs and clearly communicate instructions and expectations to both learners and preceptors: ‘It is important that there is a collective message that comes from the unit about … what are the educational goals, [and] what are the expectations.’ (E5) This was seen as a way to ameliorate the perceived inequity in IPCA workload across training sites. Residents also recommended that programmes provide learners with dedicated time to complete IPCAs. Dedicated time would help account for the additional time residents require to do the same workload of a staff physician as they learn the various components of the task.

또한, 참가자들은 IPCA를 처리할 수 있는 능력을 개발하기 위해서는 [점진적인 도입]이 중요하다고 제안했다. 참가자들은 이것이 업무량을 줄이고 IPCA 관련 스트레스를 완화하는데 도움이 될 수 있다고 믿고 있으며, 특히 임상 치료의 다른 측면을 배우면서 레지던트 초기에 더욱 그렇다. '그것은 아무도 모르는 내 동료 레지던트들의 첫 6개월 동안 정말 많은 사람들을 태워버렸다. 그들은 시스템을 몰랐고, 프로그램을 몰랐고, 어떻게 거주자가 되는지도 몰랐으며, 동시에 1,000명의 수신함을 어떻게 하는지도 몰랐다.' (P4) 
Further, participants suggested that a gradual introduction was important to develop capacity to handle IPCAs. Participants believe this may reduce the workload and help relieve IPCA-related stress, especially early in residency as they learn the other aspects of clinical care. ‘It really burnt out a lot of my co-residents in their first six months of residency when they didn't know anybody. They didn't know the system, they didn't know the program, they didn't know how to be a resident, and also how to do an inbox of 1,000 people at the same time.’ (P4). 
또한, 이 접근 방식은 IPCA 자체의 보다 효과적이고 효율적인 학습을 가능하게 할 것으로 여겨졌다. 개업 의사들은 독립적인 개업에서 IPCA의 [예상 업무량 및 필연적 업무량]에 대한 투명성을 높였고, 이는 가정의학 경력의 일부로서 전공의들이 [IPCA의 현실을 이해하고 예측]하는 데 도움이 될 것이라고 추론했다. 가정의학의 중요한 구성 요소로서 IPCA의 현실을 논의하는 것은 이러한 [작업량에 대한 전공의들의 인식]에 도움이 될 수 있으며, IPCA를 완료하는 지속 가능한 방법을 개발하도록 장려한다. "실제로 당신이 그것을 어떻게 제시하느냐에 달려 있다고 생각합니다. 예를 들어, 이것은 당신이 내 일을 하는 것에 대한 것이 아니라, 내가 당신에게 다른 종류의 교육을 제공하는 것에 관한 것입니다. 결국 당신을 좋은 가정의사로 만들 것입니다." (E5)
In addition, it was felt this approach would allow for more effective and efficient learning of IPCAs themselves. Practicing physicians encouraged more transparency about the expected and inevitable workload of IPCAs in independent practice, reasoning that this would help residents understand and anticipate the reality of IPCAs as part of a career in family medicine. Discussing the reality of IPCAs as a significant component in family medicine may help residents' perception of this workload, encouraging them to develop sustainable ways to complete IPCAs: ‘I think it depends on how you actually present it, like, this is not about you doing my work, but this is about me providing you with a different kind of education, that in the end will make you a good family doctor’ (E5).

마지막으로, 모든 그룹의 참가자들은 IPCA에 대한 보다 명확한 교육, 피드백 및 커뮤니케이션, 특히 청구서, 차트 유지보수, 양식 및 사례 보고/검토를 권고했다. 이러한 교육은 전공의들이 보다 많은 지원을 통해 보다 점진적인 방식으로 지식을 쌓을 수 있도록 도울 뿐만 아니라 교육적으로 중요한 내용을 강조하고 열린 소통의 기회를 제공할 것이다. '학습 욕구, 학습 목표, 이러한 학습 기회의 가치, 전공의가 학습에 대해 어떻게 느끼고 관리하는지, 나아가면서 상황을 조정하고 모두가 함께 작업하도록 하는 것이 중요하다고 생각합니다.' (E1)
Finally, participants in all groups recommended more explicit teaching, feedback and communication on IPCAs, especially billing, chart maintenance, forms and case debriefing/reviewing. This teaching would not only help residents build on their knowledge in a more gradual way with more support, but it would also provide an opportunity to highlight educationally important content and provide opportunities for open communication. ‘I think it's important to have ongoing conversation about learning needs, learning goals, the value of these learning opportunities, how the resident is feeling about it and managing it and be tweaking things as you go and really have everybody working together on it.’ (E1).

마지막으로 IPCA는 끝이 없습니다. 그러므로, 개인의 삶, 정신 건강, 건강을 보호하고 탈진을 피하기 위해 [제한을 두는 것]이 중요하다. 참가자들은 환자와의 경계 설정(예: 필요할 때 환자가 추가 예약을 하도록 권장), 자신에 대한 경계 설정(예: 긴급하지 않은 받은 편지함 항목을 다음날로 남겨두는 것) 및 [IPCA 작업을 완료까지의 시간을 제한하는 것]의 중요성을 반복적으로 표현했다. [솔선수범]하는 것은 전공의들이 독립 실무자와 동일한 전략을 구현할 수 있도록 지원했습니다. '나는 매우 효율적인 지도교사가 있었고, 우리는 결코 늦지 않았다. 그리고 그녀는 나에게 받은 편지함의 균형을 맞추는 법을 가르쳐 주었다. 환자를 보고, 가는 동안 차트를 작성하고, 당신과 함께 집에 가는 최소한의 일을 가져갔다. 그리고 오늘날까지 나는 여전히 그렇게 실천하고 있다. 그리고 그것은 임상적 부분과 IPCA 부분의 균형을 맞추는 방법을 배우는 것만으로도 큰 도움이 되었다고 생각합니다.' (P1)
Finally, IPCAs are never-ending; thus, it is important to set limits to protect one's personal life, mental health, wellness and avoid burnout. Participants repeatedly expressed the importance of

  • setting boundaries with patients (e.g. encouraging patients to schedule an additional appointment when necessary),
  • boundaries for oneself, (e.g. leaving non-urgent inbox items for the next day) and
  • blocking off time to complete IPCA tasks.

Leading by example helped residents implement the same strategies as independent practitioners: ‘I had a very efficient preceptor, we never ran late … and she really taught me how to balance inbox, seeing patients, charting as you go, taking minimal work home with you, and to this day I still practice that way. And I think that was very helpful, just learning how to balance the clinical and the IPCA part.’ (P1).

4 토론
4 DISCUSSION

McMaster Family Medicine Residention 프로그램에서 전공의를 위한 간접 환자 치료 활동의 교육적 영향을 조사했습니다. 모든 참가자는 이 작업량이 필요하지만 종종 충족되지 않는다는 것을 인식했습니다. 그러나 이 작업에 대한 임상의의 관점은 이 작업에 대한 인식과 참여에 영향을 미쳤다. 불평등에 대한 모호한 기대와 인식은 학습자가 이러한 과제에 대한 혐오를 악화시켰다. 참가자들은 이 작업의 교육적 가치를 향상시키기 위해 명시적인 교육 및 피드백과 함께 IPCA에 대한 표준화된 단계적 도입에 초점을 맞출 것을 권고했다. 
We explored the educational impact of indirect patient care activities for residents in the McMaster Family Medicine Residency programme. All participants recognised this workload as necessary, though often unfulfilling. However, the clinician's perspective on this work as either a burdensome additional weight or an opportunity to strengthen their management skills impacted their perception and engagement in the work. Ambiguous expectations and perceptions of inequity exacerbated learner dislike for these tasks. The participants recommended a focus on a standardised graduated introduction to IPCAs, with explicit teaching and feedback to improve the educational value of this work.

[빌렛의 직장 학습 이론]은 학습이 효과적이기 위해서는 학습자가 [교육 기회를 식별하고 참여하도록 선택해야 한다]고 설명한다. 이 연구는 IPCA를 [비교육적 초과근무로 인식하는 것]이 학습자의 이러한 과제에서 학습하는 능력을 저해한다는 점을 강조했다. 이것은 임상 작업장에서 배우는 것이 목적인 '학습자'으로서의 직업적 정체성을 가진 전공의들 사이에서 특히 심각할 수 있다. 스스로를 의료 사업에서 실천을 준비하는 '견습생'으로 보는 전공의들은 IPCA 업무를 효과적으로 관리하기 위한 전략을 배울 기회를 더 많이 볼 수 있다. 우리는 [숨겨진 커리큘럼]이 IPCA의 가치를 떨어뜨리는 방식에 주의를 기울여야 한다. 예를 들어, IPCA 과제가 임상의 시간 중 상당한 부분을 차지하지만 지도, 평가 또는 교육적 가중치를 거의 받지 않는 경우, 전공의는 IPCA 과제가 중요하지 않고 가치가 없다고 생각하는 법을 배울 수 있다. 이 작업을 ['행정적' 작업]이 아닌 '간접적 환자 치료'로 지칭하는 것은 이러한 작업의 가치와 중요성을 강조하는 데 도움이 될 수 있어 환자에게 의료 서비스를 제공하는 전공의의 역할에 관심이 쏠린다. 또한 IPCA 작업을 지속 가능하고 효과적으로 관리하기 위한 시스템에 대한 공식적인 교육 및 피드백 제공을 통합하면(예: 신뢰할 수 있는 전문 활동 또는 핵심 역량) 학습자가 이러한 작업의 교육적 가치를 인식하는 데 도움이 될 수 있다. 뉴질랜드, 호주, 영국의 왕립 일반 실무자 대학과 같은 일부 교육 기관들은 [간접 환자 치료 기술]이 독립 실무에 필요한 역량이라고 명시적으로 밝혔습니다.
Billett's workplace learning theory describes that for learning to be effective, learners must both identify and choose to engage with educational opportunities. This study highlighted that the perception of IPCAs as non-educational extra work impedes learners' ability to learn from these tasks. This may be particularly acute amongst residents whose professional identity is as a ‘student’ whose purpose in the clinical workplace is to learn.41, 42 Residents who see themselves as an ‘apprentice’ preparing to practice in the business of medicine may be more likely to see opportunities for learning strategies to effectively manage IPCA work. We must be attentive to the ways in which the hidden curriculum de-values IPCA work.43 For example, when IPCA tasks take up a significant portion of clinician time but are seldom coached, assessed or given much educational weight, residents may learn to think of them as unimportant and not valuable.42 Referring to this work as Indirect Patient Care rather than ‘administrative’ work may help emphasise the value and importance of these tasks, drawing attention to the resident's role in providing health care to the patient. In addition, incorporating formal ways to teach and provide feedback on systems for sustainably and effectively managing IPCA work (e.g. as an entrustable professional activity or core competency) may also be helpful in helping learners recognise the educational value of these tasks. The groundwork has been laid here by some educational bodies, including the Royal College of General Practitioners in New Zealand,44 Australia45 and the United Kingdom,46 each of which have explicitly stated that indirect patient care skills are a required competence for independent practice.

IPCA 작업을 적절하게 수행할 수 있는 것 외에도, 이러한 작업은 추가 교육 가치를 제공합니다. 의료 전문가로서의 기술 외에도, [목적적 IPCA 교육]은 효율성, 우선순위 부여, 적절한 전문적 의사소통 및 협업을 포함한 전문성, 옹호 및 리더십의 이전 가능한 기술을 강조한다. 이러한 기술은 캐나다 면허 대학인 College of Family Physicians of Canada가 제공하는 레지던트 훈련 프로필의 핵심 전문 활동의 최근 출판에서 강조된다. 이 문서에는 [IPCA 관리(EHR 관리, 받은 편지함 관리, 양식 작성 및 처방 관리 포함)]뿐만 아니라 [자가 및 지속 가능한 의료 행위 관리]를 의료의 유능한 관행에 중요한 핵심 전문 활동으로 나열합니다. 적절한 훈련과 적응적 전문지식의 렌즈를 통해 이 프로그램은 학습자가 다양한 리소스로 다양한 임상 맥락에서 IPCA의 가중치를 해결할 수 있도록 준비할 수 있을 것이다.  
Beyond being able to adequately perform IPCA work, these tasks offer additional education value. In addition to skills as a medical expert, purposeful IPCA education highlights transferable skills in professionalism, advocacy and leadership including efficiency, prioritisation, appropriate professional communication and collaboration. These skills are underscored in the recent publication of core professional activities in the residency training profile provided by the College of Family Physicians of Canada, the Canadian licensing college.47 This document lists managing IPCAs (including maintaining the EHR, managing the inbox, completing forms and managing prescriptions) as well as managing self-care and a sustainable practice both as core professional activities critical to the competent practice of medicine. With appropriate training and a lens of adaptive expertise, the programme would be able to prepare learners to tackle the weight of IPCAs in varied clinical contexts with varied resources.48

IPCA는 종종 전공의 수련의 예기치 않은 구성 요소이다. 직원들은 종종 진료 시간 4시간 이내에 IPCA의 상당 부분을 완료하기 때문에 이 업무량은 일반적으로 의대생에게는 보이지 않는다. 이것은 전공의들이 IPCA 관리에 필요한 긴 시간, 특히 더 유연한 시간을 예상하여 가정의학을 선택한 경우에 특히 낙담하는 이유에 대한 잠재적인 설명을 제공한다. 참가자들의 목소리처럼, [IPCA의 예상치 못한, 충족되지 못한, 그리고 때로는 지속 불가능한 업무량]은 가정의학과 졸업생들이 포괄적인 가정의학을 실천하기로 선택하는 감소와 활동 수준과 환자 패널 크기의 감소에 영향을 미치는 많은 요소 중 하나일 수 있다. 졸업생들은 [이러한 예상치 못한 부담스러운 업무량을 보상]하기 위해 [(환자 패널이 크고 포괄적인) 가정의학 진료에서 벗어남]으로써 [지속 가능한 실천을 유지하기 위한 경계]를 설정하고 있을 수 있다.
IPCAs are often an unexpected component of residency. As staff often complete a significant portion of IPCAs outside of clinic hours4 this workload is typically unseen by medical students. This offers a potential explanation for why residents are particularly disheartened by the longer hours needed to manage IPCAs, especially if they selected family medicine in anticipation of more flexible hours.49 As voiced by our participants, the unexpected, unfulfilling, and sometimes unsustainable workload of IPCAs may be one of the many elements impacting a decline in family medicine graduates choosing to practice comprehensive family medicine and the decline of activity level and patient panel size.50, 51 Graduates may be setting boundaries to maintain a sustainable practice by moving away from comprehensive family medicine practice52 with a large patient panel to compensate for this unexpected and onerous workload.

4.1 교육자에게 미치는 영향
4.1 Implications for educators

이 연구는 가정의학 전공의들이 그들의 의료행위를 관리할 수 있도록 준비하기 위한 [새로운 커리큘럼의 필요성]을 강조했고, [전공의들의 교육적 헌신과 시간]에 대한 상충하는 요구를 염두에 두면서 이 중요한 환자 치료 부분을 통합했다. 53 여기에는 IPCA의 존재에 대한 투명성, 예상 작업량, 그리고 지속 가능한 경영을 위한 기대치와 전략이 포함된다. 예를 들어, 스텝이 학습자가 볼 수 있는 방식으로 자체 IPCA 작업을 완료한다면, 이 작업의 효율성을 높이기 위해 이러한 작업 및 역할 모델링 전략을 표준화한다.
This study has highlighted the need for new curricula to prepare Family Medicine residents to manage their practices, integrating this vital piece of patient care while being mindful of competing demands on residents' educational commitments and time.53 This includes transparency around the existence of IPCAs, the anticipated workload, expectations and strategies for sustainable management. For example, when staff complete their own IPCA work in a way that is visible to the learner, they are normalising these tasks and role modelling different strategies to increase efficiency of this work.

연구 참가자들은 IPCA를 단계적이고 점진적인 방식으로 도입할 것을 권고했다. 예를 들어, EHR 수신함에 대한 소개는 관심 있는 문서 또는 특정 문서를 보낸 후 전공의가 수신함의 모든 구성 요소를 관리할 때까지 전공의가 직접 주문한 항목을 보낸 후 특정 범주의 조사(즉, 참조 노트, 처방, 혈액 검사 및 진단 영상)를 수행할 수 있다. 이 접근법은 특정 학습 목표를 허용하기 위해 [양은 줄이면서 더 집중된 교육]을 촉진할 수 있다. Inbox을 언제 어떻게 도입해야 하는지에 대한 지침을 가지고 있으면 전공의들 사이의 투명성과 형평성이 향상될 것이고, 프로그램이 의도된 역량을 명확히 하고 정기적인 피드백을 촉진하도록 장려할 것이다. 이러한 전략은 전공의들에게 명확성과 구조를 만들어 줄 뿐만 아니라 학습자들이 적응적이고 자기 조절적인 학습 전략을 개발할 수 있도록 돕는 학습 환경을 촉진할 것이다. 전공의들이 스스로의 학습을 조절하고 적응할 수 있을 때, 그들은 의학 분야에서 평생의 경력을 지속할 수 있는 능력을 강화하고 있다. 전공의 프로그램은 이러한 적응적이고 자기 통제적인 행동을 촉진하기 위해 의도적으로 그리고 의도적으로 그러한 학습 환경을 계획해야 한다. 
Study participants recommended that IPCAs be introduced in a stepwise, gradual way. For example, introduction to the EHR inbox can begin by sending interesting or specific documents, then items the resident themselves ordered, followed by a particular category of investigations (i.e. consult notes, prescriptions, blood work and diagnostic imaging) until the resident is managing all components of the inbox. This approach may facilitate focused education with reduced quantity to allow for specific learning goals. Having a guideline as to when and how inbox should be introduced will improve the transparency and equity amongst residents, encourage the programme to articulate the intended competency and to promote regular feedback. These strategies will not only create clarity and structure for residents, they also promote a learning environment that helps learners develop adaptive, self-regulated learning strategies.54 When residents are able to regulate and adapt their own learning, they are bolstering their ability to sustain a life-long career in medicine. Residency programmes should intentionally and purposefully plan such learning environments to promote these adaptive, self-regulated behaviours.54

4.2 강점과 한계
4.2 Strengths and limitations

수집된 데이터는 단일 레지던트 프로그램에서 수집되었으며 다른 가정의학 프로그램이나 다른 전문 분야로 이전할 수 없습니다. 상당한 모집 노력에도 불구하고, 참여에 자원한 전공의들은 우리 레지던트 프로그램의 대규모 학술 교육 현장에서 불균형적으로 뽑혔다. 지역사회 기반 현장에서 주민을 모집하는 것이 과제였는데, 이는 다양한 현장에서 IPCA의 교육 경험의 불일치를 시사하는 것일 수 있다. 참가자들이 자신의 경력 단계와 관련된 IPCA에 대해 말하는 방식에 차이가 있었기 때문에 다양한 수준의 전문 경험과 초점을 가진 참가자들의 통합이 강점이다.
The data collected was from a single residency programme and may not be transferable to other family medicine programmes or other specialties. Despite significant recruitment efforts, the residents who volunteered to participate were disproportionately drawn from the large academic teaching sites in our residency programme. It was a challenge to recruit residents from the community-based sites, which may be an indication of a discrepancy in the educational experience of IPCAs in the various sites. The incorporation of participants with varying levels of professional experience and focus is a strength, as there were differences in the way that participants spoke about IPCAs, related to their career stage.

5 결론
5 CONCLUSION

결론적으로, IPCA는 우리 의료 시스템의 필수적이고 증가하는 구성요소이다. 우리 가정의학 전공의들이 이러한 업무를 효과적이고 [지속 가능한 방식]으로 관리하도록 훈련받는 것이 필수적이다. 지속 가능성에 초점을 맞추지 않으면 IPCA는 인구 수요를 충족시키기 위해 충분한 수의 일반 가정의사를 모집하고 유지하는 데 장애가 될 위험이 있다. 이를 달성하기 위해서는 IPCA에 대한 점진적인 도입, 교육 및 피드백, 동료 간의 형평성을 포함할 수 있는 교육 혁신이 필요합니다. 이 교육을 제공하지 못하면, 수련을 마친 전공의가 독립적인 임상 실습으로의 이행하는 것에 대한 위험, 그리고 일부 사람들에게는 포괄적인 진료를 떠나서 더 세부전문과목으로 진입할 위험이 따른다. 그러나 교육 혁신은 충분하지 않다. 상응하는 보수 없이 업무량이 증가했을 때 나타나는 시스템적 영향을 인식하고, family practice의 지속 가능성을 높이는 의료 시스템 변화를 옹호해야 한다.
In conclusion, IPCAs are a necessary and increasing component of our health care system. It is essential to ensure our family residents are trained to manage these tasks in an effective and sustainable manner. Without a focus on sustainability, IPCAs risk becoming a barrier to recruiting and retaining sufficient numbers of generalist family physicians to serve population needs. Achieving this will require educational innovation, which may include a gradual introduction to IPCAs, with teaching and feedback, and equity amongst peers. Failing to provide this education carries the risk of more challenging transitions to independent clinical practice for graduating residents, and for some, attrition out of comprehensive practice and into sub-specialisation. However, educational innovation is not sufficient. We need to recognise the systemic implications of an increased workload without corresponding remuneration and advocate for health system change, which increases the sustainability of family practice.

 


Med Educ. 2022 Aug 16. doi: 10.1111/medu.14921. Online ahead of print.

Optimising the educational value of indirect patient care

Affiliations collapse

Affiliations

1Department of Family Medicine, McMaster University, Hamilton, Ontario, Canada.

2McMaster FHS program for Education Research, Innovation & Theory (MERIT), McMaster University, Hamilton, Ontario, Canada.

PMID: 35972822

DOI: 10.1111/medu.14921

Abstract

Introduction: Indirect patient care activities (IPCA) such as documentation, reviewing investigations and filling out forms require an increasing amount of physician time. While an essential part of patient care, rising rates of IPCA work correspond with increases in physician burnout and job dissatisfaction. It is not known how best to prepare residents in IPCA-heavy specialties (e.g. family medicine) for this aspect of their career. This study investigates how educators and residency programmes can optimise IPCA work during residency to best prepare residents for future practice.

Methods: Using Constructivist Grounded Theory, we conducted focus groups and individual interviews with 42 clinicians (19 family medicine residents, 16 family physicians in the first 5 years of practice and 7 family physician educators). All participants were connected to one family medicine residency programme. We analysed interview data iteratively, using a staged approach to constant comparative analysis.

Results: While residents, early career physicians and educators perceived the educational value of IPCAs differently, they all reported IPCAs as a necessary weight that family physicians carry throughout their career. Some residents described IPCAs as a burden, creating inequities in workload and interfering with other learning and personal opportunities. In contrast, educators conceptualised IPCAs as an opportunity to build and develop the skills required to carry the weight of IPCAs throughout their career. We make specific recommendations for helping residents recognise this educational opportunity, such as clarifying expectations, navigating equity, understanding purpose and maintaining consistency when teaching IPCAs.

Conclusion: IPCAs are a key competency for many medical residents but require explicit pedagogical attention. If the educational opportunities are not made explicit, residents may miss the opportunity to develop strategies for practice management, professional boundaries, and administrative efficiencies.

임상실습에서 과락-실패를 유발하는 교수역할특성 (Med Educ, 2022)
Role of faculty characteristics in failing to fail in clinical clerkships
Jennifer L. Swails1 | Meghana A. Gadgil2,3 | Heath Goodrum4 | Resmi Gupta5 |
Mohammad H. Rahbar5,6 | Elmer V. Bernstam1,4

 

 

1 소개
1 INTRODUCTION


CBME(역량 기반 의료 교육)는 학생들이 진급을 하기 전에 숙련도를 입증하도록 요구함으로써 환자의 안전을 증진시킨다. 이와 같이 중요한 사건 보고는 의과대학에서 시작되어, 성과가 저조한 미래의 의사를 식별하고 임상 치료에 영향을 미치기 전에 개선할 수 있는 기회를 제공함으로써 환자를 보호한다. 또한 의과대학 평가는 전공의 성공의 중요한 예측요인으로 간주되어 전공의 선정과정에서 가중치를 부여하고 있다. 
Competency-based medical education (CBME) promotes patient safety by requiring students to demonstrate proficiency before they can progress. In this way, critical event reporting begins in medical school, protecting patients by identifying underperforming future physicians and allowing them the opportunity to improve before impacting clinical care.1 Furthermore, medical school evaluations are considered an important predictor of residency success and are thus weighted heavily in the residency selection process.2-4

의학 교육과 경력 개발에서 중요한 역할에도 불구하고, 의대생 임상실습 등급 보고는 사용된 등급 척도에 따라 기관마다 크게 다르다. 평가는 학생의 성별과 인종에 따라 영향력에 취약할 수 있다. 게다가, 임상실습 책임교수 조사 데이터는 등급 인플레이션의 지속적인 국가 패턴을 시사하지만, 이에 대한 명확한 설명은 존재하지 않는다.
Despite their key role in medical education and career development, medical student clerkship grade reporting varies greatly between institutions,5-8 depending on the grading scale used7 and even across rotations within a clerkship.7 Evaluations can be vulnerable to influence based on the gender and race of students.9 Moreover, clerkship director survey data suggest a persistent national pattern of grade inflation,10-12 though no clear explanation for this exists.

교수진들은 또한 표준 이하의 임상실습 수행능력을 문서화하는 것을 꺼릴 수 있다. 특히, 최근의 메타 분석에서 교수진의 전문직업적 우려를 "과락 실패"의 주요 원인으로 확인했습니다. 최근 몇 년간 교수진에 대한 의대생 평가는 교수진 승진에 중요한 요소가 되고 있다. 의대생 사무원 자격 평가에 대한 우리의 현재 이해에서 중요한 차이는 교수직, 성별 및 인종과 같은 평가자 특성의 영향이다. 학계의 여성과 소수자는 전반적으로 승진 기준이 다르고 더 높은 수준을 유지하고 있으며, 의대생들의 평가는 교직원의 성별과 인종에 따라 영향을 받는다는 것이 데이터에 의해 입증되었다. 교육생과의 선행연구를 통해 교직원과 전공의 평가 사이의 호혜성(긍정적, 부정적 모두)을 입증했지만 의대생에 대한 자료는 거의 없다.
Faculty may also be reluctant to document substandard clerkship performance.12 Notably, a recent meta-analysis identified faculty professional concerns as a major reason for “failure to fail.”13 In recent years, medical student evaluations of faculty have become an important factor in faculty promotion. An important gap in our current understanding of medical student clerkship evaluations is the impact of evaluator characteristics like faculty rank, gender, and race. Data have demonstrated that women and minorities in academia overall are held to different and higher standards for promotion14-16 and that evaluations by medical students are impacted by the gender and race of the faculty member.17, 18 Prior research with trainees has demonstrated reciprocity (both positive and negative) in faculty and resident evaluations,19, 20 but there is little data for medical students.

이전 연구들은 학생을 낙제시키는 장벽을 조사했지만, 교수 인구 통계와 직위rank는 제외되었다. 우리는 [승진 전에 부정적인 영향에 대한 취약성]을 인지했기 때문에, 주니어 교수진이 낮은 성과 평가(LPE)를 제출할 가능성이 낮다고 가정했다. 또한 주니어 교수진은 일반적으로 경험이 부족하고, 평가 기술에 대한 자신감이 떨어질 수 있다. 우리는 교수진에 대한 학생 평가의 변동성뿐만 아니라 학문적 순위에서 알려진 차이를 고려할 때 교수진의 성별, 인종, 민족성이 중요한 수식어가 될 것이라고 생각했다. 이러한 가설을 테스트하기 위해, 우리는 미국 남부의 한 대형 학술 의료 센터에서 10년 이상의 의대 학생 임상실습생 평가와 함께 대규모 데이터 세트를 분석했다. 재교육 교정조치가 필요한 학생을 정확하게 평가하려면 두 가지 작업을 모두 수행해야 합니다.

  • (1) 표준 이하의 행동을 식별할 수 있다. 
  • (2) 그것을 기꺼이 구두로 말하거나 기록한다. 

본 연구에서는 [평가의 정확성]을 평가할 수 없었고, 대신 두 번째 요소인 [문서 작성 의지]에 초점을 맞췄다. 두 구성 요소를 별도로 평가하는 것은 정확도를 향상시키기 위한 고유한 개입을 제안할 수 있다.
Previous studies have investigated the barriers to failing a student, but faculty demographics and rank were excluded.13 We hypothesized that junior faculty were less likely to submit low performance evaluations (LPEs), perhaps due to perceived vulnerability to negative repercussions prior to promotion. Junior faculty could also be generally less experienced and less confident in their evaluation skills. We thought faculty gender, race, and ethnicity would be important modifiers given the known disparities in academic rank, as well as variability in student evaluations of faculty. To test these hypotheses, we analysed a large dataset with more than a decade of medical student clerkship evaluations from a large academic medical centre in the Southern United States. Accurately assessing a student who needs remediation requires faculty to both

  • (1) be able to identify the substandard behaviour and
  • (2) be willing to verbalise or document it.

In this study, we could not assess the accuracy of assessment and, instead, focused on the second component, willingness to document. Evaluating the two components separately may suggest unique interventions to improve accuracy.

2 방법
2 METHOD

단일 기관에서 15년 동안 완료한 3학년 임상실습 재직 중 의대생에 대한 교수진 평가를 분석하였다. 이 연구는 프로토콜 HSC-SBMI-19-0385에 따라 인간 대상 보호를 위한 위원회의 승인을 받았다.
Faculty evaluations of medical students during third-year clerkships completed over a 15-year period from a single institution were analysed. This study has been approved by the Committee for the Protection of Human Subjects under protocol HSC-SBMI-19-0385.

핵심 3년차 임상실습 7개 중 5개(가정의학과와 지역사회의학, 내과, 소아과, 정신과학, 신경학)에 대한 중간점 및 최종 교수진 평가가 모두 포함되었습니다. 외과, 산부인과, 산부인과가 제외되었는데, 이는 교수진이 사무직에 대한 총체적인 평가를 완료하기 때문이다(즉, 평가는 여러 교수진의 의견을 반영한다). 임상강사들이 완료한 평가는 한 부서에만 소수 인원이 있어 제외됐다.
All midpoint and final faculty evaluations for five of seven core third-year clerkships (Family Medicine and Community Medicine, Internal Medicine, Paediatrics, Psychiatry, and Neurology) were included. Surgery and Obstetrics and Gynaecology were excluded because the faculty complete evaluations in aggregate for those clerkships (i.e., the evaluation reflected input from multiple faculty members). Evaluations completed by clinical instructors were excluded because there were a small number in only one department.

[불충분한 학생 성과를 문서화할 의사가 있는 교직원]을 식별하기 위해, 우리는 LPE를 교직원이 중간 지점이나 사무직 최종 평가에서 학생이 기대에 미치지 못한다고 판단한 평가로 정의했다. 최종 평가 형태는 연구 기간 15년 동안 다양했으며, 형태별로 질문 항목 수가 달랐다.

  • 질문은 binary하거나 (예: "이 학생들의 윤리적 또는 직업적 행동에 대해 심각한 우려가 있습니까?" [예/아니오]) 
  • 또는 임상실습 역량 평가를 위한 5점 리커트 척도를 가지고 있었다. 

중간점 평가도 15년의 연구 기간에 걸쳐 다양했지만, 이진 척도 질문(예/아니오)으로 구성되었으며, 이를 통해 교수진은 학생이 여러 역량 영역에서 "기대 충족" 또는 "실패"를 나타낼 수 있었다. 우리는 매년 완료되는 평가 양식을 수동으로 검토하여 해당 양식에 대해 어떤 답변이 LPE를 정의했는지 확인했습니다. 
To identify faculty willing to document inadequate student performance, we defined LPEs as evaluations where the faculty instructor determined that the student did not meet expectations either at the midpoint or at the final evaluation of the clerkship. Final evaluation forms varied over the 15-year period of the study, with differing numbers of question items per form. Questions

  • were either binary (e.g., “Do you have any serious concerns about this students ethical or professional behavior?” [Yes/No])
  • or had 5-point Likert scales for assessment of clerkship competencies.

Midpoint evaluations also varied across the 15-year study period but consisted of binary scale questions (Yes/No) through which faculty could indicate if the student was “meeting” or “failing to meet” expectations in a number of competency areas. We manually reviewed the evaluation forms completed each year to determine what answers defined LPE for that form.

다음 중 하나 이상을 통해 학생의 [LPE를 정의]했습니다.

  • 중간 평가에서 학생은 하나 이상의 역량 영역에서 "기대 충족에 실패"했습니다.
  • 중간 평가 또는 최종 평가에서 비윤리적인 행동으로 플래그 지정됨
  • 전반적 최종 평가에서 낙제 점수—평가 양식에 '전반적 평가'항목이 존재했을 때(5점 Likert 척도에서 1 또는 2의 값으로 정의됨)
  • 최종 평가에서 성과에 대한 리커트 척도의 중앙 점수 아래에 있는 하나 이상의 점수(5점 리커트 척도의 경우 1 또는 2의 값) 모든 형태는 연구자들에 의해 독립적으로 검토되었으며(J. L. S., M. A. G. 또는 E. V. B.) 형태 간 변동성에도 불구하고 이러한 값에 대한 앵커들은 일관되게 부적절한 성능을 나타냈다(보조 자료에 이용 가능한 평가 양식에 사용되는 앵커). 예를 들어, 여러 형태의 레벨 2 성과는 다음과 같이 표현되었습니다. 
    • "최소한의 기본 기술 수준입니다. 면담과 신체진찰에 대한 공부가 필요하다. 임상실습 동안 진전이 거의 없습니다."
    • "환자의 불만과 관련된 정신 상태 검사를 수행하지 않으며 일부 비정상적인 소견을 간과합니다."
    • "환자기록 노트가 약간 불완전합니다."

We defined an LPE for a student through one or more of the following:

  1. A midpoint evaluation indicated the student “failed to meet expectations” in one or more competency areas;
  2. Flagged for unethical behaviour on the midpoint or final evaluation;
  3. An overall failing grade on the final evaluation—when an overall question existed in the evaluation form (defined as value of 1 or 2, on a 5-point Likert scale); and
  4. One or more scores below the centre score on any Likert scale for performance (e.g., a value of 1 or 2, on a 5-point Likert scale) on the final evaluation. All forms were independently reviewed by researchers (J. L. S., M. A. G., or E. V. B.), and despite variability among forms, the anchors for these values consistently indicated inadequate performance (anchors used in the evaluation forms available in supplemental materials). For example, level 2 performance across several forms was indicated by the following:
    1. “Minimal level of basic skills. Needs work on interviews and PE. Little progress during clerkship.”
    2. “Does not perform mental status exam relevant to patients' complaints and overlooks some abnormal findings.”
    3. “Notes somewhat incomplete.”

각 로테이션마다, 교수진들은 그들이 감독한 학생들에 대한 평가를 완료하도록 요청받았다. 각 학생은 3학년 임상실습 과정 동안 여러 평가 세션을 거쳤으며, 대부분의 교수진은 15년 동안 여러 학생을 평가했습니다. 학생들은 특정한 교수진을 요청할 수 있었지만, 그러한 요구들이 항상 허락된 것은 아니었다. 대부분의 과제는 무작위로 이루어졌다. 
For each rotation, faculty were asked to complete evaluations for students they had supervised. Each student moved through multiple evaluation sessions over the course of their third-year clerkships, and most faculty evaluated multiple students over the 15 years of the study. Students could request specific faculty, but such requests were not always granted. Most assignments were random.

위에서 정의한 바와 같이 LPE 제출 가능성과 함께 교수 평가자 등급(조교, 준교수 또는 정교수)의 연관성을 평가했습니다. 교수진 특성에는 학력, 성별, 인종, 민족성, 나이, 그리고 평가를 내린 경험이 포함된다. 학생 인구 통계 데이터를 사용할 수 없습니다. 
We assessed the association of a faculty evaluator's rank (assistant, associate, or full professor) with the likelihood of submitting an LPE as defined above. Faculty characteristics included academic rank, gender, race, ethnicity, age, and experience giving evaluations. Student demographic data were not available.

우리는 [경험 점수]를 사용하여 [직위]와 [경험]을 구분했다. 이 값은 해당 교수진이 제출한 각 평가 시 해당 교수진이 데이터 세트 내에서 완료한 평가 수의 카운트로서 각 교수진에 대해 계산되었다. 예를 들어, 학생에 대한 19번째 평가를 마친 교직원은 해당 평가에 대해 19의 경험치, 25번째 평가에 대해 25의 경험치가 할당됩니다. 평가 당시 경험치가 낮은 경험은 경험점수 ≤ 50, 중간 경험은 > 50이지만 ≤ 100으로, 높은 경험은 > 100으로 범주형 변수로 그룹화했다. 이 전략은 연구 기간 전에 상당한 수의 평가를 완료한 고위 교수진의 경험을 과소평가할 수 있지만, 모든 교수진은 시작부터 시작하여 연구 과정에 걸쳐 각 수준에서 동일한 수의 평가를 입력할 수 있는 기회를 갖게 된다. 연구 기간 15년에 걸쳐 시간이 경과되고 새로운 교수진이 추가됨에 따라, 그들의 새로운 평가 수치(평균 2134.9/년)는 더 많은 상급 교수진이 학습 시작 전에 제출한 평가의 잘못된 "startup" 효과를 훨씬 초과한다. 우리 표본에서 낮은 빈도의 LPE와 각 순위의 교수진을 고려할 때 통계적 힘을 보존하기 위해 범주형 변수가 필요했다. 
We distinguished faculty rank from experience using an experience score. This was calculated for each faculty member at the time of each evaluation submitted by that faculty member, as a count of the number of evaluations completed by that faculty member, within our dataset. For example, faculty completing their 19th evaluation of a student would be assigned an experience value of 19 for that evaluation and a value of 25 for the 25th evaluation. We grouped experience as a categorical variable, with low experience defined as an experience score of ≤50, middle experience as >50 but ≤100, and high experience as >100, at the time of evaluation. Although this strategy may underestimate the experience of senior faculty with a significant number of evaluations completed prior to the study period, all faculty will begin at the start and have an opportunity to enter the same number of evaluations at each level over the course of the study. As time progressed over the 15 years of the study and new faculty are added, their new evaluation numbers (mean 2134.9/year) far exceed the false “startup” effect of evaluations submitted by more senior faculty prior to study start. A categorical variable was necessary to conserve statistical power given the low frequency of LPE and faculty of each rank in our sample.

연속형 변수에 대한 기술 통계량을 중위수 및 표준 편차(SD)로 계산하고 범주형 변수는 빈도와 백분율로 계산했습니다. 반복 측정 계층적 데이터 구조를 고려할 때, 우리는 구조화되지 않은 공분산을 가진 이항 분포와 로지스틱 링크 함수를 갖는 일반화된 혼합 회귀 모델을 사용했다. 학생들의 평가는 교직원 평가자 내에 nested되었고, 평가자는 로테이션 내에 nested되었다. 모든 모형에 대한 결과 변수는 LPE 대 그렇지 않음을 나타내는 각 평가에 대한 이진 변수였습니다. 교직원의 성별, 교직원의 연령, 교직원의 인종, 교직원의 민족성, 교직원의 인종, 민족성, 연령 및 교직원의 평가년도의 역할과 교직원의 성별, 인종, 연령 및 교직원의 상호 작용 효과를 교직원의 등급 간 연관성과 최종 평가에 대한 LPE 부여의 잠재적 교란자로 평가하였다.
We calculated descriptive statistics for continuous variables as medians and standard deviations (SD). Categorical variables were calculated as frequencies and percentages. Given the repeated-measures hierarchical data structure, we utilised a generalised mixed regression model having binary distribution and logistic link function with unstructured covariance. Students' evaluations were nested within faculty evaluators, and evaluators were nested within a rotation. The outcome variable for all models was a binary variable for each evaluation indicating LPE versus not. We evaluated the role of faculty gender, faculty age, faculty race, faculty ethnicity, experience giving evaluations, and calendar year of evaluation, as well as interactive effects between faculty gender, race, ethnicity, age, and faculty rank, as potential confounders of association between faculty rank and giving LPE on final evaluations.


[최종 평가]와 비교하여 [중간점 평가]에서 LPE를 받을 가능성 사이에 상당한 차이를 발견했지만, 중간점평가에서 LPE의 사용에는 큰 차이가 있었다. 예를 들어, 한 교직원은 중간 지점에서 학습자의 50% 이상의 LPE를 제공했지만 최종(요약) LPE는 훨씬 적게 제공했습니다. 따라서 중간점 평가를 모델에 포함하지 않았다.

Although we found a significant difference between the likelihood of receiving an LPE on a midpoint evaluation compared with a final evaluation, there was wide variation in the use of midpoint LPEs. For example, one faculty member gave more than 50% of learners LPEs at midpoint but gave far fewer final (summative) LPEs. Thus, we did not include midpoint evaluations in our model.

통계적 비유의성으로 인해 교수 연령과 교수 인종, 민족성, 상호작용 효과의 잠재적 modifier effect는 최종 모형에서 삭제되었다. 우리의 1차 가설은 교수진과 관련이 있기 때문에 통계적 유의성이 부족함에도 불구하고 추진되었다. 결과는 95% 신뢰 구간(CI)과 함께 승산비(OR)로 표시된다. 통계적 유의 수준은 α = 0.05로 설정되었다. 모델에 적합한 GLIMMIX 절차를 포함하여 모든 분석은 SAS 통계 소프트웨어 버전 9.4.4로 수행되었다(SAS Institute Inc., Cary, NC).
Because of nonstatistical significance, the potential modifier effects of faculty age and faculty race, ethnicity, and interactive effects were dropped from the final model. Our primary hypothesis is related to faculty rank, so it was carried forward despite lack of statistical significance. Results are presented as odds ratio (OR) along with 95% confidence intervals (CIs). Statistical significance level was set at α = 0.05. All analyses were conducted with SAS statistical software version 9.4.4, including the GLIMMIX procedure to fit the model (SAS Institute Inc., Cary, NC).

3 결과
3 RESULTS

데이터 세트에는 2007년 1월부터 2021년 4월까지 총 3447명의 학생(표 1)을 대상으로 585명의 교수 평가자가 완료한 50120개의 평가(32024 최종 평가[64%] 및 18096 중간 평가[36%])가 포함되었으며, 총 1418(2.8%)의 LPE가 주어졌다. 조교수가 가장 많은 평가(70%)를 제출했고, 준교수와 정교수(각각 15%)가 그 뒤를 이었다. 여성 교직원이 51.3%의 평가를 제출했으며, 평가 완료 당시 교직원의 중위연령은 43세(28~87세)였다. 텍사스 대학교 시스템이 채용한 인종 및 민족 범주별로 보면, 비히스패닉으로 자처한 교수진이 89%의 평가를 마쳤으며, 백인 46%, 아시아인 30%, 기타 24%가 평가되었다. "낮은" 경험 교수진은 방법에 정의된 대로 38%의 평가를 완료했습니다. "중간" 경험은 21%의 평가를 마쳤고, "높은" 경험 교직원은 42%를 마쳤습니다. 교수진은 최종 평가(1.6%)보다 중간 지점(4.9%)에서 LPE를 줄 가능성이 더 높았다(OR = 4.004, 95% CI [3.59, 4.53]; p < 0.001). 
The dataset included 50 120 evaluations (32 024 final evaluations [64%] and 18 096 middle evaluations [36%]) completed by 585 faculty evaluators on 3447 students (Table 1) between January 2007 and April 2021, with a total of 1418 (2.8%) LPEs given. Assistant professors submitted the most evaluations (70%), followed by associate and full professors (15% each). Female faculty submitted 51.3% of evaluations, and the median age of faculty was 43 (range 28–87 years) at the time the evaluation was completed. Per the race and ethnicity categories employed by the University of Texas system, 89% of evaluations were completed by faculty that self-identified as non-Hispanic, with 46% White, 30% Asian, and 24% Other. “Low” experience faculty completed 38% of evaluations, as defined in the methods. “Middle” experience completed 21% of evaluations, and “high” experience faculty completed 42%. Faculty were more likely to give LPEs at the midpoint (4.9%), compared with the final (1.6%), evaluation (OR = 4.004, 95% CI [3.59, 4.53]; p < 0.001).

표 1은 최종 평가를 위한 단일 변수 연관성과 기술 통계량을 보여줍니다. 최종 평가의 2%는 LPE였다. 조교수가 LPE의 67%, 부교수가 15%, 정교수가 18%로 가장 많았다. 여성 교수진은 LPE의 63%를 주었다. LPE의 90%는 비히스패닉 교수진에 의해 주어졌다. 백인 교수진이 LPE의 47%, 아시아 교수진이 27%, 기타 교수진이 26%를 받았다. 낮은 경험의 교수진은 LPE의 54%, 중간 경험의 교수진은 22%, 그리고 높은 경험의 교수진은 24%를 주었다. 해당 연도에 주어진 총 평가의 백분율로서 연간 LPE의 백분율은 그림 1에 나와 있다. 
Table 1 shows the results of univariable associations and descriptive statistics for final evaluations. Two per cent of final evaluations were LPEs. Assistant professors gave the most LPEs (67%), associate professors gave 15%, and full professors gave 18%. Female faculty gave 63% of LPEs. Ninety per cent of LPEs were given by non-Hispanic faculty. White faculty gave 47% of LPEs, Asian faculty gave 27%, and “Other” faculty gave 26%. Low experience faculty gave 54% of LPEs, 22% by middle experience faculty, and 24% by high experience faculty. The percentages of LPE per year as a percentage of total evaluations given in that year are shown in Figure 1.

표 2는 최종 모델의 결과를 보여줍니다. 귀무 모델은 AIC(Akaike Information Criteria) 적합 통계가 5359.73인 반면, 우리의 최종 모델은 Akaike Information Criteria가 5006.32로 더 적합하다는 것을 보여주었다. 연구 기간 동안 LPE의 가능성은 각 달력 연도에 따라 유의하게 감소했습니다(표 2, OR = 0.94 [0.90, 0.97]; p < 0.01). 정교수는 조교수보다 LPE를 줄 가능성이 유의미하게 높았다(OR = 1.62 [1.08, 2.43]; p = 0.02). 여성이 남성보다 LPE를 투여할 가능성이 더 높았다(OR = 1.88 [1.37, 2.58]; p 0.01). 경험은 LPE와 연관되지 않았습니다.
Table 2 shows the results of our final model. The null model had an Akaike Information Criteria (AIC) fit statistic of 5359.73, whereas our final model had an Akaike Information Criteria of 5006.32, indicating a better fit. The likelihood of LPE decreased significantly with each calendar year during the study period (Table 2; OR = 0.94 [0.90, 0.97]; p < 0.01). Full professors were significantly more likely to give an LPE than assistant professors (OR = 1.62 [1.08, 2.43]; p = 0.02). Women were more likely to give LPEs than men (OR = 1.88 [1.37, 2.58]; p 0.01). Experience was not associated with LPE.

4 토론
4 DISCUSSION

15년에 걸쳐 제출된 이 대규모 임상실습 평가 코호트에서, 우리는 LPE가 상대적으로 드물다는 것을 발견했는데, 이는 모든 최종 평가의 2.8%에 해당한다. 다행히도, [큰 표본 크기]는 우리가 의학 교육에서 드물지만 중요한 사건에 대한 결론을 도출할 수 있게 해주었다.

  • 대부분의 이전 작업은 정성적이었고 더 작은 샘플도 포함했습니다.
  • 다른 연구는 "명예" 등급의 예측 변수에 초점을 맞췄다.
  • 한 대규모 연구는 진급 실패를 예측하기 위해 전공의 평가에서 키워드를 확인했지만, 교수 요인의 역할을 조사하지 않았다.

In this large cohort of clerkship evaluations submitted over 15 years, we found that LPEs were relatively rare, representing 2.8% of all final evaluations. Fortunately, the large sample size allowed us to draw conclusions about this rare but important event in medical education.

  • Most previous work was qualitative and included smaller samples.21 
  • Other research focused on predictors of an “honours” grade.22 
  • One large study identified keywords in resident evaluations to predict failure to progress but did not investigate the role of faculty factors.23 

우리는 또한 주니어 교수진에 비해 시니어 교수진의 낮은 유병률, 특정 임상실습(예: 입원 병동 대 일반 진료소) 및 연도를 포함하여 여러 잠재적 교란자를 제어할 수 있는 정교한 계층적 모델을 구현했다. 이 모델을 기반으로 최종(요약) 평가에 비해 중간점(형식) 평가에서 LPE가 일반적으로 3배 이상 제출되었다. (연구 기간 동안 완료된 평가 횟수로 측정되는) 교수 경험과 무관하게 정교수가 조교수보다 종합 LPE를 제출할 가능성이 더 높았다.  여성은 남성보다 LPE를 투여할 가능성이 더 높았다. 전반적으로 LPE 빈도는 우리 기관의 역량 기반 교육의 직접 관찰 및 구현에 대한 강조가 증가했음에도 불구하고 시간이 지남에 따라 감소하였다. 
We also implemented a sophisticated hierarchical model that allowed us to control for multiple potential confounders including the lower prevalence of senior faculty compared with junior faculty, specific clerkship (e.g., inpatient wards vs. general medicine clinic), and year. Based on this model, LPEs were over three times more commonly submitted at the midpoint (formative) evaluation compared with final (summative) evaluations. Full professors were more likely to submit summative LPEs than assistant professors, independent of faculty experience (as measured by number of evaluations completed during the study period). Women were more likely to give LPEs compared with men. Overall, LPE frequency decreased over time despite increased emphasis on direct observation and implementation of competency-based education at our institution.

비록 이 관찰 연구가 원인을 결정할 수는 없지만, 우리는 주니어 교수진이 부정적인 결과, 특히 학생으로부터의 부정적 평가에 대한 우려 때문에 수준 이하의 학생 성과를 문서화하는 것을 주저할 수 있다고 가정한다. 교직평가는 승진을 위한 평가, 교직상 선정, 기타 승진 및 리더십 기회의 중요한 구성 요소이다. 우리의 가설은 [특정 세부전공 로테이션, 평가 형태 변화, 교수 경험, 시간 경과에 따른 등급 인플레이션 등의 잠재적 교란 요인을 통제]한 후에도 지속된 주니어 교수진과 시니어 교수진 간 등급 차이로 뒷받침된다. 이는 또한 교수진이 개인적인 스트레스, 낙제생으로 인한 행정적 부담, 교수진 개발 부족 또는 연수생 성과에 대한 죄책감을 피하기 위해 LPE를 주는 것을 꺼릴 수 있다는 것을 발견한 이전 연구에서도 입증되었다. 그러나 이러한 원인은 특히 [제출된 평가 수에 따른 경험]을 통제한 후 서로 다른 직급의 교수들 사이에서 일정할 수 있다. [학생으로부터의 우수한 평가를 유지하기 위해 주니어 교수들이 부정적인 피드백을 제공하는 것을 피한다]는 학부 기관의 자료를 볼 때, 의학 교육에서도 비슷한 양상이 나타난다면 놀랄 일은 아닐 것이다. 하지만, 기관들은 승진에서 학생 평가를 탈-강조하는 것을 꺼릴 수 있다. 
Although this observational study cannot determine causes, we hypothesise that junior faculty may be hesitant to document substandard student performance due to fear of negative consequences, particularly poor teaching evaluations. Teaching evaluations are an important component of assessment for promotion, selection for teaching awards, and other advancement and leadership opportunities. Our hypothesis is supported by the difference in grading between junior and senior faculty that persisted even after controlling for specific subspecialty rotations, changes in evaluation forms, faculty experience, and grade inflation over time as potential confounders. This has been documented in previous research, which also found that faculty may also be reluctant to give LPEs to avoid personal stress, the administrative burden caused by failing a student, lack of faculty development, or guilt about trainee outcomes.13 However, these causes would likely be constant among faculty at different academic ranks, especially after controlling for experience based on number of evaluations submitted. Given data from undergraduate institutions that junior faculty avoid providing negative feedback in order to maintain good student evaluations, it would not be surprising if similar patterns were seen in medical education. However, institutions may be reluctant to de-emphasise student evaluations in promotion.24

교수 평가가 진급에 덜 중요할 수 있는 [임상의-연구자]는 승진할 가능성이 더 높고, 더 낮은 평가를 내릴 수 있다. 우리의 데이터 세트는 학생 평가 당시 각 교수진의 특정 트랙(예: 임상의-교육자 및 테뉴어 트랙 연구원)에 대한 정보를 포함하지 않았으며, 연구 기간 동안 승진 지침이 다양했다. 종신 재직권은 조교수나 부교수에 비해 정교수 계급의 교수들 사이에서 더 흔하다. 우리 기관에는 종신 재직 중인 부교수들이 있지만, 종신 재직 중인 정교수의 비율은 훨씬 더 높다. 이는 코호트에서 조교수와 부교수 간에 LPE의 차이를 발견하지 못한 이유를 설명하는 데 도움이 될 수 있지만, 조교수와 정교수 사이에는 차이가 있었다. 향후 연구는 성적 인플레이션, 교수진 및 재직 기간 간의 관계를 조사해야 한다.
Clinician-researchers, for whom teaching evaluations may be less critical for advancement, may be both more likely to be promoted and give lower evaluations. Our dataset did not include information on the specific track (e.g., clinician-educator and tenure-track researcher) of each faculty member at the time of student evaluation, and promotion guidelines varied during the study period. Tenure is more common among faculty at the rank of full professor compared with either associate professors or assistant professors. Although there are tenured associate professors at our institution, the proportion of tenured full professors is much higher. This may help explain why we found no difference in LPEs between assistant and associate professors in our cohort, but there was a difference between assistant professors and full professors. Future studies should investigate the relationship between grade inflation, faculty tracks, and tenure.

교수진이 개별 학생들과 보내는 시간을 제한하는 근무 패턴을 바꾸는 것은 성적 인플레이션에 기여할 수 있다. 과거에는 팀들이 매달 돌아가면서, 교수진들은 시간이 지남에 따라 학생들의 성과를 관찰할 수 있었다. 최근, 2주 또는 심지어 1주 블록이 더 흔해졌다. 이전 연구에서는 학습자와의 시간이 줄어들면 교수진이 낙제 평가를 기꺼이 제출할 가능성도 감소한다고 관찰했습니다. 따라서 "의문의 이점"은 LPE의 빈도를 감소시킬 수 있다.
Changing work patterns that limit the time that faculty spend with individual students may contribute to grade inflation. In the past, teams rotated monthly; thus, faculty were able to observe student performance over time. Recently, 2-week or even 1-week blocks have become more common. Previous studies observed that decreased time with a learner also reduced the likelihood that a faculty would be willing to submit a failing evaluation.13 Thus, the “benefit of the doubt” may decrease the frequency of LPEs.

우리는 교직원의 성별과 인종이 학생 평가에 미치는 영향을 조사했습니다. 인종과 민족은 LPE를 예측하지 못했지만, 비슷한 직위에 있는 남성보다 여성이 LPE를 제출할 가능성이 더 높았다. 남녀 후배 교수진이 부여한 LPE가 승진, 학술상, 리더십 직급에 어떤 영향을 미치는지, 어떻게 영향을 미치는지 판단할 자료가 부족하지만, 이는 향후 조사에 중요한 영역이 될 수 있다.
We investigated the effect of faculty gender and race on student evaluations. Race and ethnicity did not predict LPE, but women were more likely to submit LPEs compared with men at a similar academic rank. We lack the data to determine whether and how LPEs given by male and female junior faculty affect promotion, academic awards, and leadership positions, but these may be important areas for future investigation.

어려움을 겪고 있는 학생들을 정확하게 식별하는 것은 그 학생이 발전하도록 돕는 동시에 공공의 이익을 위해서도 중요하다. 이전의 교육 질 개선 작업은 학생 실패에 대한 근본 원인 분석을 수행했지만 실패가 환자 치료에 미칠 수 있는 영향을 고려할 때 더 심각한 중대 사건이 될 수 있다. 학습자의 성장 마인드를 강조하는 것은 낮은 점수를 교육 성장을 이끄는 도구로 해석하는 데 도움이 될 것이다. 성별, 인종 및 민족성이 평가에 미치는 영향에 대한 교수진과 학생들의 더 나은 교육과 훈련은 또한 그들이 서로에 대해 더 집중적이고 유용한 평가를 제공하는 데 도움이 될 수 있다. 시간이 지남에 따라, 그러한 환경은 더 포괄적인 학습과 전문적 개발을 지원할 것이다. 
Accurately identifying struggling students is important to help the student improve but also for the public good. Previous educational quality improvement work has performed root cause analysis on student failure, but failure to fail may be a more serious critical event given its potential impact on patient care.25, 26 Emphasis on a growth mindset in learners would help them interpret low scores as tools to guide their educational growth.27, 28 Better education and training of faculty and students on the impacts of gender, race, and ethnicity on evaluations may also help them provide more focused, useful assessments of each other.29, 30 Over time, such an environment would support more inclusive learning and professional development.


우리의 데이터는 비록 크지만, 단일 기관에서 가져온 것이다. 따라서, 우리의 연구 결과는 교직원이나 학생의 모집단이 다르거나 다른 채점 시스템(예: Likert-scale 형식이 아닌 서술적 평가)을 가진 다른 기관으로 일반화되지 않을 수 있다. 또한 일반외과 및 산부인과 임상실습은 그룹 평가를 제출하기 때문에 제외했으며, 이는 절차 하위 전문 분야에서 교수진에 대한 일반화 가능성을 제한할 수 있다. 추가 연구는 다양한 채점 메커니즘(합격/실패, 질적 또는 서술적, 조형적 또는 요약적)이 교수진이 표준 이하의 성적을 가진 학생을 식별하는 데 어떻게 도움이 될 수 있는지 조사해야 한다. 최종과 비교하여 중간 지점에서 LPE가 더 자주 주어졌다는 것을 발견한 것은, 평가에서 [중간 지점 LPE]가 우리 코호트에서 희귀했기 때문에 더 많은 조사가 필요하겠지만, 솔직한 피드백이 형성 평가에서 제공될 가능성이 더 높을 수 있음을 시사한다. 낙관적으로, 아마도 CBME 주도 교수 개발은 연구 기간 동안 다양한 상황(예: 구두 또는 EPA 양식의 맥락에서)에서 의미 있는 형성 피드백을 유발했고, 따라서 더 많은 학생들이 역량을 달성하고 LPE를 요구하지 않았다. 기관이 역량 기반 교육을 시행함에 따라 교수진이 기준 미달 성과를 정확하고 신뢰성 있게 식별할 수 없도록 할 수 있는 요인을 이해하고 해결하는 것이 매우 중요하다.

Though large, our data are from a single institution. Thus, our findings may not generalise to other institutions with different populations of faculty or students or different grading systems (e.g., narrative evaluations rather than Likert-scale forms). We also excluded surgery and OB/GYN clerkships because they submit group evaluations, which may limit generalizability to faculty from procedural subspecialties. Further studies should investigate how various grading mechanisms (pass/fail, qualitative or narrative, formative vs. summative) can help faculty identify students with substandard performance. Our finding that LPEs were more frequently given at the midpoint, compared with the final, evaluation suggests that honest feedback may be more likely to be provided at the formative evaluation, although more investigation will be needed, as midpoint LPEs remained rare in our cohort. Optimistically, perhaps CBME-driven faculty development prompted meaningful formative feedback in multiple contexts (e.g., verbally or in the context of our EPA forms) over the study period, and thus, more students achieved competence and did not require an LPE. As institutions implement competency-based education, it is critically important to understand and address factors that may prevent faculty from accurately and reliably identifying substandard performance.

우리의 데이터 세트는 다른 지표로 평가된 학생 인구 통계 및 학생 성과를 포함하여 평가에 영향을 미칠 수 있는 학생 정보를 포함하지 않았다. (예: 시험, 거주 마일스톤 및 환자 결과) 따라서 LPE가 향후 환자 치료와 관련이 있는지 여부를 알 수 없다. 학습자의 종단적 추적은 LPE가 역량 결손 학생을 얼마나 신뢰성 있게 식별하는지, 문제가 있는 의사가 의과대학에서 LPE를 받았는지 여부를 결정하는 데 도움이 될 수 있다. 우리의 연구 결과는 의대생들의 정확한 평가에 대한 장벽을 조사하는 향후 연구를 안내할 수 있으며, CBME가 전문적 성장과 환자 안전에 대한 잠재력에 도달할 수 있도록 한다. 
Our dataset did not contain student information that may have influenced evaluations, including student demographics and student performance as assessed with other indicators (e.g., exams, residency milestones, and patient outcomes). Thus, we do not know whether LPEs are related to future patient care. Longitudinal follow-up of learners can help determine how reliably LPEs identify students with competency deficits and whether problematic physicians received LPEs during medical school. Our findings can guide future research investigating the barriers to accurate evaluation of medical students, allowing CBME to reach its potential for professional growth and patient safety.


 

Med Educ. 2022 Jun;56(6):634-640. doi: 10.1111/medu.14725. Epub 2022 Jan 12.

Role of faculty characteristics in failing to fail in clinical clerkships

Affiliations collapse

Affiliations

1Department of Internal Medicine, Mc Govern Medical School, University of Texas Health Science Center at Houston, Houston, Texas, USA.

2Division of Hospital Medicine, San Francisco General Hospital, San Francisco, California, USA.

3Division of Health Policy and Management, School of Public Health, University of California, Berkeley, Berkeley, California, USA.

4School of Biomedical Informatics, University of Texas Health Science Center at Houston, Houston, Texas, USA.

5Division of Clinical and Translational Sciences, Department of Internal Medicine, McGovern Medical School, Houston, Texas, USA.

6Department of Epidemiology, Human Genetics, and Environmental Sciences, School of Public Health, The University of Texas Health Science Center at Houston, Houston, Texas, USA.

PMID: 34983083

DOI: 10.1111/medu.14725

Abstract

Introduction: In the context of competency-based medical education, poor student performance must be accurately documented to allow learners to improve and to protect the public. However, faculty may be reluctant to provide evaluations that could be perceived as negative, and clerkship directors report that some students pass who should have failed. Student perception of faculty may be considered in faculty promotion, teaching awards, and leadership positions. Therefore, faculty of lower academic rank may perceive themselves to be more vulnerable and, therefore, be less likely to document poor student performance. This study investigated faculty characteristics associated with low performance evaluations (LPEs).

Method: The authors analysed individual faculty evaluations of medical students who completed the third-year clerkships over 15 years using a generalised mixed regression model to assess the association of evaluator academic rank with likelihood of an LPE. Other available factors related to experience or academic vulnerability were incorporated including faculty age, race, ethnicity, and gender.

Results: The authors identified 50 120 evaluations by 585 faculty on 3447 students between January 2007 and April 2021. Faculty were more likely to give LPEs at the midpoint (4.9%), compared with the final (1.6%), evaluation (odds ratio [OR] = 4.004, 95% confidence interval [CI] [3.59, 4.53]; p < 0.001). The likelihood of LPE decreased significantly during the 15-year study period (OR = 0.94 [0.90, 0.97]; p < 0.01). Full professors were significantly more likely to give an LPE than assistant professors (OR = 1.62 [1.08, 2.43]; p = 0.02). Women were more likely to give LPEs than men (OR = 1.88 [1.37, 2.58]; p 0.01). Other faculty characteristics including race and experience were not associated with LPE.

Conclusions: The number of LPEs decreased over time, and senior faculty were more likely to document poor medical student performance compared with assistant professors.

내과와 외과에서 교수자와 학습자 정체성의 사회적 구성(Med Educ, 2022)
The social construction of teacher and learner identities in medicine and surgery
Peter Cantillon1,2 | Willem De Grave2 | Tim Dornan3

 

 

1 소개
1 INTRODUCTION

대학원 의학 교육(PGME)에 역량 기반 교육과정이 널리 채택되면서 임상 교사의 기대와 책임감이 크게 높아졌다. 이에 대응하여, 교수진 개발(FD)의 '지수적' 증가가 있었다.2 임상 교육을 전문화하려는 FD의 노력에도 불구하고, 임상 감독 품질과 학습자의 판단에 우려스러운 불일치가 남아 있다. 더욱이 교육생들에게 의미 있는 실습 참여 기회가 충분히 주어지지 않고 있다는 우려도 커지고 있다. [교사 자격]을 부여하고, [독립적인 교수 기술 워크샵]을 제공하는 것의 교육 효과는 실제로 잘 전달되지 않았고, 지속 가능한 것으로 입증되지 않았음이 분명하다. 이러한 실망스러운 영향은 교사 발전을 저해하는 임상 작업장의 문화적, 조직적 요인 특성으로 인한 것이다. 이러한 문제는 사회적, 문화적 맥락이 교수와 학습의 관행을 어떻게 형성하는지에 대한 경험적 연구의 부족으로 인해 복잡해진다.
The widespread adoption of competency-based curriculums in postgraduate medical education (PGME) has greatly increased the expectations and responsibilities of clinical teachers.1 In response, there has been an ‘exponential’ increase in faculty development (FD).2 Despite FD efforts to professionalise clinical education, there remain worrying inconsistencies in the quality of clinical supervision and the adjudication of learners. Moreover, there are growing concerns that trainees are not being given sufficient opportunities to participate meaningfully in practice.2-4 It is clear that the educational effects of credentialing teachers and providing standalone teaching skills workshops have neither transferred well into practice, nor proved sustainable.5-9 This disappointing impact has been attributed to cultural and organisational factors features of clinical workplaces that undermine teacher development.6, 7 These problems are compounded by a lack of empirical research into how social and cultural contexts shape the practices of teaching and learning.10, 11

[교수, 학습 및 문화적 맥락 사이의 관계]는 FD 학문을 뒷받침하는 인지 모델보다 [사회 문화 이론]과 더 잘 일치한다. 사회문화적 관점에서 임상교육은 병원, 임상팀 등 [기관의 공유된 활동]에 참여하고, 특정한 문화적 맥락 속에서 정체성이 형성된 사람이 되는 과정이다. [정체성 형성, 임상 감독 및 문화적 맥락]의 영향이 서로 어떻게 관련되는지에 대한 연구는 거의 없었다.

  • 자기보고 연구는 졸업후 수련생들이 공유 관행, 경험칙, 내재된 이해를 어떻게 숙달하는지 보여주었지만, 그러한 방법론은 문화적 맥락의 암묵적 영향에 크게 둔감해 왔다.
  • 관찰 연구는 졸업후 학습자들이 사회적으로 승인된 토큰 행동을 재현함으로써 임상 팀에서 정당성을 추구하는 방법을 보여주었지만, 사회적 문화적 맥락이 교사와 학습자의 역할을 어떻게 형성하는지 보여주지 않았다.

The relationship between teaching, learning and cultural context aligns better with sociocultural theory than the cognitive models that underpin much FD scholarship.12 From a sociocultural perspective, clinical education is a process of participating in the shared activities of institutions such as hospitals and clinical teams, and ‘becoming’13 a person whose identity is forged in particular cultural contexts.14-18 There has been little research into how identity formation, clinical supervision and the influence of cultural context relate to one another.19 

  • Self-report studies have shown how postgraduate trainees master shared practices, rules of thumb and embodied understandings,20-24 but such methodologies have been largely insensitive to the implicit effects of cultural context.2526 
  • Observational studies have shown how graduate learners seek legitimacy in clinical teams by reproducing socially sanctioned token behaviours, but not how social and cultural contexts shape the roles of teachers and learners.27-35

이에 대응하여, 우리는 [임상 교육, 학습 및 사회적 맥락 사이의 관계에 대한 위치적 이해situated understanding]를 개발하기 위한 연구 프로그램을 시작했다. 우리의 목적은 미래의 상황에 민감한 FD 이니셔티브에 정보를 제공하는 이론적 프레임워크를 개발하는 것이었다. 1년(2016~2017년) 동안 두 개의 개별 교육 병원에서 네 개의 병원 팀(내과 2개 및 외과 2개)에 대한 민족지학은 풍부한 데이터 세트를 산출했다. 우리는 [고프만의 연극적 접근 이론]을 사용하여 [선생님과 학습자 정체성, 교육 실습, 그리고 임상 팀에서의 참여를 전형적으로 보여주는 대화와 행동 방식]을 탐구했습니다. 이를 통해 [임상교사]는 팀의 암묵적 커리큘럼인 규범과 기대치를 [명확히 표현하기articulate]보다는 [체화embodied]했음을 알 수 있었다. 교육생들은 능력 있는 팀 참여자로써의 인상을 심어주기 위해 교사들의 구체화된 기준을 재현하는 것으로 응답했다. 그러나 이 방법론은 [교수와 학습에 대한 전공-특이적 문화의 shaping effect에 둔감]하다는 것이 입증되었다. 이 논문의 목적은 [외과와 내과(IM)라는 두 주요 전공의 대조적인 문화]가 [교사와 학습자의 정체성 형성]에 어떤 영향을 미치는지 확인하기 위해 Figured Worlds라는 이론적 틀을 사용하여 관찰 데이터를 재분석하는 것이었다. 연구 질문은 다음과 같았다. 작업, 학습 및 교수와 관련된 실습이 있는 전문 임상 팀의 문화적 세계에서 교사와 학습자의 정체성은 어떻게 상호 작용합니까?
In response, we launched a programme of research to develop a situated understanding of the relationship between clinical teaching, learning and social context. Our purpose was to develop a theoretical framework that would inform future contextually sensitive FD initiatives. An ethnography of four hospital teams (two internal medicine and two surgical) in two separate teaching hospitals over a period of 1 year (2016–2017) yielded a rich dataset.19 We used Goffman's dramaturgical theory, to explore the relationship between teacher and learner identity, educational practice and ways of talking and acting that typify participation in clinical teams. This showed that clinical teachers embodied rather than articulated their teams' implicit curriculum of norms and expectations. Trainees responded by reproducing teachers' embodied standards to create impressions of themselves as capable team participants.19 This methodology proved insensitive, however, to the shaping effect of specialty-specific culture on teaching and learning. The aim of this paper was to reanalyse the observational data using a theoretical framework, Figured Worlds, to identify how the contrasting cultures of two major specialties, surgery and internal medicine (IM), influenced teachers' and learners' identity formation. The research question was as follows: How do the identities of teachers and learners interplay with one another in the cultural worlds of specialty clinical teams where the linked practices of working, learning and teaching are situated?

1.1 이론적 틀
1.1 Theoretical framework

[형상화된 세계]는 [정체성 형성과 문화 사이의 관계]를 조사하기 위한, 개념적이고 분석적인 도구를 제공하는 비판적인 이론이다. 형상화된(또는 문화적) 세계는 특정한 경험, 대화 및 행동 방식, 사회적 가능성을 제공하는 사회 역사적 맥락(예: 임상 팀의 구성원)이다. 형상화된 세계 내에서 정체성은 (개인에게) 소유되지 않는다; 그것은 역동적이고 진화하고, 말과 다른 상징적 행위에 의해 구성되며, 개인과 그들이 살고 일하는 문화 세계 사이의 상호 작용에서 형태를 찾는다. Bakhtin의 [대화주의 이론]을 바탕으로 유도된 이 이론에서, [형상화된 세계]는 [말speech 및 다른 상징적 행위들]이 개인들에게 [문화적 세계]에서 [자기 저자의 정체성]에 대한 [행위자성agency]을 준다고 가정한다. 형상화된 세계에서

  • ['형상figure']이라는 용어는, 예를 들어 (전공의들이 배우는) 교수자에 의해 실체화되는 [정체성 가능성]을 가리킨다.
  • ['형상화figuring']이라는 용어는 겉으로는 [역할 모델링]을 닮았지만, 역할을 동화시키기보다는, [자신의 정체성을 형성하는데 있어 학습자의 행위자성agency을 더 강조]한다는 점에서 차이가 있다.
  • 이러한 차원에서 ['모델링']이라는 용어를 사용할 때, 우리는 [학습자를 위해 기술을 보여주거나 명확한 사고를 하는 상황에서의 교사의 행동]을 구체적으로 언급하고 있다.
  • 또한 모델링과 코칭도 구별하는데, ['코칭']이란 [교사가 학습자의 성과를 관찰하고 성장과 발전을 지원하기 위해 피드백을 제공하는 것]을 설명한다.

Figured worlds is a critical theory that provides conceptual and analytical tools to examine relationships between identity formation and culture.36 A figured (or cultural) world is a socio-historical context (e.g. membership of a clinical team) that affords particular experiences, ways of talking and acting and social possibilities.16 Identity, within Figured Worlds, is not possessed; it is dynamic and evolving, constructed by speech and other symbolic acts, finding form in the interactions between individuals and the cultural worlds that they live and work in.37 Drawing on Bakhtin's theory of Dialogism, Figured Worlds assumes that speech and other symbolic acts give individuals agency to self-author identities in cultural worlds.15, 16, 38 In Figured Worlds,

  • the term ‘figure’ refers to the identity possibilities that are embodied by, for example, teachers from whom residents learn.36 
  • The term ‘figuring’ superficially resembles role modelling but differs in how it places greater emphasis on learners' agency in forging their own identities, rather than assimilating roles.36-38 
  • In this account, when we use the term ‘modelling’, we are referring specifically to the actions of teachers in demonstrating skills or articulating thinking for learners.39
  • We also differentiate between modelling and coaching where ‘coaching’ describes when teachers' observe learners' performances and provide feedback to support growth and development.40

 

  • [형상화된 세계]는 높은 수준의 제도적, 사회역사적 담론(Gee가 대문자 D 담론Discourse이라고 부르는)이 문화 세계를 구성하고, 사회적 지위를 창출하며, 다른 정체성을 가진 사람들이 이러한 입장을 이용할 수 있게 만든다는 것을 인정한다.
  • 중요한 것은, [형상화된 세계]는 또한 학자들이 [일상적 이야기(소문자 D 담론discourse)]의 내용이 사람들에게 [대문자 D (big-D) 담론]의 구조화 효과에 저항할 수 있는 에이전시를 제공한다는 것을 밝힐 수 있게 해준다.

이러한 방식으로 (작은-D) 담론의 일상적인 사용은 (큰-D) 담론을 구성하고 재구성한다. 이 연구에서, 우리는 피규어 세계 이론의 언어 개념을 사용하여 개인이 문화 세계를 탐색할 수 있는 기관을 제공하는 활동 중인 문화 세계(예: 외과와 내과의 문화에 특화된 교육 의식)와 일상 언어(담화)에 대한 우리의 민족학적 관찰을 이해했다.

  • Figured worlds acknowledges that high-level institutional and sociohistorical discourses (which Gee terms big-D Discourses) structure cultural worlds, create social positions, and make those positions more or less available to people with different identities.41 
  • Importantly, Figured Worlds also allows scholars to reveal how the contents of everyday speech (little-d discourse) give people agency to resist the structuring effect of big-D Discourses.3641 

In this way, the everyday use of (small-d) discourse constructs and reconstructs (big-D) Discourses.41 In this study, we used Figured Worlds theory's linguistic concepts to make sense of our ethnographic observations of cultural worlds in action (e.g. the educational rituals particular to the cultures of surgery and IM) and everyday speech (discourse), which give individuals agency to navigate cultural worlds.

2 방법
2 METHODS

2.1 설정 및 시료
2.1 Setting and sample

이 기사는 아일랜드에 있는 두 개의 개별 교육 병원에서 외과 및 내과 임상 팀의 일상적인 작업 및 학습 환경에서 임상 교육이 어떻게 실현되는지 탐구하기 위해 수행된 민족지학에 대한 2차 분석을 보고한다. 병원은 아일랜드에 인접한 두 도시의 도시 인구를 포괄하는 비슷한 규모의 병원이었다. 우리는 외과와 내과가 사회-역사적 기원이 매우 다른 같은 직업 내에서의 관행을 나타내기 때문에 선택했다. 표본추출전략은 연극적 접근 연구를 위해 선택되었으나, 의학교육에서 정체성 형성에 대한 문화적 요인의 영향을 탐구하는 데도 적합하였다.
This article reports a secondary analysis of an ethnography, carried out to explore how clinical education is actualised in the day-to-day working and learning environments of a surgical and an IM clinical team, in each of two separate teaching hospitals in Ireland. The hospitals were of similar size covering largely urban populations in two adjacent Irish cities. We selected surgery and IM because they represent practices within the same profession whose socio-historical origins are very different. Although the sampling strategy was chosen for dramaturgical research, it was well suited also to exploring the influence of cultural factors on identity formation in medical education.

각 병원의 '문지기'가 모든 임상 팀에 연구에 대한 정보를 제공하는 전단지를 배포했다. 그리고 나서 수석 저자(PC)는 대부분의 팀이 참가한 의료 및 외과 그랜드 라운드에서 이 연구에 대해 말했습니다. 그는 참가 제의를 초청했고 그들이 자원한 순서대로 팀들을 포함시켰다. 포함된 이들은 1명 이상의 수석 컨설턴트 전문가, 1~2명의 선임 전문의 등록자(시니어 레지던트) 및 2~4명의 주니어 훈련생(시니어 레지던트)으로 구성되어 있다는 점에서 아일랜드의 전형적인 임상 팀 단위였다.
A ‘gatekeeper’ in each hospital distributed a leaflet giving information about the study amongst all clinical teams. The lead author (PC) then spoke about the study at medical and surgical grand rounds where most teams were represented. He invited offers to participate and included teams in the order they volunteered. Those included were typical of clinical team units in Ireland in that they were composed of one or more lead consultant specialists, one or two senior specialist registrars (senior residents) and two to four junior trainees (junior residents).

2.2 연구윤리 승인 및 참여자 정체성 보호
2.2 Research ethics approval and protection of participant identity

민족지학적 설계 및 관련 데이터 수집 방법은 두 개의 참여 교육 병원의 연구 윤리 위원회에서 승인되었다(참고 자료: C.A. 1150 및 062/16). 모든 참여 팀원들은 결과를 발표하려는 의도를 포함한 연구에 대한 정보 시트를 받았다. 모두 연구에 참여하겠다는 서면 동의를 제공했다. 비디오 또는 이미지 데이터에 우연히 포함된 환자 또는 의료진은 연구자의 연락처 정보가 포함된 정보 시트를 받았고, 데이터 세트에 포함되도록 구두 동의를 하기 전에 이를 읽어보도록 요청받았다. 그러한 동의가 나오지 않으면 관련 데이터 세그먼트를 삭제했습니다.

The ethnographic design and its associated data collection methods were approved by the research ethics committees of the two participating teaching hospitals (references: C.A. 1150 and 062/16). All participating team members received an information sheet about the research including the intention to publish the results. All provided written consent to participate in the research. Any patients or health care staff who were incidentally included in video or image data received an information sheet with researchers' contact details, which they were asked to read before giving verbal consent to be included in the dataset. If such consent was not forthcoming, we deleted the relevant data segments.

2.3 데이터 수집
2.3 Data collection

주요 저자(PC)는 2016-2017년 12주에서 16주 동안 각 팀에 [한계 참가자 관찰자marginal participant observer(즉, 관찰하고 때로는 활동에 참여하기도 함)]로 자신을 포함시켰다. 그는 병동 라운드, 다학제 팀 회의, 수술 극장, 커피 휴식, 그리고 그랜드 라운드와 같은 공식적인 교육 행사를 포함하여 매주 약 2일 동안 각 팀의 활동에 참석했다. 그는 동시 현장 기록, 디지털 이미지, 외래 환자 접견 비디오 녹화, 모든 참가자와의 종료 인터뷰 등 다양한 형식으로 데이터를 수집했다. 매일 관찰이 끝날 때, PC는 그의 동시 필드 노트를 그가 관찰한 것에 대한 풍부한 설명으로 발전시켰다. 비디오에 캡처된 출구(반구조 인터뷰)와 교사-학습자 상호 작용은 전문적으로 기록되고 가명이 붙었다. Akvis Sketch 23.5 소프트웨어를 사용하여 디지털 이미지와 비디오 스틸에 캡처된 개인들의 모습을 위장하고 식별할 수 없게 만들었다. 

The lead author (PC) embedded himself as a marginal participant observer42 (i.e. he observed, and at times partook in activity) in each team for between 12 and 16 weeks in 2016–2017. He attended each team's activities for approximately 2 days each week including ward rounds, multidisciplinary team meetings, surgical theatre, coffee breaks and formal educational events such as grand rounds. He collected data in multiple formats including contemporaneous field notes, digital images, video-recordings of out-patient encounters and exit interviews with all participants. At the end of each day of observation, PC developed his contemporaneous field notes into rich descriptions of what he had observed. Exit (semi-structured interviews) and teacher–learner interactions captured on video were transcribed verbatim and pseudonymised. Likenesses of individuals captured in digital images and video stills were disguised and rendered unidentifiable using Akvis Sketch 23.5 software.43

2.4 데이터 분석
2.4 Data analysis

우리의 지향이 형상화된 세계였기 때문에, [언어 분석]은 [문화적 세계가 어떻게 특정한 말하기와 행동 방식을 특권화하고, 개인이 어떻게 그 세계 내에서 정체성을 형성하는지]에 영향을 미칠 것이라고 가정할 수 있었다. 형상화된 세계에 관한 [두 가지 중요한 개념]은 분석 도구와 설명 능력을 제공했습니다.36

  • '포지셔닝'은 [타인의 발언]이 정체성 가능성을 부여하거나 보류하는 방법을 말한다.
  • '자기저작'어떤 방식으로 개인이 다른 사람의 말을 [자신의 연설 행위에 통합]하여, 입장을 협상하고, 만들거나, 경쟁하는지를 말한다.

Our orientation toward Figured Worlds empowered us to assume that analysing language would show how cultural worlds privileged particular ways of talking and behaving and would influence how individuals could form identities within those worlds. Two important Figured Worlds concepts provided analytical tools with explanatory power.36 

  • ‘Positioning’ refers to how other people's speech grants or withholds identity possibilities.1618 
  • 'Self-authoring’ refers to how individuals incorporate other people's speech into their own speech acts to negotiate, create or contest positions.36


데이터 세트에는 640시간의 관찰에서 얻은 필드 노트, 참여 팀원에 대한 34건의 출구 인터뷰 기록(외과적 16건, IM 18건), 30시간의 외래 환자 비디오 녹화 및 현장 사진 촬영이 제공하는 디지털 이미지가 포함되어 있었다. NVivo 12 소프트웨어(QSR International 2018)는 새로운 해석을 포착하기 위해 메모 기술을 사용하여 원본 데이터와 데이터 표현 사이를 반복적으로 이동했던 분석을 촉진했다. PC가 분석을 주도하고 메모를 작성했다. TD와 WdG는 정기적으로 PC와 만나 해석을 검토했다.

The dataset included field notes from 640 hours of observation, transcripts of 34 exit interviews with participating team members (16 surgical and 18 IM), 30 hours of out-patient video-recordings and digital images provided by in-the-field photography. NVivo 12 software (QSR international 2018) facilitated analysis, which moved iteratively between original data and representations of the data, using memoing techniques to capture emerging interpretations. PC led the analysis and wrote the memos. TD and WdG met regularly with PC to review the interpretation.

외과 데이터 세트와 내과 데이터 세트를 구별되는 두 개의 형상화된 세상으로 취급[첫 번째 분석 단계]는 표 1에 열거된 형상화된 세계의 [핵심 구성 요소]를 체계적으로 모색했다. 실제로 이것은 의미 있는 행위, 형상화된 유형(예: 특정 전문 분야의 교사), 문화적으로 중요한 유물 및 기타 장르를 식별하기 위해 현장 노트, 인터뷰 및 비디오 녹취록을 읽고 다시 읽는 것을 의미했다. 우리는 비디오 또는 디지털 이미지에 존재하는 [언어적 증거, 기호 또는 행동]이 [실증적 지원empirical support]을 제공할 때 [해석적 추론이 유효하다]고 간주했다. 우리는 이 증거를 사용하여 참가자들의 [의사소통적 행동]이 어떻게 그들의 [정체성 위치]를 '조정orchestrated'하는지 조사했다.
The first phase of analysis, which treated the surgical and IM datasets as two distinct figured worlds, systematically sought key components of Figured Worlds,36, 41 which we list in Table 1. In practice, this meant reading and rereading field notes, interviews and video transcripts to identify meaningful acts, figured types (e.g. teachers in a particular specialty), culturally significant artefacts and other genres listed in Table 1. We regarded interpretive inferences as valid when linguistic evidence, symbols or behaviours present in video or digital images provided empirical support.41 We used this evidence to examine how participants' communicative actions ‘orchestrated’36 their identity positions.

두 번째 분석 단계에서는 수술과 IM의 다른 세계를 특징짓는 '정체성 작업'(즉, 사회적 맥락에서 신분적 위치의 협상)의 패턴을 확인했다. 우리는 수술과 IM의 문화적 세계에 대한 서술적 요약을 합성하기 위해 필드 노트 관찰, 음성 언어의 발췌 및 비디오 녹취록을 사용했다.
The second phase of analysis identified patterns of ‘identity work’ (i.e. the negotiation of identity positions in social contexts) that characterised the different worlds of surgery and IM. We used field note observations, excerpts of spoken language and video transcripts to synthesise a narrative summary of the cultural worlds of surgery and IM.

 

2.5 엄격함과 반사성
2.5 Rigour and reflexivity

Figured Worlds에 의해 민감해진 우리는 [원시 데이터]에서 [해석]으로 이동하기 위해 [풍부한 설명, 결정화 및 다중 음성성]을 사용했다. 우리는 독립적으로 자료를 읽은 두 사람 사이의 해석에 동의했다. 우리는 둘 이상의 출처로부터 증거를 구함으로써 해석의 신뢰성을 강화했다. 예를 들어, 필드 노트와 인터뷰 데이터는 시간이 지남에 따라 반복됩니다. 우리는 동일한 분야의 다른 개별 참가자와 다른 팀 간의 유사성과 차이를 추구함으로써, [다중 음성성]의 피규어 월드 개념을 적용했다.36 우리는 다음의 두 가지 방법으로 해석의 타당성에 대한 참가자들의 의견을 구하였다. 첫째, 전문분야별 참가자 그룹과 해석에 동의하고, 둘째, 개별 참가자에게 원본 데이터의 샘플과 그들에 대한 우리의 해석을 보여줌으로써 해석한다. 이러한 타당성 협상은 우리의 해석과 결론을 다듬었다.
Sensitised by Figured Worlds, we used rich description, crystallisation and multi-vocality44, 45 to move from raw data to interpretation. We agreed interpretations between two people who had independently read the data.44 We strengthened the trustworthiness of our interpretation by seeking evidence from more than one source: for example, field note and interview data repeated over time.45 We applied the Figured Worlds concept of multi-vocality by seeking similarities and differences between different individual participants and different teams in the same discipline.36 We sought participants' opinions about the validity of our interpretation in two ways: first by agreeing interpretations with specialty-specific groups of participants and second by showing individual participants samples of original data and our interpretations of them. These validity negotiations refined our interpretations and conclusions.

최선의 민족지학적 연구 관행에 따라, 우리는 언어와 실천의 다른 당연시되는 측면을 면밀히 조사하기 위해 내부자(PC: 일반의사; TD: 병원 전문가)와 외부자(WdG: 교육심리학자)의 관점을 사용했다. PC는 개인적인 관점, 관찰 및 해석 사이의 관계를 면밀히 조사하기 위해 반사적인 일지를 작성했습니다.
In keeping with best ethnographic research practice,42 we used our insider (PC: general practitioner; TD: hospital specialist) and outsider (WdG: educational psychologist) perspectives to scrutinise otherwise taken-for-granted aspects of language and practice. PC kept a reflexive diary to ensure that the relationship between personal perspectives, observations and interpretations was available for scrutiny.

3 결과
3 RESULTS

외과 의사나 의사가 되는 것은 수술과 IM의 문화적 세계에 특유한 지식과 행동의 문화적인 가치 있는 방법에 의해 형성되었으며 그들의 전문적 관행과 불가분의 관계에 있었다.
Becoming a surgeon or a physician was shaped by culturally valued ways of knowing and acting peculiar to the cultural worlds of surgery and IM and was inextricably linked to their specialty-specific practices.

3.1 외과에 대한 핵심 아티팩트 및 관행
3.1 Core artefacts and practices in surgery

외과의 [핵심 행위]는 질병의 해부학적 징후를 확인하고 수정하는 것이었다. 교사와 제자 학습자 사이의 근위적 코칭 관계는 지배적인 [문화적 유물]인 [환자의 신체]에 초점을 맞췄다. 내과적 문화보다 [외과적 학습 문화]가 더 대립적confrontational이었다. 외과의사들은 훈련생들을 면밀히 관찰하고, 특히 수술실에서 그들의 의료행위를 면밀히 조사했다. 
The core practice of surgery was identifying and correcting anatomical manifestations of disease. Proximal, coaching relationships between teachers and their protégé learners centred on the dominant cultural artefact: the patient's body. The surgical learning culture was more confrontational than the culture of IM. Surgeons observed trainees closely and scrutinised their practice, particularly in theatre.

아, 수술에 들어갈 때 주변 환경을 의식하기 때문에 정밀 조사scrutiniy 수준에 충격을 주고 있습니다. 여러분이 시작할 때, 그것은 여러분이 물건을 들고 있는 방식입니다. 여러분의 외과의사가 여러분을 보고 있는 선배 동료들이 여러분을 보고 있는 방식입니다. 마취과 의사들이 여러분을 보고 있고, 여러분과 간호사들에 대한 의견을 형성하는 방식도 마찬가지입니다. (H1 T2 전공의 인터뷰)

Oh it's shocking the level of scrutiny because when you scrub in you are conscious of your surroundings. When you start off, it's the way you hold stuff, the way your surgeon is looking at you your senior colleagues are looking at you, anaesthetists are looking at you, and forming opinions about you and the nurses are too. (H1 T2 resident interview)

3.2 내과의 핵심 자료 및 관행
3.2 Core artefacts and practices in IM

IM에서 가장 중요한 [문화적 유물]은 환자의 임상 기록과 팀 구성원 간에 소통하고 협상하는 프레젠테이션의 인지적 표현이었다. 여기서, [핵심 행위]은 환자들이 어떻게 표현했는지에 대한 그럴듯한 추상적인 표현을 만들고 조작하는 것이었다. 이러한 표현은 [교사-학습자 관계]를 알려줬는데, 이는 수술에서의 관계보다 더 먼 관계였다. 내과적 행위가 대체로 불투명하고 인지적이라는 특성을 고려할 때, 교사들은 [교육]을 [피교육자가 인식하고 재현할 수 있는 방식으로 사고와 행동을 언어화하는 것]으로 프레임하였다. 예를 들어, 한 컨설턴트는 사례 발표 중에 연습생들이 환자의 사회 및 과거 이력을 탐색했는지 반복적으로 확인하는 그의 습관에 대해 이야기하면서 '내가 전하고 싶은 것은 당신이 질문해야 할 중요한 질문들이다'(H1T1 IM 컨설턴트 1 인터뷰)라고 설명했다. 내과 의사들은 [학습자들이 자기 주도적이고 독립적일 필요가 있다는 것]을 강조했다. 예를 들어, 컨설턴트는 병동에 대한 대학원 임상 교육을 다음과 같이 개념화했다. '그들[연수생]은 책임을 져야 한다. 스스로 배우게 해야 한다… 스스로 배우고 보여줘야 한다'(H1 T1 IM 컨설턴트 2 인터뷰). 내과에서 [사고의 모델링]를 강조하고, 훈련생들이 [자기주도적으로 학습]하도록 장려하는 것은, [외과적 교육]을 특징짓는 훈련생들의 [행위에 대한 집중적인 관찰과 코칭]과 강한 대조를 보였다.
In IM, the most important cultural artefacts were patients' clinical records and cognitive representations of their presentations as communicated and negotiated between team members. Here, the core practice was creating and manipulating plausible abstract representations of how patients had presented. These representations informed teacher–learner relationships, which were more distal than relationships in surgery. Given the largely opaque, cognitive nature of IM practice, teachers framed teaching as verbalising their thinking and acting in ways that trainees could recognise and reproduce. When talking about his habit of repeatedly checking during case presentations whether trainees had explored their patients' social and past histories, for example, one consultant explained: ‘What I'm hoping to transmit is that these are the important questions you need to ask’ (H1 T1 IM consultant 1 interview). IM physicians' talk emphasised the need for learners to be self-directed and independent. For example, a consultant conceptualised postgraduate clinical education on the wards as follows: ‘they [the trainees] need to be taking responsibility. You have to let them learn by themselves … They need to learn and show learning themselves’ (H1 T1 IM consultant 2 interview). The emphasis in IM on modelling thinking and encouraging trainees to learn self-directedly contrasted strongly with the intense observation and coaching of trainees' practice, which characterised surgical education.

3.3 외과팀과 IM팀의 문화적 세계 비교
3.3 Comparing the cultural worlds of surgical and IM teams

표 2는 수술과 IM의 문화적 세계에서 특히 중시되었던 알고, 보고, 말하고, 존재하는 방법을 보여줍니다. 주요 임상의는 표 2에 표시된 배치와 능력을 파악하고 명확하게 설명했으며, 훈련생은 이를 각자의 전문 분야에서 유능한 참여자로 자리매김하기 위해 사용했다.

Table 2 illustrates ways of knowing, seeing, talking and being that were particularly valued in the cultural worlds of surgery and IM. Lead clinicians figured and articulated the dispositions and capabilities shown in Table 2, which trainees used to position themselves as capable participants in their respective specialties.

3.4 공식 교육 이벤트에서의 정체성 작업
3.4 Identity work in formal educational events

3.4.1 외과 그랜드 라운드
3.4.1 Surgical grand rounds

[외과 그랜드 라운드]는 매주 미리 선정된 수술팀이 지난 달부터 흥미롭고 도전적인 사례를 동료 외과 의사들과 훈련생들의 비판적인 청중에게 들려주는 교육 행사였다. [외과 그랜드 라운드]라는 '게임'에서, 레지던트는 치열한 회의 환경에서 자신 있게 사례를 제시해 자신의 수술팀을 능력 있는 사람으로 파악해야 했다. 발표 팀의 구성원들은 수술 사례 발표 동안 청중들로부터 [날카롭고 때로는 공격적인 질문]을 받았다. 질문은 질문자들을 능력 있는 사람으로 포지셔닝하는 방식으로 표현되었고, 발표 팀은 방어적인 자세를 취했다: '전립선암에 사용하는 스테이징 기준은 우리가 유방암에서 사용하는 것과 비교하여 매우 구식이며 왜 당신은 여전히 그러한 "분변 횡단" 생체 검사를 하고 있습니까? 그들은 심각한 감염률을 가지고 있습니까?' (H1 T2 필드 노트)
Surgical grand rounds were educational events in which, each week a pre-selected surgical team narrated interesting or challenging cases from the previous month to a critical audience of fellow surgeons and trainees. The surgical grand rounds ‘game’ required a resident to figure his or her surgical team as capable by confidently presenting cases in an intense conference environment. Members of the presenting team were subjected to pointed and at times aggressive questions from members of the audience during surgical case presentations. Questions were expressed in ways that positioned questioners as capable, while putting the presenting team on the defensive: ‘The staging criteria you use for prostatic cancer are very outdated compared to those we use in breast cancer and why are you still doing those “trans-faecal” biopsies? They have a serious infection rate?’ (H1 T2 Field notes).

외과의사들은 청중들에게 종종 [상당한 평판 훼손의 위험]을 수반하는 빠르고 도전적인 질문 전략을 시행했다: '여기 무슨 일이 일어나고 있는 거지? 자, 여러분, 뻔한 일이에요. 누구 해보실 분 있나요?' (H2T2 필드 노트) 외과의사들은 미래의 외과의들이 그들이 자기스스로 생각할 수 있도록 준비하기 위한 적절한 방법으로 수술 그랜드 라운드의 특징인 [투쟁적이고 도전적인 행동]을 작성author했다.
Surgeons subjected audience members to rapid and challenging question strategies that often carried considerable risk of reputational damage: ‘Okay what's going on here? Come on everyone it's obvious. Is anyone going to have a go?’ (H2 T2 Field notes). Surgeons authored the combative and challenging behaviours characteristic of surgical grand rounds as an appropriate way of preparing future surgeons to think on their feet.

당신은 좋은 편안한 환경이 좋은 교육에 도움이 된다고 주장할 수 있지만, 우리는 그들을 전문적인 활동을 위해 준비할 책임이 있고 전문적인 활동은 전쟁터이다. 매일매일 그들은 도전에 직면하게 될 것이다. 그래서 제가 하려고 하는 것은 그들이 도전을 받는 동안 [외과적으로 생각하게 하는 것]입니다. H2 T2 컨설턴트 인터뷰
You could make an argument that a nice relaxed environment is conducive to good education, but we are responsible for preparing them for professional activity and professional activity is a battle ground. Every moment of every day they are going to be faced with challenges. So, what I try to do is to get them thinking surgically whilst being challenged. H2 T2 Consultant interview

3.4.2 내과 사례 회의
3.4.2 Internal medicine case conference

[내과 케이스 컨퍼런스]는 담당중'on'인 내과 팀이 전공의을 지명해 지난 몇 달 동안 관리했던 ['재미있는 사례']를 발표하는 주간 교육 행사였다. 이 회의들의 풍토는 외과적 대회보다 [더 공식적이고 대화적formulaic and discursive]이었다. 예를 들어, 주니어 레지던트는 항상 [표준화된 구조]를 사용하여 사례를 제시했습니다. 그녀는 아스페르길루스증을 가진 57세 환자를 제시했다. 그녀는 발표 불만 사항, 과거 이력, 의료 및 수술 이력, 시스템 검토 및 의약품 목록'(H2T1 필드 노트)을 개략적으로 설명했습니다. 외과적 그랜드 라운드와 달리, 수석 의사 소집자가 질문이나 의견을 초대할 때까지 프레젠테이션은 청중 중 누구도 방해하지 않았다. 회의 환경은 외과 그랜드 라운드보다 훨씬 덜 압박되었지만, 감독관의 질문은 여전히 전공의의 평판에 위협이 되는 것으로 인식될 수 있었다. 전공의들은 유능한 임상의가 아닌 학습자로 자리매김함으로써 질문에 자주 응답했다.
Medical case conferences were a weekly educational event in which the ‘on’ IM team, nominated a resident to present ‘interesting cases’ they had managed in the previous few months. The climate of these conferences was more formulaic and discursive than in surgical grand rounds. For example, junior residents always presented cases using a standardised structure. ‘She presented a 57-year-old patient with aspergillosis. She outlined the presenting complaint, the past history, the medical and surgical histories, the systems review and the medication list’ (H2T1 Fieldnotes). Unlike surgical grand rounds, the presentation was not interrupted by anyone in the audience until the senior physician convenor invited questions or comments. Whereas the conference environment was considerably less pressurised than surgical grand rounds, questions from supervisors could still be perceived as posing a threat to residents' reputations. Residents frequently responded to questions by positioning themselves as learners rather than capable clinicians:

 

소집자는 사례를 요약한 후 청중들에게 감별 진단에 대한 의견을 물었다. 주니어 레지던트는 낮은 음량으로 대답하고, 문장 말미에 질문적인 음높이 상승을 사용하여 convenor의 질문에 대한 대답이 아니라 질문임을 나타냈다. (H2T1 필드 노트)
The convenor summarised the case and then asked residents in the audience for their ideas about a differential diagnosis. Junior residents answered in low-volume voices and employed an interrogative upturn of pitch at the end of their sentences to indicate that their responses were questions rather than statements in response to the convenor's questions. (H2T1 Fieldnotes)


[주치의와 감독관]은 전공의들이 경청하는 동안, 서로 주고받는 의견을 나누며, 내과 케이스 컨퍼런스에서 [대화의 대부분]을 했다.
Consultants and supervisors did most of the talking in IM case conferences sharing perspectives in back-and-forth exchanges while residents listened.

아스페르길루스증 관리를 논의하는 컨설턴트들 사이에 대화가 오갔다. 그들은 증거의 출처로부터 통계와 사실들을 인용했고 그들의 주장을 밝히기 위해 경험적 내러티브를 사용했다. 전문 지식이 증거 핀볼 게임을 하는 컨설턴트에 의해 머리 너머로 공간에 이야기되기 때문에 후배 의사들은 대체로 수동적인 역할을 했다. (H2T1 필드노트)
The conversation jumped to and fro between the consultants who discussed the management of aspergillosis. They cited statistics and facts from sources of evidence and used experiential narratives to make their points. The junior doctors took a largely passive role as expert knowledge was talked into the space over their heads by consultants engaging in a game of evidential pinball. (H2T1 Fieldnotes)


시니어 의사들은 우리가 두 병원에서 관찰한 의료 관행의 지저분함과 복잡성을 경시하는 것처럼 보이는 언어를 사용하며,  [스스로를 유식하고 선견지명이 있는 증거 사용자]라고 포지셔닝했다.
Senior clinicians positioned themselves as knowledgeable and clear sighted users of evidence, employing language that appeared to marginalise the messiness and complexity of the medical practice that we had observed in both hospitals.

3.5 교사-학습자 상호 작용에서의 비공식 정체성 작업
3.5 Informal identity work in teacher–learner interactions

학습자와 감독자는 ['세트피스' 퍼포먼스]를 통해 자신의 행위를 파악하고, 자신의 정체성을 작성했습니다. [외과적 세트 피스]는 [수술장에서의 수술 공예의 공연]이었지만, [내과의 전형적 '세트 피스' 퍼포먼스]는 [케이스 발표]였다.
Learners and supervisors used ‘set piece’ performances to figure their practices and author their identities. Surgical set pieces were performances of surgical craft in theatre whereas in IM, the typical ‘set piece’ performance was a case presentation.

3.5.1 수술장에서의 학습
3.5.1 Learning in theatre

만약 당신이 수술방에서 더 많은 시간을 보낼 수 있는 기회에 달려들지 않았다면 당신은 외과의사로서 옳은 생각을 하고 있지 않았을 것이다. 병동 회진이나 외래 환자들보다 훨씬 낫습니다. 전공의는 여기(수술방)서 더 많은 시간을 보내고 싶어할 것이다. (H1 T2 전공의 인터뷰)
You wouldn't really be thinking right as a surgeon if you didn't jump at the opportunity to spend more time in theatre. It's much better than ward rounds and outpatients. Any registrar worth his salt would want to spend more time in here. (H1 T2 resident interview)


자신을 외과의사라고 생각하고 받아들여진다는 것은 수술방에서 외과 기술을 익힌다는 것을 의미했다.

Figuring oneself as a surgeon and becoming accepted meant mastering surgical craft in theatre.

새로운 컨설턴트를 처음 만났을 때 가위가 뭉툭해서 한 바늘도 못 베는 것과 같은 어리석은 일을 할 수 있기 때문에 압박을 받습니다. 말하는 것과 행하는 것 사이에는 큰 차이가 있기 때문에, 여러분이 이미 무언가를 할 수 있다는 것을 보여주기 위해 새로운 직무를 하게 될 때에는 보통 많은 불안감이 있습니다. (H1T2 거주자 인터뷰)
It's pressurised when you first meet a new consultant, because you could do something stupid, like you may not be able to cut a stitch because the scissors are blunt …. There's a big gulf between talking the talk and walking the walk, so there's usually a lot of anxiety going to a new job to demonstrate that you are already able to do something. (H1 T2 resident interview)

수련자들은 그들의 [기술을 연마]하기 위해, 감독관의 시선에서 외과적으로 능력이 있는 자신을 보여줄 필요가 있었다.
To practise their craft, trainees needed to present themselves as surgically capable under the gaze of the supervisor.

마치 구식 견습생이나 마스터 같은 거죠. 다음 단계로 넘어가기 전에 수행할 수 있어야 하는 작업들이 있습니다. 첫 번째 사례에서 그들은 [매듭]을 묶고 [기구를 잡는 것]과 같은 간단한 일을 하는 것을 볼 것이다. 그런 종류의 것들은 당신이 기술적으로 능숙한지 아닌지에 대해 그들에게 귀띔해 줄 것이다. 다음 움직임을 예상하는 보조자로서, [카메라의 초점]을 정확하게 맞추고, 관심 있는 것을 보여주며, 다음 단계가 무엇인지 이해한다면, 작업에 집중합니다. 모두 힌트입니다. (H1 T2 레지던트 인터뷰)
It's exactly like an old fashioned apprentice and master kind of thing. There are set pieces that you are expected to be able to do before you can move on. In the first instance they will watch you do something simple, like tie a knot, hold an instrument. That kind of stuff would tip them off as to whether you are technically proficient. As an assistant anticipating the next move, you know, focusing the camera correctly, showing them you are interested, focused on the operation, if you understand what the next step is. These are all hints. (H1 T2 Resident interview)


외과 선생님들은 일반적으로 그들 자신을 [코치]로서 author하기 위해 [언어적, 물리적 의사소통 수단]을 모두 사용했다. 그들의 이야기에서, 그들은 연습생들이 무엇을 해야 하고, 보고, 조심해야 하는지를 보여주었다.
Surgical teachers typically used both verbal and physical means of communication to author themselves as coaches. Their talk indicated what trainees should do, see, and be careful about.

저기에 있는 그릇들이 보이나요? 중요한 문제이기 때문에 저는 그것을 유지하고 싶습니다. 하지만 그것은 우리가 잽싸게 할 수 있습니다. 저는 그것이 중요하다고 생각합니다. 왜냐하면 저는 그것이 이 내장의 일부를 유지시킬 것이라고 생각하기 때문입니다. 그래서 우리는 그것을 조심해야 합니다. 점막 출혈은 신경 안 쓰고 장간막 출혈은 신경 쓰지
Can you see the vessels there? Now I want to keep that one because it's important, but that one we can zap. I think it's important because I think it looks after this bit of the gut that were going to keep, so we need to be careful of that. I don't care about bleeding from the mucosa, I care about bleeding from the mesentery. (H1 T2 Fieldnote)


언어적이고 신체적인 지도를 제공하는 것 외에도, 외과의사들은 계속 발전해나가기 위한 [문화적 필수 사항]을 저술했다. 이것은 외과 수련자들이 상당한 시간적 압박 속에서 그들의 기술을 연습해야 한다는 것을 의미했다. '자, 컷 컷 컷, 시작하자'(H1 T2 필드 노트). 
In addition to providing verbal and physical guidance, surgeons authored a cultural imperative to keep moving on. This meant that surgical trainees had to practise their skills under considerable time pressure. ‘Come on, cut cut cut, let's get on with it’ (H1 T2 Field note). 

내과 의사들과는 달리, 외과의사들은 정기적으로 피드백을 해주었다. 수술 과정 동안, 이 피드백은 종종 직접적이었으며, 모호하지 않았다. '그는 비판에 매우 엄격하지만, 당신이 수술하는 동안, 그 비판은 모두 건설적입니다'(H2T2 레지던트 인터뷰). 외과 선생님들은 또한 예를 들어 레지던트로부터 시술 제어를 넘겨받는 등 [암묵적인 피드백]을 전달하였다.
Unlike internists, surgeons gave regular feedback. During surgical procedures, this feedback was often direct and unambiguous. ‘He is very hard on the criticism, but it is all constructive while you are operating’ (H2 T2 Resident interview). Surgical teachers also communicated implicit feedback by, for example, taking over control of a procedure from a resident.

내가 인수하려고 할 때, 나는 명시적으로 아무 말도 하지 않는다. 하지만 외과 수련자가 이해하게 될 것은, 우리가 직접 수술하는 것을 달가워하지 않는 곳에 왔다는 것입니다. 나는 우리가 하고 있는 일의 기초에 대한 그의 이해가 완전히 만족스럽지는 않다. 따라서 내가 인수할 것이다. 말할 것도 없지만, 외과적 훈련에서는 항상 그랬습니다. (H2T2C 인터뷰)
I don't explicitly say anything when I'm taking over. But what a surgical trainee will understand by that, is that we've come to an area where I'm not happy for him to proceed directly himself. I'm not entirely happy with his understanding of the basis of what we are doing and therefore I'll take over. It's unsaid, but that's always the way it's been in surgical training. (H2T2 C interview)


[수술실에서 외과의사가 되는 것]은 [외과 감독관의 행위를 인식하고 재현하는 것]과 동시에 [자신을 외과의사로 author하고, 예상된 방식으로 지식 있게 말하는 것]을 배우는 것이었다.
Becoming a surgeon in theatre was about recognising and reproducing the practices of surgical supervisors, while authoring oneself as a surgeon and learning to talk knowledgeably in expected ways:

X 선생님의 탯줄 포트 삽입 방법을 봤다는 것은 인정하지만, 특별히 마음에 들지는 않았지만, 실제로 다른 방법은 모릅니다. 나는 다른 사람들이 훨씬 더 단순해 보이는 다른 방법들을 하는 것을 보았다. 하지만 제가 X와 함께 일하는 동안 저는 X의 방식대로 할 것입니다. 모든 사람들이 당신에게 '당신이 나를 위해 일하는 동안 나는 당신이 이런 방식으로 그것을 하기를 원한다'고 말한다. 나중에 제 환자를 보게 되면, 여러 선생님들에게 봤던 것들 중에서 마음에 들었던 부분들만 골라내서 내 방식대로 하면 될거에요. (H1T2 레지던트 인터뷰)

I have to admit I saw Mr X's' way of putting in the umbilical port, I did not particularly like it, but I do not actually know any other way. I've seen other people do different ways that look a lot simpler. But while I work with X I'll do it his way …. Everybody says to you ‘while you are working for me I want you to do it this way’. When you come to your own appointment, you pick up the bits that you liked from everybody, you do it your way. (H1 T2 Resident Interview)

3.5.2 내과에서의 사례 제시
3.5.2 Case presentation in internal medicine

[케이스 프레젠테이션]은 IM 팀에서 유능한 의사로서 자작하는 데 중요한 기회를 제공했습니다.
Case presentation provided a critical opportunity to self-author as a capable physician in IM teams.

당신은 단지 컨설턴트에게 중요한 포인트를 주고 그가 그 계획을 따르는 것을 기쁘게 생각하는지 보고 싶을 뿐입니다. 그는 자초지종을 말할 필요가 없다. 그가 필요로 하는 것은 몇 가지 요점과 우리가 하고 있는 일이다. 우리는 그에게 그 이야기를 파는 것뿐이다. …. 제가 그 이야기를 컨설턴트에게 전한다면, 그가 제 의견에 동의하는지 보고 싶습니다. 그가 더 추가할 것이 있나요? 나는 검증이나 칭찬받기를 원하는 것이 아니다. (H2T1 거주자 인터뷰)
You just want to give the salient points to the consultant and see that he is happy to go along with the plan …. He doesn't need the full story. All he needs is a couple of bullet points and what we are doing. We're just selling him the story. …. If I'm presenting the story to the consultant, I think I'm looking to see does he agree with me. Has he any more to add? I'm not looking for validation or a pat on the back. (H2 T1 Resident Interview)


내과 수련생은 [케이스 프레젠테이션에서 강조하기로 선택한 주요 세부 사항]과 [컨설턴트 감독관이 선택한 세부 사항]을 [비교]함으로써 자신을 의사로 형상화figured했습니다.
IM trainees figured themselves as physicians by comparing salient details that they chose to emphasise in their case presentation to those selected by their consultant supervisors:

누군가를 인정하고 나서 컨설턴트와 함께 그것을 겪는다면, 그리고 그들이 당신이 놓친 것들을 알게 된다면, 그것은 정말 좋은 학습 경험이고, 만약 서로 같은 것을 골랐다면, 당신은 그것을 제대로 했다고 생각하는 것이 정말 만족스럽다. (T1 H1 주니어 레지던트 인터뷰)
If you admit someone and then you go through it with the consultant, and if they pick up on things that you missed, it's a really good learning experience, and if they picked out the same things, it's really satisfying that you think that you've done it properly. (T1 H1 Junior resident interview)


고위 팀원들은 일관성을 유지하고, 하위 의사의 사례 프레젠테이션에 사례를 이해할 수 있는 세부 사항을 포함하기 위해 귀를 기울였습니다.
Senior team members listened for coherence and the inclusion of detail that allowed them to make sense of cases in junior doctors' case presentations:

나는 형편없는 referrals을 들었다. 나는 '요점을 말해 줄래? 여기서 진짜 문제가 뭐야?'라고 생각한다. 당신은 '이 남자, 그는 더블 바이패스, 심장마비, 그리고 그는 푸로세미드'로 시작하고 싶지 않을 것이다. 당신은 '그는 흉통이 있다'고 말하고 싶어하고 나는 '그는 고위험 환자인가 아니면 저위험 환자인가?'라고 생각하고 있다. 당신의 바퀴가 돌아가고 있고, 당신이 그가 바이패스 수술을 받았다는 것을 들었을 때 당신은 '그래, 그의 심전도 상태는 어때?'라고 생각한다. 반면에 만약 여러분이 문제가 무엇인지 잘 모르고 다른 정보를 먼저 듣고 있다면, 여러분은 그것을 따를 수 없습니다. 당신은 그들이 어떻게 인상을 받았는지 볼 필요가 있다. 일단 그들이 어떻게 결론에 도달했는지 알 수 있다면, 보통 괜찮다. (T1 H2 전공의 인터뷰)
I have listened to poor referrals. I think ‘Would you get to the point; what is the real issue here?’ You don't want to start off with ‘This man, he had a double by-pass, he had a heart attack, and he is on Furosemide’. You want to say ‘He's got chest pain’ and then I'm thinking ‘Is he a high risk or a low risk patient?’ Your wheels are turning, and when you hear he has had a by-pass you think ‘Well ok, how is his ecg?’ Whereas if you don't really know what the problem is and you are hearing the other information first, you can't, follow it. You need to see how they arrived at the impression. Once you can see how they arrived at their conclusion, it is usually fine. (T1 H2 resident interview)

따라서, 내과에서의 케이스 프레젠테이션은 [중요한 세부 사항을 식별]하고, 청취자의 마음에서 [질문을 예측]하고, [결론이나 행동의 근거를 명확히] 하는, 환자 프레젠테이션의 [일관성 있는 추상적 표현을 구성]할 수 있는 능력을 갖춘 사람으로서 self-authoring에 관한 것이었다.
Thus, case presentation in IM was about self-authoring as capable of identifying salient detail, anticipating questions in listeners' minds and assembling a coherent abstract representation of the patient's presentation which made clear the rationale for conclusions or actions.

내과 감독관들은 전공의의 사례발표를 [학습자의 사고]보다는, [자신의 사고와 습관]에 맞게 상호작용적으로 맞추려고 하는 경우가 많았다.
Rather than coach learners' thinking, internal medicine supervisors often sought to interactively align residents' case presentation to their own thinking and habits.

  • 전공의: 그녀는 56세 여성입니다.
  • 컨설턴트: (중단). 새로 온 환자야?
  • 전공의: 그녀는 신참이다 그녀는 2010년에 마지막으로 목격되었다.
  • 컨설턴트: 그럼 재소환인가요? 그럼 천식인가요? 그녀는 담배를 피워 본 적이 있나요?
  • 전공의: 그녀는 담배를 피웠다. 그녀는 2000년에 비호지킨의 T세포 림프종과 방사선 치료를 받았다.
  • 컨설턴트: (중단). 어디로, 그녀의 가슴?
  • 전공의: 가슴 그래. 2014년 그녀의 CT는 방사선 치료와 관련이 있다고 생각되는 일부 상엽의 변화를 보여주었지만, 그녀의 가장 최근의 흉부 X-ray에서는 어떠한 첨두 변화도 보이지 않는다. 그녀는 방사선 치료를 받은 후 증상이 시작됐다고 느낀다. H1 T1 비디오 녹취록, OPD에서의 거주 사례 프레젠테이션
  • Resident: She's a 56-year-old lady.
  • Consultant: (Interrupts). Is she a new patient?
  • Resident: She is new-ish. She was last seen in 2010.
  • Consultant: She's a re-referral then? Is it asthma then? Has she ever smoked?
  • Resident: She has smoked. She had non-Hodgkin's T-Cell lymphoma in 2000 treated with CHOP and radiation
  • Consultant: (Interrupts). To where, her chest?
  • Resident: Chest yeah. Her CT in 2014 showed some upper lobe changes that they thought were associated with radiation therapy, but in her most recent chest x-ray they do not appear to be any apical changes. She feels her symptoms started after she got radiation treatment. H1 T1 Video transcript, resident case presentation in OPD

내과 교사들은 학습자와의 비공식적 상호작용에서, 훈련생들을 위해 자신의 생각을 구두로 시연(인지 방송)하는 등 코치 이상의 모델로 자리매김했다. 그들이 [볼 수 있고 생각할 수 있는 것을 명확히 함]으로써, 그들은 내과 의학의 실천을 [모델링]했다.
Teachers in internal medicine positioned themselves as models more than as coaches during informal interactions with learners, for example, by giving verbal demonstrations (cognitive broadcasts) of their thinking for their trainees. By articulating what they could see and were thinking, they modelled the practice of internal medicine:

그저 무언가에 대해 think out loud하고, 저의 추론 방식을 보여줍니다. 그것은 단지 책을 읽고 절차를 따르는 것보다 훨씬 더 흥미롭습니다. 나는 누군가가 어떻게 추론하고 있는지 듣는 것이 매우 흥미롭다고 생각한다. (H1 T1 컨설턴트 인터뷰)
You just think out loud about something; you show your way of reasoning … It's so much more interesting than just reading a book and following procedure. I think that hearing how someone is reasoning is very interesting. (H1 T1 Consultant interview)


[컨설턴트의 독백]은 내과 팀의 [주요 교수 형태]였다.
Consultant monologues were the predominant form of teaching in internal medicine teams:

컨설턴트가 환자의 흉부 엑스레이를 보여달라고 요청한다. 엑스레이가 화면에 나타나면, 그는 자신이 본 것에 대해 말한다. 그는 정상적인 횡격막 그림자가 사라졌지만 왼쪽 심장 테두리가 선명하게 보이기 때문에 흉부 엑스레이에 양쪽 흉막삼출이 있다고 생각한다고 말한다. 그런 다음 팀원들이 수행해야 할 작업을 이해하고 있는지 확인합니다. (H1 T1 필드 노트)
The consultant asks to see the patient's chest x-ray. When the x-ray appears on the screen, he talks about what he sees. He says that he thinks that there are bilateral pleural effusions on the chest x-ray because there is loss of the normal diaphragmatic shadow and yet the left heart border is clearly visible. He then checks that his team understands the tasks that need to be carried out. (H1 T1 Field note)

4 토론
4 DISCUSSION

우리의 주된 발견은 [외과와 내과의 전공 특이적 행위]가 [무엇을 가르치고, 어떻게 배우고, 무엇을 배우는지 결정한다]는 것이었습니다. 임상 교사와 학습자의 역할은 각 전문 분야에 특화되어 있고 문화적으로 고정되어 있다. 교사와 학습자는 전문적으로 알고, 말하고, 존재하는 방식으로 특징지어지는 문화 세계 내에서 자신의 정체성을 협상했다.

Our principal finding was that the specialty-specific practices of surgery and IM determined what was taught, how it was taught and what was learned. The roles of clinical teacher and learner were particular to each specialty and culturally anchored.31 Teachers and learners negotiated their identities within cultural worlds characterised by specialty-specific ways of knowing, talking and being.

이러한 관찰은 [정체성 형성]을 학습자의 [직무현장의 어포던스에 대한 참여]와 [직무현장의 요구] 사이의 협상으로 특징짓는 [직장 학습에 대한 현재의 설명]과 강하게 일치한다. 우리의 연구는 임상 팀이 [전공 자체의 전문성]뿐만 아니라 [팀 자체의 사회역사적 규범과 기대]와 관련하여, [행위자성agency]은 변증법적dialectically으로 협상되는 문화적 세계]로 개념화되어야 한다고 제안한다. [전공-특이적 문화적 세계] 속에서 배우는 것은 [학습자의 행위자성을 제한]할 뿐만 아니라, [문화적으로 승인되는 행위과 기질의 재생산]을 촉진한다. 그러므로 외과의사나 내과의사가 되는 것은 [직장 환경의 요구], [전공과목의 문화], 그리고 [개별 학습자의 적성과 열망] 사이의 [경쟁적인 공간]에 위치한다. [학습자 중심성]에 대한 [맥락적 위협]과 [문화적으로 대본화된 지배적인 교육 관행 및 정체성의 영속화]는 임상 교육의 결함을 해결하고자 하는 교수 개발자에게 중요한 과제를 나타낸다. 예를 들어, 작업 또는 학습 환경에서 사용 가능한 대화와 연습을 활용하기 위해 에이전시를 실행할 수 있는 학습자가 학습 경험을 크게 향상시킬 수 있다는 좋은 증거가 있다. 우리의 연구는 임상 교육의 알려진 문제에 대한 해결책이 전공과목-특이적 문화 세계에 적용되는 특정 담론의 잘 알려진 구성에 기초할 필요가 있음을 제안한다.
These observations align strongly with current descriptions of workplace learning where identity formation is characterised as a negotiation between learners' engagement with the affordances of the workplace, and its demands of them.46-48 Our work suggests that clinical teams should be conceptualised as cultural worlds in which agency is negotiated dialectically in relation to the socio-historic norms and expectations of the team as well as the parent specialties.49 Learning in specialty-specific cultural worlds not only limits learners' agency but promotes the reproduction of culturally sanctioned practices and dispositions.13, 50 Becoming a surgeon or an internist is therefore situated in a contested space between the demands of workplace contexts, specialty cultures and the aptitudes and aspirations of individual learners.48 Contextual threats to learner centredness and the perpetuation of dominant culturally scripted teaching practices and identities represent important challenges for faculty developers who wish to address the deficiencies of clinical education. There is good evidence, for example, that learners who can exercise agency to harness the available dialogue and practices in working or learning contexts can greatly enhance their learning experiences.51 Our work suggests that the solutions to the acknowledged problems of clinical education need to be founded on well informed constructions of the particular discourses that apply in specialty-specific cultural worlds.

[전문가가 되는 것]이란, [임상 팀 속에의 참여]와 [특정 분야의 역사적 가치, 관행 및 전통과 자신의 일치]를 통해서 형성되는 [정체성 작업]의 한 형태를 나타낸다. [정체성 작업]은 개인이 사회적 맥락에서 다른 사람들과 관련하여 [사회적 및 역할 정체성을 어떻게 생성, 주장, 폐기 및 협상]하는지를 설명한다. 이 연구에서, 우리는 [공식 및 비공식 임상 학습 맥락]에서, 학습자들이 외과의사 및 내과의사로서의 [정체성 주장]을 담론적으로 하기 위해, [서술적 포지셔닝과 자기 저술의 전략]을 사용한다는 것을 발견했다. 그들은 내과 의사와 외과의사의 일상적인 업무 관행에 내재된 [가치 있게 여겨지는 앎의 방식이나 말하는 방식] 등에 관한 [구체적인 학문분야 특이적 문화적 배경]과 관련하여 그렇게 했다
Becoming a specialist represents a form of identity work shaped by participation in clinical teams and the alignment of self with the historical values, practices and traditions of a particular discipline.32, 34 Identity work describes how individuals create, claim, discard and negotiate social and role identities in relation to others in social contexts.52 In this study, we found that learners in formal and informal clinical learning contexts used strategies of narrative positioning and self-authoring to discursively make identity claims as surgeons and IM physicians. They did so in relation to discipline specific cultural backdrops of valued ways of knowing, talking and so forth that were embedded in the everyday working practices of internal medicine physicians and surgeons.

임상 교육의 탐색하면서, 우리는 [작업 중심성]을 PGME에서 임상 교육의 커리큘럼을 정의하는 것으로 강조했다. [작업work]는 '무엇이 학습되고 어떻게 학습되는지'를 정의하기 때문에, Morris와 Swanwick은 임상 감독관이 다음과 같이 해야 한다고 제안합니다.

  • 교육생을 위한 의미 있는 작업 기회의 선택 및 구조화한다.
  • 작업장의 숨겨진 커리큘럼의 주요 특징을 명확히 한다. 
  • 소속을 가능하게 하는 작업 및 학습 환경을 제공한다. 

이 연구와 우리의 이전 연구는 이러한 임상 감독자의 역할이 대부분 우리가 관찰한 서비스 중심 임상 작업장에서 실현되지 않았음을 시사한다. 이러한 결함은 교수 개발을 통해 해결할 수 있지만, 교수 개발자가 다양한 전문 분야에서 임상 교육이 제정되는 방법의 문화적 특수성과 교수, 학습 및 작업이 발생하는 문화 세계의 특수성을 인정할 준비가 되어 있는 경우에만 해결할 수 있다.

Explorations of clinical education have highlighted the centrality of work in defining the curriculum of clinical education in PGME.2, 53 Given that it is work that defines what is learned and how it is learned, Morris and Swanwick2 suggest that clinical supervisors should

  • select and structure meaningful work opportunities for trainees,
  • articulate key features of the workplace hidden curriculum and
  • provide working and learning environments that enable belonging.253 

This study and our previous work19 suggest that these clinical supervisor roles were for the most part not actualised in the service driven clinical workplaces we observed. These deficiencies could be addressed through faculty development, but only if faculty developers are prepared to acknowledge the cultural specificity of how clinical education is enacted in different specialties and the particularities of the cultural worlds where teaching, learning and working occur.

4.1 교수개발 대한 권고 사항
4.1 Recommendations for faculty development

직장workplace 교육과정의 [극도로 상황화된 성격situated nature]과 전공과목 분야마다의 [다양한 교수 학습의 특수성]을 고려할 때, 교수개발자는 [정통적 교육]에서 파생된 솔루션을 사용하여 임상 교육을 '개선'하려는 시도를 벗어나, [맥락적 이해에 기반한 변화를 촉진하는 시도]로 초점을 전환함으로써 효과를 크게 향상시킬 수 있다. 이를 달성하기 위해, 교수 개발자는 (예를 들어 행동 연구 접근 방식을 사용하여) 임상 교사와 협력하여 [변화시키고자 하는 작업장 환경과 교육 관행을 관찰하고 이해]해야 한다. 교수진 개발자는 임상의와 협력하여 [임상의가 일하는 곳의 정치와 현실에 맞는 상황별 커리큘럼을 개발]해야 한다. 비디오 반사 민족학(VRE)은 임상의가 맥락과 실천의 당연한 측면으로 여겨지는 문화를 감상하는 데 매우 효과적인 접근 방식인 것으로 나타났다. VRE와 같은 기술은 임상의가 작업 환경 및 이에 관련된 교육 문제에 대한 이해를 구축하는 데 직접 협력하는 참여적 행동 연구 설계의 자원에 사용될 수 있다.
Given the profoundly situated nature of the curriculum of the workplace, and the particularities of teaching and learning in different specialties, faculty developers could greatly enhance their effectiveness by shifting emphasis from attempts to ‘improve’ clinical education using solutions derived from educational orthodoxy, toward facilitating change founded on contextual understandings. To achieve this, faculty developers need to work with clinical teachers, (using action research approaches for example), to observe and make sense of the workplace settings and teaching practices that they hope to change. Faculty developers should collaborate with clinicians to develop contextual curriculums that are customised for the politics and realities of the places where clinicians work.54 Video reflexive ethnography, (VRE) has been shown to be a very effective approach in helping clinicians to appreciate cultural, taken for granted aspects of context and practice.55 Technologies such as VRE could be used to resource participatory action research designs whereby clinicians collaborate directly in building understanding of workplace contexts and therefore solutions to the educational problems that pertain there.

4.2 제한 사항
4.2 Limitations

이러한 연구 결과는 직장 교육의 실제 정치에 더 적합한 교수 개발 프로그램을 설계하는 데 도움이 될 수 있지만, 적용 가능성에는 몇 가지 한계가 있다. 이 연구는 두 개의 분리된 교육병원에서 각각 두 개의 임상팀으로부터 데이터를 수집함으로써 강화되었지만, 팀 구조, 계층 구조 및 훈련 커리큘럼과 같은 특징은 한 국가에 특유했다. 연구 결과의 [전이가능성transferability]을 높이기 위해, 우리는 Figured Worlds를 강력한 분석 프레임워크로 사용했고, 연구를 수행한 사이트와 수술 및 IM의 특수성을 임상 작업장 학습의 사례로 다루었다. 또한, 연구팀의 구성에 의해 전이가능성이 보장되었다. 저자는 네덜란드, 아일랜드, 영국 등 세 나라 출신이다. 그들은 모두 국제 의료 교육에 경험이 있다. 그리고 그 팀은 임상 의사, 심리학자, 그리고 일반 실무자를 포함하고 있는데, 그의 전문 교육은 수술이나 임상과는 매우 달랐습니다. 그럼에도 불구하고, 임상 교육을 형성하는 업무, 작업 공간 및 맥락 커리큘럼에 대한 이해의 중요성을 고려할 때, 우리는 다른 국가 및 다른 전문 분야에서 추가 연구를 권고한다. 사회인류학의 전통에 따라, 한 명의 관찰자가 이 연구에서 현장 연구를 수행했다. 편견을 최소화하기 위해 반사 일지를 작성하고 각 관찰 기간이 끝날 때 참가자들과의 비공식 인터뷰와 공식 출구 인터뷰를 사용하여 자신의 관찰을 입증했다. 단일 관찰자 효과는 세 연구자의 다른 관점에 의해 풍부해진 긴밀한 협력에 의해 더욱 완화되었다.


Although these findings could help design faculty development programs that are better suited to the realpolitik of workplace education, there are some limitations to their applicability. Whereas this study was strengthened by gathering data from two clinical teams in each of two separate teaching hospitals, features such as team structure, hierarchy and training curriculums were particular to one country. To increase the transferability of the findings, we used Figured Worlds as a strong analytical framework and treated the sites where we conducted the research and the specialties of surgery and IM as instances of clinical workplace learning. Transferability was assured, further, by the composition of the research team. The authors come from three different countries, the Netherlands, Ireland and the United Kingdom; they are all experienced in international medical education; and the team includes an IM physician, a psychologist and a general practitioner, whose specialty training was very different from either surgery or IM. Nonetheless, given the importance of understanding the work, workplaces and the contextual curriculums that shape clinical education, we recommend further research in other countries and different specialties. In keeping with the traditions of social anthropology, a single observer undertook the field work in this study. To minimise bias he kept a reflexive diary and corroborated his observations using ‘on the hoof’ informal interviews with participants and formal exit interviews at the end of each observation period. The single observer effect was further mitigated by close cooperation, enriched by the different perspectives of the three researchers.

5 결론
5 CONCLUSIONS

임상 교육에서 교사와 학습자의 정체성, 교수와 학습의 관련 관행은 모두 임상 학습이 위치한 사회 문화적 맥락에 의해 형성되고 그에 따라 결정된다. 전문분야별 임상팀과 같은 사회구조에 참여하면 학습된 내용뿐만 아니라 학습 방법도 알려준다. 임상 교육은 때때로 묘사되듯이 지식을 습득하는 [선형 과정]이 아니라, [상황적으로 특정한 직장 커리큘럼]에 [상호 참여함]으로써 되는 복잡한 과정이다. 우리의 연구는 교수 개발이 임상 교육을 '수정'하기 위해서는, 지금과 같은 [전문가 주도의 자격 증명 접근법]에서 벗어나는 대신, [그곳에서 일하는 사람들, 즉 임상의와 직장 커리큘럼에 대한 공유된 이해]를 구축하는 데 기반을 두어, 보다 [촉진적facilitative 접근 방식]을 고려해야 한다고 제안한다.
In clinical education, teacher and learner identity and the associated practices of teaching and learning are all shaped by, and contingent on, the sociocultural contexts in which clinical learning is situated. Participation in social structures such as specialty-specific clinical teams, informs not only what is learned, but how it is learned. Clinical education is not, as it is sometime portrayed, a linear process of acquiring knowledge, but is instead a complex process of becoming, through mutual engagement in situationally specific curriculums of the workplace.53 Our work suggests that faculty development should move away from its current focus on expert led credentialing approaches to ‘fix’ clinical education and consider instead a more facilitative approach, founded on constructing shared understandings of workplace curriculums with the people who work there, the clinicians.

 


Med Educ. 2022 Jun;56(6):614-624. doi: 10.1111/medu.14727. Epub 2022 Jan 26.

The social construction of teacher and learner identities in medicine and surgery

Affiliations collapse

Affiliations

1Discipline of General Practice, National University of Ireland, Galway, Ireland.

2School of Health Professions Education, Maastricht University, Maastricht, The Netherlands.

3School of Medicine, Dentistry and Biomedical Sciences, Queens University Belfast, Belfast, UK.

PMID: 34993973

PMCID: PMC9305233

DOI: 10.1111/medu.14727

Free PMC article

 

Abstract

Introduction: There are growing concerns about the quality and consistency of postgraduate clinical education. In response, faculty development for clinical teachers has improved formal aspects such as the assessment of performance, but informal work-based teaching and learning have proved intractable. This problem has exposed a lack of research into how clinical teaching and learning are shaped by their cultural contexts. This paper explores the relationship between teacher-learner identity, educational practice and the workplace educational cultures of two major specialties: internal medicine and surgery.

Methods: This was a secondary analysis of a large dataset, comprising field notes, participant interviews, images and video-recordings gathered in an ethnographic study. The lead author embedded himself in four clinical teams (two surgical and two medical) in two different hospitals. The authors undertook a critical reanalysis of the observational dataset, using Dialogism and Figured Worlds theory to identify how teachers and postgraduate learners figured and authored their professional identities in the specialty-specific cultural worlds of surgery and internal medicine.

Results: Surgery and internal medicine privileged different ways of being, knowing and talking in formal and informal settings, where trainees authored themselves as capable practitioners. The discourse of surgical education constructed proximal coaching relationships in which trainees placed themselves at reputational risk in a closely observed, embodied practice. Internal medicine constructed more distal educational relationships, in which trainees negotiated abstract representations of patients' presentations, which aligned to a greater or lesser degree with supervisors' representations.

Conclusions: Our research suggests that clinical education and the identity positions available to teachers and learners were strongly influenced by the cultural worlds of individual specialties. Attempts to change work-based learning should be founded on situated knowledge of specialty-specific clinical workplace cultures and should be done in collaboration with the people who work there, the clinicians.

의학교육연구실의 목적, 설계, 전망 (Acad Med, 2022)
The Purpose, Design, and Promise of Medical Education Research Labs
Michael A. Gisondi, MD, Sarah Michael, DO, MS, Simiao Li-Sauerwine, MD, MSCR, Victoria Brazil, MD, MBA, Holly A. Caretta-Weyer, MD, MHPE, Barry Issenberg, MD, Jonathan Giordano, DO, MEd, Matthew Lineberry, PhD, Adriana Segura Olson, MD, MAEd, John C. Burkhardt, MD, PhD, and Teresa M. Chan, MD, MHPE

 

의학 교육 연구원들과 임상의 교육자들은 장학금, 교육 기법의 개선, 그리고 직접 가르침을 통해 건강 관리의 미래를 이끈다. 그러나 역사적으로 학문적 승진academic promotion은 학습자를 교육하는 데 성공적이지 않고, 연구 생산성에만 국한되어 왔다. 의학 교육 연구자들이 새로운 지식을 발굴하고 의미 있는 학술적 결과를 만들어내지만, 학계에서는 자신의 연구를 연구로 인정하지 못하는 경우가 많은 것이 우리의 경험이었다. 이러한 편견은 의료교육 연구 경력을 추구하는 개인에 대한 제도적 지원과 승진 가능성에 부정적인 영향을 미친다. 
Medical education researchers and clinician educators steer the future of health care through scholarship, refinement of educational techniques, and direct teaching. 1,2 However, academic promotion has historically been tied to research productivity alone and not success in educating learners. Though medical education researchers discover new knowledge and create meaningful scholarship, it has been our experience that many in academia fail to recognize their work as research. This bias negatively affects institutional support and the likelihood of promotion for individuals pursuing medical education research careers.

실제로 교육 연구자는 작업 본체를 생산하는 뚜렷하고 잘 확립된 연구 방법을 사용하나, 이는 생물 과학자의 연구와는 다르다(예: 교육 연구자는 백신 흡수를 옹호하는 교육자의 능력을 연구할 수 있지만 생물 과학자는 환자에 의한 백신 채택률을 연구할 수 있다). 3 불행하게도, 기초 과학과 임상 연구자들이 종종 더 나은 자금, 자원 및 존경을 받는 학교에서, 교육 연구는 저평가되고 있다. 웹사이트와 보조금 개요를 검토하면서, 우리는 국립 보건원 상과 같은 교외 연구비의 격차가 생물 과학자들에게 크게 유리하고, 교육 연구 보조금은 간접 비용을 거의 보상하지 않는다는 것을 발견했다. 실제로, 우리는 의료 교육 연구원들이 종종 일관되지 않은 자금 조달 메커니즘과 그들의 기관에서 매우 소수의 명백한 멘토들을 남겨둔다는 것을 발견했다.

In reality, education researchers employ distinct, well-established study methods that produce bodies of work unlike those of bioscientists (e.g., an education researcher might study trainees’ abilities to advocate for vaccine uptake, while a bioscientist might study rates of vaccine adoption by patients) but that are no less rigorous. 3 Unfortunately, education research is undervalued at schools where basic science and clinical investigators are often better funded, resourced, and respected. 4,5 In reviewing websites and grant outlines, we have found that disparities in extramural funding, such as National Institutes of Health awards, greatly favor bioscientists, and education research grants rarely cover indirect costs. In effect, we have found find that medical education researchers are often left with inconsistent funding mechanisms and few obvious mentors at their institutions.

[연구실Research labs]은 개별 연구자의 커리어를 지원하기 위한 유용한 프레임워크를 제공하지만, 우리는 그것들이 의학 교육에서 상대적으로 드물다고 믿는다. 우리는 [연구실Research labs]을 [특정 조건이나 문제를 연구하는 단일 또는 복수의 PI(주요 조사자)가 이끄는 부서 또는 기관 내의 별개의 연구팀으로 정의]한다. 그들은 종종 부서나 학교를 넘나들며 많은 조사원으로 구성된 [연구 센터, 협력체 또는 네트워크]보다는 작다. [연구실]은 PI가 연구를 수행하고, 강력한 지원 팀을 이끌고, 학생들을 훈련시키는 것을 돕기 위해 구성될 수 있다. 의학 교육 연구자들은 [연구실 모델]을 폭넓게 채택하지 않아왔으며, 대신 의학 교육 부서, 보건 전문 장학 단체 또는 다른 연구 기업과 같은 다양한 종류의 협력적 구성에 배치한다. 우리의 의견으로는, 이러한 조직 스펙트럼은 특정 기관의 문화적 압력과 자금 부족, 협력자, 연구 주제 및 부서 지원과 같은 현장의 공통적인 도전에서 비롯된다.  우리는 [교육 연구실]이 이러한 장벽을 극복하고, 연구를 촉진하고, 교육 프로그램을 강화하고, 과외 자금 지원을 위해 경쟁하기 위해 부서 내에서 의도적으로 설계될 수 있다고 믿는다.
Research labs provide a useful framework to support the careers of individual investigators, yet we believe they are relatively rare in medical education. We define a lab as a distinct research team within a department or institution that is led by a single or multiple principal investigators (PIs) who study specific conditions or problems. They are smaller than research centers, collaboratives, or networks, which often cross departments or schools and are composed of many investigators. Labs can be constructed to help a PI conduct their research, lead a robust supporting team, and train students. Medical education researchers have not broadly adopted the lab model, instead arranging themselves in different kinds of collaborative configurations, such as departments of medical education, health professions scholarship units, or other research enterprises. 6–9 In our opinion, this organizational spectrum results from cultural pressures at certain institutions and common challenges in the field, such as a lack of funding, collaborators, study subjects, and departmental support. 10 We believe that education research labs can be deliberately designed within departments by established investigators to overcome these barriers, catalyze research, enhance training programs, and compete for extramural funding.

본 논문에서는 [의료 교육 연구실]의 조직과 임무를 [연구 센터, 협력체 및 네트워크]와 같은 다른 더 큰 구조와 비교하여 설명한다. 우리는 또한 교육 연구실의 몇 가지 핵심 요소에 대해 논의한다. 의학 교육에 있어 상대적으로 참신함을 감안할 때, 우리는 자체 실험실 창설을 고려하고 있는 다른 교육 연구자들에 의해 고려될 수 있도록 연구실 구조를 강조한다.
In this article, we describe the organization and missions of medical education research labs as compared with other larger structures, such as research centers, collaboratives, and networks. We also discuss several key elements of education research labs. Given its relative novelty in medical education, we highlight the research lab construct for consideration by other education researchers who may be contemplating starting up labs of their own.

사례 예제
Case Examples

우리 저자 그룹은 조직, 규모,  또는 목적이 다른 팀을 이끄는 의학 교육 연구원으로 구성되어 있습니다. 우리는 기존의 전문적인 관계를 통해 편리하고 비공식적으로 모였습니다. 그들 사이의 차이점을 비교하기 위해, 우리는 각각 우리 팀 구조의 상세한 사례 예시를 제공했다. 우리는 조직 구조, 1차 연구 강조, 자금 조달 메커니즘, 기관 지원, 교육자 영향 및 성공에 대한 장벽을 포함하여 우리 팀의 정의 특성을 설명했습니다. 우리 중 몇 명(M.A.G., S.M., J.C.B., T.M.C.)은 설명을 검토하고 공통 특성에 따라 팀을 그룹화하고 다음과 같은 5가지 공통 유형의 연구 팀 구조를 만들었습니다.

  • 단일 PI 연구소(단일 PI 리드가 있는 연구소)
  • 여러 PI 연구소(일반적으로 같은 부서 내에 있는 소규모 PI 그룹이 이끄는 연구소)
  • 연구 센터(여러 부서를 넘나들면서 해당 기관에서 여러 명의 연구자를 통합하는 대규모 단일 조직 기관. 이를 연구기관이라고도 할 수 있다.
  • 연구 협력체(많은 기관에서, 그리고 많은 부서에서 온 대규모의 비기관 조사자 그룹)
  • 연구 네트워크(많은 기관에 걸쳐 있는 연구자들의 느슨한 연합)

Our author group is composed of medical education researchers who lead teams that differ in organization, size, and/or purpose. We were conveniently and informally assembled through existing professional relationships. To compare the differences among them, we each provided detailed case examples of our team structures. We described the defining characteristics of our teams including the organizational structure, primary research emphasis, funding mechanisms, institutional supports, trainee impacts, and/or barriers to success. A few of us (M.A.G., S.M., J.C.B., T.M.C.) then reviewed the descriptions, grouped the teams based on common characteristics, and created 5 common typologies of research team structures:

  • single PI labs (labs with a single PI lead),
  • multiple PI labs (labs led by small groups of PIs, who are generally within the same department),
  • research centers (large, single-institution entities that cross departments but aggregate multiple investigators at the institution; these may also be called research institutes),
  • research collaboratives (large, noninstitutional groups of investigators who come from many institutions and may also come from many departments), and
  • research networks (loose associations of investigators across many institutions).

우리의 명명법은 [labs]라는 용어가 대규모 연구 센터, 협력체 및 네트워크와 구별되는 [단일 PI 또는 여러 PI 랩]을 지칭한다는 것이다. 도표 1과 그림 1은 이러한 의료 교육 연구 구조에 대한 개요를 제공한다. 우리는 아래의 다양한 구조를 간단한 예와 함께 설명하고 보충 디지털 부록 1의 각 연구 팀 구조에 대한 완벽한 사례 설명을 제공한다.
Our nomenclature is that the term labs refers to single PI or multiple PI labs, distinct from larger research centers, collaboratives, and networks. Chart 1 and Figure 1 provide an overview of these medical education research structures. We describe the different structures below with brief examples and provide complete case descriptions for each research team structure in Supplemental Digital Appendix 1 (at https://links.lww.com/ACADMED/B274).

 

단일 PI 연구소
Single PI labs

전통적인 기초과학 연구소와 유사하게, 이들 유닛은 [인프라를 유지하는 단일 PI]에 의존하여 연구 및 교육생을 지원한다. 성공적인 단일 PI 모델의 이점은 일반적으로 [명확한 연구 의제]와 [지속적인 연구비 지원]을 포함한다. 한계로는 개인 PI가 자체 자금을 계속 지원해야 한다는 압박과 연구소를 떠날 경우 연구소가 문을 닫을 가능성이 포함됩니다. 미시간 대학의 의학 교육의 Burkhardt 정책 분석, 연구 및 혁신(PRIME) 컬렉션은 단일 PI 연구소의 한 예이다. 이는 PI의 연구 활동을 그의 전반적인 목표와 일치시켜 의학교육의 정책분석, 연구, 혁신을 연구하고 잠재적인 멘티 및 협력자에 대한 그의 가시성을 높이려는 욕망에서 비롯되었다. 그것의 연구 의제는 "의학과 전문 교육의 힘을 더 큰 공공의 이익을 위해 활용하는 것"이다. 

Similar to traditional basic science labs, these units rely on a single PI who maintains the infrastructure to conduct research and support trainees. Benefits of a successful single PI model generally include a clear research agenda and sustained grant funding. Challenges include the pressure on that individual PI to continue self-funding and a likelihood that the lab would close if they left the institution. The Burkhardt Policy Analysis, Research, and Innovation in Medical Education (PRIME) Collective at the University of Michigan is an example of a single PI lab. It stemmed from a desire to align the PI’s research activities with his overall goals to study policy analysis, research, and innovation in medical education and to increase his visibility to potential mentees and collaborators. Its research agenda is “to leverage the power of medical and professional education for the greater public good.” 11

여러 PI 랩
Multiple PI labs

이러한 연구소는 동일한 기관 및 일반적으로 [동일한 부서 내에서 공통의 연구 의제를 가진 소규모 PI 그룹]에 의해 주도됩니다. 연구실 내의 각 PI가 보조금을 시작하고 보유할 수 있기 때문에 그들은 [책임을 공유]하고 [재정적 탄력성을 증가]시켰다. 잠재적 어려움으로는 [연구 이니셔티브와 프로젝트 선정을 둘러싼 집단 갈등의 가능성]이 포함된다. Stanford University의 Precision Education and Assessment Research Lab(Pearl)과 Houston의 Texas University Health Science Center의 Texas Emergency Medicine Research Center는 여러 PI Lab의 두 가지 예입니다. PEARL은 서로 보완하고 다양한 관심사를 가진 연습생들의 멘토링을 가능하게 하는 독특한 기술과 배경을 가진 3명의 연구자가 지휘한다. 그것의 임무는 "의사를 위한 훈련을 개인화하는 최선의 방법을 연구함으로써 의학 교육의 정밀도를 정의하는 것"이다.  텍사스 응급 의학 연구 센터는 학습자를 교육하기 위한 기술 적용에 대해 비슷한 열정을 공유하는 두 명의 PI에 의해 만들어졌습니다. 그것의 연구 목표는 혁신적인 의료 교육 도구의 개발, 구현 및 영향을 측정하는 것이다.  
These labs are led by a small group of PIs with a common research agenda at the same institution and generally within the same department. They have shared accountability and increased financial resilience, since each PI within the lab can initiate and hold grants. Challenges include the potential for group conflict surrounding research initiatives and selecting projects. The Precision Education and Assessment Research Lab (PEARL) at Stanford University and the Texas Emergency Medicine Research Center at the University of Texas Health Science Center at Houston are 2 examples of multiple PI labs. 12,13 PEARL is directed by 3 researchers with unique skills and backgrounds that complement one another and allow for the mentorship of trainees with diverse interests. Its mission is to “define precision in medical education by studying the best ways to individualize training for physicians [… to] optimize assessment methods to promote learning and [to] leverage technology to reimagine health professions education.” 12 The Texas Emergency Medicine Research Center was created by 2 PIs who share a similar passion for the application of technology to educate learners. Its research goals are to develop, implement, and measure the impact of innovative medical education tools. 13

연구소
Research centers

때때로 [연구 기관]이라고 불리는 이 그룹들은, [공통의 연구 의제를 공유하며, 여러 부서에 걸쳐 여러 명의 연구자를 지원하는, 기관 수준의 enterprises]이다. 연구소의 설립은 일반적으로 특정 조직 요건을 갖춘 [매우 형식적인 제도적 노력]이다. 그들은 보통 원활한 창업을 보장하기 위해 기부자 자금 또는 중앙 자금 지원을 받지만 장기적인 유지를 위해 상당한 지원이 필요하다. 몇몇은 학위를 수여할 수 있는 능력을 가지고 있거나 그들 자신의 내부 계층이나 승진 과정을 가지고 있다. 우리는 이 연구팀 설계의 3가지 예를 제시합니다.

  • Gordon Center for Simulation and Innovation in Medical Education은 학습 및 평가를 위한 혁신 기술의 개발과 평가를 연구하기 위해 마이애미 대학교 우수 센터로 설립되었다. 고든 센터는 연방 보조금과 비연방 보조금을 조합하여 자체 자금을 지원하고 있으며, 최소 50%의 노력을 연구에 바치는 4명의 전임 PI를 보유하고 있다.
  • 다음으로, 맥마스터 교육 연구, 혁신 및 이론(MERIT) 프로그램은 원래 맥마스터 대학이 문제 기반 학습 커리큘럼을 설계할 때 지원하는 다중 PI 연구실이었다. 최근 MERITE는 의학 교육 연구에서도 견습생을 지원하는 연구 센터로 발전했다.
  • 마지막으로, 캔자스 대학 의료 센터의 Jamierowski 체험 학습 연구소 내의 CoLab은 개별 제공자와 팀 성과를 조사합니다. CoLab의 설립은 사회 및 행동과학 전문지식의 필요성을 인식한 기관 리더십과 수혜자들에 의해 시작되었습니다.

Sometimes called research institutes, these groups are usually institution-wide enterprises that support multiple investigators across multiple departments who share a common research agenda. The establishment of a research center is generally a very formal institutional endeavor with specific organizational requirements. They are usually either donor-funded or centrally funded to ensure a smooth start-up but require significant support to sustain long term. Some have the capacity to grant degrees or have their own internal hierarchy or promotion process. We offer 3 examples of this research team design.

  • The Gordon Center for Simulation and Innovation in Medical Education was established as a University of Miami Center of Excellence to study the development and evaluation of innovative technologies for learning and assessment. 14 The Gordon Center is self-funded through a combination of federal and nonfederal grants and has 4 full-time PIs who dedicate a minimum of 50% of their efforts to research.
  • Next, the McMaster Education Research, Innovation and Theory (MERIT) Program 15 was originally a multiple PI lab that supported McMaster University in designing problem-based learning curricula. 16,17 Recently, MERIT evolved into a research center that also supports apprenticeships in medical education research. 2,18–20 
  • Finally, the CoLab within the Zamierowski Institute for Experiential Learning at the University of Kansas Medical Center examines individual provider and team performance. 21 The creation of CoLab was initiated by institutional leadership and benefactors who recognized the need for social and behavioral science expertise.

공동 연구
Research collaboratives

공식적인 [연구 센터]와 달리, 협력체은 [비공식적이고 더 비정형적이며, 대학 내의 부서나 학교에 걸쳐 같은 생각을 가진 연구자들 사이에서, 그리고 아마도 기관들 사이에서 더 유기적으로 발생]한다. [연구 센터]와 달리, 이것은 공식적인 제도적 구조가 아니다. 협업은 여러 PI를 보유하고 프로젝트별 팀을 구성하지만 새로운 벤처기업마다 구성원 자격을 변경할 수 있습니다. 이것은 다른 프로젝트를 후원하지만 같은 회원 그룹 내에 있는 연구 네트워크와는 대조적이다. 협력업체의 해결과제에는 [신뢰할 수 있는 자금 흐름]과 [의사소통을 위한 기술에 대한 의존도]가 포함됩니다. 

In contrast to formal research centers, collaboratives are informal and more amorphous, arising more organically between like-minded researchers across departments or schools within a university, and possibly also between institutions. In contrast to research centers, they are not formal institutional structures. Collaboratives have multiple PIs and form project-specific teams but may change their membership with each new venture. This contrasts them from research networks, which sponsor different projects but within the same member group. Challenges for collaboratives include reliable funding streams and dependence on technology for communications.

여기서는 협업의 4가지 예를 강조합니다.

  • 첫째, 의료 교육 번역 자료: METRIQ(Impact and Quality) Study Collaborative는 교육 및 번역 온라인 리소스를 개발, 측정 및 평가할 수 있는 방법을 연구하는 여러 기관의 연구자 파트너십입니다. METRIQ는 물리적인 집이 없으며, 오히려 여러 대륙에 걸쳐 수십 개의 프로젝트를 함께 완료한 협력자로 구성되어 있습니다. 
  • 둘째, 본드 대학의 TSC(Translational Simulation Collaborative)는 시뮬레이션을 통해 건강 관리를 개선하기 위해 노력하는 연구자들의 연결고리이다. 연구 협력의 초점은 번역 시뮬레이션 실습입니다. 따라서, 다양한 시뮬레이션 기법을 통해 의료 서비스 과제를 탐색하고, 잠재적 개선 사항을 테스트하며, 더 나은 의료 관행을 임상 운영에 포함시키는 것을 목표로 한다. TSC는 복잡한 재무 정리, 지적 재산권 문제 및 잠재적인 이해 상충을 가진 서로 다른 기관의 여러 연구 파트너들을 위한 포괄적인 조직 역할을 한다.
  • 셋째, ERLI(Academic Life in Emergency Medicine Education Research Lab and Incubator)는 소셜 미디어 기술과 교육 연구자 멘토십에 중점을 둔 비영리 건강 전문 교육 기관 내 연구 협력체이다. ERLI는 대학과 제휴하지 않기 때문에 대부분의 전통적인 자금 조달 메커니즘에 적합하지 않다.
  • 마지막으로, 의료 허브의 기술, 교육 및 협업은 기술, 교육 및 디지털 네트워크에 관심이 있는 6개 PI에 의해 조정된 국제 협업입니다. 허브의 핵심 원칙 중 하나가 수사관들 간의 경쟁보다는 투명성과 공유를 장려하는 것이기 때문에 공유된 학술 및 전문성 행동 강령이 있다.

We highlight 4 examples of collaboratives here.

  • First, the Medical Education Translational Resources: Impact and Quality (METRIQ) Study Collaborative is a partnership of investigators at multiple institutions who study how educational and translational online resources can be developed, measured, and evaluated for quality. 22 METRIQ has no physical home, rather it consists of collaborators that span multiple continents and have completed dozens of projects together.
  • Second, the Translational Simulation Collaborative (TSC) at Bond University is a nexus for researchers working to improve health care through simulation. 23 The focus of the research collaborative is translational simulation practice; thus, it aims to explore health services challenges, test potential improvements, and embed better health care practices into clinical operations through diverse simulation techniques. 24 TSC serves as an umbrella organization for multiple research partners from different institutions with complex financial arrangements, intellectual property issues, and potential conflicts of interest. 25 
  • Third, the Academic Life in Emergency Medicine Education Research Lab and Incubator (ERLI) is a research collaborative within a nonprofit, health professions education organization that focuses on social media technologies and education researcher mentorship. 26 ERLI is not affiliated with a university and therefore does not qualify for most traditional funding mechanisms; its funding has been largely philanthropic.
  • Finally, the Technology, Education, and Collaboration in Healthcare Hub is an international collaborative coordinated by 6 PIs interested in technology, education, and digital networks. There is a shared academic and professionalism code of conduct, as one of the core principles of the hub is to encourage transparency and sharing, rather than competition, among investigators.

연구 네트워크
Research networks

덜 형식적인 [연구 협력체]와는 대조적으로, [연구 네트워크]는 [고도로 구조화된 경향]이 있으며, [연구 주제와 연구 프로젝트에 참여하는 기관의 수를 증가시키는 것을 목표]로 한다. [멀티센터 임상시험]은 종종 연구 네트워크 내에서 수행된다. 회원들은 이러한 임상시험에 참여함으로써 느슨하게 서로 제휴하고 있으며, 의사소통을 자주 하지 않을 수 있다. 자금 조달은 복잡하며, 사이트 리드는 전체 네트워크 내에 대리점이 거의 없을 수 있다. 여기서는 두 가지 예를 프로파일링합니다.

  • 응급의학교육연구동맹(EMERA)은 노스웨스턴 대학교 응급의학 레지던트 졸업생들이 의학교육 연구에 관심을 가지고 설립한 단체이다. 회원들은 광범위한 공식적인 연구 훈련과 다양한 행정적 역할을 가지고 있다. EMERA의 임무는 응급의학의 교육적 모범 사례를 개발하는 것을 목표로 하는 다중 기관 연구를 수행하는 것이다.
  • 둘째, RCPSC이 전국적인 역량 기반 의료 교육 평가 프레임워크를 시행하기 1년 전에 캐나다 의학 평가 및 분석을 위한 캐나다 데이터 연구(CanDREAM) 팀이 설립되었다. 세 명의 교육 연구원이 이 구현을 연구하기 위해 CanDREAM을 시작했고 캐나다의 거의 모든 의사 교육 프로그램에서 광범위한 교육자 네트워크를 빠르게 모집했습니다. 네 명의 연구원이 이 대규모 팀을 이끌고 새로운 도구를 개발하고, 기계 학습 혁신을 개발하며, 평가 기준을 검증한다.

In contrast to less formal research collaboratives, research networks tend to be highly structured and aim to increase the number of study subjects and participating institutions in research projects. Multicenter clinical trials are often conducted within a research network. Members are loosely affiliated with one another through participation in these trials and may communicate infrequently. Funding is complex, and site leads may have little agency within the overall network. We profile 2 examples here.

  • The Emergency Medicine Education Research Alliance (EMERA) was established by a group of Northwestern University emergency medicine residency graduates with an interest in medical education research. 27 Members have a breadth of formal research training and diverse administrative roles. The mission of EMERA is to conduct multi-institutional research aimed at developing educational best practices in emergency medicine.
  • Second, the Canadian Data Research for Evaluation and Analytics in Medicine (CanDREAM) Team was established 1 year before the Royal College of Physicians and Surgeons of Canada implemented a nationwide competency-based medical education assessment framework. 28 Three education researchers started CanDREAM to study this implementation and quickly recruited a wide network of educators from nearly all physician training programs in Canada. Four investigators lead this large team to develop new tools, develop machine learning innovations, and validate assessment rubrics.

실험실의 주요 요소
Key Elements of Labs

우리의 경험에서, 우리는 연구실 설립이 의학 교육 연구자들이 경험하는 잘 알려진 제도적 난제를 극복하기 위한 전략적 시도라는 것을 발견했다. 연구실 출범 자체가 교수 라인, 순위, 연구 서사에 따라 교외 자금과 PI 적격성에 대한 엄격한 요건을 갖춘 기관에서는 장애물이 될 수 있다. 우리는 연구실의 성공이 종종 연구자의 비전, 열정 및 정치적 의지에 의해 결정되며, 후원 기관의 초기 노력에서 거의 결과를 얻지 못한다는 것을 발견했다. 위에서 제시한 사례를 검토하면서, [의학 교육 연구실]을 위한 몇 가지 핵심 요소를 확인했습니다. 

  • 실험실 정체성의 중요성,
  • 실험실 지정의 신호 효과,
  • 필요한 인프라
  • 실험실의 훈련 임무.

In our experience, we have found that the establishment of a lab is a strategic attempt at overcoming the well-recognized institutional challenges experienced by medical education researchers. Launching the lab can itself be a hurdle at institutions that have strict requirements for extramural funding and PI eligibility based on professoriate line, rank, and narrative of research. We have found that lab success is often predicated on the vision, passion, and political will of the investigators and rarely results from the nascent efforts of the sponsoring institution. In our review of the case examples presented above, we identified several key elements for medical education research labs:

  • the importance of lab identity,
  • the signaling effect of a lab designation,
  • required infrastructure, and
  • the training mission of a lab. 

이러한 요소는 연구실을 다른 팀 구성(즉, 연구 센터, 협업 및 네트워크)과 차별화하는 것으로 나타납니다. 
These elements appear to differentiate research labs from other team configurations (i.e., research centers, collaboratives, and networks).

실험실 아이덴티티의 중요성
Importance of lab identity

의학 교육 연구소는 표현형을 공유한다:

  • 연구실은 단일 PI 또는 소규모의 선임 연구자 및 PI 그룹에 의해 운영되며, 
  • 이들은 집중적인 연구 라인을 가지고 있으며, 
  • 그들의 임무는 가르치는 것보다 연구이다.

우리는 마지막 특성이 연구소와 [교육센터] 또는 [교육협동조합]을 구분하는 결정적인 차이점이라고 본다. 예를 들어, 임상 교육을 주로 제공하는 [시뮬레이션 센터]는 연구에 학문적인 초점을 둔 [시뮬레이션 연구소]와 본질적으로 다르다. 의학 교육 연구소는 또한 PI의 진로를 검증하고 그들의 연구 초점을 명확히 할 수 있다. 우리의 경험에서, 연구자의 자기 개념은 교육 연구자에게 중요하다. 연구자의 본질적인 동기 및 발견에 대한 접근 방식을 생명과학 동료의 것과 일치시키기 때문이다. [PI, 교수 협력자 및 연구 교육생]과 같은 식별자identifier가 관계를 정의하고 멘토/멘티 역할을 명확히 합니다. 

Medical education research labs share a phenotype:

  • the lab is directed by a single PI or small group of senior researchers and PIs,
    who have a focused line of research and
    whose mission is research rather than teaching.

We believe that the last characteristic is a critical difference that distinguishes research labs from educational centers or teaching collaboratives. For example, a simulation center that primarily provides clinical training is inherently different from a simulation research lab that has a scholarly focus to its work. 8 A medical education research lab can also validate the career path of the PI and clarify their research focus. In our experience, the self-concept of investigator is important to education researchers, as it aligns their intrinsic motivations and approach to discovery with that of their bioscience colleagues. Identifiers such as PI, faculty collaborator, and research trainee define relationships and clarify mentor/mentee roles. 29

실험실 명칭의 신호효과
Signaling effect of a lab designation

과학자들이 종종 실험실을 가지고 있기 때문에, 의학 교육 연구실을 만드는 것은 병원과 십일조 지도자들에게 개인이 과학자로 보여져야 한다는 신호로 작용할 수 있다. 연구소의 브랜드 이미지는 "소비자"(즉, 과학 발표회 및 부서 회의에 참석하는 사람들)와 기금 모금, 연구실 웹사이트를 갖는 경험을 통해 더욱 만들어진다. [웹사이트]는 특히 기관 외부에 있는 사람들에게 보내는 [합법성에 대한 중요한 신호]이다. 게다가, 우리는 우리의 경험으로 일반적으로 [실험실 구조]가 의료계hall of medicine 내에서 더 잘 이해되며, 그들을 지휘하거나 구성원인 연구자들의 작업에 신뢰성을 더한다는 것을 발견했다. 우리는 "나는 X 조건을 연구한다"(연구자 개인의 업무와 능력을 나타낸다)와 "나의 연구소는 X 조건을 연구한다"(연구팀의 업무와 확장성을 나타낸다)라는 문구 사이에 강력한 신호 차이를 보았다. 이러한 시그널링은 단일 조사자보다 확립된 연구실을 찾을 가능성이 높은 기관 내 다른 사람들과의 협업 또는 멘토링 관계를 초래할 수 있다.
Since scientists often have a lab, the creation of a medical education lab can act as a signal to hospital and decanal leaders that an individual should be seen as a scientist. The brand image of a lab is further crafted through the experiences of having “consumers” (i.e., those who attend scientific presentations and department meetings), fundraising, and having lab websites. Websites are particularly important signals of legitimacy to those external to an institution. Furthermore, we find that in our experience the lab structure is generally well understood within the halls of medicine, adding credibility to the work of the researchers who direct or are members of them. We have seen a powerful signaling difference between the phrases “I study X condition” (signaling the work and capacity of an individual researcher) and “My lab studies X condition” (signaling the work and scalability of a research team). Such signaling may lead to collaborations or mentoring relationships with others in the institution, who are more likely to find established labs than a single investigator.

필요한 인프라
Required infrastructure

실험실 활동과 인력은 [재정적 지원]이 필요하며, 실험실 모델은 개별 조사자가 이용할 수 없는 자원을 제공할 수 있다. 연구실 직원 및 기타 필요에 대한 [자금]은 특별 보조금, 자선 기부, 자문 업무 및 직접 수당, 종자 기금, 보조금 및 교수 급여의 형태로 제도적 지원을 결합하여 추구된다. [후원 기관]은 일반적으로 실험실 관리자 및 관리 직원에게 급여 지원을 제공하지만 통계학자 또는 데이터 과학자와 같은 다른 상근 직원에게는 급여 지원을 제공할 가능성이 낮다. [실험실 인력]은 PI의 연구팀을 구성하고 연구 프로그램을 촉진하는 것을 돕는다. [사무실 공간 및 장비 요구 사항]은 연구 유형 및 조직 접근 방식에 따라 달라집니다. 교육연구실의 [스마트 디자인 및 전략적 자금 지원]은 불충분하거나 산발적인 교외 자금 지원, 연구 대상자 모집의 어려움 등 공통의 장벽을 직접 극복할 수 있다. 이러한 [초기 투자]는 공식적인 부서 지원 없이 어려움을 겪을 수 있는 PI의 성공을 보장할 수 있습니다. 또한, 강력한 인프라는 프로그램 연구자의 신뢰도와 교외 자금을 위해 경쟁할 수 있는 능력을 향상시킨다.
Lab activities and personnel require financial support, and the lab model may provide resources that are not available to individual investigators. Funding for lab personnel and other needs are sought through combinations of extramural grants, philanthropic gifts, consultancy work, and institutional support in the forms of direct stipends, seed funding, grants, and faculty salaries. Sponsoring institutions commonly provide salary support for lab managers and administrative staff but are less likely to do so for other full-time personnel, such as statisticians or data scientists. Lab personnel comprise the research team of a PI and help to catalyze a research program. Office space and equipment needs vary based on the type of research and organizational approach. Smart design and strategic funding of an education research lab can directly overcome common barriers, such as inadequate or sporadic extramural funding and difficulty recruiting study subjects. These initial investments can ensure the success of a PI who might otherwise struggle without such formal departmental support. Moreover, a robust infrastructure improves the credibility of programmatic researchers and their ability to compete for extramural funding.

연구소의 훈련 임무
Training mission of a lab

우리는 [연구 교육생]들이 있는 연구실에는 많은 장점이 있다고 믿는다. 차세대 교육 연구 학자들이 이러한 연구실에서 개발되고 있으며, 우리는 확립된 연구소가 후배 학자들이 성공하기 위해 필요한 멘토링과 인프라에 더 쉽게 접근할 수 있도록 할 수 있다는 것을 발견했다. 비록 연구실에 교육teach이 의무는 아니지만, 많은 사람들이 그들의 PI에서 교육 연구를 수행하는 것을 배우는 교육자들을 후원한다. 이 교육생들은 학생, 거주자, 동료, 그리고 후배 교직원들을 포함할 수 있다. PI 멘토들의 긍정적인 참여와 영향력은 훈련생들의 훈련 프로그램을 향상시킬 수 있다. 중요한 것은, 의학교육연구실에서 교육생들의 초점은, 다른 졸업후 의학교육 훈련 프로그램에서 볼 수 있는 단순한 임상교습이나 학습이론이 아닌, [교육연구방법과 학술활동]이다. 이러한 연수생들은 후원부서 밖에 소속되어 있는 경우도 있어, 연구실을 상호 풍부하게 하는 추가적인 협업으로 이어질 수 있다. 또한 학습자는 더 많은 학습자를 유치한다. 즉, 성공적인 연구 멘토링에 대한 기록은 유사한 관심사를 가진 다른 교육생 및 교수 협력자의 모집 장치 역할을 한다.
We believe that there are many advantages for labs with research trainees. The next generation of education research scholars are developed in such labs, and we have found that established labs can make it easier for junior scholars to gain access to the mentorship and infrastructure that they need to become successful. Though labs are not mandated to teach, many sponsor trainees who learn to conduct education research from their PIs. These trainees can include students, residents, fellows, and junior faculty. The positive engagement and influence of PI mentors can enhance trainee’s training programs. Importantly, the focus for trainees in a medical education lab is education research methods and scholarship, not simply clinical teaching or learning theory as is seen with other postgraduate medical education training programs. In some cases, these trainees have affiliations outside the sponsoring department, which can lead to additional collaborations that reciprocally enrich the lab. Additionally, learners attract more learners; that is, a track record of successful research mentorship acts as a recruiting device for other trainees and faculty collaborators with similar interests.

창업 고려사항 및 지원 가능성
Start-Up Considerations and Likelihood of Support

우리는 최근 의학 교육 연구 경력을 지원하기 위해 혁신적인 조직 접근 방식을 개발하는 연구자들이 급증하는 것을 관찰했다. 왜 그럴까 하는 의문이 생긴다. 왜 실험실이나 더 큰 연구 구조가 그들의 성공을 위해 필요한가? 확실히 광범위한 교육 연구 주체와 투자 수익률을 계산하는 많은 방법(예: 지원금, 논문 발표, 프레젠테이션 전달)이 있다. 단일 PI 랩은 흔하지 않지만 고전적인 단위로 남아 있으며, (의료 교육 분야에서 종종 통합하기 어려운) 랩 인프라와 자금 지원에서 비롯되는 분명한 이점이 있다. 그러나, 우리는 이 최근의 확산에서 가치를 가져오는 다양한 규모와 범위의 다른 구조를 사용하는 것을 관찰했다. 자체 연구소를 설립할지 여부를 고민하고 있는 급성장하는 연구자에게 다음과 같은 의문이 제기된다. "어떤 전략이 최선입니까?" 의학 교육 연구자들이 그들의 생명과학 동료들이 사용하는 단일 PI 연구실을 거울로 삼아야 하는가? 아니면 의학 교육 연구자들이 그 분야에 대한 더 나은 접근법을 찾아내야 하는가? (실험실 시작 가이드는 그림 2를 참조하십시오.) 현재 우리는 연구실 모델이 부족한 것을 우려하는 바인데, 왜냐하면 [스스로 연구를 수행하는 단일 개인]은 훈련생도, 멘토링도, 미래 교육 과학자를 위한 파이프라인도 제공하지 않기 때문이다. 이러한 기회가 없다면, 훈련이 부족하기 때문에 미래에 의학 교육 실험실을 이끌 수 있는 사람이 없을 수도 있다.

We have observed a recent proliferation of investigators developing innovative organizational approaches to support their medical education research careers. The question arises: Why? Why are labs or larger research structures necessary for their success? There is certainly a wide array of education research entities and many ways to calculate return on investment (e.g., grant monies received, papers published, presentations delivered). The single PI lab is uncommon but remains a classic unit of analysis, with clear advantages that stem from lab infrastructure and funding that are often difficult to marshal in the medical education field. However, we observed in this recent proliferation the use of other constructs of various scales and scopes that bring value as well. 19 For the burgeoning researcher contemplating whether to establish a lab of their own, the question arises: “Which strategy is best?” Should medical education researchers mirror the single PI lab used by their bioscience colleagues? Or must medical education researchers identify a better approach for the field? (See Figure 2 for a lab start up guide.) The current scarcity of the lab model concerns us, as a single individual conducting research on their own yields no trainees, no mentoring, and no pipeline for future education scientists. Without these opportunities, there may be no one able to lead medical education labs in the future because of insufficient training.

 

교육 연구자를 조직 내에서 가장 잘 배치하기 위한 노력은 연구자와 그들의 소속 부서에 영향을 미친다. 우리의 경험에 따르면, [연구 협력체] 또는 [연구 네트워크]에 협력하는 연구원들은 [단일 PI 연구소]를 시작하는 데 필요한 지역 자원을 소진했기 때문에 그렇게 하는 경향이 있습니다. 그들은 처음부터 그러한 자원을 가지고 있었던 적이 없었거나 또는 그것들을 요청할 생각을 한 적이 없었습니다. 우리는 본 논문에서 검토한 다양한 연구소와 더 큰 연구 구조를 지역 연구 환경의 현실에 대한 측정된 반응으로 본다. 각 사례에서 선택한 경로는 특정 시간과 장소에서 사용할 수 있는 유일한 경로였을 수 있습니다. 우리의 사례에서 다양한 구성이 부서장들의 결정에 따라서 만들어진 것인지, 아니면 연구자들 스스로가 의사 결정자들을 중심으로 작업했기 때문에 발생했는지는 불분명하다. 
Efforts to best position an education researcher within an organization have implications for the investigator and their home department. In our experience, researchers who align themselves with research collaboratives and networks tend to do so because they have exhausted the local resources necessary to start a single PI lab, they never had such resources to begin with, or they never thought to ask for them. We view the various labs and larger research structures reviewed in this paper as measured responses to the realities of local research environments. The paths chosen for each case example may have been the only one available at that specific time and place. It is unclear from our case examples whether the various configurations occurred in response to decisions by department leaders or because the investigators themselves worked around the decision makers.

또 다른 이론은 이러한 준비는 종종 [필요성]보다는 [편의성]에 의해서 만들어진다는 것이다. 아마도 [저비용의 외부 협력]은 department로 하여금 [의료 교육 연구자]를 지원할 책임을 더 쉽게 포기하도록 만들지도 모른다. 왜 그들이 지원해야 하는지, 얼마나 지원해야 하는지, 어떤 방식으로 지원해야 하는지, 그리고 어떤 목적으로 지원해야 하는지. 아무도 이런 질문을 하지 않고, 그저 외부에서 의학교육 연구 지원을 찾고 있다면, department는 이러한 질문에 대한 답변을 회피하게 되기 쉽다. 우리의 경험으로 볼 때, 이러한 질문에 대한 정직한 답변은 의료 교육 연구, 지원을 요청하는 개별 조사자 또는 둘 다에 대한 가치 판단을 나타낸다.
Another theory is that these arrangements are often made of convenience rather than necessity. Perhaps low-cost, external collaborations more easily allow departments to abdicate their responsibilities to support medical education researchers. Why should they support, how much should they support, in what ways should they support, and to what end should they support? It is easy for a department to avoid answering these questions if no one is asking them but instead looking externally for medical education research support. In our experience, honest answers to these questions represent value judgments about medical education research, the individual investigator seeking support, or both.

지금까지 자원이 부족해왔던 분야에서 얼마나 많은 연구소가 존재할 수 있으며, 존재해야 하는가? 의학 분야의 다른 분야들에 비해 미국에서 이용할 수 있는 의학 교육 연구 보조금은 매우 적다. 연구자들이 재정적으로 자립할 가능성이 낮은 연구 분야의 성장을 옹호하는 것이 옳기는가? 이러한 평가 질문은 학문적 의학에서 제자리를 찾으려는 잘 훈련된 의료 교육 연구자의 수가 증가하고 있는 실존적 위기를 나타낸다. 우리의 사례 예는 연구 정체성을 확립하는 방법에 대한 로드맵을 제공할 수 있지만, [왜, 언제, 또는 연구 정체성을 확립해야 하는지] 또는 [연구 정체성 확립에 얼마나 오래 걸릴 수 있는지]에 대한 로드맵을 제공하지는 않는다. 우리의 경험에 따르면, 실험실 설계에 대한 물류 결정이 내려지기 전에 그러한 결정들은 개인화되고 현재의 고용 상황에 맞춰져야 한다. 당연히 [교육 연구소를 위한 최선의 계획]은 [부서 및 기관 문화의 영향]을 받습니다. 단일 PI 랩을 시작하는 선택은 다른 분야의 랩이 현지에서 일반적인지 또는 기관이 그러한 혁신에 대한 욕구를 가지고 있는지에 따라 달라질 것이다. 이러한 조건(예: 자원이 풍부한 부서 및/또는 지원 기관 문화)이 없다면 교육 연구소를 시작하고 유지하는 데 필요한 지원이 불충분하고 그러한 연구소가 달성할 수 있는 성공은 미미할 수 있다고 생각합니다.

How many research labs can or should exist in a field with historically scarce resources? There are very few medical education research grants available in the United States compared with other disciplines in medicine. Is it even right to advocate for the growth of a research field in which investigators are unlikely to financially sustain themselves? These questions of valuation represent an existential crisis for the growing number of well-trained medical education researchers trying to find their place in academic medicine. Our case examples can provide roadmaps as to how to establish a research identity but not why or when one should or how long one might need to establish a research identity. In our experience, those decisions must be individualized and aligned to one’s current employment situation before any logistical decisions about lab design can be made. Unsurprisingly, the best conceived plans for an education research lab are subject to departmental and/or institutional culture. The choice to start a single PI lab will depend on whether labs in other disciplines are common locally or if the institution has an appetite for such innovation. Without these conditions (e.g., a well-resourced department and/or a supportive institutional culture), we feel that the necessary support to start and maintain an education research lab will be inadequate and that any successes such a lab may achieve may be meager.

결론들
Conclusions

의학교육연구소의 성공적인 출범은 비전과 전략을 전제로 한다. 연구자는 후원 기관 어디에도 이미 존재할 것 같지 않은 것을 기꺼이 만들어내야 하며, 역할 모델링을 본 표준 프로세스와 방법을 넘어서야 합니다. 새로운 연구소장은 기관 외부의 동료들로부터 모델과 도식을 찾아야 할 것 같은데, 우리는 이것이 이 기사를 통해 다소 쉬워졌기를 바란다. 우리의 경험에 따르면, [성공적인 구현]은 [연구소의 출범과 장기적인 생존 가능성 모두를 위한 전략적 계획, 이해관계자 분석의 신중한 사용, 강력한 정치적 감각]을 필요로 한다. 의료 교육 연구소의 사례 사례는 자체 연구소를 설립할 준비를 하는 조사관에게 교훈을 제공한다. 부서 리더들이 교육 연구실을 왜 그리고 얼마나 중시하는지, 그리고 이 평가가 궁극적으로 실험실의 설계와 성공 가능성을 지시하는지에 대한 의문들이 남아 있다.
We believe that the successful launch of a medical education research lab is predicated on vision and strategy. Investigators must be willing to create something that is unlikely to already exist anywhere in their sponsoring institutions, and they must move beyond the standard processes and methods they have seen role modeled. New lab directors will likely need to seek out models and schemas from colleagues outside their institution, something that we hope has been made somewhat easier by this article. In our experience, successful implementation requires

  • a strategic plan for both the launch of the lab and its long-term viability,
  • deliberate use of stakeholder analyses, and
  • a strong political acumen.

Our case examples of medical education research labs offer lessons for investigators preparing to establish their own labs. Questions remain as to why and how much department leaders value education research labs and whether this valuation ultimately dictates the design of a lab and its likelihood of success.

 


Acad Med. 2022 Sep 1;97(9):1281-1288. doi: 10.1097/ACM.0000000000004746. Epub 2022 May 24.

The Purpose, Design, and Promise of Medical Education Research Labs

Affiliations collapse

Affiliations

1M.A. Gisondi is associate professor and vice chair for education, Department of Emergency Medicine, and principal, Precision Education and Assessment Research Lab (PEARL), Stanford University School of Medicine, Stanford, California; ORCID: https://orcid.org/0000-0002-6800-3932 .

2S. Michael is assistant professor, Department of Emergency Medicine, University of Colorado Anschutz Medical Campus, Aurora, Colorado; ORCID: https://orcid.org/0000-0003-0077-6282 .

3S. Li-Sauerwine is assistant professor and assistant program director, Department of Emergency Medicine, The Ohio State University, Columbus, Ohio, and chief academic officer, Academic Life in Emergency Medicine Education Research Lab and Incubator; ORCID: https://orcid.org/0000-0003-3445-6404 .

4V. Brazil is professor of emergency medicine and director, Translational Simulation Collaborative, Bond University, Gold Coast, Queensland, Australia; ORCID: https://orcid.org/0000-0001-9103-2507 .

5H.A. Caretta-Weyer is assistant professor and associate program director, Department of Emergency Medicine, and senior scientist, PEARL, Stanford University School of Medicine, Stanford, California; ORCID: https://orcid.org/0000-0002-9783-5797 .

6B. Issenberg is professor of medicine, professor of medical education, the Michael S. Gordon Chair of Medical Education, University of Miami Miller School of Medicine, and senior associate dean for research in medical education and director, Gordon Center for Simulation and Innovation in Medical Education, University of Miami Miller School of Medicine, Miami, Florida; ORCID: https://orcid.org/0000-0002-2524-4736 .

7J. Giordano is assistant professor, director of undergraduate medical education, codirector of medical education fellowship, Department of Emergency Medicine, and lead, Texas Innovation and Educational Research Lab, McGovern Medical School at University of Texas, Houston, Texas.

8M. Lineberry is director of simulation research, assessment, and outcomes, Zamierowski Institute for Experiential Learning, and associate professor of population health, University of Kansas Medical Center and Health System, Kansas City, Kansas; ORCID: https://orcid.org/0000-0002-0177-5305 .

9A.S. Olson is assistant professor and assistant program director, Section of Emergency Medicine, Department of Medicine, University of Chicago, Chicago, Illinois; ORCID: https://orcid.org/0000-0002-2585-0971 .

10J.C. Burkhardt is assistant professor, Departments of Emergency Medicine and Learning Health Sciences, University of Michigan Medical School, and principal investigator, Policy Analysis, Research, and Innovation in Medical Education Collective, University of Michigan, Ann Arbor, Michigan; ORCID: https://orcid.org/0000-0001-6273-8762 .

11T.M. Chan is associate dean for continuing professional development, Faculty of Health Sciences, associate professor, Divisions of Emergency Medicine and of Education & Innovation, Department of Medicine, clinician scientist, McMaster Education Research, Innovation, and Theory Program, McMaster University, Hamilton, Ontario, Canada, and founder, Technology, Education and Collaboration in Healthcare Hub; ORCID: https://orcid.org/0000-0001-6104-462X .

PMID: 35612923

DOI: 10.1097/ACM.0000000000004746

Abstract

Medical education researchers are often subject to challenges that include lack of funding, collaborators, study subjects, and departmental support. The construct of a research lab provides a framework that can be employed to overcome these challenges and effectively support the work of medical education researchers; however, labs are relatively uncommon in the medical education field. Using case examples, the authors describe the organization and mission of medical education research labs contrasted with those of larger research team configurations, such as research centers, collaboratives, and networks. They discuss several key elements of education research labs: the importance of lab identity, the signaling effect of a lab designation, required infrastructure, and the training mission of a lab. The need for medical education researchers to be visionary and strategic when designing their labs is emphasized, start-up considerations and the likelihood of support for medical education labs is considered, and the degree to which department leaders should support such labs is questioned.

보건의료전문직 교육에서 리포팅 가이드라인의 사용과 가치(Acad Med, 2020)
On the Use and Value of Reporting Guidelines in Health Professions Education Research

 

연구 간행물에서의 보고 지침의 사용과 가치에 대한 대화는 종종 양극화된 견해를 이끌어낸다. 그러한 견해는 더 많은 정보와 사려 깊은 고려의 필요성을 나타낸다. 우리 자신의 건강 전문 교육 분야의 한 예로, 오스트리아 빈에서 열린 유럽 의학 교육 협회의 2019년 회의에서 편집자 패널 토론이 [건강 전문 교육 연구 출판에서의 논쟁과 도전]이라는 제목의 토론은 HPE 연구 출판물의 보고 지침의 사용법을 둘러싼 편집자와 작가들 간의 활발한 토론을 촉발했습니다. 일부 참가자들은 그러한 지침의 사용을 강력히 지지한 반면, 다른 참가자들은 단호하게 반대했다. 이 사설에서, 우리는 보고 지침에 대해 학술 의학 커뮤니티에 알리고, 저널의 편집자로서 이에 대한 우리의 관점을 공유하며, 이러한 지침에 대한 지속적인 대화를 촉진하는 것을 목표로 한다. 
Conversations about the use and value of reporting guidelines in research publications often elicit polarized views. Such views signal a need for more information and thoughtful consideration. As an example from our own field of health professions education, the editors’ panel discussion at the 2019 meeting of the Association for Medical Education in Europe in Vienna, Austria, entitled Controversies and Challenges in Publishing Health Professions Education Research, prompted a lively discussion among editors and authors around the use of reporting guidelines in health professions education research publications. Some participants strongly endorsed use of such guidelines, while others staunchly opposed them. In this editorial, we aim to inform the Academic Medicine community about reporting guidelines, share our perspective on them as editors of the journal, and promote ongoing dialogue on these guidelines.

보고 지침이란 무엇입니까?
What Are Reporting Guidelines?

보고 지침Reporting guidelines은 독자가 연구 또는 검토를 이해하고 평가 및/또는 복제할 수 있도록 하기 위해 연구 연구 또는 문헌 검토를 설명하는 원고에 저자가 포함해야 하는 주요 정보를 나열하고 설명합니다.1 Reporting guidelines은 저자를 위한 [저널의 지침]을 보완하는데, [저널의 지침]은 단어 수 및 구조와 같은 기술적 요구사항에 초점을 맞추는 경향이 있어서, 원고나 출판물에 제시된 증거의 신뢰성, 관련성 및 품질을 평가하는 데 사용되는 [비판적 평가 도구]와는 다르다.

  • 일부에서는 불완전한 보고는 실제로 작성자가 단어 제한을 준수하기로 한 결정이거나 단순한 감독일 수 있는 경우 종종 방법론적 품질이 낮다는 신호로 해석되기 때문에, [철저한 정보 보고 평가]는 [비판적 평가 과정]과 구별되어야 한다고 주장한다.
  • 다른 이들은 정보의 [철저한 보고]가 [비판적 평가]의 필수적 선행조건이며 높은 과학적 기준을 충족하는 과정의 일부라고 생각한다.

Reporting guidelines list and describe the key information that authors should include in a manuscript that describes a research study or literature review, to ensure that readers can understand, evaluate, and/or replicate the study or review.1 Reporting guidelines complement a journal’s instructions for authors, which tend to focus on technical requirements such as word count and structure,2 and differ from critical appraisal tools, which are used to assess the trustworthiness, relevance, and quality of evidence presented in a manuscript or publication.3–5 

  • Some maintain that evaluation of thorough information reporting should be kept distinct from the critical appraisal process, since incomplete reporting is often interpreted as a sign of low methodologic quality when, in fact, it may be a decision made by authors to abide by word limits or a simple oversight.6 
  • Others consider thorough reporting of information to be a necessary precursor to critical appraisal and part of a process that fulfills high scientific standards.7,8

보고 지침의 간략한 기록
A Brief History of Reporting Guidelines

보고 지침은 과학 저널에 게재된 증거의 품질과 실제 의사 결정에서 약한 증거로 판명될 수 있는 신뢰와 관련된 위험에 대한 우려에 대응하여 시간이 지남에 따라 발전되었다. 많은 의학 분야에서, [연구 결과를 복제하여 증거를 검증하려는 연구자들의 노력]은 [연구 방법과 결과에 대한 불충분한 정보]로 인해 혼란스러워졌다. 이 문제를 해결하기 위해 생물의학 연구에서 [무작위 통제 시험]에 대한 [두 가지 보고 지침]이 독립적으로 개발되었다. 이들은 최종적으로 CONSORT을 구성하기 위해 결합되었습니다.
Reporting guidelines evolved over time in response to concerns about the quality of evidence published in scientific journals and the risks associated with trusting what may turn out to be weak evidence in practical decision making. Across many fields of medicine, researchers’ efforts to verify evidence by replicating study findings have been confounded by insufficient information about study methods and results.9 Two reporting guidelines for randomized controlled trials in biomedical research were independently developed to address this problem; the 2 were ultimately combined to form CONSORT (Consolidated Standards of Reporting Trials).9,10

연구의 투명성을 높여야 한다는 오픈사이언스 운동과 최근 체계적인 검토, 메타분석, 기타 형태의 지식합성 붐 등 현재 학문의 흐름을 감안할 때 보고지침에 대한 인식가치가 높아졌다. CONSORT는 다양한 장르와 학문에 대한 접근 방식에 걸친 후속 보고 지침을 위한 기반을 마련했습니다.
The perceived value of reporting guidelines has increased, given current trends in scholarship such as the Open Science movement, which calls for greater transparency in research,11 and the recent boom in systematic reviews, meta-analyses, and other forms of knowledge synthesis.1,12 CONSORT laid the foundation for subsequent reporting guidelines spanning multiple genres and approaches to scholarship—for example,

  • CARE (for case reports),13 
  • PRISMA (Preferred Reporting Items for Systematic Reviews and Meta-Analyses),14,15 
  • SQUIRE (Standards for Quality Improvement Reporting Excellence) 2.0,16 
  • COREQ (Consolidated Criteria for Reporting Qualitative Research),17 and
  • STROBE (Strengthening the Reporting of Observational Studies in Epidemiology).18

초기 지침의 대부분은 생물의학과 건강 연구에서 비롯되었지만, 사회과학 및 교육 분야의 학자들은 보고 지침의 자체 버전을 채택하고, 채택하고, 만들었다. 보건 전문직 교육을 위해 개발된 지침으로는 SQUIRE-EDU(교육 품질 향상 보고 우수성 기준), GREET(증거 기반 실무 교육 개입 및 교육 보고 지침), SRQR(질적 연구 보고 기준) 등이 있다. 보건 전문 교육에서 자주 언급되는 다른 지침으로는 CHERRES(인터넷 전자 설문 조사 결과 보고용 체크리스트), PRISMA, RAMESES(실재주의자 및 메타 내러티브 증거 합성: 발전하는 표준) 및 STROBE. 표 1은 보건 전문 교육 연구에 적용할 수 있는 지침의 예를 보여줍니다.
While many of the early guidelines originated in biomedical and health research, scholars in the social sciences and education adopted, adapted, and created their own versions of reporting guidelines. Guidelines developed for health professions education include

  • SQUIRE-EDU (Standards for Quality Improvement Reporting Excellence in Education),19 
  • GREET (Guideline for Reporting Evidence-Based Practice Educational Interventions and Teaching),20 and
  • SRQR (Standards for Reporting on Qualitative Research.21 

Other guidelines frequently referenced in health professions education include

  • CHERRIES (Checklist for Reporting Results of Internet E-Surveys),22 
  • PRISMA,14,15 
  • RAMESES (Realist and Meta-Narrative Evidence Syntheses: Evolving Standards),23 and
  • STROBE.18

Table 1 presents examples of guidelines that are applicable to research in health professions education.

보고 지침의 확산으로 인해 중복성을 줄이고 보급을 강화하기 위한 품질 관리 및 관리가 필요하게 되었습니다. 2008년에 설립된 EQUATOR (Enhancing the Quality and Transparency of Health Research) 네트워크는 [생물의학 및 사회과학] 커뮤니티 구성원들이 보고 지침을 개념화하는 방법을 형성하는 데 큰 역할을 해왔다. EQUATOR 네트워크는 보고 지침의 목적이 "연구자들에게 연구 방법을 알려주기 위해서가 아니라, 원고에 어떤 정보를 포함시켜야 하는지 상기시키기 위한 것"이라고 명시하고 있다. 

The proliferation of reporting guidelines created a need for quality control and management to reduce redundancy and enhance dissemination. The EQUATOR (Enhancing the Quality and Transparency of Health Research) Network, established in 2008, has played a large role in shaping how members of the biomedical and social science communities conceptualize reporting guidelines.1 The EQUATOR Network states that the purpose of reporting guidelines is “to remind researchers of what information to include in the manuscript, not to tell them how to do research.”9(p73)

보고 지침의 가치에 대한 상반된 주장
Conflicting Arguments on the Value of Reporting Guidelines

보고 지침의 용도는 다양하다.

  • 어떤 저널은 저자가 기사를 제출할 때 보고 가이드라인 체크리스트를 작성하도록 요구하기도 하고, 
  • 어떤 저널은 검토자가 검토를 완료할 때 보고 가이드라인을 참조하도록 권장하기도 하며,
  • 어떤 저널은 보고 가이드라인을 전혀 언급하지 않는다

지지자들은 보고 지침을 투명성을 위한 환영받는 도구로 보는 경향이 있다. 가이드라인은 출판 경험에 관계없이 모든 사람이 기본 표준과 기대를 자유롭게 이용할 수 있도록 한다. 지침은 또한 주요 정보의 누락을 줄임으로써 학문의 질을 향상시킬 수 있는데, 이는 보고서 품질을 위해 출판된 기사를 평가한 여러 연구에서 지적된 문제이다. 연구에 대한 주요 정보를 일관된 방식으로 보고하면, 엄격한 방법론을 위해 노력하는 저자에게 보상할 수 있습니다.
Use of reporting guidelines varies.

  • Some journals require authors to complete reporting guideline checklists when submitting articles,
  • other journals encourage reviewers to refer to reporting guidelines when completing reviews, and
  • still other journals do not mention reporting guidelines at all.24,25 

Proponents tend to view reporting guidelines as a welcome tool for transparency. Guidelines make basic standards and expectations freely available to all, regardless of publication experience. Guidelines may also improve the quality of scholarship by reducing the omission of key information, a problem noted in several studies that have evaluated published articles for reporting quality.7,26 Reporting key information about a study in a consistent way rewards authors who invest in rigorous methodology.27

[보고지침에 반대하는 사람들]은 작성자와 검토자의 [규범적이고 비판적이지 않은 사용]에 대한 우려를 제기한다.28

  • 보고지침이 보고 "체크리스트"로 전환되면 [창의성이 저해]될 수 있으며, [지침을 준수하는 접근방식이나 기법]이 그렇지 않은 접근방식보다 더 가치가 있음을 암시한다.
  • 보고 지침의 사용은 [가시적 한계(예: 설계 결함, 낮은 응답률)]가 있는 [소규모 연구를 보고하는 자원이 적은 연구자]에게 불리할 수 있다.29
  • 또한 일부에서는 [작성자가 제공하는 정보의 충분성을 평가하고 필요에 따라 추가 설명을 요청하는 것]이 [전문가 검토자의 의무]이기 때문에, 강력한 피어 리뷰 체계에서 지침이 필요하지 않다고 주장한다. 

Those opposed to reporting guidelines raise concerns about their prescriptive and uncritical use by authors and reviewers.28 

  • The conversion of reporting guidelines into reporting “checklists” can inhibit creativity and imply that the approaches or techniques that conform to guidelines are more valuable than those that do not.
  • The use of reporting guidelines may disadvantage researchers with fewer resources who report smaller-scale studies with visible limitations (e.g., design flaws, lower response rates).29 
  • Some also argue that guidelines are not necessary in a robust peer review system, as it is the duty of expert reviewers to evaluate the sufficiency of information provided by authors and request additional clarification as needed.29

편집자들과 평론가들은 [뉘앙스의 필요성]을 인정한다. 의학교육연구의 질적 기준은 생물의학연구의 질적 기준에 큰 영향을 받은 것은 사실이지만, 강력한 사회과학연구의 유입은 

  • 검토자 풀을 다양화했고,
  • 저널 편집팀의 전문성을 확장했으며,
  • 과학의 다양한 철학을 반영하고, 다양한 분야의 방법론을 채택하면서도, 원고의 공정하고 정확한 평가를 보장하는 방법에 대한 많은 논의를 장려했다.


Editors and reviewers appreciate the need for nuance. While it is true that the quality standards for medical education research have been heavily influenced by those of biomedical research, the influx of robust social science research has

  • diversified the reviewer pool,
  • expanded the expertise of journals’ editorial teams, and
  • encouraged many thoughtful discussions of how to ensure fair and accurate evaluation of manuscripts that reflect different philosophies of science and employ methodologies from various disciplines.30

우리의 견해
Our View

학술 의학 편집팀으로서, 우리는 [보고 지침의 현명한 사용]을 지지한다. 저자, 검토자 및 저널 편집자는 명확성과 일관성을 극대화하기 위해 주어진 연구에서 보고되어야 할 정보를 결정할 때 올바른 판단을 적용해야 한다. 어떤 상황에서는 특정 정보(예: 참가자의 익명성을 훼손할 수 있는 정보, 얻을 수 없거나 특정 연구 설계나 방법론 또는 사용 가능한 자원의 맥락에서 타당하지 않은 정보)를 포함하지 않는 것이 허용될 수 있다. 결국, [많은 중요한 교육적 연구 문제를 조사하려는 노력]은 [그에 대한 답을 목표로 하는 연구의 양과 질]에 의해 제한된다. 이러한 경우, 새로운 연구는 그 자체의 중요한 방법론적 한계를 가지고 있더라도 문헌에 실질적이고 의미 있게 추가될 수 있다. 이러한 인식은 우리 모두가 우리의 지식에 무엇을 더하는지에 비추어 연구를 판단하는 데 열려 있어야 하며, 이 분야의 현재 상태를 고려할 때, 지나치게 엄격할 수 있는 보고 기준만으로 연구를 판단해서는 안 된다는 것을 의미한다.

As the editorial team at Academic Medicine, we advocate judicious use of reporting guidelines. Authors, reviewers, and journal editors must apply good judgment when deciding what information must be reported in a given study to maximize clarity and coherence. In some circumstances, it may be acceptable not to include certain information (e.g., information that would compromise participant anonymity, that cannot be obtained, or that does not make sense in the context of the particular study design or methodology or available resources). After all, efforts to investigate many important educational research questions are limited by the amount and quality of the research that aims to answer them. In these cases, new studies, even with important methodological limitations of their own, can substantially and meaningfully add to the literature. This recognition means that we all have to be open to judging research in light of what it adds to our knowledge and not judging that research only by reporting standards that may be overly stringent given the state of a field.

교육 연구는 축적에 의해 성장하며, 작은 이득도 가치가 있을 수 있다. 또한, 보고 지침을 사용하지 않더라도 저자는 훌륭한 기사를 쓸 수 있고 검토자는 훌륭한 리뷰를 완성할 수 있다. 따라서 보고 지침의 사용을 의무화하지는 않지만 보고 지침은 가치가 있다고 생각합니다. 다음 섹션에서는 보고 지침을 사용하여 작성자, 검토자 및 편집자를 구상하는 방법에 대해 설명합니다.
Education research grows by accretion, and small gains can be valuable. Furthermore, authors may write excellent articles and reviewers may complete superb reviews without using reporting guidelines. We therefore do not mandate the use of reporting guidelines, yet we believe that reporting guidelines have value. In the sections that follow, we describe the ways that we envision authors, reviewers, and editors using reporting guidelines.

작가들
Authors

우리는 저자들이 교육 및 심리학 같은 사회과학에서 일반적으로 사용되는 지침뿐만 아니라, EQUATOR 네트워크에서 승인한 보고 지침에 익숙해지도록 권장한다. [분별적 활용]이란 저자가 보고 가이드라인을 꼼꼼히 검토하고, 작업에 가장 적합한 가이드라인을 선정하고, 특정 가이드라인 항목이 적용되지 않을 때를 자신 있게 결정하는 것을 의미한다. 저자는 자신의 연구에 적합하지 않다고 생각하는 정보를 제공하도록 요청받는 경우 항상 검토자와 편집자에게 자신의 근거를 설명할 수 있는 선택권이 있다.
We encourage authors to become familiar with reporting guidelines endorsed by the EQUATOR Network as well as those commonly used in social sciences such as education31–33 and psychology.34,35 Judicious use means that authors review reporting guidelines carefully, selecting the guidelines most appropriate for their work, and confidently deciding when certain guideline items do not apply. Authors always have the option to explain their rationale to reviewers and editors if they are asked to provide information that they think is not appropriate for their study.

간단히 말해서, 우리는 저자들이 연구의 설계, 수행 및 기록 전반에 걸쳐 지침을 리소스로 참조할 것을 권고한다. 우리는 학술 의학에 제출할 때 보고 지침의 사용을 의무화하지 않는다. 앞서 지적한 바와 같이, [새로운 학술적 질문] 또는 [lower-resources 환경에서만 다룰 수 있는 질문]은 보고 지침을 더 겸손하거나 덜 준수할 수 있으며, 그렇다 하더라도 여전히 문헌에 대한 진정으로 중요한 기여를 할 수 있다. 저자는 주장이나 해석을 할 때 신중해야 하며 작품의 한계를 분명히 밝혀야 한다. 모든 연구 보고서는 방법론에 대한 설명을 투명하게 해야 한다.

In short, we advise authors to refer to guidelines as a resource throughout the design, conduct, and write-up of a study.28 We do not mandate the use of reporting guidelines for any submission to Academic Medicine. As previously indicated, reports involving novel scholarly questions, or questions that can only be addressed in lower-resources settings, may be more modest or less adherent to reporting guidelines and still represent truly important contributions to the literature. Authors must be careful when making claims or interpretations and should clearly state the limitations of their work. All research reports should be transparent in their descriptions of their methodologies.

연구보고서를 지나치게 표준화하는 것이 아니라, [다양한 청중이 접근할 수 있도록 하는 것]이 목표다. 이 야심찬 목표는 작가, 검토자 및 편집자가 사이에서 [미묘한 균형]을 협상할 것을 요구한다.

  • (1) 연구자의 가정, 접근 방식, 프로세스 및 결과에 대한 명확하고 포괄적인 설명과 
  • (2) 연구자의 성실성, 독창성, 판단력에 대한 존중 

이 균형을 찾는 것은 연구자들이 보건 전문 교육 밖에서 잘 확립된 접근법과 방법론을 그릴 때 특히 중요하다.
The goal is to make research accessible to a diverse audience, not to overly standardize research reports. This ambitious goal requires authors, reviewers, and editors to negotiate a delicate balance between

  • (1) a clear, comprehensive description of the researchers’ assumptions, approach, processes, and findings and
  • (2) respect for researchers’ integrity, ingenuity, and judgment.

Finding this balance is particularly important when researchers draw on approaches and methodologies that are well established outside of health professions education.

리뷰어
Reviewers

우리는 학계 및 과정의 중요한 부분인 [피어 리뷰어의 전문성]에 크게 의존한다. 우리는 원고의 품질을 공정하고 비판적으로 판단하기 위해 필요한 전문 지식을 갖춘 리뷰어를 찾는 데 전념하고 있습니다. 동시에, 우리는 보건 직업 교육과 같은 [다학제적 분야의 철학적 지향과 방법론의 넓은 폭]이 모든 연구, 특히 보건 전문직 교육 연구에 대한 새로운 아이디어와 접근 방식을 소개하는 [연구에 대한 내용과 방법론적 전문 지식]을 모두 갖춘 검토자를 식별하는 것을 어렵게 만든다는 것을 인식한다.

  • 우리는 [보고 지침]이, 콘텐츠 전문지식을 가질 수 있는 영역에서 [생소한 방법론을 접하는 검토자]에게 [잠재적으로 유용한 리소스]로 보고한다.
  • 우리는 또한 [보고 지침]을, 방법론을 잘 알기 때문에 비전문가 독자에게는 더 많은 설명이 필요한 결정, 절차 또는 용어를 당연하게 여길 수 있는 전문가에게 [유용한 리마인더]라고 본다.

요약하면, 우리는 가이드라인을 검토 프로세스를 표준화, 훼손 또는 비숙련화하려는 시도가 아니라, 리뷰어가 각 원고에 가져오는 탁월한 통찰력을 향상시키기 위한 도구로 본다.
We rely heavily on the expertise of peer reviewers, who are a critical part of our scholarly community and process. We are committed to finding reviewers with the necessary expertise to fairly and critically judge the quality of manuscripts. At the same time, we recognize that the breadth of philosophical orientations and methodologies in a multidisciplinary field such as health professions education makes it challenging to identify reviewers with both content and methodological expertise for all studies, especially for studies introducing new ideas and approaches to health professions education research.

  • We see reporting guidelines as a potentially helpful resource for reviewers who encounter unfamiliar methodology in an area where they may have content expertise.
  • We also see reporting guidelines as useful reminders for experts who may know the methodology well and take for granted decisions, procedures, or terminology that warrant more explanation for nonexpert readers.

In sum, we view guidelines as a tool to enhance the excellent insights that reviewers bring to each manuscript, not as an attempt to standardize, undermine, or de-skill the review process.

특히 학술 의학은 연구 원고에 대한 검토 기준을 제공한다. 검토 기준은 검토자가 원고를 평가하고 저자와 편집자에게 유용한 피드백을 제공하는 데 도움을 주기 위한 것이다.
Of note, Academic Medicine provides review criteria for research manuscripts (available at https://store.aamc.org/review-criteria-for-research-manuscripts.html). Review criteria are meant to assist reviewers in evaluating manuscripts and providing helpful feedback to authors and editors.

편집자
Editors

이 저널의 편집팀으로서, 우리는 출판을 위해 받아들여진 원고가 독자들에게 연구의 신뢰성을 판단하고 연구 결과를 어떻게 사용할지에 대한 정보에 입각한 결정을 내리는 데 필요한 정보를 제공할 수 있도록 최선을 다하고 있습니다. 일부 원고들은 그들의 메시지를 명확하게 전달하기 위해 제안된 제한보다 더 많은 단어를 필요로 할 것이며, 우리는 이것을 사례별로 고려할 용의가 있다. 학술 의학에 제출된 모든 원고는 편집 및 직원 팀의 최소 2명의 구성원에 의해 평가됩니다. 우리는 스스로 새로운 방법론에 대해 배우고, 우리가 여러 관점을 가지고 있는지 확인하기 위해 원고에 대한 어려운 결정에 대해 논의한다. 우리는 저자가 보고 지침을 체크리스트로 사용하도록 요구하지는 않지만, 저자가 자신의 작업에 대한 보고를 최적화했는지 확인하기 위한 방법으로 특정 지침을 검토할 것을 권고할 수 있다. 
As the journal’s editorial team, we are committed to ensuring that manuscripts accepted for publication provide readers with the information they need to judge the credibility of studies and make informed decisions about how to use study findings. Some manuscripts will require more words than the suggested limits to convey their messages clearly, and we are willing to consider this on a case-by-case basis. Every manuscript submitted to Academic Medicine is also assessed by at least 2 members of the editorial and staff team. We learn about new methodologies ourselves and discuss challenging decisions about manuscripts to ensure that we bring multiple perspectives to bear. While we do not require authors to use reporting guidelines as a checklist, we may recommend that authors review a particular guideline as a way to ensure that they have optimized the reporting of their work.

요약
Summing Up

보고 지침의 현명한 사용에 대한 우리의 권고가 보건 전문 교육 출판물에서 그러한 지침의 역할에 대한 다른 관점을 통합하기를 바란다. 우리는 보고 지침의 존재에 대한 인식을 높이고, 이에 대한 지속적인 교육을 장려하며, 우리 커뮤니티에서 보고 지침 사용에 대한 사려 깊은 대화를 자극하는 것을 목표로 한다. 진행 중인 대화에는 보건 전문 교육 연구를 위한 보고 지침의 유용성과 관련성에 대한 고려가 포함되어야 하며, 이상적으로는 명확한 의사소통을 촉진하고 우리 분야의 엄격함을 증진시키는 보고 지침의 가치에 대한 새로운 연구 기회를 이끌 것이다.
Our recommendation of judicious use of reporting guidelines will, we hope, unify different perspectives on the role of such guidelines in health professions education publications. We aim to increase awareness of the existence of reporting guidelines, encourage ongoing education about them, and stimulate thoughtful dialogue about the use of reporting guidelines in our community. Ongoing dialogue must include consideration of the utility and relevance of reporting guidelines for research in health professions education and, ideally, will lead to new opportunities for research on the value of reporting guidelines in fostering clear communication and furthering rigor in our field.

 

 


 

Acad Med2020 Nov;95(11):1619-1622.doi: 10.1097/ACM.0000000000003666.

 

On the Use and Value of Reporting Guidelines in Health Professions Education Research

Affiliations collapse

Affiliations

1Associate editor, Academic Medicine.

2Deputy editor, Academic Medicine.

3Editor-in-chief, Academic Medicine.

PMID: 33109958

DOI: 10.1097/ACM.0000000000003666

No abstract available

이름에 무엇이 있는가? 질적 서술 다시 보기 (Res Nurs Health. 2010)
What’s in a Name? Qualitative Description Revisited
Margarete Sandelowski*

 

내가 10년 전 '질적 묘사에 무슨 일이 일어났는가'(샌델로프스키, 2000)를 구상하고 썼을 때, 나는 그것을 비판과 해명으로 읽힐 것을 의도했었다. 이 비판은 질적 건강 연구 보고서에서 오늘날에도 여전히 지속되는 상황에 대한 것으로, 이 방법들이 사용된 증거를 보여주는 발견을 만들기 위해 방법(예: 근거 이론, 현상학)을 사용했다고 주장하는 것이다. 이러한 연구들을 수행한 사람들이 합법적으로 주장할 수 있는 방법론적 접근법에 대한 해명이었지만, 방법론 텍스트에서 독특한 방법으로 식별되는 경우는 거의 없다. 그 2000년 기사에서, 나는 질적 기술을 다른 질적 방법과 구별될 수 있고 기초적인 것으로 제시했다. 나는 정성적 연구와 정량적 연구 모두에서 서술의 종류를 간략하게 비교함으로써 해석의 정도에 따라 다양한 종류의 서술들을 차별화했다. 또한 표본추출(최대변동), 자료수집(개인 또는 포커스 그룹 인터뷰), 자료분석(질적 내용분석의 변이)에 대한 전형적인 접근방법 등 질적 서술연구의 이론적 위치(자연주의)와 설계특징을 정리하였다.
When I conceived and wrote ‘‘Whatever Happened to Qualitative Description?’’ (Sandelowski, 2000) 10 years ago, I had intended it to be read as a critique and as a clarification. The critique was of the state of affairs that still persists today in reports of qualitative health research, that of claiming to have used methods (e.g., grounded theory, phenomenology) to produce findings that show no evidence these methods were used. The clarification was of a methodological approach that those who conducted such studies could—in many of these instances—legitimately claim, but that is rarely identified as a distinctive method in methods texts. In that 2000 article, I presented qualitative description as both distinguishable from, and foundational to some, other qualitative methods. I differentiated various kinds of description by degree of interpretation by briefly comparing varieties of description in both qualitative and quantitative research. I also summarized the theoretical location (naturalism) and design features of qualitative descriptive studies, including typical approaches to sampling (maximum variation), data collection (individual or focus group interviews), and data analysis (variants of qualitative content analysis).

이 기사는 처음 등장한 이후 10년 동안 간호 및 건강 연구소에서 가장 많이 다운로드되고 자주 인용되는 기사 중 하나가 되었다. 이것은 확실히 기쁘지만, 내가 소유하지 않은 방법과 내가 지지하지 않는 합법적인 주장과 관행에 대한 소유권을 나에게 할당하는 것이 잘못 사용되는 것을 일상적으로 보아왔기 때문에 실망스럽기도 하다. 후견의 20/20 비전을 습득한 나는 이러한 오해가 내가 의미하는 바를 충분히 전달하지 못한 것과 질적 연구 방법을 차별화하는 끈질긴 도전 모두에서 비롯된다는 것을 알게 되었다. 이 글에서, 나는 주요 오해를 바로잡고 그 근저에 있는 명명 문제를 더 분명히 한다.
In the decade since it first appeared, this article has become one of the most downloaded and frequently cited in
Research in Nursing & Health (see the virtual compendium at http://www.wiley. com/bw/vi.asp?ref¼0160-6891&site¼1). Although this is certainly pleasing, it has also been disheartening as I have routinely seen it misused to assign ownership to me of a method I do not own and to legitimate claims and practices I do not support. Having acquired the 20/20 vision of hindsight, I see that these misuses derive both from my failure adequately to convey what I meant and from the persistent challenge of differentiating qualitative research methods. In this article, I correct key misconceptions and make more explicit the naming problems at their roots.

오해 수정
CORRECTING MISCONCEPTIONS

[질적 묘사Qualitative Description]는 나만의(또한 다른 사람만의) 방법이 아니다.
Qualitative Description Is Not My (Nor Anyone Else’s) Method

2000년 기사에서 나는 내가 개발한 방법을 발전시키기 위해서가 아니라, [이미 오래 전부터 존재해 온 방법론적 접근법]을 정의하려고 했다. 그것의 다양한 추측과 그것을 특징짓는 샘플링, 데이터 수집 및 데이터 분석 기법의 절충적인 조합을 고려할 때, 질적 기술은 결코 한 사람이 발명한 어떤 방법으로도 묘사될 수 없다. 실제로, 정성적 서술적 연구가 수행되는 방식은 매우 다양하고, 이러한 연구가 전혀 [한정된 실체bounded entity]로 보이지 않는 데 기여했을 가능성이 있다. 그러나 일반적으로 [방법]이라고 불리는 모든 엔티티는 다양성(즉, 방법 내 변동의 상당 부분)을 포함한다. 더욱이, 더 넓은 의미에서, 모든 방법은 사용자 손에 달려있다. 즉, 방법이 사용될 때마다 다시 발명된다. 부분적으로는 연구 보고서의 한계 부분에서 분명히 드러나는 연구를 수행하려는 노력에 존재하는 제약 때문에, 그것에 대한 교과서적인 묘사에 완벽하게 부합하는 방법의 실행은 있을 수 없다. 실제로, [순수한 방법]을 구성하는 [한정된 실체bounded entity]라는 것은 없다. 나는 이 기사의 후반부에서 이 주제로 돌아갈 것이다.
In the 2000 article, I sought to define a methodological approach already long in existence, not to advance a method I had developed. Given its various guises and the eclectic combinations of sampling, data collection, and data analysis techniques characterizing it, qualitative description could never be described as any one method that any one person invented. Indeed, the very diversity in the conduct of qualitative descriptive studies likely contributed to these studies not being seen as bounded entities at all. Yet, all of the entities commonly referred to as methods encompass diversity (i.e., a great deal of within-method variation). Moreover, in a larger sense, all methods become what they are in the hands of users; that is, methods are re-invented every time they are used. Partly owing to the constraints that exist in any effort to conduct research—evident in the limitations section in research reports—there can be no execution of any method that perfectly conforms to any textbook depiction of it. Indeed, there is no
it; there is no bounded entity constituting a pure method. I will return to this subject later in this article.

따라서 연구자가 사용한 방법, 예를 들어 '산델로프스키(2000)'가 묘사한 질적 기술이라고 하는 것은 적절하지만, 질적 기술이라고 하는 것을 '산델로프스키의 방법'이라고 하는 것은 부적절하며, 단순히 [2000년 논문만을 참고한 질적 서술 디자인을 사용했다]고 말하는 것만으로는 충분하지 않을 것이다.연구자들은 여전히 샘플링, 데이터 수집 및 데이터 분석 기법의 특정 조합을 적절한 참조와 함께 설명해야 한다. 2000년 기사는 실제 콘텐츠 분석 기법에 대한 설명이 없기 때문에, [내용 분석]을 위한 유일한 참조로 사용될 수 없다. 마찬가지로, 2000년 논문은 이러한 전략에 대한 매우 간략한 개요만을 제공하기 때문에 사용되는 특정 샘플링 또는 데이터 수집 전략을 지원하는 데 사용될 수 없다.

Accordingly, although it is appropriate for researchers to refer to the method they used as, for example, ‘‘qualitative description as Sandelowski (2000) described it,’’ it is inappropriate to refer to qualitative description as ‘‘Sandelowski’s method.’’ Moreover, it would not be enough for researchers simply to state that they used a qualitative descriptive design with only a reference to the 2000 article. Researchers would still have to describe the particular combination of sampling, data collection, and data analysis techniques they used with appropriate references to support those techniques. The 2000 article cannot be used as the sole reference for content analysis as it contains no description of any actual content analysis technique. Similarly, the 2000 article cannot be used to support the particular sampling or data collection strategies used as it offers only a highly abbreviated overview of these strategies.

[질적 서술Qualitative Description]은 데이터 분석 및 해석의 실패를 정당화하지 않는다.
Qualitative Description Does Not Legitimate the Failure to Analyze and Interpret Data

나는 2000년 기사에서 [모든 서술은 필연적으로 해석적이지만 - 인간은 결코 "벌거벗은 순수한 눈으로 바라볼 수 없다" - 질적 서술 연구는 예를 들어 현상학적 또는 이론적 서술보다 덜 해석적]이라고 설명했다. 내가 소통하고자 했던 것은 질적 서술적 연구가 주어진 데이터에 더 가까운, 또는 [데이터-근접한 결과]를 산출한다는 것이었다. 나는 이어서 그러한 발견을 [주제 조사thematic survey]라고 칭하였다(Sandelowski & Barroso, 2007). 질적 건강 연구에서 지배적인 이러한 조사survey는, 예를 들어, [근거이론]이나 [푸코가 영감을 준 담론연구]보다, 훨씬 덜 변형된 데이터의 해석으로 구성된다. 주어진 데이터에 더 가깝지만, 이러한 주제 조사는 여전히 상세하고 미묘한 해석적 산물이다. 나는 이것을 "spin" (이 단어는 '거짓말'의 완곡어로서 더 자주 사용되어, 결과적으로 잘못된 단어 선택이 되었다)과 ["표면" 대 더 침투적인 데이터 읽기]또는 [행 안으로, 사이로, 너머로 읽기]와 반대되는 [행 그 자체로 읽기]에 대한 논의에서 전달하려고 노력했다. 임산부의 우려가 우려에 머무르고(Smeltzer, 1994) 의사의 인식이 지각에 머무른 데이터 근방 해석의 예를 들었다. 예를 들어, 이러한 우려와 인식은 체면치레, 만연한 문화적 담론에 대한 항의, 일탈 행위의 혐의를 물리치기 위한 도덕적 설명으로 해석적으로 변형되지 않았다.
I stated in the 2000 article that even though description of any kind was unavoidably interpretive— that human beings could never ‘‘look with a naked, innocent eye’’ (Pearce, 1971, p. 4)— qualitative descriptive studies were less interpretive than, for example, phenomenological or theoretical descriptions. What I had intended to communicate was that qualitative descriptive studies produced findings closer to the data as given, or data-near. I subsequently referred to such findings as thematic surveys (Sandelowski & Barroso, 2007). Dominant in qualitative health research, such surveys are composed of interpretations of data that are much less transformed than, for example, grounded theories or Foucault-inspired discourse studies. Although closer to the data as given, these thematic surveys are still detailed and nuanced interpretive products. I sought to convey this in my discussion of ‘‘spin’’ (admittedly an unfortunate word choice as it is used more often as a euphemism for lies), and of ‘‘surface’’ versus more penetrating readings of data, or readings
of lines as opposed to into, between, over, or beyond lines (2000, pp. 335– 336). I cited examples of such data-near interpretations in which pregnant women’s concerns stayed concerns (Smeltzer, 1994) and physicians’ perceptions stayed perceptions (Geller & Holtzman, 1995). These concerns and perceptions were not, for example, interpretively transformed into instances of face-work, or protests against prevailing cultural discourses, or moral accounts to defeat charges of deviant behavior (e.g., Murphy, 1999).

그러한 서술적 연구의 최근 두 가지 예가 RNH 학술지에 발표되었습니다. 아버지 관여에 대한 줄리온, 그로스, 바클레이-맥러플린, 포그(2007) 연구(보고서에는 질적 서술에 대한 언급이 없다), 소아 간호사와 약물 투여에 대한 반 훌레 빈센트와 가디즈(2009)의 명시적 질적 서술적 연구이다. Julion et al. report에서, 비거주 아프리카계 미국인 아버지들의 포커스 그룹 생성 견해는 일반적으로 부권 개입과 특히 자녀에 대한 그들 자신의 개입에 대해 주제별로 분류되고 상세했다. Van Hulle Vincent and Gaddyz 보고서에서는 아동에게 모르핀을 투여하는 것에 대한 두 개의 비넷에 대응한 간호사들의 사고와 실천이 주제별로 그룹화, 계수, 상세 및 비교되었다. 이 두 연구 모두에서, 연구 결과에 대한 분석과 해석은 데이터에 가까운 상태로 유지되었다.
Two more recent examples of such descriptive studies published in
Research in Nursing&Health are the Julion, Gross, Barclay-McLaughlin, and Fogg (2007) study of father involvement (the report of which contains no mention of the phrase qualitative description), and the Van Hulle Vincent and Gaddyz (2009) explicitly qualitative descriptive study of pediatric nurses’ and medication administration. In the Julion et al. report, non-resident African American fathers’ focus group-generated views of paternal involvement in general and of their own involvement with their children in particular were thematically grouped and detailed. In the Van Hulle Vincent and Gaddyz report, nurses’ thinking and practice in response to two vignettes about administering morphine to children were topically grouped, counted, detailed, and compared. In both of these studies, the analysis and interpretation of findings remained data-near.

해석의 정도에 따라 [다른 종류의 정성적 연구 및 정량적 조사]와 구별하기 위해 노력한 모든 공간에도 불구하고, 나는 정성적 서술적 연구가 [여전히 해석적]이라는 것을 충분히 전달하는 데 실패했다. 양적 연구의 해석적 요소가 양적 연구의 더 큰 투명성, 정밀성 및 객관성에 대한 논의에서 경시되거나 가려지는 경향이 있더라도, 모든 연구는 질적 또는 양적 측면에서 해석을 수반한다는 것이 혼란을 가중시킬 가능성이 있다. 또한 다른 종류의 정성적 연구와 마찬가지로 정성적 서술적 연구가 통계적 분석을 포함할 수 있다는 점도 혼란의 한 원인이 된다. 
Despite (or, perhaps, because of) all of the space I devoted to trying to differentiate—by degree of interpretation—qualitative descriptive from other kinds of qualitative studies and from quantitative surveys, I failed adequately to communicate that qualitative descriptive research is still interpretive. Likely adding to the confusion is that all research, whether qualitative or quantitative, entails interpretation even if the interpretive component of quantitative research tends to be downplayed or masked in discussions of the greater transparency, precision, and objectivity of quantitative research (Kritzer, 1996; Sandelowski, Voils, & Knafl, 2009). Also contributing to confusion is that qualitative descriptive studies (like other kinds of qualitative studies) may include statistical analyses.

내가 결코 소통하려고 의도하지 않았던 것은, [질적 서술]이 연구자의 [분석이나 해석을 할 의무를 완전히 없앤다]는 것이다. 2000년 기사의 일부 독자들은 '사건 사실의 일상언어 제시'라는 문구를 마치 연구의 finding을 [면담자료의 무분별하게 선별되고 해석되지 않은 부분(즉 인용)을 제시하는 것]을 의미한다고 받아들이고 있다. 그들은 다음을 전제한다.

  • (a) 데이터는 데이터 스스로 무언가를 말해준다. 
  • (b) 연구자들은 (목소리를 내지 않는 사람들을 위해) 이러한 데이터가 도출된 참가자를 대변해서는 안 된다. 

What I never intended to communicate was that qualitative description removes the researcher’s obligation to do any analyzing or interpreting at all. Some readers of the 2000 article have taken the phrase ‘‘the presentation of the facts of the case in everyday language’’ (p. 335) to mean the presentation of indiscriminately selected and uninterpreted segments (i.e., quotations) of interview data as if they were findings, on the premises

  • that (a) such data speak for themselves or
  • that (b) researchers should not (in the interests of voicing the voiceless) speak for the participants from whom these data were derived.

그러나 데이터는 결코 스스로를 대변하지 않으며, 연구자들이 데이터를 해석하려고 할 때 비윤리적으로 행동한다는 생각은 [해석의 엄격함, 책임 및 위험을 피하기 위한 핑계]가 될 수 있다. 유감스럽게도, 일부 독자들은 또한 "연구자들이 그들의 데이터에서 멀리 또는 그들의 데이터로 이동할 것을 요구하지 않는다"라는 문구를 [사실상 (연구자는) 전혀 움직이지 않는다]는 의미로 받아들였다. 데이터가 단순히 "재생산"되거나 "축하celebrated"될 것이라는 생각만큼 그 당시나 지금이나 내 의도와는 거리가 먼 것은 없다. 질적 서술적 연구를 포함해서, 질적 연구는 항상 어딘가로 이동해야 한다: 연구자들이 그들의 데이터로 무언가를 만드는 것이다.
But, data never speak for themselves, and the idea that researchers are behaving unethically when they seek to interpret those data is too often a pretext to avoid the rigors, responsibilities, and risk of interpretation (Sandelowski, 2004). Regrettably, some readers also have taken the phrase ‘‘do not require researchers to move as far from or into their data’’ (p. 335) to mean virtually no movement at all. Nothing could be further from my intentions then or now than the idea that data are simply to be ‘‘reproduced’’ or ‘‘celebrated’’ (Atkinson, 2005, paragraph 3). Qualitative research, including qualitative descriptive research, always requires moving somewhere: that researchers make something of their data.

질적 서술적 연구는 이론이 없지 않다.
Qualitative Descriptive Studies Are Not Atheoretical

질적 연구방법 카탈로그에서 질적 서술적 연구를 최소한의(그러나 여전히) 해석적 연구로 묘사하는 것 외에도, 나는 이러한 연구를 [''최소한의 '이론적']연구라고 묘사했다. 내가 전하고 싶었던 것은 방법의 이론적/철학적 기초(예를 들어, 근거이론의 기초로서의 상징적 상호작용주의)와 조사 중인 현상에 대한 이론적 지향(예를 들어, 낙인 이론을 통한 항레트로바이러스 약물 부착성 보기)에 관한 것이었다. 나는 자연주의naturalism를 질적 서술적 연구의 전형적인 이론적 토대로서 간략하게 논하고, 그것을 연구를 수행하는 것으로 알려진 인공적인 기업artifice-laden에서는 가능한 한 인공적으로 자유로운free of artifice 방식으로 현상을 연구하겠다는 의지를 담고 있다고 정의했다.
In addition to depicting qualitative descriptive studies as the least (but still) interpretive studies in the catalogue of qualitative research methods, I described these studies as the ‘‘least ‘theoretical’’’ (2000, p. 337). What I wanted to convey was something about both the theoretical/philosophical foundation of methods (e.g., symbolic interactionism as a foundation for grounded theory), and the theoretical orientation toward the phenomena under investigation (e.g., viewing antiretroviral medication adherence via stigma theory). I briefly discussed naturalism as the typical theoretical foundation for qualitative descriptive studies, and defined it as entailing a commitment to studying a phenomenon in a manner as free of artifice as possible in the artifice-laden enterprise known as conducting research.

나는 이제 내가 질적 서술적 연구에서 이론의 역할에 충분한 주의를 기울이지 않았거나, 질적 서술적 연구가 2000년 논문에서 정의된 것처럼 최소한 (배타적이지는 않지만) 자연주의적이라는 것을 충분히 강조하지 않았다는 것을 알 수 있다. [방법과 방법론(method and methodology)이라는 단어]는 [세계에 대한 이해와 그것을 아는 방법]을 포함하며, [이론, 철학 또는 패러다임]으로 다양하게 언급된다. 종종 상호 교환적으로 사용되지만,

  • [방법/방법론]은 탐구를 위한 다소간의 이론적/철학적 방향을 내포하고 있는 반면,
  • [테크닉]방법(샘플링 및 데이터 수집 및 분석 기술)을 운용하기 위한 방식을 내포하고 있다.

예를 들어, 하나의 방법으로 제시되는 경향이 있지만, [포커스 그룹]은 여러 다른 방법에서 데이터를 생성하는 데 사용될 수 있다. 포커스 그룹이 그 자체로 구상되고 실행되는 방법, 그리고 포커스 그룹에서 생성된 데이터가 처리되는 방법은 운영을 위해 선택된 방법을 반영해야 한다.
I can see now that I did not give enough attention to the role of theory in qualitative descriptive studies, or emphasize enough that qualitative descriptive studies were at the very least (albeit not exclusively) naturalistic as defined in the 2000 article. The words method and methodology entail some understanding of the world and how to know it, variously referred to as theory, philosophy, or paradigm. Although they are often used interchangeably,

  • method/methodology connote some theoretical/philosophical orientation to inquiry, while
  • technique connotes ways to operationalize method (e.g., techniques for sampling and for data collection and analysis).

For example, although it tends to be presented as a method, the focus group can be used to generate data to operationalize different methods; the way a focus group is itself conceived and executed, and the way the data generated from it will be treated, ought to reflect the method it was selected to operationalize.

내가 결코 전하고자 하지 않았던 것은. 질적 서술이 "이론적이거나 규율적인 토대를 완전히 벗긴" 방법이라는 것이다(Thorne, 2008, p. 35). 어떤 종류의 연구도 그렇게 개념적으로 드러날 수 없으며, 심지어 그 보고서에 명시적으로 명시된 "이론"을 제공하지 않는 연구도 있을 수 없다. [질적 서술적 연구]가 ['"표현상에 대한 어떤 단일한 이론적 관점에 대한 선험적 약속을 수반하지 않는다"]고 명시함으로써, 나는 무심코 연구자들이 그들의 질적 연구에 순진하게 접근해야 하고, 선입견 없이 접근할 수 있다는 잘못된, 그러나 끈질긴 개념에 기여했다. 그러나 이론에 대한 헌신이 없다고 해서, 이론의 영향을 전혀 받지 않는 것은 아니다. 모든 단어는 이론이다. [연구자들이 그들의 주제에 대해 말하는 바로 그 방법]은, 그들이 이러한 성향을 그렇게 제시하든 심지어 그들을 인식하든 말든 상관없이, 그들의 성향을 반영한다. 예를 들어, 상실에 대한 어떠한 명시적인 이론이 없는 경우에도 유산을 손실로 묘사하는 것은 유산을 정의하는 것이 아니라, 오히려 그것을 이론화하는 것이다.
What I never intended to convey was that qualitative description was a method ‘‘stripped entirely of its theoretical or disciplinary underpinnings’’ (Thorne, 2008, p. 35). No study of any kind could ever be so conceptually naked, even studies the reports of which offer no explicitly stated ‘‘theory.’’ By stating that qualitative descriptive studies entail ‘‘no a priori commitment to any one theoretical view of a target phenomenon’’ (2000, p. 337), I inadvertently contributed to the mistaken but persistent notion that investigators must and can approach their qualitative studies naively, meaning with no preconceptions. Yet, having no commitment to a theory does not mean not being influenced by theory at all. Every word is a theory; the very way researchers talk about their subject matter reflects their leanings, regardless of whether they present these inclinations as such or even recognize them. For example, even in the absence of any explicit theory of loss or bereavement, to portray miscarriage as a loss is not to define miscarriage, but rather to theorize it.

다음의 두 가지 사이에는 큰 차이가 있다

  • 열린 마음이지만 연구 분야에 들어가는 선입견(이론적 기울기 포함)을 염두에 두는 것.
  • 머리를 완전히 비워 두는 것. 

[후자]는, 완전히 기능하는 뇌를 가졌다면, 어떤 인간에게도, 그리고 그들이 이미 많이 알고 있거나 혹은 알고 있어야 할 것들을 연구하는 경향이 있는 연구자들에게도, [불가능한 일]이다. Nowhere에서 가지는 관점이라는 것은 없다. 관점을 가진다는 것은 어딘가에 서 있는 것을 의미한다. 질적 연구에 착수하는 연구자들의 의무는 (자신과 타인을 위하여) 연구를 시작할 때 그들이 어디에 있었는지 명시하는 것이다(일반적으로 이론과 경험적 문헌의 검토를 통해 달성된다). 그리고 그들의 추가 조사가 정당하다면 그곳에서 떠날 준비가 되어 있고 기꺼이 떠날 것이다. 질적 기술 연구는 대상 현상에 대한 이론이나 데이터를 수집하거나 분석하기 위한 틀에서 시작할 수 있지만, 그것이 이 이론이나 틀을 지키겠다는 약속을 의미하지는 않는다.

There is a vast difference between

  • being openminded yet mindful of the preconceptions (including theoretical leanings) one has entering a field of study and
  • being empty-headed, an impossibility for any human being with a fully functioning brain and for investigators who tend to study things about which they already (or should) know a great deal.

There is no such thing as a view from nowhere; having or taking a view means standing somewhere (Haraway, 1991). The mandate for researchers embarking on any qualitative study is to make explicit—for themselves and others—where they were when they began their studies (usually accomplished via a review of theoretical and empirical literature), and to be ready and willing to move away from there if their further investigations warrant it. Qualitative descriptive studies may begin with a theory of the target phenomenon or a framework for collecting or analyzing data, but that does not mean a commitment to stay with this theory or framework.

이론은 데이터를 보는 바로 그 방식에서도 나타난다. 알라수타리(1995)는 데이터에 대한 "사실주의"와 "표본주의" 관점을 구별했다.

  • 예를 들어, 인터뷰 데이터의 [사실주의적 관점]은 이러한 데이터가 다소 정확하고 진실된 현실의 지표라고 가정한다. 이러한 데이터는 믿음, 행동 및 사건의 문서적 흔적이며, ["진짜" 진행 중인 것]을 전달하기 위해 사용된다. 질적 내용 또는 주제 분석, 즉 질적 서술적 연구에서 일반적으로 사용되는 분석 기법은 주로 이러한 사실주의적 관점에 기초한다. 사실주의적 관점은 그것의 "사실성"에 의문을 제기하지 않는 세계관으로서의 자연주의에 대한 이해와 양립가능하다(Harris, 2003, p. 203; Gubrium & Holstein, 1997 참조).
  • 이와는 대조적으로 [표본]의 관점에서 [인터뷰 데이터는 현실의 지표가 아니라 연구된 현실의 일부], 즉 그 자체가 조사 대상으로 간주된다. 예를 들어, 특정 형태의 담화 분석에서 인터뷰 데이터는 실제 사건이나 경험의 지표가 아니라 자아가 만들어지는 언어 수행으로 취급된다(Hardin, 2001).

Theory appears too in the very way data are viewed. Alasuutari (1995) differentiated between ‘‘factist’’ and ‘‘specimen’’ views of data.

  • For example, a factist perspective of interview data assumes these data to be more or less accurate and truthful indexes of reality ‘‘out there.’’ These data are taken to be documentary traces of beliefs, behaviors, and events, and to convey what is ‘‘really’’ going on. Qualitative content or thematic analyses, the analysis techniques typically used in qualitative descriptive studies, are largely based on this factist perspective. The factist perspective is compatible with another understanding of naturalism as a view of the world that does not question its ‘‘facticity’’ (Harris, 2003, p. 203; see also Gubrium & Holstein, 1997).
  • In contrast, from a specimen perspective, interview data are seen not as indexes of reality but rather as part of the reality studied, that is, as themselves objects to be investigated. For example, in certain forms of discourse analysis, interview data are treated not as indices of actual events or experiences, but rather as language performances in which selves are created (Hardin, 2001).

정성적 설명은 기본적Default 또는 구원적Salvage 방법이 아닙니다.
Qualitative Description Is Not a Default or Salvage Method

나는 2000년 기사에서 질적 서술적 연구는 유용한 연구 목적에 도움이 되며, 따라서 그러한 목적을 달성하기 위해 정당하고 능동적으로 선택될 수 있다고 말했다. 나는 [잘못 개념화되거나 행해진 연구]에 질적 기술이라고 이름 붙일 의도는 없었다. 2000년 논문은 (논문위원회나 인간 주제와 소통하기 어렵거나, 질적 연구에 익숙하지 않거나, 심지어 연구비 검토 패널을 부여하는 것이 더 어렵다고 여겨지기 때문에) 더 해석적인 질적 연구를 수행하지 않는 것을 정당화하기 위해 사용되어서는 안 된다. 나는 질적 연구에 대한 지식이 한정되어 있거나, 질적 연구에 대한 반감을 가지고 있거나, 질적 서술을 '가벼운 연구'로 인식하는 청중에게 질적 연구를 더 소비할 수 있도록 하려는 의도는 결코 없었다. 나는 또한 다른 방법의 "co-option"으로서 질적 서술을 만들 의도도 없었다(Barbour, 2003). 또는 그러한 성가신 숫자가 모두 없더라도 정량적 연구와 비슷하게 만들어진 정성적 연구로 묘사할 의도도 없었다.

I stated in the 2000 article that qualitative descriptive studies serve useful research purposes and could, therefore, be justifiably and proactively chosen to fulfill those purposes. I had not intended that studies be named
qualitative description after the fact to give a name to poorly conceived and conducted studies. The 2000 article should not be used to justify not conducting more interpretive qualitative work because that work is deemed harder to do, or harder to communicate to a dissertation committee or to human subjects or grant review panels unfamiliar with or even resistant to qualitative research. I never intended to make qualitative research more consumable by an audience with limited knowledge of and/or antipathy to qualitative research, or qualitative description to be seen as research-light: a drive-by, ‘‘quick fix, data to go, smash-and-grab’’ affair (Atkinson & Delamont, 2006, p. 749). I also did not intend to advance qualitative description as a ‘‘co-option’’ of other methods (Barbour, 2003), or as qualitative research made over to resemble quantitative research, albeit without all those pesky numbers.

이름이 없는 것에 이름 짓기의 문제
THE PROBLEM OF NAMING THAT HAS NO NAME

나는 2000년 기사에서 내 의도를 충분히 전달하지 못했다. 그러나, 또한 그 기사가 만들어낸 오해들의 근원에는 이름을 짓고 방법을 차별화하는 질적 연구의 지속적인 문제가 있다. 질적 기술, 근거 이론, 현상학과 같은 이름들은 서로 명확하게 구별되는 잘 정의된 실체들이 그 안에 상주해야 하는 [경계boundaries]를 시사signal한다. 이 이름들은 분류 체계에 대한 신호이며, 그러한 다른 모든 체계와 마찬가지로, [탐구 세계를 질서화하는 고정된 방법]인 것처럼 취급되는 경향이 있다. 실재적이고 정적인 것으로 인식되어 실제 효과를 발휘한다(Bowker & Star, 2000).
I failed adequately to convey my intentions in the 2000 article. Yet, also at the root of the misconceptions the article generated is the persistent problem in qualitative research of naming and thereby differentiating methods. Names, such as
qualitative description, grounded theory, and phenomenology, signal boundaries within which well-defined entities clearly differentiated from each other are supposed to reside. These names signal a classification system that, like all such systems, tends to be treated as if it were a fixed way of ordering the world of inquiry. Perceived as real and static, they exert real effects (Bowker & Star, 2000).

나는 현재 "내 연구를 뭐라고 부르느냐"는 질문을 받고 있다. 또는 만약 연구 보고서의 저자가 그것을 "이 연구를 뭐라고 부르느냐?"라고 하지 않았다면, 나는 제임스 미치너의 소설 체서피크(1978)에서 20여 년 전에 베꼈던 몇 구절을 기억한다.
I am recurrently asked, ‘‘What do I call my study,’’ or, if the author of a research report did not name it, ‘‘What do you call this study?’’ I recall some lines I copied more than 20 years ago from James Michener’s novel
Chesapeake (1978):

그러나 그는 항상 노동자가 진정한 숙달에 도달할 수 없는 필수적인 도구가 부족했다. 그는 그가 만들고 있는 부품의 이름을 알지 못했고, 이름이 없으면 예술적으로 불완전했다. 의사, 변호사, 정육점 주인이 그들이 한 일에 대해 구체적이지만 비밀스러운 이름을 발명한 것은 우연이 아니었다. 그 이름을 소유하는 것은 비밀을 아는 것이었다. 정확한 이름을 가진 사람은 새로운 숙련의 세계로 들어가 불가사의한 형제애의 일원이 되었고, 미스터리의 공유자가 되었고, 결국엔 [능력의 수행자performer of merit]가 되었다. 그 이름들이 없다면, 그 사람은 bumbler으로 남았거나, 배를 만드는 것이라면, 단순히 집목공으로 남았을 것이다.
But always he lacked the essential tool without which the workman can never attain true mastery; he did not know the names of any of the parts he was building, and, without the names, he was artistically incomplete. It was not by accident that doctors and lawyers and butchers invented specific but secret names for the things they did; to possess the names was to know the secret. With correct names, one entered into a new world of proficiency, became the member of an arcane brotherhood, a sharer of mysteries, and, in the end, a performer of merit. Without the names, one remained a bumbler or, in the case of boat building, a mere house carpenter (pp. 264–265).

보트 건조에서 조사로 바꾼다면, 연구는 신뢰할 수 있는 것으로 간주될 수 있는가, 아니면 이름이 없는데도 연구로 간주될 수 있는가?
Moving from boat building to inquiry, can a study be considered credible, or even a study at all, if it has no name?

질적 연구 방법에 대한 교육 텍스트는 이러한 방법들이 서로 [명확한 경계를 갖는 것]으로 묘사하는 경향이 있다. 그러나 이러한 경계는 경험적 차이와는 반대로 분석을 나타내기 때문에 [고도로 투과적]이다.

  • 분석적 구별은 교육과 의사소통의 목적을 위해 만들어진다: 연구 방법과 같은 [복잡한 실체의 본질이나 속성을 정의]하는 것이다.
  • 분석적 구별은 [현실에서는 서로를 구별하려는 노력에 저항하는 실체]를 구별하기 위해 만들어진다.

Instructional texts on qualitative research methods tend to depict these methods as having clear boundaries. Yet, these boundaries are highly permeable because they represent analytic as opposed to experiential distinctions.

  • Analytic distinctions are made for the purposes of instruction and communication: to simplify the essence or defining attributes of complex entities, such as research methods.
  • Analytic distinctions are made to distinguish entities that in real life resist efforts to distinguish them.

예를 들어, 민족학 연구는 종종 "근거 이론화"로 특징지어지며, 이는 다시 "방법론적 해석학"의 한 유형으로 생각할 수 있다. 그러한 연구는 민족학, 근거 이론, 해석학으로 중 무엇으로 명명되어야 하는가? 민족학 연구는 질병 서술의 유형론과 각 유형이 특정 담론을 수용하거나 항의하는 기능을 하는 과정을 산출할 수 있다. 그러한 연구는 근거 있는 이론, 민족학, 서술 또는 담론이라고 명명될 것인가? 고전 민족학은 종종 질적, 양적 데이터 수집과 분석을 수반하며, 일반적으로 하나 또는 몇 가지 환경에서 행동에 초점을 맞춘다. 그러한 민족지학은 혼합 방법 또는 사례 연구로 명명되어야 하는가? 
For example, ethnographic studies are often characterized by ‘‘grounded theorizing’’ (Hammersley & Atkinson, 2007, p. 166), which, in turn, may be conceived as a type of ‘‘methodical hermeneutics’’ (Rennie, 2000; Rennie & Fergus, 2006). Are such studies to be named
ethnography, grounded theory, or hermeneutics? An ethnographic study may yield a typology of illness narratives and the process by which each type functions to accommodate or protest certain discourses. Is such a study to be named grounded theory, ethnography, narrative, or discourse? Classical ethnographies often entail both qualitative and quantitative data collection and analysis, and they are typically focused on actions in one or a few settings. Are such ethnographies to be named mixed-methods or case-study research?

실제로 이러한 이름 중 하나 이상이 허용되거나, 아예 그 어떤 이름도 허용되지 않을 수도 있습니다. 실제로 사회과학 저널에 게재된 민족지학 연구 보고서에서 이러한 연구들이 [이름 없는 상태]로 남아 있는 것을 보는 것이 일반적이다. 방법을 강조하는 간호학 저널에 게재된 그러한 연구의 보고서와는 달리, 사회과학 저널에 게재된 보고서는 종종 매우 축약된 방법 섹션을 포함하거나 엔드노트에 나타나는 간단한 설명만 포함한다. 이 보고서들은 대신 소견과 이론적 단계에 초점을 맞춘다. 이름은 [독자의 기대]를 불러일으키기 때문에, [어떤 이름을 선택할지, 또는 이름을 지을지 여부]는 저자가 연구 보고서가 ["어필"하기를 원하는 대상 독자]에게 어떤 신호를 보낼지에 달려 있다(Golden-Biddle & Locke, 1993)

In actual practice any one or more of these names, or even no name at all, might be acceptable. Indeed, in reports of ethnographic studies published in social science journals, it is common to see these studies remain un-named; some form of ethnography is understood to be the method. In contrast to reports of such studies published in nursing journals that emphasize method, reports published in social science journals often contain highly abbreviated methods sections or only brief descriptions appearing in an endnote; these reports are focused instead on findings and their theoretical staging. Because names create reader expectations, the choice of name(s), or whether to name at all, will depend on what authors believe will be signaled to the target audience to which they want their research reports to ‘‘appeal’’ (Golden-Biddle & Locke, 1993).

연구 실천의 실제 세계에서는 방법들이 서로 스며든다; 그것들은 교과서적인 묘사보다 훨씬 더 지저분하기 때문에, 그러한 묘사의 목적은 다음과 같이 지시하고 소통할 수 있도록 "지저분한 것"을 충분하게 청소하는 것이다. 이는 달리 말하면, 분류하고, 개별 방법 주위에 단단하고 천공되지 않은 선을 그으며, 방법 주위에 단단한 선을 그을 수 있는 것처럼 취급하는 것이다. 비록 이 기사의 범위를 벗어나지만, 심지어 연구를 질적 또는 양적으로 명명하는 것조차도 오해를 불러일으킬 수 있다. 가능한 경우 그러한 지정은 보다 명확한 지정에 유리하도록 피해야 한다. 예를 들어, 비기술적이고 전혀 정보가 없는 질적 데이터 대신, 표준화된 질문지조차도 "질적" 데이터 수집의 형태로 볼 수 있기 때문에, 독자는 연구자가 데이터(예: 인터뷰 데이터 필사본, 관찰 필드 노트)를 명명하는 것이 더 낫다(Sandelowski 등, 2009). 그러나, 정성적 또는 정량적이라는 용어의 사용은 크게 다음에 의해 특징지어지는 서술적 연구를 신호화하는 가장 좋은 방법일 수 있다.

  • (a) 창발적 설계, 목적적 샘플링, 최소 구조화되고 개방된 데이터 수집 모드, 텍스트 분석 또는
    (b) 고정적 설계, 확률 표본 추출, 고도로 구조화된 데이터 수집 모드 및 폐쇄된 데이터 수집 모드 및 통계 분석에 의해 각각 결정된다.

In the actual world of research practice, methods bleed into each other; they are so much messier than textbook depictions as the purpose of such depictions is to clean up the ‘‘mess’’ (Law, 2004) sufficiently to instruct and communicate: to classify, to draw hard and not perforated lines around individual methods, to treat methods as if hard lines could be drawn around them. Although beyond the scope of this article, even naming research qualitative or quantitative can be misleading. Whenever possible, such designations should be avoided in favor of those that are more explicit. For example, instead of the nondescript and wholly uninformative qualitative data, readers are better served by researchers naming their data (e.g., transcripts of interview data, written field notes of observations) as even standardized questionnaires can be seen as a form of ‘‘qualitative’’ data collection (Sandelowski et al., 2009). Yet, the use of the terms qualitative and quantitative may simply be the best way to signal descriptive research largely characterized

  • by (a) emergent design, purposeful sampling, minimally structured and open-ended modes of data collection, and textual analyses or
  • by (b) fixed design, probability sampling, highly structured and closedended modes of data collection, and statistical analyses, respectively.

더욱이 질적 연구에서 방법의 분류는 매우 특이하다. 질적 연구에 대한 교훈적인 텍스트의 빠른 숙독이 보여주듯이, [단일한 분류 시스템이 작동하지 않는다]. 방법들이 서로 관련하여 어떻게 명명되고 정렬되는가, 그리고 어떤 방법들이 어떻게 묘사되는가(즉, 그것이 무엇에 사용되는가, 그것을 어떻게 하는가, 그리고 그것이 다른 방법들과 어떻게 대비되는가)는 [분야에 따라 특화]되어 있고, 또는 [기존의 이론적 또는 정치적 약속]에 의해 영향을 받는다. 분류 체계 자체도 이론적/철학적 계통, 방법 또는 기술에 따라 분류될 수 있다. 근거 이론이 제시되는 방식에 대한 수많은 변형variation과, 근거 이론을 하는 "올바른" 방법과 현상학을 하는 "잘못된" 방법에 대한 종종 격렬한 논쟁을 고려하라. 방법(및 방법론적 엄격성과 전문성을 너무 자주 지나치는 이러한 국경지의 치안 유지) 사이의 경계선을 더욱 복잡하게 만드는 것은, 정성적 연구에서는 방법론적 절차가 [(분석적 통찰력을)] [결정하거나 구성하기]보다는, [촉발]하는 기능이 더 많다는 것이다.
Moreover, in qualitative research the very classification of methods is highly idiosyncratic. As any quick perusal of didactic texts on qualitative research will show, there is no one classification system in play. How methods are named and ordered in relation to each other, and how any one method is depicted (i.e., what it is, what it is used for, howto do it, and howit contrasts with other methods), are discipline-specific and/or influenced by prior theoretical or political commitments. Classification systems can themselves be classified according to whether they are constructed around theoretical/philosophical lineage, methods, or techniques. Consider too the variations in how grounded theory is presented (Charmaz, 2006; Clarke, 2005; Strauss & Corbin, 1998) and the often strident debates about the ‘‘right’’ way to do grounded theory (Boychuk Duchscher, & Morgan, 2004; Walker & Myrick, 2006) and the ‘‘wrong’’ way to do phenomenology (Crotty, 1996; Darbyshire, 1999; Paley, 2005). Complicating the borderlands between methods (and the policing of these borderlands that too often passes for methodological rigor and expertise) is that in qualitative research, methodological procedures function more to trigger analytic insights than to determine or constitute them (Eakin & Mykhalovskiy, 2003).

이 모든 것이 방법론적 전통에 대한 정의적 속성도, 그것에 대해 만들어질 수 있는 일반화도, 학습되어야 할 서명 연산과 규칙도 없다는 것을 말하는 것은 아니다. 이 모든 것이 질적 연구의 수행에 어떤 것이든 진행된다는 것을 말하는 것은 아니다. 그러나 [정의와 일반화]를 위한 모든 노력(즉, 분류와 이름 지정)과 마찬가지로, 그들은 [방법의 실제 실천의 다양한 변형variation] 및 [방법이 살아있다는 사실]을 잘 포착하지 못한다. 방법은 전기와 역사를 가지고 있다. 근거 이론, 민족학, 임상시험의 역사와 진화를 고려하라. 방법의 수행performance은 항상 "상황에 놓여 있다situated". 방법은 항상 연구 실천의 실제 세계에 수용되고 바로 그 수용으로 인해 재창조되기 때문에, 어떤 방법도 완벽한 실행이란 없다. 민족지학을 "비선형 동적 시스템"으로 묘사하면서, Agar (2004, 페이지 19)는 다음과 같이 관찰했다. 방법론적으로 말하면, 연구는 항상 처음에 예측할 수 없는 방식으로 발전한다. [방법론의 스토리]는 [연구의 스토리]이다.'
All of this is not to say that there are no defining attributes of methodological traditions, nor generalizations that can be made about them, nor signature operations and rules associated with them that should be learned. All of this is not to say that anything goes in the conduct of qualitative research. But, like all efforts to define and generalize—that is, to classify and name—they do not capture well the variations in the actual practice of methods and the fact that methods are alive; methods have biographies and histories. Consider the histories and evolution of grounded theory, ethnography, and the clinical trial. The performance of method is always ‘‘situated’’ (Haraway, 1991). There is no perfect execution of any method as methods are always accommodated to the real world of research practice and, by virtue of that very accommodation, they are reinvented. Describing ethnography as a ‘‘nonlinear dynamic system,’’ Agar (2004, p. 19) observed that: ‘‘methodologically speaking
. . . a study always develops in ways unforeseen at the beginning . . . The story of methodology is (emphasis in original) the story of the study.’’

방법은 실제 연구와 별개로 사용자가 없으면 독립적인 존재가 없다. 방법은, 다른 질적 연구 관행을 구별하는 특정 존재론적 및 인식론적 입장을 부정하지 않는 일반적인 "실천적 인식론"은, 사용자의 손에 있는 것이 된다. Becker는 다음과 같이 관찰했다
Methods have no independent existence without users and apart from actual studies. Methods become what they are in the hands of users, a generic ‘‘practical epistemology’’ (Becker, 1996, p. 57) that does not negate the particular ontological and epistemological positions that distinguish different qualitative research practices. Becker observed (p. 57):

많은 에너지가 철학적 세부 사항 때문에 낭비되고 있는데, 이것은 종종 연구자들이 실제로 하는 것과 거의 또는 전혀 관련이 없다. 연구자들은 사회생활의 현실에 적응하면서 이러한 입장을 실천한다. 따라서 그들의 활동은 철학적 입장을 참고하여 완전히 설명되거나 설명될 수 없다.
A lot of energy is wasted hashing over philosophical details, which often have little or nothing to do with what researchers actually do . . . Researchers work these positions out in practice . . . accommodat- (ing) to the realities of social life . . . Their activity thus cannot be accounted for or explained fully (italics added) by referring to philosophical positions.


내가 10년 전에 질적 서술적 연구와 다른 종류의 질적, 정량적 연구 사이에 선을 그은 것은 그저 [선을 긋기 위한 것]이었다. 이 선들은 단순하게 다루어서는 안 될 '단순화 장치simplifying device'였다. 그러나, "색조와 톤"에 관한 섹션에서, 나는 방법론적 국경 통과의 불가피성, 방법의 역동적 특성, 그리고 "지적 장인정신" (Mills, 1959/1978)과 우리의 의지에 굽히는 방법에 관련된 주의를 전달하는 데 있어서 너무 단순했다.
The lines I drew 10 years ago between qualitative descriptive and other kinds of qualitative and quantitative studies were for the sake of drawing lines; these lines were a ‘‘simplifying device’’ (Mol & Law, 2002, p. 4), not to be treated simplistically. Yet, in the section on ‘‘hues and tones’’ (Sandelowski, 2000, p. 337), I was much too simplistic in communicating the inevitability of methodological border crossings, the dynamic nature of methods, and the ‘‘intellectual craftsmanship’’ (Mills, 1959/1978) and care involved in bending methods to our will.

'광범위 잔여 범주'로서의 질적 서술
QUALITATIVE DESCRIPTION AS A ‘‘DISTRIBUTED RESIDUAL CATEGORY’’

이제 나는 질적 설명이 2000년 기사에서 내가 주장한 범주적 옵션도 아니고, 비 범주적 옵션인 Thorne(2008)이 '해석적 설명'을 설명하고 명명하는 것도 아니라는 것을 알게 되었다. 나는 질적 서술을 ‘‘distributed residual category’’ 라고 보게 되었다. Bowker와 Star(149–150)는 이렇게 설명했다.
I see now that qualitative description is neither the categorical option I claimed it to be in the 2000 article, nor the noncategorical option Thorne (2008) described and named ‘‘interpretive description.’’ I have come to see qualitative description instead as a ‘‘distributed residual category’’ (Bowker & Star, 2000, p. 149). As Bowker and Star (pp. 149–150) described them:

단순히 쓰레기 분류는 아니다. 어떻게 해야 할지 모르는 상황이 발생할 경우, [광범위 잔여 범주]는, [정확한 지정을 강요하는 것이 (확실성의) 잘못된 인상을 줄 수 있는 상황일 때], 불확실성을 시사한다. 
(far from being mere) garbage categories . . . where things get put that you do not know what to do with, (distributed residual categories) signal uncertainty . . . under conditions where forcing a more precise designation could give a false impression (of certainty).

 

  • 정성적 방법의 분류에서 [광범위 잔여 범주]로서, 질적 설명은 방법의 분류를 구성하는 "작업 관행"을 가시화하고, 이러한 관행으로 인해 "암흑으로 방치된" 모든 것을 밝혀냄으로써, 방법과 탐구에 대한 보다 세밀한 이해를 가능하게 한다.
  • As a distributed residual category in the classification of qualitative methods, qualitative description makes visible the ‘‘work practices’’ that constitute the classification of methods, brings to light all that is ‘‘left dark’’ (Bowker & Star, 2000, p. 321) by these practices, and thereby enables more finely grained understandings of methods and of inquiry.
  • [광범위 잔여 범주]로서, 질적 서술은 질적 연구 "실천 공동체"로 구성된 "다양한 학자들의 연합"을 신호하여 한 종류의 질적 연구를 수행하는 것이 무엇을 의미하는지 재고하고 중요한 차이점에 초점을 맞춘다. (예: 샘플링된 사용자 또는 대상, 데이터 처리 방법, 데이터로부터 추론을 도출하는 방법과 관련이 있습니다.)
  • As a distributed residual category, qualitative description signals the ‘‘confederacy of diverse groups of scholars’’ (Preissle, 2006, p. 687) comprising the qualitative research ‘‘community of practice’’ (p. 686) to take stock of what it means to conduct one kind of qualitative research versus another and to focus on the differences that matter (e.g., related to who or what is sampled, to the way data are treated, to the way inferences are drawn fromdata).
  • [광범위 잔여 범주]로서, 정성적 설명은 정성적 설명과 정량적 설명 사이의 다공성 선을 가시화한다. 다양한 종류의 정성적 및 정량적 설명 중. 그리고 아마도, 가장 중요한 것은, 방법의 ''erosion''과 ''재발명'' 사이일 것이다.
  • As a distributed residual category, qualitative description makes visible the porous lines between qualitative and quantitative description; among different kinds of qualitative and quantitative description; and perhaps, most importantly, between the ‘‘erosion’’ (Greckhamer & Koro-Ljungberg, 2005) and re-invention of method.
  • [광범위 잔여 범주]로서, 질적 설명은 경험적 연구의 수행에서 방법보다 기술이 계속 우세해야 하는지 여부와 얼마나 우세해야 하는지에 대한 실천 분야에서의 논쟁을 중심에 놓기 위해 움직인다.
  • As a distributed residual category, qualitative description moves to center stage the debate in the practice disciplines about whether and how much technique should continue to prevail over method in the conduct of empirical research (Chamberlain, 2000; Eakin & Mykhalovskiy, 2005; Hammersley, 2006; Rapport, Wainwright, & Elwyn, 2005).

 

결론
CONCLUSION

음, 나는 질적 묘사에 대한 2000년 기사에 대한 답방에서 내가 예상했던 것보다 훨씬 더 멀리(아마도, 너무 멀리 또는 충분히 멀리 있지 않은) 여행했다. [질적 기술의 모양qualitative description shape]을 주기 위한 나의 노력이 다소 잘못되었다는 것을 이제 알겠다. 방법론적 접근법을 명확히 하는 대신, 2000년의 논문은 질적 연구가 데이터의 해석과 반대로, [단순한 축하celebration만을 포괄할 수 있다는 잘못된 인식]을 강화하는 역할을 했다. 이번 논문은 자주 사용되는 방법론적 접근법에 이름을 붙이는 대신 '명명이 유발할 수 있는 긴장the tensions naming can engender'을 표면화하는 역할을 했다. Bowker와 Star가 결론 내렸듯이, "유일한 좋은 분류는 살아있는 분류"이며, 그 안에 우리의 변화하는 이해를 수용하기 위해 "세상을 재구성"할 수 있는 능력을 포함하도록 구축되는 것이다. [질적 서술qualitative description의 가치]는 그것의 사용이 만들어낼 수 있는 지식뿐만 아니라, [단순한 분류에 저항하는 살아있는 실체]로서 연구 방법을 제시하고 다루는 매개체vehicle로서도 존재한다.
Well, I have traveled much farther than I anticipated (perhaps, too far or not far enough) in my return visit to my 2000 article on qualitative description. I see now that my effort to give qualitative description shape—to remove it from the ranks of what Caelli, Ray, and Mill (2003) referred to as ‘‘generic qualitative research’’— was somewhat misdirected. Instead of clarifying a methodological approach, the article served to reinforce the misconception that qualitative research could encompass the mere celebration, as opposed to interpretation, of data. Instead of giving a name to a frequently used methodological approach, the article served to surface ‘‘the tensions naming can engender’’ (Jutel, 2009, p. 294). As Bowker and Star (2000, p. 326) concluded, ‘‘the only good classification is a living classification,’’ built to contain within it the capacity to ‘‘reconfigure the world’’ to accommodate our changing understandings of it. The value of qualitative description lies not only in the knowledge its use can produce, but also as a vehicle for presenting and treating research methods as living entities that resist simple classification.

 


Res Nurs Health. 2010 Feb;33(1):77-84. doi: 10.1002/nur.20362.

What's in a name? Qualitative description revisited

Affiliations collapse

Affiliation

1University of North Carolina at Chapel Hill School of Nursing, 7460 Carrington Hall, Chapel Hill, NC 27599, USA.

PMID: 20014004

DOI: 10.1002/nur.20362

Abstract

"Whatever Happened to Qualitative Description?" (Sandelowski, 2000) was written to critique the prevailing tendency in qualitative health research to claim the use of methods that were not actually used and to clarify a methodological approach rarely identified as a distinctive method. The article has generated several misconceptions, most notably that qualitative description requires no interpretation of data. At the root of these misconceptions is the persistent challenge of defining qualitative research methods. Qualitative description is a "distributed residual category" (Bowker & Star, 2000). Cambridge, MA: The MIT Press) in the classification of these methods. Its value lies not only in the knowledge its use can produce, but also as a vehicle for presenting and treating research methods as living entities that resist simple classification.

질적 서술에 무슨 일이 있었는가? (Res Nurs Health. 2000)
Whatever Happened to Qualitative Description?
Margarete Sandelowski*

 

질적 연구자들은 이제 이론적으로나 기술적으로 정교한 방법들의 점점 더 많은 배열 중에서 선택할 수 있는 선택권을 가지고 있다. 따라서, 더 평범하고 상당히 "덜 섹시한"1 방법, 즉 [질적인 묘사]를 부활시키는 것은 이상하게 보일 수 있다. 그러나 정성적 기술의 재발견이 필요한 것은 바로 간호 연구에서 [정성적 방법의 복잡성]과 [방법의 횡포]이다.
Qualitative researchers now have the option to choose from an increasing array of theoretically and technically sophisticated methods. Accordingly, it may seem strange to resurrect a plainer and considerably ``less sexy''1 method: namely, qualitative description. Yet it is precisely the increasing complexity of qualitative methods and the tyranny of method in nursing research that makes the rediscovery of qualitative description necessary.

[기술 연구descriptive research]는 일반적으로 정량적 연구 설계 계층에서 가장 낮은 순위에 있는 것으로 연구 텍스트에서 묘사된다. 이 계층 구조에서 예측과 제어를 목표로 하는 "참" 실험은 금본위제이며 다른 모든 설계는 실험적이지 않고 약하다(예: 탤벗, 1995). 정량적 연구를 ''가장 조잡한 형태의 탐구'''로 묘사하는 견해(Thorne, Kirkham, & MacDonald-Emes, 1997, p. 170)는 질적 연구에 종사하는 연구자들에게 부정적인 영향을 미쳤을 가능성이 있으며, 그들 중 많은 사람들은 단순히 묘사 이상의 것으로 그들의 노력을 방어할 의무를 느꼈다. 즉, 그들은 현상학, 근거이론, 민족학, 또는 서사연구로 그들의 작품을 지정함으로써 ''인식론적 신뢰성''(p.170)을 추구했다. 그러나 너무 많은 경우에 이러한 노력은 현상학, 이론, 민족지학 또는 서술적 해석보다는 현상학, 근거이론, 민족지학 또는 서술적 연구에 대한 "가식posturing"를 초래했다(Wolcott, 1992). 아래와 같은 혼란스러운 상황이 존재한다.

  • 최소한의 구조화된 개방형 인터뷰만 포함하면 '서사적' 라고 부른다.
  • 참가자들의 "주관적" 경험에 대한 보고만을 포함하면, '현상학적'이라고 부른다.
  • 서로 다른 민족 집단의 참가자들만을 포함하기만 하면, '민족지적'이라고 부른다.

Descriptive research is typically depicted in research texts as being on the lowest rung of the quantitative research design hierarchy. In this hierarchy, ``true'' experiments aimed at prediction and control are the gold standard and any other design is non-experimental and weak (e.g., Talbot, 1995). The view of description in quantitative research as the ``crudest form of inquiry'' (Thorne, Kirkham, & MacDonald-Emes, 1997, p. 170) likely has negatively influenced researchers engaging in qualitative research, many of whom have felt obliged to defend their efforts as something more than mere description. That is, they have sought ``epistemological credibility'' (p. 170) by designating their work as phenomenology, grounded theory, ethnography, or narrative study. In too many cases, however, this effort has resulted in ``posturing'' (Wolcott, 1992) about phenomenology, grounded theory, ethnography, or narrative study rather than in phenomenologies, theories, ethnographies, or narrative interpretations. A confusing state of affairs exists whereby studies are called

  • narrative, even though they may include nothing more than minimally structured, open-ended interviews;
  • phenomenologic, even though they may include nothing more than reports of the ``subjective'' experiences of participants; or,
  • ethnographic, even though they may include nothing more than participants in different ethnic groups.

실제로, 그것들이 실습을 위한 귀중한 정보를 산출하는 가치 있는 연구일 수 있지만, 이러한 소위 서술적, 현상학적, 민족학적 연구는 종종 서술적, 현상학적, 민족학적 측면과 함께 [질적 서술적 연구]로 더 잘 설명할 수 있다. 나는 나중에 질적 연구의 과장된 주제로 돌아갈 것이다.
Indeed, although theymay undeniably be worthwhile studies that yield valuable information for practice, these so-called narrative, phenomenologic, and ethnographic studies are often better described as qualitative descriptive studies, albeit with narrative, phenomenologic, and ethnographic overtones. I will return to the subject of overtones in qualitative research later.

현재 방대한 질적 방법 문헌에서, 다른 질적 방법과 동등한 지위를 갖는 독특한 방법으로서 [질적 묘사qualitative description]에 대한 포괄적인 설명은 없지만, 실천 분야에서 가장 자주 사용되는 방법론적 접근법 중 하나이다. 따라서 본 논문에서는 [정성적 묘사qualitative description]를 방법론적 곡예에 의존하지 않고 연구자들이 부끄럽지 않게 주장할 수 있는 방법이라고 설명한다. 나의 질적 서술에 대한 발표는 부분적으로 Thorne, Kirkham 및 MacDonald-Emes의 "해석적 서술"(1997)에 대한 통찰력 있는 논의에서 영감을 받았지만, 그 논의와 "방법론적 정통성"에 대한 Thorne의 이전 관련 토론(1991)에서 세 가지 방식으로 출발한다.

  • 첫째로, 나는 질적 설명qualitative description을 조사를 위한 "비범주적 대안"과는 달리 [범주적]으로 본다. 즉, 그 방법은 근거 이론, 현상학 및 민족지학의 새롭고 독특하게 간호된 적응인 것과는 달리 이미 존재하지만 상대적으로 인식되지 않는다.
  • 둘째, 질적 서술적 연구는 연구자들이 자료에서 멀리 또는 자료로 이동할 것을 요구하지 않는다는 점에서 "해석적 서술"보다 [덜 해석적]이라고 본다.
  • 셋째, 개념적이거나 매우 추상적으로 데이터를 렌더링할 필요가 없습니다. 질적 묘사에 대한 나의 묘사는 다른 질적 연구의 ''진입점'''이라기보다는 [그 자체로 완전하고 가치 있는 최종 산물]을 생산하는 것으로 본다는 점에서 아르티니안(1988)의 ''기술적 모드'''에 대한 유용한 논의에서 출발한다. (반면, 그녀는 qualitative description을 근거 이론 탐구의 필수 전주곡으로 제시했다.)

In the now vast qualitative methods literature, there is no comprehensive description of qualitative description as a distinctive method of equal standing with other qualitative methods, although it is one of the most frequently employed methodologic approaches in the practice disciplines. Accordingly, in this paper, I describe qualitative description as a method that researchers can claim unashamedly without resorting to methodological acrobatics. My presentation of qualitative description was inspired, in part, by Thorne, Kirkham, and MacDonald-Emes' insightful discussion of ``interpretive description'' (1997), but departs from that discussion and from Thorne's (1991) earlier related discussion of ``methodological orthodoxy'' in three ways.

  • First, I see qualitative description as a categorical, as opposed to ``noncategorical alternative'' for inquiry; that is, the method already exists but is relatively unacknowleged, as opposed to being a new, distinctively nursing adaptation of grounded theory, phenomenology, and ethnography.
  • Second, I see qualitative descriptive studies as less interpretive than ``interpretive description'' in that they do not require researchers to move as far from or into their data.
  • Third, they do not require a conceptual or otherwise highly abstract rendering of data. My depiction of qualitative description departs from Artinian's useful discussion of the ``descriptive mode'' of qualitative inquiry (1988) in that I view it as producing a complete and valued end-product in itself, rather than as an ``entry point'' (p. 139) into other qualitative studies: as she presented it, as a necessary prelude to grounded theory inquiry.

나는 현상학, 근거이론, 민족학 등 다른 종류의 질적 설명과 구별하기 위해, 여기서 제시하는 방법을 [기본적 또는 근본적인 질적 설명qualitative description]으로 지칭한다. 현상학, 기초 이론 및 민족학 연구는 현상을 설명하는 데 사용될 수 있기 때문에 기술 영역에만 국한되지 않는다. 불행하게도, 기초, 기본, 표면이라는 단어(이 글의 뒷부분에서 내가 사용하는 단어)는 기초적이고, 피상적이고, 단순하거나, 또는 단지 예비적인 것을 암시한다. 나는 이 단어들을 사용함으로써 한 방법을 다른 방법보다 더 쉽고, 덜 가치 있고, 덜 바람직하거나, 덜 과학적이라고 제시하는 사악한 계층 구조를 결코 강화하고 싶지 않다. 어떤 방법도 절대적으로 약하거나 강하지 않고, 오히려 특정 목적과 관련하여 유용하거나 적절하지 않다. 따라서 나는 여기서 정성적 설명qualitative description을 그 자체로 가치 있는 방법으로서 제시한다. 다른 방법과의 비교는 순위나 폄훼가 아닌 조명의 목적을 위한 것이다.
I refer to the method I present here as
basic or fundamental qualitative description to differentiate it from other kinds of qualitative description, such as phenomenology, grounded theory, and ethnography. Phenomenologic, grounded theory, and ethnographic studies are not exclusively in the descriptive domain, though, as they may also be used to explain phenomena. Unfortunately, the words basic, fundamental, and surface (a word I use later in this article) connote something elementary, superficial, simple, or merely preliminary. In no way do I wish to reinforce, by using these words, those invidious hierarchies that present one method as easier, less valuable, less desirable, or less scientific than another. No method is absolutely weak nor strong, but rather more or less useful or appropriate in relation to certain purposes. Accordingly, I present qualitative description here as a valuable method by itself. Comparisons to other methods are for the purposes ofillumination,not rankingordenigration.

정성적 기술 대 정량적 기술 및 기타 정성적 방법
QUALITATIVE DESCRIPTION VERSUS QUANTITATIVE DESCRIPTION AND OTHER QUALITATIVE METHODS

모든 탐구에는 묘사가 수반되고, 모든 묘사는 해석을 수반한다. 어떤 현상(또는 사건이나 경험)을 아는 것은 최소한 그 현상에 대한 "사실"을 알아야 한다. 그러나 그러한 사실들에 의미를 부여하는 특정한 맥락을 벗어난 "사실"은 없다. 설명은 항상 설명자의 인식, 성향, 민감성 및 감성에 따라 달라진다(예: Emerson, Fretz, & Shaw, 1995; Georgi, 1992; Wolcott, 1994). ''Naked, innocent 눈으로 바라보는 순수한 모습은 없다'(Pearce, 1971년, 페이지 4). 그리고 ''무구한 인식'''도 없다(Beer in Wolcott, 1994, 페이지 13). 경험이나 사건을 묘사하고자 하는 연구자들은 [그들이 묘사할 것을 선택하고 그것의 특정 측면을 특징짓는 과정]에서 그 경험이나 사건을 변화시키기 시작한다.
All inquiry entails description, and all description entails interpretation. Knowing any phenomenon (or event or experience) requires, at the very least, knowing the ``facts'' about that phenomenon. Yet there are no ``facts'' outside the particular context that gives those facts meaning. Descriptions always depend on the perceptions, inclinations, sensitivities, and sensibilities of the describer (e.g., Emerson, Fretz, & Shaw, 1995; Giorgi, 1992; Wolcott, 1994). ``There is no pure looking with a naked, innocent eye'' (Pearce, 1971, p. 4), and there is no ```immaculate perception''' (Beer cited in Wolcott, 1994, p. 13). Researchers seeking to describe an experience or event select what they will describe and, in the process of featuring certain aspects of it, begin to transform that experience or event.

어떠한 설명도 해석에서 자유롭지는 않지만, 예를 들어 현상학적 또는 근거 있는 이론 설명과 반대로, [기본적 또는 근본적인 질적 설명qualitative description]은 낮은 추론 또는 연구자들 사이의 더 쉬운 합의를 이끌어낼 수 있는 형태의 해석을 수반한다. 비록 한 연구원이 한 여성이 인터뷰에서 보고한 사건들을 두 번째 연구원이 특징지을 수 있지만, 두 연구자 모두, 예를 들어, 그 여성이 화가 났다고 여러 번 진술했고, 그녀 자신이 유방암에 걸렸다는 것을 알고 하루 후에 어머니가 죽었다고 진술했다는 것에 동의할 것이다. 표면적으로 동일한 장면을 묘사하는 두 연구자의 경우, 한 연구자는 방의 공간 배치를 특징지을 수 있고, 두 번째 연구자는 사회적 상호작용을 특징지을 수 있다. 그러나 두 연구자는 장면의 정확한 표현으로서 서로의 설명에 동의해야 한다. 즉, [추론력이 낮은 서술low-inference description]을 함으로써 연구자들은 설령 서술에 같은 사실을 포함시키지 않더라도 사건의 ``사실"에 더 쉽게 동의할 것이다. (인터뷰 또는 관찰 데이터의 설명 요약의 형태에 관계없이) 설명은 무엇을 설명해야 하는지에 대한 연구자의 선택을 수반한다. 그러나 이러한 설명은 항상 적절한 순서로 사건을 정확하게 전달하거나[서술적 타당성], 그리고 그러한 사건에 기인하는 [참여자의 의미]라는 [해석적 타당성]을 가져야 한다(Maxwell, 1992). 비록 인간은 결코 "거기"에 있는 모든 것을 묘사할 수 없으며 결코 원하지 않을 것이지만, 그들이 묘사하기로 선택한 것은 대부분의 관찰자들이 사실 "거기"에 동의하는 것이 될 것이다.''
Although no description is free of interpretation, basic or fundamental qualitative description, as opposed to, for example, phenomenological or grounded theory description, entails a kind of interpretation that is low-inference, or likely to result in easier consensus among researchers. Even though one researcher may feature the feelings and a second researcher the events a woman reported in an interview, both researchers will likely agree that, for example, the woman stated several times that she was angry and that she stated that her mother died one day after she herself learned she had breast cancer. In the case of two researchers describing ostensibly the same scene, one researcher might feature the spatial arrangement in a room, while the second researcher will feature the social interactions. But both researchers ought to agree with each other's descriptions as accurate renderings of the scene. That is, with low-inference descriptions, researchers will agree more readily on the ``facts'' of the case, even if they may not feature the same facts in their descriptions. Descriptions - whether in the form of descriptive summaries of interview or observation data - entail researchers' choices about what to describe. But these descriptions must always accurately convey events in their proper sequence, or have descriptive validity, and the meanings participants attributed to those events, or have interpretive validity (Maxwell, 1992). Although human beings can never, and will likely never want to, describe everything that is ``there,'' what they choose to describe will be something that most observers would agree is in fact ``there.''

따라서 '(인간의) 인식을 통해 필터링된다'는 점에서 필연적으로 해석적이기는 하지만, 연구자가 개념적, 철학적, 또는 그 밖의 고도로 추상적인 틀이나 체계적 측면에서 사건을 기술하는 것을 의도적으로 선택한다는 점에서 [기본적인 질적 묘사는 해석력이 높지 않다].

  • [질적 서술적 연구]의 서술은 [일상적인 언어]로 사례의 사실들을 제시하는 것을 수반한다.
  • 대조적으로, 현상학적, 이론적, 민족학적, 또는 서술적 서술은 다른 용어로 사건을 나타낸다. 이런 연구에서 연구자들은 그들이 보고 듣는 것에 그들 자신의 [해석적 스핀]을 더 많이 넣을 의무가 있다. 이 스핀은 부분적으로 이러한 방법론 자체에서 파생됩니다.
    • 근거 이론 연구는 연구자가 데이터를 "조건적/결과적 행렬"에서 요소를 찾고 해석하는 경향이 있다(Strauss & Corbin, 1998, p. 181).
    • 특정 유형의 현상학적 연구는 연구자가 "생활 세계의 실존성"이라는 관점에서 데이터를 찾고 해석하는 경향이 있다(Van Manen, 1990, 페이지 101).

Accordingly, although unavoidably interpretive, in that it is `’filtered through (human) perceptions'' (Wolcott, 1994, p. 13), basic qualitative description is not highly interpretive in the sense that a researcher deliberately chooses to describe an event in terms of a conceptual, philosophical, or other highly abstract framework or system.

  • The description in qualitative descriptive studies entails the presentation of the facts of the case in everyday language.
  • In contrast, phenomenological, theoretical, ethnographic, or narrative descriptions re-present events in other terms. Researchers are obliged to put much more of their own interpretive spin on what they see and hear. This spin derives, in part, from these methodologies themselves.
    • Grounded theory study inclines the researcher to look for, and interpret data as, elements in a ``conditional/ consequential matrix'' (Strauss & Corbin, 1998, p. 181).
    • Certain types of phenomenologic studies incline the researcher to look for, and interpret data in terms of, ``lifeworld existentials,'' such as corporeality and temporality (Van Manen, 1990, p. 101).

이러한 설명은 단순히 [단어와 장면만 읽는 것]이 아니라, [행간을 읽고, 단어와 장면을 초월한 읽기]를 요구하기 때문에 연구자가 데이터 안으로 더 깊이 들어가거나 그 너머로 이동할 것을 요구한다(예: McMahon, 1996; Poirier & Ayres, 1997). 현상학적 연구의 ''순간''에 대한 Wertz'(1983) 분석은 참가자의 사건에 대한 설명에서 연구자의 사건에 대한 현상학적 설명으로 이어지는 연속적인 변화를 잘 보여준다.
Such descriptions require researchers to move farther into or beyond their data as they demand not just reading words and scenes, but rather reading into, between, and over them (e.g., McMahon, 1996; Poirier & Ayres, 1997). Wertz' (1983) analysis of the ``moments'' of a phenomenological study is an excellent demonstration of the successive transformations from a participant's description of an event to a researcher's phenomenological description of that event.

현상학적 또는 근거 있는 이론 설명보다 해석력이 떨어지기는 하지만, [기본적인 질적 서술]은 [정량적 서술]보다 해석력이 더 강하며, 이는 일반적으로 사전 선택된 변수에 대한 공통 데이터 세트를 얻기 위한 조사 또는 기타 사전 구조화된 수단과 이를 요약하기 위한 서술적 통계를 수반한다. [정량적 서술적 연구]는 연구자들이 연구할 변수를 미리 선정하여 연구에 대한 기대의 지평을 설정하고, 일련의 가정을 바탕으로 스스로 통계적 시험 결과로부터 결론을 도출한다는 점에서 해석을 수반한다. 그러나 이는 개념의 운영적 정의와 조사 및 기타 조치의 항목으로서의 표현을 포함하여 이러한 사전 설정된 한계를 벗어나지 않는 일종의 해석이다. 정량적 설명은 참가자가 이벤트에 제공하는 의미에 대해 배울 수 있는 것을 제한한다. 더욱이, 정량적 설명에서, 연구자들은 예상치 못한 것을 위한 여지를 덜 남겨둔다(Becker, 1996, p. 61).
Although less interpretive than phenomenological or grounded theory description, fundamental qualitative description is more interpretive than quantitative description, which typically entails surveys or other pre-structured means to obtain a common dataset on pre-selected variables, and descriptive statistics to summarize them. Quantitative descriptive studies entail interpretation in that researchers set the horizon of expectations for the study by pre-selecting the variables that will be studied, and in that they draw conclusions from the results of statistical tests, which are themselves based on sets of assumptions. But it is a kind of interpretation that does not move beyond these pre-set confines, including the operational definitions of concepts and their representations as items in surveys and other measures. Quantitative description limits what can be learned about the meanings participants give to events. Moreover, in quantitative description, researchers leave less room for the unanticipated (Becker, 1996, p. 61).

질적 연구를 수행하는 연구자들은 사건 발생 시 발생하는 모든 요소를 포착할 수 있는 데이터를 최대한 많이 수집하려고 합니다. 그들이 "현장에 있는 한" 그들은 현장에서 무엇을 관찰하든 자료로 간주할 의무가 있다. 정성적 연구자들은 양적 연구자들만큼 쉽게 "데이터로부터 스스로를 절연"할 수 없다(Becker, 1996, p. 56). 비록 ''완전한 묘사는 이룰 수 없는 환상''이지만, 정성적 설명에 대한 [더 완전한fuller 설명]은 한정적이거나 정량적 조사에서 나온 (그들이 종종 인지하는) [엉성한 설명]보다 질적 연구자들에게 더 선호된다. 마지막으로, 정량적 연구에서는 정성적 서술적 연구보다 [탐구(있는 것을 찾아내는 것)]와 [서술(발견된 것을 기술하는 것)] 사이에 더 뚜렷한 선이 그어져 있다.
Researchers conducting qualitative studies want to collect as much data as they can that will allow them to capture all of the elements of an event that come together to make it the event that it is. As long as they are ``in the field,'' they are obliged to consider as data whatever they observe in the field. Qualitative researchers cannot, as readily as quantitative researchers, ``insulate themselves from data'' (Becker, 1996, p. 56). Although ``full description is a will-o'-the wisp,'' the ``fuller'' description of qualitative description is preferable to qualitative researchers than the confined, or (what they often perceive to be the) ``skimpy'' description resulting from quantitative surveys (p. 64). Finally, in quantitative research, there is a sharper line drawn between exploration (finding out what is there) and description (describing what has been found) than in qualitative descriptive studies.

요약하면, [정성적 기술 연구qualitative descriptive studies]는 그러한 사건의 일상적인 용어로 사건에 대한 포괄적인 요약을 제공한다. 그러한 연구를 수행하는 연구자들은 다음을 추구한다 

  • 기술적 타당성: 동일한 사건을 관찰하는 대부분의 사람들(연구자와 참가자 포함)이 동의하는, 사건의 정확한 설명
  • 해석적 타당성: 참가자들이 동의하는 이벤트에 귀속되는 의미에 대한 정확한 설명

In summary, qualitative descriptive studies offer a comprehensive summary of an event in the everyday terms of those events. Researchers conducting such studies seek

  • descriptive validity, or an accurate accounting of events that most people (including researchers and participants) observing the same event would agree is accurate, and
  • interpretive validity, or an accurate accounting of the meanings participants attributed to those events that those participants would agree is accurate (Maxwell, 1992).

[질적 서술적 연구qualitative descriptive studies]를 수행하는 연구자는 기초 이론, 현상학, 민족학 또는 서술적 연구를 수행하는 연구자보다 데이터와 단어 및 사건의 표면에 더 가까이 있다. [질적 기술 연구qualitative descriptive studies]에서 언어는 반드시 읽어야 하는 해석적 구조가 아니라 의사소통의 수단이다. 그러나 그러한 표면적 판독은 피상적이거나 사소하고 가치 없는 것으로 여겨져서는 안 된다. 나는 여기서 [보고되거나 관찰된 사건]에 대한 [투과의 깊이 또는 주변의 해석 활동의 정도]를 전달하기 위해 '표면'이라는 단어를 의도한다. 사실들을 얻는 것은 사소한 것이거나 쉬운 것이 아니며, 참가자들이 그 사실들에 부여하는 의미들은 그것들을 일관되고 유용한 방식으로 전달한다.

Researchers conducting qualitative descriptive studies stay closer to their data and to the surface of words and events than researchers conducting grounded theory, phenomenologic, ethnographic, or narrative studies. In qualitative descriptive studies, language is a vehicle of communication, not itself an interpretive structure that must be read. Yet such surface readings should not be considered superficial, or trivial and worthless. I intend the word surface here to convey the depth of penetration into, or the degree of interpretive activity around, reported or observed events. There is nothing trivial or easy about getting the facts, and the meanings participants give to those facts, right and then conveying them in a coherent and useful manner.

정성기술연구의 설계특성
DESIGN FEATURES OF QUALITATIVE DESCRIPTIVE STUDIES

[정성적 서술적 설계Qualitative descriptive designs]는 전형적으로 절충적이지만 합리적이고 잘 고려된 샘플링, 데이터 수집, 분석 및 재현 기법의 조합이다. 다음 섹션에서는 일반적인 설계 기능에 대해 설명합니다. [질적 설명]은 특히 실무자와 정책 입안자와 특별한 관련이 있는 질문에 대한 솔직하고 대체로 장식되지 않은(즉, 최소한 이론화되거나 변형되거나 회전된) 답변을 얻는 데 적합하다. 이러한 질문의 예는 다음과 같다.

  • 사건에 대한 사람들의 우려는 무엇인가?
  • 사건에 대한 사람들의 반응(예: 생각, 느낌, 태도)은 무엇인가?
  • 사람들이 서비스나 절차를 이용하거나 이용하지 않는 이유는 무엇인가?
  • 누가 언제 서비스를 이용합니까?
  • 어떤 요소들이 사건으로부터의 회복을 촉진하고 방해합니까?

Qualitative descriptive designs are typically an eclectic but reasonable and well-considered combination of sampling, and data collection, analysis, and re-presentational techniques. In the following sections, I describe typical design features. Qualitative description is especially amenable to obtaining straight and largely unadorned (i.e., minimally theorized or otherwise transformed or spun) answers to questions of special relevance to practitioners and policy makers. Examples of such questions include:

  • What are the concerns of people about an event?
  • What are people's responses (e.g., thoughts, feelings, attitudes) toward an event?
  • What reasons do people have for using or not using a service or procedure?
  • Who uses a service and when do they use it?
  • What factors facilitate and hinder recovery from an event?

이론적/철학적 지향성
Theoretical/Philosophical Orientation

질적 서술적 연구는 그러한 연구를 수행하는 연구자들이 기존의 이론적 및 철학적 약속에 의해 가장 방해가 되지 않는다는 점에서, 거의 틀림없이 질적 접근의 스펙트럼의 최소 "이론적"이다. 독특한 학문적 전통(예: Lowenberg, 1993)에서 나타나는 특정한 방법론적 틀을 기반으로 하는 현상학적, 근거 있는 이론, 민족학적 또는 서술적 연구와 대조적으로, 질적 서술적 연구는 자연주의 탐구Naturalistic inquiry의 일반적인 원칙에서 도출되는 경향이 있다. 자연주의 탐구는 질적 연구뿐만 아니라, [인간과 동물이 관련된 행동 연구의 형태, 예를 들어, 생태학적 관찰을 포함하는 탐구]의 generic orientation이다. [자연주의 탐구]는 연구에서 이것이 [가능한 범위 내에서 자연상태 또는 있는 그대로의 상태에서 무언가를 연구하겠다는 헌신]만을 의미한다(Linkoln & Guba, 1985; Willems, 1967). 즉, 어떤 자연주의 연구에서도 연구할 변수의 사전 선택, 변수의 조작, 대상 현상에 대해 [특정한 하나의 이론적 관점에 대한 선험적 확약이 없다]. 따라서 자연주의 조사자는 대상 현상이 연구 중이 아닌 경우처럼 스스로 나타날 수 있는 기법을 사용할 것이다.
Qualitative descriptive studies are arguably the least ``theoretical'' of the spectrum of qualitative approaches, in that researchers conducting such studies are the least encumbered by pre-existing theoretical and philosophical commitments. In contrast to phenomenological, grounded theory, ethnographic, or narrative studies, which are based on specific methodologic frameworks emerging from distinctive disciplinary traditions (e.g., Lowenberg, 1993), qualitative descriptive studies tend to draw from the general tenets of naturalistic inquiry. Naturalistic inquiry is a generic orientation to inquiry that includes not only qualitative research, but also forms of behavioral research involving humans and animals, such as ethological observation. Naturalistic inquiry implies only a commitment to studying something in its natural state, or as it is, to the extent that this is possible in a research enterprise (Lincoln & Guba, 1985; Willems, 1967). That is, in any naturalistic study, there is no pre-selection of variables to study, no manipulation of variables, and no a priori commitment to any one theoretical view of a target phenomenon. Accordingly, the naturalist inquirer will use techniques that allow the target phenomenon to present itself as it would if it were not under study.

색조, 톤, 텍스처. 질적 서술적 연구는 현상학, 기초 이론, 민족학, 서술적 연구와 다르지만, 그럼에도 불구하고 이러한 접근법에서 색조, 음색, 질감을 가질 수 있다. 어떤 하나의 질적 접근도 다른 접근의 모양, 소리 또는 느낌을 가질 수 있다. Charmaz(1990)는 그녀의 근거이론 연구를 현상학적 배역을 가지고 있다고 묘사했고, Sandelowski, Holditch-Davis, Harris(1992)는 그들의 근거이론 연구를 현상학적 배역과 서술적 배역을 획득하는 것으로 묘사했다. 실제로 질적 작업은 어떤 방법의 "순수한" 사용이 아니라 [다양한 질감, 톤 및 색조를 가진 방법]의 사용에서 생산된다. 근거이론의 오버톤을 가진 민족지학적 연구도 있고, 민족지학적 오버톤을 가진 근거연구(예: Kittell, Mansfield, & Voda, 1998)가 있다. 
Hues, tones, and textures
.
Although qualitative descriptive studies are different from phenomenologic, grounded theory, ethnographic, and narrative studies, they may, nevertheless, have hues, tones, and textures from these approaches. Any one qualitative approach can have the look, sound, or feel of other approaches. Charmaz (1990) described her grounded theory studies as having a phenomenological cast, and Sandelowski, Holditch-Davis, and Harris (1992) described their grounded theory study as acquiring phenomenological and narrative casts. Indeed, qualitative work is produced not from any ``pure'' use of a method, but from the use of methods that are variously textured, toned, and hued. There are ethnographic studies with grounded theory overtones (e.g. Timmermans, 1997) and grounded theory studies with ethnographic overtones (e.g., Kittell, Mansfield, & Voda, 1998).

따라서, 질적 서술적 연구는 연구자들이 [지속적 비교]와 같은 근거이론과 관련된 하나 이상의 기술을 사용했기에 근거이론의 오버톤을 가질 수 있지만, 그 연구가 [대상 현상의 이론적 렌더링]을 만들어내지는 않을 수 있다(예: Chow, 1998). 일부 정성적 서술적 연구는 연구자들이 특정 단어와 구절 또는 경험의 순간에 진지하게 주의를 기울였기 때문에 서술적 또는 현상학적 색채를 가질 수 있지만, 목표 현상에 대한 [서술적 또는 현상학적 렌더링]을 생성하지 않을 수 있다(예: Jablonski, 1994). Altheide의 민족지학적 내용분석(1987)은 민족지학적 및 근거 있는 이론이 위에 있는 기법으로서 질적 내용분석(아래에서 더 논의될 것)을 제시한다. 정성적 기술 연구는 또한 페미니즘과 같은 더 큰 패러다임의 음영을 가질 수 있다.
Accordingly, qualitative descriptive studies may have grounded theory overtones as researchers may employ one or more techniques associated with grounded theory, such as a form of constant comparison, but not produce any theoretical rendering of the target phenomenon (e.g., Chow, 1998). Some qualitative descriptive studies have narrative or phenomenological hues as researchers might seriously attend to certain words and phrases, or moments of experience, but not produce narrative or phenomenological renderings of the target phenomenon (e.g., Jablonski, 1994). Altheide's description of ethnographic content analysis (1987) presents qualitative content analysis (to be discussed further below) as a technique with ethnographic and grounded theory overtones. Qualitative descriptive studies may also have shadings from larger paradigms, such as feminism.

다양한 색조, 톤 및 질감의 연구는 방법이나 기술의 잘못된 참조 또는 오용과 혼동되어서는 안 된다. 연구자들은 그들의 프레젠테이션에 대해 어떠한 것도 이러한 기법을 적절하게 또는 전혀 사용했다는 것을 나타내지 않을 때 이론적 샘플링, 일정한 비교, 서술적 분석 및 현상학적 반성을 사용했다고 주장할 수 있다. 연구자들은 혼합 방법 연구에서와 같이 기술을 명시적으로 결합할 수도 있다(Tashakkori & Teddlie, 1998).
Variously hued, toned, and textured studies are not to be confused with erroneous references to or misuses of methods or techniques. Researchers may claim to have used theoretical sampling, constant comparison, narrative analysis, and phenomenological re
flection when nothing about their presentation indicates they used these techniques appropriately or at all. Researchers may also explicitly combine techniques, as in mixed method studies (Tashakkori & Teddlie, 1998).

샘플링
Sampling

사실상 패튼(1990)이 설명한 [목적적 샘플링 기법]은 정성적 기술 연구에 사용될 수 있다. 그러나 특히 유용한 것은 [최대 변동 표본 추출]로, 연구자들은 광범위한 현상 및 인구 통계학적으로 다양한 사례에 걸쳐, [대상 현상의 공통적이고 고유한 징후]를 탐색할 수 있다(Sandelowski, 1995). 연구자들은 또한 나타나는 경향이 있거나 흔하지 않게 나타나는 현상을 설명하기 위해 미리 선택된 변수들의 조합을 나타내는 사례(Trost, 1986)를 표본으로 추출하는 것을 선택할 수 있다. 다른 정성적 연구와 마찬가지로 목적적 표본 추출의 궁극적인 목표는 연구의 목적을 위해 정보가 풍부하다고 간주되는 사례를 얻는 것이다. 연구자의 의무는 표본 추출 전략을 목적에 합당한 것으로 방어하는 것이다.
Virtually any of the purposeful sampling techniques Patton (1990) described may be used in qualitative descriptive studies. Especially useful, though, is maximum variation sampling, which allows researchers to explore the common and unique manifestations of a target phenomenon across a broad range of phenomenally and/or demographically varied cases (Sandelowski, 1995). Researchers may also choose to sample cases to represent a combination of pre-selected variables (Trost, 1986), or typical or unusual cases of a phenomenon, in order to describe it as it tends to appear or uncommonly appears. As in any qualitative study, the ultimate goal of purposeful sampling is to obtain cases deemed information-rich for the purposes of study. The obligation of researchers is to defend their sampling strategies as reasonable for their purposes.

데이터 수집
Data Collection

질적 서술적 연구의 데이터 수집은 일반적으로 [사건이나 경험의 누구, 무엇, 어디서, 또는 그 기본적 성격과 형태를 발견하는 데 초점]을 맞추고 있다. 데이터 수집 기법에는 일반적으로 최소에서 중간 정도 구조의 개방형 개인 및 포커스 그룹 인터뷰가 포함된다. 포커스 그룹은 사건에 대한 광범위한 정보를 얻기 위해 질적 연구에 일반적으로 사용된다는 점에서 정량적 조사의 질적 대응물로 유용하게 볼 수 있다. 데이터 수집 기술은 또한 대상 이벤트의 관찰 및 문서 및 아티팩트의 검사를 포함할 수 있다.
Data collection in qualitative descriptive studies is typically directed toward discovering the
who, what, and where of events or experiences, or their basic nature and shape. Data collection techniques usually include minimally to moderately structured open-ended individual and/or focus group interviews. Focus groups can usefully be viewed as the qualitative counterpart to the quantitative survey, in that they are typically used in qualitative research to obtain a broad range of information about events. Data collection techniques may also include observations of targeted events and the examination of documents and artifacts.

데이터 분석
Data Analysis

[질적 내용 분석Qualitative content analysis]은 [질적 서술적 연구qualitative descriptive studies]에서 [우선되는 전략적 선택analysis strategy of choice]이다. 정성적 내용 분석은 해당 데이터의 정보 내용을 요약하는 것을 지향하는 언어 및 시각적 데이터의 역동적 분석 형태이다(Altheide, 1987; Morgan, 1993). [정량적 내용 분석]은 기존 코드 집합을 데이터에 체계적으로 적용하는 것과 달리, [정성적 내용 분석]은 데이터 파생, 즉 코드도 체계적으로 적용되지만 연구 과정에서 데이터 자체에서 생성된다. 질적 연구는 일반적으로 데이터를 동시에 수집하고 분석하는 것이 특징이며, 둘 다 서로를 형성한다. 유사하게, [질적 내용 분석]은 연구자들이 새로운 데이터와 데이터에 대한 새로운 통찰력을 수용하기 위해 지속적으로 데이터 처리를 수정하기 때문에 반사적이고 상호작용적이다. 연구자들은 [기존의 코딩 시스템]을 사용하여 정성적 내용 분석 프로세스를 시작할 수도 있지만, 이러한 시스템은 데이터에 가장 잘 적합하도록 분석 과정에서 항상 수정되거나 심지어 새로운 시스템을 위해 완전히 폐기될 수도 있다. Miller와 Crabtree(1992년, 페이지 18)는 분석에 대한 이 접근법을 \"템플릿 분석 스타일\"이라고 묘사했다.''
Qualitative content analysis is the analysis strategy of choice in qualitative descriptive studies. Qualitative content analysis is a dynamic form of analysis of verbal and visual data that is oriented toward summarizing the informational contents of that data (Altheide, 1987; Morgan, 1993).2 In contrast to quantitative content analysis, in which the researcher systematically applies a pre-existing set of codes to the data, qualitative content analysis is data-derived: that is, codes also are systematically applied, but they are generated from the data themselves in the course of the study. Qualitative research is generally characterized by the simultaneous collection and analysis of data whereby both mutually shape each other. Qualitative content analysis is similarly reflexive and interactive as researchers continuously modify their treatment of data to accommodate new data and new insights about those data. Although researchers might also begin the qualitative content analysis process with preexisting coding systems, these systems are always modified in the course of analysis, or may even be wholly discarded in favor of a new system, to ensure the best fit to the data. Miller and Crabtree (1992, p. 18) described this approach to analysis as the ``template analysis style.''

양적, 질적 내용 분석 모두 응답 범주별 응답과 참여자 수를 세는 것을 수반하지만, 질적 내용 분석에서 개수는 목적 그 자체가 아니라 목적을 위한 수단이다. 연구자들은 서술적 통계로 데이터를 수치적으로 요약함으로써 "준통계분석 스타일"(Miller & Crabtree, 1992, p. 18)을 사용할 수 있다. 그러나 카운트의 최종 결과는 데이터의 준통계적 렌더링이라기보다는 부분적으로 발견되고 카운트를 통해 확인된 데이터의 패턴이나 규칙성에 대한 설명입니다. 정성적 내용 분석은 매니페스트(예: 빈도 및 평균)뿐만 아니라, [데이터의 잠재 내용]도 이해하려는 노력이 있다는 점에서 정량적 내용 분석보다 [해석의 영역]으로 더 멀리 이동한다. 그러나 [정성적 내용 분석]은 자체적인 용어 외에 다른 용어로 데이터를 재표현할 권한이 없다는 점에서 [질적 분석 접근법 중 가장 해석성이 낮다]. 예를 들어, Smeltzer(1994)는 다발성 경화증을 앓고 있는 임산부의 우려를 질문하고 이러한 우려를 분류하기 위해 그녀의 연구 결과를 정리함으로써 설명하였다. Geller와 Hotzman(1995)은 포커스 그룹에서 이 정보를 도출한 후 그들의 인식을 요약함으로써 유전자 검사에 대한 의사의 인식을 기술했다. 이러한 연구에서 우려는 우려로, 인식은 인식으로 남았다. 예를 들어, 그것들은 이론의 차원에서 [어떤 사건의 조건이나 결과]가 되지 않았고, 서사적 렌더링이라는 차원에서 자아를 "전략적"으로 표현하지 않았다(Riessman, 1990). 
Both quantitative and qualitative content analyses entail counting responses and the numbers of participants in each response category, but in qualitative content analysis, counting is a means to an end, not the end itself. Researchers may use a ``quasi-statistical analysis style'' (Miller & Crabtree, 1992, p. 18) by summarizing their data numerically with descriptive statistics. But the end result of counting is not a quasistatistical rendering of the data, but rather a description of the patterns or regularities in the data that have, in part, been discovered and then confirmed by counting. Qualitative content analysis moves farther into the domain of interpretation than quantitative content analysis in that there is an effort to understand not only the manifest (e.g., frequencies and means), but also the latent content of data. Yet qualitative content analysis is the least interpretive of the qualitative analysis approaches in that there is no mandate to re-present the data in any other terms but their own. For example, Smeltzer (1994) described the concerns of pregnant women with multiple sclerosis by asking them about their concerns and then organizing her findings to catalog these concerns. Geller and Hotzman (1995) described physicians' perceptions concerning genetic testing by eliciting this information from them in focus groups and then summarizing their perceptions. In these studies, concerns remained concerns and perceptions remained perceptions. They did not become, for example, conditions for or consequences of some event in a theory, nor a ``strategic'' representation of self in a narrative rendering (Riessman, 1990).

데이터 재표시
Data Re-Presentation

질적 서술적 연구의 예상 결과는 [데이터에 가장 잘 맞는 방식으로 구성된 데이터의 정보 내용을 직접 서술적으로 요약]한 것이다. 예를 들어, Smeltzer(1994)는 임신 기간별로 요약을 정리했다. 즉, 그녀는 다발성 경화증을 가진 여성의 임신 관련 우려를 임신 전, 태반 전, 부분 내 및 출산 후 나타나는 것으로 묘사했다. Geller와 Holtzman(1995)은 정보를 도출한 주요 주제를 반영하는 두 가지 주요 범주로 요약을 구성했다. (a) 공개, 비지향성, 기밀성, 그리고 이러한 인식의 성별과 특수성 차이, 그리고 (b) 장벽과 통합 동기에 대한 인식.신뢰도, 자금 조달, 환자 수요, 그리고 이러한 인식의 성별과 전문성 차이를 포함한 1차 진료 관행에 대한 넷틱 테스트. 데이터를 배열하는 다른 방법으로는 (a) 사건의 실제 또는 역순, (b) 가장 널리 퍼진 주제, (c) 연구자가 사건의 광범위한 맥락을 설명하는 것에서 특정 사례로, 또는 특정 사례에서 광범위한 맥락을 설명하는 것으로 선택하는 점진적 집중, (d) 일, 주, 월 또는 연도-가 있다.실제 인(들)의 생활 내 접근, 그리고 (e) 동일한 사건이 둘 이상의 참가자의 관점에서 설명되는 라쇼몬 효과(Sandelowski, 1998; Wolcott, 1994, p. 17.
The expected outcome of qualitative descriptive studies is a straight descriptive summary of the informational contents of data organized in a way that best fits the data. For example, Smeltzer (1994) arranged her summary by time in pregnancy; that is, she described the pregnancyrelated concerns of women with multiple sclerosis as they appeared pre-conceptionally, antenatally, intrapartally, and post-delivery. Geller and Holtzman (1995) arranged their summary in two major categories re
flecting the major topics about which they elicited information:

  • (a) perceptions of obligations for disclosure, nondirectiveness, confidentiality, and the gender and specialty differences in these perceptions and
  • (b) perceptions of barriers and incentives to incorporate genetic testing into primary care practice, including confidence, financing, patient demand, and, again, the gender and specialty differences in these perceptions.

Other ways to arrange data include:

  • (a) actual or reverse chronological order of events;
  • (b) most prevalent to least prevalent theme;
  • (c) progressive focusing, whereby researchers choose to move either from describing the broad context of an event to particular cases, or from particular cases to the broad context;
  • (d) a day-, week,month-, or year-in-the life approach of actual person(s); and,
  • (e) the Rashomon effect, whereby the same event is described from the perspective of more than one participant (Sandelowski, 1998; Wolcott, 1994, pp. 17±23).

그러한 요약은 (표면과는 달리) 데이터의 더 침투적인 재표현에 쉽게 도움이 될 수 있지만, 정성적 서술적 연구가 방법론적으로 "좋다"거나 실질적으로 가치가 있다고 간주되기 위해서는 필요하지 않다. 예를 들어, 라쇼몬 효과 접근법은 동일한 사건에 대한 다른 참가자의 버전에 대한 추가 연구자 해석에 적합하지만, 정성적 기술 연구를 수행하는 연구자는 이러한 버전을 포괄적이고 정확하게 설명해야 한다. 따라서 이러한 요약은 주로 최종 제품으로서, 둘째, 추가 연구를 위한 진입점으로서 가치가 있다.
Although such summaries might easily lend themselves to more penetrating (as opposed to surface) re-presentations of data, these are not required for a qualitative descriptive study to be considered methodologically ``good'' or practically valuable. For example, the Rashomon effect approach lends itself to further researcher interpretations of different participants' versions of the same event, but the mandate for the researcher conducting a qualitative descriptive study is comprehensively and accurately to detail these versions. Accordingly, such summaries are valuable primarily as end-products and, secondarily, as entry points for further study.

[수집된 데이터를 가장 잘 포함하고, 목적한 청중과 가장 관련성이 높은 방식으로 구성된 사건에 대한 설명적 요약] 이외의 어떤 것도 생산해야 할 의무는 없다. 그러나 이러한 요약은 그 자체로 미래의 기초 이론이나 현상학 연구를 위한 작업 개념, 가설 및 주제적 순간을 산출하거나, 그 자체로 초기 버전을 포함할 수 있다.
There is no mandate to produce anything other than a descriptive summary of an event, organized in a way that best contains the data collected and that will be most relevant to the audience for whom it was written. But such summaries may themselves yield the working concepts, hypotheses, and thematic moments for future grounded theory or phenomenologic study, or themselves contain early versions of them.

결론
CONCLUSION

결론적으로 [질적 서술적 연구]는 [현상에 대한 직선적 묘사]를 원할 때 선택하는 방법이다. 이러한 연구는 특히 누가, 무엇을, 어디서 일어났는지 알고 싶어하는 연구자들에게 유용하다. 모든 질적 연구 접근법의 기초가 되지만, 질적 서술적 연구는 그 자체로 가치 있는 방법론적 접근을 구성한다. 연구자들은 그들의 방법을 [정성적 기술qualitative description]이라고 명명하는 것에 부끄러워하지 않아도 된다. 만약 그들의 연구가 다른 방법의 과장된 톤으로 디자인되었다면, 그들은 이러한 다른 방법들을 부적절하게 명명하거나 구현하는 대신, 이러한 과장된 톤들이 무엇이었는지를 설명할 수 있다. 그래서, 질적인 묘사는 어떻게 되었나요? 그 방법은 살아있지만, 질적 연구의 가치 있고 독특한 구성 요소로 재발견되고 건강 과학 연구를 위해 복구되면 된다.
In conclusion, the qualitative descriptive study is the method of choice when straight descriptions of phenomena are desired. Such study is especially useful for researchers wanting to know the
who, what, and where of events. Although foundational to all qualitative research approaches, qualitative descriptive studies comprise a valuable methodologic approach in and of themselves. Researchers can unashamedly name their method as qualitative description. If their studies were designed with overtones from other methods, they can describe what these overtones were, instead of inappropriately naming or implementing these other methods. So, whatever happened to qualitative description? The method is alive and well, but needs only to be re-discovered as a valuable and distinctive component of qualitative research and recovered for health sciences research.

 


 

Res Nurs Health. 2000 Aug;23(4):334-40. doi: 10.1002/1098-240x(200008)23:4<334::aid-nur9>3.0.co;2-g.

Whatever happened to qualitative description?

Affiliations collapse

Affiliation

1University of North Carolina at Chapel Hill, #7640, Carrington Hall, School of Nursing, Chapel Hill, NC 27599, USA.

PMID: 10940958

DOI: 10.1002/1098-240x(200008)23:4<334::aid-nur9>3.0.co;2-g

Abstract

The general view of descriptive research as a lower level form of inquiry has influenced some researchers conducting qualitative research to claim methods they are really not using and not to claim the method they are using: namely, qualitative description. Qualitative descriptive studies have as their goal a comprehensive summary of events in the everyday terms of those events. Researchers conducting qualitative descriptive studies stay close to their data and to the surface of words and events. Qualitative descriptive designs typically are an eclectic but reasonable combination of sampling, and data collection, analysis, and re-presentation techniques. Qualitative descriptive study is the method of choice when straight descriptions of phenomena are desired.

만약 우리가 하던대로 한다면, 얻던대로 얻을 것이다: 아카데믹 메디신 다시 생각하기 (Med Teach, 2018)
If we keep doing what we’re doing we’ll keep getting what we’re getting: A need to rethink “academic” medicine
Michael Wilkesa, Christine Casselb and Marc Klaub

 

 

캔자스에서는 활강 스키를 가르치지 않을 것이다.
You wouldn’t teach downhill skiing in Kansas

(브루스 블룸버그 2015, 퍼스널 커뮤니케이션)
(Bruce Blumberg 2015, Personal Communication)

의술
The practice of medicine

미국의 의료행위는 큰 스트레스를 받고 있다: 비용 상승과 변제 감소, 생산성, 관리 품질, 남용, 이해 상충, 다양한 전문 분야와 의료 전문가 간의 영역 다툼, 방해적이고 도움이 되지 않는 전자 기록 시스템, 그리고 미래의 의사들을 가르치기 위해 의사들을 연습함으로써 시간과 헌신을 줄이는 것의 조합. 의학교육은 이러한 스트레스를 공유하는 것에 더해서, 다음과 같은 문제들에 대한 스트레스, 논쟁, 토론을 가지고 있다: 온라인 학습의 역할 확대, 콘텐츠 대 개별화된 학습 스타일, 전통적인 "2 + 2" 커리큘럼을 변경하라는 압력(기초과학 2년 및 임상 교육 2년), USMLE 시험에 배치되는 필요성, 역할 및 강조, 
전문직 간 교육의 역할, 임상 환경에서 연속성의 중요성과 교수진의 가용성과 기술, 그리고 보건 시스템의 새로운 "기초 과학"의 진입.

The practice of medicine in US is under great stress: a combination of rising costs and declining reimbursements, questions about productivity, quality of care, overuse, conflicts of interest, turf battles between various specialties and health care professions, intrusive and unhelpful electronic record systems, and decreasing time and commitment by practicing doctors to teach tomorrow’s doctors. Medical education shares these and has its own additional points of stress, controversy, and debate around such issues as the expanding role of online learning, focus on content versus individualized styles of learning, pressures to change the traditional “2 + 2” curriculum (two years of basic science and two years of clinical training), the need, role and emphasis placed on USMLE exams, the role of inter-professional education, the importance of continuity and the availability and skills of faculty in clinical settings, and the entry of a new “basic science” of health systems.

교육 문헌에는 교실-기반 기초 과학 교육(Hirsch and Ogur 2007)의 사일로에서 벗어날 필요성 및 임상 과학 변화와 더 많은 통합에 대한 불만이 가득하지만, 여전히 변화는 매우 느리다. [생명윤리, 웰니스/회복력 훈련, 사회적 결정 요인 및 건강 시스템 과학을 추가하라는 새로운 압력]은 현재 커리큘럼이 학생들에게 필요한 자료를 제공하고 그들이 배운 것을 유용하게 유지할 수 있는 방법에 대한 정밀한 조사scrutiny를 증가시킬 뿐이다. 의료 교육에서 임상 업무와 연구가 많은 학제 간 융합, 협업 및 학제 간 학습을 말하지만, 의과대학은 분열과 분리의 권력 구조를 유지하고 보상하는 "교실departments"라는 구시대적인 개념을 기반으로 사일로 속에 조직되어 있다. 학술의료센터AMC는, 다수의 그리고 종종 상충되는 인센티브의 세계에 살고 있기 때문에, 많은 문헌에서 요구되는 급진적인 변화에 관여하지engaged in 않았다. 아이러니하지만, 학술 의학에서 교육이 주된 사명이 되는 곳은 거의 없다.
While the education literature is rife with complaints about the need to get away from the silos of departmentally based basic science teaching (Hirsch and Ogur 2007) and the need to promote more integration with clinical science (Ioannidis et al. 2007; Frenk et al. 2010) change has been very slow. New pressures to add bioethics, wellness/resilience training, social determinants, and health systems science only increase scrutiny of whether the current curriculum presents material necessary to the students, and in a way that they can usefully retain what they learn. At a time when clinical work and research is heavily interdisciplinary in medical education we speak of integration, collaboration, and interdisciplinary learning but our schools are organized in silos based on outdated concepts of “departments” maintaining and rewarding power structures that divide and separate. Academic medical centers have not engaged in the radical change called for in so much of the literature (Frenk et al. 2010) because they are living in a world of multiple and often conflicting incentives. It is ironic, but almost nowhere in academic medicine is education the primary mission.

플렉스너의 도발적인 보고(1910년)에 따라 의학계는 [소규모의 독립적 견습생 기반 의과대학]에서 교수, 학습, 주택, 학사 학위 수여와 관련된 모든 물류를 제공할 수 있는 [대학에서 제공되는 과학 커리큘럼의 유럽 모델]로 옮겨갔다. 플렉스너는 "단순한" 실무의사가 아닌 [과학자인 교수진]을 명시적으로 옹호했다. 대학은 병원이나 의료 전달 시스템이 아니며, 공존할 때 자원, 권한, 임무 우선순위를 놓고 두 사람 사이에 경쟁이 벌어지는 경우가 많다. 실용적인 이유로, 우리 학술 병원은 급성 고강도의 치료를 제공하는 데 초점을 맞추고 있다. 이것이 마케팅, 자선사업, 연구뿐만 아니라 보상에 좋기 때문이다. 이러한 학술 병원에서 학생들은 보통 급성 문제에 초점을 맞춘 단일 학과 기반 팀(예: 내과 또는 외과)에 시간을 보내는 반면, 학생들은 퇴원 후 관리, 만성 질환, 예방 또는 환자 건강의 사회적 맥락에 대한 사전 예방적 관리에 거의 주의를 기울이지 않는다.
Following Flexner’s (1910) provocative report the medical community moved away from small, free-standing apprenticeship based medical schools toward a European model of scientific curriculum offered at a university which could provide all the logistics related to research, as well as teaching, learning, housing, and the awarding of academic degrees. Flexner explicitly advocated for faculty who were scientists, not “merely” practitioners. Universities are not hospitals or health care delivery systems, and when they co-exist there is often competition between the two over resources, authority, and mission priorities. For practical reasons, our academic hospitals are focused on providing acute high intensity care – after all that is the sweet spot for reimbursement, as well as marketing, philanthropy, and research. In these academic hospitals, students usually spend time on single discipline-based teams (e.g. internal medicine or surgery), focused on acute problems with little or no attention paid to management after discharge, proactive managing chronic disease, prevention, or the social context of patient wellness.

Academics에서는 발견discovery에 높은 가치를 둔다. 그리고 발견이란, "연구"의 성공이며, 이것은 환자나 인구 복지에 미치는 영향보다는 보조금, 출판물 및 인용 영향 요인에 의해 정의된다. Relman이 "의료-산업 복합체"(Relman 1980)라고 부른 것 내에서는

  • 의료-산업 복합체에서 큰 가치가 부여되는 것은 다음과 같다: 기초과학 및 임상연구 활성화, 산업자금 지원, 이해충돌과 관계없이 특허와 파트너십을 통해 수익으로 이어지는 프로젝트.
  • 반면 학생들을 [데이터 과학 및 성과 연구에 노출]시키고, [실무-기반 개선으로 이어질 수 있는 의료 시스템 과학]에 할애하는 시간과 리소스는 줄어든다. 이렇게 줄어드는 것에는 치료의 질, 의미 있는 환자 지향 결과, 기술 평가, 비용 효과, 리더십 또는 증거 기반 실무 지침 개발 등이 있다. 

많은 학문적 환경은 후자의 활동이 합법적인 연구라고 거의 생각하지 않는다. [보건서비스 연구센터]가 있는 기관에서는 주로 의료 교육과정의 핵심이 아닌 독립비용센터로 연구가 운영되고 있다.
In academics a high value is place on discovery, with “research” success defined by grants, publications, and citation impact factors rather than on the impact on patient or population well-being. Within what Relman called “the medical-industrial complex” (Relman 1980)

  • great value is placed on promoting basic science and clinical research, on industry funding, and on projects that lead to profit through patents and partnerships regardless of conflicts of interest (Angell 2000; Bekelman et al. 2003).
  • Less time and resources are devoted to health systems science that would expose students to data science and outcomes research and lead to practice based improvements with a focus on quality of care, meaningful patient oriented outcomes, technology assessment, cost effectiveness, leadership, or the development of evidence-based practice guidelines.

Many academic environments barely consider such activities legitimate research. In institutions that have health services research centers, the research is largely run as an independent cost center that are not core to the medical curriculum.

미국 학술 의학에서 우리는 병원 환경에서 여러 세대의 의대 학생들을 훈련시켜 왔으며, 급성 질병에 초점을 맞추고, 종종 한 전문 분야가 다른 전문 분야와 경쟁하는 [학문분야-기반 사일로]에서 학습했습니다. 이곳은 대부분의 의사들이 결국 의료행위를 하는 곳이 아니다. 아레츠(2011)에 따르면, 우리에게 필요한 것은 적절한 장소에서, 적절한 제공자에 의해, 최고의 품질로 올바른 치료를 이끌기 위한 연구를 수행할 수 있는 새로운 세대의 의사들이다. 플렉스너는 의과대학이 인구나 그들이 앉아 있는 공동체의 건강에 대해 책임을 지라고 요구하지 않았지만, 규제 기준, 여론, 도덕적 책임은 적어도 이것에 대해 겸손한 주의를 기울이는 쪽으로 몰렸다. 실제로 미국에서 비과세 지위를 유지하기 위해서는 기관들이 상당한 '지역사회 혜택'을 제공해야 한다. 그러나 한두 개의 강의나 선택과목은 어떤 종류의 지역 사회 사명을 인정하겠지만, 이 임무 역시 핵심 커리큘럼에서 빠져 있다. 일부 학자들은 공동체의 건강에 기여할 뿐만 아니라 훈련생들이 공동체의 건강을 증진하는 데 필요한 분야에 진출하도록 자극하기 위해 [사회와의 묵시적인 '약속']이 있다고 믿는다. US News and World Reports와 같은 의대 순위는 [MCAT 및 Research 자금 지원]을 포함하지만, [지역사회 보건]이나 [학생 웰빙 또는 학생 성공]에 대한 척도는 없습니다(Report 2017).
In US academic medicine we have been training generations of medical students in a hospital environment, focused on acute illness, learning in disciplined based silo’s that often pit one specialty against another. This is not where most physicians will eventually practice. According to Aretz (2011), what we need are a new generation of doctors capable of doing research to drive the right treatments, at the right place, by the right providers, at the best quality. Flexner did not call on medical schools to be responsible for the health of populations or the communities in which they sit, and yet regulatory standards, public opinion, and moral responsibility have driven toward at least modest attention to this. Indeed, to maintain tax exempt status in the US, institutions are required to provide significant “community benefit”. But this mission, too, is missing from the core curriculum, although one or two lectures or electives will acknowledge some kind of community mission. Some scholars believe there is an implied “covenant” with society not only to contribute to the health of the community but to stimulate trainees to enter fields needed to promote health in communities (Coulter and Wilkes 1995). Medical school rankings such as the US News and World Reports count MCAT and Research funding but there is no measures of community health or for that matter student wellness or student success (Report 2017).

의학교육
Medical education

몇 세대 동안, 학부의학 교육, 졸업후의학 교육 및 지속적인 의학 교육 등 모든 수준의 의학 교육의 개혁이 필요하다고 경고해 왔다. 오늘날에는 목소리가 더 커지고(Cooke and Irby 2010), 필요성이 더 커지며(Macy 2008), 이전에는 볼 수 없었던 긴급성이 있습니다. 인구 통계는 극적으로 변화하고 있으며, 나이가 들수록 더 많은 수의 사람들이 더 활동적이고, 질병 부담이 증가하며, 더 많은 수의 사람들이 더 복잡한 치료를 필요로 한다. 65세 이상의 사람들의 수는 2030년까지 두 배가 될 것으로 예상되며 팔색조인은 가장 빠르게 성장하는 집단이다. 이것은 사회의 다른 부문들에 걸친 큰 건강 격차와 심지어 기본적인 건강 관리에 대한 접근성의 큰 차이로 인해 더욱 복잡해진다. 우리의 의료 시스템의 변화는 미래의 의사들이 다른 환경에서 일할 준비가 되어 있어야 한다는 것을 요구한다. 기술에 의한 우리 사회의 변혁은 2030년 의료의 실천이 오늘날과 전혀 다를 것이라는 것을 보장한다. 이러한 새로운 기술을 효율적이고 안전하게 사용해야 하는 필요성과 함께 의료 기술이 폭발적으로 성장하고 있습니다. 우리의 의료 시스템과 그 성장의 비용은 지속 가능하지 않다. 다음 세대의 의사들은 적절하고 필요한 치료를 제공함으로써 이러한 비용을 낮추고, 우리가 상상할 수 없는 도구와 소비자 관계를 통해 그렇게 해야 하는 도전을 받을 것이다. 우리는 미래의 의사들이 변화를 예측하고 수용하고 관리할 수 있도록 훈련시켜야 한다. 이를 위해서는 다른 환경에서, 종종 다른 교수진에 의해 다른 유형의 교육 모델, 다른 유형의 학습을 가져야 한다.
For generations (Frenk et al. 2010) sirens have warned of the need for reform of medical education at all levels – under graduate medical education, graduate medical education, and continuing medical education (Awasthi et al. 2005). Today the voices are louder (Cooke and Irby 2010), the need is greater (Macy 2008), and there is an urgency not seen before. Demographics are changing dramatically, with a larger number of people more active as they age, a greater number with an increased disease burden and more needing complex care. The numbers of people over 65 years of age are expected to double by 2030 and octogenarians are the fastest growing subgroup (Dall et al. 2013). This is complicated further by large health disparities across different sectors of society and large differences in access to even basic health care. The transformation of our health care system requires that tomorrow’s doctors must be prepared to work in different environments. The transformation of our society by technology guarantees that the practice of medicine in 2030 will be nothing like what it is today. There is the explosive growth in healthcare technology, with the need to use these new technologies efficiently and safely. The cost of our health care system and its growth is unsustainable. The next generation of physicians will be challenged to lower these cost by providing appropriate and necessary care, and to do so with tools and consumer relationships that we cannot imagine. We must train tomorrow’s doctors to anticipate, embrace, and manage change. To do this they must have a different type of educational model, a different type of learning, in different environments, often by different faculty.

교육과정에 새롭고 혁신적인 콘텐츠를 추가해야 한다는 요구 가운데 '인문주의, 공감, 대인관계 및 의사소통 능력'을 가르쳐야 한다는 요구도 있다. 이것 또한 대부분의 경우에 [높은 보상이나 보상을 받는 학술 영역이 아니기 때문에] 고통받고 있으며, 가르치는 임상의들은 환자 치료의 순간에 가장 원하는 속성을 발휘하기 어렵게 하는 바쁜 일정과 저글링 압력으로 우울증과 탈진증을 너무 자주 겪고 있다. 학생과 거주자 사이에서 우울증과 스트레스에 대한 관심이 높아짐에 따라, 이 과제를 해결하는 것은 [임상의가 실제로 진료을 즐기고 진정한 공감를 보여줄 수 있는 훈련 환경]을 찾는 것이 아니라, 이미 붐비는 커리큘럼(즉, 탄력성 훈련)에 추가하기 위한 추가 사항으로 간주되는 경우가 너무 많다. [휴머니즘에 대한 강의]는 아무리 잘해도 진짜 커리큘럼이 아니다; 학생들이 매일 진료실과 병동에서 경험하는 것은 진짜 커리큘럼이다.
Amidst the calls for adding new and innovative content to the curriculum is also a call to teach “humanism, empathy, and interpersonal and communication skills”. This too suffers as it is not a highly reimbursed or rewarded area of scholarship in most places, and clinicians who teach are too often themselves suffering from depression and burnout (Bunton et al. 2012), with rushed schedules and juggling pressures that make it difficult to exhibit the attributes most desired in the moment of patient care. As growing attention is paid now to depression and stress among students and residents, addressing this challenge is too often seen as one more additional thing to add to an already crowded curriculum (i.e. resilience training) rather than finding training environments where clinicians actually enjoy their practice and can demonstrate genuine empathy. A lecture on humanism – however well done – is not the real curriculum; what students experience every day in the clinic and on the wards is the real curriculum.

사회와 개인(졸업 당시 미국 의대 학생 평균 부채는 19만2000달러(AAMC 2017년)에 달하는 막대한 금액에도 불구하고, 우리의 노력은 여전히 부족하다. 의학 교육은 또한 그것이 어떻게 전달되는지에 대한 모델을 재고할 필요가 있다. 우리는 의학 학위 비용을 극적으로 줄이기 위해 기술과 혁신을 사용할 수 있어야 하며, 훨씬 더 다양한 그룹의 학생들이 이 교육을 더 쉽게 이용할 수 있도록 해야 한다. 미국은 우리가 지구상에서 가장 비싼 의료 시스템을 가지고 있다고 자랑할 수 있지만, 우리가 최고라고 주장할 수는 없다. 24개 이상의 국가의 의미 있는 건강 지표는 종종 실질적으로 우리의 건강 지표를 초과한다. 우리의 교육은 [서비스 남용의 원인이 되는 정확한 행동을 보상하는 환경]에서 교육생들에게 가르치고 있으며, 약간의 비용만으로도 가치가 입증된 예방과 같은 서비스를 과소평가하고 보상 시스템이 혜택을 거의 제공하지 않는 환경에 있다.
Despite the huge amount of money that society and individuals (average US medical student debt at graduation is $192,000 (AAMC 2017) expend on training doctors, our efforts are subpar. Medical education needs to also rethink the model of how it is delivered. We should be able to use technology and innovation to dramatically reduce the cost of the medical degree, making this education more accessible to a much more diverse group of students. The US can boast that we have the most expensive health care system on the planet but we cannot claim we have the best (Squires and Anderson 2015). Meaningful health indicators from more than two dozen nations exceed ours – often substantially (Squires and Anderson 2015). Our education teaches trainees in an environment where reimbursement systems reward the exact behaviors that contribute to overuse of services that offer little benefit and undervalues services such as prevention with proven value that may cost a fraction the price.

교육의 우선 순위
The priority of education

의학 교육에서 작은 변화가 기성 의과대학에서 자주 일어나고 있다. 확실히 소규모 그룹 교육, 새로운 종단적 입상실습, 고통스러울 정도로 느린 교육 기술 적응, 새로운 시뮬레이션 사용, 지원자를 보다 총체적으로 보려고 하는 의대 입학에 대한 새로운 접근법이 증가하고 있다. 미국에서는 지난 15년 정도 동안 기존 대학의 위신을 높이기 위해 12개 이상의 의과대학이 종종 신설되었습니다. 아마도 인증을 거부당하거나 동료들에 의해 심각하게 받아들여지지 않을까 하는 두려움 때문에, 이러한 새로운 학교들 중 진정으로 혁신적이고 전통적인 틀 밖에 서 있는 학교는 거의 없다. 오늘날 의과대학 지원자는 다양한 평판을 가진 학교에서 많은 선택권을 가지고 있지만, 교육의 우수성에 대한 척도에 대한 결정을 내릴 기회는 거의 없다. AMEE Aspire 상을 제외하고, 학생이 학교의 교육 혁신 수준, 학생 단체의 복지 또는 졸업생들의 질을 평가하는 데 사용할 수 있는 가이드는 거의 없습니다. 의과대학의 교육 프로그램에 대해 존재하는 정보는 종종 독점적이고 공개적이지 않다. 의과대학은 또한 학생들을 대상으로 한 마케팅에서 병원에서 제공되는 치료의 질에 대한 정보를 홍보하는 경우가 거의 없는데, 마치 그것이 커리큘럼과 관련이 있는 것이 아니라 잠재적 환자들에게만 해당되는 것처럼 말이다.
In medical education small changes are occurring often at establishment medical schools. Certainly there is a growth in small group teaching, new longitudinal clinical clerkships, the painfully slow adaption of educational technology, new uses of simulation, and new approaches to medical school admission that seek to look more holistically at the applicant. In the US, over the past 15 or so years, more than a dozen new medical schools have been created often to augment the prestige of an existing university. Perhaps out of fear of being denied accreditation or not being taken seriously by peers, few of these new schools are truly innovative and stand outside the traditional mold. An applicant to medical school today has many choices in schools with varying reputations, but little opportunity to base their decision on measures of educational excellence. With the exception of the AMEE Aspire award, there are few guides that a student can use to assess a school’s level of educational innovation, the wellbeing of the student body, or the quality of its graduates (https://amee.org/awards-prizes/aspire-award). What information does exist about medical school’s educational programs is often proprietary and not public. Medical schools also rarely promote information about the quality of care delivered at their hospitals in their marketing to students, as if that is not relevant to the curriculum but rather only to potential patients.

지난 한 세기 동안 많은 학교들이 학문분야-기반 커리큘럼에서 장기계통-기반 커리큘럼으로, 문제 또는 사례 기반 커리큘럼으로 발전했다. 그러나 의대는 성과와 시스템 기반 교육을 향한 여정을 이제 막 시작하고 있다. 여전히, 대부분의 면에서 2018년 훈련은 1988년과 비슷해 보인다. 학생들은 여전히 세 가지 R(읽기, 기억, 역류)에 집중해야 한다. 의사는 여전히 배의 선장이며, 임상 치료는 견습에 기반을 두고 있으며, 의사는 결과나 인구 건강보다는 그들이 하는 일에 따라 많은 보상을 받는다. 임상 실습은 "빅6" 분야(소아내과, 내과, 외과, 산부인과/산부인과, 정신의학과, 가정의학과)에 의해 지배되며, 따라서 우리는 학생들을 협업 의료 실습의 더 넓은 잠재적 영역과 새로운 분야에 노출시키지 못한다. 임상에서 학습에 대한 지배적인 접근법은 [견습 모델]이다. 우리의 임상 교수진은 "교사"로 불리지만, [교육 원리, 예상 역량, 평가 및 피드백, 또는 전체 의과대학 커리큘럼의 내용 또는 기본 철학]을 알고 있는 훈련된 교육자는 거의 없습니다.
Over the past century a number of schools have evolved from a science discipline-based curriculum, to organ-based curriculum to problem- or case-based curriculum. However, medical school are just beginning their journey toward outcomes and systems based education (Frenk et al. 2010). Still, in most ways training in 2018 looks much as it did in 1988. Students are still expected to focus on the three Rs (reading, remembering, and regurgitating). The physician is still the captain of the ship, clinical care is apprenticeship based, and physicians are heavily reimbursed based on what they do rather than on outcomes or the health a population. The clinical years are dominated by the “big six” disciplines (pediatrics, internal medicine, surgery, obstetrics/gynecology, psychiatry, and family medicine) and thus we fail to expose students to the broader potential areas of collaborative medical practice and to emerging disciplines. In the clinical years the dominate approach to learning is the apprenticeship model. Our clinical faculty are deputized as “teachers” but few are trained educators such that they are aware of educational principles, expected competencies, the skills of evaluation, and feedback, or the content or underlying philosophy of the overall medical school curriculum.

학술 의료 센터
The academic medical center

"교육 병원"의 개념은 적어도 1000년 전으로 거슬러 올라간다. 오늘날 우리는 "학술 의학"이 무엇을 의미하는지, 그리고 학술의료센터(AMC)가 무엇인지 물어보는 것이 타당하다. [학술 의학의 사회적 정의]공중의 건강을 증진시키는 것을 목표로 생각하고, 계획하고, 연구하고, 연구하고, 평가하고, 발견하고, 혁신하고, 가르치고, 배우는 의료 시스템의 능력을 포함할 것이다. [AMC에 의해 정의된 사명]과 [환자와 지역사회가 기대하는 사명] 사이에는 종종 불일치가 있다. 국제공동위원회(Joint Commission International)는 학술 의료센터를 의과대학과 행정적으로 통합되고 의과대학생 교육의 주요 현장이며 임상연구에 종사하고 있기 때문에 보다 실용적이다(JCI 2017). Academic centers 내에서는 학술원이 nonacademic centers보다 더 높은 수준의 의료 서비스를 제공한다는 암묵적인 가정이 있다. 그러나 학계에서는 전문화된 3차 진료, 고비용 진료 및 비병원 진료와 통합되지 않는 진료에 초점을 맞추고 있다. 학술 의학은 급성 3차 및 4차 치료에 중점을 두고 있지만, 재활, 만성 치료, 1차 치료, 건강, 예방 및 유지와 같은 분야에서 낮은 우선순위가 부여된다.
The concept of the “teaching hospital” dates back at least 1000 years (Aretz 2011). It is fair to ask today what do we mean by “academic medicine” and what is an academic medical center (AMC)? A social definition of academic medicine would include the ability of a health care system to think, plan, study, research, evaluate, discover, innovate, teach, and learn all with the goal of improving the health of the public. There is often a mismatch between the mission defined by the AMC and those expected by patients and communities. The Joint Commission International is more pragmatic as it defines an academic medical center as one that is administratively integrated with a medical school, is the principal site for the education of medical students, and is engaged in clinical research (JCI 2017). Within academic centers there is an unspoken assumption that academic centers also provide higher quality care than nonacademic centers. But academia also connotes a focus on specialized tertiary care, high cost care, and care that is often not integrated with non-hospital care (Cassel and Wilkes 2017). While academic medicine focuses on acute tertiary and quaternary care, there are areas such as rehabilitation, chronic care, primary care, wellness, prevention, and maintenance that are given low priority.

아레츠(개인 커뮤니케이션)는 [두 개의 연속체(예측가능성과 복잡성)]를 기반으로 의료의 4개 사분면(그림 1)을 설명한다. 통합 의료 시스템은 반드시 동일한 지리적 위치에 있는 것은 아니지만 이러한 각 영역에서 치료를 제공할 수 있다.
Aretz (personal communication) describes four quadrants (Figure 1) of health care based along two continua (predictability and complexity). An integrated health care system is capable of providing care in each of these areas although not necessarily at the same geographic location.

이러한 통합 시스템에서의 훈련은 많은 이점을 제공한다. 정보 기술 자원 저장소(Stuart and Triola 2015)가 점점 커지고 있기 때문에 교육적 관점에서 볼 때 더 이상 수십 개의 학과와 대규모 기초 과학 교수진이 있는 의대를 둘 필요가 없습니다. 사회가 필요로 하는 맥락에서 대학, 병원, 그리고 미래의 건강 제공자들의 훈련을 조사하는 새로운 표준이 필요하다. 정규 교육과정은 학생들이 무엇을 가르치고 전문적인 실습이 어떻게 모델링되고 강화되는지에 일관성이 있도록 비공식적인 숨겨진 교육과정과 동기화될 필요가 있다. 우리의 현재 시스템에서, 학생들은 신중하고 종종 (의식적인 고려 없이) 단순히 평가 연습에서 덜 가치가 있는 자료를 무시하면서 전략적으로 학습한다. 이와 같이 [윤리, 인구 의학, 의사소통 기술, 품질 향상, 전문직 간 협업, 임상 추론과 같은 내용]은 평가 점수에 작은 비율만 기여하므로 종종 학생들의 평가를 준비하는 집중 학습 자료로 무시된다.
Training in such an integrated system provides numerous advantages. Given the growing repository of information technology resources (Stuart and Triola 2015), from an educational perspective it is no longer necessary to have medical schools with dozens of departments and a large basic science faculty. There is a need for a new normal that examines the role of the university, the hospital, and the training of tomorrow’s health providers in the context of society’s needs. The formal curriculum needs to synchronize with the informal hidden curriculum (Hafferty 1998) so that there is consistency in what the students are taught and how professional practice is modeled and reinforced. In our current system, students are prudent and learn strategically, often (without conscious consideration) neglecting material that is simply worth less on assessment exercises. As such, content such as ethics, population medicine, communication skills, quality improvement, inter-professional collaboration, and clinical reasoning contribute only a small percentage to assessment scores and are thus often ignored as student focus learning material that will prepare them for their assessment.

"학술적"의 재정의
Redefining “academic”

미래의 의사를 훈련시키는 것은 올바른 내용, 올바른 교사, 올바른 환경을 올바른 학생들에게 제공해야 합니다. 하버드 경영학 교수인 Christensen은 ["파괴"]를 [시장을 크게 변화시키는, 덜 비싸고 더 효율적인 프로세스를 허용하는 새로운 접근법]으로 정의한다. 철강 제조, 휴대폰 또는 자동차 조립의 경우, 파괴의 이점이 분명했다. 그러나 의료 교육의 경우, 우리의 시스템(공장)은 노동력에 필요한 제품(공급자)을 생산하지 못하고 있습니다. 우리가 모래 속에 머리를 파묻고 있다면, 종국에는 [다른 사람들이 우리에게 변화를 강요]하거나, [다른 전문직들이 개입하여 새로운 역할을 맡길 것]이다. 또는, 우리는 (자발적으로) 새로운 교육 모델을 살펴볼 수 있습니다. 우리가 캔자스에서 활강 스키어들을 훈련시키는 것을 선택하지 않을 것처럼, 대학에서 의사들을 훈련시키는 것이 타당한지 생각해 볼 때이다. 환자, 다양한 지역사회, 의료 제공자, 지불자 및 의대 지원자를 포함한 이해관계자가 미래의 의사를 정의하는 고품질 전달 시스템에서 교육과 훈련을 연결하는 새로운 방법이 있는가?
Training tomorrow’s doctor’s needs to provide the right content, the right teachers, and the right environment, to the right students. Christensen, a Harvard Business Professor, defines “disruption” as a new approach that allows for less expensive and more efficient processes that significantly alter the market (Christensen 1997). In the case of steel manufacturing, cell phones, or automobile assembly the benefits of disruption have been clear. But in the case of medical education our system (factories) is not producing the products (providers) we need in the workforce. We can keep our heads in the sand and eventually either others will force change upon us or other professions will step in and assume new roles. Or, we can look at new models of education. Just as we would not opt to train downhill skiers in Kansas (sorry Kansas), it is time to think about whether training doctors in universities makes sense. Are there new ways of connecting education and training with the delivery of care in high quality delivery systems that engage stakeholders including patients, diverse communities, health care providers, payers, and medical school applicants in defining tomorrow’s doctors?

두 시스템(교육 및 의료)이 각각 최고의 의사 교육에 대한 강력한 기득권을 가지고 상호 작용하는 의료 제공 환경입니다. 고용주만이 잘 훈련된 인력 개발에 강한 관심을 가지고 있는 것은 아니다(그림 2).
It is in the health care delivery environment where the two systems (education and health care) interface each with a strong vested interest in the training the very best physicians. Employers are not the only ones with a strong interest in the development of a well trained workforce (Figure 2).

 

의료 시스템에 내장된 의과대학
A medical school embedded in a health care system

[카이저 퍼머넌트(KP)]가 국내 최고 기능 통합 건강 전달 시스템에 내장된 학습 실험실로 의대를 만들어 의료 분야에서 국가적 과제를 해결하고 의료 교육을 구체화하고자 하는 것도 이러한 맥락에서다. 학교의 궁극적인 목표는 KP를 위한 노동력을 훈련시키는 것이 아니라, KP 의료 제공의 성공을 활용하여 다음의 맥락에서 건강과 예방에 대한 헌신으로 새로운 훈련 모델을 개발하는 것이다.

  • 의료 격차 완화,
  • 증거 기반 관행의 개발 및 사용을 통한 의료 품질 개선
  • 다양성과 포용성의 증가,
  • 웰니스와 탄력성을 중시하고 강화하는 시스템 전반의 문화

It is in this context that Kaiser Permanente (KP) seeks to address national challenges in health care and shape medical education by creating a medical school as a learning laboratory embedded in one the nation’s highest functioning integrated health delivery system. The ultimate goal of the school is not to train a workforce for KP, but to leverage the success of KP health care delivery to develop new models of training with a commitment to health and prevention in the context of

  • reducing health care disparities,
  • improving health care quality through the development and use of evidence-based practice,
  • increasing diversity and inclusion, and
  • promoting a system wide culture that values and reinforces wellness and resilience.


KP는 건강플랜, 병원 및 기타 요양시설 시스템, 다중 전문 의료단체가 결합된 [미국에서 가장 큰 민간 통합 전달 시스템]이다. 급여 및 의료 제공 인센티브를 급여를 받는 의사와 연계하고, 시스템 기반 관행 및 예방에 중점과 연계함으로써, KP는 거의 모든 공개 신고 및 인증 시스템에서 높은 성과 점수를 획득할 수 있었으며, 지불 개혁과 품질 공개 보고를 통해 전달 시스템 전환의 모델이 되었습니다.
KP is the largest private integrated delivery system in the USA combining a health plan, a system of hospitals and other care facilities, and multi-specialty medical groups. With payment and health care delivery incentives aligned, with salaried physicians, and with a strong emphasis on system based practices and prevention KP has been able to achieve high performance scores on almost every public reporting and accreditation system (Leapfrog 2016; Quality 2016) and has become a model for delivery system transformation through payment reform and public reporting of quality.

KP는 의학 교육에서 새로운 것이 아니다; 그들은 현재 각각 30개 이상의 전문 분야에서 50개의 부속 대학 프로그램에서 900명 이상의 학생들을 훈련시키고 있다. 그러나, 이 교육생들은 다른 학교에서 온 방문객들이며, 제한된 기간 동안 KP에 있고 각각의 가정 기관에 책임을 지고 있기 때문에 혁신적인 교육을 어렵게 만들고 있다. 디스커버리호는 또한 연방 연구 자금 1억 달러, 1300개의 클리닉 추적, 3900만 달러의 KP 자금 지원 건강 결과 연구 및 140명의 상근 연구팀으로 구성된 KP 임무에 매우 중요하다. 임상 분야에서 KP 시스템은 단일 자금 출처, 글로벌 예산 및 서비스를 받는 인구의 건강으로 측정되는 궁극적인 책임을 가진 미니 국가 보건 시스템처럼 기능한다. KP는 보다 적극적인 치료로부터 이익을 얻기보다는 오히려 그 반대로 이익을 얻는다. 즉, 환자가 건강해질수록 환자와 시스템 모두에 더 많은 이점이 있다. 전문가들은 기업을 주도하지 않으며, 오히려 1차 진료와 특수 치료는 의료 팀의 일부로 기능하는 동등한 파트너입니다. 돌봄은 가정, 제공자 사무실, 병원, 숙련된 간호 시설(일명 "요양원") 및 호스피스로부터 연속해서 이루어진다. 마찬가지로, [질병disease뿐만 아니라 질환illness에도 초점을 맞추고 있다는 것]은, [1차 및 2차 예방, 진단, 치료, 만성 상태 관리 및 사후 관리, 지원 치료 및 완화 치료에 중점을 두고 있다는 것]을 의미한다. 환자 중심 치료는 시간이 지남에 따라 소규모 자발적 해약(연간 2% 미만)이 주어지면 긴 시간 범위와 통합된다.
KP is not new in medical education; they currently train over 900 students from 50 affiliated university programs each in more than 30 specialties. However, these trainees are visitors from different schools, at KP for limited period and each responsible to their home institution thus making innovative education difficult. Discovery is also crucial to the KP mission with over $100 million in federal research funding, 1300 clinic trails, $39 million in KP funded health outcomes research, and a team of 140 full time researchers (Kaiser-Permanente 2017). In the clinical arena, the KP system functions like a mini national health system with a single source of funding, a global budget, and the ultimate accountability measured by the health of the population served. Rather than profiting from more aggressive care, KP benefits from the reverse – the healthier it can keeps patients the more advantages there are to both patients and the system. The specialists do not drive the enterprise, rather primary care and specialty care are equal partners that function as part of care teams. Care covers a continuum from home, provider offices, hospital, skilled nursing facilities (aka “nursing homes”), and hospice. Similarly, the focus is not only on disease but on illnesses meaning that emphasis is placed on primary and secondary prevention, diagnosis, treatment, chronic condition management and follow-up, supportive care, and palliative care. Patient-centered care is integrated over time with a long time horizon given a small voluntary disenrollment (<2% per annum).

차별화 특성
Differentiating characteristics

의과대학은 기존 의과대학과는 크게 다를 것이다. 왜냐하면, KP의 차별화된 특성을 활용하여 사회적 사명을 지닌 예방 중심의 인구 기반 통합 돌봄 전달 모델로 활용하고, 이를 필요로 하는 회원들을 위한 세계적 수준의 전문 돌봄이 가능할 것이기 때문이다.
The School will be significantly different from traditional medical schools leveraging KP’s differentiating characteristics as a prevention-focused, population-based integrated care delivery model with a social mission, capable of world-class specialty care for the members who need it.

학교의 가장 중요한 차별화 요소는 카이저 퍼머넌트 메디컬 케어 프로그램의 일부가 된다는 것입니다. 카이저는 인구의 총체적 건강에 초점을 맞춘 치료와 자금 조달의 통합 모델입니다. Permanente Medicine으로 알려진 치료 모델은 증거 기반, 팀 제공, 기술 지원 및 문화적으로 책임 있는 것으로 가장 잘 특징지어집니다. 이러한 차이는 임상 치료, 교육, 연구/발견 및 사회적 사명으로 구분된다. 커뮤니티 건강, 발견 및 혁신, 다양성과 포용, 웰빙 등 여러 주제가 네 가지 영역에 모두 포함되어 있습니다.
The School’s most important differentiator is that it will be part of the Kaiser Permanente Medical Care Program, an integrated model of care and financing focused on the total health of populations. The model of care, known as Permanente Medicine best characterized as evidence-based, team delivered, technology enabled, and culturally responsible. These difference are broken down into clinical care, education, research/discovery, and social mission. Several themes – community health, discovery and innovation, diversity and inclusion, and wellness – are embedded in all four areas.

[다양성 채용 어젠다]는 의대 발전의 핵심 고려 사항이 될 것이다. KP의 현재 강력한 국가 프로그램을 기반으로, 건강 격차를 해결하고 특수 모집단에 관심이 있는 예비 학생들에게 독특한 임상 학습 기회를 제공할 것이다.
The diversity recruitment agenda will be a key consideration in the development of the medical school, building on KP’s current robust national programs that address health disparities and offer unique clinical learning opportunities for prospective students interested in special populations.

모든 미국의 의과대학과 마찬가지로 KP 의과대학은 오늘날 의과대학에서 대표성이 낮고 사회경제적으로 불리한 학생들을 포함하여 다양하고 포괄적인 학생 단체를 모집하는 데 상당한 도전에 직면할 것이다. 이 미션 크리티컬 다양성 목표를 달성하기 위해 학교는 KP가 다양한 인력을 창출하는 데 사용한 많은 측면을 활용할 필요가 있습니다.
Like all US medical schools, a KP medical school will face a significant challenge in recruiting a diverse and inclusive student body, including the underrepresented and socioeconomically disadvantaged students in medical schools today. To achieve this mission-critical diversity goal, the School will need to leverage many aspects that KP has used to create a diverse workforce.

많은 면에서 국가의 요구는 예방과 환자 권한 부여, 만성 질환의 효과적인 관리, 소득 극대화보다는 임상 증거와 환자에 중점을 두는 것, 통합 팀 간의 진료 조정, 보건 서비스 연구 등 KP가 뛰어난 동일한 분야이다.
In many ways, the needs of the nation are the same areas where KP excels, such as the emphasis placed on prevention and patient empowerment, effective management of chronic conditions, a focus on clinical evidence and the patient rather than on maximizing income, care coordination across an integrated team, and health services research.

올바른 내용, 올바른 교사, 올바른 환경을 파악하고 올바른 학생을 선발하는 것은 쉽지 않지만 우리가 수년간 academic center에서 배운 것이 있기에 가능하다. 환자, 직원 및 교수진과의 의미 있는 종단적 연결은 내일을 위한 리더를 훈련하는 데 매우 중요합니다. 교수진이 교수 전문성과 효과성을 가르칠 수 있는 시간을 제공하고, 급여를 지급하며, 지속적인 교수 개발을 제공하여 학습 커뮤니티를 최적화하고자 합니다.
Identifying the right content, the right teachers, and the right environment, and selecting the right students is not easy but is possible because of what we have learned from academic centers over the years. Meaningful longitudinal connections with patients, staff, and faculty are crucial to training leaders for tomorrow. By identifying unique approaches to student learning where faculty are provided time to teach, paid, and academically recognized for their teaching expertise and effectiveness, and provided ongoing faculty development to augment their skills we seek to optimize our learning community.

Academic medical centers는 전통적으로 환자와 지역 사회의 요구보다는 개별 교수진과 대학의 연구 요구를 충족시켜 왔다. KP는 현재 1,100만 명의 모든 회원에 대한 데이터를 제공하는 단일 전자 의료 기록에 초기에 투자하여 의료가 제공되는 모든 영역에서 유사한 환자 그룹에 걸친 의료 제공자 및 의료 품질에 대한 비교 데이터를 허용한다. 환자는 자신의 의료 정보에 대한 온라인 액세스, 예약 및 예약 변경, 담당 간호사나 의사에게 이메일 문의 전송, 특정 조건에 대한 건강 정보 및 코칭 등을 통해 권한을 부여받는다.
Academic medical centers have traditionally served the research needs of individual faculty and the University rather than the needs of patients and local communities. KP invested early in a single electronic medical record that now supplies data on all 11 million members, allowing comparative data on providers and quality of care across similar groups of patients in all arenas where care is delivered. Patients are empowered through access on-line to their own medical information, and to scheduling and changing appointment, sending email queries to their practice nurse or physicians, and receiving health information and coaching for specific conditions.

KP에서의 임무는 전통적인 학술 의과대학의 임무와 다르다(표 1). 학술 보건 센터는 두 축을 따라 네 개의 사분면(그림 2)으로 정렬하는 것처럼 보입니다.
The mission at KP is different from that of a traditional academic medical school (Table 1). Academic health centers seem to align themselves into four quadrants (Figure 2) along two axes.

 

Y축에는 사회적 사명 → 재정적 성공/성공에 대한 집중이 있습니다. x축에는 혁신적인 임상 실습과 제공 → 과학적 연구에 대한 헌신의 연속체가 있습니다. 완전히 사분면에 속하는 학교는 없지만, KPSOM은 사회적 임무와 임상 실습(사분면 1)에 더 중점을 두고 있다.
On the y-axis is a continuum from commitment to social mission → focus on financial success/prestige. On the x-axis is a continuum from commitment to innovative clinical practice and delivery → commitment to scientific research. While no school sits entirely within on quadrant, KPSOM is more focused on the social mission and clinical practice (quadrant 1).

의과대학의 스트레스는 4년 중 어느 시점에 학생들의 4분의 1이 심각한 우울증을 포함하여 정서적 행복의 감소를 초래하는 것으로 잘 입증되었다. 그 중 일부는 웰빙과 자존감을 손상시키고 회복력에 기여하지 않는 학습 환경 때문이다. 여기에다 자신들도 지쳐 있고 환경이 건강한 일과 삶의 균형에 도움이 되지 않는 교수진을 추가한다. KPSOM은 오랫동안 웰빙을 노동력으로 삼아온 인프라 지원과 리더십을 제공하는 시스템으로 소모가 적은 거대 퍼머넌트 의료단(2만2,000명 이상 의사)에서 선발해 업무에서 기쁨을 전하는 내과 교직원을 선발할 계획이다.

The stresses of medical school have been well documented to produce declines in emotional well-being, including serious depression among a quarter of students at some point in their four years (Dyrbye et al. 2010). Some of this is because of learning environments that impair wellbeing and self-esteem and do not contribute to resiliency (Cassel and Wilkes 2017). Add to this a faculty who are themselves burned out and the environment is not conducive to healthy work-life balance. KPSOM plans to select physician faculty who convey joy in their work, selected from the enormous Permanente medical group (more than 22,000 physicians) where burnout is lower as a result of a system that provides infrastructure support and leadership that has long made wellness a workforce a priority.

결론들
Conclusions

우리는 차세대 의사들을 훈련시키기 위한 이상적인 모델이 서비스되는 지역사회의 건강에 의해 결과가 정의되는 고기능 통합 의료 제공 시스템 내에 있다고 믿는다. 의대 설립 결정은 전통적인 학문적 의학 교육과 훈련이 의사가 트리플 목표(더 나은 의료, 더 건강한 인구, 더 현명한 지출)를 달성하기 위해 연습할 준비를 하지 못한다는 인식에서 영감을 받았다. KPSOM의 목표는 다른 의료 교육 기관들이 그들의 방법과 커리큘럼을 개선하고 강화하도록 고무시키는 촉매제 역할을 하는 것이다.
We believe an ideal model for training the next generation of physicians is within a high functioning, integrated health care delivery system where outcomes are defined by the health of the community served. The decision to initiate a medical school was inspired by the perception that traditional academic medical education and training does not prepare physicians to practice toward achieving the Triple Aim (better health care, healthier populations, and smarter spending). The goal at KPSOM is to act as a catalyst to inspire other medical education institutions to refine and strengthen their methods and curricula.

 


Med Teach. 2018 Apr;40(4):364-371. doi: 10.1080/0142159X.2017.1417580. Epub 2018 Jan 10.

If we keep doing what we're doing we'll keep getting what we're getting: A need to rethink "academic" medicine

Affiliations collapse

Affiliations

1a Davis School of Medicine , University of California , Davis , CA , USA.

2b Kaiser Permanente Medical School , Pasadena , USA.

PMID: 29320901

DOI: 10.1080/0142159X.2017.1417580

Abstract

Purpose: For generations there have been warnings of the need to reform medical education at all levels. Today the voices pushing reform are louder, the need is greater, and there is an urgency not seen before. Approaches that have worked in the past to train physicians are no longer as relevant today as demographics, disease patterns, human resources, practice behaviors, technology, and attention to costs demand new collaborative approaches to clinical practice. To prepare for this practice tomorrow's doctors will need a different type of educational model, a different type of learning, in different environments, often taught by different faculty. This paper provides one innovative approach to redefine "academic medicine".

Methods: After reviewing current trends in medical education, this paper describes one approach being taken by a large nonprofit American health care system to move medical education and discovery (research) out of traditional academic universities and placing it within a health care delivery system.

Conclusions: The creation of a learning laboratory in a high functioning health care delivery system allows for leveraging the successes in quality health care delivery to transform medical education with a focus on prevention, improving health care quality, reducing disparities in health, and promoting practical evidence-based clinical and outcomes focused research.

교수개발을 조직적 관점에서 바라보기: 교훈 공유 (Med Teach, 2021)
Viewing faculty development through an organizational lens: Sharing lessons learned
Klodiana Kolomitroa , Joanne Hamiltonb, Karen Lesliec, Lara Hazeltond, Kiran Veerapene, Kenna Kelly-Turnerf and David Keeganf

 

 

서론
Introduction

교수개발(FD)은 개인과 조직의 교수, 교육 연구 및 리더십 역량을 향상시키는 데 핵심적인 역할을 한다. FD는 학문으로서 신뢰를 얻었지만, 학계에서 FD의 역할에 대한 불확실성은 남아있다. FD는 여러 이해 관계자의 권한을 지원하므로 FD가 포함된 기관의 요구와 우선순위에 따라 결정됩니다(Little and Green 2012). 그 결과 FD 프로그램과 의무에 상당한 다양성이 생겼다. 이 연구는 다음과 같은 문제를 해결하기 위해 노력했다. [조직적 요인]이 교수 개발자의 의무 이행 능력을 어떻게 제한하거나 향상시키는가?
Faculty development (FD) plays a key role in enhancing teaching, educational research, and leadership capacity of individuals and organizations (AFMC 2010; Steinert 2020). While FD has gained credibility as a discipline, there remains uncertainty regarding its role in academia (Beach et al. 2016). Supporting the mandates of multiple stakeholders, FD is shaped by the demands and priorities of the institutions in which it is embedded (Little and Green 2012). The result is considerable diversity in FD programs and mandates. This study sought to address the question: How do organizational factors constrain or enhance the capacity of faculty developers to fulfil their mandates?

[FD 단위]와 [FD 단위가 운영되는 조직] 간의 관계는 AME ASPIRE 상을 위한 Excellence in Practist Development의 첫 번째 기준에 분명히 나타나 있습니다. 'FD 프로그램은 명확한 목표를 가지고 있으며, [학교 목표와 우선순위]에 맞춰져 있으며, 조직 문화에 영향을 미칩니다.' 조직 요인의 영향에 대한 더 나은 이해는 FD 문헌의 격차로 확인되었다. 이는 새로운 FD 프로그램을 개발하고 기존 FD 프로그램을 다시 검토하는 학술 기관에 해당됩니다. Silver(2014)는 [새로운 FD 프로그램 수립]을 위한 핵심 구성 요소로 [조직 요인 탐색]을 지목했습니다.
The relationship between a FD unit and the organization in which it operates is evident in the first criterion for Excellence in Faculty Development for the AMEE ASPIRE award: ‘The FD program has clear goals, is aligned with school goals and priorities, and/or influences organizational culture’ (Association for Medical Education in Europe (AMEE),
 2021). A better understanding of the influence of organizational factors has been identified as a gap in the FD literature (Leslie et al. 2013; Steinert et al. 2016). This is relevant for academic institutions as they develop new FD programs and re-examine existing ones (Zodpey et al. 2016; Samarasekera et al. 2020); this observation has also been supported by Silver (2014), who identified exploring organizational factors as a key component for the establishment of a new FD program.

Bolman and Deal(2017)은 의료 교육 리더십(Lieff and Albert 2010)과 연구에 사용된 프레임워크를 개발했다. 현재까지 FD와 관련된 조직 요소를 이해하기 위한 가치는 문헌에서 논의되지 않았다. 볼만과 딜은 4개의 프레임을 묘사한다

  • 구조 프레임(예: 보고 관계, 자원 및 업무 조정 구조)은 조직 구조의 영향을 인식합니다. 
  • 인적 자원 프레임(예: 리더십, 권한 부여 및 조직 및 인적 요구 조정)은 사람과 조직 간의 관계를 탐구합니다. 
  • 정치적 프레임(권력, 통제, 갈등, 경쟁, 동맹 구축)은 조직을 '희소한 자원, 경쟁적 이해, 권력과 이익을 위한 투쟁의 경쟁 영역'으로 본다
  • 상징적 프레임(비전, 문화, 신화, 신념 및 의미 창출)은 조직에 목적의식을 창출하는 데 중점을 둔다. 

네 가지 프레임은 조직에 대한 이해를 심화시키는 것을 목표로 한 시스템에서 서로 다른 요소를 식별하고 설명합니다.
Bolman and Deal (2017) developed a framework that has been used in medical education leadership (Lieff and Albert 2010) and research (Thammasitboon et al. 2017). To date, its value for understanding the organizational factors relevant to FD has not been discussed in the literature. Bolman and Deal describe four frames.

  • The Structural frame (e.g. reporting relationships, resources and attuning structures to tasks) recognizes the influence of organizational architecture.
  • The Human Resource frame (e.g. leadership, empowerment and aligning organizational and human needs) explores the relationship between people and organizations.
  • The Political frame (power, control, conflict, competition, and building alliances) views organizations as ‘competitive arenas of scarce resources, competing interests, and struggles for power and advantage’ (Bolman and Deal 2017, p. 23), while
  • the Symbolic frame (vision, culture, myths, beliefs and creating meaning) focuses on creating a sense of purpose in organizations.

The four frames identify and describe different elements in a system with the goal of deepening understanding of the organization.

본 연구에서는 볼만 및 딜 프레임워크를 활용하여 FD 리더의 경험과 인식을 조사한다. 이를 통해, 우리는 국제 사회 전반에 걸쳐 FD 리더가 조직 맥락에서 FD에 대한 접근 방식을 만들고 방향을 바꿀 때 FD 리더의 작업을 알리는 것을 목표로 한다.
In the present study, we utilize the Bolman and Deal framework to examine the experiences and perceptions of FD leaders. By doing so, we aim to inform the work of FD leaders across our international community as they create and reorient approaches to FD in their organizational contexts.

방법들
Methods

디자인, 설정 및 참가자 연구
Study design, setting and participants

조사 연구 방법론을 사용하여 캐나다 의과대학의 FD 리더를 조사했는데, 이들은 모두 캐나다 의학부 협회(AFMC) FD 네트워크의 회원이다. 
Using survey research methodology (Creswell and Creswell, 2017), we surveyed FD leaders at Canadian medical schools, all of whom are members of the Association of Faculties of Medicine Canada (AFMC) FD network.

연구기구
Research instrument

캐나다의 AFMC FD 네트워크에 의해 배포된 기존 설문지를 채택했다. 이 적응은 볼만과 딜의 프레임워크에서 inform되었고, 그리고 나서 최종 버전에 통합된 피드백과 함께 모든 네트워크 구성원에 의해 검토되었다. 설문지(부록 1)에는 30개의 질문이 있었다. 6개의 질문은 정량적이고 수집된 인구 통계, 상황별 및 프로그램 정보였습니다(예: 프로그램이 지원하는 교육 프로그램을 식별하십시오). FD 범위, 단위 책임 및 구조 변경, 당면 과제와 같은 조직 요소를 탐구하는 24개의 개방형 질문이 있었습니다.  (예: 지난 5년 동안 포트폴리오에 큰 변화가 있었습니까? 그렇다면 변경 사항을 설명하고 변경 사항에 대한 근거를 파악하십시오.)
An existing questionnaire distributed by the AFMC FD network in Canada was adapted. This adaptation was informed by the Bolman and Deal framework and was then reviewed by all network members, with feedback incorporated in the final version. The questionnaire (Supplementary Appendix 1) had 30 questions. Six questions were quantitative and collected demographic, contextual and programmatic information (e.g. Please identify which educational programs your program supports). There were 24 open-ended questions that explored organizational factors such as scope of FD, changes to unit responsibilities and structure, and challenges experienced (e.g. Have there been any significant changes in your portfolio in the last five years? If so, please describe the changes and identify any rationale for those changes.)

데이터 수집
Data collection

2020년 7월 캐나다 17개 의과대학의 FD 지도자들에게 참가 초청장이 배포되었다. 설문조사는 Qualtrics(™)를 통해 전자적으로 배포되었습니다. 의과대학별로 FD 리더 1명이 응답했으며, 총 참여 인원은 14명(82%)이었다.
An invitation to participate was distributed to FD leaders at all 17 Canadian medical schools in July 2020. The survey was distributed electronically via Qualtrics (™). One FD leader responded for each medical school, and the total number of participants was fourteen (82%).

데이터 분석
Data analysis

이 연구는 캘거리 대학의 컨조인트 건강 연구 윤리 위원회에 의해 승인되었다.
The study was approved by the Conjoint Health Research Ethics Board at the University of Calgary (REB20-1126).

6개의 정량적 질문에 대한 빈도가 계산되었다. 해당될 경우 가장 빈도가 높은 응답부터 가장 낮은 응답까지의 순서와 계산된 백분율 순위를 매긴다. 정량적 질문은 볼만 및 딜 프레임워크와 관련된 정보를 수집하기 위해 특별히 설계되지는 않았지만, 이러한 응답은 정성적 분석에 영향을 미쳤다.
Frequencies were calculated for the six quantitative questions. We rank ordered responses from most to least frequent, and calculated percentages where applicable. While the quantitative questions were not specifically designed to collect information related to the Bolman and Deal framework, these responses informed the qualitative analysis.

질적 분석을 위해 데이터를 분석하기 위해 먼저 볼만과 딜(2017) 이론적 프레임워크를 활용했다. 개방형 질문에 대한 세 명의 참가자의 응답은 처음에는 팀의 두 구성원(JH, KK)이 임시 코딩을 사용하여 라인별로 독립적으로 코딩되었다. NVivo 12(™)를 통해 데이터 분석이 용이했습니다. JH와 KK는 코딩을 비교하고, 차이점을 해결했으며, 코드 정의와 최종 코딩 프레임에 대해 합의를 보았다. 그런 다음 모든 참가자의 응답은 이 프레임을 사용하여 코딩되었습니다. JH와 KK는 이러한 초기 코드를 관련 볼만 및 딜(2017) 프레임으로 분류하고 주제를 식별했다. 연구팀은 이후 예비 해석을 확인하기 위해 만났다. 데이터 분석은 피드백을 위해 이메일을 통해 참가자들과 공유되었다.
For the qualitative analysis, we utilized Bolman and Deal (2017) theoretical framework a priori to analyze the data. Three participants’ responses to the open-ended questions were initially coded line-by-line independently by two members of the team (JH, KK) using provisional coding (Saldana 2013). Data analysis was facilitated with NVivo 12 (™). JH and KK compared coding, resolved any differences, and came to agreement about code definitions and the final coding frame. All participants' responses were then coded using this frame. JH and KK grouped these initial codes into the relevant Bolman and Deal (2017) frame, and identified themes. The research team subsequently met to confirm preliminary interpretations. The data analysis was shared with the participants via email for feedback.

반사율
Reflexivity

이 논문의 저자들은 서로 다른 배경과 경험을 가지고 있어 데이터에 대한 그들의 해석에 영향을 미쳤을 수 있다. 모든 저자들은 교수 개발의 리더십을 가지고 있다. 저자들 중 6명이 설문 응답자였기 때문에, 우리는 '이 아이디어가 우리의 데이터에 분명히 근거를 두고 있는가?'와 같은 질문을 정기적으로 했습니다. 우리는 또한 우리의 분석이 그들의 경험을 반영하는지 확인하기 위해 참가자들과의 회원 확인을 수행했다.
The authors from this paper have different backgrounds and experiences which might have influenced their interpretation of the data. All the authors provide leadership in faculty development. As six of the authors were survey respondents, we regularly asked questions like ‘Is this idea clearly grounded in our data?’ We also conducted member-checking with participants to ensure our analysis reflected their experience.

 

결과.
Results

정량적 소견
Quantitative findings

많은 참가자들이 최근 [자금, 보고 구조 및 활동]에서 변화를 경험했다. 소속 기관의 유닛이 어디에 위치하는지, 내부적으로 어떻게 조직되는지에 차이가 있었다. 일부 유닛(36%)은 독립적이었고, 다른 유닛은 지속적 전문 개발(CPD) 유닛과 같은 다른 유닛과 제휴하거나 합병되었다. FD 부서는 리더십 개발, 새로운 교수진 지향, 커리큘럼 개발 및 갱신, 교육 연구 육성, 교사 개발을 포함한 일부 책임 영역을 공유했다. 대부분의 FD 사업부는 다양한 건강 전문 교육 프로그램(그림 1)에 프로그래밍을 제공하고 여러 이해관계자 그룹(그림 2)을 개발하는 데 도움을 주었다.

Many participants experienced recent changes in funding, reporting structure, and activity. There were differences in where units were situated in their institutions and how they were internally organized. Some units (36%) were stand-alone, while others were affiliated or merged with other units such as Continuing Professional Development (CPD) units. FD units shared some areas of responsibility which included leadership development, new faculty orientation, curriculum development and renewal, fostering educational research, and teacher development. Most FD units offered programming to a variety of health professional education programs (Figure 1) and helped develop multiple stakeholder groups (Figure 2).

 

 

정성적 소견
Qualitative findings

볼만과 딜의 프레임워크를 사용하여 다음과 같은 주제를 파악하였다.

  • 심볼릭 프레임에서는 [FD 유닛으로서의 정체성 결여]가 제약 요인으로 간주되었다.
  • 정치적 프레임에서는 [가시성visibility을 높이는 것]이 늘 가치를 보장하는 것은 아니지만 강화 요인으로 간주되었다.
  • 구조 프레임 내에서 [실행 범위를 확장하는 것]은 강화 요인으로 간주되었다. 단, 자원 증가를 동반하지 않는 경우 제약 요인이 될 수 있었다.
  • HR 프레임에[리더십의 변화와 인적 자원에 대한 불확실성으로 인한 불안감]이 제약 요인으로 간주되었다.

Using Bolman and Deal’s framework, the following themes were identified:
In the Symbolic frame, lack of identity as a FD unit was seen as a constraining factor;
in the Political frame, developing visibility was seen as an enhancing factor, though it did not always ensure being valued;
within the Structural frame, expanding scope of practice was seen as an enhancing factor, though it could also be a constraining factor if not accompanied by increased resources; and
in the HR frame, a sense of instability due to changing leadership and uncertainty about human resources was seen as a constraining factor.

기호 프레임: FD 단위로서의 정체성 결여가 제약 요인으로 보였다.
Symbolic frame: Lack of identity as a FD unit was seen as a constraining factor

[FD 단위로서의 정체성 결여]가 참가자들에 의해 보고되었으며, 그들의 작업에 제약 요인으로 간주되었다. 참석자들은 이해 관계자들이 [FD가 무엇이며, FD의 핵심 비즈니스와 비전을 구성하는 것이 무엇인지] 종종 혼란스러워한다는 점에 주목했습니다. 일반적인 예는 [FD와 CPD 사이의 중복]으로 '[CPD 유닛과의 혼선, 그리고 각 센터의 정렬과 특정 초점을 정의하기 위해 수행해야 하는 경계짓기 작업boundary work]'으로 이어졌다(S11). 참가자들은 다른 부서에서 예를 들어 '교육 테크놀로지 그룹 및 FD 작업에 대한 혼란'과 같은 교육을 제공할 때 혼란을 보고했습니다. 교육 테크놀로지 사용에 대한 교육도 수행하지만, FACDEV의 문제이기도 합니다(S3). 이는 FD 유닛이 다른 유닛과 통합되었을 때, 예를 들어, S8의 경우 '사무실은 서로 다른 개별 사무실의 통합'이라고 언급했을 때 복합적으로 작용한 것으로 보입니다. 이것은 아직 우리에게 비교적 새로운 것이므로, 약간의 학습과 정체성 형성이 필요할 것이다.' 다른 사람들과 통합하고 협력하는 것은 유익할 수 있지만, [FD가 무엇이고, 무엇을 하는지]에 대한 기관 파트너들의 '혼란'을 초래할 수도 있다.
A lack of identity as a FD unit was reported by participants, and was seen as a constraining factor in their work. Participants noted stakeholders were often confused about what FD was, and what constituted its core business and vision. A common example was overlap between FD and CPD leading to ‘Confusion with the Office of CPD, and boundary work that needs to take place to define the alignment and specific foci of each centre’ (S11). Participants also reported confusion when other units provided training for example: ‘confusion around the educational technology group and our FD work. They (edutech) do training as well, on using educational technologies, but it is also a FACDEV issue’ (S3). This seemed to be compounded when FD units were integrated with other offices, such as for S8 who noted that their ‘office is an amalgamation of different separate offices […]. This is still relatively new to us, so there will [need to be] some learning and identity formation’. Integrating and collaborating with others can be beneficial, and yet can also result in ‘confusion’ on the part of institutional partners regarding what FD is and does.

정치 프레임: 가시성 개발은 항상 가치를 보장하지는 않았지만, 향상 요소로 간주되었습니다.
Political frame: Developing visibility was seen as an enhancing factor, though it did not always ensure being valued

이 프레임의 주요 주제는 [가시성 개발]이었는데, 이는 항상 가치를 보장하지는 않았지만, 강화 요인으로 간주되었습니다. 눈에 보이는 것은 교수 개발자들이 그들의 임무를 수행할 수 있는 능력과 관련이 있었다. FD 리더는 여러 가지 방법으로 가시성을 개발하기 위해 노력했습니다. [조직의 전략 계획에 관여]하고 [계획과 정책 개발에 역할]을 하는 것이 몇 가지 사례로 확인되었다. S5는 '대화, 정책 업무, 위원회 회의 참여, 전략기획 참여 등을 통해 업무를 수행한다'고 평했다. S9이 지적했듯이, '우리는 시간이 지남에 따라 더 많은 가시성과 더 많은 buy-in을 얻고 있다.' 가시성을 높이기 위해 나타난 한 가지 전략은 동맹을 맺는 것이었다. FD 유닛은 제휴를 통해 '노력 및 중복 방지'(S2), '공동 개발 촉진'(S4), '새로운 프로그램 제공'(S9), '존중 구축'(S12), '교차 프로모션'(S7) 및 'FD 이벤트 이외의 교육 및 학습 대화(S6)에 적극적임'(S6) 등에 대한 시너지 효과를 제공했다고 보고했습니다.
The main theme in this frame was developing visibility, which was seen as an enhancing factor, though it did not always ensure being valued. Being visible was linked to the capacity of faculty developers to fulfill their mandates. FD leaders worked to develop visibility in a number of ways. Involvement in their organization’s strategic plan and having roles in planning and policy development were identified as some examples. As S5 commented, ‘We work through conversations, policy work, committee meeting participation, participation in strategic planning’. As S9 noted, ‘we are getting more visibility and more buy-in over time’. One strategy that appeared to enhance visibility was forging alliances. FD units reported that alliances helped synergize ‘efforts and prevent duplication’ (S2), ‘facilitate co-development’ (S4), help ‘deliver new programs’ (S9), ‘build respect’ (S12), ‘cross promote’ offerings (S7) and ‘stay active in the teaching and learning conversation outside of FD events’ (S6).

그러나 가시성이 항상 FD의 가치와 동일하지는 않았다. S1이 공유했듯이, '교수 개발의 명백한 중요성과 우리가 실제로 사용되는 방법 사이에는 단절이 있다. 우리가 일상적인 운영이나 교육과정 전달에 잘 통합되지 않는다고 생각한다.' 비슷하게, S5는 학교에서 가시성을 보고했지만, 그들은 또한 '우리가 하는 일에 대한 인정credit을 얻는 것은 조직의 문화, 그것의 가치, 그리고 그것이 "가치worthiness" 척도에서 우리와 같은 단위를 위치시키는 것에 영향을 받는 어려운 균형 행위'라고 언급했다. FD에 대한 전반적인 인식 부족은 여전합니다. '대부분의 교수진[구성원]은 아직 'FD'가 무엇인지 모르는 것 같습니다'(S9).
However, visibility did not always equate with valuing of FD. As S1 shared, ‘there is a disconnect between the apparent importance of faculty development and how we are actually utilized. I don’t think we are integrated well into the daily operations or delivery of the curriculum’. Similarly, while S5 reported visibility in their school, they also noted that ‘getting credit for the work we do is a tough balancing act, one that is influenced by the culture of the organization, its values, and where it positions units such as ours on the “worthiness” scale’. An overall lack of awareness about FD remains: ‘I don’t think most faculty [members] know yet what ‘Faculty Development’ is’ (S9).

구조 프레임: 자원 증대를 수반하지 않을 경우 제약 요인이 될 수 있지만, 실천 범위를 확대하는 것은 강화 요인으로 간주되었다.
Structural frame: Expanding scope of practice was seen as an enhancing factor, though it could also be a constraining factor if not accompanied by increased resources

이 틀에서 주요 주제는 [실천practice 범위를 확장하는 것]이었는데, 이는 자원증가를 동반하지 않을 경우 제약 요인이 될 수도 있지만, 강화 요인으로 간주되었다. 실무 범위는 제공되는 다양한 프로그램과 FD 부서에서 서비스하는 이해 관계자의 유형을 참조했습니다. 거의 모든 FD 부서는 지난 1년 동안 형평성, 다양성 및 포괄성, 리더십 개발, 가상 의료 감독 및 전문성과 같은 분야에서 실무 범위가 확대되었다고 보고했습니다. 응답자의 64%가 교육 관련 정책 개발에 참여했다. 한 유닛은 '교직원 지원… 교사, 지도자, 연구자 등 모든 학문적 역할과 일반 경력 개발 지원'으로 범위가 확대되었다고 보고했다(S6). 많은 사람들이 디지털 변환과 강력한 온라인 존재, 그리고 더 많은 프로그래밍 빈도로 전달 모드의 다양화를 보고했다. S7에서 지적했듯이, '우리는 최근 우리의 범위scope를 기하급수적으로 늘렸습니다. 나는 우리가 잠시 동안 여기에 머무르는 것이 행복할 것이라고 생각한다.'
In this frame the main theme was expanding scope of practice, which was seen as an enhancing factor, though it could also be a constraining factor if not accompanied by increased resources. Scope of practice referred to the variety of programs offered and types of stakeholders that FD units serve. Almost all FD units reported over the past year an expansion in scope of practice, in areas such as equity, diversity and inclusion, leadership development, supervision in virtual care, and professionalism. Sixty four percent of respondents participated in education-related policy development. One unit reported that their scope had increased to ‘support faculty members … in all their academic roles including teacher, leader, and researcher, as well as in their general career development’ (S6). Many reported a diversification of delivery modes with digital transformation and robust online presences, and a greater frequency of programming. As noted by S7, ‘We have just increased our scope exponentially. I think we will be happy to stay here for a while’.

FD 장치의 기능을 강화하기 위해 실행 범위를 확장하는 것처럼 보였지만, 일부는 이것이 반드시 증가된 자원이나 자금과 함께 오는 것은 아니어서 FD 실행을 제한할 수 있다고 언급했다. S7이 공유한 것처럼, '많은 사람들이 내가 하고 있는 것에 관심을 갖고 정치적으로 지지하고 있지만, 반드시 재정적으로 그렇지는 않다.'
While expanding scope of practice appeared to enhance FD units’ function, some noted this did not necessarily come with increased resources or funding, which can constrain FD practice. As shared by S7, ‘Lots of people are invested and looking to support what I am doing politically but not necessarily financially’.

인적 자원 프레임: 리더십의 변화와 인적자원에 대한 불확실성으로 인한 불안감이 제약 요인으로 보였다.
Human resources frame: A sense of instability due to changing leadership and uncertainty about Human Resource was seen as a constraining factor

[인적자원 프레임]의 주요 주제는 [리더십의 변화와 인력에 대한 불확실성으로 인한 불안감]이었으며, 이는 FD 부서의 임무 수행 능력을 제한하는 것으로 보였다. 일부 의견제출자들은 불충분한 자원을 '전반적으로 더 많은 직원을 두는 것이 더 나을 것이다'와 유사한 의견으로 표현하였다. 나는 본질적으로 다른 일도 하는 큰 사무실에서 FD를 하는 유일한 사람이다(S2). 리소스가 부족하더라도: '우리는 너무 거절하지 않으려고 노력하고 사람들이 요구하는 것을 유머, 친절, 그리고 많은 리소스로 주려고 노력합니다.' (S9) 또한 많은 이들이 '조직의 리더십 변화'와 '행정직원의 이직'에 대해 우려를 표하였고, '업무 성격의 변화'를 예상하였다(S8). 이에 대해 S1은 '교직원 육성 프로그램 전체가 없어질 것이라고 생각할 이유가 없다…'고 상세히 설명하였다. 하지만, 나는 또한 향후 5년이 무엇을 가져올지 확실히 알지 못한다. 다른 이들은 '정부 차원의 삭감'(S5)과 '채용 동결'(S6)에 대해 언급했다. 변화하는 리더십과 자원에 대한 불확실성으로 인해 대부분의 FD 유닛은 불안정감을 느끼게 되었습니다.
The main theme in the HR frame was a sense of instability due to changing leadership and uncertainty about human resources, which appeared to constrain FD units’ ability to fulfill their mandates. Some respondents described inadequate resources as represented in comments similar to, ‘More staffing overall would be better. I am essentially the one person doing FD in a large office which does other things as well’ (S2). Even though the resources are inadequate: ‘We try not to turn down too much and we try to give people what they ask for with some humour, lots of kindness and lots of resources …’ (S9). Further, many expressed concerns about ‘changing organization leadership’ (S5), ‘turnover in administration staff’ (S3), and anticipated ‘shifts in the nature of our work’ (S8). S1 elaborated on this saying, ‘I don’t have any reason to think the entire faculty development program would ever be eliminated… However, I also don’t have a clear sense of what the next 5 years will bring’. Others commented on ‘government level cuts’ (S5) and ‘hiring freezes’ (S6). The changing leadership, and uncertainty about resources resulted in a sense of instability in most FD units.

논의
Discussion

이 연구에서 FD 리더들은 광범위한 활동과 청중을 보고했으며, 지난 1년 동안 그들의 실천 범위가 증가하고 있다고 언급했다. 이것은 다른 사람들의 발견과 일치하며 시간이 지남에 따라 자연적으로 발생한 FD의 진화를 반영한다. 스타이너트 외 연구진(2016)은 FD의 범위를 [교사 준비]를 넘어 [새로운 콘텐츠(연구 기술 및 리더십 개발 등)와 새로운 접근 방식(온라인 및 직장 기반 학습 등)]을 포함하도록 확장할 것을 권고했다. 우리의 연구 결과는 이것이 캐나다의 많은 FD 장치의 현재 상태임을 보여준다.
In this study, FD leaders reported a wide range of activities and audiences, and noted that their scope of practice has been increasing over the past year. This aligns with the findings of others (Beach et al. 2016) and is reflective of an evolution in FD that has been occurring naturalistically over time. Steinert et al. (2016) recommended broadening the scope of FD beyond teacher preparation to include new content (such as research skills and leadership development) and new approaches (such as online and workplace-based learning). Our findings demonstrate that this is the current state for many FD units in Canada.


그러나 이러한 확장에는 비용이 듭니다. [FD의 가시성과 동맹 관계 개선에 따라 실천 범위가 확대]되면서, 개별 프로그램은 이러한 [확대된 역할에 수반될 것으로 예상되는 지원과 인정]을 얻기 위해 노력하고 있습니다. 자금과 인적 자원의 부족은 자금과 인적 자원의 동반적인 증가 없이 새로운 주제와 접근 방식이 통합되기 때문에 많은 학교에서 FD에 도전 과제를 제기한다. 이러한 긴장은 현장에서 일하는 사람들의 스트레스 수준을 증가시킬 수 있으며, 해결하지 않으면 사기가 저하될 수 있다.
However, this expansion comes at a cost. As FD’s scope of practice expands with resultant gains in visibility and alliances, individual programs are struggling to garner the support and recognition that might be expected to accompany this expanded role. A lack of funding and human resources poses challenges for FD at many schools, as new topics and approaches are incorporated without concomitant increases in funding and human resources. This tension can lead to increased levels of stress for those working in the field, and if not addressed, may result in demoralization.

자원 부족은 명백한 과제를 제기하지만, [FD의 실행 범위를 넓히는 것]은 [FD가 무엇이고, 무엇을 하는지]에 대한 [다른 단위와의 혼동]을 초래할 수도 있는 것으로 보인다. 이는 마치 'FD가 하지 않는 것은 무엇인가?'라는 질문과도 관련이 있다. [핵심 비즈니스를 구성하는 요소에 대한 명확한 경계와 정의]가 없으면 우선 순위를 설정하고 노력이 일치하도록 보장하는 것이 어려워질 수 있습니다. 이러한 상황에서 교육 혁신과 개선의 강력한 비전과 문화로 구성된 FD에 대한 강력한 정체성을 확립하는 것은 특히 중요합니다.
While under-resourcing poses an obvious challenge, it also appears that broadening the scope of practice of FD may be leading to confusion with other units regarding what FD is and does. Just as relevant is the question of what FD doesn’t do? Without clear boundaries and definitions of what constitutes core business, it may become difficult to set priorities and ensure efforts are aligned. Establishing a strong identity for FD, consisting of a strong vision and culture of innovation and improvement in education, becomes exceptionally critical under these circumstances.

보건 전문직 교육이 끊임없이 발전함에 따라, FD는 [새로운 방향]으로 이끌릴 수밖에 없다. 그러나 FD 리더가 [적절한 제도적 지원]을 확보할 수 없다면, 이러한 [다양한 요구를 충족시키기 위한 노력]이 부족해질 수 있습니다. FD 리더는 [FD 유닛의 실행 범위를 확장하는 것]과 관련된 [위험과 보상]을 [안정성, 가치, 정체성 및 가시성] 측면에서 평가해야 한다. 실무 범위가 확대되는 경우 FD 리더는 [기존 조직 리소스를 옹호하거나 최적화]하기 위해 여러 전략을 활용할 수 있습니다. 여기에는 [기존 동맹의 활용]과 [새로운 동맹의 탐색]이 포함될 수 있습니다. [인증 검토]는 종종 추가 FD 자원의 필요성을 제안하는 기회이다. FD 리더는 현재 리소스 내에서 무엇을 할 수 있는지, 무엇을 할 수 없는지 명확하게 파악하고 이를 조직의 리더십에 명확하게 설명할 수 있어야 합니다. 동시에, 그들은 그들의 [부가가치added value]와 그들이 그들의 기관 내에서 [어떻게 교육을 개선하고 혁신하는 데 기여]하는지 명확히 설명해야 한다.
As health professions education is constantly evolving, FD is inevitably going to be pulled in new directions. However, if FD leaders are not able to secure adequate institutional support, efforts may be inadequate to meet these diverse demands. FD leaders should weigh the risk and rewards associated with expanding a FD unit’s scope of practice, in terms of stability, value, identity, and visibility. When faced with an expansion in scope of practice, FD leaders might utilize a number of strategies to advocate for and/or optimize existing organizational resources. This can include leveraging existing alliances and exploring new ones. Accreditation reviews are often opportunities to propose a need for additional FD resources. FD leaders must have a clear sense of what they can and cannot do within their current resources, and be able to articulate this to leadership in their organizations. At the same time, they should clearly articulate their added value and how they contribute to improving and innovating education within their institutions.

일부 부서에서는 소수의 직원만 보유하고 있다고 보고하기 때문에, 다른 기관의 FD 실무자와의 연결은 아이디어 공유와 상호 지원을 위해 중요해집니다. 보건학 학장 및 기타 그룹과 함께 국가 차원에서 옹호할 수 있는 강력한 네트워크 및 관행 커뮤니티를 구축하면 FD에 대한 지원과 인정을 얻는 데 도움이 될 수 있습니다. 중요한 것은 FD에서 일하는 사람들은 가시성을 높이고 가치를 입증하기 위해 FD 효과에 대한 근거 기반을 계속 확장해야 한다는 것이다.
Because some units report having only a few staff, connecting to FD practitioners in other institutions becomes important for the sharing of ideas and mutual support. Building strong networks and communities of practices that can advocate at a national level with health sciences Deans and other groups may assist in garnering support and recognition for FD. Importantly, those working in FD must continue to expand the evidence base for FD effectiveness in order to enhance its visibility and demonstrate its value (Steinert 2020).

강점과 한계
Strengths and limitations

우리가 아는 한, 이것은 조직적 요인이 FD에 어떤 영향을 미치는지 탐구하기 위한 프레임워크를 사용하는 첫 번째 연구이다. 우리는 이 프레임워크의 적용이 국내 및 국제적으로 FD 유닛으로 전이transferable될 수 있다고 믿는다. 우리의 참가자들은 캐나다의 FD 리더들이었고, 그들은 조직적 요인이 그들의 임무를 수행하고 번창하는 교수 개발자들의 능력에 미치는 영향에 대한 우리의 이해를 증진시키는 풍부한 응답을 제공했다.
To our knowledge this is the first study utilizing a framework to explore how organizational factors influence FD. We believe the application of this framework is transferable to FD units nationally and internationally. Our participants were FD leaders in Canada, and they provided rich responses that enhanced our understanding of the impact that organizational factors have on faculty developers’ abilities to fulfill their mandates and thrive.

한계는 이 연구가 COVID-19 팬데믹이 잘 진행되고 있을 때 수행되었고, 결과적으로 FD 맥락은 정기적인 지원 및 프로그래밍 외에도 온라인 교육에 대한 긴급한 피벗을 지원할 필요성을 반영했다는 사실을 포함한다. 많은 교수진이 온라인 또는 혼합 교육을 제공하고 동맹을 강화하지만 종종 그렇게 하기 위한 추가 자원을 받지 못하는 등 일부 응답에 영향을 미칠 수 있는 FD 부서의 도움과 추가 지원이 필요하다는 것이 분명해졌다. 설문지는 또한 복잡한 상황과 동기를 탐구하는 능력이 제한적이며, 추가 연구는 다른 방법론을 채택함으로써 이익을 얻을 수 있다. 이 데이터는 캐나다에서만 FD 단위로 수집되었기 때문에, 다양한 맥락과 국가에서 볼만과 딜(2017)의 적용을 더 넓게 보면 이 데이터를 풍부하게 하고 확장할 수 있을 것이다. 마지막으로, 6명의 저자가 조사를 완료했고, 이것이 데이터에 대한 그들의 해석에 영향을 미쳤을 수 있다. 
Limitations include the fact that this study was carried out when the COVID-19 pandemic was well underway and consequently the FD context reflected the need to support urgent pivoting to online teaching, in addition to regular support and programming. It became clear that many faculty members needed help and extra support from FD units which might have affected some of the responses, in particular those reflecting an expansion in the scope of practice, in terms of how to offer online or blended teaching, strengthening alliances, but often receiving no extra resources to do so. Questionnaires also have limited ability to explore complex situations and motivations, and further studies would benefit from employing different methodologies. As this data was collected in FD units in Canada only, a broader look at the application of Bolman and Deal (2017) in different contexts and countries would enrich and expand this data. Finally, six of the authors completed the survey, and this might have influenced their interpretation of the data.

시사점
Implications

우리의 연구는 다음을 위해 새로운 FD 유닛을 개발하는 데 관여하는 사람들에게 시사하는 바가 있다.

  • 조직 환경 내에서 FD 활동의 초점과 범위를 식별한다. 
  • 이러한 활동의 자원화 방법에 대한 예산을 결정한다. 
  • 이 작업의 가치와 영향이 조직 내에서 어떻게 인식되고 전달될 것인지 파악합니다. 

현재 조직에서 FD를 개발 및 제공하는 사람들에게, 이 작업을 조직적 관점으로 볼 수 있는 프레임을 제공합니다. 또한 FD가 어떻게 이해되고, 평가되고, 자원이 제공되는지를 평가할 수 있는 관점을 제공합니다.
Our research has implications for those involved in developing new FD units who are working to

  • identify the focus and scope of FD activity within their organizational contexts,
  • determine the budget for how these activities will be resourced, and
  • identify how the value and impact of this work will be recognized and communicated within the organization.

For those currently developing and delivering FD in their organizations, we provide a frame through which this work can be viewed organizationally; we also offer a perspective to assess how FD is understood, valued and resourced.

[기관 리더]는 [FD에 대한 실무 범위의 증가]가 기관의 우선 순위와 필요에 따라 신중하게 수행되고, 적절하게 지원되며, 가시성 향상을 위한 전략을 숙지하고 동반하도록 보장해야 한다. 그렇게 하지 않으면 기관 내에서 FD의 정체성과 지위, 지속 가능성 및 가치를 훼손할 위험이 있습니다.
Institutional leaders must ensure that increase in scope of practice for FD is undertaken thoughtfully, in alignment with institutional priorities and needs, adequately supported, and informed and accompanied by strategies for enhancing visibility. Failing to do so risks undermining FD identity and status, sustainability, and value within the institution.

향후 연구는 조직적 요인이 다양한 맥락과 환경에 걸쳐 교수진 개발 실무에 어떤 영향을 미치는지 검토하는 것을 고려해야 한다. 위에서 언급한 바와 같이, 데이터 수집에 대한 정성적 접근 방식을 사용하면 각 주제와 이들 사이의 관계에 대한 '심각한 깊이'가 허용될 것이다. 학생, 교직원 및 기관 전체의 리더십 위치에 있는 사람들을 포함한 조직 내의 다른 관점을 데이터 소스로 포함하면 FD가 수행하는 위치와 역할에 대한 이해가 더욱 풍부해질 수 있습니다.Future studies should consider examining how organizational factors impact the practice of faculty development across different contexts and settings. As noted above, utilizing qualitative approaches to data collection would allow for a ‘deeper dive’ into each of the themes and the relationships between them. Bringing in other perspectives within an organization, including students, faculty members, and those in leadership positions across the institutions as sources of data, could further enrich the understanding of the positionality and role that FD plays.

결론
Conclusion


많은 기관에서 FD에 대한 권한이 확대됨에 따라, FD를 학술 사명에 대한 가치 있는 기여자로 인정하고 적절히 자원을 조달하는 것이 필수적이다.
With a broadening mandate for FD in many institutions, it is imperative that it is appropriately resourced and accompanied by recognition of FD as a valued contributor to the academic mission.

 


 

 

Med Teach. 2021 Aug;43(8):894-899. doi: 10.1080/0142159X.2021.1931078. Epub 2021 May 31.

 

 

Viewing faculty development through an organizational lens: Sharing lessons learned

Affiliations collapse

Affiliations

1Office of Professional Development and Educational Scholarship, Faculty of Health Sciences, Queens University, Kingston, Canada.

2Office of Educational and Faculty Development, University of Manitoba, Winnipeg, Canada.

3Department of Paediatrics, University of Toronto, Toronto, Canada.

4Department of Psychiatry, Dalhousie University, Halifax, Canada.

5Faculty of Medicine, University of British Columbia, Vancouver, Canada.

6School of Medicine, University of Calgary, Calgary, Canada.

PMID: 34057867

DOI: 10.1080/0142159X.2021.1931078

Abstract

Introduction: Faculty Development (FD) plays a key role in supporting education, especially during times of change. The effectiveness of FD often depends upon organizational factors, indicating a need for a deeper appreciation of the role of institutional context. How do organizational factors constrain or enhance the capacity of faculty developers to fulfil their mandates?

Methods: Using survey research methodology, data from a survey of FD leaders at Canadian medical schools were analyzed using Bolman and Deal's four frames: Symbolic, Political, Structural, and Human Resource (HR).

Results: In the Symbolic frame, FD leaders reported lack of identity as a FD unit, which was seen as a constraining factor. Within the Political frame, developing visibility was seen as an enhancing factor, though it did not always ensure being valued. In the Structural frame, expanding scope of practice was seen as an enhancing factor, though it could also be a constraining factor if not accompanied by increased resources. In the HR frame, a sense of instability due to changing leadership and uncertainty about human resources was seen as a constraining factor.

Conclusion: While broadening the mandate of FD can generally be considered as positive, it is imperative that it is appropriately resourced and accompanied by recognition of FD as a valued contributor to the educational mission.

Keywords: Best evidence medical education; continuing; postgraduate; staff development; teaching & learning; undergraduate.

역량 기반, 시간 변동 의학교육시스템의 평가를 위한 강화된 요구조건 (Acad Med, 2018)
Enhanced Requirements for Assessment in a Competency-Based, Time-Variable Medical Education System
Larry D. Gruppen, PhD, Olle ten Cate, PhD, Lorelei A. Lingard, PhD, Pim W. Teunissen, MD, PhD, and Jennifer R. Kogan, MD 

 

 

역량 기반 의료 교육(CBME)은 교사, 학습자 및 규제 기관으로부터 상당한 관심을 받고 있다. 그것은 커리큘럼 디자이너, 교수 개발자, 임상의 교육자 및 프로그램 관리자의 인식과 관행을 변화시켰다. CBME는 평가에 특히 중요한 영향을 미친다. 
Competency-based medical education (CBME) has captured considerable attention from teachers, learners, and regulatory bodies. It has changed the perceptions and practices of curriculum designers, faculty developers, clinician educators, and program administrators. CBME has particularly significant implications for assessment.

2010년, 프랭크 등은 CBME를 "시간을 덜 강조하는 역량의 organizing framework를 사용하여, 의료 교육 프로그램의 설계, 구현, 평가 및 평가에 대한 성과 기반 접근법"으로 정의했다. 이 정의는 전통적인 교육 모델 간의 대비를 강조한다. 전통적 모델은 "고정 시간, 가변 결과"로 특징지을 수 있고, CBME는 "고정 결과, 가변 시간"으로 묘사될 수 있다. 품질 관리와 환자 안전의 표준을 보장하기 위해 고정된 결과가 필요하기 때문에, [시간 변동성]은 CBME에 논리적으로 함축되어 있다.개별 학습자는 다양한 준비와 기술을 가지고 의학 교육에 오고, 다양한 속도로 역량을 추구, 달성, 입증하기 때문에 재교육이나 가속이 필요하다. 근본적으로, CBME는 그 직업에 대한 [대중의 기대]를 충족시키기 위한 약속을 지키기 위한 접근법으로 볼 수 있다.
In 2010, Frank et al1,2 defined CBME as “an outcomes-based approach to the design, implementation, assessment, and evaluation of medical education programs, using an organizing framework of competencies” that “de-emphasizes time.” This definition highlights the contrast between traditional educational models, which can be characterized as “fixed time, variable outcomes,” and CBME, which can be described as “fixed outcomes, variable time.” Because fixed outcomes are necessary to ensure standards of quality care and patient safety, time variability is a logical implication of CBME when one recognizes that individual learners come to medical education with variable preparation and skills, pursue and attain competencies at different rates, and demonstrate their competence while possibly needing remediation or acceleration.3–5 Fundamentally, CBME can be seen as an approach to honor the commitment to meet public expectations of the profession.

이 기사에서는 평가에 대한 시간 변동성의 영향을 살펴볼 것이다. 평가는 대부분의 전통적인 프로그램보다 CBME 프로그램(특히 졸업후 과정)에서 훨씬 더 중요하다. 전통적인 프로그램은 훈련의 특정 기간이 역량으로 이어진다고 가정한다. 따라서 평가는 대체로 "안전 점검safety check"이다. 그러나 이러한 가정은 특정 결핍 영역과 개선이 필요한 부분을 식별하는 평가 데이터 자체에서 [정해진 기간 동안 역량을 획득하거나 확립하지 못한 개별 학습자 사례]가 확임됨에 따라 무너지고 있다. CBME 프로그램에서는, 이러한 가정을 하지 않기에, 학습자의 진행 궤적이 보다 개인화되고, 평가는 훈련 기간에서 결과적인 차이를 정당화해야 하는 상당한 부담을 져야 한다.
In this article, we will explore the implications of time variability for assessment. Assessment is even more important in CBME programs than in most traditional programs, particularly postgraduate ones. Traditional programs assume that a specified period in training will lead to competence; thus, assessment is largely a “safety check.” However, this assumption is crumbling under the weight of individual learner cases in which competence was not acquired in the set period of time and not established from the assessment data itself, which identify specific areas of deficiency and needed remediation. In CBME programs, which do not make this assumption, the learners’ progression trajectories are more individualized, and assessment must bear the significant burden of justifying consequential differences in length of training.

CBME의 평가 원칙
Principles of Assessment in CBME

CBME는 [시간을 상수가 아닌 변수]로 취급하기 때문에 학습자가 다음 교육 단계로 넘어갈 준비가 된 시점을 결정하는 대안적 방법이 필요하다. 이 방법은 역량 평가와 판단에 기초한다. 역량은 다음과 같이 정의됩니다.
Because CBME treats time as a variable rather than a constant, it requires an alternative method for deciding when a learner is prepared to move on to the next phase of education. This method is predicated on assessing and judging competence. Competence is defined as:

특정 상황에서 의사 수행의 여러 영역 또는 측면에 걸친 능력의 배열. 역량에 대한 진술은 관련 능력, 상황 및 훈련 단계를 정의하기 위한 서술적 자격자를 필요로 한다. 역량은 다차원적이고 역동적입니다. 그것은 시간, 경험, 그리고 환경에 따라 변한다.
the array of abilities across multiple domains or aspects of physician performance in a certain context. Statements about competence require descriptive qualifiers to define the relevant abilities, context, and stage of training. Competence is multi-dimensional and dynamic. It changes with time, experience, and setting.1

시간 변동성은 대부분의 기존 프로그램에 비해 더 크고 더 다양한 요구 사항인 평가 프로세스에 상당한 요구 사항을 부과한다. 우리는 이러한 요구에 대한 우리의 검토를 안내하기 위해 현대적인 평가 타당성 프레임워크를 사용할 것이다.
Time variability places considerable demands on the assessment process, demands that are both larger and more varied than is typical for most traditional programs. We will use a modern assessment validity framework5–7 to guide our examination of these demands.

한 가지 핵심 원칙은 [평가는 항상 우리가 판단하려는 목표target, 즉 구인construct을 가지고 있다]는 것입니다. 구인construct은 무형이며, 교육, 성과, 판단 등에 대한 우리의 이론에 기초한다. 의학에서 평가를 위한 일반적인 구인은 지식, 전문성, 의사소통, 팀워크, 그리고 많은 다른 것들이 있다. CBME는 역량이 우리가 판단하고 데이터를 수집해야 하는 핵심 구조라고 가정한다.
A key principle is that assessment always has a target, a construct about which we are trying to make a judgment. Constructs are intangible and based on our theories of education, performance, judgment, etc.8 Common constructs for assessment in medicine are knowledge, professionalism, communication, teamwork, and numerous others. CBME posits that competencies are the key constructs about which we need to make judgments and for which we need to gather data.


두 번째 핵심 원칙은 [평가 데이터와 그 데이터로부터 이루어지는 평가 판단 사이의 구별]이다. 객관식 지식 테스트에서 평가 데이터(점수)는 종종 평가 판단 및 결정(합격/실패, 교정조치, 표창)과 구별된다. 대조적으로, 임상 분야에서 [평가 데이터에 기반한 평가 판단]은 덜 명확해질 수 있다. 교수진 관찰자는 성과를 평가할 때 종종 평가 데이터의 출처이다. 학습자의 코치 또는 옹호자, 그리고 이러한 데이터를 사용하는 심판은 학습자가 유능한지 여부(즉, 이정표를 달성했고, 진급할 수 있다 등)를 결정한다. 측정 도구(양식, 점검표)는 이러한 판단에 대한 데이터를 제공할 뿐이며, 목적 자체가 아니라 이 더 큰 목적을 위한 수단일 뿐이다.
A second key principle is the distinction between assessment data and the assessment judgments that are made from those data. In a multiple-choice test of knowledge, assessment data (the scores) are often distinct from the assessment judgments and decisions (pass/fail, remediation, commendation). In contrast, assessment judgments based on assessment data in the clinical arena can become less obvious. The faculty observer is often the source of the assessment data when evaluating performance; the coach or advocate of the learner and the judge making use of those data decide whether the learner is competent—that is, has achieved a milestone, can progress, etc.9 The measurement tool (form, checklist) merely provides data for these judgments and is only a means to this greater end, not the end itself.

세 번째 핵심 원칙은 [판단의 결과consequence]인 [결정]에 관한 것이다. 일반적인 교육 테스트 환경에서, 이 결정은 학생들의 진도나 졸업장을 받는 것과 관련이 있다. 임상 교육에서, [평가에 따른 결정]은 피드백이나 환자 치료에서 [더 적은 감독 하에 의료행위를 할 수 있는 허가(즉, 학습자가 특정 감독 수준에서 행동하도록 위임받을 수 있는 결정)]를 초래할 수도 있다. 평가 결정은 다음과 같을 수 있다.

  • 총괄적 또는 고부담적 결정(예: 졸업) 또는 
  • 형성적 또는 저부담된 결정(예: 학습자가 자신의 학습을 지도하는 데 사용할 수 있는 성과 피드백).

A third key principle regards the decision that is the consequence of the judgment. In usual educational testing settings, this decision pertains to student progress or to receiving a diploma. In clinical education, the decision resulting from an assessment may also result in feedback or the permission to act with less supervision in patient care (i.e., to a decision that a learner can be entrusted to act at a specified level of supervision).10 Assessment decisions may be

  • summative or high-stakes decisions (e.g., graduation) or
  • formative, low-stakes decisions (e.g., performance feedback that a learner may use to guide her or his own learning).

평가 데이터 수집에 대한 영향
Implications for Gathering Assessment Data

평가 작업
Assessment tasks

역량을 직접 평가할 수 없기 때문에, 우리는 어떤 방식으로든 관찰하고 측정할 수 있는 행동을 생성하는 [구인 관련 작업이나 활동]을 정의해야 한다. 이러한 작업은 (지식 테스트 설문에서) 질문에 대답하는 것만큼 간단하거나 환자 및 그녀의 가족과 완화 치료에 대해 논의하는 것만큼 복잡할 수 있다. 이러한 [작업의 선택]은 우리의 평가 판단의 타당성에 심오한 결과를 초래한다. 좋은 평가 판단에는 다양한 평가 방법을 사용하는 관련 직무의 다양한 데이터 소스가 필요하다. 평가 절차의 신중한 청사진은 평가 판단의 질을 향상시킬 것이다.
Because we cannot assess competencies directly, we must define construct-relevant tasks or activities that produce behaviors that we can observe and measure in some way. These tasks can be as simple as answering a question (in a survey of knowledge test) or as complex as discussing palliative care with a patient and her family. The selection of these tasks has profound consequences for the validity of our assessment judgments. Good assessment judgments require multiple sources of data from a range of relevant tasks that use a variety of assessment methods.9 Thoughtful blueprinting of assessment procedures will improve the quality of assessment judgments.

전문가의 의견이 항상 일치하는 것은 아니지만, 임상 교육생에 대한 타당한 평가 결정을 내리는 데 점점 더 가치가 있고 심지어 필요한 것으로 간주되고 있다. 이러한 의견은 개별 임상의(평가자)가 진정한 작업 환경에서 훈련생과 상호작용하고 신뢰를 얻는 방법에 대한 평가 데이터 수집의 조정이 필요하다. 이것은 부분적으로 위탁 의사 결정과 관련된 새로운 조사 영역이다. 
Despite the fact that expert opinions do not always agree, they are increasingly considered valuable and even necessary to arrive at valid assessment decisions regarding clinical trainees.11,12 Such opinions require the alignment of assessment data gathering with how individual clinicians (as assessors) interact with and gain trust in trainees in the authentic work environment.13,14 This is a new domain of investigation15 related in part to entrustment decision making.16–18

평가 혁신
Innovation in assessment

CBME 프로그램은 [데이터를 통합하고 사용하기 위한 평가 방법과 절차에 대한 혁신과 실험을 안내하는 평가 전문성]이 필요하다. CBME의 완전한 약속이 실현되려면 평가, 데이터 분석, 정보 관리, 의사결정 지원 분야의 전문성을 개발하거나 채용해야 할 것이다. CBME는 우리가 임상 성과에 대한 수시적이고 미리 예정된 필기 또는 수행 검사와 단편적인 교수진 평가에 계속 의존한다면 실행 가능하지 않을 것이다. 이는 결국 전반적인 예산 제약에 직면하여 자원 재분배가 필요할 것이다.
CBME programs will need assessment expertise to guide innovation and experimentation in assessment methods and procedures for integrating and using the data. It will become necessary to develop or recruit expertise in assessment, data analytics, information management, and decision support if the full promise of CBME is to be realized. CBME will not be viable if we continue to depend on occasional, prescheduled written or performance examinations and fragmentary faculty evaluations of clinical performance. This will, in turn, require resource reallocation, often in the face of overall budgetary constraints.

우리가 확립되고 혁신적인 [다양한 평가 방법을 개발하고 사용하기로 약속]한다면, CBME는 현재 무시되고 있는 자연스럽게 발생하는 평가 데이터를 활용할 수 있다. 다음을 포함한다.

  • 학습자 제품(예: 전자 건강 기록의 항목) 
  • 팀 기반 성과(예: 멀티소스 피드백 기반) 
  • 관리 데이터(예: 사전 자격 및 시험, 수행된 활동) 
  • 교수진 판단(예: mini-CEX, 기타 관찰, 사례 기반 논의) 
  • 현재 높은 수준의 종합 평가 결정을 위한 "충분히 좋은" 것으로 간주되지 않을 수 있는 다른 평가 기회. 

단일 관측 사건은 높은 심리 측정 기준을 요구하지만, 각각 표준화되거나 신뢰성 있게 재현할 수 없는 여러 측정 조합으로 일반화 가능한 결과를 산출할 수 있다. 원칙적으로, 신뢰할 수 있는 전문 활동(EPA)의 개념은 이 점을 보여준다. 자연적으로 발생하는 과제(예: 건강 유지 검사를 위한 위험 요소 평가 수행)로서 EPA는 지침과 평가 과제의 단위 또는 초점일 수 있다.
If we commit to developing and using a variety of established and innovative assessment methods, CBME can take advantage of naturally occurring assessment data that are presently neglected. These include

  • learner products (e.g., entries in an electronic health record),
  • team-based performance (e.g., based on multisource feedback),
  • administrative data (e.g., prior qualifications and tests, activities performed),
  • faculty judgments (e.g., mini-CEX, other observations, case-based discussions), and
  • other assessment opportunities that may not be presently thought of as “good enough” for high-stakes, summative assessment decisions.9 

While single observation events require high psychometric standards, multiple measures in combination, each of which may not be standardized or reliably reproducible, may yield generalizable results.19 In principle, the notion of the entrustable professional activity (EPA)20 illustrates this point. As a naturally occurring task (e.g., conducting a risk factor assessment for a health maintenance examination), an EPA can be both a unit or focus of instruction and an assessment task.

[환자 결과]는 [역량 결정]에 통합될 수 있고, [환자 경험 향상, 인구 건강 개선, 비용 절감]이라는 3중 목표를 해결하고자 하는 [평가의 유효성]을 향상시키는 매우 중요한 다른 평가 데이터 소스를 제공한다. 그러나 [환자 결과를 교육 활동과 연결하는 것]은 매우 복잡합니다. 이러한 데이터를 수집하고, 결과에 대한 교육생의 기여를 이해하고, 이러한 데이터가 개인에 대한 역량 결정에 어떻게 정보를 제공해야 하는지 확립하는 것은 CBME의 연구 의제의 일부로 남아 있다.
Patient outcomes offer other, critically important sources of assessment data that can be incorporated into competency decisions21 and enhance the validity of assessments that seek to address the triple aim of enhancing the patient experience, improving population health, and reducing costs.22 However, linking patient outcomes to educational activities is extremely complex.23–26 Gathering such data, understanding trainees’ contributions to the outcomes, and establishing how these data should inform competency decisions about individuals remain part of the research agenda for CBME.27

평가의 시간 유연성
Time flexibility in assessment

CBME [학습 과정]에서 시간이 고정된 양이 아니라면, [평가]에서도 시간이 고정될 수 없다. 역량 판단이 언제든지 이루어질 수 있기 때문에, 평가 데이터는 그러한 판단에 사용할 수 있어야 하며, 따라서 (거의) 지속적으로 수집되어야 한다. 특히 학습자에게 피드백을 제공하는 데 있어 평가 데이터의 형태적 용도는 공연의 설정 및 시간과 밀접하게 연계되어야 한다. 형성적 피드백은 교사와 학습자 사이의 대화를 필요로 하며, 따라서 이러한 대화와 관련된 평가를 필요로 한다. 이러한 평가는 교수진에게 시간이 많이 소요되며 CBME를 구현하기 위한 상당한 잠재적 비용을 구성한다.
If time is not a fixed quantity in the CBME learning process, it also cannot be fixed in assessment. Because competency judgments can be made at any time, assessment data need to be available for those judgments and thus gathered (more or less) continuously. In particular, the formative uses of assessment data in providing feedback to learners need to be linked closely to the setting and time of the performance. Formative feedback requires a dialogue between teacher and learner28 and, thus, assessments that are tied to those dialogues. Such assessments are time consuming for faculty and constitute a significant potential cost for implementing CBME.

또한 [시간-유연 평가]는 특히 개별화된 학습 순서나 계획을 추구하면서 [다수의 학습자에 대한 공식 평가(예: 졸업에 필요한 객관적인 구조화된 임상 검사)]를 계획하는 데 있어 [행정 및 물류 리소스]에 상당한 요구를 부과한다. 유연하고 지속적인 평가는 특히 고위험 평가의 엄격한 스케줄링을 수용하기 어렵다. CBME가 요구하는 평가 유연성의 향상은 관련 심사 기관의 중요한 조직 변경을 필요로 할 것이다. 그러나 시간 변동성은 그러한 측면에서 유익할 수도 있다. 교육 모듈의 고정된 길이로 인해, 짧은 시간 내에 여러 학습자를 평가해야 하는 상당한 압력이 있는 반면, 가변적인 길이는 시간이 지남에 따라 평가 노력을 더 고르게 분산시킬 수 있다.
Time-flexible assessment also imposes considerable demands on administrative and logistical resources, particularly in trying to schedule formal assessments (e.g., objective structured clinical examinations required for graduation) for large numbers of learners who are pursuing individual learning sequences or plans. Flexible and continuous assessment is particularly difficult to accommodate with the rigid scheduling of high-stakes assessment. The increased assessment flexibility required by CBME will necessitate significant organizational changes in the relevant examination bodies. However, time variability may also be beneficial in that respect. With the fixed length of training modules, there is significant pressure to evaluate multiple learners in a short period of time, whereas variable length could spread assessment effort more evenly over time.29

평가 데이터 관리
Managing assessment data

CBME 평가에는 더 자주 수집되고 가변적인 일정에 따라 수집되는 [여러 소스의 데이터]가 필요하기 때문에, 일반적인 기존 평가 시스템보다 더 높은 수준의 데이터 공유, 관리 및 통신이 필요합니다. 프로그램 내 및 프로그램 간에 교육생의 평가 데이터를 전달하는 물류 및 윤리는 아직 많은 관심을 받지 못한 필수 과제입니다. 성과 및 평가 데이터의 전자 포트폴리오가 솔루션의 일부일 수 있지만, 표준화가 부족하여 기관마다 상당히 가변적입니다. 학습 분석은 이러한 데이터 관리 및 분석을 지원하는 역할을 할 수 있으며, 모바일 기술은 임상 활동의 자연스러운 과정에서 데이터 수집에 사용될 수 있다. 웜 등은 36만 개의 데이터 포인트로 3년 동안 약 200명의 내과 레지던트들을 추적할 수 있는 가능성을 입증했다. CBME는 30년 이상의 전문 실무 및 학습에 걸쳐 프로그램 및 이해관계자(학습자 포함) 간에 역량 평가 정보를 해석하고 공유하기 위한 시스템을 다루어야 한다.
Because CBME assessment requires data from multiple sources that are gathered more frequently and on variable schedules, it requires a greater level of data sharing, management, and communication than is typical of more traditional assessment systems.30 The logistics and the ethics of communicating a trainee’s assessment data within and across programs is a necessary challenge that has not yet received a great deal of attention.31–33 Electronic portfolios of performance and assessment data may be part of the solution, but they lack standardization, being quite variable from one institution to the next. Learning analytics may serve to support such data management and analysis,34 and mobile technology may be used for the collection of data in the natural course of clinical activities. Warm et al35 demonstrated the feasibility of tracking almost 200 internal medicine residents over three years with 360,000 data points. CBME will need to address systems for interpreting and sharing competency assessment information across programs and stakeholders (including learners) that may span more than 30 years of professional practice and learning.

맥락 특이성
Context specificity

맥락 특이성은 [실제 실행 중에 발생하는 복잡한 수행능력에 대한 모든 평가의 문제]이다. 널리 알려진 사실 중 하나는 [하나의 설정, 상황 또는 사례]에서 성과를 평가하는 것이, [유사한 사례]에서도 성과를 완벽하게 예측하지 못한다는 것이다. 맥락 특이성은 의미 있고 신뢰할 수 있는 성능 추정치를 얻기 위해 다양한 맥락에서 여러 사례에 대해 여러 관찰자에 의해 여러 평가가 수행되어야 한다. 전자 포트폴리오와 모바일 기술은 다양한 맥락에서 진행 상황에 대한 피드백, 형성적 평가 및 종합적 결정을 제공하기 위해 직장에서의 자연스러운 만남을 포착하는 데 도움이 될 수 있다. 
Context specificity is a problem for all assessments of complex performance that take place during real-world practice. A pervasive finding is that an assessment of performance in one setting, situation, or case does not perfectly predict performance in even a similar case. Context specificity requires that multiple assessments be done by multiple observers over multiple cases in a variety of contexts to obtain a meaningful and trustworthy estimate of performance. E-portfolios and mobile technology could help capture natural encounters in the workplace to provide feedback, formative assessment, and summative decisions regarding progress in various contexts.36

[맥락 특이성]에 더하여, 평가 데이터는 전문적 정체성 형성과 같이 [쉽게 정의할 수 없는 역량의 "암묵적" 구성요소]의 존재에 의해 제한될 수 있다. 이러한 결정을 지원하는 데 있어 [평가의 본질적인 불확실성과 부정확성]을 잊어서는 안 된다.
Along with context specificity, assessment data may be limited by the existence of “implicit” components of competence that may not be easily definable, such as professional identity formation. The inherent uncertainty and imprecision of assessment in aiding these decisions must not be forgotten.

평가 판단에 미치는 영향
Implications for Making Assessment Judgments

형성적 및 종합적 판단
Formative and summative judgments

평가 판단의 범위는 학습자와 교육 시스템에 미치는 영향이다.

  • [고부담(총괄) 판단]에는 과정 합격 또는 불합격, 학습자 졸업 또는 유지, 교육과정 변경에 대한 투자, 역량에 대한 결정이 포함된다.
  • [저부담(형성) 판단]에는 학생 자기조절 학습을 안내하기 위한 피드백, 많은 이러닝 모듈에 포함된 것과 같은 자체 테스트, 진행 테스트 등이 포함된다.

Assessment judgments range in the impact they have on the learner and the educational systems.

  • High-stakes (summative) judgments include decisions about passing or failing a course, graduating or retaining a learner, investment in curricular changes, and decisions about competence.
  • Low-stakes (formative) judgments include feedback to guide student self-regulated learning, self-testing such as is included in many e-learning modules, and progress testing.37

CBME에서, 형성적 결정과 종합적 결정은 동일한 스펙트럼의 다른 끝으로 볼 수 있다.

  • 훈련 초기에는 격차를 해소하고 강점을 강조하는 방법에 대한 [형성적 지침]을 제공할 목적으로 평가될 수 있다.
  • 보다 상급 학습자는 자신의 진행 또는 교정과 관련된 종합적인 결정을 위해 동일한 방법으로 평가될 수 있다.

중요한 것은, 동일한 평가 데이터가 형성적 또는 요약적 판단에 사용될 수 있다는 것이다.—평가 활동 자체는 형성적이거나 종합적이지 않습니다. 그러나 종합적 판단과 결정에는 일반적으로 형성적 판단보다 더 많은 양의 고품질 평가 데이터가 필요하다.
In CBME, formative and summative decisions can be viewed as different ends of the same spectrum.

  • A learner early in her training may be assessed for the purpose of providing formative guidance on how to address gaps and accentuate strengths.
  • A more advanced learner may be assessed with the same method for a summative decision related to his progression or remediation.

Importantly, the same assessment data can be used for either formative or summative judgments—an assessment activity, per se, is neither formative nor summative. However, summative judgments and decisions generally require greater amounts of higher-quality assessment data than do formative judgments.

프로그램적 평가 문헌에서, 각각 개별적으로 학습을 자극하는 역할을 하는 일련의 형성적 평가는 함께 종합 결정(또는 학습 평가라고 불리는 것)을 내리는 역할을 할 수 있다. 마찬가지로, 위탁 결정은 보건의료 업무에서 교육 목적을 위한 학습자에 대한 임시 평가의 일부와 보건의료 업무 인증에 대한 요약 결정의 일부로 식별되었다. 

In the programmatic assessment literature, a series of formative assessments, each of which separately serves to stimulate learning (an approach labeled assessment for learning), together may serve to make summative decisions (or what is called assessment of learning).38 Similarly, entrustment decisions have been identified as part of ad hoc assessments about learners for training purposes in health care tasks and as part of summative decisions about certification for health care tasks.10,20

평가기준 및 기준
Assessment standards and criteria

[총괄적 판단]은 확실한 평가 데이터뿐만 아니라, [결정을 정의하는 성과에 대한 표준이나 기준(유능한 것과 그렇지 않은 것)]도 필요로 한다. 이러한 표준은 정량적이며 Angoff 또는 Hofstee 방법과 같은 공식적인 그룹 판단 절차에 의해 도출될 수 있으며, 또는 정성적일 수 있으며 필요한 감독 또는 이정표 달성에 기초하여 주어진 성과 수준을 설명할 수 있다. CBME에서 식별되는 [복잡한 역량]은 [전통적인 표준화된 심리 측정법]에 쉽게 의존하지 않기 때문에, 교수진의 "주관적" 판단을 체계화하는 데 상당한 노력이 기울여졌다. 이러한 노력에는 등급 척도에 대한 행동 앵커, "유능한" 성과에 대한 상세한 설명, 이정표와 같은 공통 기준의 교직원 개발을 포함한다. 슈워트 등은 또한 심리측정학 이론에 따르면 신뢰할 수 없는 것처럼 보이지만, 개별 교수 평가자의 다중 "주관적" 평가가 학습자에게 다중적이고 의미 있는 관점에 기여할 수 있다고 강조했다.
Summative judgments require not only solid assessment data but also a standard or criterion for performance that defines the decision (competent vs. not competent). These standards may be quantitative and derived by formal group judgment procedures, such as Angoff or Hofstee methods,39 or they may be qualitative and describe a given performance level based on needed supervision or milestone achievement.40 The complex competencies identified by CBME do not readily lend themselves to traditional standardized psychometrics, so considerable effort has been devoted to systematizing more “subjective” judgments (whether qualitative or quantitative) on the part of faculty. These efforts include behavioral anchors for ratings scales, detailed descriptions of what “competent” performance looks like, and faculty development to calibrate faculty to a common set of criteria, such as milestones.41 Schuwirth et al12,30,42 also have emphasized that multiple “subjective” assessments from individual faculty raters may contribute multiple, meaningful perspectives on a learner, in spite of appearing unreliable according to psychometric theory.

EPA 및 위탁 결정
EPAs and entrustment decisions

CBME를 구현하기 위한 논리적 필수는 아니지만, EPA는 많은 CBME 시스템의 핵심 측면으로 부상했다. EPA는 학습자가 적절한 성과를 입증한 후 감독되지 않은 실행을 위해 학습자에게 위임하는 전문 관행의 단위로 정의되어 왔다. EPA의 주요 특징 중 하나는 전문직의 진정한 일상 업무와 이러한 업무를 완료하는 학습자의 성과를 관찰하고 평가할 수 있는 기회 사이의 연결이다.
Although not a logical necessity for implementing CBME, EPAs have emerged as a key aspect of many CBME systems. EPAs have been defined as units of professional practice to be entrusted to learners for unsupervised execution once they have demonstrated adequate performance.43 One of the key features of EPAs is the link between authentic, often-everyday tasks of a profession and the opportunities to observe and assess learners’ performance completing those tasks.

EPA 개념의 핵심 요소는 위임이다. 위임을 위해서는 교수진과 평가자가 학습자의 성과와 평가자의 기대 및 과제/EPA의 성격을 통합하는 판단을 내려야 한다. 중요한 전문적 기준의 맥락에서 평가자의 전반적인 판단을 포착하기 때문에 [매우 실용적인 가치(학습자가 이 과제를 독립적으로 수행할 수 있을 정도로 "신뢰할 만trustworthy"합니까?)]가 있고, 판단은 학습자가 필요로 하는 감독량의 추정에 기초한다.
A key component of the EPA concept is entrustment. Entrustment requires that faculty and assessors make a judgment that integrates learner performance with assessor expectations and the nature of the task/EPA. It has enormous practical value because it captures the assessor’s overall judgment in the context of an important professional criterion—Is the learner “trustworthy” to do this task independently?—and the judgment is based on an estimation of the amount of supervision the learner requires.

[과제를 독립적으로 수행하기 위한 학습자의 위임]은 교육 프로그램을 위해 식별된 각 EPA의 목표가 될 수도 있고 아닐 수도 있다. 기대에 따라 일부 EPA는 프로그램이 끝날 때까지 완전히 숙달되지 않을 수 있다. 그러나 CBME 프레임워크 하에서 개별 학습자는 특정 기술, 동기 부여 또는 학습 기회 때문에 프로그램이 끝나기 훨씬 전에 "감독되지 않은 연습"의 완전한 위탁에 대한 충분한 숙달에 도달할 수 있다.
Entrustment of a learner to perform a task independently may or may not be the goal for each EPA identified for an educational program. Depending on expectations, some EPAs may not be fully mastered by the end of the program. However, under a CBME framework, individual learners may exceed program expectations and attain sufficient mastery for full entrustment of “unsupervised practice” long before the end of the program because of particular skills, motivation, or learning opportunities.

EPA는 [학습자가 책임을 질 준비가 되는 즉시 책임을 부여하기 위한 프레임워크]를 제공한다. 선행 학습과 학습 경험의 순서 차이 때문에, 모든 학습자가 동일한 속도로 목표 역량을 획득하는 것은 아닙니다. 따라서 EPA 마스터에 필요한 시간의 변화는 개별화된 훈련 경로를 필요로 할 수 있다. 개별 EPA 마스터링의 시간 변동성이 전체 프로그램 시간의 변동성에 반드시 기여하는 것은 아니다. 개별 학습자가 마스터해야 하는 EPA의 가변 개수는 전체 프로그램 시간에도 영향을 미칠 수 있다.
EPAs provide a framework for granting responsibility as soon as learners are ready for it. Not all learners will attain the targeted competencies at the same rate because of prior learning and differences in sequencing of learning experiences. Therefore, variation in the time required to master EPAs may require individualized training pathways.44 Time variability in mastering individual EPAs is not necessarily the only contribution to variability in total program time; the variable number of EPAs that need to be mastered by an individual learner also may affect the total program time.

위탁 결정은 평가 결과로서 이분법적(위탁 대 비위탁)이거나 평가를 위한 개발 프레임워크를 수용하기 위해 증분적incremental일 수 있다. 서로 다른 수준의 위탁은 다음과 같이 서로 다른 수준의 독립성 또는 감독을 반영할 수 있다. 

  • 관찰만 가능
  • 직접 감독(실내)과 함께 EPA에 참여 
  • 간접 감독(실내에서는 아니지만 신속하게 이용 가능)으로 참여
  • 원격 감시를 빨리 할 수 없는 상황에서 참여

Entrustment decisions, as an assessment outcome, can be dichotomous (entrusted vs. not entrusted) or incremental to accommodate a development framework for assessment. Different levels of entrustment may reflect different levels of independence or supervision, such as

  • the learner observing only,
  • participating in the EPA with direct supervision (in the room),
  • participating with indirect supervision (not in the room but quickly available), and
  • with distant supervision not quickly available.45

평가의 목적이 임상 실무에서 EPA에 대한 위탁 결정을 내리는 것으로 정의되고, 이 평가의 규모가 학습자가 요구하는 감독 양으로 프레임화되는 경우, 평가 도구를 만들 수 있다. 초기 연구는 이러한 구성 정렬 접근법이 유리한 타당성 증거를 보여준다는 것을 발견했다. 그러나 덜 집중적인less intensive 감독을 위한 교수 관찰자의 기준에서 개인의 차이를 인정하는 것이 중요하다. [교수 판단자faculty judges의 변동성]은 이러한 위탁 판단의 [타당성에 대한 위협]이다.
If the purpose of assessment is defined as making entrustment decisions for EPAs in clinical practice and the scale of this assessment is framed as the amount of supervision the learner requires, assessment instruments can be created. Early studies have found that these construct-aligned approaches13 show favorable validity evidence.14,46,47 However, it is important to acknowledge individual differences in faculty observers’ criteria for less intensive supervision. Variability among faculty judges is a threat to the validity of these entrustment judgments.

전환 및 개별 계획
Transitions and individual plans

교수진과 연구자는 의학 교육에서 한 단계에서 다른 단계로 전환하고 있는 학습자가 [준비 상태가 적절한지 확인하는 것]이 일반적입니다. 학부생에서 대학원생으로, 대학원생에서 펠로우십 프로그램으로, 또는 감독되지 않은 실습으로. 이러한 [준비의 격차gaps in preparation]는 의대생들의 인턴십 전환을 위한 준비를 돕기 위한 부트캠프 등 다양한 대응으로 이어지고 있다. 비슷하게, 많은 레지던트 프로그램들은 처음에 몰입 경험을 가지고 있다. CBME 평가는 성과에 대한 더 명확한 기대치와 학습자의 강점과 약점에 대한 더 나은 데이터를 제공하여, [교정 및 조기 학습 계획]이 그룹 전체에 대한 필요성보다는, [개별적인 필요에 맞게 조정]될 수 있도록 함으로써 이러한 노력에 도움이 될 수 있다.
It is common for faculty and researchers to identify inadequate preparation in learners who are transitioning from one phase to another in medical education: from undergraduate to graduate education,48,49 from graduate to fellowship programs,50 or into unsupervised practice.51 These gaps in preparation have led to a variety of responses, including boot camps to help prepare medical students for the transition to internship.52 Similarly, many residency programs have immersion experiences at their beginning. CBME assessments could aid these efforts by providing clearer expectations of performance and better data on learners’ strengths and weaknesses so that remediation and early learning plans could be adapted to individual needs, rather than to the perceived needs of the group as a whole.

평가 판단을 위한 시스템
Systems for making assessment judgments

임상 역량 위원회(CCC 또는 위탁 위원회)는 평가 결정을 위해 교수진이 협력하는 방법에 대한 혁신의 예를 제공한다. 이러한 위원회는 정의된 역량에 따라 조직된 다양한 출처와 시간으로부터 평가 데이터를 수집, 검토 및 합성한다. CCC는 이러한 평가 데이터를 사용하여 프로그램을 통해 신뢰와 진행에 대한 결정의 위험과 이익을 균형 있게 조정하면서, 각 학생의 역량에 대한 평가 판단을 내린다. 많은 CCC가 위험에 처한 훈련생 식별에 집중하는 경향이 있지만, 이러한 의사 결정 구조와 과정은 가속 학습과 조기 졸업에 관한 의사 결정에도 가능성을 가지고 있다. CBME에 특히 중요한 것은 CCC 구조가 진정으로 시간 가변적인 교육 프로세스의 구현을 지원할 것이고 지원해야 한다는 것이다.

Clinical competency committees (CCCs or entrustment committees) provide an example of innovation in how faculty collaborate around making assessment decisions.53,54 These committees collect, review, and synthesize assessment data from various sources and times, organized around defined competencies. The CCC takes these assessment data and uses them to make assessment judgments about the competence of each student, balancing the risks and benefits of the decisions about trust and progression through the program.18 Although many CCCs tend to focus on identifying at-risk trainees,53 this decision-making structure and process holds promise for making decisions regarding accelerated learning and early graduation as well.55 Of particular importance to CBME, the CCC structure would and should support the implementation of a truly time-variable education process.

결론
Conclusion

학습 성과에 대한 평가는 항상 모든 의료 교육 수준에서 필수적이지만 역량 기반 시간 가변 교육은 전통적인 요구 사항을 초과하는 평가 품질, 빈도, 목적 및 관리에 특별한 요구를 둔다. CBME 프로그램이 증가하고 성숙해짐에 따라 평가 방법 및 시스템에 대한 시간, 돈 및 인재의 투자도 증가할 것입니다. 우리는 의료 교육이 학습자, 환자 및 사회에 대한 교육 약속을 문서화할 수 있는 의무를 이행하기로 약속함에 따라 평가 분야가 향후 수십 년 동안 역동적인 혁신 영역이 될 것으로 예상한다.
The assessment of learning outcomes has always been essential to all levels of medical education, but competency-based, time-variable education places particular demands on assessment quality, frequency, purpose, and management that exceed the traditional requirements. As CBME programs multiply and mature, the investment of time, money, and talent into assessment methods and systems will also grow. We envision that the field of assessment will be a dynamic area of innovation over the next several decades as medical education commits to meeting the obligations of being able to document its educational promises to learners, to patients, and to society.

 


Acad Med. 2018 Mar;93(3S Competency-Based, Time-Variable Education in the Health Professions):S17-S21. doi: 10.1097/ACM.0000000000002066.

Enhanced Requirements for Assessment in a Competency-Based, Time-Variable Medical Education System

Affiliations collapse

Affiliation

1L.D. Gruppen is professor, Department of Learning Health Sciences, University of Michigan Medical School, Ann Arbor, Michigan. O. ten Cate is professor of medical education, Center for Research and Development of Education, University Medical Center Utrecht, Utrecht, the Netherlands. L.A. Lingard is professor, Department of Medicine, and director, Centre for Education Research & Innovation, Schulich School of Medicine & Dentistry, Western University, London, Ontario, Canada. P.W. Teunissen is professor, School of Health Professions Education, Maastricht University, Maastricht, the Netherlands, and maternal fetal medicine specialist, VU University Medical Center, Amsterdam, the Netherlands. J.R. Kogan is professor of medicine, Department of Medicine, Perelman School of Medicine at the University of Pennsylvania, Philadelphia, Pennsylvania.

PMID: 29485482

DOI: 10.1097/ACM.0000000000002066

Abstract

Competency-based, time-variable medical education has reshaped the perceptions and practices of teachers, curriculum designers, faculty developers, clinician educators, and program administrators. This increasingly popular approach highlights the fact that learning among different individuals varies in duration, foundation, and goal. Time variability places particular demands on the assessment data that are so necessary for making decisions about learner progress. These decisions may be formative (e.g., feedback for improvement) or summative (e.g., decisions about advancing a student). This article identifies challenges to collecting assessment data and to making assessment decisions in a time-variable system. These challenges include managing assessment data, defining and making valid assessment decisions, innovating in assessment, and modeling the considerable complexity of assessment in real-world settings and richly interconnected social systems. There are hopeful signs of creativity in assessment both from researchers and practitioners, but the transition from a traditional to a competency-based medical education system will likely continue to create much controversy and offer opportunities for originality and innovation in assessment.

성격이 중요한가? 일반외과의사로서 내향성과 외향성의 경험과 인식(Teach Learn Med. 2022)
Does Personality Matter? Perceptions and Experiences of Introverts and Extraverts as General Surgeons
Victoria Luonga , Chris Shieldsb, Allison Petriec, and Katerina Neumannd

 

 

서론
Introduction

2012년, 수잔 케인은 "내향적인 사람들의 힘"이라는 제목의 TED 강연을 했습니다. 1 그녀의 책과 함께, 그녀의 강연은 서구 사회가 외향적인 사람들을 내향적인 사람들에게 해를 끼치는 것을 이상화하는 방식을 비판했고 우리는 내향적인 사람들이 제공해야 하는 것에 주의를 기울일 필요가 있다고 주장했습니다. 그 당시에, 이러한 생각들은 혁명적이었다. 그녀의 강연은 ted.com에서 2800만 번 이상 조회되었고, 더 내향적인 생활 방식과 리더십을 장려하는 학술 출판물, 대학원 작업, 책, 블로그 및 팟캐스트의 물결을 일으켰다. 
In 2012, Susan Cain gave a TED talk titled “The Power of Introverts.”1 Along with her book,2 her talk critiqued the way Western society has idealized extraverts to the detriment of introverts and argued that we need to pay attention to what introverts have to offer. At the time, these ideas were revolutionary. Her talk was viewed over 28 million times on ted.com, and sparked a wave of academic publications,3–7 graduate work,8–10 books,11–13 blogs,14 and podcasts15 emboldening more introverted styles of living and leading.

내성적인 사람들의 역량 강화와 그들의 도전 과제를 조명하는 것은 필연적으로 의학 교육으로 가는 길을 찾았다. 2015년 Davidson과 동료들은 의과대학이 대화식 교육 전략(예: 문제 및 사례 기반 학습)으로 전환하는 것이 내성적인 학습자에 비해 외향적인 학습자가 갖는 이점을 심화시킬 수 있다고 경고했다.3 교사로서의 역할에서, 저자들은 내성적인 의대생들이 종종 부적응자로 느껴지고, 오해받고, 저조한 수행자로 판단되며, 의학에서 성공하기 위해 종종 더 외향적인 행동을 할 필요가 있다고 관찰했다. 연구들은 또한 의과대학의 임상 기간 동안 평가자들은 대인관계 행동의 척도에서 외향적인 사람들을 더 높게 평가하는 경향이 있다는 것을 보여주었다. 이에 대응하여, 의학 교육자들은 [내향적인 사람들이 의학에서 가지는 중요한 역할]을 옹호해왔다. 일반적으로 사교성과 같은 외향적인 특성과 연관된 응급의학과 같은 전문분야를 포함한다.
The empowerment of introverts—and spotlighting of their challenges—has inevitably found its way to medical education. In 2015, Davidson and colleagues cautioned that medical schools’ move toward interactive teaching strategies (e.g., problem- and case-based learning) may be deepening the advantages extraverted learners have over their introverted counterparts.3 In their roles as teachers themselves, the authors observed that their introverted medical students often felt like misfits, misunderstood, and judged as underperformers and often needed to act more extraverted in order to succeed in medicine.3 Studies have also shown that, during the clinical years of medical school, evaluators tend to rate extraverts higher on measures of interpersonal behavior.16 In response, medical educators have advocated for the important role introverts have in medicine6—including in specialties like emergency medicine that have typically been associated with extraverted traits like sociability and gregariousness.7

의학에 대한 내향적인 사람들의 관심이 증가했음에도 불구하고, 그 분야의 출판물은 논평, 관찰, 그리고 편집자에게 보내는 편지의 형태로 되어 있는 경향이 있다. 이러한 저자들이 제시한 주장은 대부분 성격과 의학의 성공을 연계한 선행(그리고 종종 시대에 뒤떨어진) 연구들에 의해 뒷받침되어 왔다. 실제로 의학교육에서 성격에 관한 문헌은 설문지를 사용하여 성격 특성을 다른 의료 전문분야에 일치시키는 데 초점을 맞추고 있다. 하지만, 우리는 여전히 다른 성격을 가진 사람들(내향적인 사람들과 외향적인 사람들)이 어떻게 동일한 의학 전공분야를 진정으로 경험하는지에 대해 거의 알지 못한다.
Despite this increased interest in introverts in medicine, publications within the field have tended to be in the form of commentaries, observations, and letters to the editor. The arguments these authors have put forward have mostly been supported by prior (and often outdated) studies linking personality to success in medicine and research outside the field of medical education.17–19 In reality, the literature on personality in medical education has focused on matching personality characteristics to the different medical specialties using questionnaires.17 But, we still know little about how those with different personalities (such as introverts and extraverts) truly experience the same medical specialties.

외과적 성격
The surgical personality

본 연구는 내향적인 사람들이 의학에서 직면할 수 있는 도전에 대한 중요한 논의를 더하여, 일반외과 수련에서 내향적인 사람들과 외향적인 사람들의 경험과 인식을 살펴보고자 하였다. 수술 장소는 다른 성격을 가진 사람들이 어떻게 같은 전문 분야를 경험하고 성공하는지 조사하기 위한 이상적인 맥락을 제공한다. 외과의사들은 오랫동안 대담하고, 공격적이고, 거리낌이 없고, 지배적이고, 솔직하고, 그리고 빠르게 진행되며, 책임감을 갖는 "무딘thick-skinned" 사람으로 고정관념이 되어 왔다. 비록 이러한 고정관념들이 항상 정확한 것은 아니지만, 고정관념은 [외과의사를 인식하는 방식]에 영향을 미치는 일반적인 담론에 연습생들을 노출시킬 수 있다. 가장 중요한 것은 그 안에서 번창할 수 있는 잠재력입니다. 
Adding to the important discussion of the challenges introverts may face in medicine, this study sought to examine the experiences and perceptions of introverts and extraverts in general surgical training. The surgical workplace provides the ideal context for examining how those with different personalities experience, and succeed within, the same specialty. Surgeons have long been stereotyped as bold, aggressive, uninhibited, domineering, frank, and “thick-skinned” with fast-paced and take-charge mentalities.20–24 Although stereotypes like these are not always accurate, they may expose trainees to common discourses that influence the way they perceive the profession—and, perhaps most importantly, their potential to thrive within it.22–24

또한, 많은 연구자들은 수술의 숨겨진 커리큘럼(즉 신념, 태도, 그리고 사회 문화적 규칙의 암묵적 시스템)을 묘사했고, 이에 따르면 수술장에서 성공하기 위해서는 [자신감 있고 가혹하며 단호하게 보임]으로써 언행일치를 이뤄야 한다. Ott와 동료들은 외과 레지던트들을 대상으로 한 이론 연구에서 외과의사들은 [주저하는 것]을 [지식, 자신감 및/또는 역량의 부족]으로 해석한다는 것을 발견했다. 파텔과 동료들은 외과 레지던트들이 종종 빠르고 결정적으로 결정을 내려야 한다는 압박을 느낀다는 것을 발견했다. 그러므로 [수술의 문화]는 어떤 희생을 치르더라도 [자신에 대한 나약함이나 불확실함의 느낌이 없어야(혹은 보이지 않아야)]하는 장소인 것 같다. 
In addition, a number of researchers have described the hidden curriculum of surgery (i.e., the implicit systems of beliefs, attitudes, and social and cultural rules that govern the work environment) as a place where, in order to succeed, one must learn to walk the talk by appearing confident, harsh, and assertive.25,26 In their grounded theory studies of surgical residents, Ott and colleagues found that surgeons interpret hesitation as a lack of knowledge, confidence, and/or competence.27 Patel and colleagues found that surgical residents often feel pressure to make decisions quickly and decisively.26,28 The culture of surgery thus seems to be a place where feeling (or appearing) weak or unsure of oneself is to be avoided at all costs.25–28

역사적으로, 외향적인 사람들은 외과 전문 분야를 지배하는 경향이 있었다. 외향적인 사람들은 많은 사람들과의 사회적 활동보다는 고독한 활동(또는 1:1 상호작용)에 의해 내향적이고 활력을 얻는 경향이 있는 내성적인 사람들에 비해 지배적이고 사교적이며 자신감 있고 따뜻하며 대담한 경향이 있다. 내성적인 사람들은 외향적인 상대방에 비해 조용하고, 내성적이며, 덜 적극적이고, 더 신중한 의사 결정자를 하는 경향이 있다. 또한, 내성적인 사람들의 조용함은 종종 자신감 부족으로 인식된다. 따라서 내향적인 사람들은 외과적 전문성이 특히 어렵다고 생각할 수 있지만, 이는 외과적 교육 문헌에서 아직 탐구되지 않았다.
Historically, extraverts have tended to dominate surgical specialties.17,29 Extraverts tend to be dominant, gregarious, confident, warm, and bold compared to introverts who tend to be inward-turning and energized by solitary activities (or 1:1 interactions) rather than social activities with numerous individuals. Introverts tend to be quiet, reserved, less assertive, and more careful decision-makers compared to their extraverted counterparts.30–32 As well, introverts’ quietness is often perceived as a lack of confidence.9 Therefore, one may expect that introverts may find surgical specialties particularly challenging, but this has yet to be explored within the surgical education literature.

방법
Method

우리는 구성주의 근거 이론(CGT)의 원리와 방법을 사용하여 데이터를 수집하고 분석했습니다. 이 방법을 통해 수술 분야를 [사회적 공간]으로 개념화하고, 수술에 거주하는 사람들의 [복잡한 주관적 경험]에서 오는 의미를 탐색할 수 있었다. 본 연구의 궁극적인 목표는 [새로운 설명 이론을 밝히기elucidate]보다는 데이터 분석을 위한 체계적인 방법을 사용하여 [외과 전문의의 인식과 경험에 대한 이해를 높이는 것]이었다.
We collected and analyzed data using principles and methods of constructivist grounded theory (CGT). This method allowed us to conceptualize the field of surgery as a social space and to explore the meaning that comes from the complex subjective experiences of those who inhabit it.33,34 The ultimate goal of our study was to enhance understanding of the perceptions and experiences of surgical professionals using systematic methods for data analysis rather than to elucidate a novel explanatory theory.

우리는 [리틀의 인간 발달에 대한 사회적 생태학적 모델]을 우리의 분석적 통찰력을 알리는 데 도움이 되는 민감화sensitizing 프레임워크로 사용했다. 리틀은 사람들이 종종 [개인적인 목표]를 달성하기 위해 [타고난 성향과 불일치하는 행동을 한다]고 주장했다. 예를 들어, 조용하고 보통 고독한 내성적인 대학교수는 그들의 학생들과 열정과 참여를 표현하기 위해 수업을 가르칠 때 더 큰 소리로, 더 활기차게, 그리고 더 제스처적으로 표현될 수 있다. 따라서 사람들은 시간이 지나도 안정적인 [성격 특성][성격 상태]를 모두 보여주는데, [성격 상태]는 사람이 (때로는 다른) 성격 특성의 정서적, 행동적, 인지적 측면을 반영하는 방식으로 행동함에 따라 변동할 수 있다. 게다가, 리틀의 모델은 [성격과 다르게 행동하려는 동기]가 한 개인의 [핵심 가치]와 [개인적 신념]과 밀접하게 연관되어 있다고 제안했다. 따라서 개인의 행동이 변화하는 정도(가소성이라고 함)는 각 개인에 따라 다르다. 앞의 예에서, 내성적인 교수는 그렇게 하는 것이 학생들에게 이익이 될 것이라고 진정으로 믿는 경우에만 "외향적으로 행동"할 것이다.
We used Little’s social ecological model of human development as a sensitizing framework to help inform our analytical insights.35,36 Little asserted that people often behave in discordance with their natural dispositions in order to accomplish personal goals. For instance, a quiet, usually solitary introverted university professor may speak more loudly, more energetically, and be more gesturally expressive (i.e., they can act extraverted) when teaching a class in order to portray enthusiasm and engagement with their students. People thus exhibit both personality traits, which are stable over time, and personality states, which may fluctuate as a person acts in a way that mirrors the affective, behavioral, and cognitive aspects of a (sometimes different) personality trait.37 Furthermore, Little’s model proposed that motivation to act out of character is closely linked to one’s core values and personal beliefs; the degree to which a person’s behavior varies (called plasticity38) is therefore specific to each individual. In the earlier example, the introverted professor would only “act extraverted” if they truly believed that doing so would benefit their students.

참가자
Participants

2017년 9월부터 11월까지 도시 3차 요양병원의 모든 교직원 일반외과 의사들과 일반외과 레지던트들을 연구에 참여하도록 초청하였다. 훈련생과 외과의 모두를 모집함으로써 우리는 훈련을 탐색하는 사람들과 훈련을 지도하고 평가해야 하는 사람들 모두의 관점을 얻을 수 있었다. 외과의사보다 레지던트 수와 응답률이 높아 제2차 3차 요양병원 소속 외과의사 2명도 모집했다. 우리는 두 사람의 경험을 탐색하고 비교하기 위해 외향적인 사람과 내향적인 사람을 모집했다. 외과 의사(n = 6), 레지던트(n = 10), 내성적(n = 8), 외향적(n = 6), 양향적(n = 2; 한 범주 또는 다른 범주에 깨끗하게 들어맞지 않는 것으로 정의)의 표본(N = 16)과 남성(n = 9) 및 여성(n = 7)의 개별 인터뷰를 완료했다. 레지던트 1~4세들은 연구에 참여했고, 외과의사들 사이에서는 10~31년의 경험이 있었다.
All faculty member general surgeons and general surgery residents at an urban tertiary care hospital were invited to participate in the study between September and November 2017. Recruiting both trainees and surgeons allowed us to gain the perspective of both those navigating their training and those who must guide and evaluate that training. Two surgeons from a second tertiary care hospital were also recruited due to the higher number and response rate of residents compared to surgeons. We recruited extraverts and introverts in order to explore and compare the experiences of both. A sample (N = 16) of surgeons (n = 6) and residents (n = 10); introverts (n = 8), extraverts (n = 6), and ambiverts (n = 2; which we defined as those who did not fit cleanly into one category or the other); as well as men (n = 9) and women (n = 7) completed individual interviews. Residents years 1–4 participated in the study, and years of experience ranged from 10 to 31 among surgeons.

설문지
Questionnaire

참가자들은 관련 배경 정보(예: 나이, 경험 연수)와 성격 척도(Ten-Item Personality Inventory 또는 TIPI)를 포함하는 간단한 설문지를 작성했다. 본 연구에서 성격 유형 지정은 성격이 외과적 훈련에 어떤 영향을 미칠 수 있는지에 대한 관점에 대해 다양한 성격(내향적, 외향적)을 [적절하게 샘플링했는지 확인]하는 데만 사용되었다. 우리의 목표는 내성적인 사람과 외향적인 사람 사이의 차이에 대한 결론을 도출하는 것이 아니었다. 따라서, 우리는 빠르게 완성될 수 있지만 연구의 필요성에 충분히 부합하는 성격의 척도를 선택했다. TIPI의 정신측정학적 특성은 다른 곳에서 설명되었다. 

Participants completed a brief questionnaire that included pertinent background information (e.g., age, years of experience) and a measure of personality (the Ten-Item Personality Inventory or TIPI).39 Designation of personality type in our study was used only to ensure we had adequately sampled a range of personalities (introverted, extraverted) on their perspectives of how personality may affect surgical training; our goal was not to draw conclusions about the differences between introverts and extraverts. Thus, we chose a measure of personality that could be completed rapidly but that was sufficiently valid for the needs of the study. The psychometric properties of the TIPI have been described elsewhere.39–41

연구 참가자들은 또한 인터뷰 동안 내성적, 외향적, 또는 양향적임을 스스로 확인하고 인터뷰 진행자와 이러한 개념에 대한 자신의 정의에 대해 논의했습니다. 이러한 자체 식별은 TIPI의 결과와 비교되었으며 15/16 참가자와 일치했다.
The research participants also self-identified as introverted, extraverted, or ambiverted during their interviews and discussed their own definitions of these concepts with the interviewer. These self-identifications were compared to their results on the TIPI, and matched for 15/16 participants.

인터뷰
Interviews

PI(VL)는 20-60분 동안 반구조적인 인터뷰를 직접 진행하여 디지털 방식으로 녹음하고 기록했습니다. 그녀는 참가자들에게 [내향성과 외향성을 어떻게 정의하는지 설명]하도록 하는 것으로 각 인터뷰를 시작했고, 참가자들에게 [연구자들의 정의]를 설명하면서 구체적으로 다음과 같이 말했다.

  • "저는 내성적인 사람을 고독한 활동으로 활력을 얻고 과도한 사회적 자극을 피하는 조용하고 차분하며 성찰적이고 수동적인 유형으로 정의합니다. 외향적인 사람들은 다른 사람들과 함께함으로써 에너지를 얻고 과도한 시간을 혼자 보내는 것을 피하는 수다스럽고, 겉으로는 열정적이고, 충동적이고, 지배적인 유형으로 정의된다. 이 정의는 귀사와 어떻게 비교됩니까?" 

그 후, 참가자들에게는 자신의 성격과 성격과 외과적 훈련에서의 경험 사이의 관계에 대한 인식을 탐구하는 개방형 질문이 주로 주어졌다(표 1 참조).

The PI (VL) conducted the 20–60 minute semi-structured interviews in person, digitally-recording and transcribing verbatim. She began each interview by asking the participants to describe how they define introversion and extraversion, and then explained the researchers’ definitions to participants, specifically stating:

  • “I define introverts as silent, calm, reflective, passive types who are energized by solitary activities and avoid excessive social stimulation. Extraverts are defined as talkative, outwardly enthusiastic, impulsive, dominant types who are energized by being with other people and avoid spending excessive amounts of time alone. How does this definition compare with yours?”

Following this, participants were asked primarily open-ended questions exploring their own personalities and their perceptions of the relationship between personality and their experiences in surgical training (see Table 1).

CGT 연구의 전형적인 사례처럼, 이러한 질문들은 [개발되는 테마developing theme]를 탐구하기 위해 각 인터뷰 후에 다듬어졌다. 예를 들어, 초기 참가자들이 외과의사에게 필수적인 기술로서 팀워크와 리더십을 강조했을 때, 우리는 이러한 주제에 특별히 초점을 맞춘 인터뷰 가이드에 질문을 추가했다. 또한, 리틀의 사회 생태학적 모델에 의해, 참가자들이 자신의 행동을 수술 현장에 어떻게 적응시켰는지를 설명할 때, 우리는 참가자들이 이것을 가능한 한 자세히 설명하도록 장려하는 탐색 질문을 사용했다. 참가자들은 다른 사람들에 대한 관찰뿐만 아니라 개인적인 경험을 공유하도록 격려 받았다. 모든 식별 정보는 데이터 분석 전에 제거되었고 각 참가자는 라벨(p1–p16)을 받았다.

As is typical of CGT research, these questions were refined after each interview to explore developing themes.33 For instance, when the initial participants emphasized teamwork and leadership as essential skills for a surgeon, we added questions to the interview guide that focused specifically on these themes. Furthermore, informed by Little’s social ecological model, when participants described how they adapted their behavior to the surgical workplace, we used probing questions that encouraged participants to describe this in as much detail as possible. Participants were encouraged to share their personal experiences as well as their observations of other people. All identifying information was removed prior to data analysis and each participant received a label (p1–p16).

데이터 분석
Data analysis

데이터 수집 및 분석이 반복적으로 수행되었습니다. 주임조사관(VL)은 먼저 이 분야에서 잘 알려졌으며, 다른 논문에서 잘 설명된 [개방형, 선택적, 이론적 코딩 과정]을 이용하여 인터뷰 데이터를 분석하였다. 33,34 이러한 코딩 방식은 연구 기간 동안 2명의 추가 연구원(AP, CS)에 의해 4차례 검토되고 그룹 내에서 논의되어 개발 중인 테마를 더욱 정교하게 다듬을 수 있었다. 두 번째 연구자(KN)는 두 개의 인터뷰를 독립적으로 코딩했다. 그룹(VL, KN, AP)은 두 코딩 체계를 검토하고 비교하여 새로운 해석을 비교하고 다듬었다. 그 과정은 우리가 각 주제에 대해 충분히 풍부하고 포괄적인 탐구를 개발했을 때 끝났다.
Data collection and analysis occurred iteratively. The principal investigator (VL) first analyzed the interview data using an open, selective, and theoretical coding process well-recognized in the field and described in more detail elsewhere.33,34 These coding schemes were reviewed four times by two additional researchers (AP, CS) throughout the study period and discussed within the group, leading to further refinement of developing themes. A second researcher (KN) independently coded two interviews; the group (VL, KN, AP) then reviewed and compared both coding schemes to compare and refine emerging interpretations. The process ended when we had developed a sufficiently rich and comprehensive exploration of each theme.

우리의 [구성주의적 접근 방식]은 참여자와 연구자 사이의 [적극적인 지식의 공동 구성]을 인식하도록 강요한다. 연구과정에서, 우리는 연구자들의 배경이 데이터 해석에 어떻게 기여했는지를 인식했다. 최근 건강전문교육 석사과정을 수료한 의대 졸업생이자 내성적이라고 자처하는 PI(VL)는 저널링, 메모 작성, 연구팀과 공개적이고 비판적인 대화를 정기적으로 하는 등 연구에 기여한 점을 지속적으로 반성했다. 의료 문화와 훈련의 사회적 과정에 초점을 맞춘 그녀의 연구 배경은 CGT 접근법과 일치한다. 연구팀은 질적 방법(AP)에 대한 배경을 가진 교육학 연구원과 만성질환(CS)에 대한 운동학적 측면과 환자진료에 대한 전문지식을 갖춘 연구원 등 2명으로 구성됐다. 추가 멤버는 연구 환경에 "내부" 렌즈를 제공했는데, 이는 외과 수련자(KN)를 가르친 경험이 풍부한 일반 외과 의사이다.
Our constructivist approach compels us to recognize the active co-construction of knowledge between participants and researchers.33 Throughout the study, we recognized how the backgrounds of our researchers may have contributed to interpretations of the data: the PI (VL), a medical graduate who recently completed a Master’s in Health Professions Education and who self-identifies as introverted, continuously reflected on her contribution to the research through journaling, writing memos, and regularly engaging in open and critical conversations with the research team. Her research background, focusing on medical culture and the social processes of training, are aligned with the CGT approach. The team was composed of two members who provided “outsider” (non-physician) lenses to the research setting: a researcher in Education with a background in qualitative methods (AP) and a researcher with expertise in the psychological aspects of Kinesiology and patient care in chronic disease (CS). An additional member provided an “insider” lens to the research setting: a general surgeon who has extensive experience teaching surgical trainees (KN).

결과.
Results

내향성 및 외향성 정의
Defining introversion and extraversion

참가자들은 내향성과 외향성에 대한 유사한 정의를 보고했으며, 몇 가지 중요한 차이점이 있었다. 연구자들이 그렇듯이, 모든 참가자들은 내향성을 단독(또는 1:1) 활동과, 외향성을 더 큰 그룹의 사회 활동과 연관시켰다. 그들은 이것을 에너지, 선호, 그리고/또는 즐거움/번영의 관점에서 설명했습니다. 예를 들어, 그들은 외향적인 사람은 "다른 사람 주변에 있는 것에서 에너지를 얻는다"(p14)고 내향적인 사람은 "사람들과 상호작용하기 위해 더 많은 감정적인 에너지를 필요로 하고, 그 후에 그들은 재충전할 필요가 있다"(p7)고 제안했다. 그들은 외향적인 사람은 "그룹에서 일하는 것을 선호한다"(p14), 내향적인 사람은 "더 조용한 상호작용이나 상호작용의 부재"(p8)라고 설명했다. 그리고, 그들은 외향적인 사람은 "관심의 중심에 있는 것은 번창"하지만 내향적인 사람은 "사교하는 것을 즐기지 않는다"(p15)고 언급했다. 참가자들은 외향적인 사람들은 더 사교적이고 외향적이며, 내성적인 사람들은 더 조용하고 내향적인 것으로 특징지었습니다.
Participants reported similar definitions of introversion and extraversion, with a few important differences. As do the researchers, all participants associated introversion with solitary (or 1:1) activities, and extraversion, with social activities in larger groups. They explained this in terms of energy, preferences, and/or enjoyment/thriving. For instance, they proposed that an extravert “gets energy from being around other people” (p14) while introverts need “more emotional energy to interact with people and they need to recharge after they do” (p7). They explained that an extravert prefers to work in groups” (p14) while an introvert “prefers more quiet interactions or absence of interactions” (p8). And, they noted that an extravert thrives being at the center of attention” but that introverts “don’t enjoy socializing” (p15). Participants characterized extraverts as more sociable and outward-seeking, and introverts as quieter and more inward-looking.


그러나, 전부는 아니지만 일부 참가자들은 이러한 차이를 설명하기 위해 다른 용어, 즉 편안함과 능력과 같은 단어를 사용했습니다. 이 용어들은 더 이상 중립적이지 않았다; 사실, 그것들은 종종 본질적으로 [경멸적]이었다. 이러한 참여자들은 [내향성과 사회적 내성], 그리고 [외향성과 지배력과 공격성]을 연관시켰다. 즉, 일부 참가자들은 개인적인 선호로 설명을 제한시킨 반면, 다른 참가자들은 능력의 차이를 암시했다. 후자의 용어는 연구자들이 사용한 용어와는 차이가 있지만 성격 연구 문헌에서 흔히 볼 수 있는 것은 아니다. 
However, some participants—but not all—used other terms to explain this difference: words like comfort and abilities. These terms were no longer neutral; in fact, they were often pejorative in nature. Participants like these associated introversion with social reserve and shyness, and extraversion with dominance and aggressiveness. In other words, while some participants limited their explanations to personal preferences, others alluded to differences in abilities. The latter types of terms diverged from those used by the researchers but are not uncommonly seen in the personality research literature.30

두 개의 뚜렷한 서술
Two distinct narratives

[내향성과 외향성을 정의하는 방법(즉, 선호 vs 능력)]에 대해 참가자들이 동의하지 않는 방식과 유사하게, 그들은 또한 내향인이 일반 외과에서 얼마나 잘 될 것이라고 생각하는지에 대해서도 동의하지 않았다. 연구 내내, 우리는 연구 데이터를 특징짓는 두 가지 중요한 내러티브에 충격을 받았다.

  • 연구의 많은 참가자들은 수술 문화가 두 성격을 동등하게 환영하고 내성적이거나 외향적인 사람들은 수술에 성공하기 위해 그들의 행동 스타일을 적응할 필요가 없다고 믿었다.
  • 그러나, 다른 이들은 외향적인 행동이 수술 현장에서 더 전형적이고 내성적인 사람들은 더 외향적인 행동으로부터 이익을 얻을 수 있다고 믿었다.

, 외과에서 [성격이 중요하다는 관점]과 [성격이 중요하지 않다는 관점]이 수술 훈련에서 공존한다는 것을 발견했다.
Similar to the way participants disagreed about how to define introversion and extraversion (i.e. preferences vs abilities), they also disagreed about how well they thought introverts would fare in general surgery. Throughout the study, we were struck by two overarching narratives that characterized the research data.

  • Many of the study’s participants believed that the culture of surgery welcomed both personalities equally and that neither introverts nor extraverts needed to adapt their style of behavior in order to succeed in surgery.
  • However, others believed that extraverted behaviors were more typical of the surgical workplace and that introverts could benefit from acting more extraverted.

In other words, we found that two contrasting perspectives—one where personality doesn’t matter in surgery, and one where personality matters—co-exist within surgical training.

본 논문에서는 일반외과 분야에서 내성적인 사람과 외향적인 사람의 인식과 경험의 차이와 유사성을 설명하기 위해 두 가지 관점(구체적인 예를 심층적으로 탐구)을 모두 설명할 것이다.
In this paper, we will describe both viewpoints—exploring specific examples in-depth—in order to elucidate the differences and similarities in the perceptions and experiences of introverts and extraverts in the field of general surgery.

"성격은 중요하지 않다"
“Personality doesn’t matter”

패트리샤(내향적, 외과 의사)와 에릭(외향적, 외과 실습생)은 '성격이 중요하지 않다'고 믿었던 참가자들을 대표한다. 즉, 내성적인 성격과 외향적인 성격 모두 외과적 직업 내에 잘 들어맞으며 성격(적어도 이 두 가지 요소 측면에서)은 학습자가 외과적 훈련을 경험하는 방식에 거의 영향을 미치지 않는다고 주장한 참가자들이다.
Patricia (introvert, surgeon) and Eric (extravert, surgical trainee) represent the participants who believed that “personality doesn’t matter.” That is, the participants who argued that both introverted and extraverted personalities fit well within the surgical profession and that personality (at least in terms of these two factors) has little influence on the way learners experience surgical training.

패트리샤와 에릭은 [이상적인 외과의사]를 지식이 풍부하고, 기술적으로 손재주가 있으며, 증거에 근거한 좋은 결정을 내릴 수 있는 사람이라고 묘사했다. 패트리샤는 환자와의 신뢰관계 구축도 중요하지만 외과의사라는 직업은 "수술에 관한 모든 것이 1대 1이기 때문에" 대부분 혼자 하는 활동이라고 설명했다. 그녀는 수술을 "고독한 것"이라고 묘사했다. 당신과 환자, 그리고 조수입니다. 그건 집단적인 일이 아닙니다." 에릭의 관점은 이 특정한 점에 대해 달랐다: 그는 외과 직업이 다른 사람들과 빈번한 상호 작용을 필요로 한다고 보고했다. 그러나 에릭은 여전히 의사의 사회적 기술보다 지식과 의사 결정과 같은 다른 자질을 더 우선시하는 경향이 있었다.
Patricia and Eric described the ideal surgeon as someone who is knowledgeable, technically skilled with their hands, and who is able to make good, evidence-based decisions. Patricia explained that creating trust relationships with one’s patients is important, but that the job of a surgeon is a mostly solitary activity “because everything about surgery is one-on-one.” She portrayed surgery as “a solitary thing. It’s you and your patients and your assistant. It’s not a group thing.” Eric’s perspective differed on this particular point: he reported that the surgical profession requires frequent interaction with others. However, Eric still tended to prioritize other qualities such as knowledge and decision-making well above a physician’s social skills:

결국 당신이 그들의 병소를 고친다면, 당신이 그들의 병을 치료 기준에 따라 지도한다면, 당신이 아는 것은 별로 중요하지 않다. 우리는 침상 접근법에 대해 의학 교육에 많은 중점을 두지만, 결국 누군가가 훌륭한 침상 예절을 가지고 있지만 완전히 무능하다면 그것은 당신에게도 도움이 되지 않을 것이다.
At the end of the day if you fix their pathol–you know if you guide them through their illness according to the standard of care, it doesn’t really matter you know. We put a lot of emphasis in medical education about bedside approach…but at the end of the day, if someone has great bedside manners but is completely incompetent that’s not gonna help you either.

두 참가자 모두 내향적인 사람과 외향적인 사람을 주로 고독과 사회 활동을 선호하는 성향으로 구분했다. 따라서, Patricia는 수술을 단독 활동으로, Eric은 수술의 "사회적" 역할을 부차적인 것으로 묘사했기 때문에, 두 사람 모두 내성적인 사람과 외향적인 사람이 [외과 수술을 경험하는 방법 사이에 차이가 거의 없다]는 것에 동의할 수 있었다. 그들은 내향적인 사람들의 고독에 대한 선호도를 인정하면서도, 특정 활동에 대한 선호는 특정 활동을 완성하는 능력과 별개의 개념이라고 주장했다.
Both participants distinguished introverts and extraverts primarily by their tendency to prefer solitary and social activities, respectively. Hence, because Patricia described surgery as a solitary activity and Eric described the “social” role of surgery as secondary, both could agree that there is little difference between the way introverts and extraverts experience the practice of surgery. While recognizing introverts’ preference for solitude, they argued that one’s preference for certain activities is a separate concept from one’s ability to complete certain activities:

만약 제가 여러분과 함께 일하고 있고 이 문제를 다루고 있다면, 토론을 해 봅시다. 여러분은 어떻게 할 것인가, 어떻게 할 것인가? 그건 환자 치료이지 내향성/외향성이 아니라고 생각합니다. 하지만 소통하고 대화하고 교류하고 따라가는 한 장벽은 없다고 생각합니다.
If I’m working with you and I’m dealing with this, let’s have a discussion…what would you do, how would you do it. That’s patient care, not introversion/extraversion I suppose. But I don’t think there are barriers as long as you’re willing to communicate and talk and interact and keep up. (Patricia)

따라서 내향적인 사람들이 혼자 일하는 것을 선호한다고 해도, [외과적 직업에 진정으로 중요한 특성]에 있어서는 외향적인 사람들과 다르지 않다.
Thus, even if introverts may prefer to work alone, they do not differ from extraverts in characteristics that are truly important to the surgical profession:

내향성/외향성은 학습에 영향을 미치지 않기 때문입니다. 훈련에는 별로 영향을 주지 않습니다. 기술력에는 영향을 미치지 않습니다. 그래서 그것들이 당신의 수술실습에 어떤 의미있는 영향을 미칠지 확신할 수 없어요.
Because introversion/extraversion doesn’t affect learning. Doesn’t really affect training. Doesn’t affect your technical skills. So I’m not sure they should influence your surgical practice in any significant way. (Patricia)

따라서 이러한 참여자들은 내향적인 사람들이 그들의 행동을 어떤 특정한 방식으로든 그 직업에 '적응'할 필요가 있을 것이라는 점을 나타내지 않았다.
These participants thus did not indicate that introverts would need to ‘adapt’ their behavior to the profession in any particular way:

만약 당신이 당신의 성격을 적응하고 싶지 않다면, 괜찮습니다. 만약 여러분이 무엇이든 진실하고 싶다면, 여러분이 강한 외향적인 사람이고 환자들에게 그런 접근을 하고 싶어하고 몇몇 환자들이 그것을 좋아하지 않는다면, 그렇게 될 것입니다. 만약 당신이 내성적인 사람이고 몇몇 환자들이 그것을 좋아하지 않는다면, 그렇게 하세요.
If you don’t want to [adapt your personality], that’s fine. If you wanna be true to whatever…you know, if you’re a strong extravert and you wanna have that approach to patients and some patients don’t like it, then so be it. And then the same way if you’re an introvert and some patients don’t like it, so be it. (Eric)

게다가, 많은 참가자들은 내향적인 사람들이 수술에 중요한 강점을 가지고 있다고 제안했다. 특히 내성적인 사람들의 침착함과 반사성이 어떻게 능숙한 의사 결정으로 이어졌는지, 내성적인 사람들의 행동이 어떻게 팀에 반영되어 보다 관리하기 쉬운 작업 환경을 만드는지에 대해 설명했습니다.
Furthermore, many participants proposed that introverts had important strengths to bring to the practice of surgery. In particular, they explained how introverts’ calm and reflexivity led to adept decision-making, and how the behaviors of introverts reflected on their team to create a more manageable work environment:

나는 누군가가 쉽게 흥분한다면, 그것은 방을 매우 쉽게 흥분시킬 수 있다고 생각한다. 그리고 만약 당신이 트라우마나 심각한 병을 앓고 있는 사람을 다루고 있다면, 당신은 흥분된 방을 원하지 않을 것이다. 당신은 조용한 방을 원합니다. 당신은 반사적인 방을 원합니다. 그리고 저는 그러한 특정한 시나리오를 지휘하는 사람, 그들의 성격은 그 방의 분위기에 많은 영향을 미친다고 생각합니다. 그리고 저는 이러한 환경에서 차분하고 성찰적인 행동이 환자 치료의 질에 더 도움이 된다고 생각합니다. (p6, 내성적, 전공의)
I think if someone’s easily excitable, that can very easily excite a room. And if you’re dealing with a trauma or someone who’s critically unwell, you don’t want an excited room. You want a calm room. You want a reflective room. And I think the person directing those particular scenarios, their personality has a lot of influence on the tone of that room and I think-I really do think a calm, reflective demeanour in those settings is more conducive to quality of patient care. (p6, introvert, resident)

따라서, 이 참가자들은 내성적인 사람들이 외향적인 사람들과 같은 능력을 가지고 있다고 주장했고, 그들이 외과적 훈련을 더 어려워할 이유를 제시하지 않았다. 그들은 두 성격 모두 실행에 옮길 수 있는 독특한 강점을 가지고 있으며, 직업의 요구에 맞추기 위해 그들의 전형적인 행동을 바꿀 필요는 없다고 믿었다.
Hence, these participants maintained that introverts possess the same abilities as extraverts and offered no reason for them to find surgical training more challenging. They believed that both personalities had unique strengths to bring to practice, and that neither should need to change their typical behaviors in order to fit the demands of the profession.

"인격이 중요하다"
“Personality matters”

그러나 두 번째 그룹의 참가자들은 직장에서 성격의 역할에 대해 [현저하게 다른 견해]를 보였다. 이를 설명하기 위해, 우리는 외향적인 외과의사(매튜)와 내성적인 레지던트(제인)의 예를 제공한다.

A second group of participants, however, demonstrated strikingly different views on the role of personality in the workplace. To illustrate this, we provide examples from an extraverted surgeon (Matthew) and an introverted resident (Jane).

Matthew와 Jane과 같은 참가자들은 수술을 [본질적으로 사회적인 활동]이라고 설명했습니다. Matthew에 따르면, 수술은 "팀 환경 내에서 완전히 발생한다"고 합니다. 이 연구의 모든 참가자들은 적어도 어느 정도는 대인관계 기술이 연습에 중요하다는 것을 인식했지만, 매튜와 제인처럼 "인격이 중요하다"고 믿는 사람들은 훨씬 더 열정적으로 이러한 자질을 강조하는 경향이 있었다. 예를 들어, 그들은 외향적이고 사교적인 것이 동료들과 더 개방적이고 유쾌한 관계를 만드는 데 도움이 된다고 주장했고, 그러한 상호작용을 즐기지 않는 사람들을 [공개적으로 비난]했다. 심지어 그들은 내향성을 사회적 유보(social repare)와 연결시켜 "내향적인 사람이라면 일이 힘들 수 있다"(p12)고 경고하기도 했다. 그들은 내성적인 사람들은 종종 시끄럽고, 지배적이며, 단호한 태도를 보이는 데 어려움을 겪으며, 내향적인 사람들은 바쁜 임상 상황에서 "소음에 빠져들기" 쉬운 것으로 간주하고 그들의 힘을 빼앗긴다고 보고했다. 
Participants like Matthew and Jane described surgery as an inherently social activity—one which, according to Matthew, “completely occurs within a team environment.” While all the participants in this study recognized that interpersonal skills were, at least to some degree, important for practice, those who believed, like Matthew and Jane, that “personality matters” tended to emphasize these qualities with much more fervor. For instance, they argued that being outgoing and sociable helped them create more open, convivial relationships with their colleagues, and openly denounced those who did not enjoy those interactions. They even linked introversion to social reserve, warning that “if you’re an introvert, things can be hard for you” (p12). They reported that introverts often had difficulty being loud, dominant, and assertive, and considered introverts more susceptible to being “drowned out in the noise” (p6) of busy clinical situations and to having their power taken away from them:

또래들과의 관계에서 OK라고 말할 수 있는 다른 외향적인 사람들이 있다, 이제 내가 너의 자리를 대신할 것이다.(p13, 외향적인 외과의사) 
In the relationships with your peers, there are other extraverted people who will say ok, I’m going to take your place now. (p13, extraverted surgeon)

매튜는 "리더가 되는 것을 좋아하지 않는다면, 리더가 없는 상황에서 매우 나쁜 일이 일어날 것이기 때문에 외과의사가 되어서는 안 된다"고 말했다. 그는 내성적인 사람들을 더 조용하고, 주저하며, 그 직업이 필요로 할 지도 모르는 지배적이고 단호한 리더가 되는 것에 덜 편안하다고 특징짓고, 내성적인 훈련생들이 겪는 많은 어려움을 관찰했다. 구체적으로, 그는 내성적인 훈련생들이 그들의 성격을 초월하여, 익숙한 방식에 직접적으로 반하는 방식으로 행동하도록 격려하는 것을 묘사했다.
Matthew described the absence of leadership skills as incongruent with being a surgeon because “if you don’t like being a leader, then you should not be a surgeon because very bad things will happen in the absence of leadership.” He characterized introverts as more quiet, hesitant, and less comfortable with being the dominant and assertive leaders the profession may require and has observed many challenges for his introverted trainees. Specifically, he described encouraging his introverted trainees to transcend their personalities and to act in a way that is directly counter to their habitual ways of being:

만약 여러분이 내성적이고 관심의 중심이 되는 것을 불편하게 느낀다면, 여러분은 외과의사로서 성공할 수 없을 것입니다. 우리가 가르치는 것 중 하나는 좀 더 내성적인 경향이 있는 전공의들에게 여러분이 그것을 만들기 위해 가짜로 만들어야 한다는 것입니다. 여러분은 큰 목소리로, 큰 존재로 들어와, 여러분은 방을 가득 채우고, 여러분은 모든 사람들을 지휘하고 주의를 명령해야 합니다. 모두 외향적인 사람들입니다. 여러분은 그 역할에서 관심의 중심이 되고 편안함을 느낄 수 있어야 합니다. 여러분은 스스로를 멈추고 이 대체 인물을 채택해야 합니다. 당신은 당신 자신을 삶보다 더 크게 만들어야 합니다.
If you are an introvert and feel uncomfortable being the center of attention, then you aren’t going to succeed as a surgeon. One of the things we teach residents who may have tendencies to be more introverted is that you gotta fake it to make it…you got to come in with a big voice, a big presence, you have to fill the room, you have to direct everyone and command attention. And that’s all extraverts. You have to be able to be the center of attention and feel comfortable in that role…you have to suspend yourself and adopt this alternate persona. You have to make yourself larger than life.

이 관점을 고수했던 다른 참가자들처럼, 매튜는 외과 전문직이 침묵을 망설임으로 보는 경향에 대해 말했다. 신속하고 결정적으로 결정이 내려질 것으로 예상되는 분야에서는 "당장 답이 없으면 마치 자신이 무엇을 하고 있는지 모르는 것처럼 볼 수 있다"(p3)고 말했다. Matthew는 내향적인 사람들이 그들의 결정을 반성할 필요가 본질적으로 환자 치료에 위험하다고 판단했다.
Like the other participants who adhered to this viewpoint, Matthew spoke to the tendency for the surgical profession to view quietness as hesitation—and, in turn, hesitation as a lack of confidence or competence. In a field where decisions are expected to be made quickly and decisively, “if there isn’t an answer right away, it can be viewed as if they don’t know what they’re doing” (p3). Matthew judged that introverts’ need to reflect on their decisions was inherently dangerous for patient care:

사려 깊고 조용하며 모든 선택지를 고려한다는 것은… 당신은 기회를 놓치게 될 것이고 환자는 죽게 될 것이다.
To be thoughtful and quiet and consider all the options…you’re going to miss the boat and the patient would be dead.

이러한 관점을 가진 다른 내성적인 사람들과 마찬가지로, 효과적인 지도자들이 때때로 혼란스러운 상황을 통제할 필요가 있기 때문에, 내성적인 사람들은 종종 "그들이 익숙할 수 있는 상황보다 더 assertive하다"고 불린다. (p7); "그들이 [그들이] 환자에게 최선이라고 생각하는 것을 얻으려고 노력할 때 더 공격적이다." (p14) 그리고; "[그들이] 그래야 하기 때문에, 수술실에서 더 우세하다." (p6) 제인은 [자신의 조용함]이 종종 자신이 자신감이 낮거나, 능력이 부족하다는 것으로 인식된다고 지적했다. 그녀와 이러한 관점을 가진 다른 사람들은 외향적인 사람들의 성격이 자신감을 더 잘 표현하고, 존경을 받고, 동료들과 환자들에게 더 안심시킬 수 있게 만들 수 있다고 제안했다.
Jane, as well as the other introverts with this perspective, agreed that because effective leaders needed to take control of sometimes chaotic situations, introverts were often called to be “more assertive in situations than [they] may be used to” (p7); “more aggressive [when] trying to get what [they] think is best for [their] patient” (p14); and “more dominant in the operating room, just because [they] have to” (p6). Jane indicated that her own quietness was often perceived as her being less confident or competent. She, and others with this viewpoint, suggested that extraverts’ personalities may make them better able to project confidence, command respect, and be more reassuring to their colleagues and patients:

종종 가장 눈에 띄는 사람, 알다시피, 자신을 가장 많이 표현하는 사람은 다른 사람들보다 더 나은 것처럼 단기적으로 전달할 수 있습니다. [그] 외향적인 성격이 눈에 띈다. 그것은 그가 나아졌다는 것을 의미하는 것이 아니라, 단지 가끔 그것이 주는 인상일 뿐이다. (p13)
Often the person who stands out the most, you know, who expresses himself the most, can pass on the short term as if he were better than the others. [The] extraverted personality stands out. It doesn’t mean he’s better, it’s just sometimes the impression that it gives. (p13)

제인은 자신의 성격을 직장에 적응시키기 위해 그녀에게는 부자연스러운 방식으로 행동하려고 노력했다.
In order to adapt her personality to the workplace, Jane worked to act in ways that were unnatural to her:

그것은 단지 자신에게 불편한 일을 강요하는 것이다. 여러분이 생각하는 것보다 더 큰 소리로 말하고 때로는 실제 느끼는 것보다 더 자신감 있게 행동합니다. 네. 그건 대부분 불편한 일을 하기 위해 자신을 몰아붙이는 거예요.
It’s just forcing yourself to do things that are uncomfortable. To talk louder than you think you should and just be…sometimes acting more confident than you actually feel. Yeah. That’s mostly just pushing yourself to do the uncomfortable things.


여러 내성적인 사람들은 [외향적인 행동]을 "배출" (p7)과 "너로부터 에너지를 빼앗는 것" (p14)로 묘사했다. 시간이 지남에 따라 외향적으로 행동하는 것이 더 편해졌음에도 불구하고, 그것은 "[그들의] 개성에 진정으로 통합되었다"는 것은 아니었다. (p6)
Many introverts described acting extraverted as “draining” (p7) and taking “energy out of you” (p14). Despite becoming more comfortable acting extraverted over time, it was not something that became “truly incorporated into [their] personalit[ies]” (p6):

가끔 이게 진짜 내가 아니라고 느꼈지만, 이 시점에서 나는 그렇게 되어야 한다. (p14, 내성적, 거주자)
Sometimes I’ve felt like this isn’t really me, but I have to be like that at this point in time. (p14, introvert, resident)

Jane을 포함한 이러한 내성적인 참가자들은 이러한 방식으로 행동하는 것(즉, 더 외향적으로 행동하는 것)이 장기적으로 소진을 유발할 수 있다고 예상했습니다.
These introverted participants, Jane included, expected that acting in this way (i.e., acting more extraverted) could lead to burnout in the long-term:

개인적인 목적을 위해서죠, 개인적인 행복의 목적처럼요. 만약 여러분이 좀 더 내성적인 사람이라면, 하루 일과가 끝날 때쯤 업무상 상호작용으로 인해 지칠 것 같다면, 그것은 잠재적으로 더 지칠 수 있고 더 높은 소진으로 이어질 수 있습니다. 만약 여러분이 더 외향적이라면, 여러분은 하루의 끝에 삶의 다른 관계들에 헌신할 수 있는 더 많은 에너지를 갖게 될 것입니다.
Just on the personal end of it, like the personal well-being end of it. If you’re more introverted, it potentially could be more draining and lead to like higher rates of burnout if you felt like you were drained at the end of the day from your interactions at work. Versus if you’re more extraverted, you potentially have more energy at the end of the day to kind of devote to other relationships in your life.

따라서 이러한 관점에서 참가자들은 [외과 수련을 특징짓는 특정한 기대]가 있다고 주장했다. 자신감 있고, 단호하고, 단호하게 보일 필요성 등, 이는 내성적인 사람들의 전형적인 특징과 일치하지 않는 것처럼 보입니다. 그들은 사색적인 생각 더 조용할 보이는 경향이 그렇게 내성적인 훈련생 가끔은 그들의 더 많은extraverted을 하는 동년배를 따라가“자신의 행위 밖에서” 필요가 있다고 믿었다.
The participants from this perspective thus argued that there are certain expectations that characterize surgical training—such as the need to appear confident, decisive, and assertive—that seem inconsistent with the typical characteristics of introverts. They believed that introverted trainees who had a tendency to be quieter and more reflective sometimes need to “act outside of themselves” in order to keep up with their more extraverted peers.

논의
Discussion

우리의 연구는 외과적 훈련에서 내향적인 사람과 외향적인 사람의 경험을 둘러싼 두 가지 대조적인 이야기를 발견했다. 한편으로, 일부 참가자들은 일반 수술은 두 성격 모두에게 열려 있으며, 어느 쪽도 다른 쪽보다 직업에서 성공하는 데 더 큰 어려움을 겪지 않아야 한다고 믿었다. 반면에, 두 번째 그룹의 참가자들은 그 직업이 훈련생들에게 리더십 행동에 참여하도록 요구하며, 이는 외향적인 사람들에게 더 자연스럽게 다가온고 믿었다. 결과적으로, 일부(전부는 아니지만)는 내향적인 사람들이 (—조용하고 더 주저하는 성질 때문에—) 외과 의사로서 성공하기 위해 때때로 "더 외향적인" 행동을 할 필요가 있다고 믿었다.

Our study found two contrasting narratives surrounding the experience of introverts and extraverts in surgical training. On the one hand, some participants believed that general surgery was open to both personalities and that neither should have more difficulty succeeding in the profession than the other. On the other hand, a second group of participants believed that the profession required trainees to engage in leadership behaviors that came more naturally to extraverts. Consequently, some (but not all) believed that introverts—because of their quiet, more hesitant nature—needed to “act more extraverted” at times in order to succeed as surgeons.

두 관점의 참여자들의 경험은 개인들이 그들이 놓여진 특정한 맥락에 따라 그들의 행동을 "적응"할 것을 암시하는 인간 행동의 전통적인 틀 안에서 이치에 맞지만, 그들의 성격이 그들이 하고자 하는 역할과 일치하지 않는다고 믿을 때에만 이치에 맞는다. 

  • 우리는 일부 내성적인 사람들(즉, "성격이 중요하다"고 믿는 사람들)이 그들에게 요구되는 것과 더 일치하는 성격 상태를 순간적으로 채택하기 위해 그들의 성격 특성 밖에서 어떻게 행동할 것인지를 보여주었다. 
  • 우리는 또한 어떻게 일부 내성적인 사람들(즉, "성격은 중요하지 않다"고 믿는 사람들)이 그렇게 하는 것이 "개인 프로젝트"에서 그들에게 이익이 될 것이라고 믿지 않았기 때문에, 그들의 행동을 적응할 필요성을 애초에 느끼지 않았는지를 보여주었다. 

간단히 말해서, [성격에 맞지 않게 행동하려는 동기]는 한 사람의 [핵심 가치 및 개인적인 신념]과 밀접하게 연관되어 있다. 
수술 문화가 요구하는 것, 외과의사는 어떤 모습이어야 하는지, 좋은 지도자가 되는 것이 무엇을 의미하는지에 대한 믿음은 참가자들 사이에서 상당히 달랐기 때문에, 참가자들이 그들의 성격을 수술에 적응시키는 정도는 그만큼 다양했다.
The experiences of participants from both viewpoints make sense within traditional frameworks of human behavior that suggest that individuals will “adapt” their behavior according to the specific context in which they are placed, but only when they believe that their personality is incongruent with the role they are attempting to play.35,36 

  • We demonstrated how some introverts (i.e., those who believed that “personality matters”) will act outside of their personality traits in order to momentarily adopt a personality state that is more in line with what is demanded of them.
  • We also demonstrated, however, how some introverts (i.e., those who believed that “personality doesn’t matter”) did not feel the need to adapt their behavior in the first place because they did not believe that doing so would benefit them in their “personal projects.”35,36 

Put simply, motivation to act out of character is closely linked to one’s core values and personal beliefs; because beliefs about what surgical culture demands, what surgeons should look like, and what it means to be a good leader varied significantly among participants, the degree to which participants adapted their personalities to surgery varied just as much.

그녀의 비판적 논평에서, 맥레오드는 의학 교육자들이 숨겨진 커리큘럼을 언급할 때 [the 가 아니라 a을 사용해야 한다]고 주장했다. 왜냐하면 실제로는 항상 하나의 숨겨진 커리큘럼이 아니라 여러 개의 숨겨진 커리큘럼이 작동하기 때문이다. 마찬가지로, 우리의 데이터는 우리에게 보편적인 "진실"으로 이해되는 하나의 수술 문화가 없다는 것을 상기시킨다. 오히려, 수술 문화는 인식, 신념, 가치의 [복잡한 거미줄]로 구성되어 있다. 우리의 연구에서, 우리는 두 개의 다른 "문화"를 묘사했다.

  • 외과적 훈련의 맥락에서 내성적인 특성과 외향적인 특성을 동등하게 평가하는 사람(평등의 문화) 
  • 외향적인 특성을 더 중요시하는 경향이 있는 또 다른 것(위계의 문화)

서구 사회에서 [내향적인 사람들의 empowerment 증가]와 같은 직장 밖의 이념적 운동은, 직장 내 사람들 사이에서 divide가 증가하는 것에 기여할 수 있다. 이것은 수술 문화에 대한 기존 연구([어떤 가치가 직업을 특징짓는지]에 대해서 [이견이 거의 없는 균일한 실체]인 것처럼 수술 문화를 논의하는 경향이 있음)에 새로운 관점을 가져온다.

In her critical commentary, MacLeod42 argued that medical educators should use the article a, rather than the, when referring to the hidden curriculum because, in reality, there are always multiple hidden curricula at play—not only one. Similarly, our data remind us that there is not one surgical culture that is uniformly understood to be “true.” Rather, surgical culture is composed of an intricate web of perceptions, beliefs, and values. In our study, we described two distinct “cultures”:

  • one that values introverted and extraverted traits equally in the context of surgical training (culture of equality) and
  • another that tends to value extraverted traits more (culture of hierarchy).

Ideological movements outside the workplace, such as the growing empowerment of introverts in Western society,1–7 may contribute to a growing divide among those in the profession. This brings a novel perspective to previous studies on the culture of surgery which tend to discuss surgical culture as if it were a single entity in which disagreements about which values characterize the profession are few and far between.43

주의할 점은, 두 가지 상이한 관점이 근본적인 성격 유형(내향적, 외향적)이나 직업적 지위(주민, 외과 의사)와 관련이 없는 것으로 보인다는 것이다. 그러나 우리는 일반적으로 ["성격은 중요하지 않다"고 믿는 여성]이 더 많고 ["성격이 중요하다"고 믿는 남성]이 더 많다는 것을 발견했다. 직관적으로, 더 많은 여성들이 평등의 문화 안에서 자신을 일치시킬 것이라는 것은 이치에 맞다. 역사적으로, 여성들은 의학, 특히 외과 전문 분야에서 과소 대표되어 왔다. 참가자들 중 한 명이 설명했듯이, 여성들은 오랫동안 남성 동료들 사이에서 "자신을 증명"할 필요성을 느껴왔습니다.

It is important to note that the two diverging viewpoints did not appear to be related to underlying personality type (introvert, extravert), nor professional status (resident, surgeon). However, we found that there were generally more women who believed that “personality doesn’t matter” and more men who believed that “personality matters.” Intuitively, it makes sense that more women would align themselves within the culture of equality. Historically, women have been under-represented medicine, and particularly in surgical specialties.44 As one of our participants explained, women have long felt the need to “prove themselves” among their predominantly male colleagues:

…당신은 당신 자신을 옹호하고 있고 당신 뒤에 오는 모든 여성들을 옹호하고 있습니다. 여기서 내가 할 수 없는 것은 절대 없으며 당신만큼 잘 할 수도, 더 잘 할 수도 없습니다. (내향적, 외과의사)
…you’re advocating for yourself and you’re advocating for all the women coming behind you, that there’s absolutely nothing in here that I cannot do and I can’t do as well as or better than you. (introvert, surgeon)

[남성들이 "위계의 문화"에 더 잘 집착adhere할 수 있다는 개념]은 남성들이 더 적극적이고 지배적인 성격 특성을 보이고, 다른 의사소통 방식을 갖는 경향과 관련이 있을 수 있다. 수술 전문분야에서 성격과 성별 차이 사이의 미묘한 교차성을 더 잘 이해하기 위해서는 추가 연구가 필요하다.
The notion that men may be more likely to adhere to the “culture of hierarchy” may be related to the tendency for men to exhibit (and perhaps, to value) more assertive and dominant personality traits, and to have different styles of communication.45,46 Further research is needed to gain a better grasp of the nuanced intersectionality between personality and gender differences in surgical specialties.

시사점
Implications

외향적 문화
Extravert culture


우리의 발견은 외향적인 것의 이상화가 서구 문화, 나아가 서구 의료 문화에 뿌리내릴 수 있다고 경고한 이전 저자들의 연구를 반영한다. 우리 연구의 많은 참가자들은 외향적인 사람들이 수술 연습에 더 이상적이라고 생각했지만, 어떤 참가자도 내향적인 사람들이 외과 수술에 더 이상적이라고 생각하지 않았다. 내향적인 사람들의 이러한 [잠재적 소외]는 특히 [의사들이 성격에 대해 가지고 있는 편견]이 새로운 외과 레지던트들을 [선발하는 방법]에 영향을 미치는 경향이 있기 때문에, 우리의 미래 의료진의 다양성에 중요한 영향을 미친다. 우리의 연구는 많은 외향적인 전형적인 행동들이 외과 분야의 많은 사람들에게 여전히 높이 평가되고 있다는 것을 보여준다.

Our findings reflect the work of previous authors who have cautioned that an idealization of the extravert may be ingrained within Western culture1,4,8–11—and, by extension, Western medical culture.3,5–7 While a number of participants in our study thought extraverts were more ideal for surgical practice, no participants believed that introverts were more ideal for surgical practice. This potential marginalization of introverts has important implications for the diversity of our future medical personnel, especially since biases surgeons hold around personality tend to affect how they select new surgical residents.47 Our study indicates that many extravert-typical behaviors remain highly valued to many in the surgical profession.

그러므로 그들의 전문 분야에서 어려움을 겪고 있는 내성적인 훈련생들은 그들의 외향적인 상대와 동등하게 보이기 위해 그들의 성격의 외향적인 측면을 활용하는 방법을 배우는 것에서 이점을 찾을 수 있다. 그러나 외과의사와 의학 교육자들은 다양한 성격의 더 큰 수용이 궁극적이고 장기적인 목표가 되어야 하는지에 대해 성찰해야 한다. 이 연구의 많은 참가자들이 주장했듯이, 내성적인 사람들은, 특히 그들의 침착함과 반사성 측면에서, 의학에 독특하게 이로운 특성을 가지고 있을 수 있다.
Introverted trainees who may be struggling in their specialty may thus find benefits in learning how to harness the extraverted sides of their personalities in order to be seen as equal to their extraverted counterparts. However, surgeons and medical educators must reflect on whether a greater acceptance of a diversity of personalities should be the ultimate, long-term goal. As many participants in the study argued, introverts—particularly in terms of their calm and reflexivity—may have qualities that are uniquely beneficial to medicine.

의료연수생 선발
Selection of medical trainees

우리의 연구 결과는 또한 우리가 외과 수련생을 선발하는 방식에 중요한 영향을 미친다. 성격 테스트는 양심, 친화력, 외향성과 같은 특성이 다른 특성들보다 일부 특성 내에서 더 높은 가치를 가질 수 있다는 가정에 기초하여 선발 과정의 중요한 부분이다. 그러나, 의학 교육에서의 성격 연구는 지난 20년 동안 그 매력을 잃었다. 많은 학자들은 성격검사가 기껏해야 경박하고 최악의 경우 위험하다고 비난해 왔다. 에바 말로는 

  • "[인성 검사와 함께] 위험은 이러한 조치들이 기껏해야 현실과 잘 상관관계가 없는 구조를 바탕으로 개인들로 하여금 자신에 대해 무엇인가를 믿게 할 수 있다는 것이다."

Our findings also have important implications for the way we select surgical trainees. Personality testing continues to be an important part of selection processes based on the assumption that traits such as conscientiousness, agreeableness, and extraversion may have higher value within some specialties more than others.48–52 However, personality research in medical education has lost its appeal over the last two decades. Many scholars have denounced personality testing as, at best, frivolous47 and, at worst, dangerous.53–56 According to Eva,

  • “the danger [with personality testing] is that these measures can lead individuals to believe something about themselves (e.g., what career to pursue or how to perceive one’s academic/romantic successes and failures) based upon constructs that are, at best, poorly correlated with reality.”54(p.276)


우리의 연구는 훈련생의 성격 점수가 외과적 훈련에서의 성과와 나쁜 상관관계가 있다는 한 가지 가능한 이유를 조명한다. 특히, 이산형 성격 테스트에 지나치게 의존하면 [어떤 학생들은 다른 학생들보다 더 의도적으로 자신의 성격과 다르게 행동한다]는 사실을 간과할 수 있다. 우리의 연구에서, 우리는 많은 참가자들이 직업의 인지된 요구를 충족시키기 위해 종종 하는 반면, 다른 참가자들은 성격에 맞지 않는 행동을 할 필요성을 느끼지 않는다는 것을 발견했다. 따라서 [안정적인 특성traits]으로서의 성격에 대한 전통적인 개념은 [성격 상태states]가 동등하게 중요할 수 있다는 사실을 간과하는 경향이 있다. 따라서 잠재적 외과 수련자의 선발 과정에서 성격 평가는 [효과적인 외과의가 되는 것]이 무엇을 의미하는지에 대한 [학습자의 가치와 신념]에 대한 광범위한 이해에 비추어 해석되어야 한다. 향후 연구는 또한 다른 성격을 가진 사람들이 특정한 전문 분야에 적응하는 복잡한 방법에 대한 더 깊은 이해를 개발해야 한다.

Our research shines light on one possible reason that trainees’ personality scores are poorly correlated with their performance in surgical training. Specifically, over-reliance on discrete personality tests potentially overlooks the fact that some students are more willing to act outside of their personalities than others.56 In our study, we found that many participants did not feel the need to act out of character while others often did to fulfill the perceived demands of the profession. Traditional conceptions of personality as stable traits thus tend to overlook the fact that personality states may be of equal importance. In the selection process of potential surgical trainees, personality assessments should thus be interpreted in light of a broader understanding of a learner’s values and beliefs about what it means to be an effective surgeon.57 Future studies should also develop a deeper understanding of the complex ways those with different personalities adapt to specific specialties.

강점과 한계
Strengths and limitations


우리의 연구는 그 점에서 독특하다.

  • (1) 그것은 동일한 의료 전문 분야 내에서 다른 성격들이 어떻게 성공하는지 구체적으로 탐구한 첫 번째 중 하나이다. 
  • (2) 그것은 본질적으로 양적이라기보다는 건설적이고 질적이다. 

비록 우리의 연구가 두 개의 학술 센터로 제한되었지만, 우리는 우리의 많은 발견이 다른 맥락에 적용될 수 있을 것으로 기대한다. 우리의 데이터는 성격과 수술 문화 사이의 복잡한 관계에 대한 풍부한 예비 통찰력을 제공하지만, 그 관계에 대한 이해를 깊게 하기 위해서는 향후 연구가 필요하다. 향후 연구는 또한 직장에서 중요한 역할을 하는 의료 기술자와 같은 다른 전문가의 관점을 고려할 수 있다.

Our study is unique in that (1) it is among the first to specifically explore how different personalities succeed within the same medical specialties and (2) it is constructivist and qualitative, rather than quantitative, in nature. Although our study was limited to two academic centers, we anticipate that many of our findings are applicable to other contexts. Our data provide rich preliminary insight into the complicated relationship between personality and surgical culture, but future studies are required to deepen our understanding of the relationship. Future studies could also consider the perspectives of other professionals, such as medical technicians, who play an important role in the workplace.

우리는 내향적인 사람과 외향적인 사람의 경험과 관련된 우리의 발견을 논의하는 동시에 두 가지 다른 내러티브를 설명하면 잘못된 이분법을 만들고 연구 중인 현상을 지나치게 단순화할 위험이 있다는 것을 인정한다. 그러나 우리는 두 가지 다른 관점을 탐구하는 것이 우리의 데이터를 이해하는 데 도움이 되었다고 주장한다. 연구 과정을 억제하기보다는 참가자들을 하나의 관점과 다른 관점과 연관시키는 어려움을 탐구하는 것이 우리의 해석에 깊이와 뉘앙스를 더할 수 있는 기회였다. 또한 두가지 내러티브가 근본적인 성격 유형과 상관관계가 없는 것으로 보인다는 점도 유의해야 한다. 우리는 내성적인 사람과 외향적인 사람 사이의 그룹 차이를 분석하는 것을 목표로 하지 않았다. 성격 테스트는 우리의 표본 모집단을 묘사하기 위해서만 우리의 연구에서 사용되었다.
We acknowledge that discussing our findings related to introverts’and extraverts’experiences, all the while describing two distinct narratives, risks creating false dichotomies and oversimplifying the phenomena under study. We contend, however, that exploring two diverging perspectives helped us make sense of our data. Rather than inhibiting the research process, exploring difficulties associating participants with one viewpoint or the other were opportunities to add depth and nuance to our interpretations. It is also important to note that the two narratives did not appear to correlate with underlying personality type. We were not aiming to analyze group differences between introverts and extraverts; personality testing was used in our study only to describe our sample population.

마지막으로, 우리는 우리의 연구 참가자 중 한 명이 스스로 내성적이라고 밝혔지만 TIPI에서 약간 외향적인(5.5) 점수를 받았다는 것에 주목했다. 이는 부분적으로 TIPI의 제한된 신뢰성 또는 사람들이 내향/외향을 개념화하는 방법의 차이 때문일 수 있다. 본 연구의 목적은 자기식별이 때때로 성격점수와 차이가 나는 이유를 탐구하는 것이 아니었지만, 이는 향후 연구를 위한 중요한 방법이 될 수 있다.
Finally, we noted that one of our research participants self-identified as introverted but scored slightly extraverted (5.5) on the TIPI. This could be due, in part, to the limited reliability of the TIPI or differences in how people conceptualize intro/extra-version. It was not the intention of this study to explore why self-identification sometimes diverges from personality scores; however, this may be an important avenue for future research.

결론
Conclusion

의학 교육자들은 내성적인 사람들이 의학에서 직면할 수 있는 도전에 대해 점점 더 우려하고 있으며, 그들이 그 직업에 가져다주는 강점에 대한 더 큰 인식을 지지한다. 우리의 연구는 이러한 우려를 반영하지만, 성격이 의학 교육에 진정으로 중요한지에 대한 논쟁에 중요한 관점을 추가한다. [외과의사가 어떻게 행동해야 하는지에 대한 학습자의 믿음]은 직장에서 실제로 어떻게 행동하는지 크게 영향을 미칩니다.—그리고 이것은 왜 성격 유형이 레지던트 프로그램에서 수행에 대한 좋지 않은 예측 변수인지 설명하는 데 도움이 될 수 있다. 이것은 우리가 잠재적인 외과 지원자를 선발하고 훈련하는 방식에 중요한 영향을 미친다. 외과의사, 교육자, 교육자 모두 학습자의 성격, 신념과 가치 체계, 그리고 채택하기로 선택한 문화의 본질 사이의 복잡한 관계를 더 깊이 이해함으로써 이익을 얻을 수 있다.
Medical educators are increasingly concerned with the challenges introverts may face in medicine and advocate for a greater recognition of the strengths they bring to the profession. Our study reflects these concerns, but also adds important perspectives to the debate about whether or not personality truly matters in medical education. Learners’ beliefs about how a surgeon is “supposed to” behave profoundly influences how they actually behave in the workplace—and this could help explain why personality type is a poor predictor of performance in residency programs. This has important implications for the way we select and train potential surgical candidates. Surgeons, trainees, and educators alike could benefit from a deeper understanding of the intricate relationships between learners’ personalities, their systems of beliefs and values, and the nature of the culture they choose to adopt.

 

 


Teach Learn Med. 2022 Jun-Jul;34(3):255-265. doi: 10.1080/10401334.2021.1922284. Epub 2021 May 17.

 

Does Personality Matter? Perceptions and Experiences of Introverts and Extraverts as General Surgeons

Affiliations collapse

Affiliations

1Department of Continuing Professional Development, Dalhousie University, Halifax, Nova Scotia, Canada.

2School of Kinesiology, Acadia University, Wolfville, Nova Scotia, Canada.

3School of Education, Acadia University, Wolfville, Nova Scotia, Canada.

4Division of General Surgery, Dalhousie University, Halifax, Nova Scotia, Canada.

PMID: 34000927

DOI: 10.1080/10401334.2021.1922284

Abstract

Phenomenon: Medical educators increasingly recognize both the challenges introverts, compared to extraverts, may face in medical training and the unique strengths they bring to practice. However, few researchers have examined in-depth how introverts and extraverts truly experience training and practice, particularly in specialties like surgery that tend to value qualities (e.g., dominance and assertiveness) typically associated with extraverts. This study aimed to explore the perceptions and experiences of individuals with both personalities within the field of general surgery.

Approach: Using a constructivist grounded theory approach, six general surgeons and 10 general surgery residents who identified as introverted, extraverted, or ambiverted were recruited from two Canadian tertiary care hospitals to participate in semi-structured interviews. Data collection and analysis occurred iteratively, and data were analyzed using open, selective, and thematic coding. Constant comparison allowed us to make sense of the similar and dissimilar views that emerged from each interview.

Findings: Irrespective of their personalities, participants voiced two general patterns of responses. Some participants believed that "personality doesn't matter": that both introverted and extraverted practice styles were equally viable and neither introverts nor extraverts would find surgical training more challenging than the other (culture of equality). However, others believed that "personality matters," emphasizing that surgeons should be dominant and aggressive leaders. Only those who believed "personality matters" felt that introverts sometimes needed to act more extraverted in order to succeed in surgical training (culture of hierarchy). Similar numbers of introverts and extraverts adhered to each viewpoint.

Insights: Our qualitative approach allowed us to draw meaning from the complex subjective experiences of our research participants. Our findings suggest that two competing cultures (equality and hierarchy) co-exist within the field of surgery and that trainees, depending on which culture they adhere most to, will or will not "adapt" their personalities to the workplace. These findings deepen our understanding of the nuances of surgical culture and have important implications for how we select candidates based on personality.

Keywords: Personality; introversion extraversion; person-environment fit; surgical culture; surgical residency.

 

발달적 Progress Assessment의 도입에 관한 이해관계자 인식: 이론적 영역 프레임워크를 활용한 행동결정요인 문서화 (Adv Health Sci Educ Theory Pract. 2022)
Stakeholders’ perception on the implementation of Developmental Progress Assessment: using the Theoretical Domains Framework to document behavioral determinants
Christina St‑Onge1 · Elisabeth Boileau1 · Serge Langevin1 · Lily H. P. Nguyen2 · Olivia Drescher3 · Linda Bergeron1 · Aliki Thomas2 

 

 

서론
Introduction

불행히도, 종단 평가(longitudinal assessment (LA))의 광범위한 구현은 의대생의 독립적 진료로의 진행을 문서화하는 데 사용하는 것을 뒷받침하는 실제 과학적 증거보다는 잠재적 편익 추정에 더 의존한다. 우리는 대학원 의학 교육의 맥락에서 LA의 시행과 관련된 몇 가지 도전과 장벽을 문서화했지만, 우리는 아직 그 속담의 결실을 거둘 수 있는 방식으로 그것을 홍보하는 방법을 확립하지 못했다. 어떤 요인들이 LA의 이행을 유리하게 하거나 방해할 수 있는지에 대한 명확하고 공유된 이해가 부족하면 훈련생의 독립적 실천으로의 진행에 관한 결정의 질이 저하될 수 있다.
The widespread implementation of longitudinal assessment (LA) unfortunately rests more on suppositions of its potential benefits than on actual scientific evidence supporting its use to document progression of medical students to independent practice. While we have documented several challenges and barriers associated with the implementation of LA in the context of postgraduate medical education (St-Onge et al., 2020), we have yet to establish how to promote it in a manner that will allow us to reap its proverbial fruits. Lack of a clear and shared understanding of what factors can favor or hinder the implementation of LA can decrease the quality of decisions about trainees’ progression to independent practice.

최근 LA의 인기가 높아진 것은 많은 HPE 프로그램에서 진행 중인 광범위한 CBME 롤아웃 덕분이다. [LA의 중심 원칙]은 [미리 설정된 역량 연속체]에서 한 사람의 [진행에 대한 피드백]을 받는 것이 [독립적 관행을 향한 그들의 발전]에 크게 기여한다는 것이다. 다시 말해, 역량 연속체, 즉 궤적을 사용하면 훈련생과 임상 교사가 그들이 지향하는 "목표"를 알 수 있다고 생각된다. 이러한 궤적은 구현되는 위치에 따라 다른 형태를 띠며, 결과적으로 다른 용어를 사용하여 레이블이 지정되었습니다. 국경을 초월하는 것처럼 보이는 이러한 기본 역량 연속성을 설명하는 데 자주 사용되는 용어는 마일스톤과 EPA(위탁 가능한 전문가 활동)입니다. 대학원 의학 교육을 위한 인증 위원회(ACGME)는 2012년 개인의 진행 상황을 더 잘 모니터링하기 위해 역량 기반 마일스톤을 도입했습니다. 2005년 ten Cate는 "잘 수행한다는 것은 중요한 EPA를 수행하는 데 신뢰할 수 있는 것으로 정의될 수 있다"고 제안했다. 그리고 전 세계의 많은 의료 인증 기관들이 그 뒤를 따랐다. 피드백과 결합하여, 이러한 역량 연속성은 훈련생이 다음에 숙달해야 할 개발 단계를 강조함으로써 해당 궤도에 스스로 위치할 수 있도록 하여 전문적 발전에 기여할 수 있어야 한다. LA의 인기는 주로 그러한 잠재적 이익에 의해 주도되었지만, 그것의 실행은 도전으로 가득 차 있다.
The recent and increased popularity of LA can be attributed to the on-going widespread CBME roll-out in many HPE programs (Green et al., 2009; Holmboe et al., 2020; St-Onge et al., 2020). A central tenet of LA is that receiving feedback about one’s progression on a pre-established competence continuum greatly contributes to their development towards independent practice (Boud, 2015; Lajoie, 2003). In other words, the use of a competence continuum, or a trajectory, is thought to allow trainees and clinical teachers to know the “goal” they are working towards (St-Onge et al., 2020). These trajectories take on different forms according to where they are implemented, and consequently have been labeled using different terms. Frequent terms used to describe these underlying competence continua, that seem to transcend borders (Bramley & McKenna, 2021), are Milestones and Entrustable Professionals Activities (EPAs). The Accreditation Council for Graduate Medical Education (ACGME) introduced competency-based Milestones to better monitor individuals’ progression in 2012 (Nasca et al., 2012). In 2005, ten Cate suggested that “performing well could be defined as being trusted to carry out critical EPAs”, and many medical accreditation bodies across the globe have since followed suit. Combined with feedback, these competence continua should enable trainees to situate themselves on said trajectory thus contributing to their professional development by highlighting what developmental steps are to be mastered next (Lajoie, 2003). While the popularity of LA has been largely driven by such perceived potential benefits, its implementation is fraught with challenges.

우리는 최근 범위 검토에서 [LA 구현에 대한 장벽]을 문서화했습니다. 하나의 중요한 장벽은 훈련생과 감독관이 [LA를 완료하는 데 필요한 기회 또는 시간]을 찾는 측면에서 관찰된 [성과에 대한 빈번한 평가와 관련된 추가적인 로지스틱적 부담]으로 구성된다. LA의 편익에 대한 불충분한 증거(실제 대 예상 편익)는 서로 다른 이해관계자(감독관 및 교육생 등)가 LA를 회피하거나 기본 전제를 존중하지 않고 사용할 수 있다. Touchie와 Ten Cate가 지적한 바와 같이: "마일스톤과 EPA가 새로운 체크리스트 역할을 한다면 우리는 아무것도 얻지 못한 것이다." LA의 보급 증가와 학습을 촉진하기 위한 평가의 잠재성으로 인해, LA의 품질 구현을 촉진하기 위해 이러한 장벽을 해결하는 것이 필수적이다.

We recently documented barriers to the implementation of LA in a scoping review (St-Onge et al., 2020). One important barrier consists of the additional logistical burden -for supervisors and trainees- associated with frequent assessment of observed performance in terms of finding the opportunities or the time required from trainees and supervisors to complete LA (Hicks et al., 2016; Holmboe, 2015; Peters et al., 2017). Insufficient evidence of the benefits of LA (actual versus anticipated benefits) may cause different stakeholders (such as supervisors and trainees) to avoid LA, or to use it without respecting its underlying premises (Conforti et al., 2018; Drolet et al., 2017; Friedman et al., 2016; Goldman et al., 2017; Peabody et al., 2017; Peters et al., 2017; Swing et al., 2014). As Touchie and ten Cate (2016, p. 96) point out: “if milestones and EPAs serve as the new checklist we have not won anything”. With the increased prevalence of LA and the potential of assessment to drive learning (Swanson & Case, 1997), it is imperative that we address such barriers to promote quality implementation of LA.

LA와 같은 개입의 품질 구현은 여러 이해관계자의 행동 변화를 필요로 한다. 새로운 관행의 구현과 수용을 촉진하기 위해, 프로세스와 설명 프레임워크가 행동 변화에 대한 명시적인 결정 요인을 어떻게 만들 수 있는지 고려하는 것이 도움이 된다. [모범 사례에 방해가 될 수 있는 결정 요인(지지 및 장벽)을 식별]할 수 있을 때, 우리는 맞춤형 및 이론 중심 개입을 만들어 모범 사례의 활용을 촉진할 수 있다. [Buy-in(즉, 이해 관계자가 관행의 가치와 관련성을 보아야 하는 경우)]와 [결정 요인(예: 지원 및 장벽)]이라는 개념은 지식 번역(KT) 및 구현 과학 분야에서 일반적이다. LA의 품질 구현을 촉진하는 방법을 식별하기 위해 [결정 요소 프레임워크]가 이 연구를 안내하는 데 어떻게 도움이 될 수 있는지 고려했다. 우리는 행동 변화를 지지하거나 방해하는 요인을 식별하기 위해 KT 연구에 특별히 사용되는 이론 도메인 프레임워크(TDF)를 선택했다.

Quality implementation of interventions, such as LA, requires behavioral changes from several stakeholders (Buck et al., 2018; Canadian Institutes of Health Research, 2012; Carr et al., 2009; O’Rourke et al., 2016). To promote the implementation and uptake of new practices, it is helpful to consider how both process and explanatory frameworks can make explicit determinants of behaviour change. When we can identify the determinants (supports and barriers) that may stand in the way of best practices, we can create tailored and theory driven interventions to promote the uptake of best practices (Thomas & Bussières, 2021). Notions of buy-in (i.e., where stakeholders must see the value and relevance of a practice) and of determinants (e.g., supports and barriers) are common in the fields of knowledge translation (KT) and implementation sciences (Birken et al., 2017; Nilsen, 2015). To identify how to promote quality implementation of LA, we considered how a determinant framework could help guide this research. We opted for the Theoretical Domains Framework (TDF) which is specifically used in KT research to identify the factors that either support or hinder behaviour change (Francis et al., 2012; French et al., 2012; Graham et al., 2006; Michie et al., 2005).

개념 프레임워크 – 이론적 도메인 프레임워크
Conceptual framework – Theoretical Domains Framework

여러 심리학적 이론은 [행동 변화]의 잠재적으로 수정 가능한 [결정 요인]을 탐색하고, 임상 관행을 바꾸기 위한 [표적targeted 개입]을 설계하는 데 성공적으로 적용되었다. TDF는 특정 행동의 결정 요인을 조사하기 위해 특별히 개발되었으며, 따라서 전문적인 행동을 바꾸기 위한 개입의 설계를 알릴 수 있다. TDF는 14개 영역(지식, 기술, 사회적/전문적 역할 및 정체성, 역량에 대한 신념, 낙관론, 결과에 대한 신념, 강화, 의도, 목표, 기억, 주의 및 의사결정 프로세스, 환경 컨텍스트 및 자원, 사회적 영향, 감정 및 행동 규제)과 84개 구성 요소를 포함한다. 행동 변화와 관련이 있는 것으로 추정됩니다. TDF를 사용할 때, 연구자들은 [지배적인 영역], 즉 [행동에 영향을 미칠 가능성이 가장 높은 영역]을 식별하려고 한다. 그런 다음 식별된 요인/결정 요인을 대상으로 맞춤형 행동 변화 개입을 설계한다. 예를 들어, 데이터에서 식별된 지배적 영역이 강화 및 사회적 영향인 경우 KT 개입에는 인센티브와 보상 및/또는 동료로부터의 사회적 장려 과정이 포함될 수 있다.

우리의 구체적인 목표는 

  • (1) LA에 대한 주요 이해 관계자의 지식과 태도를 문서화한다. 
  • (2) LA의 수용과 지속 가능한 사용에 대한 지지와 장벽을 파악합니다.

Psychological theories have been successfully applied to explore potential modifiable determinants of behavior change and to help design targeted interventions to change clinical practice. The TDF was developed expressly to investigate determinants of specific behaviors and thus, can inform the design of interventions to change professional behavior (Grol et al., 2007; Webb et al., 2010). The TDF contains 14 domains (knowledge, skills, social/professional role and identity, beliefs about capabilities, optimism, beliefs about consequences, reinforcement, intentions, goals, memory, attention and decision processes, environmental context and resources, social influences, emotions and behavioral regulation) and 84 component constructs believed to be associated with behavior change (Cane et al., 2012; Francis et al., 2012). When using the TDF, researchers seek to identify the dominant domains, that is, those most likely to influence behavior. Tailored behavior change interventions are then designed to target the identified factors/determinants. For example, the KT interventions could include incentives and rewards and/or social processes of encouragement from peers (Michie et al., 2008) if the dominant domains identified in the data are reinforcement and social influences.

Our specific objectives are to

  • (1) Document key stakeholders’ knowledge of- and attitudes towards LA, and
  • (2) Identify the supports and barriers to the uptake and sustainable use of LA.

방법들
Methods

맥락
Context

많은 나라에서, 의과대학 졸업생들은 독립 실습에 들어가기 전에 대학원 훈련을 마쳐야 한다. 전문 레지던트 프로그램은 2년에서 3년(가정의학), 최대 5년에서 7년(대부분의 외과 전문 또는 의료 하위 전문)까지 다양하다. 캐나다의 레지던트 프로그램은 각각 가정의학대학(CFPC)과 캐나다 왕립내과외과의학대학(RCPSC)에 의해 인가되며, 교육 가이드라인을 제정한다. 일반적으로 훈련생들은 처음에는 다양한 임상 윤회를 통해 그들의 훈련의 기초를 배우고, 결국 그들의 교육은 전문분야의 세부사항에 전념하게 된다. RCPSC는 2017년에 CBME의 한 형태인 CBD(Competency-by-Design)를 구현하고 LA의 구현을 촉진했습니다. 보다 구체적으로, LA는 확립된 위탁 가능한 전문 활동(EPA)에 의해 거주자가 특정 EPA에 포함된 특정 이정표를 충족해야 한다는 것을 통보받는다.
In many countries, graduating medical students must complete postgraduate training before entering independent practice. Specialty residency programs can range from two to three years duration (i.e. family medicine), up to five to seven years (i.e. most surgical specialities or medical subspecialties). Residency programs in Canada are accredited, respectively, by the College of Family Medicine (CFPC) and by the Royal College of Physicians and Surgeons of Canada (RCPSC), who establish training guidelines. Typically, trainees initially learn the foundations of their discipline through a diversity of clinical rotations, and eventually, their education is dedicated to the specifics of the specialty. The RCPSC implemented Competency-by-Design (CBD) -a form of CBME- in 2017 and promoted the implementation of LA (Gofton et al., 2017). More specifically, LA is informed by established Entrustable Professional Activities (EPAs), that residents are required to meet given Milestones embedded within specific EPAs.

CBD의 이러한 맥락에서, 여러 이해관계자는 LA에서 특정한 역할을 가지고 있다

  • 지도부(PGME Deans 및 PD)는 CBD와 LA의 일반적인 구현을 책임진다. 
  • 전공의들은 정기적으로 전공의를 관찰하고 평가 양식을 작성해야 하는 감독관에게 관찰과 피드백을 요청함으로써 평가에 대한 소유권을 갖게 된다. 
  • 임상역량위원회(CCC) 위원은 이러한 평가 양식을 통해 수집된 정보를 종합한다. 

우리의 연구는 CBME의 특정 형태인 CBD의 맥락에서 수행되었지만, 우리의 연구 결과는 CBME의 원칙과 일치하는 다른 프로그램들에게 흥미로울 수 있다. 더 구체적으로, 프로그램 관리자와 교육자는 우리의 연구 결과를 새로운 종적 평가 관행의 설계와 구현을 알리기 위해 사용할 수 있다.

In this context of CBD, several stakeholders have specific roles in LA.

  • The leadership (PGME Deans and PD) are responsible for the general implementation of CBD, and LA.
  • Residents are called to take ownership of their assessment by soliciting observations and feedback from their supervisors, who, in turn, are required to regularly observe residents and complete assessment forms.
  • Clinical Competency Committee (CCC) members aggregate the information collected through these assessment forms.

While our study was conducted in the context of CBD, a specifc form of CBME, our findings could be of interest to other programs whose goals are aligned with the principles of CBME. More specifically, program administrators and educators can use our findings to inform the design and implementation of novel longitudinal assessment practices.

설계.
Design

이론적 도메인 프레임워크에 의해 통보된 주요 이해관계자와의 반구조적 인터뷰를 사용하여 서술적 질적 연구를 수행했다. 우리는 [양질의 LA의 구현을 방해하거나 촉진할 행동 결정 요인]을 식별하는 것을 목표로 했다. 연구를 수행하기 위한 윤리적 승인이 PI의 기관에서 얻어졌다.

We conducted a descriptive qualitative study, using semi-structured interviews with key-stakeholders that were informed by the Theoretical Domains Framework (Atkins et al., 2017; Cane et al., 2012; French et al., 2012); we aimed to identify behavioral determinants that would hinder or facilitate the implementation of quality LA. Ethical approval to conduct the study was obtained at the PI’s institution.

참가자 및 모집
Participants and recruitment

참가자들은 [주어진 영역 또는 영역에 대한 특정 전문 지식 또는 경험이 있거나, 새로운 평가 관행의 도입에 위험이 있고 연구 중인 개념에 대한 고유한 통찰력을 제공]할 때 [주요 이해 당사자]로 간주된다(Patton, 2002). 우리는 4개의 핵심 이해 관계자 그룹, 즉 1-PGME(Postgraduate Medical Education) 학장 및 프로그램 이사, 2-임상 역량 위원회 위원, 3-임상 감독자 및 4-주민을 식별했다. 우리의 목표는 TDF 연구에서 일반적으로 접하는 샘플이기 때문에 그룹당 10-12명의 참가자를 모집하는 것이었다. 이러한 연구는 그러한 샘플을 통해 행동 변화에 가장 영향을 미칠 가능성이 높은 요인에 대한 풍부한 데이터가 생성된다는 것을 보여주었다. 이러한 이해관계자는 교육생의 임상역량 또는 LA의 이행에 대한 종단적 평가의 역할을 하며, 이행 및 LA에 대한 장벽과 지원을 명확히 할 수 있다. 그들은 LA의 다양한 측면을 다루며, 그렇게 함으로써 보완적인 관점을 제공할 수 있다.

Participants are considered key stakeholders when they have specific expertise and/or experiences in a given area or domain, or when they have something at stake in the uptake of a new assessment practice and that provide unique insights in regards to the concept under study (Patton, 2002). We identified four key stakeholder groups namely,

  • 1- Postgraduate Medical Education (PGME) deans and program directors,
  • 2- clinical competence committee members,
  • 3- clinical supervisors and
  • 4- residents.

Our goal was to recruit 10–12 participants per group as these are the samples usually encountered in TDF studies (Boet et al., 2017; Cheung et al., 2019; Curran et al., 2013; Islam et al., 2012; Patey et al., 2012). These studies have shown that with such samples, rich data are generated on the factors most likely to affect behaviour change. These stakeholders play a role in the longitudinal assessment of trainees’ clinical competence or the implementation of LA, and can articulate barriers and supports for the implementation and LA. They tackle different aspects of LA, and as such can provide complementary viewpoints.

모집은 목적추출, 눈덩이모집, 언론게시 등 3가지로 이뤄졌다

  • 주요 이해관계자를 초청하기 위해 목적적 표본 추출 전략이 먼저 채택되었다. 
  • 이 전략은 스노우볼 샘플링 전략으로 보완되었다. 이를 위해 연구 조수는 기관 웹사이트를 통해 캐나다의 Deans, Vice and Associate PGME Deans 및 프로그램 디렉터를 식별했습니다. 이러한 개인은 최초 작성자(CSO)가 이메일을 통해 연락했습니다. 우리는 잠재적 참가자들에게 우리의 채용 초청장을 배포하여 임상 역량 위원회 위원, 임상 감독자 및 거주자를 식별하는 데 도움을 요청했다.  
  • 또한, 우리는 PI의 계정을 통해 소셜 미디어(트위터 및 페이스북)에 채용 청첩장을 게시하고 RCPSC를 태그했습니다. 마지막으로 참가자들에게 동료들의 연락처를 알려달라고 하는 등 눈덩이처럼 불어나는 채용전략으로 나아갔다. 참가자들에게 50달러짜리 기프트 카드가 제공되었다. 

Recruitment was three-fold: purposive sampling, snowball recruitment, and media posting.

  • A purposive sampling strategy (Luborsky & Rubinstein, 1995) was employed first to invite key stakeholders;
  • this strategy was complemented with a snowball sampling strategy. For this, a research assistant identified Deans, Vice and Associate PGME Deans, and program directors in Canada using institutional websites. These individuals were contacted by the first author (CSO) via email. We asked those potential participants to help us identify clinical competence committee members, clinical supervisors and residents by disseminating our recruitment invitation.
  • Additionally, we posted recruitment invitations on social media (Twitter and Facebook) via the PI’s accounts and tagging the RCPSC. Finally, we proceeded to a snowball recruitment strategy by asking participants to provide contact information for their colleagues. Participants were offered a $50.00 gift-card for their participation.

데이터 수집 절차
Data collection procedure

사회인구학적 설문지
Socio demographic questionnaire

우리는 짧은 웹 기반 설문지를 통해 사회 인구 통계 정보를 문서화했습니다.

  • PGME 사장 및 프로그램 이사, CCC 회원 및 임상 감독관은 8가지 질문으로 구성된 설문지를 작성했다. 
    • 기관에서의 현재 역할, 평가 결정에 미치는 영향, 평가에 대한 교육, 현재 역할에서의 시간, PGME 수준에서의 시간 감독 및 연령에 대한 6가지 개방형 질문과 공식 훈련과 성별에 대한 두 가지 폐쇄형 질문입니다.
  • 전공의는 5가지 질문으로 구성된 설문지를 작성했습니다.
    • 전공의 프로그램 및 연령에 대한 두 가지 개방형 질문, 그리고 그들의 거주 년도, 다른 훈련, 그리고 성별에 대한 세 개의 폐쇄형 질문들.

참가자들은 가상으로 연구에 참여하기 위한 동의서에 서명한 후 설문지를 작성하도록 초대받았다.

We documented sociodemographic information via a short web-based questionnaire.

  • PGME deans and program directors, CCC members and clinical supervisors completed a questionnaire comprised of eight questions:
    • six open-ended questions on their current role at their institution, their influence on assessment decisions, training received on assessment, time in their current role, time supervising at the PGME level, and age; and
    • two close-ended questions on their formal training, and their gender.
  • Residents completed a questionnaire comprised of five questions:
    • two open-ended questions about their residency program, and their age; and
    • three close-ended questions about their year of residency, other training, and gender.
  • Participants were invited to complete the questionnaire once they virtually signed the consent form to participate in the study.

개별 인터뷰 및 인터뷰 프로토콜
Individual interviews and the interview protocol

2018년 5월부터 2020년 5월까지 두 명의 서로 다른 경험 있는 이중 언어 연구 보조자가 웹 기반 비디오 플랫폼(GoTo Meeting)을 사용하여 주요 이해 관계자들과 만났다. 인터뷰는 참가자들이 선택한 언어(프랑스어 또는 영어)로 진행되었다.
Two different experienced bilingual research assistants met with the key stakeholders using a web-based video platform (GoToMeeting) between May 2018 and May 2020. The interviews were conducted in the language chosen by participants (French or English).

인터뷰 프로토콜은 이론 도메인 프레임워크(TDF)를 기반으로 설계되었다. 우리는 LA의 구현을 제한하거나 촉진할 수 있는 요소를 식별하는 것을 목표로 14개의 다른 TDF 도메인을 다루기 위한 질문을 만들었다(부록 1 참조). 인터뷰 진행자는 참가자들이 LA 및 그 구현에 대한 전문 지식 및/또는 경험을 바탕으로 고유한 통찰력을 공유할 수 있도록 했습니다.
The interview protocol was designed based on the Theoretical Domains Framework (TDF). We created questions to address the 14 different TDF domains with the goal to identify which factors can limit or facilitate the implementation of LA (see Appendix 1). The interviewer allowed participants to share their unique insights based on their expertise and/or experience with LA and its implementation.

전반적으로, 인터뷰는 평균 41분 동안 지속되었다(PGME 대표와 PD = 44분, CCC 회원 = 45분, 감독관 = 43분, 주민 = 34분). 그 인터뷰는 녹음된 것과 녹음된 것으로 되어 있었다. 참가자들의 익명성을 보호하기 위해 녹취록은 전사 과정에서 익명으로 처리되었다. 또한, 한 RA는 식별 데이터가 남지 않도록 다른 팀원들에게 전송되기 전에 모든 전사물을 검토했다. 참가자에게는 이해관계자 그룹(예: 전공의의 경우 R##)을 반영하기 위한 코드가 할당되었지만, 팀 구성원은 이를 식별할 수 없었다. 전사된 내용은 보안 클라우드 서버에 보관되었으며, 액세스는 엄격하게 제어되었으며 분석에 참여한 팀 구성원(CS-O, LB, OD)에게만 제공되었습니다.

Overall, the interviews lasted 41 min on average (PGME deans and PDs = 44 min; CCC members = 45 min; Supervisors = 43 min; Residents = 34 min). The interviews were audio recorded and transcribed verbatim. To protect the anonymity of the participants’ identity, the recordings were rendered anonymous during the transcription process. Furthermore, one RA reviewed all transcriptions before they were sent to the other team members to ensure no identifying data were left. Participants were assigned codes to reflect their stakeholder group (e.g., R## for residents) but that did not allow the team members the possibility of identifying them. Transcriptions were kept on a secure cloud server, access was strictly controlled and only provided to team members that participated in the analysis (CS-O, LB, OD).

데이터 분석
Data analysis

인터뷰가 진행된 언어로 데이터를 분석했는데, 이는 모든 팀원들이 프랑스어와 영어에 능통하기 때문에 가능한 접근 방식이었다. 주제 분석에 대한 연역적(TDF 도메인)과 귀납적(특정 신념) 접근 방식은 모두 앳킨스 외(2017)에서 설명한 대로 사용되었다. 인터뷰 기록들은 처음에 14개의 TDF 도메인을 사용하여 두 명의 팀 구성원(OD와 LB)에 의해 코딩되었다. 코딩의 차이는 첫 번째 저자(CS-O)와 논의되었다. 모든 발화가 관련된 이론적 영역으로 코드화되면, 팀 구성원(OD, LB 및 CS-O)은 발화를 [구체적 신념]으로 코드화한다. [구체적 신념]은 행동에 영향을 미치는 영역의 역할에 대한 세부사항을 제공하는 진술이다. 이러한 진술들은 여러 발화에 공통적인 의미를 전달하기 위한 것이다. 이어서 각 도메인 내에서 가장 중요한 주제가 제안되었다. 주제 식별은 CS-O & AT의 지속적인 반복 분석을 통해 수행되었습니다. 그들은 주제에 대해 토론하고 다듬어 다른 팀원들에게 발표했다. 분석 과정은 팀이 데이터 해석에 충분하다고 느낄 때까지, 즉 데이터 해석에 합의할 때까지 계속되었다.

Data were analyzed in the language that the interview was conducted in, an approach that was available since all team members are fluent in French and English. Both deductive (TDF domains) and inductive (specific beliefs) approaches to thematic analysis were used as described in Atkins et al. (2017). Interview transcriptions were initially coded by two team members (OD and LB) using the 14 TDF domains (Atkins et al., 2017; Cane et al., 2012; French et al., 2012). Differences in coding were discussed with the first author (CS-O). Once all utterances were coded to a relevant theoretical domain, team members (OD, LB and CS-O) coded utterances to specific beliefs. A specific belief is a statement that provides detail about the role of the domain in influencing the behaviour (Francis, Stockton, et al., 2009; Francis, Tinmouth, et al., 2009). These statements are intended to convey a meaning that is common to multiple utterances. Subsequently, overarching themes were proposed within each domain. Theme identification was done through continued iterative analysis by CS-O & AT. They discussed and refined the themes andpresented them to the other team members. The analysis process continued until the team felt they reached sufficiency (Dey, 2007; Nelson, 2017) in the data interpretation, that is, until they agreed on the interpretation of the data.

두드러진 도메인 식별
Identification of salient domains

TDF 결과 프레젠테이션의 관례에 따라 도메인 및 이해관계자 그룹별로 식별된 테마(빈도 카운트)를 정량화했다. 그런 다음 우리는 데이터에 더 널리 퍼져 있고 행동 변화에 동기를 부여하기 위해 행동할 수 있는 주제를 확인했다. 빈도(인터뷰 전반에 걸쳐, 그리고 각 영역 내의 신념의 수) 외에도, 우리는 종적 평가에 영향을 미칠 수 있는 상반되는 진술의 존재와 강한 신념의 증거를 고려했다. 
As is customary for a TDF result presentation, we quantified the themes (frequency count) identified per domain, and also per stakeholder group. We then identified the themes that were more prevalent in the data and on which we could act upon to motivate behavioral changes (Atkins et al., 2017; Buetow, 2010). In addition to frequency (across interviews, and number of beliefs within each domain), we considered the presence of conflicting statements and evidence of strong beliefs that could influence longitudinal assessment (Atkins et al., 2017; Buetow, 2010).

반사율
Reflexivity

본 절에서는 팀원들의 내용 전문지식과 이론적 틀에 대한 지식이 본 연구의 설계 및 수행에 어떤 영향을 미쳤는지 자세히 설명한다. 우리는 정량적 방법론(CS-O, LB, SL)과 CBME(SL, LHPN, EB, TD, CS-O)에 대한 경험이 있고, 정량적 방법론(CS-O, LB, OD)에 대한 배경을 가진 팀원들을 의도적으로 모았다. 팀원은 상호 보완적인 이론적 관점(LA 및 TDF; CS-O, AT, LB, OD)과 수집된 데이터에 대한 강력한 해석을 달성하기 위해 모인 LA 구현의 '현장' 경험을 가지고 있습니다. 교육자들은 실용적인 관점을 제시했고, 구현 '전선'에서 일어나고 있는 상황을 고려하여 데이터를 맥락화하는 데 도움을 주었다. 
(SL – 전 PGME 학장, OTL-HNS 프로그램의 LHPN-CBME 리드, OTL-HNS 프로그램의 CC 멤버, 가정의학과 및 고급 기술 레지던트 프로그램(응급 의료 프로그램 및 노인 의료 프로그램 포함) 

In this section, we detail how the team members’ content expertise and knowledge of the theoretical framework influenced the design and conduct of this study. We purposefully brought together team members that have experience with assessment (CS-O, LB, SL) and CBME (SL, LHPN, EB, TD, CS-O), with backgrounds in quantitative methodologies (CS-O, LB, OD), and qualitative methodologies (AT). Team members have complementary theoretical perspectives (LA and TDF; CS-O, AT, LB, OD) and the ‘on-the-ground’ experiences of the implementation of LA (SL– former PGME dean, LHPN- CBME lead for OTL-HNS program, member of CC for OTL-HNS program, EB–director for the family medicine and enhanced skills residency programs [which include an emergency medicine program and a geriatrics program]) that were brought together to achieve a robust interpretation of the data collected. The educators offered a pragmatic point of view and helped to contextualize the data in light of what was happening on the implementation ‘frontlines’.

이것은 행동 변화의 결정 요인을 식별하기 위해 HPE에서 TDF를 적용한 첫 번째 연구 중 하나이기 때문에, 우리는 우리 팀에 적절한 전문 지식을 갖는 것의 중요성을 인식했다. CS-O는 TDF를 뒷받침하는 몇 가지 이론에 익숙하고 이전 경험을 가지고 있다. 이는 OD가 TDF에 의해 보고된 연구에서 작업한 두 번째였다. AT는 임상 실습에서 행동 변화의 결정 요인을 식별하기 위해 TDF를 적용한 여러 팀의 일부였다. HPE에 TDF를 적용하는 참신함을 고려할 때, 팀 구성원들은 다른 코딩(LB)을 포함한 코딩 전반에 걸쳐 몇 가지 논의를 했고, TDF의 본질에 충실하도록 하면서 TDF를 데이터에 중요한 요소를 충분히 수용하도록 조정했다.
Since this is one of the first studies to apply the TDF in HPE to identify determinants of behavioural change, we were cognizant of the importance of having the appropriate expertise in our team. CS-O is familiar and has previous experience with several theories underpinning the TDF. This was OD’s second time working in a study informed by the TDF. AT has been part of several teams that have applied the TDF to identify determinants of behavioral changes in clinical practice. Given the novelty of applying the TDF in HPE, team members had several discussions throughout the coding, including the other coder (LB), and analysis to make sure they stayed true to the essence of the TDF, while adapting it sufficiently to capture the important elements in their data.

결과.
Results

연구에 참여한 사람은 41명이었다: 5명의 PGME 이사들과 5명의 프로그램 디렉터들, 10명의 CCC 회원들, 10명의 감독들, 그리고 11명의 거주자들. 참가자들은 8개의 다른 프로그램과 14개의 다른 캐나다 대학에서 왔습니다. 참가자들에 대한 더 많은 사회인구학적 정보가 표 1에 제시되어 있다.

Forty-one individuals participated in the study: five PGME deans and five program directors (PD); 10 CCC members, 10 supervisors, and 11 residents. Participants are from eight different programs and 14 different Canadian universities. More sociodemographic information about the participants are presented in Table 1.

 

관련 도메인이 있는 주요 테마
Key themes with relevant domains

우리는 이해관계자 그룹당 상위 3개의 지배적인 도메인(즉, 가장 빈번한 도메인)을 식별했다. 즉, 참가자 발언의 양 측면에서 가장 지배적인 도메인은 다음과 같다. LA의 '결과에 대한 믿음', '환경적 맥락과 자원', LA에 대한 '지식'입니다. 이러한 영역은 참가자의 발언의 56%에서 73%를 차지했다(표 2 참조). 전공의의 경우, 이 세 가지 영역의 순위는 다른 이해관계자 그룹에서 보았던 결과에 대한 신념과 비교하여 [가장 지배적인 도메인]이 [환경적 맥락와 자원]이라는 점에서 다르다. 또한 이러한 각 도메인에 대한 개별적인 상대적 중요도는 표 2에 설명된 바와 같이 그룹마다 다릅니다. 이러한 행동 결정 요인의 상대적 중요성은 LA의 구현을 추진할 때 어떤 요인들이 더 주의를 기울여야 하는지 이해 관계자 그룹별로 알려줄 수 있다.

We identified the top 3 dominant domains (i.e., most frequent) per stakeholder group, that is, the domains most predominant in terms of quantity of participant utterances, namely: ‘belief about consequences’ of LA, ‘environmental context and resources’, and ‘knowledge’ about LA. These domains represented 56% to 73% of participants’ utterances (see Table 2). For residents, the ranking of these three domains is different, in that the most dominant domain is environmental context and resources, versus beliefs about consequences, which was seen in other stakeholder groups. Furthermore, the individual relative importance for each of these domains varies from group to group as documented in Table 2. The relative importance of these behavioral determinants can inform us, per stakeholder group, about what factors need more attention when going forward with the implementation of LA.

 

부록 2에서 우리는 TDF 도메인 및 이해관계자 그룹별 구체적인 믿음과 상대적 중요성을 제시한다. 우리는 먼저 TDF 도메인별로, 그리고 나서 주어진 TDF 도메인 내에서 구체적인 믿음으로 이를 제시한다. 데이터의 양을 고려할 때, 우리는 이해관계자 그룹당 가장 두드러진 특정 신념, 즉 행동에 가장 영향을 미칠 가능성이 높은 행동 결정 요인만 아래에 제시한다.
In Appendix 2 we present the specific beliefs per TDF domain and stakeholder group, and their relative importance: we present this first by TDF domain and then by specific belief within a given TDF domain. Given the volume of data, we present below only the most salient specific beliefs per stakeholder group, that is, the behavioral determinants most likely to influence behaviours.

일반적으로 참가자들은 [LA가 PGME [학장과 PD와 CCC 위원]의 80/20 비율, [감독관과 전공의]의 70/30 비율로 부정적인 결과보다 긍정적인 결과를 더 많이 가지고 있다]고 인식한다. 따라서 CCC 회원과 PGME 회원과 PD보다 약간 부정적인 전공의와 감독관의 견해는 다음과 같다. 이 두 그룹의 주요 차이점은 많은 평가 양식을 작성해야 하는 것과 관련된 [평가 피로]인 것 같은데, 전공의와 감독자의 경우 각각 23%와 21%가 PGME 대표와 PD, CCC 구성원의 경우 각각 10%와 14%가 된다. 예를 들어, 한 감독자는 LA가 '극도로 길다'(S18)고 말했다. 또 다른 상사는 그들이 '질렸다'며 LA가 '내 귀에서 나오는 소리'라고 말했다(S17). 한 거주자는 LA를 '채워야 할 다른 확인란'과 '넘어야 할 추가적인 장애물'이라고 언급하며, '주민이 되어 임상 서비스를 운영하고 공부하는 것 외에, 실제로 이러한 EPA를 완료하여 적절한 사람을 찾고 있는지, 적절한 수 만큼 하고 있는지 확인하는 또 다른 압박이다.'라고 말했습니다.'(R07) CCC 위원과 감독관에게는 학습과 역량 개발을 더 잘 추적할 수 있는 가능성이 가장 긍정적인 결과(각각 해당 영역에서 발언의 30%, 36%)로 보였다. CCC의 한 회원은 LA가 주민들이 '[시스템의 균열]에 빠지는 것을 방지하는 데 도움이 된다'고 말했다. (C10). PGME 학장과 PD, 그리고 거주자들에게는, [평가 문화의 변화]와 그들의 [평가에 대한 감독관과 전공의의 참여 증가]는 LA의 가장 긍정적인 결과로 간주되었다. (각각 TDF 도메인에서 발화의 30%와 36%를 사용한다.) PGME와 PD 그룹의 한 참여자는 이 변화를 "… "매우 강력하고 매우 중요한"(A18) 변화임을 나타내는 "판단 역할에서 코칭 역할로" 변화.
In general, participants perceive that LA has more positive than negative consequences with an 80/20 ratio for PGME deans and PDs and CCC members and 70/30 ratio for supervisors and residents. Thus, residents’ and supervisors’ views where slightly more negative than CCC members and PGME deans and PDs. The main difference between these two groups seems to be assessment fatigue related to having to fill out many assessment forms, with 23% and 21% of their utterances -in this domain- for residents and supervisors respectively compared to 10% and 14% for PGME deans and PDs, and CCC members respectively. For example, one supervisor communicated about LA being ‘extremely long’(S18). Another supervisor said that they are ‘fed up’ and that LA is ‘coming out of my ears’(S17). A resident referred to LA as ‘other checkboxes to fill’ and as being ‘an additional hurdle to cross’, stating that ‘it's another pressure on top of being a resident and running a clinical service and studying and whatnot, to actually get these EPAs completed to ensure that we’re finding the right people to do it, ensure we’re getting the right number’(R07). For CCC members and supervisors the potential for better tracking of learning and competence development was seen as the most positive consequences (30% and 36% of utterances in that domain respectively). A CCC member stated that LA helps to avoid residents ‘falling in a crack [of the system]’(C10). For PGME deans and PDs, and residents, the shift in the assessment culture and the increased involvement of supervisors and residents in their assessment was seen as the most positive consequence of LA (with 30% and 36% of the utterances in that TDF domain respectively). A participant in the PGME deans and PD group explains this shift as a “… change in the nature of the relationship between the preceptor and the resident … from the judging role to the coaching role” indicating that it is a “very powerful and very important” (A18) change.

[LA를 수행하는 데 필요한 자원]은 모든 이해관계자 그룹(CCC 구성원 = 55%, PGME 수단 = 61%, 주민 = 53%, 감독자 = '환경적 맥락과 자원' 영역에서 발언의 32%)에 대한 중요한 고려 사항이다. 사용된 플랫폼은 참가자마다 달랐지만 전반적으로 완료해야 할 양식과 task을 지원하는 테크놀로지는 모든 이해관계자 그룹(CCC 회원, PGME 위원 및 PD, 주민 및 감독자의 '자원' 발언의 각각 32%, 23%, 24%, 16%)에 대해 문제가 있는 것으로 보였다. 예를 들어, 참가자들은 "비사용자 친화적" 플랫폼(A21, R02)과 액세스 코드 요구(R03) 및 플랫폼이 작동하지 않는다는 사실(R11)에 대해 비판적이었다. 한 참가자는 다른 프로그램 이사들과 사용 가능한 e-포트폴리오에 대해 논의한 후 전반적인 인상이 "충격적이지 않다underwhelming"(A20)고 말했다. 또한 많은 참가자들은 모바일로 양식에 액세스하지 못하는 것(또는 휴대폰을 통해 양식에 액세스하는 데 문제가 보고된 것)이 상사와 함께 '실시간' 평가를 완료하는 데 중요한 장애라고 보고했습니다. 또한 PGME 학장 및 PD들은 DPA(이 영역에서 발언의 24%)를 적절하게 이행하기 위해 추가적인 자원(재정 및 인적)이 필요하다고 지적했다. 
The resources required to do LA is an important consideration for all stakeholder groups (CCC members = 55%, PGME deans = 61%, residents = 53%, and supervisors = 32% of utterances in the ‘environmental context and resources’ domain). While the platforms used varied between participants, overall, the forms to be completed and the technology to support the task seemed problematic for all stakeholder groups (with 32%, 23%, 24% and 16% of ‘resource’ utterances from CCC members, PGME deans and PDs, residents and supervisors respectively). For example, participants were critical of the “non-user-friendly” plateform (A21, R02), the access codes required (R03), and the fact the plateform didn’t work (R11). One participant stated -after discussion with other program directors about the e-portfolios available- that the overall impression “is underwhelming” (A20). In addition, many participants reported that not having access to the forms on their mobile (or reported issues with accessing forms via their cell phones) was an important barrier to completion of the assessment ‘in real-time’ with their supervisors. Additionally, PGME deans and PDs pointed out that there is a need for additional resources (financial and human) to appropriately implement DPA (24% of their utterances in this domain).

전체 참가자들은 일반적으로 [LA에 대해 잘 알고 있습니다]. LA의 모든 요소와 특성은 우리의 데이터에 존재하지만, 각 이해관계자 그룹에 의해 식별되지는 않는다. 예를 들어, PGME의 사장과 PD들은 LA 관행 내에서 피드백의 가치를 강조한다(발언의 32%는 이 영역에서). "공식 피드백은 로테이션 중간 및 로테이션 종료 회의로 제한될 수 있다."(A18) 
그리고 LA가 "문화의 변화"(A18)를 산출했다고 밝혔다. CCC 회원들은 LA가 진행을 평가하는 데 사용된다는 사실에 대해 더 자주 논의했고, 명시적인 기대치를 제시했다(이 영역에서 발언의 25%, 26%). 참가자에게 이러한 명시적 기대는 "…구체적 목표 또는 구체적 역량 – 훈련생이 독립적인 실습에 안전하다고 간주되기 위해 달성해야 하는 역량"으로 해석됩니다. (C07) 감독관들은 LA가 "학생들이 훈련 중에 어디에 있는지 구체적으로 알아야 하는 목표와 핵심 학습 문제가 무엇인지 알고 있다"고 제공하는 명백한 기대치에 대해 이야기했다(S12)(이 영역에서 발언의 45%). 전공의들은 LA를 완성하기 위해 시행된 프로세스에 대해 자주 말했는데, 예를 들어 누가, 무엇을, 언제, 왜(이 영역에서 발언의 38%) 하는지 언급했습니다. 마지막으로, 평가가 [관찰 기반](3~12% 범위)이거나 LA가 [전공의들에게 책임을 부여하는 중요성]과 관련된 발언은 거의 없었다(2~9% 범위). 이 두 가지 측면 모두 LA의 전제와 그에 따른 품질 구현의 핵심이다.

Overall participants are generally knowledgeable about LA. While all the elements and characteristics of LA are present in our data, they are not identified by each stakeholder group. For example, PGME deans and PDs emphasize the value of feedback within LA practices (with 32% of their utterances in this domain) stating that “formal feedback was likely limited to mid-rotation and end of rotation meetings.”(A18) and that LA yielded “a change in culture’”(A18) CCC members discussed more often the fact that LA is used to assess progression, and offered explicit expectations (25% and 26% of their utterances in this domain). For a participant, these explicit expectations translate into “…specific objectives or specific competences– competencies that a trainee needs to accomplish in order to be deemed safe for independent practice.”(C07). Supervisors talked about the explicit expectations that LA provides them as “knowing what the objectives and key learning issues that students need to know particular to where they are in their training”(S12) (45% of their utterances in this domain). Residents spoke often about the processes put in place to complete LA, stating for example who does what, when and why (38% of their utterances in this domain). Lastly, very few utterances related to the importance that assessment be observation-based (ranging from 3 to 12%), or that LA places the responsibility on residents (ranging from 2 to 9%). Both these aspects are central to the premise of LA and thus to its quality implementation.

지식 영역에서는 명시적이지 않지만, [오너십을 가진 전공의]들은 행동 규제와 관련된 모든 이해 관계자의 담론에 존재했다. 즉, 직관적으로 우리의 참가자들은 LA의 이 구성요소가 요구하는 행동의 중요한 변화를 강조하는 방식으로 그것을 논의했다. 구체적으로, CCC 구성원은 전공의(및 교수진)가 (평가될 EPA를 제기하는 데 있어) 책임을 지는 것을 목표로 한다. 그들은 또한 관찰 기반 평가(이 TDF 영역에서 이러한 특정 신념 각각에 대한 발언의 34%)를 지지한다. PGME 학장과 PD 및 감독자는 관찰 후 가능한 한 빨리 EPA를 생성하거나 완료하는 것을 목표로 한다(PGME 학장과 PD 및 감독자의 경우 각각 63%와 38%). 감독자는 "비교적 평가를 신속하게 수행해야 한다"며 "임상 접촉 후 몇 주 후에 수행된 평가는 품질을 잃는다(S17)"고 말했다. 행동 조절과 관련하여 주목할 만한 점은 전공의가 [EPA 기회(발언의 44%)에 따라 임상 관행을 구조화한다는 것]이다. 한 레지던트는 '더 급한 업무에 따라 하루를 정리하고, 어떤 환자를 먼저 보고, 어떤 환자를 나중에 봐야 하는지'에서 '어떤 환자가 내가 해낼 수 있는 EPA'(R10)로 일상 업무를 정리하는 방식의 변화를 설명했다.
While not explicit in the knowledge domain, residents taking ownership was present in all stakeholders’ discourse related to behavioral regulation, that is, intuitively our participants discussed it in a way that highlighted the significant change in behavior that this component of LA requires. Specifically, CCC members aim for residents (and faculty) to take responsibility (in bringing up EPAs to be assessed). They also advocate for observation-based assessment (34% of utterances for each of these specific beliefs in this TDF domain). PGME deans and PDs and supervisors aim to produce or complete EPAs as quickly as possible after observation (with 63% and 38% of their utterances in this domain for PGME deans and PDs and supervisors respectively). A supervisor stated the “need to do the assessment relatively quickly” and that “an assessment done several weeks after a clinical encounter loses quality”(S17). Noteworthy with regards to their behavioral regulation, residents structure their clinical practice according to EPA opportunities (with 44% of their utterances in this domain). A resident illustrated the change in how they organize their daily work from “organizing a day according to the more urgent work, which patient to see first and which to see later” to “which patient is an EPA I can accomplish”(R10).

CCC 위원과 감독관은 LA를 수행하는 데 필요한 [가장 관련 있는 기술]은 [피드백을 제공하는 적절한 대인관계 및 인지 능력]이라고 말했다(CCC와 감독관의 경우 각각 92%와 62%). CCC 회원과 PGME 대표 및 PD들은 영역 내에서 LA 구현의 맥락에서 [사회적 영향력자]로서의 역할을 한다고 보고하였다(응답의 40%, 44%). 전공의들과 감독관들은 동료 또는 상급자들로부터 다양한 수준의 영향을 받았다고 보고했지만, 그러한 정보원이 그들의 행동에 어떻게 영향을 미쳤는지에 대한 명확한 패턴이 없었다.
CCC members and supervisors stated that the most relevant skills required to do LA are the appropriate interpersonal and cognitive abilities to provide feedback (with 92% and 62% of their utterances in this domain for CCCs and supervisors respectively). Within the domain social influence, CCC members and PGME deans and PDs reported that they have a role as social influencers in the context of LA implementation (with 40% and 44% of their responses in this domain). Though residents and supervisors reported experiencing varying levels of influences from peers, colleagues or superiors, there was no clear pattern of how those sources influenced their behaviors.

우리가 LA의 맥락에서 [사회적, 전문적인 역할과 정체성]을 탐구했을 때, CCC와 감독관은 그것이 전공의를 지도하는 데 예상되는 책임이자 일부라고 말했다(CCC와 감독관의 경우 각각 71%와 78%). CCC 회원들은 또한 (이 TDF 영역에서 발언의 29%를 차지하는) 진급progress 상황을 결정할 책임이 있다는 것을 인정한다. PGME 학장과 PD들은 (발화의 100%가 이 영역에서) 구현을 지원하도록 되어 있다고 보고했다. 전공의는 자기들이 스탭을 교육하고(예: 플랫폼을 사용하고 EPA를 작성하는 것) 그들에게 평가를 요청하는 것으로 본다(이 영역에서 발언의 79%).
When we explored social, professional role and identity in the context of LA, CCC and supervisors stated that it is an expected responsibility and part of coaching residents (with 71% and 78% of their utterances in this domain for CCCs and supervisors respectively). CCC members also recognize that they have the responsibility to determine progress (with 29% of utterances in this TDF domain). PGME deans and PDs reported they are meant to support the implementation (with 100% of their utterances in this domain). Residents see themselves as educating staff (e.g., using the platform and filling out EPAs) and requesting assessments from them (with 79% of their utterances in this domain).

LA에 대한 참가자들의 [낙관론]은 대부분 서로 다른 이해관계자 그룹에 걸쳐 50대 50의 비율로 나뉘었다. CCC 구성원들은 LA에 대한 긍정적인 감정을 보고하는 4개의 이해관계자 그룹 중 가장 긍정적이었다(이 영역에서 발언의 71%).
Participants’ optimism about LA was mostly divided, with 50/50 ratios across the different stakeholder groups. CCC members were the most positive of the four stakeholder groups reporting positive emotions towards LA (71% of their utterances in this domain).

논의
Discussion

[구현과학 학자들]은 혁신의 구현과 평가를 알리기 위해 이론과 엄격한 방법의 사용을 옹호해 왔다. 본 연구에서는 잘 알려진 [결정 요소 프레임워크]인 [이론적 도메인 프레임워크]를 사용하여, 캐나다 대학원 교육 프로그램에서 CBD의 구현과 동시에 수행되고 있는 종단 평가의 구현에 대한 이론적인 문서를 수행했다. 우리는 PGME 이사장과 PD, CCC 회원, 감독관 및 5개 레지던트 프로그램의 거주자 등 4개 이해관계자 그룹을 대표하는 41명의 참가자를 인터뷰했다. 이 연구에서, 우리는 CBD 또는 다른 형태의 CMBE의 맥락에서 LA의 향후 설계, 개정 및 구현에서 다루어야 할 세 가지 핵심 요소를 확인했다. 

  • 1- LA에 대한 모든 주요 이해당사자 간의 [지식 및 이해 공유], 
  • 2- 예상되는 [편익을 극대화]하면서 [잠재적인 부정적 결과를 최소화]하기 위한 수립된 계획 
  • 3- LA를 성공적으로 구현하기 위해 [필요한 자원을 확보]하기 위한 계획 

Implementation science scholars have been advocating for the use of theories and rigorous methods to inform the implementation and evaluation of innovations (Atkins et al., 2017; Thomas & Bussières, 2021). In this study, we used a well-known determinant framework, the Theoretical Domains Framework, to conduct a theory informed documentation of the implementation of Longitudinal Assessment, which is being done concurrently with the implementation of CBD in Canadian postgraduate training programs. We interviewed 41 participants representing four different groups of stakeholders, namely PGME deans and PDs, CCC members, supervisors and residents from five residency programs. In this study, we have identified three key elements that should be tackled in future design, revision and implementation of LA in the context of CBD or other forms of CMBE:

  • 1- a shared knowledge and understanding between all key stakeholders of what is LA,
  • 2- an established plan to minimize potential negative consequences while maximizing the anticipated benefits, and
  • 3- a plan for obtaining the required resources to implement LA successfully.

우리는 이것들 각각이 LA 구현의 품질에 어떻게 영향을 미칠 수 있는지 논의하고 진행 중인 CBD 구현의 맥락에서 LA의 지속적인 롤아웃 동안 고려할 요소를 제안한다. 독자들은 모든 결과에 대한 논의를 기대할 수 있지만, 우리는 이 세 가지에 초점을 맞춘다. 왜냐하면 그들은 '변화'의 가능성이 더 크기 때문이다. 그러므로, 이것들은 우리가 가장 시급히 다루어져야 한다고 생각하는 영역들이다.
We discuss how each of these can impact the quality of the implementation of LA implementation and suggest elements for consideration during the its continued roll-out of LA in the context of the on-going CBD implementation. While readers might expect discussion of all the results, we focus on these three because they have a greater likelihood of ‘change’. Therefore, these are the domains we consider should most urgently be addressed.

TDF에서 지식은 "무언가의 존재에 대한 인식"으로 정의된다. 우리의 맥락에서, 지식은 참가자들이 LA에 대해 무엇을, 얼마나 많이 알고 있는지를 의미한다. 혁신에 대한 기본 지식은 행동 변화의 핵심입니다. 실제로, 특정 행동에 대한 지식(및/또는 공식 교육)의 부족은 새로운 관행의 채택에 대한 주요 장벽으로 다른 맥락에서 확인되었다. 총체적으로 (네 그룹 모두에 걸쳐) 우리의 참가자들은 LA의 모든 특징이나 구성 요소에 대해 알고 있었다. 그러나, 우리는 서로 다른 이해관계자 그룹에 따라 보고된 특징의 변화에 주목했다. 우리는 이러한 특정 지식의 영역의 원인과 잠재적 결과에 대해 가설을 세운다.
In the TDF, knowledge is defined as an awareness of the existence of something (Atkins et al., 2017, p. 4). In our context, knowledge refers to what and how much participants know about LA. Foundational knowledge of an innovation is key for behaviour change. Indeed, a lack of knowledge (and/or formal education) about a specific behavior has been identified in other contexts as a major barrier to the adoption of a new practice (Salbach et al., 2007; Thomas & Bussières, 2021). Collectively (across all four groups) our participants knew about all the characteristics or components of LA. However, we noted a variation in the characteristics reported according to the different stakeholder groups. We hypothesize about the cause and potential consequences of these specific areas of knowledge.

Cianciallo & Regher(2019)와 Varpio et al(2012)은 혁신은 지역적 맥락에 적응하기 위해 수정될 수 있지만, 항상 [기본 철학과 원칙]에 뿌리를 두고 진실해야 한다고 주장한다. 즉, [양질의 구현]은 [일상적인 운영화(기술)]보다는 [기본 철학과 원칙]에 대한 적절한 이해]에 달려 있습니다. 우리의 데이터에서 관찰된 LA에 대한 이해의 차이는 핵심 철학과 원칙의 통합 부족을 지적하는 것보다 LA의 기술(운영화)에 대한 초점을 반영하는 것으로 보인다.

Cianciallo & Regher (2019) and Varpio et al. (2012) argue that while innovations are amenable to local context adaptations, they should always stay rooted in, and true, to their underlying philosophies and principles. That is, quality implementation is dependent upon an appropriate understanding of the underpinning philosophies and principles, rather than on its day-to-day operationalisation (techniques). The differences in understanding of LA observed in our data seems to reflect a focus on the techniques of LA (its operationalisation), more than pointing to a lack of integration of its core philosophies and principles.

[LA에 대한 지식]에서 관찰된 패턴은 또한 다중 이해관계자 구현의 현실을 반영할 수 있다. 즉, LA에서 이해관계자마다 다른 역할을 한다. 감독관과 전공의는 [이전에 없었던 명시적인 학습 목표]를 높이 평가한다. 역량 위원회 위원들은 또한 그들의 주요 기능이 전공의 진급을 감시하는 것이기 때문에 [훈련 진급에 대한 명시적인 기대치]에 초점을 맞춘다. UGME 학장과 PD는 [직접적인 관찰에 기반한 코칭과 평가의 중요성]을 당연히 강조할 수 있다. 따라서, 우리 데이터의 패턴은 각 이해당사자 그룹이 LA 내에서 그들의 특정 작업과 역할에 초점을 맞추고 그들의 고유한 관점을 표로 가져온다는 것을 시사한다. [양질의 구현을 극대화하고 LA의 핵심 철학과 원칙에서 벗어나는 잠재적 이동을 최소화하는 방법]은 [LA의 모든 특성에 대한 모든 이해 관계자의 지식을 증가시키는 것]을 목표로, [이론 중심적인 KT 개입을 개발하고 구현하는 것]일 수 있다. 그러한 개입을 개발하는 데 관여하는 사람들의 과제는 각 이해당사자 그룹이 LA에 대해 어떤 지식을 보유해야 하는지, 그리고 구현 과정의 어떤 측면이나 단계를 가져야 하는지를 결정하는 것이다.
The patterns observed in the knowledge about LA may also reflect the reality of a multi-stakeholder implementation. That is, different stakeholders play different roles in LA. Supervisors and residents appreciate the explicit learning targets that were absent previously. Competence committee members also focus on explicit expectations of trainee progression since their primary function is to monitor resident progression. UGME deans and PD may rightfully emphasize the importance of coaching and assessment based on direct observation. Thus, the pattern in our data suggests that each stakeholder group is focused on their specific tasks and roles within LA and bring their unique perspective to the table. An option to maximise a quality implementation and to minimise a potential move away from the core philosophies and principles of LA, could be to develop and implement targeted and theory driven KT interventions aimed at increasing all stakeholders’ knowledge about all characteristics of LA. The challenge for those involved in developing such interventions will be to determine what knowledge about LA each stakeholder group should possess and for which aspect or stage of the implementation process.

놀랍게도, 참가자들은 (이 주제에 대한 현재 문헌의 격차에도 불구하고) [LA 데이터 해석의 타당성]에 대한 문제를 명시적으로 제기하지 않았다. LA의 구현은 캐나다와 전 세계적으로 최신이며 참신하다. LA 데이터의 타당한 해석을 뒷받침하는 결과 또는 결과에 대한 제한된 경험적 증거가 있다. 최근 몇 년 동안, 몇몇 저자들은 타당성에 대한 심리측정학적 관점에 도전했고, 프로그램적, 서사적, 또는 심지어 종적 평가와 같이, 새로운 평가 전략과 더 일치할 수 있는 다른 접근 방식을 더 포함할 것을 제안했다. Progress처럼, 움직이는 과녁의 타당성을 문서화하는 것은 어려운 것으로 판명될 수 있으며, LA의 제안된 목적에 맞게 적절하게 조정되도록 하기 위해 우리의 검증 관행을 다시 한 번 검토해야 할 수 있다.
Surprisingly, participants seldom explicitly brought up issues of the validity of LA data interpretation, despite a current gap in the literature on this subject (St-Onge et al., 2020). The implementation of LA is both recent and novel in Canada and around the world; there is limited empirical evidence of its outcomes or evidence supporting the valid interpretation of LA data (St-Onge et al., 2020). In recent years, several authors have challenged the psychometric perspective on validity and suggested that it be more inclusive of other approaches that may be more aligned with novel assessment strategies, such as programmatic- narrative- or even longitudinal- assessment (Cook et al., 2016; Marceau et al., 2018; St-Onge et al., 2017). Documenting the validity of a moving target, such as progress, may prove challenging and may require that we examine our validation practices -yet again- to ensure proper alignment with the proposed purpose of LA.

[LA의 결과에 대한 신념]이라는 요소가 자주 언급되었습니다. 이 요소는 "특정 상황에서 행동의 결과에 대한 진실, 현실 또는 타당성의 수용"을 의미한다. 이는 새로운 실무관행을 채택하는 것이 바람직한 결과나 불리한 결과를 초래할 것이라는 잠재적 최종 사용자의 신념에 관한 것이다. LA의 [현재 구현에 대해 다소 회의적]임에도 불구하고, 대다수의 참가자들은 LA가 학생, 레지던트 프로그램, 나아가 사회에 [긍정적인 결과를 가져올 수 있다]고 믿었다. 그러나 모든 이해관계자 집단은 LA와 관련된 부정적인 결과보다 긍정적인 결과를 더 많이 예상하지만, LA와 그 이행에 대한 전반적인 긍정적인 경험이 있다는 것을 의미하지는 않는다. 결과적으로, 참가자들은 현재 시행 중인 LA의 일부 실무와 이것이 예상되는 효익을 산출할 수 있는지에 의문을 제기하였다. 잠재적 결과에 대한 믿음은 서로 다른 이해관계자 그룹이 빈번하고 관찰 기반이며 거주자 주도적이며 피드백이 풍부한 평가의 노력을 유지하기에 충분한 동기부여가 될 수 있다. 이 결과는 현재 널리 퍼진 LA 구현의 맥락에서 고무적이다.
The factor Belief about the consequences of LA was frequently mentionned. This factor refers to one’s acceptance of the truth, reality, or validity about outcomes of a behaviour in a given situation (Atkins et al., 2017, p. 4). It is about a potential end user’s belief that adopting a new practice will result in favourable outcomes or unfavorable consequences. Despite being somewhat skeptical about the current implementation of LA, the majority of participants believed that LA could yield positive outcomes for students, residency programs, and even society. However, while all stakeholder groups anticipate more positive consequences than negative consequences related to LA, it does not signify that they have an overall positive experience of LA and its implementation. Consequently, participants questioned some practices in the current implementation of LA and whether these could yield the anticipated benefits. The belief in potential consequences may be a sufficient motivator for the different stakeholder groups to maintain their efforts of frequent, observation-based, resident-initiated, and feedback-rich assessment (Griffiths et al., 2019; Holmboe et al., 2020; St-Onge et al., 2020). This result is encouraging in the context of the current widespread implementation of LA.

[LA의 참신성]을 고려할 때, 현재 긍정적인(또는 부정적인) 결과에 대한 경험적 증거는 거의 없다. 롤아웃 후반에 CBD로 이동하는 프로그램은 일부 기술적 문제가 해결되었고, 다른 프로그램들은 긍정적인 경험을 공유할 수 있었기 때문에 더 쉽게 전환되었다는 인식이 있다. 그럼에도 불구하고, 그리피스 외 연구진(2019)에서 보듯이, 이해관계자에게 [LA의 긍정적인 결과에 대한 과학적 증거를 제공]하면, 이해관계자의 동기 부여와 이러한 새로운 평가 관행에 대한 수용에 기여할 수 있을 뿐만 아니라, LA의 긍정적인 결과에 대해 회의적인 사람들을 설득할 수 있다. 더 중요한 것은, 이것이 몇 가지 모범 사례에 대한 증거를 제공할 수 있다는 것입니다. 우리의 결과에서 얻을 수 있는 것은 LA 결과에 대한 우리가 생성하는 [증거가 견고하고 유용하며 적용가능하지 않다]면, 새로운 관행을 성공적으로 구현하는 데 [충분한 buy-in을 얻을 수 없다]는 것이다. 이는 지난 20년 동안 HPE 증거의 성격, 규모 및 유용성에 대한 현장에서의 대화를 고려할 때 특히 중요할 것이다.

Given the novelty of LA, there is currently little empirical evidence of its positive (or negative) outcomes (St-Onge et al., 2020). There is a perception that programs moving to CBD later in the roll-out had an easier transition because some technological issues had been dealt with, and other programs could share positive experiences. Nonetheless, providing stakeholders with scientific evidence of the positive outcomes of LA, such as seen in Griffiths et al. (2019), could not only contribute to stakeholders’ motivation and uptake of these new assessment practices, it might convince those remaining skeptical about the positive outcome of LA. More importantly, it could provide evidence for some best practices. What can be gleaned from our results is that unless the evidence we generate -about LA outcomes- is robust, useful and applicable, there may be less buy-in than is required for successful implementation of a new practice (Onyura et al., 2015; Thomas et al., 2019). This will be particularly important given conversations in the field over the last 20 years on the nature, magnitude and usefulness of HPE evidence.

[환경적 맥락과 자원]은 "기술과 능력, 독립성, 사회적 역량, 적응적 행동의 발전을 저해하거나 장려하는 개인의 상황이나 환경의 모든 상황"으로 정의된다. 이 영역은 새로운 관행을 채택하는 데 중요한 역할을 할 수 있다. 본 연구에서 LA에 사용된 테크놀로지는 LA의 양질의 구현에 대한 장벽으로 가장 많이 보고되었습니다. 참가자들은 주로 사용성(또는 그 부족) 측면에서 현재 선호되고 있는 테크놀로지에 대해 비판하였다. 교육과 평가에서 [테크놀로지의 사용]은 그 자체로 어려움으로 가득 차 있다. 많은 저자들은 일반적으로 교육, 특히 평가에서 기술을 성공적으로 구현하려면 사용자의 수용이 필요하다고 문서화하였다. 인식된 유용성은 사용자 수용에 기여하는 중요한 요소이다(Terzis & Economicides, 2011). 즉, 잠재적 사용자가 기술을 채택하려면 '사용자 친화적'이라는 인식을 가져야 한다. LA 구현의 맥락에서, 참가자들은 다음과 같은 측면에서 테크놀로지의 usability을 크게 비판한다.

  • 접근성 (예: 특정 플랫폼에 국한됨) 
  • 로지스틱스 (예: 작성할 양식으로 이동하기 위해 점프하는 여러 후프) 및 
  • 사용자 친화성 (예: 제한된 탐색 용이성과 양식 작성에 필요한 정보를 찾는 어려움) 

LA의 구현에 있어 기술은 필수적입니다. 이해 당사자들은 하루 중 때때로 그것을 자주 사용해야 할 수도 있다. 따라서, 앞서 언급한 문제들은 양질의 LA 구현의 아킬레스건이기 때문에 다루어질 필요가 있다.

The domain Environmental context and resources is defined as any circumstance of a person’s situation or environment that discourages or encourages the development of skills and abilities, independence, social competence and adaptive behaviour (Atkins et al., 2017, p. 5). This domain can play an important role in the adoption of new practices (Grol & Wensing, 2004; Salbach et al., 2007; Scurlock-Evans et al., 2014). In our study, the technology used for LA was most frequently reported as a barrier to the quality implementation of LA. Participants critiqued the technology that is currently favored, mainly in terms of usability (or lack thereof). The use of technology in education and assessment is, in and of itself, fraught with challenges (Nikou & Economides, 2017, 2018, 2019). Many authors have documented that the successful implementation of technology in education generally, and assessment in particular, requires acceptance from the users (Briz-Ponce & García-Peñalvo, 2015; Briz-Ponce et al., 2017; Harmon, 2015; Hart & Sutcliffe, 2019). Perceived usability is an important factor contributing to user acceptance (Terzis & Economides, 2011). In other words, for potential users to adopt a technology they have to perceive that it is ‘user-friendly’. In the context of LA implementation, participants greatly critique the usability of the technology, in terms of

  • accessibility (e.g., limited to certain platforms),
  • logistics (e.g., several hoops to jump to get to the form to fill out), and
  • user-friendliness (e.g., limited ease of navigation and difficulty finding the required information to fill out the forms).

Technology is quintessential in implementation of LA. Stakeholders may have to use it sometimes often during the course of a day. Thus, the aforementioned issues need to be addressed as they stand to be the Achilles heel of a quality LA implementation.

TDF가 도출된 이론은 LA의 구현에 영향을 미칠 수 있는 많은 가능한 요인(개인 및 조직 모두)에 대한 포괄적인 이해를 제공했으며, 따라서 그 활용이 본 연구의 강점이다. 우리는 LA의 '현장' 구현에 중요한 4개 이해관계자 그룹의 관점을 모색하여 LA 구현의 장벽과 촉진자에 대한 다각적인 이해를 얻을 수 있도록 하였다. HPE에서는 새로운 관행의 구현에 대한 다중적인 이해당사자 관점이 거의 모색되지 않기 때문에 이것은 독특한 기여를 나타낸다.
The theories from which the TDF is drawn provided us with a comprehensive understanding of many possible factors (both individual and organizational) that may influence the implementation of LA, and as such, its use is a strength of this study. We sought the perspectives of the four stakeholder groups that are instrumental to the ‘on-the-ground’ implementation of LA, allowing us to achieve a multi-perspective understanding of the barriers and facilitators to the implementation of LA. This represents a unique contribution as multi-stakeholder perspectives on the implementation of a new practice are seldom sought in HPE.

이것은 교육 혁신의 구현을 연구하기 위해 HPE에서 TDF를 사용한 첫 번째 사례 중 하나였기 때문에, 우리는 배운 교훈을 비판적으로 살펴볼 필요가 있다. 우리는 교육 혁신의 하향식 구현을 연구할 때 일부 TDF 도메인이 제대로 적용되지 않는다는 것을 알게 되었다. 예를 들어, 참가자들은 [LA를 채택하려는 의도]나 [LA 채택을 위한 강화로 작용할 수 있는 요소가 무엇인지]에 대해 거의 언급하지 않았다. 사실, [LA는 인증 기관에 의해 의무화]되어 있기 때문에, 참가자들은 LA의 채택여부를 선택하는 데 있어 거의 주체성agency을 느끼지 않을 수 있다. 더욱이, 그들은 그러한 [강화reinforcement에 무관심]할 수 있는데, 그 이유는 그것에 대해 [어떻게 생각하거나 어떻게 인식하느냐에 관계없이 시행될 것]이기 때문이다. 이러한 관찰을 바탕으로, 교육 혁신의 구현에 대한 장벽과 촉진자를 연구하기 위해 TDF를 적용하기로 선택한 연구자들은 하향식 접근법이 있을 때 영역과 그 적용 가능성에 대해 유념하고 비판해야 한다(즉, 혁신이 부과된다).
Since this was one of the first to use the TDF in HPE to study the implementation of an educational innovation, we need to take a critical look at the lessons learned. We noticed that some TDF domains are not quite applicable when studying a top-down implementation of an educational innovation. For example, participants had little to say about their intention to adopt LA, or about what elements could act as reinforcement for the adopting of LA. In fact, LA is mandated by the accreditation body, and as such, participants may feel little agency in choosing to adopt or not LA. Further, they may be indifferent to such reinforcements because the implemenation will happen regardless of what they think about it or how they perceive it. Building on this observation, researchers that choose to apply the TDF to study the barriers and facilitators to the implementation of an educational innovation should be mindful and critical of the domains and their applicability when there is a top-down approach (i.e., the innovation is imposed).

이 연구는 한계가 있다. TDF는 전통적으로 [임상 가이드라인의 사용]과 같은 제한된 행동이나 모범 사례와 함께 사용되어 왔다. LA의 구현은 여러 수준에서 훨씬 더 복잡하고 상호의존적인 행동 변화 세트를 요구한다. 따라서 연구팀은 TDF에 소소한 수정(인터뷰 가이드에서 질문이 표현되는 방식 또는 분석에 대한 특정 신념으로 간주되는 것 등)을 해야 했고, 신중하게 고려했을 때 TDF가 적용 가능성의 한계에 도달했을 수 있다.
This study has limitations. The TDF has traditionally been used with more circumscribed behaviors or best practices, such as the use of a clinical guideline (Baay et al., 2019; Cowdell & Dyson, 2019; Hallsworth et al., 2020; Norton et al., 2019). The implementation of LA requires a much more complex and interdependent set of behavioral changes at several levels (Thomas & Ellaway, 2021). Thus, the research team had to make minor adaptations to the TDF (such as how questions were phrased in the interview guide, or what was considered a specific belief in the analysis), and carefully considered, this may have pushed the TDF to the limits of its applicability.

결론들
Conclusions

평가가 학습을 촉진한다는 격언에 대한 논쟁은 거의 없다. 명확한 기대치를 바탕으로 피드백을 보다 개방적이고 정직하며 건설적으로 사용하는 것을 선호함으로써, LA는 HPE의 평가 관행과 평가 문화를 변화시킬 수 있는 잠재력을 가지고 있습니다. 필요한 행동 변화를 촉진하기 위해 적절한 지원이 제공된다면, LA의 이행은 유능한 의료 전문가의 발전에 확실히 기여할 것이다. LA의 잠재적으로 긍정적인 결과에도 불구하고, 그것의 실행은 도전으로 가득 차 있다. LA의 구현과 품질 모니터링을 진행하면서, 우리는 LA의 품질 구현에 기여할 수 있는 전략적이고 명시적인 계획을 만들기 위해 이해관계자들을 하나로 모으는 것이 반드시 필요하다고 믿는다. 앞으로 연구자, 교육자 및 관리자는 이러한 결과를 함께 사용하여 LA 구현을 개선할 수 있는 방법을 추가로 모색할 수 있습니다. 예를 들어 합의 방법론을 사용하여 LA의 개념화와 구현을 더욱 세분화하고 이러한 결과를 교수진과 이해관계자의 지속적인 개발에 적용하여 모범 사례를 촉진하는 동시에 잠재적인 부정적 결과를 제한할 수 있다.

There is little debate about the adage that assessment drives learning. By favoring a more open, honest and constructive use of feedback building on explicit expectations, LA has the potential to change assessment practices and the assessment culture in HPE. The implementation of LA will surely contribute towards the development of competent health professionals, if the right affordances are made available to promote the behavioral changes required. Notwithstanding the potentially positive outcomes of LA, its implementation is fraught with challenges. Going forward with the implementation and quality monitoring of LA, we believe that there is imperative to bring stakeholders together to create a strategic and explicit plan that would contribute to a quality implementation of LA. Moving forward, researchers, educators and administrators could choose to come together and use these results as a starting point to further explore how to improve LA implementation. For example, using consensus methodology, they could further refine the conceptualization and implementation of LA and apply these findings towards faculty and stakeholder continued development to limit potential negative consequences while promoting best practices.

 

 

 

 


Adv Health Sci Educ Theory Pract. 2022 Aug;27(3):735-759. doi: 10.1007/s10459-022-10119-5. Epub 2022 May 27.

Stakeholders' perception on the implementation of Developmental Progress Assessment: using the Theoretical Domains Framework to document behavioral determinants

Affiliations collapse

Affiliations

1Université de Sherbrooke, Christina St-Onge, 3001 12e Avenue Nord, Sherbrooke, QC, J1H 5N4, Canada. christina.st-onge@usherbrooke.ca.

2Université de Sherbrooke, Christina St-Onge, 3001 12e Avenue Nord, Sherbrooke, QC, J1H 5N4, Canada.

3McGill University, Montreal, Canada.

4Université Laval, Quebec City, Canada.

PMID: 35624332

DOI: 10.1007/s10459-022-10119-5

Abstract

Background: The widespread implementation of longitudinal assessment (LA) to document trainees' progression to independent practice rests more on speculative rather than evidence-based benefits. We aimed to document stakeholders' knowledge of- and attitudes towards LA, and identify how the supports and barriers can help or hinder the uptake and sustainable use of LA.

Methods: We interviewed representatives from four stakeholder groups involved in LA. The interview protocols were based on the Theoretical Domains Framework (TDF), which contains a total of 14 behaviour change determinants. Two team members coded the interviews deductively to the TDF, with a third resolving differences in coding. The qualitative data analysis was completed with iterative consultations and discussions with team members until consensus was achieved. Saliency analysis was used to identify dominant domains.

Results: Forty-one individuals participated in the study. Three dominant domains were identified. Participants perceive that LA has more positive than negative consequences and requires substantial ressources. All the elements and characteristics of LA are present in our data, with differences between stakeholders.

Conclusion: Going forward, we could develop and implement tailored and theory driven interventions to promote a shared understanding of LA, and maintain potential positive outcomes while reducing negative ones. Furthermore, ressources to support LA implementation need to be addressed to facilitate its uptake.

Keywords: Assessment; Competency-based medical education; Development and progress; Longitudinal assessment; Theoretical domains framework.

의학교육으로 뛰어넘기: 의학교육자의 경험에 대한 질적 연구 (Med Educ, 2018)
Making the leap to medical education: a qualitative study of medical educators’ experiences
Julie Browne,1 Katie Webb2 & Alison Bullock2

 

서론
Introduction

본 논문은 개인이 [성공적인 자기 정체성 있는 의학교육자의 정체성]으로 전환하는 데 도움이 되거나 방해하는 요인을 파악하고 탐구하는 것을 목표로 한다.
This paper aims to identify and explore factors that help or hinder individuals in making the transition into the identity of a successful, self-identified medical educator.

의학 교육자들은 [커리어와 역할 변화의 지속적인 과정]의 일부로서 그들의 직업적 정체성을 개발한다. 많은 의학 교육자들이 정체성과 심지어 학문 사이의 [한계 공간]을 차지하고 있다고 주장되어 왔다. 결과적으로, 일부 개인들은 경쟁적인 진로 요구와 의료 교육 내의 증가하는 변화 속도에 직면하여, 안정적인 의료 교육자 정체성을 개발하고 유지하기 위해 고군분투한다. 이는 개인이 자신을 주로 임상의나 연구자로 보는 상황에서 특히 어려운 문제이다. 이러한 일차적인 전문적 정체성은 거의 불가피하게 교육자 역할보다 우선시되는데, 이는 임상의나 연구자가 더 나은 지원을 받고 더 많은 사회적 자본을 가지고 있으며, 개인들이 그것들을 획득하는 데 더 감정적으로 투자했을 가능성이 높기 때문이다. Hu 외 연구진과 Sabel 외 연구진은 [열등하고 애매한 정체성]으로 인식되는 것을 얻기 위해 [필요한 변화를 협상하는 데 수반되는 스트레스]는 종종 프로그램이나 조직의 지원에 관계없이 후배 교육자들이 더 관여하는 것을 방해한다고 제안한다.
Medical educators develop their professional identities as part of a continual process of career and role change.1 Many medical educators, it has been argued, occupy a liminal space between identities2 and even academic disciplines.3 Consequently, some individuals struggle to develop a stable medical educator identity and to maintain it in the face of competing career demands and the increasing pace of change within medical education.4, 5 This is a particular challenge in circumstances in which the individual views him- or herself primarily as a clinician or researcher.6-8 These primary professional identities almost inevitably take precedence over the educator role because they are better supported and carry more social capital, and because individuals are likely to have invested more emotionally in acquiring them.5 Both Hu et al.9 and Sabel et al.5 suggest that the stress involved in negotiating the changes necessary to acquire what is perceived as an inferior and nebulous identity often deters junior educators from becoming more involved, regardless of programme or organisational support.

이러한 긴장에도 불구하고, 일부 의학 교육자들은 역할과 정체성 모두에 편안한 지점에 도달할 수 있다. 이것은 그들이 ['의학 교육 일을 하는 사람']에서 [의학 교육자의 스스로 인정한 정체성]으로 전환한 시점이다. 우리의 주요 연구 질문은 이러한 일이 어떻게 발생하는지를 탐색하고 도움이 될 수 있거나 방해할 수 있는 요소를 식별하려고 시도한다.
Despite these tensions, some medical educators are able to arrive at a point at which they are comfortable with both role and identity; this is the point at which they have transitioned from ‘someone who does medical education work’ into the self-acknowledged identity of the medical educator. Our primary research questions explore how this happens and attempt to identify factors that may help or hinder.

[심리사회적 전환 이론]을 이용하여, 우리는 [의료 교육자가 되는 과정]을, 다른 비교적 안정적인 상태(의료 교육자 정체성)로의 전환을 이끄는 [일련의 스트레스를 받는 변화]를 통해, [하나의 비교적 안정적인 상태(주요 직업 정체성)]에서 벗어나는 과정 중 하나로 개념화한다. 
Using psychosocial transition theory, we conceptualise the process of becoming a medical educator as one of moving out of one relatively stable state (primary professional identity) through a series of sometimes stressful changes that lead to a transition into another relatively stable state (medical educator identity).10

[변화]와 [전환] 사이에는 차이가 있다.

  • 변화는 [상황적]이다: 새로운 교수나 리더십 역할을 맡거나, 새로운 일을 시작하거나, 새로운 학생이나 관리자 그룹을 만나거나, 다른 평가 시스템 내에서 일하는 것을 포함할 수 있다.
  • 반면, 전환은 [심리적]이다. 그것은 개인이 [자신의 삶에 변화를 포함incorporate]할 수 있도록 하기 위해 필요한 내면의 변화에 관한 것이다. Bridges는 다음과 같이 말합니다. '전환transition이 일어나지 않는 한, 변화는 "받아들여지지" 않기 때문에 작동하지 않을 것입니다.' 

There is a difference between change and transition.11 

  • Change is situational: it may involve taking on a new teaching or leadership role, starting a new job, encountering a new group of students or managers, or working within a different appraisal system.
  • Transition, however, is psychological: it concerns the inner alterations that are necessary to enable an individual to incorporate changes into his or her life. Bridges remarks: ‘Unless transition happens, the change won't work because it doesn't “take”.’11

[개인이 일련의 변화를 협상하는 데 성공]하는 것이 [자기 정체성 있는 의료 교육자 역할로의 전환]을 이끌게 된다. 우리는 이것이 사벨과 동료들이 보고한 의료 교육으로의 '도약leap'을 구성하는 것이라고 제안합니다. 교육자 역할에 대한 자기 동일시는 개인이 의료 교육 공동체 내에서 [합법적인 참여자]임을 느끼고, 해당 분야의 전문 지식을 개발하고 유지하는 어려운 과제에 전념할 준비가 되어 있다면 필요한 전환이다. 

An individual's success in negotiating a series of changes is what leads to transition into a self-identified medical educator role: this, we suggest, is what constitutes the ‘leap’ to medical education reported by Sabel and colleagues.5 Self-identifying with the educator role is a required transition if individuals are to feel that they are legitimate participants within the medical education community, ready to commit themselves to the difficult task of developing and maintaining specialist expertise in the field.12

특정 변화 또는 일련의 변화에 적응하는 개인의 능력은 [내적 및 외적 요인 모두]에 의해 영향을 받는다.

  • 이러한 요인에 대한 개인의 반응은 [부족함deficit에 대한 인식]과 [이를 충족할 수 있는 자원]에 따라 달라질 것이다.
  • 본질적인 성향(경험에 대한 개방성, 양심성 등)도 한몫할 수 있지만, 이전의 경험, 개인적 가치관, 야망도 영향을 미친다.
  • 더욱이 적응은 변화의 타이밍, 성격 및 상황, 강요 또는 선택 여부, 변화가 발생하는 개별 상황, 변화가 발생하는 조건이 이해되고 수용되는지 여부에 따라 달라질 수 있다.
  • 마지막으로, 변화에 적응하는 능력은 이용 가능한 지원과 개인이 채택할 수 있는 전략에 영향을 받는다.

An individual's ability to adapt to a particular change or set of changes is affected by multiple factors, both intrinsic and extrinsic.

  • The individual's response to these factors will vary depending on his or her perceptions of deficits versus resources available to meet them.13 
  • Intrinsic tendencies (such as openness to experience and conscientiousness) may play a part, but previous experience, personal values and ambitions also have effect.
  • Moreover, adaptation may vary with the timing, nature and circumstances of the change, whether it is imposed or chosen, individual circumstances when the change occurs, and whether the terms on which the change takes place are understood and accepted.
  • Finally, the ability to adjust to change is affected by the support available and the strategies the individual is able to adopt.1415

최근의 많은 연구들은 개별 임상 교사들이 그들의 경쟁적인 정체성을 저글링하면서 그들의 인식을 보고한다. 그러나 제안된 해결책들(예: 경력 기회, 교수 시간 및 전문 개발 계획 개발의 측면에서)은 종종 프로그램적 또는 조직적 수준에 있다. 주요 스트레스 요인이 느껴지는 것 같습니다. 그러나, Monrouxe의 주장처럼, '정체성은 고정된 인지 체계가 아니며, 오히려, 정체성은 우리가 하는 일'이며, 따라서 개인 수준에서 어떤 요소가 의학교육의 '행동'이나 수행을 촉진하거나 방해하는지 이해하는 것이 중요하다. 우리는 의학교육의 변화와 도전에 직면했을 때 개인의 지속성에 유리하도록 저울을 기울일 수 있는 요인을 탐구하는 데 관심이 있었다.

A number of recent studies report the perceptions of individual clinical teachers as they juggle their competing identities; however, proffered solutions (e.g. in terms of developing career opportunities, time for teaching and professional development schemes) are often at a programmatic or organisational level because it is at this level that the chief stressors appear to be felt.16, 17 However, as Monrouxe argues, ‘…identities are not fixed cognitive schemas; rather, identities are what we do’, and hence it is important to understand what factors, at an individual level, facilitate or impede the ‘doing’ or performance of medical education.12 We were concerned to explore the factors that may tip the scales in favour of an individual's persistence when faced with change and challenges in medical education.

따라서 이 논문은 두 가지 주요 방법으로 문헌에 추가된다. 첫째, 의료교육자로서의 자아정체성 발달과정을 고찰하기 위한 개념적 모형으로 전환이론을 소개하고, 둘째, 의료교육자 정체성 추구에 있어 개인의 지속성을 지지하거나 저지할 수 있는 개별적 요인을 살펴본다.

This paper therefore adds to the literature in two key ways. Firstly, it introduces transition theory as a conceptual model for considering the process of developing self-identity as a medical educator and, secondly, it looks at the individual factors that may support or deter an individual's persistence in pursuing a medical educator identity.

방법들
Methods

본 저자들은 전문 교육 기관 구성원의 정보 요구를 탐구하는 대규모 HEA(Higher Education Academy) 자금 지원 프로젝트에 참여했다. 우리는 의학교육아카데미(AoME)에서 의료교육 측면을 담당하기 위해 참여했으며, HEA 보고서를 알려주는 disciplined-focused report (미발표)를 제출하기 전에 온라인 설문 조사와 포커스 그룹을 사용하여 연구를 수행했다. HEA 학제간 보고서는 2015년에 발표되었다.
The present authors participated in a large-scale Higher Education Academy (HEA)-funded project exploring the information needs of members of professional education bodies. We were engaged by the Academy of Medical Educators (AoME) to undertake the medical education aspect, and conducted a study using an online survey and focus groups before submitting a disciplined-focused report (unpublished) that informed the HEA report. The HEA across-discipline report was published in 2015.18

그 후, 우리는 세 개의 의료 교육 포커스 그룹에서 수집한 데이터를 재조사했는데, 이 그룹은 여러 번의 경력 변화 동안 성공적으로 의료 교육자 정체성을 전환하고 유지한 경험이 있는 개인들을 대상으로 수행되었다.
We subsequently re-examined the data we had collected during three medical education focus groups, which had been conducted with individuals who had experience of transitioning successfully into and maintaining a medical educator identity during a number of career changes.

우리는 알고 싶었다: 

  • (i) 개인 수준에서 어떤 요인들이 이러한 개인들이 성공적인 자기 정체성 있는 의료 교육자로 전환하는 데 도움이 되었거나 방해가 되었는가? 
  • (ii) 의료 교육자 역할에 적응하기 위해 고군분투하고 따라서 의료 교육자 정체성을 거부할 위험이 있는 전문가에 대한 개별화된 지원을 개발하는 데 도움이 될 수 있는 결론을 도출할 수 있는지 여부.

We wanted to know:

  • (i) what factors at an individual level had helped or hindered these individuals in making the transition into a successful, self-identified medical educator, and
  • (ii) whether we could draw any conclusions from this that might help develop individualised support for professionals who are struggling to adjust to the medical educator role and are thus at risk of rejecting a medical educator identity.

데이터 수집
Data collection

2015년 5월 7일 카디프 대학교 대학원 의학 및 치과 교육 윤리 위원회는 이 프로젝트를 완전히 승인했다. 2015년 동안 3개의 포커스 그룹이 15명의 영국 기반 고위 의료 교육자(여성 6명, 남성 9명)와 함께 수행되었으며, 여기에는 다양한 의료 전문 분야의 임상의 9명이 포함되었다. 참여는 자발적이었다. 모든 참가자는 [시니어 자기 정체성 의학 교육자senior self-identified medical educators]에게 초점을 맞추기 위한 의도적인 노력으로, AoME 펠로우 중에서 모집되었다. 동료로서, 그들의 성과는 AoME 프로페셔널 표준의 레벨 2-3(즉, 상급 레벨)에서 AoME의 프로페셔널 인정 제도를 통해 동료 검토 및 인정을 받았다. 
Cardiff University's School of Postgraduate Medical and Dental Education Ethics Committee granted full approval for the project on 7 May 2015. Three focus groups were conducted during 2015 with 15 senior UK-based medical educators (six women, nine men), who included nine clinicians from diverse medical specialties. Participation was voluntary. All participants were recruited from among AoME fellows in a deliberate effort to focus on senior self-identified medical educators. As fellows, their achievements had been peer-reviewed and recognised through AoME's professional recognition scheme at levels 2–3 (i.e. senior level) of the AoME Professional Standards.19

첫 번째 포커스 그룹은 AoME의 전문 인정 제도에 대한 6명의 평가자로 구성되었습니다. 두 번째 그룹은 선출된 AoME 위원회 위원 5명으로 구성되었다. 세 번째 포커스 그룹은 4명의 AoME 펠로우로 구성되었으며, 이들은 모두 의료 교육에서 고위 직책을 맡고 있었다. KW는 JB의 지원으로 그룹 1을 촉진했다. JB는 KW와 AB의 지원으로 그룹 2를 촉진했다. AB는 KW의 지원으로 그룹 3을 촉진했다. 부록 S1은 포커스 그룹에 대한 질문 가이드를 제공한다. 토론은 오디오 녹음되고 장황하게 기록되었다. 모든 신원 확인 정보는 참가자들의 익명성을 보호하기 위해 삭제되었다.

The first focus group comprised six assessors for the AoME's professional recognition scheme. The second group consisted of five elected AoME council members. The third focus group comprised four individual AoME fellows, all of whom held senior positions in medical education. KW facilitated Group 1 with the support of JB. JB facilitated Group 2 with the support of KW and AB. AB facilitated Group 3 with the support of KW. Appendix S1 provides the question guide for the focus groups. Discussions were audiorecorded and transcribed verbatim. All identifying information was removed to protect the anonymity of the participants.

데이터 분석
Data analysis

[심리사회적 전환 이론]은 스트레스가 많은 변화를 협상하는 데 있어 개인의 지원에 대한 필요성을 탐구하는 데 유용한 도구이다. 의료 교육자 식별을 향한 진전은 상당한 스트레스를 주는 변화를 수반할 수 있기 때문에, 슐로스버그의 '4S'(4S) 모델 14는 원래 [개인이 변화에 성공적으로 적응할 수 있도록 개입을 지원하도록 설계]되었기 때문에, 포커스 그룹 데이터에 대한 적절한 분석 프레임워크를 만들 것이라고 이론화했다. [교육환경의 변화와 전환이 어려운 성인을 위한 지원서비스 개발]의 기반으로 성공적으로 활용되어 왔으며, 이러한 맥락에서 특히 유망하였다. 우리는 데이터가 잘 맞는지 확인하기 위해 프레임워크 방법을 통해 연역적으로 사용했다. JB와 KW는 매트릭스 프레임워크 형식을 사용하여 4S 메인 테마에 대해 데이터를 독립적으로 코딩하고 차트화했다. 그런 다음 저자들은 이 네 가지 프레임워크 영역 각각 내에서 하위 테마를 귀납적으로 식별했다. JB와 AB는 분석이 체계적이고 일관성 있게 이루어졌는지 확인하기 위해 차트 작성에 더 많은 노력을 기울였습니다. 마지막으로, 세 명의 연구자 모두 실무와 결론에 대한 시사점을 분석 검토에 참여하였다.

Psychosocial transition theory is a useful tool for exploring an individual's need for support in negotiating stressful changes. As the progress towards identifying as a medical educator can involve a good deal of stressful change,20 we theorised that Schlossberg's ‘Four S’ (4S) model14 would make an appropriate analysis framework for the focus group data as it was originally designed to support interventions to help individuals adapt successfully to change. It has been successfully used as a basis for developing support services for adults who are finding change and transition in education settings difficult and was therefore particularly promising in this context.15 We used it deductively through a framework method21 to examine if the data were a good fit. JB and KW independently coded and charted the data against the 4S main themes using a matrix framework format. The authors then inductively identified sub-themes within each of these four framework areas. JB and AB worked further on charting to ensure that analysis had been systematic and coherent. Finally, all three researchers engaged in a review of the analysis for implications for practice and conclusions.

결과.
Results

우리의 데이터는 슐로스버그의 4S 프레임워크와 일치한다. 그림 1의 각 사분면에 있는 17개의 글머리 부제목은 우리 자신의 분석을 반영하며, 앤더슨 등의 설명에 있는 더 큰 하위 주제 집합에서 도출된다. 우리의 샘플은 너무 작고 전문적 문제에 너무 정확하게 지시되어 친밀한 파트너 지원, 영성 및 성적 지향과 같은 하위 주제를 반영할 것으로 기대되지 않았다.
Our data aligned with Schlossberg's 4S framework.15 The 17 bulleted subheadings in each quadrant in Fig. 1 reflect our own analysis, and are drawn from the larger set of sub-themes within Anderson et al.'s account.22 Our sample was too small and too precisely directed at professional issues to be expected to reflect sub-themes such as intimate partner support, spirituality and sexual orientation.

테마1. 자신
Theme 1. Self

슐로스버그의 틀에서 [자아]는 다음과 같은 개인적 특성과 심리적 자원을 가리킨다.

  • 개인이 변화/새로운 역할에 대해 얼마나 편안하게 느끼는지, 
  • 그들이 예상한 것에 대해 얼마나 자신 있는지, 
  • 이전의 경험과 기대가 어떻게 그들을 이 지경에 이르게 했는지, 
  • 그들이 원하는 곳인지 아닌지, 그리고 
  • 그들의 개인적 가치가 그 역할과 어떻게 일치하는지. 

참가자들은 다년간의 경험을 가진 고위 의료 교육자였으며, 다양한 경로(예: 고위직 임명, 고급 자격, 펠로우십, 상, 보조금 및 상)를 통해 이를 인정받았다. 그러나 그들의 코멘트는 [의사, 학술, 과학자 또는 (두 명의 경우) 인문학자]라는 기본적인 이전 정체성에서 의학 교육자가 되기 위해 움직이고 있거나 움직인다는 지속적인 감각을 드러냈다.
In Schlossberg's framework,15 self refers to personal characteristics and psychological resources, such as to

  • how comfortable individuals feel with the change/new role,
  • how confident they are in their understanding of what is expected,
  • how prior experiences and expectations have brought them to this point,
  • whether it is where they want to be, and
  • how their personal values align with the role.

Participants were senior medical educators with many years of experience and had achieved recognition for this through a number of different channels (e.g. senior appointments, higher-level qualifications, fellowships, prizes, grants and awards), but their comments revealed a continuing sense that they were moving, or had moved, towards becoming medical educators from a primary prior identity as a doctor, academic, scientist or, in two cases, humanities scholar:

교육 설계에 관여하는 우리들 중 꽤 많은 사람들은 더 이상 의료 실습의 최전선에 있지 않습니다. (FG2, 참가자 K)
Quite a lot of us who are involved [in] the design of teaching are no longer in the frontline of medical practice. (FG2, participant K)


많은 참가자들은 이 분야의 [복잡성]을 언급했는데, 그 중 한 명은 의료 교육 인력의 다양성이 통합된 요인으로 보였다.
A number of participants referred to the complexity of the field, for one of whom the medical education workforce's diversity appeared to be a unifying factor:

우리는 매우 다양한 사람들과 함께 매우 복잡한 일들을 하려고 합니다. 우리 중 몇몇은 임상적이다. 우리 중 몇몇은 임상적이지 않다. 우리 중 몇몇은 1차 진료에 기반을 두고 있고, 몇몇은 2차 진료에 기반을 두고 있습니다. 우리 중 일부는 연구원이다. (FG2, 참가자 H)
We try to do some very, very complicated things with a very diverse group of people. Some of us are clinical. Some of us aren't clinical. Some of us are based in primary care, some of us in secondary care. Some of us are researchers. (FG2, participant H)

'우리'와 '우리 중 일부'를 반복적으로 사용하는 것은 화자가 '우리'(즉, 의학 교육자)가 누구인지 명확하게 알고 있음을 나타낸다. 여기서 [의료교육의 다양성을 성공적으로 탐색하는 것]은 의료교육자 정체성 형성의 잠재적 요인으로 보인다.
The repeated use of ‘we’ and ‘some of us’ indicates that the speaker has a clear idea of who ‘we’ (i.e. medical educators) are. Successfully navigating medical education's diversity appears here to be a potential factor in medical educator identity formation.

의학교육자들은 고등교육에서 신뢰를 얻기 위해서는 [세 가지 분야(과학연구, 교육, 의료행위) 모두에 전문가가 되어야 한다는 불안한 느낌]을 내포하는 용어인 ['임포스터 증후군']의 희생양이 될 위험이 있다. 자신의 전문 지식을 편안하게 느끼는 것이 참가자의 성공에 분명히 중요했습니다.
Medical educators risk falling prey to ‘imposter syndrome’,23, 24 a term that implies an uneasy sense that they need to be expert in all three fields (of scientific research, education and medical practice) in order to have credibility within higher education. Feeling comfortable in their own expertise was clearly crucial to the success of participants:

알다시피, 제가 제 영역에서 가르칠 때, 저는 상당히 편안하고 그렇게 할 자신감과 능력을 느낍니다. (FG3, 참가자 M)
You know, when I'm teaching in my own area then I'm, you know, I'm reasonably comfortable and I feel confident and competent to do that. (FG3, participant M)


한 참가자는 모든 것이 실제로 새로운 정체성을 형성하는 원동력이 될 수 있다는 것을 예상할 수 없다는 것을 받아들이는 것을 제안하는 것처럼 보였다.
One participant appeared to suggest accepting that they could not be expected to know everything might actually be a driver for forming a new identity:

네, 그것은 단지 지식에 관한 것이 아닙니다. 사회화, 정체성, 인성, 그리고 모든 종류의 것에 관한 것입니다. 그래서 당신은 단순한 정보의 보고가 아닙니다. 당신은 거의 다른 사람입니다. (FG3, 참가자 P)
Yes, it's not just about knowledge. It's about socialisation and identity, personability and all that sort of thing. So you're not just a repository of information. You are a different person almost. (FG3, participant P)

이 교육자에게는 정보 보유가 필요하지만, 교육자 정체성의 구별되는 특징은 [타인의 전문적 발전을 촉진하는 방법에 접근한다]는 것이다. 여기서 시사하는 바는 의학교육자들이 [그들이 알고 있는 것]에 의해서가 아니라, [그들의 직업윤리와 그들의 업무관계에서 표현되는 실제적인 방법]에 의해서 정의된다는 것이다.
For this educator, the possession of information is necessary; however, the distinguishing feature of educator identity is how one approaches the facilitation of others' professional development. The implication here is that medical educators are defined less by what they know than by their professional ethics and the practical ways in which these are expressed in their working relationships.

의학 교육은 [가치 주도적인 직업] 내에서 [가치 주도적인 활동]이다.25 많은 참가자들이 의사 및 과학자의 직업으로 그들을 처음 이끈 것은 그들의 가치였다고 느꼈고, 의료 교육에서의 그들의 노력이 이러한 가치를 뒷받침한다는 사실은 그들의 참여를 유지하는 데 중요했다.
Medical education is a value-led activity within a value-led profession.25 A number of participants felt it was their values that had first led them into careers as doctors and scientists, and the fact that their work in medical education supported these values was important in maintaining their involvement:

존경, 진실성, 학문, 자질… 어떤 것이든 실제로 이전할 수 있습니다. 무엇을 하든 그 네 가지 자질을 갖춰야 한다고 생각한다.(FG1, 참가자 A)
Respect, integrity, scholarship, quality… are transferrable to anything really. I think whatever you do, you need to have those four qualities. (FG1, participant A)

테마2. 상황.
Theme 2. Situation

Schlossberg의 프레임워크에서 ['상황']은 다음과 같은 변화 사건의 특성을 나타낸다. 

  • 변화를 촉발시킨 것, 변화에 대한 개인의 준비성, 변화에 대한 추가적인 스트레스에 대처하는 현재의 능력, 
  • 변화가 선택되었는지, 얼마나 오래 지속될지에 대한 이해, 
  • 변화의 결과로 자신의 지위가 향상되었는지 또는 손상되었는지에 대한 개인의 감각. 

[변화는 일생 동안 사람들에게 영향을 미치지만, 변화는 획일적인 진행에서 마주치지 않는다]는 슐로스버그의 관점과 일치한다. 연령과 삶의 단계는 참가자들에게 중요한 관심사로 보이지 않았다. 그들 모두는 의학 교육에서 적어도 세 번 또는 네 번의 실질적인 역할을 하고 있었다.

‘Situation’ in Schlossberg's framework15 refers to the characteristics of the change event, such as

  • what triggered the change, the individual's readiness for it, current ability to cope with the additional stress of change,
  • whether the change was chosen, understanding of how long it will last, and
  • the individual's sense of whether his or her status is improved or damaged as a result.

In line with Schlossberg's view that change affects people throughout their lives, but that change is not encountered in a uniform progression,15 age and stage of life did not appear to be significant concerns for participants, all of whom were in at least their third or fourth substantial role in medical education. However, changing (and increasing) clinical and academic workloads and their impact were constant themes:

저는 지난 5년에서 10년 동안, 1년에 두 번의 평가, 한 번의 학술 및 한 번의 NHS [국민건강서비스]를 실시해야 한다고 생각합니다. 이 두 가지 평가 모두 상당한 정보와 지속적인 CPD(전문적 개발 지속)가 필요합니다. 정말 큰 부담인데…(FG3, 참가자 K)
I think for the last 5 to 10 years, having to do two appraisals a year, one academic and one NHS [National Health Service], both of which require a fair bit of information and ongoing CPD [continuing professional development]. It's a huge burden really… (FG3, participant K)

그리고 또한 대학에서 일하면서, 우리가 연구도 할 것이라는 기대가 있습니다. 즉, 다른 모든 시간적 압박으로 인해 그것을 위한 시간은 정말 어렵다. (FG2, 참가자 H)
And also working in university, there's expectations that we'll do research as well. That's, time for that is really difficult with all these other time pressures on you. (FG2, participant H)


참가자들이 의료교육 및 기타 전문 활동과 관련된 [업무량 압박을 어떻게 경험했는지]에 영향을 미치는 가장 중요한 요인은 [의료교육에 참여하기로 선택한 정도]와 [그 안에서 행사할 수 있는 통제력의 양]이었다. 참가자는 스스로 의료 교육 경력을 선택하거나 성공적으로 전환했지만, 여러 가지 이유로 인해 해당 역할을 담당하는 교육자의 통제력이 감소할 수 있다는 우려를 표명했습니다.

The most significant factor affecting how participants experienced the competing workload pressures associated with medical education and their other professional activities was the degree to which they had chosen to be involved in medical education and the amount of control they felt able to exercise within it. Our participants had themselves chosen or transitioned successfully into medical education careers, but they expressed concern that educators' control of how they occupied the role could be decreasing for a number of reasons:

국가 차원에서 […] 우리는 소위 "구식" 의학 교육에서 현재 실제로 일어나고 있는 것으로의 전환기에 있습니다. (FG3, 참가자 M)
At a national level […] we're in this transition from what I call “old school” medical education to what's really happening now… (FG3, participant M)

다른 학과에 비해 우리만큼 규제와 통제가 심하고 정치인들의 관심을 끄는 학과는 거의 없다.(FG2, 참가자 H)
Compared to other academic departments, very few are as heavily regulated and controlled and attract as much interest from politicians as we do. (FG2, participant H)


참가자들은 개인적으로 이것을 받아들일 수 있는 것처럼 보였지만, 변화의 속도가 증가함에 따라 후배 교육자들에게 우려를 분명히 느꼈다. 

Although participants seemed able to accept this personally, they clearly felt concern for junior educators as the rate of change increased: 

우리 모두에게 걱정되는 것 중 하나는 결국 의료 교육자가 되는 것이 임상의에게 너무 심하게 뒤집혀서 스스로 의료 교육을 떠날 것이라는 두려움이다…(FG2, 참가자 J)
One of the things that is worrying for all of us is the fear that eventually being a medical educator is just going to be so flipping hard for clinicians that they vote with their feet and leave medical education… (FG2, participant J)

현재 우리는 의료 교육 내에서 임상 및 비임상 직원들 간의 매우 좋은 혼합과 훌륭한 협업을 가지고 있지만, 만약 의사들이 실제로 그 분야를 포기하고 "아, 그냥… 우리는 할 일이 충분해."라고 말한다면 정말 슬픈 날이 될 것이라고 생각합니다. (FG1, 참가자 A)
At the moment we have a very good mix and a very good collaboration between the clinical and non-clinical staff within medical education, but I think it would a very sad day indeed if doctors actually just gave up the field and said, oh it's just… we have enough to do. (FG1, participant A)

재검증, 연구 평가 연습 및 성과 검토, 새로운 법률 및 기술, 성과 데이터의 기록 및 분석 증가, 언론 및 정치권의 의료 교육에 대한 관심 증가 등 [NHS 및 대학 환경의 규제 및 조직 혁신]은 모두 변화의 원천으로 언급되었다. 이러한 [비자발적 변화]에 기여하는 다른 요인으로는 학생 기대치의 변화가 있었다. 

Regulatory and organisational innovations in the NHS and university environments such as revalidation, research assessment exercises and performance reviews, new legislation and technology, the growth in the recording and analysis of performance data and the increasing attention given to medical education in media and political circles were all mentioned as sources of change. Other factors contributing to this sense of involuntary change included alterations in student expectations:26

우연히 밤 8시에 이메일을 열어보니 거기 있고 다음날 토요일인데도 답변을 기다리고 있는데 왜 답이 없으세요? 왜 당신은 그것을 처리하지 않았나요? 그리고 당신은 그 요구를 느낀다. (FG1, 참가자 E)
You happen to open your e-mails at 8 o'clock at night and it's there and they're expecting you to answer it even though it's Saturday the next day and why haven't you answered? Why haven't you dealt with it? And you feel that demand. (FG1, participant E)

 

[변화의 기간이 얼마나 지속될 가능성이 높은지를 이해하는 것]은 전환을 달성하기 위해 변화를 성공적으로 협상하는 데 중요한 요소이다. 참가자들은 특히 의료 교육계에 의해 변화가 추진되지 않는 상황에서 의료 교육에서 이것이 가능할 것이라고 비관했다.27 [명확한 방향감각이나 최종점을 정의할 수 없는 무능감]은 일부에게 실패감을 암시하게 했다.
Understanding how long the period of change is likely to last is an important factor in negotiating change successfully in order to achieve transition. Participants were pessimistic that this would ever be possible in medical education, particularly in contexts in which the changes were not driven by the medical education community.27 This inability to define a clear sense of direction or endpoint led some to hint at a sense of failure:

제 생각에 격차 중 하나는 우리가 어떻게 다중 전문 교육이나 상호 전문 교육으로 전환하느냐가 될 것 같습니다. 우리는 긍정적인 측면에서 우리가 성취하려고 노력해야 한다는 것을 만족스럽게 말할 수 없었습니다. (FG2, 참가자 G)
I guess one of the gaps is going to be how we transition into whatever multiprofessional or interprofessional education is going to be. We've never been able to satisfactorily say, you know, what, in positive terms, we should be trying to achieve… (FG2, participant G)

NHS는 변하고 있지만 의학교육은 보조를 맞추기 위해 변하지 않았다[…] 국민건강보험은 계속 변화하고 있고 우리는 일치시키기에는 멀었다고 생각하며, 그 격차는 극복하기 어려울 것이라고 생각한다.(FG2, 참가자 K)
The NHS is changing and medical education hasn't changed to keep pace […] I think the NHS is continuing to change and we're a long way from aligning, and I think that gap is going to be a difficult one to cross. (FG2, participant K)

주제 3. 지지하다
Theme 3. Support


변화를 겪고 있는 개인에 대한 [지원]은 다음에서 비롯될 수 있다

  • 개인 지원 네트워크에 대한 접근(그리고 이러한 네트워크로부터 이익을 얻으려는 의지),
  • 제도적 지원의 강도,
  • 적절한 자원의 가용성, 품질 및 관련성,
  • 다른 사람들의 태도(자신을 역할에 참여시키고자 하는 개인의 희망에 대한)

참가자들은 멘토링, 조언, 코칭, 동료 검토 및 피드백, 새로운 역할 커버, 평가, CPD를 위한 자원 접근 등 의료 교육 활동을 위한 다양한 지원 소스를 식별했다. 일부 의견제출자들은 최근 몇 년 동안 의학 교육에 대한 [공식적인 인식의 증가]가 [더 나은 지원]으로 이어졌다고 느꼈다.
Support for individuals undergoing change may derive from

  • access to personal support networks (and willingness to benefit from these),
  • strength of institutional support,
  • the availability, quality and relevance of appropriate resources, and
  • the attitudes of others concerning the individual's wish to involve him- or herself in the role.

Participants identified a number of sources of support for medical education activities, including mentoring, advice, coaching, peer review and feedback, cover for new roles, appraisal, and access to resources for CPD. Some respondents felt that increased formal recognition of medical education in recent years had led to better support:

드디어 의료 교육 분야의 커리어가 꽃을 피우기 시작하는 것을 볼 수 있다. (FG2, 참가자 H)
I can see careers in medical education starting to blossom at last. (FG2, participant H)

그러나, 참가자들은 그들의 역할에 따라 부문, 기관, 부서, 심지어 서로 함께 일하는 개인들 사이에서도 지원이 다양하다고 보고했다. 임상의들은 그들의 다양한 역할에 의해 부과된 실제적인 어려움을 보고하였다: 모두 CPD를 위한 자금과 자원을 확보하기 어렵다고 보고하였다.
However, participants reported that support varied among sectors, institutions, departments and even between individuals working alongside one another, depending on their roles. Clinicians reported practical difficulties imposed by their multiple roles: all reported that funding and resources for CPD were difficult to secure.

이러한 지원 부족의 원인은 다양한 요소와 관련이 있다. 일부 사람들에게는 [행정 리소스 및 전문 지식의 부족]과 [학생 수와 기대치가 증가함에 따라 워크로드 압력을 공유할 동료의 부족]이 수반되는 [개인적인 문제]였습니다. 다른 이들은 의료 교육의 어려움과 복잡성에 대한 높은 수준의 이해가 계속 부족하기 때문에 [지원을 받는 데 어려움]을 겪었다고 말했다. 교육 및 CPD를 위한 [용도-지정된 시간]을 확보하는 것은 임상 환경에서 일하는 응답자들에게 특히 우려되는 사항이었다.

The reasons for this lack of support were associated with a variety of factors. For some, the challenges were personal and of a day-to-day nature, involving lack of administrative resource and expertise, and a shortage of colleagues with whom to share workload pressures as student numbers and expectations increase. Others attributed difficulties in obtaining support to a continued lack of high-level understanding of the challenges and complexities of medical education. Obtaining ring-fenced time for teaching and CPD was a particular concern for respondents working in clinical settings:

이 작업을 수행하는 데 소요되는 주량과 상관없이 동일한 양의 CPD를 수행해야 합니다. 모든 CPD를 필요한 표준으로 수행할 시간이 없기 때문에 이 작업을 선택해야 합니다. (FG2, 참가자 J)

You've got the same amount of CPD to do regardless of how much of your week you spend doing that […] It makes you have to choose because you just haven't got the time to do all of the CPD to that required standard. (FG2, participant J)

고용주들이 의학 교육자들의 특정한 요구에 눈을 뜨는 속도가 느리다는 인식에도 불구하고, 응답자들은 그들의 교육적 역할과 더 넓은 교육 공동체에 대한 [그들의 소속감에 대한 개인적인 만족]을 표현하기를 열망했다. 이러한 참가자들은 자신이 필요한 교육 자원을 파악하고 확보하며 이익을 얻는 데 자신만만하고 창의적이었다.

Despite the sense that employers were only slowly waking up to the particular needs of medical educators, respondents were keen to express their personal satisfaction in their educational roles and their sense of belonging to a wider education community. These participants were confident and creative in identifying, securing and benefitting from the educational resources they needed:

임상 교육 석사 과정을 밟고 있습니다. 저는 그것을 할 수 있도록 저희 기관의 지원을 많이 받았습니다. (FG1, 참가자 E)
I'm doing a Masters in clinical education… I've been very well supported by my institution to do that. (FG1, participant E)


그들의 지지의 주요 원천은 의료 교육의 동료들과, 특히 정보를 찾는 것과 관련하여, [더 넓은 의료 교육 공동체 자체]로부터 비공식적으로 왔다.
A major source of their support came informally from colleagues in medical education and from the wider medical education community itself, particularly with regard to information seeking:

나는 다른 많은 의학 교육자들과 교류하고 다른 사람들이 나에게 무엇을 제안하고 지시하는지에 많이 의존한다. (FG3, 참가자 P)
I interact with lots of other medical educators and I depend a lot on what other people suggest and direct me to. (FG3, participant P)

참가자들은 큐레이션된 자료에 접근하고 동료 및 학생들과 공유하는 데 적극적이었다.

Participants were active both in accessing curated material and in sharing it with colleagues and students:

제 말은, NHS 신탁회사 중 한 곳이 꽤 정기적으로 나오는 […] 게시판을 가지고 있는데, 제가 실제로 본 것 중 가장 유용한 것들 중 하나이고, 제가 우연히 그것을 얻어서 간신히 목록에 추가했습니다. 그리고 그것은 기본적으로 매달 보건 전문 교육 문헌을 스캔하는 일종의 사서입니다. ( )FG1, 참가자 C)
I mean, one of the NHS trusts has a […] bulletin that kind of comes out on a fairly regular basis, and it's one of the most useful things I've seen in a long time actually and I got it by accident and managed to get [it] added to the list, and it's basically a librarian sort of scans the health professions education literature on a monthly basis… (FG1, participant C)

앱샵에서 찾을 수 있고 학생들 중 일부는 알아서 찾을 수 있지만, 일부는 그것을 가리켜줄 필요가 있다. (FG3, 참가자 P)
They can find it in the App shop and some of the students do independently, but some of them need to be pointed to it. (FG3, participant P)


[소셜 미디어]는 이러한 의료 교육자들을 위한 비공식적인 커뮤니티 지원의 중요한 원천을 대표했지만, 많은 사람들이 시작하는데 개인적인 접촉이 필요하다고 보고했다.
Social media represented a significant source of informal community support for these medical educators, although a number reported that it had required personal contact to get started:

트위터는 많은 토론이 있습니다 […] 만약 여러분이 MedEd와 같은 해시태그와 같은 것들을 사용한다면, 여러분이 클릭할 수 있는 수많은 토론과 기사들을 불러올 것입니다. [그 사람이] 실제로 보여줬습니다. 그녀는 그것에 대해 많은 것을 한다. (FG3, 참가자 N)
Twitter has a lot of discussions […] If you just use the hashtags like MedEd and things like that then it will bring up a whole host of discussions and articles that you can click on. [Name anonymised] actually showed me. She does a lot of things around that. (FG3, participant N)


다시 말하지만, 참가자들 스스로가 교육자 정체성을 유지하기 위해 어려운 환경을 탐색했지만, 특히 커리어 지원 측면에서 [다음 세대에 대한 우려]가 있었다.
Again, although the participants themselves had navigated the challenging environment in order to maintain their educator identity, there was concern for the next generation, particularly in terms of career support:

우리는 일반적으로 대학, 특히 의과대학에 대한 압력이 명확하고 투명한 커리어 발전을 이루도록 해야 합니다. 즉, 목표, 메트릭스, 측정 가능한 것들[…]을 의미합니다. 이 사람들이 낮은 수준에서 진정되는 것을 볼 뿐, 이 상황에서 벗어날 수 있는 실질적인 방법은 없습니다. (FG3, 참가자 Q)
We need to make sure that pressure is brought to bear on, you know, universities generally, medical schools particularly about creating obvious and transparent career progression. That means targets, metrics, things that are measurable […] you know, I just see these people becalmed at lower levels and there's no real way of getting them out of that. (FG3, participant Q)


대부분의 응답자들은 [나이가 적은 동료들을 지원하는 데 관여하고 책임감]을 느낀다고 보고했습니다.
Most respondents reported being involved in and feeling responsible for supporting less senior colleagues:

특히 많은 것은 동료들과 어떻게 물건을 공유하느냐에 관한 것입니다. 네가 사람들을 어떻게 멘토링하는지. 의학교육 및 이와 유사한 분야에서 어떻게 선도하고 있는가. (FG2, 참가자 J)
A lot of it particularly is around how you share things with colleagues. How you mentor people. How you lead in medical education and similar things. (FG2, participant J)


그러나 비공식 및 개인 네트워크는 매우 귀중하지만 눈에 잘 띄지 않으며, 따라서 특히 후배들에게 접근성이 떨어진다는 인식이 있었다.
However, there appeared to be some recognition that informal and personal networks, although invaluable, were less visible and therefore less accessible, especially to junior colleagues:

경력 초기 사람들은 지난 몇 년 동안 제가 주변에 많이 다녔기 때문에 훨씬 더 힘든 일을 겪었을 것입니다. 예를 들어, […] 저는 그것에 대한 현재의 생각이 무엇인지 알아내야 했습니다. 그래서 저는 이것을 조사하기 위해 제가 아는 사람을 찾아갔습니다. 그래서 매우 도움이 되지만, 알다시피, 그것은 즉시 볼 수 있는 네트워크가 아닙니다. 그것은 내 안에 남아 있는 것이다. (FG3, 참가자 Q)
People early in their careers would find it much tougher […] Because I've been around a lot you meet people over the years. So for example, […] I needed to find out what the current thinking on that was. So I just went to the person I knew had been commissioned to investigate this. So that's very helpful but it's not, you know, it's not a network that's immediately visible. It's one that remains within me. (FG3, participant Q)

4번. 전략들
Theme 4. Strategies

[전략]은 변화를 성공적으로 극복하기 위해 채택된 전술들을 포함하는 대응이다. 집단적으로, 우리의 응답자들은 그들이 개인으로서 개발한 매우 다양한 전략을 보고했지만, 그것은 대처에 대한 공통된 접근법을 제안하는 것으로 보였다.
Strategies are coping responses that include the tactics adopted to get through a change successfully. As a group, our respondents reported a large variety of strategies they had developed as individuals, but which appeared to suggest a common approach towards coping.

주제 3에 보고된 교육 지원의 식별 및 접근의 어려움에도 불구하고, 많은 사람들이 [의료 교육 전문지식을 습득하기 위해 매우 전략적인 접근법]을 취했으며, [지식과 기술을 개발하기 위해 상당한 노력]을 기울였다. 몇몇 사람들이 대학원 의학 교육 자격을 취득했다고 보고되었다. 한 학생은 자신이 선택한 과정이 자신의 학습 욕구에 직접 초점을 맞추지는 않았지만, 이를 적응하고 그로부터 이익을 얻을 수 있었다고 평했다.
Despite the difficulties in identifying and accessing educational support reported in Theme 3, many had taken a highly strategic approach to acquiring medical education expertise and had gone to considerable lengths to develop knowledge and skills. Several reported undertaking postgraduate medical education qualifications. One commented that although the course he had chosen had not focused directly on his learning needs, he had been able to adapt it and benefit from it:

제가 박사 학위를 받았을 때, 의대생에 관한 문헌에는 아주 적은 양이 있었습니다. 사실 제 논문의 문헌 기반은 대부분 교사 교육에서 나왔습니다. (FG2, 참가자 L)
When I did my PhD […] there was a tiny amount in the literature relating to medical students, in fact most of the literature base for my thesis came from teacher education. (FG2, participant L)


대부분의 참가자들은 자신의 학습에 대한 resourceful하고, 유연한 접근 방식을 표현했습니다.
Most participants expressed a resourceful and flexible approach to their own learning:

교과서에 있는 것들은 다양한 품질을 가질 수 있습니다. 그래서 나는 임상 환경 밖의 기초 자원으로 돌아가는 나 자신을 발견한다. (FG1, 참가자 E)
The stuff that's in textbooks can be of varying quality. So I find myself reverting back to foundational resources that are outside of clinical settings. (FG1, participant E)

이 교육자들은 집단으로서 매우 자기주도적이었다. 대부분은 의학 교육 저널을 구독했고 관련 정보를 찾기 위해 더 광범위한 문헌을 기꺼이 훑어보았다. 다른 이들은 소셜 네트워킹, 웹 세미나, 뉴스레터 및 메일링 목록, 온라인 과정 및 원격 학습을 포함한 전자 자원을 포함한 새로운 기술을 추천했다.
These educators were highly self-directed as a group. Most subscribed to medical education journals and were willing to sift through wider literatures in order to find relevant information. Others recommended new technologies, including social networking, webinars, newsletters and mailing lists, electronic resources, including online courses and distance learning.

참가자들은 [업무와 전문적 협력]에 대해 한결같이 긍정적인 접근을 했습니다. 그들의 토론은 그들이 다른 학문 분야, 전문직간 그룹, 국가 및 국제 조직의 동료들과 맺었던 더 넓은 파트너십에 대해 반복적으로 반영했다. 협력과 노력의 조정을 촉진하기 위해 더 많은 것을 할 수 있다는 일반적인 견해가 있었다.
Participants had a uniformly positive approach towards work and professional collaborations. Their discussions repeatedly reflected on the wider partnerships they had formed with colleagues from different academic disciplines, interprofessional groups and national and international organisations. There was a general view that more could be done to promote cooperation and coordination of effort:

환자 치료에 도움이 될 새로운 지식을 창출하는 것입니다. 그리고 그 세대는 어디에서 일어날까요? 그것은 전형적으로 분야들 사이의 접점에서 발생하지만, 우리는 내면을 들여다보고 있고 우리는 다른 분야들과 충분히 접하지 못하고 있다. 지리, 수학 – 저는 수학 학교에서 많은 것을 해왔고 […] 그런 식으로 대학 전체를 가로질러 갈 수 있다고 확신합니다… (FG1, 참가자 M)
It's about generating new knowledge that's going to help patient care and where does that generation occur? It typically occurs at the interface between disciplines and yet we're inward looking and we don't interface enough with other disciplines. Geography, mathematics – I've done lots of stuff with the school of mathematics and […] I'm sure you can go across the whole of the university in that way… (FG1, participant M)

내가 보고 싶은 것은 전문직이 조금 더 단결하는 것이고, 나는 모든 단체가 그 영역에서 조금 더 많은 것을 할 수 있다고 생각한다. (FG2, 참가자 J)
What I would like to see is the profession uniting a bit more and I think all the bodies could do a bit more in that area. (FG2, participant J)

위에서 논의한 비공식 네트워크와 전문적 개발 기회를 활용하고 스스로 만드는 것 외에도, 모든 인터뷰 대상자들은 자신의 기관을 넘어 공식적인 네트워크에 참여하기 위해 의도적인 노력을 기울였다. 이들은 모두 AoME의 펠로우들이었으며, 대부분은 의학 교육 지원을 위해 적어도 한 개의 다른 국가 특수 이익 단체 또는 단체에 참여했다. 또한 규제 기관, 고용주, 왕립 대학 및 전문 기관의 조언과 지침을 포함한 공식 지원의 다른 출처에 대해서도 언급하였다.
In addition to taking advantage of and creating for themselves the informal networks and professional development opportunities discussed above, all of the interviewees had made deliberate effort to engage with formal networks beyond their own institutions. All were fellows of the AoME, and most were also involved with at least one other national special interest group or organisation for the support of medical education. A number also mentioned other sources of formal support, including advice and guidance from regulators, employers, Royal Colleges and professional organisations.

[전문가 인지recognition]의 역할은 핵심 주제였으며, 참가자들이 의료 교육자의 정체성으로 전환했다고 느낄 수 있도록 돕는 데 분명히 중요했으며, 이는 다른 관찰자들의 이전 제안을 확인했다.
The role of professional recognition was a key theme and was clearly important in helping participants to feel that they had made a transition into the identity of a medical educator, which confirmed other observers'28 previous suggestions:

의학 교육자 아카데미 등은 의학 교육자로서 사람들에게 배지를 수여하는badging 역할을 한다. 그 역할에 기대되는 전문적인 기준이 있다. (FG3, 참가자 P)
The Academy of Medical Educators and others actually have a role in badging people in that transition from being one thing where they are, you know, fairly well regarded to badging them as a medical educator and there are professional standards that are expected of that role. (FG3, participant P)


[증가하는 규제]를 과제로 언급했지만, 대부분의 참가자들은 규제가 [조직 내에서 그리고 의료 교육을 위해 더 폭넓게 옹호할 수 있는 기회]를 제공했으며, [이전에 제대로 연결되지 않았던 교육 영역에 걸쳐 수준을 높일 수 있는 기회]를 제공한다고 보았다. 예를 들어, 중등 의료에서 교육 감독자를 인정하는 데 있어 일반 의료 위원회(GMC)의 역할에 대해 한 참석자는 다음과 같이 논평했다.
Although increasing regulation presented challenges, most participants also viewed it as providing opportunities to advocate within their organisations and more widely for medical education, and to raise standards across areas of education that had formerly been poorly connected. For example, speaking of the role of the General Medical Council (GMC) in recognising educational supervisors in secondary care, one participant commented:

저는 학부생과 대학원생 사이에 더 많은 일치성이 있고 학생들이 학부생과 재단, 그리고 재단 및 훈련 사이에 동굴이 있는 것보다 실제로 그들이 어디로 가고 있는지 볼 수 있도록 더 나은 선이 있을 것이라는 것을 알 수 있습니다. (FG2, 참가자 G)
I can see that there will be more congruence between undergraduate and postgraduate and hopefully better lines so that students can actually see where they're going rather than there being a, sort of, cavern between undergraduate and foundation, and foundation and training. (FG2, participant G)


이러한 성공적인 교육자들은 [개인 및 전문적 개발의 필요성]을 주장하기 위해, 의료 교육을 둘러싼 문화의 변화로 인해 제공되는 기회를 빠르게 파악했습니다.
These successful educators have been quick to identify the opportunities offered by changes in the culture around medical education to assert their need for personal and professional development:

규제 풍토가 지난 1~2년 동안 이를 더 쉽게 만든 이유는 의사들이 해야 할 일에 꼬리표를 달아줬기 때문이다. 일이 더 쉬워졌다는 것을 의미한다. 그것은 이제 공식적으로 당신의 일의 일부입니다… (FG1, 참가자 C)
The regulatory climate that's what made it easier in the last year or two because it's been earmarked that something doctors have to do which means that… it's much easier to do it. It's part of your job officially now… (FG1, participant C)

이 역할은 전문화되고 있다. 교육 시간을 얻는 것이다 […] 그리고 사람들은 그것을 포트폴리오 또는 실질적인 경력으로 봅니다. 그래서 그런 의미에서 일종의 존경심을 얻는 데 있어. (FG2, 참가자 G)
You're professionalising it [the role]. Getting the teaching time […] and people seeing it as more of a portfolio or substantive career. So in getting, sort of, respectability in that sense. (FG2, participant G)

주요 조사 결과 요약
Summary of key findings

포커스 그룹 데이터의 하위 테마 분석을 통해 참가자의 의료 교육자 정체성에 기여한 각 4S 테마 내에서 여러 가지 핵심 요소를 식별할 수 있었다.
Our analyses of sub-themes from the focus group data allowed us to identify a number of key factors within each of the 4S themes that contributed to the participants' sense of medical educator identity.


본 연구의 참여자는 비교적 안정적인 의료 교육자 정체성으로 성공적으로 전환한 경험이 있는 전문가였습니다. 그들은 특히 더 많은 후배 교육자들을 대표하여 미래에 대한 몇 가지 우려에 주목했지만, 그들은 일반적으로 의학 교육자가 되기로 한 결정에 만족했다.
The participants in our study were experienced professionals who had made a successful transition to a relatively stable medical educator identity. Although they noted some concerns for the future, particularly on behalf of more junior educators, they generally expressed satisfaction with their decisions to become medical educators.

[자아]에 있어서, 모든 사람들은 의학 교육자가 되는 것과 그들의 개인적인 가치 사이에 분명한 연관성을 만들 수 있었다. 분명히, 그들의 의학교육 업무와 그들의 개인적 가치 사이의 '적합fit'은 이러한 개인들이 의학교육자로서 새로운 전문적 정체성으로 성공적으로 전환하는데 필요한 내부적 조정을 하는 데 노력을 투자할 수 있을 만큼 충분히 가까웠다.

In terms of self, all were able to make clear connections between being a medical educator and their personal values. Clearly, the ‘fit’ between their medical education work and their personal values was close enough to allow these individuals to invest effort in making the internal adjustments necessary to successfully transition into a new professional identity as a medical educator.

둘째, 그들의 상황(의학 교육에 대한 참여 증가의 특성) 측면에서, 의학교육자 정체성에 대한 그들의 적응에 영향을 미치는 가장 중요한 요인은,

  • 그들이 의학교육에 참여하기 위해 선택한 정도,
  • 그들이 의학교육 내에서 행사할 수 있는 통제력의 양
  • 그들이 의학교육의 미래 방향에 영향을 미칠 수 있다는 감각

Secondly, in terms of their situation (the characteristics of their increased involvement in medical education), the most significant factors affecting their adaptation to a medical educator identity were

  • the degree to which they had chosen to be involved in medical education,
  • the amount of control they felt able to exercise within it and
  • their sense that they could influence its future direction.

셋째, 직장생활의 변화에 대처하기 위해 받은 개인적 [지원]은 변화에 대처하는 데 큰 도움이 되었다. 참가자들은 [의료교육이 연구나 임상서비스보다 덜 중요하다고 인식하는 상태]를 [양질의 교육을 계획하고 제공하기 위한 자원 부족]과 [경력 및 개인 개발 기회를 포함한 교육 개선을 위한 자원 부족]에 대한 우려와 일관되게 연결했다. 참가자들은 일반적으로 의료 교육자 정체성으로 전환하기 위해 받은 [지원 수준에 대해 불만족]스러웠지만, [비공식 정보 출처, 네트워킹, 자격, 역할 모델 및 멘토, (AoME가 제공한 것과 같은) 학습된 사회 및 전문 인정 체계와 같은 모든 자원]을 식별했다.
Thirdly, the personal support they had received to cope with changes in their working lives was a significant factor in helping them to deal with change. Participants consistently linked medical education's perceived status as less important than either research or clinical service to their concerns about the shortage of resources for both planning and providing quality education and also for educational improvement including opportunities for career and personal development. Although participants were generally dissatisfied with the level of support they had received to make the transition to medical educator identity, all identified resources that had worked for them, such as informal sources of information, networking, qualifications, role models and mentors, learned societies and professional recognition schemes such as that offered by the AoME.

넷째, 이러한 참여자들은 그들 자신의 [전략]을 개발하는 데 있어 [resourcefulness과 에너지]로 특징지어졌다. 우리의 연구에서 확인된 성공적인 전략에는 정보 추구, 기술 개발, 네트워킹 및 인식 추구에 대한 창의적이고 적극적인 접근 방식을 채택하는 것이 포함되어 있습니다. 이들은 모두 [교육 기회와 정보 찾기]에 적극적이었고, [서로를, 학생과 교육생을, 초기 진로교육자 등을 지원하겠다는 의지]를 밝혔다.
Fourthly, these participants were characterised by their resourcefulness and energy in developing their own strategies. Successful strategies identified in our research included adopting creative and active approaches to information seeking, skills development, networking, and seeking recognition. They were all active in seeking education opportunities and information, and expressed their willingness to support one another, their students and trainees, and early career educators.

논의
Discussion

우리의 연구는 데이터 수집에 목적 샘플링을 사용하기로 한 초기 결정에 영향을 받았다. 따라서 이 연구결과는 영국의 맥락과 상급 의학 교육자(AoME의 동료)의 관점으로 제한된다. 후배 교육자들의 경험은 추구되지 않았고 이러한 연구 결과는 다른 집단과 환경으로 이전될 수 없다는 것이 입증될 가능성이 있다. 그러나 우리는 의료 교육자 정체성을 성공적으로 채택한 사람들의 관점이 이전에 체계적으로 탐구되지 않았기 때문에 그들 자신에게 관심이 있다고 믿는다. 그들은 또한 후배 교육자들이 그들의 변화하는 교육 역할에 적응할 수 있도록 지원하는 데 가장 효과적일 가능성이 있는 자기, 지원, 상황 및 전략의 측면을 식별하는 데 유용할 수 있다.
Our study was affected by our early decision to use purposive sampling for data collection. The findings are therefore limited to the UK context, and to the perspectives of senior medical educators (fellows of the AoME). The experiences of junior educators were not sought and it is possible that these findings would not prove transferable to other populations and settings. We believe, however, that the perspectives of those who have successfully adopted a medical educator identity have not been systematically explored before and are therefore of interest in themselves. They may also prove useful in identifying the aspects of self, support, situation and strategy that are likely to be most effective in supporting junior educators to adapt to their changing educational roles.

[전환]에 관한 문헌은 사별이나 트라우마와 같은 삶을 변화시키는 사건에 적응하기 위해 고군분투하는 사람들의 지원에 자연스럽게 초점을 맞추는 경향이 있다. 4S 프레임워크를 이용한 상담 등의 개입은 주요 변화에 적응하기 위해 고군분투하는 개인들을 돕기 위해 고안되었다. 그러므로 많은 사람들에게 의학교육은 즐겁고, 자극적이며, 그들의 직장 생활을 풍요롭게 하는 일상의 활동일 때, 의학교육을 중요하고 심지어 트라우마적인 삶의 사건으로 보는 것은 어울리지 않는 것처럼 보일 수 있다. 그러나 [의학교육으로의 이동]이 개인의 업무 정체성에 대한 감각에 심대한 영향을 미치는, [중대하고 때때로 고통스러운 직업적 전환]을 나타낸다는 것에는 의심의 여지가 없다. 이 문헌은 좌절, 실망, 스트레스, 사기 저하 및 탈진의 시기에 대한 교육자들 사이의 거의 보편적인 경험을 보고하고 있으며, 주요 직업 정체성의 침식에 대한 상실감이 여전하다. 또한, 교직에 대한 열망을 표현하는 사람들 중 실제로 얼마나 많은 사람들이 중요한 의료 교육 경력을 발전시키는지 보여주는 데이터는 거의 없지만, 우리는 대부분의 의과대학에서 교직원의 유지가 주요 과제라는 것을 알고 있으며, 한 연구에서 의과대학 교직원의 42%가 '진지한 사직 의향'을 표명했다. 
The literature on transition naturally tends to focus on the support of those struggling to adapt to life-changing events such as bereavement and trauma. Interventions such as counselling using the 4S framework and others were designed to help individuals struggling to adapt to major changes. It may therefore seem incongruous to view medical education as a significant and even traumatic life event, when for many it is an enjoyable, stimulating and deeply rewarding daily activity that enriches their working lives. There is no doubt, however, that moving into medical education represents a major and occasionally painful career transition that profoundly affects the individual's sense of his or her working identity. The literature reports an almost universal experience among educators of periods of frustration, disappointment, stress, demoralisation and burnout, coupled with a lingering sense of loss at the erosion of their primary professional identity.4-9, 29 Furthermore, although there are few data to show how many of those who express a desire to teach actually go on to develop a significant medical education career, we do know that for most medical schools the retaining of teaching staff is a major challenge, with 42% of medical school faculty in one study expressing ‘serious intent to leave’.30, 31

따라서 이 4S 프레임워크는 경험이 없거나 교육자로서 정착된 전문적 정체성을 얻기 위한 여정에서 협상할 변화에 대한 몇 가지 근본적인 질문을 탐구하기 위해 고군분투하는 동료들을 돕기 위한 적절한 구조를 제공합니다.
This 4S framework therefore offers an appropriate structure for helping colleagues who are inexperienced or at risk of struggling to explore some fundamental questions about the changes they will negotiate on their journey towards gaining a settled professional identity as an educator.

우리 연구의 참가자들은 모두 경력 후반부에 있었고, 확고하게 확립된 의료 교육자 정체성으로 전환하기 위해 필요한 변화를 협상한 광범위한 경험을 가지고 있었다. 비록 그들은 의학 교육자들의 진로 상황이 여러 면에서 개선되었다는 것을 인정했지만, 그들은 또한 그에 상응하는 기대와 도전이 증가했다는 것을 알고 있었다. 슐로스버그 프레임워크 내에서 변화를 협상하기 위한 그들의 전략을 그룹화하여, 우리는 급격한 변화 기간 동안 개별 교육자들이 필요로 하는 지원을 고려하는 체계적인 접근 방식을 제공한다. 의학 교육에 종사하는 모든 사람들이 의학 교육자의 정체성으로 성공적으로 전환할 수 있거나 의향이 있는 것은 아니다. 교수개발을 책임지는 사람들이 이러한 꺼림칙하거나 어려움을 겪고 있는 교육자들을 개인적 차원에서 지원할 수 있는 방법을 찾지 못한다면, 교육 관행을 개선하고 확장하기 위해 그들을 학문적이고 전문적인 활동에 참여시키는 것은 거의 불가능하다. 우리는 이에 대한 몇 가지 가능한 이유를 검토했고 이 프레임워크가 개별 의료 교육자들과 함께 사용되어 그들이 직장 생활의 변화에 적응할 수 있는 전략을 개발할 수 있도록 도와야 한다고 제안한다. 그들이 적응함에 따라, 그들은 완전한 의학 교육자의 정체성으로 전환하고 감정적으로 참여할 수 있게 될 것이다.

The participants in our study were all in the latter parts of their careers and had wide experience of negotiating the changes necessary to make the transition to a firmly established medical educator identity. Although they accepted that in many ways the career situation has improved for medical educators, they also were aware that expectations and challenges have risen correspondingly. By grouping their strategies for negotiating change within the Schlossberg framework,15 we offer a systematic approach to considering the support needed by individual educators during periods of rapid change. Not all of those working in medical education are able or willing to make a successful transition to a medical educator identity. Unless those responsible for faculty development can find a way to support these reluctant or struggling educators at a personal level, it is almost impossible to engage them in scholarly and professional activities to improve and extend their education practice. We have examined some of the possible reasons for this and propose that this framework should be used with individual medical educators to help them develop strategies to adapt to changes in their working lives. As they adapt, they will be enabled to make the transition to and to emotionally engage with a full medical educator identity.

의료 교육 경력을 시작하는 직원에게 지원을 제공할 때 다음과 같은 특정 상황에 맞는 조언과 지원을 제공하는 것이 중요합니다. 

  • 자아(역할에 대한 이전 경험과 아이디어 및 기대) 
  • 상황(예상되는 것에 대한 이해와 우려를 포함하여 스스로 발견하는 상황) 
  • 지원(사용 가능한 리소스, 필요한 리소스 및 액세스 위치와 방법을 알고 있는지 여부) 및 
  • 전략(어려운 의료 교육 환경에서 번창할 수 있도록 변화에 대처하는 개인 전략을 개발하는 데 도움이 됩니다.)

When providing support to staff who are commencing medical education careers, it is important to tailor advice and support to their particular circumstances, including:

  • Self (their previous experiences and their ideas and expectations regarding the role);
  • Situation (the circumstances in which they find themselves, including their understanding of and concerns about what is expected);
  • Support (the resources they have available, what they may need, and whether they know where and how to access these), and, finally,
  • Strategies (helping them to develop personal strategies to cope with changes so that they are enabled to thrive in the challenging medical education environment).

마지막으로, [(의료 교육자 역할, 잘 정의된 기대 및 조직적으로 적절한 경계에 대한) 명확한 의사소통]은 개인과 의료 교육 공동체 모두의 [정체성과 정당성에 대한 불안의 여운]을 극복하는 데 중요하다. 이는 기술 습득에 대한 목표 자문, 개인 개발 및 연습을 위한 구조적 지원 및 시간 제공과 결합되어야 한다. 이것은 두 가지 이점이 있다.

  • 의료 교육 역할에 있는 사람들을 지원하는 것
  • 교육자가 아닌 사람들 사이에서 더 나은 이해를 할 수 있도록, 의료 교육자 정체성의 쉽게 알아볼 수 있는 대중적 얼굴을 제공하는 것

Finally, clear communication of the medical educator role, well-defined expectations and organisationally appropriate boundaries are important to combating lingering feelings of insecurity around identity and legitimacy in both individuals and the medical education community.32, 33 These should be coupled with the provision of targeted advice on the acquisition of skills, and structural support and time for personal development and practice. This has a twofold benefit

  • in both supporting those who are in medical education roles and
  • in providing an easily recognisable public face of the medical educator identity to permit better understanding among those who are not themselves educators.

튜니센과 웨스터만은 다음과 같이 주장한다. 전환은 순간이 아니라 개인이 한 환경에서 다른 환경으로 이동하는 역동적인 과정이다.' 의학 교육자들은 교육자 역할로 이동하기 위해 고군분투하는 후배들을 도울 수 있다. 

  • 첫째, 변화에 적응하고 새로운 정체성으로 전환하기 위한 능력과 동기에 영향을 미치는 요인을 파악하고 이해한다. 
  • 둘째, 긍정적인 대처 전략을 채택할 수 있도록 돕는 것이다. 중요한 것은 이러한 모델이 멘토들이 새로운 역할과 정체성으로 전환함에 따라 교육자에 대한 개별 지원을 목표로 삼을 수 있는 기회를 식별하는 데 도움이 될 수 있다는 것이다. 

Teunissen and Westerman assert that: ‘A transition is not a moment but rather a dynamic process in which the individual moves from one set of circumstances to another.'33 Medical educators can help junior colleagues who may be struggling to move into an educator role by,

  • firstly, identifying and understanding the factors that influence their ability and motivation to adapt to change and to make the transition to a new identity, and,
  • secondly, helping them to adopt positive coping strategies. Importantly, such a model might also help mentors to identify opportunities to target individual support for educators as they make the transition into their new roles and identities.34

결론들
Conclusions

4S 프레임워크에 대한 논의는 후배 교육자에 대한 더 나은 목표 지원 및 멘토링으로 이어질 수 있으며, 선배들이 교육자 정체성을 향한 여정에서 요구되는 어려운 도전에 직면할 준비가 되어 있는 사람들과 그들의 직업에서 이 시점에서 변화에 대처하기 위해 잠재적으로 고군분투할 수 있는 사람들을 식별하는 데 도움이 될 수 있습니다.

Discussions based around the 4S framework may lead to better targeted support and mentoring for junior educators and may help seniors to identify those who are ready to face the difficult challenges required in the journey towards an educator identity and those who may potentially struggle to cope with change at this point in their careers.

 

 


 

 

Med Educ. 2018 Feb;52(2):216-226. doi: 10.1111/medu.13470. Epub 2017 Nov 28.

 

 

Making the leap to medical education: a qualitative study of medical educators' experiences

Affiliations collapse

Affiliations

1Centre for Medical Education, Cardiff University School of Medicine, Cardiff, UK.

2Cardiff Unit for Research and Evaluation in Medical and Dental Education (CUREMeDE), Cardiff University, Cardiff, UK.

PMID: 29193365

DOI: 10.1111/medu.13470

Abstract

Context: Medical educators often have prior and primary experience in other academic and clinical disciplines. Individuals seeking successful careers in the education of medical students and doctors must, at some point in their development, make a conscious transition into a new identity as a medical educator. This is a necessary move if individuals are to commit to acquiring and maintaining specialist expertise in medical education. Some achieve this transition successfully, whereas others struggle and may even lose interest and abandon the endeavour. We explored senior educators' experiences of achieving the transition into medical education and their views on what helps and what hinders the process.

Methods: In 2015 we conducted three focus groups with 15 senior medical educators. All focus group discussions were audiorecorded and transcribed verbatim. We applied transition theory to guide our deductive analysis, using Schlossberg's Four S (4S) framework to code and report participants' self-reported perceptions of those factors relating to Self, Situation, Support and Strategy that had assisted them to make a successful transition to a fully acknowledged medical educator identity. Through inductive analysis, we then identified 17 explanatory sub-themes common to all three focus groups.

Results: Background and circumstances, individual motivation, a sense of control, organisational support, and effective networking and information-seeking behaviour were factors identified as contributing to successful transition into, and maintenance of, a strong self-identity as a medical educator.

Conclusions: The experiences of established medical educators and, in particular, an exploration of the factors that have facilitated their transition to an acknowledged self-identity as a medical educator could assist in supporting new educators to cope with the changes involved in developing as a medical educator.

객관식 시험의 사후 분석 AMEE Guide No. 54 (Med Teach, 2011)
Post-examination analysis of objective tests
MOHSEN TAVAKOL & REG DENNICK

 

 

소개
Introduction

이 가이드의 목적은 의료 교육에서 객관적인 평가 결과를 분석하고 평가하는 데 관련된 이론적 근거와 프로세스의 개요를 제공하는 것이다. 객관적인 평가란

  • 지식을 평가하는 객관식 질문 및
  • 구체적이고 쉽게 측정할 수 있는 관찰 기준을 통해 임상 기술을 평가하는 객관적 구조화된 임상 검사(OSCE) 및 관련 평가(예: 절차적 기술의 직접 관찰(DOPS), 미니 임상 검사(mini-CEX))

The purpose of this Guide is to provide an overview of the rationale and processes involved in analysing and evaluating the results of objective assessments in medical education. By objective assessment we mean

  • multiple choice questions that assess knowledge and
  • objective structured clinical examinations (OSCEs) and related assessments (e.g., direct observation of procedural skills (DOPS), mini-clinical examination (mini-CEX)) that assess clinical skills by means of specific and easily measurable observational criteria.

결과적으로 우리는 성과에 대한 보다 주관적인 해석에 의존하는 에세이, 과제 또는 포트폴리오 기반 평가와 같은 자료를 배제하고 있다.
We are consequently excluding material such as essays, assignments or portfolio-based assessments which rely on more subjective interpretations of performance.

우리는 측정하기가 더 '쉬운' 사물을 측정하는 결과를 분석하는 데 집중하고 있으며, 따라서 편견에 대한 죄가 있다는 것을 인정한다. 객관적으로 측정하기 어렵기로 악명 높지만 매우 중요한 정서적 또는 태도 영역에서 의학 교육의 많은 학습 결과가 있다. 그럼에도 불구하고 지식 및 임상 기술의 객관적 시험은 의료 평가의 주요 요소이며 이러한 측정이 이루어지고, 분석되고, 평가되는 과정에 대한 이해는 현대 실무의 필수 요건이다. 많은 교과서와 논문이 이 중요한 분야를 다루었다.

We acknowledge that we are concentrating on analysing the results of measuring things which are ‘easier’ to measure and that therefore we are guilty of bias. There are many learning outcomes of medical education in the affective or attitudinal domains that are notoriously difficult to measure objectively but which are exceedingly important. Nevertheless the objective testing of knowledge and clinical skills is a major element of medical assessment and an understanding of the processes whereby these measurements are made, analysed and evaluated is an essential requirement of contemporary practice. A number of text-books and papers have covered this important area (Traub & Rowley 1991; Gilbert 1996; Anastasi & Urbin 1997; Hopkins 1998; Osterlind 1998; McAlpine 2002; Shultz & Whitney 2005; Crocker & Algina 2008; Holmbow & Hawkins 2008; Rust & Golombok 2009; de Champlain 2010; Cohen & Swerdlik 2010).

처음부터 우리는 객관적인 테스트가 개념적으로 일반적인 측정 원리와 관련된 심리측정이라고 불리는 측정의 한 형태라고 주장한다. 따라서 정확도, 신뢰성, 재현성, 유효성, 특수성 및 민감도와 같은 요소들은 모두 객관적인 측정 과정에 다양하게 적용될 수 있다. 이러한 요인의 통제는 [심리측정학이 모든 본질적인 변동성향을 가진 인간에게 적용된다]는 사실에 의해 더욱 중요해진다
From the outset we assert that objective testing is a form of measurement, termed psychometrics, conceptually related to the principles of measurement in general. Consequently factors such as accuracy, reliability, reproducibility, validity, specificity and sensitivity can all apply in varying ways to the process of objective measurement. The control of these factors is made more important by the fact that psychometrics applies to human beings with all their intrinsic propensity for variation.

길이 또는 질량과 같은 물리적 특성은 매우 정확하게 측정할 수 있는 반면, 인간 학습의 측정은 상당한 변동과 '소음'과 관련이 있다. 또한 학습의 경우 [동질적인 실체]가 아닌 것이 분명하다. 전통적으로 (Bloom 1956년)은 인지적, 심리적, 정서적 영역으로 구분되며 각 영역 내에 더 많은 계층적 수준이 있다고 말했다. 이 가이드에서는 [객관식 질문에 의해 측정된 지식 영역]과 [OSCE에 의해 측정된 심리 운동 영역의 일부 측면]에 초점을 맞출 것이다.

A physical property such as length or mass can be measured extremely accurately whereas the measurement of human learning is associated with significant variation and ‘noise’. In addition, in the case of learning, it is clear that it is not a homogeneous entity. Traditionally (Bloom 1956) said that it is differentiated into the cognitive, psychomotor and affective domains with further hierarchical levels within each. In this guide we will concentrate on the knowledge domain as measured by multiple choice questions and some aspects of the psychomotor domain measured by OSCEs.

또 다른 분명한 점은 측정과 평가라는 용어가 종종 하나의 용어 바구니에 잘못 던져지는 경우가 많지만, 각각은 뚜렷한 의미를 가지고 있으며 서로 구별되어야 한다는 것이다

  • [측정]은 측정되는 현상의 크기를 평가하기 위해 [수치를 할당하는 과정]이다. 
  • 랄프 타일러에게 [평가evaluation]는 '교육목표가 어느 정도 실현되고 있는지를 결정하는 과정'을 의미한다(Tyler 1949).
    • 수치지수numerical index를 입수하여 보고하는 것 자체는, 우리가 지수를 해석하고 평가하지 않는 한 의미가 없다(Morrow et al. 2006).

A further point of clarification is that although the terms measurement and evaluation are often mistakenly tossed into one terminological basket, each has a distinct meaning and should be differentiated from each other.

  • Measurement is the process of assigning a numerical value in order to assess the magnitude of the phenomenon being measured.
  • For Ralph Tyler, evaluation refers to ‘the process of determining to what extent the educational objectives are being realised’ (Tyler 1949).
    • Obtaining and reporting a numerical index has no meaning in itself unless we interpret and value the index (Morrow et al. 2006).

학습 측정은 고립된 사건이 아닙니다. 그것은 근본적으로 학습 요구의 식별에서 시작하여 예를 들어 의사, 간호사 및 기타 의료 전문가의 학습 결과로부터 시작하는 커리큘럼 주기의 일부이다. 그런 다음 이러한 학습 성과는 강의, 소규모 그룹 교육 또는 경험적 학습과 같은 가장 적절한 습득 방법에 대해 내린 결정의 기초가 된다. [학습의 측정] 또는 [평가]를 가지고 필요한 결과를 달성했는지 확인하는 것은 이 시점 이후입니다. 이 지점에서 [시험 후 분석]이 이루어지지만, 이것은 결과, 학습 및 평가의 커리큘럼 요소가 [커리큘럼 정렬]이라고 불리는 것에서 최적으로 표현되는지 여부를 확인하고자 하는 [커리큘럼 평가]의 전체 프로세스의 한 구성 요소일 뿐이다. 이 개념은 그림 1의 다이어그램으로 요약됩니다.
The measurement of learning is not an isolated event; it is fundamentally part of a curriculum cycle beginning with the identification of the learning needs and then the learning outcomes of, for example, doctors, nurses and other healthcare professionals. These learning outcomes then become the basis of decisions made concerning the most appropriate methods of acquisition, such as lecturing, small group teaching or experiential learning. It is after this point that the measurement of learning or assessment takes place to see if the required outcomes have been achieved. It is here that the subject of this guide, post-examination analysis, takes place but this is just one component of an overall process of curriculum evaluation that seeks to ascertain if the curriculum elements of outcomes, learning and assessment are articulated optimally in what has been termed curriculum alignment (Biggs & Tang 2007). This concept is summarised by the diagram in Figure 1.

커리큘럼 설계자와 교사는 [학습 성과에 대한 명확하고 집단적인 그림]을 가져야 한다.

  • 그것들은 학생들이 학습 과정의 결론에 따라 [무엇을 배우고 입증할 것으로 예상되는지에 대한 진술]이며,
  • 원칙적으로 [측정 가능]해야 하며
  • 따라서 [객관적인 평가로 변환되고 운영]될 수 있어야 한다.

Curriculum designers and teachers should have a clear and collective picture of learning outcomes.

  • They are statements of what students are expected to learn and demonstrate by the conclusion of the learning process and
  • in principle they need to be measurable and
  • hence capable of being transformed and operationalised into objective assessments.

본 가이드는 평가에 의해 생성된 데이터를 분석하는 방법에 중점을 두지만, 이 데이터에서 얻은 정보가 학습, 교육 및 결과 사양의 프로세스로 되돌아간다는 것을 깨달아야 한다. 예를 들어, [시험에서 드러난 이상anomalies]은 잘못된 문제 설정, 잘못된 교육 또는 부적절한 학습 결과의 사양을 나타낼 수 있다. 평가 주기는 그림 2와 같이 도표로 표시할 수 있습니다.

Although this Guide will focus on the methods for analysing the data generated by assessments it must be realised that the information obtained from this data feeds back into the processes of learning, teaching and outcome specification. For example, anomalies revealed in tests might indicate poor question setting, poor teaching, or even the specification of inappropriate learning outcomes. The assessment cycle can be displayed diagrammatically as shown in Figure 2.

 

 

시험 주기
The examination cycle

본 가이드의 목적상, 우리는 학습 성과가 정의되었고 모든 학습자가 이러한 결과를 달성할 수 있도록 적절한 교육 및 학습 경험이 제공되었다고 가정할 것입니다. [학습 성과]와 관련된 용어를 둘러싼 논란이 여전히 존재한다. (학습) 성과는 학습 과정이 끝날 때 학습자가 요구하거나 달성한 역량을 설명하는 광범위한 진술이 되어야 합니다. 예를 들어, GMC, 스코틀랜드 학장 및 WFME에 의해 '결과' 기반 의료 커리큘럼이 정의되었다.
For the purposes of this Guide we will assume that learning outcomes have been defined and that appropriate teaching and learning experiences have been provided so that these outcomes can be achieved by all learners. There is some controversy still surrounding the terminology associated with learning outcomes. Outcomes are meant to be broad statements describing the competencies required or achieved by learners at the end of a course of study. For example ‘outcome’ based medical curricula have been defined by the GMC, Scottish Deans and the WFME (GMC 2003; WFME 2003; Scottish Dean 2007).

반면 '학습목표'는 보다 [세분화]되어, 강의와 같은 [특정 학습 에피소드의 마지막에 습득한 학습]을 설명하는 데 자주 사용된다. 세분화된 수준의 결과 또는 목표는 학습자가 무엇을 할 수 있어야 하는지를 설명하는 진술이다. 단순성을 위해 우리는 결과라는 용어를 내내 사용할 것이다.
‘Learning objectives’, on the other hand, are more granular and are frequently used to describe the learning that has been acquired at the end of a specific learning episode such as a lecture. Whatever level of granularity is specified outcomes or objectives are statements describing what learners should be able to do. For simplicity we will use the term outcomes throughout.

앞서 지적했듯이 학습 결과는 측정 가능해야 하므로 종종 [행동 성과]라고 합니다. 블룸(1956)은 행동 결과를 세 가지 영역으로 분류했다: 인지 영역, 정서 영역 및 정신 운동 영역. 

  • 인지적 또는 지식 내에서 도메인 결과는 증가하는 인지적 요구의 스펙트럼에 따라 분류될 수 있다. 블룸의 원래 순위는 지식, 이해, 응용, 분석, 종합, 평가로 구분되었다. 보다 최근에는 지식 차원이 업데이트되었다. 기억, 이해, 응용, 분석, 평가, 창조(Anderson & Krathwohl 2000).
  • 원래의 심슨 1966년 사이코모터 영역은 관찰 프로토콜로 작동하기 쉽지 않은 일반적인 용어로 구성되었다: 인식, 설정, 유도 반응, 메커니즘, 복합적 공공적 반응, 적응 및 발생. 

As previously pointed out, learning outcomes should be measurable and hence they are frequently termed behavioural outcomes. Bloom (1956) classified behavioural outcomes into three domains: the cognitive domain, the affective domain and the psychomotor domain.

  • Within the cognitive or knowledge, domain outcomes can be categorised on a spectrum of increasing cognitive demand. Bloom's original ranking was differentiated into the following: knowledge, comprehension, application, analysis, synthesis and evaluation. More recently the knowledge dimension has been updated, giving the following: remembering, understanding, application, analysis, evaluation, creation (Anderson & Krathwohl 2000).
  • The original psychomotor domain (Simpson 1966) consisted of general terms which were not easy to operationalise into an observational protocol: perception, set, guided response, mechanism, complex overt response, adaptation and origination.

Dreyfus 모델은 현재 실무 능력의 습득을 모니터링하는 데 널리 사용되고 있지만, 다시 말해 실무 절차를 평가하기 위한 객관적인 시스템으로 쉽게 전환되지 않는다. OSCE 스테이션에서 확인할 수 있듯이, 본질적으로 증가하는 정신운동 복잡성의 척도에 대해 개인을 측정하기보다는 쉽게 관찰할 수 있는 특정 실무 역량의 목록을 정의하는 데 중점을 둔다. 정서적 영역에서 결과를 측정하는 것은 정의된 행동을 관찰함으로써 달성되지만 기준은 종종 주관적이고 정의하기 어렵다. 관찰된 행동과 개인의 내면적 '태도' 사이의 관계도 문제가 있다.

The Dreyfus model (Dreyfus & Dreyfus 2000) is now widely used to monitor the acquisition of practical skills but again is not easily transformed into an objective system for assessing, for example, practical procedures. As will be seen methods for assessing at OSCE stations essentially revolve around defining a list of specific practical competencies that can be easily observed rather than measuring an individual against a scale of increasing psychomotor complexity. Measuring outcomes in the affective domain is achieved by observing defined behaviours but the criteria are often subjective and difficult to define. The relationship between observed behaviour and an individual's internal ‘attitude’ is also problematic.

 

시험
Test

시험은 '행동 표본의 객관적이고 표준화된 척도'로 정의되었다(Anastasi & Urbin 1997). 이 정의를 이해하기 위해서는 세 가지 핵심 요소, 즉 객관성, 표준화 및 행동의 표본이 명확해질 필요가 있다.

  • 시험은 시험관의 주관적인 판단과 독립적으로 시행, 채점, 해석될 경우 [객관적인 것]으로 간주된다.
  • [표준화된 시험]은 문제, 채점, 해석 및 관리에 대한 절차가 '한 시험관으로부터 다른 시험관에 이르기까지 획일적'인 시험이다. 이것은 단순히 우리가 학생들의 점수를 서로 비교하고 싶다면, 동일한 시험 조건에서 동일한 시험 문제를 가진 모든 학생들을 시험할 필요가 있다는 것을 보여준다.
  • 시험은 [특정 행동의 표본]을 측정해야 한다. 이 표본을 바탕으로 검정 생성자는 몇 가지 추론과 가설을 도출합니다. 예를 들어, 의학 교육자가 학생들의 의학 용어에 대한 지식을 테스트하고 싶다면, 그 또는 그녀는 대표적인 의학 용어의 샘플로 그들의 성과를 조사한다.

Test has been defined as ‘an objective and standardised measure of a sample of behaviour’ (Anastasi & Urbin 1997). To understand this definition, three key elements need to be clarified, that is objectivity, standardisation and a sample of behaviour.

  • A test is considered to be objective if it is administered, scored and interpreted independently of the subjective judgment of examiners.
  • A standardised test is a test in which the procedure for the questions, scoring, interpreting and administrating are ‘uniform from one examiner and setting to another’ (Gregory 2007). This simply shows if we want to compare students’ scores to each other, it is necessary to test all students with the same test questions under the same test conditions.
  • A test should measure a sample of particular behaviour. Based on this sample, test constructors draw some inferences and hypotheses. For example, if a medical educator wishes to test the knowledge of students’ medical terminology, he or she examines their performance with a representative sample of medical terms.

항목 작성 및 항목 뱅킹
Item writing and item banking

[학습 성과]가 정의되고 학생들이 학습 결과를 습득할 수 있도록 적절한 [학습 경험]이 제공되었다면, 다음 단계는 [시험 항목, 문제 또는 OSCE 점검 목록]의 작성이다. [문제 작성]은 잘못 구성된 항목이 평가 프로세스의 정렬을 전복시키고 손상시킬 수 있으므로 신중하게 개발되어야 하는 기술입니다. 질문은 인지 수준이 알려진 정의된 학습 결과와 관련되어야 하며 명확하고 모호하지 않아야 한다. 질문은 또한 타당해야 한다. 즉, 최소한 내용 타당성, 구성 타당성 및 안면 타당성, 즉 홉킨스(1998)에서 정의된 개념을 가져야 한다. 여기서 질문 작성 기술을 다룰 공간은 없지만 독자는 케이스와 스완슨에게 언급된다. 질문 개발자가 최종 초안에서 요구되는 것보다 2배 많은 질문을 생성한다면 유용할 것이다. 문제 개발자는 이러한 문제를 문제은행에 보관하여 나중에 시험에 대한 결정을 내릴 수 있다. 또한 시험 개발자는 병렬 형식의 신뢰성 추정(신뢰성 추정 참조)을 사용하여 신뢰성을 결정하기 위해 병렬 형식의 시험을 설계할 수 있다.

If learning outcomes have been defined and appropriate learning experiences provided so that students can acquire them, the next phase becomes the writing of test items, questions or OSCE check lists. Question writing is a skill that needs to be carefully developed as badly constructed items can subvert and damage the alignment of the assessment process. Questions should be related to a defined learning outcome whose cognitive level is known and they should be clear and unambiguous. Questions should also be valid, i.e. they should have at least content validity, construct validity and face validity, concepts defined in Hopkins (1998). There is not space here to go into the techniques of question writing but the reader is referred to Case and Swanson (Case & Swanson 2010). It would be useful if question developers produced twice as many questions as required in the final draft. Question developers can keep these questions in the question bank for later decisions on incorporation into the test. The test developer could also design parallel forms of the test in order to determine reliability by using parallel-forms reliability estimation (see reliability estimates). 

질문 작성 외에도, 평가자들은 리즈 의학 교육 연구소(UMAP 2010)의 UMAP(Universities Medical Assessment Partnership)와 같은 많은 질문이 구축, 테스트, 평가 및 정제된 [문제 은행]으로 점점 더 눈을 돌리고 있다. 홍콩 이상 컨소시엄은 또한 국제적인 규모로 의학 교육자들을 위한 평가 은행을 설립하고 공유했다. 많은 질문의 장점은 평가자가 대상 내용 영역, 심리 측정 특성 또는 기타 독립 변수에 따라 분류되는 많은 시도되고 테스트된 질문에 편리하게 접근할 수 있다는 것을 의미한다. [문제 은행]은 컴퓨터에 저장하여 학생에게 전달된 질문이 이전 질문에 대한 수행의 함수인 컴퓨터 적응 테스트(CAT)에 사용할 수 있습니다(Weiss & Vale 1987). 

In addition to question writing, assessors are increasingly turning to question banks where many questions have been constructed, tested and evaluated and refined, for example the Universities Medical Assessment Partnership (UMAP), at Leeds Institute for Medical Education (UMAP 2010). The Hong Kong Ideal Consortium has also created and shared an assessment bank for medical educators on an international scale (Ideal Consortium 2010). The advantage of a large bank of questions means that assessors have convenient access to a large number of tried and tested questions which are categorised according to the target content area, psychometric properties or other independent variables. Question banks can be stored in computers and used for computerised adaptive testing (CAT) where the question delivered to the student is a function of their performance on the previous questions (Weiss & Vale 1987).

CAT 접근 방식에서는 학생이 이전 질문에 올바르게 답하지 않을 경우 프로그램이 다음 질문으로 넘어가지 못하게 할 수 있습니다. 이는 기관이 지원자를 인증 또는 면허 취득 여부를 결정하는 형성 평가나 고부담 시험에서 매우 유용합니다. CAT는 시험 중 학생의 수행 수준을 측정하는 방식으로 작동한다. 각각의 질문이 끝난 후, 그의 현재 성과를 은행의 모든 질문과 비교할 수 있다. 전산화된 시험 프로그램의 알고리즘은 학생의 현재 성적 수준과 모든 시험 규격을 기반으로 은행의 다음 질문을 선택한다. 이 프로세스는 테스트가 종료될 때까지 계속됩니다. 이 방법으로 너무 쉬우거나 너무 어려운 문제는 해당 응시자에게 전달되지 않고 시험이 개인화됩니다. CAT를 사용하면 신뢰성에 영향을 주지 않으면서 관리해야 하는 시험 문제 수가 50% 감소하고 오류 측정도 50% 감소합니다.

In this approach the programme may not allow the student to move on to the next question, if he or she does not correctly answer the previous question. This is very useful for formative assessment or in high stakes examinations, where institutions are deciding if a candidate will be certified or licensed (Bergstrom & Lunz 2008). CAT operates by measuring the performance level of the student during the test. After each question, his/her current performance can be compared to all questions in the bank. The algorithm of the computerised testing programme selects the next question from the bank based on the current level of the student's performance and all test specifications. This process continues until the test is terminated. By this method the questions that are too easy or too difficult will not be delivered to that candidate and the test will be individualised. Using CAT, the numbers of test questions that need to be administrated are reduced by 50% without sacrificing reliability and concurrently the measurement of error is reduced by 50% (Bergstrom & Lunz 2008; Cohen & Swerdlik 2010).

항목 샘플링: 몇 가지 질문을 해야 합니까?
Item sampling: how many questions should we ask?

우리가 시험을 칠 때, 학습 영역의 모든 학습 결과와 관련된 질문을 하는 것은 현실적으로 불가능하며, 결과적으로 우리는 실용적인 이유로 샘플을 채취해야 한다. 그러나, 특정 지식의 영역이 영역의 적절한 깊이와 폭을 포괄하는 학습 결과의 범위에 의해 설명되었다면, 이러한 학습 결과의 몇 부분이 전체 모집단의 대표적인 샘플을 구성합니까? 다시 말해서, 우리는 시험에서 얼마나 많은 항목을 정해서 한 학생을 위해 얻은 점수가 그들의 세계적인 지식을 반영한다는 것을 우리에게 안심시켜야 하는가? 많은 시험들의 크기가 적절한 표본 크기보다는 전통이나 시간의 길이에 기반을 두고 있기 때문에 이것은 자주 묻는 질문이 아니다. 이 문제를 해결함으로써 생성된 유효성은 내용 타당도와 연관된다.
When we set an exam it is practically unfeasible to ask a question concerned with every single learning outcome in an area of learning, consequently we are forced to sample for practical reasons. However, if a particular area of knowledge has been described by a range of learning outcomes, which cover an appropriate depth and breadth of the domain, what fraction of these learning outcomes constitutes a representative sample from the total population? In other words how many items should we set in the test to reassure us that the score obtained for a student reflects their global knowledge? This is a question that is not often asked as the size of many exams is based on tradition or length of time rather than appropriate sample size. The validity created by addressing this issue is associated with content validity.

전체 항목 풀의 대표적인 부분을 선택하는 과정을 문항 샘플링이라고 한다. 시험의 항목 크기는 오류의 원인이 될 수 있으며 오류는 나중에 논의될 것처럼 신뢰성이 떨어진다(Cortina 1993). 그러나 시험 항목의 수가 증가함에 따라 표본 오차가 감소하여 신뢰성이 그림 3과 같이 증가해야 한다는 것은 분명하다. 또한 추측 가능성이 있는 객관식 시험에서 항목 수를 늘리면 추측과 관련된 오차가 줄어듭니다.

The process of selecting a representative fraction of a total pool of items is referred to as item sampling. The size of items in a test can be a source of error and error leads to unreliability as will be discussed later (Cortina 1993). However, it is clear that as the number of test items increases sampling error will decrease and hence reliability should increase as shown in Figure 3. In addition, in multiple choice tests where there is the possibility of guessing, increasing the number of items will reduce errors associated with guessing.

 

아래 공식을 사용하여 검정에 적합한 표본 크기를 계산할 수 있습니다.
An appropriate sample size can be calculated for a test using the formula below:



여기서 n은 표본 크기와 같으며, Z2는 표본 크기가 우연에 의해 얼마나 영향을 받는지 나타내는 신뢰 수준(90% 신뢰도는 1.64, 95% 신뢰도는 1.96, 99%는 2.57)이며, SD는 항목 모집단의 표준 편차 추정치이며, e2는 표본 크기의 오차(예: 0.03 또는 0.05)입니다. 따라서 표본 크기를 계산하려면 파일럿 연구 또는 이전 데이터에서 추정된 표준 편차가 필요합니다. 예를 들어, 문항 모집단에서 20문항의 무작위 표본을 추출하여 학생 그룹과 함께 시험하는 경우, 학생 점수의 표준 편차는 0.26으로 계산될 수 있다. 그런 다음 이 표준 편차를 표본 크기 공식에 대입하고 필요한 표본 크기를 계산합니다. 이 정보를 가지고 95% 신뢰 수준과 0.05 정밀도의 표본을 얻으려면 필요한 표본 크기(n)는 다음과 같이 계산됩니다.


Where n is equal to the sample size, Z2 is a confidence level indicating how much the sample size is influenced by chance (1.64 for 90% confidence, 1.96 for 95% and 2.57 for 99%), SD is an estimation of standard deviation in the population of items, e2 is the error of the sample size, e.g., 0.03 or 0.05. To calculate the sample size we therefore need the standard deviation estimated either from a pilot study or from previous data. For example if a random sample of 20 questions is drawn from the population of items and piloted with a group of students a standard deviation of student's scores might be calculated as 0.26. This standard deviation is then substituted into the sample size formula and the sample size required is calculated. With this information in hand, if we desire to obtain a sample with a 95% confidence level and 0.05 precision, the sample size required (n) is calculated as:

따라서 95% 신뢰도를 제공하기 위해 최소 106개 문항이 시험에 포함되어야 합니다. 시험 대상 항목 모집단의 이질성이 클 경우, 주어진 수준의 정밀도를 얻기 위해서는 더 큰 표본이 필요하며, 그 반대의 경우도 마찬가지라는 점에 유의해야 한다. 이질적인 테스트가 많을수록 나중에 논의된 크론바흐 알파 통계에 의해 결정되는 항목 간 일관성이 떨어진다.
Therefore, the test should include at least 106 questions to provide 95% confidence. It should be noted that if the heterogeneity of the population of items being tested is large, a larger sample is required to obtain a given level of precision and vice versa. The more heterogeneous a test, the less inter-item consistency there is as determined by the Cronbach alpha statistic as discussed later.

 

평가의 파일럿
Piloting of assessments

원칙적으로 시험이 개념화되고 구성되면 항목 분석을 사용하여 전체 내용 문제를 제거하기 위해 적절한 학습자 그룹을 대상으로 시험해야 합니다. 실제로 통계 절차는 '좋은' 질문과 수정하거나 폐기해야 하는 질문을 판단하는 데 도움이 됩니다. 이 분석을 바탕으로 시험 문제를 만들고 새로운 수험생 표본에 시험하여 시험을 마무리한다. 그러나 실제로 이 과정은 시험 내용이 학생에게 '유출'될 수 있고, 문제 은행의 좋은 문제를 다 사용할 수 있기 때문에 실현 불가능할 수 있습니다. 대안적 또는 추가적인 접근법은 문제의 용이성, 난이도 또는 적절성에 대한 귀중한 조언을 해줄 수 있는 외부 심사관이 시험지를 볼 수 있도록 하는 것이다. 또 다른 고려사항은 아래에서 논의되는 병렬 형식의 시험 사용이다.
In principle, once an examination has been conceptualised and constructed it should be piloted on an appropriate group of learners to eliminate any gross content problems using item analysis. Indeed, statistical procedures assist us to judge ‘good’ questions and those questions that need to be modified or discarded. On the basis of this analysis, test questions are created and tried out on a new sample of examinees to finalise the test. However, in practice this process may be unfeasible as it might allow ‘leakage’ of the exam content into the student body and might use up valuable questions from the bank. An alternative or additional approach is to ensure that the exam paper is seen by an external examiner who can give valuable advice on the ease, difficulty or appropriateness of questions. Another consideration is the use of parallel-forms of the test, which is discussed below.

표준설정
Standard setting

시험지를 사용할 준비가 되면 '표준 설정'으로 합격 표시를 결정해야 합니다. 간단히 적절한 개인 그룹은 대상 청중과 관련하여 각 질문의 용이성 또는 난이도를 차례로 검토하고, [주관적인 합의 과정]을 통해 (필기 시험과 임상 시험 모두에 대해) [신뢰할 수 있고 정당하며 허용되는 합격선 점수]를 설정한다. 표준은 허용 가능한 수행자와 그렇지 않은 수행자 사이의 경계를 나타내는 최소 적정 수준의 수행이다(Norcini 2003). 문헌에 설명된 표준 점수 식별에 사용할 수 있는 여러 가지 표준 설정 방법이 있지만 이 가이드의 목적은 아닙니다. 
Once the exam paper is ready for use a pass-mark needs to be determined by ‘standard setting’. Briefly a group of appropriate individuals examines each question in turn for its ease or difficulty in relation to its target audience and, via a subjective process of consensus, establishes trustworthy, justifiable and acceptable standard scores for both written tests and clinical examinations. The standard is the minimum adequate level of performance, indicating the boundary between those who perform acceptably and those who do not (Norcini 2003). There are a number of different standard setting methods available for identifying the standard score, described in the literature (Cusimano 1996, Norcini & Guille 2002; Bandaranayake 2008), but it is not the purpose of this Guide to discuss them.

그러나 여기서 중요한 것은 [시험 후 분석 결과]를 [표준 설정과 관련된 사람들에게 피드백]하여, 문항의 속성과 품질을 평가하는 능력을 향상시킬 수 있는 수단이다. 표준 설정자는 시험의 용이성이나 난이도에 대해 더 많은 정보에 입각한 판단을 내릴 수 있도록 [문항과 전반적인 시험 구성]에 대한 지식과 경험을 쌓아야 하며, 따라서 더 공정하고 적절한 합격점수 또는 컷 점수를 정의할 수 있어야 한다.

However, what is relevant here is the means by which the results of post-examination analysis can be fed back to those involved in standard setting so that their ability to evaluate the attributes and quality of questions is enhanced. Standard setters need to build up a body of knowledge and experience of items and overall test construction so that they can make more informed judgements concerning the ease or difficulty of a test and hence define a fairer and more appropriate pass mark or cut-score.

표준 참조 및 기준 참조 테스트
Norm referenced and criterion referenced tests

이것이 포함된 문항의 수와 유형에 영향을 미치고 따라서 검사 후 분석의 해석에 영향을 미치기 때문에 고려해야 할 마지막 주제는 시험의 전반적인 목적이다. 테스트를 구성하는 두 가지 주요 목적은 로버트 글레이저가 만든 용어인 표준 참조와 기준 참조를 위한 것이다.

One final topic that needs to be considered is the overall purpose of the test since this will affect the number and type of questions it contains and hence will influence the interpretation of post-examination analysis. The two major purposes for constructing tests are for norm-referencing and criterion referencing, terms coined by Robert Glaser (Glaser 1963).

[norm-referenced 접근법]에서 시험 설계자는 경쟁적인 이유 또는 특정 표준을 유지하기 위해 미래 과정의 제한된 장소와 같은 특정 이유로 최고의 학생을 선발하기 위해 성적이 우수한 학생과 성적이 낮은 학생을 구별하려고 한다. 시험이 끝날 때 시험 제작자들은 학생들의 시험 점수의 평균과 표준 편차를 계산한 다음 정규 분포 곡선에서 각 학생의 위치를 결정한다. 합격이 허용된 학생의 비율과 다른 성적을 가진 학생들의 places의 가용성에 따라 임의의 성적 경계와 합격 표시가 이 분포에 삽입된다. 분명히 표준 기준 시험에서 [학생이 얼마나 잘하느냐]는 학생의 성취도에 대한 절대적인 척도가 되기보다는, 전체 코호트가 어떻게 수행하느냐의 함수이다. 만약 시험의 목적이 제한된 포지션이나 시상을 위한 경쟁이라면, 정규 분포를 따라 [학생들을 분산시키기 위해] norm-referenced 시험을 설계해야 한다. 따라서 지식기반시험에서는 [이질적인 인지적 요구]를 가진 문항이 있는 것이 적절할 것이며, 검사후 분석은 그러한 시험이 목적을 달성했는지 여부를 확인할 수 있을 것이다.
In norm-referenced approaches, test designers seek to differentiate high-performing students from low-performing ones in order to select the best students for particular reasons, such as a limited number of places on future courses, for competitive reasons or to maintain particular standards. At the conclusion of the examination test makers calculate the mean and standard deviation of students’ test scores and then determine the placement of each student on a normal distribution curve. Arbitrary grade boundaries and pass-marks are inserted onto this distribution depending on the proportion of students that are permitted to pass and the availability of places for students with different grades. Clearly how well a student does in a norm-referenced exam is a function of how the whole cohort performs rather than being an absolute measure of the student's attainment. If the purpose of the exam is competition for limited places or prizes then a norm-referenced exam should be designed to spread students out along the normal distribution. Thus, in a knowledge based exam it would be appropriate to have a range of questions with heterogeneous cognitive demand and post-examination analysis would be able to confirm whether such an exam achieved its aim.


[Criterion-referenced 접근법]은 다른 사람의 성과에 대한 참조 없이 학습자의 성취도를 측정하여 학습자를 평가하려고 시도한다. Cohen과 Swerdlik(2010)에 따르면, Criterion-referenced 평가는 '평가방법 및 정해진 기준에 따라 개인의 점수를 평가하여 시험점수에서 의미를 도출하는 방법'으로 정의된다. 따라서 학생이 특정 학점을 합격, 불합격 또는 달성하는지 여부는 코호트의 달성 여부에 관계없이 시험에서 특정 점수를 달성할 수 있는 능력에 따라 결정된다. 기준 참조는 시험의 주요 목적이 학생들이 특정한 인지 능력이나 정신 운동 능력을 획득했는지 확인하는 것일 때 사용된다. 이는 질문의 수와 유형에 영향을 미칠 것이 분명하며, 따라서 Criterion-referenced 시험이 [더 동질적]일 가능성이 높다. 그럼에도 불구하고 학습자 모집단 내 능력 범위와 질문의 잔류 이질성을 고려할 때, Criterion-referenced 시험에서도 분산은 적지만 결과가 분석될 때 정규 분포가 관찰될 가능성이 여전히 높다.

Criterion-referenced approaches attempt to assess learners by measuring their attainment without reference to the performance of others. Criterion-referenced assessment, according to Cohen and Swerdlik (2010), is defined as ‘a method of evaluation and a way of deriving meaning from test scores by evaluating an individual's score with reference to a set standard’. Thus, whether a student passes or fails or achieves a particular grade is determined by their ability to achieve a particular score in an examination regardless of the attainment of the cohort. Criterion-referencing is used when the primary purpose of an examination is to see if students have attained specific cognitive or psychomotor competencies. Clearly this will influence the number and type of questions asked and it is more likely, therefore, that a criterion-referenced exam would be more homogeneous. Nevertheless given the range of abilities within a population of learners and the residual heterogeneity of questions, even in a criterion-referenced exam, it is still likely that a normal distribution will be observed when the results are analysed, albeit with less variance.

시험문제 분석
Analysis of examination questions

[시험 후 분석기법]을 활용하는 근거는 [평가의 질과 신뢰성을 향상]시키고, 작은 분산오차로 학생들의 수행수준을 추정하기 위해 학생을 평가하는 데 [가장 적합한 문항을 선택]하기 위함이다. 이 섹션에서는 결함이 있는 질문을 식별하기 위해 다양한 프로세스를 사용할 수 있는 방법, 차별을 개선할 수 있는 방법 및 질문을 삭제하거나 바꿔서 전체적인 신뢰성을 높일 수 있는 방법을 설명합니다. OSCE 시험의 경우 '매'와 '비둘기'의 식별과 평가자 간 신뢰성 문제를 다루는 문제가 논의될 것이다.
The rationale for using post-exam analysis techniques is to improve the quality and reliability of assessments, and to select the questions that are most appropriate for assessing students in order to estimate students’ level of performance with low variance error. This section will explain how various processes can be used to identify flawed questions, how discrimination can be improved and how overall reliability can be increased by deleting or rephrasing questions. In the case of OSCE examinations the identification of ‘hawks’ and ‘doves’ and the problem of dealing with inter-rater reliability issues will be discussed.

또한 시험 후 분석이 항목 은행의 메타 데이터 코딩 문제 개발에 어떻게 기여할 수 있는지, 예를 들어 표준 설정의 정확도를 향상시킴으로써 문제 데이터가 시험 주기에 어떻게 영향을 미칠 수 있는지 논의할 것이다.
In addition we will discuss how post-exam analysis can feed into the development of meta-data coded questions in item banks and how question data can influence the examination cycle by, for example, improving the accuracy of standard setting.

조정
Moderation

보다 분석적인 방법을 다루기 전에 [시험 조정 과정]에 대해 간략하게 논의할 가치가 있습니다. 이는 반드시 매우 객관적인 평가 기준을 사용하지 않는 평가자가 여러 명인 상황에서 필요할 가능성이 높다. 이 문제는 기계나 컴퓨터에 표시된 지식 기반 평가에서는 발생하지 않지만 사람이 평가한 OSCE 검사에서는 발생할 수 있다. 특히 주관성이 시험 채점에 관여할 때, 평가 기준('매'와 '비둘기')을 차등적으로 해석하는 심사관은 오류 분산의 원천이 될 수 있으며, 이는 다시 측정되는 성과에 대한 학생의 실제 점수에 부정적이거나 긍정적인 영향을 미칠 수 있다. 이는 또한 저신뢰성unrealiability을 유발하며, 이 요인을 보완하기 위한 메커니즘을 마련해야 한다(나중에 참조). 논술이나 단답형을 이용한 필기시험의 경우, 이중, 익명의 채점이 공정한 기준이 유지되도록 하는 가장 좋은 방법인 경우가 많다.
Before dealing with the more analytical methods it is worthwhile briefly discussing the process of exam Moderation. This is more likely to be required in situations when there are multiple assessors who are not necessarily using very objective assessment criteria. This is unlikely to occur with machine or computer marked knowledge based assessments but can occur with human assessed OSCE examinations. Examiners, especially when subjectivity is involved in test scoring, who differentially interprets assessment criteria (‘hawks’ and ‘doves’) can be source of error variance, which in turn may negatively or positively influence the student's true score on the performance being measured. This will also generate unreliability and mechanisms need to be in place to compensate for this factor (see later). For written examinations using essays or short answers, double, anonymous marking is often the best way to ensure that fair standards are maintained.

기술 통계량
Descriptive statistics

테스트에서 원시 점수를 얻은 후 가장 간단한 분석은 점수의 빈도 분포를 살펴보고 평균, 최빈값, 중위수 및 표준 편차를 계산하는 것입니다. 이 수치는 SPSS(SPSS 2009)에 데이터를 삽입하여 쉽게 계산할 수 있다. 일반적으로 사용되는 용어의 정의는 표 1에 설명되어 있습니다.
Once raw scores have been obtained from a test the simplest analysis that can be undertaken is to look at the frequency distribution of scores and to calculate the mean, the mode, the median and the standard deviation. These figures are readily calculated by inserting the data into SPSS (SPSS 2009). The definitions of the commonly used terms are described in Table 1.

 

분포를 검사하면 분포가 '정규' 분포에서 얼마나 멀리 떨어져 있는지, 얼마나 치우쳐 있는지 알 수 있습니다. 평균, 모드 및 중위수 간의 차이는 분포가 정규 분포를 얼마나 벗어나는지 보다 객관적으로 나타냅니다. 분포가 치우쳐 있는 정도는 검정의 전반적인 용이성 또는 난이도를 나타낼 수 있습니다. 모드가 한쪽으로 꺼지면 분포가 치우쳐 있다고 합니다. 모드가 왼쪽이고 꼬리가 오른쪽인 경우 분포는 양의 또는 오른쪽 왜도를 갖습니다. 이는 학생들의 시험 점수가 분포의 높은 끝에서 떨어지는 경우가 거의 없다는 것을 보여주는데, 이는 시험이 너무 어려웠다는 것을 의미한다. 여기서 분포의 하단에서의 변별력을 수정하기 위해서는 난이도가 낮은 문항이 더 많이 사용되었어야 했다. 긴 꼬리가 왼쪽에 있으면 분포가 음수 또는 좌측 스큐를 갖습니다. 이는 학생들의 시험 점수가 분포 하단에서 떨어지는 경우가 거의 없다는 것을 보여주는데, 이는 시험이 너무 쉬웠다는 것을 의미한다. 여기서 분포의 상위 끝에서의 차별을 수정하기 위해 더 어려운 질문이 사용될 수 있었다. 
Inspection of the distribution can reveal how far it deviates from a ‘normal’ distribution and how skewed it is. Differences between the mean, mode and median also give a more objective indication of how much the distribution deviates from normal. How skewed the distribution is can indicate the overall ease or difficulty of a test. When the mode is off to one side the distribution is said to be skewed. If the mode is to the left with a long tail to the right the distribution has positive or right skewness. This shows that few students’ test scores fall at the high end of the distribution, which means the test was too difficult. Here, in order to modify the discrimination at the lower end of the distribution, more questions with a lower level of difficulty should have been used. If the long tail is to the left the distribution has negative or left skeweness. This shows that few students’ test scores fall at the lower end of the distribution, which means the test was too easy. Here, in order to modify the discrimination at the higher end of the distribution, harder questions could have been used.

Z점수
Z-scores


원시 점수의 평균과 표준 편차는 시험의 크기와 총점에 따라 달라집니다. 시험 점수를 표준 방식으로 비교할 수 있도록 '정규화'하는 방법은 z-점수를 계산하는 것이다.
The means and standard deviations of raw scores will vary depending on the size of the examination and the total mark. A method for ‘normalising’ examination scores so that they can be compared in a standard way is to calculate z-scores.

만약 학생들의 점수가 평균과 표준 편차를 가지고 있다면, 학생의 점수는 다음과 같은 방정식에 의해 z-점수로 변환된다.
If students’ scores have a mean and standard deviation, then the student's score is transformed into a z-score by the equation:

이 공식은 단순히 z-점수가 특정 시험에서 학생들의 원시 점수(X)와 평균 점수(X_bar)의 차이와 같다는 것을 보여준다. 모든 z-점수 변환 분포의 평균은 0이고 표준 편차는 1입니다. 개인의 z 점수는 표준 편차 단위로 평균보다 얼마나 높거나 낮은지 보여줍니다. 예를 들어 특정 시험의 점수 평균이 표준 편차 15에 50이라고 가정하면 학생이 65점을 받으면 z 점수는 +1이다. 이것은 학생이 분포의 평균보다 +1 표준 편차라는 것을 의미합니다. 학생의 위치를 서로 비교하는 데 z-점수의 표준 표를 사용할 수 있습니다. 정규 분포 내에서 점수의 위치는 다음과 같습니다. 점수의 68%는 평균의 +/-1 표준 편차 내에 있습니다. 점수의 95%는 평균의 + /-2 표준 편차 내에 있습니다. 마지막으로, 점수의 99.75%는 평균의 +/-3 표준 편차 내에 있습니다. 따라서 위의 예에서 다른 학생의 약 16%가 학생보다 높은 점수를 받았습니다. 따라서 원점수에 의존하는 것은 학생들에게 잘못된 인상을 줄 수 있을 뿐만 아니라 시험에 대한 왜곡된 시각을 제공할 수 있다. Z 점수는 교사들이 다른 총점으로 다른 시험에서 학생들의 점수를 비교할 수 있게 해준다.

This formula simply shows that a z-score is equal to the difference between a raw score (X) and the mean score of students (X_bar)  in a particular test divided by the standard deviation (s). All z-score transformed distributions have a mean of 0 and a standard deviation of 1. An individual's z-score shows how far above or below the mean their score is in units of standard deviation. For example assuming the mean of scores in a particular test is 50 with a standard deviation 15, if a student scores 65, his/her z score is +1. This means that the student is +1 standard deviation above the mean of the distribution. Standard tables of z-scores are available for comparing the position of student to each other. Within the normal distribution the position of scores is as follows: 68% of scores lie within +/−1 standard deviation of the mean. 95% of scores lie within + /−2 standard deviations of the mean. Finally, 99.75% of the scores lie within +/−3 standard deviations of the mean. Therefore, in the above example, approximately 16% of other students obtained higher scores than the student. Thus, relying on a raw score can provide a wrong impression of the student, as well as a distorted view of the exam. Z-scores allow teachers to compare students’ scores on different tests with different total marks.

X_Bar

 

 

문항 분석
Item analysis

시험 결과의 문항 분석은 정량적 방법을 사용하여 어떤 문제를 채택해야 하는지, 어떤 문제를 수정해야 하는지, 어떤 문제를 폐기해야 하는지 판단하는 데 도움이 된다. 문항 분석은 개별 문항과 글로벌 시험 점수 사이의 관계뿐만 아니라 개별 문항의 용이성이나 난이도를 분석하는 데 사용될 수 있다. 예를 들어, 시험에서 높은 점수를 받은 학생이 문제를 맞힌다면 그 문제는 좋은 문제로 여겨질 것이다. 마찬가지로, 만약 시험에서 낮은 점수를 받은 학생이 질문에 잘못 대답한다면, 그 질문은 좋은 질문으로 여겨질 것이다. 항목 분석을 기반으로 시험의 수정 및 개선이 이루어질 수 있다.
Item analysis of test results uses quantitative methods to help make judgements about which questions need to be adopted, which questions need to be revised and which questions should be discarded. Item analysis can be used to analyse the ease or difficulty of individual questions as well as the relationship between individual questions and the global test score. For example if a student with a high score on the test answers a question correctly that question would be considered a good question. Equally, if a student with a low score on the test answers a question incorrectly, that question would be considered a good question. On the basis of item analysis, a revision and improvement of the test can be made (Cohen & Swerdlik 2010).

 

문항 난이도 지수
The item-difficulty index

만약 모든 학생들이 특정한 질문에 옳거나 틀리게 대답한다면, 그 질문은 좋은 질문이 아니며 검토할 필요가 있다. 그것은 너무 쉽거나 너무 어렵다. 학생에게 너무 쉽거나 너무 어려운 문제들은 학생의 능력에 대한 정보를 거의 제공하지 않는다. 항목 난이도 지수(항목 시설이라고도 함)는 시험 문제를 맞힌 학생 수의 백분율을 말하며 다음과 같이 계산한다.
If all students answer a particular question either correctly or incorrectly, that question is not a good question and needs examining. It is either too easy or too difficult. Questions which are too easy or too hard for a student contribute little information regarding the student's ability (Green et al. 1984). The item-difficulty index (sometimes also termed item facility) refers to the percentage of the total number of students who answered the test question correctly and is calculated as follows:

여기서 R은 문제를 맞힌 총 학생 수이고 N은 총 응답 수(정답 + 오답 + 빈 응답)입니다. 그 문제 번호는 i라고 불린다. P는 정답의 분수입니다. 예를 들어 100명 중 40명이 1번 문제를 맞혔을 경우 항목 난이도 지수는 다음과 같이 간단하게 계산된다.
Where R is the total number of students who answered the question correctly and N is the total number of responses (correct + incorrect + blank response). The question number is called i. P is the fraction of correct answers. For instance, if 40 of the 100 students answered question 1 correctly, the item-difficulty index is simply calculated as follows:

따라서 항목 난이도 지수의 값은 0부터 1까지(모든 사람이 질문에 올바르게 대답하지 않은 경우)이다. 또한 P 값이 클수록 질문이 쉬워집니다. P_i가 0.3과 0.8 사이에 있으면 해당 질문이 좋은 질문으로 간주됩니다.
Consequently the value of an item-difficulty index ranges from 0 (if no one answered a question correctly) to 1 (if everyone answered a question correctly). In addition, the larger the P value, the easier the question. If Pi is located between 0.3 and 0.8, the question is considered to be a good question.

그러나 객관적 시험에서 추측의 효과를 고려할 필요가 있다. 예를 들어, 5가지 옵션 객관식 문제를 추측할 확률은 0.20입니다. 이 경우 정답을 맞힐 확률과 1.00(모두 정답일 경우)을 더한 뒤 합을 2로 나누면 (0.20 + 1.00)/2 = 0.60이다. 반대로, 정답 확률이 0.5인 진-거짓 문제에서 수정된 문제 난이도는 0.75 즉, (0.5 + 1.0)/2이다. 이 경우 '양호' 문항은 각각 0.2~0.6과 0.5~0.75 사이의 항목 난이도를 가져야 한다.
However, the effects of guessing in objective tests needs to be considered. For example, the probability of guessing a five-option multiple choice questions is equal to 0.20. In order to calculate the corrected question difficulty in this case, we need to add the probability of getting an answer right and 1.00 (if everyone answered a question correctly) and then divide the sum by 2, that is, (0.20 + 1.00)/2 = 0.60. Conversely, the corrected question difficulty in a true-false question, where the probability of a correct answer is 0.5, is equal to 0.75, i.e. (0.5 + 1.0)/2. In these cases ‘good’ questions should have a range of item difficulty between 0.2–0.6 and 0.5–0.75, respectively.

데이비스는 '기회성공'을 위해 문제가 수정되어야 할 때 항목 난이도를 결정하기 위한 다음과 같은 일반 공식을 제시하였다(Davis 1952).
Davis has presented the following general formula for determining item difficulty when questions need to be corrected for ‘chance success’, (Davis 1952):

여기서 PDi는 문제 번호(i)에 대해 수정된 항목 난이도 지수, R은 문제 정답자 수, W는 문제 정답자 수, n은 문제 선택 수, K는 학생 수, KR은 미답자 수이다.그가 질문한다.
Where PDi equals the item-difficulty index corrected for the question number (i), R equals the number of students who answer a question correctly, W equals the number of students who answer a question incorrectly, n equals the numbers of choices in a question, K equals the number of students, and KR equals the number of students who do not answer the question.

문항-변별 지수
The item-discrimination index

문항 변별지수는 성적이 좋은 학생과 그렇지 않은 학생, 또는 '강한' 학생과 '약한' 학생을 얼마나 잘 구별할 수 있는지를 나타내는 값이다. 문항 변별 지수는 소문자 기울임꼴 "d"로 표시됩니다. d의 범위는 -1.00 ~ 1.00입니다. 이제 개별 질문에 대한 d-값을 계산하는 가장 일반적인 방법이 설명된다.
The item-discrimination index is a value of how well a question is able to differentiate between students who are high performing and those who are not, or between ‘strong’ and ‘weak’ students. The item-discrimination index is symbolised by a lowercase italic “d”. The range of d is −1.00 to 1.00. The most common method to calculate a d-value for individual questions is now described.

이 방법에서 시험관은 각 학생의 점수표에 따라 학생들을 두 그룹('높음'과 '낮음')으로 나눕니다. 이 분류를 기준으로 학생의 27%가 강자 집단, 27%가 약자 집단으로 분류된다. 일부 방법은 '상위 3분의 1'과 '하위 3분의 1'을 선호하지만, 27%를 기준으로 학생들을 두 그룹으로 나누면 d값의 민감도와 정밀도가 높아진다는 연구결과가 나왔다. 분명히 중위권 학생의 46%는 항목별 차별 지수 계산에서 제외된다.
In this method, the examiner divides students into two groups (‘high’ and ‘low’) according to the score sheet of each student. On the basis of this classification, 27% of the students are categorised as a strong group and 27% as a weak group. Some methods prefer a ‘top third’ and a ‘bottom third’ but studies have shown that when students are divided into two groups on the basis of 27% the sensitivity and precision of the value of d is increased (Kelley 1939; Cohen & Swerdlik 2010). Obviously 46% percent of the middle-scoring students are excluded from the calculation of the item-discrimination index.

다음으로, (두 그룹의) 특정 질문에 정확하게 답하는 학생의 수가 계산됩니다. 다음 공식은 d-값을 계산하는 데 사용됩니다.
Next the number of students (in both groups) who answer a particular question correctly is calculated. The following formula is used to calculate a d-value.

여기서 U는 상위 그룹의 정답 수와 같으며, L은 하위 그룹의 정답 수와 같으며, n은 전체 학생 수의 27%입니다. 예를 들어, 한 생리학 강사가 총 112명의 의대생들에게 신경생리학 테스트를 실시했습니다. 강사는 시험 점수의 상위와 하위 27%를 분리했는데, 각 그룹별로 총 28명의 학생이 있었다. 강사는 '강한'(상위) 그룹 18명이 1번 문제를 맞혔고, '약한'(하위) 그룹 10명이 1번 문제를 맞혔다고 관찰한다. 따라서 d-값은 0.28 = [(18–10)/28]과 같습니다. d 값이 높을수록 시험 문제가 더 좋고 변별력이 더 높다.

Where U equals the number of correct answers in the upper group, L equals the number of correct answers by the lower group and n is 27% of the total number of students (Cohen & Swerdlik 2010). For example, a physiology lecturer gave the neurophysiology test to a total of 112 medical students. The lecturer isolated the top and bottom 27% of the test scores, with a total of 28 students in each group. The lecturer observes that 18 students in the ‘strong’ (top) group answered question 1 correctly and 10 students in the ‘weak’ (bottom) group answered correctly question 1. Therefore, the d-value is equal to 0.28 = [(18–10)/28]. The higher the d value, the better and more discriminating the test question.

주어진 문항이 d-값이 높으면 매우 변별력이 있을 가능성이 높다. 그러나 주어진 문항의 d-값이 음수일 경우 '강한' 학생은 오답을, '약한' 학생은 정답을 맞힌다는 것을 의미한다. 그러한 질문들은 수정되거나 폐기되어야 한다.
If a given question has a high d-value, it is likely to be very discriminating. However, a negative d-value on a given question indicates that the ‘strong’ students answered the question incorrectly and the ‘weak’ students answered the question correctly. Such questions should either be revised or discarded.

점 이직렬 상관 계수
The point bi-serial correlation coefficient

항목-차별 지수를 계산하는 데 널리 사용되는 또 다른 방법은 포인트 바이-시리얼 상관 계수이다. 이 통계량은 시험의 특정 문제(정답 또는 오답)와 총 시험 점수(Kapplan 2008) 사이의 관계를 나타내는 통계량입니다. 문제는 '맞음'에 1점, '틀림'에 0점입니다. 시험 문제의 정답 합계는 총 학생의 점수를 산출한다. 각 질문에 대한 항목 식별 지수를 계산하기 위해 다음 공식이 사용됩니다.
Another widely used method for computing the item-discrimination index is the point bi-serial correlation coefficient. This is a statistic that indicates the relationship between a particular question (correct or incorrect) on a test and the total tests score (Kaplan 2008). Questions are scored 1 for ‘correct’ and 0 for ‘wrong’. The sum of correct answers of test questions produces the total student's score. To calculate the item-discrimination index for each question the following formula is used:

여기서 Rpbi는 점 이중 직렬 상관 계수와 같다. 
Where Rpbi equals the point bi-serial correlation coefficient, 

 항목을 올바르게 답한 학생의 평균 점수(1s로 코딩된 학생)와 같다. 
 equals the mean score of students answering the item correctly (those coded as 1s), 

 이 값은 학생이 항목을 잘못 대답한 평균 점수(0s로 코드화된 점수)와 같으며 St는 전체 시험의 표준 편차와 같습니다. P는 항목을 올바르게 답하는 학생의 비율입니다. Rpbi 값이 높을수록 질문이 더 잘 변별합니다. Rpbi 값의 범위는 -1.0 ~ +1.0입니다. 부정적인 Rpbi가 포함된 질문은 수정하거나 폐기해야 합니다.
 equals the mean score of students answering the item incorrectly (those coded as 0s), and St equals the standard deviation for the entire test. P equals the proportion of students answering the item correctly. The higher the Rpbi value, the better the question is at discriminating. The Rpbi values range from −1.0 to +1.0. A question with a negative Rpbi should be revised or discarded.

통계적 유의성
Statistical significance

객관식 문제의 자질을 평가하는 마지막 방법은 'R조'라고 불리는 항목과 'W조'라고 불리는 항목에서 정답이 나온 학생을 두 그룹으로 나누는 것이다. 'R조'와 'W조'의 총점 평균이 계산된다. 그룹의 평균 점수 
The last method for the assessment of the quality of a multiple-choice question is to divide students into two groups, those who answered the item correctly, called ‘group R’, and those who answered the item incorrectly, called ‘group W’. The mean of the total score of ‘group R’ and ‘group W’ is calculated. The mean score of group 

 그룹의 평균 점수보다 낮거나 높을 수 있음 
 could be below or above the mean score of group 

. 따라서 고려해야 할 귀무 가설은 다음과 같다.
. Consequently, the null hypothesis that should be considered is that ‘

 와 같다 
 is equal to 

', '라는 대립 가설에 반하여 저울질했다.
’, weighed against the alternative hypothesis that ‘

 보다 크다 
 is greater than 

'. 귀무 가설은 정답을 선택한 학생들의 평균 점수와 오답 사이에 차이가 없다는 것을 의미한다. 귀무 가설을 검정하기 위해 t-검정을 사용하여 두 그룹의 평균 여부를 평가할 수 있습니다.
’. The null hypothesis means that there is no difference between the mean scores of the students who chose the correct answer and the wrong answer. To test the null hypothesis a t-test can be used that assesses whether the means of two groups (

 그리고. 
 and 

)은 통계적으로 서로 다르다. p-값이 0.05보다 작으면 귀무 가설을 기각하고 대립 가설을 받아들입니다. 이것은 시험 문제가 학생들을 두 개의 강/약 그룹으로 나누었다는 것을 의미한다.
) are statistically different from each other. If the p-value is less than 0.05, we will reject the null hypothesis and accept the alternative hypothesis. This means that the test question has divided students into two separate strong/weak groups.

신뢰성.
Reliability

신뢰도를 계산하는 주요 방법들이 설명되고 설명될 것이다. 점-이진 상관 계수와 크론바흐의 알파를 사용한 예는 테스트의 신뢰성이 어떻게 향상될 수 있는지를 설명하는 데 사용될 것이다. OSCE 검사에서 평가자 간 및 평가자 내 신뢰성의 평가가 설명될 것이다.
The main methods of calculating reliability will be described and explained. Examples of the use of point-biserial correlation co-efficient and Cronbach's Alpha will be used to explain how the reliability of tests can be improved. The evaluation of inter and intra-rater reliability in OSCE examinations will be described.

[신뢰성]을 설명하고 정의하는 전통적인 방법은 [평가의 재현성, 안정성 및 내부 일관성]과 관련이 있다. 심리측정학 문헌에서 신뢰성은 일반적으로 측정 도구의 일관성을 의미한다.

  • 예를 들어, 학생이 같은 시험을 반복적으로 치르고 같은 점수를 받는다면 시험은 안정적이다.
  • 신뢰성은 다른 경우에 적용될 때 유사한 결과를 생성하는 테스트의 능력을 측정하는 척도입니다.
    • 같은 시험에서 다른 경우에 얻은 점수 차이가 클 때, 시험은 신뢰할 수 없고 치명적인 결함이 있다. 예를 들어, 동일한 성취도 테스트가 한 학생에 대해 서로 다른 시점에 62, 85, 53 및 92와 같은 점수를 낸다면, 이 테스트는 일관성이 없기 때문에 조사가 필요합니다.
  • 검정의 내부 일관성은 동일한 기본 구조를 측정하기 위해 개별 항목이 함께 얼마나 잘 기능하는지와 관심 구조를 얼마나 정확하고 정확하게 측정할 수 있는지를 측정하는 척도이다.

The traditional way of explaining and defining reliability is that it is concerned with the reproducibility, stability and internal consistency of an assessment. In the psychometric literature, reliability more generally refers to the consistency of a measurement tool (Cohen & Swerdlik 2010).

  • For example a test is stable if a student repeatedly takes the same test and obtains the same mark.
  • Reliability is a measure of a test's ability to generate similar results when applied on different occasions. When the difference of scores obtained by the same test on different occasions is high, the test cannot be reliable and is fatally flawed.
    • For example, if the same achievement test delivers scores for a student of 62, 85, 53 and 92 in different points in time, then this test is not consistent and needs to be investigated.
  • The internal consistency of a test is a measure of how well the individual items are functioning together to measure the same underlying constructs and how accurately and precisely can it measure the construct of interest.

[신뢰도]에 대한 또 다른 사고방식은 학생의 [관찰된 시험 점수]와 ['참' 점수]의 차이의 함수라는 것이다. 관찰된 점수는 학생이 실제 시험에서 얻은 점수입니다. 진정한 점수는 학생이 자신의 기본 능력을 정확하게 측정할 때 (가정적인) 시험에서 얻는 점수이다. [관측된 시험 점수]와 [실제 점수] 사이에 유의한 차이가 있으면 시험의 신뢰성이 낮으며, 그 반대도 마찬가지이다.

Another way of thinking about test reliability is that it is a function of the difference between the observed test score of the student and his/her ‘true’ score. The observed score is the score that a student obtains from an actual test. The true score is the score that a student obtains from a (hypothetical) test when it accurately measures his or her underlying ability. If there is a significant difference between an observed test score and a true score, the reliability of the test is low, and vice versa.

그러나 신뢰성에 대한 보다 일반적인 견해는 [심리측정학적 측정에 내재된 오류]와 관련이 있다는 것이다. 평가 언어에서 측정 오류를 일으키는 요인은 크게 두 가지, 외부 및 내부 요인입니다.

  • [외적 요인]은 시험 상황과 시험 상황에 따라 달라지는데, 예를 들면 실내 온도, 추측 정답, 정서적 문제, 신체적 불편함, 수면 부족 등이다.
  • [내부 요인]은 항목 샘플링(시험 항목 수 제한) 및 항목 구성 방식 등 시험의 품질과 양에 따라 달라집니다. 채점자와 채점 시스템도 잠재적인 오류의 원인이 될 수 있다.

However, a more general view of reliability is that it is concerned with the error inherent in psychometric measurements. In the language of assessment, there are two main factors that cause errors in measurements, external and internal factors (Anastasi & Urbin 1997).

  • The external factors depend on the test situations and administrations, such as the room temperature, guessing answers, emotional problems, physical discomfort and lack of sleep.
  • The internal factors depend on the quality and quantity of the test, such as item sampling (the limited number of test items) and the way in which the item is constructed. Scorers and scoring systems can also be a potential source of error.

고전적인 시험 이론은 개인이 특정한 양의 지식, 예를 들어 '진정한 점수'에 대한 기호 T를 가지고 있다고 제안한다. 그러나 이 점수의 측정값 또는 '관찰된 점수'인 X측정 오류 E로 인해 교란됩니다. 따라서,
Classical test theory proposes that an individual possesses a particular amount of, for example, knowledge, given the symbol T for ‘true score’. However the measurement of this score, X, or the ‘observed score’ is confounded by the errors of measurement, E. Thus,

고품질 평가 설계자가 직면한 과제는 이러한 오류의 원인을 식별하고 최소화하는 것이어야 한다. 크기나 온도에 대한 물리적 측정은 상대적으로 제한적이고 쉽게 통제되는 측정 오류를 가질 수 있는 반면, 인지적, 정신운동적 또는 인간에 대한 정서적 측정은 통제 불가능한 큰 오류를 가질 수 있다. 신뢰성에 영향을 미치는 세 가지 오류 원인은 [테스트, 수험생(학생) 및 테스터]에서 비롯됩니다. 많은 경우 평가를 수행하기 전에 오류를 식별하고 제어할 수 있지만 모든 가능한 오류를 추정하는 것은 현실적으로 불가능하다. 결과적으로, 시험의 진정한 신뢰성 계수true reliability coefficient 를 결정하는 것은 실용적이지 않다. 따라서, 의학 교사는 아래에 설명될 신뢰성 추정 기법을 사용하여 시험을 실시한 후 획득한 데이터로부터 시험의 신뢰성을 추정해야 한다.
The task facing the designer of high quality assessments should be to identify and minimise these sources of error. Physical measurements of size or temperature may have relatively limited and easily controlled errors of measurement whereas cognitive, psychomotor or affective measurements on human beings may have large, uncontrollable and even unknown errors. The three sources of error influencing reliability derive from: the test, the testee (student) and the tester. In many cases errors can be identified and controlled before an assessment is undertaken but it is practically impossible to estimate every possible error. As a result, the determination of the true reliability coefficient of a test is not practicable. Therefore, medical teachers have to estimate the reliability of a test from the data acquired after the test has been administered using the techniques for estimating reliability to be described below.

테스트
The test

테스트는 서면 지식 기반 MCQ, OSCE 스테이션 또는 다른 형태의 심리 측정 평가일 수 있다. [생산 및 해석 과정]과 [테스트 환경]에 영향을 미치는 프로세스에서 오류가 발생합니다.
The Test can be a written knowledge-based MCQ, an OSCE station or some other form of psychometric assessment. Errors are created in its production and interpretation and by processes impacting on the testing environment:

  • 애매한 질문
  • 너무 길다(피로)/너무 짧다
  • 잘못된 질문
  • 비균질 질문지
  • 너무 어렵다/너무 쉽다
  • 서투른 지시
  • 너무 덥다/너무 춥다/너무 시끄럽다
  • 시간이 충분하지 않아요.
  • 조명 수준
  • 잘못된 코드화된 응답
  • Ambiguous questions
  • Too long (fatigue)/Too short
  • Invalid questions
  • Non-homogeneous question paper
  • Too hard/too easy
  • Poor instructions
  • Too hot/too cold/too noisy
  • Not enough time
  • The level of lighting
  • Responses which are coded incorrectly

테스터
The tester

검사자는 MCQ와 같은 필기 시험을 작성할 책임이 있는 사람 또는 OSCE 또는 기타 실제 평가의 경우 평가 기준을 사용하고 해석할 책임이 있는 사람일 수 있다. 오류는 평가 원칙 또는 항목 구성에 대한 이해 부족 또는 평가 기준 적용에 대한 교육 부족으로 인해 발생할 수 있습니다.
The tester can be the person responsible for creating a written test such as an MCQ or, in the case of an OSCE, or other practical assessment, the person who is responsible for using and interpreting the assessment criteria. Errors can be created from a lack of understanding of assessment principles or item construction or by a lack of training in applying assessment criteria:

  • 학습 목표에 대한 이해 부족
  • 평가 기준에 대한 잘못된 해석
  • 평가 기준의 일관성 없는 적용
  • 점수 체계 또는 점수 체계 불일치
  • 성차별적/인종차별적 편견
  • 체계적인 타이핑 오류
  • 평가 교육 부족
  • 평가자간 변동성
  • 채점 주관성
  • Lack of understanding of learning objectives
  • Poor interpretation of assessment criteria
  • Inconsistent application of assessment criteria
  • Inconsistent scoring system or mark scheme
  • Sexist/racist bias
  • Systematic typing errors
  • Lack of assessment training
  • Inter-rater variability
  • Subjectivity in scoring

수험생
The testee

수험자는 시험 대상자이다. 개인의 본질적인 능력 때문이 아닌 오류와 변화는 스트레스나 질병에 대한 반응이나 적절한 교육 또는 학습 준비 부족으로 인해 발생할 수 있다.

The testee is the person being tested. Error and variation not due to the intrinsic capacity of the individual can be caused by their reaction to stress or illness or by a lack of appropriate teaching or learning preparation:

  • 스트레스
  • 치료 및 질병
  • 수업부족
  • 일관성 없는 교육
  • 열악한 학습 환경
  • 적절한 자원 부족
  • 연습 기회 부족
  • 수면부족
  • Stress
  • Therapy and illness
  • Lack of teaching
  • Inconsistent teaching
  • Poor learning environment
  • Lack of appropriate resources
  • Lack of practice opportunities
  • Lack of sleep

신뢰성 추정치
Reliabilities estimates

테스트-재테스트 신뢰성 추정치
Test–retest reliability estimates

테스트-재테스트 신뢰성은 동일한 학생과 다른 시간에 동일한 테스트를 수행함으로써 추정됩니다. 두 시험에서 학생들의 점수 사이의 상관계수(ra)는 시험-재시험 신뢰성의 정량적 척도로 사용된다.
The test-retest reliability is estimated by performing the same test at different times with the same students. The correlation coefficient (ra) between students’ scores in the two tests is used as a quantitative measure of the testretest reliability.

시험-재시험 신뢰성의 한계는 시간의 경과가 두 번째 시험에서 학생의 반응에 영향을 미칠 수 있다는 것이다. 왜냐하면 학생들은 새로운 것을 배우고, 어떤 것을 잊거나, 새로운 기술을 습득할 수 있기 때문이다.
A limitation of the testretest reliability is that the passage of time can influence the student's response in the second test. This is because students may learn new things, forget some things or acquire new skills.

병렬 형식 신뢰성 추정치
Parallel-forms reliability estimates

[병렬 형식]의 시험을 사용하면 시험-재시험 신뢰성에 관련된 어려움을 피할 수 있다. 신뢰도를 추정하기 위해 검정의 두 표본이 두 가지 다른 경우에 검정됩니다. 첫 번째 경우, 학생들은 한 가지 형태의 시험으로 시험을 치른다. 두 번째 경우, 같은 학생들이 평행한 형태의 시험으로 시험을 치른다. 병렬 시험 양식은 평균 항목 난이도가 같아야 한다. 또한, 평행한 형태로 관찰된 시험 점수의 평균과 표준 편차는 동일해야 한다. 병렬 형식 신뢰도를 추정하는 것은 테스트-재테스트 신뢰도를 추정하는 것과 유사합니다. 두 시험 병렬 양식에서 학생들의 점수는 병렬 양식 신뢰도의 추정치를 얻기 위해 상관관계가 있다.

The use of parallel forms of the test helps avoid the difficulties involved in testretest reliability. To estimate the reliability, two different samples of a test are tested on two different occasions. In the first occasion, students are tested with one form of the test. On the second occasion, the same students are tested with a parallel form of the test. Parallel test forms should have the same average item difficulty. In addition, the mean and the standard deviations of observed test scores in parallel forms should be equal. Estimating parallel forms reliability is similar to estimating testretest reliability. Students’ scores on the two test parallel forms are correlated to obtain an estimate of parallel-forms reliability.

병렬 형식 신뢰도 추정치의 한 가지 분명한 한계는 시험 점수가 피로, 동기부여 및 학습과 같은 요인에 의해 영향을 받을 수 있다는 것이다.

One obvious limitation of estimates of parallel-forms reliability is that test scores may be affected by factors such as fatigue, motivation and learning.

양분 신뢰도 추정치
Split-half reliability estimates

전체 테스트의 신뢰성을 추정하기 위해, 단일 테스트를 수행한 후 항목을 반으로 분할할 수 있습니다. 홀수 번호는 시험의 절반에 해당하고 짝수 번호는 나머지 절반에 해당된다. 스피어맨-브라운 상관 관계를 사용하여 신뢰성 계수에 대한 검정 단축 효과를 추정할 수도 있습니다. 테스트의 크기를 적절하게 줄이면 관리 시간과 학생들의 시험 피로를 최소화할 수 있습니다(Cohen & Swerdlik 2010). 
To estimate the reliability of a whole test, a single test can be administrated followed by a splitting of the items into halves; odd-numbered items to one half of the test and even-numbered to the other half. A SpearmanBrown correlation can also be used to estimate the effect of shortening the test on the reliability coefficient. Reducing the size of a test appropriately can minimise administration time and students’ exam fatigue (Cohen & Swerdlik 2010).

알파 계수
Coefficient alpha

알파 값은 시험의 내부 일관성 신뢰성 또는 항목 동질성을 추정하는 데 널리 사용된다(Henson 2001; Streiner 2003). 앞에서 설명한 신뢰도 지수와는 달리 테스트는 한 번만 수행되며 알파 통계량을 계산하는 데 사용되는 점수입니다. 알파는 시험 항목 집합의 상호 연관성에 대한 추정치로 간주할 수 있다(Schmitt 1996). 알파 값은 또한 검사 항목이 얼마나 유사하거나 고유한지를 나타냅니다(Cortina 1993). 알파 계수는 이분법 또는 다분법 항목을 사용한 검정에서 사용할 수 있습니다. 값은 0에서 1까지이며 0.70보다 커야 하지만 0.90보다 크면 안 됩니다. 획득한 점수는 모든 시험 항목의 반영이기 때문에, 시험관들은 시험에서 높은 알파 값을 찾는다. 그러나 알파 값이 높은 것이 보통 더 좋지만 항상 그런 것은 아닙니다. 단일 도메인을 측정하는 검정에는 항목 간의 이질성이 어느 정도 포함될 수 있습니다. 테스트가 단일 도메인을 사용하지만, 하위 도메인이 3개 또는 4개인 경우, 각 하위 도메인의 동질성은 테스트 전체보다 더 클 수 있습니다. 이 경우 알파 값이 0.90을 초과하면 안 됩니다. 이 상황에서 알파의 큰 값은 '항목 간 콘텐츠의 불필요한 중복'을 나타내며 동질성보다는 중복성에 더 중점을 둔다(Streiner 2003).
The value of alpha is widely used for estimating the internal consistency reliability or item homogeneity of a test (Henson 2001; Streiner 2003). In contrast to previously described reliability indices the test is only administered once and the scores used to calculate the alpha statistic. Alpha can be considered as an estimate of the interrelatedness of a set of test's items (Schmitt 1996). The value of alpha also indicates how similar or unique test items are (Cortina 1993). The alpha coefficient can be used on either tests with dichotomous or polytomous items. It ranges in value from 0 to 1 and should be above 0.70, but not much than 0.90 (Nunnally & Bernstein 1993; Streiner 2003). As the obtained score is a reflection of all the test's items, examiners seek for a high value of alpha on a test. However, although a high value for alpha is usually better, it is not always the case. Tests that measure a single domain can contain some degree of heterogeneity among the items. If a test taps a single domain but has three or four sub-domains, the homogeneity of each sub-domain can more than the test as a whole. If this is the case, the value of alpha should not be over 0.90. In this situation a large value of alpha is an indication of ‘unnecessary duplication of content across items and points more to redundancy than to homogeneity’ (Streiner 2003).

Kuder-Richardson 신뢰성
Kuder–Richardson reliability

이전에 지적했듯이, 더 높은 테스트 동질성은 테스트 내에서 더 높은 내부 일관성을 생성합니다. 성취도 시험에서 내부 일관성 신뢰성을 추정하기 위한 가장 일반적인 통계적 절차는 쿠더-리처드슨 20(KR-20)이다. 알파 계수와 달리 KR-20은 객관적인 테스트와 같은 정답 혹은 오답으로 채점되는 [이분법 문항]의 내부 일관성을 결정하는 데 사용된다. KR-20의 값은 시험 항목 간 관계의 강도에 정비례한다. 이 값은 0에서 1 사이의 범위이며, 0은 신뢰성의 부족을 나타내고 1은 신뢰성이 높은 검정을 나타냅니다. 
As previously pointed out higher test homogeneity generates a higher internal consistency within a test. The most common statistical procedure for estimating the internal consistency reliability in achievement tests is KuderRichardson 20 (KR-20). In contrast to coefficient alpha, KR-20 is used to determine the internal consistency of dichotomous items such as objective tests which can be scored as either right or wrong. The value of KR-20 is directly proportional to the strength of the relationship between the items on the test. It ranges between 0 to 1 where 0 represents a lack of reliability and 1 represents a fully reliable test.


항목 동질성이 시험 신뢰성에 미치는 영향을 요약하면, 내부 일관성 신뢰성에 대한 두 가지 다른 지수를 사용할 수 있다. 
알파 계수 및 KR-20. 신뢰도 값이 낮을수록 시험의 모든 항목이 다양한 지식이나 성능을 측정한다는 점에 유의해야 한다. 또한 신뢰도 지수는 시험과 학생들의 이질성에 영향을 받는다. 장기간의 시험과 이질적인 학생들은 더 높은 내부 일관성 신뢰성을 갖게 될 것이다(Anastasi & Urbin 1997).

In summary to estimate the impact of item homogeneity on test reliability, two different indices of internal consistency reliability are available: coefficient alpha and KR-20. It should be noted that a lower reliability value indicates that all the items on the test measure a diversity of knowledge or performance. Furthermore, the reliability index is affected by the test and students’ heterogeneity. Longer tests and heterogeneous students will have a higher internal consistency reliability (Anastasi & Urbin 1997).

OSCE의 심리학적 특성
Psychometric properties of OSCE

OSCE 스테이션의 심리측정학적 분석은 지식 기반 시험에 비해 의학 교육 문헌에 덜 보고되었다. 시험 목적에 따라 시험장 수가 달라질 수 있으며 각 시험장마다 응시자의 특정 능력을 평가할 수 있다. 특정 행동을 정량화하기 위해, 특정 행동에 해당하는 체크리스트 항목은 컨센서스를 통해 콘텐츠 전문가가 객관적으로 고안한다. 시험관은 특정한 행동이 이분법적으로 또는 척도로 능숙하게 수행되었는지 여부를 확인하여 각 스테이션의 학생을 채점한다. 각 스테이션의 마지막에, 시험관들은 그들의 점수와 학생들의 성적에 대한 피드백을 기록합니다. 스테이션에 있는 item의 개수는 다를 수 있습니다. 예를 들어, 점검표에 21개의 항목이 있는 스테이션 1에서 학생은 15개의 임상 조치를 유능하게 수행할 수 있다. 따라서, 그 또는 그녀는 역 1에서 21점 만점에 15점의 총점을 받는다. OSCE가 25개의 스테이션로 구성되어 있고 학생 성취도를 측정하기 위해 등급 척도를 사용하는 경우 25개의 등급이 계산되고 각 학생에 대한 평균이 계산된다. OSCE 이전에, 각 스테이션에 대한 전체 통과 마크는 표준 설정에 의해 결정된다. 다른 평가 절차에는 점수와는 무관하게 주어진 합격, 불합격 또는 경계선에 대한 심사관의 글로벌 판단이 포함될 수 있다.
The psychometric analysis of OSCE stations has been less reported in the medical education literature in comparison to knowledge based tests. Depending on the purpose of the examination, the number of stations can vary and each station can assess a specific ability of the candidate. To quantify a specific behaviour, checklist items, which correspond to specific actions, are objectively devised by content experts through consensus. The examiner marks the student in each station by checking whether or not a given action was performed competently either dichotomously or on a scale. At the end of each station, examiners record their scores and feedback on the performance of students. The number of items in each station can vary. As an example, in station 1 with 21 items on the checklist, a student might competently perform 15 clinical actions. Therefore, he or she receives a total score of 15 out of 21 from station 1. If the OSCE consists of 25 stations and uses a rating scale for measuring student performance 25 ratings are calculated and then the mean for each student. Before the OSCE, the overall pass mark for each station is decided by standard setting. Other assessment procedures might include a global judgement by the examiners of pass, fail or borderline given independently of any scoring.

OSCE의 스테이션 분석
Station analysis of OSCEs

OSCE에서 각 스테이션은 분석 항목으로 간주된다. 첫 번째 공통 분석은 OSCE의 [모든 스테이션 간의 상관 관계]를 나타내는 OSCE의 [스테이션 간 신뢰도]를 결정하는 것이다. 스테이션 간 신뢰도 지수를 계산하는 것은 동질성을 평가하는 데 유용하다. OSCE는 단일 특성을 측정하는 관측소를 포함하는 경우 동질적이다.
In the OSCE, each station is regarded as an item of analysis. The first common analysis is to determine the inter-station reliability of the OSCE which refers to the degree of correlation between all the stations on the OSCE. Calculating the index of inter-station reliability is useful in assessing homogeneity. OSCEs are homogeneous if they contain stations that measure a single trait.

쿠더-리처드슨 20 공식(KR-20)은 의학 교사들이 스테이션 간 신뢰성을 추정할 수 있도록 한다. KR-20 공식은 다음과 같다.

The Kuder-Richardson 20 formula (KR-20) allows medical teachers to estimate inter-station reliability. The KR-20 formula is



여기서 rKR20은 전체 OSCE의 신뢰성 계수를 제공하며, K는 OSCE의 스테이션 수, λ2는 총 스테이션 점수의 분산, p는 스테이션을 통과한 학생의 비율, q는 스테이션을 통과하지 못한 학생의 비율(q = 1 - p), Zpq는 모든 스테이션의 pq 곱의 합계이다. K-R20은 SPSS를 사용하여 계산됩니다. 신뢰도 계수가 높을수록 OSCE는 균일하다.

Where rKR20 provides a reliability coefficient of the whole OSCE, K is the number of stations in the OSCE, σ2 is the variance of total station scores, p is the proportion of students who pass the station, q is the proportion of students who fail the station (q = 1 − p), and Zpq is the sum of the pq products over all stations. K-R20 is calculated using SPSS. The higher the reliability coefficient, the more homogenous the OSCE.

신뢰도 계수가 낮다는 것은 OSCE 검사에 기여하는 임상역량 평가에서 많은 스테이션의 성능이 좋지 않다는 것을 보여준다.
A low reliability coefficient shows that a number of stations are performing poorly in assessing the clinical competencies contributing to the OSCE examination.

신뢰성 계수가 낮으면 일부 관측소가 공통 핵심 임상 성과를 동등하게 공유하지 않으므로 수정하거나 폐기해야 한다. 따라서 각 스테이션과 총 OSCE 점수의 상관관계를 계산하여 검출하는 것이 중요하다. 여기에는 앞서 설명한 바와 같이 점-이중 선형 상관 방법을 사용하는 것이 포함됩니다. 항목(스테이션) 총상관성 검사를 통해 의료교사는 어떤 스테이션을 수정하거나 폐기해야 하는지 파악할 수 있다.
If the reliability coefficient is low it suggests that some stations do not share equally in the common core clinical performance and need to be revised or discarded. Therefore it is important to detect them by computing the correlation of each station with the total OSCE score. This involves using the point-biserial correlation method as previously described. The item (station) total correlation test allows medical teachers to identify which station needs to be revised or discarded.

OSCE 시험의 동질성을 증가시킬 수 있는 또 다른 분석은 평균 측점 점수와 평균 총 OSCE 점수 사이의 상관관계를 찾는 데 사용할 수 있는 피어슨 상관관계를 사용하는 것이다. 각 스테이션이 OSCE 동질성에 기여하고 있으므로 전체적으로 OSCE 시험과 상관관계가 없는 스테이션은 수정하거나 폐기할 수 있다. 시험이나 OSCE 시험의 동질성과 이질성은 다음 절에서 추가로 논의되는 중요한 문제이다.
Another analysis that can increase the homogeneity of an OSCE exam is the use of Pearson's correlation which can be used to find a correlation between mean station scores and the mean total OSCE score. As each station is contributing to OSCE homogeneity, those stations that do not correlate with the OSCE exam as a whole can be revised or discarded. The homogeneity and heterogeneity of a test or an OSCE exam is an important issue that is further discussed in the next section.

품목의 동질성과 이질성
Homogeneity and heterogeneity of the items

시험의 문항들이 단일 특징을 측정하는 경우 시험을 균질하다고 합니다. 즉, 동질성은 테스트가 단일 영역을 두드리는 정도이며 다른 능력을 측정하는 항목은 포함하지 않습니다. 예를 들어, 심혈관 생리학 시험은 모든 의학 생리학이 아니라 심혈관 시스템에 대한 지식을 평가해야 한다. 테스트의 항목은 항목 풀의 랜덤 샘플에서 가져와 단일 도메인을 측정해야 합니다. 이 항목들은 또한 서로 조금 다른 정도로 서로 상관되어야 한다(Streiner 2003).
If the items of a test measure a single feature, the test is termed homogenous. In other words, homogeneity is the extent to which a test taps a single domain and does not include items that measure other abilities. For example, a test of cardiovascular physiology should assess knowledge of the cardiovascular system, not all medical physiology. It should be noted that items on a test should come from a random sample of the item pool and measure a single domain. These items should also correlate with each other to varying degrees (Streiner 2003).

테스트 동질성과는 대조적으로, 이질적 테스트의 항목은 서로 다른 도메인이나 속성을 사용합니다. 위의 예에서 심혈관 시스템의 항목은 한 영역을 두드리는 반면 의학 생리학 항목은 심혈관 시스템을 측정할 뿐만 아니라 신장, 폐, 위장 시스템 등을 측정한다.

  • [동질적 객관식 시험]에서 같은 점수를 받은 사람들은 시험한 영역에 대해 비슷한 지식을 가지고 있다.
  • [이질적 객관식 시험]에서 같은 점수를 받은 사람은 시험 영역에 대한 지식이 다를 수 있다.

In contrast to test homogeneity, the items of a heterogeneous test tap different domains or attributes. In the above example the items on the cardiovascular system tap one area while the items on medical physiology not only measure the cardiovascular system but also measure renal, lung, gastrointestinal systems and so forth.

  • Those who receive the same score on a multiple-choice homogenous test have a similar knowledge in the area tested.
  • On the other hand, those who receive the same score on a multiple-choice heterogeneous test may have different knowledge in the areas tested (Cohen & Swerdlik 2010).

이것은 이질적인 시험에서 나온 시험 점수가 동질적인 시험보다 더 모호하다는 것을 보여준다. 이질적인 의학 생리학 테스트에서 존과 사라가 모두 30점을 받는다고 상상해 보세요. 시험에서 두 사람의 지식이나 성적이 동등했다고 단정할 수는 없다. 30점은 다양한 조합을 통해 얻을 수 있다. 존은 10개의 심혈관 생리학 항목, 10개의 감각 생리학 항목, 10개의 호흡기 생리학 항목, 그리고 신경 생리학이나 위장학 항목에는 정답이 없을 수 있다. 반면 사라는 감각생리학 항목 5개, 호흡생리학 항목 10개, 신경생리학 항목 15개를 맞혔을 수 있으며 심혈관 생리학에 대해서는 정답이 없다. 보다 구체적인 평가 데이터가 필요한 경우 각 테스트가 단일 영역을 측정하는 여러 동종 테스트를 개발하는 것이 좋습니다.
This simply illustrates that test scores that come from a heterogeneous test are more ambiguous than a homogenous test. Imagine that in a heterogeneous medical physiology test, John and Sarah both receive a score of 30. One cannot conclude that knowledge or performance of both on the test was equal. The score of 30 can be obtained through a variety of combinations. John may have correctly answered 10 cardiovascular physiology items, 10 sensory physiology items, 10 respiratory physiology items and none on neurophysiology or gastroenterology. Sarah by contrast, may have correctly answered 5 sensory physiology items, 10 respiratory physiology items and 15 neurophysiology items and none on cardiovascular physiology. If more specific assessment data is required it is better to develop several homogenous tests in which each test measures a single domain.

[시험의 동질성]은 시험의 모든 문제가 [동일한 구성 요소] 또는 특성을 측정하도록 보장하므로 [구성 타당성]의 지표이기도 하다. 시험 설계자가 측정하려는 특정 특성을 정확하게 반영하는 시험 정도를 평가하기 위해 시험 설계자는 시험 전에 시험 또는 OSCE 시험의 타당성을 결정해야 한다. 
The homogeneity of a test is also an indicator of construct validity as it ensures that all the questions on the test measure the same construct or trait. It should be noted that test designers should determine the validity of a test or an OSCE exam before an examination in order to assess the degree to which the test accurately reflects the specific trait that the test designer is attempting to measure.

표준 측정 오차(SEM)
The standard Error of measurement (SEM)

검사 후 분석과 관련된 마지막 유용한 개념은 표준 측정 오차(SEM)이다. SEM은 개인의 시험 점수에 내재된 오류의 양에 대한 추정치를 제공한다. 이 추정은 평가자가 개인의 시험에서 관찰된 점수와 실제 점수 사이의 불일치를 결정하는 데 도움이 된다. 시험 신뢰성 추정치와 SEM 사이에는 연관성이 있다. 시험 [신뢰도 추정치]가 클수록 SEM은 낮아집니다. 시험의 신뢰성과 표준 편차의 추정치가 결정되면 SEM은 다음과 같이 계산된다.

One final useful concept concerned with post-exam analysis is the standard error of measurement (SEM). The SEM provides an estimate of the amount of error inherent in an individual's test score (Cohen & Swerdlik 2010). This estimation helps assessors to determine the discrepancies between an individual's observed score on the test and his/her true score. There is a link between the test reliability estimate and the SEM. The larger the test reliability estimate, the lower the SEM. If the estimate of the reliability of a test and its standard deviation are determined, the SEM is calculated by the following below:

 

SEM이 측정의 표준 오차인 경우, SD는 학생 그룹에 의한 시험 점수의 표준 편차와 같으며 r은 시험의 신뢰도 계수와 같다. 어떤 의대생이 시험에서 50점(100점 만점)을 획득했다고 가정합니다. 테스트의 [표준 편차]와 [신뢰도 계수(예: 분할-반신뢰도)]가 각각 10과 0.74인 경우 SEM은 5입니다. 

Where SEM is equal to the standard error of measurement, SD is equal to the standard deviation of test scores by a group of students and r is equal to the reliability coefficient of the test. Assuming a medical student achieved a score of 50 (out of 100) on a test. If the test had a standard deviation and a reliability coefficient (e.g. split—half reliability) of 10 and 0.74, respectively, then the SEM is 5 (SEM = 10 

 = 5). = 5).

SEM 값을 해석하기 전에 정규 분포에서 값의 약 68%가 평균의 ±1 표준 편차 내에 있고, 값의 95%가 평균의 ±2 표준 편차 내에 있으며, 값의 99.75%가 평균의 ±3 표준 편차 내에 있다는 것을 아는 것이 도움이 됩니다. 심혈관 검사 점수의 분포가 정상이라고 가정할 때, 우리는 이제 아래와 같이 학생의 실제 점수를 추정할 수 있습니다.
Before interpreting the value of the SEM it is helpful to know that in a normal distribution roughly 68% of the values lie within ±1 standard deviation of the mean, 95% of the values lie within ±2 standard deviation of the mean and 99.75% of the values lie within ±3 standard deviation of the mean. Assuming the distribution of cardiovascular test scores is normal we can now estimate the true score for the student as shown below.

우리는 이 학생의

  • 실제 점수가 50±1SEM(또는 45와 55) 내에 있다고 68% 확신할 수 있고,
  • 실제 점수가 50±2SEM(또는 40과 60) 내에 있다고 95% 신뢰할 수 있으며,
  • 실제 점수가 50±3SEM(또는 35와 65) 내에 있다고 99% 확신할 수 있다.

We can be 68% confident that his true score lies within 50±1SEM (or between 45 and 55), 95% confident that the true score lies within 50±2SEM (or 40 and 60) and 99% confident that the true score lies within 50±3SEM (or 35 and 65).

SEM은 또한 학생들의 시험 성적에 대한 의사 결정에도 도움을 준다. 위의 테스트에서 표준 설정자가 불합격에 대해 컷 점수를 50으로 설정하고 평가자가 자신의 결정에 68% 확신을 가지기를 원한다면 SEM은 학생의 실제 점수를 45에서 55 사이로 표시합니다. 이는 학생이 시험을 다시 치르게 되면 점수가 컷 점수(45~55점)보다 작거나 그 이상일 수 있다는 것을 의미한다. 이것은 그 학생이 시험을 통과해야 하는지 여부를 결정할 때 다른 학생들의 활동을 고려할 필요가 있음을 나타낸다.
The SEM also aids in decision making about a students’ performance on the test. If standard setters, in the above test, set a cut score for failing of 50 and if assessors want to be 68% confident of their decision, the SEM indicates that the student's true score, lies between 45 and 55. This means that if the student was to take the test again, his/her score might be less or more than the cut score (between 45 and 55). This indicates that other student activities need to be taken into account when deciding whether or not the student should pass the test.

정성항목분석
Qualitative item analysis

마지막으로 객관적인 시험 항목의 품질을 보장하는 비통계적이고 질적인 방법이 있다는 것을 알아야 한다. 시험 제작자들은 학생들이 시험에 대한 그들의 경험을 이해하는 방법에 대해 오랜 관심을 가지고 있다. 질적 방법들은 학생들이 시험 후에 그들의 경험에 붙이는 의미와 그들이 그 시험에 대해 어떻게 이해하는지 탐구하기 위해 사용될 수 있다. 연구자들은 특정 시험을 치른 학생들의 자연스러운 환경에 몰입할 수 있다. 테스트 생성자와 학생 간의 상호 작용을 탐구하는 것은 조사 중인 항목에 대한 깊은 이해의 기회를 제공합니다.
Finally it is worthwhile being aware that there are non-statistical, qualitative methods, of ensuring the quality of objective test items. Test constructors have had a long-standing interest in the way students make sense of their experiences on tests (Mosier 1947; Fiske 1967). Qualitative methods can be employed to explore the meanings students attach to their experience following a test and how they make sense of that test. Researchers can immerse themselves in the natural setting of students who have taken a particular test. Exploring the interaction between the test constructor and the student provides the opportunity for a deep understanding of the items under investigation.

정성적 방법은 심리측정학적 통계적 추론보다는 학생들의 목소리에 기반을 둔 데이터를 생성하고 분석하는 기술을 활용한다. 다시 말해, 분석 단위는 학생들의 수치 점수보다는 단어이다.
Qualitative methods utilise techniques for generating and analysing data which is grounded in the voice of students rather than psychometric-statistical inferences. In other words, the units of analysis are the words of students rather than their numerical scores.


'학생의 목소리'는 그룹 인터뷰, 대면 인터뷰 또는 관찰과 같은 다양한 언어 출처에서 얻을 수 있다. 면접의 목적은 학생들의 시험 경험에 대한 주관적인 이해를 탐구하는 것이다. 정성 테스트 생성자는 개별 테스트 항목이 어떻게 작동하는지 파악하려고 합니다. 시험 개발자는 일반적으로 질적 분석을 통해 탐색의 잠재적 영역을 파악하기 위해 개방형 및 폐쇄형 질문을 포함하는 인터뷰 일정을 구성한다. 인터뷰 일정에 포함될 수 있는 잠재적 영역은 다음과 같습니다. 문화적 인식, 시험 타당성, 시험 관리, 시험 환경, 시험 공정성, 시험 언어, 항목 추측, 학생 준비, 시험 중 학생들의 편안함, 시험 기간, 시험 시간 및 학생의 전반적인 인상.
‘The student voice’ can be gleaned from different verbal sources such as group interviews, face to face interviews or observations. The purpose of the interview is to explore students’ subjective understanding of their test-taking experience. Qualitative test constructors seek to uncover how individual test items work. Test developers usually construct an interview schedule containing open and closed questions to uncover potential areas of exploration by means of qualitative analysis. The potential areas that may be contained in the interview schedule are: cultural awareness, test validity, test administration, test environment, test fairness, test language, item guessing, student preparation, student's comfort during the test, test length, test time and overall impression of the student (Cohen & Swerdlik 2010).

'Think aloud' 시험관리는 시험 운영 중 각 항목이나 기술에 대한 학생들의 반응을 파악하기 위한 관찰 질적 연구 도구이다. 이 접근법에서, 학생들은 시험에 참여하도록 요청 받고, 그들이 각 항목이나 기술에 반응할 때 그들이 느끼고 생각하는 것을 표현하도록 한다. 시험관들은 시험 중에 학생들의 발언을 객관적으로 기록하거나 중단 없이 녹음한다. 자료의 전사 및 분석은 질적 연구 방법을 사용하여 수행된다. 학생들의 이러한 언어화는 학생들이 어떤 항목을 어떻게 해석하는지, 그리고 그들이 어떤 항목을 잘못 해석하는 이유와 방법을 더 잘 이해하는 데 도움이 될 수 있다(Cohen & Swerdlik 2010).
‘Think aloud’ test administration is an observation qualitative research instrument to uncover student's responses to each item or skill during the administration of a test. In this approach, students are asked to take part in a test and then express whatever they are feeling and thinking when they are responding to each item or skill. Examiners make objective notes of students’ utterances or audio-record them, without interruption, during the test. Transcriptions and analysis of the materials is carried out using qualitative research methods. Such verbalisations by students may help examiners to better understand how students interpret an item, as well as why and how they are misinterpreting an item (Cohen & Swerdlik 2010).

그러나 학생들의 점수가 면접 중 질문에 대한 그들의 반응에 영향을 미칠 수 있다는 점에 유의해야 한다. 좋은 점수를 받은 사람들은 긍정적으로 반응할 수 있고, 나쁜 점수를 받은 사람들은 시험 개발자들을 비난할 수 있다. 질적 데이터의 해석은 모든 학생들의 경험을 고려해야 한다. 이러한 해석에 기초하여 심사관이나 시험 개발자는 항목을 수정, 재작성 또는 폐기할 수 있다.
It should be noted, however, that students’ scores may influence their responses to the questions during interview. Those who have received good scores may respond positively and those who have received poor scores may criticise test developers. The interpretation of qualitative data should take all student experiences into consideration. Based on these interpretations, examiners or test developers can revise, reword or discard an item.

요약
Summary

본 가이드에서는 의학교육에서 측정 및 평가의 중심적 중요성과 시험문제의 추론기반을 설명하였다. 의학 교육자들은 학습에 대한 학생들의 참여를 촉진하는 데 세 가지 주요 역할을 한다.

  • 첫째, 그들은 의대생들이 무엇을 해야 하는지 또는 무엇을 알아야 하는지에 초점을 맞춘 학습 목표에 대한 결정을 내려야 한다.
  • 둘째, 의료교육자는 교육관리 및 리더십 기법과 교육학적 방법을 이용하여 의료환경이나 교실에서 대상주제를 구현하고 가르칠 필요가 있다.
  • 마지막으로, 의학 교육자들은 특정 성취도 테스트를 통해 얼마나 많은 양의 자료를 습득했는지 측정하고 평가할 필요가 있다. 

This Guide has explained the central importance of measurement and evaluation and inferential foundations of examination questions in medical education. Medical educators have three key roles in facilitating student engagement in learning.

  • First, they need to make a decision about learning objectives which focuses on what medical students need to do or know.
  • Second, medical educators need to implement and teach the target subject matter in health care settings or the classroom using educational management and leadership techniques and pedagogical methods.
  • Finally, medical educators need to measure and evaluate how much of the material has been mastered by a particular achievement test.

시험은 보통 특정 과목의 학생 성취도 기준으로 간주된다. 따라서 의료 교육자는 검사 문제가 의도한 목적에 적합한 증거를 도출하도록 유효하고 신뢰할 수 있는 시험을 구성해야 한다. 이를 위해 항목-난이도 지수 및 항목-차별 지수를 산출할 필요가 있다. 문제는 대다수(60% 이상) 학생이 맞히면 쉬운 것으로, 30% 미만 학생이 맞히면 어려운 것으로 간주된다. 항목 판별 지수는 점-이진 상관 계수 및 t-테스트 절차를 사용하여 분석한다. 큰 양의 Rpbi는 좋은 질문의 표시이고 낮은 양의 Rpbi 또는 음의 Rpbi는 나쁜 질문의 표시입니다. t-검정은 항목 식별 지수를 결정하기 위한 또 다른 통계적 절차이다. 문제를 맞힌 학생의 평균점수와 오답한 학생의 평균점수 사이에 큰 차이가 없다면 문제는 강한 학생과 약한 학생을 구별하는 것이 아니다. 이는 다음 시험을 위해 문제를 제거하거나 수정해야 함을 시사한다. SPSS는 항목 분석 데이터의 분석을 용이하게 한다.

This test is usually considered as a criterion for student achievement in a particular subject. Consequently, medical educators need to construct valid and reliable tests in order to ensure that examination questions elicit evidence that is appropriate to the intended purpose. To this end, the item-difficulty index and the item- discrimination need to be calculated. A question is considered easy if it is answered correctly by the majority of students (more than 60%), and is considered hard if it is answered correctly by less than 30% of the students. The item-discrimination index is analysed using the point-biserial correlation coefficient and the t-test procedure. A large positive Rpbi is an indication of a good question while a low positive or a negative Rpbi is an indication of a bad question. The t-test is another statistical procedure for determining the item-discrimination index. If there is no significant difference between the mean score of students who answered the question correctly and the mean score of students who answered the question incorrectly, the question is not differentiating strong students from weak students. This suggests that the question should be removed or revised for next examination. SPSS facilitates the analysis of the item analysis data.

 


 

Med Teach. 2011;33(6):447-58. doi: 10.3109/0142159X.2011.564682.

Post-examination analysis of objective tests

Affiliations collapse

Affiliation

1University of Nottingham, UK.

PMID: 21609174

DOI: 10.3109/0142159X.2011.564682

Abstract

One of the key goals of assessment in medical education is the minimisation of all errors influencing a test in order to produce an observed score which approaches a learner's 'true' score, as reliably and validly as possible. In order to achieve this, assessors need to be aware of the potential biases that can influence all components of the assessment cycle from question creation to the interpretation of exam scores. This Guide describes and explains the processes whereby objective examination results can be analysed to improve the validity and reliability of assessments in medical education. We cover the interpretation of measures of central tendency, measures of variability and standard scores. We describe how to calculate the item-difficulty index and item-discrimination index in examination tests using different statistical procedures. This is followed by an overview of reliability estimates. The post-examination analytical methods described in this guide enable medical educators to construct reliable and valid achievement tests. They also enable medical educators to develop question banks using the collection of appropriate questions from existing examination tests in order to use computerised adaptive testing.

학부의학교육에 CBME와 개별화된 경로를 도입할 때 인프라와 조직문화의 결정적 역할(Med Teach, 2021)
The critical role of infrastructure and organizational culture in implementing competency-based education and individualized pathways in undergraduate medical education
Kimberly D. Lomisa , George C. Mejicanob, Kelly J. Caverzagiec, Seetha U. Monradd , Martin Pusice and Karen E. Hauerf 

 

서론
Introduction

의료 교육은 환자와 인구의 건강 관리 요구에 부응하기 위해 존재한다. 그러나, 생물 의학, 인구 건강, 그리고 건강 관리 시스템의 빠른 변화에도 불구하고, 의학 교육의 구조는 100년 이상 동안 대체로 균일하고 전통에 젖어 있었다. 미국의 의료는 국가의 건강을 최적화하는 데 실패했다. 관련된 이슈로는 질 낮은 의료, 의료 오류, 의료 격차와 건강 불평등, 복잡하고 부담스러운 시스템, 비용 증가와 같이 그리고 의료 제공 시스템의 결정적 단점을 보여주는 것들이 있다. 새로운 교육 전략은 의사들이 사회의 요구를 충족시키기 위해 더 잘 훈련되도록 보장한다.
Medical education exists to serve the health care needs of patients and populations. However, despite rapid changes in biomedical science, population health, and health care systems, the structure of medical education remained largely uniform and steeped in tradition for over 100 years. Health care in the United States has failed to optimize the nation’s health, with issues such as poor-quality care, medical errors, health care disparities and health inequities, complex and burdensome systems, and escalating costs demonstrating important shortcomings in the health care delivery system (IOM 2001). New educational strategies are warranted to ensure physicians are better trained to meet the needs of society.

[2010년의 기념비적 의학 교육 연구]는 현재와 미래의 의료 문제를 해결하기 위해 현대 의사들을 훈련시키는 데 필요한 변화의 유형을 예측했다. 글로벌 독립 및 전문직 간 위원회인 21세기 보건 전문가 교육에 관한 랜싯 위원회는 21세기 보건 전문가 교육에 대한 권고안을 발표했다(Frenk et al. 2010). 이 그룹은 직업 전반에 걸쳐 원하는 교육적 결과를 달성하기 위해 커리큘럼과 평가 프로그램을 정렬하기 위한 후향적 설계(Wiggins and McTighe 1998)를 지지했다(그림 1). 카네기 재단이 의뢰한 미국의 의료 교육에 대한 증거 기반 보고서에서 유사한 권고가 나왔으며, 이는 개별화된 학습 과정과 함께 교육 연속체에 걸친 발달적 방식으로 명확하게 표현된 학습 성과의 표준화를 요구했다(Cooke et al. 201).0).
Sentinel works in medical education in 2010 forecasted the types of changes that would be needed to train modern physicians to meet current and future challenges in health care. The Lancet Commission on Education of Health Professionals for the 21st Century, a global independent and interprofessional committee, published recommendations on Education of Health Professionals for the Twenty-First Century (Frenk et al. 2010). This group advocated for backward design (Wiggins and McTighe 1998) to align curricula and assessment programs to achieve desired educational outcomes across professions (Figure 1). Similar recommendations arose from an evidence-based report of medical education in the United States, commissioned by the Carnegie Foundation, which called for the standardization of learning outcomes – clearly articulated in a developmental manner across the educational continuum – coupled with individualized learning processes (Cooke et al. 2010).

 

랜싯 위원회의 최종 제안된 개혁 중 첫 번째는 다음과 같다.
Of the Lancet Commission’s final proposed reforms, the first is:

정적인 교과과정에 의해 지배되기보다는 급변하는 요구에 대응하는 역량 기반 커리큘럼의 채택. 역량은 지역 상황에 맞게 조정되어야 하며 글로벌 지식과 경험을 활용하는 동안 국가 이해 관계자가 결정해야 한다. 동시에, 현재의 격차는 모든 국가에 공통적인 21세기 과제(예: 글로벌 보건 보안 위협에 대한 대응 또는 점점 복잡해지는 보건 시스템의 관리)를 처리하는 데 필요한 광범위한 역량으로 채워져야 한다. (Frenk et al. 2010)
Adoption of competency-based curricula that are responsive to rapidly changing needs rather than being dominated by static coursework. Competencies should be adapted to local contexts and be determined by national stakeholders while harnessing global knowledge and experiences. Simultaneously, the present gaps should be filled in the range of competencies that are required to deal with 21st-century challenges common to all countries—e.g., the response to global health security threats or the management of increasingly complex health systems. (Frenk et al. 2010)

 

역량 기반 의학 교육(CBME)은 특정 주제나 경험에 소비되는 [커리큘럼 시간에 초점을 맞추는 것]에서 [훈련 결과를 더 명시적으로 강조]하는 근본적인 변화를 나타낸다(Harden 1999). 훈련의 다음 단계에 진입할 준비가 되어 있음을 나타내기 위해 훈련생이 보여야 하는 지식, 기술 및 태도를 정의하고, 실습 중에 역량을 계속 확장하는 방법을 개략적으로 설명함으로써, CBME는 커리큘럼 설계에 대한 성과 기반 접근 방식을 구성한다(Frank et al. 2010). 랜싯 위원회는 변혁적 의학 교육의 세 가지 중요한 구성 요소를 강조했습니다.

  • (1) 의료지식의 암기보다는 적응적 전문지식과 평생학습에 대한 기술 함양 
  • (2) 전문 의료팀 간의 효과적인 실천을 위한 다양한 역량 달성 
  • (3) 지역 맥락에 맞게 조정된 건전한 교육 모델의 적용(Frenk et al. 2010). 

Competency-based medical education (CBME) represents a fundamental shift from focusing on curricular time spent on certain topics or experiences to more explicitly emphasizing the outcomes of training (Harden 1999). By defining what knowledge, skills, and attitudes trainees must demonstrate to signify readiness to enter the next stages of training and eventual unsupervised practice and outlining how they will continue to expand their competence while in practice, CBME constitutes an outcomes-based approach to curricular design (Frank et al. 2010). The Lancet Commission highlighted three critical components of transformative medical education:

  • (1) cultivation of skills in adaptive expertise and lifelong learning rather than rote memorization of medical knowledge;
  • (2) achievement of a range of competencies for effective practice within interprofessional health care teams; and
  • (3) application of sound educational models adapted to the local context (Frenk et al. 2010).

현재의 실천 현실은 의료 전문가를 [단독적 '영웅 의사']가 아니라 [지역사회의 요구에 반응]하고, [더 큰 시스템 내에서 효과적]인, [유연하고 적응력이 뛰어난 팀 구성원 및 변화 에이전트]로 재구성해야 한다(Lesser et al. 2010). CBME 접근 방식은 의사의 진화하는 기대를 수용할 수 있다. CBME의 실현은 관리 책임 증대에 대한 훈련생의 준비성을 보장하고 실습에서 지속적인 교육을 통해 평생 학습에 참여할 수 있도록 해야 한다. 그러나 랜싯 위원회가 인정한 것처럼 구현은 어렵다.

Current realities of practice demand a reframing of a medical expert not as a solo ‘hero physician’ but rather as a flexible, adaptive team member and change agent, responsive to the community’s needs and effective within a larger system (Lesser et al. 2010). CBME approaches can accommodate such evolving expectations of physicians. Actualization of CBME should ensure trainee readiness for escalating care responsibilities and equip them to engage in lifelong learning throughout their continuing education in practice. Implementation, however, is arduous, as the Lancet Commission acknowledged:

한 세기 전과 다를 바 없이, 교육개혁은 리더십을 요구하는 길고 어려운 과정이며, [관점, 작업 스타일, 모든 이해관계자 간의 좋은 관계]를 변화시켜야 한다. (Frenk et al. 2010)
No different than a century ago, educational reform is a long and difficult process that demands leadership and requires changing perspectives, work styles, and good relationships between all stakeholders. (Frenk et al. 2010)


이 원고에서, 우리는 CBME를 구현하는 데 있어 인프라와 조직 문화의 중요한 역할에 대해 배운 공유된 교훈을 개략적으로 설명한다.
In this manuscript, we outline shared lessons learned regarding the critical role of infrastructure and organizational culture in implementing CBME.

 

의료 교육 컨소시엄의 변화를 가속화하는 미국 의사 협회
The American Medical Association Accelerating Change in Medical Education Consortium

미국 의학 협회(AMA)는 의료 오류, 높은 진료 비용 및 제공자 간의 번아웃 유병률에 관련된 우려로 입증되는 의사 교육과 실무의 현실 사이의 불일치를 인정했다(Scochelak and Stack 2017). 환자와 인구의 요구를 더 잘 충족시키기 위해 의료 교육에 필요한 변화에 박차를 가하기 위해, AMA는 2013년에 의료 교육의 변화 가속화를 시작했다. 경쟁적인 과정을 통해, 11개의 미국 의과대학에 초기 보조금이 수여되었고, 2016년에 추가로 21개의 미국 학교로 자금이 확장되었다. AMA는 이러한 학교를 소집하여 의료교육의 변화 가속 컨소시엄을 만들어 기관 간 파트너십이 획기적인 아이디어를 구현하고 전파할 수 있는 전례 없는 기회를 제공했다. 컨소시엄은 이후 성장하여 대학원 의학 교육(GME)까지 확대되었다. 이 기사는 원래 32개 학교 중 컨소시엄의 첫 5년 동안 UME에서 CBME와 관련된 활동에 초점을 맞추고 있다. 이 부록의 마지막 논문은 이러한 노력의 지속을 GME로 논의한다. 

The American Medical Association (AMA) recognized a malalignment between physician education and the realities of practice, demonstrated by concerns related to medical error, high costs of care, and prevalence of burnout among providers (Skochelak and Stack 2017). To spur needed changes to medical education to better meet the needs of patients and populations, the AMA launched the Accelerating Change in Medical Education initiative in 2013. Through a competitive process, initial grants were awarded to eleven U.S. medical schools, and funding was extended in 2016 to an additional twenty-one U.S. schools. The AMA convened these schools to create the Accelerating Change in Medical Education Consortium, providing an unprecedented opportunity for cross-institutional partnerships to implement and disseminate groundbreaking ideas. The consortium has since grown and extended to include graduate medical education (GME). This article focuses on activities related to CBME in UME during the consortium’s first five years among the original 32 schools; the final paper of this supplement discusses the continuation of these efforts into GME.

이 시책의 핵심 목표 중 하나는 의대 학생들의 핵심 역량을 가르치고 평가하는 새로운 방법과 보다 유연하고 개별화된 학습 경로를 만들기 위한 육성 방법을 홍보하는 것이었다. CBME가 맥락과 제도적 문화에 크게 의존하는 복잡한 개입이라는 것을 인식하면서, AMA는 이 목표를 지원하기 위해 [지역 해결책]이 필요할 것이라고 인정했다. 컨소시엄 사이트 전반에 걸쳐 표준화된 구현에 대한 기대는 없었습니다. 이 원고에서는 AMA 컨소시엄에 참여하는 여러 학교가 CBME를 지원하고 구성원들이 그 과정에서 성공과 투쟁을 공유하면서 얻은 집단적 교훈을 되새기기 위해 광범위한 커리큘럼 및 구조 혁신을 어떻게 구현했는지 설명한다.
One core objective of the initiative was to promote new methods for teaching and assessing key competencies for medical students and fostering methods to create more flexible, individualized learning pathways. Recognizing that CBME is a complex intervention heavily dependent upon context and institutional culture, the AMA acknowledged that local solutions would be necessary to support this objective. There was no expectation for a standardized implementation across consortium sites. In this manuscript, we describe how different schools participating in the AMA’s consortium implemented broad curricular and structural innovations to support CBME and reflect upon the collective lessons learned as members shared successes and struggles in the process.

2019년에 Van Melle과 동료들은 CMBE 구현의 충실도를 평가하기 위한 핵심 구성 요소 프레임워크를 제안했다.

  • 다섯 가지 구성요소는 역량의 단계적 개발을 특징짓는 이정표와 같이 발달 단계의 순차적 진행과 함께 명확하게 표현된 성과 역량을 수반한다.
  • 맞춤형 학습 경험강의실뿐만 아니라 직장에서도 해당하며, 역량 중심 교육과 결합하여 보다 경험이 풍부한 제공자의 필요한 교육, 코칭 및 역할 모델링과 함께 진정한 학습authentic learning이 이루어지도록 합니다.
  • 프로그램 평가(Programmatic Assessment)는 학습자 평가 데이터를 수집하고 합성하기 위한 조정된 접근 방식으로, 일반적으로 그룹 검토 및 의사 결정과 결합되어 학습자가 예상된 점진적 역량 개발의 달성을 보장하기 위해 다양한 도구를 사용하여 평가됩니다.

In 2019, Van Melle and colleagues proposed a core components framework for evaluating the fidelity of CMBE implementation (Van Melle et al., International Competency-Based Medical Education Collaborators 2019).

  • The five components entail clearly articulated outcome competencies with a sequenced progression of developmental steps, such as milestones to characterize the graded development of competence.
  • Tailored learning experiences, not only in the classroom but also in the workplace, are paired with competency-focused instruction so that authentic learning takes place with the needed teaching, coaching, and role modeling from more experienced providers.
  • Programmatic assessment is the coordinated approach to gathering and synthesizing learner assessment data, typically coupled with group review and decision making so that learners are assessed using a variety of tools to ensure their achievement of the expected progressive development of competence (van der Vleuten et al. 2012; Lockyer et al., ICBME Collaborators 2017).

이러한 구성 요소를 달성하는 CBME 시스템에서는 학습자가 다른 속도로 진행할 수 있습니다. 이렇듯 시간은 의학교육의 정의구조보다는 교육과정 자원이 된다. 비록 컨소시엄 학교가 그들의 노력을 시작할 때 이 핵심 요소 프레임워크는 아직 발표되지 않았지만, 그 요소들은 그들이 성취한 구현을 검토할 수 있는 유용한 렌즈를 제공한다.
In a CBME system that achieves these components, learners can progress at different rates. As such, time becomes a curricular resource rather than the defining structure of medical education (Frank et al. 2010; Lucey et al. 2018 ). Although this core components framework was not yet published when the consortium schools embarked on their efforts, the components provide a useful lens to review the implementation they accomplished.

컨소시엄 기관에서 CBME 구현
Implementing CBME at consortium institutions

컨소시엄 기관은 다양한 접근 방식으로 구현 과제를 해결했으며, 그 과정에서 얻은 교훈을 공유했습니다. CBME의 핵심 구성요소가 달성된 정도는 회원 기관마다 크게 다르다. 32개 회원 기관의 초기 보조금 제안서에 설명된 목표를 검토하면서, 16개 회원국은 보조금 지급의 결과로 CBME를 구체적으로 언급했고, 14개 회원국은 개별화된 경로를 언급했다. 단 하나의 목표로서 명시적으로 명명된 프로그램 평가와 3개 기관은 [시간-변수time-variable 시스템]을 만들려고 했다. 컨소시엄 기관 전체에서 실제로 달성된 공통 프로그램 변경에는 랜싯 위원회의 권고사항과 일치하는 보다 적극적인 학습 형식과 초기 의미 있는 임상 역할을 통해 역량 개발을 위한 역량 기대치를 보다 분명히 하고 기회를 넓히는 것이 포함되었다. 결과를 정의하고 학습자의 진도를 평가하기 위해 컨소시엄 학교는 기존 프레임워크와 새로운 프레임워크를 적용했다. 많은 이들이 대학원 의학 교육 마일스톤 프로젝트를 위한 인증 위원회(ACGME 2021)와 미국 의과대학 핵심 위탁 가능 전문 활동(EPAs for Engineerable Professional Activities for Grademy Medical Education Milestones Professional Activities)과 같은 미국 국가 프레임워크와 일치했다. 많은 기관들은 각 학습자가 원하는 역량을 획득했다는 증거를 강화하기 위해 인턴십 준비 상태에 대한 명시적인 평가를 시행했다. 일부 사이트는 프로그래밍 역량 평가, 데이터 중심 학습자 포트폴리오, 시간 변수 진행 및 유연한 개별화된 학습 계획을 통해 CBME의 훨씬 더 심층적인 구현을 달성할 수 있었다.
Consortium institutions tackled the challenge of implementation with varied approaches, sharing lessons learned along the way. The degree to which core components of CBME have been achieved varies significantly among member institutions. In reviewing the objectives described in the initial grant proposals from the 32 member institutions, 16 specifically mentioned CBME as an outcome for their grant, and 14 mentioned individualized pathways; only one explicitly named programmatic assessment as a goal, and three sought to create time-variable systems. Common programmatic changes actually accomplished across consortium institutions included making competency expectations more explicit and broadening opportunities for competency development via more active learning formats and early meaningful clinical roles, consistent with recommendations of the Lancet Commission. To define outcomes and assess learner progression, consortium schools applied existing and novel frameworks. Many aligned with U.S. national frameworks such as the Accreditation Council for Graduate Medical Education Milestones Project (ACGME 2021) and the Association of American Medical Colleges Core Entrustable Professional Activities (EPAs) for Entering Residency (AAMC 2021). Many institutions implemented explicit assessments of readiness for internship to strengthen the evidence that each learner attained desired competencies. A few sites were able to accomplish even deeper implementation of CBME, with programmatic competency assessment, data-driven learner portfolios, time-variable progression, and flexible individualized learning plans.

CBME 구현 예시
Exemplars in implementing CBME

몇몇 컨소시엄 기관들은 그들의 모든 학생들을 위해 CBME를 시행할 수 있었다. 이러한 사이트는 교육 기간 동안 전체 학생 모집단에 CBME 접근 방식을 적용하기 위해 프로그래밍의 포괄적인 정비에 착수했다. 표 1은 '변동적인 역량 달성률에 적응할 수 있는 유연하고 개별적으로 맞춤화된 프로그램'에 초점을 맞춘 '개혁적 입장'을 실현하는 과정에서, 이들 의과대학이 핵심 요소 프레임워크의 요소를 어떻게 달성했는지 설명한다(Hodges 2010). 
A few consortium institutions were able to implement CBME for all of their students. These sites undertook a comprehensive overhaul of programming to apply a CBME approach to their entire student population over all the years of training. Table 1 elaborates how these sites accomplished elements of the core components framework, actualizing the ‘reform position’ (Van Melle et al., International Competency-Based Medical Education Collaborators 2019) that focuses on ‘flexible, individually tailored programs that can adapt to variable rates of competence attainment’ (Hodges 2010).

다른 컨소시엄 학교들은 [제한된 수의 학생들이 참여하는 특별 트랙]을 지원하기 위해 CBME 전략을 적용했다. 캘리포니아 대학교(UC), 데이비스, 의과대학 및 오하이오 대학교 헤리티지컬 칼리지 오브 오스테오파시컬 메디컬 모두 1차 진료에 대한 가속화된 경로를 제공하고, CBME 전략을 적용하여 학생들이 짧은 교육 기간에도 불구하고 만족스러운 학습 결과를 얻을 수 있도록 했다.

  • UC Davis에서는 각 학생이 전담 임상의 멘토 및 코치와 협력하여 강의실 학습을 일상적인 임상 실습 기술로 변환합니다. 이 프로그램은 EPA를 사용하여 역량을 평가하고 적절한 진전을 결정한다.
  • 오하이오 헤리티지는 학생들이 특정 시간 내에 고정되지 않은 교육적 및 임상적 이정표를 달성해야 하는 새로운 골병리학 역량 기반 프로그램을 개발했다. 승진은 프로그램의 연수가 아닌 객관적 평가에 의해 결정된 역량 달성에만 기초한다.

Other consortium schools applied CBME strategies to support special tracks involving limited numbers of students. Both the University of California (UC), Davis, School of Medicine and the Ohio University Heritage College of Osteopathic Medicine offered accelerated pathways into primary care and applied CBME strategies to ensure students attained satisfactory learning outcomes despite a shortened timeline of training.

  • At UC Davis, each student works with a dedicated clinician mentor and coach to translate classroom learning into everyday clinical practice skills. The program uses EPAs to assess the competence and determine appropriate advancement.
  • Ohio Heritage developed a new osteopathic competency-based program in which students must achieve didactic and clinical milestones that are not fixed in a specific timeframe. Advancement is based solely on the attainment of competencies determined by the objective assessment, not by the number of years in the program.

 

구현의 충실도를 지원하기 위한 컨소시엄의 협업 작업
Collaborative work of the consortium to support fidelity in implementation

컨소시엄 기관이 CBME 구현의 힘든 작업을 깊이 연구함에 따라, 팀은 충실도를 달성하려면 정말로 변화가 필요하다는 것을 인식했습니다. CBME는 고도로 맥락 의존적인 복잡한 개입이다. CBME 프로그램의 성공은 졸업생들이 기대 역량 달성을 향한 그들의 진도를 지원하고 평가할 수 있도록 [인프라]에 크게 의존한다(Holmboe et al. 2010). McGaghie와 동료들은 1978년에 '이러한 시스템을 구현하기 위해서는 교수진과 학생의 역할과 책임에 대한 상당한 재정의가 필요하다'고 경고했다(McGaghie et al. 1978). 
As consortium institutions delved into the hard work of CBME implementation, teams recognized that attaining fidelity would truly require a transformation. CBME is a complex intervention that is highly context-dependent. The success of a CBME program relies heavily upon infrastructure to ensure that graduates are supported and assessed on their progress toward achievement of expected competencies (Holmboe et al. 2010). McGaghie and colleagues cautioned in 1978 that ‘implementation of such a system demands a substantial redefinition of faculty and student roles and responsibilities’ (McGaghie et al. 1978).

이 컨소시엄은 전환 작업에 참여하는 학교들에게 도중에 마주친 공통의 도전과 장벽에 대해 논의할 수 있는 장을 제공했다. 공통적인 어려움에 대한 구성원 간의 투명성은, 컨소시엄 작업의 시스템 지향성과 결합하여, [사람, 워크플로우, 기술 및 문화를 다루는 변화 관리 방식]에 관한 기관적 접근에 정보를 주었다. CBME를 지원하기 위한 문화 변화는 교직원과 학생에 의한 수용뿐만 아니라, [성취 중심]에서 [성장과 평생 학습 중심]으로의 광범위한 제도적 전환에 전념하는 리더십을 수반한다(Alman et al. 2013). 학교는 CBME를 독립적으로 구현했지만, 구현의 충실성을 지원하기 위해 필요하다고 판단되는 인프라의 핵심 요소를 중심으로 협업 노력이 나타났다.

The consortium provided a venue for schools engaged in the work of transformation to discuss shared challenges and barriers encountered along the way. Transparency among members regarding common struggles, coupled with a systems orientation of the consortium’s work, informed institutional approaches to change management that address people, workflows, technology, and culture. Culture change to support CBME entails not only acceptance by faculty and students but also leadership committed to a widespread institutional shift from a focus on achievement to a focus on growth and lifelong learning (Alman et al. 2013). Although schools implemented CBME independently, collaborative efforts emerged around key elements of infrastructure that were deemed necessary to support fidelity of implementation.

다음 영역은 CBME의 이행에 있어 충실성을 지원하기 위한 기관 간 컨소시엄 구성원의 집단적 노력을 반영한다.

The following areas reflect the collective efforts of consortium members across institutions to support fidelity in implementation of CBME.

마스터 어댑티브 학습자 모델
The master adaptive learner model

CBME는 [자신의 교육에 적극적으로 참여하는 학습자]에게 의존한다. 의대에 입학하기 위해서는 상당한 학문적 성공이 필요하지만, 그 성공이 (의사로서의 경력 내내 요구되는) 자기 주도적이고 자기 통제적인 성격의 경우는 드물다(샌더스와 클리어리 2011). 학생들은 (능력 있어 보이고 점수, 성적, 의과대학 입학 같은 외적인 보상을 얻기 위해 노력하는) [수행 지향performance orientation]에서 벗어나서, (더 큰 팀과 시스템 내에서 개별 목표와 최적의 기능을 달성하기 위해 역량을 개발하고 개선하기 위해 학습하는) [마스터 오리엔테이션mastery orientation]으로 옮겨가야 한다.

CBME relies on learners who are actively engaged in their own education. Though gaining admission to medical school requires significant academic success, that success is rarely of a self-directed and self-regulated nature that is required throughout one’s career as a physician (Sandars and Cleary 2011). Students must shift from a performance orientation, in which they strive to appear competent and achieve extrinsic rewards such as scores, grades, and medical school admission to a mastery orientation in which they learn for the sake of developing competency and improving to achieve individual goals and optimal function within larger teams and systems (Dweck 1986; Pintrich et al. 2003).

이미 높은 성취를 얻은 학생들에게 그들이 배우는 방법을 배울 필요가 있다고 설명하는 것은 어렵다. 이러한 긴장으로 인해 컨소시엄 구성원들은 마스터 적응 학습자의 구성을 명확하게 설명하는 데 협력하게 되었습니다. 이 모델은 일상적인 전문 지식의 Dreyfus 모델(Dreyfus et al. 1986)을 넘어 [적응적 전문성adaptive expertise]을 위해 노력한다. (적응적 전문성은) [평가, 적응, 계획 및 학습]의 반복적 주기가 [개별화된 발달적 역량 향상]을 지원하며, 이러한 개발이 역량 영역에 걸쳐 개인 내에서 어떻게 달라질 수 있는지를 보다 명확하게 설명한다. 이러한 단계는 '계획, 실행, 연구, 행동' 접근법(1986년 데밍)을 연상시키는 보건 시스템 품질 개선 노력과 유사하다. 이 병렬은 학습자가 [시스템 그 자체가 성장하고 적응할 때], 그 속에서 자신의 [성장 지향성]을 수용하는 데 도움이 되며, 시스템의 지속적인 품질 개선과 일치하는 지속적인 개별적 자기 개선을 제시한다. 마스터 적응 학습자 모델의 구현을 더욱 진전시키기 위해, 컨소시엄 구성원들은 미래의 임상의가 적응 기술을 개발할 수 있도록 교육하는 강사 중심 가이드를 출판하기 위해 협력했다(Cutrer et al. 2019).

Explaining to accomplished students that they need to learn how to learn is a challenge. This tension led members of the consortium to collaborate in articulating the construct of the Master Adaptive Learner (Cutrer et al. 2017). This model pushes beyond the Dreyfus model of routine expertise (Dreyfus et al. 1986) to strive for adaptive expertise. Iterative cycles of assessing, adapting, planning, and learning support individualized, developmental competency progression and illustrate more clearly how such development may vary within an individual across different domains of competency. These steps are analogous to efforts in health system quality improvement, reminiscent of the ‘plan, do, study, act’ approach (Deming 1986). This parallel helps learners to embrace a growth orientation within a system that is also growing and adapting, presenting continual individual self-improvement as matching continual quality improvement of systems. To further advance the implementation of the Master Adaptive Learner model, members of the consortium collaborated to publish an instructor focused guide on training future clinicians to develop adaptive skills (Cutrer et al. 2019).

코칭
Coaching

[맞춤형 학습 경험]에 대한 CBME의 기대는, 평가 증거를 수집하고 검토하고, 격차를 이해하고, 필요한 경험을 식별하기 위한 [구조화된 프로세스]를 필요로 한다. 의학 코칭의 초점은 다양할 수 있지만(Lovell 2018), CBME 프로그램의 코치는 학습자를 [종단적 관계의 맥락]에서 지도하며, 이 때 아래의 과정을 활용한다(Deiorio et al. 2016). 

  • 수행능력 평정 검토,
  • 학습목표 작성,
  • 목표달성을 위한 전략 계획,
  • 개인 및 전문적 발달에 대한 성찰 

The expectation in CBME for tailored learning experiences requires a structured process to gather and review assessment evidence, understand gaps, and identify needed experiences. Though the focus of coaching in medicine can vary (Lovell 2018), a coach in a CBME program guides a learner in the context of a longitudinal relationship through the process of

  • reviewing performance ratings,
  • creating learning goals,
  • planning strategies to achieve goals, and
  • reflecting on personal and professional development (Deiorio et al. 2016).

[일반인, 특히 의사가 자기 평가에 효과적이지 않다는 증거]는, [역량에 대한 발달적 접근법]을 서포트하기 위해서는 [정보에 입각한 자기 평가]를 촉진하기 위한 목적으로 [명시적 훈련과 수행능력에 대한 증거]가 필요하다고 주장한다(Davis 등 2006; Sargeant 등 2010). 학습에 대한 [숙달지향성] 함양을 우선시하는 학교는 다양한 형태의 코칭 프로그램을 만들어 [증거 중심 자기 평가]를 하는 학생들의 능력을 키워, 이를 바탕으로 개별화된 학습 경로의 설계에 필요한 정보를 제공한다. 기존 문헌(Kruger와 Dunning 1999)에서 예상한 바와 같이, 높은 성과를 보인 학생들은 종종 자신의 성과를 과소평가했고 낮은 성과를 보인 학생들은 때때로 과잉 자신감을 보였다. 

Evidence that people in general, and perhaps physicians in particular, are not effective at self-assessment argues that explicit training and evidence about one’s performance to promote informed self-assessment are necessary to support a developmental approach to competency (Davis et al. 2006; Sargeant et al. 2010). Schools prioritizing the cultivation of a mastery orientation toward learning and adaptive expertise have created coaching programs of varying forms to foster students’ skills in evidence-driven self-assessment that in turn inform the design of individualized learning pathways. As expected from existing literature (Kruger and Dunning 1999), high performing students often under-rated their own performance and lower performing students sometimes exhibited over-confidence.

코치는 이러한 잘못을 보정하는 데 도움을 줄 수 있다. 한 컨소시엄 회원 학교는 성과 피드백의 해석에 대해 학생과 코치가 토론하는 반복적인 세션이 학생들의 자기 평가와 코치의 성과 검토 간의 일치성을 증가시킨다는 것을 입증했다. 의료 교육에서의 코칭 활용도를 높이기 위해 컨소시엄 구성원들이 협력하여 학습자를 위한 교수 가이드북과 동반 가이드를 만들었습니다(Deiorio and Hammoud 2017; Wolff et al. 2019). 이 컨소시엄은 또한 코칭 분야에서 여러 교수 개발 워크샵을 제공했습니다.

Coaches can assist in calibration; one consortium member school demonstrated that repeated sessions involving the student and coach discussing the interpretation of performance feedback led to increasing concordance between students’ self-assessments and coaches’ review of performance. To advance the utilization of coaching in medical education, consortium members collaborated to create a faculty guidebook and a companion guide for learners (Deiorio and Hammoud 2017; Wolff et al. 2019). The consortium has also offered multiple faculty development workshops in coaching.

학습 환경
The learning environment

컨소시엄 구성원들은 CBME의 구현에 대한 [학습 환경]의 엄청난 영향을 인식했다. 컨소시엄 기관에 걸친 학습 환경 연구(Scochelak et al. 2016)는 이후 의대 교육 환경의 개인 및 기관 동인에 대한 설명으로 이어졌다(Gruppen and Stansfield 2016). 이 연구는 학습 환경에 대한 학생 인식에서 기관 간의 차이를 보여주었지만, 더 놀라운 것은 [특정 기관 내 경험에서 상당한 개인 차이]를 보여주었으며, 이는 환경 문제를 다루는 학습자의 다양성을 염두에 둘 필요가 있음을 강조한다. Grupen과 동료들이 개략적으로 설명한 학습 환경을 설명하기 위한 개념적 프레임워크는 심리사회적 차원과 물질적 차원을 모두 포함한다. 컨소시엄 구성원들은 최적의 학습을 지원하기 위한 [개인, 사회, 물리적, 가상 공간의] 상호 작용과 [조직 요소]를 해결하기 위한 전략을 공유했다(Grouppen et al. 2019).
Consortium members recognized the tremendous impact of the learning environment on the implementation of CBME. A Learning Environment Study across consortium institutions (Skochelak et al. 2016) subsequently led to the description of individual and institutional drivers of the medical school educational environment (Gruppen and Stansfield 2016). That study demonstrated differences among institutions in student perceptions of the learning environment, but even more striking was the significant individual variance in experience within a given institution, which highlights the need to be mindful of the diversity of learners in addressing environmental issues. A conceptual framework for describing the learning environment outlined by Gruppen and colleagues includes both a psychosocial dimension and a material dimension. Members of the consortium shared strategies to address the interplay of the personal, social, physical, and virtual spaces and organizational factors in supporting optimal learning (Gruppen et al. 2019).

CBME는 [진정한 발달적 접근 방식]을 요구하며, 이는 학습자가 일정 정도로 자신의 취약성의 인정하게끔 한다. [수행 지향]에서 [숙달 지향]으로 전환하려면 학습자가 추가 개발이 필요한 영역을 노출해야 한다(Sawatsky et al. 2020). 비록 많은 사람들이 불편하지만, 안전하고 효과적인 치료를 지원하기 위해 임상 영역에서도 이와 같은 행동이 필요하다. CBME를 더 깊이 구현한 학교들은 학생들에게 이 근거를 명확히 밝히고, 학생들이 자신의 개발을 책임질 수 있도록 하는 데 초점을 맞췄다.

CBME demands a true developmental approach, which creates a level of vulnerability for learners that must be acknowledged. Shifting from a performance orientation to a mastery orientation requires the learner to expose areas needing further development (Sawatsky et al. 2020). Although uncomfortable for many, this same behavior is necessary in the clinical realm to support safe and effective care. Schools attaining deeper implementation of CBME articulated this rationale to students and focused on empowering them to take charge of their own development.

학습에 대한 전통적인 평가를 벗어나, [학습을 위한 평가]를 강조하기 위해서는 [제도적 문화]가 학생들의 신뢰를 얻어야 한다. 프로그램 평가 접근법과 개발의 종적 관점에 대한 학생들을 위한 명시적 교육이 필수적이라는 것이 입증되었다. 역할 모델링도 도움이 되었습니다. 학생들은 전공의와 교직원들이 공개적으로 자신의 격차gaps와 학습 요구needs를 성찰할 때 가장 좋은 반응을 보였다. Edmondson은 학생이 심리적 안전, 동기부여 및 책임감의 조합을 경험할 때 학습이 가장 효과적이라는 것을 입증한다(Edmondson 2018). CBME의 비전을 실현하기 위해서는 학생들이 안전한 환경을 인식해야 한다(Tsuei et al. 2019).

To move from traditional assessment of learning to emphasize assessment for learning (van der Vleuten et al. 2012), the institutional culture must gain students’ trust. Explicit training for students about programmatic assessment approaches and the longitudinal view of development proved essential. Role modeling was helpful as well; students responded best when supervising residents and faculty members openly reflected on their own gaps and learning needs. Edmondson demonstrates that learning is most effective when a student experiences a combination of psychological safety, motivation, and accountability (Edmondson 2018). To realize the vision of CBME, students must perceive a safe environment (Tsuei et al. 2019).

[안전한 학습 환경의 문제]는 교수개발에서도 매우 중요한 것으로 입증되었다. 교수진 평가자들은 역사적으로 [졸업을 위한 궁극적인 역량을 향한 학생의 발전]에 대해 보고하기보다는 [성적 과제와 순위를 위해 주어진 훈련 수준에서 학생들을 비교]해왔기 때문에, 기준 기반criterion-based 접근법이 어렵다는 것을 깨달았다. 실제로, 그러한 전통적인 규범적normative 접근법은 구조적 편견으로 가득 차 있고 상당한 다운스트림 결과를 가진 교육 불평등을 야기한다(Hauer and Lucy 2019; Therani 2018). 많은 평가자들은 CBME의 맥락에서 학생 성과에 대한 평가가 개발적으로 적절하더라도 '낮은 평가'를 주곤 하며, 이는 학생들이 원하는 임상 분야에서 레지던트 지위를 확보할 수 있는 능력을 해칠 것이라고 우려했다. 일부 교수진은 역량, 이정표 및 EPA에 관한 교육용어가 지나치게 복잡하다고 보았다(Dath and Iobst 2010; Holmboe et al. 2011).  
The issue of a safe learning environment has proved critical in faculty development as well. Faculty assessors found a criterion-based approach challenging since they have historically compared students at a given level of training for the purpose of grade assignments and ranking rather than reporting on their progress toward ultimate competency for graduation. In reality, that traditional normative approach has been found fraught with structural biases and creates educational inequities with significant downstream consequences (Hauer and Lucey 2019; Teherani 2018). Many assessors expressed concern that their ratings of student performance were ‘lower’ in the context of CBME — even if developmentally appropriate — and that this would harm students’ ability to secure a residency position in their desired clinical discipline. Some faculty found the educational lingo around competencies, milestones, and EPAs overly complex (Dath and Iobst 2010; Holmboe et al. 2011).

교수진 개발에 대한 한 가지 접근법은 '알아야 할 필요성need to know'에 따라 교수 훈련을 계층화하는 것이었다. [데이터 대시보드]가 각 학생의 성과에 대한 종단적 관점을 공식화하고, [역량 위원회]가 시간과 환경에 따른 성과 동향을 모니터링한다는 것을 설명하는 데 어떻게 도움이 되었는지를 보여줌으로써, 일선 평가자(임상 환경에서 학습자를 감독하는 교직원 및 전공의)들이 [어떤 단일 평가도 그것이 학생에게 해를 끼치지 않을 것]이라는 것을 이해하는 데 도움이 되었다. 학습자가 발달 사고방식에 참여할 수 있도록 지원하는 코치와 역량 위원회에 근무하는 교직원은 기관의 프로그램 평가 프로세스에 대해 더 깊고 미묘한 이해를 필요로 했습니다.

One approach to faculty development was to tier faculty training by the ‘need to know’. Demonstrating how data dashboards aid in formulating a longitudinal view of each student’s performance and explaining that competency committees monitor trends in performance over time and across settings helped frontline assessors (those faculty members and residents supervising learners in the clinical environment) understand that any single rating from them would not harm a student. Coaches assisting learners to engage in a developmental mindset and faculty members serving on competency committees needed a deeper, more nuanced understanding of the institution’s programmatic assessment process.

종단적 진행 모니터링
Monitoring longitudinal progress

[교육 인포매틱스]에 대한 투자는 프로그램 평가를 지원하기 위해 중요하다(Thoma et al. 2020). 과정은 물론 시간이 지남에 따라 역량이 발전하므로, 진행 상황을 추적하기 위한 [중앙 집중식 메커니즘]이 필요합니다. 데이터 캡처, 구성 및 시각화 도구는 성능 증거를 해석 및 실행 가능하게 만들기 위해 필요합니다(Boscardin et al. 2018). 컨소시엄 구성원들은 [인포매틱스 플랫폼 개발]의 주요 특징과 직면한 과제를 공유했다(Santen et al. 2020). 역량 마일스톤은 서술형 설명자에 의존하지만, 구현 시 주목되는 대시보드의 일반적인 함정은 보고와 표시를 위한 [서술형 데이터]를 [수치형 데이터]로 변환하는 것이었다. 이 관행은 두 가지 면에서 해롭다.

  • 수치 데이터는 학생이 수준 2에서 수준 3으로 이동하는 데 도움이 되는 피드백을 제공하지 않습니다. 어떤 특정한 행동이 성장을 이끄는지를 이해하기 위해서는 역량과 이정표의 표현이 필요합니다.
  • 또한 수치 표현은 criterion-based ratings이 연속적인 데이터를 나타낸다는 착각을 일으키지만, 실제로는 별개의 설명자이다. 학생이 한 등급 또는 다른 등급을 받는 빈도, 그리고 더 중요하게는 맥락이, '평균' 점수보다 교육 계획에 더 도움이 된다.

Investment in educational informatics is critical to support programmatic assessment (Thoma et al. 2020). Competency develops across courses and over time; thus, centralized mechanisms to track progress are required. Data capture, organization, and visualization tools are necessary to make performance evidence interpretable and actionable (Boscardin et al. 2018). Consortium members shared key features of developing informatics platforms and challenges encountered (Santen et al. 2020). Although competency milestones rely on narrative descriptors, a common pitfall of dashboards noted in implementation was conversion of narratives to numeric data for reporting and display. This practice is harmful in two ways.

  • Numeric data provides no feedback to help a student move, for example, from level 2 to level 3 on a scale; one needs the wording of competencies and milestones to understand what specific behaviors lead to growth.
  • Numeric representation also creates the illusion that criterion-based ratings represent continuous data, although in reality, they are discrete descriptors. The frequency with which, and importantly the contexts in which, a student receives one rating or another is more helpful to educational planning than an ‘average’ score.

대부분의 프로그램은 의미 있는 해석을 가장 잘 지원하기 위해 [대시보드 설계]를 반복적으로 수행했습니다. 또한, 일부 학교는 학생들의 진도와 역량 달성에 대한 결정을 내리기 위해 사무직에 학생들의 성과와 관련된 내러티브를 포함시켰다. 이 컨소시엄의 구성원들은 혁신을 지원하기 위해 중요한 기술 요구를 명확히 하기 위해 협력했습니다(Stuart and Triola 2015; Spickard et al. 2016).
Most programs went through repeated iterations of their dashboard designs to best support meaningful interpretation. Further, some schools incorporated narratives associated with student performance in clerkships to ground decisions on student progression and competency achievement. Members of the consortium collaborated to articulate critical technology needs in support of transformation (Stuart and Triola 2015; Spickard et al. 2016).

컨소시엄 스쿨은 학부 의학 교육(UME) 커리큘럼의 과정과 시기 사이의 [교육적 인계handover]를 발달적이고 순차적인 학습 진행을 지원하기 위해 필요하다고 간주했다. 과거의 '성과 사고방식performance mindset'(1986년 2월)에서 일부 기관은 학생의 성과에 대한 기대 편향에 대한 우려 때문에 [과정 간 커뮤니케이션]을 저해하고 있으며, 많은 학생들이 각 과정에 [깨끗한 슬레이트]로 들어가는 것을 선호하고 있다. 그러나 마스터 지향mastery orientation 은 학습의 자원으로서의 시간을 보다 목적적으로 사용할 수 있도록 개발 요구를 식별하기 위해 과정과 환경에 걸친 개별 성과 동향에 의존한다. 종단적 개발에 초점을 맞춘 컨소시엄 학교는 특정 역량에 주의를 집중함으로써 학생이 이미 참여하고 있는 주어진 과정이나 순환 내에서 개별화된 학습 계획을 실행할 수 있는 경우가 많다는 것을 발견했다. 경우에 따라, 학생들은 적절하게 목표된 경험을 향할 수 있다. [UME에서 GME로의 전환에 걸친 학습자 개발의 연속성]을 지원하기 위해서는 유사한 지원과 신뢰가 필요하다. 몇몇 컨소시엄 구성원은 졸업 시점의 역량 개발 커뮤니케이션 파일럿에 참여했다(Schiller et al. 2018). 컨소시엄 회원인 오리건 보건과학대학(OHSU)은 학생들이 매칭된 후 의사소통 과정을 구현하여 레지던스 시작 전에 GME 프로그램을 받는 학생 역량 성취도에 대한 업데이트를 제공한다. 컨소시엄의 연례 회의 중 하나가 이 주제에 몇 가지 세션을 할애하여 학습자를 성장 연속체에 참여시키기 위해 계획된 선택 후 UME-GME 핸드오버 프로세스의 핵심 요소에 대한 협업 출판물을 작성했습니다(Morgan et al. 2020).

Educational handovers between courses and phases in an undergraduate medical education (UME) curriculum were deemed by consortium schools as necessary to support a developmental, sequenced learning progression. In a historical ‘performance mindset’ (Dweck 1986), some institutions have discouraged communication across courses due to concerns about anticipatory bias regarding a student’s performance, and many students would prefer to enter each course with a clean slate. However, a mastery orientation relies upon trends in individual performance across courses and settings to identify developmental needs enabling a more purposeful use of time as a resource for learning. Consortium schools that focused on longitudinal development found that individualized learning plans could often be executed within any given course or rotation in which the student was already engaged by focusing attention to specific competencies. In some cases, students could be directed toward targeted experiences as appropriate. Supporting a continuum of learner development across the transition of UME to GME requires similar support and trust. Several consortium members participated in pilots of communication of competency development near the time of graduation (Schiller et al. 2018). Consortium member Oregon Health & Science University School of Medicine (OHSU) implemented a process of communication after students have been matched that provides the receiving GME program an update on student competency achievement prior to the start of residency. One of the consortium’s annual conferences devoted several sessions to this topic, resulting in a collaborative publication regarding key elements of an envisioned post-selection UME-GME handover process to engage learners in a continuum of growth (Morgan et al. 2020).

모든 것을 하나로 묶는 것
Bringing it all together

컨소시엄 구성원들은 그림 2와 같이 [CBME, 마스터 적응 학습, 코칭 및 학습 환경의 교차점]을 설명하기 위해 협력했습니다.

  • 마스터 적응 학습의 반복 주기를 중심으로 하는 CBME는 원하는 학습 결과에 대한 지침을 제공하고 시간이 지남에 따라 진전의 증거를 생성한다.
  • 코치는 각 사이클을 통해 학습자의 발전을 지원하고 학습자가 자기 방향성을 높일 수 있도록 사회적 지원을 제공합니다.
  • 학습 환경은 숙달 학습을 위한 적절한 물리적 및 가상 공간과 도구를 제공해야 하며 조직 수준에서 숙달 방향을 검증해야 한다.

Members of the consortium collaborated to describe the intersection of CBME, master adaptive learning, coaching, and the learning environment, as represented in Figure 2.

  • Centered around iterative cycles of master adaptive learning, CBME provides guidance regarding desired learning outcomes and generates evidence of progress over time.
  • Coaches support the learner’s advancement through each cycle and provide social support that positions the learner for increasing self-direction.
  • The learning environment must offer appropriate physical and virtual spaces and tools for mastery learning and must validate mastery orientation at an organizational level.

이러한 모델의 통합은 현재 코칭에 관한 컨소시엄의 교수 개발 프로그램에서 추진되고 있습니다.
This integration of models is now being promoted in the consortium’s faculty development programs on coaching.

 

역량 개발을 위한 시간 우선 순위 지정
Prioritizing time for competency development

CBME는 [시간]을 [학습의 척도]가 아닌 [학습의 자원]으로 취급하고 있으며, 발달이 시간변수적으로 진행되기 때문에, 타임라인에서 [유연성]을 창출하는 것은 구현의 충실도를 뒷받침하는 중요한 요소이다. 2년간의 기초과학교육에 이어 2년간의 임상연수를 거치는 미국의 전통적인 플렉스네리안 의료교육 모델은 이 두 분야의 발전을 인위적으로 분리하는 경직성을 갖고 있다. 의과대학 1학년 때부터 능동적인 학습 양식과 임상 기회를 통합하면 학생들은 훨씬 더 일찍 광범위한 역량 영역을 개발하기 시작할 수 있다. 학생들에게 이 관계를 명확히 하는 것이 중요합니다. 학생의 [지식 학습]은 환자들에게 적용하기 위함이며, 학생이 [교육 팀에서의 보이는 행동]은 [임상 팀에서 보이는 행동]의 전조이다; 교실은 모든 영역을 연습할 수 있는 안전한 공간이다. 성공적인 CBME 프로그램은 첫 해부터 의미 있는 임상 역할을 통합하여 여러 역량에 걸쳐 학생들의 학습을 더 잘 통합합니다.

Because CBME treats time as a resource for learning rather than a measure of learning and development progresses in a time-variable manner, creating flexibility in timelines is a critical element to support fidelity of implementation. The traditional Flexnerian model of medical education in the U.S., with two years of basic science training followed by two years of clinical work, has a rigidity that artificially separates development in these two spheres. Incorporating active learning modalities and clinical opportunities starting in the first year of the medical school enables students to begin developing the full breadth of competency domains much earlier. It is important to make this connection clear to students – that their knowledge learning is for application with patients and their behavior in their educational teams is a precursor to their behavior on clinical teams; the classroom is a safe space to practice all the domains. Successful CBME programs incorporate meaningful clinical roles from the first year to better integrate students’ learning across competencies.


미국에서 학생들의 발전 시간을 본질적으로 빼앗는 [외부 장벽]은 레지던트 직책에 대한 학생들을 선발할 때 USMLE Step 1 시험의 점수를 크게 강조하는 것이었다. USMLE step 1은 원래는 의대생이나 졸업생들이 기초과학의 중요한 개념을 의학의 실천에 적용할 수 있는지를 평가하는 것을 목표로 한다. USMLE step 1의 사용은 학생들이 시험이 치러질 때까지 다른 능력 영역의 우선 순위를 낮추도록 만들었다. 다른 나라의 고위험 시험도 비슷한 영향을 미칠 가능성이 높다. 학생들은 교육과정의 변화가 면허시험 수행이나 전공의 선발 경쟁력에 위험을 초래할 수 있다고 인식될 때 불안감을 경험한다. 일부 컨소시엄 학교에서는 [시간 변경]을 시범적으로 실시해 학생들이 [핵심 임상실습]을 마친 후 이 시험을 치르도록 장려하여 지식과 임상 기술을 개발하는 통합적인 성격을 강조하였다. 

An external barrier in the U.S. that essentially robs students of time for development has been a heavy emphasis on the scores on the United States Medical Licensing Examination (USMLE) Step 1 examination (which aims to assess whether medical school students or graduates can apply important concepts of the foundational sciences fundamental to the practice of medicine) in selecting students for residency positions. Use of this metric has driven students to de-prioritize other domains of competency until that exam has been taken. It is likely that high-stakes exams in other countries have similar impacts. Students experience anxiety when changes in curriculum and assessment are perceived to create a risk to performance on licensing examinations or competitiveness for residency selection (Yengo-Kahn et al. 2017). Some consortium schools piloted a shift in timing, encouraging students to take this examination after completing their core clerkships to emphasize the integrated nature of developing knowledge and clinical skill sets; students at these schools attained higher scores (Daniel et al. 2017; Jurich et al. 2019).

USMLE의 대표가 참여한 2018년 컨소시엄 컨퍼런스는 Step 1 점수가 역량 개발에 미치는 영향에 대한 우려를 강조했습니다. 이는 AMA, AAMC, ECFMG 및 USMLE 모기관인 FSMB와 NBME(USMLE 2019)가 공동으로 후원하는 2019년 이해관계자 컨퍼런스인 InCUS에 박차를 가하는 데 도움이 되었다. 이번 시험의 점수를 심사 지표로 사용하는 것이 현재 미국 전공의 선발 과정과 관련된 많은 문제 중 하나일 뿐이라는 데 참석자들 사이에 공감대가 형성되었고, 이는 2022년부터 세 자릿수 점수에서 합격/불합격 모델로 보고서를 전환하려는 계획을 낳았다. 이러한 전환이 학생들의 경험 초기에 모든 역량 영역에 걸쳐 개발 시간을 효과적으로 재탈환할 수 있기를 바랍니다.

A consortium conference in 2018, which included representatives of the USMLE, highlighted concerns about the impact of Step 1 scoring on competency development. This helped to spur InCUS, a stakeholder conference in 2019 (USMLE 2019), jointly sponsored by the AMA, the Association of American Medical Colleges (AAMC), the Educational Commission for Foreign Medical Graduates (ECFMG), and the USMLE parent organizations, the Federation of State Medical Boards and the National Board of Medical Examiners (USMLE 2019). There was consensus among participants that use of scores on this examination as a screening metric is only one of many problems associated with the current process of selection for residency in the U.S., however, this did result in plans to transition reporting from a 3-digit score to a pass/fail model starting in 2022. Hopefully, that transition will effectively recapture time for development across all competency domains early in students’ experiences.

미국에서 시간변수 CBME를 시행하는 것은 기존의 경쟁적인 전공의 자리 선발 과정과 관련된 또 다른 중요한 장벽에 직면해 있다. 비록 전환 과정이 다른 나라들에서 다르긴 하지만, 비슷한 압력은 모든 곳에서 학생들의 행동에 영향을 미칠 수 있다. 학생들은 경쟁력있는 이력서competitive resume를 짜야 한다는 압박감을 느끼는데, 이는 역설적으로 학습자들이 더 나은 의사가 되기 위한 그들의 학습 욕구를 드러내는 것보다, [서류상으로 잘 보이는 것]을 우선시해야 한다고 느끼기 때문에 발전을 방해할 수 있다. 경쟁적인 선발 과정은 한 학생이 원하는 전공에서 [여러 번의 '오디션'용 로테이션]을 이수하는 것과 [몇 달 동안 면접에 전념]하는 과정에서 [3-6개월의 교육 시간]을 방해한다. 이러한 이행transition에 대한 수많은 우려는 InCUS 회의 동안 명확히 드러났으며, 이 회의에서는 현재 프로세스가 어떠한 이해 관계자에게도 도움이 되지 않는다는 데 의견이 일치했다. The Coalition for Physician Accountability은 최근 UME-GME 심사 위원회에 의뢰하여 현재 전공의 지원 및 선발 과정의 유해한 노력을 조사했습니다(CPA 2021). [가속된 3년 트랙]은 일반적으로 공식적인 미국 매칭 프로세스에서 예외를 찾고 참여 학생에게 홈 기관(본교)의 전공의 지위를 보장한다는 점이 눈에 띈다. 선발 과정에 대한 시간 손실을 피함으로써, 이러한 가속화된 경로에서의 훈련 시간은 기존의 경로보다 몇 달만 더 짧아진다.

Implementing time variable CBME in the United States faces another significant barrier related to the existing competitive process of selection for residency positions. Although processes of transition differ in other countries, similar pressures likely influence student behavior everywhere. Students feel pressured to assemble a competitive resume, which may paradoxically hamper development as learners feel compelled to prioritize looking good on paper over revealing their learning needs toward becoming a better physician. The competitive process for selection disrupts 3–6 months of educational time for each student, between completing multiple away ‘audition’ rotations in one’s desired specialty and devoting several months to interviews. Numerous concerns about this transition point were articulated during the InCUS conference, in which there was consensus that the current process is not serving any stakeholders well. The Coalition for Physician Accountability has recently charged a UME-GME Review Committee to examine the deleterious efforts of the current residency application and selection process (CPA 2021). It is notable that accelerated 3-year tracks typically seek exception from the formal U.S. matching process and guarantee participating students residency positions at the home institution; by avoiding time lost to the selection process, training time in these accelerated pathways effectively becomes only a few months less than the traditional pathway.

많은 컨소시엄 학교에서 사용한 전략 중 하나는 [임상 실습 전 단계]의 기간을 줄이고, 학생들의 경험에서 [핵심 임상실습]을 더 일찍 배치하는 것이었다. 3학년 6월에 핵심 사무원직을 마치고, 9월에 레지던트 신청서를 제출하기 전에, 몇 번의 고급 임상 순환을 서둘러 완료하기보다는, 이러한 학교의 학생들은 핵심 사무원 직책 이후 진로 탐색을 위해 4-6개월을 추가로 얻을 수 있으며, 지원 주기가 시작되기 전에 역량 개발에 집중할 수 있습니다. 이 구조는 성과 증거와 개별 관심사에 의해 주도되는 개별화된 경로에 대해 post-clerkship 단계에서 더 많은 유연성을 제공한다.

One strategy used by many consortium schools was to reduce the length of the pre-clerkship phase and position the core clerkships earlier in the students’ experience. Rather than completing core clerkships in June of the third year then hustling to complete a couple of advanced clinical rotations before submitting residency applications in September, students at these schools gain an additional 4–6 months for career exploration after the core clerkships and can focus on rounding out competency development before the application cycle begins. This structure provides more flexibility in the post-clerkship phase for individualized pathways driven by performance evidence and individual interests.

GME로의 전환 시점이 단일한 것도 추가적인 과제입니다. 곰곰이 생각해 보면, 3만 명 이상의 교육생들이 전국적으로 동시에 전환되는 시스템을 갖는 것은 이상해 보인다. 아마도 더 나은 데이터가 있다면, 전환을 위한 여러 표준화된 시점을 구현할 수 있을 것이다. 강력한 CBME 프로그램을 시행한 컨소시엄 학교는 훈련의 초기 시점에 인턴십의 의무를 수행할 준비가 된 학생들의 하위 집합을 식별할 수 있었다. 컨소시엄의 한 학교인 OHSU는 이 학생들을 일찍 졸업시켜 등록금 부담을 줄였고 심지어 일부 졸업생들이 예정보다 일찍 그들 자신의 기관 내에서 GME 교육을 시작할 수 있도록 허용했다. 다른 학교들은 그들이 갈 곳이 없기 때문에 이 지원자들을 일찍 졸업시키지 않았고, 몇 달 동안 활동을 하지 않은 것은 성과를 유지하는 데 도움이 되지 않는 것처럼 보였다. 
The single time point of transition into GME is an added challenge. On reflection, it does seem odd to have a system in which over 30,000 trainees transition simultaneously across the country; perhaps with better data, multiple standardized time points for transition could be implemented. Consortium schools that implemented robust CBME programs were able to identify a subset of students who were ready for the duties of internship at earlier time points in training. One school in the consortium, OHSU, did graduate these students early, reducing their tuition burden and even allowing some graduates to begin GME training within their own institution ahead of schedule (Mejicano and Bumsted 2018). Other schools did not graduate these candidates early because there was nowhere for them to go, and months of inactivity did not seem beneficial to sustaining performance.

졸업생의 [재정지원 손실과 대출상환 유예]도 위험요인이다. 그 학교들은 지속적인 성장을 촉진하기 위해 home institution에서 advanced, value-added 경험을 제공하려고 노력했다. UME에서 GME로의 전환에 대한 변화를 탐구하기 위하여 the Coalition for Physician Accountability이 곧 완료할 작업은 CBME 모델에서 가치 있는 지속적인 학습 궤적을 더 잘 지원할 수 있는 현재 선발 프로세스를 통해 과제를 해결할 수 있는 기회를 제공한다. AMA는 CBME 이행의 완전한 충실도를 지원하는 구조를 만들기 위해 의과대학에서 GME로, 그리고 GME에서 펠로우십 또는 실습으로 전환되는 여러 시점과 같은 시스템 변화를 장려하는 옹호 역할을 맡았다(Nousiainen et al. 2020).
Loss of financial aid and loan repayment deferral for graduated students is also a risk. Those schools tried to provide advanced, value-added experiences within the home institution to promote ongoing growth. The upcoming work of the Coalition for Physician Accountability to explore changes to the UME to GME transition offers the opportunity to address challenges with the current selection process that would better support the continued learning trajectory valued in a CBME model. The AMA has taken on an advocacy role, encouraging systemic changes – such as multiple time points of transition across institutions from medical school into GME and from GME into fellowship or practice – to create a structure that supports full fidelity of implementation of CBME (Nousiainen et al. 2020).

결론
Conclusion

UME에서 CBME를 구현하는 것은 개인, 시스템 및 문화를 위한 거대하고 지속적인 변화 과정이다. AMA 컨소시엄 스쿨의 경험은 각 기관이 제도적 사명, 특성, 변화에 대한 준비성 및 자원을 기반으로 구현 시 서로 다른 도전과 기회를 어떻게 직면할 것인지를 강조한다. 그러나 서로 공유하는 과제와 기회를 중심으로 한 협업에는 이점이 있습니다. 컨소시엄 구성원들은 투쟁, 배운 교훈 및 자원 공유에 있어 투명성에 대한 헌신으로부터 이익을 얻었다. 특정 기관의 구현 전략의 구체적인 예(이 문서에 설명된 것 중 일부는)는 UME에서 CBME의 구현을 고려하는 다른 학교에 도움이 될 수 있다. 일부 기관은 CBME를 구현하는 데 필요한 교수 노력, 정보 기반 시설 및 문화 변화에 대한 상당한 투자로 인해 위축되고 마비되기보다는 혁신적 변화를 위해 노력하는 동안 반복적인 접근 방식을 채택할 수 있습니다. 
Implementing CBME in UME is an immense and ongoing change process for individuals, systems, and cultures. The AMA consortium schools’ experiences highlight how each institution will encounter different challenges and opportunities in implementation, based on institutional mission, characteristics, readiness for change, and resources. Yet, there is benefit to collaboration around shared challenges and opportunities. Members of the consortium benefitted from a commitment to transparency in sharing struggles, lessons learned, and resources. Concrete examples of implementation strategies at specific institutions – some described in this manuscript – may help other schools considering implementation of CBME in UME. Rather than be intimidated and perhaps even paralyzed by the significant investments in faculty effort, informatics infrastructure, and culture change needed to implement CBME, some institutions might embrace an iterative approach while striving for transformative change (Borkan et al. 2018).

[실행 충실도]에 대한 [투명성]을 유지하는 것은 결과를 이해하기 위해 필요하다. 우리는 구조를 현실화하는 데 있어 우리의 도전으로 인해 CBME의 개념적 가치를 무시할 수 없다. 컨소시엄 회원 기관의 경험을 바탕으로 CBME의 즉각적인 혜택으로 인식되는 것은 더 많은 지원이 필요한 학습자를 식별하고 개입할 수 있는 능력뿐만 아니라 환자 치료에 대한 더 큰 책임으로 발전할 준비가 된 학습자를 인식하고 가능하게 하는 능력이다. 지속적인 개선에는 평가 프로세스를 강화하고 기관 간에 비교 및 번역 가능한 역량 평가 프레임워크 및 데이터 관리 도구의 집단 개발을 통해 UME에서 GME로의 진정한 연속 개발을 지원하는 것이 포함됩니다. 기관은 학습자의 다운스트림 성과에 대한 결과를 계속 평가해야 한다. 의료 문화에 대한 지속적인 검토와 경력 전반에 걸쳐 전문적 개발을 진정으로 지원하는 인프라와 환경에 대한 옹호는 CBME의 완전한 잠재력을 실현하는 데 필수적일 것이다.

Maintaining transparency about the fidelity of implementation is necessary to understand outcomes; we cannot dismiss the conceptual value of CBME due to our challenges in bringing the construct to reality. Perceived immediate benefits of CBME based on the experience of consortium member institutions include the ability to identify and intervene with learners requiring more support as well as recognizing and enabling those ready to advance to greater responsibility for patient care. Ongoing improvements will include strengthening assessment processes and supporting a true continuum of development from UME to GME via the collective development of competency assessment frameworks and data management tools that are comparable and translatable across institutions. Institutions must continue to evaluate outcomes regarding the downstream performance of learners. Continued examination of the culture of medicine and advocacy for infrastructures and environments that truly support professional development across one’s career will be essential to realizing the full potential of CBME.


Med Teach. 2021 Jul;43(sup2):S7-S16. doi: 10.1080/0142159X.2021.1924364.

The critical role of infrastructure and organizational culture in implementing competency-based education and individualized pathways in undergraduate medical education

Affiliations collapse

Affiliations

1Medical Education Outcomes, American Medical Association, Chicago, USA.

2School of Medicine, Oregon Health and Science University, Portland, USA.

3College of Medicine, University of Nebraska, Omaha, USA.

4Medical School, University of Michigan, Ann Arbor, USA.

5Department of Pediatrics, Harvard Medical School, Boston, USA.

6School of Medicine, University of California, San Francisco, San Francisco, USA.

PMID: 34291715

DOI: 10.1080/0142159X.2021.1924364

Abstract

In 2010, several key works in medical education predicted the changes necessary to train modern physicians to meet current and future challenges in health care, including the standardization of learning outcomes paired with individualized learning processes. The reframing of a medical expert as a flexible, adaptive team member and change agent, effective within a larger system and responsive to the community's needs, requires a new approach to education: competency-based medical education (CBME). CBME is an outcomes-based developmental approach to ensuring each trainee's readiness to advance through stages of training and continue to grow in unsupervised practice. Implementation of CBME with fidelity is a complex and challenging endeavor, demanding a fundamental shift in organizational culture and investment in appropriate infrastructure. This paper outlines how member schools of the American Medical Association Accelerating Change in Medical Education Consortium developed and implemented CBME, including common challenges and successes. Critical supporting factors include adoption of the master adaptive learner construct, longitudinal views of learner development, coaching, and a supportive learning environment.

Keywords: CBME; UME; Undergraduate medical education; coaching; competency-based medical education; learning environment; master adaptive learner.

평가자의 합격선설정과정에 대한 이해와 수행능력을 지원하기 위한 피드백(Med Teach, AMEE Guide No. 145)
Feedback to support examiners’ understanding of the standard-setting process and the performance of students: AMEE Guide No. 145 
Mohsen Tavakola, Brigitte E. Scammella and Angela P. Wetzelb

 

서론
Introduction

인간이 다른 인간을 평가하는 경우, 많은 요소들이 그들의 주관적인 판단을 흐리게 할 수 있다. 평가된 콘텐츠 영역의 불확실성 또는 평가 상황에서 입증되는 예상 지식 및 기술 수준에 대한 명확성의 결여는 측정 오류를 초래할 수 있는 잠재적인 편견의 원천이다. 교육 시스템에서, 정확한 학생 평가는 어려울 수 있지만 공정한 측정을 위해 필수적이며 학생들의 점수에서 적절한 추론을 도출할 수 있도록 보장하는 데 필수적이다.

In instances where humans rate other humans, many factors can cloud their subjective judgments. Uncertainty in the content area assessed personal biases or lack of clarity on expected levels of knowledge and skills demonstrated in a rating situation are potential sources of bias that may lead to measurement error. In educational systems, accurate student assessment can be challenging but is essential for fair measurement and is essential to ensuring appropriate inferences can be drawn from students’ scores.

'[공정성]은 [시험 응시자의 구인-무관한 개인적 특성]이 [시험 결과나 해석]에 유의미한 영향을 미치지 않도록 요구한다.' (ETS) 2002. 구성-무관 분산CIV은 체계적인 측정 오류의 원인입니다(Haladyna 및 Downing 2005). CIV는 관련 성과 측정과 무관한 체계적인 오류로서, 인플레이션이나 등급 하락으로 인해 실제 점수에 영향을 미칠 수 있다(Lord and Novick 1968). 또한 체계적인 오류는 점수의 오역misinterpretation으로 이어져 시험 점수의 타당성을 제한할 수 있다.
‘Fairness requires that construct-irrelevant personal characteristics of test-takers have no appreciable effect on test results or their interpretation’ (Educational Testing Service (ETS)) 2002). Construct-irrelevant variance is a source of a systematic measurement error (Haladyna and Downing 2005). This systematic error, unrelated to measuring the relevant performance, can influence true scores due to inflation or deflation of ratings (Lord and Novick 1968). Further, systematic errors can lead to misinterpretation of scores, limiting test score validity.

객관 구조화 임상 검사(OSCE)와 입학 OSCE(MMI)는 [체계적인 오류systematic errors]로부터 면역되지 않는다. 예를 들어, 이러한 의료 교육 맥락에서,

  • 스테이션 불규칙성 또는 스테이션의 결함
  • 일반적인 평정 오류(예: 관용 오류, 심각도 오류, 중심 경향 오류, 후광 효과, 불일치),
  • 하위 그룹을 위해 제작된 스테이션의 불공정성
  • 강건한 합격점의 결여

...은 모두 구성 무관 분산CIV의 잠재적 원천이다. CIV는 다음의 것들을 저하시킬 수 있다.

  • 시험 점수 해석의 관련성과 적절성,
  • 시험 점수에 기초한 결정의 정당성
  • 시험 점수에 대한 외부 타당성 증거

Objective Structured Clinical Examinations (OSCEs) and admission OSCEs (Multiple Mini- Interviews) are not immune from systematic errors. For example, in these medical education contexts,

  • station irregularities or flawed stations,
  • common errors in ratings (e.g. generosity error, severity error, central tendency error, halo effect, inconsistency),
  • the unfairness of stations crafted for subgroups, and
  • a lack of a robust pass mark

...are potential sources of construct-irrelevant variance. The sources of construct-irrelevant variance could minimise

  • the relevance and appropriateness of test score interpretations,
  • the legitimacy of a decision based on test scores and
  • the external validity evidence for test scores (Downing 2002).

CIV에 기여하는 대부분의 오류는 [각 검사자가 학생 및 검사자 간의 성과 등급에 대한 데이터를 받는] [검사자 교육 및 개별화된 교정 피드백]을 통해 최소화할 수 있다. [개별화된 피드백]은

  • 동일한 학생을 평가하는 여러 평가자의 일관성을 개선하고,
  • 관찰자 간 신뢰성과 공정성을 지원하며,
  • 점수 해석에 대한 신뢰도를 높일 수 있다.

Most of the errors that contribute to construct-irrelevant variance can be minimised through examiner training and individualised calibration feedback where each examiner receives data on their performance ratings across students and between examiners. Individualised feedback could

  • improve the consistency of multiple raters assessing the same student,
  • supporting inter-observer reliability and fairness, and
  • enhancing confidence in score interpretations.

[공정한 평가]는 '모든 시험 응시자에 대해 [동일한 구인]을 반영하며, 그 결과 점수는 [의도된 모집단의 모든 개인]에게 [동일한 의미]를 갖는다'(American Educational Research Association, A. P. A. & National Council on Measure in Education 2014)이다. 이 가이드의 목적은 평가를 공정하고 유효하며 신뢰할 수 있도록 하기 위한 노력으로 [학생 성과 및 표준 설정 프로세스]에 대한 [examiner의 관찰과 평가]를 지원하기 위해 [개인화된 피드백]을 위한 다양한 방법을 제공하는 것이다. 여기에는 심사관의 성과 변동성, 경계선 학생, 등급 정확도, 등급 정확도 향상을 위한 피드백, 표준 설정자와 OSCE 심사관 모두를 위한 다양한 접근 방식을 사용하는 심판에게 피드백을 시각화하는 내용이 포함된다.

A fair assessment is one that ‘reflects the same construct(s) for all test takers, with scores from it having the same meaning for all individuals in the intended population’ (American Educational Research Association, A. P. A., & National Council on Measurement in Education 2014). The purpose of this Guide is to provide various methods for individualised feedback to support examiners’ observations and evaluations of student performance and the standard-setting process with an effort to make assessments fair, valid and reliable. It will cover the following topics:

  • performance variability of examiners,
  • the borderline students,
  • rating accuracy,
  • feedback to improve rating accuracy,
  • visualising feedback to judges using different approaches, both for standard setters and OSCE examiners.

심사관의 성과 변동성
Performance variability of examiners

학생들의 실력을 평가할 때, 많은 요소들이 [학생들의 진점수true score]에 영향을 미친다. OSCE 시험에서, 이상적으로, 학생들의 성과는 그들이 글로벌 등급 척도 및 체크리스트 점수로 받은 등급과 일치해야 한다. 그러나 [민족성, 성별, 시험관 엄격성/관용성, 측정되는 현상과 관련한 시험관 배경]과 같은 [평가자의 인구통계학적 특성]이 학생 점수에 영향을 미칠 수 있기 때문에 편향이 발생할 수 있다. 이러한 [평가자 특성]은 측정에 구성 무관 분산CIV을 추가하여 실제 점수에 비해 점수가 증가하거나 감소할 수 있습니다. [학생 수행]은 학생의 평가 등급이 [학생의 수행]보다 [평가자의 특성]이 더 반영되는, [독특한 평가자 효과idiosyncratic examiner effect]의 함수가 되어서는 안 된다. 결과 점수는 학생의 성과를 반영해야 하며, [독특한 검사 경험의 영향]을 최소화해야 한다. 시험관은 [합격선 설정] 및 [학생 성취도 측정] 모두에서 중요한 역할을 하므로, 각 역할에 대한 교육은 두 영역 모두에서 중요하며 별도로 논의된다.

In assessing students’ skills, many factors affect the true score of students. In OSCE exams, ideally, student performance should be matched with the ratings that they receive from the global rating scale and checklist scores. However, this may not happen as examiner demographic characteristics, such as ethnicity, gender, examiner stringency/leniency, and examiner background with the phenomenon being measured may affect student scores. Such examiner characteristics could add construct-irrelevant variance to measurement, resulting in increased or decreased scores relative to the true score. Student performance should not be a function of the idiosyncratic examiner effect, where the examiner rating of a student is a reflection of their characteristics rather than the student’s performance. Outcome scores should reflect student performance and be affected minimally by the idiosyncratic examiner experience. Examiners play an essential role in both setting the standard and measuring student performance; therefore, training for each role is important in both areas and is discussed separately.

표준 설정
Standard-setting

[합격선 설정 과정]은 지식 기반 테스트와 OSCE를 포함하여, 표준 설정자가 특정 테스트에 대한 합격점을 계산하는 방법을 포함한다. 평가 제공자, 학생 및 평가 결과 이용자의 마음속에 있는 질문은 '얼마면 충분할까?'이다(Cusimano 1996). 표준 설정자들은 [능력 있는 사람]과 [능력 없는 사람]을 구별하는 기준을 설정하기 위해 다른 방법을 사용한다. 알려진 표준 설정 방법이 다른 곳에서 잘 설명되기 때문에, 여기서는 설명하지 않는다. 관심 있는 독자는 다른 AMEE 가이드(Ben-David 2000; McKinley and Norcini 2014)에서 표준 설정 방법에 대한 추가 정보를 찾을 수 있습니다.

The standard-setting process involves a method in which standard setters calculate a pass mark for a particular test, including knowledge-based tests and OSCEs. The question in the minds of assessment providers, students and users of assessment outcomes is ‘how much is enough?’ (Cusimano 1996). Standard setters use different methods to establish the standard to discriminate competent from incompetent. Given that the known methods of setting standards are well described elsewhere, they are not discussed here. Interested readers can find further information about standard-setting methods in other AMEE Guides (Ben-David 2000; McKinley and Norcini 2014).

경계선 그룹
The borderline group

[경계선에 있는 학생(때로는 최소 능력 학생minimally competent student으로 불림)]을 판단하는 것이 표준 설정 과정의 초석이다. 예를 들어, 앙고프 방법과 에벨 방법에서 표준 설정자들은 [가상의 경계선 그룹]의 특징을 선언한다. 다음으로, 그들은 경계선에 있는 학생이 [각 항목에 올바르게 답할 확률]을 추정합니다. 각 표준 설정자는 해당 그룹에 대한 자체적인 자의적 판단을 가지고 있습니다. 우리가 아는 한, 표준 설정 문헌에는 경계선이나 최소한의 능력 있는 학생에 대한 [경험적 정의가 없다]. 전형적으로 합격점 주변에 성적 수준이 있는 학생들은 경계선 그룹이지만, 경계선 그룹을 경험적으로 연구하기 위해서는 얼마나 가까운지(예: 1% 이내, 2% 이내 또는 표준 측정 오차(SEM))에 대해 [임의의 범위]를 만들어야 한다. 예를 들어, 합격 표시 주변의 경계선 점수 범위를 식별할 수 있습니다. 다음으로, 1 SEM 이하에서 1 SEM 이상까지의 범위에 있는 학생은 경계선으로 간주됩니다.
Judging a borderline student (sometimes called a minimally competent student) is the cornerstone of the standard-setting process. For example, in the Angoff method and the Ebel method, standard setters declare the features of a hypothetical borderline group of students. Next, they estimate the probability that a borderline student will answer each item correctly. Each standard-setter has their own arbitrary judgment of that group. To our knowledge, there is no empirical definition of borderline or minimally competent students in the standard-setting literature. Typically, the students who have a performance level around the pass mark are the borderline group, but we have to make an arbitrary range for how close, (e.g. within 1%, 2% or within a standard error of measurement (SEM)) in order to study the borderline groups empirically. For example, we could identify a range of borderline scores around the pass mark. Next, students who lie within the range from one SEM below to one SEM above the pass mark are considered borderline.

표준 설정 문헌에서는 '경계선 또는 최소 역량'의 개념에 대한 의문이 제기되어 왔다. 예를 들어, 표준 설정자는 정확하고 일관된 표준을 확립할 수 있는 능력을 가지고 있는가? (Glass 1978). [표준 설정자]나 [표준 설정 방법]이 변경되면 합격 점수가 영향을 받아 합격점의 신뢰성과 안정성에 부정적인 영향을 미칠 수 있다(Meskauskas 및 Webster 1975). 더 중요한 것은, 구인 무관 분산CIV이 측정에 도입될 수 있다는 것이다. 계산된 표준이 합리적이고 방어 가능한 결과를 생성하는 경우(합격 횟수가 너무 많거나 실패 횟수가 많지 않은 경우) 변덕스럽지 않은 표준을 보장하기 위해 표준 설정 문헌에 알려진 방법을 따를 필요가 있다(예: Cizek 2006, Skorupski 2012). Standards for Educational and Psychology Testing 는 이렇게 말한다:
Questions about the concept of ‘borderline or minimal competence’ have been raised in the standard-setting literature. For example, do standard setters have the ability to establish an accurate and consistent standard? (Glass 1978). When the standard setters or standard-setting methods are changed, the passing score can be affected, negatively impacting the credibility and stability of the pass mark (Meskauskas and Webster 1975). More importantly, the construct-irrelevant variance may be introduced to measurement. To ensure standards that are not capricious, where the calculated standard produces a reasonable and defensible outcome (not too many passes and not too many fails), it is necessary to follow the known methods in the standard-setting literature (e.g. Cizek 2006, Skorupski 2012). Standards for Educational and Psychology Testing state:

  • 합격선 설정 절차를 따른다면,
    • 채택된 방법을 명확히 기술하고,
    • 요구된 판단의 정확한 성격을 제시해야 한다.
    • 절차의 문서화 시에는 다음을 포함해야 한다.
      • Judges의 선택과 자격,
      • 제공되는 훈련,
      • 임시 판결의 함의에 대한 심판에게 주어진 피드백,
      • 판결자가 서로 협의할 수 있도록 주어진 기회
    • 해당되는 경우 판결자의 변동성variability over judges을 보고해야 한다.
    • 가능하다면, 만약 이 합격선 설정 절차를 [반복할 경우에 예상할 수 있는 컷 점수 변동의 양에 대한 추정치]가 제공되어야 한다.
  • ‘If a judgmental standard-setting process is followed,
    • the method employed should be clearly described, and
    • the precise nature of the judgments called for should be presented.
    • Documentation should also include
      • the selection and qualification of judges,
      • training provided,
      • any feedback to judges concerning the implications of their provisional judgments, and
      • any opportunities for judges to confer with one another.
    • Where applicable, variability over judges should be reported.
    • Whenever feasible, an estimate should be provided of the amount of variation in cut scores that might be expected if the standard-setting procedure were replicated’ (American Educational Research Association, A. P. A., & National Council on Measurement in Education 2014).

앙고프법
Angoff method

판단적 접근법(네델스키 1954; 앙고프 1971; 에벨 1979; 예거 1989) 내에서 [앙고프 표준 설정 방법]은 의학 교육 평가에 널리 사용되고 있으며, 계산된 합격 앙고프 점수는 [허용 가능한 성과]와 [허용되지 않는 성]과 사이의 경계로 이어진다. 앙고프 방법의 기원은 앙고프가 아니라 레드야드 터커(미국 심리학자)에게 있다. 그러나 1971년 Angoff는 Educational Measurement 라는 책의 각주에 각 표준 설정자가 다음과 같이 진술하도록 요청받는 절차를 썼다.
Within the judgmental approaches (Nedelsky 1954; Angoff 1971; Ebel 1979; Jaeger 1989), the Angoff standard-setting method is widely used in medical education assessment, and the calculated passing Angoff score leads to the boundary between the acceptable and unacceptable performance. The origin of the Angoff method lies not with Angoff, but Ledyard Tucker (American Psychometrician); yet, in 1971, Angoff, wrote in a footnote in the book Educational Measurement a procedure in which each standard setter is asked to state:

  • '최소한의 수용가능한 사람'이 각 항목에 정확하게 답할 확률'. 실제로, judges은 그러한 한 사람만이 아닌, [다수의 최소 수용 가능한 사람들]을 생각할 것이고, [정답을 맞출 수 있는 최소 수용 가능한 사람들의 비율]을 추정할 것이다. 이러한 확률 또는 비율의 합은 최소 허용 점수를 나타냅니다(515페이지).
  • ‘the probability that the “minimally acceptable person” would answer each item correctly. In effect, the judges would think of a number of minimally acceptable persons, instead of only one such person, and would estimate the proportion of minimally acceptable persons who would answer correctly. The sum of these probabilities, or proportions, would then represent the minimally acceptable score, (p. 515)’

Angoff의 운영 정의는 이 접근법의 단순성을 보여주지만, 이 접근 방식은 표준 설정자가 경계선 학생에 대해 갖는 주관적 해석에서 오류의 위험에 남아 있다. 또한, 경험적 연구에 따르면 표준 설정자는 [항목에 대한 경계선 학생의 성과를 과소평가하거나 과대평가]하여, 경계선 학생을 정확하게 평가하는 데 어려움을 겪고 있다(Impara and Plake 1998; Goodwin 1999; Clauser et al. 2002; Clauser et al. 2008). 이는 Angoff 접근 방식이 '임의적이고 명확성이 부족함'임을 시사한다(Stone et al. 2011).
Angoff’s operational definition shows the simplicity of this approach, and yet the approach remains at risk of error in the subjective interpretations that standard setters have of borderline students. Further, empirical studies show that standard setters struggle to accurately rate borderline students, underestimating or overestimating the performance of borderline students on items (Impara and Plake 1998; Goodwin 1999; Clauser et al. 2002; Clauser et al. 2008), suggesting the Angoff approach to be ‘random and lacking in clarity’ (Stone et al. 2011).

경계선 그룹과 Angoff 방법 접근법에 대한 이러한 비판은 표준 설정자 간의 변동variation이 [설정될 표준]을 손상시킬 수 있고, 따라서 평가된 점수의 정확성을 손상시킬 수 있다는 사실에 관심을 갖게 한다. 즉, 표준 설정자의 통과 점수 사이에 상당한 차이가 있을 경우 이러한 방법을 사용하지 말아야 함을 시사한다.
These criticisms of the borderline group and Angoff method approaches draw our attention to the fact that the variation among standard setters could compromise the set standard and thus the accuracy of assessed scores, suggesting these methods should not be used if there is a significant difference between the standard setters’ passing scores.

등급 정확도를 높이기 위한 표준 설정자에 대한 피드백
Feedback for standard-setters to improve rating accuracy

표준 설정자 교육은 표준 설정 프로세스의 필수적인 부분이며, 피드백은 훈련의 필수적인 부분입니다. 표준 설정자에게 피드백을 제공하는 것은 측정 오차의 영향을 더 잘 이해하고(또는 적어도 고려하고), 안정적인 표준을 추정할 수 있는 기회를 제공한다(Recase 및 Chen 2012). Angoff 방법과 경계선 그룹 접근법으로 이전에 논의된 한계를 고려할 때, 표준 설정자의 성능에 대한 피드백은 후속 검사 정확도에 긍정적인 영향을 미칠 수 있다. 특히, 표준 설정자 내 불일치intrastandard-setter discrepancies [(무효 항목의 출처), (린덴 1982)]는 표준 설정자 간 결과를 공유하여 식별할 수 있다. 이러한 피드백 데이터는, 그 자료를 개별로 검토하고 그룹 토론을 통해 보정함으로써, 경계 그룹 및 컷 스코어 설정을 개선할 수 있습니다. 표준 설정자에게 [다른 표준 설정자에 대한 등급과 비교한 피드백]을 제공하면 합격 표시에 부착된 오류를 줄일 수 있다. 또한 피드백을 통해 표준 설정자는 추정 합격 점수를 신뢰할 수 있고 방어할 수 있는지 확인하고 [앙고프 등급]의 신뢰성과 유효성을 개선할 수 있다.

Standard-setter training is an integral part of the standard-setting process, and feedback is an essential part of the training. Giving feedback to standard setters provides an opportunity for them to understand better the impact of measurement error (or at least consider it) and estimate a stable standard (Reckase and Chen 2012). Given the previously discussed limitations with the Angoff method and borderline group approach, feedback on standard setters’ performance may have a positive effect on subsequent examiner accuracy. Specifically, intrastandard-setter discrepancies [(a source of invalidating items), (Linden 1982)], can be identified with results shared with standard setters. These feedback data, reviewed at the individual level and calibrated through group discussion, can improve borderline group and cut score setting. Providing standard setters with feedback about their ratings relative to other standard setters may reduce the error attached to the pass mark. Furthermore, feedback allows standard setters to ensure that the estimated passing scores are credible and defensible and improve the credibility and validity of Angoff ratings.

[피드백의 목적]과 [표준 설정자에 대한 이러한 방법이 얼마나 소화 가능한지]에 따라, 피드백을 제공하는 여러 가지 접근법이 있다. 전반적으로, 피드백의 궁극적인 목표는 표준 설정자들이 [경계선 학생들의 개념화]에 대한 그들의 [등급을 재고할 수 있는 기회]를 제공하는 것이다. 피드백은 [계산된 합격점수]가 아니라 [심판들judges의 변동성]에 초점을 맞춰야 한다는 점에 유의해야 한다(Hambleton et al. 2012). 피드백은 표준 설정자가 항목을 검토 및 토론하고 경계선 학생을 위한 항목 추정치를 작성할 때 표준 설정자에게 제공될 수 있으며, [표준 설정 회의]를 시작하기 전의 공식 훈련시간 중에 피드백을 공유할 수 있다. 자세한 내용에 관심이 있는 독자는 AMEE Guide No 119(타바콜과 데닉 2017)를 참조할 수 있다. 아래에서, 우리는 다른 접근 방식을 가진 피드백의 형태에 대해 논의한다. 시각화된 모든 데이터는 가상적이며 R 프로그래밍 코드로 작성된다는 점에 유의해야 한다. 프로그래밍 코드로부터 더 많은 정보를 수신하는 데 관심이 있는 사람들은 해당 작성자에게 연락할 수 있다.
There are several approaches to provide feedback, depending on the purpose of the feedback and how digestible these methods are for standard setters. Overall, the ultimate goal of feedback is to provide an opportunity for standard setters to reconsider their ratings on borderline students’ conceptualisation. It should be noted that feedback should focus on judges' variability, not the calculated pass mark (Hambleton et al. 2012). Feedback could be provided to standard-setters at the time they review and discuss items and make item estimates for borderline students, or feedback could be shared during formal training prior to starting the standard-setting meeting. Readers interested in more details can refer to AMEE Guide No119 (Tavakol and Dennick 2017). Below, we discuss the forms of feedback with different approaches. It should be noted that all visualised data are hypothetical and written with R programming codes. Those who are interested in receiving more information from the programing codes may contact the corresponding author.

기술 통계량
Descriptive statistics

표준 설정자 피드백을 포함하여, 모든 연구의 데이터에 대한 [기술 통계]는 데이터 시각화를 용이하게 하므로 결과에 대한 간단한 해석을 제공한다. 표준 설정자와 평균 항목 난이도를 포함한 학생들의 수행에 대한 서술적 통계를 공유하면 피드백 과정에 도움이 될 수 있다. 합격점을 나타내는 그래프 내에 수직선과 함께 학생들의 점수 분포의 히스토그램 그래프를 그리면 심사위원들은 그들이 설정한 합격점과 관련하여 학생들의 점수 분포를 더 깊이 이해할 수 있다. 가장 중요하게는, [항목과 시험의 평균 항목 난이도 값을 제공]하는 것은 표준 설정자들에게 [시험이 얼마나 어려운지]를 말해준다. 표준 설정자는 평균 항목 난이도(전체 시험의 난이도)를 기준으로 개별 항목의 난이도를 비교할 수 있었다. 게다가, 그들은 확립된 합격 점수와 문항들의 평균 난이도를 비교할 수 있다. 난이도 항목 지수는 AMEE Guide No. 54번에서 객관적 시험의 사후 분석(Tavakol and Dennick 2011)에 설명되어 있다.
Descriptive statistics of data in any research study, including standard-setters feedback, facilitate data visualisation and thus provide a simple interpretation of the results. Sharing the descriptive statistics of students’ performance, including the mean item difficulty with standard setters, can help in the feedback process. Plotting a histogram graph of students’ mark distribution along with a vertical line within the graph indicating the passing mark allows judges to gain a deeper understanding of the distribution of students’ marks in relation to the passing mark they established. Most important, providing the mean item difficulty value of the items and test tells the standard-setters how difficult the test was for the students. Standard setters could compare individual items’ difficulty based on the mean item difficulty (the overall test’s difficulty). In addition, they can compare the established passing score with the average difficulty of the questions. In AMEE Guide No. 54, the difficulty item index is explained in the Post-Examination Analysis of Objective Tests (Tavakol and Dennick 2011).

 

오차 막대 차트
Error-bar charts

[오차 막대]는 표준 설정자에게 피드백을 제공하는 강력한 도구입니다. 오류 막대를 사용하면 표준 설정자가 제공하는 Angoff 등급을 비판적으로 평가할 수 있다. 오차 막대는 측정 오차가 아니라 평균 주변의 데이터 범위 또는 산포를 나타내는 T자형 막대입니다(즉, 표준 편차). 오류 막대는 또한 경계선 학생을 좁거나 광범위하게 등급을 매긴 표준 설정자에게 주의를 끌기 위해 사용될 수 있다.

  • [작은 T자 모양]의 막대는 데이터 점(Angoff 등급)이 평균에 가깝다는 것을 알려주고,
  • [큰 T자 모양]의 막대는 데이터 점이 평균과 구별된다는 것을 알려줍니다.

Errors bars are powerful tools for providing feedback to standard setters. Error bars allow us to critically assess the Angoff ratings provided by the standard setters. An error bar is a T-shaped bar representing a range or spread of data around the mean (i.e. standard deviation), not a measurement error. The error bar can also be used to draw attention to standard setters who rated borderline students narrowly or broadly.

  • A small T-shaped bar tells us data points (Angoff ratings) are close to the mean, and
  • a large T-shaped bar tells us data points are distinct from the mean.

그림 1은 Angoff 방법에서 모든 항목과 표준 세터의 평균 추정(검은색 원)과 표준 세터 간의 변동성에 대한 피드백의 예를 보여준다. 점선은 계산된 합격점를 나타냅니다. X축은 표준 세터(N = 10)를 나타내고 Y축은 모든 항목의 평균 등급을 나타냅니다. X축 번호는 표준 세터의 코드이므로 이 그림을 사용하여 합격 점수를 결정하는 데 관련된 모든 표준 세터에 기밀 등급을 표시할 수 있습니다. 표준 설정자는 자신에게 주어진 코드를 알고 있어야 한다. 예를 들어, 표준 설정자 1과 5는 막대 차트에서 코드를 찾고 항목에 대한 평균 추정 등급이 다른 표준 설정자와 다르다는 것을 확인할 수 있습니다. 그러나 세터 1과 5는 다른 표준 세터보다 자체 추정에서 여전히 더 동질적이라는 것을 보여주는 작은 T 모양의 막대를 가지고 있습니다. 표준 세터 6, 8, 9는 다른 표준 세터에 비해 큰 T자형 막대를 가지고 있다. 앞서 언급한 바와 같이, 이는 표준-세터 간 불일치를 암시할 수 있으며, 결과적으로 서로 다른 합격점을 초래할 수 있다. 예를 들어, 쉬운 문제에서는 경계선 학생의 낮은 앙고프 평점과 어려운 문제에서는 높은 앙고프 평점이 그것이다. 이 두 등급은 일정하지 않다. 전자는 낮은 통과 점수를 초래하는 반면, 후자는 높은 통과 점수를 초래한다(린덴 1982). 높은 등급은 표준을 위로 밀어 올리고 낮은 등급은 표준을 아래로 밀어냅니다. 주목할 점은, 때때로 표준 설정자가 등급에 확신을 가지고 있다면 등급의 불일치가 있어도 방어가능하다는 것이다(Recase와 Chen 2012).

Figure 1 shows an example of feedback about the mean estimation (black circles) of all items and standard setters and the variability among standard setters in the Angoff method. The dashed line represents the calculated pass mark. The X-axis represents the standard setters (N = 10), and the Y-axis represents the average ratings of all items. The X-axis numbers are the standard setters' codes, so this plot can be used to present confidential ratings to all the standard setters involved in determining the passing score. Standard setters should be aware of the code given to them. For example, standard setters 1 and 5 can look for their code in the bar chart and see that their average estimation rating for the items is different from other standard setters. However, setters 1 and 5 have small T-shaped bars showing they are still more homogeneous in their own estimations than other standard setters. Standard setters 6, 8 and 9 have large T-shaped bars compared to other standard setters. As previously noted, this may suggest intrastandard-setter inconsistency, subsequently resulting in different pass marks. For example, a low Angoff rating for a borderline student on an easy question and a high Angoff rating on a hard question. These two ratings are not consistent. The former results in a low pass mark, whereas the latter results in a high pass mark (Linden 1982). High ratings push the standard upwards, and low ratings push the standard downwards. Of note, sometimes inconsistencies in ratings are defendable if the standard setters are confident in their ratings (Reckase and Chen 2012).

 

그림 1은 또한 각 라운드의 표준 설정 프로세스 동안 사용될 수 있으며, 표준 설정자가 과제와 경계선 학생의 개념화에 대한 피드백을 받을 수 있다. 과제에 익숙하지 않거나, [경계선 학생을 개념화하기 어려워하는 사람들]은 다른 표준 설정자에 비해 [극단적인 앙고프 등급]을 제공하는 경향이 있다는 점을 언급할 가치가 있다(Recase 및 Chen 2012).

Figure 1 can also be used during the standard-setting process for each round, allowing standard-setters to receive feedback about the task and the conceptualisation of borderline students. It is worth stating that those who are not familiar with the task and struggle to conceptualise borderline students tend to provide extreme Angoff ratings compared to other standard setters (Reckase and Chen 2012).

평균 정격에서 표준 설정자의 위치
Location of the standard setters on the mean ratings


표준 설정자에게 피드백을 제공하는 또 다른 시각화 방법은 각 설정자의 표준과 시험에 대해 계산된 합격 점수를 척도로 찾는 것이다(Recase 및 Chen 2012). 그림 2는 표준 세터의 분포를 각각의 알파벳 코드와 함께 보여준다. 검정색 선은 시험에 대한 식별된 합격 표시이다.

Another visualisation method to give feedback to standard setters is to locate, on a scale, the standard for each of them and the passing score calculated for the exam (Reckase and Chen 2012). Figure 2 shows the standard setters’ distribution with an alphabetical code for each of them. The black line is the identified pass mark for the test.

 

그림 2는 표준 설정자의 개별 표준 추정치와 모든 표준 설정자에 기초한 평균 추정치의 위치를 사용하여 피드백의 예를 보여준다. 수평선은 시험의 보고 마크 척도를 나타낸다. 줄의 각 문자는 한 평의 합격선 설정자의 판단에 따른 합격점(통과 점수) 위치를 나타낸다. 문자는 표준 설정자의 코드이므로 이 그림은 합격 점수를 결정하는 데 관여한 모든 표준 설정자에게 기밀로 표시될 수 있습니다. 표준 설정자는 코드를 부여받으므로 나머지 표준 설정자와 관련하여 추정된 표준을 알 수 있습니다. 예를 들어, 합격선 결정자 N은 보고기준 척도에서 70점으로 합격점을 추정하였다. 표준 설정자는 제공된 등급이 다른 표준 설정자의 등급보다 높은 추정 합격점을 초래했다는 것을 깨달을 수 있다.

Figure 2 illustrates this example of feedback with the locations of standard setters’ individual estimates of the standards and the average estimate based on all of the standard setters. The horizontal line represents the reporting mark scale for the test. Each of the letters on the line represents the standard (pass mark) location and results from the judgment of a single standard setter. The letters are the standard setters’ codes, so this plot can be confidentially presented to all the standard setters who have been involved in determining the passing score. The standard setters are given their code, so they know their estimated standard in relation to the rest of the standard setters. For example, standard-setter N gave ratings that resulted in an estimated standard at 70 on the reporting mark scale. The standard-setter can realise that the provided ratings resulted in an estimated pass mark above that of other standard setters.

이 피드백 방법은 평가 제공자에게 간단하며 쉽습니다. 이 때문에 본 가이드의 목적을 위해 표준 설정자에게 피드백을 제공하는 온라인 대화형 시스템을 설계했습니다. 이 시스템을 사용하면 표준 설정자가 모든 문항의 평균 추정을 조작manipulate하여, 축 상에서 새로운 통과 점수를 가지고 각 표준 설정자의 위치를 볼 수 있다. 
This feedback method is straightforward and easy for assessment providers. Because of this, and for the purpose of this Guide, we have designed an online interactive system that provides feedback to standard setters. Using this system allows the standard setters to manipulate the average estimation of all questions to see each standard setter's location along with the new passing score on the scale axis. The online interactive feedback can be found at https://mt17.shinyapps.io/feed/.

경험적 항목 난이도에서 Angoff 등급의 편차
Deviation of Angoff ratings from empirical item difficulties

항목에 대한 실제 난이도(통계 가설 검정과 관련된 p-값과 혼동하지 않아야 함)로부터의 [Angoff 등급]의 편차는 '항목 추정 정확도item estimate accuracy'의 문제이다. [편차가 작을수록] 항목 추정 정확도의 타당성validity이 커집니다(Brandon 2004). [질문에 올바르게 답한 학생의 비율(즉, p-값)]은 표준 설정자에게 '현실 피드백reality feedback'으로 피드백된다. 이를 통해 표준 설정자는 평가 문항의 난이도를 더 잘 이해할 수 있다. 표준 설정자 문헌은 경계선에 대한 실제 p-값과 p-값을 개별 표준 설정자 등급과 비교하여 피드백을 제공한다는 것을 보여줍니다. 그러나 경계선 그룹에 대한 명확한 경험적 정의가 없다는 것을 기억하십시오. 경계선 그룹이 임의로 정의되더라도(예: 합격 표시 ± SEM) 소수의 경계선 학생만 합격점에 근접한 점수를 받을 수 있습니다. 따라서 합격점 위 또는 아래로 샘플이 편향되어 발생하지 않도록 경계 그룹을 정의해야 합니다. 표본에 대한 해석을 신뢰하기 위해 경계선 그룹의 평균 표시를 설정된 통과 표시와 비교합니다. 합격 표시에 가장 가까운 평균 점수는 경계선 그룹 p-값에 대해 덜 편향된 표본을 생성합니다. 표준 설정자의 일관성은 '표준 설정 등급이 항목의 상대적 난이도와 일치해야 한다'(Reid 1991)는 Reid(1991)가 제안한 경계선 그룹에 대한 p-값 또는 전체 학생 그룹에 대한 p-값과 비교하여 평가할 수 있다.
The deviation of Angoff ratings from actual difficulty levels (sometimes referred to as p-values, not to be confused with the p-values related to statistical hypothesis testing) for the items is a matter of 'item estimate accuracy’. The smaller the deviation, the greater the validity of the item estimate accuracy (Brandon 2004). The proportion of students who correctly answered the question (i.e. p-values) are fed back to standard setters as ‘reality feedback.’ This helps standard-setters get a greater understanding of the level of difficulty of assessment questions. The standard-setter literature shows both actual p-values and p-values for the borderline group are compared to individual standard-setter ratings to provide feedback. However, recall that there is no clear empirical definition of the borderline group. Even if the borderline group is defined arbitrarily (e.g. pass mark ± SEM), only a small number of borderline students may receive a mark around the pass mark. Therefore, the borderline group should be defined so as not to lead to a biased sample either above the pass mark or below the pass mark. To be confident of interpretations for the sample, the average mark of the borderline group is compared with the established passing mark. The average score closest to the pass mark produces a less biased sample of the borderline group p-values. Standard-setters’ consistency can be evaluated by comparing their ratings to the p-values for the borderline group or the p-values for the entire student group as suggested by Reid (1991), where ‘Standard setting ratings should be consistent with the relative difficulties of items’ (Reid 1991).

표준 설정자의 등급과 기준 그룹(경계선 학생 또는 전체 학생 그룹)에 대한 실제 항목 난이도의 차이를 측정하는 다양한 방법이 있으며, 이는 다음과 같다.
There are different methods to measure the differences between standard setters’ ratings and the actual item difficulty for the reference group (the borderline students or the entire student group), which are demonstrated below.

그룹 막대 차트
Group bar charts

그룹 막대 차트는 [항목 난이도에 대한 표준 설정자의 등급(예: Angoff 등급)]과 [경계선 학생의 실제 평균 항목 난이도]를 비교하기 위해 생성됩니다. 그림 3은 각 표준 세터에 대한 평균 앙고프 등급(A.R.)을 보여줍니다. 실선은 경계선 그룹의 평균 p-값을 나타내고, 점선은 설정된 통과 표시를 나타내며, 실선은 경계선 학생의 평균 표시를 나타냅니다. 이 차트를 보면 표준 설정자(N = 10)는 합격 표시와 경계선 학생의 실제 평균 항목 난이도 간의 뚜렷한 차이를 관찰합니다. 또한, 각 표준 설정자는 자신의 합격 점수를 다음과 비교할 수 있다.

  • 다른 표준 설정자(S.S.)
  • 결정된 합격점(Passmark),
  • [경계선 학생(BPV)의 평균 문제 난이도]와 

Group bar charts are created to compare the standard setters’ ratings of item difficulty (e.g. Angoff ratings) and the actual mean item difficulty for borderline students. Figure 3 shows the mean Angoff ratings (A.R.) for each standard setter. The solid line represents the mean p-values for the borderline group, the dashed line represents the established pass mark, and the solid line represents the mean mark of borderline students. By looking at this chart, the standard setters (N = 10) observe a distinct difference between the pass mark and the actual mean item difficulty for borderline students. In addition, each standard-setter can compare their passing score

  • with other standard setters (S.S.),
  • with the established pass mark (Passmark) and
  • with the mean difficulty of questions for borderline students (BPV).

 

이 그룹 막대 차트를 추가로 분석한 결과, [경계선 학생의 평균 점수(평균)]가 [표준 설정자가 설정한 합격점수]보다 높음을 알 수 있어 경계선 학생의 성적을 과소평가했음을 시사한다. 따라서 경계선 학생이 진정한 경계선 학생을 정확하게 반영하지 못하여 표본편향이 발생한다.
Further analysis of this group bar chart suggests the mean mark (Mean) of the borderline students is higher than the pass mark set by the standard setters, suggesting an underestimation of the performance of borderline students. Therefore, the borderline students do not accurately reflect the true borderline students, and thus, sampling bias occurs.

 

개별 항목에 대한 그룹 막대 차트
Group bar charts for individual items

표준 설정자는 각 항목과 경계선 그룹에 대한 [문항별 p-값]을 기준으로 등급에 대한 피드백을 받을 수도 있습니다. 이 피드백은 '표준 설정자가 개별 항목에 대한 경계 그룹 능력을 얼마나 정확하게 추정할 수 있었는가?'라는 질문을 명확히 한다. 개별 항목과 Angoff 등급을 기반으로 하는 막대 그래프는 표준 설정자 내 일관성에 유용한 정보를 제공할 수 있습니다. 표준 설정자는 경계선 학생들의 성과와 일치하는 방식으로 문제를 평가해야 한다. Angoff 등급과 개별 항목 p-값 간의 차이가 작을수록 표준 세터의 내부 일관성 수준이 높아집니다.
Standard setters can also be given feedback on their ratings based on each item and the associated item p-value for the borderline group. This feedback clarifies the question, ‘How accurately could the standard setters estimate the borderline group ability for individual items?’. Bar plots based on the individual items and the Angoff ratings could provide useful information for intrastandard setter consistency. A standard-setter is expected to rate questions in a way that is consistent with the performance of the borderline students. The smaller the difference between the Angoff ratings and individual item p-values, the higher the level of internal consistency of the standard setter.

그림 4는 개별 앙고프 등급과 경계선 학생의 개별 항목 p-값과의 연관성을 나타낸다. 이 안내서의 목적을 위해 네 가지 항목을 시연합니다. 그림 4는 표준 설정자 1이 여러 문항에 걸쳐 등급이 일관되지 않음을 보여주며, 경계선 그룹에 어려운 문항에서는 쉬운 문항으로 평가되며, 쉬운 문항에서는 높은 등급을 부여하여 표준 설정자 내 불일치를 나타낸다.

Figure 4 represents the individual Angoff rating and their association with individual item p-values for the borderline students. For the purpose of this Guide, four items are demonstrated. Figure 4 demonstrates standard-setter 1 is not consistent in ratings across questions, where the question was difficult for the borderline group, it is rated as easy, and where the question is easy, it rates hard, indicating intrastandard setter inconsistency.

 

 

항목 p-값에 대한 등급의 상관 관계
Correlation of ratings to item p-values

표준 설정자가 자신의 판단을 반영할 수 있는 또 다른 방법은 [개별 항목 수준 등급]과 [p-값] 간의 상관관계이다. 이는 표준 설정자에게 '평가자 판단과 관찰된 항목 난이도 값의 순위 순서ranking order관점에서 등급을 비교한 정도'를 전달한다. 이 피드백 정보를 통해 표준 설정자는 등급과 p-값 사이의 연결을 연결할 수 있다(버켄다히와 데이비스-베커 2012).
Another method that allows standard-setters to reflect on their judgments is the correlation between individual item level ratings and p-values. This communicates to standard setters ‘the extent to which their ratings were compared in terms of rank ordering of their judgments and observed item difficulty values’. This feedback information allows standard setters to link connections between ratings and p-values (Buckendahi and Davis-Becker 2012).


표준 설정 문헌에서는 (전체 학생에 대한) [개별 표준 설정자의 등급]과 [경험적 p-값] 사이의 상관관계경계선 학생에 대한 [개별 표준 설정자의 등급]과 [경험적 p-값] 사이의 상관관계에 대해 논의하고 있다[(예: (Brandon 2004). 그러나 Angoff가 권고한 대로 (전체 학생에 대한) [개별 표준 설정자의 등급]을 [경험적 p-값]과 비교하는 것은 결과의 잘못된 값으로 이어질 수 있다. 그는 [표준 설정자의 등급]과 [합격점에 가까운 점수를 받은 학생들] 사이의 관계를 조사할 것을 제안했다(Smith와 Smith 1988). 이 경우에, [개별 평가자의 (난이도) 추정치]와 [관찰된 항목들의 난이도] 사이의 상관관계가 낮다면 표준 설정자들의 등급에 대한 타당성 우려를 야기한다(Brandon 2004). 그러나 이는 시험 내용 타당성이나 추정치의 정확성의 문제가 아니다. 시험 합격점을 계산하는 데 사용되는 프로세스의 타당성의 문제이다(Smith and Smith 1988). 그러나 강한 상관관계를 달성한다고 해서 강력한 합격 점수가 설정되는 것은 아니다. 경계선 학생에 관해서 [등급]과 [p-값] 사이의 강한 상관관계는 [기준 참조criterion-referenced 접근법]에서 [표준norm-referenced 참조 접근법]으로 이동하는 표준 설정자와 함께 질문 평가 과정의 결함을 의미할 수 있다(Linn et al. 1991). Linn과 동료들은 높은 상관관계에 대한 가능한 이유를 다음과 같이 전달한다.

In the standard-setting literature, there is a discussion of both the correlation between the individual standard setters’ ratings and the empirical p-values and the correlation between the individual standard setters’ ratings and the empirical p-values for the borderline students [(e.g. (Brandon 2004)]. However, as Angoff recommended, comparing the individual standard-setters’ ratings with the empirical p-values may lead to a misleading value of the results. He suggested the relationship between standard setters’ ratings and students with a total mark close to the passing mark be examined (Smith and Smith 1988). As such, the low correlation between the individual judges’ estimates and the observed difficulty of the items raises validity concerns regarding the standard setters' ratings (Brandon 2004). However, it is not a matter of the test content validity or the accuracy of estimates; it is an issue of the validity of the process used to calculate that test’s pass mark (Smith and Smith 1988). However, achieving a strong correlation does not ensure that a robust passing score is established. A strong correlation between ratings and p-values for borderline students may imply a flaw in the question rating process with standard setters moving from the criterion-referenced approach to the norm-referenced approach (Linn et al. 1991). Linn and colleagues communicate possible reasons for a high correlation:

  • 평가자들이 학생들을 위한 [문항의 난이도]에 민감하다는 것은 분명해 보인다. 그러나 이러한 민감도가
    • 문항 p-값과 문항 검정 회귀에 대한 인식 때문인지,
    • 평가자의 난이도에 대한 비공식적이고 암묵적인 이해 때문인지,
    • 항목에 대한 주관적인 판단 때문인지는 알 수 없다.
  • 'It seems clear that judges are sensitive to the difficulty of items for students. It is unknown, however, whether this sensitivity is due
    • to their awareness of the item p-values and item test regressions,
    • to the raters' informal and implicit understanding of difficulty, or
    • to subjective judgments of the items'.

관심 있는 독자는 표준 설정 프로세스를 다른 곳에 알리기 위해 표준 데이터(영향 데이터) 피드백 공유와 관련된 추가 정보를 제공할 수 있다(Recase and Chen 2012; Tavakol and Dennick 2017).
Interested readers can find further information about providing additional information related to sharing normative data (impact data) feedback to inform the standard-setting process elsewhere (Reckase and Chen 2012; Tavakol and Dennick 2017).

조건부 p-값 피드백
Conditional p-value feedback

앞서 언급한 바와 같이, [전체 학생 그룹에 대한 p-값]과 [표준 설정자가 제시한 등급] 사이의 상관관계는 해당 시험의 합격점을 계산하는 데 사용되는 과정에 대한 잘못된 피드백을 제공할 수 있다. 마찬가지로 [합격점에 가까운 점수를 받은 소수의 경계선 학생]은 [경계선 학생의 성과에 대한 표준 설정자의 진정한 판단true jedgement]에 대한 편향된 판단biased rating을 유발할 수 있다. Rasch 모델과 같은 문항 반응 이론(IRT) 모델은 합격 표시에 가까운 경계선 학생을 선택하는 데 수반되는 문제를 완화한다. 래쉬 모델은 학생이 [학생의 능력에 따라 질문에 정확하게 답할 수 있는 조건부 확률]을 보여줍니다. 래쉬 모델에서 앙고프 등급은 개념화된다. 관심 있는 독자들은 AMEE Guide No. 72(Tavakol and Dennick 2012)에서 래쉬 모델에 대한 추가 정보를 찾을 수 있다.
As previously stated, the correlation between p-values for entire groups of students and the ratings rendered by the standard setters may provide misleading feedback of the process used to calculate that test’s pass mark. Similarly, a small number of borderline students who scored close to the passing mark may produce a biased rating of the standard setters’ true judgment of the borderline students’ performance. Item response theory (IRT) models, e.g. the Rasch model, mitigate the issues attached to selecting the borderline students close to the pass mark. The Rasch model shows us the conditional probability that a student will answer a question correctly based on the student’s ability. Under the Rasch model, Angoff ratings are conceptualised. Interested readers can find further information about the Rasch model in AMEE Guide No. 72 (Tavakol and Dennick 2012).

[라쉬 모형]에서 [문항 반응 조건부 p-값]은 [Angoff 등급] 및 [p-값]을 사용하여 계산됩니다. 경험적 조건부 p-값과 평균 등급 사이의 관계는 산점도 및 상관 계수를 사용하여 조사됩니다. 또한 선형 회귀선과 관련 결정 계수가 다루어진다. 이 모형에서 결정 계수(R2)는 평균 Angoff 등급과 조건부 p-값이 [공유하는 분산의 백분율]로 해석됩니다. 일반적으로 R2가 높을수록 평균 Angoff 등급이 조건부 p-값을 더 잘 예측합니다. 즉, 판단judgment과 조건부 p-값 사이에 작은 차이가 있습니다.

  • '이 correspondence은 앙고프 절차의 일환으로 내려진 판단을 평가하는 중요한 근거로 받아들여졌다.'(Clauser et al. 2009).

The Rasch model item response conditional p-values are calculated using the Angoff ratings and p-values. The relationship between empirical conditional p-values and the average ratings are examined using scatterplots and correlation coefficients. In addition, a linear regression line and the associated coefficient of determination are addressed. In this model, the coefficient of determination (R2) is interpreted as the percentage of variance shared by the mean Angoff ratings and the conditional p-values. In general, the higher the R2, the better the mean Angoff ratings predict the conditional p-values. Put another way, there are small disparities between the judgments and the conditional p-values.

  • ‘This correspondence has been accepted as an important basis for evaluating judgments made as part of the Angoff procedure’ (Clauser et al. 2009).

그림 5는 [평균 Angoff 등급]과 [조건부 p-값] 사이의 관계를 나타내는 산점도입니다. 보시다시피 평균 Angoff 등급과 조건부 p-값 사이에 0.42의 상관 관계가 얻어집니다. 따라서 R2는 0.18입니다. 즉, 평균 Angoff 등급의 변동은 조건부 p-값의 변동으로 설명됩니다. 또한, 판단과 조건부 p-값 간의 차이를 식별하여 검토할 영역을 식별할 수 있다. 판단과 조건부 p-값 간의 차이가 20% 이상이면(이 컷오프 값은 임의적이고 판단적이며 변경될 수 있음), 데이터 점은 산점도에 다른 색으로 표시됩니다. 그림 5에서 산점도의 회색 점으로 표시되어 있다.

Figure 5 shows a scatterplot indicating the relationship between the mean Angoff ratings with the conditional p-values. As you can see, a correlation of 0.42 is obtained between the mean Angoff ratings and the conditional p-values. Therefore, R2 is 0.18, i.e. 18% of the mean Angoff ratings’ variation is explained by the variation in the conditional p-values. Further, the difference between judgments and conditional p-values can be discerned to identify areas for review. If the difference between judgments and the conditional p-values is more than 20% (this cut-off value is arbitrary and judgmental and can be changed), the data points are marked with a different colour on the scatterplot. In Figure 5, they are shown in grey dots on the scatterplot.

 

패스마크의 신뢰성 및 신뢰성
Reliability and dependability of pass marks

[일반화 가능성(G) 이론의 결과]는 항목과 표준 세터에 걸친 통과 표시와 관련된 오류의 근원을 최소화하기 위해 표준 세터에 피드백될 수 있다. 특정 테스트의 합격 표시는 표준 세터 및 항목에서 관측된 평균입니다. 평균은 표준 세터 모집단과 항목 세계(Brennan and Lockwood 1980)에 대한 평균으로 정의된 통과 표시의 추정치이다. G 이론은 다른 곳에서 설명되며, 독자들은 더 많은 정보를 위해 다음을 참조할 수 있다. 타바콜과 데닉 2012, 타바콜과 브레넌 2013.
The results of generalisability (G) theory can be fed back to standard setters to minimise sources of error associated with the pass mark across items and standard setters. The pass mark in a particular test is the observed mean across standard setters and items. The mean is an estimate of a passing mark defined as the mean for a population of standard setters and a universe of items (Brennan and Lockwood 1980). G-theory is described elsewhere, and readers may refer to the following for more information: Tavakol and Dennick 2012; Tavakol and Brennan 2013.

G 이론에서 분산 성분(V.C.)은 각 면facet에 부착된 오차를 측정하기 위해 계산된다. 이들은 G 연구에서 분석의 기본 단위이며 분산 분석(ANOVA)을 사용하여 추정됩니다. V.C.는 각 오류 원인과 관련된 분산을 알려줍니다. 표준 설정자가 경계선 그룹의 성능을 독립적으로 평가할 때(즉, 모든 표준 설정자가 모든 항목을 평가한다), 항목이 표준 설정자와 교차되는 설계에 대해 V.C.가 계산되므로 이 설계는 i × s(단일 면 설계)로 표시된다. 이 설계에 따르면 항목 V.C., 표준 세터 V.C. 및 표준 세터 V.C.에 의한 항목의 교호작용 등 세 가지 V.C.를 추정할 수 있습니다.

  • 항목 V.C.는 항목에 대한 평균 등급의 변동성을 나타냅니다.
  • 항목 표준 설정자 V.C.는 표준 설정자에 대한 평균 등급의 변동성을 보여줍니다.
  • 표준 설정자와 문항 사이 상호작용의 V.C.는 [설계와 무관한 체계적 오류(기타 측면)]를 보여준다.

In G-theory, variance components (V.C.s) are calculated to measure the error attached to each facet (in the language of G theory, e.g. standard setters and items). They are the basic unit of analysis in a G study and are estimated using analysis of variance (ANOVA). The V.C.s tell us the variance associated with each source of error. When standard-setters independently rate the borderline group's performance (i.e. all standard setters rate all items), V.C.s are calculated for a design in which items are crossed with standard setters, and hence this design is denoted i × s (a single facet design). According to this design, three V.C.s can be estimated, the item V.C., the standard setters V.C., and the interaction of item by the standard setters V.C.

  • Item V.C. shows the variability in mean ratings over items.
  • Item standard-setters V.C. shows the variability in mean ratings across standard setters.
  • The V.C. of the interaction of items by standard setters shows systematic error (other facets) unrelated to the design.

표 1은 R 코드를 사용하여 생성된 표준 세터와 교차되는 10개 항목의 분산 분석(ANOVA) 및 분산 성분을 보여줍니다. 표 1에서 볼 수 있듯이

  • 문항에 따른 평균 Angoff 등급(표준 세터당 합격 표시)의 변동성은 작다. 등급항목의 난이도가 변동된 정도를 실제 항목 난이도의 변동으로 설명한다는 점에 유의하여, 항목 변동item variance은 오류의 원인으로 간주하지 않는다(Clauser et al. 2014).
  • 가장 큰 오차 분산은 표준 세터에 기인하며, 이는 [표준 설정자에 걸친 평균 등급의 변동성이 높다]는 것을 시사합니다. 이것은 우리가 표준 설정자를 바꿔서 절차를 반복한다면 결과가 달라질 것이라는 것을 시사한다.
  • 여기서, 표준 설정자가 표준 설정자의 목표 인구와 항목의 세계로 일반화될 때 전체 [체계적 오류(37%)]를 간과해서는 안 된다.

Table 1 shows the analysis of variance (ANOVA) and the variance components of 10 items that are crossed with standard setters, generated using R codes. As we can see from Table 1,

  • there is a small variability in the mean Angoff ratings (the passing mark per standard setter) across items. Noting that the extent to which the variation in the difficulty of the rated items is explained by the variation in the actual item difficulty, item variance is not considered as a source of error (Clauser et al. 2014).
  • The largest error variance is attributed to the standard setters, suggesting high variability in the mean ratings across standard setters. This suggests the results would be different if we repeat the procedure with different standard setters.
  • Here, the overall systematic error (37%) should not be overlooked when the standard setters are generalised to standard setters’ target population and items’ universe.

 

표준 설정 방법이 [다른 동등한 표준 설정자]에 대해서 [다른 결과]를 초래하는 경우, 방법의 신뢰성과 신뢰성에 의문이 제기됩니다. 신뢰도는 주관적 판단에 따라 결정된 합격점수의 일관성을 말한다. 이 과정은 '표준 설정 프로세스의 외부external'에 존재하며, 합격 점수가 확립된 후에만 평가할 수 있다(Berk 1986). 추정된 V.C.는 표준 세터당 통과 마크의 신뢰성을 나타내는 G 계수를 추정하는 데에도 사용된다.

If a standard-setting method results in different results from other equivalent standard setters, the method's dependability and reliability are questioned. Reliability refers to the consistency of the passing score decided on the basis of subjective judgments. It is ‘external to the standard-setting process’ and can only be assessed after the pass mark has been established (Berk 1986). The estimated V.C.s also are used to estimate a G coefficient indicating the reliability of the passing marks per standard setters.

그림 6은 통과 마크의 잠재적 개선을 위한 추정 알파 및 파이 계수를 나타낸다.

  • i × s 설계에서 [알파 계수]는 상대 오차 분산을 포함하는 [크론바흐의 알파]와 동일합니다.
  • [파이 계수]는 절대 오차 분산을 포함하며, '신뢰성 지수'(Brennan 2010) 또는 [표준 설정자 간 일관성]이다.

Figure 6 presents estimated alpha and phi coefficients for potential improvement of the pass mark.

  • The alpha coefficient for an i × s design is equivalent to Cronbach's alpha involving relative error variance.
  • The phi coefficient involves absolute error variance, and it is ‘an index of dependability’ (Brennan 2010) or interstandard setter consistency.

여기서 12개의 합격선 설정자에 대한 신뢰도 지수는 고무적이지 않습니다(phi = 0.52). 낮은 신뢰도 지수 값은 통과 마크가 다른 표준 설정자에게 일반화될 수 없음을 시사하며, 따라서 Angoff 등급은 수정이 필요하다. 그림 6은 또한 표준 세터의 수가 증가함에 따라 신뢰도 지수가 증가하는 것을 보여준다.
Here, the index of dependability for 12 standard setters is not encouraging (phi = 0.52). The index value suggests the pass mark is not generalisable to other standard setters, and hence the Angoff ratings need revision. Figure 6 also shows as the number of standard setters increases, the index of dependability increases.

평가 정확도 향상을 위한 심사관 피드백
Feedback for examiners to improve rating accuracy

OSCE 및 승인 OSCE
OSCEs and admission OSCEs

이전 섹션에서는 학생 수행의 기준 또는 기준 수준에 대한 몇 가지 피드백 방법에 대해 논의했습니다. 표준은 학생점수의 분포를 [합격생]과 [불합격생]이라는 상호 배타적인 두 그룹으로 나눈다. 각 표준 설정자의 합격 표시와 시험에 대해 설정된 합격 표시를 비교한 요약은 시험 결과를 조정하는 데 중요한 역할을 하지만, 합격 표시를 결정하는 데 도움을 주지 않은 사람들과도 공유할 수 있다. 이는 표준성과standard performance는 정책 결정의 문제이며, 평가 제공자는 합격점수가 얼마나 높은지 낮은지를 결정하기 때문이다. 그 결정은 경계선 [학생의 성격, 평가의 성격, 학생 훈련 수준, 그리고 실무자에 대한 지역사회의 필요성] 등 몇 가지 요소를 기반으로 한다. 그럼에도 불구하고 평가 제공자는 표준 성과 결정을 정당화하기 위해 합리적이고 신뢰할 수 있는 합격점을 제공해야 한다(Kane 등 1999).
In previous sections, we discussed some feedback methods for the standard or criterion level of student performance. The standard splits student marks’ distribution into two mutually exclusive groups: passing students and failing students. A summary from the comparison of each standard setters’ passing mark and the established passing mark for the test can be shared with those that play a crucial role in moderating the exam results but who did not help determine the passing mark. This is because the standard performance a matter of policy decision, and assessment providers decide with regards to how high and low is the passing score. The decision is based on several factors, such as

  • the nature of the borderline student,
  • the nature of assessment,
  • student training level, and
  • community need for practitioners.

Nevertheless, assessment providers need to provide a reasonable and credible pass mark to justify their standard performance decision (Kane et al. 1999).

[OSCE]에서 [학생 중심 접근법]은 특정 과제를 수행할 때 학생의 지식, 기술 및 판단을 식별하기 위해 학생 성과를 관찰할 때 [표준 설정자의 주관적 해석]이 적용되기 때문에 더 적절하다(Kane 등 1999; Kramer 등 2003). OSCE에서는 [보더라인 그룹법]과 [보더라인 회귀법]을 모두 사용하지만, [보더라인 회귀법(BRM)]이 [중위수 보더라인]보다 더 많이 사용되는 것으로 보인다. 각 OSCE 스테이션 내에서 과제에 대한 학생의 성과는 평가되는 각 항목 또는 영역에 점수를 매겨 학생에게 총 점수를 생성한다. 표준 설정 또는 심리측정학 연구의 목적을 위해, 심사관은 [할당된 점수]와는 독립적으로 [글로벌 평가 척도]를 사용하여 학생 수행의 질에 대한 전반적인 주관적 해석을 평가한다.

In OSCEs, the student-centred approach is more appropriate as the subjective interpretation of standard setters is applied when observing student performance to identify students’ knowledge, skills, and judgments when a specific task is performed (Kane et al. 1999; Kramer et al. 2003). Both the borderline group method and the borderline regression methods are used in OSCEs, but it seems that the borderline regression method (BRM) is more popular than the median borderline. Within each OSCE station, the student’s performance on the task is rated by examiners who assign a mark to each of the items or domains being assessed, generating a total mark for the student. For standard-setting or psychometric study purposes, examiners rate an overall subjective interpretation of student performance’s quality using a global rating scale independent of the marks assigned.

일부 연구는 학생 수행 등급의 일반적인 오류에 대한 우려를 다룬다(Godfrey et al. 2015; Yeates et al. 2015; Fuller et al. 2017; Tavakol and Pinner 2018). 학생을 특정 범주(예: 실패, 경계선 실패, 경계선 통과, 양호 및 우수)에 올바르게 배치하는 것은 등급 정확도를 제안하고 평가 제공자에게 유용한 피드백 정보를 제공한다(Roch et al. 2012). 다음 섹션에서는 심사관에게 피드백 정보를 제공하기 위해 OSCE에서 심사관의 일부 오류를 시연한다. 

Some studies address concerns about common errors in student performance ratings (Godfrey et al. 2015; Yeates et al. 2015; Fuller et al. 2017; Tavakol and Pinner 2018). Placing students correctly into a specific category (e.g. fail, borderline fail, borderline pass, good and excellent) suggests rating accuracy and provides useful feedback information for assessment providers (Roch et al. 2012). In the following sections, we demonstrate some of the examiners’ errors in OSCEs in order to provide feedback information for examiners.

체크리스트 등급과 글로벌 등급 간의 불일치
Discrepancy between checklist ratings and global ratings

체크리스트의 도메인 수준(항목 수준) 등급과 전체 글로벌 척도 등급은 학생의 성과와 동일한 정보를 표시해야 합니다. 항목 등급이 높은 경우 전체 글로벌 척도 등급도 높아야 합니다. 검사자 체크리스트 점수와 글로벌 등급 간의 불일치는 경계선에 있는 학생들에게 영향을 줄 수 있고 측정에 구성 무관한 분산을 추가할 수 있기 때문에 이 대응은 필수적이다.

The domain-level (item level) ratings from the checklist and overall global scale ratings should indicate the same information the student’s performance. If item ratings are high, overall global scale rating should also be high. This correspondence is essential as the discrepancy between examiner checklist scores and the global ratings may affect the borderline students and add construct-irrelevant variance to measurement.

그림 7은 체크리스트 점수와 글로벌 등급 사이의 연관성을 보여준다. 점선은 관심 스테이션에 대한 통과 표시를 나타낸다. 그림에서 알 수 있듯이, 일부 학생들의 체크리스트 점수와 글로벌 등급 사이에는 일치하지 않아 검사자 정렬이 불량하다는 것을 보여준다. 도표를 살펴보면, 일부 학생들은 체크리스트를 기준으로 항목이나 수행 영역에서 좋은 점수를 받지만, 경계선 학생으로 분류된다. 가장 중요한 것은, 체크리스트 총점수가 합격점수보다 높은 몇몇 학생들은 불합격으로 분류된다는 것이다. 추가 검사를 통해 옵션 E(실패)가 거의 사용되지 않기 때문에 사용된 등급 척도 범주의 기능에 결함이 있음을 알 수 있습니다. 각 옵션(A~E)에 대해 최소 10개의 관측치가 필요합니다. 따라서 이는 대부분의 학생들이 이 역을 통과할 것으로 예상되지 않는다고 가정할 때 'E'가 신뢰할 수 없는 옵션임을 시사할 수 있다(Tavakol 및 Pinner 2019).

Figure 7 presents the association between the checklist scores and global ratings; the dashed lines represent the pass mark for the station of interest. As we can see from the Figure, there is no correspondence between the checklist scores and global ratings for some students, demonstrating poor examiner alignment. On inspecting the Figure, some students receive good scores on items or performance domains based on the checklist, but they are classified as borderline students. Most important, some students who receive checklist total scores greater than pass mark are categorised as fail students. A further inspection shows that the functioning of the rating scale category used is flawed because option E (Fail) is rarely used. At least ten observations are required for each option. Therefore, this may suggest ‘E’ is an implausible option (Tavakol and Pinner 2019) assuming most students are not expected to pass this station.

평가자가 성과 등급에 미치는 영향
Examiner effect on performance ratings

평가 및 측정 문헌에서는 평가자가 성과 등급에 미치는 영향에 많은 관심이 쏠리고 있다. 이론적으로 [세 가지 요소]가 등급 정확도에 영향을 미칠 수 있다. 

  • 학생 성과,
  • 학생에 대한 시험관의 태도 또는 관찰,
  • 의도된 성과에 대한 시험관의 관찰 회상

[고전적 검사 이론]은 각 구성 요소에 대한 성능 등급의 결과를 예측한다. 예를 들어, 학생 수행의 태도는 다음의 합이다

  • 학생의 진정한 수행(오류 없는 평가),
  • 수행의 태도 편향,
  • 무작위 오류.

따라서 등급의 품질과 등급 효과를 평가하고 개선하고자 할 때 이러한 구성요소를 고려할 필요가 있습니다.

In the assessment and measurement literature, much attention has been paid to examiners’ effect on performance ratings. Theoretically, three components can influence the rating accuracy:

  • student performance,
  • attitudes or observation of the examiner towards the student,
  • the recall of the examiner’s observation of the intended performance (Landy and Farr 1980).

Classical test theory predicts the outcome of the performance rating for each component. For example, the attitude of student performance is the sum of

  • the student’s true performance (error-free rating),
  • the bias of attitude of the performance, and
  • random error.

Therefore, when we want to evaluate and improve the quality of ratings and the rater effect, these components need to be considered.

Cronbach(1990)는 평가자가 평가 과정에서 도입할 수 있는 가장 심각한 오류, 즉 '매파적'과 '비둘기적' 효과(Cronbach 1990)로 간주했다. 심사관이 척도에서 특정 위치를 선호하는 경향은 두 가지 부정적인 결과를 낳는다.

  • 첫째, 이것은 의심스러운 학생 평점으로 이어진다. 실제로, 높은 등급 또는 낮은 등급은 평가된 학생의 실제 성적보다는 심사관의 태도를 반영할 수 있다(Miller et al. 2013).
  • 둘째, 중심 경향 오차(예: 학생들을 평균으로 배치하는 경향이 있는 시험관)는 '척도의 중심에 등급 쏠림'를 초래한다. 따라서, 학생 평점의 범위는 감소합니다. 범위가 줄어들면 학생 등급ratings의 타당성과 신뢰성이 떨어진다.

Cronbach (1990) considered the rater effect as the most severe error that a rater can introduce in a rating process, i.e. the ‘hawkish’ and ‘dovish’ effect (Cronbach 1990). The tendency of an examiner to favour a specific position on the scale has two negative consequences.

  • First, this leads to questionable student ratings. Indeed, a high or low rating may reflect the examiner’s attitude rather than the actual performance of the student rated (Miller et al. 2013).
  • Second, the central tendency error (e.g. examiners who tend to place students at average) results in the ‘bunching of ratings in the centre of the scale’. Therefore, the range of student ratings decreases. Reducing this range leads to a decrease in the validity and reliability of student ratings.

[행동 관찰 정확도에 대한 검사자의 성과 평가 효과]의 중요성을 간과해서는 안 된다. 보다 구체적으로, 검사자 성과 측정의 주요 목적이 성능 등급 정확도 향상이라는 점을 감안할 때, 각 검사자마다 각 스테이션 내의 성과에 대한 피드백을 제공할 필요가 있다. 피드백을 제공하기 위한 몇 가지 접근법이 있다. 우리의 경험에 따르면, [검사자 오류]보다는 [등급 정확도 향상에 초점을 맞춘 간단한 방법(예: 상자 그림 또는 막대 그림)]을 사용하는 것이 검사자의 더 많은 관심을 받는다. 그림 8은 상자 그림을 사용한 검사자 수행의 한 예를 나타냅니다. 다른 예는 다른 곳에서 설명되었다(Tavakol 및 Pinner 2018).
The importance of the performance rating effect by examiners on behavioural observation accuracy should not be overlooked. More specifically, given that the primary purpose of measuring examiner performance is to improve performance rating accuracy, it is necessary to give each examiner feedback on their performance within each station. There are several approaches to providing feedback. Based on our experience, using simple methods (e.g. boxplots or bar plots) focusing on improving rating accuracy, rather than examiner errors, gets more attention from examiners. Figure 8 represents one example of examiner performances using box plots. Other examples have been described elsewhere (Tavakol and Pinner 2018).

 

그림 8은 가상 스테이션 내의 검사자 성능을 나타내며 각 스테이션에 대해 제공될 수 있다. 그림에서 알 수 있듯이, 8명의 검사관(검사관 코드 제공)이 특정 관측소(x축)에서 학생들을 평가했습니다. 각각의 스테이션 내에서 시험관들은 일관되게 점수를 매겼지만, 일부 시험관들은 다른 시험관들에 비해 학생들의 성적을 불규칙적으로 평가한 것으로 보인다. 그림을 검토하면 시험관 4에 의해 등급이 매겨진 학생들의 경우, 거의 모두가 이 스테이션에 대해 설정된 합격 점수(빨간색 점선)를 기준으로 해당 역에 불합격되었음을 알 수 있다. 이것은 '매파적'이거나 엄격한 심사관을 나타낼 수 있다. 그러나 심사관 4는 '비둘기파' 또는 관대한 심사관을 나타낸다. 시험관 7은 시험관 3보다 훨씬 더 엄격하다. 이는 평가 제공자가 학생들의 점수를 공정하게 하기 위해 이러한 시험관의 등급을 조정(중간)한다는 것을 나타낼 수 있다. 특히 상자 그림 구조를 그림과 함께 요약하면 검사자가 상자 그림을 더 쉽게 해석할 수 있습니다.

Figure 8 represents examiner performance within a hypothetical station and could be provided for each station. As we can see from the Figure, eight examiners (examiner codes are provided) rated students in a particular station (x-axis). Within this station, examiners rated consistently, yet some examiners seem to have irregularly rated student performance compared to other examiners. If we review the Figure, we can see that for the students rated by examiner four, almost all failed the station based on the passing score established for this station (the red dashed line). This may represent a ‘hawkish’ or stringent examiner. However, examiner 4 represents a ‘dovish’ or lenient examiner. Examiner 7 is even more stringent than examiner 3. This may indicate that assessment providers adjust (moderate) the ratings of these examiners in order to make the students’ marks fair. Of note, including a summary of the box plots’ structure with the Figure may make it easier for examiners to interpret the box plots.

성능 피드백을 위한 막대 차트
Bar chart for performance feedback

간단한 피드백 접근 방식은 막대 차트를 사용하여 검사자의 성과를 입증한다. 이 접근법에서 검사자는 [표준 점수] 또는 [z 점수]라는 통계를 사용하여 서로 비교됩니다. [z 점수]는 점수가 [특정 분포의 평균]에서 얼마나 많은 표준 편차만큼 떨어져 있는지를 나타낸다. 시험관의 점수를 z 점수로 환산하면, 우리는 그것들을 서로 비교하고 어떤 시험관이 모든 관측소에서 '비둘기' 또는 '매파'로 평가했는지 볼 수 있다. z 점수가 높을수록 다른 사람에 비해 극단적인 점수를 받는다. 따라서 0.5점이라는 평균에 가까운 z 점수는 평가자가 특별히 '비둘기파' 또는 '매파'가 아니었음을 나타냅니다.

  • 표준 점수가 전체 분포에서 -2라고 가정합니다. 이 경우 이는 검사자가 평균보다 -2 표준 편차 낮은 점수를 주었음을 나타내며, 평균적인 검사자에 비해 가혹하거나 '매파적'일 가능성이 높습니다.
  • 표준 점수가 2보다 크면 심사관이 관대하거나 '비둘기적'임을 나타냅니다.

A simple feedback approach employs bar charts to demonstrate examiner performance. In this approach, examiners are compared with each other using a statistic called a standard score or z score. The z score indicates how many standard deviations the score is from the mean of a particular distribution. If examiners’ scores are converted to z score, we can compare them with each other and see which examiner rated ‘dovish’ or ‘hawkish’ across all stations. The higher the z score, the more extreme the score relative to others. Therefore, a z score of 0.5, being close to the mean, indicates that the assessor was not particularly ‘dovish’ or ‘hawkish’.

  • Suppose a standard score is −2 on the whole distribution. In that case, this indicates the examiner scored −2 standard deviations below the mean and is likely to be harsh or ‘hawkish’ compared to the average examiner.
  • If a standard score is larger than 2 this shows the examiner is lenient or ‘dovish’.

2보다 크거나 -2보다 작은 표준 점수를 임계값으로 설정하는 것은 임의적인 접근법입니다. 다만, 점수가 정규 분포일 때 표준점수가 +3 이상 또는 -3 이하인 경우는 예외적이라는 점에 유의해야 한다. 우리가 시험관의 점수를 z 점수로 환산하면, 우리는 z 점수에 대한 막대 차트를 그릴 수 있다. 그림 9와 같이, 시험관 10의 점수는 -2 z 점수 아래에 나타나지만, +2 z 점수 위에는 나타난 평가자는 없다. 평균보다 두 표준 편차 높거나 낮은 점수를 임계값으로 사용하면 학생들의 점수에 '비둘기 또는 매' 효과가 거의 없을 수 있습니다. z 점수에 대한 자세한 내용은 다른 곳에서 참조할 수 있습니다(Tavakol 및 Pinner 2018).

Setting a standard score larger than 2 or less than −2 as the threshold is an arbitrary approach. However, it should be noted, when the scores are normally distributed, it is exceptional to get a standard score greater than +3 or less than −3. When we convert the examiners’ scores to z scores, we can draw bar charts for the z scores. As shown in Figure 9, examiner 10’s scores appear below the −2 z score, but no scores appeared above the +2 z score. Using two standard deviations above or below the mean as the threshold may suggest little ‘dove or hawk’ effect on students’ scores. For more information on z scores, readers can refer elsewhere (Tavakol and Pinner 2018).

변수 지도
Variable map

MFRM(Many Facet Rasch Model)은 불규칙한 검사자를 탐지하는 고급 심리 측정 방법이다. 모델의 복잡성 때문에, 이러한 피드백에 대한 접근 방식은 라쉬 모델이 추가 설명을 위해 제공되지 않는 한, 특히 수학 교육을 받지 않은 시험관들에 의해 잘 소화되지 않을 수 있다. 라쉬 모델과 MFRM 접근법은 다른 곳에서 설명된다(Tavakol 및 Dennick 2012; Tavakol 및 Pinner 2019). 

Many Facet Rasch Model (MFRM) is an advanced psychometric method to detect erratic examiners. Due to the model’s complexities, this approach to feedback may not be well digested by examiners, especially those who have not been schooled in math, unless the Rasch model is offered for further explanation. The Rasch model and the MFRM approach are described elsewhere (Tavakol and Dennick 2012; Tavakol and Pinner 2019).

그림 8은 세 가지 측면(학생, 스테이션 및 검사자)이 있는 가상의 OSCE 시험에 대한 변수 맵을 보여준다.

  • 동일한 로짓 척도(첫 번째 열, 'Measr'라는 제목)를 기준으로 [학생들의 능력, 스테이션 난이도 및 심사관의 엄격도 측정치]를 제시하여 모든 측면을 공통 척도로 비교할 수 있다.
  • 두 번째 열('학생')은 학생의 능력을 나타냅니다. 이 열에서 각 점은 한 학생을 나타내며, 두 명인 경우 학생은 별표(*)로 표시됩니다.
  • 세 번째 열에는 스테이션 facet이 포함됩니다. 스테이션들은 위에서 가장 어려운 것부터 아래에서 가장 덜 어려운 것까지 분포되어 있다.
  • 네 번째 열은 [검사자 facet(숫자로 암호화됨)]을 나타냅니다. 엄격한 심사관은 열의 맨 위에 배치되고 관대한 심사관은 열의 맨 아래에 배치됩니다.
  • 다섯 번째 열은 '총 점수 달성'을 나타냅니다. 본 AMEE 가이드의 목적상, 우리는 검사자의 측면에만 초점을 맞추고 있습니다.

Figure 8 shows the variable map for a hypothetical OSCE exam with three facets (student, station and examiner).

  • It presents the spread of students’ ability, station difficulties and examiner severity measures on the same logit scale (the first column, titled ‘Measr’), so all facets can be compared with each other on a common scale.
  • The second column (titled ‘student’) presents student ability. In this column, each dot represents one student, with 2 students represented by an asterisk (*).
  • The third column contains the station facet. The stations are distributed from most difficult at the top to the least difficult at the bottom.
  • The fourth column shows the examiner facet (encrypted as numbers). Stringent examiners are located at the top of the column, and lenient examiners locate at the bottom of the column.
  • The fifth column represents ‘total score achieved’. For the purpose of this AMEE Guide, we only focus on the examiner facet.

그림 10의 4열은 MFRM을 기반으로 한 검사자의 엄격성과 관용을 보여준다. 검사관은 상단의 엄격함부터 하단의 관대함 순으로 정렬되며, 변수 맵의 상단에는 '매파적' 검사관이 배치된다. 반대로 '비둘기' 검사자는 열의 지도 하단에 있습니다.

Figure 10, column 4, shows the examiner stringency and leniency based on the MFRM. Examiners are ordered in order from stringency at the top to leniency at the bottom, with ‘hawkish’ examiners are located at the top of the variable map. In contrast, ‘dovish’ examiners are located at the bottom of the map in the column.

그림 10에서 볼 수 있듯이 Examiner 엄격도 로짓은 -0.87 로짓에서 +1.60 로짓까지 산재해 있습니다. 검사자 10은 1.60 로짓의 측정값인 더 엄격한 것으로 변수 지도에 나타납니다. 그러나 시험관 12명을 제외하고 모두 비둘기파였던 다른 시험관들에 비해, 시험관 10명은 [이번 OSCE 시험]에서 -0.87의 로짓으로 가장 비둘기파 시험관이다. MFRM 접근 방식은 위에서 논의된 불규칙한 검사자의 유형(예: 후광 오류 및 중심 경향 오류)을 밝힐 수 있다는 점을 언급하는 것이 주목할 만하다.
As we can see from Figure 10, the Examiner severity logits are scattered, ranging from −0.87 logits to +1.60 logits. Examiner 10 appears on the variable map as more severe, a measure of 1.60 logits. However, compared to other examiners who have all been dovish except examiner 12, examiner 10 is the most dovish examiner, with −0.87 logits, in this OSCE exam. It is noteworthy to mention the MFRM approach can reveal the types of erratic examiners discussed above (e.g. halo error and central tendency error).

공정한 평균을 사용하여 피드백 제공
Providing feedback using fair averages

만약 우리가 두 명의 시험관, 한 명은 비둘기파이고 다른 한 명은 매파적인 시험관에게 평가받는 것을 학생들이 꺼리는 것은 의심의 여지가 없다. 그러나, 두 심사관 모두 불공정한 점수를 낼 수 있다. 학생들의 점수를 공평하게 하기 위해, 우리는 학생들의 관찰된 점수를 조절하거나 조정합니다. MFRM의 언어로는 중간/조정된 마크를 '공정 평균fair average'이라고 한다. 공정한 평균은 관찰된 표시가 검사자의 관용/긴밀도에 기초하여 조정될 때 발생한다. 두 학생이 심장병 스테이션에서 두 명의 다른 검사관으로부터 동일한 점수를 받는다고 가정해보자. 첫 번째 학생은 비둘기파 시험관에 의해 등급이 매겨졌지만 두 번째 학생은 매파 시험관에 의해 등급이 매겨졌다. 이 두 학생의 점수를 공정하게 비교하기 위해서는 시험관의 관용/엄밀함을 기준으로 이 두 학생을 대상으로 평가된 점수를 조정할 필요가 있다(Linacre 2020). 그렇지 않으면, 이 두 학생의 점수는 그들의 성적과 관련하여 불공평하게 평가될 것이다.
If we consider two examiners, one dovish and the other hawkish, there is no doubt that students are reluctant to be rated by the hawkish examiner. However, both examiners may produce unfair marks. In order to make the students’ marks fair, we moderate or adjust their observed marks. In the language of MFRM, moderated/adjusted marks are called ‘fair average’. The fair average occurs when the observed marks are moderated based on the examiner leniency/stringency. Consider two students receive an equal mark from two different examiners in the cardiology station. The first student was rated by a dovish examiner, but the second student was rated by a hawkish examiner. In order to fairly compare the scores of these two students, we need to adjust the scores assessed for these two students based on the examiner’s leniency/stringency (Linacre 2020). Otherwise, the scores of these two students will be unfairly evaluated relative to their performance.

[공정 평균]의 결과는 심사관의 심각도 분포를 더 잘 이해하기 위해 심사관과 공유할 수 있다. 그림 11은 심사관의 개별 공정 평균에 대한 피드백의 한 가지 예를 제공한다. 적당한 평균 점수는 관용에서 엄격함으로 배열된다. x축(Examiner)에서 문자는 검사자 코드입니다. 따라서, [공정 평균]의 결과는 서로를 식별할 수 없는 상태에서 학생들을 평가한 모든 시험관들에게 제시될 수 있다. 예를 들어, 심사관 J는 그 척도에서 공정 평균 18.50에 가까운 결과를 가져온 판단을 제공하였다. 매파적 수험생인 다른 수험생과 비교해 가장 낮은 점수를 줬다고 판단할 수 있다. L 심사관은 그 척도에서 공정 평균이 거의 32에 달하는 판단을 내렸다. 비둘기파 시험관이 될 가능성이 있는 다른 시험관에 비해 학생들에게 가장 높은 점수를 줬다고 심사관은 판단할 수 있다.

The results of fair averages can be shared with examiners to better understand the examiner severity distribution. Figure 11 provides one example of feedback about examiners’ individual fair averages of the marks. Fair average scores are arranged from leniency to stringency. In the x-axis (Examiner), the letters are the examiner codes. Therefore, the results of fair averages can be presented to all examiners who rated the students without them being able to identify each other. For example, examiner J provided judgments that resulted in a fair average of nearly 18.50 on the scale. The examiner can judge that they gave the lowest score to the students compared to other examiners, a possible hawkish examiner. Examiner L provided judgments that resulted in a fair average of nearly 32 on the scale. The examiner can judge that they gave the highest score to the students compared to other examiners, a possible dovish examiner.

 

로그를 익숙한 점수로 전송하여 검사자 관련 변형을 피드백합니다.
Transfer logits to a familiar score to feedback examiner-related variation

교사들이 로짓과 변수 맵을 환영하지 않을 경우, 엑셀을 사용하는 일부 간단한 조작은 시험관에게 익숙한 숫자(0과 100 사이)로 척도를 바꿀 수 있다. 따라서 최소 심각도는 0이고 최대 심각도는 100입니다. 이를 위해 래쉬 검사기 성능 및 래쉬 표준 오차 측정이 계산됩니다. 아래 단계를 통해 Rasch 검사자 성능을 0-100 척도로 변환할 수 있습니다(Eckes 2015).

  • Rasch 검사기 성능, S=(최대 로짓-분 로짓)/100 사용,
  • SE=(각 검사자 * S에 대한 S.E.)
  • M = 0-(분 로짓-S) 및
  • Excel에서 0-100 스케일을 얻으려면 , = Round(M+(Rasch 측정 성능 + S), 0.

If teachers do not welcome logits and the variable map, some simple operations using Excel can turn scales into numbers (for example, between 0 and 100) that are familiar to examiners. Therefore, the minimum severity measure is zero, and the maximum severity measure is 100. To achieve this, the Rasch examiner performance and the Rasch standard error measure are calculated. By the following steps below, we could convert the Rasch examiner performance to the 0–100 scale (Eckes 2015).

  1. Using the Rasch examiner performance; S= (max logits- min logits)/100,
  2. SE=(S.E. for each examiner * S),
  3. M= 0-(min logits-S), and
  4. To get the 0-100 scale in Excel; =Round(M+(the Rasch measure performance + S),0).

예를 들어, 검사자 X의 측정값이 S인 0.16이라고 가정합니다.E는 0.26으로, 그들의 새로운 점수는 새로운 척도에서 52점이다. 우리는 성과 변동성 심사관을 위한 새로운 척도를 계산한 다음 이 점수를 주어 서로 비교할 수 있다. 구간 척도를 순서 척도(예: 비둘기 척도, 평균 척도 및 매 척도)로 변환할 수도 있습니다. 또한 엄격하고 관대한 검사자의 수를 계산할 수 있습니다.

For example, suppose the examiner X has a measure of 0.16 with an S.E of 0.26; their new score is 52 points on the new scale. We can calculate the new scale for performance variability examiners and then give them these scores to compare themselves with each other. You could also convert the interval scale to the ordinal scale (e.g. dovish, average and hawkish). This also allows you to calculate the number of stringent and lenient examiners.

 


Med Teach. 2022 Jun;44(6):582-595. doi: 10.1080/0142159X.2021.1993164. Epub 2021 Nov 2.

Feedback to support examiners' understanding of the standard-setting process and the performance of students: AMEE Guide No. 145

Affiliations collapse

Affiliations

1Medical Education Centre, School of Medicine, University of Nottingham, Nottingham, UK.

2School of Education, Virginia Commonwealth University, Richmond, VA, USA.

PMID: 34726546

DOI: 10.1080/0142159X.2021.1993164

Abstract

The ratings that judges or examiners use for determining pass marks and students' performance on OSCEs serve a number of essential functions in medical education assessment, and their validity is a pivotal issue. However, some types of errors often occur in ratings that require special efforts to minimise. Rater characteristics (e.g. generosity error, severity error, central tendency error or halo error) may present a source of performance irrelevant variance. Prior literature shows the fundamental problems in student performance measurement attached to judges' or examiners' errors. It also indicates that the control of such errors supports a robust and credible pass mark and thus, accurate student marks. Therefore, for a standard-setter who identifies the pass mark and an examiner who rates student performance in OSCEs, proper, user-friendly feedback on their standard-setting and ratings is essential for reducing bias. This feedback provides useful avenues for understanding why performance ratings may be irregular and how to improve the quality of ratings. This AMEE Guide discusses various methods of feedback to support examiners' understanding of the performance of students and the standard-setting process with an effort to make inferences from assessments fair, valid and reliable.

Keywords: Feedback; assessment; standard setting.

 

의과대학생이 AI에 대해서 알아야 하는 것은 무엇인가? (J Educ Eval Health Prof. 2019)
What should medical students know about artificial intelligence in medicine?
Seong Ho Park1*, Kyung-Hyun Do1, Sungwon Kim2, Joo Hyun Park3, Young-Suk Lim4

서론
Introduction

의학에 인공지능(AI)을 사용하는 것은 최근 빅 데이터에 대해 훈련된 인공 신경망의 여러 레이어를 포함하는 머신 러닝 기술, 즉 딥 러닝[1,2]의 발전으로 인해 많은 관심을 끌고 있다. AI는 의료의 다양한 분야에 상당한 영향을 미칠 것으로 예상되며 의료의 많은 측면을 개선할 수 있는 잠재력을 가지고 있다[1]. 부정적인 면에서도, AI는 많은 과대 광고를 만들어냈다. 현대 AI 소프트웨어 프로그램이 환자의 의료 정보를 얼마나 빠르고 정확하게 분석하고 인간 전문가보다 더 정확하게 진단을 자동으로 제시할 수 있는지에 대한 이야기를 인터넷에서 찾는 것은 어렵지 않다. 그러나 이러한 이야기들은 대부분 상당히 과장되어 있거나 기껏해야 피상적으로만 그 문제를 설명한다. 실제로 현재 의료 현장에서 사용되는 AI 기술은 거의 없다.
The use of artificial intelligence (AI) for medicine has recently drawn much attention due to the advances in machine learning techniques involving multiple layers of artificial neural networks trained on big data, i.e., deep learning [1,2]. AI is expected to affect various fields of medicine substantially and has the potential to improve many aspects of healthcare [1]. On the downside, AI has been creating much hype, too. It is not difficult to find on the Internet stories about how fast and accurately modern AI software programs can analyze the patient’s medical information and automatically present diagnoses, even more precisely than human experts, with a nuance that AI will soon dominate the medical practice. However, these stories are mostly quite exaggerated or, at best, explain the matter only superficially. In reality, few AI techniques are currently used in medical practice.

그럼에도 불구하고 현재의 의대생들이 학업과 훈련을 마치고 의료 전문가로서의 경력을 시작하는 시점에 다양한 AI 소프트웨어 도구가 임상 실습에 활용될 것으로 보인다. 환자에게 AI 기술을 적용함에 있어 의료인은 뒷자리에 있는 사람이 아니라 운전석에 앉아야 한다. 그들은 환자와 대중이 의학에 AI를 적용하는 것에 대해 가질 수 있는 불안, 혼란, 의문을 해결할 수 있어야 한다. 의료 전문가들도 AI가 환자 치료에 유익한 기술이 되도록 할 책임이 있다. 이것들은 AI에 대한 건전한 지식과 경험의 습득을 의대생들에게 매우 중요한 과제로 만든다. 이 글의 목적은 의학적인 관점에서 AI의 현황을 간결하게 요약하고 의대생들이 의학에서 AI 시대를 대비하기 위해 해야 할 일을 제안하는 것이다.
Nevertheless, at the time when the current medical students will commence their career as medical professionals after completion of studies and training, various AI software tools will likely be used in clinical practice. In applying AI technology to patients, medical professionals are not ones who are in the backseat but should be in the driver’s seat. They should be able to resolve any anxiety, confusion, and questions that patients and the public may have about applying AI to medicine. Medical professionals are also responsible for ensuring that AI becomes a technology beneficial for patient care. These make the acquisition of sound knowledge and experience about AI a task of high importance for medical students. The purpose of this article is to provide a succinct summary of the current state of AI from a medical viewpoint and suggest what medical students should do to prepare for the era of AI in medicine.

인공지능 관련 용어
Artificial intelligence-related terms

AI는 컴퓨터가 인간의 인지 능력이 필요한 작업을 수행할 수 있도록 하는 알고리즘을 일컫는 광범위한 용어다. 최근 딥러닝 기술의 발달로 '딥러닝'과 'AI'라는 용어가 동의어로 사용되는 경우가 늘고 있다. 일반적인 AI 관련 용어의 계층은 그림 1[3]에 시각적으로 요약되어 있다.
AI is a broad term that refers to algorithms that allow computers to perform tasks requiring human cognitive abilities. With the recent development of deep learning technology, the terms ‘deep learning’ and ‘AI’ are increasingly often used as synonyms. The hierarchy of common AI-related terms are visually summarized in
 Fig. 1 [3].

과대광고 대 현실
Hype versus reality

바둑 챔피언 세돌 이세돌은 2016년 초 딥 러닝 기술을 이용해 개발한 구글의 알파고에 패배한 이후, AI는 예측 가능한 미래에 많은 의사들을 대체할 기술로 종종 언급되어 왔다. 그러나 3년이 지난 지금 아이러니하게도 의료용 AI 소프트웨어 도구를 개발하는 많은 기업들이 폐쇄 위기에 직면해 있다는 우려가 존재한다. 즉, 지금까지 개발된 의료 애플리케이션용 AI 소프트웨어 도구가 실제 임상 실습에서 소비되지 않고 있다. 왜요?
Since the Go champion Sedol Lee was defeated in early 2016 by Google’s AlphaGo developed using deep learning technologies, AI has often been referred to by lay media and some people as a technology that would replace many physicians in the foreseeable future. However, 3 years later, now ironically, worries exist that many companies developing AI software tools for medical use are facing the risk of shutting down. In other words, AI software tools for medical applications that have been developed so far are not being consumed in real-world clinical practice. Why?

[의료 실무에서 AI 기술을 채택하는 가장 중요한 기준]은 이 기술이 환자에게 더 나은 품질의 치료를 제공하고 환자의 의료 결과를 개선하는 데 도움이 되어야 한다는 것이다. 즉, 환자에게 품질과 가치를 창출하는 것이다. 이 요구 사항을 충족하지 않음으로써 발생하는 한 가지 주목할 만한 실패 사례는 IBM의 Watson for Oncology입니다. 암 진단에 도움이 되는 정보를 제공하기 위해 설계된 이 AI 소프트웨어는 IBM이 2013년에 출시하였으며, 2016년과 2017년에 국내 8개 병원(2018년 이후 없음)에서 도입하였습니다[4]. 그러나, 대중에게 노출된 것과 달리, Watson for Oncology에 의해 제공된 진단 제안은 기대만큼 정확하지 않았습니다. 그 결과, 승리의 초기 분위기는 곧 장점과 단점에 대한 냉정한 평가로 대체되었습니다 [5,6]. 실제로 미국 최고의 암 병원 중 하나인 MD Anderson Cancer Center는 2017년 초에 Watson for Oncology를 도입하려고 시도했지만 6,200만 달러를 지출한 후 문제를 발견하고 프로젝트를 중단했습니다[7]. 또한 IBM은 2018년 상반기에 해당 사업부 직원의 약 70%를 해고했습니다[8]. 약물과 다른 의료기기가 환자에게 사용하기 전에 안전성과 효능에 대한 엄격한 검증을 통과해야 하는 것처럼, 임상 채택 전에 철저한 임상 검증은 AI 기술에 있어서도 중요하다. 우발적 피해 없이, 얼마나 정확하고 환자 치료로 얼마나 큰 이익을 제공할 수 있는지에 관해서도 중요하다.[9-13].
The most important criterion for adopting AI technology in medical practice is that the technology should help provide better quality care for patients and improve healthcare outcomes of the patients, that is, create quality and value for patients. One notable example of failure by not fulfilling this requirement is IBM’s Watson for Oncology. This AI software designed to provide information to assist cancer diagnosis was released in 2013 by IBM and was introduced by 8 hospitals in Korea (Republic of) in 2016 and 2017 (none since 2018) [4]. However, unlike what has been exposed to the public, diagnostic suggestions provided by Watson for Oncology were not as accurate as expected. As a result, the initial atmosphere of triumph was soon superseded by a sober evaluation of advantages and drawbacks [5,6]. In fact, the MD Anderson Cancer Center, one of the best cancer hospitals in the United States, attempted to introduce Watson for Oncology early in 2017, but found problems and stopped the project after having spent $62 million [7]. Also, IBM laid off approximately up to 70% of staff in the corresponding business division in the first half of 2018 [8]. Just as drugs and any other medical devices are required to pass a strict validation of safety and efficacy before they can be used for patients, thorough clinical validation before clinical adoption is critical for AI technology, too, regarding how accurate it is and how large of a benefit with patient care it can provide without creating any inadvertent harms [9-13].

AI 알고리듬의 정확도를 평가할 때 고려해야 할 핵심 사항 중 하나는 외부 검증, 즉 교육 데이터 세트로부터 독립적으로 수집된 데이터 세트를 사용하여 알고리듬 정확도를 테스트하는 것이다[11,14-17]. 이는 AI 알고리즘의 데이터 의존도가 높기 때문이다. [AI 알고리즘을 훈련]하는 과정은 인간 학습과는 다른데, 전자는 개념과 원칙을 이해하지 않고 주어진 데이터에서 패턴을 찾는 것을 기반으로 하기 때문이다[18]. 컴퓨터에 많은 양의 데이터가 입력되면 AI를 제공하기 위해 데이터와 답을 연관시키는 수학적 공식(즉, 패턴의 수학적 표현)을 생성한다. 딥 러닝 등 현대 AI 기술은 패턴을 찾는 데 있어 기존 기술에 비해 정확도가 높은 것으로 알려졌다. 그러나, 그들은 훈련 데이터에 대한 강한 의존성을 가지고 있다. 일반적으로 훈련에 사용된 데이터 내에서 높은 정확도가 보장되지만, 훈련에 사용되지 않은 데이터의 정확도는 낮을 수 있다. 
One of the key points to consider when evaluating the accuracy of an AI algorithm is external validation, i.e., testing the algorithm accuracy using datasets collected independently from the training dataset [11,14-17]. This is due to strong data dependency of AI algorithms. The process of training AI algorithms is different from that of human learning, as the latter is based on understanding concepts and principles, while the former is based on the search for patterns in given data without an understanding of concepts and principles [18]. When a large amount of data is input to a computer, it creates mathematical formulae (i.e., a mathematical representation of the patterns) that associate the data to answers to afford AI. Modern AI technologies such as deep learning are known to have high accuracy compared to past technologies in finding the patterns. However, they have a strong dependency on training data. While high accuracy is generally guaranteed within the data used for training, the accuracy for data that were not used for training can be low.

AI 알고리듬의 정확성은 학습된 데이터 세트에 내재된 정보를 넘어서는 안 되며 학습 데이터의 편향과 오류를 피할 수 없다. AI의 이러한 강력한 데이터 의존성은 의료 분야에서 특히 우려된다[19]. 의료 애플리케이션을 위한 AI 알고리듬을 훈련하는 데 사용되는 데이터 세트는 다양한 선택 편향을 일으키기 쉽고 여러 가지 이유로 실제 임상 실습에서 대상 모집단을 적절하게 나타내지 못할 수 있다[19]. 또한 실제 임상 실습에서 예상치 못한 상황이 발생할 수 있으며, 그 빈도는 아니다[19]. 따라서, AI 소프트웨어가 다른 병원의 데이터와 환자 또는 다른 영상 시스템 또는 방법에서 획득한 데이터에 적용될 경우 AI 알고리즘의 정확도가 떨어질 수 있는 진정한 위험이 있다[13,20-23]. 마찬가지로, AI 알고리듬이 그러한 임상 환경에서 직접 검증될 때까지 다양한 실제 실행 환경에서 얼마나 정확하게 수행될지는 불확실하다.

The accuracy of AI algorithms cannot go beyond the information inherent to the datasets on which they are trained and cannot avoid the biases and errors in the training data. This strong data dependency of AI poses a particular concern in the medical field [19]. The datasets used to train AI algorithms for medical applications are prone to various selection biases and may not adequately represent target populations in real-world clinical practice for many reasons [19]. Also, unexpected situations can occur in real-world clinical practice at any time, not infrequently [19]. As a result, there is a genuine risk that the accuracy of an AI algorithm may drop if the AI software is applied to the data and patients of another hospital or data acquired from other imaging systems or methods [13,20-23]. Likewise, it is uncertain how accurately an AI algorithm would perform in various real-world practice settings until it is validated directly in such clinical environments.

AI 알고리즘의 임상 정확도에 대한 적절한 검증을 위해, 테스트 데이터는 다음과 같은 특징을 가져야 한다[11,16,17]. 

  • (1) AI 소프트웨어가 적용될 특정 적응증(즉, 잘 정의된 임상 시나리오의 대상 환자 그룹)에서 편향을 피하여 수집된 데이터 
  • (2) AI 교육을 위한 데이터를 수집한 기관 이외의 병원으로부터의 데이터, 그리고 
  • (3) 여러 기관에서 수집한 데이터 또한, 가능한 경우 항상 예상 수집 데이터를 사용해야 한다[11,14,16,17].

그러나 지금까지 개발된 의료용 AI 소프트웨어 애플리케이션은 대부분 이러한 방식으로 검증되지 않았으며 [24], '디지털 예외주의'라고 하는 현상인 AI 알고리즘에 대한 적절한 임상 검증의 부족은 상당한 우려를 낳고 있다[25,26].

For proper validation of the clinical accuracy of AI algorithms, the test data should have the following features [11,16,17]:

  • (1) data collected avoiding biases from specific indications (i.e., target patient groups in well-defined clinical scenarios) to which the AI software will be applied;
  • (2) data from hospitals other than the institution in which the data for AI training were collected, and
  • (3) data collected from multiple institutions.

Also, whenever possible, prospectively collected data should be used [11,14,16,17]. However, most AI software applications for medical use developed until now have not been validated in this way [24], and the lack of appropriate clinical validation for AI algorithms, a phenomenon referred to as ‘digital exceptionalism,’ raises a significant concern [25,26].

[의료에 AI 기술을 채택하는 두 번째 기준]은 [환자에게 직접 도움이 되지 않더라도, 의료 제공자나 병원 행정을 지원해야 한다]는 것이다. 이 점을 잘 다루는 한 가지 성공적인 예는 피츠버그 대학 의료 센터(UPMC)에서 개발 및 도입한 AI 소프트웨어입니다 [27]. 이 소프트웨어는 입원환자의 데이터를 분석해 퇴원 후 7일과 30일 이내에 재입원할 확률을 추정한다. 미국의 경우 퇴원 후 단기간 내에 환자가 재입원하면 보험사로부터 보상금을 받지 못할 수 있고, 조기 재입원은 보험사와 계약을 맺을 때 결국 병원에 불이익으로 작용할 수 있다. 따라서 병원은 조기 재입원 비율을 줄이는 것이 중요하다. UPMC는 현재 엔터프라이즈 분석에 1억 달러를 투자하여 이익을 얻고 있는 것으로 보고되었습니다 [27].
The second criterion for adopting AI technology in medicine is that it should support healthcare providers or hospital administration if not directly helps patients. One successful example well addressing this point is an AI software developed and introduced by the University of Pittsburgh Medical Center (UPMC) [
27]. This software analyzes data of hospitalized patients and estimates the probability of re-hospitalization within seven and 30 days after discharge. In the United States, the hospital may not receive reimbursement from insurers if a patient is re-hospitalized within a short period after discharge, and the early re-hospitalizations may ultimately work as a disadvantage to the hospital when it makes a contract with insurers. Therefore, it is crucial for hospitals to reduce the rate of early re-hospitalizations. UPMC is now reported to be reaping the benefits of its investment of $100 million in the enterprise analytics [27].

인공지능이 의학을 위해 무엇을 할 수 있을까?
What can artificial intelligence do for medicine?

적절하게 설계되고 사용될 경우 AI 기술은 현재의 의료 관행에서 많은 약점을 강화할 수 있다[1].

  • 단순 반복 작업이 필요한 시간이 많이 걸리는 프로세스를 AI가 처리하면 의료 제공자의 피로가 상당히 줄어들 수 있으며, 의사는 환자를 대면하고 보다 복잡한 의료 작업에 집중하는 데 더 많은 시간을 할애할 수 있다[1].
  • AI 기술은 또한 임상 실습에서 의도하지 않은 오류의 수를 줄일 수 있고 의료 전문가들 간의 판단 차이를 줄일 수 있다.
  • 인간이 할 수 없는 AI 시스템으로 24시간 환자 상태를 모니터링할 수 있다면 환자를 보다 안전하게 관리할 수 있을 것이다.
  • 또한 임상 practice 빅데이터 분석을 통해 AI가 발견한 새로운 패턴은 진단 및 치료를 위한 새로운 바이오마커의 개발로 이어질 수 있다.

If properly designed and used, AI technology could reinforce many weaknesses in current medical practice [1].

  • If time-consuming processes that require simple repetitive work are taken care of by AI, it would substantially reduce the fatigue of healthcare providers, and physicians could spend more time in facing with patients and concentrating on more complicated medical tasks [1].
  • AI technology may also reduce the number of inadvertent errors in clinical practice and may decrease differences in judgments among medical professionals.
  • If patient conditions can be monitored 24 hours a day by AI systems, which would practically be impossible for humans to do, the patients may be managed more safely.
  • Furthermore, new patterns discovered by AI through the analysis of big data from clinical practice may lead to the development of new biomarkers for diagnosis and treatment.

환자뿐만 아니라, [의학을 이해하는 의료 전문가에 의한 인풋]은 이러한 기대를 실현하는 데 매우 중요하다. 현재까지 개발된 많은 의료 AI 소프트웨어 애플리케이션은 주로 실제 임상 세계에서 의사가 파악한 실제 요구를 해결하기보다는(즉, 실제 실무에서 문제 또는 관련 사용 사례에 대한 정의 먼저, 니즈를 해결하기 위한 데이터 수집이 뒤따름), 이미 사용 가능한 대용량 데이터를 활용하기 위해 만들어졌다. 지금까지 개발된 AI 소프트웨어 애플리케이션이 임상 실무에서 거의 활용되지 않는 또 다른 이유이자 현장에서 실제로 환자를 돌보는 의료진의 입력이 중요하다는 점을 부각시킨다.

Inputs by medical professionals who understand medicine, specific details of clinical practice, as well as patients, are critical for realizing these expectations. Many medical AI software applications developed to date were created mainly to make use of large data that happen to have already been available rather than addressing the actual needs identified by practitioners in real clinical world (i.e., definition of problems or pertinent use cases in real-world practice first, followed by data collection to address the needs). It is another reason why AI software applications developed so far are rarely used in clinical practice and highlights the importance of input by medical professionals who actually take care of patients on the spot.

 

인공지능의 영향을 가장 많이 받는 의료 분야는 어디인가?
Which medical sector will be most affected by artificial intelligence?

불과 몇 년 전만 해도 AI가 방사선과나 병리과 전문의들을 곧 대체할 수 있을 것이라는 소문이 돌았다. 그러나 AI에 대한 이해가 증가함에 따라, 우리는 이제 이러한 조기 "예측"이 당시 의학에서의 기술과 그것의 적용에 대한 매우 얕은 이해만을 드러내고 있다는 것을 알고 있다. 그렇다면 우리는 AI가 의사를 대체하는 것에 대해 걱정할 필요가 없는가? 의료용 AI 도구는 대부분 의사 및 의료 시스템의 가상 비서 역할을 하여 보다 정확하고 효율적인 환자 진료를 제공할 수 있도록 돕는 경우가 많은데, 대표적인 예가 방사선과 및 병리학 분야에서 개발되고 있는 많은 AI 도구이다. 반면에, 일반적인 만성 질환이나 1차 건강 관리를 관리하는 환경에서, AI는 환자와 일반인을 위한 가상 비서로 설계되고 사용될 수 있다[1].

It was spoken merely a few years ago that AI might soon replace specialists in radiology or pathology departments. However, with increasing understanding of AI, we now know that these premature “predictions” are only revealing a very shallow understanding of the technology and its application in medicine at the time. Do we not have to worry about AI replacing physicians then? In many cases, AI tools for medicine mostly play the role of a virtual assistant for physicians and healthcare systems, helping them to provide more accurate and efficient patient care, of which typical examples are many AI tools that have been being developed in the fields of radiology and pathology. On the other hand, in the setting of managing common chronic illnesses or primary healthcare, AI could be designed and used as a virtual assistant for patients and the public [1]. 

예를 들어, 사소한 건강 문제와 관련된 상담이나 검사를 위해 의사를 방문할지 말지 고민하는 환자나 만성 약물 처방전을 재발급받기를 원하는 환자는 병원 방문을 줄일 수 있도록 AI가 이러한 기능 중 일부를 수행하게 하고 싶을 수 있다. 유사한 시나리오가 응급실 방문에도 적용될 수 있다. 예를 들어 밤에 피부 발진과 열이 있는 아이의 경우 스마트폰으로 촬영한 피부 사진을 이용해 AI 시스템 '아이가 즉시 응급실을 방문해야 하는지, 다음날 소아과를 방문해야 하는지'를 알려줄 수 있다면, 밤에 응급실을 방문하는 아이들의 수는 줄어들지도 모른다. 이러한 시나리오에서 AI 알고리즘은 환자에게 직접 정보를 제공하고 환자가 자신의 의료 서비스를 직접 이용할 수 있도록 한다. 이러한 종류의 AI 알고리즘을 개발하기 위한 작업은 임상의와 의료 시스템을 위한 AI에 뒤처져 왔다[1]. 그러나 일반적인 만성 질환과 가벼운 건강 문제에 대해 환자와 대중을 직접 지도하는 AI 도구는 의료 분야에서 AI와 관련하여 곧 주요 논의 주제가 될 것이다. AI 시대의 의료 전문가들은 임상적으로 도구를 검증하고, 그에 대한 신뢰할 수 있는 정보를 제공하며, 환자에게 가장 좋은 이익을 위해 채택에 대한 올바른 결정을 내리는 데 중요한 책임을 지고 있다.
For example, patients pondering about whether or not to visit physicians for counseling or examination related to their minor health issues or patients wanting their prescription for chronic medication reissued might want to have AI do some of these functions so that they could save hospital visits. A similar scenario may also apply to emergency room visits. For example, if an AI system can make a suggestion using skin photographs taken with a smartphone in a child who has skin rash and fever at night regarding whether the child should visit the emergency room immediately or visit a pediatrician’s office the following day, the number of children visiting the emergency room during the night might decrease. In these scenarios, AI algorithms provide information directly to the patients and enable them to take their healthcare into their own hands. The work for developing AI algorithms of this kind has lagged behind AI for clinicians and healthcare systems [1]. However, AI tools for directly coaching patients and the public about common chronic conditions and mild health issues will likely soon become a major topic for discussion regarding AI in medicine given the large volume that these take in healthcare. Medical professionals in the AI era have an important responsibility in clinically validating the tools, providing trustworthy information about them, and making the right decisions about their adoption in the best interest of the patients.

 

의대생들은 인공지능에 대비하기 위해 무엇을 해야 할까?
What should medical students do to prepare themselves for artificial intelligence?

의대생들은 AI 기술을 적용할 때 자신의 환자를 가장 책임지는 역할을 하는 데 필요한 적절한 지식과 경험을 습득해야 한다. 

  • 인공지능을 준비하는 것은 컴퓨터 프로그래밍과 같은 정보 기술을 배우는 것만을 의미하는 것이 아니다. 
  • 기본 및 임상 의학(의료 실무의 기본을 구성하고 AI를 의학에 사용하는 방법을 이해하는 열쇠), 데이터 과학, 생물 통계 및 증거 기반 의학에 대한 충분한 지식을 습득해야 한다. 
  • 의대생으로서도 언론과 인터넷에서 의학 분야 AI 관련 이야기를 수동적으로만 받아들여서는 안 된다
  • 의대생은 정확한 정보와 과대광고[28]를 구별하는 능력을 개발해야 하며, 환자와 대중을 위해 철저히 검증되고 신뢰할 수 있는 정보를 만드는 능력도 개발해야 한다. 

의과대학의 커리큘럼은 교육적 요구를 충분히 수용하기 위해 아직 발전하지 않았을 것이지만, 울산대학교와 연세대학교와 같은 한국의 일부 의과대학들은 최근 학생들에게 AI 전용 선택과목을 제공하기 시작했다.
Medical students should acquire the appropriate knowledge and experience required for them to act as ones who take the ultimate responsibility for their patients when applying the AI technology to them.

  • Preparing for AI does not merely mean learning information technology such as computer programming.
  • One should acquire sufficient knowledge of basic and clinical medicines (which constitute the fundamentals of medical practice and are keys to understanding how to use AI for medicine), data science, biostatistics, and evidence-based medicine.
  • Even as a medical student, one should not passively accept stories related to AI in medicine in the media and on the Internet.
  • Medical students should try to develop abilities to distinguish correct information from hype and spin [28] and even capabilities to create thoroughly validated, trustworthy information for patients and the public.

While the curricula at medical schools would have yet to evolve to accommodate the educational needs sufficiently, some medical colleges in Korea (Republic of) such as University of Ulsan and Yonsei University have recently started providing AI-dedicated elective courses to the students.

결론
Conclusion

AI는 다양한 의료 분야에 상당한 영향을 미칠 것으로 예상되며, 적절하게 설계되고 사용될 경우 현재의 의료 관행에서 많은 약점을 강화하고 의료의 많은 측면을 개선할 수 있는 잠재력을 가지고 있다. 의료 전문가들은 AI가 환자 치료에 유익한 기술이 되도록 보장할 책임이 있다. 의대생들은 AI에 대한 정확한 정보와 과대광고 및 스핀을 구별하는 능력을 개발하고, 환자와 대중이 의학에서 AI 시대에 대비할 수 있도록 철저히 검증되고 신뢰할 수 있는 정보를 만드는 능력까지 개발해야 한다.

AI is expected to affect various fields of medicine substantially and, if properly designed and used, has the potential to reinforce many weaknesses in current medical practice and improve many aspects of healthcare. Healthcare professionals are responsible for ensuring that AI becomes a technology beneficial for patient care. Medical students should develop abilities to distinguish correct information about AI from hype and spin and even capabilities to create thoroughly validated, trustworthy information for patients and the public to prepare for the era of AI in medicine.

 


J Educ Eval Health Prof. 2019;16:18. doi: 10.3352/jeehp.2019.16.18. Epub 2019 Jul 3.

What should medical students know about artificial intelligence in medicine?

Affiliations collapse

Affiliations

1Department of Radiology and Research Institute of Radiology, Asan Medical Center, University of Ulsan College of Medicine, Seoul, Korea.

2Department of Radiology, Research Institute of Radiological Science and Center for Clinical Image Data Science, Severance Hospital, Yonsei University College of Medicine, Seoul, Korea.

3Department of Medical Education, University of Ulsan College of Medicine, Seoul, Korea.

4Department of Gastroenterology, Asan Medical Center, University of Ulsan College of Medicine, Seoul, Korea.

PMID: 31319450

PMCID: PMC6639123

DOI: 10.3352/jeehp.2019.16.18

Free PMC article

Abstract

Artificial intelligence (AI) is expected to affect various fields of medicine substantially and has the potential to improve many aspects of healthcare. However, AI has been creating much hype, too. In applying AI technology to patients, medical professionals should be able to resolve any anxiety, confusion, and questions that patients and the public may have. Also, they are responsible for ensuring that AI becomes a technology beneficial for patient care. These make the acquisition of sound knowledge and experience about AI a task of high importance for medical students. Preparing for AI does not merely mean learning information technology such as computer programming. One should acquire sufficient knowledge of basic and clinical medicines, data science, biostatistics, and evidence-based medicine. As a medical student, one should not passively accept stories related to AI in medicine in the media and on the Internet. Medical students should try to develop abilities to distinguish correct information from hype and spin and even capabilities to create thoroughly validated, trustworthy information for patients and the public.

Keywords: Artificial intelligence; Deep learning; Machine learning; Medical students.

보건의료전문직 교육에서 인공지능: 스코핑 리뷰(JMIR Med Educ. 2021)
Artificial Intelligence Education Programs for Health Care Professionals: Scoping Review

Rebecca Charow1,2, MSc; Tharshini Jeyakumar2, MHI; Sarah Younus2, MPH; Elham Dolatabadi1,3, MESc, PhD;
Mohammad Salhia4, MEd; Dalia Al-Mouaswas4, HBSc; Melanie Anderson2, MLiS; Sarmini Balakumar1,4, BSc;
Megan Clare4, HBSc; Azra Dhalla3, MBA; Caitlin Gillan1,2,5, MEd; Shabnam Haghzare2,3,6, BSc; Ethan Jackson3,
PhD; Nadim Lalani3, BA; Jane Mattson4, BSc, MLT; Wanda Peteanu4, MHSc; Tim Tripp2, MLiS; Jacqueline Waldorf4,
EMBA; Spencer Williams2, BSc; Walter Tavares1,2,5,7, PhD; David Wiljer1,2,5,8, PhD

 

서론
Introduction

배경
Background

보건 과학, 교육 및 실습에서 인공지능(AI) 기술의 광범위하고 신속한 채택은 환자 치료를 제공하는 새로운 방법을 도입한다[1]. AI는 복잡한 기계에 인간과 같은 인식, 지능 및 문제 해결을 통합할 수 있는 기술을 포함하는 컴퓨터 과학 내에서 더 넓은 용어를 포함한다[2]. 의료 분야의 빅데이터는 고성능 컴퓨팅 파워와 함께 AI, 머신러닝(ML) 및 딥 러닝의 활용을 가능하게 하여 특히 임상 의사 결정 및 보건 분야 효율성을 향상시켰다[3]. 보다 최근에는 방사선과, 마취과, 피부과, 외과 및 약학 분야에서 AI 지원 기술이 계속 등장하고 있다[4-7]. AI가 임상 추론을 대체할 가능성은 낮지만, Mesko[8]는 AI가 관행의 특성(예: 관련된 반복적인 작업의 정도 및 작업이 데이터 기반인지 여부)에 따라 다양한 정도로 모든 전문성에 영향을 미칠 것으로 예측한다. 그러나 의료에서 AI 지원 기술의 효율성은 이러한 기술을 개발하고 검증하는 데 있어 의료 전문가(HCP)의 참여에 달려 있다. 따라서 HCP는 이러한 전환에서 역할을 해야 하며 AI 채택이 그들의 전문성과 조직에 어떤 영향을 미칠지 형성하는 모든 측면에 관여해야 한다.
The widespread and rapid adoption of artificial intelligence (AI) technologies in health sciences, education, and practices introduces new ways of delivering patient care [1]. AI encompasses a broader term within computer science, which includes technologies that can incorporate human-like perception, intelligence, and problem-solving into complex machines [2]. Big data in health care, along with high-performance computing power, has enabled the use of AI, machine learning (ML), and deep learning, in particular, to improve clinical decision-making and health sector efficiency [3]. More recently, AI-enabled technologies have continued to emerge, predominantly in the medical fields of radiology, anesthesiology, dermatology, surgery, and pharmacy [4-7]. Although AI is not likely to replace clinical reasoning, Mesko [8] predicts that AI will influence all specialties in varying degrees, depending on the nature of the practice (eg, the degree of repetitive tasks involved and whether the tasks are data driven). However, the efficacy of AI-enabled technologies in health care depends on the involvement of health care professionals (HCPs) in developing and validating these technologies. Therefore, HCPs should play a role in this transformation and be involved in every aspect of shaping how AI adoption will affect their specialties and organizations.

HCP 참여에 대한 권고안이 대두되고 있다. 예를 들어, 의료 영상 분야에서 웨스트와 앨런[9]은 HCP가 다음과 같이 관여할 것을 권고한다. 

  • (1) 데이터 표준을 구현하고 실제로 이를 준수 
  • (2) 의학에서 AI의 사용 사례 우선 순위 지정
  • (3) 잠재적 알고리즘의 임상적 영향을 결정
  • (4) 데이터 과학자와 연구자를 위한 직업의 필요성을 설명하고 명확하게 설명 
  • (5) 인간 언어에서 기계 언어로 연습 요구를 번역하는 데 참여

이러한 기술이 등장함에 따라, HCP와 교육자들은 이러한 변화를 신속하게 개발하고 그들의 관행과 분야에 통합하는 데 필요한 역량을 갖추는 것이 필수적이다.

Recommendations for HCP involvement are emerging. For instance, in the field of medical imaging, West and Allen [9] recommend that HCPs be involved in

  • (1) implementing data standards and following them in practice,
  • (2) prioritizing use cases of AI in medicine,
  • (3) determining the clinical impact of potential algorithms,
  • (4) describing and articulating the needs of the profession for data scientists and researchers, and
  • (5) participating in the translation of practice needs from human language into machine language.

As these technologies emerge, it is essential for HCPs and educators to have the competencies required to rapidly develop and incorporate these changes into their practices and disciplines.

개인 차원에서 [AI 리터러시 부족]은 다양한 의료 전문 분야에서 AI 지원 기술을 최대한 활용하고 채택하는 데 상당한 장벽이다. 특히 AI 교육 프로그램에서는 다양한 수준의 의학 교육(학부, 대학원, 실습 기반 교육 또는 지속적인 전문성 개발)에서 구현에 장벽이 존재한다. 예를 들어,

  • 건강 정보학은 현대 의학에서 중요한 역할을 하지만, 대부분의 의과대학 커리큘럼의 초점은 아니다[2].
  • 전자 임상 도구 사용에 대한 교육을 제공하기 위해 테크놀로지 전문가와 상담하는 경우는 많지만, 그렇다고 해서 전자electronic 임상 도구 사용이 환자 상호 작용 향상과 치료 개선에 어떻게 사용될 수 있는지를 이해하는 데 필요한 기술skill 수준을 지원하지 않는다[10].
  • 또 다른 예는 방사선 레지던트 프로그램 내에 존재하며, 여기에는 AI 구현 및 사용에 대한 인식 부족이 채택의 장벽으로 언급되었다[11,12].

At the individual level, a lack of AI literacy is a significant barrier to the adoption and use of AI-enabled technologies to their full capacity in various medical specialties. In AI education programs specifically, there are barriers to implementation at various levels of medical education (undergraduate, postgraduate, practice-based education, or continuing professional development). For instance,

  • health informatics plays a valuable role in modern medicine; yet, it is not the focus of most medical school curricula [2].
  • Technology experts are often consulted to provide training on the use of electronic clinical tools, but this does not support the level of skill required to understand how it could be used to enhance patient interactions and improve care [10].
  • Another example exists within radiology residency programs, where the lack of awareness as well as lack of knowledge of implementing and using AI were cited as barriers to its adoption [11,12].

보건 전문가의 커리큘럼에 [AI 기초]를 통합하는 것은 필수적이며, 미래의 HCP가 자신의 임상 판단의 맥락에서 AI를 고려할 수 있도록 권한을 부여함empowering으로써, [이러한 지식]과 [환자 중심 치료를 제공하는 것]의 균형을 맞추는 것이 유용할 것이다. [스스로의 판단에 대한 신뢰]와 [기본적인 통계 지식]의 조합은 임상 실습에서 새로운 AI 기반 기술을 가장 잘 적용하는 방법을 이해하는 데 유용할 것이다[13]. AI는 의료 분야에서 HCP의 광범위한 기술 세트, 우선순위 및 궁극적인 목표의 맥락에서 고려되어야 한다. 여기에는 임상 실무에서 환자 중심적이고 동정적인 치료를 장려하는 것이 포함된다[13,14].
Incorporating AI fundamentals into health professionals’ curricula is essential, and it would be useful to balance this knowledge with providing patient-centered care by empowering future HCPs to consider AI in the context of their own clinical judgment. The combination of trust in their own judgment and basic statistical knowledge will be useful in understanding how to best apply new AI-driven technologies in clinical practice [13]. AI needs to be considered within the context of HCPs’ broader skill sets, priorities, and ultimate goals in health care; this includes encouraging patient-centered, compassionate care in clinical practice [13,14].

[Martec의 법칙]은 이러한 [기술을 채택하는 조직의 능력]에 비해 [기술 변화]가 훨씬 더 빠르게, 그리고 실제로 기하급수적으로 일어난다는 생각을 말합니다[1]. 따라서 조직은 혁신 기술을 적극적으로 홍보하고 전문 인력이 AI 기반 도구를 실제로 성공적으로 구현할 수 있도록 적절한 교육을 받을 수 있도록 해야 합니다[1]. 이러한 신기술을 [개인의 수준]과 [조직의 문화 및 운영 범위] 내에서 효과적이고 동정적으로 통합하기 위해서는 [일치되고 신중한 접근 방식]이 필요하다[1].
Martec’s Law refers to the idea that technology changes occur much more rapidly, and in fact exponentially, compared with the ability of organizations to adopt these technologies [1]. Therefore, organizations need to promote innovative technologies proactively and empower their professionals to be adequately trained to successfully implement AI-based tools in their practice [1]. A concerted, deliberate approach is required to incorporate these new technologies, both effectively and compassionately, at an individual level and within the culture and operations of an organization [1].

이러한 기술을 구현하는 데 있어 많은 [잠재적 장벽]이 존재합니다. 확인된 세 가지 주요 제한 사항에는 규제, 경제 및 조직 문화 문제가 포함됩니다[15].

  • 임상 환경에서 AI 기술을 [채택]하려면 규제 승인[16]이 필요하며, 이러한 기술을 환자 치료에 사용하는 데 있어 잠재적 책임뿐만 아니라 임상 의사 결정을 위한 AI 알고리듬의 안전성, 유효성 및 투명성을 고려해야 한다[17,18].
  • AI 채택을 위해 [데이터에 액세스]하는 경우에도 규제 문제가 발생할 수 있습니다. 알고리즘 개선 및 검증과 함께 수반되는 연구 윤리 위원회 및 규제 승인을 위해 다중 기관 데이터 공유가 필요합니다 [18].
  • 채택을 더욱 개선하기 위해, 이러한 기술은 또한 [경제적]이어야 하고 적절한 자금 지원을 받아야 하며 [18] 조직 자체에도 가치가 있는 것처럼 보여야 합니다.
  • 조직 수준에서 AI의 사용은 조직의 [목표와 전략계획]과 일치해야 한다. 조직은 AI 기술이 데이터 웨어하우스 및 전자 건강 기록을 포함한 [기존 시스템에 얼마나 잘 통합]될지 평가해야 한다[18].
  • 여전히 원활하게 작동하고 개별 수준에서 임상적으로 유용하면서 조직 수준에서 가치가 입증될 정도로 다양한 임상 상황에 걸쳐 특정 AI 모델을 일반화하는 것은 어려울 수 있다[15].
  • 또한, AI 기술을 채택하기로 선택할 때, 조직은 외부 공급업체와 협력하거나 사내에서 기술을 개발할 수 있으며, 이는 추가적인 인적 및 물적 자원을 사용해야 한다[15].

A number of potential barriers to implementing these technologies exist; the 3 main limitations identified include regulatory, economic, and organizational culture issues [15].

  • Regulatory approval [16] is needed to adopt AI technologies in clinical settings, and potential liabilities in using these technologies for patient care must be considered, as well as the safety, efficacy, and transparency of AI algorithms for clinical decision-making [17,18].
  • Regulatory issues can also come into play when it comes to accessing data for AI adoption; multi-institution data sharing is required for algorithm improvement and validation, as well as the accompanying research ethics board and regulatory approvals [18].
  • To further improve adoption, these technologies will also have to be economical, supported by adequate funding [18], and seem as valuable to the organization itself. At an organizational level, the use of AI should align with the goals and strategic plans of an organization; organizations will need to assess how well the AI technology will integrate into existing systems, including data warehouses and electronic health records [18].
  • It may be difficult to generalize a particular AI model across different clinical contexts to a degree that would prove valuable at an organizational level while still working seamlessly and being clinically useful at the individual level [15].
  • Furthermore, when choosing to adopt AI technologies, organizations can either collaborate with outside vendors or create the technologies in-house, which will require the use of additional human and material resources [15].

목적
Objective

AI 교육의 적자는 국립 의학 아카데미의 5중 목표 모델의 일부로서 AI 통합에 대한 요구에도 불구하고 환자 치료를 개선하기 위해 AI 기술을 완전히 통합하고 채택할 수 있는 의료 시스템의 용량capacity 부족에 기여할 수 있다[19]. 의료 기관 및 이해 관계자가 의료 전달을 강화하고 최적화하는 데 AI를 활용할 수 있는 인지, 정신 운동 및 정서적 기술을 갖추도록 하는 것이 중요하다. 여기에는 또한 모든 유형의 HCP에 널리 이용 가능한 AI 교육 이니셔티브를 지원하는 것도 포함될 것이다. 향후 AI 교육 개발, 보급, 평가를 지원하기 위해서는 보건의료에서 AI 도입 내 현황을 평가하고 AI 교육 실시 대상자, 대상 콘텐츠는 무엇이며 전달 방식, 전문가들이 AI 교육 커리큘럼이 포함되어야 한다고 믿는 것이 반영되는지 여부 등 AI 교육 시행의 범위를 더욱 파악하는 것이 중요하다. 본 범위 검토는 HCP를 위한 AI 교육 프로그램에 대한 기초적 이해를 확립하는 것을 목표로 한다.
Deficits in AI education may be contributing to a lack of capacity in health care systems to fully integrate and adopt AI technologies to improve patient care, despite calls for AI integration as part of the National Academy of Medicine’s Quintuple Aim Model [19]. It is important to equip health care organizations and their stakeholders to have the cognitive, psychomotor, and affective skills to harness AI in enhancing and optimizing the delivery of care. This will also involve supporting AI education initiatives that are widely available for all types of HCPs. To support future AI education development, dissemination, and evaluation, it is important to assess the current situation within AI adoption in health care and further understand the extent of AI education implementation, including who is receiving AI training or education, what content is covered, how it is delivered, and whether this reflects what experts believe that AI education curricula should include. Therefore, this scoping review aims to establish a foundational understanding of education programs on AI for HCPs by determining the following:

  • HCP가 의료 서비스 제공을 개선하고 최적화하는 데 AI를 활용할 수 있도록 하는 가장 효과적인 교육 접근 방식은 무엇이었습니까?
    • 어떤 커리큘럼 콘텐츠가 제공되었습니까?
    • 전달해야 할 콘텐츠의 범위는 어느 정도였습니까?
    • Bloom [20]에 의해 공식화된 학습을 위한 분류법을 사용하여 이러한 접근법에 사용된 학습 목표는 무엇인가?
  • 이러한 프로그램의 성공과 의료 교육 프로그램에서 AI 커리큘럼의 구현에 기여 요인 또는 장애 요인은 무엇이었습니까?
  • Kirkpatrick-Barr Framework [21]를 사용하여 교육 프로그램의 효과를 평가하기 위해 어떤 성과가 사용되었는가?
  1. What were the most effective educational approaches to enabling HCPs to harness AI in enhancing and optimizing health care delivery?
    • What curricular content was delivered?
    • What was the scope of content that should be delivered?
    • What learning objectives were used in these approaches, using the taxonomy for learning formulated by Bloom [20]?
  2. What were the enablers or barriers that contributed to the success of these programs and the implementation of AI curricula in health care education programs?
  3. What outcomes were used to assess the effectiveness of the education programs, using the Kirkpatrick-Barr Framework [21]?

 

방법들
Methods

개요
Overview

이 범위 검토는 Arcsey 및 O'Malley [22] 지침과 범위 검토용 PRISMA(체계적 검토 및 메타 분석을 위한 선호 보고 항목) 확장 체크리스트 [23,24]를 따랐다. 이 범위 검토의 목적은 HCP에 대한 AI 교육 및 훈련에 대한 현존하는 문헌을 검토하고 요약하는 것이다.
This scoping review followed the Arksey and O’Malley [22] guidelines and the PRISMA (Preferred Reporting Items for Systematic Reviews and Meta-Analyses) Extension for Scoping Reviews checklist [23,24]. The objective of this scoping review is to examine and summarize the extant literature on AI education and training for HCPs.

1단계: 검색 전략
Stage 1: Search Strategy

보건과학 사서(MA)는 AI 및 보건 전문직 교육을 위해 적절한 주제 제목과 키워드를 사용하여 전략을 개발했다. 보건과학 문헌에서 보건직업과 교육과 관련된 용어가 널리 사용된 결과, 결과 집합의 소음을 줄이기 위해 보건직업 교육 개념에 검색을 집중하기로 결정했다. 이러한 제목에 대한 검색은 주요 제목(항목에 대한 데이터베이스 기록에서 가장 중요한 제목)인 위치로 제한되었습니다. 이러한 개념에 대한 키워드는 데이터베이스의 내용과 필드 가용성에 따라 연구 제목, 저자 지정 키워드, 제목 단어, 저널 제목에서만 검색되었다. 언어 또는 날짜 제한이 적용되지 않았습니다. 검색은 실행되었고 결과는 2020년 7월 7일에 다운로드되었다. 전체 전략은 멀티미디어 부록 1을 참조하십시오. 검색 결과에 학회 초록과 프로시딩 내용이 포함된 경우 해당 후속 연구를 찾기 위한 검색이 Google Scholar에서 수행되었습니다. 마지막으로, 초기 선별부터 포함된 연구에서 인용된 모든 논문이 2단계 선별 과정(제목 및 추상 스캔은 물론 전체 텍스트 검토)을 거친 상태에서 핸드 빗 프로세스로도 알려진 진주 재배가 수행되었다.
A health sciences librarian (MA) developed strategies for Ovid MEDLINE All, Ovid Embase, Ovid APA PsycINFO, Ovid Emcare Nursing, Ovid Cochrane Database of Systematic Reviews, Ovid Cochrane Central Register of Controlled Trials, EBSCO ERIC, and Clarivate Web of Science using appropriate subject headings and keywords for AI and health professions education. As a result of the widespread use of terms relating to health professions and education in health sciences literature, the decision was made to focus the searches on health professions education concepts to reduce noise in the results sets. Searches for these subject headings were limited to where they were the major subject heading (the most important subject heading in the database record for an item). Keywords for these concepts were only searched in the study titles, the author-assigned keywords, heading words, and journal titles, depending on the content and field availability of the database. No language or date limits were applied. The searches were run and the results were downloaded on July 7, 2020. For the complete strategies, see Multimedia Appendix 1. If the search results included conference abstracts and proceedings, a subsequent search to find any corresponding follow-up studies was conducted in Google Scholar. Finally, pearl growing, also known as a hand comb process, was conducted where all cited works in the included studies from the initial screening underwent a 2-stage screening process (title and abstract scan as well as full-text review).

2단계: 스터디 선택
Stage 2: Study Selection

2단계 심사 과정은 (1) 제목 및 초록 스캔과 (2) 전문 검토로 구성되었다. 연구 적격성은 두 명의 독립 검토자에 의해 결정되었으며, 두 검토자 간에 합의에 도달하지 못한 경우 충돌을 해결하기 위해 세 번째 검토자가 참여했습니다. 전체 텍스트 검토를 위해 스터디가 포함되고 후속 포함을 위해 선택되기 위해서는 각 단계의 제목과 요약이 다음과 같은 속성을 가져야 합니다.

  • 실제 훈련 프로그램이나 교육 개입, 잠재적 훈련 프로그램이나 교육 개입, 그리고 다루어야 할 바람직한 내용에 대해 논의하였다.
  • AI에 초점을 맞췄다.
  • HCP를 위해 설계되거나 의도되었다.

The 2-stage screening process consisted of (1) title and abstract scan and (2) full-text review. Study eligibility was determined by 2 independent reviewers, and a third reviewer was involved to resolve any conflict when consensus was not reached between the 2 reviewers. For a study to be included for full-text review and to be chosen for subsequent inclusion, the title and abstract at each stage needed to have the following attributes:

  1. It discussed an actual training program or educational intervention or potential training program or educational intervention and the desired content to be covered.
  2. It focused on AI.
  3. It was designed or intended for HCPs (at any stage of their career).

MEDLINE 인용문 중 20%(595/2973)에 대한 파일럿 검토를 수행하여 상호간 신뢰성이 확립되었다. 중간자 신뢰도 임계값은 0.70의 Cohen θ 값을 가지며, 이는 상당한 일치성을 나타낸다. 임계값이 충족될 때까지 50개의 추가 인용 배치를 검토했다.
A pilot review of 20% (595/2973) of the MEDLINE citations was conducted to establish interrater reliability. The interrater reliability threshold had a Cohen κ value of 0.70, indicating substantial agreement. Additional batches of 50 citations were reviewed until the threshold was met.

3단계: 데이터 수집
Stage 3: Data Collection

표준화된 차트 작성 양식은 기사 세부 정보, 연구 세부 정보(출판이 경험적 연구인 경우), 교육 프로그램 세부 정보 및 구현 요소를 포착하기 위해 개발되었다. 데이터 추출을 위한 도메인의 세분화가 표 1에 요약되어 있습니다.

A standardized charting form was developed to capture the following domains: article details, study details (if publication was an empirical study), education program details, and implementation factors. The subdivisions of the domains for the data extraction are outlined in Table 1.

 

4단계: 결과 종합 및 보고
Stage 4: Synthesizing and Reporting the Results

본 검토에 포함된 연구를 정리하고 요약하며 보고하기 위해 서술적 합성 접근법이 사용되었다[25]. 여기에는 각 영역(기사 상세, 연구 상세, 교육 프로그램 상세, 구현 요소)을 보고하기 위해 기술 통계를 이용한 수치 요약이 포함되었다. 교육 프로그램 세부사항에 따른 프로그램 커리큘럼의 경우 커리큘럼 주제를 귀납적으로 코딩하였다. 일단 주제 목록이 생성되면 블룸이 공식화한 학습을 위한 분류법을 사용하여 도메인별로 그룹화되었다. 3개의 도메인이 있습니다. 

  • (1) 인지, 즉 학습자가 가져야 할 지식을 말한다. 
  • (2) 사이코모터, 학습자가 보여주고 익혀야 하는 기술을 가리킴
  • (3) 정동, 학습자가 개발하고 실습에 통합해야 하는 태도를 나타냄

 

To collate, summarize, and report on the included studies in this review, a narrative synthesis approach was used [25]. This included a numeric summary using descriptive statistics to report each domain (article details, study details, education program details, and implementation factors). For program curriculum under education program details, curriculum topics were inductively coded. Once a list of topics was generated, they were then grouped by domain using the taxonomy for learning formulated by Bloom. There are 3 domains:

  • (1) cognitive, which refers to knowledge that learners should have,
  • (2) psychomotor, which refers to skills learners should demonstrate and master, and
  • (3) affective, which refers to attitudes learners should develop and incorporate into their practice [20].

[20] 연구 결과는 교육 성과의 Kirkpatrick-Barr 프레임워크[21]를 사용하여 연역적으로 코딩되었다. 이 프레임워크는 각 연구에서 보고된 교육적 성과 유형을 분류하는 표준화된 방법을 제공했기 때문에 선택되었다. 구현 요소 하위 도메인은 선험적 코드를 사용하여 2명의 독립 검토자에 의해 주제적으로 분석되었다. 검토자들은 코딩 체계를 비교하고 주요 주제를 반복적으로 결정하여 결과를 프레임화하였다. 콘텐츠 검증을 위해 프로젝트 팀원과 환자, 의료교육 및 AI 분야 전문가가 주제 분석에 대한 피드백을 제공했다.

The study outcomes were deductively coded using the Kirkpatrick-Barr Framework [21] of educational outcomes. This framework was selected because it provided a standardized method of categorizing the type of educational outcomes reported by each study. The implementation factors subdomain was thematically analyzed by 2 independent reviewers using a priori codes. The reviewers compared coding schemes and iteratively determined overarching themes to frame their findings. For content validation, the project team members, patients, and experts in the fields of medical education and AI provided feedback on the thematic analysis.

결과.
Results

검색 결과
Search Results

초기 데이터베이스 검색 결과 13,449개의 결과가 나왔으며, 중복이 제거된 후에는 10,094개(75.05%)의 고유 인용 제목과 요약이 확인되었다. 10,094개의 고유 인용문 중에서 기존 13개 고유 프로그램[32,35,39,43,49,50,59,61-63]이 10개(24%) 기사에 언급된 41개(0.41%) 기사[2,5,13,26-31,34,36-36,40-42,44-48,51,50] 기사에 언급된 나머지 31개(76%) 기사[2,5,35,13,49,50,61-63]는 바람직한 교육내용에 대해 논의하였다. 기사 선택 프로세스는 그림 1에 나와 있습니다. 기존 프로그램에 대해 논의한 10개의 기사 중 8개(80%)는 논평[32,43,49,50,59,61-63]이었고, 1개(10%)는 사례 보고서[39]였으며, 1개(10%)는 실증 연구[35]였다. 표 2와 3은 이 검토에 포함된 기사와 프로그램의 특성을 설명한다.

The initial database search yielded 13,449 results; once duplicates were removed, the titles and abstracts of 10,094 (75.05%) unique citations were identified. From the 10,094 unique citations, we identified 41 (0.41%) articles [2,5,13,26-63], where 13 unique, existing programs [32,35,39,43,49,50,59,61-63] were mentioned in 10 (24%) articles, and the remaining 31 (76%) articles [2,5,13,26-31,33,34,36-38,40-42,44-48,51-58,60] discussed the desired or recommended curricular content. The article selection process is presented in Figure 1. Of the 10 articles that discussed an existing program, 8 (80%) were commentaries [32,43,49,50,59,61-63], 1 (10%) was a case report [39], and 1 (10%) was an empirical study [35]. Tables 2 and 3 describe the characteristics of the articles and programs included in this review.

 

 

전달 방식은 무엇이었습니까?
What Was the Mode of Delivery?

개별 프로그램의 요약은 표 4에서 확인할 수 있습니다. 13개 프로그램 중 8개(62%)가 미국[32,35,49,50,59,61-63]에서, 1개(8%)가 캐나다[43]에서, 1개(8%)가 프랑스[59]에서, 1개(8%)가 멕시코[39]에서 나왔다. Strosahl [64]이 기술한 유형학은 교육 방법을 분류하는 데 사용되었다. 13개 프로그램 중 9개 프로그램(69%)은 강의식 접근[32, 35, 43, 43, 43, 43, 43, 50, 50, 59, 59, 59, 59, 59]과 결합된 토론 [62](1/13, 8%), 웹 기반 [39,61](2/13, 15%), 워크숍 및 사례 기반 [50](1/13, 8%), 경험적 학습 [43](1/13, 8%)을 가지고 있었다. 13개 프로그램 중 10개(77%)가 학술적 환경에서 교육되었습니다 [32,35,39,43,59,61,62].

Summaries of the individual programs can be found in Table 4. Of the 13 programs, 8 (62%) originated from the United States [32,35,49,50,59,61-63], 1 (8%) from Canada [43], 1 (8%) from France [59], and 1 (8%) from Mexico [39]. The typology described by Strosahl [64] was used to classify the educational method. Of the 13 programs, 9 (69%) had a didactic approach [32,35,39,43,50,59,61,62] in combination with discussions [62] (1/13, 8%), web-based [39,61] (2/13, 15%), workshop and case-based [50] (1/13, 8%), and experiential learning [43] (1/13, 8%). Of the 13 programs, 10 (77%) were taught in an academic setting [32,35,39,43,59,61,62].

 

대상 독자
Target Audience

검토된 41개 논문에서 확인된 HCP의 유형은 의사 [41, 43, 46, 52, 59, 63](6/41, 15%)와 간호사 [31, 52](2/41, 5%) 및 방사선 기술자 [5](1/41, 2%)이다. 또한 의료영상[5,26,32-34,37,42,48,50,51,55,58,63] (13/41,32%)과 심장내과[56,61] (2/41,51,31,35,36,38-43,43-47,49-52,57,60,60,26] (2/41,63)의 두 가지 특정 전문성이 확인되었다. 그림 2는 임상의의 학습 연속체에서 다루는 커리큘럼 주제 유형을 보여주고 있으며, 여기에는 학부 의료 교육 [2,13,28-30,33,35-37,39-41,44,47,53,57,61,62](20/41,49%), 대학원 의료 교육 [5,26,32-35,42,42,42,42,42,41,54-58,63,63](19/41,41,41,416%), 전문성 개발 [51,51,2] 등이 포함된다. 5%). 기타 비임상 전문가로는 연구자[5,27,33,59,62](5/41,12%), 보건관리자[27,33,45,52,62](5/41,12%), 컴퓨터 및 데이터 과학자[27,33,52,63](4/41,10%) 등이 있습니다.

There were 3 types of HCPs identified in the 41 reviewed papers: physicians [41,43,46,52,59,63] (6/41, 15%), nurses [31,52] (2/41, 5%), and radiology technologists [5] (1/41, 2%). In addition, 2 specific specialties were identified: medical imaging [5,26,32-34,37,42,48,50,51,55,58,63] (13/41, 32%) and cardiology [56,61] (2/41, 5%), with others not being specified [2,13,27-31,35,36,38-41,43-47,49,52-54,57,59,60,62] (26/41, 63%). Figure 2 illustrates the type of curriculum topics covered in the continuum of learning for clinicians, which includes undergraduate medical education [2,13,28-30,33,35-37,39-41,43,44,47,53,57,61,62] (20/41, 49%), postgraduate medical education [5,26,32-35,41,42,48-51, 54-58,62,63] (19/41, 46%), and continuing professional development [5,57] (2/41, 5%). Other nonclinical professionals include researchers [5,27,33,59,62] (5/41, 12%), health care administrators [27,33,45,52,62] (5/41, 12%), and computer and data scientists [27,33,52,63] (4/41, 10%).

어떤 내용이 다루어졌습니까?
What Content Was Covered?

이러한 논문에서 언급한 프로그램 커리큘럼과 희망 또는 추천 콘텐츠는 맥코이 외 연구진[43]에 의해 프레임화된 AI의 사용, AI 해석 및 결과 설명에 대한 주제를 포함했다. 각 커리큘럼 주제에 대한 설명은 표 5에서 확인할 수 있다. 이들 16개 교육과정 주제 중 인지영역(56%)은 9개, 심리운동영역(68%)은 6개, 정서영역(6%)은 1개였으며, 현 교육프로그램을 논한 논문과 HCP가 무엇을 배워야 하는지에 대한 논평을 통해 대부분 언급되었다. 커리큘럼 주제는 Bloom[20]이 공식화한 학습을 위한 분류법에서 식별된 3가지 영역으로 분류되었다. 표 6은 AI 프로그램이 현재 가르치는 내용을 기술한 논문[32,35,39,43,49,50,59,61-63]의 24%(10/41)에 고유한 커리큘럼 주제를 보여주고 있으며, AI 프로그램이 커리큘럼의 일부로 무엇을 가르쳐야 하는지를 기술한 논문[2,5,13,26-33,34,36-38,40-42,44-48,51-58,60]의 76%(31/41)에 해당하는 커리큘럼 주제를 보여주고 있다. 가르쳐야 할 것과 가르쳐야 할 것.

From these papers, the program curriculum and desired or recommended content mentioned included topics on using AI, interpreting AI, and explaining results from AI, as framed by McCoy et al [43]. A description of each curricular topic can be found in Table 5. Of these 16 curricular topics, 9 (56%) fell under cognitive domain, 6 (38%) under psychomotor domain, and 1 (6%) under affective domain, and most of them were mentioned both by papers that discussed current education programs and commentaries that discussed what HCPs should be learning. The curricular topics were categorized into the 3 domains identified in the taxonomy for learning formulated by Bloom [20]. Table 6 displays the curricular topics

  • that were unique to 24% (10/41) of the papers [32,35,39,43,49,50,59,61-63] that described what AI programs currently teach,
  • 76% (31/41) of the papers [2,5,13,26-31,33,34,36-38,40-42,44-48,51-58,60] that described what AI programs should teach as part of their curriculum, and
  • those that outlined both what was taught and what should be taught.

인지 영역
Cognitive Domain

41편의 논문 중 20편(49%), [5,26,32,34,36,37,39-41,43,45-47,50,52,55,57-59,62]은 HCP에게 AI에 대한 기본적 이해를 제공하는 것의 중요성을 강조했고 10편(24%)은 AI 응용을 가르치라고 권고했다. 그 연구는 진단 시스템, 데이터 수집, 평가 및 사용, 임상 응용, 개인 맞춤형 치료 등 AI의 다양한 응용에 초점을 맞췄다. 또한, 많은 논문은 의료 교육과정이 빅데이터와 생물정보학을 포함하되 이에 국한되지 않는 건강관리 데이터 과학의 기초[5,13,26-36,42,45,49,50,52,54](19/41,46%)를 통합해야 한다고 보고했다. 매서니 외 연구진[45]은 데이터 과학 커리큘럼은 AI의 가치를 향상시키고 현재 작동 중인 윤리, 형평성, 다양성 및 포용 원칙과 AI 구현에서 발생할 수 있는 우발적 결과를 인지하기 위해 다학제적 개발팀을 구성하는 방법을 포함해야 한다고 언급했다. 이 연구는 또한 통계, 모델 개발을 포함한 ML, 임상 지식에서의 모델 번역 및 사용, 데이터 추출, 환자의 시각화를 위한 응용 프로그램에 초점을 맞췄다. ML 어휘에 대한 익숙함과 방법론(알고리즘과 기계 수집 및 데이터 프로세스)에 대한 기본적인 이해는 이 급부상하는 분야를 이해하는 데 중요하다고 여겨졌다.
Of the 41 papers, 20 (49%) [5,26,32,34,36,37,39-41,43, 45-47,50,52,55,57-59,62] highlighted the importance of providing HCPs with a baseline understanding of AI and 10 (24%) [32,35,39,43,49,50,59,61-63] recommended teaching them AI applications. The studies focused on various applications of AI, including diagnostic systems, data gathering, assessment and use, clinical applications, and personalized care. In addition, many of the papers reported that medical curricula should integrate fundamentals of health care data science [5,13,26-36,42,45,49,50,52,54] (19/41, 46%), including, but not limited to, big data and bioinformatics. Matheny et al [45] stated that data science curricula should encompass how to form multidisciplinary development teams to improve the value of AI and to be aware of the ethics, equity, diversity, and inclusion principles at play and the inadvertent ramifications that may result from AI implementation. The studies also focused on statistics, ML with model development, model translation and use in clinical knowledge, data extraction, and applications for visualization of patients. Familiarity with ML vocabulary and a basic understanding of the methodology (algorithms and machine gathering and process of data) were deemed important to understand this rapidly emerging field.

사이코모터 도메인
Psychomotor Domain

대부분의 논문은 추세와 효율성 상관관계를 파악하기 위해 [2,5,31,34,35,40,43,46,50,54,55,58,59,61,63](15/41,37%) [임상의가 데이터를 효과적으로 분석할 수 있도록 하는 것]에 초점을 맞추었다. 발타자르 외 연구진[63]과 포니와 맥브라이드[55]가 강조했듯이, AI 애플리케이션의 효율성과 정밀도를 평가하는 방법을 배우는 것이 필수적이다. 이 점은 의대생이 알고리즘의 임상 정확도를 검증할 수 있어야 한다는 박 외 연구진[40]의 검토에서 강화되었다. HCP는 실시간 건강 정보를 수용하는 방법에 익숙해져야 하며, 실천 환경에서 의사 결정을 내릴 수 있다[61]. 41편의 논문 중 8편(20%)은 출처 오류, 편향 또는 임상적 무관성에 대한 인식을 포함하여 합리적인 정확도로 연구 결과를 이해하고 해석하는 것의 중요성을 논의하였다[13,28-31,39,47,50]. 또한, 연구 결과는 문제 해결[35,38,60](3/41,7%)을 중요한 기술로 설명했으며, 여러 개별 자원의 관리와 적용을 수반했다. 임상의는 결과 및 프로세스[5,28-30,32,36,43,46](8/41,20%)를 개인화되고 의미 있는 방식으로 환자와 전달하는 데 능숙해야 한다. 환자와 의사소통할 때 공감과 동정심을 배양하고 표현하는 것[28-30,36](4/41, 10%)이 여러 연구에서 강조되었다. 

Most of the papers focused on clinicians being able to effectively analyze the data [2,5,31,34,35,40,43,46,50,54,55,58,59,61,63] (15/41, 37%) to identify trends and efficiency correlations. As highlighted by Balthazar et al [63] and Forney and McBride [55], it is imperative to learn how to evaluate the efficacy and precision of AI applications. This point was reinforced in a review conducted by Park et al [40] that stated medical students should be able to validate the clinical accuracy of algorithms. HCPs will need to become accustomed and understand how to embrace real-time health information to help make decisions in their practice setting [61]. Of the 41 papers, 8 (20%) discussed the significance of understanding and interpreting the findings with a reasonable degree of accuracy, including awareness of source error, bias, or clinical irrelevance [13,28-31,39,47,50]. Moreover, the study findings described problem-solving [35,38,60] (3/41, 7%) as a critical skill, entailing the management and application of several distinct resources. Clinicians will need to become adept in communicating the results and processes [5,28-30,32,36,43,46] (8/41, 20%) with patients in a personalized and meaningful manner. Cultivating and expressing empathy and compassion [28-30,36] (4/41, 10%) when communicating with the patient was emphasized in several studies.  

영향 영역
Affective Domain

41편의 논문 중 8편(20%)은 HCP가 환자와 지역사회에 대한 결과를 개선하기 위해 AI 도구를 효과적으로 활용하는 태도를 가져야 한다고 강조했다[27,30,37,52,55,58,59,62]. Wiljer와 Hakim [27]은 초기 단계로서 AI에 대한 대중적 고정관념을 깨는 것의 중요성을 주장했다. 전문가들은 AI가 의료 시스템의 다른 측면을 인수하는 것이 아니라 의료 전달을 강화하는 것으로 인식하는 것이 필수적이다[62]. 포니와 맥브라이드[55]는 임상의가 광범위한 AI 도구와 이러한 도구가 작업 흐름 및 환자 치료에 미치는 영향을 볼 수 있다면 AI를 위협으로 인식할 가능성이 없다고 밝혔다. 또한, Sit 외 연구진[37]은 의대생들이 활용 사례를 제시하고 AI 도구의 경계를 이해할 때 특정 전문 분야를 추구하는 것을 주저하지 않을 가능성이 높다고 언급했다. 응답자의 거의 절반은 [AI 때문에 방사선 전문의와 같은 특정 전문가가 가까운 미래에 쓸모없게 될 것이라는 잘못된 인식]을 믿었다. 또한, Brouillette[59]는 의대생, 컴퓨터 공학대생 및 공대생 간의 협업 프로그램의 필요성을 언급하여 서로의 학문을 더 잘 이해할 수 있도록 하였다. 몇몇 논문은 미래 AI 프로그램이 변경 관리를 통합하고 관련 이해 관계자들과 신뢰와 투명성의 문화를 구축해야 하며, 이는 조직이 의료 생태계 내에서 AI 기술을 보다 신속하게 채택하고 구현할 수 있도록 지원할 것이라고 권고했다[27,30]. 따라서, 조직이 기술의 급속한 발전에 발맞춘 속도로 변화를 관리할 수 있도록 지원하는 것이 중요합니다.

Of the 41 papers, 8 (20%) stressed that HCPs should have the attitude to harness AI tools effectively to improve outcomes for patients and their communities [27,30,37,52,55,58,59,62]. Wiljer and Hakim [27] asserted the importance of breaking the mass stereotypes about AI as an initial step. It is essential that professionals perceive AI as augmenting their delivery of care, rather than taking over different aspects of the health care system [62]. Forney and McBride [55] stated that clinicians are not as likely to perceive AI as a threat if they are able to see the wide array of AI tools and the impact these tools have on workflow and patient care. Furthermore, Sit et al [37] mentioned that medical students are not as likely to be discouraged from pursuing certain specialties when they are presented with use cases and understand the boundaries of AI tools; almost half of the respondents believed the misconception that because of AI, certain specialists such as radiologists will become obsolete in the near future. Moreover, Brouillette [59] mentioned the need for collaborative programs among medical students, computer science students, and engineering students, where they can better understand each other’s disciplines. A few papers recommended that future AI programs should integrate change management and establish a culture of trust and transparency with relevant stakeholders, which will support organizations to more rapidly adopt and implement AI technologies within the health care ecosystem [27,30]. Thus, it is vital to help organizations manage change at a rate in pace with the rapid advancement of technology.

중요한 구현 요인은 무엇이었습니까?
What Were the Critical Implementation Factors?

활성화 요인
Enablers

이러한 프로그램의 성공과 구현에 기여하거나 잠재적으로 기여하는 것으로 확인된 요인에는 단과대학 간 협력 촉진[39,54,57]과 기존 규제 구조 내에서 작업[28,37,39,57]이 포함된다. 모든 기관이 데이터 과학에 대한 경험을 가진 임상 교수진을 보유하고 있는 것은 아니다. 따라서 데이터 과학 교수진과의 협업을 위한 실습과 교육 모두에서 필요하다. 연구에 따르면, [interfaculty collaboration]의 촉진은 교수진 간의 전문성 공유로 설명되었고, 따라서 다학제적인 팀을 구성했다[39,54,57]. 임상 및 비임상 강사의 협업 교육은 향후 HCP를 준비할 때 교육 가치를 높일 수 있으며 또한 교수진에게 데이터 과학 지원을 제공할 수 있다[39,54]. 구현의 또 다른 촉진자는 [기존 규제 구조] 내에서 작업하는 것이다. 커리큘럼 변경은 기존 인증 및 규제 기관의 지원을 필요로 한다[28]. 몇 개의 논문은 의무 AI 과정 작업 및 평가를 현재 커리큘럼과 통합할 필요성을 논의하였다[39,57]. 따라서, 이것은 다양한 AI 리터러시 수준을 다룰 수 있다. AI에 대한 지식을 향상시키면 실제 환경에서 사용될 가능성이 높아질 것이다[37].
The factors identified as contributing, or potentially contributing, to the success and implementation of these programs include promoting interfaculty collaboration [39,54,57] and working within existing regulatory structures [28,37,39,57]. Not all institutions have clinical faculty who also have experience with data science; hence, there is a need in both practice and teaching for collaboration with data science faculty. Promoting interfaculty collaboration was described in the studies as the sharing of expertise among faculty members, thus creating a multidisciplinary team [39,54,57]. Collaborative teaching by clinical and nonclinical instructors may increase the educational value when preparing future HCPs and also provide data science support to faculty [39,54]. Another facilitator to implementation is working within existing regulatory structures. Curriculum changes require the support of existing accreditation and regulatory bodies [28]. A few papers discussed the need for the integration of mandatory AI coursework and assessments with the current curricula [39,57]. Hence, this could address varying AI literacy levels; enhancing knowledge of AI will increase the likelihood that it will be used in practice settings [37].

장벽
Barriers

전반적으로 조직의 구현 노력을 잠재적으로 방해할 수 있는 두 가지 주요 장벽이 확인되었습니다. 

  • (1) 커리큘럼 설계에서 교수진 간의 다양한 수준의 AI 리터러시[54,57] 및 
  • (2) AI를 현재 커리큘럼에 통합할 수 있는 인프라의 부족 [34,39,50,54]. 

교직원과 교육과정 지도자들 사이의 다양한 수준의 [AI 리터러시(literacy)]가 AI 프로그램의 실행을 가로막는 주요 장벽으로 논의되었다. 41편의 논문 중 2편(5%)은 교수진이 AI 기초(예: 빅 데이터 또는 데이터 과학)와 소프트웨어에 대한 지식뿐만 아니라 [가르치는 시간]도 어떻게 제한되는지 논의했다[54,57]. AI 기반 커리큘럼을 설계하기 위한 기술적 전문지식이 부족하다[49,57]. 게다가, 몇몇 연구는 AI를 교육과정에 통합할 수 있는 [인프라의 부족]에 대한 우려를 표명했다. 일부 연구에서는 기존 커리큘럼이 포괄적이고 복잡하며 AI에 대한 [추가 콘텐츠가 강의 부하]를 증가시킬 것이라고 강조했습니다 [34, 50, 54]. 학술 기관은 교직원의 퇴직, AI에 익숙하지 않은 직원, 불충분한 재정 자원과 같은 여러 가지 장애에 직면해 있다[54]. 마지막으로, AI 콘텐츠를 기존 커리큘럼에 통합하는 것은 많은 조직에 장애가 될 수 있다[39].

Overall, 2 major barriers were identified that could potentially impede an organization’s implementation efforts:

  • (1) varying levels of AI literacy among faculty in designing curricula [54,57] and
  • (2) lack of infrastructure to integrate AI into the current curriculum [34,39,50,54].

Varying levels of AI literacy among faculty and curriculum leaders was discussed as a major barrier that encumbers the implementation of AI programs. Of the 41 papers, 2 (5%) discussed how faculty have limited knowledge of AI fundamentals (eg, big data or data science) and software, as well as limited time to teach [54,57]. There is a lack of technical expertise to design AI-based curricula [49,57]. Moreover, a few studies voiced concerns about the lack of infrastructure to integrate AI into the curriculum. Some studies highlighted that the existing curricula are comprehensive and complex and additional content on AI will increase the course load [34,50,54]. Academic institutions are faced with several encumbrances such as faculty retirement, staff not being well-versed in AI, and inadequate financial resources [54]. Finally, integrating the AI content into existing curricula can be an impediment for many organizations [39].

교육 프로그램의 효과를 평가하기 위해 어떤 조치와 결과가 사용되었는가?
What Measures and Outcomes Were Used to Assess the Effectiveness of Education Programs?

41편의 논문 중 5편(12%)이 훈련 평가 결과를 제시했다[35,39,49,50,62]. 연구마다 교육적 접근법이 다르기 때문에, 각 접근법에 대해 간략하게 논의한 후(표 7) 각 교육 이니셔티브와 관련된 조치와 결과를 도출한다. Kirkpatrick-Barr 프레임워크에 따라 분류된 결과는 레벨 1(즉, 학습자 반응과 교육에 대한 만족도) [39,49,50], 레벨 2a(즉, 태도 변화) [49,50,62] 또는 레벨 2b(즉, 지식 또는 기술의 변화) [35,62]였다. 수준 3 또는 수준 4로 분류할 수 있는 결과가 없었으므로 프로그램 평가는 조직 수준 또는 환자 결과에 대한 행동 또는 영향의 변화에 대해 언급하지 않았다.
Of the 41 papers, 5 (12%) presented the results of their training evaluation [35,39,49,50,62]. As the educational approaches varied across studies, each approach will be briefly discussed (Table 7), followed by the measures and outcomes associated with each educational initiative. Categorized according to the Kirkpatrick-Barr Framework, the outcomes were either level 1 (ie, learner reaction and satisfaction with the education) [39,49,50], level 2a (ie, change in attitude) [49,50,62], or level 2b (ie, change in knowledge or skill) [35,62]. There were no outcomes that could be categorized as level 3 or level 4; thus, the program evaluations did not comment on the change in behavior or affect at the organizational level or on patient outcomes.

 

논의
Discussion

AI 교육 프로그램 현황
Current State of AI Education Programs

이 리뷰는 HCP를 위한 효과적인 AI 교육 프로그램에 대한 우리의 이해에서 중추적인 지식 격차를 확인했다. 본 검토를 통해 확인된 격차는 HCP가 이용할 수 있는 제한된 AI 교육 및 훈련 기회를 보여주었으며, 따라서 HCP를 대상으로 한 추가 AI 교육 프로그램의 큐레이션 필요성을 강조했다. 기존 프로그램은 [AI의 개발과 구현]에만 집중하는 경향이 있다. 
그러나, AI와 협력할 뿐만 아니라 건강과 임상 의사 결정을 위해 AI를 발전시킬 수 있도록 HCP를 준비하는 것도 필수적이다. AI 교육 프로그램은 HCP가 이러한 기술을 안전하게 채택할 수 있을 뿐만 아니라 관련성을 유지하기 위해 practice의 범위를 조정하고 전환할 수 있도록 설계되어야 한다. 의료 분야의 AI 커리큘럼에 대한 중요하고 의미 있는 변화는 [HCP의 AI 리터러시를 높이고 관련 디지털 및 데이터 중심 의사 결정 도구를 활용할 수 있는 능력을 제공해야만] 일어날 것이다. 연구 결과 AI 관련 교육 시책의 성과를 평가하기 위한 노력이 이루어지고 있음을 알 수 있지만, 이러한 성과에 대한 종합적인 평가를 위한 조치에는 일관성이 결여되어 있다. 대부분의 논문은 자체 제작 및 검증되지 않은 도구를 사용했으며, 그 결과를 정성적인 용어로 설명했습니다. 연구에 사용된 다양한 도구를 고려할 때, 표준적이고 포괄적인 도구의 부재는 연구 전반에 걸친 발견의 통합과 합성을 방해한다. 이 검토에서 제공된 지침 원칙은 또한 이러한 프로그램의 향후 개발 및 설계에 도움이 되기를 바란다. 
This review identified pivotal knowledge gaps in our understanding of effective AI education programs for HCPs. The gaps identified through this review illustrated the limited AI education and training opportunities available for HCPs and thus emphasized the necessity of curating further AI education programs targeted to HCPs. The existing programs tend to focus only on the development and implementation of AI; yet, it is essential to also prepare HCPs to not only work with AI but also to advance AI for health and clinical decision-making. AI education programs should be designed in a way that enables HCPs to not only safely adopt these technologies, but also to adapt and shift their scope of practice to stay relevant. A significant and meaningful change to AI curricula in health care will only occur by increasing AI literacy among HCPs and by providing them with the ability to leverage relevant digital and data-driven decision-making tools. Although the studies demonstrate that efforts are being made to evaluate the outcomes of AI-related education initiatives, there is a lack of consistency in the measures for a comprehensive assessment of these outcomes. Most of the papers used self-constructed and nonvalidated instruments and delineated their findings in qualitative terms. Given the variety of instruments that have been employed in the studies, the absence of a standard, comprehensive tool impedes the integration and synthesis of findings across the studies. The guiding principles provided in this review will also hopefully inform future development and design of these programs.

중요한 구현 요소
Critical Implementation Factors

AI 콘텐츠를 현재 커리큘럼에 통합하기 위한 인프라의 부족은 이러한 유형의 프로그램 개발을 방해할 수 있다. 설명된 프로그램 중 일부는 콘텐츠 개발을 용이하게 하기 위해 기존 전문 인증 기관의 인프라에 콘텐츠를 내장했다. 특히 캐나다 왕립의과대학은 이러한 규제 전략의 필요성을 더욱 강조하고 있는데, 이는 현재 진행 중이지만 아직 실제로 시행되지는 않고 있다[65,66]. 다학제적 협업의 촉진은 콘텐츠 전달의 원동력으로 지적되었다.  그러나 교수진 간 다양한 수준의 AI 리터러시는 AI 콘텐츠의 성공적인 전달을 방해할 수 있다[54,57]. [커리큘럼 적응과 AI 기술에 대한 인프라 구축]은 환자 치료를 개선하기 위해 AI를 채택하려는 HCP에게 도움이 될 수 있다. 여기에는 AI 교육에 사용할 수 있는 의료 데이터 유형의 개선이 포함된다[67]. 
A lack of infrastructure to integrate AI content into current curricula could hinder the development of these types of programs; some of the programs described embedded their content within existing professional certifying bodies’ infrastructure to facilitate content development. The Royal College of Physicians and Surgeons of Canada, in particular, further emphasizes the need for these regulatory strategies, which are currently in process but not yet in practice [65,66]. The promotion of multidisciplinary collaboration was indicated as an enabler of content delivery; yet, varying levels of AI literacy among faculty could impede successful delivery of AI content [54,57]. Curricular adaptations and building an infrastructure for AI technologies could be helpful to HCPs wanting to adopt AI to improve patient care; this includes improvements in the types of health care data available for AI education [67].

특히, 생성된 건강 데이터의 대부분은 연구자가 액세스할 수 없고, 기관 윤리 승인 및 데이터 공유 계약을 포함한 규제 또는 인프라 수준의 장벽에 의해 제한된다[67]. 비식별된 데이터, 보안 및 개인 정보 보호 제어의 사용은 잠재적으로 접근 범위를 넓힐 수 있다. 또한 다학제 전문가와의 광범위한 협력은 의료 데이터의 사용과 접근을 개선하기 위한 안전한 데이터 네트워크를 구축하는 데 도움이 될 수 있다[67]. 낮은 AI 리터러시는 [역량 진술을 표준화]하고, [e-러닝에 교수진을 참여]시키고 훈련함으로써 강화될 수 있다[68-70]. 세계보건기구의 디지털 건강에 대한 글로벌 전략은 AI 채택에 대한 장벽을 시스템 수준에서 해결하고 구현의 모든 측면을 고려해야 한다는 것을 추가로 시사한다.

Of note, much of the health data generated are often inaccessible to researchers and limited by regulatory or infrastructure-level barriers, including institutional ethics approvals and data-sharing agreements [67]. The use of deidentified data, security, and privacy controls could potentially widen the scope of access; broader collaboration with multidisciplinary experts could also help to establish secure data networks to improve use and access of health care data [67]. Lower levels of AI literacy could be augmented by standardizing competency statements and engaging and training faculty in e-learning, for instance [68-70]. The World Health Organization’s Global Strategy on Digital Health further suggests that the barriers to AI adoption need to be addressed at the systems level and all aspects of implementation should be considered.

우리의 권고안은 미래의 AI 커리큘럼 개발을 안내하거나 기존 커리큘럼에 AI 교육을 통합하는 데 사용될 수 있는 지침 원칙으로 형성되었다.
Our recommendations have been formed into guiding principles that could be used to guide the development of future AI curricula or to incorporate AI education into existing curricula.

지도 원칙
Guiding Principles

원칙 1: 규제 전략의 필요성
Principle 1: Need for Regulatory Strategies

기존 규제 구조 내에서 일하는 것이 AI 교육 이니셔티브의 이행을 저해할 수 있다는 연구결과가 다수 논의됐다. 교직원은 처음에 국가 보드 시험을 준비하기 위해 개발된 커리큘럼을 변경하는 데 방해가 될 수 있다[28,30]. 또한, 교육 접근 방식은 변화하는 디지털 및 AI 환경에 새로운 기술[29]을 통합하기에는 너무 구식일 수 있다. 새로운 규제 전략이 요구될 것이며, 조직은 이러한 도구를 사용하여 치료를 제공할 수 있는 지식과 기술뿐만 아니라, 신속하게 학습하고 적응할 수 있는 역량을 갖춘 인력을 개발하는 데 우선순위를 두어야 합니다. 이 연구는 또한 [인증 기관이 변화의 장애물이 될 수 있음]을 강조했습니다 [27-29]. Wartman과 Combs[28]는 AI 지원 치료를 위한 미래 의료 제공자를 준비하기 위해 인증기구가 (사실 기억 및 임상 실습을 기반으로 하는) 전통적인 모델을 넘어, 혁신하고 평생 학습에 대한 새로운 접근 방식을 고려할 필요가 있다고 밝혔다.

Many studies discussed that working within the existing regulatory structure can hinder the implementation of AI education initiatives. Faculty can be inhibitors to changing curricula that were initially developed to prepare students for their national board examinations [28,30]. In addition, teaching approaches may be too outdated to incorporate new and emerging technologies [29] into the changing digital and AI landscape. New regulatory strategies will be required, and organizations will have to prioritize developing a workforce that not only has the knowledge and skills to provide care with these tools, but also the competencies to rapidly learn and adapt. The studies also highlighted that accrediting bodies can be a roadblock to change [27-29]. Wartman and Combs [28] stated that to prepare future care providers for AI-enabled care, there is a need for accreditors to move beyond traditional models (based on fact memorization and clinical clerkships) and be willing to innovate and consider new approaches to lifelong learning.

원칙 2: 설계 및 전달에 대한 다원적 접근
Principle 2: Multidisciplinary Approach to Design and Delivery

빠르게 진화하는 현장의 특성과 역동적인 규제, 법률 및 경제 지형은 AI 커리큘럼의 구현을 방해할 수 있으며, 따라서 임상 실습에서 AI 도구의 배치에 영향을 미칠 수 있다. 이러한 영역 중 많은 부분이 여전히 상당한 연구와 발전을 수반하기 때문에 초기 AI 커리큘럼은 반복적으로 개발되어야 하며 [26] 새로운 지식 습득과 정책 변화가 커리큘럼에 반영되도록 해야 한다. 이 발견은 Wiljer와 Hakim에 의해 논문에서 강화되었다[27]. 저자들은 AI 애플리케이션이 아직 복잡성과 임상적 가치 수준으로 발전하지 못한 것은, 이들 애플리케이션 중 상당수가 현재 연구개발 단계에 있기 때문이라고 보고했다.

The rapidly evolving nature of the field and the dynamic regulatory, legal, and economic landscape may hinder the implementation of an AI curriculum and thus affect the deployment of AI tools in clinical practice. An initial AI curriculum must be developed iteratively because many of these areas still entail considerable research and advancement [26], ensuring that new knowledge gains and policy changes are reflected within the curriculum. This finding was reinforced in a paper by Wiljer and Hakim [27]. The authors reported that AI applications have not yet developed to a level of complexity and clinical value because many of these applications are currently in the research and development stages.

Wiens et al [71]은 성공적인 ML 구축은 지식 전문가, 의사 결정자 및 사용자를 포함한 다양한 분야의 전문가와 이해 관계자를 모으는 것을 수반한다고 언급했습니다. 커리큘럼 재설계에 대한 접근 방식은 여러 분야와 훈련 수준에 초점을 맞출 필요가 있다. 커리큘럼은 의료 연구자, 임상의 및 품질 개선 팀과 같은 [다양한 개인의 요구]에 특화되어야 한다[44]. 따라서 AI 기반 커리큘럼의 개발은 커리큘럼의 정확성과 임상적 관련성을 보장하기 위해 보건 시스템 리더, 최전선 제공자, 데이터 과학자, 환자 및 교육 전문가로 구성된 다학제 팀을 포함해야 한다[57,71]. 해당 분야의 모든 이해당사자와 전문가들이 잠재적 편향을 이해하고 해결하기 위해 협력하는 것이 필수적이며, 따라서 기존의 사회적 불평등을 줄이고 궁극적으로 모든 환자를 위한 최적의 치료로 이어진다[71].

Wiens et al [71] stated that successful ML deployment entails assembling experts and stakeholders from various disciplines, including knowledge experts, decision-makers, and users. The approach to curriculum redesign will need to focus on multiple disciplines and levels of training; curricula should be specialized to the needs of various individuals such as health care researchers, clinicians, and quality improvement teams [44]. Therefore, the development of an AI-based curriculum should involve a multidisciplinary team comprising health system leaders, frontline providers, data scientists, patients, and education experts to ensure accuracy and clinical relevance of the curriculum [57,71]. It is imperative for all stakeholders and experts in the field to work collaboratively to understand and address the potential biases, thus reducing the existing social inequalities and ultimately leading to optimal care for all patients [71].

원칙 3: 역량기반 교육과정 설계
Principle 3: Competence-Based Curriculum Design

[미래 practice의 발전]에 영향을 미치려면 [HCP가 기본적인 수준의 AI 역량과 기술을 보유]하는 것이 필수적이다[27]. 교육은 HCP가 임상 practice에서 사용하는 AI와 협력하고 이해하도록 교육하는 방식으로 설계되어야 한다. 또한, AI의 기준 역량 수준은 훈련생이 자신의 업무 범위와 관련된 보건 정책 결정에 상당한 기여를 할 수 있도록 해야 한다[50]. 인공지능은 미래의 의료 행위에 크게 기여할 것이다.  따라서 [AI 도구와 용어의 기본과 적용]은 의대 커리큘럼에 통합되어야 한다. 특히, 이러한 기술의 한계와 윤리적 영향을 고려하면서, 양질의 의료 서비스를 제공하기 위해 이러한 도구를 사용하는 방법에 대해 현재 및 미래의 의사를 교육하는 것이 유용할 것이다[43]. 의학 학습자 및 의사 외에도, 의학 교사는 이러한 혁신적인 AI 커리큘럼 콘텐츠를 제공하기 위해 교육을 받아야 한다. 이는 앞으로의 가파른 학습 곡선을 고려할 때 지체 없이 일어나야 할 변화이다[36]. Paranjape 외 연구진[41]은 학부생에서 지속적인 의학 교육에 이르는 AI와 의료에서의 AI의 적용에 대해 미래 의료 제공자에게 교육하기 위한 단계별 접근 방식을 권고했다.

To influence the development of their future practice, it is essential for HCPs to have a foundational level of AI competencies and skills [27]. Education should be designed in a manner that teaches HCPs to work with, and understand, the AI they use in their clinical practice. Furthermore, a level of baseline competencies in AI should allow trainees to make significant contributions to health policy decisions related to their scope of practice [50]. AI will likely contribute significantly to the medical practice of the future; therefore, fundamentals and applications of AI tools and terminologies should be integrated into medical school curricula. Specifically, training current and future physicians on how to use these tools to provide quality health care, while taking into account the limitations and ethical implications of such technologies, will be useful [43]. In addition to medical learners and physicians, medical teachers need to be trained to deliver this innovative AI curriculum content; this is a shift that needs to occur without delay, given the steep learning curve ahead [36]. Paranjape et al [41] recommended a staged approach to educating future care providers about AI and its application in health care that spans from undergraduate to continuing medical education.

이 검토 결과를 바탕으로 AI 개념의 이상적인 흐름은 옥스퍼드 메디컬이 정의한 의학교육의 3단계에 걸쳐 나눌 수 있다. 
학부 의학 교육, 대학원 의학 교육 및 지속적인 전문성 개발(그림 3) [72] 

  • [학부 의학 교육]은 HCP가 AI 용어, ML 및 데이터 과학의 기초, AI의 역량, 건강 형평 렌즈로 AI가 적합한 건강 분야 기회와 응용 분야를 파악하는 방법에 초점을 맞춰야 한다. 
  • [졸업후 의학 교육] 동안, 배치deployment뿐만 아니라, 모델의 검증과 사전 평가에 참여하는 방법에 중점을 두어야 한다. 거버넌스 전략 개발을 포함한 윤리적, 법적 고려사항을 더 깊이 탐구해야 한다.
  • 마지막으로, [지속적인 전문성 개발] 중에 제공자는 윤리 및 사회적 논의를 촉진하고, AI 과정을 가르치고, 새로운 AI 지식과 기술 및 교수 방법을 따라잡는 데 참여해야 한다.

On the basis of the findings of this review, an ideal flow of AI concepts could be split across the 3 stages of medical education defined by Oxford Medicine: undergraduate medical education, postgraduate medical education, and continuing professional development (Figure 3) [72].

  • Undergraduate medical education should be focused on HCPs becoming familiar with AI terminology, the fundamentals of ML and data science, capabilities of AI, and how to identify opportunities and applications in health where AI would be appropriate with a health equity lens.
  • During postgraduate medical education, emphasis should be placed on how to engage in validation and prospective evaluation of models, as well as deployment. Ethical and legal considerations, including governance strategy development, should be explored in more depth.
  • Finally, during continuing professional development, providers should be involved in facilitating ethical and societal discussions, teaching AI courses, and keeping abreast of new AI knowledge and skills as well as teaching methods.

 

원칙 4: 환자-임상의 상호 작용
Principle 4: Patient-Clinician Interaction

AI 지원 의료의 시대에 HCP는 [환자와 임상의사 상호작용]의 잠재적 영향뿐만 아니라 기술 지원 환경에서 제공되는 의료 품질을 개선하기 위한 전략을 고려해야 한다[13,27]. Li et al [13]은 보건 전문직 교육은 AI 애플리케이션의 출현에 필수적인 인간에게 고유한 기술인 이타주의와 동정심을 가르치고 육성해야 한다고 말했다. 이것은 HCP가 새로운 도구에 의해 중단되지 않도록 보장할 것이다. 실제로 AI를 사용할 수 있도록 준비하기 위해, 의료 제공자는 의료 제공 시 신뢰할 수 있는 정보와 거짓 정보를 구별할 수 있는 역량을 개발해야 한다[40]. 다른 산업의 상황과 유사하게, 의료 분야에서 AI를 채택하고 구현하는 도전은 승자와 낙후자를 초래할 것이다[48]. AI의 성공적인 채택을 위해서는, HCP는 환자와 협력해야 한다. AI가 의료 환경을 변화시킬 때 이러한 상호 작용은 AI의 기술적 전문 지식을 보완하는 데 중요하기 때문이다[48].
In the age of AI-enabled care, HCPs must consider the potential impact of the patient and clinician interaction as well as the strategies for improving the quality of care delivered in a technology-enabled environment [13,27]. Li et al [13] stated that health professions education should teach and cultivate altruism and compassion, unique skills to humans that are integral to the emergence of AI applications. This will ensure that HCPs are not disrupted by novel tools. To equip themselves to use AI in practice, care providers should develop competencies that allow them to differentiate between credible and false information in their delivery of care [40]. Similar to the situation in other industries, the challenge of adopting and implementing AI in health care will lead to winners and laggards [48]. In the successful adoption of AI, HCPs should engage with their patients because these interactions will be important to complement the technical expertise of AI as AI transforms the health care milieu [48].

제한 사항
Limitations

우리의 범위 검토 결과는 다음과 같은 제한사항의 맥락에서 검토되어야 한다. 범위 검토의 특성 때문에 확인된 각 연구의 품질은 평가되지 않았다. 연구 대상의 성격상 의학 교육이나 지속적인 전문성 개발을 위한 도구로서 AI를 논의한 연구는 제외했다. 오직 영어로 된 연구만이 포함되었다. 또한, 교육적 접근은 연구에 따라 다양하여 어떤 것이 효과적인지 결정하기 위해 커리큘럼 간에 공식적인 비교를 수행할 수 없었다. 그러나 문헌 검토를 통해 현재 교육 프로그램의 차이를 확인하고 향후 교육 노력을 안내할 수 있는 통찰력과 모범 사례를 제공할 수 있었다. 본 검토는 모든 유형의 연구를 포함하고 광범위한 문헌에 초점을 맞추었기 때문에, 교육 프로그램 세부사항에 대한 보고의 깊이는 연구의 범위에 따라 일관성이 없고 다양했다.
Our scoping review findings should be examined in the context of the following limitations. Because of the nature of the scoping review, the quality of each identified study was not assessed. Given the nature of the topic being investigated, we excluded studies that discussed AI as a tool for medical education or continuing professional development. Only studies in English were included. In addition, the educational approaches varied across the studies; thus, we were unable to conduct formal comparisons among the curricula to determine which were effective. However, reviewing the literature enabled us to identify the gaps in current education programs and provide insights and best practices to guide future education efforts. As this review was inclusive of all types of studies and focused on a breadth of literature, the depth in reporting of education program details was inconsistent and varied based on the scope of the study.

결론들
Conclusions

의료 디지털화가 불가피하게 진행됨에 따라 보건 전문직 교육은 이러한 신흥 기술을 보완할 수 있는 인간 고유의 능력을 길러야 한다. 본 검토에서는 보건전문교육의 AI 현황과 향후 의료분야 AI 시대를 위한 의료제공자 준비방향에 대한 개요를 제공하였다. 향후 교육 노력은 규제 전략 개발, 커리큘럼 재설계에 대한 다학제적 접근, 역량 기반 커리큘럼 및 환자-임상의 상호 작용에 초점을 맞춰야 한다.

With the inevitable progression of health care digitization, health professions education should foster unique human abilities, which will complement these emerging technologies. This review provided an overview of the current state of AI in health professions education and future directions on preparing care providers for the era of AI in health care. Future education efforts should focus on the development of regulatory strategies, a multidisciplinary approach to curriculum redesign, a competency-based curriculum, and patient-clinician interaction.

 

 


JMIR Med Educ. 2021 Dec 13;7(4):e31043. doi: 10.2196/31043.

Artificial Intelligence Education Programs for Health Care Professionals: Scoping Review

Affiliations collapse

Affiliations

1Institute of Health Policy, Management and Evaluation, Dalla Lana School of Public Health, University of Toronto, Toronto, ON, Canada.

2University Health Network, Toronto, ON, Canada.

3Vector Institute, Toronto, ON, Canada.

4Michener Institute of Education, University Health Network, Toronto, ON, Canada.

5Faculty of Medicine, University of Toronto, Toronto, ON, Canada.

6Institute of Biomedical Engineering, University of Toronto, Toronto, ON, Canada.

7Wilson Centre, Toronto, ON, Canada.

8CAMH Education, Centre for Addictions and Mental Health (CAMH), Toronto, ON, Canada.

PMID: 34898458

PMCID: PMC8713099

DOI: 10.2196/31043

Free PMC article

Abstract

Background: As the adoption of artificial intelligence (AI) in health care increases, it will become increasingly crucial to involve health care professionals (HCPs) in developing, validating, and implementing AI-enabled technologies. However, because of a lack of AI literacy, most HCPs are not adequately prepared for this revolution. This is a significant barrier to adopting and implementing AI that will affect patients. In addition, the limited existing AI education programs face barriers to development and implementation at various levels of medical education.

Objective: With a view to informing future AI education programs for HCPs, this scoping review aims to provide an overview of the types of current or past AI education programs that pertains to the programs' curricular content, modes of delivery, critical implementation factors for education delivery, and outcomes used to assess the programs' effectiveness.

Methods: After the creation of a search strategy and keyword searches, a 2-stage screening process was conducted by 2 independent reviewers to determine study eligibility. When consensus was not reached, the conflict was resolved by consulting a third reviewer. This process consisted of a title and abstract scan and a full-text review. The articles were included if they discussed an actual training program or educational intervention, or a potential training program or educational intervention and the desired content to be covered, focused on AI, and were designed or intended for HCPs (at any stage of their career).

Results: Of the 10,094 unique citations scanned, 41 (0.41%) studies relevant to our eligibility criteria were identified. Among the 41 included studies, 10 (24%) described 13 unique programs and 31 (76%) discussed recommended curricular content. The curricular content of the unique programs ranged from AI use, AI interpretation, and cultivating skills to explain results derived from AI algorithms. The curricular topics were categorized into three main domains: cognitive, psychomotor, and affective.

Conclusions: This review provides an overview of the current landscape of AI in medical education and highlights the skills and competencies required by HCPs to effectively use AI in enhancing the quality of care and optimizing patient outcomes. Future education efforts should focus on the development of regulatory strategies, a multidisciplinary approach to curriculum redesign, a competency-based curriculum, and patient-clinician interaction.

Keywords: deep learning; education; health care providers; learning; machine learning; patient care.

의학교육에서 사회적 정의: 포용으로는 충분하지 않다, 단지 첫 걸음일 뿐이다(Perspect Med Educ. 2022)
Social justice in medical education: inclusion is not enough—it’s just the first step
Maria Beatriz Machado · Diego Lima Ribeiro · Marco Antonio de Carvalho Filho

 

 

 

서론
Introduction

세계적으로 의과대학에 입학하기 위한 선발 과정은 종종 사실적 지식을 평가하는 것을 우선시하며, 이는 종종 비싸고 좋은 중등교육을 받은 부유한 가정의 학생들에게 이익이 된다[1,2,3]. 게다가, 중산층 학생들조차 증가하는 교육 부채로 어려움을 겪고 있기 때문에 의료 훈련과 관련된 비용은 저소득 가정의 사람들에게 엄청나게 비싸다. 관찰되는 결과는 낮은 사회경제적 지위를 가진 학생들을 배제하는 것으로, 소수 인종과 종종 겹치는 사회 집단이다[2, 4]. 이러한 [사회적, 인종적 분리]는 의료 분야가 스스로 갱신되는 것을 막고 사회 정의의 원칙과 양립할 수 없는 [특권의 순환]을 영속시킨다[3, 5, 6]. 이러한 선발 편향을 보완하기 위해 전 세계 의과대학들은 취약계층의 입학정원을 늘리는 포용정책을 마련하고 있다[2, 5, 6, 7, 8]. 그러나 이러한 학생들의 서로 다른 사회적, 경제적, 인종적 배경이 의과대학에서의 사회화 과정에서 어떻게 교차하고 상호작용하며 그들의 직업적 정체성 발달에 영향을 미치는지는 알려져 있지 않다[9]. 이러한 [취약한 사회 집단의 학생들이 의사가 되기 위한 궤적]을 어떻게 경험하는지 이해하는 것은 맞춤형 교육 및 지원 관행을 고안하는 데 필수적이다.
Globally, the selection processes for entering medical schools often prioritize assessing factual knowledge, which benefits students from wealthy families who have had access to good and often expensive secondary education [1,2,3]. Moreover, costs associated with medical training are prohibitive for people from low-income families as even middle-class students struggle with increasing educational debts. The observed result is the exclusion of students with low socioeconomic status, a social group that often overlaps with racial minorities [2, 4]. This social and racial segregation prevents the medical field from renewing itself and perpetuates a cycle of privilege incompatible with the principle of social justice [3, 5, 6]. To compensate for this selection bias, medical schools worldwide are creating inclusion policies to increase admissions from vulnerable social groups [2, 5,6,7,8]. However, it is unknown how the different social, economic, and racial backgrounds of these students intersect and interact during their socialization in medical school and influence their professional identity development [9]. Understanding how students from these vulnerable social groups experience their trajectory to becoming doctors is essential for devising tailored educational and supportive practices.

최근의 노력에도 불구하고, 전 세계적으로 여전히 의학계에서 대표성이 낮은 사회 집단이 있다[4, 7, 10]. 브라질에서는 2011년 한 연구에 따르면 [공립 의대생의 98%]가 최저임금보다 5배 높은 가족소득을 가지고 있으며, 6%만이 자신의 인종을 브라운 또는 블랙[11, 12]으로 자칭하였다. 그러나 [브라질 인구의 절반 이상]이 최저 임금/월 1회 미만으로 생활하며 인종을 브라운 또는 블랙[13]으로 자칭하고 있으며, 이는 미국(미국)[1, 10], 호주[14] 및 영국[3]에서 발견되는 인구 통계를 반영한다.
Despite recent efforts, there are still underrepresented social groups in medicine worldwide [4, 7, 10]. In Brazil, a 2011 study revealed that 98% of medical students in public universities had a family income five times higher than the minimum wage, and only 6% self-declared their race as Brown or Black [11, 12]. However, more than half of Brazil’s population lives on less than one minimum wage/month and self-declared their race as Brown or Black [13], which mirrors demographics around the world, including those found in the United States (US) [1, 10], Australia [14], and the United Kingdom [3].

의과대학에서 더 큰 사회적 다양성은 일반인들의 보살핌care을 개선하고 의대 학생들의 교육에 도움이 될 수 있다. 증거는 소수 민족 환자들이 같은 민족 출신의 의사의 치료를 받을 때 더 나은 집착과 치료 성공을 보인다는 사실을 뒷받침한다[1, 5, 15, 16, 17]. 또한, 더 다양한 환경에서 공부하는 의사들은 다른 인종 및 사회 그룹의 환자를 다루는 데 더 능숙하다[18, 19]. 따라서, 의과대학에서 소외된 사회 집단의 대표성을 높이는 것은 연대의 문제일 뿐만 아니라, 의료 서비스를 개선하고 사회 정의를 증진하기 위한 자산이다. 따라서 의료 교육에 대한 접근을 민주화하는 데 전념하는 여러 국가는 저소득 가정과 소수 인종 학생들의 입학을 촉진하는 정책을 채택했다[3, 7, 8]. 이러한 정책들이 다양성을 성공적으로 증가시켰음에도 불구하고, 불리한 사회적 배경의 학생들은 재정적 문제와 인종차별을 경험했고, 잠재적으로 그들의 사회적 및 직업적 통합을 방해했다[20, 21, 22, 23, 24].
Greater social diversity in medical schools could improve the care of the general population and benefit medical students’ education. Evidence supports the finding that ethnic minority patients have better adherence and treatment success when cared for by a doctor from the same ethnicity [1, 5, 15,16,17]. Additionally, doctors who study in a more diverse environment are more competent in dealing with patients from different racial and social groups [18, 19]. Therefore, increasing the representation of underserved social groups in medical schools is not only a matter of solidarity, but an asset to improve healthcare and promote social justice. Thus, several countries committed to democratizing access to medical education have adopted policies to facilitate the admission of students from low-income families and racial minorities [3, 7, 8]. Although these policies successfully increased diversity, students from disadvantaged social backgrounds experienced financial problems and racism, potentially hampering their social and professional integration [20,21,22,23,24].

본 연구는 브라질 의과대학에 입학한 저소득층 의대생들의 사회화 및 전문적 정체성 발달과 관련된 과제를 긍정정책을 통해 탐색한다.
This study explores the challenges related to the socialization and professional identity development of medical students from low-income families admitted to a Brazilian medical school through an affirmative policy.

방법들
Methods

이것은 리치 픽처스 방법론을 이용한 구성주의 패러다임에 기초한 단면적 질적 연구이다[25]. 캄피나스 대학교 의과대학 연구윤리위원회는 이 연구를 승인했다(CAAE: 91119118.1.0000.5404).
This is a cross-sectional qualitative study based on a constructivist paradigm using the Rich Pictures methodology [25]. The research ethics committee of the School of Medical Sciences of the University of Campinas approved the study (CAAE: 91119118.1.0000.5404).

우리는 브라질 상파울루 캄피나스 대학교(UNICAMP) 의과대학에서 이 연구를 수행했다. UNICAMP 선정 과정은 국가적인 두 단계 인지 테스트에 의존한다. 2018년에는 110명의 자리에 30676명의 지원자가 지원했다. 브라질의 중등 학교 시스템은 불평등하며, 부유한 가정의 학생들은 우수한 사립학교에 접근할 수 있고 대학에 진학할 기회가 증가했습니다 [26]. 대조적으로, 빈민가 한가운데에 있는 일부 주변 공립학교 학생들은 거의 입학하지 않는다[7, 11, 12].
We conducted this study in the School of Medical Sciences at the University of Campinas (UNICAMP), São Paulo, Brazil. The UNICAMP selection process relies on a national two-step cognitive test. In 2018, 30,676 candidates applied for 110 available positions. The secondary school system in Brazil is unequal, and students from wealthy families have access to excellent private schools and increased opportunities to attend universities [26]. In contrast, students from peripheral public schools, some in the middle of slums (“favelas”), are seldom admitted [7, 11, 12].

2011년, UNICAMP의 고등 학제간 훈련 프로그램(ProFIS)은 [캄피나스의 92개 중등학교에서 각각 학생들을 선발]하여, 대학 프로그램과 비슷한 준비 프로그램에 입학시키기 위해 만들어졌다. ProFIS 선택은 영역 매개 변수를 학생들의 학업 성과와 결합한다. [지역적 매개변수]는 빈민가에 위치한 학교를 포함한 모든 공립학교의 학생들의 입학을 보장하며, 이는 빈곤 가정으로부터의 포함inclusion을 보장하고 affirmative policies의 혁신을 나타낸다.
In 2011, the UNICAMP’s Higher Interdisciplinary Training Program (ProFIS) was created to select students from each of the 92 secondary public schools of Campinas to enter a college-like preparatory program. ProFIS selection combines a territorial parameter with students’ academic performance. The territorial parameter guarantees admission of students from all public schools, including those located in favelas, which assures inclusion from impoverished families and represents an innovation in affirmative policies.

매년 120명의 학생들이 ProFIS를 통해 선발된다. 2년간의 프로그램을 마친 후, ProFIS 학생들은 그들의 선호, 순위, 장소의 가용성에 따라 유니캠프 과정 중 하나를 선택한다. 매년, 10명의 프로FIS 학생들은 의대에 입학할 수 있으며, 입학정원의 거의 10%를 차지한다[27]. ProFIS 학생들은 의대 학생들의 일반 인구와 다른 인종 및 사회경제적 배경을 가지고 있다(표 1).

Annually, 120 students are selected through ProFIS. After completing the two-year program, ProFIS students choose one of the UNICAMP courses to follow, according to their preferences, ranking, and availability of places. Every year, 10 ProFIS students are admitted to the medical school, representing almost 10% of its admissions [27]. ProFIS students have different racial and socioeconomic backgrounds than the general population of medical students (Tab. 1).

 

인종과 인종주의
Race and racism

우리는 인종이 생물학적 기반이 없는 [사회적 구조]라고 믿고 [28, 29] 피부색이 인간 조건의 한정자로 사용되지 않는 날을 희망합니다. 그러나 모순적으로 보일지 모르지만, 인종 차별과 싸우고 불평등을 줄이기 위한 보상 정책을 시행하기 위해서는 피부색이 사회적 결정요인으로 인식되어야 한다. 브라질의 흑인 운동은 흑인 학생들의 대학 입학률을 높이는 것을 목표로 하는 보상 교육 정책을 시행하기 위해 수십 년 동안 싸웠다[30].
We believe that race is a social construct with no biological foundation [28, 29] and hope for the day when skin color will not be used as a qualifier of the human condition. However, as contradictory as it may seem, to fight racism and implement compensatory policies to decrease inequality, skin color must be recognized as a social determinant. The black movement in Brazil fought for decades to enforce compensatory educational policies that target increasing the university admission of black students [30].

참가자, 연구팀 및 반사성
Participants, research team, and reflexivity

우리는 ProFIS의 다양한 학년 학생들이 사회화 경험에 대한 보다 포괄적인 개요를 갖도록 하기 위해 목적 있는 샘플링 전략을 사용했다. 10번의 인터뷰 후, 우리는 이론적 충분성에 도달했다[31]. 즉, 우리는 학생들의 [사회화의 다양한 측면(공식 및 비공식; 교실 내 및 임상 활동)], 그리고 이러한 활동이 학생들의 정체성 발달에 어떤 영향을 미치는지에 대한 충분한 정보를 얻었다.
We used a purposeful sampling strategy that included ProFIS students from different academic years to have a more comprehensive overview of their socialization experiences. After ten interviews, we reached theoretical sufficiency [31], i.e., we covered different aspects of students’ socialization (formal and informal; in-classroom and clinical activities), and obtained sufficient information about how these activities impacted students’ identity development.

연구팀은 임상교습 경력이 20년이고 리치픽처스 방법론에 정통한 의대생(MB), 임상교사(DLR), 교육혁신연구부교수(MACF)로 구성됐다. MB, DLR 및 MACF는 비슷한 사회적 배경을 가지고 있습니다. 이들은 모두 하위 중산층 가정 출신이며 참가자들의 경험 중 몇 가지 측면과 관련될 수 있으며, 이는 조사 결과를 이해하는 데 도움이 되었습니다. 또한, 저자들은 유니캠프를 졸업했지만 약 10년 안에 졸업했다. 이러한 종단적 이해는 학생들의 관점에 더해져 지난 20년 동안 소수민족 학생에 대한 기관의 문화가 어떻게 발전했는지에 대한 통찰력을 촉진시켰다. 감정적 과정인 경우가 많았던 만큼 저자들은 자신의 감정적 반응이 자료수집과 분석의 자격요건으로 작용하도록 성찰적 입장을 취했다.
The research team was composed of a medical student (MB), a clinical teacher (DLR), and an associate professor in innovation and research in education (MACF) who had 20 years of experience in clinical teaching and is familiar with the Rich Pictures methodology. MB, DLR, and MACF share a similar social background—they all come from lower middle-class families and could relate to several aspects of participants’ experiences, which helped them make sense of the findings. In addition, the authors graduated from UNICAMP but within a period of approximately ten years. This longitudinal understanding added to students’ perspectives to facilitate insights on how the institution’s culture regarding minority students evolved over the last 20 years. As it was often an emotional process, the authors took a reflective stance to guarantee that their emotional responses worked as qualifiers of data collection and analysis.

MB는 데이터 수집에서 위계 구조의 영향을 최소화하기 위해 학생들을 인터뷰했다. 연구팀은 [교육]을 사회 정의에 헌신하는 비판적 의식을 개발하기 위한 "해방" 과정으로 간주하는 [비판적 페다고지]의 개념을 따른다[32]. 선행연구팀인 연구팀은 사회적 포용을 바람직한 결과로 간주했다. 다양한 학생들은 의과대학의 종종 가부장적이고 인종차별적인 구조를 재고하고 새롭게 할 기회를 제공한다[33, 34]. 이러한 관점은 연구 프로토콜, 데이터 수집 및 데이터 분석의 정교화에 영향을 미쳤다.
MB interviewed the students to minimize the effect of hierarchy in data collection. The research team follows the concepts of critical pedagogy, which considers education as a “liberation” process towards developing a critical consciousness committed to social justice [32]. The research team, a priori, regarded social inclusion as a desirable outcome. Diverse students bring an opportunity to rethink and renew medical schools’ often patriarchal and racist structures [33, 34]. This perspective influenced the elaboration of the research protocol, data collection, and data analysis.

데이터 수집
Data collection

비공개 세션에서 MB는 참가자들에게 사회, 경제, 인종적 배경을 고려하여 의학 과정 동안 경험한 어려운 상황을 나타내는 [그림을 그리도록 지시]했다. 그 후, 학생들은 27분에서 69분 사이의 인터뷰에 응했다. 우리는 비언어적 기억을 활성화하고 "사회적으로 바람직한 답변" 현상을 최소화하기 위한 전략으로 [리치 픽처스]를 사용했다[35, 36]. 자료수집과 분석은 서로 정보를 주고받았으며 2018~2019년 8개월에 걸쳐 발생했으며, 반구조화된 인터뷰의 대본/주제는 자료수집 과정에 따라 진화했다. 우리의 프로토콜은 ESM(Electronic Supplementary Material)에 있는 부록 1에 자세히 설명되어 있습니다.

In a private session, MB instructed participants to draw a picture representing a challenging situation they experienced during the medical course, considering their social, economic, and racial background. Afterward, students were interviewed (in interviews ranging from 27–69 min). We used the Rich Pictures as a strategy to activate non-verbal memories and minimize the phenomenon of “socially desirable answers” [35, 36]. Data collection and analysis informed each other and occurred over eight months in 2018–2019, and the script/topics of the semi-structured interview evolved along the process of data collection. Our protocol is detailed in Appendix 1, found in the Electronic Supplementary Material (ESM).

데이터 분석
Data analysis

우리는 실천 공동체(CoP) 이론적 프레임워크에 기초하여 연역적 주제 분석[37]을 수행했다[38]. 코딩 프로세스를 안내하기 위해 CoP의 참여, 상상력 및 정렬 개념을 선험적 주제로 사용했습니다 [38]. 우리는 공동체 활동에 참여할 수 있는 능력으로 참여, 다른 구성원들과 연결되어 있다고 느끼면서 자신을 공동체의 일원으로 상상할 수 있는 능력으로 상상, 그리고 공동체의 가치와 행동 규범을 공유하고 내재화하는 과정으로 정렬을 고려했다[38] 데이터 분석 프로세스는 ESM의 부록 1에 자세히 설명되어 있습니다.
We performed a deductive Thematic Analysis [37] grounded on the Communities of Practice (CoP) theoretical framework [38]. We used CoP’s engagement, imagination, and alignment concepts as a priori themes to guide our coding process [38]. We considered engagement as the ability to get involved in community activities; imagination as a capacity to imagine oneself as a member of the community while feeling connected to other members; and alignment as the process of sharing and internalizing the community’s values and codes of conduct while learning to collaborate with other members [38]. Our data analysis process is detailed in Appendix 1 in the ESM.

결과.
Results

참가자들은 [학문과 사회활동을 할 경제적 수단이 부족하고, 인종과 사회경제적 편견에 시달리며, 집단의 일부를 느끼지 못하며, 동료와 임상감독관의 지배적인 상류사회 문화에 맞지 않기 때문에] 의료계와의 연계에 어려움을 겪고 있다. 반면에, 참가자들은 소외계층을 돌볼 때 환자와 더 가깝고 공감을 더 잘 보여줄 수 있는 것으로 인식한다. 이들은 공공의료체계를 파악하고 이에 맞춰 [자신이 받은 투자를 사회에 환원하고 싶은 강렬한 마음urge]을 느낀다.
Participants wrestle with connecting to the medical community because they

  • lack the financial means to engage in academic and social activities,
  • suffer from racial and socio-economic prejudice,
  • do not feel part of the group, and
  • do not fit the predominant upper social class culture of their colleagues and clinical supervisors.

On the other hand, participants perceive themselves as closer to patients and more capable of showing empathy when caring for underserved populations. They identify and align with the public healthcare system and feel the urge to pay back the investment they received to society.

참가자들은 의과대학에서 경험한 어려운 상황을 공유할 때 강렬한 감정을 보여주었다. 종종 그들은 "숨쉬기 위해" 인터뷰를 중단해야 했고, 우는 에피소드도 흔했다. 학생들은 종종 그림에서 자신을 의학 교육 영역에 통합하거나 이해할 수 없는 외부인으로 묘사했다. 그 사진들은 학생들이 그들의 과거와 현재의 경험을 멈추고, 기억하고, 성찰할 수 있도록 함으로써 인터뷰의 유력한 촉진자 역할을 했다. 특정 사건에 초점을 맞추는 대신, 일부 학생은 학업 궤적을 은유적으로 표현하였다(그림 1). 이러한 은유적 성격은 참가자들의 의미 형성 과정을 탐구할 수 있는 창구를 제공했고, 이는 인터뷰 중과 후에 통찰력을 확장시켰다. 다음 섹션에서는 참가자들의 목소리를 증폭시키고 그들의 사회적, 경제적, 인종적 배경이 의료계에 대한 소속감에 어떤 영향을 미치는지에 대한 그들의 반성을 공유한다.

Participants displayed intense emotions when sharing the challenging situations they experienced in medical school. Frequently, they had to pause the interview “to breathe,” and crying episodes were common. Students often portrayed themselves in the drawings as outsiders unable to integrate into or make sense of the medical education realm. The pictures functioned as potent facilitators of the interviews by allowing students to stop, remember, and reflect on their past and present experiences. Instead of focusing on a specific event, some drawings were metaphorical representations of students’ academic trajectories (Fig. 1). This metaphoric nature offered a window to explore participants’ meaning-making processes, which expanded the insights during and after the interviews. In the following sections, we amplify the participants’ voices and share their reflections on how their social, economic, and racial backgrounds influence their belongingness to the medical community.

 

이 그림에서 ProFIS 학생(가칭 다니엘)은 학부 의학 과정을 나타내는 은유로서 [경주 트랙]을 묘사했다. 다니엘은 자신이 뒤처져 있다고 느끼고 "일반" 학생들 뒤에서 경주를 시작하는 자신을 그렸다. 다니엘은 또한 자신의 달리기 차선이 일반 학생들의 차선보다 [더 많은 장애물]을 포함하고 있다고 생각한다. Daniel은 또한 그가 직면한 장애물은 다른 성질의 것이라고 믿는다 - 그것들은 더 도전적이다 (사진에서 Daniel의 차선의 장애물은 빨간색인 반면 다른 차선의 장애물은 녹색이다). Daniel의 차선의 빨간 장벽은 그가 인지한 지식 부족과 그와 같은 ProFIS 학생들이 겪는 재정적, 사회적 어려움을 나타냅니다. 그는 반 친구들보다 열등하고 능력이 떨어진다고 느낀다. 다니엘이 옆에 있는 두 개의 텍스트 버블에 'EU'(I)와 'INCAPACIDADE'(용량 부족)라는 단어를 쓴 것도 이 때문이다. 동시에 사진 오른쪽 하단에 'TORCENDO'(응원)와 'AJUDANDO'(도움)라는 글자로 표현된 가족의 지지를 느낀다.
In this drawing, the ProFIS student (given the fictitious name of Daniel) depicted a race track as a metaphor to represent the undergraduate medical course. Daniel feels he is lagging behind and drew himself starting the race behind the “regular” students. Daniel also thinks that his running lane contains more hurdles than the lanes of regular students. Daniel also believes that the obstacles he faces are of a different nature—they are more challenging (in the picture, the barriers in Daniel’s lane are red, whereas the ones in the other lanes are green). The red barriers in Daniel’s lane represent his perceived knowledge deficit and the financial and social difficulties experienced by ProFIS students like him. He feels inferior and less capable than his classmates. That’s why Daniel wrote the words “EU” (I) and “INCAPACIDADE” (LACK OF CAPACITY) in the two text bubbles next to him. At the same time, Daniel feels supported by his family, which was represented on the bottom-right side of the picture with the words “TORCENDO” (CHEERING) and “AJUDANDO” (HELPING)

 

상상력 -"우린 잘못된 곳에 있어"
Imagination—“We are in the wrong place”

ProFIS 학생들은 illegitimate함을 느끼고 미래의 의사로서 자신을 보기 위해 고군분투하는데, 이는 지역 의료계와 사회 전반에 반영된다. 자신을 의사로 상상하는 어려움은 세 가지 측면을 가지고 있다:

  • 의료 환경과의 동일성 부족
  • 낮은 자존감의 감정
  • 인종과 사회적 차별의 경험.

ProFIS students feel illegitimate and struggle to see themselves as future doctors, a feeling reverberated by the local medical community and society in general. This difficulty in imagining themselves as doctors has three dimensions:

  • a lack of identification with the medical environment,
  • feelings of low self-esteem, and
  • experiences of racial and social discrimination.

의료 환경과의 동일성 결여
Lack of identification with the medical environment

이러한 [정체성의 부족]ProFIS 의 학생들이 의과대학과 대학 환경을 꿈으로도 생각하지 않았기 때문에 의과대학에 입학하기 전에 시작된다. 일반적으로, ProFIS 학생들은 [대학 과정에 입학하는 가족의 1세대]를 대표하는데, 이것은 그들이 그들 자신, 과정, 동료, 그리고 환경에 대한 그들의 기대를 조절하는 데 어려움을 겪는다는 것을 의미한다. 이러한 기대치 조절의 어려움은 그들의 "올바른"(예상된) 행동이나 태도를 맥락과 문화에 맞게 예상하는 능력을 방해하기 때문에 좌절감을 느낄 가능성을 증가시킨다.
This lack of identification starts before entering medical school as ProFIS students have never considered the medical and university environments part of their reality, not even as a dream. In general, ProFIS students represent the first generation of their families to get into a university course, which means that they have trouble modulating their expectations about themselves, the course, their colleagues, and the environment. This difficulty in modulating expectations increases the chance of feeling frustrated because it hampers their capacity to anticipate the “right” (expected) behavior or attitude to match the context and culture.

ProFIS 가 없었다면, 저는 의대에 오지 못했을 것입니다. 첫째, 의대에 지원할 생각이 없었기 때문이다.나는 돈이 없었다. 나는 일하고 있었다. 그것은 나에게 괜찮았다. 세상에 대한 나의 시야는 너무 좁고 좁았다. 나는 낮에는 일하고 밤에는 학교에 가곤 했다. 그리고, 가르침이 매우 좋지 않았기 때문에, 나는 배우려고 노력하는 것에 흥분하지 않았다… 나는 시도조차 하지 않았다. (ProFIS 학생 번호 10 [PS 번호 10])
Without ProFIS, I would never have come to the Medical School. First, because I did not have the intention of applying for medical school, because 
[pause]—I did not have the money. I was working; it was OK for me. My vision of the world was too small, too narrow. I used to work during the day and go to school at night. And, because the teaching was not very good, I was not excited about making an effort to learn … I did not even try. (ProFIS student no. 10 [PS no. 10])


코스의 시작은 이러한 식별력 부족을 악화시킨다. ProFIS 학생들의 사회 현실은 의대생에 대한 일반적인 스테레오타입에 맞지 않는다. 이러한 차이는 [정당성legitimacy의 결여]로 인식되어 의료계에서의 그들의 참여를 방해한다. 그들은 자신들의 재정 상태에 대해 어색하고 당황스러워한다. 그들은 다르게 옷을 입고, 다른 것을 소유하고, 다른 경험을 하고, 다른 가치를 공언한다. 이러한 [충돌]은 소속되지 않았다는 감각을 유발하고, 그들의 사회적 연결과 네트워킹을 방해한다. 믿을 수 없다. 이 사람들처럼 (비프로)FIS)는 의과대학에서 승인을 받았고, 그 후 그들은 그것을 위해 차를 얻는다. 저는 22살이고, 제 가족 중 아무도 차를 가져본 적이 없어요, 한 번도!" (PS 3번)

The start of the course worsens this lack of identification. ProFIS students’ social reality does not fit the prevalent stereotype of medical students. This difference is perceived as a lack of legitimacy, which hampers their participation in the medical community. They feel out of place, awkward and embarrassed by their financial condition. They dress differently, possess different things, have different experiences, and profess different values. These clashes generate a sense of not belonging and hamper their social connections and networking. “It is unbelievable. Like, these guys (non-ProFIS’s) were approved in medical school, and then they get a car for that. I am 22 years old, and nobody in my family has ever had a car, never!” (PS no. 3).

다른 사회적 배경에서 온 ProFIS 학생들은 [다른 세계관, 우려, 그리고 정치적 이데올로기]를 가지고 있다. 그들은 사회적 불평등의 부담을 직접 경험했기 때문에 [사회 정의와 책임에 대한 확고한 의지]를 가지고 있으며, 의료 교육을 보다 공평한 의료 시스템을 향한 정치적 기업으로 이해한다.
Coming from a different social background, ProFIS students have different world views, concerns, and political ideologies. Since they have directly experienced the burden of social inequality, they have a solid commitment to social justice and accountability and understand medical education as a political enterprise towards a more equitable healthcare system.

그들(ProFIS 학생)은 세계관이 매우 다르다. 어떻게 설명해야 할지 모르겠어요. 하지만 나는 첫해 첫날에 그것을 기억한다. 이곳에 도착했을 때, 저는 사람들을 보았고, 그들이 제가 익숙했던 것과는 매우 다르다고 생각했습니다. 사고방식도 다르다. 나는 모른다. 어떤 사람들은 돔에 사는 것 같다. 그들은 아무것도 모른다. 그것은 주변 세계에 대한 인식 부족입니다, 아시죠? 심지어 그들이 가지고 있는 종류의 걱정까지. (PS no. 5)
They (non-ProFIS students) have a very different worldview. I don’t even know how to explain. But I remember that on the first day of the first year. When I arrived here, I looked at the people, and I thought they were very different from what I was used to. Different even in the way of thinking. I don’t know. It seems that some people live in a dome. They have no idea of anything. It is a lack of awareness of the world around, you know? Even the kind of concern they have. 
(PS no. 5)

낮은 자존감
Low self-esteem

"완벽한 폭풍"은 ProFIS 학생들의 자존감을 위협한다: 그들은 불안정하고 자금이 부족한 학교 출신이고, 교육 경험을 확장할 재정적 수단이 없으며, 그들의 친척들은 낮은 수준의 정규 교육을 받는다. 그들은 준비되지 않았고, 불안정하고, 의학 과정을 밟고, 직업적인 성공을 거두기엔 불충분하다고 느낀다. 의료 훈련의 경쟁적인 환경은 특히 ProFIS 학생들이 그들의 새로운 사회적, 학문적 현실에 적응하기 위해 씨름할 때 이러한 열등감을 강화한다. 뒤처진다는 이 느낌은 이미 의대생이 되기 위한 힘든 과정에 추가적인 압력을 가한다.
A “perfect storm” threatens ProFIS students’ self-esteem: they come from precarious and underfunded schools, they do not have the financial means to expand their educational experiences, and their relatives have low levels of formal education. They feel unprepared, insecure, and insufficient to enter and follow the medical course and achieve professional success. The competitive environment of the medical training reinforces this feeling of inferiority, particularly when ProFIS students wrestle to adapt to their new social and academic reality. This feeling of lagging behind creates extra pressure on the already demanding process of becoming a medical student.

"와, 이 사람들처럼 되기 위해서라도 공부를 열심히 해야겠다"는 생각이 들었다. 사람들이 파티에 가는 동안, 나는 그들처럼 되기 위해 열심히 공부해야 해. 그리고 저는 제 인생 전체가 그랬다고 생각합니다. 이모는 항상 "너는 지금 공립대학에 있어. 수백만 명의 사람들이 당신과 경쟁하고 있습니다. 그리고 그들은 자원을 가지고 있습니다. 그들은 좋은 사립학교에서 공부했고, 더 나은 선생님들이 있었습니다. 그리고 넌 그런거 없어. 그래서, 여러분이 그들과 동등해지려면, 여러분은 두 배로 공부해야 할 것입니다." (PS No.1)
I felt like, “wow, I’m going to have to study hard to stand out or to be like these people.” While people are going to parties, I need to study hard to be like them. And I think my whole life has been like that. My aunt always said, “You are in a public university now. There are millions of people competing with you. And they have resources; they studied in good private schools, they had better teachers. And you don’t have that. So, for you to be equal to them, you’ll have to do twice as much.” 
(PS no. 1)

과정 중, [조직적으로 불신을 드러내고, ProFIS 학생들의 의견과 가치를 과소평가하는 동급생과 교사]들과의 상호작용이 낮은 자존감을 강화시키는 경우가 많다. ProFIS 학생들은 계속해서 자신의 가치를 증명해야 한다는 부담을 느낀다.
During the course, the interaction with classmates and teachers who systematically show distrust and underestimate ProFIS students’ opinions and values often reinforces their low self-esteem. ProFIS students continuously feel the burden to prove themselves valuable.

사람들은 내 말을 믿지 않는다. 그들은 항상 내가 사물에 대해 잘 모른다고 생각한다. 그래서, 만약 제가 주제나 아이디어와 관련된 말을 한다면, 사람들은 항상 제가 말하는 것을 평가절하할 것입니다. 혹은 그것이 진실이라고 믿지 않는 것. 다른 학생들과 하는 것과는 전혀 다릅니다. (PS no. 6)
People do not trust what I say. They always think that I do not know much about things. So, if I say something related to a subject, or an idea, there will always be people devaluing what I am saying. Or not believing that it is something true. Completely different from what they do with other students. 
(PS no. 6)

사회적 차별과 인종차별
Social discrimination and racism

일부 학생들은 교직원과 반 친구들로부터 차별을 느꼈습니다. affirmative policies 에 동의하지 않는 교사들이 반 친구들 앞에서 학생들을 모욕한다. 몇몇 상황에서, ProFIS 학생들은 대학에 쉽게 접근할 수 있다는 것이 그들이 대학에 있을 자격이 없다는 것을 의미한다는 생각에 직면했다. 다시, 이러한 경험은 [정당성이 부족하다는 느낌]을 강화한다.
Some students felt discriminated against by their faculty members and classmates. Teachers who disagree with the affirmative policies affront the students in the presence of their classmates. In several situations, ProFIS students were confronted with the idea that their facilitated access to the university meant they were less deserving to be there. Again, these experiences reinforce the feeling of lack of legitimacy.

학급 앞에서 ProFIS 에서 온 학생에게 물어보고 이런 긍정 정책에 동의하지 않는다며 우리에게 지시하는 연설을 시작한 교사가 있었다. 너무 노출된 것 같았어요. (PS No.1)
There was a teacher who asked in the front of the class who was from ProFIS and started giving a speech directed to us, saying that he did not agree with this affirmative policy. I felt super exposed. 
(PS no. 1)

 

자신을 [흑인]으로 식별한 모든 학생들은 주로 병원 내부에서 일어났던 인종차별과 관련된 도전적인 경험을 언급했다. [대학 병원에서 일하는 흑인 의사가 거의 없다는 사실]은 이미 이 학생들이 자신을 의료계의 일부로 상상하도록 도전한다. 그 외에도 인종차별의 경험들은 학생들이 미래에 일반 대중들이 그들을 의사로 보고 믿지 않을 것을 두려워하게 만든다.

All students who self-identified as black mentioned challenging experiences related to racism, which mainly occurred inside the hospital. The fact that few black doctors are working at the university hospital already challenges these students to imagine themselves as part of the medical community. Besides that, experiences of racism make students afraid that the general public will not see and trust them as doctors in the future.

흑인 전문직 종사자들은, 어떤 상황에서든, 그들의 영역이 무엇이든, 항상 이런 압박을 느낀다. 당신은 평범한 변호사가 될 수 없어요. 당신은 평범한 판사가 될 수 없어요. 당신은 평범한 의사가 될 수 없어요. 사회에서 인정받기 위해서는 흑인으로서 무엇을 하든 최고가 되어야 한다.(…) 내가 이 도시에서 최고의 정형외과 의사가 된다면 정말 멋질 것이다. 하지만 이것이 제가 최고의 정형외과 의사가 되고 싶은 이유는 아닙니다. 저는 최고의 정형외과 의사가 되고 싶습니다. 왜냐하면 제가 최고가 아니라면 사람들이 저를 단순히 흑인이라는 이유로 고용하지 않을 수도 있기 때문입니다.(PS No.2)
The black professional, in any situation, whatever their area, always feel this pressure. You cannot be an average lawyer. You cannot be an average judge. You cannot be an average doctor. To be recognized in society, as a black person, you need to be the best in whatever you do. (…) It would be really cool for me to be the best orthopedist in the city. But this is not the reason why I want to be the best orthopedist. I want to be the best orthopedist because if I am not the best, maybe people will not hire me simply because I am black. 
(PS no. 2)

인종차별은 또한 학생들이 의사로서의 역할에 대해 [칭찬을 받을 때 조차]도, 소속되지 않고 불법적이라는 느낌을 강화한다.
Racism also reinforces the feeling of not belonging and illegitimacy even when students are praised for their role as doctors.

주민들은 길에서 폭행을 당한 환자를 평가하고 있었고, 아무도 이유를 알지 못했고, 환자는 말을 할 수 없었다. 그래서, 그들은 조사를 위해 경찰을 불렀습니다. 그리고 경찰관들은 나를 의사라고 부르며 정중하게 인사를 했다. "안녕하세요, 의사 선생님." 그것은 나에게 큰 충격을 주었다. 왜냐하면 내가 길거리에 있을 때, 그들은 나를 그렇게 부르지 않기 때문이야, 알지? 막아서서 때리듯이. (PS no. 3)
The residents were evaluating a patient who had been assaulted on the street, and nobody knew the reason, and the patient could not speak. So, they called the cops to investigate. And the police officers greeted me respectfully, calling me doctor, “Good evening, doc.” It shocked me a lot. Because when I’m on the street, they do not call me that, you know? Like, they stop me, and they hit me. 
(PS no. 3)

계약 -"난 항상 지쳤어"
Engagement—“I’m always exhausted”

CoP 이론은 참여가 전문적 정체성을 개발하는 데 중요하다는 것을 암시한다[38]. 이러한 의미에서 ProFIS 학생들은 재정적인 어려움과 대학 지원의 부족으로 인해 사회적, 전문적 활동에 참여하기 위해 고군분투한다. 그들은 뒤처지고 소외된 기분을 느끼며, 이는 고뇌와 버림받은 감정을 유발한다.
The CoP theory implies that participation is crucial in developing a professional identity [38]. In this sense, ProFIS students struggle to engage in social and professional activities because of financial challenges and a lack of university support. They feel left behind and excluded, which triggers feelings of anguish and abandonment.

재정적 불이익
Financial disadvantage

ProFIS 학생들은 대부분 도시 외곽에 살기 때문에 대중교통을 이용하는데 3~4시간을 소비한다. 결과적으로, 그들은 공부하고 커리큘럼과 과외 활동에 참여할 시간이 더 적습니다. 일부 학생들은 가족의 수입을 보충하기 위해 돈벌이를 해야 할 수가 있다. 집에서도 공부할 수 있는 여건이 다르다. 예를 들어, 어떤 학생들은 안정적인 [인터넷 연결]이 없는 반면, 다른 학생들은 과정을 따라가는 데 [필요한 자료를 살 수 없다]. 의료행위의 아이콘인 [청진기를 구입하는 것조차 부담]스러울 수 있다. "저는 청진기를 사기 위해 다른 사람들보다 훨씬 더 많은 고통을 겪었습니다. 왜냐하면 내가 하나를 사러 갔을 때, 그것은 일종의 행사였기 때문이다. 열 명이 넘는 사람들이 우리 가족을 도와 청진기 하나를 샀다."(PS No.2).

ProFIS students spend 3 to 4 h in public transportation since most live on the city’s periphery. Consequently, they have less time for studying and engaging in curricular and extra-curricular activities. Some students need to work to complement family income. At home, the conditions to study are also different. For instance, some students do not have stable internet connections, while others cannot buy the necessary materials to follow the course. Even purchasing a stethoscope—the “icon” of the medical practice—may be a burden. “I suffered a lot more than other people to buy a stethoscope. Because when I went to buy one, it was a kind of event. More than ten people helped my family to buy one.” (PS no. 2).


학술행사에 참여하는 것 또한 경제적 자원이 부족하고, 좌절감과 불이익을 느끼기 때문에 도전이다. 장학금을 추구하는 것이 의학계의 핵심이기 때문에, ProFIS 학생들은 그들의 직업적 정체성을 기를 수 있는 가장 강력한 기회 중 하나를 거부당한다.
Engaging in academic events is also a challenge because they lack the economic resources, making them feel frustrated and disadvantaged. As pursuing scholarship is at the core of the medical profession, ProFIS students are denied one of the most potent opportunities to nurture their professional identity.

예를 들어, 의회와 다른 학문적인 것들입니다. 사람들은 "어떻게 congress에 가지 않을 수 있어?"라고 말한다. 저는 이렇게 말합니다. "여러분, 의회에 가는 비용을 생각해본 적이 있나요? 강의료도 내고 등록비도 내고 거기 가기 위해서도 돈을 내고, 나는 그들이 우리에게 이것이 얼마나 중요한지 보여주고 싶어하는 것을 이해한다. 하지만 그 중요성을 보여주기엔 충분하지 않다. 중요한 건 다들 알지만, 제가 참여할 수 있도록 중요성을 보여주는 것 말고는 어떻게 하실 건가요? (PS no. 6)
For example, congresses and other academic stuff. People say like, “How could you not go to the congress?” And I say like, “Guys, have you ever realized the costs of going to a congress? You pay for a lecture; you pay for registration; you pay to go there.” I understand that they (the teachers) want to show us how important this is. But it is not enough to show the importance. Everyone knows it is important, but what are you going to do besides showing me the importance so that I can participate? 
(PS no. 6)

 

ProFIS 학생들은 의료계 내부의 비공식 활동에 참여하는 것도 어렵다. 경제적 여건이 열악하고, 운동과 사회활동을 할 시간이 부족하며, 이는 집단과의 외로움과 단절감을 심화시키기 때문이다.
Joining informal activities inside the medical community is also challenging because ProFIS students lack the financial conditions and the time to engage in athletic and social activities, which intensifies the feeling of loneliness and disconnection from the group.

"아, 제가 더 복잡한 이유는… 이런 행사에 참석하는 사람들은… 훨씬 더… 글쎄요… 통합적이라는 것을 알기 때문입니다. 내가 거기에 있을 수 없기 때문에 통합의 부족을 느낀다."(PS No.3).
“Ah, it’s more complicated for me because I realize that … The guys who go to these events … they are much more … like … I don’t know … integrated. I feel this lack of integration because I can’t be there.” (PS no. 3).

불충분한 지원
Insufficient support

ProFIS 학생들에 따르면, 이 의과대학은 상류 사회 계층의 학생들을 다루는 데 익숙해 있는데, 이것은 저소득 가정의 학생들의 요구를 예상하는 데 있어서 그것의 커리큘럼 구조가 실패한다는 것을 의미한다. 그 대학은 학생들을 사회 경제적 프로필에 포함시키는 것에 진정한 관심이 없는 것처럼 느껴진다. "대학은 우리를 맞을 준비가 전혀 되어 있지 않다. 사람들이 우리를 무시하고 '언젠가 이 사람들은 여기 오는 것을 포기하고, 일이 예전으로 돌아갈 것이다.'라고 생각하는 것 같은 느낌을 준다.(PS No.2)
According to ProFIS students, the medical school is used to dealing with students from upper social classes, which means that its curricular structure fails in anticipating the needs of students from low-income families. It feels like the university does not have a genuine interest in including students with their socio-economic profile. “It (the university) is entirely unprepared to welcome us. It gives us a feeling that people are ignoring us and thinking, ‘someday, these people will give up on coming here, and things will go back to how they were before.’” (PS no. 2).

얼라인먼트: "나는 이 현실에서 왔다.—"나는 무언가를 돌려줘야 한다."
Alignment: “I came from this reality”—“I have to give something back”

비록 ProFIS 학생들은 자신을 공동체의 일원으로 상상하고 전문적이고 사회적인 활동을 하는 것에 어려움을 겪지만, 그들은 (스스로 그룹에 포함되기 위해 싸우도록 동기를 부여하기 위해 에너지와 열정을 제공하는) 강한 목적 의식을 가지고 있다. 과정 초반에 소외감을 느낀 후, 그들은 자신의 정당성을 발견하고 공공 의료 시스템의 가치와 목표에 연결되고 일치한다고 느끼며 자신에게 힘을 실어줍니다empower. 이런 맥락에서 비슷한 사회적 배경을 가진 환자들을 돌볼 수 있는 역량을 느끼는 것은 기쁨과 성취감의 원천이다.

Although ProFIS students struggle with imagining themselves as members of the community and engaging in professional and social activities, they have a strong sense of purpose that provides energy and enthusiasm to keep them motivated to fight to be included in the group. After feeling excluded at the beginning of the course, they discover their legitimacy and empower themselves by feeling connected and aligned with the values and aims of the public healthcare system. In this context, feeling competent to take care of patients with a similar social background is a source of joy and fulfillment.

빈약한 환자에 대한 공감 및 동일시 강화
Greater empathy and identification with poor patients

ProFIS 학생들은 사회적 불평등이 가난한 환자들에게 어떤 부담을 주는지에 대해 개인적으로 이해하고 있다고 믿는다. 그들은 공공 의료 시스템에 의존하고 의료 상담과 치료에 접근하기 위해 싸우는 것이 무엇을 의미하는지 알고 있다. 이러한 개인적 경험은 환자의 경험과 맥락에 대한 이해를 넓히고 공감력을 높여주고 환자 중심의 치료를 더 잘 채택할 수 있다고 느끼게 한다. 유능함을 느끼는 것은 그들의 자존감을 높이고 소속감을 회복시킨다. "우리가 공공 의료 시스템에서 돌볼 대부분의 사람들은 나 같은 사람들이다; 나는 이런 현실에서 왔다. 나는 내가 어디에서 왔는지 잊지 않았다. 나는 내가 누군지 안다…" (PS no. 6).
ProFIS students believe they have a personal understanding of how social inequality burdens poor patients. They know what it means to depend on the public healthcare system and fight to have access to medical consultations and treatment. These personal experiences expand their understanding of patients’ experiences and contexts, increasing their empathy and making them feel more capable of adopting patient-centered care. Feeling competent increases their self-esteem and rescues their sense of belongingness. “Most people who we are going to take care of in the public healthcare system are people like me; I came from this reality. I did not forget where I come from. I know who I am …” (PS no. 6).

더 큰 공감의 예로, 많은 참가자들은 [의사들이 환자의 사회 경제적 배경으로 인해 접근하기 어려운 치료를 처방한 상황]에 대한 개인적인 경험을 예시하였다. 이러한 경험들은 그들에게 환자의 사회적 현실을 평가하고 이해하는 것이 얼마나 중요한지를 가르쳐 주었다. 이러한 공유된 사회적 현실은 환자와의 관계를 강화하고 보다 동정심 있는 치료에 대한 그들의 헌신을 강화한다.
As an example of greater empathy, many participants brought up personal examples of situations in which doctors prescribed inaccessible treatments considering their socio-economic background. These experiences have taught them how important it is to assess and understand patients’ social reality. This shared social reality tightens their connections with patients and strengthens their commitment to a more compassionate care.

우리에겐... 모르겠어요... 우리가 더 동정심을 가지고 있다는 걸. 때때로 우리 [ProFIS] 학생들은 다른 [부자] 현실에서 온 친구들과 이야기합니다. 그리고… 그들이 공감하지 않는 것은 아닙니다… 하지만 저는 잘 모릅니다, 아마도, 제 피부에서 [환자들이 겪는 어려움]을 살았고, 저는 그것이 어떤 것인지 정확히 알고 있습니다, 아시죠? (PS no. 4)
It seems that we have a ... I don’t know … that we have more compassion. Sometimes we 
[ProFIS students] talk to friends who come from a different [wealthier] reality. And … it’s not that they’re not empathic … But I don’t know, maybe, I lived it [the difficulties experienced by patients] in my skin, and I know exactly how it is like, you know? (PS no. 4)

취약계층을 위한 봉사 의향상
Willingness to serve vulnerable populations

모든 ProFIS 학생들은 공공 의료 시스템에서 일하고 취약한 사람들에게 봉사하려는 의지를 보였다. 그들은 공립대학에서 의학을 공부할 수 있는 특권을 느끼고 소외된 지역사회의 환자들을 도우면서 사회에 보답하고 싶은 충동을 느낀다.
All ProFIS students showed a willingness to work in the public healthcare system and serve vulnerable populations. They feel privileged to study medicine in a public university and have the urge to pay the society back by helping patients from underserved communities.

나는 개인 병원에서 일하고 싶지 않고, 나는 SUS(브라질 공중 보건 시스템) 의사가 되고 싶고, 나는 항상 1차 진료소에서 일하고 싶다고 말했고… 그리고 우리 반의 ProFIS의 다른 사람들도 그것을 원한다. 우리는 항상 SUS에 의존해왔기 때문에, 나는 무언가를 돌려줘야 한다. 우리는 대학 등록금을 내지 않는다. 그래서 나는 공공 병원, 공공 장소에서 일할 것이다. (PS no. 7)

I don’t want to work at a private hospital, I want to be a SUS (Brazil public health system) doctor, I always said that I wanted to work in primary care … and the others from ProFIS in my class also want that. Because we have always depended on SUS, so, I have to give something back. We don’t pay for university. So, I will work at the public hospital, at a public place. 
(PS no. 7)

논의
Discussion

본 연구는 [저소득과 인종차별]이 어떻게 교차하여 학생들의 의료계 소속감을 저해하는지 조명한다. 그들의 다른 사회적 궤적과 지위는 사회 정의와 책임의 경로로서 다양성과 포용을 이해하지도 기념하지도 않는 엘리트주의 문화와 식민주의 권력 매트릭스와 충돌한다[39, 40]. 우리의 연구는 또한 [취약계층을 의대에 포함시키는 것]만으로는 충분하지 않다는 것을 분명히 하고 있다. 긍정적이고 보상적인 정책affirmative and compensatory policies에는 이러한 학생들의 의료계로의 [통합]을 지원하는 전략이 포함되어야 한다.
Our study sheds light on how low income and racism intersect to hamper students’ sense of belongingness to the medical community. Their different social trajectories and status clash against an elitist culture and a colonial power matrix that neither understands nor celebrates diversity and inclusion as pathways to social justice and accountability [39, 40]. Our study also makes it explicit that the inclusion of vulnerable social groups in medical school is not enough—affirmative and compensatory policies should include strategies to support the integration of these students into the medical community.

CoP 이론이 예상하는 바와 같이 [32, 33] 새로운 사람들은 관행을 갱신하고 편견에 의문을 제기함으로써 공동체가 더욱 발전하고 새로운 사회적 맥락에 적응할 수 있도록 한다. 그러나 이러한 변화는 이러한 새로운 사람들이 지역사회에 의해 합법적인 참여자로 받아들여지고 정회원 자격을 얻을 때까지 그들의 참여 수준을 높일 수 있도록 지원되어야만 일어날 것이다.

As the CoP theory anticipates [32, 33], newcomers are responsible for renewing practices and questioning prejudices, allowing the community to develop further and adapt to new social contexts. However, this transformation will only happen if these newcomers are accepted by the community as legitimate participants and supported to increase their levels of participation until achieving full membership.

[저소득 학생의 포용inclusion]은 여전히 특권, 인종 차별, 성차별, 식민지적 입장으로 특징지어지는 의료 문화의 보다 포괄적인 개혁을 향한 첫걸음이다[39, 41]. 이러한 포함은 의료계가 그것의 편협함을 반성하고 현재의 사회적 요구에 연결하고 대응하는 데 필요한 문화 개혁을 받아들일 수 있는 독특한 기회를 제공한다. 이 새로운 문화에서 의사나 의료 교육자가 되는 것은 시민권을 위한 활동가가 되는 것을 의미하며, 구조적 인종차별과 싸우고 취약한 인구와 동일시하며, 돌봄과 교육의 불평등을 우려하는 전문가이다[33]. 의과대학과 교육자들은 여전히 우리의 전문적이고 교육적인 공동체 내에 존재하는 억압의 시스템(인종차별, 성차별, 외국인 혐오 등)을 개혁할 수 있는 최고의 기회를 대표하는 학생들을 위한 안전한 환경을 조성할 책임이 있다[42].
The inclusion of low-income students is the first step towards a more comprehensive reform of the medical culture, which is still marked by privilege, racism, sexism, and a colonial stance [39, 41]. This inclusion offers the medical community a unique opportunity to reflect on its insularity and embrace the cultural reform necessary to connect and respond to current societal needs. In this new culture, being a doctor or medical educator means becoming an activist for civil rights, a professional who fights structural racism, identifies with vulnerable populations, and is concerned about inequality of care and education [33]. Medical schools and educators are responsible for creating safe environments for the students who represent our best opportunity to reform the systems of oppression (racism, sexism, xenophobia, etc.) that still exists inside our professional and educational communities [42].

실제적 함의
Practical implications

[취약한 사회 집단의 학생들을 지원]하는 것은 [재정 지원을 넘어서는 것]이어야 한다[20]. 의료 교육자와 리더는 의료 커뮤니티로의 통합을 촉진하기 위한 조건을 만들어야 합니다 [43, 44]. 이러한 통합은 학생들과의 [수평적 대화]와 [변화의 주체change agents가 되기 위한 학생들의 권한 부여empowerment]에 의존해야 한다[45].

  • [권한을 느낀다는 것]은 그들의 가치를 인정하고 불의와 편견에 맞서 당당하게 말하는 것을 의미한다.
  • [권한을 느낀다는 것]은 그룹에 동등하게 기여하는 지식 있는 사람들로서 동료들로부터 존중을 받는다는 것을 의미한다[46].
  • [권한을 느낀다는 것]은 의료계 구성원들에게 그들의 정당성을 인정받는 것을 의미한다.

이러한 정당성 없이는, 그들은 전문적인 정체성을 배양하는 데 필요한 참여 수준에 도달할 수 없다[47]. 이러한 합법성은 또한 학생들의 현실을 변화시키기 위해 행동하려는 동기를 촉진하는 데 필수적이다[46].
Supporting students from vulnerable social groups should go beyond providing financial aid [20]. Medical educators and leaders must create the conditions to foster their integration into the medical community [43, 44]. This integration should rely on a horizontal dialogue with students and their empowerment to become change agents [45].

  • Feeling empowered means having their values acknowledged and being comfortable to speak up against injustice and prejudice.
  • Feeling empowered means being respected by their peers as knowledgeable people who equally contribute to the group [46].
  • Feeling empowered means having their legitimacy recognized by the members of the medical community.

Without this legitimacy, they cannot reach the levels of participation needed to nurture their professional identities [47]. This legitimacy is also essential to fuel students’ motivation to act upon their realities to transform them [46].


지원적이고 성찰적인 역할 모델을 참여시키는 것은 필수적이다[23]. 감독관들은 학생들의 존재를 인정하고, 토론에 기여하도록 격려하고, 학생들의 목소리가 들리게 할 필요가 있다. 저소득층 학생들이 취약한 환자들과 더 강한 유대감을 느끼는 것에 자부심을 느낀다는 것을 아는 것은 공감능력이 실종되고 의사와 환자 관계가 차선책일 때 감독관들이 이러한 학생들에게 [주도권을 행사take the lead]할 수 있는 기회를 만들어준다. 그럼에도 불구하고, 이미 압도된overwhelmed 학생들에게 "주도권을 갖는 것taking the lead" 자체가 추가적인 부담이 되지 않는 것이 중요한데, 이 과정은 흔히 "소수자 세금"이라고 불린다[48]. "소수자 세금"은 "백인이 남성 중심의 제도적 환경 내에서 예외로 수반되는 일련의 추가 의무, 기대 및 도전"으로 정의될 수 있다[49].
Engaging supportive and reflective role models is essential [23]. Supervisors need to acknowledge students’ presence, encourage them to contribute to the debate, and guarantee that their voices are heard. Knowing that low-income students feel proud of feeling a stronger connection with vulnerable patients creates opportunities for supervisors to empower these students to take the lead when empathy is missing and the doctor-patient relationship is sub-optimal. Nevertheless, it is crucial that “taking the lead” does not become an extra burden for already overwhelmed students, a process that is often called “the minority tax” [48]. “Minority tax” may be defined as “an array of additional duties, expectations, and challenges that accompany being an exception within white male-dominated institutional environments” [49].

또한, 대학은 통합을 최적화하기 위해 학생 및 환자와 동일한 사회 그룹의 [역할 모델]을 고용해야 한다. 교수진은 이러한 역할 모델을 쉽게 사용할 수 없을 때 이러한 통합 프로세스를 이끌 감독자를 준비해야 합니다. 첫 번째 단계는 감독자들이 자신의 편견과 암묵적인 편견을 [인식]하도록 돕는 것이다. 상호보완적 활동은 인식 창출 후 문화적 겸손을 자극하고 보상함으로써 [문화간 역량intercultural competencies] 개발을 목표로 삼아야 한다. [문화적 겸손]은 포론다 등에 의해 다음과 같이 정의되었다. "다양한 개인들과 기꺼이 교류한 후 개방성, 자기비판, 이기심, 자기반성과 비평의 통합의 과정. 문화적 겸손을 성취하는 것의 결과는 상호 권한 부여, 존중, 파트너십, 최적의 보살핌, 평생 학습이다.[50]. 따라서, 감독자들이 정의롭지 못할 때, 그들은 편안함을 느끼고 한 발짝 물러서서, 그들의 실수를 인식하고, 사과하는 데 동원되어, 그들 스스로가 그들의 실수로부터 배우고 미래의 교육적 또는 임상적 만남에서 그들의 행동을 바꿀 수 있는 기회를 줄 필요가 있다.

Additionally, universities should hire role models from the same social groups as their students and patients to optimize integration. Faculty development should prepare supervisors to lead this integration process when these role models are not readily available. The first step is to help supervisors become aware of their own prejudices and implicit bias. After creating awareness, complementary activities should target the development of intercultural competencies by stimulating and rewarding cultural humility. Cultural humility was defined by Foronda et al. “as a process of openness, self-awareness, being egoless, and incorporating self-reflection and critique after willingly interacting with diverse individuals. The results of achieving cultural humility are mutual empowerment, respect, partnerships, optimal care, and lifelong learning” [50]. Thus, when supervisors fail to be just, they need to feel comfortable and mobilized to step back, recognize their mistakes, and apologize, giving themselves a chance to learn from their mistakes and change their behavior in future educational or clinical encounters.

감독관만으로는 교육 시스템의 구조를 바꾸지 않는다. 의대 지도자는 통합 촉진을 위해 교육과정의 현대화와 디자인의 지침이 필요하다. 예를 들어, 우리의 결과는 어떻게 이 특정 의과대학이 저소득 학생들이 겪는 모든 어려움을 예상할 수 없었는지를 강조한다. 일반적으로 의과대학은 특권층 학생들을 다루며 대부분의 교과활동은 이러한 맥락에서 계획되기 때문에 놀라운 일이 아니다. 저소득층 학생들의 필요를 인식하기 위해서, 의과대학은 그들을 배울 수 있는 안전한 의사소통 채널을 열어야 한다. 이러한 니즈를 파악한 후, 학생들이 참여하는 조직 그룹은 통합을 목표로 하는 특정 프로젝트에 참여할 수 있습니다. 하지만, 학교에서 채택한 어떤 정책이나 조치도 학생들의 정체성을 보존하고, 그것들을 과도하게 노출시키지 않는 것not overexpose이 필수적이다. 저소득층 학생들은 이미 사회적 배제의 과정을 경험한 바 있으며, 자신의 사회 경제적 지위에 대해 부끄러움을 느낀다[20].
Supervisors alone do not change the structure of the educational system. Medical schools leaders need to guide the modernization of the curriculum and design to promote integration. For instance, our results highlight how this particular medical school could not anticipate all the challenges experienced by low-income students. It is unsurprising since, in general, medical schools deal with students from privileged backgrounds, and most curricular activities are planned within this context. To become aware of low-income students’ needs, medical schools should open a secure communication channel to learn about them. After understanding these needs, organizational groups with the participation of the students can work on specific projects targeting their integration. However, it is imperative that any policy or measure adopted by the schools preserve students’ identity and not overexpose them. Low-income students already experience a process of social exclusion and feel ashamed of their socio-economic status [20].

제한 사항
Limitations

우리의 연구는 의사가 되기까지의 모든 과정을 망라하는 학부생들로 한정되어 있었다. 또한, 사회적 포용의 과정은 매우 역동적이며, 우리는 저소득층 학생들의 통합에 대한 종단적 이해가 부족하다. 우리는 이 과정을 추적하고 정책 수립에 알리기 위해 종단 연구를 수행할 것을 제안한다. 우리는 또한 향후 연구가 졸업 후 저소득 배경의 의사들의 경험을 평가하여 그들의 진로에 대한 시사점을 더 탐구해야 한다고 믿는다.
Our study was limited to undergraduate students, which does not cover the whole process of becoming a doctor. Also, the process of social inclusion is hugely dynamic, and we lack a longitudinal understanding of low-income students’ integration. We suggest that longitudinal studies be conducted to track this process and inform policy-making. We also believe that future studies should evaluate the experiences of doctors from a low-income background after graduating, further exploring the implications for their careers.

결론
Conclusion

의학 교육자들은 취약한 사회 집단의 학생들이 포함됨으로써 오는 기회를 받아들여야 한다. 의학을 실천의 공동체로서, 저소득층 학생들을 이 공동체를 새롭게 할 수 있는 새로운 사람들로 생각한다면, 우리는 취해야 할 길은 이러한 학생들을 현재의 의료 문화에 맞게 만드는 것이 아니라, 공동체가 서로 다른 사회 집단과 계층의 기여를 할 수 있도록 스스로를 재정비하는 것이라고 믿는다.

Medical educators should embrace the opportunity brought by the inclusion of students from vulnerable social groups. Considering medicine as a community of practice and low-income students as the newcomers who may renew this community, we believe that the path to be taken is not to make these students fit into the current medical culture but to make sure that the community will reshape itself to allow the contribution of the different social groups and classes.

 

 


Perspect Med Educ. 2022 Aug;11(4):187-195. doi: 10.1007/s40037-022-00715-x. Epub 2022 May 23.

Social justice in medical education: inclusion is not enough-it's just the first step

Affiliations collapse

Affiliations

1Faculty of Medical Sciences, University of Campinas (UNICAMP), São Paulo, Brazil.

2Interdisciplinary Center of Bioethics, Faculty of Medical Sciences, University of Campinas (UNICAMP), São Paulo, Brazil.

3Department of Clinical Sciences, Faculty of Veterinary Medicine, Utrecht University, Utrecht, The Netherlands. m.a.decarvalhofilho@uu.nl.

PMID: 35604538

PMCID: PMC9391538

DOI: 10.1007/s40037-022-00715-x

Free PMC article

Abstract

Introduction: Medical schools worldwide are creating inclusion policies to increase the admission of students from vulnerable social groups. This study explores how medical students from vulnerable social groups experience belongingness as they join the medical community.

Methods: This qualitative study applied thematic analysis to 10 interviews with medical students admitted to one medical school through an affirmative policy. The interviews followed the drawing of a rich picture, in which the students represented a challenging situation experienced in their training, considering their socio-economic and racial background. The analysis was guided by the modes of belonging (engagement, imagination, and alignment) described by the Communities of Practice framework.

Results: Participants struggled to imagine themselves as future doctors because they lack identification with the medical environment, suffer from low self-esteem, aside from experiencing racial and social discrimination. Participants also find it troublesome to engage in social and professional activities because of financial disadvantages and insufficient support from the university. However, participants strongly align with the values of the public health system and show deep empathy for the patients.

Discussion: Including students with different socio-economic and racial backgrounds offers an opportunity to reform the medical culture. Medical educators need to devise strategies to support students' socialization through activities that increase their self-esteem and make explicit the contributions they bring to the medical community.

Keywords: Affirmative policies; Medical education; Professional identity; Social justice.

의학교육에서 인공지능 (AMEE Guide No. 126) (Med Teach)
Artificial intelligence in medical education
Ken Masters

 

서론
Introduction

사고 기계와 인공지능: 짧은 역사
Thinking machines and artificial intelligence: a brief history

데카르트의 오토마타(Descartes 1637)부터 찰스 배비지의 분석 엔진까지 수세기 동안 [사고 기계]의 개념은 존재해 왔으며, 러블레이스 여사는 그 중 "우리가 그것을 수행하는 방법을 알고 있는 것은 무엇이든" 수행할 수 있다고 말했다(메나브레아 1843). 1950년 앨런 튜링은 "머신은 생각할 수 있는가?"라고 물었고 그의 모방 게임(현재 튜링 테스트라고 불린다)을 만들었다. 이 테스트에서 인간 피실험자는 기계와 다른 인간과 상호 작용하며, 피실험자가 기계와 인간을 구별할 수 없다면 기계는 "생각하고 있다"고 말할 수 있다.
The notion of thinking machines has existed for centuries, from Descartes’ Automata (Descartes 1637) to Charles Babbage’s Analytical Engine, of which Lady Lovelace said could only perform “whatever we know how to order it to perform”(Menabrea 1843). In 1950, Alan Turing (Turing 1950) asked, “Can machines think?” and constructed his Imitation Game (now called the Turing Test). In this test, a human subject interacts with a machine and another human, and, if the subject cannot tell the difference between machine and human, then the machine can be said to be “thinking.”

21세기에, 우리는 인공지능(AI)에 첫발을 내디뎠다. (이 가이드를 위해, 나는 풀 외 연구진(1998)과 러셀 & 노르빅(2009)과 같은 일반적인 텍스트를 느슨하게 기반으로, [인간의 합리적 사고와 행동을 모방하고 확장하도록 설계된 컴퓨터 소프트웨어에 의한 행동]으로서 AI에 대한 working definition를 제안한다).
In the twenty-first century, we have the first forays into artificial intelligence (AI). (For this Guide, I propose a working definition of AI as the behaviors by computer software that are designed to mimic and extend human rational thinking and actions, based loosely on general texts, such as Poole et al. (1998) and Russel & Norvig (2009)).

트위터 사용자들로부터 배우고 상호작용하도록 설계된 AI 시스템인 마이크로소프트의 Tay와 같은 AI 실패가 있었다. 불행하게도, Tay는 트위터 사용자들로부터 인종차별주의자, 성차별주의자 편협한 사람으로 교육받았고 오프라인으로 옮겨졌다(Vincent 2016).
There have been AI failures, such as Microsoft’s Tay, an AI system designed to learn from, and interact with, Twitter users. Unfortunately, Tay was taught by Twitter users to be a racist, sexist bigot, and was taken offline (Vincent 2016).

이와는 대조적으로, 2016년 구글의 알파고가 바둑 세계 챔피언 이세돌(상훈 2016)에 4대 1로 승리하며 세계를 놀라게 한 것과 같은 AI 성공이 있었다.
Contrastingly, there have been AI successes, such as Google’s AlphaGo, which, in 2016, stunned the world with a 4-1 victory over Go world champion Lee Se-dol (Sang-Hun 2016).

배비지의 분석 엔진과 달리, 테이와 알파고는 [사고 기계]의 영역으로 들어가, 그들이 배운 것 이상으로 지식과 사고를 확장했다.
Unlike Babbage’s Analytical Engine, both Tay and AlphaGo had entered the realm of the thinking machine, extending their knowledge and thinking beyond what they had been taught; unlike Tay, however, AlphaGo had been taught well, and had behaved acceptably.

교육을 위한 교훈
Lessons for education

교육적 교훈은 AI 실패와 성공에서 배울 수 있다. 가장 중요한 것은 인간 학습자와 마찬가지로 AI 시스템이 학습한 것의 기본을 취하고, 그들과 씨름하고, 혼란스러워하고, 해결책을 시도하고, 확장하고, 적용한다는 것이다. 좋은 선생님들이 자동적으로 좋은 교육으로 이어진다고 주장하는 것은 너무 단순하지만, 우리는 선생님들이 학생들과 그들의 행동에 영향을 미친다는 것을 알고 있다. 테이와 알파고는 [좋은 가르침은 좋은 AI 학습을 위한 플랫폼]을 제공할 수 있고, [나쁜 가르침은 AI를 해칠 수 있다]는 것을 보여준다. 그래서, 인공지능이 학습할 수 있다는 것을 고려하면, 우리는 그것을 가르치는 데 사용하지 않을 수 있을까?

Educational lessons can be learned from AI failures and successes. Most important is that, just like human learners, AI systems take the basics of what they have been taught, grapple with them, get confused, attempt resolutions, extend, and apply. It is too simplistic to argue that good teachers automatically lead to good education, but we do know that teachers influence students and their behavior; Tay and AlphaGo illustrate that good teaching can provide the platform for good AI learning, and bad teaching can harm AI. So, given that AI can learn, could we not use it to teach?

선생님들
Teachers

1980년에 아서 C 클라크는 "누구든 기계로 대체될 수 있는 선생님은 그렇게 되어야 한다!"라고 썼다.(1980년 클록). 교육을 단순한 지식 이전으로 보는 시각에서, 인간 교사를 기계로 대체하는 것은 매력적이다. 실제로, 좋은 가르침은 많은 출처의 정보에 접근하고, 대조하고, 우선순위를 정하고, 적응한 다음, 극히 미묘한 차이가 있는 좁은(심지어 독특한) 환경 내에서 사용하는 것을 포함한다. 또한 창의적 교사는 어떤 형식적인 의미에서도 '교육적'은 아니지만, 사고를 자극하거나 주제를 소개하거나 좁은 교과과정을 넘어 경계를 밀어붙이는 데 유용한 자료를 자주 사용한다. 이 기능은 아직 컴퓨터에 존재하지 않습니다.
In 1980, Arthur C Clarke wrote “Any teacher who can be replaced by a machine should be!”(Clarke 1980). In a view of education as simple knowledge-transfer, replacing human teachers with machines has appeal. In reality, good teaching involves accessing information from many sources, collating, prioritizing, adapting, and then using it within narrow (even unique) circumstances with extremely subtle variations. In addition, creative teachers frequently use materials that are not “educational” in any formal sense, but are useful to stimulate thinking, introduce topics, or push boundaries beyond the narrow curriculum. This ability does not yet exist in computers.

인공지능은 의심할 여지 없이 다음을 포함한 의학 교육 방법에 영향을 미칠 것이다.

  • 학생들의 지식 격차를 파악하고 대응하는 지능형 튜터링 시스템,
  • 구성주의 학습 접근법에서 적응적 가상 촉진자,
  • 데이터 마이닝("검색 엔진"이 아닌)
  • 학생과 교사에 대한 지적 피드백, 그리고
  • 과제 채점 및 출석률 추적과 같은 일상적인 작업 수행

이것들은 모두 교육에 영향을 미칠 것이다.
AI will undoubtedly impact on medical education methods, including

  • intelligent tutoring systems’ identifying and responding to gaps in students’ knowledge,
  • adaptable virtual facilitators in constructivist learning approaches,
  • data mining (as opposed to using “search engines”),
  • intelligent feedback to students and teachers, and
  • performing mundane tasks like assignment grading and attendance tracking.

These will affect all education.

의료 교육에서 AI의 잠재력을 더 잘 보기 위해, 우리는 그 과정의 끝, 즉 훌륭하고 유능한 의사들을 고려해야 한다. 의학 교육의 어떤 변화도 이 최종 목표에 의해 인도되어야 하듯이, 우리는 교사들을 대체하기보다는 AI가 배울 수 있는 잠재력을 고려할 때, 우리가 오히려 AI 의사를 목표로 해야 하는지 물어볼 필요가 있다.

To better see the potential of AI in medical education, we should consider the end of the process: good and competent doctors. Just as any change in medical education should be guided by this end goal, we need to ask, given the potential that we have already seen for AI to learn, rather than replacing teachers, should we rather be aiming at AI doctors?

닥터스
Doctors

이미 컴퓨터는 인간보다 예측과 진단을 더 잘 수행할 수 있다. 하지만 사회가 AI 의사를 받아들이기까지는 얼마나 걸릴까요? 아이디어를 얻기 위해서는 몇 가지를 기억해야 합니다.
Already, computers can perform prediction and diagnosis better than humans (Boguševičius et al. 2002; Esteva et al. 2017; Litjens et al. 2017; Mobadersany et al. 2017; Betancur et al. 2018; De Fauw et al. 2018; Haenssle et al. 2018). But how far off is AI before society accepts an AI doctor? To get some idea, we need to remember a few things:

  • 알파고가 세계 챔피언을 향한 질주는 놀라울 정도로 빨랐고(Cho 2016), 우리는 의학을 포함한 모든 분야에서 빠른 발전을 기대할 수 있다.
  • AlphaGo’s race to world champion was stunningly swift (Cho 2016), and we can expect rapid advances in all fields, including medicine.
  • 알파고는 단일 시스템이다. 의료 AI 시스템은 사물 인터넷(IoT)을 통해 수십만 대의 컴퓨터를 활용하는 글로벌 신경망일 것이다.
  • AlphaGo is a single system. A medical AI system would be a global neural network utilizing hundreds of thousands of computers through the internet of things (IoT).
  • 증거 기반 의학(EBM)이 금본위제이지만, 연구 데이터 배포 및 획득에 대한 입증된 효과적인 방법은 없으며, 연구 성장은 이 이상을 매일 우리의 손아귀에서 더 멀리 떨어뜨린다. 초기 실험은 AI가 출판된 연구 및 전자 의료 기록(EMR)의 관련 데이터에 자동으로 액세스하여 시스템과 의사가 최신 상태를 유지할 수 있도록 하는 데 이상적으로 적합하다는 것을 보여준다.
  • Although evidence-based medicine (EBM) is the gold standard, there is no proven effective method of research data dissemination and acquisition, and research growth puts this ideal further from our grasp every day. Early experiments show that AI is ideally suited to automatically accessing relevant data from published research and from electronic medical records (EMRs), allowing systems and doctors to stay current (Tafti et al. 2017).
  • 유능한 의사가 되기 위해 AI 시스템이 세계 최고의 의사가 될 필요는 없다. AI는 당신의 반에서 최악의 졸업생보다 더 나아야 한다. 또한 표준 분포 곡선을 가정하면 AI가 평균 학생보다 낫다면 전체 의사의 50%보다 낫다. 게다가, 위의 참고 자료에서 볼 수 있듯이, 이미 몇몇 최고 작업보다 몇 가지 작업을 더 잘 수행할 수 있는 시스템이 있기 때문에, AI는 이를 달성하기 위해 궤도에 오르고 있다.
  • To be a competent doctor, an AI system does not have to be the best doctor in the world. AI has to be better than only the worst graduating student in your class. Further, assuming a standard distribution curve, if AI is better than your average student, it is better than 50% of all doctors. Moreover, as seen from the references above, there are already systems that can perform several tasks better than some of the best, so AI is on track to achieve this.
  • 그리고 마지막으로, 당신은 그들의 원칙과 윤리와 같은 모든 졸업생의 다른 측면들에 얼마나 자신이 있는가?
  • And finally, how confident are you in other aspects of all your graduating students, such as their principles and ethics?

사람의 손길
The human touch

우리는 의료와 관련된 모든 사람이 환자에 대해 가지고 있는 [휴먼 터치와 공감]을 고려함으로써 이러한 논쟁에 대응할 수 있다(Cayley 2006). AI가 그런 것도 할 수 있나요? 다시 한 번, 이것을 관점에서 보기 위해, 우리는 두드러진 문제들에 대해 반성해야 한다. 여기에는 다음이 포함됩니다.
We may counter these contentions by considering the Human Touch and empathy that all involved in healthcare have for patients (Cayley 2006). Can AI do that? Again, to see this in perspective, we should reflect on salient issues. These include the following:

  • 20세기에 전 세계에서 수행된 끔찍한 의학 실험(Masters 2018a);
    Appalling medical experiments performed around the world in the twentieth century (Masters 2018a);
  • 의과대학 과정을 거치면서 의대생들의 공감능력이 저하됨
    Declining empathy levels among medical students as they progress through their medical degree (Hojat et al. 2009; Neumann et al. 2011; Chen et al. 2012);
  • 금융 이윤 추구에 있어 제약회사의 가격 급등, 치료제는 그들의 이익을 잠식할 것이기 때문에 유전자 혁명을 두려워함
    Pharmaceutical companies’ price gouging in pursuing financial profits (Hemphill 2010; Greene et al. 2016; Wardle and Wood 2017) and fearing the Genomic Revolution because cures will eat into their profits (Kim 2018);
  • 병원들은 의사들이 급히 병실을 통과하도록 강요하고, 환자에게 퉁명스러운 반응을 보이며, 의사들이 상담을 10분 또는 15분으로 줄이도록 강요하는 일정.
    Hospitals’ forcing doctors to rush through wards, giving curt responses to patients, and schedules forcing doctors to reduce consultations to 10 or 15 minutes;
  • 보험 의사들은 내과의사를 우선시하고 환자와 신체 접촉 없이 환자를 위한 "최선의" 치료를 결정한다. 개업 의사를 위한 과제: 환자에게 영향을 미치는 보험 의사들의 결정을 고려하십시오. 평균적으로, AI 시스템이 더 나쁠까요? 그리고 AI 시스템이 공감(Huang and Rust 2018)을 배우면서 휴먼 터치가 향상될 것이다. 인공 휴먼 터치는 휴먼 터치가 전혀 없는 것보다는 낫다.
    Insurance doctors’ overriding treating physicians and deciding on “best” treatments for patients without any physical contact with those patients. A task for practicing doctors: consider some decisions made by those insurance doctors affecting your patients: on average, would an AI system do any worse? And, as AI systems learn empathy (Huang and Rust 2018), their Human Touch will improve. Artificial Human Touch is better than no Human Touch at all.

그렇다, 인간의 직접적인 상호작용이 필요하다. 특히 나쁜 소식을 전할 때, 상담과 혈압 측정, 봉합 등 작은 절차들을 할 때. 하지만 우리는 이것을 위해 의사가 필요하지 않다. 나쁜 소식을 전하고 상담을 하는 것은 적절하게 훈련된 상담자들이 가장 잘 수행한다. 우리가 "또한 가르쳤다"는 상담에서 교육과정의 주요 초점으로 옮기지 않는 한, 우리는 이 일을 전문가들에게 맡겨야 한다. 혈압 기록이나 봉합 같은 작은 시술은 잘 훈련된 간호사가 가장 잘 수행한다.
Yes, there is a need for direct human interaction, especially when breaking bad news, counselling and small procedures like checking blood pressure, suturing, and so forth. But we do not need doctors for this. Breaking bad news and counselling is best performed by properly trained counsellors. Unless we move counselling from “also taught” to a major focus in the curriculum, we should leave this work to professionals. Small procedures like blood-pressure recording and suturing are best performed by well-trained nursing staff.

의사가 컴퓨터로 대체될 수 있을까? "기계로 대체할 수 있는 의사는 누구라도 그래야 한다!"는 간결한 대답이지만 현실은 더 미묘하다. 아마도, 의사를 대체하기보다는, 우리는 AI를 사용하여 의사들의 일부 역할을 대체하거나 향상시키는 것을 고려해야 할 것이다. 우리는 이러한 새로운 역할들을 이해해야만 그에 따라 의학 교육을 조정할 수 있다.
Can doctors be replaced by computers? While the snappy answer is, “Any doctor who can be replaced by a machine should be!”, reality is more subtle. Perhaps, rather than replacing doctors, we should look at using AI to replace or enhance some of the doctors’ roles. We need to understand these new roles so that we can adjust medical education accordingly.

새로운 의사들의 역할을 대체하고 가르치는 것
Replacing and teaching the new doctors’ roles

AI 역할 식별
Identifying AI roles

위에서 인용한 문헌은 AI가 인간보다 더 능숙하게 일부 감별 진단과 임상 추론을 수행할 수 있음을 나타낸다(아이러니하게도, 이 능력은 컴퓨터가 튜링 테스트(Turing 1950)를 "실패"한다는 것을 의미할 것이다). 그러나 AI 진단 시스템은 자격 있는 의사를 교체해서는 안 된다는 경고를 담고 있으며, 환자들조차 의사의 진단 확인을 원한다. 이것은 훈련되고 자격을 갖춘 의사가 실수를 했기 때문에 일부 AI 시스템이 정확하게 설계되었다는 사실에도 불구하고 그렇다. 본질적으로, 우리는 [순전히 그 시스템이 인간이라는 이유]로 [열등한 임상 추론 기술]을 가지고 있는 것이 입증된 시스템을 여전히 따르고 있다. 하지만, 아마 눈치채지 못했을지 모르지만, 우리는 이미 역할 대체의 초기 단계인 EMR을 가지고 있다.

The literature cited above indicates that AI is able to perform some differential diagnosis and clinical reasoning more competently than humans (ironically, this ability would mean that the computer would “fail” the Turing test (Turing 1950)). Yet AI diagnostic systems carry warnings that they should not replace qualified physicians, and even patients want diagnosis confirmation by physicians (Fink et al. 2018). This is in spite of the fact that some AI systems have been designed precisely because trained and qualified physicians made mistakes (Isabel Healthcare 2018). In essence, we are deferring to a system that is proven to have inferior clinical reasoning skills, purely on the grounds that that system is human. Yet, perhaps unnoticed, we already have the early stages of role replacement: the EMR.

역할 교체: 초기 단계
Role replacement: early stages

EMR은 의료 서비스에 큰 잠재적 이익을 예고하지만, practicing doctors에 의한 EMR에 대한 비판은 너무 많다. 가장 흔한 비판은 [데이터 수집]이 의사와 환자 사이에 직접 눈을 마주쳐야 하는 정상적인 의료 워크플로우 관행 및 절차를 방해한다는 것이다. 해결책은 이러한 EMR 설계 결함을 수정하여 EMR이 일반적인 작업 흐름 관행 및 절차에 적합하도록 하는 것으로 보인다.

EMRs herald great potential benefit to health services, yet there is so much criticism of EMRs by practicing doctors. The most common is that data capture interferes with normal health care workflow practice and procedures that specifically require direct eye contact between doctor and patient (Unger 2015; Gaither 2016; Sinsky et al. 2016; Shanafelt et al. 2016). The solution seems to be to rectify these EMR design flaws, so that EMRs do fit in with normal workflow practice and procedures.

불행하게도, 이 "해결책"은 현대 의료에서 EMR의 역할에 대한 오해를 보여준다. 환자에서 컴퓨터로 의사의 눈을 제거하는 것은 설계상의 결함이 아니라 설계상의 특징이다. EMR 시스템은 일반적인 작업 흐름 관행에 적합하도록 설계되지 않았습니다. EMR 시스템은 일반적인 워크플로우 관행을 변경하도록 설계되었다. 비즈니스 측면에서 EMR은 지속적 기술이 아니라 파괴적 기술입니다(Christensen 및 Armstrong 1998). 그리고, EMR 시스템이 점점 더 AI 시스템과 상호 작용하고, EMR 시스템이 점점 더 AI 시스템이 되면서, 그들은 점점 더 정상적인 워크플로우 관행을 방해할 것이다.

Unfortunately, this “solution” shows a misunderstanding of the EMR’s role in modern healthcare.
> Removing doctors’ eyes from patient to computer is not a design flaw; it is a design feature.
> EMR systems are not designed fit in with normal workflow practice; EMR systems are designed to change normal workflow practice.
> In business terms, EMRs are not sustaining technologies, they are disruptive technologies (Christensen and Armstrong 1998).
> And, as EMR systems increasingly interact with AI systems, and as EMR systems increasingly become AI systems, so they will increasingly disrupt normal workflow practice.

의사들이 지금 느끼는 좌절과 분노는 중요한 새로운 역할의 초기 단계에 있기 때문인데, 주로 환자 데이터를 수집하고 EMR 및 AI 시스템에 입력하는 것이 특징이다. 이는 의사들에게 반갑지 않은 소식일 수 있는데, 이는 의사들 스스로가 데이터 캡처자로 전락했다고 볼 수 있기 때문이지만, 의사들이 EMR의 역할에 대해 어떤 말을 들었는지에 관계없이 놀라운 일이 아닐 수 있다. 실제로 의사들이 경험하고 있는 것은 단지 EMR 사용의 초기 단계일 뿐이고 AI는 이를 따라잡고 다음 단계로 나아간다.: 바로 [역할의 변화와 역전role change and reversal]이다

The frustration and anger that doctors feel now is because they are at the initial stages of an important new role, largely characterised by gathering and entering patient data into EMR and AI systems. This may be unwelcome news to doctors, as they may see themselves reduced to data capturers, but it should not be surprising, in spite of what doctors may have been told about the role of EMRs. In real terms, what doctors are experiencing is merely the early stage of EMR usage while AI catches up and moves into the next stage: role change and reversal.

역할 변경, 새로운 역할 및 이들을 위한 교육
Role change, new roles, and teaching for them

실무적인 측면에서 AI는 미래의 의사 역할에 어떤 의미가 있습니까? 모든 영향을 예측하는 것은 불가능하지만, 일부는 명백하며, 앞 절에서 언급되었다. 이 섹션에서는 이러한 새로운 역할을 충족시키기 위해 필요한 새로운 역할과 의료 커리큘럼 내용에 대한 변경 사항을 살펴봅니다.
In practical terms, what does AI mean for future doctors’ roles? While it is impossible to foresee all implications, some are obvious, and have been mentioned in preceding sections. This section looks at new possible roles and changes to medical curricula content that will be required to meet these new roles.

  • AI 시스템 설계에 적극적이 되라. 성공적인 파괴적 기술은 종종 단순화를 도입하지만(크리스텐슨과 암스트롱 1998), 현재 많은 EMR 시스템에 대해서는 말할 수 없다. 유지된 의료와 변화의 균형을 맞추기 위해 의사는 영향력 있는 그룹으로 조직하고 EMR 및 AI 시스템을 설계하고 시험하는 데 직접 지원해야 한다. 의사는 최소한 기본적인 의료 정보학을 배워야 하며, 설계자와 직접 협력할 수 있도록 EMR 및 AI 설계 원칙에 대한 감각을 갖춰야 하며, 시스템이 의료 윤리, 의료 및 실무 요건을 충족하도록 보장해야 한다.
    Being proactive in AI system design. Successful disruptive technologies frequently introduce simplification (Christensen and Armstrong 1998), but that cannot be said about many current EMR systems. To balance change with maintained healthcare, doctors should organise themselves into influencing groups and assist directly in designing and trialing EMR and AI systems. Doctors should be taught at least basic medical informatics, and have a sense of EMR and AI design principles so that they can work directly with designers, ensuring that systems meet healthcare ethical, medical and practical requirements.
  • AI 진단 시스템으로 작업합니다. 의사들은 환자의 요구에 가장 잘 부응하기 위해 AI 진단과 다른 시스템을 통해 건설적으로 일하는 방법을 알아야 한다. 이를 위해 이러한 시스템에 대한 교육을 통해 다른 의료 도구와 마찬가지로 익숙해질 수 있어야 한다. 이제 훈련이 시작되어야 합니다. 훈련을 시작하기 전에 이러한 시스템이 만연할 때까지 기다리는 것은 학습 곡선과 심리적 영향이 엄청날 것이기 때문에 역효과를 낳을 것이다. 기술 교육 외에도 윤리, 역할, 프로토콜 및 책임에 대한 광범위한 질문이 해결되어야 합니다.
    Working with AI diagnostic systems. Doctors need to know how to work constructively with AI diagnostic and other systems to best serve their patients’ needs. For this, they will require training on these systems to become as familiar with them as they are with any other medical tools. Training should start now. Waiting until these systems are pervasive before beginning training will be counterproductive, as the learning curve and psychological impact will be tremendous. In addition to technical training, wider questions around ethics, roles, protocols, and liability need to be addressed.
  • AI 시스템과 소통합니다. 의사들은 AI 시스템에 관련 정보를 inform하는 방법을 배울 필요가 있으며, 그래야 EMR이 새로운 정보를 EMR 안팎의 정보와 일치시킬 수 있을 것이다. 또한 그래야 EMR이 의사들이 불분명해 보이는 부분에 대한 추가 정보를 요청하도록 촉구할 필요가 있다. 이것은 [순환적 과정]이다. 
    Communicating with AI systems. Doctors need to be taught how to inform AI systems of the relevant information, so that EMRs can match new information to information inside and outside the EMR, and prompt doctors to request further information on areas that appear unclear. This is an iterative process.
    • 또한 의사들은 구두 의사소통, 서면 의사소통, 음성 입력, 촉각 정보, 의심과 예감을 디지털 정보로 변환하는 것, 그리고 임상 환경에서 데이터 마이닝 도구를 사용하는 방법에 대한 세심한 교육이 필요하다.
      In addition, doctors require careful training on verbal communication, written communication, voice input, and translating tactile information, suspicions and hunches into digital information, and how to use data-mining tools within clinical environments.
    • 또한 의사는 환자와 "개인적" 관계를 발전시키는 AI 시스템에 참여하는 방법을 가르쳐야 하며, 조기 경고 신호를 감시하고, 동시에 환자가 제공자 간에 쉽게 데이터를 전송하고, 데이터를 수집 및 대조하며, 동향과 이상 징후를 파악하고, 적절한 조직 대응을 촉발할 수 있도록 해야 한다.
      Doctors also need to be taught how to engage with AI systems that develop “personal” relationships with patients, watching for early warning signs, and simultaneously allowing patients to easily transfer between providers, gathering and collating data, identifying trends and anomalies, and triggering appropriate organisational responses.
  • 심층 상담 및 관련 활동. 의사 소통 능력과 관련하여, 의사들은 향상된 상담 기술을 배울 필요가 있다. 이러한 기술이 없는 의사들은 환자들로부터 떨어져 더 적합하게 고용될 것이고, 상담은 자격을 갖춘 상담사들에 의해 수행될 수 있다. 이는 AI가 강화의학(현재 "정상"으로 간주되는 것 이상으로 인간의 심신을 향상시키는 의료 절차)과 같은 새로운 의료 분야를 열면서 중요성이 커질 것이다.
    Deeper counselling and related activities. Related to communication skills, doctors need to be taught improved counselling skills. Doctors without these skills would be more suitably employed away from patients, and counselling can be performed by qualified counsellors. This will grow in importance as AI opens new medical fields, such as enhanced medicine (medical procedures enhancing the human mind and body beyond what is currently considered “normal”).
  • 자신의 역할에 대한 심리적 방향 전환. 어떤 의사들의 역할은 너무 많이 변해서 더 이상 알아볼 수 없을 것이고, 많은 역할들은 우리가 현재 "의사"라는 단어가 의미하는 패턴에 더 이상 맞지 않을 수도 있다. 이것은 특히 지속적인 의료 교육(CME)에서 모든 수준에서 다루어져야 할 것이다.
    Psychological reorientation of one’s roles. Some doctors’ roles will change so much that they will no longer be recognisable, and many roles might no longer fit the pattern of what we currently mean by the word “doctor.” This will have to be addressed at all levels, especially in Continuing Medical Education (CME).
  • 새로운 의학 AI를 가르칩니다. Tay와 AlphaGo로부터 우리는 AI를 제대로 가르칠 수 있는 의사가 필요하다는 것을 알고 있다.
  • Teaching new medical AI. From Tay and AlphaGo, we know that we need doctors who can teach AI properly.
    • 초기에, 환자 정보는 의사가 수집하여 AI 시스템에 제공되어야 할 것이다. 그러나 AI는 이 정보 자체를 수집하고, 어떻게 적절하게 작업할 수 있는지 배워야 할 것이다. 의료정보학 윤리(Masters 2018a)에 이미 내재된 복잡한 문제를 지침 원칙으로서 의료 AI에 내장해야 할 것이다. 이러한 윤리적 원칙을 AI에 포함시켜야 AI가 [인공지능]에서 [인공지혜]로 넘어갈 수 있다.
    • Initially, patient information will have to be gathered by doctors and given to AI systems. But AI will have to be taught to gather this information itself, and how to work properly with it. Complex issues already inherent in medical informatics’ ethics (Masters 2018a) will need to be built into medical AI as guiding principles. Only by including these ethical principles into AI, can AI move from Artificial Intelligence to Artificial Wisdom.
    • 효과적인 시스템 진화를 위해 원활한 통신이 중요하기 때문에, [개별 EMR AI 시스템]이 [더 크고 글로벌한 AI 시스템]과 통신하도록 학습될 필요가 있다. 그러나 기술 분야는 한 가지 측면만을 형성한다. 해결이 요구되는 더 큰 영역은 [언어]이다. [의학 전문용어]는 불일치로 가득 차 있으며(Lee와 Whitehead 2017), AI 시스템은 이미 이러한 제한을 해결할 수 있으며, 인간보다 훨씬 더 효율적으로 서로 소통하고 있다. 문제는 인간이 기계가 개발한 AI 언어를 이해할 수 없고, 시스템을 종료하는 방식으로 대응했다는 점이다(Wong 2016). 우리는 이러한 새로운 언어들을 다룰 수 있는 의료 종사자들이 필요할 것이다.
    • Individual EMR AI systems will need to be taught to communicate with greater, global AI systems, as smooth communication is crucial for effective system evolution. But the technical areas form only one aspect. A larger area requiring addressing is language. Medical jargon is fraught with inconsistencies (Lee and Whitehead 2017), and AI systems can already address these restrictions, and have communicated with each other far more efficiently than humans can. The problem is that humans cannot understand machine-developed AI languages, and have responded by shutting down the systems (Wong 2016). We will need medical practitioners who can work with these new languages.
    • 우리는 이미 형편없는 가르침으로 인한 의료 AI 시스템 오류의 예를 가지고 있다. IBM의 Watson은 가상의 사례만을 통해 종양학 기술을 배웠다. 인간이었다면 용납할 수 없는 교육행위로 간주되는 것이다. 그것이 그렇게 많은 실수를 했다는 것은 놀라운 일이 아니었다. 좋은 AI는 의료, 교육 및 컴퓨팅 분야의 전문가 팀을 필요로 한다.
    • We already have examples of medical AI system errors because of poor teaching—IBM’s Watson was taught oncology skills through hypothetical cases only (Ross and SwetlitzIke 2018), a practice considered unacceptable when teaching human doctors. It was not surprising that it made so many mistakes. Good AI needs teams of experts from medical, educational and computing fields.
  • 로봇 공학. 비록 초기 단계이고 대부분 인간의 통제 하에 있지만, 외과용 로봇 공학은 이미 수술을 변화시키는 데 잠재력을 보여주었고, 의료에 대한 직접적인 긍정적인 영향은 심오할 것이다. 지능형 로봇은 단순히 AI 소프트웨어를 가진 로봇이며, 이 소프트웨어는 결국 사람 없이 수술을 수행할 것이다. 곧, 이러한 수술 방법이 표준화될 것이고, 로봇 수술을 가르치지 않는 의과대학은 빠르게 뒤처질 것이다.
  • Robotics. Although in its infancy, and mostly under human control, surgical robotics has already shown potential in changing surgery, and the direct positive impact on healthcare will be profound (Nag et al. 2017; Schroerlucke et al. 2017; Porpiglia et al. 2018; Stiegler and Schemmer 2018; Stravodimos et al. 2019). Intelligent robots are simply robots with AI software, and this software will eventually perform surgery without humans. Soon, these surgical methods will be standard, and medical schools that are not teaching robotic surgery will fall behind rapidly.
  • 전자 환자들. 비록 전자 환자(Masters 2017; Masters 2018b)의 개념은 이 가이드의 범위를 벗어났지만, 우리는 AI가 전자 환자에게 극적으로 영향을 미칠 것이라는 것을 알 수 있다. 환자들은 의사가 AI사용하는 것을 보거나, 볼거라 기대할 수 있으며, 그렇지 않은 사람들에 대한 (부정적) 판단을 갖게 될 것이다. 
  • E-patients. Although the concept of e-patients (Masters 2017; Masters 2018b) is beyond this Guide’s scope, we can note that AI will dramatically impact upon the e-patient. Patients will become accustomed to seeing, may expect to see, doctors’ using AI, and be judgemental of those who are not.
    • 특히 어려운 점은 환자가 개인 AI 시스템에 직접 액세스하거나 상당한 비용을 지불하지 않고 액세스하는 것을 방지하고자 하는 AI 기업들의 바람일 것이다. 이 논의는 병원 소유 및 제어 EMR 시스템을 넘어 환자의 AI 시스템이 필요할 때만 의료진에게 액세스 권한을 부여하고 해당 액세스를 인증 및 추적하며 데이터 사용량을 추적 및 감사하는 암호화, 환자 소유 및 제어 시스템으로 이동하는 것이 목표이기 때문에 이미 오래되었다. 의사들은 AI 환경의 일부로서 전자 환자와 상호 작용하는 방법을 배워야 한다.
    • A particular difficulty will be AI companies’ wishing to prevent patients’ accessing personal AI systems directly, or without paying a substantial fee. This discussion is already old, as the goal is to move beyond hospital-owned and controlled EMR systems to encrypted, patient-owned and controlled systems, to which patient’s AI systems grant health personnel access only when needed, that access is authenticated and tracked, and data usage is tracked and audited. Doctors have to be taught how to interact with e-patients as part of the AI environment.
    • AI가 개선됨에 따라, 환자들은 종종 의사를 우회할 것이며, 음성, 웨어러블 및 이식형 컴퓨터를 통해 집이나 다른 원격지에서 AI 시스템과 상호 작용하는 것을 선호할 것이다. 이러한 측면을 결합하면 인간이 광대한 사물인터넷의 노드인 호모 노두스(Masters 2015)로 진화하면서 환자의 본질을 변화시킬 것이다.
    • As AI improves, patients will frequently by-pass doctors, preferring to interact with AI systems from their home or other remote locations through voice, wearable and implanted computers. Combining these facets will change the very nature of the patient, as humans evolve into Homo Nodus (Masters 2015), a node on a vast Internet of Things.

산업화가 '디스킬링'(Frey and Osborne 2013)으로 이어진 방식과 유사하게, 많은 보건 전문가들의 업무와 역할이 AI에 의해 대체되고, 새로운 역할이 필요할 것이며, 의학교육은 그러한 새로운 역할에 대비해야 할 것이다. 세부 커리큘럼은 기술과 환경이 발전함에 따라 개발되고 업데이트되어야 한다. 많은 재료 개발은 환자를 포함한 개발 팀에 의해 수행되어야 할 것이다.
It is inevitable that similar to the way in which industrialisation led to “deskilling”(Frey and Osborne 2013), many health professionals’ tasks and roles will be taken over by AI, new roles will be necessary, and medical education must prepare for those new roles. Detailed curricula need to be developed and updated as the technology and environment evolve. Much material development will need to be performed by development teams that include patients.

결론
Conclusion

본 가이드에서는 데카르트와 튜링부터 알파고를 활용한 인공지능까지 생각하는 기계에 대해 살펴보았다. AI가 의료 실무로 더 깊이 들어가면서, 우리는 "진짜" 작업이 컴퓨터에 의해 수행되고, 의사들은 할 일이 없고, 아무것도 알지 못할 것이라는 두려움을 가질 수 있다. 만약 우리가 원한다면, 그것은 가능하다. 그러나 보건 전문가들을 위한 새로운 역할이 등장할 가능성이 높지만, 아직 예측되지 않은 많은 역할, 새로운 의학 교육이 필요한 역할들이 등장할 것이다.
This Guide has considered thinking machines from Descartes and Turing to Artificial Intelligence with AlphaGo. As AI moves deeper into medical practice, we may have fears that the “real” work will be done by computers, and doctors will have nothing to do, and will know nothing. That is possible, if we want it to be. Just as likely, however, new roles for health professionals will emerge, many roles not yet foreseen, roles requiring new medical education.

일부 독자들은 이 가이드의 겉보기에 공상과학적인 전망에 회의적일 수 있다. 그러나 AI 연구에 연간 수백억 달러가 쏟아지고(Bughin et al. 2017), 현재 컴퓨터 시스템에서 사용할 수 있는 데이터의 양은 전례가 없다는 점을 기억해야 한다. AI는 우리 삶의 모든 측면에 직접적인 영향을 미칠 것이며, 의학 및 의학 교육이 면제될 것이라고 믿을 이유가 없다. 양질의 의료 서비스가 제공될 수 있도록 AI로 미래를 준비하는 것은 우리의 책임이다.
Some readers may be skeptical about the seemingly science-fiction outlook of this Guide. One should remember, however, that tens of billions of dollars are poured into AI research annually (Bughin et al. 2017), and the amount of data currently available to computer systems is unprecedented; AI will impact directly on every aspect of our lives, and there is no reason to believe that medicine and medical education will be spared. It is our responsibility to prepare ourselves, our students and our doctors, for the future with AI, so that quality healthcare can be delivered.

인공지능을 무시하는 사람들은 일시적인 편안함을 갖게 될 것이지만, 마침내 그것이 그들 주변에 있다는 것을 알게 되면, 그들은 어떻게 그것을 놓쳤는지 궁금해 할 것이다.
Those who ignore AI will have temporary comfort, but, when they finally realise that it is all around them, they will wonder how they missed it.

의사, 학생 또는 의료 교육자를 대체하기는 커녕, AI는 새로운 지평을 열 것이다. 인공지능으로 대체될 수 있는 사람이 아니라, 인공지능으로 대체되기를 원하는 사람이 그렇게 될 것이다. 나머지 사람들에게, 기회는 엄청날 것이다. 미래가 어떻든 간에, "우리는 단지 짧은 거리만을 볼 수 있지만, 우리는 그곳에서 해야 할 많은 것을 볼 수 있다."(1950년 동안).

Far from replacing doctors, students, or medical educators, AI will open new horizons. It is not so much that those who can be replaced by AI will be; it is more that those who wish to be replaced by AI will be. For the rest, the opportunities will be vast. Whatever the future, “We can only see a short distance ahead, but we can see plenty there that needs to be done” (Turing 1950).

 

 


 

 

Med Teach. 2019 Sep;41(9):976-980. doi: 10.1080/0142159X.2019.1595557. Epub 2019 Apr 21.

 

 

Artificial intelligence in medical education

Affiliations collapse

Affiliation

1Sultan Qaboos University , Muscat , Sultanate of Oman.

PMID: 31007106

DOI: 10.1080/0142159X.2019.1595557

Abstract

Artificial intelligence (AI) is a growing phenomenon, and will soon facilitate wide-scale changes in many professions, including medical education. In order for medical educators to be properly prepared for AI, they will need to have at least a fundamental knowledge of AI in relation to learning and teaching, and the extent to which it will impact on medical education. This Guide begins by introducing the broad concepts of AI by using fairly well-known examples to illustrate AI's implications within the context of education. It then considers the impact of AI on medicine and the implications of this impact for educators trying to educate future doctors. Drawing on these strands, it then identifies AI's direct impact on the methodology and content of medical education, in an attempt to prepare medical educators for the changing demands and opportunities that are about to face them because of AI.

의학교육의 출판과 지식생성에서 새는 파이프라인(Perspect Med Educ, 2022)
The leaky pipeline of publications and knowledge generation in medical education
Rashmi A. Kusurkar

 

 

의학 교육에서의 나의 여정은 세계적인 것이다. 저는 의사, 교사, 연구원으로 글로벌 남방(인도)에서 글로벌 북방(네덜란드)으로 이주했습니다. 연구 역량은 뛰어나지만 과학 저술과 출판에 대한 자신감은 낮았던 인도에서 야심차고 동기부여가 된 제 자신을 회상하면서, 저는 혁신적인 연구를 수행하는 것에서 출판 가치가 있는 학술 논문을 만드는 것에 이르는 궤적을 완성할 훈련과 자원이 전혀 없었다는 것을 깨닫게 됩니다. 뒤늦게나마, 제 연구는 출판 가치가 있었지만, 제 글은 그렇지 않았습니다. 네덜란드로 이사하면서 내 경력에 새로운 힘이 생겼다. 나는 네덜란드 최고의 연구소인 위트레흐트 대학 의료 센터에서 자원을 이용할 수 있었고, 세계적으로 유명한 전문가 올레텐 카테 교수의 지도로부터 이익을 얻을 수 있었다. 저의 새로운 위치와 저의 새로운 멘토 덕분에, 저는 그 분야의 지배적인 지식 대화가 일어나는 네트워크의 일부가 되었습니다. 나는 그러한 대화와 관점에 익숙해졌다. 나는 연구에 대한 독서와 대화를 통해 문헌의 차이를 비교적 쉽게 파악할 수 있었고 혁신적인 연구 주제로 나만의 연구 프로그램을 마련하는 데 성공했다.

My journey in medical education is a global one. I relocated as a doctor, teacher and researcher from the Global South (India) to the Global North (the Netherlands). As I reminisce about my ambitious, motivated self in India with competence in research, but low confidence in scientific writing and publishing, I realize that I simply did not have the training and resources to complete the trajectory from conducting innovative research to crafting a publication-worthy academic paper. By hindsight, my research was publication-worthy, my writing was not. Moving to the Netherlands gave my career a new boost. I was granted access to resources at a premier Dutch institute, University Medical Center Utrecht, and could benefit from the guidance of world-renowned expert Professor Olle ten Cate. By virtue of my new location and my new mentor, I became part of a network where the dominant knowledge conversations in the field were happening. I became privy to those conversations and viewpoints. I was able to identify gaps in the literature relatively easily through reading and talking to people about research and was successful in setting up my own research program with innovative research themes.

박사 학위를 받은 후, 리뷰어로서의 경험을 쌓으면서, 나는 '문헌의 gap이 명확하지 않다', '과학적 글쓰기의 질이 나쁘다', '영어 실력이 부족하다', '이것은 이미 서양맥락에서 행해졌다', '이 주제는 현장의 현재 대화에서 충분히 중요하지 않다' 등과 같은 이유로 거절당한 의학 교육에서 흥미로운 원고들을 발견했다. [글로벌 북방]의 출판문화에 익숙하지 않은 연구자들에 의해 심각한 자원 제약 속에서 진행되었다는 것을 알면서도, 이러한 이유들로 인해 거부된 고품질의 원작을 보고 가슴이 아팠다. 저는 그 작가들 각각과 동일시 했습니다. 제가 상상할 수 있는 모든 작가들은 펜을 들고 그들의 작품을 제출할 수 있는 충분한 자신감을 모으기 위해 주요 장애물을 극복했습니다. 제가 여러 의학 교육 저널의 부편집장으로 임명되었을 때, 저는 글로벌 사우스 출신의 작가들이 주요 저널에 게재될 수 있도록 돕기 위해 그 대의를 추진하겠다고 제 자신과 약속을 했습니다. 나는 편집자들과 이 주제에 대한 대화를 시작함과 동시에 일대일로 몇몇 작가들을 멘토링함으로써 이것을 할 것이다. 의학 교육에서 출판물의 유출 파이프라인에 대한 이 논평은 이러한 대화를 추진하기 위한 시도이다.
After my PhD, as I gathered experience as a reviewer, I came across interesting manuscripts in medical education written by authors from the Global South that were rejected for reasons such as: ‘the gap in the literature is not clear’, ‘poor quality of scientific writing’, ‘poor English language skills’, ‘this has already been done in the Western context’, ‘this topic is not important enough in the current conversations in the field’, and so on. It broke my heart to see high-quality original work rejected for these reasons, knowing it had been conducted under serious resource constraints by researchers who were not familiar with the publication culture in the Global North. I identified with each of those authors, who I could imagine had overcome major hurdles in order to put pen to paper and muster enough confidence to submit their work. When I was appointed as an associate editor on multiple medical education journals, I made a pact with myself that I would drive the cause to help authors from the Global South publish in the major journals. I would do this by mentoring some authors on a one-on-one basis, while simultaneously starting conversations about this topic with editors. This commentary on the leaky pipeline in publications in medical education is an attempt to drive this conversation.

물이 새는 파이프라인
The leaky pipeline

[누출성 파이프라인] 은유는 학계[1]와 STEM(과학, 기술, 공학, 수학) 분야[2]에서 여성의 대표 부족과 의학뿐만 아니라 학계에서도 유색인종의 부족을 설명하기 위해 사용되었다[3]. 새는 파이프라인 은유는 의학 교육 출판 관행과 아름답게 들어맞는다. 의학 교육에 대한 지식은 전 세계적으로 생성되지만, 그 분야의 시스템적 요소 때문에 특정 유형의 지식만 출판되고 그 분야에 보탬이 되는 '지식'으로 인정된다. 그림 1에서는 [글로벌 남방]으로부터의 지식이 상실되어, [글로벌 북방] 의학 교육 연구 저장고에 도달하거나 통합되지 않는 지식 파이프라인의 여러 가지 점을 설명한다.
The leaky pipeline metaphor has been used to illustrate the lack of representation of women in academia [1] and in the STEM (science, technology, engineering, and mathematics) disciplines [2], and the lack of people of colour in academia as well as in medicine [3]. The leaky pipeline metaphor fits medical education publication practices beautifully. Knowledge on medical education is generated all over the globe, but due to systematic factors in the field only certain types of knowledge are published and acknowledged as ‘knowledge’ that adds to the field. In Fig. 1, I illustrate the different points in the knowledge pipeline where knowledge from the Global South is lost and never reaches or is never incorporated into the Global North medical education research reservoir.

Buffone 등은 10년 동안 7개 주요 의학 교육 저널의 출판물에 대한 조사를 실시했으며, 이러한 대륙이 세계 인구의 약 85%를 차지함에도 불구하고 글로벌 남부(아시아, 아프리카 및 남미)의 주요 저자가 있는 출판물은 21% 미만이라고 보고했다[4]. Maggio 등은 의료 교육에서 지식 합성에 대한 분석을 수행하여 의료 교육에서 지식 대화를 주도하는 사람이 누구인지 밝혀냈다[5]. 그들은 보건 전문 교육에서 지식 합성의 6%만이 저소득 또는 중간 소득 국가의 저자를 포함한다고 보고했다. 나머지 94%의 작가들 중에서, 대다수의 기사들은 고소득 국가 출신의 고위 기관의 작가들에 의해 쓰여졌다. 따라서 지식의 권력 구조는 고소득 국가, 특히 세계 인구의 5% 정도에 불과한 북미의 특정 기관으로 극단적으로 치우쳐 있다.

Buffone et al. conducted an investigation into publications in seven major medical education journals over a 10-year period and reported that publications with lead authors from the Global South (Asia, Africa and South America) were less than 21%, even though these continents represent around 85% of the world population [4]. Maggio et al. conducted an analysis of knowledge syntheses in medical education, uncovering who drives the knowledge conversations in medical education [5]. They reported that only 6% of knowledge synthesis in health professions education included authors from low or middle income countries. Among the remaining 94% of authors, majority of articles were written by authors from highly ranked institutions from high income countries. Thus, the power structure of knowledge is extremely skewed to certain institutions from high income countries, and especially from North America, (which represents only around 5% of the world population).

Yip과 Rashid는 10개의 저명한 의학 교육 저널의 편집 위원회에 대한 최근 조사에서 이전에는 하드 데이터에 의해 뒷받침되지 않았던 잘 알려진 그림을 밝혀냈다[6]. 0-10 척도에서 6개의 저널은 성별, 지리적, 소득 수준 관련 다양성으로 구성된 종합 점수에서 낮은 점수(≤ 5)를 받았으며, 그 안에서 대부분의 점수는 [지리적, 소득 수준 관련 다양성]이 아닌 [젠더 다양성]으로 설명되었다. 불행하게도 'Perspectives on Medical Education'은 이 척도에서 5점밖에 받지 못했고 'Academic Medicine'은 완전한 북미 편집 위원회를 가지고 있는 것으로 보도되었다.

In their recent investigation of the editorial boards of ten well-established medical education journals, Yip and Rashid brought to light a well-known picture that was never before supported by hard data [6]. On a scale of 0–10, six journals scored poorly (≤ 5) on a composite score comprising gender-related, geographic and income level-related diversity, within which the scores of most of them were accounted for by gender diversity rather than geographic and income level-related diversity. Unfortunately, ‘Perspectives on Medical Education’ scored only 5 on this scale and ‘Academic Medicine’ was reported to have a fully North American Editorial Board.

따라서 글로벌 남부가 의료 교육 분야의 대화에서 제외되는 것으로 시작한다. Lancet Global Health에서 발행한 글로벌 사우스(Global South)가 의료 분야에서 스토리텔링의 일부가 아니라는 기사가 이러한 현상의 증거입니다 [7]. 글로벌 사우스 대표들은 의학 교육 연구 의제를 논의하기 위해 테이블에 앉아 있지 않다. '식탁에 앉아있지 않으면, 결국 메뉴판에 오르는 것으로 끝날 뿐이다'는 말이 생각난다. 여기에 비전통적 역량(강력한 개인 서사 작성, 과학에 전통적인 지혜 포함 등)과 글로벌 남방에서 창출되는 새로운 지식의 영역은 합법적으로 받아들여지지 않는다[8]. 따라서 글로벌 남방에서의 작업은 글로벌 남방에서의 의료 교육의 근거 있는 현실을 이해하지 못할 수 있는 글로벌 북방의 저자, 검토자 및 편집자의 손에 달려 있다[6, 8].

Thus, it begins with the Global South being excluded from conversations in the medical education field. An article published by Lancet Global Health on how the Global South is not part of the storytelling in the medical field is evidence of this phenomenon [7]. Global South representatives are not at the table to discuss the medical education research agenda. I am reminded of the saying, ‘If you are not at the table, you will end up on the menu’. On top of that, unconventional competences (such as in writing powerful personal narratives, inclusion of traditional wisdom in science, etc.) and the new domains of knowledge generated in the Global South are not accepted as legitimate [8]. Thus, work from the Global South is at the mercy of authors, reviewers and editors from the Global North, who may not understand the grounded reality of medical education in the Global South [6, 8].

자원이 부족하거나 서구 과학 글쓰기에 대한 문학과 훈련에 대한 접근성이 부족하면 글로벌 남방 저가들의 신뢰와 인지된 역량이 심각하게 저해될 수 있다. 주요 학술지에 투고조차 되지 않은 원고가 많다. 일부 저자들이 그들의 원고를 제출하기 위해 용기를 내더라도(지난 몇 년 동안 일어나고 있는 것처럼 보인다), 그 원고가 출판에 받아들여질 가능성은 여전히 아주 적다[8].
Lack of resources or access to literature and training in Western scientific writing, which is the dominant accepted practice, can seriously hamper the confidence and perceived competence of Global South authors. Much of the work is not even submitted for publication in major journals. If some authors do gather the guts to submit their work, which seems to be happening in the last few years, there is still only a miniscule chance that this work will be accepted for publication [8].

주요 보건 전문 교육 저널에 성공적인 저자의 다양성 부족과 편집위원회의 다양성 부족을 합치면, 극도로 왜곡된 지식 종합은 소수의 강력한 글로벌 노스(어소시에이트) 편집자들이 비공식적이고 암묵적으로 지배하고 있다고 결론짓는 것이 타당하다. 그들은 대다수의 논의에 공개되지 않은 품질 기준을 설정한다[8]. 우리의 새는 파이프라인은 긴급한 조사가 필요하며 데이터는 이미 존재합니다. 근거 있는 현실을 조사하기 위해 세계적으로 연구 프로그램을 마련해야 한다. 여기에는 다음이 포함되어야 한다.

  • a) 리뷰어의 다양성 분석
  • b) 저소득 및 중산층 국가 및 지리적으로 다양한 지역의 저자가 작성한 논문의 게재/거부에 대한 검토자의 권고 분석
  • c) 편집 위원회가 최종 게재/거부 결정을 결정하기 위해 이러한 결정을 승인/거부하는 방법.

If we put the lack in diversity of authors successful in publishing in major health professions education journals together with the lack of diversity of editorial boards, it is reasonable to conclude that the extremely skewed knowledge syntheses is informally and implicitly dominated by a handful of powerful Global North (associate) editors. They set standards for quality which is not open for the majority to debate [8]. Our leaky pipeline needs urgent investigation and the data already exist. A program of research needs to be set up globally for investigating the grounded reality. This should include:

  • a) analysis of diversity among reviewers,
  • b) analysis of reviewers’ recommendations on acceptance/rejection of papers written by authors from low and middle income countries and geographically diverse regions, and
  • c) how these decisions are accepted/rejected by editorial boards to determine final acceptance/rejection decisions.

이 문제를 어떻게 해결할 수 있을까요?
How can we address this problem?

이 문제를 해결하려면 다음과 같은 몇 가지 전략을 조합해야 합니다.
Addressing this problem needs a combination of several strategies such as:

출판 관행과 관련하여—Naidu는 출판 편향 문제를 해결하기 위한 세 가지 전략을 권장하며 이를 '탈식민지적 프락시스'라고 부릅니다.

  • a) 행위자 변경—소외 작가에게 주요 저널에 게재할 수 있는 기회를 제공함으로써,
  • b) 연구의 권력 이동—서양 프레임워크에 포함되어 있지 않은 맥락과 관련된 비전통적인 연구에 자금을 지원함으로써, 그리고
  • c) 과학/연구의 질에 대한 지배적인 글쓰기 구조와 고정된 개념 해체[9].

Related to publications practices—Naidu recommends a three-pronged strategy to address the issue of publication bias and calls it ‘decolonial praxis’:

  • a) Changing the actors—By providing marginalized authors the opportunities to publish in major journals,
  • b) Shifting the power in research—By funding context-relevant unconventional research, which is not embedded in Western frameworks, and
  • c) Dismantling the predominant writing structures and fixed notions of the quality of science/research [9].

나로서는 이 문제를 해결하고 글로벌 사우스 출신의 한 저자가 제안한 의학 교육 출판 관행과 지식 생성에 평등을 가져오기 위한 그러한 이니셔티브를 환영할 것이다.

I, for one, would welcome such initiatives to tackle this problem and to bring equity in medical education publication practices and knowledge generation, the suggestion of which comes from an author from the Global South.

저널 편집 위원회와 관련하여저널 편집자는 주요 성과 지표 중 하나로 다양성 목표를 선택해야 합니다. 여기에는 지리적, 소득 수준 관련 다양성이 포함되어 있으며, 저자들이 출판하는 저작물뿐만 아니라 편집위원회에서도 마찬가지이다. 모든 저널은 출판 관행의 투명성을 위해 매년 출판물에 다양성에 대한 보고서를 발행해야 한다.
Related to journal editorial boards—Journal Editors must take up diversity targets as some of their key performance indicators. This includes geographic as well as income-level related diversity not only among the authors whose work they publish but also in their Editorial Boards. Every journal should publish a report on diversity in their publications annually, in the interest of transparency in publication practices.

글로벌 사우스(Global South)의 연구 및 출판 개선을 위한 특정 이니셔티브와 관련하여—국제 과학 및 정책 발전 네트워크(INASP)와 같은 국제 이니셔티브는 [10]에서 배울 수 있는 모범 사례로 간주할 수 있습니다. INASP는 모든 목소리를 포함하고 모든 인재를 육성함으로써 전 세계에 평등한 지식 생태계를 조성하기 위해 노력하고 있습니다. 그들은 [개인, 조직 및 시스템] 세 가지 수준에서 지원과 지침을 제공합니다.

  • 개인에 대한 지원은 포용적인 생산, 의사소통, 평가 및 지식의 사용을 포함한다.
  • 조직에 대한 지원은 비판적 사고, 학습 및 지식 생산을 위한 포용적인 환경을 개발하는 것을 포함한다.
  • 시스템에 대한 지원은 공동생산, 교육 및 학습에 관련성과 퀄리티 증거를 사용하는 것으로 구성된다[10].

우리는 글로벌 남방으로부터 중요한 연구 및 출판물 덩어리를 만들기 위해 INASP와 같은 더 많은 이니셔티브가 필요하다.
Related to specific initiatives for enhance research and publication from the Global South—International initiatives such as the International Network for Advancing Science and Policy (INASP) can be considered as best practices to learn from [10]. INASP strives to produce an equitable knowledge ecosystem in the world through including every voice and fostering every talent. They provide support and guidance at three levels: individual, organizational and systemic.

  • Individual support comprises inclusive production, communication, appraisal, and use of knowledge.
  • Organizational support comprises developing inclusive environments for critical thinking, learning and knowledge production.
  • Systemic support comprises coproduction, and using relevant and quality evidence in teaching and learning [10].

We need more initiatives such as INASP to create a critical mass of research and publications from the Global South.

이것은 우리의 유출을 고치기 위해 힘을 모으자는 요청입니다!

This is a call to join forces to fix our leaks!

 


Perspect Med Educ. 2022 Mar;11(2):70-72. doi: 10.1007/s40037-022-00700-4. Epub 2022 Mar 3.

The leaky pipeline of publications and knowledge generation in medical education

Affiliations collapse

Affiliations

1Amsterdam UMC, Research in Education, Faculty of Medicine, Vrije Universiteit, Amsterdam, The Netherlands. R.Kusurkar@amsterdamumc.nl.

2LEARN! research institute for learning and education. Faculty of Psychology and Education, VU University Amsterdam, Amsterdam, The Netherlands. R.Kusurkar@amsterdamumc.nl.

PMID: 35239162

PMCID: PMC8941050

DOI: 10.1007/s40037-022-00700-4

HPE에서 데이터 사이언스와 머신러닝의 역할: 실용적 적용, 이론적 기여, 인식론적 신념(Adv Health Sci Educ Theory Pract. 2020)
The role of data science and machine learning in Health Professions Education: practical applications, theoretical contributions, and epistemic beliefs 
Martin G. Tolsgaard1,2 · Christy K. Boscardin3 · Yoon Soo Park4,5 · Monica M. Cuddy6 · Stefanie S. Sebok‑Syer7

 

 

서론
Introduction

거의 10년 전, 제프 노먼은 왓슨의 상업적 성공을 사설화한 "의학자가 기계를 만난다"라는 제목의 글을 썼고, 왓슨은 인공지능(AI)이 미래에 의학에 어떻게 영향을 미칠 수 있는지를 보여주는 것이라고 주장했다(노먼 2011). 그 이후로 건강 전문 교육(HPE) 분야의 학자들이 증가하고 있으며, 데이터 과학 분야에 뿌리를 둔 AI가 교육, 학습 및 평가에 혁명을 일으킬 가능성을 선전하고 있다. 미국 통계 협회(van Dyk et al. 2015)에 따르면, [데이터 과학의 학제간 분야]는 다음을 활용하는 것을 목표로 한다. 

  • (1) 데이터에서 지식을 추출하기 위한 통계, 인공지능(AI), 머신러닝(ML) 등. 
  • (2) 데이터 구성, 관리 및 저장을 위한 데이터베이스 관리, 
  • (3) 복잡한 데이터 분석을 수행하는 데 필요한 계산 인프라를 제공하기 위한 시스템 엔지니어링. 

Almost a decade ago, Geoff Norman wrote a piece entitled, “Medicine man meets machine” where he editorialized the commercial success of Watson, arguing that Watson was a demonstration of how Artificial Intelligence (AI) may influence medicine in the future (Norman 2011). Since then, a growing body of scholarship in health professions education (HPE) has touted the potential for AI, rooted in the field of data science, to revolutionize instruction, learning, and assessment (Masters 2019; Chahine et al. 2018; Murdoch and Detsky 2013; Gruppen 2012). According to the American Statistical Association (van Dyk et al. 2015), the interdisciplinary field of data science aims to utilize:

  • (1) statistics, artificial intelligence (AI), and machine learning (ML) to extract knowledge from data,
  • (2) database management to organize, manage, and store data, and
  • (3) systems engineering to provide the computational infrastructure needed to conduct complex data analyses.

본 논문에서는 컴퓨터 알고리즘과 수학적 모델이 HPE의 맥락에서 데이터와 그 응용에 대한 이해를 어떻게 형성했는지 강조하기 위해 데이터 과학의 ML 측면(그림 1 참조)에 초점을 맞춘다. 우리가 HPE 연구 내에서 데이터 과학과 ML의 존재 증가를 예상함에 따라, 건강 과학 교육의 발전은 데이터 과학과 HPE의 교차 분야 내에서 지식 확산을 촉진하고 중요한 대화를 가능하게 하는 데 중요한 역할을 할 수 있다.

In this paper, we focus on the ML aspect of data science (see Fig. 1) to highlight how computer algorithms and mathematical models have shaped our understanding of data and its applications in the context of HPE. As we anticipate an increasing presence of data science and ML within HPE research, Advances in Health Sciences Education can play an important role in facilitating knowledge dissemination and enabling critical conversations within the intersecting fields of data science and HPE.

용어가 익숙하지 않을 수 있는 사람들을 위해, ML은 통계를 사용하여 기계가 특정 동작을 수행하도록 프로그래밍되지 않고 데이터를 기반으로 학습하고 적응적 예측을 할 수 있도록 하는 AI의 하위 집합이다(Thakur 2020). 많은 ML 접근 방식의 기본 원칙은 [기계의 데이터 해석 능력을 지속적으로 개선하는, 반복적이고 적응적인 알고리듬을 통해, 데이터 내의 패턴을 자동으로 찾는 것]이다. 딥 러닝(DL)은 신경망 또는 노드(뇌에서 뉴런이 작동하는 방식과 유사)를 사용하여 빅데이터를 활용하여 복잡한 문제를 이해하고 해결하는 ML 기술의 새로운 하위 집합이다(MIT 2020). 자연어 처리(NLP)는 많은 양의 언어 또는 텍스트 데이터를 처리하고 분석하는 데 사용되는 일반적인 DL 접근법이다.
For those who may be unfamiliar with the terms, ML is a subset of AI that uses statistics to enable machines to learn and make adaptive predictions based on data without being programmed to perform specific actions (Thakur 2020). The fundamental principle of many ML approaches is to automatically find patterns within data through iterative and adaptive algorithms that continuously refine the machine’s ability to interpret data. Deep learning (DL) is a newer subset of ML techniques that uses neural networks or nodes (similar to the way neurons work in the human brain) to leverage big data to understand and solve complex problems (MIT 2020). Natural language processing (NLP) is a common DL approach used to process and analyze large amounts of language or text data.

최근의 연구는 ML이 HPE를 개선하고 환자 관리를 개선할 수 있는 가능성을 보여주었다. 현재 검토 기사에서 Topol(2019)은 방사선사와 병리학자가 ML을 사용하여 의료 영상(예: 흉부 X선, 심전도, 피부 병변, 망막 영상)을 진단하는 전문가 수준의 성능을 보여주는 방법을 강조했다. 예를 들어, Haensle et al.(2018)은 알려진 결과를 가진 24,000개의 피부 병변 이미지에 대해 훈련된 신경망이 흑색종 진단 시 민감도와 특이성 측면에서 대부분의 인간 피부과 의사보다 우수하다는 것을 입증했다. 또한, 의학에서 NLP의 적용에는 전자 건강 기록 및 임상 기록의 데이터를 사용하여 환자 정보를 효율적으로 분류하고 요약하는 음성 인식 및 감정 분석이 포함된다.

Recent research showcased the potential for ML to enhance HPE and improve patient care. In a current review article, Topol (2019) highlighted how radiologists and pathologists use ML to display expert-level performance in diagnosing medical images (e.g., chest X-rays, electrocardiograms, skin lesions, retinal images). For instance, Haenssle et al. (2018) demonstrated that a neural network trained on 24,000 skin lesion images with known outcomes outperformed most human dermatologists in terms of sensitivity and specificity when diagnosing melanomas. Furthermore, applications of NLP in medicine include speech recognition and sentiment analyses that use data from electronic health records and clinical notes to efficiently classify and summarize patient information (Koleck et al. 2019).

이러한 예에서 알 수 있듯이, 의료 분야의 ML은 주로 분류 및 예측 목적으로 사용되어 왔다. 어떤 사람들은 그것이 그것을 [서포트]하기보다는, 의사들이 하는 일을 [모방]하는 경향이 있다고 주장한다. ML 기술은 의사 성과를 대체하는 대신 개선하는 데 중점을 두기 때문에, [HPE에 상당한 가치를 추가할 수 있는 잠재력]을 가지고 있다. 일반적으로 ML은 보건 전문가의 교육, 학습 및 평가를 지원하기 위해 대량의 임상 및 교육 데이터를 자동화, 관리 및 결합하는 데 적합할 수 있다(Chan 및 Zary 2019).

As these examples suggest, ML in healthcare has been used primarily for classification and/or prediction purposes. Some argue that it tends to mimic the work being done by physicians rather than support it (Masters 2019). With a focus on improving physician performances as opposed to replacing them, ML techniques have the potential to add substantial value in HPE. In general, ML may be well-suited for automating, managing, and combining large amounts of clinical and educational data to support the instruction, learning, and assessment of health professionals (Chan and Zary 2019).

그러나 이 약속은 데이터 과학과 ML이 보건 분야의 연구와 실무에 미치는 장기적인 영향에 대한 우려가 커짐에 따라 완화될 수 있다. 교육 과학자들은 ML 기술이 HPE의 맥락적 뉘앙스를 인식하지 못할 수 있기 때문에 "복잡한 문제에 대한 포괄적인 해결책"으로 홍보하는 것을 경계했다. 일반 교육 문헌에서 제기된 한 가지 구체적인 우려는, 데이터 과학과 ML의 초기 적용은, 주로 [특정한 과학적 사고 방식에 뿌리를 둔 학문]인, [인지 심리학과 신경 과학]에서 비롯되었다는 것이다. 얼리 어답터로서, 이러한 특정 분야는 일반적으로 교육 및 특히 HPE 내에서 데이터 과학과 ML의 현재 사용을 알리는 이론적 입장과 인식론적 믿음에 과도하게 영향을 미쳤을 수 있다. 이러한 유형의 영역 영향은 HPE 연구에서 이러한 새로운 분석 접근법의 범위와 유용성을 제한할 수 있다.
This promise, however, may be tempered by growing concerns about the long-term impact of data science and ML on research and practice in the health professions (van der Niet and Bleakley 2020; Imran and Jawaid 2020; Wartman and Combs 2019). Education scientists have cautioned against promoting ML technology as an “all-encompassing answer to complex problems” as it might fail to recognize the contextual nuances of HPE (van der Niet and Bleakley, 2020). One specific concern raised in the general education literature is that early applications of data science and ML stemmed primarily from cognitive psychology and neuroscience, disciplines rooted in certain scientific ways of thinking (Williamson 2017). As early adopters, these specific disciplines may have unduly affected the theoretical positions and epistemic beliefs that inform the current use of data science and ML within education in general and HPE specifically. This type of domain influence has the potential to limit the scope and utility of these new analytic approaches in HPE research.

지난 10년간 데이터 과학과 ML의 발전은 교육 연구에서 [가설 검증에서 이론의 관련성과 사용에 대한 논의]를 이끌었다. 일부 학자들은 데이터 과학과 ML의 출현을 인간의 주관성과 편견의 영향 없이 데이터가 "스스로를 대변"할 수 있게 했다고 칭찬한다(Kitch 2014). 이러한 프레임워크는 교육에서 확립된 많은 전통적인 연구 관행에서 벗어난다. 전통적 연구 관행에서는 [이론의 사용]이 지식 생성을 위한 [가설 생성과 검증에 중심적인 역할]을 하기 때문이다. 교육 및 HPE에서 데이터 과학과 ML을 사용하는 이론 중심 접근법이 아직 충분히 구체화되지 않았지만(Kitch in 2014), [데이터 과학]은 [경험적 증거], [과학 이론], [계산 과학]에 합류하여 과학에서 네 번째 패러다임으로 언급되었다. 그러나 데이터 과학이 개념적으로나 운영적으로 과학적 패러다임으로서 어떻게 작동할지는 불분명하다. 이는 HPE에서 ML을 사용하는 경우에도 마찬가지입니다. 이러한 논의를 고려하여, 우리는 HPE 문헌 내에서 ML과 관련된 연구의 실제 적용, 이론적 기여 및 인식론적 믿음을 비판적으로 평가했다.

Advances in data science and ML over the past decade have led to discussions regarding the relevance and use of theory in hypothesis testing in educational research (Williamson 2017; Kitchin 2014). Some scholars praise the emergence of data science and ML for allowing data to “speak for itself” without the influence of human subjectivity and bias (Kitchin 2014). Such a framework strays from many traditional research practices established in education, where the use of theory takes a central role in hypothesis generation and testing for the purpose of knowledge generation (Laksov et al., 2017). Although a theory-driven approach to using data science and ML in education and HPE has not been sufficiently articulated yet (Kitchin 2014), data science has been referred to as the fourth paradigm in science, joining empirical evidence, scientific theory, and computational science (Hey et al. 2009). Yet, it is unclear how data science might operate as a scientific paradigm both conceptually and operationally. This is also true for the use of ML in HPE. In light of these discussions, we critically evaluated the practical applications, theoretical contributions, and epistemic beliefs of studies involving ML within the HPE literature.

방법들
Methods

연구설계
Study design

우리는 HPE 내에서 데이터 과학과 ML 연구를 분류하기 위해 비판적 검토 방법론(Grant and Booth 2009)을 사용했다. 우리는 실제 적용, 이론적 기여 및 인식론적 기반과 관련하여 선택된 연구의 속성을 비판적으로 평가했다. [비판적 검토]는 체계적인 검토를 위해 설계된 것은 아니지만, 우리의 목적과 잘 일치하는 문헌의 개념적 기여에 대한 평가를 지원하는 과정을 제공한다. 우리의 목적은 [HPE에서 데이터 과학 및 ML의 사용에 inform하는 핵심 또는 영향력 있는 작업의 개요를 제공하는 것]이다.

We employed critical review methodology (Grant and Booth 2009) to classify data science and ML research within HPE. We critically appraised attributes of selected studies with respect to their practical applications, theoretical contributions, and epistemic underpinnings. Although a critical review is not designed to systematically review a body of work, it offers a process that supports an evaluation of the conceptual contributions of the literature (Grant and Booth 2009), which aligns nicely with our purpose: to provide an overview of key or influential work that informs the use of data science and ML in HPE.

분류 과정을 안내하기 위해 Stokes의 프레임워크를 사용하여 각 연구 논문을 분류했다(Stokes 1997). [Stokes의 프레임워크]를 채택한 것은 연구자들이 HPE에서 데이터 과학과 ML을 활용하는 방식에 대한 분류를 기반으로 하는 공통 언어를 제공했다. 또한, 이 프레임워크는 비평적 렌즈를 사용하여 문헌을 탐구할 수 있게 해주었는데, 이는 일부 연구가 이론이나 개념적 프레임워크를 참조하는 방법과 이유를 설명하는 데 도움이 되었고, 다른 연구들은 그렇지 않았다.

To help guide our classification process, we used Stokes’ framework to categorize each research article (Stokes 1997). Employing Stokes’ framework provided a common language upon which to base our classifications of the ways that researchers utilized data science and ML in HPE. Furthermore, this framework allowed us to explore the literature with a critical lens, which helped explain how and why some studies referenced a theory or conceptual framework, while others did not.

Stokes의 프레임워크(Stokes 1997)는 [두 가지 차원]에 따라 연구를 검토한다. 

  • (1) 근원적 이해
  • (2) 실제 사용을 고려

그것은 네 가지 유형의 연구 결과를 낳는다. 

  • [이론적 이해]에 정보를 주기 위해서만 이루어지며, [실제적인 함의를 고려하지 않는 연구]를 '순수 기초 연구'라고 한다. 
  • [이론적 이해]뿐만 아니라 그러한 [작업의 활용을 고려]하는 연구를 "사용에 영감을 받은 기초 연구"라고 한다. 
  • 특정 과학 분야의 이론적 지식을 발전시키려 하지 않고, [오로지 실질적인 문제를 해결하거나 특정한 목표를 달성하]기 위해 행해지는 연구를 '순수 응용 연구'라고 한다. 
  • 마지막으로 [이론적 이해를 알리거나 실용화를 고려하지 않는 연구]는 '예측적, 탐색적, 평가적'으로 분류할 수 있다.

Stokes’ framework (Stokes 1997) examines research along two dimensions:

  • (1) quest for fundamental understanding and (2) consideration of practical use. 

It results in four types of research.

  • First, research that is done solely to inform theoretical understandings, but does not consider any practical implications, is labelled “Pure Basic Research.”
  • Research that seeks to further not only theoretical understanding, but also considers the applications of such work is called “Use-inspired Basic Research” and
  • research that is done solely to solve practical problems or achieve specific goals without attempting to advance theoretical knowledge in a particular scientific area is called “Pure Applied Research.”
  • Finally, research that does not seek to inform theoretical understandings or consider practical use can be classified as “Predictive, Exploratory, or Evaluative.”

검색 전략
Search strategy

우리는 주요 용어에 대해 Medline, Scopus, Eric, Web of Science, Google Scholar를 검색했습니다. 이 용어는 데이터 과학(데이터 과학, "인공지능", "딥 러닝", "빅 데이터 분석", "기계 학습", "자연 언어 처리", "신경 네트워크"), HPE(보건 전문 교육", "의학 교육", "시뮬레이션 기반 의료 교육", "학습 평가", "성과 평가", "컴포지트")와 관련이 있다.의학적 교육("Etentency-based medical dev 또한, 우리는 스노우볼 기법을 사용하여 주요 논문의 참조 목록을 검색했습니다. 주요 포함 기준은 본 논문에서 HPE 맥락에서 일부 데이터 과학 기술을 활용했다는 것이다. 우리는 다양한 실제 적용, 이론적 관점 및 인식론적 믿음을 강조하기 위해 독창적인 연구, 입장 논문, 사설 및 주석을 포함했다.
We searched Medline, Scopus, Eric, Web of Science, and Google Scholar for key terms. These terms related to data science (“data science”, “artificial intelligence”, “deep learning”, “big data analytics”, “machine learning”, “natural language processing”, “neural networks”) and HPE (“health professions education”, “medical education”, “simulation-based medical education”, “assessment of learning”, “assessment of performance,” “competency-based medical education”). In addition, we searched reference lists of key papers using a snowball technique. The main inclusion criterion was that the paper utilized some data science technique in an HPE context. We included original research, position papers, editorials, and commentaries to highlight a diversity of practical applications, theoretical perspectives, and epistemic beliefs.

검토 프로세스
Review process

모든 저자들은 선별된 논문들을 검토하고 토론하는데 기여했다. Stokes의 프레임워크에 따라 논문을 분류하기 위해, 우리는 연구의 명시된 목표, 결과의 프레임 및 토론의 초점을 기반으로 지식을 발전시키거나 실제 문제를 해결하거나 둘 다로 코딩했다. 우리는 2020년 4월 16일부터 2020년 7월 29일까지 매주 만나 새로운 주제에 대해 논의했습니다.
All authors contributed to reviewing and discussing selected papers. To categorize the papers according to Stokes’ framework, we coded them as either advancing knowledge, solving practical problems, or both based on the stated goals of the study, framing of the results, and focus of the discussion. We met weekly from April 16, 2020 to July 29, 2020 to discuss emerging themes.

결과.
Results

HPE 연구에서 데이터 과학 및 ML의 실용적 적용
Practical applications of data science and ML in HPE research

HPE에서 데이터 과학과 ML을 사용한 연구의 대부분은 [실제 문제]를 해결하는 것을 목표로 했으며, 이론적 이해를 증진시키기 위한 몇 가지 연구만 명시적으로 시작했다. 확인된 다수의 논문은 기술적 효율성을 입증한 "정당화" 연구 또는 [개념 증명]으로 분류될 수 있으며, 이는 "순수 응용 연구" 범주와 일치한다. 이것은 어떤 것이 어떻게, 누구를 위해, 왜 작동하는지에 대한 질문을 던지는 [명확화 연구]와 구별된다.

The majority of research using data science and ML in HPE aimed to solve practical problems, with only a few studies explicitly setting out to advance theoretical understanding. A large number of papers identified (Dias et al. 2019; Masters 2019; van der Niet and Bleakley 2020; Chan and Zary 2019; Topol 2019) could be classified as “justification” studies that demonstrated technological efficiency or a proof-of-concept (Cook et al. 2008), which coincides with the “Pure Applied Research” category. This is distinct from clarification research (Cook et al. 2008), which asks questions about how, for whom and why something works.

시뮬레이션 및 의료 영상과 같은 영역은 주로 성능 평가 자동화, 피드백 제공 및 환자 결과 예측을 위해 ML의 실용적인 응용 프로그램을 사용했다(표 1 참조). 많은 경우, 저자는 ML 접근 방식을 사용하는 이유로 기존 한계(예: 전문가 인간 평가자의 직접 관찰과 피드백에 의존하는 간헐적이고 무작위적인 작업장 기반 평가)를 해결할 수 있는 능력을 인용했다(Oquendo et al. 2018). 실제로, 여러 연구는 [평가자 기반 점수]를 [ML 기반 예측]으로 대체하여, 수술 기술 평가의 효율성을 향상시키기 위해 ML 알고리듬을 사용하는 방법을 설명했다. 예를 들어, 한 연구는 외과의사의 경험 수준을 사용하여 ML 알고리즘을 훈련시켜 서로 다른 수준의 수술 기술을 구별했습니다.

Areas such as simulation and medical imaging predominantly used practical applications of ML for automating performance assessment, providing feedback, and predicting patient outcomes (see Table 1). In many cases, authors cited the ability to address existing limitations (e.g., infrequent and haphazard workplace-based assessments that rely on direct observation and feedback by expert human raters) as the rationale for using a ML approach (Oquendo et al. 2018). Indeed, several studies described how ML algorithms could be used to improve the efficiency of assessing surgical skills by replacing rater-based scores with ML-based predictions (Winkler-Schwartz et al. 2019; Alonso-Silverio et al. 2018; Oquendo et al. 2018; Ismail Fawaz et al. 2019; Wang and Fey  2018; Uemura et al. 2018; Bissonnette et al. 2019; Khalid et al. 2020; Andrew et al. 2018). For example, one study used surgeons’ experience levels to train a ML algorithm to distinguish between different levels of operative skills (Uemura et al. 2018).

 

 

전통적인 교육 방법을 보강하는 지능형 튜터링 시스템(ITS)은 HPE 내에서 ML의 실용적인 유용성을 입증한 문헌의 또 다른 영역을 대표했다. 한 연구에서는 복통 임상사례 208건을 바탕으로 임상추리력을 높이는 이러닝 툴을 개발하기 위해 ML 기법을 사용하였다. 이 도구를 사용하여 학생들은 가상 환자와 상호작용하고 학습자가 요청한 특정 환자 정보를 기반으로 개인화된 피드백을 받았다(Khumrin et al. 2017). 또 다른 연구에서는 ML 기술을 사용하여 임상 데이터를 수집하고 실제 임상 환경을 시뮬레이션하는 마취에서 몰입적이고 대화형 가상 훈련 플랫폼을 만들었다. 마지막으로 ML 기반 평가의 타당성을 탐구하는 대다수의 연구는 교육적 프레임워크가 없거나 시대에 뒤떨어진 타당성 프레임워크를 사용했다(Dias et al. 일반적으로, 이 연구의 하위 집합은 평가와 교육 내에서 실질적인 교육 문제를 다루었지만, 교육 이론이나 인식론에 대한 제한된 고려나 참고를 제공했다.
Intelligent tutoring systems (ITS) augmenting traditional instruction methods represented another area in the literature that demonstrated the practical utility of ML within HPE. In one study, ML techniques were used to develop an e-learning tool that increased clinical reasoning skills based on 208 clinical cases of abdominal pain. Using this tool, students interacted with a virtual patient and received personalized feedback based on the specific patient information requested by the learner (Khumrin et al. 2017). In another study, ML techniques were employed to collect clinical data and create an immersive and interactive virtual training platform in anesthesia that simulated an authentic clinical environment (Cao et al. 2015). Lastly, the majority of studies exploring the validity of ML-based assessments, either used no educational framework or outdated validity frameworks (Dias et al. 2019). In general, this subset of studies addressed practical educational problems within assessment and instruction, but offered limited consideration or reference to educational theory or epistemology.

HPE 연구에서 데이터 과학과 ML의 이론적 기여
Theoretical contributions of data science and ML in HPE research

이번 심사를 위해 선정된 논문의 대다수가 '순수응용연구' 범주에 속하지만 모두 이론적이 없는 것은 아니었다. 통계이론, 계산이론, 방법론적 고려사항 측면에서 데이터 과학이론을 충분히 활용한 연구가 몇 개 있었는데, 이는 ML 모델을 선택하고 활용하는 방법을 안내하였다. 예를 들어, [설명 가능한 AI]의 개념은 모델이 특정 결과에 도달하는 방법이 불분명한 ML 연구에서 '블랙박스' 문제를 해결하기 위한 이론으로 도입되었다. 이러한 연구는 "사용에 영감을 받은 기초 연구" 범주에 속합니다.
Although the majority of papers selected for this review fall into the “Pure Applied Research” category, not all of them were atheoretical. There were a few studies with sufficient use of data science theory, in terms of statistical theory, computational theory, and methodological considerations, which guided how ML models were selected and utilized (Bisonette et al. 2019; Uemura et al. 2018; Wang and Fey 2018). For example, the concept of Explainable AI was introduced as a theory (Winkler-Schwartz et al. 2019) to address the ‘black box’ problem in ML research, where it is unclear how a model arrives at a certain result. These studies fell into the “Use-inspired Basic Research” category.

또한 역량 또는 성과 평가를 다루는 몇 개의 논문은 [이론이 데이터 분석 및 해석을 가이드하는 데 어떻게 사용되는지]를 보여주었다.

  • 특별수술팀 구성원 간의 사회적 유대가 환자 만족도에 어떤 영향을 미치는지 탐구하기 위한 연구에서, 앤더슨 외 연구진(2020)은 ML 분석을 사용하여 기존의 통계로는 불가능했을 몇 가지 이론 기반 가설을 탐구했다. 소셜 네트워크 이론을 기반으로, 저자들은 수술팀의 서로 다른 하위 그룹을 대표하는 노드로 구성된 네트워크를 사용하여 환자 만족도의 예측 변수로서 하위 팀 간의 정서적, 전문적, 개인적 유대를 해부했다.
  • 또 다른 연구에서, 기븐스 외 연구진(2017)은 가설 유도 코딩을 사용하고 의사의 성과에 대한 핵심 지표로 다중 소스 피드백을 기반으로 실행 가능한 통찰력을 수집하는 ML 알고리듬을 훈련시켰다. 이 두 연구에서, 저자들은 크고 복잡한 데이터 세트를 탐구하기 위해 이론 기반 접근 방식을 사용했다.
  • 마지막으로, ITS에 초점을 맞춘 연구는 이러한 시스템이 도메인 모델에 그러한 통찰력을 포함하도록 설계되었기 때문에 학습 이론의 중요성을 강조했다. 예를 들어, Crowley와 Medbedeva(2003)는 병리학 슬라이드의 분류를 평가하는 연구에서 자신의 도메인 모델의 설계를 알리기 위해 시각적 전문지식을 개발하기 위해 이론적 프레임워크인 통합 문제 해결 방법을 사용했다.

Additionally, a few papers dealing with assessment of competence or performance demonstrated how theory was used to guide data analysis and interpretation.

  • In a study aimed at exploring how social ties between members of ad hoc surgical teams influenced patient satisfaction, Andersen et al. (2020) used ML analytics to explore several theory-based hypotheses, which would not have been possible using traditional statistics. Building on social network theory, the authors dissected affective, professional, and personal ties between sub-teams as predictors of patient satisfaction using a network consisting of nodes representing different sub-groups of the surgical team.
  • In another study, Gibbons et al. (2017) used hypotheses-guided coding and trained a ML algorithm that gleaned actionable insights based on multi-source feedback as key indicators of physicians’ performance. In both of these studies, the authors used theory-based approaches to explore large and complex datasets.
  • Lastly, studies that focused on ITS stressed the importance of learning theory, as these systems were engineered to include such insights in their domain model. For example, Crowley and Medvedeva (2003) used a theoretical framework, the unified problem-solving method, for developing visual expertise to inform the design of their domain model in a study evaluating the classification of pathology slides.


위에서 예시한 바와 같이, 우리가 확인한 대부분의 연구는 "순수 응용 연구" 범주에 속하며, 몇 가지 예외는 "사용에 영감을 받은 기초 연구" 그룹에 속하는 것으로 분류되었다. 우리는 오로지 이론적 연구의 부족과 패턴 이해에만 초점을 맞춘 연구의 부족을 반영하여 "순수 기초 연구" 또는 "예측, 탐색적 또는 평가" 범주에서 0개의 연구를 분류했다.
As exemplified above, most of the studies we identified fell into the “Pure Applied Research” category, with a few exceptions classified as belonging in the “Use-inspired Basic Research” group. We classified zero studies in either the “Pure Basic Research” or “Predictive, Exploratory, or Evaluative” categories, reflecting a dearth of solely theoretical work and a lack of studies focused exclusively on understanding patterns.

데이터 과학 및 ML 기반 HPE 연구에 대한 인식론적 신념
Epistemic beliefs in data science and ML driven HPE research

HPE 문헌에서 교육 이론의 일반적인 부재는 데이터 과학과 ML이 역사적으로 등장한 분야를 반영할 수 있다. 여기에는 [이론 구축과 테스트]보다는 [실제 적용과 문제 해결에 중점]을 두는 경향이 있는 컴퓨터 과학, 통계 및 공학이 포함된다(Pea 2014). 같은 이유로, [교육 데이터 과학]기술자, 도구자, 기능주의자로 인식되어 왔다. 이러한 생각은 "과학적인 관점에서 학습을 정량화, 측정, 실행이 가능하고, 따라서 최적화가 가능하다고 보는 과학적 사고방식"라는 표현에서 잘 드러난다.

To some degree, the general absence of educational theory in HPE literature may reflect the disciplines from which data science and ML emerged historically (Pea 2014). These include computer science, statistics, and engineering which tend to focus on practical applications and problem solving rather than theory building and testing (Pea 2014). For the same reasons, educational data science has been perceived as technicist, instrumentalist, and functionalist (Kitchin 2014) as it reflects “a scientific style of thinking that views learning in scientific terms as quantifiable, measurable, actionable, and therefore optimizable” (Williamson 2017).

이러한 프레임으로, 일부 일반 교육 학자들은 데이터 과학과 ML에서 비롯된 새로운 [경험주의 인식론]의 출현은, [이론을 불필요하게 만들고, 지식 생산을 인간 편향의 영향으로부터 자유로운 상황으로 만들 수 있다]고 제안했다. 예를 들어, 앤더슨(2008)은 "과학은 모델, 통일된 이론, 또는 정말로 어떠한 기계론적 설명 없이도 진보할 수 있다"고 주장하면서 "이론의 종말"을 선언했다. HPE 연구에 대한 우리의 검토에서, 일부 학자들은 교육, 학습 및 평가를 진전시키기 위한 데이터 과학과 ML의 잠재적인 사용에 대해 논의할 때 유사한 인식론적 신념의 목소리를 냈다.

  • 예를 들어 쇼텐 외 연구진(2018)은 의사의 기술력 향상을 위한 ML의 잠재적 사용을 요약하고 다음과 같이 주장했다. "[...] 환자 수준의 관찰은, 기계 학습 알고리즘을 통해 데이터가 스스로 말할 수 있도록 함으로써, 고품질 또는 낮은 품질의 성능(효율 및 오류 회피)과 임상 결과를 예측하고 평가할 수 있는 수단을 제공합니다." 
  • Uemura et al(2018)의 또 다른 연구는 외과의사의 전문성 수준 분류를 위한 신경망의 사용을 조사했고 "분류 중 인간의 개입은 없었으며, 이는 이 결과가 객관적이고 양적으로 간주될 수 있음을 의미한다"고 강조했다.
  • 비슷한 맥락에서 솔트 외 연구진(2019)은 USMLE 2단계 임상 기술 점수를 평가하기 위해 NLP를 사용할 수 있는 방법을 연구했고 다음과 같이 진술했다. "잘 설계된 컴퓨터 기반 채점 시스템은 피로나 인간의 편견의 영향을 받지 않기 때문에 일관성, 객관성 및 효율성에 있어 인간의 판단보다 우수하다." 

따라서 일부 연구자의 경우 HPE에서 데이터 과학과 ML의 사용을 지원하는 가치 제안에서 [객관성에 대한 강조]와 [인간 편향이 없는 것]이 높은 우선 순위를 갖는 것으로 보였다.

With this framing, some general education scholars suggested that the emergence of a new empiricist epistemology stemming from data science and ML may render theory unnecessary and situate knowledge production as free from the influence of human bias (Kitchin 2014). For instance, Anderson (2008) proclaimed the “end of theory” arguing that “science can advance even without models, unified theories, or really any mechanistic explanation at all.” In our review of HPE research, some scholars voiced similar epistemic beliefs when discussing the potential uses of data science and ML for advancing instruction, learning, and assessment.

  • Shorten et al. (2018), for example, summarized potential uses of ML for improving physicians’ technical skills and argued that “by letting the data speak for themselves through a machine-learning algorithm, [...] patient level observations offer a means to predict and assess high- or low-quality performance (efficiency and error avoidance) and clinical outcome.”
  • Another study by Uemura et al. (2018) examined the use of neural networks for classification of surgeons’ expertise levels and highlighted that “there were no human interventions during classification, meaning that this result can be considered objective and quantitative.”
  • On a similar note, Salt et al. (2019) explored how NLP can be used to assess USMLE Step 2 Clinical Skills scores and stated that a “well-designed computer-based scoring system is superior to human judgment with respect to consistency, objectivity, and efficiency because it is not susceptible to the effects of fatigue or human biases.”

Hence, for some researchers, the emphasis on objectivity and perceived lack of human bias seemed to have high priority in the value proposition supporting the use of data science and ML in HPE.

[인간 편향의 감소를 통한 객관성 달성에 관한 이러한 인식론적 믿음]에 대해서나, [맥락의 역할]에 대해서 반대 의견이 없는 것은 아니다.

  • Salt et al(2019)에 대한 답변에서, Spadafore와 Monrad(2019)는 ML의 알고리듬이 본질적으로 훈련하기 위해 선택한 데이터 유형에 따라 편향되기 때문에 [점수 매김의 일관성]과 [객관성]을 동일시하는 개념에 대해 우려를 제기했다.
    • 솔트 외 연구진(2019)도 이것을 인정했지만, 그들은 다음과 같이 언급했다. "자동 채점 시스템은 이상적인 인간 평가자보다 우수할 수 없겠지만, 실제 일반적인 인간 평가자보다 사전 정의된 채점 기준을 따를 수는 있다." 
  • 여기에 더하여 지얼 외 연구진(2014)은 NLP 기반 점수가 신뢰성 측면에서 인간 평가자가 산출한 것과 같거나 그 이상이라고 강조했다. 그러나 그들은 또한 점수가 매겨지는 구조에 의미를 부여하고 시험의 비인간화를 피할 수 있는 방법을 제공하기 위해 [전문가의 판단을 통합할 필요]가 있다고 강조했다.
  • 엘라웨이(2014)는 "의학과 의학 교육의 기술은 [인간으로부터 벗어나는 것]으로 보여서는 안 된다. [인간이 되는 것]은 [기술을 사용하는 것]이다. "
    마지막으로, Bijker(1997)는 다음과 같이 말했다. "[하나는] 기술 아티팩트 또는 기술 시스템의 의미가 [기술 자체에 존재하는 것]으로 간주해서는 안 됩니다. 대신, 테크놀로지가 어떻게 형성되는지 연구하고, 사회적 상호 작용의 이질성 속에서 그 의미를 획득해야 한다."

These emerging epistemic beliefs around achievement of objectivity through reduction of human bias, and the role of context are not unopposed.

  • In a reply to Salt et al. (2019), Spadafore and Monrad (2019) raised concerns about the notion of equating consistency in scoring with objectivity, as algorithms in ML are inherently biased based on the type of data we choose to train them with.
    • Although this was acknowledged in a reply by Salt et al. (2019), they noted that “while an automated scoring system cannot be superior to the ideal human rater, it can be more adherent to predefined scoring rubrics than the typical human rater in practice”.
  • Adding to this, Gierl et al. (2014) emphasized that NLP-based scorings were equal to (or better than) those produced by human raters in terms of their reliability; however, they also stressed the need for incorporating expert judgments to provide meaning to the constructs being scored as well as a way to avoid dehumanization of examinations.
  • Another view offered by Ellaway (2014) argued that “technology in medicine and medical education should not be seen as a distraction or deviation from being human; to be human is to use technology”.
  • Finally, Bijker (1997) stated that, “[one] should never take the meaning of a technical artifact or technical system as residing in the technology itself. Instead, one must study how the technologies are shaped and acquire their meaning in the heterogeneity of social interactions.”

논의
Discussion

데이터 과학과 ML은 HPE 분야에서 점점 더 많이 사용되고 있으며, 이는 미래에 교육, 학습 및 평가에 혁명을 일으킬 가능성이 높다. 검토한 연구에서, 우리는 주로 [이론을 생성하거나 테스트하기]보다는 [실제 문제를 해결]하기 위해 데이터 과학과 ML을 사용하는 데 초점을 맞추고 있다는 것을 발견했다. [프로시져 기술을 평가]하거나 [한정된 속성을 가진 임상 시나리오를 가르치는 것]은 데이터 과학 및 ML 기술을 사용하여 해결할 수 있는 [잘 정의된 문제]의 일부 예이다. 이러한 유형의 성공적인 응용 프로그램을 염두에 두고, HPE의 비판자들은 기술자 및 도구주의 방식으로 데이터 과학과 ML을 사용하면 콘텐츠 전문가가 개발 및 실행 활동에 포함되지 않는 한 효과적인 교육, 학습 및 평가에 지장을 줄 수 있다고 주장한다. 데이터 과학은 특히 ML 영역에서 새로운 가능성을 제공하지만, HPE에서도 몇 가지 고유한 과제를 안고 있다. 예를 들어, HPE는 사회과학에 의해 많이 알려진 분야인 반면, 데이터 과학과 ML은 기초과학 전통에 뿌리를 두고 있다. 과학을 조사하는 이러한 뚜렷한 사고 패턴과 철학은 HPE 내에서 데이터 과학과 ML 연구를 가이드하는 근원적 인식론적 믿음뿐만 아니라 연구를 설계하고 결과를 해석하는 데 이론의 사용에 영향을 미친다.
Data science and ML are increasingly used within the field of HPE and this likely will revolutionize instruction, learning, and assessment in the future (Rowe 2019; Wartman and Combs 2018). In the studies reviewed, we primarily found a focus on using data science and ML to solve practical problems, rather than generating or testing theories. Assessing procedural skills and teaching clinical scenarios with finite attributes are some examples of well-defined problems that can be addressed using data science and ML techniques. With these types of successful applications in mind, criticisms in HPE argue that the use of data science and ML in a technicist and instrumentalist way may disrupt effective instruction, learning, and assessment unless content experts are included in development and execution activities (van der Niet and Bleakley 2020). While data science offers new possibilities, especially in the area of ML, it also bears some inherent challenges in HPE. For example, HPE is a field that is heavily informed by the social sciences, whereas data science and ML are rooted in basic science traditions. These distinct thought patterns and philosophies of examining science have implications for not only the underlying epistemic beliefs guiding data science and ML studies within HPE, but also the use of theory in designing studies and interpreting results.

HPE 연구는 종종 [학습]이란, [학습이 이루어지는 학습 또는 의료 기관의 사회적 상호작용 및 맥락과는 동떨어진], [배타적인 인지 과정]이 아니라는 것을 인정한다. 학습과 평가를 이유나 작동 방식을 고려하지 않고 작동하는 무언가에 대한 간단한 시연으로 줄이는 것은 기술적 해결책으로 이어질 수 있지만, 의미 있는 방법으로 지식을 발전시키지 못할 수 있다. 그럼에도 불구하고, HPE의 많은 데이터 과학과 ML 연구는 '데이터가 스스로 말할 수 있도록' 하는 그들의 요구에서 이러한 유형의 [이론적 불가지론theoretical agnosticism]을 보여주는 것으로 보였다. 이 접근법에는 [두 가지 문제]가 있다.

  • 첫째, [모델]에는 인간이 해야 할 선택과 판단이 항상 존재하기 때문에, 결코 가치가 없거나 인식론적 믿음에서 자유롭지 않다. 
  • 둘째, [기존의 어떤 신념과 이론적 렌즈]에 전혀 영향을 받지 않으면서, 자료에서 절대적인 진실이나 지식이 나타날 것이라는 견해는 오류이다. 

HPE research often acknowledges that learning is not exclusively a cognitive process, separate from the social interactions and context of learning or healthcare organizations where learning takes place (e.g., Berkhout et al. 2018). Reducing learning and assessments to simple demonstrations of something working, without consideration of why or how it works, can lead to technical solutions, but may not advance knowledge in meaningful ways. Nonetheless, a number of data science and ML studies in HPE appeared to exhibit this type of theoretical agnosticism in their calls for letting ‘data speak for themselves’. There are two problems with this approach.

  • First, models are never value-free or free from epistemic beliefs as there are always choices and judgments that need to be made by humans (Spadafore and Monrad 2019; Kitchin 2014; Diekmann and Peterson 2013; Norman 2011).
  • Second, the view that an absolute truth or knowledge will emerge from data without being influenced by any pre-existing beliefs and theoretical lenses is a fallacy.

명백히, 데이터를 해석하는 렌즈는 언제나 있다(Bordage 2009). 문제는 렌즈가 어느 정도까지 식별되고 인식되는가 하는 것이다. 개념적 프레임워크의 사용은 HPE의 연구에 대한 두 가지 관점을 체계화한 Albert et al(2007)에 의해 강조된 연구 범위에 따라 달라지는 것으로 보인다. 동료 과학자를 위한 [지식과 이론을 생성하려는 의도]인지, 아니면 [교육의 실질적인 문제를 해결하려는 의도]인지에 따라 생산자를 위한 생산(PP)과 사용자를 위한 생산(PU)이 달라진다. 이전의 사고방식은 사회과학자들이, 후자는 임상의들이 지배하고 있는 것으로 생각된다. 현재 데이터 과학 문헌은 본 검토에서 설명한 바와 같이 PU 관점(또는 "순수 적용 연구")을 지향하는 것으로 보인다.

Certainly, there is always a lens, through which data are interpreted (Bordage 2009); the question is to what extent is the lens identified and acknowledged. The use of conceptual frameworks seems to depend on the scope of studies as highlighted by Albert et al. (2007), who framed two perspectives on research in HPE: Production for Producers (PP) and Production for Users (PU) as depending on whether the authors intended to generate knowledge and theory for fellow scientists or to solve practical problems in education. The former way of thinking is thought to be dominated by social scientists and the latter by clinicians (Albert et al. 2007). The current data science literature seems oriented towards the PU perspective (or “Pure Applied Research”) as illustrated in this review.

[무이론적이면서, 응용에 초점을 둔 작업]을 과도하게 강조하는 것의 한 가지 특별한 문제는 '블랙박스' 문제이다. ML 알고리듬은 알고리듬이 문제를 어떻게 해결했는지에 대한 정보를 제공하지 않고, 크고 지저분한 데이터 세트의 새로운 솔루션과 정밀한 분류를 제공한다(Topol 2019). 이에 대한 이유 중 일부는 일반적으로 사용되는 많은 ML 기법을 지원하는 통계 모델을 구성하는 노드 계층의 복잡성 때문이다. 모델이 [특정 결론에 도달한 이유 또는 방법을 설명할 수 없는 것]은 데이터 과학과 ML 접근법의 결과를 해석하기 위해 [이론을 사용하려는 노력]을 더욱 복잡하게 만든다. 이 문제를 기술적 차원에서 다루기 위한 노력이 이루어지고 있지만, 개념적, 이론적 차원에서 ML 모델에서 통찰력을 얻는 방법을 배우기 위해서는 여전히 해야 할 일이 많다

One particular problem of a potential overemphasis on atheoretical, applied work is the ‘black box’ issue: ML algorithms provide novel solutions and precise classifications of large and messy data sets without providing any information about how the algorithm solved the problem (Topol 2019). Part of the reason for this is due to the complexity of the layers of nodes that make up the statistical model supporting many ML techniques commonly used. The inability to explain why or how a model arrived at a certain conclusion further complicates any efforts to use theory to interpret the results of data science and ML approaches. Efforts are being made to handle this problem on a technical level, but there is still much work to do to learn how to gain insights from ML models on a conceptual and theoretical level.

ML 결과를 학습자를 위한 실행 가능한 통찰력으로 변환하는 데 도움이 될 수 있는 기술적 솔루션의 유망한 예는 의료 이미지에서 '히트맵'을 사용하는 것이다. 히트 맵은 의료 이미지 분류에서 신경망에 특히 중요한 픽셀을 강조하기 위해 사용될 수 있으며, 이는 이미지가 원래대로 분류된 이유에 대한 통찰력을 제공할 수 있다. 피드백과 학습 목적에 유용한 것 외에도, 이러한 방법과 기술은 HPE 연구에 영향을 미칠 수 있으며, 과학자들은 방법이 효과가 있다는 것을 증명하는 것 보다 지시, 학습 및 평가를 위해 작동하는 이유를 설명하는 데 주로 관심이 있다. 이와 관련하여 통계 또는 계산 전문지식을 갖춘 HPE 학자들은 HPE 연구에서 데이터 과학과 ML의 미래 사용자들에게 맥락과 설명을 제공함으로써 번역자 역할을 할 수 있는 독특한 위치에 있다.

A promising example of technical solutions that can help translate ML findings to actionable insights for learners is the use of ‘heat maps’ in medical images (Miller and Brown 2019). Heat maps can be used to highlight the pixels that are particularly important for a neural network in the classification of medical images, which can provide insights into why images were classified as they were. Besides being useful for feedback and learning purposes, these methods and techniques may impact HPE research, where scientists are primarily concerned with explaining why methods work for instruction, learning, and/or assessment rather than merely demonstrating that they work. In this regard, HPE scholars with statistical or computational expertise are in unique positions to act as translators by providing context and explanation for future users of data science and ML in HPE research (Miller et al. 2017).

HPE에서 데이터 과학과 ML의 사용이 증가함에 따라, 더 많은 학제적 협력([데이터 과학자, 정량적 연구자 및 교육 과학자]들 사이)이 HPE에서 이론의 지속적인 발전을 보장하기 위해 필요할 수 있다. NLP의 유용성을 입증하는 연구는 학제간 접근법이 교육 이론, 질적 연구 방법, ML, 통계 및 데이터 분석을 결합하여 분야를 발전시키는 방법에 대한 몇 가지 예를 제공한다. 그러나 교육 과학자와 데이터 과학자의 긴밀한 파트너십은 (다른 전통, 가치, 그리고 다른 것들 사이에서 연구를 할 수 있는 동기 부여로 인해) 어려울 수 있다는 점에 유의해야 한다. 그럼에도 불구하고 향후 HPE에서의 데이터 과학 연구가 이론과 실제의 발전에 모두 관련될 수 있다면 협업이 중요할 것이다. 
With an increased use of data science and ML in HPE, a more interdisciplinary collaboration among data scientists, quantitative researchers, and education scientists may be necessary to broaden the potential applications and ensure the continued advancement of theory in HPE. Studies demonstrating the utility of NLP (Burstein et al. 2014; Gierl et al. 2014; Baker 2010) offer some examples of how interdisciplinary approaches can bring together educational theory, qualitative research methods, ML, statistics, and data analytics to advance the field. However, it is important to note that close partnerships between education scientists and data scientists may be difficult due to different traditions, values, and incentives to do research among other things. Nonetheless, collaboration will be crucial if data science research in HPE in the future is going to be relevant to the advancement of both theory and practice.

이와 관련하여, 우리는 HPE 연구의 다른 영역에서 개발된 성공적인 [기존 학제간 파트너십] 중 일부에 주의를 돌릴 수 있다. 협력 관계의 유일한 유형은 아니지만, 데이터 엔지니어, 사회 과학자 및 임상 연구자가 함께 작업하여 실제 문제를 해결하고 이론에 기반을 둔 사용자 영감을 받은 연구를 생성하는 [학술-산업 협력]에서 한 가지 형태의 협업을 찾을 수 있습니다. [산업계]가 [재정 및 기술 자원]을 가지고 있을 수 있지만, [도메인 지식과 전문성]은 교육 과학자와 학자들이 가지고 있으며, 이는 파트너십과 협업을 개발하는 것이 향후 HPE 연구 내에서 데이터 과학과 ML을 성공적으로 통합하는 가장 중요한 예측 변수 중 하나가 될 수 있음을 의미한다.

In this regard, we may turn our attention to some of the successful existing interdisciplinary partnerships developed in other areas of HPE research. Although not the only type of partnership arrangement, one form of collaboration can be found within academic–industry partnerships, where data engineers, social scientists and clinician researchers, for example, work together to produce user-inspired research that solves a practical problem and is grounded in theory. Although industry may have the financial and technological resources, domain knowledge and expertise reside with education scientists and scholars, which means developing partnerships and collaborations may be one of the most important predictors of successfully integrating data science and ML within HPE research in the years to come.

이 저널의 25주년은 데이터 과학과 ML이 어떻게 HPE 분야에서 우리의 실천을 발전시키고 우리의 생각을 인도해 왔는지를 되돌아볼 수 있는 완벽한 시기인 것 같다. Norman과 Ellaway(2020)에 따르면, 건강 과학 교육의 진보는 여러 직업에 걸쳐 존재하는 시급한 교육 문제를 해결하고자 하는 열망에서 태어났다. 우리는 데이터가 가치 있는 상품인 HPE의 중추적인 지점에 있으며 우리 중 많은 사람들이 여전히 그것의 통화를 파악하고 있다. 혁신에 직면하여 과학적 탐구의 엄격함을 유지하기 위해, 데이터 과학 및 ML 접근 방식은 다른 접근 방식과 마찬가지로 존재론적 및 인식론적 가정의 맥락에서 검토될 필요가 있다. 우리가 다른 분야의 가치를 활용하고 보건 분야에서 이론과 실습을 계속 홍보하고 싶다면, 우리는 과학적 접근 방식을 확장하고 HPE 내에서 데이터 과학과 ML의 실용, 이론적, 인식론적 기여에 대한 담론을 계속해야 한다.

The 25th anniversary of this journal seems like a perfect time to reflect upon how data science and ML has evolved within the field of HPE to advance our practice and guide our thinking. According to Norman and Ellaway (2020), Advances in Health Sciences Education was born out of a desire to address pressing educational issues that exist across multiple professions. We are at a pivotal point in HPE where data is a valued commodity and many of us are still figuring out its currency. To retain rigor of scientific inquiry in the face of innovations, data science and ML approaches need to be reviewed in the context of their ontological and epistemological assumptions, just like any other approach. If we want to capitalize on the value of other disciplines, and continue to promote both theory and practice in the health professions, we need to expand our scientific approach and continue the discourse around the practical, theoretical, and epistemological contributions of data science and ML within HPE.


 

Adv Health Sci Educ Theory Pract. 2020 Dec;25(5):1057-1086. doi: 10.1007/s10459-020-10009-8. Epub 2020 Nov 3.

The role of data science and machine learning in Health Professions Education: practical applications, theoretical contributions, and epistemic beliefs

Affiliations collapse

Affiliations

1Copenhagen Academy for Medical Education and Simulation (CAMES), Rigshospitalet, Copenhagen, Denmark. martintolsgaard@gmail.com.

2Department of Obstetrics, Centre for Fetal Medicine, Copenhagen University Hospital Rigshospitalet, Copenhagen, Denmark. martintolsgaard@gmail.com.

3Department of Medicine, Department of Anesthesia, University of California San Francisco, San Francisco, CA, USA.

4Massachusetts General Hospital, Boston, MA, USA.

5Harvard Medical School, Boston, MA, USA.

6National Board of Medical Examiners, Philadelphia, PA, USA.

7Department of Emergency Medicine, Stanford University School of Medicine, Stanford University, Palo Alto, CA, USA.

PMID: 33141345

DOI: 10.1007/s10459-020-10009-8

Abstract

Data science is an inter-disciplinary field that uses computer-based algorithms and methods to gain insights from large and often complex datasets. Data science, which includes Artificial Intelligence techniques such as Machine Learning (ML), has been credited with the promise to transform Health Professions Education (HPE) by offering approaches to handle big (and often messy) data. To examine this promise, we conducted a critical review to explore: (1) published applications of data science and ML in HPE literature and (2) the potential role of data science and ML in shifting theoretical and epistemological perspectives in HPE research and practice. Existing data science studies in HPE are often not informed by theory, but rather oriented towards developing applications for specific problems, uses, and contexts. The most common areas currently being studied are procedural (e.g., computer-based tutoring or adaptive systems and assessment of technical skills). We found that epistemic beliefs informing the use of data science and ML in HPE poses a challenge for existing views on what constitutes objective knowledge and the role of human subjectivity for instruction and assessment. As a result, criticisms have emerged that the integration of data science in the field of HPE is in danger of becoming technically driven and narrowly focused in its approach to teaching, learning and assessment. Our findings suggest that researchers tend to formalize around the epistemological stance driven largely by traditions of a research paradigm. Future data science studies in HPE need to involve both education scientists and data scientists to ensure mutual advancements in the development of educational theory and practical applications. This may be one of the most important tasks in the integration of data science and ML in HPE research in the years to come.

Keywords: Artificial intelligence; Machine learning; Medical education research; Research in Health Professions Education; data science.

 

의대생들에게 어떻게 가르치는지를 가르치기: 스코핑 리뷰(Teach Learn Med. 2022)
Teaching Medical Students How to Teach: A Scoping Review
Holly S. Meyera , Kelsey Larsenb, Anita Samuela , Holly Berkleyc, Morgan Harveyd , Candace Nortone and Lauren A. Maggioa 

 

 

현상
Phenomenon

의사로서의 숙련도는 환자를 가르치고, 훈련생을 가르치고, 동료들을 가르치는 것을 필요로 한다. 이러한 필요를 충족시키기 위해, 많은 의과대학들은 의대생들의 교사 자격 프로그램을 제공한다. MSAT 프로그램은 의과대학에서 니어피어neer-peer 튜터링과 가르침을 통해 그들이 임상 실습에 도달했을 때 이 중요한 역할을 맡을 수 있는 지식, 기술 및 태도를 의대 학생들이 준비하도록 돕는다. 소수의 리뷰 또는 여러 기관 연구는 교육자들이 그러한 프로그램을 알릴 수 있는 증거를 제공하는 이러한 이니셔티브에 대한 문헌을 종합했다. 그러나 이러한 원고는 가치가 있지만 특정 국가 또는 출판 유형(예: 개입을 특징으로 하는 기사)에 초점을 맞춘 범위가 좁다. 우리가 아는 한, MSAT 프로그램에 대한 체계적인 검토, 경험적 연구, 논평 및 서술적 연구를 포함하는 풍부하고 성장하는 문학 본체의 전체적인 합성은 없다. 이것은 이 주제에 대해 널리 알려진 것을 실천으로 옮기려는 교육자들에게 불리할 수 있는 격차를 나타낸다. MSAT 프로그램을 시작하거나 운영하는 교육자는 이 검토 없이 시대에 뒤떨어지고 대조되지 않은 증거를 구현할 위험이 있습니다. 따라서 본 범위 검토는 모든 출판 유형을 고려하여 현재 문헌을 매핑하여 교육자, 연구자 및 의료 전문가에게 문헌의 전체적 합성을 제공하는 것을 목표로 한다.
Proficiency as a physician requires teaching: teaching patients, teaching trainees, and teaching colleagues.1 To meet this need, many medical schools offer medical students’ as teachers (MSAT) programs. MSAT programs help prepare medical students with the knowledge, skills, and attitudes to take on this critical role through near-peer tutoring and teaching in medical school and when they reach clinical practice. A small number of reviews or multi-institutional studies have synthesized the literature on these initiatives providing educators with evidence to inform such programs.2–4 However, while valuable, these manuscripts are narrow in scope focusing on a specific country2 or publication type (e.g., articles featuring interventions).3 To our knowledge, there is no holistic synthesis of the rich and growing body of literature that includes systematic reviews, empirical research, commentaries, and descriptive studies on MSAT programs. This indicates a gap that may disadvantage educators seeking to translate what is broadly known about this topic into practice. Educators starting or running an MSAT program risk implementing outdated and uncollated evidence without this review. Thus, this scoping review aims to map the current literature, taking into consideration all publication types, to provide educators, researchers, and medical professionals with a holistic synthesis of the literature.

많은 의과대학들이 MSAT 프로그램을 교과과정에 통합했다. 이 프로그램들은 전달 방식이 다양하지만 [의대생들의 교육 역량을 향상시킨다]는 공통의 목표를 가지고 있다. 전달은 피어 또는 니어피어 튜터링 프로그램, 워크샵 또는 종방향 교육 과정, 그리고 지역사회 서비스 교육(예: 고등학생에게 보건 교육을 가르치거나 개발도상국의 지역사회 구성원을 가르치는 것)과 같은 다른 다양한 접근 방식을 포함한 여러 가지 형태를 취한다. 프로그램은 다양한 교수법 활용, 평가 개발, 프로그램 평가 참여, 커리큘럼 작성, 목표 제작 등 의대 학생들의 능력 개발을 돕기 위해 다양한 교수 지식과 기술을 우선시합니다.
Many medical schools have integrated an MSAT program into their curriculum.5 These programs vary in delivery but share a common goal: to improve the medical students’ teaching competency. Delivery takes several forms including

  • peer or near-peer tutoring programs,6–11 
  • workshops or longitudinal teaching courses,12–19 
  • other varied approaches such as community service teaching (e.g., teaching health education to high school students or teaching community members of a developing country).20,21 

Programs prioritize a variety of teaching knowledge and skills to help develop medical students’ abilities including utilizing varied teaching methods, developing assessments, engaging in program evaluation, creating curriculum, and crafting objectives.

새로운 프로그램의 성장을 촉진하고 기존 프로그램에 대한 실습에 대한 공유 지식을 제공하기 위해 의대생들에게 가르치는 방법에 대한 문헌 검토가 필요하다. MSAT 또는 니어피어 튜터링 프로그램은 [교수 역량 향상]과 [가르침teaching이 의사의 중심 업무임을 인식하게 함]을 포함한 다양한 혜택과 관련이 있다. 그 프로그램들은 가르치는 법을 배우는 사람들과 의대생-선생님이 가르치는 사람들- 의대생들에게 모두 혜택을 준다. 의료계 종사자들에게, 교육에 대한 노출은 평생의 교육 문화, 강화된 의사소통 기술을 통한 환자 치료 개선, 그리고 교육자 역할에 더 잘 준비된 노동력으로 이어질 수 있다. 기관은 교직원이 채우지 못하는 교육과정 내 격차를 해소하는 등 교직원의 교육부담 완화를 도모할 수 있다1. 의대생들의 경우, 교수 기술 훈련을 받는 사람들은 

  • (1) 더 자립적이고 지략이 풍부하고 
  • (2) 개인적으로나 직업적으로 성장하고 성숙하다. 
  • (3) 교육 전략을 습득한다.
  • (4) 지속적인 노출과 자료 참여를 통해 학문적으로 이익을 얻는다. 
  • (5) GMC에서 정한 교육자 요건을 충족시키다. 

 

A review of the literature on teaching medical students how to teach is necessary to facilitate the growth of new programs and to provide a shared knowledge of practices for existing programs. MSAT or near-peer tutoring programs have been associated with a variety of benefits including improved teaching competency and identification of teaching as a central task of physicians.22 The programs benefit the medical profession, institutions, and medical students - both those learning to teach and those taught by the medical student-teacher. For the medical profession, exposure to teaching could lead to a lifelong culture of teaching,23 improved patient care through enhanced communication skills,3 and a workforce better prepared for educator roles.3 Institutions may benefit from alleviating the teaching burden of faculty members1 including closing gaps within the curriculum that faculty members are unable to fill.24 For medical students, those who receive training in teaching skills are

  • (1) more self-reliant and resourceful,1 
  • (2) grow and mature personally and professionally,25 
  • (3) acquire teaching strategies,3 
  • (4) benefit academically through continual exposure and engagement with material,2 and
  • (5) fulfill educator requirements established by the General Medical Council.26–28 

교육 프로그램의 필요성은

  • [의료 면허 규정에 따른 요구 사항],
  • ["온더잡" 훈련 이상의 교육 기술에 대한 추가 지원],
  • [동료 튜터링 프로그램에서 튜터를 양성해야 하는 확인된 필요성]

..등 여러 가지 출처에서 비롯된다. 그러므로, 의대생들에게 가르치는 것의 이점은 의대생들에게 가르치는 기술을 구축하는 것 이상으로 확장된다.

The need for teaching programs stems from several sources, including

  • requirements according to the medical licensure regulations,29 
  • additional support of teaching skills beyond “on the job” training,30 
  • and the identified need to train tutors in peer tutoring programs.2 

Benefits of teaching medical students to teach, therefore, extend beyond building medical student teaching skills.

MSAT 프로그램에 대한 문헌은 빠르게 성장하고 있다. 그러나, 지적한 바와 같이, 이전의 검토들은 이 주제에 다소 좁게 접근했다. 예를 들어, Marton 등은 동료 교수, 교수 워크숍 및 아웃리치 프로그램에 초점을 맞춘 20개의 연구를 기술한 리뷰를 발표했다. Marton 등은 보다 객관적인 이니셔티브의 조치가 필요하다는 점을 유의하면서 다양한 프로그램을 통해 의대생들의 교육능력이 주관적으로 향상되었음을 확인하였다. 가치가 있지만 2013년까지의 연구를 포함한 이 연구는 대규모 조사 연구, 문헌 검토, 델파이 연구와 같은 더 최근의 문헌 및 비간섭 연구를 제외했다. 델파이 연구는 MSAT 프로그램이 다룰 수 있는 매우 다양한 주제를 우선시하는 데 도움이 되는 프레임워크를 설명한다. 우리는 이러한 연구가 무엇보다도 의학 교육자들에게 이 주제에 대한 문헌에 대한 포괄적이고 전체적인 이해를 제공하는 데 중요하다고 주장한다.

The literature on MSAT programs is growing rapidly. However, as noted, previous reviews have somewhat narrowly approached the topic. For example, Marton et al.4 published a review that described 20 studies focused on peer teaching, teaching workshops, and outreach programs. Marton et al. found that medical student’s teaching skills subjectively improved through a variety of programs with the caveat that more objective measures of the initiatives are needed. While valuable, this work which included studies until 2013 excluded more recent literature and nonintervention studies such as a large survey study,2 literature reviews,3,4 and a Delphi study.5 The Delphi study describes a helpful framework for prioritizing the large variety of topics that MSAT programs can cover.5 We contend that these studies, among others, are critical in providing medical educators with a comprehensive and holistic understanding of the literature on this topic.

본 연구는 MSAT 프로그램을 시작하는 이유, 이점과 장벽, 누가 가르치고 어떤 내용을 가르치는지를 설명하는 것을 목적으로 한다. 이를 위해, 우리는 개입을 넘어 개입, 검토 및 주석과 같은 보다 포괄적인 범위의 출판물을 포함하도록 확장함으로써 MSAT 프로그램의 적용 범위를 넓힐 계획이다. 이전 연구의 연장선상에서, 우리는 또한 Marton 등의 작업을 구축하고 교수 개입이 효과를 극대화하기 위한 프로그램에 필수적인 실질적인 수업을 만드는 데 초점을 맞췄다.
This study aims to describe why MSAT programs are started, the benefits and barriers, who teaches them, and what content is taught. To this end, we intend to broaden the scope of coverage of MSAT programs by extending beyond interventions to include a more comprehensive range of publications: interventions, reviews, and commentaries. As an extension of earlier works, we also focused on building off of Marton et al.’s work and creating practical lessons that are essential for programs to ensure teaching interventions maximize effectiveness.

접근
Approach

우리는 Arcsey와 O'Malley의 5단계 프레임워크에 따라 스코핑 리뷰를 수행했다. 우리는 연구의 격차를 파악하고 향후 연구와 적용에 대한 정보를 제공하기 위해 이 방법론을 선택했다. 우리의 설계에서, 우리는 다른 지식 합성 유형(예: 체계적인 검토)을 고려했다. 그러나, 문헌의 이질성과 급속한 성장으로 인해, 그리고 프로그램 평가 메커니즘과 관련된 Marton et al.4의 요청에 응답하기 위해, 우리는 스코핑 리뷰가 가장 적절하다고 판단했다. 이 범위 검토는 Marton 등을 기반으로 작성되었습니다. 1990년부터 2013년까지 출판물을 검토했으며 2014년부터 2020년까지의 기사를 포함했다. 이 범위조사의 두 번째 목적은 향후 체계적 검토의 적절성을 결정하는 것이었다.
We conducted a scoping review guided by Arksey and O’Malley’s five-stage framework.31 We selected this methodology to identify gaps in the research and make suggestions to inform future research and application.31 In our design, we considered other knowledge synthesis types (e.g., a systematic review). However, due to the heterogeneity and rapid growth of the literature, and to answer the call from Marton et al.4 regarding program evaluation mechanisms, we determined that a scoping review was most appropriate. This scoping review was built on Marton et al. (which reviewed publications from 1990 to 2013) and included articles from 2014 to 2020. A secondary aim of this scoping study was to determine the appropriateness of a future systematic review.

1단계: 연구 질문 식별
Stage 1: Identifying the research question

저자팀에는 의학교육(AS, HM, KL), 지식합성(LM), 정보과학(CN)에 대한 전문지식을 갖춘 회원들이 포함됐다. 이해관계자의 관점을 통합하기 위해, 우리는 MSAT 프로그램 개발과 구현을 도운 의대 졸업생인 MH와 HB를 모집했다. 집합적으로, 우리는 "의학 학생들이 가르칠 수 있도록 훈련하기 위해 고안된 의과대학 이니셔티브에 대한 문헌의 현재 스코프는 무엇인가?"라는 광범위한 연구 질문을 개발했다.

The author team included members with expertise in medical education (AS, HM, and KL), knowledge syntheses (LM), and information science (CN). To incorporate stakeholder views, we recruited MH and HB, both recent medical school graduates who helped develop and implement an MSAT program. Collectively, we developed a broad research question, “what is the current scope of the literature on medical school initiatives designed to train medical students to teach?”

2단계: 관련 기사 식별
Stage 2: Identifying relevant articles

HM과 CN은 공동으로 검색 전략을 개발했다. 원래 2019년 9월 17일에 검색한 후 2021년 2월 1일에 재방송하여 새로운 문헌을 식별하였다. 우리는 PubMed, Embase, ERIC, Web of Science, PsycINFO를 검색했습니다. 전체 검색 전략은 부록 1(온라인 부록 참조)을 참조하십시오. 우리는 또한 당과 마조가 제안한 바와 같이 관련 커리큘럼 자료의 캡처를 보장하기 위해 MedEdPORTAL 웹사이트를 직접 검색했다.32 검색어에는 다음과 같은 키워드와 각 데이터베이스에 최적화된 제어된 어휘가 포함되어 있습니다: 학생, 의대생, 의대생, 의대생, 의대교사, 교수역할, 미시교습, 교사교습, 동료교습, 근친교습. 모든 출판 유형(예: 편지, 주석, 리뷰)을 포함시켜 문헌을 완전히 탐색하고 이전 리뷰를 넘어 적용 범위를 확장했다. 포함된 모든 기사의 인용문은 추가 관련 기사를 위해 손으로 검색되었다. 인용은 중복 제거를 포함하여 EndNote에서 관리되었습니다.
HM and CN collaboratively developed the search strategy. A search was originally conducted on September 17, 2019 and then rerun on February 1, 2021 to identify new literature. We searched PubMed, Embase, ERIC, Web of Science, and PsycINFO. See Appendix 1 (see online supplement) for complete search strategies. We also hand-searched the MedEdPORTAL website to ensure the capture of relevant curricular materials, as suggested by Dang and Maggio.32 Search terms included a combination of keywords and controlled vocabulary terms optimized for each database, including, but not limited to: students-as-teachers, medical students, medical education, medical teachers, teaching role, microteaching, teaching the teacher, peer teaching, and near peer teaching. We included all publication types (e.g., letters, commentaries, reviews) to fully explore the literature and expand our coverage beyond earlier reviews.32 Citations of all included articles were hand-searched for additional relevant articles. Citations were managed in EndNote, including duplicate removal.

1990년에서 2013년 사이에 발표된 기사를 포함한 Marton 등의 4개 리뷰를 연장하고자 했기 때문에 의대생을 포함하지 않았거나, 영어로 작성되지 않은 논문는 제외했다. 검색은 2014년 이후에 출판된 기사로 제한되었다. 또한 튜터를 위한 교육학적 훈련이 없는 동료 튜터링에 초점을 맞춘 기사 및 가르침과 직접적인 관련이 없는 전문 기술(예: 커뮤니케이션, 리더십, 피드백)에 초점을 맞춘 기사는 제외했다. 마지막으로, 여러 출판물에 대한 개입을 위해, 우리는 더 최근의 출판물에 의해 대체된 결과가 있는 연구를 제외했다.

As we intended to extend Marton et al.’s4 review, which included articles published between 1990 and 2013, we excluded articles, not including medical students and not written in English. Retrieval was limited to articles published in or after 2014. Additionally, we excluded articles focused on peer tutoring without pedagogical training for tutors and those that focused on professional skills (e.g., communication, leadership, feedback) without a direct connection to teaching. Lastly, for interventions with multiple publications, we excluded studies with results that were superseded by those of a more recent publication.

3단계: 연구 선택
Stage 3: Study selection

우리는 검색된 인용문과 연구 질문 사이의 정렬을 결정하기 위해 2단계 프로세스를 사용했다. 이 반복 프로세스는 체계적인 검토 프로그램인 코비던스에서 관리되었다. HM과 KL은 독립적으로 처음 20개의 제목과 초록을 검토했다. 우리는 우리의 결과를 규범화하고 우리의 포함 및 제외 기준을 개선했다. 초기 정렬에 도달한 후, 우리는 각각 독립적으로 나머지 모든 기록을 검토했다. 우리는 모든 인용에 대한 합의에 도달할 때까지 불일치(모든 제목 요약의 약 5%)를 검토했다.

We used a two-phase process to determine the alignment between the retrieved citations and the research question. This iterative process was managed in Covidence, a systematic review program. HM and KL independently reviewed the first 20 titles and abstracts. We normed on our results and refined our inclusion and exclusion criteria. After initial alignment was reached, we each independently reviewed all remaining records. We reviewed any discrepancies (approximately 5% of all title abstracts) until we reached a consensus on all citations.

4단계: 데이터 차트 작성
Stage 4: Data charting

저자 팀은 데이터 차트 작성 도구를 공동으로 개발했다. 먼저 HM은 구글 형태로 데이터 차트 작성 도구를 개발했다. 모든 저자는 식별된 세 가지 유형의 출판물 그룹(예: 개입), 합성 및 주석)을 나타내는 동일한 세 가지 기사를 사용하여 데이터 차트 작성 도구를 독립적으로 시험했다. 그 후 우리는 결과를 검토하고 차트 작성 도구를 다듬기 위해 만났다. 나머지 기사들은 독립 검토를 위해 (KL, AS, CN, HB, MH) 간에 균등하게 나누어 모든 기사들은 최소 두 명의 저자에 의해 검토되었다. HM은 모든 기사를 검토했다. HM은 불일치를 검토하기 위해 각 공동 저자를 만났고, 모든 것은 합의로 해결되었다. 필요에 따라 LM은 타이브레이커 역할을 했다. 데이터 차트에는 교육 전략, 방법, 이점 및 장벽을 포함한 다양한 추출 범주가 포함되었다(전체 데이터 차트 작성 툴은 부록 2(온라인 부록 참조).

The author team collaboratively developed a data charting tool. First, HM developed the data charting tool in Google forms. All authors independently piloted the data charting tool using the same three articles that represented the three groups of publication types identified: original research (e.g., interventions), syntheses, and commentaries. We subsequently met to review the results and refine the charting tool. The remaining articles were divided equally between (KL, AS, CN, HB, and MH) for independent review such that all articles were reviewed by at least two authors. HM reviewed all the articles. HM met with each coauthor to review discrepancies; all were resolved by consensus. As needed, LM served as a tiebreaker. The data charting included a variety of extraction categories, including teaching strategies, methods, benefits, and barriers (See Appendix 2 (see online supplement) for the complete data charting tool).

5단계: 결과 분석, 요약 및 보고
Stage 5: Collating, summarizing, and reporting results

프로그램 결과를 보고하기 위한 미래 연구에 대한 Marton 등의 요구를 기반으로, 우리의 분석은 [프로그램 평가]와 [교육 방법]이라는 두 가지 영역에서 확립된 프레임워크와 개입 프로그램 결과를 정렬했다. HM은 추출된 프로그램 평가 방법을 커리큘럼 평가에 맞춘 Kirkpatrick의 프로그램 평가 모델의 수정 버전을 사용하여 분류하였다8(박스 1 참조). 프로그래밍 평가에 전문성을 가진 의학 교육자인 AS가 독립적으로 분류를 검토했고 LM은 필요에 따라 타이브레이커 역할을 했다.
Based on Marton’s et al. call for future studies to report program outcomes, our analysis aligned the intervention program outcomes with established frameworks in two areas: program evaluation and teaching methods. HM classified the extracted program evaluation methods using a modified version of Kirkpatrick’s program evaluation model33 that is tailored to curriculum evaluation8 (see Box 1). AS, a medical educator with expertise in programmatic evaluation, independently reviewed the categorization and LM served as a tiebreaker as necessary.

====

상자 1. 에를리히의 수정판 커크패트릭 커리큘럼 평가 피라미드.8

"레벨 4 결과. 교육 커리큘럼이 1학년 학생들의 성적에 어떤 방식으로 영향을 미쳤는가?

레벨 3 행동. 교육과정이 끝날 때 학생-교사가 더 유능했는가?

레벨 2 학습. 참가자들은 어떤 방식으로 교육의 기본 원리에 대한 학습을 입증했으며, 이러한 목표에 대해 어떤 방식으로 확신했습니까?

레벨 1 반응. 학생-교사는 그 경험에 대해 어떤 반응을 보였는가, 아니면 그 경험을 즐겼는가?

Box 1. Erlich’s modified version of Kirkpatrick pyramid of curriculum evaluation.8

“Level 4 Results. In what ways did the teaching curriculum impact the outcomes of the first-year students?

Level 3 Behavior. Were student-teachers more competent at the curriculum’s end?

Level 2 Learning. In what ways did participants demonstrate learning of the basic principles of teaching, and in what ways were they confident in these objectives?

Level 1 Reaction. How did student-teachers react to or enjoy the experience?”

====

교수법은 라나 등의 최근 델파이 연구에 기초하여 추출되고 우선 순위가 매겨졌다. 라나 등은 이 기간 동안 28명의 전문가가 MSAT 프로그램에서 의대생에게 가르치는 주제에 가치를 부여하고 틀을 만드는 델파이 연구를 진행했다. 데이터 도표에서, 우리는 Rana 등의 프레임워크를 우리의 연구에 적용함으로써 배운 내용을 범주 및 주제에 맞출 수 있는 이점을 보았다(표 4 참조). HM은 추출된 데이터에 프레임워크를 적용하고 두 명의 상주 의사인 HB와 MH에게 그녀의 노력을 제시했다. 그들은 그들의 관련 임상 경험에 비추어 프레임워크의 적용을 검토했다.
Teaching methods were extracted and prioritized based on a recent Delphi study by Rana et al.5 Rana et al. conducted a Delphi study during which 28 experts assigned value to the topics taught to medical students in MSAT programs and created a framework. In our data charting, we saw the benefits of applying Rana et al.’s5 framework to our study, which allowed us to align the content taught to the categories and topics (see Table 4). HM applied the framework to the extracted data and presented her efforts to HB and MH, two resident physicians. They reviewed the application of the framework in light of their related clinical experiences.

소견
Findings

우리의 검색 전략은 1,644개의 결과를 반환했고, 1,587개의 기사가 무관한 것으로 표시되었고, 57개의 기사가 전문 검토 대상으로 남았고, 27개의 기사가 포함되었습니다.1-19,34-40 포함된 기사를 시각화하기 위해 두 개의 그림이 포함되었습니다. 1) PRISMA 흐름도 그림 1 및 2) 포함된 기사의 특성 요약 그림 2. 2014년과 2020년 사이에 출판되었으며, 미국에서 가장 많이 출판된 9개국의 기관(n = 10, 39.1%), 5,6,8,9,13,15,17,19,36,38 영국(n = 5,34,39,40,42), 호주(n = 4,17.4%)를 대표한다.s 모래 동료 과외 프로그램, n = 20, 74.1%), 1,6-19, 35–39 리뷰/세션 합성(n = 3, 11.1%), 3,4,30 의견 조각(n = 3, 11.1%), 34,40,42 및 하나의 서술적 연구. (3.7%)5 표 1은 연구에 포함된 모든 논문의 개요를 제공한다.
Our search strategy returned 1,644 results, with 1,587 articles marked as irrelevant, leaving 57 articles for full-text review, and resulting in 27 included articles.1–19,34–40 Two figures have been included to visualize the articles included: 1) Figure 1 for a PRISMA flow diagram41 and 2) Figure 2 for a summary of the characteristics of included articles. Articles were published between 2014 and 2020 and represent institutions from nine countries with most published in the United States (n = 10, 39.1%),5,6,8,9,13,15,17,19,36,38 United Kingdom (n = 5, 13%),10,34,39,40,42 and Australia (n = 4, 17.4%).2,3,12,35 We identified four general publication types: intervention studies (e.g., teaching workshops and peer tutoring programs, n = 20, 74.1%),1,6–19,35–39 reviews/knowledge syntheses (n = 3, 11.1%),3,4,30 opinion pieces (n = 3, 11.1%),34,40,42 and one descriptive study. (3.7%)5 Table 1 provides an overview of all articles included in the study.

개입은 [동료 튜터링 프로그램]과 [강의실/과정으로 사용하도록 설계된 것]으로 균등하게 나뉘었다. 개입의 과반수(n = 18, 90%)가 [선택 사항]으로 제공되었다. 두 표는 개입 전반에 걸친 일반적인 특성(표 2)과 특정 개입의 특성(표 3)을 구분한다.

  • 표 2는 개입을 시작해야 하는 이유, 개입을 가르치는 개인, 가르치는 내용 등을 포함한 [개입의 특성]을 설명한다.
  • 표 3은 각 [개입의 데이터를 분류]하여 특정 개입이 선택적 또는 의무적이었는지, 누구를 가르쳤는지(예: 1학년 대 3학년 의대 학생), 학생들에게 가르치는 방법을 가르치는 데 소비한 시간, 개입 유형(예: 동료 교수 대 강의실/과정) 등을 보여준다.

이 표들은 함께 각 개입에 대한 자세한 보기와 여러 개입에 걸친 일반적인 특성을 제공한다.
The interventions were evenly split between those designed to serve as peer tutoring programs and teaching workshops/courses. A majority (n = 18, 90%) of the interventions were offered as electives. Two tables breakdown general characteristics across interventions (Table 2) and characteristics of specific interventions (Table 3). 

  • Table 2 describes characteristics of interventions including reasons to start an intervention, individuals teaching an intervention, content taught, etc. 
  • Table 3 breaks down the data from each intervention to show if the specific intervention was elective or mandatory, who they taught (e.g., 1st year vs 3rd-year medical students), time spent teaching students how to teach, type of intervention (e.g., peer teaching vs teaching workshop/course), etc.

Together, these tables provide a detailed view of each intervention and of general characteristics across multiple interventions.

 

 

의대생에게 가르치는 것의 이점과 과제
Benefits and challenges of teaching medical students to teach

이 기사에서는 튜터, 튜티, 기관 및 직업에 대한 수많은 혜택을 설명합니다. 몇몇 연구들은 의대생들이 교육의 기초를 배우는 것 이상의 이점을 보고했습니다. 이러한 편익은 종종 자가 진단 또는 일화로 관찰되었으며,

  • 교수 기술(n = 17, 85%),
  • 의대 학생의 자신감(n = 13, 65%),
  • 조직 기술(n = 8, 40%),
  • 의대 학생의 학습 능력(n = 6, 30%),
  • 임상 기술 강화(n = 6, 30%) 및
  • 교수진 지원(n = 3, 15%),
  • 전문적 정체성 발달(n = 2, 10%),
  • 학술적 저작물 보급 참여(n = 1, 5%).

The articles describe numerous benefits for the tutor, tutee, institution, and profession. Several studies reported benefits beyond medical students learning the fundamentals of teaching. These benefits were often self-reported or anecdotally observed and included

  • enhanced teaching skills (n = 17, 85%),
  • increased confidence of medical student (n = 13, 65%),
  • increased organizational skills (n = 8, 40%),
  • enhanced learning abilities of the medical student (n = 6, 30%),
  • strengthened clinical skills (n = 6, 30%),
  • assistance to faculty (n = 3, 15%),
  • development of professional identity (n = 2, 10%), and
  • participation in the dissemination of scholarly work (n = 1, 5%).

예를 들어, Erlich et al.8은 실제 교수 경험 내에서 교훈적인 교수 커리큘럼을 개발했고 조직 능력, 향상된 학습 능력 및 향상된 임상 기술을 포함한 교수 기술을 능가하는 일련의 향상된 기술과 태도를 보고했다. 또한 개입은 미래의 의사-교육자(n = 16, 80%)를 개발하고, 의대생에게 레지던스 교육 의무를 준비하도록 하며(n = 13, 65%), 의대생 자신의 학습능력 향상(n = 8, 40%)의 필요성을 인정하였다. 표 2에는 코드화된 이유가 모두 포함되어 있습니다. 저자들은 MSAT 개입을 구현하기 위한 두 가지 과제에 주목했다:

  • 다른 교육 수요와의 경쟁(n = 6, 30%)과
  • 교수진 모집 및 유지의 어려움(n = 5, 25%).

For example, Erlich et al.8 developed a didactic teaching curriculum within a practical teaching experience and reported an assortment of enhanced skills and attitudes that transcend teaching skills including organizational abilities, enhanced learning abilities, and enhanced clinical skills. Additionally, interventions acknowledged the need to develop future physician-educators (n = 16, 80%), to prepare medical students for teaching obligations in residency (n = 13, 65%), and to enhance a medical student’s own learning ability (n = 8, 40%). Table 2 includes all coded reasons. The authors noted two challenges to implementing an MSAT intervention:

  • competition with other educational demands (n = 6, 30%) and
  • difficulty in the recruitment and retention of faculty (n = 5, 25%).

강사 배경
Instructor backgrounds

개입에는 의사(n = 8, 40%), 기타 의대생(n = 5, 25%), 보건 관련 교육자(n = 5, 25), 박사/에디(PhD/EdD) 경력을 가진 강사(n = 2, 10%)가 포함되었다. 의대생 참여는 프로그램 구상, 교재 개발, 직접 교육 등 다양한 형태로 이뤄졌다. 예를 들어 Blanco et al.36은 온라인 교육 모듈을 구성할 뿐만 아니라 프로그램 설계 개발에 참여하는 의대생들을 기술했다.
The interventions included instructors from a variety of backgrounds including physicians (n = 8, 40%), other medical students (n = 5, 25%), health-related educators (n = 5, 25), and instructors with PhD/EdD backgrounds (n = 2, 10%). Medical student participation took numerous forms including program conception, developing materials, and directly teaching the content. For instance, Blanco et al.36 described medical students engaging in the development of the program design as well as constructing online teaching modules.

가르칠 내용
Content to teach

라나 등은 학생-교사 프로그램이 다룰 수 있는 매우 다양한 주제를 우선시하기 위한 유용한 프레임워크를 제공했다.5 우리의 리뷰는 의대생-교사들에게 일반적으로 가르치는 10가지 주제를 확인했다. 라나 등의 분류를 사용하여 각 주제(예: 소규모 그룹을 촉진하는 방법)를 필수, 중요, 중요하지 않거나 합의에 도달하지 않은 것으로 분류했다(표 4 참조). 이 틀을 적용하면 10개 주제 중 5개가 필수, 2개가 중요, 3개가 합의에 이르지 못했다. 우리의 연구에 따르면, 가르치는 콘텐츠의 [상위 세 영역]에는 다음이 포함되어 있었다

  • 소규모 그룹을 촉진하는 방법(n = 16, 80%),
  • 피드백을 주는 방법(n = 15, 75%)
  • 세션 설계/교육 자료 작성 방법(n = 10, 50%).

Rana et al. provided a helpful framework for prioritizing the large variety of topics that students-as-teachers programs can cover.5 Our review identified 10 topics commonly taught to medical student-teachers about teaching. Using Rana’s et al. classifications, each topic (e.g., how to facilitate small groups) was categorized as either essential, important, not important or did not reach consensus (see Table 4). Applying this framework, five of the ten topics were essential, two were important, and three did not reach consensus. According to our study, the top three areas of content taught included

  • how to facilitate small groups (n = 16, 80%),
  • how to give feedback (n = 15, 75%), and
  • how to design sessions/create instructional materials (n = 10, 50%).

이 세 가지 콘텐츠 영역은 Rana 등이 각각 필수, 필수, 중요로 분류하였다. 네 번째로 널리 보급된 주제는 성인 학습 이론/교육 이론(n = 8, 40%)이었다. 라나 등의 연구에서 [경험적 학습 이론의 가치]를 두고는 합의에 도달하지 못했으며, 아무도 그것을 필수적이고 중요하지 않은 것으로 파악하지 않았다.
These three content areas were categorized by Rana et al. as essential, essential, and important, respectively. The fourth most prevalent topic was adult learning theory/educational theory (n = 8, 40%). Rana et al.’s study did not reach a consensus on the value of experiential learning theory with no one identifying it as essential and a split between important and not important.

니아즈와 미스트리(Mistry)는 [동료 및 니어피어 교수 프로그램]을 촉진하는 데 특히 도움이 되는 작품을 제공했다. 이들은 주요 교육 분야를 파악했습니다. 

  • 명확한 목표 보유, 
  • 학생에게 맞춤
  • 프레임워크 사용, 
  • 수많은 자원 활용, 
  • 임상 관련성 및 개인적 경험 기반 구축, 
  • 건설적인 피드백 제공, 
  • 학생 실습 장려, 
  • 현장 최신 정보 제공, 
  • 명확한 기대치 설정, 
  • 동료 관찰 참여, 
  • 자기 성찰 참여.

Niaz and Mistry40 provided a particularly helpful piece to facilitate peer and near-peer teaching programs. They identified the key areas of instruction:

  • having clear objectives,
  • adapting to students,
  • using a framework,
  • utilizing numerous resources,
  • building on clinical relevance and personal experience,
  • offering constructive feedback,
  • encouraging student practice,
  • keeping up to date with the field,
  • setting clear expectations,
  • participating in peer observation, and
  • engaging in self-reflection.

의대생 교사들을 가르치기 위한 방식
Modalities for teaching medical student teachers

무엇을 가르칠 것인가를 넘어, 내용을 가르치는 방법은 개입에 따라 다양했다.

  • 소그룹 지침 사용(n = 12, 60%),
  • 의대생들이 관찰을 통해 배우게 함(n = 12, 60%) 및
  • 대규모 그룹 지시(n = 7, 35%) 
    둘 다 의대생들에게 가르쳤으며 교수법으로 사용되었다.
    의대생을 가르치는 데 사용되는 다른 교육 방식에는 다음이 포함된다.
  • 다른 사람을 가르치는 것(n = 6, 30%),
  • 역할극(n = 5, 25%),
  • 읽기자료 분석(n = 4, 20%),
  • 온라인 모듈(n = 3, 15%),
  • 자기반성(n = 2, 10%) 및
  • 전문가 인터뷰(n = 2, 10%).

Beyond what to teach, how to teach the content varied across interventions. Teaching approaches included

  • using small group instruction (n = 12, 60%),
  • having medical students learn through observation (n = 12, 60%) and
  • large group instruction (n = 7, 35%) were both taught to medical students and used as a teaching modality.
    Other teaching modalities used to teach the medical students included
  • teaching others (n = 6, 30%),
  • role-play (n = 5, 25%),
  • analyzing readings (n = 4, 20%),
  • online modules (n = 3, 15%),
  • self-reflection (n = 2, 10%) and
  • interviewing experts (n = 2, 10%).

개입의 80%(n = 16)가 의대생에게 최소한 한 번 이상 피드백을 제공했다고 보고했다. 12개의 개입(60%)은 의대생-교사들에게 피드백을 제공하는 프로그램의 동료 및/또는 학습자를 묘사했다. 이러한 초점 영역은 교육 개입이 효과를 극대화하기 위한 프로그램에 필수적인 실질적인 수업을 만듭니다.

We found that 80% (n = 16) of interventions reported providing medical student-teachers with feedback at least once. Twelve interventions (60%) described peers and/or learners in the program providing feedback to the medical student-teachers. These areas of focus create practical lessons that are essential for programs to ensure teaching interventions maximize effectiveness.

프로그램 평가 방법
Methods of program evaluation

개입은 평가를 수행하기 위해 설문 조사, 포커스 그룹, 인터뷰, 성찰 에세이를 포함한 다양한 방법을 사용했다. 표 5는 중재에 의해 사용되는 13가지 평가 방법의 보급률을 보여준다. 프로그램 평가 방법을 커크패트릭의 프로그램 평가 수준에 대한 에를리히의 수정된 버전으로 도표화한 후, 도달한 최고 수준을 기준으로 20개 개입을 4가지 수준의 프로그램 평가로 분류했다: 수준 1(n = 3, 15%), 수준 2(n = 9, 45%), 수준 3(n = 5, 25%), 수준 4(n = 3, 15%), 미지(n = 2, 11.8%)

The interventions used a variety of methods including surveys, focus groups, interviews, and reflective essays to conduct their evaluation. Table 5 shows the prevalence of thirteen methods of evaluation used by interventions. After charting program evaluation methods to Erlich’s modified version of Kirkpatrick’s program evaluation levels we classified the 20 interventions into four levels of programmatic evaluation based on the highest level reached: level 1 (n = 3, 15%), level 2 (n = 9, 45%), level 3 (n = 5, 25%), level 4 (n = 3, 15%) and unknown (n = 2, 11.8%) (See Table 4).

예를 들어,

  • Karthik 등은 미시적 가르침에 대한 참가자들의 태도를 보여주기 위해 설문조사를 사용하였고(레벨 1)
  • Tcheckmedyian 등은 의학-학생 가르침에 대한 블라인드 리뷰를 사용하여 교수 기술(레벨 3)에서 통계적으로 유의미한 향상을 보였다.
  • Sammarie et al.은 주로 강의 기반의 정식 사전임상교육과정이 시니어 학생이 프로그램을 설계하고 전달함으로써 개선될 수 있음을 보여주었고(level 3)
  • Erlich et al.은 1학년 학습자의 OSCE 점수의대생-교사의 평가를 프로그램적 가치 측정 수단(level 4)의 하나로 상관시켰다. 

For example,

  • Karthik et al. used a survey to show participants’ attitudes toward microteaching (level 1),18 while
  • Tchekmedyian et al.15 used blinded reviews of medical-student teaching to show statistically significant improvement in teaching skills (level 3).
  • Sammaraiee et al.10 showed that a mostly lecture-based formal preclinical curriculum can be improved by senior medical students designing and delivering a program (level 3), and
  • Erlich et al.8 correlated first-year learners’ OSCE scores and evaluations of their medical student-teacher as one means of measuring programmatic value (level 4).

 

통찰력
Insights

교수법을 배우는 의대생들에 대한 국제적인 대화는 독창적인 연구, 논평, 그리고 지식 종합의 출판과 함께 계속해서 성장하고 있다. 본 연구는 이 선행 연구의 중요한 기여를 바탕으로 7년 동안 27개의 논문을 확인함으로써 사용된 교수법, 평가 관행 및 의대생 편익에 대한 현재 추세를 설명할 수 있었다. Marton 등은 1990년부터 2013년까지의 기사를 검토했으며, 이 23년 동안 20개의 기사, 즉 연간 평균 0.87개의 기사를 발견했다. 우리의 연구는 Marton 등의 연구를 6년 연장하고 27개의 추가 기사를 분석했는데, 이 중 20개가 포함 기준을 충족하여 연간 평균 4.6개(440% 증가)의 기사를 낳았다.
The international conversation around medical students learning to teach has continued to grow with the publication of original research, commentaries, and knowledge syntheses. Building on the important contributions of this prior research, our study identified 27 articles over a 7-year period enabling us to describe current trends in teaching methods used, evaluative practices, and benefits for medical students. Marton et al.4 reviewed articles from 1990 to 2013, and over this 23-year period found 20 articles, an average of 0.87 articles per year. Our study extended Marton et al.’s4 study by six years and analyzed an additional 27 articles, with 20 of these articles meeting their inclusion criteria, resulting in an average of 4.6 articles per year (a 440% increase).

마틴 등이 객관적인 프로그램 평가를 요구한 것에 대한 후속 조치
Following up on Marton et al.’s call for objective program evaluation

Marton 외 연구진과 Chu와 Salooja는 모두 [공식적인 MSAT 교육 프로그램에 대한 강화된 평가 노력의 필요성]을 인정했다. 우리의 데이터에서, 우리는 평가 특성을 Kirkpatrick Model과 정렬하여 주목한 보다 다양한 프로그램 평가 방법(표 5)과 더 높은 수준의 프로그램 평가로 향하는 추세를 관찰했다. 이러한 추세는 프로그램 가치에 대한 증거에 대한 수요가 증가하고 있음을 강조하며 더 높은 수준의 평가 결과에 대한 요구에 답하기 시작한다. 예를 들어, 한 프로그램은 심지어 참가자들에게 학술적 연구를 전파하도록 장려하기 시작했다. 그러나, 출판물이 교수 숙련도와 상관관계가 있는지 여부를 결정하기 위한 미래 연구가 필요하다. 우리는 에를리히, 쇼네시, 삼마리 등의 선례를 따를 것을 권고한다. 두 이니셔티브 모두 영향을 측정하고 지속적인 개선을 보장하기 위해 포괄적인 교육 커리큘럼과 효과적인 프로그램 평가 방법을 개발했습니다.

Marton et al.4 and Chu and Salooja42 both acknowledged the need for enhanced evaluation efforts for formal MSAT teaching programs. In our data, we observed a trend toward more diverse programmatic evaluation methods (Table 5) and higher levels of program evaluation noted by aligning the evaluation characteristics with the Kirkpatrick Model.33 This trend highlights an increasing demand for evidence of a program’s value and begins to answer the call for higher-level evaluation outcomes.4,42 For example, one program13 even started encouraging their participants to disseminate scholarly work; however, future research is needed to determine if publications correlate with teaching proficiency. We recommend following the lead of Erlich and Shaughnessy8 and Sammaraiee et al.10; both initiatives developed a comprehensive didactic teaching curriculum and effective programmatic evaluation methods to measure impact and assure continual improvement.

MSAT 프로그램 설계 시 고려사항
Considerations when designing an MSAT program

내용은 프로그램의 목적과 일치해야 한다(예: 해부학 과외, 소규모 그룹 토론 주도, 강의, 임상 교육 제공 - 현재 필요성 대 미래 능력). 자원으로서, MSAT 프로그램들은 그들의 프로그램의 요구를 가장 잘 맞추는 방법에 대한 제안들을 위해 표 4를 사용할 수 있다. 예를 들어, MSAT 프로그램이 [소규모 그룹을 촉진하는 의대 학생의 능력]을 향상시키도록 설계된 경우 강사는 [소규모 그룹 촉진과 관련된 내용]이 포함되도록 해야 한다.
Content must be aligned with the purpose of the program (e.g., anatomy tutoring, leading small group discussions, giving lectures, providing clinical teaching - present need versus future ability). As a resource, MSAT programs can use Table 4 for suggestions on how to best align the needs of their program. For example, when an MSAT program is designed to improve a medical student’s ability to facilitate small groups instructors should ensure that content related to small group facilitation is included.

우리의 연구에서, 우리는 개입 기간이 일부는 3시간 정도로 짧고 다른 일부는 몇 주에 걸쳐서 다양하다는 것을 관찰했다. 간단한 개입(약 3~6시간)을 제공하는 경우, 강사가 주요 학습 목표에 적절하게 집중할 수 있도록 효과적으로 교육 대상을 지정하는 것이 중요합니다. 또한, 이러한 강사들은 이러한 짧은 개입이 학습자에게 제공되는 즉각적인 교육 과제를 위해 참가자들을 준비하는 것 이상의 결과를 가져올 것이라는 기대를 완화시키는 것이 중요하다. 예를 들어, 보다 장기적인 변화를 창출하고 임상의-교육자로서 정체성 형성을 촉진하고자 하는 장기 이니셔티브(예: 30시간 과정)에 참여하는 사람들은 단기 과정보다 커리큘럼 개발, 학습 이론, 평가, 리더십 및 교육 장학금에 대한 내용을 더 많이 포함하는 것을 고려할 수 있다. 프로그램을 개발할 때, 강사들은 포함할 콘텐츠 요소를 결정할 때 그들의 이니셔티브 기간을 고려해야 한다.

In our study, we observed that the duration of interventions varied with some running as short as three hours and others spanning several weeks. For those offering brief interventions (approximately 3–6 hours in length), it is important for instructors to effectively target their instruction to ensure they adequately focus on their main learning objectives. Additionally, it is important that these instructors temper their expectations that such a brief intervention will produce outcomes beyond preparing participants for the immediate teaching task provided to learners. For example, for those engaging in longer initiatives (e.g., a 30-hour course)8 who aspire to produce more long-term change and facilitate identity formation as a clinician-educator they might consider including more content on curriculum development, learning theory, assessment, leadership, and educational scholarship than a short course. Thus, when developing such programs instructors should take into account the duration of their initiative when determining which content elements to include.

가르치는 것을 배우는 것 이상의 의대생들을 위한 혜택
Benefits for medical students beyond learning to teach

MSAT 프로그램은 의대 학생들의 교수 능력을 향상시키는데 효과적인 메커니즘으로 나타났다. [MSAT 프로그램을 선택하는 이유]는 의대생에게 미래의 노력(예: 미래의 의사-교육자 개발 또는 거주지에서의 교육 의무 준비)을 준비하거나 인증 요건을 충족하는 등 다양하다.

  • 그러나 이 문헌은 의대생들의 다음과 같은 향상과 같은 MSAT 프로그램 구현에 대한 추가적인 이점도 지원하였다. 자신감, 학습 능력, 조직 기술(예: 시간 관리) 및 커뮤니케이션 기술.
  • 프로그램들은 또한 의대 학생들을 가르치는 것이 [교수진을 위한 지원과 역량 강화의 역할]을 했다고 보도했다.
  • 마지막으로 의대생의 직업적 정체성 발달이 인정되었다.
  • 의대생들의 숙련도와 교육자로서의 정체성을 조기에 구축하는 것은 의대생들의 실천을 구체화하는 데 도움이 될 수 있으며, 의대생들에게 의대 교육 커뮤니티에 대한 추가적인 목적과 연결을 제공할 수 있다.
  • 정체성 형성과 공동체 형성은 의사들 사이의 지속적인 도전인 탈진을 방지하는 데 도움이 될 수 있다.
  • 조직 및 효율성이 향상되었으며 빠른 속도의 클리닉 환경에서 유용할 수 있습니다.

MSAT programs have been shown to be effective mechanisms for improving medical students’ teaching skills.4 Programs have a variety of reasons for choosing to start an MSAT program including preparing medical students for future endeavors (e.g., development of future physician-educators or preparing for teaching obligations in residency) or meeting accreditation requirements.

  • However, the literature also supported additional benefits to implementing MSAT programs including the enhancement of medical student’s: confidence, learning ability, organizational skills (e.g., time-management), and communication skills.
  • Programs also reported that teaching medical students served as support and capacity building for faculty.
  • Finally, the development of a medical student’s professional identity was acknowledged.
  • Building medical students’ proficiency and identity as educators early may help shape their practice, giving it additional purpose and connection to the medical education community.13 
  • Identity formation and community-building could help ward off burnout,44 a persistent challenge among physicians.
  • Improved organization and efficiency and may prove beneficial in the fast-paced clinic environment.

 프로그램을 시작하기 위해 윤곽이 드러나는 수많은 이점들이 있지만, 다른 교육적 요구와의 경쟁은 상당한 장벽이 될 수 있다. 프로그램을 시작하는 것을 고려하는 의학 교육자들은 시간 제약을 고려하고 그들의 지역 맥락에 가장 잘 맞는 콘텐츠와 경험의 우선순위를 정할 필요가 있을 것이다. 표 2에는 개입이 프로그램을 시작하는 이유, 프로그램 시작에 대한 관찰된 이점과 장벽, 개입의 추가 특성이 자세히 설명되어 있습니다. 이러한 관찰된 편익을 공식적으로 평가하기 위해서는 추가적인 미래 연구가 필요하다.

While there are numerous advantages outlined for starting a program, competition with other educational demands can be a significant barrier. Medical educators considering starting a program will need to consider time constraints and prioritize content and experiences to best match their local context. Table 2 details reasons interventions start programs, observed benefits and barriers to starting a program, and additional characteristics of interventions. Additional future research is needed to formally evaluate these observed benefits.

의대생들에게 중재에 대한 계획과 교육을 하도록 유도한다.
Engaging medical students to plan and teach in the intervention


Marton 등의 검토에서 [동료 교습]은 큰 역할을 했으며 MSAT 관행을 계속해서 형성하고 있다. 이 개념을 확장하면서, 우리는 많은 개입에서 [개입을 가르치거나, 설계하는 데 의대생들을 참여하게 했다는 것]을 발견했다. 이것은 사회적, 인지적 일치에 대한 ten Cate와 Durning의 개념과 일치한다.

  • [사회적 일치성]은 "공유된 사회적 맥락, 경험, 나이 및 기타 세대적 자질"이다. 
  • [인지적 일치성]은 "튜터들이 기성 학구적 직원들보다 튜터들이 직면하는 어려움을 더 잘 이해할 수 있다는 생각"이다. 

Peer teaching played a major role in Marton et al.’s review and continues to shape MSAT practices. Expanding on this concept, we found that many interventions engaged medical students in teaching and/or designing the intervention. This aligns with ten Cate and Durning’s24 concepts of social and cognitive congruence.

  • Social congruence being the “shared social context, experience, age and other generational qualities”8(p.2) and
  • cognitive congruence is “the idea that tutors are able to understand the difficulties faced by the tutees better than established academic staff”10(p.297).

의대생들을 참여시키는 것은 [가르치는 것이 곧 가르치는 방법을 배우는 것]이라는 개념을 지지한다. MSAT 프로그램에서 의대생들의 역할은 [교수 개입을 설계하고, 튜터로 일하고, 일선 교육을 제공하는 것]을 포함한다. 일선 수업은 의대생들이 "처음으로 개인에게 입문 학습 목표를 전달하는 것"이다.  또한, 또래 튜터에게 교육에 대한 교육을 제공하는 프로그램은 니아즈와 미스트리에게 다루어야 할 주요 영역에 대한 지침으로 삼아야 한다.

Engaging medical students supports the concept that a way to learn how to teach is to teach. Medical students’ roles in MSAT programs include designing teaching interventions, serving as tutors, and delivering front-line teaching. Frontline teaching is when medical students “communicate introductory learning objective/s to individual/s for the very first time.” 45(p.237) Additionally, programs providing peer tutors with training on teaching should look to Niaz and Mistry40 as a guide for key areas to cover.

제한 사항
Limitations

포괄적인 검색(예: 손 검색 포함, 여러 데이터베이스 쿼리)을 수행하기 위한 최선의 노력에도 불구하고, 우리가 실수로 관련 기사를 놓쳤을 가능성이 있다. 또한 저널 기사에 기술되지 않았고 우리의 노력으로 포착되지 않은 MSAT 프로그램이 존재할 가능성이 있다. 그러나 우리는 향후 연구가 이러한 전략에 대해 계속 복제되고 확장될 수 있도록 검색 전략을 자유롭게 사용할 수 있도록 했다. 마지막으로, 우리는 출판물의 상승이 증거 기반 개입을 위한 지속적인 노력일 수 있다는 것을 인식한다. 그러나 저널의 확산과 학계의 "출판 또는 소멸" 필요성과 같은 요소도 영향력자일 수 있다.

Despite best efforts to conduct a comprehensive search (e.g., the inclusion of hand searching, querying multiple databases) it is possible that we may have inadvertently missed a relevant article. Additionally, it is possible that MSAT programs may exist that have not been described in journal articles and would not have been captured in our efforts. However, we have made our search strategies freely available such that future studies may continue to replicate and expand upon these strategies. Finally, we recognize that the uptick in publications may be ongoing efforts for evidence-based interventions; however, factors such as the proliferation of journals and the need to “publish-or-perish” in academia may also be influencers.

향후 방향
Future directions

본 연구는 교육과정 목표화 및 프로그램 평가 방법을 포함하여 MSAT 프로그램을 시행하고자 하는 의과대학에 몇 가지 시사점을 제공한다. 여러 프로그램이 성장함에 따라, 이러한 프로그램의 이점을 엄격하게 연구할 시기가 무르익었다. 특히, 필수적인 첫 번째 단계는 의과대학 재학 중과 실습 모두에서 의과대학 학생들을 위한 교수 개입의 이점을 더 정확하게 명시하는 것이다. 이러한 연구는 [교수기술을 배운 학생들]이 [교수기술이 없는 또래]와 비교했을 때 학업 수행이 어떠한지, 그리고 이러한 개입의 졸업생들이 실무자로서 어떻게 수행하는지 탐구할 수 있을 것이다.
This study offers several implications for medical schools looking to implement an MSAT program including targeting of curriculum and of methods for programmatic evaluation. With the growth of multiple programs, the time is ripe to rigorously study the benefits of these programs. In particular, an essential first step is more precisely specifying the benefits of teaching interventions for medical students both while in medical school and into practice. Such studies might explore how students who learn teaching skills perform academically when compared to their peers without teaching skills, as well as how graduates of these interventions perform as practitioners.

기존 MSAT 문헌을 매핑하려는 이러한 시도를 바탕으로 향후 연구자들이 MSAT 개입에 대한 체계적인 검토를 수행하는 것을 고려하는 것이 적절할 것이라고 제안한다. 이러한 노력을 통해 강사들은 MSAT 프로그램을 설계하고 옹호하기 위해 증거 정보에 근거한 접근법을 취할 수 있을 것이다. 우리가 발견한 결과에는 다양한 수준의 품질(예: 교육에 사용되는 방법, 개입 시간, 피드백을 제공하는 방법 등)이 있는 것으로 나타났다. 공식적인 체계적인 검토는 증거의 품질을 결정하는 수단을 제공할 것이다.

Based on this attempt to map the existing MSAT literature, we propose that it would be appropriate for future researchers to consider conducting a systematic review of MSAT interventions. Such an effort would enable instructors to take an evidence-informed approach to design and advocate for MSAT programs. There appeared to be varying levels of quality in the findings (e.g., methods used for teaching, how long interventions should last, ways to provide feedback, etc.) we discovered. A formal systematic review would provide a means for determining the quality of the evidence.

결론
Conclusion

의과대학은 의대 학생들, 특히 더 많은 상급생들에게 교사가 되기 위한 지식과 기술을 제공하기 위한 노력을 증가시켰다. 이러한 교사로서의 학생 프로그램은 종종 근거리 교육 프로그램의 형태로 제공되지만, 또한 학생들이 상주 교사, 환자 교육자 및 임상의-교육자로서의 역할을 준비하도록 설계된 보다 집중적인 과정을 포함한다. 이 범위 검토는 문헌이 [객관적인 교육 프로그램 평가에 대한 요구에 답하기 시작했다는 것]을 입증함으로써 Marton 등이 2014년에 발표한 이전 검토에 기초한다. 그러나 증거의 품질을 결정하기 위해서는 향후 체계적인 검토가 필요하다. 함께, 이러한 연구는 의대 학생들에게 제공되는 교수 기술과 기회를 확대할 것이다.

Medical schools have increased efforts to provide medical students, especially more senior students, with the knowledge and skills to become teachers. These student-as-teacher programs are often provided in the form of near-peer teaching programs but also include more intensive courses designed to prepare students for their roles as resident teachers, patient educators, and clinician-educators. This scoping review builds on a prior review published in 2014 by Marton et al. by demonstrating the literature has begun to answer the call for objective educational program evaluations; however, a future systematic review is needed to determine the quality of evidence. Together, these studies will expand the teaching skills and opportunities afforded to medical students.

 


Teach Learn Med. 2022 Aug-Sep;34(4):379-391. doi: 10.1080/10401334.2021.1979006. Epub 2021 Oct 7.

Teaching Medical Students How to Teach: A Scoping Review

Affiliations collapse

Affiliations

1Center for Health Professions Education, Uniformed Services University of the Health Sciences, Bethesda, Maryland, USA.

2School of Politics, Security, and International Affairs, University of Central Florida, Orlando, Florida, USA.

3Obstetrics & Gynecology Resident, Naval Medical Center San Diego, San Diego, California, USA.

4Expeditionary Medical Facility, Camp Lemonnier, Djibouti.

5Library Learning Resource Center, Uniformed Services University of the Health Sciences, Bethesda, Maryland, USA.

PMID: 34618654

DOI: 10.1080/10401334.2021.1979006

Abstract

Phenomenon: Teaching medical students how to teach is a growing and essential focus of medical education, which has given rise to student teaching programs. Educating medical students on how to teach can improve their own learning and lay the foundation for a professional identity rooted in teaching. Still, medical student-as-teacher (MSAT) programs face numerous obstacles including time constraints, prioritizing curriculum, and determining effective evaluation techniques. The purpose of this scoping review is to map the current landscape of the literature on medical school initiatives designed to train students to teach to describe why medical student teaching programs are started; the benefits and barriers; who teaches them; what content is taught; and how content is delivered. With this new map, the authors aimed to facilitate the growth of new programs and provide a shared knowledge of practices derived from existing programs.

Approach: The authors conducted a scoping review, guided by Arksey and O'Malley's framework, to map the literature of MSAT training programs. Six databases were searched using combinations of keywords and controlled vocabulary terms. Data were charted in duplicate using a collaboratively designed data charting tool. This review builds on the Marton et al. review and includes articles published from 2014 to 2020.

Findings: Of the 1,644 manuscripts identified, the full-text of 57 were reviewed, and ultimately 27 were included. Articles included empirical research, synthetic reviews, opinion pieces, and a descriptive study. Analysis focused on modalities for teaching medical students how to teach; content to teach medical students about teaching; benefits and barriers to starting teaching programs; and the value of teaching programs for medical students.

Insights: The rapid growth of MSAT programs suggests that this curricular offering is of great interest to the field. Literature shows an increase in evaluative efforts among programs, benefits for students beyond learning to teach, and evidence of effective engagement in medical students' designing and implementing programs.

 

초기 임상실습에서 전문직정체성형성 이해하기: 새로운 프레임워크(Acad Med, 2019)
Understanding Professional Identity Formation in Early Clerkship: A Novel Framework
Sandra Jarvis-Selinger, PhD, Kimberley A. MacNeil, MA, Gregory R.L. Costello, MD, CCFP, Kenneth Lee, MD, and Cheryl L. Holmes, MD, FRCPC, MHPE 

 

 

의학 교육자들은 개인들이 그들의 책임 뒤에 있는 이상과 원칙을 내면화했을 때 그들의 직업의 가치에 따라 행동할 가능성이 더 높기 때문에, 학생들의 전문직업적 태도를 길러주어야 한다는 것에 널리 동의한다. 따라서, 훈련 중인 의사들 사이에서 긍정적인 전문적 정체성을 지원하는 것은 지식과 기술에 초점을 맞춘 교육 접근법을 보완하고 이러한 신흥 전문가의 개발 요구를 보다 포괄적으로 해결하는 역할을 한다. 이에 PIF(Professional Identity Formation)를 육성하기 위한 교육 혁신, 특히 학생들의 성찰 참여를 강조하는 혁신이 급증하고 있다. 하지만, 학생들이 언제 그리고 왜 그들의 새로운 직업적 정체성을 조사하고 협상할 기회를 잡는지에 대해 여전히 배울 것이 많다.
Medical educators widely agree that they should foster students’ professional attitudes because individuals are more likely to act in accordance with the values of their profession if they have internalized the ideals and principles behind their responsibilities.1–3 Therefore, supporting a positive professional identity among physicians-in-training serves to complement knowledge- and skill-focused educational approaches and to more comprehensively address the developmental needs of these emerging professionals.4–6 In response, there has been an upsurge in educational innovations intended to foster professional identity formation (PIF), especially innovations that emphasize engaging students in reflection.7–11 However, there is still much to be learned about when and why students take up opportunities to examine and negotiate their emerging professional identities.

역사적으로 [정체성 이론]은 개인이 자아성장에 의해 특징지어지는 일련의 단계를 통해 진보한다는 개념에 바탕을 둔 발달적 관점에 기초한다. 이러한 이론들이 각 [개인 내부의 인지 구조]의 역할을 뒷받침하는 반면, 점점 더 많은 연구자들이 [사회적 토대를 둔 과정]으로서 정체성 발달의 상호 작용을 주장하는 [사회적 인지 이론]을 채택하고 있다. 의학 교육의 맥락에서, PIF는 다음으로 묘사되어 왔다. 

"두 가지 수준에서 동시에 발생하는 적응적이고 발달적인 과정으로서,
(1) 개인의 심리적 발달을 수반하는 개인의 수준에서, 그리고 
(2) 공동체의 업무에서 개인의 적절한 역할과 형태로 사회화하는 것을 포함하는 집단적 수준에서." 

Historically, identity theories are based on developmental perspectives grounded in the notion that individuals progress through a series of stages marked by ego growth.12 While such theories foreground the role of each individual’s internal cognitive structures, more and more researchers are adopting social-cognitive theories that assert the interactional nature of identity development as a socially grounded process.13,14 In the context of medical education, PIF has been described as an

“adaptive, developmental process that happens simultaneously at two levels:
(1) at the level of the individual, which involves the psychological development of the person, and
(2) at the collective level, which involves socialization of the person into appropriate roles and forms of participation in the community’s work.”4 

PIF의 개인 및 사회적 차원을 모두 인정하는 [사회적 인지 이론]을 바탕으로 연구자들은 의대생들의 서술적 성찰을 연구해 왔는데, 이러한 성찰은 학생들이 임상 경험과 내부 정체성 구성 사이에 맺고 있는 관계를 설명할 수 있는 잠재력을 가지고 있기 때문이다. 서술적 성찰은 학생들의 PIF 경험을 조명할 뿐만 아니라 일부 연구에 따르면 학생들이 전문성과 정체성을 함양하면서 학습기제 역할을 한다. 서술적 성찰 문헌은 특히 학생들이 자신의 진화하는 자신을 죽음과 질병의 경험, 해부학 실험실 연습, 그리고 그들의 첫 환자 상호작용과 같은 극적인 순간들의 영향과 어떻게 연관시키는지 강조한다. 비록 이것이 그들의 새로운emerging 직업 정체성에 큰 영향을 미칠 수 있지만, 학생들의 일상적인 교육 및 임상 경험의 더 일상적인 측면을 성찰하는 보고는 덜 널리 퍼져 있다.

Building from social-cognitive theories—that acknowledge both the individual and social dimensions of PIF—researchers have studied medical students’ narrative reflections because these reflections have the potential to illustrate the links students are making between clinical experiences and internal identity construction.8 Narrative reflections not only illuminate students’ experiences of PIF but also, according to some research, act as a learning mechanism that supports students as they develop their professionalism and identity.15,16 Narrative reflection literature particularly emphasizes how students relate their evolving selves to the impact of dramatic moments, such as their experiences of death and illness,17 anatomy lab exercises,10 and their first patient interactions.18 Less prevalent are reports of students reflecting on the more routine aspects of their day-to-day educational and clinical experiences, even though these may significantly affect their emerging professional identity.

또한, 성찰의 기회와 PIF를 연계하기 위한 커리큘럼 노력을 inform할 수 있는 방식으로 성찰의 순간(크든 작든)이 학생들의 직업적 정체성에 어떻게 영향을 미치는지에 대한 해석을 용이하게 하는 개념적 프레임워크는 거의 존재하지 않는다. 본 연구에서는 의대생들에게 중요한 전환기인 임상서기 3년차 동안 학생들이 새롭게 부상하고 변화하는 전문적 정체성을 어떻게 반영하는지 파악하고자 하였다. 브리티시컬럼비아 대학교(UBC)의 GRAPIC(Guided Reflection and Professionalization/Hidden Curriculum) 과정의 파일럿 연도의 맥락에서 진화하는 의대생 전문 정체성에 대해 조사했다.  
In addition, few conceptual frameworks exist to facilitate interpretation of how reflective moments—either great or small—affect students’ evolving sense of professional identity in ways that can inform curricular efforts to link opportunities for reflection and PIF. In this study, we aimed to understand how students reflected on their emerging and changing professional identities throughout their third-year clinical clerkship, which is a critical transition period for medical students. We examined evolving medical student professional identity within the context of the pilot year of the Guided Reflection and Professionalization/Hidden Curriculum (GRAPHiC) course at the University of British Columbia (UBC).19,20

방법
Method

본 연구의 초기 목적은 의과대학 3학년 학생들이 임상실습 기간 중 PIF에 대한 경험을 분석하여 의과대학 중 학생들의 전문성장을 지원하는 방법에 대한 의학교육계의 이해를 증진시키는 데 있었다. 우리는 우리의 해석론적 관점에 의존하여 근거 이론 접근법에 의해 알려진 분석에 참여했다. 이 연구는 UBC의 GRAPiC 과정의 시범 연도에 수행되었다. GRAPiC 프로그램은 앞서 설명한 바와 같이 의대생 및 신흥 전문가로서의 발전과 관련하여 숨겨진 교육과정의 영향을 '드러내기unhide' 위해 노력함에 따라 의대생을 지원하기 위해 마련되었다. GraphiC 세션(n = 10)은 토론을 안내하고 모든 참가자를 능동적인 성찰에 참여시키기 위해 준비, 주의, 처리, 선택의 4단계 접근 방식을 사용하여 구성되었습니다. 예를 들어, 진행자들은 먼저 학생들이 숨겨진 커리큘럼이 그들에게 어떤 영향을 미치는지 알아차리게 하고, 그들이 알아차린 것을 처리하는 동안 학생들을 지원했고, 마지막으로, 그들이 발전하는 직업 정체성을 긍정적으로 지원할 수 있는 행동을 선택하도록 도왔다.
The initial purpose of this study was to examine third-year medical students’ experiences of PIF during their clinical clerkships to advance the medical education community’s understanding of how to support students’ professional growth during medical school. We relied on our interpretivist perspectives21 to engage in an analysis informed by a grounded theory approach. The study was conducted during the pilot year of the GRAPHiC course at UBC.19,20,22 As previously described, the GRAPHiC program was designed to support medical students as they worked to “unhide” the influences of the hidden curriculum in relation to their development as medical students and emerging professionals. GRAPHiC sessions (n = 10) were structured using a 4-step approach—priming, noticing, processing, and choosing—to guide the discussion and to engage all participants in active reflection (see Supplemental Digital Appendix 1, available at https://links.lww.com/ACADMED/A699).20 For example, facilitators first primed students to notice how the hidden curriculum was influencing them, then supported students as they processed what they were noticing, and, finally, helped them choose behaviors that might positively support their developing professional identity.

acadmed_2019_06_07_jarvisselinger_acadmed-d-18-00785_sdc1.pdf
1.34MB

참가자
Participants

우리는 UBC에 등록된 모든 3학년 학생들을 이메일로 연구에 참여하도록 초대했습니다. 참여하기 위해 학생들이 자발적으로 GraphiC 파일럿 과정에 등록했다. 의과 3학년 자원봉사자들은 1학년에 걸쳐 교직원 3명(C.L.H. 포함), 응급의학과 레지던트 1명, 의과 4학년(G.R.L.C.) 1명과 9차례의 공동토론을 진행했다. 학생들은 주요 진행자(C.L.H.)와 함께 그룹 토론, 온라인 저널링 및 이메일 서신에 참여했습니다. UBC 행동연구윤리위원회 과정은 이 연구에 대한 윤리적 승인을 제공했다.
We invited all third-year students registered at UBC to participate in the study via email. To participate, students voluntarily enrolled in the GRAPHiC pilot course. Over the course of 1 academic year, volunteer third-year medical students engaged in 9 collaborative discussions with 3 faculty members (including C.L.H.), 1 emergency medicine resident, and 1 fourth-year medical student (G.R.L.C.). Students participated in group discussions, online journaling, and email correspondence with the lead facilitator (C.L.H.). The UBC Behavioural Research Ethics Board process provided ethical approval for this study.

데이터 수집
Data collection

본 연구를 위해 의대 3학년(2015년 6월~2016년 6월) 과정과 4학년(2017년 2월) 1회 후속 세션에 걸쳐 진행된 9개 그룹 토론(GraphiC 또는 G 세션)의 녹음 및 녹취록을 분석하였다. 각 세션에 참석한 한 조사관(C.L.H.)은 각 오디오 녹음을 듣고 참가자를 인코딩하여 녹취록을 비식별화했다. 각 참가자는 남학생(MS) 또는 여학생(FS)으로 인코딩되어 번호가 할당되었다. 순차적으로 인코딩된 세션(G1–G10)은 2시간이었다. 우리는 준비, 주의, 처리 및 선택 단계를 통해 학생들의 진전을 지원하기 위해 전략적이고 계획된 프롬프트와 비정형 토론으로 구성된 이 세션을 설계했습니다. 
For the present study, we analyzed audio recordings and transcripts of the 9 group discussions (i.e., GRAPHiC or G sessions) that took place over the course of the students’ third year of medical school (June 2015–June 2016) and of 1 follow-up session in their fourth year (February 2017). One investigator (C.L.H.) who was present at each session listened to each audio recording and encoded the participants, deidentifying them in the transcripts. Each participant was encoded as either a male student (MS) or a female student (FS) and assigned a number. The sessions, encoded sequentially (G1–G10), were 2 hours in length. We designed these sessions, which consisted of strategic, planned prompts as well as unstructured discussions, to support students’ progress through the phases of priming, noticing, processing, and choosing.20

GraphiC 커리큘럼 설명
GRAPHiC curricular description

앞서 기술한 바와 같이, 초기 그룹 미팅에서는 의대생들에게 준법 및 순응의 구성뿐만 아니라 숨겨진 커리큘럼의 개념을 소개하는 1시간의 교훈 세션(2015년 6월)이 포함되었다. 

  • 또한, 이 첫 번째 세션 동안 진행자들은 개인 영역과 임상 작업장의 숨겨진 커리큘럼의 예를 제공하고 토론을 초대하여 학생들이 또래 압력에 접근한 자신의 경험에 민감하게 반응하도록 했다. 
  • 학생들은 그들의 일상 활동을 기록하기 위해 교과 과정 사이에 현장 메모를 하도록 요청 받았다. 이메일 알림과 구두 프롬프트를 통해, 우리는 참가 학생들이 특히 그들 자신의 문화 과정을 기록하고 기록하도록 지도했습니다. 
  • 우리는 그들에게 그들이 불협화음을 경험했을 때, 즉 그들이 그들의 최고 또는 이상적인 직업적 자신으로부터 멀어지게 하는 행동에 순응하거나 순응해야 한다는 압박을 느꼈을 때를 주목하고 기록하도록 요청했습니다.

As previously described,19,20 the initial group meeting included a 1-hour didactic session (June 2015) introducing the concept of the hidden curriculum, as well as the constructs of compliance and conformity, to medical students.

  • In addition, during this first session, the facilitators provided examples of the hidden curriculum from the personal realm and clinical workplace and invited discussion to sensitize students to their own experiences of acceding to peer pressure.19,20 
  • The students were asked to take field notes between curricular sessions to record their daily activities. Through email reminders and verbal prompts, we coached the participating students to note and journal, specifically, their own process of enculturation.
  • We asked them to notice and record moments when they experienced dissonance, that is, when they felt pressure to comply or conform to behaviors that moved them away from their best or ideal professional self.

데이터 분석
Data analysis

우리는 10개의 GRAPiC 세션에서 얻은 데이터를 분석하기 위해 근거 이론 접근법을 사용했다. 근거 이론은 시간에 따른 프로세스 또는 변화와 관련된 질문을 적절하게 다루고 "사회 환경에서 일어나는 일"에 대한 개념적 추상적 설명을 쉽게 개발하기 때문이다. 데이터 분석은 마이크로소프트 엑셀을 사용하여 지원되었다. 분석에는 4학년 의대생 2명(G.R.L.C.와 K.L.)이 성적서를 읽고, 분석 메모에 참여하고, 우리의 연구 질문과 관련된 새로운 주제를 생성하는 것이 포함되었다. [근거 이론 방법론을 사용하는 연구자들의 근본적인 문제]는 [범주 및 코드의 귀납적 생성과 데이터 중심 분석과 개념적 사고]에 영향을 미치는 [연구자들 자신의 이론적 민감성의 잠재성] 사이의 긴장 관계에 있기 때문에 대학원생 연구 조교(K.A.M.)가 이 차에 합류했다. K.A.M.은 외부인(의학부가 아닌 교육학부 출신)으로서 데이터 분석에 종사하였는데, 이는 주요 연구자들의 이론적 민감성이 개념적 범주의 부과를 야기했을 수 있는 정도를 확인할 수 있는 관점을 주었다. 우리는 코딩의 목적을 위해 초기 주석을 더 작은 의미 단위로 구문 분석parsed하였다. 범주는 가장 중요한 발견물(아래 참조)로 나타났으며, 각 범주 내 및 범주의 패턴과 관계를 식별하기 위해 사용되었던 행동 모델 역할을 했다. 이 과정을 통해 우리 중 2명(K.A.M.과 S.J.-S.)은 지속적인 비교 접근법을 사용하여 개별적으로 축 코딩에 참여했고, 개발 코드뿐만 아니라 범주의 특성과 차원을 논의하고 정의하며 질문하기 위해 격주로 만났다.26
We used a grounded theory approach to analyze the data resulting from the 10 GRAPHiC sessions because grounded theory suitably addresses inquiries related to process or change over time16,23 and facilitates developing a conceptually abstract explanation of “what is happening in a social setting.”24 Data analyses were supported by the use of Microsoft Excel (version 16.16.1, Redmond, Washington). Analyses involved 2 fourth-year medical students (G.R.L.C. and K.L.) reading transcripts, engaging in the act of analytic memoing,25,26 and generating emergent themes related to our research questions. Because a foundational issue for researchers employing a grounded theory methodology lies in the tension between the inductive creation of categories and codes and the potential for the researchers’ own theoretical sensitivities to influence data-driven analyses and conceptual thinking,21,27 a graduate student research assistant (K.A.M.) joined the team. K.A.M. engaged in data analysis as an outsider (from the Faculty of Education rather than the Faculty of Medicine), which gave her the perspective to check the degree to which the lead researchers’ theoretical sensitivities may have caused an imposition of conceptual categories. We parsed the initial comments into smaller units of meaning for the purposes of coding. Categories emerged as overarching findings (see below) and served as the model of action,28 which we used to discern patterns and relationships within and across each category. Throughout this process, 2 of us (K.A.M. and S.J.-S.) engaged individually in axial coding, using a constant comparative approach,28 and met biweekly to discuss, define, and interrogate not only the developing codes but also the categories’ properties and dimensions.26

결과.
Results

12명의 학생이 등록했고, 10개의 GraphiC 세션에서 12명 전원이 의견을 표명했다. 10개 세션의 모든 대화록은 1,137줄에서 1,976줄의 텍스트 범위였으며, 우리는 처음에 114개의 개별 의견을 분석했습니다. 분석 결과 두 가지 실질적인 결과가 나왔다. 

  • (1) 개념적 프레임워크의 개발 및 
  • (2) 뚜렷한 PIF 테마.

Twelve students enrolled, and all 12 vocalized opinions across the 10 GRAPHiC sessions. The transcripts from all 10 sessions ranged from 1,137 to 1,976 lines of text, and we initially analyzed 114 individual comments. The analysis resulted in 2 substantive findings:

  • (1) the development of a conceptual framework and
  • (2) distinct PIF themes.

개념적 틀의 출현은 의도하지 않았지만 중요한 발견이었다. 학생들의 PIF 경험 분석을 통해, 우리는 그들의 전문적인 이야기를 구성하는 4가지 식별 가능한 구성 요소를 발견했다(그림 1 참조). 사후, 우리는 이것들을 다음과 같은 프레임워크로 구성했다. 

  • (1) 학생 참가자들이 말했던 맥락, 
  • (2) 그들의 이야기의 초점
  • (3) 학생들이 자기성찰을 하도록 자극하는 것처럼 보이는 촉매제
  • (4) 학생들이 그들의 정체성 신념을 처리하는 방법

The emergence of a conceptual framework was an unintended but important finding. Through analyzing students’ experiences of PIF, we found 4 identifiable components that together constituted their professional stories (see Figure 1). Post hoc, we organized these into a framework that comprises

  • (1) the contexts that student participants spoke about,
  • (2) the focus of their stories,
  • (3) the catalysts that seemed to spur students to introspect, and
  • (4) how students process their identity beliefs.

우리는 학생들이 어떻게 처리하고 전문적인 정체성을 형성하는지에 대한 학생들의 설명에서 두 가지 중요한 주제인 존재와 존재가 되는 것을 확인했습니다. 우리는 학생들의 (1) 개인과 (2) 사회적으로 참조되는 성찰을 통해 존재의 두 가지 차원을 확인했다. 학생들이 자신이 어떤 사람이 되고 있는지 설명하면서, 그들은 그들이 관찰하고 임상 환경에서 함께 일하고 있는 의사들과 관련하여 미래의 정체성에 대해 생각하고 있었다.
We identified 2 overarching themes—being and becoming—in students’ descriptions of how they process and form a professional identity. We identified 2 dimensions of being through students’ (1) individual and (2) socially referenced reflections. As students described who they were becoming, they were thinking forward to their future identities in relation to the physicians they were observing and working with in clinical settings.

학생들의 PIF 스토리를 구성하기 위한 개념적 프레임워크
A conceptual framework for organizing students’ PIF stories

학생들은 그들의 직업적 정체성을 형성한 경험을 특정한 [맥락], 즉 그들이 일하고 있는 임상 환경의 시간적, 물리적, 관계적 요소 안에서 찾았다. 학생들은 특히 응급실에서, 첫 번째 임상 순환에서, 또는 진료 교대 후 지도교사의 피드백을 받았을 때 자신의 경험을 되새겼다.
Students located the experiences that shaped their professional identity within a specific context, that is, the temporal, physical, and/or relational components of the clinical environment in which they were working. Students reflected on their experience, specifically, for example, in the emergency department, on a first clinical rotation, or upon getting feedback from a preceptor after a clinic shift.

학생들은 또한 그들의 이야기를 특정한 [초점]에 집중했고, 우리는 그것을 특정한 맥락에서 "그들의 관심을 끄는 것"이라고 정의했습니다. 예를 들어, 학생이 수술실(OR)에서 처음 수술한 경우, 학생의 초점은 팀의 의사소통과 상호작용 또는 이러한 상호작용의 톤과 내용에 맞춰질 수 있다. 각 컨텍스트(예: OR)가 잠재적으로 수백, 심지어 수천 개의 잠재적 초점을 제공할 수 있다는 점을 고려하여, 우리는 학생들이 기록한 특정 정보 조각, 즉 초점을 강조했다.
Students also centered their stories on a specific focus, which we defined as “what held their attention” in that particular context. For example, if the student described the context as a surgical rotation and his or her first time in the operating room (OR), the student’s focus might be on the team’s communication and interactions or on the tone and content of those interactions. Given that each context (e.g., the OR) could provide potentially hundreds, even thousands, of potential foci, we highlighted the specific pieces of information students noted: their focus.

학생들은 종종 특정한 [촉매]가 어떻게 그들이 특정한 맥락과 집중 안에서 그들 자신의 정체성에 대해 반성하고 자기성찰하도록 자극하는지 묘사했다. 예를 들어, 학생은 수업 시간에 전문성에 대한 강의를 들을 수 있었고, 그것은 임상 학습 렌즈가 아닌 PIF 렌즈로 OR 팀의 대화를 볼 수 있는 촉매제가 되었을 수 있다. 즉, 학생은 어떤 관련 환자 정보가 제시되고 있는지가 아니라 "이 상황에서 나는 누구인가?" 또는 "나는 미래에 어떻게 되는지에 대해 무엇을 배우고 있는가?"라고 생각한다.
Students often described how a specific catalyst stimulated them to reflect on and be introspective about their own identity within a particular context and focus. For example, a student could have just heard a lecture in class about professionalism, and that may have become the catalyst to view the OR team’s conversations not with a clinical learning lens but instead with a PIF lens; that is, the student considers not what relevant patient information is being presented but instead ponders, “Who am I in this situation?” or “What am I learning about how to be in the future?”

마지막으로, 본 연구의 초기 목적은 학생들이 [자신의 정체성 신념을 [처리]하거나 협상하는 방법에 대한 지식을 쌓는 과정]이었다. 따라서, 학생들이 그들의 정체성을 처리하는 방법에 대해 더 광범위하게 설명함으로써, 우리는 또한 학생들의 PIF 경험을 패턴화하고 이해하기 위한 우리의 개념 프레임워크의 유용성을 입증했다. 우리는 과정을 학생들의 현재 또는 미래의 직업적 자아에 대한 인식과 탐색으로 정의했다. 학생들은 현재의 정체성(즉, 내가 누구인지)을 가지고 있거나 미래에 자신이 어떤 사람이 될지(즉, 내가 누구일지)에 대한 감각을 가지고 있다고 묘사했다. Being와 Becoming에 대한 각각의 상위 주제 내에서, 우리는 학생 참가자들에 따르면, 그들의 정체성에 대해 내성introspect하거나 처리process하는 [촉매] 역할을 하는 순간의 유형에서 패턴을 확인했다. 아래에서, 우리는 학생들이 그들의 정체성을 어떻게 처리했는지에 대한 분석을 통해 식별된 지배적인 주제와 예시적인 인용문을 결합했고, 우리는 각 인용문의 G 세션, 대본 라인 번호, 그리고 참가자 번호를 기록했다.
Finally, the last component, process—specifically building knowledge about how students process or negotiate their identity beliefs—was the initial aim of this study. Therefore, by elaborating more extensively on how students process their identity, we have also demonstrated the utility of our conceptual framework for patterning and understanding students’ experiences of PIF. We defined process as students’ awareness and navigation of their current or future professional selves. Students described having a sense of their current identity (i.e., who I am) in the present moment or a sense of who they might become in the future (i.e., who I will be). Within each superordinate theme of being and becoming, we identified patterns in the types of moments that, according to our student participants, served as catalysts for introspecting about or processing their identity. Below, we have paired illustrative quotations with the dominant themes identified through our analysis of how students processed their identities, and we have noted the G session, the transcript line numbers, and participant number of each quotation.

존재
Being

학생들이 미래에 어떤 사람이 될 것이 아니라, 그 당시 자신이 누구인지에 대한 개념을 설명할 때, 그들은 자신의 정체성과 관련하여 개인적으로 (나에게) 또는 사회적으로 (나에게) 어떻게 자신을 위치시키는지 구별했다.
When students described their conceptions of who they were in the then-present moment, rather than who they might become in the future, they made distinctions between how they personally (me-to-me) or socially (me-to-them) positioned themselves in relation to their identity.

나 대 나(개인적)의 성찰.
Me-to-me (personal) reflections.

(첫째,) 학생들은 그들이 과거에 누구였는지, 그들의 교육/경력에서 이 시점에서 누가 될 것으로 예상했는지, 그리고 그들이 의사 특유의 방식을 취하기 시작했는지와 관련하여 그들의 진화하는 정체성에 대해 설명했다.
Students described their evolving sense of identity in relation to who they had been in the past, who they expected to be at this point in their education/career, and how they were beginning to take on physician-specific ways of being.

첫 번째 사례에서, 학생들은 현재 자신의 개념화가 이전에 자신이 누구였는지에 대한 개념과 어떻게 대조되는지를 관찰했다. 학생들은 그들의 과거에서 현재의 자신으로 어느 정도 변모하는지를 확인했다. 예를 들어, FS6는 그녀의 첫 제왕절개수술에서 어떻게 "소름끼쳤다"고 언급할 때 새로운 정상 상태를 설명했지만, 이제는 어떻게 "이렇게 빨리 정상화되는지"에 충격을 받았다(G5, 260–287).
In the first case, students observed how conceptualizations of themselves at present contrasted to notions about who they had been previously. Students identified a degree of transformation from their past to present selves. For example, FS6 described a new normal when recounting how she was “horrified” at her first cesarean section but is now shocked at how “things normalize so quickly . . . within a couple of days” (G5, 260–287).

둘째, 학생들은 그들의 변화하는 [자아 의식]이 교육 궤적에서 어떻게 [그들이 누구였는지]와 [그들이 지금쯤 될 것이라고 생각하는 것] 사이에 긴장을 불러일으켰는지를 묘사했다. 어떤 경우에, 학생들은 임상적 맥락의 현실이 그들이 의도하는 의료 제공자의 유형을 훼손한다고 느꼈다. 예를 들어, FS4는 한 환자에게서 좌절을 경험했고 그녀가 "그 인터뷰에 그녀 자신이 아니었다"고 인식했다. 그녀는 다음과 같이 묘사했다.
Second, students described how their shifting sense of self evoked a tension between who they were and who they thought they would be by this point in their educational trajectory. In some cases, students felt the realities of the clinical context undermined the type of health care provider they intended to be. For example, FS4 experienced frustration with a patient and recognized how she “was not [her]self in that interview.” She described:

저는 여전히 예의 바르게 행동했지만, 다른 환자들과 같은 관계를 유지하지는 못했어요. 그리고 5분간의 인터뷰를 마치고 나왔죠. 그리고 저는 그 사건에 대해 정말 부끄러웠습니다. 그날 저는 누군가와 정말 좋은 대화를 나누었습니다. 그리고 제가 갔을 때, "오, 그녀는 놀라운 의사가 될 거야."라고 말하는 것을 들었습니다. 그리고 나는 "그래, 이것이 지금의 나"라고 생각했던 것을 기억한다. (G7, 675–700)
I was still polite, but just—I didn’t really have the same rapport that I have with other patients. And I walked out of that, like, you know, a little 5-minute interview . . . and I was really ashamed of that incident . . . that same day I had a really good interaction with someone. And I had heard them when I went away, say, “Oh, she’s going to be, like, an amazing doctor.” And I remember thinking, “Yeah, like, this is who I am now.” (G7, 675–700)

이 사례와 다른 사례에서, 학생들은 자신이 누구여야 한다고 느끼는 열망과 자신이 누구인지를 보여주는 실제 사례를 대조했다.
In this, and other instances, students contrasted a real-life example of who they were with aspirations of who they felt they should be.

셋째, 학생들은 [일하는 방식, 사고 방식, 기여 방식]에서 의사(즉, 학생이 아닌) 정체성을 채택하는 방법을 설명했다. 그들은 의사들과 동등한 입장에서 결정을 내리던 경험을 되새겼다. 예를 들어, MS5는 "내가 말한 것이 실제로 환자의 치료에서 일어난 일로 번역되었다는 것이 다소 놀랍다"(G7, 38-97)고 언급하였다. 일부 학생들은 의사처럼 생각하거나 더 많은 인내심을 갖고 책임을 지는 경우를 의사처럼 느끼는 것과 연결시켰다. 다른 이들은 환자나 학습에 대한 주인의식의 변화를 묘사했다. 예를 들어, 한 학생은 그의 정신의학적인 순환이 그가 부분적으로 주인의식을 느낄 수 있게 해주는 방법을 강조했습니다, 왜냐하면 그는 보았기 때문입니다.
Third, students described how they were adopting physician (i.e., not student) identities in their ways of working, thinking, and/or contributing. They reflected on experiences in which they were making decisions on equal footing with physicians. For example, MS5 stated that “it was kind of amazing that what I was saying actually translated to what happened with the patient’s care” (G7, 38–97). Some students linked instances of thinking like a physician or taking on more patient responsibility to feeling more like a physician. Others described a shift in their sense of ownership over patients or their learning. For example, 1 student emphasized the ways in which his psychiatry rotation allowed him to feel a sense of ownership, in part, because he saw

제가 인정한 환자들—그래서 저는 큰 주인의식과 그들이 저의 환자라고 느꼈습니다. 나는 그들을 [나의 스승]보다 더 잘 안다고 느꼈다. 그래서 나는 정신과 의사처럼 느꼈다. (G8, 430–489)
patients that I admitted and—so I felt like a huge sense of ownership and that they were my patients. I felt like I knew them better than [my preceptor] did . . . so I did feel like a doctor in psych. (G8, 430–489)

그는 그 경험을 자신의 피부과 로테이션과 대조했는데, 그 기간 동안 그는 스스로 환자를 보지 않았기 때문에 의사처럼 느껴지지 않았다. 이 예시와 다른 예는 학생들이 자신을 의사로 보기 시작하면서 어떻게 자신의 PIF를 탐색했는지 보여준다.
He went on to contrast that experience to his dermatology rotation, during which he did not feel like a physician because he was not seeing patients on his own. This and other examples illustrate how students navigated their own PIF as they began to see themselves as physicians.

나 대 그들(사회적)의 성찰.
Me-to-them (social) reflections.


학생들은 자신을 일반인, 주어진 상황/사건이 정상적인 건강 전문가, 그리고 개업 의사들과 구별함으로써 타인과 관련된 이동 또는 새로운 정체성을 찾았다.

Students located their shifting, or new, identity in relation to others by distinguishing themselves from laypeople, from health professionals for whom a given context/occurrence is normal, and from practicing physicians.

학생들은 임상적 맥락이나 개인 생활에서 그들의 새로운 정체성이 [일반인]과 어떻게 다른지를 분명히 했다. 그들은 자신에 대한 새로운 사고방식이 타인과의 상호작용에 어떻게 귀속될 수 있는지 개략적으로 설명했고, 그들은 이러한 새로운 경험과 관점이 어떻게 그들이 자신을 다른 것으로 인식하거나 인식하는데 도움이 되었는지를 묘사했다. 예를 들어, FS6는 그녀가 더 이상 "우리가 하는 것 중 일부에 놀라지 않는" 방법을 설명했다. 그녀는 "마치, 요전 날 한 남자의 코를 다시 꿰매고 있었던 것 같다…. 평범해지는 것은 일종의 야생이다…. 나는, 내 가족이 지금 나를 볼 수 있다면, 이것은 미친 짓일 것이다."라고 자세히 설명한다. (G7, 195–245). 또 다른 예로, MS7은 신경질적인 의대 2학년 학생과의 대화가 어떻게 그가 더 후배인 누군가와 자신이 어디에 있는지 생각하도록 자극했는지를 인식했다.
Students articulated how their new identities differed from those of laypeople either in the clinical context or in their personal lives. They outlined how new ways of thinking about themselves could be attributed to interactions with others, and they described how these new experiences and perspectives helped them appreciate or perceive themselves as different. For example, FS6 described how she is no longer “amazed by some of the things we do.” She elaborates, “Like, I was sewing a guy’s nose back together the other day . . . it’s just kind of wild what becomes the norm . . . I’m like, if my family could see me right now, this would be crazy” (G7, 195–245). In another instance, MS7 recognized how a conversation with a nervous second-year medical student spurred him to think about where he was in relation to someone more junior:

나는 산부인과에 들어간 지 2주가 지났고 방금 산부인과 수술을 마쳤다. 그리고 우리는 분만 중이었고 2년차도 마찬가지였습니다. 왜냐하면 그들은 주치의의 뒤를 따라다녔기 때문입니다. 2학년 학생이 제게 와서 이렇게 말했습니다. "저는 수술실에서 X박사를 따라다니며, 그것에 대해 매우 긴장할 것입니다. 수술실에 들어가 봤어요? 그것에 대해 조금 말해줄 수 있니?" 그래서 산부인과 병동 뒤쪽에 있는 수술실로 데려가서 스크럽 방법이나 모든 것을 보여줬고 규칙이나 무균 밭이나 모든 것을 지켰습니다. 그리고 10분에서 15분 정도 있으면 그녀는 "와,와,와, 이건 너무 심해요. "어떻게 이런 걸 배웠어요?" 그리고 나는, 와, 사실 이런 것들을 배웠다는 것을 깨닫지 못했다. 지금처럼 그것은 제2의 자연과 같다. (G7, 346–371)
I’d been 2 weeks into obstetrics and just finished the surgery portion of obstetrics. And we were in labor delivery and a second year was in as well because they were shadowing a family doctor. The second year came to me and said, like, “I’m going to be shadowing Dr. X in OR, super nervous about it. Have you been in OR? Can you tell me a bit about it?” And so then I actually just took her to, like the OR that’s in the back of the obstetrics ward and showed her, like, how to scrub and everything and, like, stick to rules and sterile fields and everything. And, like, maybe 10, 15 minutes in she was like, “Whoa, whoa, whoa, this is way too much. How did you learn this stuff?” And I didn’t realize, like, wow, I actually have learned this stuff . . . like now it’s just like second nature. (G7, 346–371)

이 학생들은 그들이 공식적으로 맡은 [일반인 위치 또는 주니어 학습자 역할]에서 벗어났다는 느낌을 보여주었다.
These students demonstrated a sense that they had moved on from the layperson positions and/or junior learner roles they formally occupied.

학생들이 자신을 다른 사람들과 구별하는 두 번째 방법은 [어떤 일은 다른 사람들에게는 평범했지만 그들에게는 놀라웠다]는 감각이었다. 예를 들어, FS8은 그녀가 처음으로 제왕절개를 목격했을 때 다음과 같이 기술했다."어느 순간 산부인과 의사가 복부에서 자궁을 꺼내 마사지를 시작합니다. 그리고 그것이 수축하는 것을 돕는 것은... 나팔관과 모든 것"—그녀가 "수술실에 있는 다른 모든 사람들에게는 정상이지만" "처음 수술실에 있을 때는 특별하다"라고 묘사한 사건이다. 그녀는 "어떻게 이것이 정상인가?"라고 생각했던 것을 기억한다. (G5, 202–228) 이러한 성찰은 초보자로서의 정체성 때문에 학생 스스로가 임상적 맥락에서 타인을 느끼는 방식을 보여준다.
A second way in which students distinguished themselves from others was in their sense that remarkable occurrences were not as normal to them as they were to others. For example, FS8 described the first time she was in the OR witnessing a cesarean section—“At one point, the obstetrician . . . pulls [the uterus?] out of the abdomen and starts kind of massaging it. And helping it contract . . . fallopian tubes and all”—an occurrence, which she framed as “normal for everybody else in the OR but” extraordinary “when you’re in the OR for the first time.” She recalls thinking, “How is this normal?” (G5, 202–228). This reflection illustrates the ways in which students themselves felt othered in the clinical context because of their identity as novices.

학생들이 그들의 진화하는 정체성에 대해 설명하는 세 번째 방법은 [그들이 의사와 어떻게 관련되는지]에 있었다. 어떤 경우에는 학생들이 의사처럼 느끼는 것을 묘사하는 반면, 다른 경우에는 그들은 자신을 개업 의사들과 구별되는 존재로 묘사했다. 한 예로, FS6는 환자의 이야기를 이해하려고 노력하는 것이 "의사보다 의대생으로서 더 쉽다"고 설명했다. 그녀는 다음과 같이 말합니다. "만약 내가 응급 상담이나 뭐 그런 것에 20분을 할애한다면, 아무도 나에게 화를 내지 않을 것입니다. 하지만 실제 의사라면 그럴 시간이 그리 많지 않을 것 같다."(G7, 1103–1155) GraphiC 세션 동안, 한 의사가 환자에게 말기 암에 대한 진단을 어떻게 전달했는지 동료로부터 들은 후, 여러 학생들은 그들 자신을 [의사와 학생 역할에 걸쳐 있다]고 묘사했다. 한 학생(MS2)은 다음과 같이 말했다.
A third way in which students described their evolving sense of identity was in how they related to physicians. While in some cases students described feeling like a physician, in others, they described themselves as distinct from practicing physicians. In one example, FS6 described how trying to understand patients’ stories is “easier as a medical student than a doctor.” She notes: “If I take 20 minutes for an emergency consult or whatever, no one’s going to be mad at me. But when you’re an actual doctor, I think you don’t have quite as much time to do that” (G7, 1103–1155). During a GRAPHiC session, after hearing from a peer about how a physician communicated a diagnosis of terminal cancer to a patient, multiple students described themselves as straddling the doctor and student roles. One student (MS2) commented:

학생으로서 우리는 뒤로 물러서서 지켜볼 수 있습니다. 그리고 우리는 그것을 매우 명확하게 봅니다. 그리고 저는 어떤 상황들이 있다고 확신합니다. 우리가 얼마나 지겨워졌음에도 불구하고, 저는 우리가 그것을 갖는 것에 대해 매우 독특한 무언가가 있다고 생각합니다. 관찰하기 위해 뒤로 물러서는 것과 같은 것입니다.
In being a student . . . we get to stand back and just watch . . . and we see it so clearly. And I’m sure that there are situations—if we, despite how jaded we become, I think there’s something so unique about having that—sort of step back to just observe.
FS8은 "글쎄요, 저는 우리가 거의 다리에 도달한 것처럼 느껴져요. 마치, 우리는 한 발을 넣고, 한 발을 빼는 것 같습니다." MS2는 이에 동의했다: "당신이 옳습니다. 두 세계 모두 기본적으로" (G5, 655-682)이다.
FS8 responded by noting: “Well, I kind of feel like we’re almost the bridge. Like, we kind of have one foot in, one foot out.” MS2 agreed: “You’re right. Both worlds basically” (G5, 655–682).

되는 것
Becoming

주요 발견은 미래 정체성에 대한 학생들의 압도적 다수가 [임상적 맥락에서 의사들에 대한 관찰에 대한 반응]이었다는 것이다. 한 학생(MS7)은 학생들에게 전문성의 모범이 되는 "어마어마한incredible" 내과의사에 대해 언급하며, 학생들이 자신에 대한 높은 기준을 갖도록 도왔다. 그 학생은 내과의사의 모델을 기반으로 자신의 기준을 설정하는 것을 설명했습니다.
A major finding was that the overwhelming majority of students’ conceptualizations about their future identities were responses to observations about physicians in clinical contexts. One student (MS7) spoke of an “incredible” internist who was an exemplar of professionalism for students, helping them to have high standards for themselves. The student described setting his own standards based on the internist’s model:

이게 닥터 X가 할 일인가요? 그녀가 할 수 있는 방법인가요? 아니면, 그녀가 어떻게 했을까요? 더 많은 시간을 보내고 더 많은 질문을 하고 더 오래 듣겠죠 닥터 X가 그랬을 겁니다. 이것이 공식이 될 것입니다. 그리고 저는 그냥 제 자신에게 상기시킵니다. 아니, 그게 공식이야. 그냥 시간을 좀 더 쓰세요. 좀 더 들어보세요. 더 많은 질문을 하는군요. 좀 더 생각해 보세요. (G2, 936–998)
Is this something Dr. X would—is this the way she would do it? Or, how would she do this? And I know she would just spend more time and she’d ask more questions, and she’d listen a lot longer. Dr. X would—is this [what] the formula would be, and I just remind myself. No, that’s the formula. You just spend more time. You listen a bit more. You ask more questions. You think about it a bit longer. (G2, 936–998)

학생들은 의사들이 환자에 대해 둔감하다는 것을 인식했을 때 실망감을 표시했다. 설명하자면, MS1은 환자에게 공감을 느꼈음에도 불구하고 무신경한 지도자의 접근 방식을 흉내낼 때 느끼는 긴장을 다음과 같이 묘사했다.
Students expressed dismay when they perceived physicians to be insensitive toward patients. To illustrate, MS1 described the tension he felt when he mimicked an insensitive preceptor’s approach—even though he felt empathy toward the patient:

그리고 나는 그것에 대해 기분이 나빴다. 마치, 제가 느꼈던 것처럼요. 사실 제가 환자를 정말 불쌍히 여겼거든요. 하지만 동시에, 나는, 마치, 내가 뭘 알고 있는 것 같았어. 이 사람의 [preceptor]는 오랫동안 이 환자를 다뤄왔고, 그들에 대해 몇 가지 이야기를 해줘서 그들이 무슨 말을 하는지 알고 있는 것 같고 나는…. 하지만 그는 환자에 대한 공감이 별로 없어 보였고…. 만성적인 고통에 대한 공감이 큰 부분을 차지할 것 같은 곳 중 하나였습니다.저기서 일어나고 있어요. 하지만, 네, 그것은 저에게 그저 흥미로운 경험이었어요. 나는 그것이 다시 일어날 것이라는 것을 알고 있고 나는 항상 나 자신에게 그런 사람이 되고 싶지 않다고 말한다. (G1, 466–516) 
And I felt bad about it. Like, I felt—’cause I actually kind of really did feel for the patient. But at the same time, I was, like, what do I know? This person’s [preceptor] been dealing with this patient for a long time and tells me a few stories about them so I guess they know what they’re talking about and I don’t. . . . But he didn’t seem to have a lot of empathy for the patients. . . . It was for chronic pain so it’s one of those places where you’d think empathy would be a big part of what’s going on there. But yeah, it was just an interesting experience for me. I know it’s going to happen again and I always tell myself I don’t want to be that person. (G1, 466–516)


퍼실리테이터가 학생 참가자들에게 [그들이 되고 싶지 않은 의사가 되는 것]을 피할 수 있는 방법을 생각해보도록 자극했을 때, 학생들은 거의 잠재적인 해결책을 공유하지 않았다. 대신에, 그들은 [MS1]의 논평에서 예시되었듯이, 대부분 시간이 지남에 따라 필연적으로 둔감해짐을 암시했다.
When the facilitator prompted the student participants to consider how they might avoid becoming the physicians they did not want to become, the students rarely shared potential solutions. Instead, they mostly alluded to the inevitability of becoming insensitive over time, as exemplified by [MS1]’s comment:

내가 항상 이런 걸 보는 지경에 이르긴 싫다. 암에 걸린 사람을 하루에 50명씩 본다. '당신은 하루에 한 번 암에 걸린다'는 말이군요. 오늘처럼요. 우리는 모두 그곳에 도착할 것이고, 어쩌면 모두 그럴지도 모릅니다. 하지만 나는 원하지 않는다. (G5, 632-654)
I don’t want to get to the point where I’m, like, well, I see this all the time. People have cancer 50 times a day for me. It’s ‘you have cancer 1 time a day’ for you, like, today. . . . We’ll all just get there and maybe we all will. But I don’t want to. (G5, 632–654)

요약하자면, 학생들은 [더 경험이 많은 의사들로부터 본 것에 대한 반응]을 통해서 [미래에 그들이 될 수 있는 사람]에 대해 생각했다.

In sum, students reflected on the person they might become in the future in response to what they saw from more experienced physicians.

논의
Discussion

[비판적 성찰]은 [사회적 영역(예: 의대생, 레지던트, 의사) 내의 역할 지정role designation]이 [어떻게 전문적 정체성으로 내재화되고 자아의 개념을 형성하는지]를 이해하는 강력한 도구이다.11 본 연구에서 우리는 의대생들이 어떻게 [변화하는 정체성에 대해 의식적으로 성찰]하기 시작하는지를 밝혀내려고 했다. 또한 어떤 종류의 경험이 그러한 성찰을 끌어냈는지도 알아보고자 했다.
Critical reflection is a powerful tool for understanding how role designations within the social realm (e.g., medical student, resident, physician) are internalized into a professional identity and shape the conception of self.11 In this study, we sought to uncover not only how medical students begin to consciously reflect on their changing identities but also what kinds of experiences they drew on to do so.

학생들에게 깊은 [자각의 감정feelings of awareness]을 불러일으키는 것처럼 보이는 순간들은 [종종 다른 사람들이 (심지어 사후에도) 주목할 만한 것으로 인식하지 못하는 순간들]이다. PIF 연구는 종종 나중에 강력하다고 쉽게 인식할 수 있는 큰 사건(예: 학생들이 시신과 함께 작업하거나 환자의 죽음을 처음 경험하는 경우)에 초점을 맞추는 반면, 우리의 연구에서 우리는 학생들에게 중요한 순간들이 종종 다른 사람들에게는 [일상적 순간]이라는 것을 관찰했다(예: 친구나 가족과 대화하는 것, 일상적 수술 작업). 학생들은 그들의 초기 임상실습에서의 일상적인 경험에 대한 반응으로 그들의 정체성을 정의하고 협상하는 거의 지속적인 행동에 참여하고 있기 때문에, 이러한 순간들이 언제 일어날지 아는 것은 어렵다. 그러나, 의학 교육자들이 그들의 직업적 정체성을 협상하면서 학생들이 성찰할 수 있는 일부 경험이 다른 경험보다 더 생산적이라고 가정한다면, 이번과 같은 연구는 - 학생들이 집중하는 종류의 순간에 대한 통찰력을 제공하는 - 긍정적인 PIF를 적극적으로 지원하려는 노력을 안내할 것이다.
The moments that seem to generate profound feelings of awareness in students are often moments that others would not recognize (even post hoc) as remarkable. While PIF research often focuses on the big events that are easily recognizable as powerful afterward (e.g., the first time students work with a cadaver or experience the death of a patient), in our research, we observed that significant moments for students were often mundane for others (e.g., talking to lay friends and family members, a routine operative task). Because students are engaged in the near-constant act of (re)defining and (re)negotiating their identities as a response to their day-to-day experiences in early clerkship, knowing when these moments will occur is difficult. However, if medical educators assume that some experiences are more fruitful than others for students to reflect on as they negotiate their professional identity,29 then studies like ours—that provide insight into the kinds of moments students focus on—will guide efforts to actively support positive PIF.

여기에 기록한 성찰이 촉구되었지만, 정체성에 대한 성찰은 종종 (항상 그렇지는 않더라도) 참여/타자화participating/othering의 과정이다. 개인들은 적절한 임상적 자율성과 환자의 치료에 대한 주인의식을 가질 때 의사로서의 강한 의식을 느꼈다. 이러한 관찰은 학생들이 [의미 있는 관계에 참여]하고, [실질적인 책임(즉, 종적 통합 임상실습)을 수행할 수 있는 환경]이 전문적 정체성의 형성에 영향을 미친다는 다른 연구자들의 발견과 일치한다. 학생들의 정체성에 대한 개념화는 [적응적adaptive]이었다. 그들은 정체성에 대한 그들의 개념이 일반인(예: 환자, 가족), 다른 학생 및 의료 전문가와 어떻게 관련되어 있는지에 기초했다. 그들은 임상적 맥락과 대인관계에서 얻은 경험을 바탕으로 그것들이 어떻게 포함/배제되었는지를 묘사했다. 학생들이 자신의 경험을 사용하여 표준화된 건강 전문가 관점을 형성했다는 이 발견은 PIF에 대한 사회문화적 맥락의 영향을 강조한다.

While the reflections we have recorded here were prompted, reflection on identity is often (if not always) a relational process of participating/othering. Individuals felt a stronger sense of being a physician when they had appropriate clinical autonomy and a sense of ownership over patients’ care. This observation aligns with the findings of others who observed that contexts in which students are allowed to engage in meaningful relationships and to carry real responsibilities (i.e., longitudinal integrated clerkships) influence the formation of professional identity.30,31 Students’ conceptualizations of identity were adaptive; they based their notions of identity on how they were relating to laypeople (e.g., patients, family members), other students, and health care professionals. They drew on experiences from clinical contexts and interpersonal interactions to describe how they were included/excluded. This finding—that students used their experiences to form a normalized health professional perspective—underscores the influence of the sociocultural context on PIF.32–34

학생들은 현재 또는 미래의 정체성을 묘사하는 방식으로 증명된 [임시적 정체성 개발]을 경험했으며, 때로는 이 시점에서 [자신이 누구여야 한다고 생각했는지에 대한 믿음]과 관련하여 경험했다. [그룹 토론과 비판적이고 서사적인 성찰]은 다음의 것들의 상호 작용을 고려하면서 학생을 지원할 수 있는 잠재력을 가지고 있다. 

  • (1) 존재에 대한 감각(예: 나는 학생이다); 
  • (2) Becoming, "전문지식의 도착 및 최종점 달성 개념을 회피하는 반복iterative 개념"이 된다. 
  • (3) 정체성 불협화음의 경험 

이러한 토론과 성찰은 또한 학생들이 [직업적 헌신과 가치]를 재정의하고 강화하는 데 도움이 될 뿐만 아니라, [직업적 정체성professional identity]을 재정립하고 협상할 수 있는 그들의 능력을 뒷받침할 수 있는 [직업적 행위자 의식sense of professional agency]을 구축하는 데 도움을 줄 수 있는 잠재력을 가지고 있다. 특히, 학생들은 [의사가 되는becoming a physician] 측면을 예측할 때 [학생으로서의 존재being a student]으로서의 감각을 쉽게 긍정하고affirmed, 더 모호함을 표현했다. 그러나, 예를 들어, 그들은 자신의 경험을 비전문가와 연관시킬 때 의사로서의 의식을 표현했다. 비슷하게, Becoming이라는 것은 [4학년 학생이 되는 것]이나 [1년차 레지던트가 되는 것] 또한 포함되었고, [의사가 되는 것]이라는 최종 목표만을 포함하지는 않았다. 학생들이 PIF 과정에 참여할 때 ["학습자" 정체성의 정당성]에 대한 의도적인 인식을 촉진하는 것은 [현재 정체성과 미래 정체성 사이의 긴장을 완화]하는 데 도움이 될 수 있다. 

Students experienced identity development temporally as evidenced in the ways they described their current or future identities, sometimes in relation to beliefs about who they thought they would/should be by this point. Group discussions and critical, narrative reflection have the potential to support students as they consider the interplay among

  • (1) their sense of being (e.g., I am a student);
  • (2) becoming, which is “an iterative concept that eschews notions of arrival and end-point achievement of expertise”35; and
  • (3) experiences of identity dissonance.5,6,36,37 

Such discussions and reflection also have the potential to help students not only redefine and strengthen professional commitments and values38 but also build a sense of professional agency,39 which can, in turn, support their capacity to reshape and negotiate professional identity.4,40 Notably, students readily affirmed their current sense of being a student and expressed more ambiguity when forecasting aspects of becoming a physician. They did, however, express an awareness of being a physician when, for example, they related their experiences to laypersons. Similarly, becoming also included becoming a fourth-year student or a first-year resident and did not include just the end goal of becoming a physician. Fostering students’ intentional awareness of the legitimacy of their “learner” identity as they engage in the process of PIF might help mitigate tensions between students’ current and future identities.41

GraphiC와 같은 맥락은 학생들에게 "내가 누구냐"를 협상하면서 그들 스스로와 다른 사람들의 독특한 관점을 그릴 수 있는 기회를 제공한다. 또한 이러한 맥락은 학생들이 (집단적 "우리"의 일부가 되는 것이 아니라) 자신의 [고유한 정체성]을 적극적으로 구성할 수 있게 할 뿐만 아니라, 그들이 되고 있는 동안 존재의 상호 작용을 협상하는 데 도움을 준다. 실제로, 전문적 정체성의 개발 과정에 초점을 맞춘 향후 연구는 [PIF에 식별 가능하고 바람직한 종점이 있다]는 개념과 싸우는 데 도움이 될 것이다. 이러한 연구는 학생들의 다양한 관점과 위치가 그들이 존재의 순간과 존재의 순간에 관여할 때 그들의 개별 궤적에 어떤 영향을 미치는지 도표화하고 조사해야 한다. 
Contexts such as GRAPHiC provide students with the opportunity to draw on their own and others’ unique perspectives while negotiating “who I am.”42,43 Additionally, such contexts not only allow students to actively construct their unique identities (rather than becoming part of a collective “us”) but also help them negotiate the interplay of being while they are becoming.44 Indeed, future research focused on the process of developing a professional identity will help combat the notion that there is a discernible and desirable end point to PIF. Such research should chart and examine how students’ diverse perspectives and positionalities influence their individual trajectories as they engage in moments of being and in moments of becoming.42

우리의 데이터는 자기 성찰에 협력적으로 참여하려는 열망을 가지고 있다고 가정할 수 있는, 소수의 자발적 참여자 의대생들의 토론을 기반으로 한다. 참여자의 수가 적다는 것은 개념적 프레임워크가 독특한 학생 경험에 기초하고 있으며 일반화할 수 없다는 것을 의미한다. 참여한 개인의 수는 적을 수 있지만, 10개의 포커스 그룹 만남을 갖는 것은 [중요한 이행의 시기에 걸쳐 포괄적이고 종단적인 데이터 세트를 산출하여 학생들이 여행을 탐색하는 과정을 심층적으로 분석]할 수 있게 한다. 향후 연구는 집단 성찰에 참여하는 여러 학생 집단의 연구 결과를 비교하거나 참여자 수를 증가시킴으로써 표본 크기와 참여자 개방성의 이러한 문제를 해결할 수 있다. 우리의 개념 프레임워크는 단지 12명의 참가자를 기반으로 하기 때문에, 향후 연구는 개념 프레임워크가 PIF의 프로세스를 이해하기 위한 강력하고 적용 가능하며 일반화 가능한 접근 방식인지 여부를 조사하는 데 초점을 맞출 수 있다.
Our data are based on the discussions of a small number of volunteer medical students who, as volunteers, might be assumed to possess an eagerness to engage collaboratively in self-reflection. The small number of participants also potentially means that the conceptual framework is based on a unique student experience and may not be generalizable. While the number of individuals who participated may be small, having 10 focus group encounters yielded a comprehensive, longitudinal set of data over a critical transition time, allowing an in-depth analysis of students navigating their journeys. Future research might address these issues of sample size and participant openness either by comparing findings across multiple cohorts of students engaging in group reflection or by increasing participant numbers. Since our conceptual framework is based on just 12 participants, future research might focus on examining whether the conceptual framework is a robust, applicable, and generalizable approach to understanding the process of PIF.

본 연구의 또 다른 잠재적 한계는 퍼실리테이터가 학생들의 서술과 성찰에 영향을 미쳤을 수 있다는 것이다. GRAPiC 과정은 학생들이 의대 경험을 고려했을 때 학생들을 지원하는 것을 제외하고 촉진자의 간섭을 거의 받지 않고 4단계 접근(위에서 설명)을 통해 숨겨진 커리큘럼에 참여할 수 있도록 하기 위해 고안되었습니다. 본 연구에서는 학생들의 PIF에 대한 사후 분석을 수행하였으므로 촉진자의 반응이 정체성 형성에 대한 GraphiC 논의에 영향을 미치지 않는다고 가정하였다. 그러나 강사 존재는 의심할 여지 없이 그룹의 논의를 형성했으며, 향후 연구는 또래 주도의 그룹이 교육자 주도의 그룹과 어떻게 다르게 성찰에 참여하는지를 조사할 수 있다.

Another potential limitation of this study is the influence the group facilitators may have had on student narratives and reflections. The GRAPHiC course was designed to empower students to engage in the hidden curriculum through a 4-step approach (described above) with little interference from facilitators—except to support students as they considered their medical school experiences. In the present study, we conducted a post hoc analysis of students’ PIF; therefore, we assumed that facilitators’ responses did not influence the GRAPHiC discussions of identity formation. However, instructor presence undoubtedly shaped the groups’ discussions, and future research might examine how peer-led groups engage in reflection differently from educator-led groups.

우리의 연구 접근 방식은 학생들이 언제, 어떻게, 왜 그들의 새로운 직업 정체성을 반성하고 협상할 기회를 잡았는지에 대한 이해를 뒷받침했다. 우리의 분석은 여러 가지 방법으로 사용될 수 있는 개념적 프레임워크를 생성했다. 여기서 보는 바와 같이, 개념적 프레임워크는 연구자들이 학생들의 여정에 대한 성찰의 다양한 측면을 탐구할 수 있게 함으로써 PIF의 복잡한 개념을 이해하는 데 도움이 된다. 구체적으로, [촉매]의 개념은 학생들이 경험, 대화, 성찰 등을 사용하여 정체성 변환의 과정과 성찰에 불을 붙이는 새로운 방법이다. 의학교육자들은 또한 [촉매]의 개념을 적용하여 무엇이 학생들이 그들이 누구이고 누가 되고 있는지 성찰하도록 자극하는지를 이해하기 위해 커리큘럼 및 학습 환경의 측면을 능동적으로 검토할 수 있다. 더 넓게 말하면, 개념적 프레임워크를 통해 학생들이 다음의 것을 어떻게 하는지를 비판적으로 바라볼 수 있다.

  • 어떻게 학습 환경(즉, 맥락)에서 제공하는 엄청난 양의 정보를 어떻게 활용하고 있는지
  • 어떻게 실천 공동체를 통해 자신의 여정을 탐색하는 데 도움이 되는 특정 측면(즉, 포커스)의 핵심을 잡는지

Our research approach supported our understanding of when, how, and why students took up opportunities to reflect on, and negotiate, their emerging professional identities. Our analysis produced a conceptual framework that could be used in several ways. As shown here, the conceptual framework is helpful for understanding the complex concept of PIF by allowing researchers to explore different aspects of students’ reflections about their journeys. Specifically, the concept of catalyst is a novel way of looking at how students use experiences, conversations, reflections, etc., to spark their own process of, and reflection on, identity transformation. Medical educators could also apply the notion of catalyst to proactively examine aspects of the curriculum and/or learning environment to understand what is sparking students to reflect on who they are and who they are becoming. More broadly, the conceptual framework allows medical educators to look critically at how students are

  • taking the overwhelming amount of information being presented to them across learning environments (i.e., contexts) and
  • keying in on certain aspects (i.e., focus) that help them navigate their journey into and through a community of practice.

우리는 학생들이 문맥, 초점 및 촉매와 정체성 처리와 어떻게 관련되는지 조사하기 위해 향후 연구에서 근거 이론 접근법과 우리의 새로운 개념 프레임워크를 사용할 계획이다. 또한, 우리의 새로운 개념 프레임워크는 의학교육 및 기타 건강 분야 내에서 학습자 및 다른 사람들의 정체성 개발에서 맥락, 초점, 촉매 및 과정이 발현되는 방식을 질문하고자 하는 다른 연구자들에게 자원으로 작용할 수 있다. 의학 교육 연속체에 걸쳐 [겉보기에 작은 순간들]의 잠재적인 영향과 PIF의 [개인과 사회적 측면 사이의 성찰적 상호 작용]을 이해하는 것은 학생들이 의사가 되는 것을 배우는 것을 지원하는 데 도움이 될 것이다.

We plan to use a grounded theory approach and our novel conceptual framework in future studies to examine how students relate context, focus, and catalyst to processing identity. Further, our novel conceptual framework might serve as a resource for other researchers who wish to interrogate the ways in which context, focus, catalyst, and process manifest in learners’ and others’ developing identities within medical education and other health disciplines. Understanding the potential influence of seemingly small moments across the medical education continuum and the reflective interplay between the individual and social aspects of PIF will help medical educators support students learning to become physicians.

 

 

 


Acad Med. 2019 Oct;94(10):1574-1580. doi: 10.1097/ACM.0000000000002835.

Understanding Professional Identity Formation in Early Clerkship: A Novel Framework

Affiliations collapse

Affiliation

1S. Jarvis-Selinger is professor and associate dean, Faculty of Pharmaceutical Sciences, and former director of curriculum, Undergraduate Medical Education, Faculty of Medicine, The University of British Columbia, Vancouver, British Columbia, Canada; ORCID: https://orcid.org/0000-0001-9926-2569. K.A. MacNeil is a PhD candidate, Department of Educational Counselling, Psychology, and Special Education, Faculty of Education, The University of British Columbia, Vancouver, British Columbia, Canada; ORCID: https://orcid.org/0000-0002-8050-0819. G.R.L. Costello is clinical instructor, Department of Family Practice, Faculty of Medicine, The University of British Columbia, Vancouver, British Columbia, Canada. K. Lee is a fourth-year pediatrics resident, BC Children's Hospital, Vancouver, British Columbia, Canada; ORCID: https://orcid.org/0000-0001-5164-105X. C.L. Holmes is clinical professor, Department of Medicine, Division of Critical Care, and associate dean, Undergraduate Medical Education, Faculty of Medicine, The University of British Columbia, Vancouver, British Columbia, Canada; ORCID: https://orcid.org/0000-0001-5857-2704.

PMID: 31192797

DOI: 10.1097/ACM.0000000000002835

Abstract

Purpose: Medical educators should foster students' professional attitudes because individuals are more likely to act in accordance with medicine's professional values if these values have been internalized. Still, there is much to be learned about how students examine and negotiate their emerging identities. This study examined third-year medical students' experiences of professional identity formation (PIF) during clinical clerkship.

Method: The authors relied on an interpretivist perspective, informed by a grounded theory approach, to analyze data, which were collected from a pilot course designed to support medical students' efforts to "unhide" the hidden curriculum in relation to their development as medical students and emerging professionals.

Results: Twelve third-year medical students engaged in 10 collaborative discussions with 3 faculty members, a resident, and a fourth-year student (2015-2016). Discussions facilitated students' reflection on their professional journeys. Analysis of transcribed discussions resulted in a conceptual framework useful for exploring and understanding students' reflections on their PIF. Through analyzing students' experiences, the authors identified 4 components that constituted PIF stories: context, focus, catalyst, process.

Conclusions: The analysis resulted in the development of a conceptual framework and distinct identity formation themes. Discrete reflections focused on either students' current identity (being) or their sense of future self (becoming). The study identified catalysts that sparked participants' introspection about, or their processing of, identity. The moments that generate profound feelings of awareness in students are often moments that would not be recognizable (even post hoc) as remarkable by others.

 

교육: 표현의 자유? (Med Educ, 2022)
Teaching: The expression of freedom?
Zareen Zaidi

 

필자는 Freire의 영향을 받은 학자로서, 이전에 식민지화된 국가에서 교육을 받고, 전 세계 북부에서 의료 교육 도구와 관행의 구현에 대해 교육을 받았으며, 그 후 전 세계 남부에서 이러한 접근 방식을 활용했다. Du et al의 문제 기반 학습(PBL) 촉진자 역할을 협상하는 보건 교육자의 전문 기관에 대한 기사는 나의 관심을 끌었다. 파울로 프레이레는 교육학을 매우 정치적인 관행이기도 한 자유의 실천으로 보았다. 이러한 비판적이고 탈식민지적인 관점에서, 나는 외부 신자유주의/서구적 모델이 카타르에 있는 Du et al의 PBL 촉진자들의 기관에 미치는 영향에 대해 궁금해하고 이 논평에서 몇 가지 관점을 논의하였다.
As a Freirean-inspired scholar who has been educated in a previously colonised country, trained in implementation of medical education tools and practices in the global North, and has then utilised these approaches in the global South, Du et al.'s1 article on health educators' professional agency in negotiating their Problem-Based Learning (PBL) facilitator roles captured my attention. Paulo Freire viewed pedagogy as a practice of freedom that is also an eminently political practice. From this critical and decolonial point of view,2-4 I wondered about the impact of external neoliberal/western models on the agency of Du et al.'s PBL facilitators in Qatar and discuss some perspectives in this commentary.

세계적으로 의학교육의 기초는 '신자유주의'라는 이념에 점점 더 기반을 두고 있다. 신자유주의란 모든 경제활동에서 [민간부문의 역할]을 높이기 위해 노력하면서, [국가의 간섭을 제한함]으로써 자본주의를 통한 진보를 이룰 수 있다는 이념이다.5 교육 기관은 시장 주도형이며, 경쟁력을 강조한다. 신자유주의는 교육이 더 많은 표준화와 교수진의 더 많은 관리 통제와 함께 비즈니스 세계를 모델로 삼을 것을 요구한다. 신자유주의적 관점에서 교직원은 (Freire에 따라) 부차적인 계급으로 간주되거나, 학생들이 고객으로 보는 관점과 별합하여 army of labour로 간주된다. 
Globally, the foundations of the pedagogical system in medical education are increasingly based upon the ideology of ‘neoliberalism’. This is the ideology that progress can be achieved through capitalism and by limiting state interference while working to increase the role of the private sector in all economic activities.5 Education institutions are market driven, placing emphasis on competitiveness. Neoliberalism calls for education to be modelled after the business world with more standardisation and more managerial control of faculty. From a neoliberal perspective, faculty are viewed as a subaltern class (per Freire) or as an army of labour with students viewed as customers.6-8

[의학 교육에서 신자유주의의 증거]는, 주로 경제적 측면과 실습 확대에 초점을 맞춘 제도적 목표를 위해 교수들에게 [서비스 수익 창출에 대한 압력]을 증가시키는 학문적 비즈니스 모델에서 찾을 수 있다. 교육 및 연구 참여에 대한 보상이 거의 없는 상태에서 임상 생산성에 대한 집중도가 높아짐에 따라 환자 치료, 교육 및 연구 등 학술적 의료academic medicine의 임무가 위협받고 있습니다.
Evidence of neoliberalism in medical education can be found in the academic business models putting increased pressure on faculty to generate revenue in service to institutional goals that primarily focus on economics and practice expansion. The increased focus on clinical productivity with little compensation for engagement in education and research threatens the very mission of academic medicine—patient care, education and research.9

신자유주의는 개인과 기관이 '컨설턴트'나 파트너로 급여를 받는 등 역량기반 의료교육(CBME), 위탁가능 전문활동(EPA), PBL 등 하향식 교육과정에 초점을 맞춰 교육을 감염시킨다. MCQ와 OSCE를 포함한 평가도 관행을 표준화하는 데 사용되는 핵심 도구이다. 이러한 평가의 문제 중 하나는 '학습이 일련의 측정 가능한 기술과 행동으로 축소될 위험성'이지만, 이 관행은 또한 의료 교육을 영리 공급업체가 시험 준비 서적 및 인증을 판매하는 시장으로 변화시킨다(MCAT, Step 1-2, NBME).  
Neoliberalism infects education through a focus on top-down curricula such as competency-based medical education (CBME), Entrustable Professional Activities (EPAs) and PBL, with individuals and institutions being paid as ‘consultants’ or partners. Assessments including MCQ's and OSCEs are also key tools used to standardise practice. Although one of the problems with such assessments is the ‘risk of reducing learning to a series of measurable skills and behaviours’,10 the practice also turns medical education into a marketplace where for-profit vendors sell test prep and certification (MCAT, Step 1–2, NBME).11

신자유주의는 표준화된 무언가가 이익과 축적을 위해 거래되는 모델로 나타난다. 이와 관련하여 도그라 등은 많은 교육적 접근법이 '소수자에 대한 백인 지배의 역사적 맥락에 뿌리를 두고 있다'고 언급하고 있다. 겉보기에는 온화해 보이지만, 전문성 문화의 지배는 궁극적으로 파트너 기관의 전통 문화를 압도한다. 요점은, 이러한 교류가 반드시 양방향일 필요는 없고, 한 문화가 다른 문화에 대해 비대칭적인 문화적 강요가 된다는 것이다.
Neoliberalism, that is, manifests as models that become standardised and traded for profit and accumulation.12, 13 In this regard, Dogra et al. note that many educational approaches are ‘rooted in the historical context of white domination of disadvantaged minorities’.14 The dominance of the culture of expertise, although seemingly benign, ultimately overwhelms the traditional cultures of partnering institutions.15 The point being, these exchanges are not necessarily bidirectional, but are asymmetric cultural impositions of one culture upon another.

PBL은 고전적인 신자유주의 교육학적 사례로 작용한다. PBL은 또한 인적 자원에 대한 비용과 수요로 인해 비판받았지만, 여전히 전 세계적으로 널리 채택되어 왔으며, 이 분야의 서양 전문가들이 비서구적, 종종 비민주적, 맥락적, 또는 지역 교수진이 교육 프로그램에 등록하기 위해 개발도상국 기관의 지원을 받고 있다. 이런 의미에서, PBL은 위계에 도전하지 않으며, 전문가(주로 서구 출신의 부유한 전문가)가 비서구민에 대한 권한을 부여하는 전문화된 권위의 기존 구조를 유지한다. 또한, 교육자들은 교육의 목표를 더 폭넓게 성찰할 필요가 있다. 만약 목표가 [해방과 형평성]을 포함한다면, 교육자의 전문성을 인정하고 그들이 처한 상황에서 학습자의 요구를 충족시키기 위해 그들의 전문성을 사용할 수 있도록 권한을 부여하는 교육학의 필요성이 있다. PBL의 일부 지지자들은 PBL이 비판적 사고를 촉진할 수 있다고 주장한다. Freire는 비판적 사고가 시험으로 확인할 목표나 성과가 아니라고 설명함으로써 이 주장에 이의를 제기할 가능성이 높다. 오히려, 비판적 사고는 자기 결정과 시민 참여를 위한 도구이다.

PBL serves as a classic neoliberal pedagogical example. Although PBL has also been critiqued for its cost and demand on human resources, there has still been broad adoption worldwide, with western experts in the field being invited to implement PBL in non-western, often non-democratic, contexts or local faculty being supported by institutions in developing countries to enrol in training programmes.13, 16 In this sense, PBL does not challenge hierarchy but sustains the existing structure of professionalised authority wherein experts (primarily wealthy professionals from the west) are afforded power over non-westerners.17, 18 Additionally, educators need to reflect on the goals of education more broadly. If the goals include emancipation and equity, then there is a need for pedagogies that recognise the expertise of educators and empower them to use their expertise to meet the needs of the learners in the context they are situated. Some proponents of PBL contend that PBL can promote critical thinking; Freire would likely contest this claim by explaining that critical thinking is not an objective or outcome to be tested. Rather, it is a tool for self-determination and civic engagement.8

점점 더 [비서구권 맥락에 초대받는 서양 교육자들]과 [비서구권 기관] 간의 양방향 협업 교류가 요구되고 있다. 이러한 요구를 고려할 때, 나는 [국제적으로 협력하도록 초청된 의학 교육 학자들과 서양 훈련 맥락의 연구자들]이 프로젝트의 실행 과정 동안 그들의 reflexivity(즉, 그들의 판단, 관행 및 신념)을 설명할 것을 권고한이다. 그래서 그들의 가정과 관점이 독자들에게 명확하게 드러나야 한다. [반사성의 과정]은 권력 역학에 대한 논의와 그러한 우려를 잠재적으로 해결하기 위한 노력이 어떻게 이루어졌는지를 입증하는 데 도움이 될 것이다.
Increasingly, there have been several calls for bidirectional collaborative exchanges between western educators and their institutions, who are invited to non-western contexts.4, 19-21 Given these calls, I would encourage medical education scholars and researchers from western training contexts who are invited to collaborate internationally to describe their reflexivity (i.e. their judgements, practices and beliefs) throughout the process of implementation of a project so their assumptions and perspectives are evident to readers. The process of reflexivity would help demonstrate discussions about power dynamics and how efforts were made to potentially address such concerns.

카타르 보건 전문 교육 프로그램에서 PBL 촉진자 역할을 협상하는 촉진자의 professional agency에 초점을 맞춘 Du 등의 논문은 이러한 인식론적 관점과 맥락으로 읽을 수 있다. 카타르는 주로 이슬람교도이며, 1868년부터 군주제에 의해 통치되어 1971년 영국의 지배로부터 독립했습니다. 세계 자본주의 시장에서 상당한 자원과 부를 가진 지역 강국으로 부상했다.
It is with this epistemological lens22 and context that I read Du et al.'s1 article, which focuses on the professional agency of facilitators in negotiating their PBL facilitator roles in a health professions education programme in Qatar. Qatar is predominantly Muslim and has been ruled by a monarchy since 1868, gaining independence from British rule in 1971. It has emerged in the global capitalistic market as a regional powerhouse with significant resources and wealth.

Du et al.의 연구는 카타르 의과대학의 교수진의 agency를 조사한다. 간단한 말로 설명하면, 대리인은 그들의 일을 구체화하는데 있어 교사들의 적극적인 기여이다(즉, 개인과 직업 생활에서 통제력을 행사할 수 있는 정도). 저자들은 Q-방법론을 사용하여 촉진자의 전문 기관의 출처에 대한 5가지 다른 '관점'을 확인했는데, 그 중 4개는 긍정적이고 1개는 부정적이었다. 부정적인 시각(PBL 퍼실리테이터 agency의 출처로서의 정책지침)을 표명한 참가자들은 PBL 역할에 대한 agency가 떨어지는 것으로 나타났으며, 퍼실리테이션 업무에 대한 인식이 좋지 않고, 관심이 부족한 것으로 나타났다. 저자들은 이것이 [교수와 학습에 대한 관심이 부족]하다거나, [PBL 및 학생 중심 학습과 일치하지 않는 교육학적 신념]을 유지하는 것과 같은 [개인 내 특성]과 관련이 있을 수 있다고 가정한다.
Du et al.'s study examines the agency of faculty at Qatar University College of Medicine. Described in simple words, agency is the active contribution of teachers in shaping their work (i.e. the extent to which they are able to exert control in their personal and professional lives).23 Using Q-methodology, the authors identified five different ‘viewpoints’ on the sources of facilitators' professional agency, four of which were positive and one of which was negative. Participants expressing the negative viewpoint (policy guidelines as a source of PBL facilitator agency) appeared to be less agentic regarding their PBL roles and reported poor perceptions and lack of interest in facilitation work. The authors postulate that this may be connected to their intrapersonal traits such as lacking interest in teaching and learning and holding pedagogical beliefs that were not aligned with PBL and student-centred learning.

신자유주의 교육 모델의 역사를 고려할 때, 이러한 결과는 흥미롭지만 확실히 놀랍지는 않다. 하나의 교육 모델을 외국의 맥락에 적용하는 것을 전제로 하는 한, [가치 불일치]에 직면한다는 점에서 [촉진 과정에 대한 관심 부족]은 타당하다. 경험이 적거나 대학에 처음 온 교수진이 가치 불협화음을 더 많이 경험했다는 사실은 더 많은 탐구를 할 만하다. 비록 이 기관의 교수진이 일반적으로 PBL을 지지했지만, 그 결과는 기관/지역에 더 유기적일 수 있는 대안적인 교육학적 모델에 대한 의문을 제기한다. 신자유주의적 관점에서, 교수진의 agency는 (서부로부터) PBL 전문가들이 규정한 교육학을 집행enact할 수 있는 능력에 기초한다. 그러나 프리어의 해방적 관점에서는 다른 의미를 가질 것이다. 교수진은, 저자들이 주장하는 것처럼, 교육에 대한 agency가 부족한 것이 아니라, 오히려 자신이 설계의 이해당사자가 아닌 커리큘럼에 환멸을 느꼈을 수도 있다. 이 틀을 통해, 교수진은 [설계의 행위자성design agency]가 부족했고, 서구 교육학적 틀을 전달하는 [수동적인 군대passive army]가 되었다.
Given the history of neoliberal education models, these results are interesting but certainly not surprising. Insofar as education is premised upon the imposition of one model onto a foreign context, the lack of interest in facilitation processes makes sense in the face of value dissonance. The fact that faculty with less experience or who are new to the university experienced more value dissonance warrants more exploration. Although faculty at this institution were generally supportive of PBL, the results beg the question of alternative pedagogical models that may be more organic to the institution/region. From a neoliberal perspective, the faculty's agency is based on their ability to enact the pedagogy as prescribed by the experts in PBL (from the west). But from a Freirean emancipatory perspective agency would have a different meaning. The faculty may not have less agency about teaching, as the authors claim, but may rather have been disillusioned by a curriculum they were not stakeholders in designing. Through this frame, the faculty lacked design agency and became a passive army for the delivery of western pedagogical frameworks.

비록 저자들은 촉진자들 사이에 agency의 차이가 있었다고 결론지었고, 일부는 그들의 역할에 대해 더 'agentic'하였다. 하지만 그런 높은 agency는 외부 신자유주의/서구적 모델에 의해 어떻게 중재되었는가? 기관이 행동한다는 것은 PBL 채택에 반대하는 목소리를 낼 수 있는 능력을 의미하는가? PBL 모델은 의견 공유를 허용하고 교수진이 오프스크립트(즉, 진행자 가이드에서 드리프트)로 갈 수 있도록 허용합니까? [agency]와 [위계질서] 사이의 역설은 비서구적 기관에만 내재된 것이 아니라 서양의 맥락에서도 존재하며, 교수진의 기관은 종종 기관과 통치 기관의 위계질서와 권력 역학에 의해 억압된다. 
Although the authors conclude that there was a variation of agency amongst the facilitators, with some being more ‘agentic’ about their role, how was that agency mediated by external neoliberal/western models? Does agency to act imply the capacity to voice disagreement with adopting PBL? Does the model of PBL permit sharing of opinions and allow faculty to go off-script (i.e. drift from the facilitator guide)? The paradox between agency and hierarchy is not intrinsic to only non-western institutions, rather is present in the western context as well, where the agency of faculty is often suppressed by hierarchy and power dynamics of the institution and governing bodies.24

따라서 신자유주의는 [단순한 행동 능력이 아니라, 의사소통 교환의 표준화된 모델에 저항하는 능력]으로 정의되는, pure agency의 표현을 억제하는 위계구조의 접지선grounding wire 역할을 한다. 의학교육이 측정과 기준 설정을 통해 지속된 교육의 상품화라는 족쇄를 없앨 수 있을 때까지, 이 시스템은 교직원들을 계속 억압할 것이다. 그 결과 평등주의를 악용한 교육모델을 양성하고, 그 과정에 관여한 교사를 무시할 것이다. [유기적 촉진자로서의 교사의 역할]은 [특정한 방식으로 전달되는 특정한 종류의 스크립트 콘텐츠]를 학생들의 의식 속에 '기탁deposit'하려는 기계적인 욕구에 의해 억제된다. 그렇다면 교육은 [agency of teachers]라는 주장에도 불구하고 자유의 대척점이 된다.

Neoliberalism thus serves as a grounding wire for a hierarchy that suppresses the expression of pure agency, defined not simply as the ability to act, but also as the capacity to resist standardised models of communicative exchange. Until medical education can get rid of the shackles of commodification of education perpetuated through measurement and standard setting, the system will continue to suppress faculty. The result is the cultivation of educational models under the ruse of egalitarianism with a disregard for the teachers involved in the process. The role of teacher as an organic facilitator becomes sub-tended by a mechanistic desire to ‘deposit’25 a particular kind of scripted content delivered in a particular way into the consciousness of students. Education, then, becomes the antithesis of freedom despite an insistence on the supposed agency of teachers.

Du 등은 'agentic action의 시행을 강조하는 대안적 접근법' 개발, 공유된 'PBL 촉진 작업에 대한 이해', 나아가 PBL 촉진에 대한 전문적인 학습을 지원하기 위한 '제도적 노력'을 개발할 것을 권고한다. 그러나 나는 다음과 같은 질문이 필요하다고 주장하고 싶다. 우리는 정말로 교수진에게 권한을 주고 싶은가, 아니면 순응을 원하는가? 우리는 그들이 PBL 진행자 가이드를 고수하기를 원합니까, 아니면 그들이 그들의 경험을 공유하는 주제를 벗어나도록 장려하기를 원합니까? 우리가 교육과정에서 비판적 사고를 열망할 때에도 우리는 단순히 사람들에게 '최고의 답'을 주고 '대본'을 따르는 방법을 훈련시키는 순환을 영속시키고 있는가?
Du et al. recommend working on developing ‘alternate approaches highlighting enforcement of agentic actions’, a shared ‘understanding of PBL facilitation work’ and further ‘institutional efforts’ to support professional learning for PBL facilitation. However, I would contend that the following questions need to be asked: Do we really want to give faculty agency or do we want conformity? Would we like them to stick to PBL facilitator guides or encourage them to go off topic sharing their experiences? Even when we aspire for critical thinking in the curriculum are we simply perpetuating a cycle of training people how to give the ‘best answer’ and follow a ‘script’?

국제적으로 일할 기회를 가졌고 기관이 지역의 필요와 맥락에 거의 관심을 기울이지 않고 서구 교육 도구를 채택하는 방법을 목격한 의학 교육자이자 학자로서, 나는 이 경험을 서구 환경에서 그러한 도구의 활용과 비교할 수 있다. 주목해야 할 공통점 중 하나는 커리큘럼 설계 및 구현에 관한 faculty agency의 부재로, 이들의 역할이 숙련된 기술 조교skilled technical assistants로 축소되었다는 것이다. Paulo Freire는 가르치는 것이 자유의 표현이라고 말했다. 나는 우리 독자들이 이 질문에 수사적으로 대답하도록 남겨둔다: 현재의 신자유주의 시대에, 가르치는 것은 정말로 자유의 표현인가?

As a medical educator and scholar who has had the opportunity to work internationally and has witnessed how institutions adopt western pedagogical tools with little attention to local needs and contexts, I am able to compare this experience with utilisation of such tools in western settings. One of the commonalities to be noted is the lack of faculty agency regarding curriculum design and implementation, with their role being reduced to that of skilled technical assistants. Paulo Freire said teaching is the expression of freedom. I leave our readers to rhetorically answer this as a question: In the current neoliberal times, is teaching truly an expression of freedom?

 


Med Educ. 2022 Aug;56(8):787-790. doi: 10.1111/medu.14849. Epub 2022 Jun 14.

Teaching: The expression of freedom?

Affiliations collapse

Affiliation

1Division of General Internal Medicine, George Washington School of Medicine & Health Sciences, Washington, District of Columbia, USA.

PMID: 35670766

DOI: 10.1111/medu.14849

CME와 CPD의 이해와 개선을 위한 새로운 원천으로서의 학습과학(Med Teach, 2018)
Learning science as a potential new source of understanding and improvement for continuing education and continuing professional development
Thomas J. Van Hoofa,b,c and Terrence J. Doyled,e

 

 

서론
Introduction

적어도 2009년까지 거슬러 올라간다(커풋 외. 2009), CE/CPD 문헌에서, 학습이 일어날 때 뇌에서 일어나는 일과 관련된 "학습 과학"으로 알려진 새로운 학제간 분야와 관련된 전략에 대한 기사가 계속적으로 나오기 시작했다. 일부 저자들은 "학습 과학"이라는 다른 총체적인 용어를 선호하며, 이를 교수와 학습에 관한 연구 분야로 정의한다(Sawyer 2016). 학습과학이 인지심리학, 신경과학 등 전통적인 분야의 중첩을 반영하는 인위적인 구성인지, 그리고 어떤 용어가 학습과학을 가리키는지 여부는 CE/CPD 리더와 중요한 관련성을 갖는다. 최근 몇 년 동안 적지만 상당히 잘 설계된 연구에도 불구하고, CE/CPD 문헌은 한 가지 주목할 만한 예외를 제외하고 학습 과학과 관련 전략에 대한 명시적인 설명이 부족한 것으로 보인다. Weidman과 Baker(2015)는 "학습의 인지과학"이라는 용어를 사용하여 일반적으로 의학 교육에 적용되는 학습과학의 일부 개념, 이론적 원리 및 실제 적용에 대한 설명을 제공한다. 이 논문은 CE/CPD에 대한 보완책으로, 과학 학습에서 나오는 몇 가지 핵심 전략 및 습관을 설명하고 증거 기반 CE/CPD 속성과 어떻게 일치하는지 설명한다.

At least as far back as 2009 (Kerfoot et al. 2009), articles have begun to appear in the continuing education/continuing professional development (CE/CPD) literature about strategies associated with an emerging interdisciplinary field known as “learning science,” which concerns itself with what happens in the brain when learning occurs. Some authors prefer a different, collective term, that is, “the learning sciences,” and define it as a field of study about teaching and learning (Sawyer 2016). Whether learning science is a distinct field or an artificial construct reflecting an overlap of such traditional fields as cognitive psychology and neuroscience, and whether one refers to learning science by one term or another, the field has significant relevance to CE/CPD leaders. Despite a modest but significant number of well-designed studies in recent years (Larsen et al. 2015; Kerfoot and Baker 2012; Kerfoot et al. 2014; Boespflug et al. 2015; Mallon et al. 2016), the CE/CPD literature appears to lack an explicit description of learning science and its attendant strategies with one noteworthy exception. Using the term “cognitive science of learning,” Weidman and Baker (2015) provide a description of some concepts, theoretical principles and practical applications of learning science as applied to medical education in general. As a complement to that article but more specific to CE/CPD, this article describes some key strategies and/or habits that emanate from learning science and explains how they align with evidence-based CE/CPD attributes.

배움이란 무엇이며 어떻게 이루어지는가?
What is learning and how does it happen?

네 가지 핵심 학습 과학 전략을 설명하기 전에 학습 자체에 대한 간략한 설명이 적절해 보인다. 많은 학습 과학 자원이 훨씬 더 깊고 광범위한 설명을 제공하지만(Doyle and Zakrajsek 2013; Brown et al. 2014; Carey 2014; Oakley 2014), "학습"은 뇌의 뉴런 간 연결, 즉 신경망을 개발하는 산물이다(Doyle and Zakrajsek 2013). 학습에는 지식, 기술, 행동 및 태도와 같은 정보가 신경망을 통해 물리적으로 표현되는 것이 포함된다(Doyle and Zakrajsek 2013). 나중에 사용하기 위해 접근할 가능성이 있는 학습은 단순히 뇌를 사용하는 것이 아니라 말 그대로 뇌를 변화시켜야 한다. 린슨(1999)의 학습 정의는 이러한 변화와 일치한다(이탤릭체는 생략한다.) "학습은… 반복적인 사용을 통해 뇌의 특정 적절하고 바람직한 시냅스를 안정화시키는 것이다."(5페이지) 

Before describing four key learning science strategies, a brief explanation of learning itself seems appropriate. While many learning science resources provide a far deeper and broader explanation (Doyle and Zakrajsek 2013; Brown et al. 2014; Carey 2014; Oakley 2014), “learning” is the product of establishing connections between neurons in the brain, that is, developing neural networks (Doyle and Zakrajsek 2013). Learning involves information, such as knowledge, skills, behaviors and attitudes, becoming physically represented through neural networks (Doyle and Zakrajsek 2013). Learning that has the prospect of being accessed for later use must literally change the brain, not merely use it (Leamnson 1999; Doyle and Zakrajsek 2013; Brown et al. 2014). Leamnson’s (1999) definition of learning is consistent with such change (italics omitted): Learning is … stabilizing, through repeated use, certain appropriate and desirable synapses in the brain” (p. 5).

필연적으로, 배우는 것은 힘든 일이다. 노력적 학습effortful learning의 좋은 예는 비지배적 손으로 글을 쓰는 연습이다(Leamnson 1999). 전문성을 유지하고 확장하고자 하지만 간단하고 쉬운 CE/CPD 활동을 찾고 있는 임상의는 학습 프로세스에 대한 Doyle(2008)의 기본 진술을 신중하게 고려해야 합니다. "… 일을 하는 사람이 배움을 한다"(p. 63). 의미 있는 학습에는 빠르고 쉬운 것이 없다. 그럼에도 불구하고, 약 860억 개의 뉴런(허큘라노-호젤과 2005년 사순절)이 150조 개의 연결 또는 시냅스를 만들고, 100만 기가바이트의 디지털 저장 용량을 가진, 적절하게 사용한다면, 평균적인 인간 두뇌의 학습 능력은 정말로 놀랍다. 수천 시간의 연구와 연습을 반영하듯, 학문적이든 아니든 한 분야의 진정한 전문 지식을 구성하는 방대한 신경망은 종종 "청크"(Oakley 2014) 또는 "정신 모델"(Brown et al. 2014)로 설명된다. 정신 모델은 사람이 더 효과적으로 추론하고, 해결하고, 창조할 수 있게 해준다(Brown et al. 2014). 학습자가 전문지식을 개발하는 초보자인지 또는 전문지식을 확장하는 전문가인지에 관계없이 학습은 뇌의 많은 다른 부분을 포함하는 세 가지 기본 단계를 따릅니다(표 1).

Necessarily, learning is hard work. A good example of effortful learning is practicing to write with one’s non-dominant hand (Leamnson 1999). Clinicians who want to maintain and extend their expertise but who are looking for simple and easy CE/CPD activities should carefully consider Doyle’s (2008) foundational statement about the learning process: “… the one who does the work does the learning” (p. 63). There is nothing quick and easy about meaningful learning. Having said this, with roughly 86 billion neurons (Herculano-Houzel and Lent 2005) making 150 trillion connections or synapses (Doyle and Zakrajsek 2013), and with a digital storage capacity of one million gigabytes (Carey 2014), the capacity of the average human brain for learning is truly remarkable, if used appropriately. Reflecting thousands of hours of study and practice, the vast neural networks that constitute true expertise in a field – academic or otherwise - are often described as a “chunk” (Oakley 2014) or a “mental model” (Brown et al. 2014). Mental models allow a person to reason, solve and create more effectively (Brown et al. 2014). Whether a learner is a novice developing expertise or an expert expanding her/his expertise, learning follows three basic steps that involve many different parts of the brain (Table 1).

인코딩
Encoding

학습 과정의 첫 단계인 [인코딩]하나 이상의 감각에 의해 인식되는 정보를 뇌로 가져오는 것을 수반하며, 이는 [단기 기억]의 정보를 일시적으로 기억 흔적으로 표현하기 위해 화학적, 전기적 신호를 사용한다(Brown et al. 2014). 새로운 것을 배울 때 형성되는 신경 연결은 뇌가 그 정보에 대한 영구적인 기억을 형성하기 위해 사용할 것과 같은 세트이다. 이와 같이 초기 노출 시점에 새로운 정보(즉, 상세하고 다면적이며 감정적으로 만드는 것)를 더 정교하게 인코딩할수록 나중에 회상할 가능성이 더 높다(Squire 및 Kandel 2000). 인코딩에 관여하는 뇌의 부분은 다음을 포함한다.

  • 신피질(학습 프로세스를 시작), 
  • 전전두피질(과제에 충분한 주의를 기울일 수 있도록 보장) 
  • 해마(운동 기술과 관련된 것 이외의 의식적인 단기 기억의 위치 및 처리)

 

The first step in the learning process – encoding – entails bringing information perceived by one or more senses into the brain, which uses chemical and electrical signals to represent the information temporarily in short-term memory as a memory trace (Brown et al. 2014). The neural connections that form when one learns something new are the same set that the brain will use to form a permanent memory for that information. As such, the more elaborately one encodes new information (i.e. making it detailed, multifaceted, and emotional) at the time of initial exposure, the better the chance of later recall (Squire and Kandel 2000). Parts of the brain that are involved in encoding include

  • the neocortex (initiates the process of learning) (Hahn et al. 2012; Doyle and Zakrajsek 2013),
  • the pre-frontal cortex (ensuring that sufficient attention is available for the task) (Oakley 2014), and
  • the hippocampus (location and processing of conscious short term memories other than those involving motor skills) (Brown et al. 2014; Oakley 2014).

이름에서 알 수 있듯, 기억 흔적은 본질적으로 유연하지만(Brown et al. 2014), 초기 인코딩 이벤트의 품질은 장기적인 숙달에 중요하다(Benjamin and Tullis 2010). 인코딩은 한 저자가 '집중 모드 사고'(Oakley 2014)라고 지칭하고 다른 저자가 '노력적 관심'(Brown et al. 2014)이라고 부르는 특별한 유형의 주의를 필요로 한다. 이름과는 상관없이, 새롭고/또는 도전적인 것에 집중하는 데 더 많은 집중력을 쏟을 수 있는 정신적인 에너지가 더 많을수록, 정보는 단기 기억에서 정확하고 완전히 표현될 가능성이 더 높다.

Even though memory traces, as the name implies, are inherently labile (Brown et al. 2014), the quality of the initial encoding event is critical to long-term mastery (Benjamin and Tullis 2010). Encoding requires a special type of attention that one author refers to as ‘focused-mode thinking’ (Oakley 2014) and that others call ‘effortful attention’ (Brown et al. 2014). Regardless of its name, the more undistracted mental energy that one can devote to focusing on something new and/or challenging, the more likely it is that the information will find itself accurately and completely represented in short-term memory.

통합
Consolidation

[통합]으로 알려진 학습의 다음 단계 동안 뇌는 중요한 것으로 플래그가 지정된 기억 흔적을 "빠르지만 용량이 적은 단기 기억 저장소"인 [해마]에서 가져와서 "학습은 가능하지만 용량은 더 큰 장기 기억 저장"인 신피질의 적절한 영역(예: 시각 처리 센터)으로 옮긴다. 이 단계에는 경막피질(해마와 신피질 사이의 주요 상호 작용을 조정하는)이 관여한다(Hahn et al. 2012). 신피질이 적절한 조건(예: 양질의 수면)에 있다면, 기억 흔적은 [신중한 처리]를 거치게 되는데, 그 동안 "뇌는 학습을 재생하거나 리허설을 하며 의미를 부여하고 빈 곳을 채우며 과거의 경험과 이미 장기 기억에 저장되어 있는 다른 지식과 연결시킨다." 이것이 한 과목에 대한 상당한 양의 사전 지식을 가진 사람이 그 과목에 대한 새로운 학습이 더 쉽다고 느끼는 이유이다. 뇌는 연결을 만드는 경험을 많이 가지고 있다.

During the next step of learning known as consolidation, the brain takes memory traces flagged as important (Carey 2014) – based on significant effort or relevance – from the hippocampus, which is the “fast-learning but low-capacity short-term memory store” (Doyle and Zakrajsek 2013, p. 73) and transfers them to the appropriate area (e.g. visual processing center) of the neocortex, which is the “slower-learning but higher-capacity long-term memory store” (Doyle and Zakrajsek 2013, p. 73). The entorhinal cortex (coordinating key interactions between the hippocampus and the neocortex) is involved in this step (Hahn et al. 2012). Under the right conditions (e.g. quality sleep) in the neocortex, the memory traces undergo careful processing, during which time “… the brain replays or rehearses the learning, giving it meaning, filling in blank spots, and making connections to past experiences and to other knowledge already stored in long-term memory” (Brown et al. 2014, p. 73). This is why a person with significant amounts of prior knowledge in a subject finds new learning in that subject to be easier; the brain has many experiences with which to make connections.

수면은 [통합]에 중요할 뿐만 아니라, 수면의 주요 목적이 될 수 있다(Carey 2014). 낮잠이나 다른 인지적 '휴식' 동안 정보를 통합할 수 있지만, 야간 수면은 통합에 가장 좋습니다(Doyle and Zakrajsek 2013). 수면 단계가 다르면 학습 유형이 다르기 때문에 모든 수면 단계를 포함하는 숙면 휴식이 필요하다(Carey 2014). 예를 들어, 빠른 안구 운동(REM) 수면은 패턴 인식 및 창의적 문제 해결과 관련이 있다(Carey 2014). 새로 학습된 정보는 통합 중에 기존 신경망의 일부가 되거나(동조화) 새로운 신경망(수용)을 형성하기 시작한다. 수면은 단기 기억의 공간을 비움으로써 다음날 새로운 학습을 위해 뇌를 준비시키는 추가적인 이점을 제공한다. Oakley(2014)는 인코딩에 대한 [집중 모드 사고]와 달리 통합과 관련된 사고의 유형을 '확산 모드 사고'라고 부른다. 왜냐하면 이 과정은 우리의 의식적인 노력 없이 일어나고, 종종 신피질의 다른 영역을 포함한 뇌의 많은 부분을 포함하기 때문이다.

Not only is sleep critical to consolidation, it may be the primary purpose of sleep (Carey 2014). While one can consolidate information during a nap or other cognitive ‘break,’ nocturnal sleep is best for consolidation (Doyle and Zakrajsek 2013). A good night’s rest that includes all sleep phases is necessary, as different sleep phases are associated with different types of learning (Carey 2014). For example, rapid eye movement (REM) sleep is associated with pattern recognition and creative problem solving, among other things (Carey 2014). During consolidation, newly learned information becomes part of an existing neural network (assimilation) or begins to form a new one (accommodation) (Doyle and Zakrajsek 2013). Sleep offers the additional benefit of preparing the brain for new learning the next day by clearing space in short-term memory (Doyle and Zakrajsek 2013). In contrast to the focused-mode thinking of encoding, Oakley (2014) refers to the type of thinking associated with consolidation as ‘diffuse-mode thinking,’ given that it happens without our conscious effort and involves many parts of the brain, often including different areas of the neocortex.

인출
Retrieval


학습과학 전문가들은 종종 "필요할 때 인출할 수 있을 때 무언가를 배웠다고 한다"(도일 2017). 인출이라는 이름은 이전에 학습된 정보에 접근하는 것을 의미하지만, 메모리로부터 정보를 검색하는 과정 그 자체가 신경망에 관여하는 세포의 시냅스를 안정화시켜 더 강하고 빠르게 만든다(Brown et al. 2014). LTP(Long-term potentiation)라고 알려진 프로세스는 미래에 정보를 리콜할 수 있는 가능성을 의미합니다. 중요한 정보를 검색할 때마다 LTP가 증가합니다. 검색은 또한 뇌가 정보를 다시 사용한 후에 정보를 다시 통합함으로써 이해도를 향상시킬 수 있다(Brown et al. 2014). 학습에 대한 다음 정의에 따르면, [인코딩과 통합]은 "지식과 기술 습득" 부분을 설명하지만, [인출]은 나머지 부분을 설명합니다. 

  • "[학습이란] 지식과 기술을 습득하고 이를 기억에서 쉽게 얻을 수 있게 하여 미래의 문제와 기회를 이해할 수 있게 하는 것을 의미한다." 

earning science experts often say, “You are said to have learned something when you can retrieve it when you need it” (Doyle 2017). While retrieval’s name implies accessing previously learned information, the process of retrieving information from memory makes it stronger and faster by stabilizing the synapses of cells involved in the neural network (Brown et al. 2014). A process known as long-term potentiation (LTP) refers to the potential to recall information in the future; LTP increases each time one retrieves important information (Hebb 1949; Paradiso et al. 2007). Retrieval can also improve understanding by reconsolidating the information after the brain uses it again (Brown et al. 2014). As per the following definition of learning, encoding and consolidation account for the “acquiring knowledge and skills” part, but retrieval accounts for the remainder of the definition:

  • “[Learning means] acquiring knowledge and skills and having them readily available from memory so you can make sense of future problems and opportunities” (Brown et al. 2014, p. 2).

검색은 [장기 기억(신피질)]에 저장된 정보에 접근하여 정보를 [단기 기억(히포캠퍼스)]으로 불러오는 것을 포함한다. 뇌가 학습된 정보에 접근할 때마다 기억력이 변하며, 최신 맥락을 반영하는 새로운 신호 세트와 연관된다는 점을 고려할 때(Carey 2014) 더 나아진다(Brown et al. 2014) 응답할 수 있는 신호가 많을수록 정보를 떠올릴 가능성이 높아진다. 또한 학습된 정보와 관련된 맥락적 단서가 더 다양할수록 (추가적이고 다른 응용 프로그램을 통해) 정보에 대한 뇌의 이해와 접근성이 향상된다(Brown et al. 2014). 또한 검색은 학습된 정보와 관련된 청크의 크기를 증가시키고 새로운 상황으로의 전송 가능성을 향상시킨다(Oakley 2014).

Retrieval involves accessing information stored as a long-term memory (neocortex) and bringing the information back to short-term memory (hippocampus). Each time the brain accesses learned information, the memory changes (Doyle and Zakrajsek 2013; Carey 2014), and for the better (Carey 2014), given that it becomes associated with a new set of cues reflecting the latest context (Brown et al. 2014). The more cues to which one can respond, the better the chance of recalling the information. In addition, the more diverse the contextual cues associated with learned information, the better the brain’s understanding of (through additional and different applications), and access to, the information (Brown et al. 2014). Retrieval also increases the size of the chunk associated with learned information and improves its transferability to new situations (Oakley 2014).

어떤 전략이 학습에 중요합니까?
What strategies are important to learning?

네 가지 보완적 학습 과학 전략은 학습에 대한 간략한 개요(표 2)와 일치하며, 저자들의 의견으로는 CE/CPD에 가장 중요하다. 뚜렷한 전략으로 설명되지는 않았지만, 4대 접근법의 기초가 되는 것은 학습은 학습 의미에서 많은 "실습practice"을 필요로 하는 과정이라는 것이다. 전문가가 되고 전문가로 남으려면 말 그대로 수천 시간의 공부와 훈련이 필요하기 때문에, 실습이 중요하다는 것을 학문과 전문지식을 갖춘 임상의에게 설명할 필요는 거의 없다(Brown et al. 2014). 전문가들 사이에서 우수한 성과를 설명하면서 에릭슨과 풀(2016)은 성과 약점에 초점을 맞추고 피드백을 제공하고 개선을 촉진할 줄 아는 교사나 코치가 지도하는 몇 년간의 공부 또는 연습(일반적으로)을 지칭하기 위해 "의도적 연습"이라는 용어를 사용한다. 
Four complementary learning science strategies are consistent with this brief overview of learning (Table 2), and, in the authors’ opinion, most important to CE/CPD. Though not described as a distinct strategy, what underlies the four major approaches is that learning is a process that requires lots of “practice,” in the learning sense. Practice requires little explanation for any clinician with discipline and specialty-specific expertise, as becoming and remaining an expert requires literally thousands of hours of study and training (Brown et al. 2014). Describing superior performance among experts, Ericsson and Pool (2016) use the term “deliberate practice” to refer to the years (typically) of study or practice focused on performance weaknesses and guided by teachers or coaches who know how to provide feedback and to facilitate improvement.

일반적으로 (태도, 역량, 행동 및 수행은 말할 것도 없고) 지식과 기술의 집합이 더 생소하거나 복잡할수록, 그것을 마스터하고 유지하기 위해 더 많은 정보를 가진 공부나 연습이 필요할 것이다. 예를 들어, 무작위 대조 시험에서 쇼 외 연구진(2011)은 CE 회의에 이어 온라인 보충물(정답과 설명이 포함된 객관식 질문)에 참여한 임상의(대부분 의사와 간호사)가 임상 실무 행동의 개선을 자체 보고하였다. 평가를 완료하기 전에만 회의에 참석한 임상의. 끊임없이 변화하는 임상 실습의 특성을 고려할 때, CE/CPD는 이전 교육 및 훈련과 마찬가지로 피드백을 통한 학습에 전념해야 합니다. 그 연습 시간 동안 다양한 접근법을 사용하는 것처럼 중요한 정보를 가지고 상당한 양의 연습이 필요하다. 많은 경쟁적인 관심사와 요구에 직면한 바쁜 임상의는 틀림없이 과학 전략을 학습함으로써 가장 많은 이익을 얻을 것이며, 이는 또한 교육, 공식(학생, 훈련생 및 동료 교사) 및 비공식(환자 상담)에서의 역할을 모두 지원할 것이다.

In general, the more unfamiliar or complex some set of knowledge and skills is (not to mention attitude, competence, behavior and performance), the more informed study or practice will be necessary to master and maintain it. For example, in a randomized controlled trial Shaw et al. (2011) demonstrated that clinicians (mostly physicians and nurse practitioners) who participated in an online supplement (multiple choice questions with correct answers and explanations) following a CE conference self-reported enhanced improvement in clinical practice behaviors compared to clinicians who only attended the conference prior to completing the assessment. Given the ever-changing nature of clinical practice, CE/CPD requires the same devotion to learning with feedback as did prior education and training. A significant amount of practice with important information is necessary, as is using a variety of approaches during that practice time. Busy clinicians, facing many competing interests and demands, would arguably benefit most from learning science strategies, which would also support their roles in education, formal (teaching students, trainees, and colleagues) and informal (counseling patients) alike.

분산 학습
Distributed learning

"공간 효과"라고 하는 이점을 가진 "분산 실습"이라고도 하는 분산 학습은 효과적인 학습 과학 전략입니다(Carey 2014). 분산형(Distributed)은 장기간에 걸쳐 여러 스터디 또는 연습 세션에서 간격을 두는 것을 의미합니다(Benjamin 및 Tullis 2010). Oakley(2014)는 최초 노출 후 24시간 이내에 새로 학습한 정보로 돌아갈 것을 권고한다. 정보가 이해되면, 연구 세션 사이의 간격을 일, 주, 그리고 몇 개월로 점차 늘려 장기간에 걸쳐 확실하게 기억해야 한다(Doyle and Zakrajsek 2013; Oakley 2014). 한 세션 동안 주제를 공부하거나 기술을 연습하는 데 상당한 시간을 소비하는 것은 효율적으로 보일지도 모른다. 이를 "대집합 연습" 또는 보다 구어체로 "벼락치기"라고 한다. 하지만 단일 세션에서 보내는 시간이 많을수록, 그 시간은 덜 효과적이게 된다. 

Distributed learning, also known as “distributed practice” with benefits referred to as the “spacing effect,” is an effective learning science strategy (Carey 2014). “Distributed” refers to the spacing out of multiple study or practice sessions over an extended period of time (Benjamin and Tullis 2010). Oakley (2014) recommends that one should return to newly learned information within 24 hours of initial exposure. Once the information is understood, one should gradually increase the spacing between study sessions from days, to weeks, and then to months in order to reliably remember it for extended periods (Doyle and Zakrajsek 2013; Oakley 2014). As efficient as it may seem to spend a significant amount of time studying a topic or practicing a skill during a single session – what is known as “massed practice” or more colloquially as “cramming” – the more time that participants spend in a single session, the less effective that time becomes.

과도한 반복은 뇌를 지루하게 만든다(Carey 2014). 대규모 연습massed practice을 통해 단기 기억에서 정보를 반복적으로 작업하지만, 학습에 결정적인 것은 장기 기억으로 작업하는 것이다(Carey 2014). 숙달을 위해 뇌는 자신이 연습한 것을 처리하고, 수면 시간으로 분리된 다른 시간에 다시 돌아올 시간이 필요하다(도일과 Zakrajsek 2013). CE/CPD에 특유하고 분산된 관행만 있는 예가 결여된 상태에서, 미세혈관 문합법을 배우는 외과 레지던트들의 무작위 대조 실험은 프로시저를 [4주 동안] 배운 레지던트들이 [단일 집중 세션]에서 배운 레지던트들보다 훨씬 더 나은 성과를 보였으나, 후자의 방식이 CE/CPD에서 흔하다(Moulton et al. 2006). 시험과 같이 알려진 종착점이 주어졌을 때 언제 공부해야 하는지, 간격을 고정 또는 확장해야 하는지에 대해 많은 것이 쓰여져 있지만(Carpenter et al. 2012), 가장 중요한 것은 오랜 기간에 걸쳐 학습을 분산시키는 것이다.

The brain becomes bored with excessive repetition (Carey 2014). With massed practice, one is working with the information repeatedly in short-term memory, but working with long-term memory is what is critical to learning (Carey 2014). For mastery, the brain needs time to process what one has practiced and to come back to it at different times separated by periods of sleep (Doyle and Zakrajsek 2013). Lacking an example that is CE/CPD-specific and distributed practice only, a randomized controlled trial of surgical residents learning microvascular anastomosis revealed that residents who learned the procedure over four weekly sessions performed significantly better than those who learned it during a single intensive session, the latter being common in CE/CPD (Moulton et al. 2006). While much has been written about when to study given a known end point, such as an exam, and whether the spacing should be fixed or expanding (Carpenter et al. 2012), what is most important is that one distributes her/his learning over an extended period of time.

인출 연습
Retrieval practice

"언제"(분산 학습)와 대조적으로, 학습하는 동안 "어떻게" 시간을 보내는가는 검색 실습 또는 "리콜"로 알려진 학습 과학 전략과 관련이 있으며, 그 이점은 "테스트 효과" 또는 "생성 효과"로 알려져 있다(Oakley 2014). 검색 연습은 재독과 같은 수동적인 학습 수단에 비해 중요한 정보에 대한 기억력을 향상시킬 수 있다(Carey 2014). 장기 기억에서 정보를 검색하려면 단순히 정보를 다시 리뷰하는 것보다 더 많은 노력이 필요하며, 정보를 복원하면 다시 편집되었다는 점에서 새로운 연결 또는 다른 연결(Carey 2014)이 발생합니다. 린슨(1999)이 설명하듯이, "강도의 집중은, 약간의 압박 하에서, 언어와 씨름하는 동안, 뇌에 무언가를 하지 않을 수 없다." 중요한 정보를 이해하기 위해 초기 학습 세션 동안 집중 모드 사고(Oakley 2014)를 사용한 후, 검색 연습은 학습자가 정보를 설명하기 위해 장기 기억을 검색하도록 강요하며, 이상적으로는 완전한 문장으로, 자신만의 단어로, 말하기 또는 쓰기를 하게 된다(Leamnson 1999). 

In contrast to “when” (distributed learning), “how” one spends time while learning is relevant to the learning science strategy known as retrieval practice or “recall,” the benefits of which are known as the “testing effect” or the “generation effect” (Oakley 2014). Retrieval practice can improve memory for important information compared to passive means of study, such as rereading (Carey 2014). Retrieving information from long-term memory requires more effort than simply reviewing the information again, and restoring the information results in new or different connections (Carey 2014) given that it has been re-edited (Doyle and Zakrajsek 2013). As Leamnson (1999) explains, “Intense concentration, under a little pressure, while wrestling with language, cannot but do something to the brain (p. 111).” After using focused-mode thinking (Oakley 2014) during an initial learning session or two to understand important information, retrieval practice forces the learner to search her or his long-term memory to explain the information, ideally using her or his own spoken or written words in complete sentences (Leamnson 1999).

이 시도가 아무리 성공적이더라도, 학습자는 [신뢰할 수 있는 출처와 비교함으로써, 이해의 정확성과 완전성을 점검]해야 하며, 후속 학습 세션에서 초점을 맞출 개선 기회를 노려야 한다(Brown et al. 2014). 따라서 검색 시도는 정보에 대한 일부 어려움을 겪은 후 학습자에게 [피드백]을 제공한다(Oakley 2014). 게다가, 검색 연습은 단기 기억과 장기 기억 사이에서 정보의 이동을 강요하며, 매번 이해력과 기억력을 향상시킨다. 예를 들어, Larsen 외 연구진(2015)은 연례 회의 참석에 따른 반복 퀴즈를 통해 반복 학습에 비해 습득한 지식의 장기 보존이 향상(거의 두 배)되었음을 입증했다. 인출 연습이 이해를 테스트하는 것으로서도 잘 작동하지만, 리콜은 효과적인 사전 테스트pretest이기도 합니다(Carey 2014). 사전 테스트는 학습자가 종종 자신의 필요를 잘 판단하지 못하기 때문에 지식과 이해에서 [학습자의 격차를 명시함]으로써, 뇌가 [학습할 수 있도록 준비]한다(Brown et al. 2014). 일단 이렇게 작동하면, 뇌는 잠재의식적으로 필요한 정보를 찾기 시작할 것이고, 이 상태는 Carey (2014)가 '사냥하는 뇌'라고 부르는 상태입니다 (p.213).

Following the attempt, however successful, the learner should check the accuracy and completeness of her/his understanding against a credible source, noting opportunities for improvement on which to focus in subsequent study sessions (Brown et al. 2014). Retrieval attempts thus provide feedback to the learner following some struggle with the information (Oakley 2014). Moreover, retrieval practice forces the movement of information between short-term and long-term memory, each time improving comprehension and memory. For example, Larsen et al. (2015) demonstrated that repeating quizzing following attendance at an annual conference improved (nearly doubled) long-term retention of knowledge acquired compared to repeat studying. While retrieval practice works well as a test of understanding, recall is also an effective pretest (Carey 2014). Pre-testing prepares the brain to learn by making explicit for the learner gaps in knowledge and understanding, for learners are often a poor judge of their own needs (Brown et al. 2014). Once realized, the brain will subconsciously begin to look for needed information, a state that Carey (2014) calls the ‘foraging brain’ (p. 213).

인터리빙
Interleaving

인터리빙은 공부나 연습 시간을 보내는 방법과 관련된 또 다른 학습 과학 전략이다. 인터리빙(Interleaving)은 "학습 중에 관련되지만 구분되는 자료를 혼합하는 것"을 의미하며(Carey 2014, p. 163) 학습자가 원칙, 개념 및 절차와 같이 이전에 학습한 정보를 동일한 학습 활동에서 더 최근의 정보와 심지어 향후의 정보와 조화시키도록 강제한다. 학습자는 특정 학습 시간 동안 단일 영역에 비례적으로 더 많은 시간을 할애할 수 있지만, 예를 들어 다가오는 교육 회의에서 논의될 어려운 사례를 고려하는데 30분을 할애할 수 있지만, 사례에만 시간을 할애하지는 않을 것이다. 또한 학습자는 비교적 먼 세션에서 논의된 최근 가이드라인 업데이트에 대해 10분 동안 질문을 하고, 20분 동안 가장 최근 세션에서 해결되지 않은 질문에 대한 가능한 답을 조사합니다. 뇌는 새로운 학습과 이전 학습 사이의 연관성을 찾는 패턴 탐색 장치이기 때문에(Ratey 2001), 학습자의 뇌는 과정이나 활동에서 오래된 자료, 현재 자료, 미래 자료를 동시에 연구함으로써 주제나 주제에 대한 확실한 이해에 따라 발전 및/또는 확장될 가능성이 더 높다(Oakley 2014). 
Interleaving is another learning science strategy that relates to how one spends study or practice time. Interleaving means “… mixing related but distinct material during study” (Carey 2014, p. 163), forcing the learner to reconcile previously learned information, such as principles, concepts, and procedures, with more recent and even upcoming information in the same learning activity (Brown et al. 2014; Oakley 2014). While a learner may spend proportionately more time on a single area during a particular study session, for example, spending 30 minutes considering a challenging case to be discussed at an upcoming educational meeting, s/he would not spend time exclusively on the case. The learner might also spend 10 minutes quizzing her/himself on recent guideline updates discussed at a relatively distant session and 20 minutes researching possible answers to unresolved questions from the most recent session. Because the brain is a pattern-seeking device that looks for connections between new and previous learning (Ratey 2001), by studying old, present, and future material in a course or activity at the same time, the brain of the learner will more likely develop and/or expand upon a solid grasp of a topic or subject (Oakley 2014).

정보를 "청킹" 하는 것(앞서 설명한 명사 "청킹"을 동사로 사용함)은 학습자가 관련 부분들 사이에 더 많은 연결고리를 만들기 때문에 주어가 더 응집력 있고 기억에 남도록 만든다(Oakley 2014). 인터리빙의 이점 중 하나는 학습을 분산시킨다는 것이다(Brown et al. 2014). 그러나, 특히 문제 해결이나 사례 전개에 적용할 때, 인터리빙은 학습자가 다양하고 예기치 않은 상황에서 지식과 기술을 사용하는 "언제"와 "어떻게"를 이해하도록 강요한다는 점이며, 이는 임상 실무에서 매우 일반적인 것이다(Carpenter et al. 2012; Oakley 2014). 즉, 학습자는 정보를 다른 맥락으로 '전이transfer'할 수 있는 가능성이 높아집니다(Carey 2014). 저자들은 CE/CPD 문헌에서 인터리빙의 예를 찾을 수 없었지만, Birnbaum et al. (2013)은 생물학 수업에서 서로 다른 범주를 병치(즉, 인터리빙)하는 것이 이러한 동일한 범주의 차단된(대량) 연습에 비해 우수한 학습 방법임을 입증했다. 인터리빙은 종종 학습자에게 느리거나 비효율적으로 느껴지지만, 연구는 인터리빙을 통해 학습된 정보에 대한 이해와 기억이 대규모 연습을 통해 학습하는 것보다 낫다는 것을 보여준다(Brown et al. 2014).

“Chunking” information (using the previously described noun – “chunk” – as a verb) makes a subject more cohesive and memorable, as the learner is creating more connections between related parts (Oakley 2014). One of the benefits of interleaving is that it distributes learning (Brown et al. 2014); however, a distinct benefit – especially when applied to solving problems or unfolding cases – is that interleaving forces the learner to understand “when” and “how” to use knowledge and skill in varying and unexpected circumstances (Carpenter et al. 2012; Oakley 2014), which are quite common in clinical practice. In other words, the learner will be more likely to be able to ‘transfer’ information to other contexts (Carey 2014). While the authors were unable to find any examples of interleaving in the CE/CPD literature, Birnbaum et al. (2013) demonstrated that juxtaposing (i.e. interleaving) different categories in a biology lesson was a superior method of learning compared to blocked (massed) practice of these same categories. While interleaving often feels slower or inefficient to the learner, research demonstrates that understanding and memory for information learned through interleaving is better than through massed practice (Brown et al. 2014).

정교화
Elaboration

정교화는 검색 연습과 인터리빙과 마찬가지로 학습자가 어떻게how 공부나 연습 시간을 보내는지에 관한 것이다. Doyle과 Zakrajsek(2013)에 따르면, 간단히 말해 정교화는 "정보에 대한 여러 경로를 만드는 과정"이다(52페이지). 기억을 논하면서, Schacter(2001)는 기억 형성에 정교화가 얼마나 필수적인지를 강조한다. 일반적으로 같은 시간, 같은 장소에서, 그리고 매번 같은 방식으로 공부하는 것에 비해, 정교함은 학습과 기억에서 훨씬 더 효과적인 전략이다. 정교화는 학습자가 다양한 감각을 포함하는 다양한 상황적 단서와 정보를 점진적으로 연관시킬 수 있도록 학습자가 가능한 한 어떻게, 어디서, 그리고 언제 공부하거나 연습할 수 있도록 장려한다. CE/CPD의 맥락에서, Shaw et al. (2011)은 3일간의 대면 컨퍼런스의 중요한 내용을 반영하는 간격 검색 관행(즉, 이메일을 통해 설명이 포함된 MCQ에 반복적으로 노출)이 자체 보고 임상 행동을 개선하는 효과적인 메커니즘임을 입증했다. Doyle과 Zakrajsek (2013)에 따르면, "(듣기, 말하기, 읽기, 쓰기, 복습 또는 자료나 기술에 대해 생각하는 것 등등) 학습에 더 많이 참여할수록 뇌의 연결이 더 강해지고 새로운 학습이 더 영구적인 기억이 될 가능성이 높아진다." (p.7) 그림이나 이미지를 만드는 것은 "이미지 큐 메모리"와 같이 학습하는 데 특히 효과적인 방법이다. 정보를 설명하기 위해 여러분 자신의 단어와 아이디어를 사용하는 것 – 바꿔말하기 – 또한 효과적인 정교함의 한 형태이다.

Elaboration (Doyle and Zakrajsek 2013; Brown et al. 2014), like retrieval practice and interleaving, concerns how a learner spends her/his study or practice time. According to Doyle and Zakrajsek (2013), elaboration is simply “[the] process of creating multiple paths to information” (p. 52). In discussing memory, Schacter (2001) emphasizes how essential elaboration is to memory formation. Compared to generally studying at the same time, in the same place, and in the same way each time, elaboration is a much more effective strategy for learning and memory. Elaboration encourages a learner to vary, as much as possible, how, where, and when s/he studies or practices so that the learner gradually associates information with a wide variety of contextual cues involving multiple senses (Doyle and Zakrajsek 2013; Carey 2014). In the context of CE/CPD, Shaw et al. (2011) demonstrated that the spaced retrieval practice (i.e. repeated exposure to emailed multiple-choice questions with explanations) reflecting important content from a three-day, face-to-face conference was an effective mechanism to improve self-reported clinical behaviors. According to Doyle and Zakrajsek (2013), “[the] more you engage with something that you are learning – such as listening, talking, reading, writing, reviewing, or thinking about the material or skill – the stronger the connections in your brain become and the more likely the new learning will become a more permanent memory” (p. 7). Creating pictures or images is an especially powerful way to learn (Doyle and Zakrajsek 2013), as “[images] cue memories” (Brown et al. 2014, p. 187). Using your own words and ideas to explain information – paraphrasing - is also an effective form of elaboration (Leamnson 1999; Brown et al. 2014).

과학 학습이 지속적인 교육에 대한 체계적인 리뷰의 최신 통합과 어떻게 일치합니까?
How does learning science align with the latest synthesis of systematic reviews about continuing education?

체계적 검토의 최신 종합(Cervero and Gaines 2015)은 주로 임상의와 CE/CPD보다는 의사와 지속적인 의료 교육(CME)에 초점을 맞추고 있지만, 그 연구 결과는 적어도 이 논의의 목적을 위해 모든 임상의와 일반적으로 CE/CPD에 합리적인 대리인 역할을 할 수 있다. 합성은 연습을 위해 다음과 같은 중요한 교훈을 제공한다.

  • "CME가 더 상호작용적이고, 더 많은 방법을 사용하고, 여러 노출을 수반하며, 더 길고, 의사가 중요하게 여기는 결과에 초점을 맞춘다면, 의사 성과와 환자 결과에서 더 큰 향상으로 이어질 것이다." 

While the latest synthesis of systematic reviews (Cervero and Gaines 2015) focuses primarily on physicians and continuing medical education (CME) rather than (more broadly) on clinicians and CE/CPD, its findings may serve as a reasonable proxy for all clinicians and for CE/CPD in general, at least for the purposes of this discussion. The synthesis offers the following important lesson for practice:

  • “CME leads to greater improvement in physician performance and patient outcomes if it is more interactive, uses more methods, involves multiple exposures, is longer, and is focused on outcomes that are considered important by physicians” (Cervero and Gaines 2015, p. 136).

이러한 일반적인 발견은 이 글에서 간략하게 설명한 학습에 대한 학습 과학 설명과 일치한다. 인터랙티브 세션은 상호 작용의 중요성으로 시작하여, 특히 참가자가 세션 중에 주요 정보를 여러 번 고려하는 경우 단기 메모리에 견고하게 인코딩되는 정보를 촉진한다는 점에서 더 효과적일 가능성이 높다. 더 많은 방법을 사용하는 CME 활동은 더 많은 감각을 참여시키고, 따라서 단기 기억에서 정보를 더 잘 인코딩하는 결과를 가져온다는 점에서 더 효과적일 가능성이 높다. 종단적 프로그램을 통해 여러 번 노출되면 뇌가 여러 번 정보를 검색해야 하기 때문에 여러 번 노출되고 더 긴 CME 활동이 더 효과적일 수 있다. 따라서 [암호화, 통합 및 검색의 반복적 사이클]이 발생하며, 세션 간에 통합(초기 노출 후) 및 재통합(후기 노출 후)을 지원할 수 있는 충분한 수면 시간이 제공됩니다. 마지막으로, [중요한 성과에 초점을 맞춘 활동]이 참가자를 더 잘 참여시킬 수 있다는 점에서, 그 활동이 참가자에게 인식된 중요성을 고려할 때 정보를 견고하게 인코딩하고 후속적으로 처리(연결)할 가능성이 더 높다는 것을 발견했다.

These general findings are consistent with the learning science explanation of learning briefly described in this article. Starting with the importance of interaction, an interactive session is more likely to be effective given that it promotes information being encoded solidly in short-term memory, especially if participants are considering key information many times during a session. CME activities that use more methods are more likely to be effective given that they engage more senses, and, as such, will result in better encoding of information in short-term memory. CME activities that involve multiple exposures and are longer are more likely to be effective given that multiple exposures throughout a longitudinal program will require the brain to retrieve the information multiple times, resulting in iterative cycles of encoding, consolidation, and retrieval, with adequate sleep between sessions to support consolidation (after the initial exposure) and reconsolidation (after each of subsequent exposures). Finally, the synthesis’ finding that activities focused on outcomes that are considered important are more likely to be effective given that the activities will better engage participants, resulting in information being solidly encoded and more likely to be subsequently processed (consolidated) given its perceived importance to participants.

최근 체계적 검토의 종합에 대한 일반적인 결과는 네 가지 학습 과학 전략과도 일치한다. 

  • 대화형 CME 활동은 참가자들이 자신이 알고 있거나 믿는 것을 반성하고 (이상적으로) 자신이 할 수 있는 일에 대한 피드백을 받을 것을 요구합니다. 이러한 유형의 상호작용은 중요한 교육 성과에서 개선의 기회를 밝힐 수 있는 인출 연습 전략과 매우 일치한다.
  • 더 많은 (다른) 방법을 사용하는 것은 정교화 전략에 내재된 한 가지 유형의 변형이다. 다른 변형으로는 활동의 위치와 시간을 바꾸는 것이 있다.
  • 더 긴 기간에 걸쳐 여러 번 노출을 수반하는 활동은 분산 학습의 주요 원칙을 충족한다.
  • 활동에 특정 전문분야의 구별되지만 관련된 정보가 혼재되어 있는 경우, 시간 경과에 따른 다중 노출은 인터리빙과도 일치할 수 있다.
  • 마지막으로, 참가자들이 중요한 결과에 주의를 집중하는 한 가지 방법은 인출 연습을 통해 상대적인 약점을 인식하도록 하는 것이다. 충분한 숙달력이 부족하다는 것을 알게 된 참가자는 추가 공부나 연습의 높은 우선순위로 간주할 가능성이 높다.

The general findings of the latest synthesis of systematic reviews (Cervero and Gaines 2015) are also consistent with the four learning science strategies.

  • Interactive CME activities require participants to reflect on what they know or believe and (ideally) to receive feedback on what they can do. Interaction of this type is very consistent with the strategy of retrieval practice, which can reveal opportunities for improvement in important educational outcomes.
  • Using more (different) methods is one type of variation inherent to the strategy of elaboration; other variation may involve the location and time of activities.
  • Activities that involve multiple exposures over a longer duration satisfy the major tenets of distributed learning.
  • Multiple exposures over time may be consistent with interleaving too, if the activities involve a mix of distinct but related information of a specialty.
  • Finally, one way to focus participants’ attention on important outcomes would be to make them aware of relative weaknesses through retrieval practice. A participant who becomes aware that s/he lacks sufficient mastery will likely consider it a high-priority for additional study or practice.

결론들
Conclusions

학습과학은 CE/CPD에 중요한 통찰력을 제공하여 교육자가 자신의 작업을 더 잘 이해하고 교육자가 제공하는 활동의 효과를 향상시킬 수 있도록 하는 신흥 분야입니다. 인간의 뇌에서 학습하는 것이 완전히 이해되지는 않지만, 인코딩, 통합, 검색과 같은 기본적인 단계들은 개념적으로 중요한 것으로 알려져 있으며 해마, 회음부, 신피질 등과 같은 특정 뇌 구조와 점점 더 연관되어 있다. 또한, 실무에 기반을 둔 학습 과학은 분산 학습, 검색 실습, 인터리빙 및 정교화를 포함한 몇 가지 실용적인 전략을 제공하며, 이는 교육자가 가장 중요한 결과, 즉 임상의 성과 및 환자 결과를 달성하는 것을 지원하기 위해 특정 CE/CPD 형식을 조정하는 데 도움이 될 수 있다. 마지막으로, 단계와 전략에 대한 학습 과학 설명은 가장 최근의 체계적인 검토 합성에 반영된 증거 기반 CE/CPD 속성과 일치한다.

Learning science is an emerging field that stands to offer CE/CPD important insights that may allow educators to understand better their work and to improve the effectiveness of the activities that educators offer. While learning within the human brain is not completely understood, some basic steps, such as encoding, consolidation and retrieval are known to be conceptually important and are increasingly linked to specific brain structures, such as the hippocampus, cingulate gyrus, and neocortex. Additionally, grounded in practice, learning science offers some practical strategies, including distributed learning, retrieval practice, interleaving and elaboration, which may help educators to adjust specific CE/CPD formats in support of achieving the most important outcomes, that is, clinician performance and patient outcomes. Finally, learning-science explanations about steps and strategies align with evidence-based CE/CPD attributes reflected in the most recent synthesis of systematic reviews.

 

 


Med Teach2018 Sep;40(9):880-885. doi: 10.1080/0142159X.2018.1425546. Epub 2018 Jan 15.

Learninㅁg science as a potential new source of understanding and improvement for continuing education and continuing professional development

Affiliations collapse

Affiliations

1a University of Connecticut School of Nursing , Storrs , CT , USA.

2b Department of Community Medicine and Health Care , University of Connecticut School of Medicine , Farmington , CT , USA.

3c Faculty Development , Center for Excellence in Teaching and Learning, University of Connecticut , Storrs , CT , USA.

4d Ferris State University , Big Rapids , MI , USA.

5e Learner Centered Teaching Consultants , Big Rapids , MI , USA.

PMID: 29334306

DOI: 10.1080/0142159X.2018.1425546

Abstract

Learning science is an emerging interdisciplinary field that offers educators key insights about what happens in the brain when learning occurs. In addition to explanations about the learning process, which includes memory and involves different parts of the brain, learning science offers effective strategies to inform the planning and implementation of activities and programs in continuing education and continuing professional development. This article provides a brief description of learning, including the three key steps of encoding, consolidation and retrieval. The article also introduces four major learning-science strategies, known as distributed learning, retrieval practice, interleaving, and elaboration, which share the importance of considerable practice. Finally, the article describes how learning science aligns with the general findings from the most recent synthesis of systematic reviews about the effectiveness of continuing medical education.

보건전문직 교육에서 공감: 무엇이 효과적이며, 격차와 개선 영역은? (Med Educ, 2022)
Empathy in health professions education: What works, gaps and areas for improvement
Dujeepa D. Samarasekera1 | Shuh Shing Lee1 | Jillian H. T. Yeo1 | Su Ping Yeo1 | Gominda Ponnamperuma2

 

1 소개
1 INTRODUCTION

과거의 연구는 의학의 실천에서 공감의 중요성을 입증했다. 건강 관리 맥락에서, 공감 능력이 환자의 더 나은 건강 결과로 이어진다는 것은 널리 인정되어 왔다. 연구들은 환자와 맺어진 공감적 관계가 개별화된 치료 계획의 준수를 강화하고, 환자 만족도를 향상시키며, 치료의 질을 향상시킨다는 것을 추가로 보여주었다. 공감의 긍정적인 효과는 환자들에게만 국한되지 않고 의료 전문가들에게도 똑같이 확대된다. Wilkinson 등은 그들의 리뷰에서 공감과 번아웃 사이에 부정적인 상관관계가 있음을 보여주었다. 이 개념은 Thiriou et al에 의해 더욱 반복되었는데, 그는 공감능력이 건강 관리 전문가의 과로에 대한 보호 요소로 기능한다고 추론했다. 사실, 공감의 감소는 종종 높은 수준의 탈진과 관련이 있다. 따라서 전문가와 환자에게 최적의 혜택을 주기 위해서는 의료 전문가들 사이에 공감대를 키우고 심어주는 것이 필수적이다.
Past research has established the importance of empathy in the practice of medicine. Within the health care context, it has been widely acknowledged that the ability to empathise leads to better health outcomes for patients.1-3 Studies have further illustrated that the empathetic relationship forged with patients strengthens the adherence to individualised therapeutic plans, improved patient satisfaction, and enhanced quality of care.4-6 The positive effects of empathy are not limited to patients but extend to health care professionals alike. Wilkinson et al.7 in their review demonstrated that there is a negative correlation between empathy and burnout. This notion is further reiterated by Thirioux et al.,8 who reasoned that empathy functions as a protective factor against burnout in health care professionals. In fact, decreased empathy is often associated with higher levels of burnout.8 Therefore, it is essential that empathy is nurtured and instilled among health care professionals for optimum benefits to professionals and patients.7, 9, 10

1.1 개념, 정의 및 치수
1.1 Concepts, definitions, and dimensions

의료에서 공감의 중요성은 다양한 문헌에서 널리 고려되고 있지만, 공감의 정의를 내리기는 어렵다. 공감의 개념화는 복잡하며 의학, 간호, 심리학 등 다양한 분야에서 다르게 기술되어 왔다. 역사적으로 공감의 개념은 많은 진화를 거쳤다.  주로 인지 영역으로 정의되는 것에서 정서적, 인지적, 행동적 측면을 포함하는 다차원 구조로서 공감을 개념화하는 현재 문헌에 이르기까지. 

Although the significance of empathy in health care is widely regarded in various literature, it is challenging to define empathy.11, 12 The conceptualisation of empathy is complex and has been described differently in various disciplines such as medicine, nursing and psychology.12 Historically, the concept of empathy had undergone many evolutions: From being predominantly defined as a cognitive domain to the current literature which conceptualises empathy as a multidimensional construct that encompasses affective, cognitive, and behavioural aspects.13-16

1.2 정서적
1.2 Affective


[정서적 공감(Affective empathy)]은 치료적 관계의 맥락 안에서 [타인의 감정에 대한 감정적 연결이나 반응]을 말한다. 직업들을 돕는 분야에서, 공감의 이러한 정서적 차원은 종종 "돌봄caring"과 "합치congruence"의 개념에 의해 정의된다.

  • "돌봄caring"의 개념은 정서적 공감의 일부이다. 기존 문헌은 돌봄Caring은 성공적인 도움helping 관계 내에서 확립된 정서적 애착affective attachment을 뒷받침한다고 주장해왔다. 환자-제공자 커뮤니케이션에 대한 여러 연구는 또한 환자의 만족도와 치료 계획에 대한 준수가 의사의 긍정적인 표현(관심, 배려, 따뜻함, 흥미 등)과 긍정적인 상관관계가 있음을 발견했다.
  • 정서적 공감의 또 다른 개념인 '합치congruence'는 [고객을 포용하고, 개방적이고, 정직하며, 비판단적인 상태를 유지하는 능력]을 말한다. 합치는 [고객에 대한 무조건적인 수용]에 의해 뒷받침되기 때문에, 긍정적인 정서적 연결이 확립되고 효과적인 치료/도움 관계로 전환된다. 

Affective empathy refers to the emotional connection or response to the emotions of another within the context of a therapeutic relationship.17, 18 Within the field of helping professions, this affective dimension of empathy is often defined by the concepts of “caring” and “congruence.”19, 20 

  • The concept of “caring” is part of affective empathy. Existing literature has recurrently posited that “care” underpins the affective attachment that is established within a successful helping relationship.19 Multiple studies on patient-provider communication have also found that patients' satisfaction and adherence to treatment plans were positively correlated with physicians' expressions of positive affect, such as concern, care, warmth, and interest.2122 
  • Congruence, another concept of affective empathy, refers to the ability to embrace clients and remain open, honest, and non-judgemental. As congruence is underpinned by an unconditional acceptance of clients, it allows for positive affective connections to be established and translates into effective therapeutic/helping relationships.14

1.3 인지
1.3 Cognitive

반면에, 인지 공감은 다른 사람의 상황과 관점을 객관적으로 이해하는 능력으로 정의된다. 노이만(Neumann)은 인지적 공감은 [개인의 감정적 반응에서 벗어나 타인의 경험을 구체화하는 것]을 수반하며, 양육nurturing을 통해 획득할 수 있는 능동적인 기술이라고 설명했다. 이를 통해 인지 공감이 [대인관계적 민감성]과 [관점 수용]을 모두 통해 발현된다는 것이 추가로 설명된다.

  • [대인관계적 민감성(IS)]은 구두 및 비언어적 단서를 기반으로 고객의 우려를 정확하고 객관적으로 평가할 수 있는 능력이다. 대인관계 민감성은 "사회적 민감성"과 "감정적 민감성"으로 더 나눌 수 있다.
    • [감정적 민감성]는 비언어적 단서(즉, 얼굴 표정 또는 신체 언어)에 대한 인지적 평가를 포함한다. 반면에
    • [사회적 민감성]은 건강 전문가들이 의뢰인의 사회적 역할 기대, 성격 특성, 그리고 주변 사회 구조와 같은 맥락을 이해하도록 요구한다.

On the other hand, cognitive empathy is defined as the ability to objectively comprehend another person's situation and perspective.17, 23, 24 Neumann et al.23 further described that cognitive empathy entails one embodying the experiences of another with detachment from one's individual emotional response and is an active skill that can be acquired through nurturing.11 Leading on from this, it is further explained that cognitive empathy manifests through the concepts of both interpersonal sensitivity and perspective-taking.24, 25 

  • Interpersonal sensitivity (IS) is the ability to make accurate and objective assessments of clients' concerns based on verbal and nonverbal cues. Interpersonal sensitivity can be further divided into “social sensitivity” and “emotional sensitivity.”
    • Emotional sensitivity involves a cognitive assessment of nonverbal cues (i.e., facial expressions or body language), whereas
    • social sensitivity requires health professionals to appreciate the context, such as the client's social role expectations, personality traits, and surrounding social structures.1426
  • 관점 수용(PT)은 공감의 인지 차원의 두 번째 핵심 측면이다. PT에서 의료 전문가들은 고객의 관점을 적절한 맥락에서 평가하기 위해 자신의 인식을 "일시 중지"하고 클라이언트의 세계로 자신을 "전환"해야 한다. 효과적인 IS와 PT의 구현은 치료사들이 다른 시맨틱으로 고객의 문제를 반복할 수 있을 때 명백하다. 인지 공감의 효과는 또한 환자와의 더 나은 의사소통과 관련이 있으며, 환자의 의사 능력에 대한 인식 증가와 긍정적인 관련이 있는 것으로 밝혀졌다.
  • Perspective-taking (PT) is the second key aspect of the cognitive dimension of empathy. In PT, health professionals are expected to “suspend” their own perceptions and “transpose” themselves into the world of the client to appreciate clients' perspectives in the appropriate context. The embodiment of effective IS and PT is evident when therapists are able to reiterate clients' issues with a different semantic. The effects of cognitive empathy are also found to be associated with better communication with patients and are positively related to patients' increased perceptions of their physicians' capabilities.2728

1.4 행동
1.4 Behaviour

[행동 차원]은 공감을 실천/행동으로 변환하는 것으로 정의되며, 공감의 인지적 및 정서적 경험에 대한 반응이다. 이타주의와 치료적 관계의 구성은 공감을 돕는 관계에서 기능적 실체가 되도록 허용하면서 이 차원을 더욱 정의한다. 의료의 맥락에서, 공감과 이타주의 사이의 긍정적인 연관성은 널리 문서화되어 왔다. 높은 수준의 공감은 이타주의로 이어지며, [이타주의]는 다른 사람의 고통을 덜어주거나 다른 사람의 행복을 향상시키는 주된 목표를 가진 "다른 사람 지향적인" 동기나 행동이라고 묘사된다.

The behaviour dimension, defined as translating empathy into practice/action, is a response to the cognitive and/or affective experience of empathy.29, 30 The constructs of altruism and therapeutic relationship further define this dimension, allowing empathy to become a functional entity in a helping relationship. In the context of health care, positive associations between empathy and altruism have been documented widely.31, 32 High levels of empathy lead to altruism which is described as an “other-oriented” motivation or behaviour with a primary goal of relieving another's pain or improving another's well-being.31-33

[치료적 관계]는 공감적 실천의 핵심 신조tenet이며, 종종 인지적, 정서적 공감의 개념을 활용하여 실행 가능한 프레임워크를 포지셔닝한다. 사실, 연구에 따르면 전문적인 판단은 관점을 취하는 것(인지 공감)을 통해 객관적인 평가가 일어날 수 있도록 하면서 감정적으로 조정될 필요가 있다고 한다. 
Therapeutic relationships, a key tenet of empathetic practice, have often utilised the concepts of cognitive and affective empathy to posit actionable frameworks. In fact, studies postulate that professional judgement begets the need for one to be emotionally attuned (affective empathy) while allowing for objective assessments to occur through perspective-taking (cognitive empathy).19

1.5 의료교육 공감능력 배양
1.5 Nurturing empathy in medical education

공감과 더 나은 환자 건강 결과 사이의 긍정적인 연관성에 대한 압도적인 증거의 관점에서, 증가하는 연구 이니셔티브와 교육적 개입은 공감 능력을 개발하고 의료 서비스 내에서 학생과 실무자의 이타적 동기를 유지할 수 있는 더 전체적인 커리큘럼을 요구했다. 
In view of overwhelming evidence of the positive association between empathy and better patient health outcomes, an increasing amount of research initiatives and pedagogical interventions have called for more holistic curricula that can develop empathy and maintain altruistic motivations of students and practitioners within health care services.31, 34, 35

Elayyan 등은 워크숍을 통한 훈련과 학습, 특정 학습 접근법과 경험이 공감 행동을 향상시킬 수 있다고 강조했다. 문헌에 제시된 다양한 접근법이 있다. 시뮬레이션 시나리오/환자와의 개인적 경험에 대한 성찰적 그룹 토론, 시와 문학, 회화, 성찰적 글쓰기, 문화사 등 예술과 인문학의 활용, 공감에 대한 자기 인식을 높이기 위한 명상과 마음챙김 경청 등이다. 체계적인 검토 결과, 개입은 [리허설이 있을 때]와 [혼합 모델 개입(예: 경험적, 교훈적, 기술 훈련)이 사용될 때] 더 효과적이었다는 것이 밝혀졌다. 
Elayyan et al.36 highlighted that training and learning during workshops and specific learning approaches and experiences are able to enhance empathetic behaviour. There are multiple approaches suggested in the literature including reflective group discussion on personal experiences with simulated scenarios/patients, the use of art and humanities such as poetry and literature, painting, reflective writing, and cultural history, as well as meditation and mindful listening to increase self-awareness on empathy.37, 38 Systematic reviews revealed that interventions were more effective when rehearsal was present and when mixed-model interventions (e.g., experiential, didactic, and skills training) were used.39, 40

밀로타 외 연구진의 또 다른 체계적인 리뷰는 [서사 의학]이 [자기성찰과 공감을 자극하는 효과적인 교육적 도구]이며 학생들이 다른 관점이나 각도에서 환자를 생각하는 데 도움이 될 수 있다는 것을 보여주었다. 비록 공감은 적절한 개입으로 학부 교육 동안 가르치고 배울 수 있지만, 그것의 지속 가능성은 아직 결정되지 않았다. [역할 모델링]은 학생을 포함한 의료 전문가들이 환자의 공감과 상호작용하는 방법을 배우는 가장 강력한 접근법 중 하나이다.36 그러나 부적절한 역할 모델링은 환자 치료를 제공하는 데 있어 공감의 중요성을 이해하는 데 방해가 될 수 있다.
Another systematic review by Milota et al.41 showed that narrative medicine is an effective pedagogic tool to stimulate self-reflection and empathy and that it can help students think about their patients from a different perspective or angle. Although empathy can be taught and learned during undergraduate training with the appropriate intervention, its sustainability remains undetermined. Role modelling is one of the strongest approaches whereby health care professionals, including students, learn how to interact with patients' empathetically.36 However, inappropriate role modelling might impede understanding the importance of empathy in providing patient care.

의학 교육에 대한 공감 개입의 결과에 대해서도 학자들 사이에 이견이 있었다. 교육 프로그램 과정 중에 감정이입 감소의 증거가 있지만, 학자들은 또한 이러한 변화가 다른 요인의 결과일 수 있다는 것을 인정했다. 이러한 요소들은 학생들의 특성, 사회문화적, 지정학적 요인들을 포함한다. 이 문제의 복잡성을 더욱 설명하기 위해, Ferreira-Valente 외 연구진이 여러 연구 설계(설계, 사용된 측정, 샘플 크기 및 결과)를 포괄한 메타 분석을 통해 의과대학 전체에서 학생 공감에 일반화된 추세를 보이지 않았다. 이는 [문화와 맥락, 연구 설계, 척도 등]이 이러한 연구 결과에 영향을 미칠 수 있는 영향을 보여준다.
There has also been disagreement among scholars about the outcomes of empathy interventions in medical education. While there is evidence of empathy-decline during the course of the training programme, scholars have also acknowledged that these changes might be a result of other factors.42 These factors include characteristics of students, socio-cultural and geopolitical factors.34, 43, 44 To further illustrate the complexity of this issue, a meta-analysis by Ferreira-Valente et al.45 that encompassed multiple study designs (design, measures used, sample sizes, and results) showed no generalised trend in student empathy throughout medical school. This demonstrates a possible impact of culture and context, study design, and measures affecting the results of these studies.

기존 문헌을 바탕으로 우리는 개입의 결과가 일관되지 않다는 것을 발견했다. 따라서, 이 기사의 목적은 학부 및 대학원 의학 교육에서 공감 능력을 배양하기 위한 개입/접근 방식에 대한 더 많은 통찰력을 제공하기 위한 서술적 검토를 수행하는 것이다.
Building upon existing literature, we found that there are inconsistent outcomes of interventions. Hence, the aim of this article is to conduct a narrative review to provide more insights into the interventions/approaches to nurturing empathy in undergraduate and postgraduate medical education.

본 연구의 연구 질문은 다음과 같습니다.

  • 공감 능력을 키우는 학부 및 대학원 의학 교육에 어떤 개입이 있나요?
  • 이러한 개입이 의료 전문가에게 공감 능력을 배양하는 측면에서 얼마나 효과적인가?
  • 개입의 강점과 한계는 무엇인가?
The research questions of this study are as follows:
  • What are the interventions in undergraduate and postgraduate medical education that nurture empathy?
  • How effective are these interventions in terms of developing empathy in health care professionals?
  • What are the strengths and limitations of the interventions?

2 방법론
2 METHODOLOGY

위의 연구 질문에 답하기 위해 페라리가 제안한 프레임워크를 기반으로 한 서술적 검토를 채용했다. PubMed, Embase 및 Google Scholar의 세 가지 주요 전자 데이터베이스를 검색하여 영어로 번역되고 2012-2020년 동안 발행된 영어 기사 또는 기사를 검색했다. 연구의 중요성을 인식하기 위해 부울 연산자("OR/AND")를 사용하여 '의료' 주제 표제(MeSH)를 검색하기 위해 검색어를 넓혔다. 그 결과, 검색 문구가 아래에 나열되었습니다.

  • 학부 대상: (공감) AND (의학 교육) AND (학부) OR (학습) OR (기술 강화 학습) OR (교육 회진) OR (통신) OR (환자 시뮬레이션) OR (교육 자료) OR (역할 놀이) OR (전자 학습)
  • 대학원생의 경우: (공감) AND (의학 교육) AND (대학원) AND (교육) OR (학습) OR (기술 강화 학습) OR (교육 회진) OR (환자 시뮬레이션) OR (교육 자료) OR (교육 자료) OR (역할 놀이) OR (e-Learning)


To answer the above research questions, we employed a narrative review based on the framework proposed by Ferrari.46 We searched three major electronic databases of PubMed, Embase, and Google Scholar for the English-language articles or articles which were translated to English, and published during 2012–2020. The search terms were broadened using the Boolean operator (“OR/AND”) to search the ‘medical’ subject heading (MeSH) in order to recognise the significance of the study. As a result, the search phrases were listed below.

  1. For Undergraduate: (Empathy) AND (Medical education) AND (Undergraduate) AND (Teaching) OR (Learning) OR (Technology-enhanced learning) OR (Teaching round) OR (Communication) OR (Patient simulation) OR (Teaching material) OR (Role-play) OR (e-Learning)
  2. For Postgraduate: (Empathy) AND (Medical education) AND (Postgraduate) AND (Teaching) OR (Learning) OR (Technology-enhanced learning) OR (Teaching round) OR (Communication) OR (Patient simulation) OR (Teaching material) OR (Role-play) OR (e-Learning)

또한 주제에 대한 연구의 관련성에 초점을 맞춘 문헌 검색에 대한 포함 및 제외 기준을 정의했다. 공감능력 배양에 학부 및 대학원 의학교육 개입을 포함하는 것 외에, 개입을 측정하는 결과가 명확한 원저 연구 논문(양적 또는 질적 또는 혼합 방법)과 체계적인 검토만 연구에 포함되었다. 이를 통해 결과를 논의하는 데 있어 전체적인 관점을 제공할 수 있었습니다. 그림 1은 본 기사에 대한 문헌 선정 과정의 흐름도이다.
We also defined the inclusion and exclusion criteria for the literature search focusing on the relevance of the studies to the topic. Other than including undergraduate and postgraduate medical education interventions in nurturing empathy, only original research articles (quantitative or qualitative or mixed-method) and systematic reviews with clear outcomes measuring the interventions were included in the study. This enabled us to provide a holistic view in discussing the outcomes. Figure 1 shows the flow chart of the literature selection process for the present article.

세 명의 연구자(SSL, YSP, JYHT)는 포함 기준을 충족하는 기사의 전문을 철저히 스캔했다. 그리고 나서 그 연구원은 독립적으로 기사 내용을 검토했다. 우리는 각 연구의 유형 및 설계, 연구의 주요 목표, 연구의 품질, 표본 크기, 자체 보고 또는 객관적 측정, 유형, 지속 시간, 가르친 기술, 교육 개입의 양식, 그리고 학문에 기초한 기사를 면밀히 검토했다. 우리는 또한 반응, 학습, 행동 및 영향의 네 가지 수준을 기반으로 커크패트릭 모델의 네 가지 수준에 따라 결과를 기록했다.
Three researchers (SSL, YSP, and JYHT) thoroughly scanned the full text of articles that met inclusion criteria. The researcher then independently reviewed the article content. We scrutinised the articles based on the types and designs of studies, primary objectives of studies, quality of studies, sample size, self-reported, or objective measurements in each study, type, duration, frequency, skills taught, modality of educational interventions, and disciplines. We also recorded the outcomes according to the four levels of Kirkpatrick's model based on the four levels: Reaction, learning, behaviour, and impact.

3 결과
3 RESULTS

총 44개 논문(학부 38편, 대학원 6편)이 검토되었다. 공감과 관련된 개입은 대학원 교육에 비해 학부생에게 더 큰 비중을 두고 있다. 그림 2는 검토된 기사에 대한 기본 정보를 요약한 것이다.

A total of 44 articles (38 undergraduate and six postgraduate)11, 37, 38, 47-87 were reviewed. Interventions related to empathy have placed a higher emphasis on undergraduate as compared with postgraduate education. Figure 2 summarises the basic information on the articles reviewed.

 

아시아와 미국에서도 같은 수의 연구 결과가 발표된다(각 대륙에 대해 10개). 이것은 [아시아의 국가]들이 특히 학부 시절에 의학교육에서 공감을 길러야 할 중요한 측면으로 인식하고 있음을 나타낼 수 있다. [양적 연구 설계]는 여전히 공감에서 연구를 지배한다. 커크패트릭 평가 모델에 따른 결과에 대해서는 대학원 의학 교육에 대한 개입이 커크패트릭 레벨 3(행동)까지 평가된 반면, 학부 교육에 대한 개입은 대부분 레벨 2(학습)에 초점을 맞췄다.
There is also an equal number of studies published in Asia and the United States (10 for each continent). This may indicate that the countries in Asia perceive empathy as an important aspect to be nurtured in medical education specifically during undergraduate years. Quantitative research design still dominates the studies in empathy. As for the outcomes according to Kirkpatrick Evaluation Model, the interventions in postgraduate medical education were evaluated up to Kirkpatrick Level 3 (Behaviour) whereas interventions in undergraduate education were mostly focused on Level 2 (Learning).

3.1 개입 및 결과의 유형
3.1 Types of interventions and outcomes

우리가 검토한 연구에서 권장되는 다양한 개입이 있다. 연구의 약 44%(n = 18)가 다양한 접근법의 혼합물을 개입으로 사용했다. 여기에는 동영상 사용, 소그룹 토론, 역할극, 실시간 피드백, 성찰 등이 포함된다. 다양한 개입에 사용된 다양한 접근법에 대한 자세한 내용은 표 1에 나와 있다.가장 일반적으로 사용되는 접근법 중 하나는 공감 능력을 배양하는 데 시뮬레이션 환자 또는 동료/튜터와의 인터뷰 기법을 사용한 것이고, 그 다음으로는 성찰/내러티브 글쓰기를 사용한 것이다. 사례 토론, 게임화, 편지 교환, 문신을 이용한 체험 학습과 같은 다른 접근법이 제안되고 있다. 일부 개입은 특정 학습 영역에 의해 결정되었는데, 예를 들어 의사소통 기술에 초점을 맞춘 논문 7편, 인문 과학에 관한 논문 3편, 예술에 관한 논문 3편이 있었다. 다양한 접근법이 제시되고 있지만, 결과는 표 1과 같이 다양했다. 따라서, 우리는 개입 유형만으로는 공감 능력을 배양하는 데 충분하지 않을 수 있다고 결론짓는다.

There are different interventions recommended in the studies that we reviewed. About 44% (n = 18)38, 52, 58-60, 63-67, 73, 74, 77, 82, 83, 85, 86 of the studies used a mixture of different approaches as their interventions. These include the use of videos, small group discussion, role play, real-time feedback, and reflection. The details of the different approaches used in different interventions are indicated in Table 1.The one of the most commonly used approach was the use of interviewing techniques with simulated patients or peers/tutors in fostering empathy,47, 48, 54, 62, 71 followed by the use of reflective/narrative writing.51, 55, 68, 76 There are other approaches being suggested such as case discussion,37, 61, 78 gamification,72 letter exchange,80 and experiential learning using tattoos.57 Some interventions were anchored by specific study areas, for example, there were seven papers focusing on communication skills,47, 53, 56, 58, 63, 64, 71 three papers on humanities,66, 67, 77 and three on arts.38, 55, 85 While there are different approaches being suggested, the outcomes were varied as shown in Table 1. Hence, we conclude that the types of intervention alone may not be sufficient in cultivating empathy.

 

3.2 개입 및 결과의 지속 시간
3.2 Duration of the interventions and outcomes

추가 정밀 조사 결과, 우리는 다른 개입이 일회성 개입으로 또는 일정 기간 동안 구현되고 있음을 발견했다(표 1 참조). 시행 기간을 언급하지 않은 연구는 4개였다. 이 4개 연구 중 2개의 정량적 기사에 대한 공감에 큰 변화가 없는 것으로 나타났고 나머지 2개는 정성적 연구였다. 일회성 개입을 제안한 연구(30%; n = 12)와 비교하여 대부분의 개입(60%; n = 26)이 일정 기간에 걸쳐 구현되었다. 일정 기간 동안 시행된 논문 중 16(38%)가 개입 후 공감 점수가 증가했다고 밝혔다. 다만 일회성 개입에 대한 공감 점수가 상승한 논문은 3편(7%)에 불과했다. 따라서, 우리는 시행되는 개입 기간이 학생들의 공감에 영향을 미칠 수 있다고 제안한다.

Upon further scrutiny, we found that different interventions were being implemented either as a one-off intervention or over a span of time (refer to Table 1). There were four articles which did not mention the duration of implementation.47-49, 81 Of these four articles, the results showed no significant change in empathy for two quantitative articles47, 48 and the other two were qualitative research.49, 81 A majority of the interventions (60%; n = 26) were implemented over a span of time37, 60-80, 83-86 as compared with studies that suggested a one-off intervention (30%; n = 12).38, 50-59, 82 16 (38%)61-74, 83, 84 of the 26 papers which the interventions which were implemented over a span of time indicated increased in empathy score after the intervention. However, there were only three papers52, 53, 58 (7%) showing an increase in empathy score for the one-off intervention. Therefore, we suggest that the duration of the intervention being implemented may have an effect on student empathy.

3.3 개입 및 결과에 대한 공감 측정 도구
3.3 Empathy measurement tools of interventions and outcomes

제퍼슨 공감 척도(Jefferson Scale of Efficiency, JSE)는 개입 후 학생들의 공감을 측정하는 데 널리 사용되는 반면, 연구의 약 41%(n = 14)는 다른 측정 도구를 포함했다. 여기에는 대인관계 반응도 지수(IRI) 인벤토리, 환자-제공자 지향 척도(PPOS), 컨설팅 및 관계형 공감(CARE) 측정, 전문가 또는 환자의 평가 및 평가 데이터가 포함된다. 외부 관찰자 등급과 같은 다른 측정값을 사용한 연구는 거의 없었다. 여기에는 공감 커뮤니케이션 코딩 시스템, 표준화된 환자 커뮤니케이션 체크리스트, 의대생 인터뷰 성과 설문지(MSIPQ) 등이 포함됐다. JSE 척도를 사용하는 것은 림 외 연구진과 웡드리치 외 연구진이 수행한 연구에서 전문가와 환자가 개입 후 학생 공감에 대해 높은 평가를 내렸기 때문에 학생 공감 수준을 나타내기 위한 추가 측정 도구를 갖는 것만큼 정확하지 않을 수 있지만, JSE에서 유의미한 변화는 나타나지 않았다. 그러나 도구 외에 이러한 차이는 자기 인식과 외부 평가의 차이 때문일 수도 있습니다.

While the Jefferson Scale of Empathy (JSE) is widely used in measuring student empathy after an intervention, around 41% (n = 14) of the studies included other measuring tools.47, 51, 52, 60, 70, 73, 75-79, 82-84 These include Interpersonal Reactivity Index (IRI) inventory, Patient–Provider Orientation Scale (PPOS), Consultative and Relational Empathy (CARE) measure, experts' or patients' rating, and assessment data. Few of the studies employed other measurements such as external observers rating on a graded scale.50, 63, 82-84 These included Empathic Communication Coding System,50 standardised patient communication checklist,50 and Medical Student Interview Performance Questionnaire (MSIPQ).50 Using the JSE scale alone might not be as accurate as having additional measurement tools to indicate student empathy levels as studies carried out by Lim et al.54 and Wündrich et al.79 showed that experts and patients rated highly on student empathy after the intervention, but no significant change was shown in JSE. However, other than the tool, this difference may also be due to the difference in self-perception and external assessment.

검토한 평가 척도는 다른 속성 또는 특성에 초점을 맞추고 학습자의 특정 속성을 다른 척도와 비교할 때 다르게 가중치를 부여한다. 따라서 개입 후 한 환경에서 다른 환경에서 다른 그룹의 학생들과 학생들의 공감 수준을 비교할 때, 연구자들이 학습자의 공감 수준을 측정하기 위해 다른 척도를 사용한다면 비교는 동일하지 않을 수 있다.

The rating scales we reviewed focused on different attributes or characteristics and weigh certain attributes of learners differently than when compared with another scale. Therefore, when one compares student empathy level in one setting after an intervention with another group of students in a different setting, the comparisons may not be the same if investigators have used different scales to measure the learners' empathy level.

3.4 개입 및 품질에 관한 연구
3.4 Studies on intervention and the quality

비록 대부분의 연구가 연구의 엄격함에 부합하지만, 우리는 일부 연구가 연구의 결과에 영향을 미칠 수 있는 연구 방법론에 한계를 가지고 있다는 것을 알아챘다. 정성적 연구 설계를 활용한 연구는 4개였지만 결과에서 양성되는 공감의 구성요소에 대해서는 논의하지 않았다. 개입 결과의 주제 중 하나로 인터뷰 대상자들이 공감을 짧게 언급했다. 4개의 연구는 개입의 기간과 실행 시기를 언급하지 않았다. 따라서 결과(중요한 변화가 없음)가 기간에 의한 것인지는 공정한 판단을 할 수 없다. 학생공감도가 높아진 기사는 2건이었지만, JSP의 항목 중 일부만 사용(한 기사는 JSP의 항목 5건만 사용)했다. 따라서 결과가 의심스러울 수 있다.

Although most of the studies conformed to the rigour of research, we noticed that some studies had limitations in the research methodology which might affect the outcome of the studies. There were four studies utilising qualitative research design49, 71, 80, 81 but did not discuss the components of empathy being nurtured in the results. Empathy was briefly mentioned by the interviewees as one of the themes of the outcome of the interventions. Four studies did not mention how long the interventions were and when they were implemented.47-49, 81 Hence, we are not able to make a fair judgement whether the outcome (no significant change) was due to the duration. There were two articles showing an increase in student empathy level but only part of the JSP's items were used (one article only used five items from JSPE).72, 73 Therefore, the outcomes could be questionable.

4 토론
4 DISCUSSION

현재의 리뷰는 보건 직업 학생들의 공감 능력을 향상시키기 위한 개입을 설계할 때 몇 가지 중요한 전략을 추천하고 싶다. 내용을 전달하기 위해 사용되는 교육-학습 방법, 그러한 방법의 조합이 일정 기간 동안 사용되는지 여부, 즉 단일 개입이 아닌 세로 방향, 측정 유형 및 학습자의 공감의 영향/수준을 평가하는 데 사용되는 측정 도구에 대해 명확히 알아야 한다..
The current review would like to recommend several important strategies when designing interventions to improve empathy among health professions students. It is important that one must be clear about the teaching–learning method that would be used to deliver the content, whether a combination of such methods is used over a period of time, that is, longitudinally rather than a single intervention, the type of measurement, and the measurement tool used to evaluate the impact/level of learner's empathy.

  • 첫째, 우리는 학습자의 [사고 과정(성찰 연습 및 서술 의학 등)을 호출하는 교육-학습 접근법]과 일반적으로 [역할 모델링을 수반하는 경험적 학습]이 교육 및 학습의 교육적 방법보다 더 효과적이라는 것을 발견한다.
  • 둘째, 나머지 커리큘럼에서 [한 번] 또는 [고립된 노력]과 공감 능력을 향상시키기 위한 [하나의 중재적 접근]에만 집중하는 것은 최상의 결과를 가져오지 못할 수 있다. 대신, 서로 다른 교육적 개입을 결합하는 다중 모드 혼합 방법 접근법은 원하는 결과를 가져올 가능성이 더 높다.
  • First, we find the teaching–learning approaches that would invoke learners' thought processes (such as reflective practice and narrative medicine) and experiential learning which usually involves role modelling are more effective than the didactic methods of teaching and learning.
  • Second, onetime or isolated efforts from the rest of the curriculum and focussing only on one interventional approach to improve empathy may not bring about the best results. Instead, multimodal mixed-method approaches that combine different pedagogical interventions are more likely to bring about the desired outcomes.

검토는 또한 [개입이 구현되는 방식]에 따라 학습자에게 다른 결과를 산출할 수 있다는 것을 발견했다. 일회성 개입에 비해 개입이 [장기간에 걸쳐 구현될 때] 더 나은 공감 점수를 얻고 유지된다. 그러나 공감으로 측정되는 것은 서로 다른 도구를 사용하는 연구마다 크게 다르다. 결과의 불일치는 주로 사람들이 공감을 인식하는 방식에 영향을 미치는 데 영향을 미치는 여러 요인 때문이다. 이 격차는 JSE에 대한 자체 보고 점수에서 유의미한 변화는 없지만 시뮬레이션 환자(SP)와 관찰자는 공감 점수가 개선되었다고 보고한 여러 연구에서 강조되었다. 제프리는 또한 의대생들 사이에서 실시된 자기보고 설문지와 자신의 공감을 평가하는 인터뷰 사이의 불일치를 지적했다. 학생들은 그들의 공감을 설문지에 나타난 것처럼 훈련 중에 감소하기 보다는 면접에서 발전하는 것으로 묘사했다.
The review also discovered the way in which the interventions were implemented could yield different outcomes in learners. Better empathy scores are obtained and retained when the interventions are implemented over a longer period of time as compared with one-off intervention. However, what is being measured as empathy vary significantly in different studies using different tools. The incongruence in the results is mainly due to multiple factors playing a part in influencing how people perceive empathy. This gap was also highlighted in several studies56, 79 that reported no significant change in self-reported scores on the JSE but simulated patients (SPs) and observers showed an improved empathy score. Jeffrey88 also pointed out the discrepancy between self-report questionnaires and interviews conducted among medical students on evaluating their own empathy. Students described their empathy as developing in the interview rather than declining during their training as indicated in the questionnaire.

우리는 이러한 도구가 본 논문의 앞부분에서 공유한 [공감의 모든 도메인을 포착하지 못한다]고 주장한다. 따라서, 우리는 현재의 연구가 특정 측면에서만 학생의 공감을 반영할 수 있고 학생 공감 수준에 대한 포괄적인 관점을 제공하지 않을 수 있다는 것을 인식할 필요가 있다. 평가 도구를 사용할 때 교묘함과 명확성의 부족도 공감 점수의 불일치에 기여했을 수 있다. 일부 도구는 검증되고 해당 국가의 모국어로 번역되지만, 이는 현지 상황에 따라 다른 의미를 가질 수 있습니다. 또한 Zhou 등이 수행한 체계적인 검토 결과, 이러한 도구를 사용하여 공감을 측정했을 때 35개 글에서 공감이 제대로 정의되지 않은 것으로 나타났다. 따라서, 조사자들은 그들의 맥락에서의 공감의 정의, 개입에서 조사되고 구현될 공감의 영역, 공감 점수에 영향을 미치는 요인 및 번역된 버전의 척도를 명확하게 진술하는 것이 중요하다. 이렇게 하면 개입 결과를 보고할 때 공감 수준을 보다 전체적으로 이해할 수 있습니다.

We argue that these tools do not capture all the domains in empathy as shared earlier in our paper. Hence, we need to be cognizant that current studies may only reflect the student's empathy in certain aspects and do not provide a well-rounded view of student empathy level. A lack of finesse and clarity when using the tools to evaluate may have also contributed to inconsistency in the empathy scores. Some tools are validated and translated to the country's mother tongue but this may give rise to different meanings in the local context. In addition, a systematic review carried out by Zhou et al.89 showed that empathy is poorly defined in 35 articles when empathy was measured using these tools. Therefore, it is important for investigators to clearly state the definition of empathy in their context, the domain of empathy to be investigated and implemented in the interventions, the factors influencing empathy score and the translated version of the scale. This will provide a more holistic understanding of the empathy level when reporting the outcome of the interventions.

공감의 모든 차원을 포괄하는 개입을 개발하는 것은 거의 불가능하기 때문에, 어떤 개입에 앞서, 교육자와 연구원들은 자신의 연구 맥락에서 공감을 정의해야 한다. 우리는 또한 저자가 공감을 키우고 측정하려는 학습 영역에 대한 정보를 제공할 것을 제안한다. 측정 도구는 측정하려는 특정 치수를 표시해야 한다. 다음으로, 연구자들은 그 정의에 기초하여 개입을 설계하고 공감을 측정하기 위한 적절한 도구로 그것을 추적해야 한다. 도구를 통해 수집된 데이터의 해석은 선택한 공감의 차원과 정의에 기초해야 한다. 주어진 도구로 측정하려고 의도하지 않은 공감 차원과 정의를 포함하도록 해석을 확장해서는 안 된다. 이와 같이, 유사한 도구에 의해 측정된 공감의 비교는 공정하고 투명한 것으로만 간주될 수 있다.
Because it is almost impossible to develop an intervention that encompasses all dimensions of empathy, prior to any intervention, the educators and researchers should define empathy in one's study context. We also suggest that authors provide information on the area of learning in which they intend to nurture and measure empathy. The measurement tools should indicate the specific dimensions that they intend to measure. Next, the researchers should design the intervention based on the definition and follow it up with an appropriate tool to measure empathy. The interpretation of data collected through the tool should be based on the dimension and definition of empathy selected. One should never extend the interpretations to cover empathy dimensions and definitions that were not intended to be measured by a given tool. As such, the comparison of empathy measured by similar tools can only be considered fair and transparent.

5 결론
5 CONCLUSIONS

지난 수십 년 동안, 보건직 교육자들은 보건직 학생들 사이의 공감을 기르기 위해 다양한 접근 방식을 실험해 왔다. 이 서술적 검토는 공감을 주입하기 위해 사용된 접근 방식을 다루고 분석하며, 다양한 접근 방식의 조합이 활용된다는 것을 알게 되었다. 그러나 이러한 접근법의 결과는 다양하다. 우리는 접근법이 [어떻게 구현]되고 있었는지가 그것의 성공을 결정하는 데 중요한 요소라고 주장하며, 우리는 [일정 정도의 기간] 동안 수행된 개입이 더 나은 결과를 산출한다는 것을 본다. 그러나 보고된 결과가 서로 다른 이유만은 아닐 수 있다. 대부분의 평가 도구는 서로 다른 영역과 공감 구조에 초점을 맞춘 척도를 사용하여 보고되었다. 이것은 우리가 본 논문에서 논의한 바와 같이 몇 가지 모순된 결과를 초래했다. 공감의 구조는 복잡하고 맥락이 매우 높다. 따라서, 우리는 상황별 접근 방식을 정의하고 사용할 때 명확성을 가지며, 사용된 도구가 공감 결과를 평가하고 보고할 때 데이터를 삼각측량하는 데 사용된 방법을 명확하게 명시할 것을 제안한다.

Throughout the past several decades, health professions educators have been experimenting with multiple approaches to nurture empathy among health professions students. This narrative review addresses and analyses the approaches used to inculcate empathy and we noticed different combinations of approaches were utilised. However, the outcomes of these approaches vary. We argue that how the approaches were being implemented plays an important factor in determining its success and we see that interventions that were carried over a span of time, yield better results. However, this might not be the only reason for the different outcomes reported. Most of the evaluation tools have been reported using scales focusing on different domains and constructs of empathy. This has led to some inconsistent outcomes as we have discussed in this paper. The constructs of empathy are complex and highly contextual. Therefore, we propose to have clarity in defining and using contextual approaches, and to clearly state the tools used assess empathy and methods used to triangulate data when assessing and reporting empathy outcomes.

 

 


Med Educ. 2022 Jul 5. doi: 10.1111/medu.14865. Online ahead of print.

Empathy in health professions education: What works, gaps and areas for improvement

Affiliations collapse

Affiliations

1Centre for Medical Education (CenMED), Yong Loo Lin School of Medicine, National University of Singapore, Singapore.

2Department of Medical Education, Faculty of Medicine, University of Colombo, Colombo, Sri Lanka.

PMID: 35790499

DOI: 10.1111/medu.14865

Abstract

Introduction: Developing a physician equipped with both technical and affective skills is crucial in ensuring quality patient care. Of these skills, nurturing empathy is a key skill that has been studied in great detail, particularly among medical undergraduates. Despite numerous studies trending the changes in empathy, the results are often contradictory or confusing. Our study aims to find what interventions are effective to inculcate empathy in both undergraduate and postgraduate medical education and suggest areas for improvement.

Methods: A narrative review was conducted on the interventions in nurturing empathy in undergraduate and postgraduate medical education. Original research articles and systematic reviews with clear interventions and outcomes were included in the study.

Results: A total of 44 articles were reviewed. About 44% (n = 18) of the studies used a mixture of different approaches as their interventions. Some interventions were anchored by specific topics: Seven papers focusing on communication skills, three papers on humanities, and three on arts. A majority of the interventions (60%; n = 26) were implemented over a span of time as compared to studies which suggested a one-off intervention (30%; n = 12). Of the 26 papers in which the interventions were enforced over a period of time, 62% (n = 16) indicated an increase in student empathy whereas 16% (n = 4) indicated no changes in empathy post-intervention. On the contrary, 50% (n = 6) of the one-off interventions revealed no significant change in student empathy. Jefferson Scale of Empathy (JSE) is widely used in measuring student empathy postintervention, but approximately 41% of the studies included measuring tools other than JSE.

Conclusions: Pedagogical methods that invoke thought processes related to the affective domain of learning and experiential learning are more effective than the didactic methods of teaching and learning. Multimodal mixed-methods approach that combine different pedagogical interventions is more likely to bring about the desired results.

교육과정 혁신의 촉매로서 학생: 변화 관리 프레임워크 (Med Teach, 2020)
Students as catalysts for curricular innovation: A change management framework
Jesse Burk-Rafela, Kevin B. Harrisb, Jacqueline Heatha, Alyssa Millironc, David J. Savageb and Susan E. Skochelakd

 

서론
Introduction

2005년 이후 약 75%의 동종 요법 기관이 개혁을 시작함에 따라 미국 의과대학이 커리큘럼 변혁에 착수했다는 근거가 있다(Bear et al. 2013). 의료 커리큘럼도 학생 중심의 훈련으로 더 폭넓게 전환하면서 국제적으로 변화하고 있다(Jones et al. 2001).
There is groundswell of American medical schools embarking on curricular transformation, with an estimated 75% of allopathic institutions initiating reforms since 2005 (Bear et al. 2013). Medical curricula are changing internationally, as well, with a broader shift to more student-centered training (Jones et al. 2001).

이러한 노력 가운데, 비의료 고등 교육(테일러 및 와일딩 2009, 보빌 외 2011, 펠텐 외 2013)과 의료 교육(홀름보 및 바탈덴 201)에서 학생을 [교육 콘텐츠의 단순한 '소비자']에서 [활동적인 협력자, 공동 제작자, 콘텐츠 및 커리큘럼의 공동 제작자]로 재개념화하려는 움직임이 일고 있다. 불행하게도, 교육과정 설계에 학생의 목소리를 참여시키는 것이 중요하다는 광범위한 동의에도 불구하고, 그러한 참여는 종종 상대적으로 수동적인 피드백이나 토큰 학생 리더(Seal et al. 2015)에 의존하며, 진정한 학생 교육과정 변화 에이전트의 참여와 권한 부여는 부족하다. 또한 커리큘럼 변환을 검토하는 출판물은 일반적으로 의대 학생 참여의 세부 사항을 생략하고(Huppatz 1996; Visser et al. 1998), 잠재적 촉매 및 변화의 선도자로 의대생을 언급하지 않았다(Irby et al. 2010; Skochelak 2010).
Amidst these efforts, there is a movement to re-conceptualize students from mere ‘consumers’ of educational content to active collaborators, co-producers, and co-creators of content and curricula, both in non-medical higher education (Taylor and Wilding 2009; Bovill et al. 2011; Felten et al. 2013) and in medical education (Holmboe and Batalden 2015). Unfortunately, despite broad agreement that engaging the student voice in curricular design is important, such engagement often relies on relatively passive feedback or token student leaders (Seale et al. 2015), stopping short of engaging and empowering true student curricular change agents (Kay et al. 2010). Moreover, publications examining curricular transformation typically omit the details of medical student engagement (Huppatz 1996; Visser et al. 1998), failing to mention medical students as potential catalysts and leaders of change (Irby et al. 2010; Skochelak 2010).

유럽 의학교육협회(AMEE)는 2012년 의과대학 교육 우수성을 인정하기 위해 ASPIRE 이니셔티브를 시작하였으며, 기관 수상자는 네 가지 영역에 걸쳐 '학생 참여'를 입증해야 한다.

  • (1) 정책 및 사명과 비전을 포함한 학교 운영
  • (2) 학교 교육 프로그램 제공,
  • (3) 학계 참여,
  • (4) 지역 사회 및 서비스 제공 참여(Patricio 2016).

ASPIRE는 넓은 의미에서 학생 참여를 정의하고 인정하기 위한 지금까지의 가장 포괄적인 노력이며, 커리큘럼 개발에서 학생 리더십 및 피드백과 관련된 하위 기준을 명시한다.
The Association for Medical Education in Europe (AMEE) launched the ASPIRE initiative in 2012 to recognize medical schools for excellence in teaching, with a requirement that institutional awardees demonstrate ‘student engagement’ across four spheres:

  • (1) management of the school, including matters of policy and the mission and vision of the school;
  • (2) provision of the school’s education program;
  • (3) engagement in the academic community; and
  • (4) engagement in the local community and service delivery (Patricio 2016).

ASPIRE is the most comprehensive effort to date to define and recognize student engagement in a broad sense, and specifies sub-criteria related to student leadership and feedback in curricular development.

교육과정 변화에서 학생 리더십의 지역적 사례도 나타나고 있다. Yengo-Kahn 외(2017)는 학생 중심 커리큘럼의 설계, 구현 및 피드백 단계에서 학생들이 역할을 하는 밴더빌트 의과대학의 커리큘럼 업데이트를 진전시키는 데 있어 학생들의 필수적인 역할을 설명했다. 그들의 작업은 커리큘럼 변화 노력에서 학생-행정 파트너십을 촉진하기 위한 특정 접근 방식을 강조하기 때문에 중요하다. 다른 이들은 커리큘럼 개발에 대한 의대생의 동기 부여(Fujikawa et al. 2015), 학생-교수의 성공 원칙 공유(Bear et al. 2013), 커리큘럼 변혁에서 학생의 가치(Loeser et al. 2007)를 설명했다.
Local examples of student leadership in curricular change are also emerging: Yengo-Kahn et al. (2017) described the essential role of students in advancing a curricular update at Vanderbilt University School of Medicine, with students having roles in the design, implementation, and feedback stages of a student-centered curriculum. Their work is important as it highlights specific approaches for fostering student-administrative partnerships in a curricular change effort. Others have described medical student motivations for curriculum development (Fujikawa et al. 2015), shared student–faculty tenets of success (Bear et al. 2013), and the value of students in curricular transformation (Loeser et al. 2007).

교육과정 변화에 대한 학생들의 참여에 대한 이러한 새로운 정의와 사례들에도 불구하고, 교육과정 변화에 대한 학생 리더십이 조직 변화 관리의 일반화된 프레임워크에서 맥락화될 수 있다는 차이점이 남아있다. 이 글에서, 미국 의학 협회(AMA) 학생과 의사 지도자들은 교육 과정 혁신을 촉진하는 학생들을 위한 변화 관리 프레임워크를 설명하기 위해 AMA의 의료 교육(ACE) 이니셔티브(AMA 2017; Skochelak and Stack 2017)의 정성적 방법과 사례 연구를 사용한다. 우리는 미국 의과 대학 협회(AAMC) 연차 회의에서 학계의 의사와 학생 지도자를 대상으로 교육 과정 변화에 대한 의과 학생 참여의 activator와 barriers을 평가했다. 우리는 청중이 학생들의 참여를 열망할 뿐만 아니라 그러한 참여를 지지하거나 방해하는 제도적 요소에 대한 상당한 통찰력을 가질 것이라는 가설을 세웠다. 우리는 일반화 가능한 변화 관리 프레임워크에서 학생 역할, 활동자 및 장벽을 식별함으로써 교직원들이 학생들을 보다 쉽고 효과적으로 커리큘럼 변경 담당자로 참여시킬 수 있기를 바란다.
Despite these emerging definitions and examples of student engagement in curricular change, a gap remains: can student leadership in curricular change be contextualized in a generalizable framework of organizational change management? In this article, American Medical Association (AMA) student and physician leaders use qualitative methods and case studies from the AMA’s Accelerating Change in Medical Education (ACE) initiative (AMA 2017; Skochelak and Stack 2017) to describe a change management framework for students catalyzing curricular innovation. We surveyed academic physicians and student leaders at an Association of American Medical Colleges (AAMC) annual meeting to assess the activators and barriers of medical student engagement in curricular change. We hypothesized that our audience would be eager for student engagement but would also have considerable insight into the institutional factors that support or hinder such engagement. We hope that by identifying student roles, activators, and barriers across a generalizable change management framework, faculty leaders may more easily and effectively engage students as curricular change agents.

방법들
Methods

의료 교육 이니셔티브의 변화를 가속화하는 AMA
AMA accelerating change in medical education initiative

AME ACE 이니셔티브는 학부 의료 교육의 혁신을 가속화하기 위해 고안되었으며, 미국 의료 시스템의 예상 필요성과 의과대학 훈련을 더 잘 조화시킬 수 있다(Skochelak and Stack 2017). ACE 이니셔티브는 2013년에 시작되었으며, 11개 학교의 초기 코호트에 5년 보조금을 지급했으며, 이 컨소시엄은 2016년에 32개교, 2019년에 37개교로 늘어났다. 저자들은 AMA ACE 지도자들뿐만 아니라 원래 코호트의 일부로서 교육 변화를 겪고 있는 기관의 전직 학생 지도자들을 대표한다.
The AME ACE initiative was designed to accelerate innovations in undergraduate medical education, leading to better alignment of medical school training with the anticipated needs of the US healthcare system (Skochelak and Stack 2017). The ACE initiative launched in 2013 with five-year grants to an initial cohort of 11 schools; this consortium grew to 32 schools in 2016 and 37 in 2019. The authors represent former student leaders from institutions undergoing educational change as part of the original cohort, as well as AMA ACE leaders.

사례 연구 및 데이터 수집
Case studies and data collection

2015년 11월, 4명의 학생 저자들(JBR, KBH, JH, AM)은 교육 기관의 커리큘럼 변경 과정에서 학생들의 역할을 설명하는 사례 연구를 개발했다. ACE 이니셔티브 학생 리더로서의 DJS의 경험을 바탕으로 추가 사례 연구가 구축되었습니다. 저자들은 AAMC Learn Serve Lead 전국 회의(볼티모어, MD)에서 워크숍을 주도했으며, 여기서 이러한 사례 연구가 제시되었다. 우리는 워크시트(개별 및 소규모 그룹으로 완료)와 간단한 자발적 설문 조사(개별 완료)를 사용하여 교육과정 변화를 주도하는 학생에 대한 참가자들의 견해를 평가했다. 워크시트 및 설문조사는 교육과정 변화에 대한 학생 참여, 학생 역할 및 학생 참여에 대한 활동가 및 장애물에 대한 응답자들의 견해를 탐구했다. 작업장 활동 및 설문 조사는 보충 자료를 참조하십시오. 이 데이터 수집은 Penn State College of Medicine Institutional Review Board에 의해 면제되도록 지정되었습니다.

In November 2015, four student authors (JBR, KBH, JH, and AM) developed case studies describing the role of students in their institutions’ curricular change processes. An additional case study was built based on the experience of DJS as an ACE initiative student leader. The authors led a workshop at the AAMC Learn Serve Lead national meeting (Baltimore, MD) where these case studies were presented. We assessed participants’ views on students leading curricular change using worksheets (completed both individually and in small groups) and a brief voluntary survey (completed individually). The worksheets and survey explored respondents’ views on student participation in curricular change, student roles, and activators of and barriers to student engagement. See Supplementary Materials for the workshop activities and survey. This data collection was designated exempt by the Penn State College of Medicine Institutional Review Board.

프레임워크 및 주제 분석
Framework and thematic analysis

응답자 워크시트와 조사 데이터(주로 자유기입 텍스트)가 기록되었습니다. 우리는 John Kotter의 변화 관리 프레임워크(Kotter 1996, 2012)를 사용하여 커리큘럼 변화를 촉진하고 주도하는 학생 역할을 분류했다. 우리는 또한 확인된 역할의 성공(또는 실패)에 중요할 수 있다고 가정한 학생 참여자와 학생 참여에 대한 참가자의 인식을 이해하려고 했다. 우리는 이러한 인식을 체계적으로 그룹화하기 위해 주제 분석(Nowell et al. 2017)을 사용했다. 인간 평가자들은 보고된 현상을 포착하는 코드를 식별하기 위해 필사된 무료 텍스트 응답을 검토했다. 그런 다음 유도 방식으로 테마를 위한 코드를 탐색했다(브라운과 클라크 2006). 테마는 내부 동질성과 일관성을 검토함으로써 다듬어졌고, 중복 테마는 제거되었다.

Respondent worksheet and survey data (primarily free text) were transcribed. We used John Kotter’s change management framework (Kotter 1996, 2012) to categorize student roles in catalyzing and leading curricular change. We further sought to understand participants’ perceptions of activators of and barriers to student engagement, which we hypothesized might be critical to the success (or failure) of the identified roles. We employed thematic analysis (Nowell et al. 2017) to group these perceptions systematically. Human raters reviewed the transcribed free text responses to identify codes capturing a reported phenomenon. Codes were then explored for themes in an inductive fashion (Braun and Clarke 2006). Themes were refined by reviewing for internal homogeneity and coherence, and redundant themes were removed.

결과.
Results

교육과정 혁신에서의 학생 역할: 프레임워크
Student roles in curricular innovation: a framework

약 75명의 참석자 중 55명이 조사에 응답했다: 40명의 교수진(73%는 학장 또는 부학장 포함), 15명의 공립 및 사립 의과대학 직원 또는 행정관(27%)이었다. 응답자 45명(83%)은 소속 기관이 지난 5년 동안 주요 학부 의료 커리큘럼을 변경했다고 보고했다. 모든 참석자들은 효과적인 교육과정 변화를 가능하게 하는 데 학생 리더가 독특한 역할을 할 수 있다는 것에 동의했다. 그러나 많은 (n = 25, 46%) 학생들이 그들의 기관에 '조금만 또는 희박하게' 종사하고 있다고 보고했다. 90%의 응답자(n = 47)가 학생 지도자를 더 잘 통합함으로써 교육 기관의 커리큘럼 노력을 향상시킬 수 있다는 데 동의했다. 우리의 경험과 참가자 워크숍 반응을 바탕으로, 우리는 Kotter의 변화 관리 프레임워크를 사용하여 커리큘럼 변화를 촉진하고 주도하는 학생 역할을 분류했습니다(Box 1).
Of approximately 75 attendees, 55 responded to the survey: 40 faculty (73%, including 16 deans or assistant deans) and 15 staff members or administrators (27%) from public and private medical schools. Forty-five respondents (83%) reported that their institution had undergone a major undergraduate medical curriculum change in the last five years. All attendees agreed that student leaders can play a unique role in enabling effective curricular change, yet many (n = 25, 46%) reported that students were only ‘somewhat or sparsely’ engaged at their institution, with 90% of respondents (n = 47) agreeing that their institution’s curricular efforts could be enhanced by better incorporating student leaders. Based on our experiences and participant workshop responses, we used Kotter’s change management framework to categorize student roles in catalyzing and leading curricular change (Box 1).


Box 1 커리큘럼 변화를 촉진하고 선도하는 학생 역할: 프레임워크
Box 1 Student Roles in Catalyzing and Leading Curricular Change: A Framework


1단계. 큰 기회에 대한 긴급성 창출
Step 1. Create urgency around a big opportunity

  • 교육 격차를 해소하고 문제를 파악합니다.
  • 중요한 니즈를 입증하는 학생 간 설문 조사 실시
  • 커뮤니티 또는 커리큘럼 문제를 강조하기 위해 컨퍼런스 구성
  • Bring to light gaps in their education, identify issues
  • Conduct student-to-student surveys that demonstrate critical needs
  • Organize conferences to highlight community or curricular issues

2단계. 지도적 연합체 구축 및 유지
Step 2. Build and maintain a guiding coalition

  • 학생 단체의 주요 이해관계자 발언권 제공
  • 변경 노력에 대한 참여buy in 및 신뢰도 확립
  • 연합에 상향식 구성 요소 제공
  • 긍정, 열정, 에너지 및 추진력을 연합에 가져옵니다.
  • Contribute a key stakeholder voice of the student body
  • Establish buy in and credibility for the change effort
  • Contribute bottom-up component to coalition
  • Bring positivity, enthusiasm, energy, and momentum to coalition

3단계. 전략적 비전 수립
Step 3. Formulate a strategic vision

  • 비전이 발생하는 워크그룹에서 서비스하여, 고유한 직접적인 관점 기여 및 잠재적으로 파괴적인 혁신 기여
  • 설문 조사, 학생 그룹 회의 및 타운홀을 통해 학생 인풋 범위 확대
  • 학습자 중심의 비전을 개발하여 동료들의 우려를 예상합니다.
  • Serve on workgroups where visioning occurs, contributing unique first-hand perspective and potentially disruptive innovations
  • Broaden student input through surveys, student group meetings, and town halls
  • Develop learner-centered vision, anticipating peer concerns

4단계. 비전과 전략을 전달
Step 4. Communicate the vision and strategy

  • 소셜 미디어와 같은 방법을 사용하여 동료들과 유기적으로 소통하고, 메시지를 일반적인 커뮤니케이션 사일로 이상으로 확대
  • 학생 간 의사소통의 목표 달성을 위한 신뢰도 확보
  • 커뮤니케이션 노력에 에너지와 소유권에 대한 자부심 제공
  • 커뮤니케이션 노력의 루머와 반발, 동료 코호트의 전반적인 맥박 인식
  • 변화 프로세스에 대한 업데이트를 포함한 정기적인 학생 게시판을 보내 동료들이 이해하는 이유와 내용을 전달
  • 타운홀, 블로그/웹사이트, 촌극 및 커뮤니티 커리큘럼 리트윗
  • 학술 프레젠테이션 및 출판물 파트너
  • Communicate with peers organically, broadening the message beyond typical silos of communication using methods such as social media
  • Targeted student-to-student communication efforts have credibility
  • Bring energy and pride of ownership to communication efforts
  • Aware of rumors and backlash from communication efforts, overall pulse of peer cohort
  • Send regular student bulletins with updates on the change process, communicating the why and what in language peers understand
  • Lead town halls, blogs/websites, skit nights, and community curricular retreats
  • Partner in scholarly presentations and publications

5단계. 장벽을 제거하여 비전을 향해 가속합니다.
Step 5. Accelerate toward vision by removing barriers

  • 반대론자들 사이에서의 혁신 및 참여 촉진
  • 모범 리더십을 통해 동료들이 모범을 보이고 변화 노력에 참여하도록 유도
  • Promote innovation and engagement among naysayers
  • Model leadership to inspire peers to follow in footsteps, engage in change effort

6단계. 눈에 보이는 중요한 단기 승리 축하
Step 6. Celebrate visible, significant short-term wins

  • 선도적인 파일럿 프로그램 및 새로운 오퍼링의 신속한 반복
  • 성공과 실패를 거침없이 보고하세요.
  • 달성한 성과와 들어오는 코호트의 변경 이유를 증명합니다.
  • Lead pilot programs and rapid iteration of new offerings
  • Report success and failures unabashedly
  • Attest to what was accomplished and rationale for change to incoming cohorts

7단계와 8단계. 새로운 접근 방식을 늦추지 않고 제도화

Steps 7 and 8. Never let up and Institutionalize new approaches

  • 혁신을 미세 조정하여 일관성 및 유용성 향상
  • 선배들이 후배들에게 문화를 전수하다.
  • Fine tune innovations to increase consistency and usefulness
  • Senior students hand off the culture to junior peers


이 목록은 Kotter의 8단계 "Accelerate!" 변경 관리 프레임워크를 사용합니다(Kotter 2012).

This list uses Kotter’s eight-step “Accelerate!” change management framework (Kotter 2012)


학생 참여의 활성화자 및 장벽
Activators of and barriers to student engagement

참가자들은 학생들을 교과 변화에 참여시키는 수많은 방법들을 찾아냈고, 우리는 주제 분석을 통해 이를 네 가지 주요 활동가들로 분류했다. 명시된 장벽도 분류되었으며, 우리는 이를 교수진, 학생 또는 둘 다와 관련이 있다고 설명하였다(상자 2).
Participants identified numerous ways to engage students in curricular change, which we categorized through thematic analysis into four key activators. Stated barriers were also categorized, which we delineated as related to faculty, students, or both (Box 2).



Box 2 교육과정 변화에 대한 학생 참여의 촉진자 및 장벽
Box 2 Activators of and Barriers to Student Engagement in Curricular Change

액티베이터
Activators

1. 협업 교수진, 직원 및 학생 모집
1. Recruit collaborative faculty, staff, and students

  • 학생의 목소리를 중시하는 교직원 대상으로 함
  • 교육에 열정적이고 검증된 리더인 학생을 참여시킵니다.
  • Target faculty and staff who value the student voice
  • Involve students who are passionate about education and are proven leaders

2. 학생 리더십 역할 확대
2. Broaden student leadership roles

  • 학생을 모든 커리큘럼 위원회, 작업 그룹 및 평가 팀에 배치
  • 학생 간 설문 조사 및 니즈 평가 활용
  • 학생 주도의 타운홀, 생각나눔의 날, 포커스 그룹, 교육과정 수련회
  • 교육과정 연구과제 연구원으로 학생을 모집합니다.
  • Place students on all curriculum committees, working groups, and evaluations teams
  • Utilize student-to-student surveys and needs assessments
  • Student-led town halls, thought sharing days, focus groups, and curricular retreats
  • Recruit students as curricular research project investigators

3. 학생 리더에게 힘을 실어주기
3. Empower student leaders

  • 학생들이 성공에 대비할 수 있도록 멘토링 및 준비
  • 공식적인 리더십 교육 제공
  • 소셜 미디어 아웃리치를 장려합니다.
  • 학생 프로젝트에 대한 시드 보조금
  • Mentor and prepare students so they are primed for success
  • Provide formal leadership training
  • Encourage social media outreach
  • Seed grants for student projects

4. 학생의 성공을 인정합니다.
4. Recognize student successes

  • 학생 주도의 변화를 강조하는 월간 요약(예: 이미 설명했습니다)
  • 미팅, 기관 뉴스레터 및 Dean의 서신에서 학생 주도 성공 사례 인정
  • Monthly digests highlighting student-driven changes (you said, we did)
  • Recognize student-led wins in meetings, institutional newsletters, and Dean’s letters

장벽
Barriers

1. 교직원의 장벽
1. Faculty barriers

  • 변화 비전을 알지 못하거나 지지하지 않음(학생의 신뢰를 떨어뜨림)
  • 학생의 목소리 또는 관심사에 관심이 없음
  • 학생 역할을 좁게 보기 또는 토큰 학생으로 보기
  • 학생 지도자를 적극적으로 모집하거나 멘토링하거나 칭찬하지 않음
  • Unaware or unsupportive of change vision (undermines student confidence)
  • Uninterested in student voice or concerns
  • View student roles narrowly or as token students
  • Do not actively recruit, mentor, or celebrate student leaders

2. 학생 장벽
2. Student barriers

  • 수동성, 무관심 또는 비건설적인 불만 사항
  • 집단적 관심사가 아닌 자신의 관심사를 대표하는 학생 리더
  • 필요한 활동(예: 사무원직, USMLE)으로 인한 리더십의 연속성 분열
  • 공포에 대한 변화, 기니피그가 되는 것
  • 교수진이 주도하는 커리큘럼 기대
  • 이전에 수행된 작업에 대한 역사적 관점이 없음
  • USMLE와 레지던시 매치 우려는 혁신적인 사고를 제한한다.
  • Passivity, apathy, or unconstructive complainers
  • Student leaders who represent own, rather than collective, interests
  • Fractured continuity of leadership due to required activities (e.g., clerkships, USMLE)
  • Fear change, being guinea pigs
  • Expect a faculty-led curriculum
  • Lack historical perspective of what was done before
  • USMLE and residency match concerns limit innovative thinking

3. 교직원과 학생의 장벽
3. Faculty and student barriers

  • 동료로서 불편한 교직원 및 학생
  • 공식적인 리더십과 의학교육 훈련 부족
  • Faculty and students uncomfortable as peers
  • Lack formal leadership and medical education training

사례 연구
Case studies

박스 1과 2의 핵심 발견을 강조하기 위해, AMA ACE 이니셔티브에 대한 저자의 개인적 경험에서 선택된 사례 연구가 관련 변경 관리 단계, 활성화자 및 장벽에 대해 전반적으로 언급되어 있다.
To highlight the core findings in Boxes 1 and 2, a selection of our case studies are presented here from the authors’ personal experiences with the AMA ACE initiative, with relevant change management steps, activators, and barriers noted throughout.

사례 연구 1: 의료 교육 학생 리더의 변화를 가속화하는 AMA
Case study 1: AMA accelerating change in medical education student leaders


2012년, AMA 의대생 부문은 ACE 이니셔티브의 국가 자문 패널(NAP)에서 근무할 학생 지도자 2명을 선정했다. 이 학생 지도자들은 의료 교육 프로그램의 장점과 단점에 대한 그들의 직접적인 관점을 공유했다. 기초 과학 훈련과 환자 치료에 필요한 필수 의학 지식 사이의 점점 더 단절되는 것과, 그리고 어떻게 사전 임상 경험을 미국 의료 면허 시험(USMLE) 준비로 기울일 수 있는지를 논의했다. 또
한 의료 정책, 품질 향상, 리더십 훈련, 절차 기술 및 전문가 간 팀 기반 관리와 같은 의료 교육의 격차를 강조했습니다. – 전통적으로 학생들에게 독립적으로 학습하도록 남겨진 개념입니다(1단계 – 긴급성 생성). NAP 회의에서 이러한 경험의 목소리는 역량 기반 교육, 보건 시스템 커리큘럼 및 학습자의 진로 및 환자 요구에 맞춘 교육 경험을 포함하여 지원 요청(RFA)의 여러 주제에 영향을 미쳐 ACE 기관의 초기 코호트를 형성했다(2단계 및 3단계 – 연합 구축, 비전 수립).
In 2012, the AMA Medical Student Section selected two student leaders to serve on the ACE initiative’s National Advisory Panel (NAP) (Activator 2 – Broaden Student Roles). These student leaders shared their first-hand perspective on the strengths and deficiencies of medical education programs, discussing a growing disconnect between basic science training and essential medical knowledge needed for patient care, and how the preclinical experience can be skewed toward US Medical Licensing Examination (USMLE) preparation. They also highlighted gaps in medical education such as health policy, quality improvement, leadership training, procedural skills, and interprofessional team-based care – concepts traditionally left to students to learn independently (Step 1 – Create Urgency). Voicing these experiences at NAP meetings influenced several themes in the Request for Applications (RFA), including competency-based education, health systems curricula, and educational experiences tailored to learners’ career paths and patient needs (Steps 2 and 3 – Build a Coalition; Formulate a Vision), which shaped the initial cohort of ACE institutions.

ACE 프로그램 리더십은 NAP 학생 리더에게 멘토링과 리더십 기회를 제공하면서 실천 공동체를 넓혔습니다(액티베이터 3 – 학생 리더 역량 강화). 따라서 NAP 학생 리더는 두 번째 ACE 코호트 선택에 의미 있는 기여를 할 수 있는 좋은 위치에 있었다. 교육생으로서의 경험을 바탕으로, 이 학생 지도자들은 어떤 프로젝트가 궁극적으로 환자 치료를 발전시키면서 의대생들의 교육적 경험을 진정으로 변화시킬 것인지를 고려했다. 마찬가지로, 학생 리더들은 일관되게 어떤 커리큘럼이 필요한지, 무엇이 '추가' 되어야하고, 학생이 과소평가하는 것은 무엇인지, 경쟁적인 시간 요구가 주어진 학생들에게 실현 가능한 것은 무엇인지 옹호했다(5단계 – 비전을 향한 가속화). 우리는 이러한 학생들의 참여가 ACE 프로그램에서 비롯되는 혁신적인 변화가 학생 중심적이고 역동적이며 일상적인 학생 경험의 현실에 바탕을 둔다는 것을 보장하는 데 도움이 되었다고 믿는다.
ACE program leadership provided mentorship and leadership opportunities to the NAP student leaders, while broadening their community of practice (Activator 3 – Empower Student Leaders). The NAP student leaders were thus well positioned to make meaningful contributions to a second ACE cohort selection. Drawing on their experiences as trainees, these student leaders considered which projects would truly transform the educational experience of medical students while ultimately advancing patient care. Likewise, the student leaders consistently advocated for what curriculum was needed, what would be ‘add on’ and undervalued by learners, and what was feasible for students given competing time demands (Step 5 – Accelerate Towards Vision). We believe such student engagement has helped ensure that innovative changes resulting from the ACE program are student-centered, dynamic, and grounded in the reality of the day-to-day student experience.

사례 연구 2: 미시간 대학교 의과대학
Case study 2: University of Michigan Medical School

미시간 대학교 교육과정 변혁은 학습 공동체, 전문직 간 교육, 리더십 훈련, 초기 임상 경험 및 전문 개발 분교를 구상했다(미시간대 의과대학 2017). 이 야심찬 프로젝트의 시작에, 교수진 지도자들은 원하는 학생 역할을 성문화하기 위해 기존 학생 대표들을 초대했습니다(활동가 1과 2 – 협업 교수진 모집; 학생 역할 확대). 학생이 디자인한 대표 구조는 학생들을 교육 과정 리더십에 동등한 참여자로 참여시켜 전략 계획 기구의 각 위원회에서 임상 전과 학생 모두를 통합함으로써 의미 있는 학생 인풋을 달성하기 위한 것이었다(2단계와 3단계 – 연합 구축, 비전 공식화). 교육 과정 지도부와 학생 단체 간에 연락을 주고받기 위해 완전히 학생 주도의 '학생 자문 위원회'가 구성되었으며, 폭넓은 참여와 학생 대표 활동의 연속성을 촉진합니다(4단계 – 비전 전달).

The University of Michigan curricular transformation envisioned learning communities, interprofessional education, leadership training, earlier clinical experiences, and professional development branches (University of Michigan Medical School 2017). At the outset of this ambitious undertaking, faculty leaders invited existing student representatives to codify desired student roles (Activators 1 and 2 – Recruit Collaborative Faculty; Broaden Student Roles). A student-designed representation structure was intended to achieve meaningful student input by engaging students as equal participants in the curricular leadership, integrating both preclinical and clinical students on each committee in the strategic planning apparatus (Steps 2 and 3 – Build a Coalition; Formulate a Vision). A fully student-led ‘Student Advisory Committee’ was created to liaise between the curricular leadership and student body, facilitating communication, broad buy-in, and continuity of student representation (Step 4 – Communicate the Vision).

모든 의대생에 대한 공개적인 요청에 따라, 거의 7명 중 1명의 학생이 교육에 대한 열정, 교수진과의 협업 경험, 리더십 실적을 평가하는 논술 지원서를 통해 지원했습니다(Activator 1 – Recruit Collaborative Students). 학생이 주도하는 과정에서 30명 이상의 학생이 선발되었으며, 이는 기존 대표자를 넘어 당사 실무 커뮤니티를 넓혔습니다(Activator 2 – 학생 역할 확대). 이러한 학생들은 커리큘럼 설계 위원회에서 적극적으로 활동하여 학습자 중심의 변화를 구상하는 데 도움을 주었습니다(3단계 – 비전 수립). 그러나 학생들은 또한 변화 노력을 주도했다:

  • 그들은 변화의 강점과 약점을 특징짓는 학교 전반의 설문조사를 실시했다(1단계 - 긴급성 만들기).
  • 그들은 제안된 변화의 배후에 있는 교육 커뮤니티를 규합하고, 타운 홀 미팅을 개최하고, 지역 전체 커리큘럼 수련회에서 연설하고, 예비 학생을 대상을 한 홍보대사로서 교육 혁신을 강조했다(5단계 – 비전을 향한 가속화); 그리고
  • 사례 토론, 리더십 및 전문성 교육, 임상 추론 선택 항목과 같은 새로운 콘텐츠를 설계하고 구현했습니다(6단계 – 단기 성공 축하).

In response to an open call to all medical students – which fostered a sense of inclusivity – nearly one in seven students applied for positions through an essay application that assessed students’ passion for education, experience collaborating with faculty, and leadership track record (Activator 1 – Recruit Collaborative Students). More than 30 students were selected in a student-led process, which broadened our community of practice beyond existing representatives (Activator 2 – Broaden Student Roles). These students worked actively on curricular design committees, helping envision learner-centered changes (Step 3 – Formulate a Vision). But students also led change efforts:

  • they conducted school-wide surveys characterizing strengths and weaknesses of the transformation (Step 1 – Create Urgency);
  • they rallied the educational community behind the proposed changes, holding town hall meetings, speaking at community-wide curricular retreats, and highlighting curricular innovations as ambassadors to prospective students (Step 5 – Accelerate Toward Vision); and
  • they designed and implemented new content, such as case discussions, leadership and professionalism training, and a clinical reasoning elective (Step 6 – Celebrate Short-Term Wins).

이러한 활동은 학생 리더의 전문적 성장을 위한 발판이 되었으며, 팀워크와 리더십의 습관을 길러주었습니다. 즉, 새로운 미시간 대학교 커리큘럼의 핵심 임무(액티베이터 3 – 학생 리더의 임파워Empower). 학생 지도자들의 노력과 성공은 교육과정 회의와 학과장의 메시지에서 일상적으로 축하되었습니다(Activator 4 – 학생 성공 인식). 마지막으로, 이러한 성공적인 학생 노력은 교육적 설계에서 구현으로 전환하면서 지속적이고 생산적인 학생-교수-직원 협업의 틀을 만들어냄으로써 제도 문화에 긍정적인 영향을 끼쳤다. (7~8단계 – 절대 양보하지 않고 새로운 접근 방식을 제도화한다.)
These activities served as a springboard for the student leaders’ professional growth, developing teamwork and habits of leadership – core missions of the new University of Michigan curriculum (Activator 3 – Empower Student Leaders). The efforts and successes of student leaders were routinely celebrated in curricular meetings and messaging from the Dean’s office (Activator 4 – Recognize Student Successes). Finally, these successful student efforts positively influenced the institutional culture, creating a framework for sustained, productive student–faculty–staff collaborations that the institution is drawing upon as it shifts from curricular design to implementation (Steps 7 and 8 – Never Let Up and Institutionalize New Approaches).

사례 연구 3: Penn State 의과 대학
Case study 3: Penn State College of Medicine

Penn State 의과대학의 시스템 탐색 커리큘럼(Sync)은 의료 시스템 문제에 대한 의대 학생들의 이해를 향상시키기 위한 훈련 경험을 소개했다(Gonzalo et al. 2017). 예를 들어, 1학년 학생들은 환자 내비게이터 역할을 하며, 보험, 약물 걱정, 약속과 같은 도전들을 통해 환자들을 안내한다. 학생 정부 구성원을 포함한 학생들은 SyNC의 중요한 공동 개발자였다. 학생 리더는 매주 SyNC 설계 팀과 회의를 갖고 교수진이 주도하는 커리큘럼 위원회에 참석하여(Activator 2 – 학생 역할 확대), 교직원들이 강의실 및 임상 환경 모두에서 더 나은 작업 방식을 식별할 수 있도록 지원했습니다(1단계와 2단계 – 긴급성 작성 및 연합 구축). 학생들은 이러한 피드백 기회에 지속적으로 참여했으며 소규모 그룹 세션과 임상 현장 경험에서 학습 목표가 얼마나 잘 달성되었는지 평가하는 데 특히 능숙했다. 또한, 학생 리더는 SyNC에 참여한 학생 중 85% 이상의 의견을 수렴하는 연말 설문조사를 실시했으며, 이는 학생 의견의 광범위한 표현을 촉진했다(1단계 – 긴급성 작성). 학생 피드백은 환자 탐색 경험의 표준화, 강의 주제 재구성, 보다 현실적인 환자 시뮬레이션 시나리오로 이어졌다. 커리큘럼에 대한 학생들의 영향은 (의심할 여지 없이) 열린 마음을 가진 교수진과의 파트너십, 혁신적인 커리큘럼 토론에 학생들을 포함시키려는 의과대학의 노력(액티베이터 1 및 2 – 협업 교수진 모집, 학생 역할 확대), 그리고 그들의 수업의 더 넓은 관점을 전달하기 위한 학생들의 헌신과 관련이 있다. 자신의 개인적인 의견보다는 동료들이 더 중요하다(공통의 장애요인). SyNC의 두 번째 반복에서 학생 주도 개선의 증거를 확인한 결과, 지속적인 학생 참여로 이어졌고, 결과적으로 전반적인 학생 참여가 이루어졌다(8단계 – 새로운 접근 방식 제도화).
The Systems Navigation Curriculum (SyNC) at Penn State College of Medicine introduced training experiences to improve medical students’ understanding of healthcare systems issues (Gonzalo et al. 2017). For example, first-year students serve as patient navigators, guiding patients through challenges such as insurance, medication concerns, and appointments. Students, including student government members, were vital co-developers of SyNC. Student leaders met weekly with the SyNC design team and attended faculty-led curricular committees (Activator 2 – Broaden Student Roles), helping faculty identify better practices in both the classroom and clinical settings (Steps 1 and 2 – Create Urgency and Build a Coalition). Students were continuously engaged in these feedback opportunities and were particularly adept at assessing how well learning objectives were achieved in small group sessions and within clinical site experiences. Additionally, student leaders administered an end-of-year survey, collecting comments from over 85% of students participating in SyNC, that facilitated broad representation of student views (Step 1 – Create Urgency). Student feedback led to standardization of patient navigation experiences, reorganization of course lecture topics, and more realistic patient simulation scenarios. Students’ impact on the curriculum was undoubtedly linked to their partnerships with open-minded faculty, the College of Medicine’s commitment to including students in innovative curricular discussions (Activators 1 and 2 – Recruit Collaborative Faculty; Broaden Student Roles), and students’ dedication to conveying the broader views of their classmates rather than their own personal opinions (a common Barrier). Seeing evidence of student-driven improvement apparent in the second iteration of SyNC has inspired continued student engagement and, consequently, overall student buy-in (Step 8 – Institutionalize New Approaches).

토론 및 결론
Discussion and conclusions

의학을 발전시키는 데 필요한 일선 지도자를 양성하기 위해서는 교직원, 기관, 학술 의학계가 학생 지도 기회를 육성해야 한다. 의대 교육과정 변화 노력이 이런 기회를 제시한다. 선행 연구는 커리큘럼 변화의 리더십을 포함하여 학생 참여 기준을 정의하고(Patricio 2016), 커리큘럼 변화를 주도하는 학생들의 지역 사례를 문서화하였다(Yengo-Kahn et al. 2017). 우리는 일반화할 수 있는 8단계 변경 관리 프레임워크에서 커리큘럼 변화를 촉진하고 선도하는 학생들을 위한 수많은 역할을 식별함으로써 그 작업에 추가했다. 분명히 완전하지는 않지만, 우리의 표는 학생들이 교과 변화 노력의 모든 측면에서 독특하고 중요한 역할을 할 수 있다는 것을 보여준다. Kotter의 업데이트된 프레임워크는 변화 리더들로 구성된 '자원봉사 군대'를 배치하는 것을 강조합니다; 학생들은 Kotter가 주목하는 필수 요소인 에너지, 열정, 그리고 진정한 헌신과 같은 특성들을 가져오는 완벽한 자원봉사 군대입니다.

To develop the front-line leaders necessary to advance medicine (Bohmer 2013), student leadership opportunities must be fostered by faculty, institutions, and the academic medical community. Medical school curricular change efforts present such an opportunity. Prior work has defined criteria for student engagement, including leadership of curricular change (Patricio 2016), and documented local examples of students leading curricular change (Yengo-Kahn et al. 2017). We have added to that work by identifying numerous roles for students in catalyzing and leading curricular change across a generalizable, eight-step change management framework. Although clearly not exhaustive, our tabulation demonstrates that students can have unique and instrumental roles in all facets of curricular change efforts. Kotter’s updated framework emphasizes deploying a ‘volunteer army’ of change leaders; students are the perfect volunteer army, bringing traits that Kotter notes are essential: energy, enthusiasm, and authentic commitment.

그러나 학생의 역할을 설명하는 것 만으로는 불충분하다. 교육과정 변화에 대한 학생들의 의미 있는 참여에는 많은 학생과 교직원의 장애요인이 존재한다. 학생들은 일반적으로 광범위한 리더십 훈련을 받지 않으며, 교육과정 변화 노력에 대한 '큰 그림'의 시각이 부족할 수 있으며, 이는 교직원들이 학생들을 단순한 소비자로 보게 할 수도 있다. 게다가, 학생들은 의료 면허 시험에 지나치게 집중하고 이전에 시도된 것에 대한 제도적 지식이 부족할 수 있다. 그러나 우리의 주제 분석은 학생들을 생산적인 변화 리더로 참여시키기 위한 네 가지 '활성요인activator'를 보여주었다.

  • (1) 협력적인 교수진, 직원 및 학생을 모집
  • (2) 학생 리더십 역할 확대
  • (3) 학생 리더에게 권한을 부여
  • (4) 학생의 성공을 인정

Delineating student roles is alone insufficient, however; numerous student and faculty barriers exist to meaningful student engagement in curricular change. Students do not typically have extensive leadership training and may lack a ‘big picture’ view of curricular change efforts that may lead faculty to view students as mere consumers. Moreover, students may be overly focused on medical licensure exams and lack institutional knowledge of what has been tried before. However, our thematic analysis revealed four ‘activators’ for engaging students as productive change leaders:

  • (1) recruit collaborative faculty, staff, and students;
  • (2) broaden student leadership roles;
  • (3) empower student leaders; and
  • (4) recognize student successes.

교직원과 관리자에 의한 이러한 활동가들의 구현은 학생들을 리더로 참여시킬 뿐만 아니라, 그들이 새로운 리더적 역할을 성공하게 하고, 학생들의 참여를 지지하고 축하하는 제도적 문화를 구축한다. 우리의 경험으로 볼 때, 긴밀한 교수진의 지도력을 갖춘 모든 교육 위원회에 걸쳐 변화 과정의 초기에 학생 지도자들을 통합하는 것은 필수적이다. 커리큘럼 리더는 학생이 생성한 데이터를 사용하여 일반적으로 언급되는 장벽인 변화에 대한 교수진의 저항을 극복할 수 있습니다. 이와 유사하게, 학생 지도자들은 종종 관리자들보다 [변화의 필요성에 저항하는 학생들]을 더 효과적으로 설득할 수 있다.

Implementation of these activators by faculty and administrators not only engages students as leaders, but primes them to succeed in their new leadership roles and builds an institutional culture that supports and celebrates student engagement. In our experience, incorporating student leaders early in the change process across all curricular committees with close faculty mentorship is vital. Curricular leaders can use student-generated data to overcome faculty resistance to change, a commonly stated barrier. Similarly, student leaders can often persuade resistant students that change is needed more effectively than can administrators.

요컨대, 학습자는 강력한 촉매제가 될 수 있고 커리큘럼 변화의 리더가 될 수 있다. 학생과 교직원의 강력한 파트너십은 반대를 최소화하고 협업을 최대화함으로써, 학생들을 수동적인 커리큘럼 소비자에서 적극적으로 권한을 부여하는 변화 에이전트로 이동시킨다(Burk-Rafel et al. 2017). 이러한 변화 기관을 육성하기 위해, 우리는 의과대학이 우리가 파악한 네 가지 활성제를 적용하도록 촉구한다. 우리는 특히 멘토링과 지도자로써 학생들의 공식적인 훈련을 통해 학생 지도자들에게 힘을 실어주는 것의 중요성을 강조할 것이다.

In sum, learners can be powerful catalysts and leaders of curricular change. Robust student–faculty partnerships minimize opposition and maximize collaboration, shifting students from passive curricular consumers to actively empowered change agents (Burk-Rafel et al. 2017). To foster this change agency, we urge medical schools to apply the four activators we identified. We would particularly emphasize the importance of empowering student leaders through mentorship and formal training of students as leaders (Varkey et al. 2009; Webb et al. 2014; Myers and Pronovost 2017) and educators (e.g. medical education scholarly concentrations (Burk-Rafel et al. 2016) and students-as-teachers programs (Ten Cate and Durning 2007; Varkey et al. 2009; Peluso and Hafler 2011; Nelson et al. 2013)).

이러한 개입의 장기적 영향과 학생 참여가 교육과정 변화 결과에 미치는 영향을 이해하기 위한 연구가 필요하다. 우리는 학생들이 참여하는 커리큘럼 변화가 순수하게 교수진이 주도하는 과정보다 더 나은 커리큘럼을 만드는지 아니면 다른 커리큘럼을 만드는지 모른다. 그러나 여기에 제시된 사례 연구 및 교육 워크샵 참가자들의 연구 결과는 강력한 학생 참여의 이점이 상당할 수 있음을 시사한다고 생각합니다. 학생들이 [교육 소비자주의] 또는 [토큰 리더십] 역할을 넘어 교육 콘텐츠와 커리큘럼의 완전한 협력자 및 공동 제작자로 이동할 수 있도록 하는 것은 교육생들이 현대 의료의 도전에 대처할 수 있도록 지원하는 학습자 중심의 의대를 만드는 데 도전적이지만 중요한 과제이다. 우리는 그러한 학생들의 교육과정 참여와 리더십을 장려하기 위한 다른 기관의 혁신적인 접근법에 대한 설명을 보기를 간절히 바란다.

Studies are needed to understand the long-term impact of such interventions, and the effect of student engagement on curricular change outcomes. We do not know if student-engaged curricular change creates better or different curricula than purely faculty-led processes. However, we believe the case studies presented here – and the findings from the educational workshop participants – suggest the benefits of robust student engagement could be profound. Empowering students to move beyond educational consumerism or token leadership roles to full collaborators and co-creators of educational content and curricula is a challenging but critical task in creating learner-centric medical schools that equip their trainees to meet the challenges of modern healthcare. We are eager to see descriptions of innovative approaches at other institutions for encouraging such student curricular engagement and leadership.

 


Med Teach. 2020 May;42(5):572-577. doi: 10.1080/0142159X.2020.1718070. Epub 2020 Feb 4.

Students as catalysts for curricular innovation: A change management framework

Affiliations collapse

Affiliations

1Department of Internal Medicine, NYU Langone Health, New York, NY, USA.

2Department of Internal Medicine, Cleveland Clinic Foundation, Cleveland, OH, USA.

3Department of Internal Medicine, UC Davis Health, Sacramento, CA, USA.

4American Medical Association, Chicago, IL, USA.

PMID: 32017861

DOI: 10.1080/0142159X.2020.1718070

Abstract

Introduction: The role of medical students in catalyzing and leading curricular change in US medical schools is not well described. Here, American Medical Association student and physician leaders in the Accelerating Change in Medical Education initiative use qualitative methods to better define student leadership in curricular change.Methods: The authors developed case studies describing student leadership in curricular change efforts. Case studies were presented at a national medical education workshop; participants provided worksheet reflections and were surveyed, and responses were transcribed. Kotter's change management framework was used to categorize reported student roles in curricular change. Thematic analysis was used to identify barriers to student engagement and activators to overcome these barriers.Results: Student roles spanned all eight steps of Kotter's change management framework. Barriers to student engagement were related to faculty (e.g. view student roles narrowly), students (e.g. fear change or expect faculty-led curricula), or both (e.g. lack leadership training). Activators were: (1) recruiting collaborative faculty, staff, and students; (2) broadening student leadership roles; (3) empowering student leaders; and (4) recognizing student successes.Conclusions: By applying these activators, medical schools can build robust student-faculty partnerships that maximize collaboration, moving students beyond passive educational consumption to change agency and curricular co-creation.

Keywords: Medical students; curriculum change; leadership; undergraduate medical education.

When I say…응답 프로세스 타당도 근거(Med Educ, 2022)
When I say…response process validity evidence
Sneha Shankar1 | Christina St-Onge2 | Meredith E. Young1

 

[성과 기반 평가]는 평가자의 판단에 따라 크게 달라지며, 학습자가 평가 과제 중 무엇이 필요한지 이해하는 방법과 평가자가 무엇이 필요한지 이해하는 방법을 포함한 다양한 요인에 의해 형성된다. 역량 구성 요소에 대한 평가자의 관점이 점수를 어떻게 바꿀 수 있는지 또는 학습자의 행동이나 동기가 평가 순간을 어떻게 형성할 수 있는지와 같은 일부 요소는 의도하지 않은 방식으로 평가를 형성할 수 있다. [평가자와 학습자가 평가와 상호 작용하는 방법]을 더 잘 이해하면 평가가 의도한 대로 기능하는지 여부에 대한 중요한 정보를 얻을 수 있습니다. 여기에는 평가가 설계된 맥락에서 공정하게 사용되고 있는지 또는 공평하게 사용되고 있는지도 포함됩니다. [평가자나 학습자가 평가 과제와 상호 작용하는 방법(즉, 이해, 평가, 해석, 수행)]을 탐구하는 것은 응답 프로세스 타당성 증거, 즉 타당성 주장을 구축하는 데 중요한 증거이지만 만성적으로 조사 및 보고가 부족한 증거이다.

Performance-based assessments depend heavily on assessor judgement,1, 2 and are shaped by a variety of factors including how a learner understands what is required during an assessment task and how a rater understands what is required of them. Some factors may shape assessments in a way that is not intended, such as how an assessor's view of what constitutes competency might shift scoring1 or how learner behaviour or motivation may shape an assessment moment.2 Better understanding of how assessors and learners interact with assessments provide critical information about whether an assessment is functioning as intended, including whether it is being used fairly or equitably in a context for which it was designed. Exploring how an assessor or learner interacts with an assessment task (i.e. understands, rates, interprets, performs) is the focus of response process validity evidence, evidence that is critical to building a validity argument but evidence that is chronically underinvestigated and underreported.3, 4

점수 해석을 지원하기 위해 타당성 증거를 수집하는 것이 보건 전문가 교육(HPE)의 표준 관행이 되었다. [응답 프로세스]는 개인(예: 평가자 또는 학습자)이 [평가 및 평가 도구의 특정 문항과 상호 작용할 때 어떤 일이 발생하는지]를 검토하는 특정 유효성 근거의 출처입니다.5 본 원고에서 응답 프로세스 타당성 증거를 설명함에 있어, 우리는 [교육 및 심리 테스트 표준]과 교육 측정 분야에서 새롭게 부상하는 연구의 통일된 관점에서 크게 도출한다.

It has become standard practice within Health Professions Education (HPE) to collect validity evidence in support of score interpretation. Response process is a specific source of validity evidence that examines what happens when an individual (e.g. an assessor or learner) is interacting with an assessment and/or specific items in an assessment tool.5 In describing response process validity evidence in this manuscript, we draw heavily from the unified view of validity in the Standards for Educational and Psychological testing,5 and emerging research from the discipline of educational measurement.6 

이 기사에서는 HPE에 적용하기 위해 익은 교육 측정의 새로운 증거를 통합하기 위해 크라이터와 다우닝의 대응 프로세스에 대한 설명을 확장한다. 이 설명에서, 우리는 인지 프로세스를 넘어 감정, 행동 및 동기에 대한 고려를 대응 프로세스로 포함하도록 확장하고, 대응 프로세스 타당성 증거가 평가 공정성과 공정성을 평가하는 데 어떻게 중요한 역할을 할 수 있는지 설명한다.5 응답 프로세스 증거는 평가, 항목 또는 점수의 의미 또는 해석의 차이를 밝히는 데 도움이 될 수 있으며 평가자가 평가 사용 및 성과 모두에서 응답 패턴을 형성할 수 있는 요소를 더 잘 이해하는 데 도움이 될 수 있다.

In this article, we expand on Kreiter's,7 and Downing's8 description of response processes to integrate emerging evidence from educational measurement6 ripe for application in HPE. In this description, we expand beyond cognitive processes to include consideration for emotions, actions and motivations as response processes69 and describe how response process validity evidence can play an important role in evaluating assessment equity and fairness.5 Response process evidence can help shed light on differences in the meaning or interpretation of assessments, items or scores and can help assessors to better understand factors that may shape patterns of responses in both assessment use and performance.5

1957년, 로빙거는 평가가 의도된 현상을 얼마나 효과적으로 측정하는지를 이해하기 위해서는 [평가 또는 테스트 중의 행동 및 그에 반응한 행동]을 의미하는 "측정 상황context of measurement"을 고려할 필요가 있다고 처음으로 언급했다. 이는 특히 [수행-기반 평가]와 관련이 있다. 왜냐하면 평가는 역동적 컨텍스트 내에서 이루어지기 때문에, 평가자가 학습자를 평가할 때 [상황 정보]가 [수행 판단]에 통합되어 [평가 점수]로 변환되기 때문이다. 따라서, 응답 프로세스 타당성 증거에는 다음 두 가지 행동에 대한 검토를 포함한다.

  • 평가자(예: 특정 성과에 대해 '기대 수준' 또는 '기대 이상'으로 평가하는지 여부) 
  • 평가 대상자(예: 학습자가 평가 항목에 대한 해석 또는 '좋은' 성과에 기대되는 내용을 해석하고 제정) 

In 1957, Loevinger10 first noted that in order to understand how effectively an assessment measures the intended phenomenon, one needs to consider the “context of measurement,”(p.665) referring to behaviour during, and in response to, the act of assessing or testing. This is particularly relevant for performance-based assessments, as assessment happens within a dynamic context—when assessors rate learners, contextual information is integrated into judgements of performance that are then transformed into an assessment score.1 Therefore, response process validity evidence includes examining the behaviour of

  • an assessor (e.g. whether a particular performance is scored as ‘meets’ or ‘exceeds expectations’) and
  • the assessment taker5 (e.g. learner interpretation of an assessment item, or interpreting and enacting what they believe is expected in a ‘good’ performance).

타당성은 고도로 맥락적이기 때문에, 평가자와 학습자의 관점 모두에서 반응 과정을 조사하면 평가에 어떻게 respond in, respond to 하는지에 대한 통찰력을 얻을 수 있다. 응답 프로세스를 검토하여 수집된 데이터는 [평가가 의도한 대로 사용되고 이해되고 있는지]를 막후에서behind the scenes 확인할 수 있습니다. 또한 [평가가 공평하게 사용되고 있는지]도 살펴볼 수 있습니다. 다시 말해, 평가가 여러 학습자 간 동등한 방식으로 이해되고 있는지, 모든 학습자에게 공정하고 공평하게 성과를 판단하는 방식으로 평가자가 사용하고 있는지 탐구한다.

Since “validity is highly contextual,”2(p.297) investigating response processes from both assessor and learner perspectives provides a glimpse as to how both respond in, and respond to, assessment. Data collected through examining response processes provide a behind the scenes look at whether an assessment is being used and understood as intended. It also offers a look at whether an assessment is being used equitably. In other words, it explores whether an assessment is understood by learners in a comparable way and whether it is being used by assessors in a way that judges performance fairly and equitably for all learners.

응답 프로세스 타당성 증거를 고려할 때 [개인이 평가에 참여하는 방식에 대한 가정]에 의문을 제기할 수 있다. 그것이 예상대로든, 예상 밖이든 말이다. 예를 들어, 우리가 가지고 있는 한 가지 가정은 평가 개발 및 구현 프로세스의 일부로서 [평가자 교육의 가치]입니다. [평가자 훈련]은 평가의 일관성을 위한 노력이다. 충분한 교육을 받으면 학습자를 일관성있게 판단할 것이고, 평가자가 평가 점수에 영향을 주는 상황적 요소(예: 컨텍스트 또는 학습자 특성) 에 대해 면역력을 가질것이라고 가정한다. [평가자가 학습자를 균일하게 판단할 것이라는 가정]은 다음과 같은 현상 사이에 완벽한 일관성이 존재할 수 있고, 그것이 모든 학습자에게 복제될 수 있다고 가정한다.

  • 평가하려는 현상(즉, 특정 기술 성과)
  • 평가자의 반응(즉, 인지적 또는 감정적 처리) 
  • 최종 판단(즉, 평가 점수), 

Considering response process validity evidence encourages us to question our assumptions about how individuals engage with an assessment—whether in expected or unexpected ways.11 For example, one assumption we hold is the value of assessor training as part of our assessment development and implementation process.1 Assessor training strives for consistency in ratings, which rests on the notion that with enough training; assessors will judge learners consistently and therefore become immune to contextual factors that may otherwise shape assessment scores (e.g. whether context or learner characteristics). The assumption that an assessor will judge learners uniformly suggests that there can be perfect consistency between

  • the phenomenon that one intends to assess (i.e. specific skill performance),
  • an assessor's response (i.e. cognitive or emotional processing), and
  • eventual judgement (i.e. assessment score),
    ...that can be replicated for all learners.

[평가자 교육에 대한 우리의 믿음]은 개인이 평가와 상호 작용하는 방식과 이러한 상호 작용이 상황적 요인에 의해 형성되는 방식에 대한 중요한 고려사항을 못 보게 만들 수 있으며, 따라서 의도치 않게 응답 프로세스에 대해 우리가 놓치게 만들 수 있다. 이는 평가의 공정성과 형평성을 고려하는 것과 특히 관련이 있다. 또한 응답 프로세스가 상황 또는 학습자 특성(성별이든, 영어능력이든, 인종이든)에 따라 어떻게 변화하는지와 관련이 있다. 따라서 응답 프로세스를 고려하는 것은 점수 해석의 공정성과 형평성, 그리고 평가자와 학습자의 상호의존성에 대한 중요한 정보를 제공할 수 있으며, 건전한 타당성 주장을 구축하는 데 중요하다.
Our faith in assessor training may overshadow important considerations for how individuals interact with assessments and how these interactions are shaped by contextual factors and therefore unintentionally minimise our attention to response processes. This is particularly relevant when considering equity and fairness in assessment and how response processes may shift across contexts or learner characteristics—whether gender, English language competency or race. Therefore, consideration of response processes can provide important information about the fairness and equity of score interpretations and the interdependency of an assessor and learner11 and are critical for building a sound validity argument.

[응답 프로세스 타당성 증거]는 평가자와 학습자 모두에 초점을 맞추며, 평가의 맥락에서 인식, 감정, 행동 및 동기에 대한 고려도 포함한다. 이러한 다면적인 관점은 [인지, 감정 및 동기 부여 수준에서 개개인이 평가에 어떻게 상호작용하고 참여하는지]에 초점을 맞추고, [평가자와 평가 순간에 걸쳐 점수의 의미에 잠재적인 차이]를 허용한다. 평가자, 학습자 및 환경 간의 이러한 상호 작용은 [상호의존적 효과interdependent effects]로 분류되었으며 HPE의 성과 기반 평가 상호 작용을 형성할 수 있다. HPE의 연구는, 평가자의 인지 과정에 대한 연구와 성과 평가 중 학습자가 임상 팀과 상호 작용하는 방법을 설명하는 상호의존적 효과에 대한 연구를 포함하여, [평가 순간의 복잡성]을 더 잘 이해하는 데 기여했다. [응답 프로세스 증거]는 다음의 것들 사이의 정렬을 조사한다.

  • 평가자와 학습자가 [평가의 목표를 이해]하는 방법,
  • [평가 내 항목에 관여]하는 방법,
  • [평가 대상에 대한 공유된 이해] 여부(예: 기술, 역량 또는 관심 행동)

이 타당성 증거는 평가 데이터 해석을 지원하고 점수 해석과 이러한 점수에 기초한 결정이 정당화되는지 여부를 검증하는 데 도움이 된다. 

Response process validity evidence includes a focus on both the assessor and learner and includes consideration for their cognitions, emotions, actions and motivations in the context of assessment.6, 9 This multifaceted perspective places focus on how individuals interact and engage with an assessment at a cognitive, emotional and motivational level, as well allowing for potential differences in the meaning of scores across assessors and across assessment moments.5 These interactions between assessor, learner and environment have been labelled interdependent effects and can shape performance-based assessment interactions in HPE.11 Research in HPE has contributed to better understanding the complexity of an assessment moment, including work on the cognitive processes of assessors1 and interdependent effects that describe how a learner interacts with the clinical team during assessments of performance.11 Response process evidence examines the alignment between

  • how an assessor and learner understand the goals of an assessment,
  • how they engage with items within an assessment and
  • whether there is a shared understanding of the assessment target (i.e. skill, competency or behaviour of interest).

This validity evidence helps to build a validity argument to support assessment data interpretation and verify whether score interpretations, and decisions based on these scores, are justified.12

HPE의 [수행-기반 평가]를 위한 [응답 프로세스 타당성 증거]를 수집하는 것은 다양한 형태를 취할 수 있으며, 어려울 수도 있다.

  • 평가를 통해 수집된 데이터는 [문항 반응item response]을 조사하고, 하위 그룹 간에 통계적으로 반응을 비교하여, 문항이 다양한 하위 그룹(예: differential item functioning)에 걸쳐 다르게 기능하는지 여부를 판단함으로써 공정성을 검사할 수 있다. 
  • 개인(평가자 또는 학습자)이 [평가와 상호 작용할 때 인지 과정]을 탐구하기 위해, 예를 들어, think-aloud 프로토콜을 사용하여 질적 데이터로 수집될 수 있다. 생각을 크게 하는 인터뷰는 주로 개인이 평가와 상호 작용할 때 어떤 생각을 하는지, 그리고 그 생각이 학습자의 기대(또는 예상하지 못한) 성과 또는 평가자의 점수와 어떻게 관련될 수 있는지를 이해하는 데 초점을 맞춘다. 
  • 반응 프로세스가 인지 범위를 넘어 [감정, 행동, 동기]를 포함하도록 확장된다는 인식이 커짐에 따라, 이러한 프로세스가 어떻게 평가 모멘트를 형성하고 그것이 생성하는 점수를 보다 완전하게 이해하도록 다양한 방법론을 도입할 수 있다.

Collecting response process validity evidence for performance-based assessment in HPE can take a variety of forms and can be challenging.

  • Data collected through assessments can be examined for fairness, by examining item responses and comparing responses statistically across subgroups to determine whether items function differently across various subgroups (e.g. differential item functioning).
  • Data can also be gathered qualitatively, for example, using think-aloud protocols, to explore the cognitive processes of individuals (assessors or learners) as they interact with an assessment. Think-aloud interviews primarily focus on understanding what individuals are thinking as they interact with an assessment and how that thinking may relate to anticipated (or unanticipated) performances from a learner or scores from an assessor.
  • With greater recognition that response processes expand beyond cognition to include emotions, actions, and motivation,69 a multitude of methodologies can be brought to bear to more fully understand how these processes shape assessment moments and the scores they generate.

전반적으로, [응답 프로세스]는 평가 데이터를 기반으로 한 주요 의사결정에 대한 지원을 제공하는 타당성 증거의 귀중한 원천입니다. 쿡이 상기시키듯이, 어떤 해석이 타당성에 대한 의도적인 검증을 버텨낸다면, 그 해석은 평가의 사용제안과 평가 데이터의 이해에 대한 정당성을 제공할 것이다. [응답 프로세스 타당성 증거]는 예상되는 평가자와 학습자의 행동을 고려할 때, 제안된 평가 데이터의 해석이 정당하다는 것을 확인하는 데 도움이 된다. 평가는 다양한 형태를 취하며, 본 문서는 주로 수행-기반 평가에 초점을 맞추고 있지만, 응답 프로세스는 (서면 평가에서 포트폴리오까지) 모든 평가 형식에 대한 핵심 품질 지표입니다. HPE의 복잡성과 상황에 따라 동원되는 다양한 평가를 고려할 때, 대응 프로세스는 방어 가능한 평가 시스템을 구축하는 핵심 수단이다.

Overall, response processes are a valuable source of validity evidence that provides support for key decisions made based on assessment data. As Cook12 reminds us, if interpretations hold during deliberate tests of validity, these interpretations provide justification for the proposed use and understanding of assessment data. Response process validity evidence helps verify that our proposed interpretation of assessment data is justifiable given expected assessor and learner behaviour. Assessments take a variety of forms, and although this article has focused primarily on performance-based assessments, response processes are key quality markers for all assessment formats—from written assessments to portfolios. Given the complexity of HPE and the variety of assessments mobilised across contexts, reponse processes are a key means through which we build defensible assessment systems.


Med Educ. 2022 Sep;56(9):878-880.

 doi: 10.1111/medu.14853. Epub 2022 Jun 15.

When I say…response process validity evidence

Affiliations collapse

Affiliations

1Institute of Health Sciences Education, Faculty of Medicine and Health Sciences, McGill University, Montreal, Québec, Canada.

2Department of Medicine, Faculty of Medicine and Health Sciences, Université de Sherbrooke, Sherbrooke, Québec, Canada.

PMID: 35688144

DOI: 10.1111/medu.14853

When I say… 여행 개념(Med Educ, 2020)
When I say… travelling concepts
Mario Veen1 | Iris van der Tuin2

의학교육 연구를 하는 것의 많은 부분은 [개념]에 관한 작업으로 구성되어 있다. 의학 교육의 이 섹션에 있는 논문은 대개 그러한 개념 중 하나를 논의하는데 전념한다. 그러나 종종 의심받지 않는 '개념'이라는 단어 자체의 개념은 어떠한가? 이 질문은 학문분야와 그 학문분야를 긴장시키는 기본 가정에 따라 달라지는 질문입니다. 예를 들어, 인지 심리학에서 개념들은 종종 '구성'과 같이 육체가 없는 추상적인 개념으로 보여진다. 그들은 언어로부터 떨어져 살고, 어쩌면 생각으로부터도 떨어져 산다. 하지만, 이것은 우리가 개념을 바라보는 방식이 아닙니다. 우리는 그들을 각자의 역사와 인격을 가진 비판적인 친구로 보고 있으며, 또한 고려를 요구합니다. 추상적인 실체와는 거리가 먼, 그것들은 우리의 분석 도구이며, 우리의 연구 대상과 의미 있는 대화를 할 수 있는 틀을 형성한다. 여기서, 우리는 특히 여행 개념travelling concepts을 의미한다. 이는 Mieke Bal에 의해 인문학에 소개된 [학제간 분석]을 위한 도구이다. 그것은 또한 학제간(또는 적어도 다학제간) 분야인 의학 교육에도 유용하다.

A large part of doing medical education research consists of working with concepts. The papers in this section of Medical Education are usually devoted to discussing one such concept. However, what about the often unquestioned concept of ‘concept’ itself—a question that depends on the discipline and the underlying assumptions that tension it.1 For example, in cognitive psychology, concepts are often seen as disembodied, abstract ideas—as ‘constructs’. They live apart from language and perhaps even apart from thought. However, this is not how we look at concepts. We see them as critical friends, each with their own history and personality that also demand consideration. Far from abstract entities, they are our analytical tools, shaping the frameworks that allow us to engage in a meaningful dialogue with our objects of research. Here, we specifically mean travelling concepts—a tool for interdisciplinary analysis introduced to the humanities by Mieke Bal.2, 3 It is useful for medical education as well, which is also an interdisciplinary (or at least, multidisciplinary) field.1

[개념]은 모든 단어 중에서 우선이다. [단어]는 체계적인 사용과 개발을 통해 [개념]이 될 수 있다. 예를 들어, 'depression'이라는 단어를 생각해보세요. 심리학에서 정신적인 '장애'를 의미할 수도 있고, 기상학에서 '저압계'를 의미할 수도 있지만, 두 개념 모두 단어의 어원인 deprimere에 의존한다. '누르다'라는 의미를 갖는다. 그러나 이 개념은 [일상적인 언어]에서도 더 느슨한 의미로 사용된다. 사람들은 슬플 때 '나는 우울하다'고 말한다. 의학교육, 의학교육 연구, 그리고 실제로 이 시리즈의 많은 작업은 [개념]과 [일상적 단어]를 구별하는 것이다. 특히 서로 다른 학문적 배경을 가진 동료들과 이야기할 때, 우리는 개념을 사용할 때 항상 우리가 의미하는 바를 분명히 해야 합니다.

Concepts are first of all words. A word can become a concept via its systematic use and development. As an example, consider the word ‘depression’. While it can mean either a mental ‘disorder’ in psychology or a ‘low pressure system’ in meteorology, both uses of the concept draw upon the word's etymology—deprimere, ‘to press down’. But the concept is also used in everyday language in a looser sense—people say ‘I am depressed’ when they feel sad. Much of the work of medical education, medical education research, and indeed this series, is to distinguish concepts from mere words. Especially when speaking with colleagues from different disciplinary backgrounds, we should always clarify what we mean when we use concepts.

그러나, 의학 교육에서 잘 확립된 개념들조차도 그 시점에 도달하기 위해 확장된 궤적을 따라왔다. 여행 중에, 그들은 둘 다 여행 중에 '짐baggage'을 얻거나 잃어버린다.

  • 예를 들어, '반성reflection'라는 개념은 철학에서 심리학, 그리고 교육과학으로 이동했다.
  • 마찬가지로, '증거evidence'라는 개념은 수학에서 매우 구체적인 의미를 가지고 있지만, 자연과학을 통해 의학에 의해 채택되었고, 마침내 의학교육 연구의 터전을 찾았다. 따라서, 무작위 대조 시험이 금본위제라는 생각과 같이 반드시 짐baggage이 따라오게 된다. 또한 의학 교육 연구에도 사용됩니다. 

이러한 개념은 '여행 이력travel histories'을 매핑할 때 빠르게 구체화됩니다. 여행 이력이란, 특정한 단어가 서로 다른 (학술) 문화, 공동체 및 맥락에서 체계적으로 작업에 놓이게 된 방법을 의미한다.

Yet, even concepts that are well established in medical education have followed an extended trajectory to reach that point. During their travels, they both acquire and shed ‘baggage’ along the way.

  • For instance, the concept of ‘reflection’ travelled from philosophy to psychology, thence to educational science.
  • Similarly, the concept of ‘evidence’ has a very specific meaning in mathematics, but was adopted by medicine via the natural sciences, finally finding a home in medical education research. Hence, it necessarily brings with it baggage, such as the idea that the randomised controlled trial is the gold standard—also for medical education research.

Such concepts quickly become concrete when you map their ‘travel histories’—the ways in which they have been systematically put to work in different (academic) cultures, communities and contexts.

마지막으로, 개념에는 [경계]와 [어포던스] 또는 ['선호']가 있습니다. [선호]란 우리가 그 개념과 [함께 할 수 있는 것]과 할[ 수 없는 것]을 뜻한다. [개념]과 [단순한 단어]를 구분하고, 그 궤적을 지도화해야, 우리의 연구에서 어떻게 그것들을 다룰 수 있는지 탐구하기 시작할 수 있다. 증거의 개념을 다시 생각해보세요. 이 개념은 의학의 뿌리에 있는 [실증주의]와 [현상학과 구성주의]와 같은 인간과학의 접근 사이에서, 근본적인 논쟁의 교차점에 있다.

  • [실증주의]에서 증거란 생성되기보다는 발견되는 것으로 본다. 연구 과정에서 확립된 사실들은 특정 현상, 사물 또는 관계의 [논란의 여지가 없는 존재의 근거]로 간주된다.
  • 그러나 [개념]으로 작업함에 있어, 개념과 증거에 대한 또 다른 관점도 존재한다. 즉, [현상]들이 특정한 개념을 [유도]하는 만큼, [개념적 도구]들은 현상을 [확립]한다.

의학교육 연구에서 테마가 자료에서 '출현emerged'했다거나, 특정 개입의 효과에 대한 증거를 '발견found'했다고 말할 수 없는 이유다. [개념] 그 자체는 '밖에서' 발견되거나, 한 번에 모두에게 구성되는 안정적인 실체가 아니다. 변화하고 진화해야 합니다. 우리가 사용하는 특정한 개념은 우리가 교육, 우리의 연구 대상, 연구를 어떻게 보는지를 결정한다.

Finally, concepts have boundaries and affordances or ‘preferences’—what we can (and cannot) do with them. Only when we distinguish concepts from mere words and map their trajectories can we start to explore how we can work with them in our research. Consider again the concept of evidence. This concept is at the intersection of a fundamental debate between positivism, which is at the root of medical science, and approaches from the human sciences such as phenomenology and constructivism.

  • Positivism sees evidence as something that is found rather than generated. Facts established in the research process are seen as the basis for the undisputed existence of certain phenomena, objects or relations.
  • However, working with concepts involves a different view of concepts and evidence. Here, conceptual tools establish phenomena, as much as phenomena invite particular concepts.

This is why, in medical education research, we cannot say that themes ‘emerged’ from the data or that evidence was ‘found’ for the effectiveness of a certain intervention. Concepts themselves are not stable entities that are found ‘out there’ or that are constructed once and for all—they can (and should) change and evolve. The particular concepts that we use determine how we view education, our research objects and research.

하지만, 우리가 사용하는 개념의 역사적 배경이나 학문분야적 토대를 되돌아볼 때, 의학 교육에 대해 정확히 밝혀진 것은 무엇인가? 게다가, 의학 교육에서 그들의 사용은 그러한 역사와 다른 학문으로부터 수집된 지식과 통찰력에 대해 무엇을 드러내는가? [반성]의 예로 돌아가면, 이 개념은 최근까지 주로 [메타인지 과정]으로 간주되어 왔다. 그러나, 이것은 그저 마음 뿐만 아니라, [사람 전체whole person]를 포함하는 [구체화되고 상황화된 현상embodied, situated phenomenon]으로 점점 더 여겨지고 있다. [주어진 개념의 의미]는 [그 개념이 어떤 용법으로 사용되는지]를 통해 자기자신을 드러내며, 따라서 그것은 다수의 타당한 의미를 갖는다.

Yet, what exactly is revealed about medical education when we reflect upon the historical backgrounds or disciplinary groundings of the concepts that we use? Further, what does their use in medical education reveal about such histories and about knowledge and insights gleaned from other disciplines? Returning to the example of reflection, the concept has until recently been seen primarily as a metacognitive process. However, it is increasingly seen as an embodied, situated phenomenon that involves the whole person, not just the mind. The meaning of a given concept reveals itself in the use made of it, and hence, it has multiple valid meanings.

따라서 개념을 출발점으로 삼으면 학술적 논의와 엄격한 연구를 촉진할 수 있다. 개념을 출발점으로 삼는다는 것은, 우리가 차이점과 공통점을 논할 수 있다는 공통지점common ground를 갖는다는 것이다. [개념]은 '모든 사람에게 같은 것을 의미하기 때문이 아니라 그렇지 않기 때문에' 생산적인 힘을 갖는다. 예를 들어, '증거'의 개념을 구성하는 층들의 조심스러운 포장은 교육의 본질만큼이나 근본적인 토론 질문들을 위해 개방된다. Biesta와 Van Braak은 '증거'의 개념을 의학 연구에 사용하는 것은 의학 모델에 적용되는 인과적 가정을 수반하지만, 교육의 본질과 일치하지 않기 때문에 의학 교육 연구에 적용할 수 없음을 보여준다.

Thus, concepts can facilitate academic discussion and rigorous research if we take them as a starting point—a common ground on the basis of which we can discuss our differences and commonalities.3, 4 Concepts become productive forces ‘not because they mean the same thing for everyone, but because they don't’2(p.11) For example, a careful unpacking of the layers that make up the concept of ‘evidence’ opens for debate questions as fundamental as the very nature of teaching. Biesta and Van Braak show that the concept of ‘evidence’ as used in medical research, cannot be applied to medical education research, because it carries with it causal assumptions that work in the medical model, but are inconsistent with the nature of education.5

따라서, [어떤 개념의 힘]은 [한 번 설정되면 바로 실천에 적용될 수 있도록 엄격하게 정의할 수 있는 정도]가 아니다. 오히려, 그러한 [엄격한 적용에 저항하여, 대화의 파트너가 되는 정도]라고 볼 수 있다. 이론보다는 개념에서 교육 연구에 대한 방법론적 근거를 찾는 것은 의학에서 환자 중심의 치료와 유사한 방식으로 의료 교육의 실천으로 우리의 초점을 돌릴 수 있게 할 것이다. 우리는 미리 정해둔 범주로 무장하여 [대상]에 접근하기보다는, [대상]의 경계와 어포던스를 존중하는 대화에 참여ㅎ야 한다. 이 대화에서 [대상object]은 '대답하는to speak back' 것이 허용되고, 그 과정에서 개념에 대한 접근방식을 조정할 수 있다. 따라서 개념으로 작업하려면 연구 대상에 대한 [방법론적 접근 방식을 조정]해야 합니다. 듣는 것이 먼저이고, 그 다음에야 이론과 방법을 선택한다. 그래야 대상object가 자신의 용어로 자신을 드러낼 수 있다.

Hence, the power of a given concept is not to be found in the degree to which we can rigidly define it so that once set, it can be straightforwardly applied to practice. On the contrary, it is in the degree to which concepts resist such straightforward application that they become our conversation partners. Finding our methodological basis for educational research in concepts rather than theories would allow us to turn our focus to the practice of medical education in a similar way to patient-centred care in medicine. Rather than approaching the object of our research armed with predetermined categories, we engage instead in a dialogue in which we respect the object's boundaries and affordances. In this dialogue, the object is allowed ‘to speak back’2(p.45) and we can adjust the concepts with which we approach it accordingly. Therefore, working with concepts demands that we tailor our methodological approach to the object of research—to listen to it first, only then choosing theories and methods so that the object is allowed to reveal itself on its own terms.

 


Med Educ. 2021 Feb;55(2):146-147.

 doi: 10.1111/medu.14400. Epub 2020 Nov 6.

When I say… travelling concepts

Affiliations collapse

Affiliations

1Department of General Practice, Erasmus Medical Center, Rotterdam, The Netherlands.

2Department of Philosophy and Religious Studies, Utrecht University, Utrecht, The Netherlands.

PMID: 33099785

DOI: 10.1111/medu.14400

+ Recent posts