21세기의 미국 의사과학자 인력: 파이프라인 권고 (Acad Med, 2019)
U.S. Physician–Scientist Workforce in the 21st Century: Recommendations to Attract and Sustain the Pipeline
Robert A. Salata, MD, Mark W. Geraci, MD, Don C. Rockey, MD, Melvin Blanchard, MD, Nancy J. Brown, MD, Lucien J. Cardinal, MD, Maria Garcia, MD, MPH, Michael P. Madaio, MD, James D. Marsh, MD, and Robert F. Todd III, MD, PhD

 

 

미국은 현재 미국의 의사-과학자(PS) 노동력의 기여로 인해 생물의학 연구에서 세계 선두를 달리고 있다. PS는 미국 전체 의사 노동력의 1.5%에 불과한 것으로 추정된다. 그러나 PS는 국가의 생의학 연구 노력에 매우 중요하다. 그들의 훈련 때문에, PS는 "임상 관찰을 실험 가능한 연구 가설로 전환하고 연구 결과를 의학 발전으로 변환하는 데 필수적인 힘"이다. 생의학 연구를 통해 특정 질병이 없어지고, 다른 질병에 대한 치료법이 발견되고, 생명을 구하는 의료 절차와 치료법이 개발되었다. 그러한 발견들은 수명 연장, 삶의 질 향상, 그리고 전 세계적으로 공중 보건의 향상으로 이어졌다.

The United States is currently the world’s leader in biomedical research,1 in large measure because of the contributions of the nation’s physician–scientist (PS) workforce.2–5 PSs are estimated to account for only 1.5% of the nation’s total physician workforce5; however, they are invaluable to the nation’s biomedical research effort.5–13 Because of their training, PSs are a “vital force in transforming clinical observations into testable research hypotheses and translating research findings into medical advances.”10 It is through biomedical research that certain diseases have been eliminated, cures for others have been discovered, and medical procedures and therapies that save lives have been developed.1–3,14,15 Such discoveries have led to the lengthening of life spans, quality of life improvements, and the betterment of public health throughout the world.1–7,13–15

중요한 것은, 생의학 연구를 통해 지금까지 이루어진 발전은 PS 인력들이 점점 더 빠른 속도로 인간 건강 증진에 더 큰 기여를 할 수 있도록 자리를 잡았다는 것이다. 1989년에 시작된 인간 게놈 프로젝트는 연구를 수행하기 위한 환경을 변화시켰고 건강 문제를 해결하기 위해 데이터를 공유하고 다학제적 접근법을 사용하는 시대를 열었다. 또한 팀 사이언스, 빅데이터, 정밀 의학에 기반을 둔 프로젝트에 문을 열었다. 이 세 가지 이니셔티브의 결과로 PS 인력들은 뇌를 더 잘 이해하고 그 장애를 치료하기 위해 설계된 혁신적 신경기술을 통한 뇌 연구와 같은 대규모의 조정된 생의학 연구 프로그램을 구현할 수 있다. 이것의 또 다른 예는 백만 명의 지원자들을 대상으로 한 종적 연구인 정밀의학 이니셔티브 코호트 프로그램으로, 질병의 약리유전학을 더 잘 이해하기 위해 이동 건강 기술을 사용하고 참가자들에게 그들 자신의 건강을 증진시킬 것이다. 마지막 예로, 모든 종류의 암을 예방하고, 발견하고, 치료하는 능력을 가속화하기 위해 빅데이터를 사용하는 국립 암 문샷이 있다. 

Importantly, the advances made thus far through biomedical research have positioned the PS workforce to make greater contributions to the enhancement of human health at an increasingly faster pace. The Human Genome Project, which began in 1989, changed the landscape for conducting research and ushered in an era of sharing data and using multidisciplinary approaches to address health issues.16 It also opened the doors to projects based on team science, big data, and precision medicine. As a result of these three initiatives, the PS workforce is able to implement large-scale, coordinated biomedical research programs, such as the Brain Research through Advancing Innovative Neurotechnologies Initiative, which is designed to better understand the brain and treat its disorders.4,17 Another example of this is the Precision Medicine Initiative Cohort Program, a longitudinal study of one million volunteers, which will enhance understanding of microbiome science, using mobile health technologies to better understand the pharmacogenetics of disease and empowering participants to improve their own health.4,18 As a final example, there is the National Cancer Moonshot, which uses big data to accelerate the ability to prevent, detect, and treat all types of cancer.4,19

한국의 PS 노동력 유지에 대한 우려는 지난 40년 동안 정책 입안자들과 다른 사람들에 의해 공개적으로 제기되어 왔으며, 그러한 우려는 범위와 강도에 있어서 증가하고 있다. 젊은 의사들이 PS보다는 임상의나 임상의사-교육자로 경력을 쌓는 것을 선택함에 따라, 지난 몇 년 동안 PS 인력 규모감소해왔다. 아마도 더 큰 관심사는 현재 PS 노동력의 고령화이다. 2003~2012년 10년 동안 60세 이하 PS는 감소했고 61세 이상은 증가했습니다(그림 1 참조). 이 데이터는 놀랍습니다. 

  • (1) 새로운 PS의 인력진 진입과 지속적인 참여가 전례 없이 감소하고 있음을 시사한다. 
  • (2) 고위직원들은 은퇴를 연기했다. 

PS 파이프라인 모델의 관점에서, 유입과 유출이 모두 감소하기 때문에, 시니어 인력들이 은퇴할 때 시스템이 갑자기 붕괴되기 쉽다.

Concerns about sustaining the nation’s PS workforce have been publicly voiced by policy makers and others for the past four decades,5–13 and those concerns are growing in scope and intensity.5–13,20 The size of the PS workforce has declined over the past several years,5 as young physicians choose to focus their careers on being clinicians or clinician–educators rather than PSs. Perhaps of even greater concern is the aging of the current PS workforce. During the 10-year period between 2003 and 2012, the number of PSs aged 60 or younger declined, while the number of those aged 61 or older rose (see Figure 1).5 These data are striking;

  • they suggest that (1) the entry and sustained engagement of new PSs into the workforce are in unprecedented decline, and
  • (2) senior members of the workforce have postponed retirement. In terms of a PS pipeline model, the decreased inflow and outflow renders the system vulnerable to collapsing suddenly as the senior workforce retires.

2007년과 2008년 동안 의대 교수 협회(APM)와 미국 의대 협회(AAMC)는 일련의 회의를 개최하여 기금 풀을 다음과 같이 확장하기 위한 권고안을 발표 및 배포하였다.

  • 젊은 PS의 경력을 유지하고 육성합니다. 
  • 젊은 PS의 멘토링을 위한 접근 방식을 개선합니다. 
  • 여성 PS의 발전을 촉진한다. 
  • 미래 PS의 경력 개발을 식별하고 육성합니다. 

During 2007 and 2008, the Association of Professors of Medicine (APM) and the Association of American Medical Colleges (AAMC) held a series of conferences resulting in published and disseminated recommendations to expand the pool of funds to

  • retain and foster the careers of young PSs,
  • improve the approach for mentorship of young PSs,
  • promote the advancement of women PSs, and
  • identify and foster the career development of future PSs.12,13

PS에 대한 기존 국립 보건원(NIH) 지원에 대한 우려가 커짐에 따라, 2014년, 프랜시스 콜린스 소장은 의사-과학자 인력 워킹 그룹에 현재 커리어 서포트 메커니즘을 평가하고 개선을 위한 권고안을 제출하도록 요청했습니다. 2014년 6월, 작업 그룹은 여러 권고사항과 함께 보고서를 발표했는데, 무엇보다도 NIH에 다음과 같이 촉구했습니다.

  • PS의 강력한 훈련을 지속합니다.
  • [연방정부가 자금을 지원하는 의사 후 교육]에서 [더 많은 개인 대상 펠로우쉽을 포함]하는 쪽으로 균형을 옮깁니다.
  • 신규 및 기성 조사원 간의 수상률award rates 격차를 지속적으로 완화한다.
  • PS 인력의 강점을 평가하기 위해 엄격한 도구를 채택한다.5

In response to growing concerns about existing National Institutes of Health (NIH) support for PSs, in 2014, Director Francis Collins charged a Physician–Scientist Workforce Working Group to assess the current mechanisms of career support and make recommendations for improvement. In June 2014, the working group issued its report with a series of recommendations that, among other things, urged the NIH to

  • sustain strong training of PSs,
  • shift the balance in federally funded postdoctoral training for physicians to include more individual fellowships,
  • continue to mitigate the gap in award rates between new and established investigators, and
  • adopt rigorous tools to assess the strength of the PS workforce.5

이 워킹 그룹은 또한 약 14,000명의 PS의 현재 국내 인력을 유지하기 위해 "매년 약 1,000명의 개인이 파이프라인에 진입해야 할 것"이라고 추정했다. (이 계산은 "파이프라인에 진입"하는 사람들 중 절반이 성공하지 못할 것으로 가정한다.) 이는 [생의학 연구에서 세계적인 리더]로서 미국의 역할을 위협할 수 있기 때문에, 이 예측은 상당한 무게를 지니고 있다. 모세 외 연구진은 현재의 추세가 계속된다면 앞으로 10년 안에 중국이 이 역할을 맡을 것이라고 언급했다.

The working group also estimated that, to maintain the nation’s current workforce of approximately 14,000 PSs, “about 1,000 individuals will need to enter the pipeline each year.”5 (This calculation assumes that half of those who “enter the pipeline will not succeed.”)5 This projection carries with it significant weight because this could threaten the nation’s role as the global leader in biomedical research, as in 2015, Moses et al21 noted that, if current trends continue, China will assume this role within the next 10 years.

2015년 11월, 학술 내과 연합(AAIM)은 의사 조사관 인력 재검토라는 컨센서스 컨퍼런스를 개최했다. 새롭고 진화하는 연구 영역과 학술 기관의 성공 경로. AAIM은 5개의 단체로 구성된 컨소시엄이다. 
In November 2015, the Alliance for Academic Internal Medicine (AAIM) hosted a consensus conference, Re-examining the Physician Investigator Workforce: New and Evolving Areas of Research and Pathways to Success in Academic Institutions. The AAIM is a consortium of five organizations:

  • the APM,
  • Association of Subspecialty Professors,
  • Association of Program Directors in Internal Medicine,
  • Clerkship Directors in Internal Medicine, and
  • Administrators of Internal Medicine.

이 컨퍼런스의 초점은 NIH 의사-과학자 인력 워킹 그룹에 주어진 것과는 달랐다. 즉, NIH 워킹 그룹의 주요 관심사는 NIH 프로그램과 정책에 영향을 미치는 문제를 다루는 것이었지만, AAIM 컨센서스 컨퍼런스의 주요 관심사는, 개개인의 경험과 관심에 기초한 커리어 초기 PS로부터의 투입으로, academic medical school에 영향을 미치는 문제를 다루는 것이었다.

The focus of this conference was different than the charge given to the NIH Physician–Scientist Workforce Working Group—that is, while the major concern of the working group was to address issues impacting NIH programs and policies, the major concern of the AAIM consensus conference was to address issues impacting academic medical schools, with input from early-career PSs based on their individual experiences and concerns.

이 컨퍼런스는 사상적 리더와 초기 경력 PS가 [생물의학 연구에 진지하게 참여할 가능성이 있는 개인을 조기에 식별하는 것과 관련이 있는 중요한 주제들]과 [이러한 개인의 커리어를 개발하기 위한 최적의 메커니즘]을 논의할 수 있는 기회를 제공했다. 또한, 이 회의의 목표 중 하나는 [PS를 유치하고 지원하는 데 있어 현재 걸림돌]을 확인하고 2016년 이후 [PS 인력을 유지하기 위한 새로운 권고안]을 개발하는 것이었다.
The conference provided an opportunity for thought leaders and early-career PSs to discuss a series of critical topics relating to the early identification of individuals with a potential for serious engagement in biomedical research, as well as optimal mechanisms for developing the careers of these individuals. Additionally, one of the goals of the conference was to identify current impediments to attracting and supporting PSs and to develop a new set of recommendations for sustaining the PS workforce in 2016 and beyond.

이 회의에는 100명 이상의 개인이 참석했으며, 학술 관리자, 학과 의장, 프로그램 책임자, 초기 경력 PS(아래 참조)와 국가 재단, NIH, 미국 국립 의학 아카데미, 제약 업계의 대표자들이 참석했다. 이 회의에는 10개의 의학 센터를 대표하는 14명의 초기 경력 PS가 참석했다. 그들 모두는 NIH 멘토링 경력 개발상 또는 보훈처 경력 개발상의 수상자였다. 모두 박사학위였고, 3명은 석사학위를 추가로 받았으며, 박사학위를 받은 사람은 없었다.
More than 100 individuals attended the conference, representing a cross-section of academic administrators, department chairs, program directors, and early-career PSs (see below), as well as representatives from national foundations, the NIH, the National Academy of Medicine, and the pharmaceutical industry. Fourteen early-career PSs attended the conference, representing 10 academic medical centers. All of them were recipients of either an NIH mentored career development award or a Department of Veterans Affairs (VA) career development award. All of them were MDs, 3 had additional master’s-level degrees, and none had a PhD.

이 회의에는 10차례의 브레이크아웃 세션 동안 집중 토의할 핵심 주제에 대한 5차례의 전체 발표가 포함되었다. 각 브레이크아웃 세션은 국가의 PS 인력을 유지하고 잠재적으로 확장하는 것을 목표로 학술적 보건 지도자와 NIH 및 기타 기금 기관을 대상으로 한 일련의 권고안을 개발했다. 그런 다음 각 브레이크아웃 세션의 권장 사항이 모든 컨퍼런스 참석자에게 제시되었습니다. 특정 권고안에 대해 회의 참석자들 사이에 약간의 의견 차이가 있었지만, 이 관점에 포함된 권고안은 회의가 만장일치에 도달한 후 AAIM 이사회에 의해 승인되었다. 이러한 권장사항은 두 가지 주요 전략으로 분류됩니다.

  • (1) PS 파이프라인으로의 진입 증가 및 
  • (2) PS 인력으로부터의 소모 감소(목록 1 참조)

The conference included five plenary presentations on key topics to focus discussion during its 10 breakout sessions. Each breakout session developed a series of recommendations targeted to academic health leaders and to the NIH and other funding agencies, with the goal of sustaining and potentially expanding the nation’s PS workforce. The recommendations from each breakout session were then presented to all of the conference attendees. Although there were slight differences of opinion among the conference participants on certain recommendations, the recommendations included in this Perspective are those on which the conference reached unanimous consensus and which were subsequently approved by the AAIM Board of Directors. These recommendations are categorized within two major strategies:

  • (1) increasing entry into the PS pipeline and
  • (2) reducing attrition from the PS workforce (see List 1).

목록 1 PS Workforce에 대한 학술적 내과의사 컨센서스 컨퍼런스의 권고 사항, 2015년 11월
List 1 Recommendations of the Alliance for Academic Internal Medicine Consensus Conference on the PS Workforce, November 2015

PS 파이프라인 진입 증가
Increasing entry into the PS pipeline

  • 젊은이들에게 생의학 연구의 가치와 생의학 진보에서 PS가 수행하는 중요하고 독특한 역할을 홍보합니다.
  • 역할 모델 및 멘토 네트워크에 대한 액세스를 제공하는 프로그램의 광범위한 구현을 통해 다양한 모집단의 구성원을 PS로 모집 및 보유할 수 있습니다.
  • 국제 PS가 미국에 들어와 미국 노동력의 일원으로 남을 수 있는 기회를 강화한다.
  • PS 교육에서 효율성과 커리큘럼 모범 사례를 홍보합니다.
  • MD/PhD 프로그램에 입학하지 않은 교육생을 위한 학부 및 대학원 연구 교육 기회를 강화합니다.

  1. Promote to young people the value of biomedical research and the important and unique role that PSs play in biomedical advances.
  2. Facilitate the recruitment and retention of members from diverse populations as PSs through widescale implementation of programs that provide access to a network of role models and mentors.
  3. Enhance opportunities for international PSs to enter and remain in the United States as members of the nation’s workforce.
  4. Promote efficiency and curricular best practices in the training of PSs.
  5. Enhance undergraduate and postgraduate research training opportunities for trainees who do not matriculate into MD/PhD programs.

PS 인력 소모 감소
Reducing attrition from the PS workforce

  • "멘토 멘토링" 교육을 포함한 정형화된 멘토링 프로그램을 구현하고, 멘토링 결과에 대한 주기적인 검토를 수행합니다.
  • [Training]에서 [독립적인 연구 커리어]로의 PS 전환을 지원하는 것을 특별히 목표로 하는 연구비 프로그램을 수립합니다.
  • NIH 또는 VA 경력 개발 보조금을 수여받은 개인에 대한 학자금 대출 상환 기회를 확대합니다.
  • 경력 개발 어워드로 지정된 멘토에게 급여 지원을 제공합니다.
  • PS 간에 부서 전체의 급여 형평성을 보장합니다.
  • 보호 시간 제공 및 필요한 경우 브리지 자금 지원을 통해 PS 교수진이 독립적인 연구자가 될 수 있는 안정적인 환경을 제공합니다.
  • 생물의학 발전에 대한 PS의 기여에 대한 환경의 변화를 수용하고, P&T 의사결정 과정에 투명성을 유지하기 위해 P&T 기준을 재고한다.
  • 산업계와의 파트너십 확대를 포함하여 연구 및 연구 자금 지원을 위한 새로운 방법을 모색합니다.
  • PS 경력 개발 데이터 저장소를 구축합니다.
  1. Implement formalized mentoring programs, including “mentoring the mentor” training, and periodic reviews of mentoring results.
  2. Establish grant programs specifically targeted to supporting the PS transitioning from training to an independent research career.
  3. Expand student loan repayment opportunities for individuals who are awarded an NIH or a VA career development grant.
  4. Provide salary support for mentors named on career development awards.
  5. Assure department-wide salary equity among PSs.
  6. Provide a stable environment for PS faculty to become independent researchers through provision of protected time and, when necessary, bridge funding.
  7. Reconsider criteria for P&T to accommodate the changing environment for PSs’ contributions to biomedical advances and be transparent in P&T decision-making processes.
  8. Pursue new avenues for research and research funding, including expanding partnerships with industry.
  9. Establish a repository for PS career development data.

약자: PS는 의사-과학자, NIH, 국립보건원, VA, 보훈처, P&T, 승진 및 재임 기간을 나타냅니다.

Abbreviations: PS indicates physician–scientist; NIH, National Institutes of Health; VA, Department of Veterans Affairs; P&T, promotion and tenure.


이 합의문의 목적상, PS는 [전문적 노력의 대부분을, (학술기관, 정부기관, 산업 및 독립연구센터와 연구소에서 수행되는), 광범위한 생물 의학 연구의 연속체 내에서 정의된 영역에 바치는 의사]로 정의되었다. (기본, 번역, 임상, 역학, 결과 및 의료 교육 연구 포함) 이 사람들 중 많은 사람들은 MD에 더하여 과학 분야에서 전문 학위를 가지고 있으며, 임상의사로서의 자격으로 환자 치료를 계속 제공하고 있다.
For the purposes of this consensus statement, PSs were defined as physicians who devote the majority of their professional effort to a defined area within the broad continuum of biomedical research (inclusive of basic, translational, clinical, epidemiological, outcomes, and medical educational research) conducted in academic institutions, government agencies, industry, and independent research centers and institutes. Many of these individuals have a professional degree in the sciences, in addition to an MD, and continue to provide patient care in their capacity as clinicians.

PS 파이프라인 진입을 늘릴 기회
Opportunities for Increasing Entry Into the PS Pipeline

미국 내 PS를 늘리기 위한 전략 개발과 실행이 필수다. 이 목표를 달성할 수 있는 기회에는 생물의학 연구의 가치를 더 잘 촉진하고 조기에 홍보하는 것, PS 인력의 다양성을 증가시키는 것, 다양성을 증가시키기 위한 역할 모델과 멘토를 사용하는 것, PS 교육 프로세스의 합리화와 연구 교육 기회의 확대가 포함된다.
Developing and implementing strategies to increase the number of PSs in the U.S. workforce is essential. Opportunities to achieve this goal include

  • facilitating better and early promotion of the value of biomedical research,
  • increasing the diversity of the PS workforce,
  • using role models and mentors to increase diversity, and
  • streamlining the PS training process and expanding research training opportunities.

생물의학 연구의 가치를 더 낫고 조기에 홍보할 수 있도록 촉진
Facilitating better and early promotion of the value of biomedical research

아이들의 두뇌가 아직 개발되고 있는 중인 초등학교 때부터 생의학 연구의 가치를 홍보하는 것이 중요하다. 과학, 기술, 공학, 그리고 수학 (STEM)에서 학생들의 기술을 향상시키기 위한 프로그램을 시행하는데 초점을 맞추고 있음에도 불구하고, 미국은 선진국들 사이에서 표준화된 시험의 과학 점수에서 상위 20위 안에 들지 못하고 있다. 앨런과 케이먼은 이 낮은 순위가 부분적으로 연구와 혁신보다 운동선수와 연예인에 더 큰 가치를 두는 국가 전체에 기인할 수 있다고 주장한다. 생물의학 연구의 가치와 기존 STEM 프로그램의 목표를 효과적으로 홍보하기 위해서는 정부 기관, 지역사회 기반 조직, 민간 부문 연구 조직 및 학교 간의 협력이 필요하다.

It is important to promote the value of biomedical research as early as elementary school—while children’s brains are still being developed. Despite a focus on implementing programs to increase students’ skills in science, technology, engineering, and mathematics (STEM), the United States is not ranked in the top 20 on science scores from standardized tests among industrialized nations.22 Allen and Kamen23 argue that this low ranking can, in part, be attributed to the nation as a whole placing greater value on its athletes and entertainers than it does on research and innovation. Collaborations between government agencies, community-based organizations, private-sector research organizations, and schools are necessary to effectively promote both the value of biomedical research and the goals of existing STEM programs.

PS 인력의 다양성 증대
Increasing the diversity of the PS workforce

AAMC가 수집한 데이터는 PS 파이프라인의 다양성 부족을 보여준다. 2015년 의과대학 입학자 중 여성은 47.8%를 차지했다. 그러나, 지난 5년 동안, 그들은 국가의 MD/PhD 프로그램에 등록한 사람들 중 37%에서 38%를 지속적으로 차지해왔다.25 MD/PhD 파이프라인에서 여성의 낮은 대표성은 [시작부터 여성 지원자의 감소]와 [여성들 사이의 더 큰 이탈attrition 수준]을 반영한다. 여성이 MD/PhD 진로를 추구할 가능성이 낮은 이유에 대해 보고한 몇 가지 요인이 있는데, 여기에는 다음이 포함된다.

  • 자녀 양육 또는 다른 가족 책임에 대한 우려,
  • 남성 상대자에 비해 "경쟁에서 이길 필요"가 있다는 인식을 초래하는 직장의 편견,
  • 여러 면에서 PS가 되기 위한 격려의 부족
  • 역할 모델의 부족

Data compiled by the AAMC demonstrate a lack of diversity in the PS pipeline. In 2015, women accounted for 47.8% of those matriculating into medical school24; however, for each of the past five years, they have consistently accounted for between 37% and 38% of those enrolled in the nation’s MD/PhD programs.25 The lower representation of women in the MD/PhD pipeline reflects both fewer female applicants to start with and greater levels of attrition among women.26–28 There are several factors reported by women as to why they are less likely to pursue the MD/PhD career path, which include

  • concerns about child rearing or other family responsibilities;
  • a sense of bias in the workplace resulting in the perception that there is a need to “outcompete” relative to male counterparts;
  • encountering, on multiple fronts, a lack of encouragement to become a PS; and
  • a lack of role models.27–31

인종/민족의 대표성이 부족한 집단을 위한 파이프라인도 확대될 필요가 있다. 2014-2015년 미국 내 MD/PhD 프로그램 졸업생 616명 중 79명(12.8%)만이 인종/민족적으로 대표성이 낮은 집단 출신이라고 보고했다.

  • 26명(4.2%)이 흑인 또는 아프리카계 미국인이라고 스스로 밝혔다. 
  • 히스패닉, 라틴계 또는 스페인계 혈통으로 12명(1.9%) 
  • 41명(6.7%)이 다인종/다인종이었다. 

The pipeline for racial/ethnic underrepresented groups also needs to be expanded.8,32 Of the 616 graduates of MD/PhD programs in the United States during the 2014–2015 academic year, only 79 (12.8%) reported themselves as being from a racially/ethnically underrepresented group:

  • 26 (4.2%) self-identified as black or African American;
  • 12 (1.9%) as being of Hispanic, Latino, or Spanish origin; and
  • 41 (6.7%) as multiple race/ethnicity.33

게다가, [다른 나라의 재능 있고 지망 있는 많은 수의 PS]들이 미국에서 연구 훈련에 들어가려고 시도하는 반면, 그들 중 소수만이 미국의 PS 노동력에 들어가는 데 성공하고 있다. 2015년 미국의 MD/PhD 프로그램에 입학한 626명 중 16명(2.6%)만이 미국 이외의 국가에서 왔다. 이 적은 수의 국제 대학 입학은 국가의 MD/PhD 프로그램의 절반 이하에 부과되는 자금 제한으로 부분적으로 설명될 수 있다. 즉, 연방정부에서 자금을 지원하는 의학 과학자 훈련 프로그램은 미국 시민들과 미국 영주권자들에게만 개방된다. 유학생이 미국에 입국하여 체류할 수 있는 기회를 강화하려는 노력을 포함하여 다양한 인구로부터 회원을 모집하고 유지하는 것을 촉진하는 것은 PS 인력을 늘리는 효과적인 전략이 될 수 있다.

Additionally, while large numbers of talented and aspiring PSs from other countries attempt to enter research training in the United States, only a small percentage of them are successful in entering the nation’s PS workforce.5 Of the 626 matriculates to the nation’s MD/PhD programs in 2015, only 16 (2.6%) came from countries outside the United States.34 This small number of international matriculates can be partially explained by funding restrictions imposed on slightly less than one-half of the nation’s MD/PhD programs—that is, the federally funded Medical Scientist Training Programs (MSTPs) are open only to U.S. citizens and permanent residents of the United States. Facilitating the recruitment and retention of members from diverse populations, including efforts to enhance opportunities for international students to enter and remain in the United States, could be an effective strategy for increasing the PS workforce.

역할 모델 및 멘토를 활용하여 다양성 증대
Using role models and mentors to increase diversity

롤모델과 멘토는 서로 다른 기능을 하며, 둘 다 PS 파이프라인 진입을 늘리는 데 중요합니다. Cruess 등에 따르면, [롤모델]은 "영감을 주고 모범을 보임으로써 가르칠 수 있다"고 한다. 롤모델은 예를 들어 스포츠 영웅, 연예인, PS가 될 수 있고, 다른 사람들에게 미치는 영향은 텔레비전 쇼나 그랜드 라운드 강의 동안처럼 쉽게 초등학교 교실에서 일어날 수 있다.
Role models and mentors function differently, and both are important to increasing entry into the PS pipeline. Role models, according to Cruess et al,35 can “inspire and teach by example.” Role models can be, for example, sports heroes, celebrities, or PSs, and their impact on others can occur in an elementary school classroom as easily as on a television show or during a Grand Rounds lecture.

롤모델에 대한 노출이 핵심입니다. 인종적/인종적으로 대표성이 낮은 고등학생을 대상으로 한 정성적 연구는 많은 학생들이 PS와 상호작용을 해본 적이 없다는 것을 보여주었다. 그들은 연구 경력을 고려하지 않은 근본적인 이유라고 목소리를 높였다. 더욱이, MD/PhD 의대생들을 대상으로 실시한 유사한 연구는 [일찍이 중학교 또는 고등학교의 역할 모델에 대한 노출]이 연구 커리어를 시작하려는 그들의 결정에 영향을 미친 것으로 나타났다. 학생들은 과학 과정 동안 마주친 역할 모델, 가족 내 PS에 대한 노출, 가족 건강 위기 동안 전문가에 대한 노출에 대해 말했다. 이러한 연구는 MD/PhD 파이프라인에서 인종/민족 차이를 해결하는 데 있어 롤 모델의 중요한 중요성을 강조한다.
Exposure to role models is key. Qualitative research of racially/ethnically underrepresented high school students revealed that many had never had interactions with a PS.30,36 They voiced this as an underlying reason for why they did not consider a research career. Furthermore, similar research conducted on MD/PhD medical students indicated that exposure to role models as early as middle and/or high school influenced their decisions to enter a research career.5,36 Students spoke of the role models they encountered during their science courses, exposure to PSs in their families, and exposure to professionals during a family health crisis. These studies emphasize the critical importance of role models in addressing racial/ethnic disparities in the MD/PhD pipeline.

파이체(Paice) 등에 따르면 [멘토]는 연습생이나 경험이 적은 동료와 '멘토가 명시적인explicit 쌍방향 관계를 활발히 하고 있다'는 점에서 롤모델과 다르다. 그것은 "시간이 지남에 따라 진화하고 발전하며 어느 한쪽이 종료할 수 있는 관계"이다. 국가연구멘토링네트워크(NRMN)와 같은 프로그램이 존재하여 특정 조사 영역뿐만 아니라 전문적 개발 영역에서도 멘토링을 제공한다. NRMN의 일부 프로그램은 "다양성, 멘토 관계 내에서의 포괄성 및 문화, 그리고 보다 광범위한 연구 인력 등의 혜택과 도전을 강조한다." 
Mentors differ from role models, according to Paice et al,37 in that a “mentor is actively engaged in an explicit two way relationship” with a trainee or a less-experienced colleague. It is “a relationship that evolves and develops over time and can be terminated by either party.”37 Programs such as the National Research Mentoring Network (NRMN) exist to offer mentoring not only in specific areas of inquiry but also in areas of professional development. Some of the NRMN’s programs “emphasize the benefits and challenges of diversity, inclusivity and culture within mentoring relationships, and more broadly the research workforce.”38

PS 교육 프로세스 합리화 및 연구 교육 기회 확대
Streamlining the PS training process and expanding research training opportunities

생의학 연구를 위한 준비는 10년 이상의 학부, 의과대학, 대학원 교육을 필요로 하는 긴 과정이다. 이 과정을 가속화하기 위해, 연합 MD/PhD 커리큘럼(연방정부가 지원하는 MSTP 포함)은 의과대학 동안 의학 및 연구 훈련을 더 잘 통합하고 가속화하는 아이디어로 개발되었다. 2014년 전국 설문 조사 결과에 따르면 MD/PhD 프로그램 졸업생 중 80% 이상이 연구 지향적인 직업을 추구하는 것으로 나타났다. MSTP 등록(7년 이상의 의무)에 대한 대안으로, 의대생들 중 일부는 등록자들에게 (기관 또는 외부 자금 지원으로) 1년 동안의 멘토링 연구 경험을 제공하는 공식적인 연구 계약을 이용한다. 제한된 일화 데이터는 이러한 공식 연구 계획 중 일부의 효과를 뒷받침한다. 

Preparation for a career in biomedical research is a lengthy process requiring well over a decade of undergraduate, medical school, and postgraduate training, which may include formal graduate education in a scientific discipline. To expedite this process, combined MD/PhD curricula (including federally funded MSTPs) were developed with the idea of better integrating and expediting medical and research training during medical school. The results of a national survey from 2014 show that these programs have had success with > 80% of MD/PhD program graduates pursuing research-oriented careers.39 As an alternative to MSTP enrollment (a commitment of over seven years),39 a subset of medical students take advantage of formal research tracts, which offer enrollees a one-year mentored research experience during medical school (with institutional or external funding support). Limited anecdotal data support the effectiveness of some of these formal research tracts.40,41

의과대학에서 연구 경험을 쌓은 후, 많은 졸업생들은 오랜 기간의 대학원 임상 및 연구 훈련으로 전문 교육을 이수하는 것을 선택한다. 이 과정을 가속화하기 위해, 이러한 [박사 후 경험을 간소화]하기 위한 보조 메커니즘이 개발되었습니다. 미국 내과의사회(Board of Internal Medicine)가 승인한 이러한 접근 방법 중 하나는 신속한 임상 훈련(그리고 종종 하위 전문 펠로우쉽)과 3년간의 멘토링된 박사 후 연구를 결합하는 레지던트 연구 경로이다. 짧은 임상 교육 기간(3년 대신 2년)에도 불구하고, 이러한 졸업생들의 임상 역량(보드시험 합격률로 측정)은 희생되지 않았으며, 80% 이상이 자금 지원을 받은 생물의학 연구를 계속했다. 다른 전공과목 학회(예: 소아과 및 병리학)도 유사한 간소화된 의사 후 교육 경로를 승인했다.

After gaining research experience in medical school, many graduates opt to complete their professional education with a lengthy period of postgraduate clinical and research training. To expedite this process, supplemental mechanisms have been developed to streamline this postdoctoral experience. One such approach, sanctioned by the American Board of Internal Medicine, is a residency research pathway which combines expedited clinical training (and often subspecialty fellowship) with three years of mentored postdoctoral research. Despite a shortened duration of clinical training (two years instead of three), the clinical competency (as measured by board exam pass rate) of these graduates was not sacrificed,42 and more than 80% went on to pursue funded biomedical research.43 Other medical specialty boards (e.g., pediatrics and pathology) have sanctioned similar streamlined postdoctoral training pathways.

마지막으로, 연구에 대한 새로운 관심을 가진 모든 의사들이 의과대학 이전 또는 그 동안 대학원 수준의 과학 훈련을 이수하지 않았기 때문에, 몇몇 연구집약적 의과대학은 [임상훈련의 후기 단계에 있는 의사나 주니어 교수진 중에서 엄선된 그룹에 이러한 엄격한 훈련을 제공하기 위한 공식적인 박사후 연구 훈련 프로그램](종종 MS 또는 PhD 학위까지 이어진다)을 개발했다. 

Finally, because not all physicians with a budding interest in research have completed graduate-level scientific training prior to or during medical school, several research-intensive medical schools have developed formal postdoctoral research training programs (often leading to an MS or PhD degree) to provide this rigorous training to a select group of committed physicians who are in the later stages of clinical training or who are junior faculty.44–46

PS 파이프라인 진입을 늘리기 위한 권장 사항
Recommendations Aimed at Increasing Entry Into the PS Pipeline

PS 파이프라인 진입을 늘리기 위한 AAIM 컨센서스 회의 권고안은 다음과 같았다.

  • (1) 젊은이들에게 생물의학 연구의 가치와 생물의학 진보에서 PS가 수행하는 중요하고 독특한 역할을 홍보한다. 
  • (2) 역할 모델 및 멘토 네트워크에 대한 액세스를 제공하는 프로그램의 광범위한 구현을 통해 다양한 모집단의 구성원을 PS로 모집 및 보유할 수 있습니다. 
  • (3) 국제 PS가 미국 노동력의 일원으로 미국에 입국하여 체류할 수 있는 기회를 강화한다. 
  • (4) PS 교육에서 효율성과 커리큘럼 모범 사례를 촉진한다. 
  • (5) MD/PhD 프로그램에 입학하지 않는 교육생을 위한 학부 및 대학원 연구 교육 기회를 강화한다(목록 1).

The AAIM consensus conference recommendations for increasing entry into the PS pipeline were to

  • (1) promote to young people the value of biomedical research and the important and unique role that PSs play in biomedical advances;
  • (2) facilitate the recruitment and retention of members from diverse populations as PSs through widescale implementation of programs that provide access to a network of role models and mentors;
  • (3) enhance opportunities for international PSs to enter and remain in the United States as members of the nation’s workforce;
  • (4) promote efficiency and curricular best practices in the training of PSs; and
  • (5) enhance undergraduate and postgraduate research training opportunities for trainees who do not matriculate into MD/PhD programs (List 1).

젊은이들에게 생물의학 연구의 가치와 생물의학 발전에 있어 PS가 수행하는 중요하고 독특한 역할을 홍보합니다.
Promote to young people the value of biomedical research and the important and unique role that PSs play in biomedical advances

과학과 수학의 풍요를 제공할 뿐만 아니라, 어린 학습자들, 특히 소외된 배경을 가진 사람들에게 지원을 제공할 수 있는 혁신적인 교육 개입이 확립되어야 한다. 이를 위해 정부 기관, 지역사회 기반 조직, 민간 부문 연구 조직 및 학교 간의 협력을 장려해야 한다.

Innovative educational interventions should be established to provide enrichment in science and math as well as to provide support for young learners, especially those from disadvantaged backgrounds. To this end, collaborations between government agencies, community-based organizations, private-sector research organizations, and schools should be encouraged.

롤모델 및 멘토 네트워크에 대한 액세스를 제공하는 프로그램의 광범위한 구현을 통해 다양한 모집단의 구성원을 PS로 모집 및 유지
Facilitate the recruitment and retention of members from diverse populations as PSs through widescale implementation of programs that provide access to a network of role models and mentors

PS와 다른 전문가들로 구성된 롤모델 네트워크를 만들어 정기적으로 K-12 및 학부 수업을 방문하면 학생들이 생물의학 연구의 가치와 직업으로서의 생존 능력에 노출되는 데 도움이 될 것이다. 마찬가지로, NRMN과 같은 프로그램은 다양한 모집단의 구성원을 모집하고 유지하기 위해 널리 사용되어야 한다.
Creating a network of role models, comprising PSs and other professionals, to routinely visit K–12 and undergraduate classes would help expose students to the value of biomedical research and its viability as a career. Similarly, programs such as the NRMN should be widely used to recruit and retain members from diverse populations as they pursue training as PSs.

국제 PS가 미국에 입국하여 미국 노동력의 일원으로 체류할 수 있는 기회를 강화합니다.
Enhance opportunities for international PSs to enter and remain in the United States as members of the nation’s workforce

연구 상금과 보조금은 거주 상태에 따라 달라지는 경우가 많다. 외국 의대 졸업생들의 박사 후학을 후원하는 대학들은 미국 영주권 신청에 도움을 주어야 한다. 또한, NIH는 다른 정부 기관과 협력하여 국가 연구 서비스상 펠로우십, 교육 보조금 및 경력 개발상의 자격 요건에 대한 정책을 수정해야 한다. 여기에는 미국 대학원 유학을 위해 입학했지만, 아직 영주권을 부여받지 못한 외국 의과대학 졸업생도 포함해야 한다.
Research awards and grants are frequently dependent on residency status. Universities sponsoring foreign medical school graduates’ postdoctoral studies should provide assistance with applications for permanent residence in the United States. Additionally, the NIH should work with other government agencies to amend policies on eligibility requirements for its National Research Service Award fellowships, training grants, and career development awards to include graduates of foreign medical schools who have been admitted to the United States for postgraduate study but who have not yet been granted permanent resident status.

PS 교육의 효율성 및 커리큘럼 모범 사례 촉진
Promote efficiency and curricular best practices in the training of PSs

연구 분야에서 진로에 대한 의지를 입증한 교육생은, 의과대학 재학 중 정식 MD/PhD 프로그램 및 전공의 수련 중 전공/세부전공 연구 경로 조정과 같이 교육 과정을 단축하고 능률화하는 교육 이니셔티브를 최대한 활용할 것을 강력히 권장해야 한다. MSTP에 대한 지속적인 NIH 자금후원이 제공되어야 한다.
Trainees who have demonstrated a commitment to careers in research should be strongly encouraged to take full advantage of educational initiatives that shorten and streamline the training process, such as formal MD/PhD programs during medical school and coordinated residency/subspecialty research pathways during postgraduate training. Continued NIH funding for MSTPs should be provided.

MD/PhD 프로그램에 입학하지 않은 교육생을 위한 학부 및 대학원 연구 교육 기회 강화
Enhance undergraduate and postgraduate research training opportunities for trainees who do not matriculate into MD/PhD programs

연구에 관심이 있지만 공식적인 MD/PhD 프로그램에 등록되지 않은 의대생은 1년 동안 멘토링된 연구 경험에 참여하는 것을 고려해야 한다. 전문 교육(예: 하위 전문 펠로십) 또는 하위 교수로서 연구를 추구하는 데 관심을 보이는 임상 교육을 받은 의사는 석사 및/또는 박사 학위를 받을 수 있는 공식적인 연구 훈련 기회에 참여하는 것을 고려해야 한다. 현재 이러한 학부 및 대학원 교육 프로그램의 효과에 대한 발표된 데이터가 제한적이므로, 이러한 대안 연구 커리큘럼에 대한 포괄적인 조사(졸업자의 내용, 지원 메커니즘 및 경력 결과 포함)는 관련 전문 기관이 수행해야 한다. 예를 들어 AAIM이나 AAMC, 프로그램 리더가 소집하고 모범 사례를 교환할 수 있는 메커니즘이 제공되어야 한다.

Medical students who have an interest in research but who are not enrolled in a formal MD/PhD program should consider participating in a one-year mentored research experience. Clinically trained physicians who develop an interest in pursuing research later in their professional education (e.g., subspecialty fellowship) or as junior faculty should consider participating in formal research training opportunities that may lead to a master’s and/or doctoral degree. Currently, there are limited published data on the effectiveness of these undergraduate and postgraduate training programs,40,41,44–46 so comprehensive surveys of these alternative research curricula (including content, mechanisms of support, and career outcomes of graduates) should be conducted by relevant professional organizations, such as the AAIM or AAMC, and a mechanism for program leaders to convene and exchange best practices should be provided.

PS 인력의 소모 감소를 위해 해결해야 할 요인
Factors to Address to Reduce Attrition From the PS Workforce

많은 PS들, 특히 그들의 경력 초기와 중간 단계에 있는 사람들은 전임 임상 실습에 들어가기 위해 생물의학 연구 기회를 추구하려는 그들의 원래 계획을 두고 떠난다. Attrition 사유는 다양하고 복잡하지만, 학계로부터 PS의 Attrition와 인과적으로 연결될 수 있는 식별 가능한 요인은 다음과 같다.

  • 부적절한 멘토링, 
  • PS로서의 성공에 대한 편협한 인식, 
  • 외부 지원을 위한 경쟁이 치열해지고 있습니다. 
  • 재정적 압박, 
  • 불충분한 제도적 지원, 그리고 
  • 일과 삶의 균형에 대한 어려움

Many PSs, especially those in the early and middle stages of their careers, leave behind their original plans to pursue biomedical research opportunities to enter full-time clinical practice. Reasons for attrition are numerous and complex; however, there are identifiable factors that can be causally linked to the attrition of PSs from academia, including

  • inadequate mentoring,
  • a narrow perception of success as a PS,
  • increasing competition for external support,
  • financial pressures,
  • inadequate institutional support, and
  • difficulties with work–life balance.

부적절한 멘토링
Inadequate mentoring

독립적으로 자금을 지원하는 PS로서 성공을 달성하는 것은 어려울 수 있습니다. 강력하고 적극적인 멘토링은 그 성공의 중요한 요소이다. 멘토-연수생 다이애드가 멘토십의 전통적인 모델이었지만, 몇몇 기관들은 중앙 집중식 감독, 멘토 지원 및 경력 개발을 제공하기 위해 고안된 이니셔티브를 개발했다. 확립된 연구자는 연구를 수행하는 전문 지식을 가지고 있지만, 견습생을 적극적으로 지도하는 데 필요한 기술을 개발하기 위해 추가적인 교육 지원을 요구할 수 있다. 연구 멘토 양성 프로그램이 효과가 있는 것으로 나타났다. 그러한 프로그램은 모든 의과대학에서 시행되어야 하며 진로 협상, 보조금 작성, 원고 출판, 일과 삶의 균형과 같은 분야의 공식화된 훈련을 포함해야 한다. 가정 기관, NIH 및 기타 기금 기관은 시간과 보상 측면에서 멘토에게 적절한 자원을 할당해야 한다.
Achieving success as an independently funded PS can be challenging. Strong, active mentoring is a crucial element of that success.43 While the mentor–apprentice dyad has been the traditional model of mentorship, several institutions have developed initiatives designed to provide centralized oversight, mentorship support, and career development. Established researchers, while having the expertise to perform research, may require additional educational support to develop the skill set needed to actively mentor an apprentice. Training programs for research mentors have been shown to be effective.47–49 Such programs should be implemented in all medical schools and should include formalized training in areas such as career negotiation, grant writing, publication of manuscripts, and work–life balance.47 Home institutions, the NIH, and other funding agencies should allocate adequate resources to mentors in terms of both time and compensation.

PS로서의 성공에 대한 좁은 인식
A narrow perception of success as a PS

[성공적인 PS는 NIH가 벤치 또는 초기 중개연구를 위한 PI로 자금을 지원받는다]는 인식이 많다. 하지만, 이 개념은 NIH와 다른 사람들이 가정한 [광범위한 PS의 정의]를 고려하지 않으며, 또한 다학제 연구팀이 빅데이터를 사용하고 정밀의학 이니셔티브를 발전시켜야 하는 [연구 분야 내에서의 진화]도 고려하지 않는다. 그럼에도 불구하고, 성공적인 PS를 구성하는 이러한 오래된 개념은 연구 자금과 승진 및 테뉴어(P&T)에 대한 결정에 있어서 부정적인 경력 결과를 초래할 가능성을 계속 제기한다. 따라서, 연구비 지원 기관과 AMC 모두 [PS로서 성공을 구성하는 것]에 대한 더 광범위한 기준을 개발할 필요가 있을 것이다. 
A widely held view is that a successful PS is funded by the NIH as a principal investigator for bench or early translational research.50 This notion does not take into account the broader definition of a PS as posited by the NIH and others,5 nor does it take into account the evolution occurring within the research arena that requires multidisciplinary research teams to use big data and advance precision medicine initiatives. Nonetheless, these antiquated notions of what constitutes a successful PS continue to pose the possibility of negative career consequences when it comes to decisions about research funding and promotion and tenure (P&T). Accordingly, both funding agencies and academic medical centers will need to develop broader criteria for what constitutes success as a PS.50

외부 지원 경쟁 심화
Increasing competition for external support

NIH가 지원하는 R01 보조금에 대한 PS의 최초 수상률은 2012년에 14%로 사상 최저였다. NIH로부터 보조금을 받기 위한 과정은 경쟁이 치열해졌고, 모든 연구 프로젝트 보조금에 대한 전반적인 성공률은 1997년 31%에서 2014년 18%로 떨어졌다. 자금을 성공적으로 확보하거나 지속하지 못하는 것은 흔하지만 예측할 수 없는 일이다. 그로 인해 발생하는 [다른 진로 경로와 비교했을 때에 연구자가 가지는 취약성]의 감각이 소모attrition에 기여할 수 있다. NIH가 훈련에서 독립 연구 경력으로 전환하는 동안 PS를 용이하게 하기 위해 K99/R00 Pathways to Independence Award 이니셔티브와 유사한 프로그램을 수립해야 한다는 강력한 논거를 제시한다.
The first-time award rate among PSs for an NIH-funded R01 grant was 14% in 2012, an all-time low.5 The process to receive a grant from the NIH has become more competitive, with overall success rates for all research project grants dropping from 31% in 1997 to 18% in 2014.5 The failure to successfully obtain or continue funding is a common yet unpredictable occurrence. The resulting sense of researcher vulnerability, as compared with other career pathways, can contribute to attrition. It makes a strong case for the NIH to establish a program similar to its K99/R00 Pathway to Independence Award initiative to facilitate PSs during their transition from training to an independent research career.

학술 기관들은 연방 및 주 기관, 전문 협회 및 사회, 제약 산업을 포함한 민간 부문과 같은 다른 자금 공급원과의 제휴를 고려할 필요가 있다. 빅데이터가 성장하면서 구글, 아마존과 같은 기업과 제휴할 기회도 존재한다. PS에게 이러한 다양한 자금 출처에 접근할 수 있는 지식과 도구를 제공하기 위해서는 효과적인 멘토링과 경력 개발이 필요할 것이다.

Academic institutions need to consider partnering with other sources of funding, such as federal and state agencies, professional associations and societies, and the private sector, including the pharmaceutical industry. With the growth of big data, opportunities also exist to partner with companies such as Google and Amazon. Effective mentorship and career development will be needed to provide PSs with the knowledge and tools to be able to access these diverse funding sources.

재정적 압박
Financial pressures

의대와 대학원 교육 동안, 임상 실습에서의 경력에 비해, PS 커리어를 선택할 때 따르는 재정적 디스인센티브가 있다. 즉, 교육 부채에 대한 부담이 훨씬 더 커지고 안정적인 유급 고용에 대한 자격이 상당히 지연될 가능성이 있다. 비록 MD/PhD 학생이 펠로우십을 통해 지원을 받는다고 해도, 의사 후 연구 훈련과 함께 의과대학 훈련의 상당한 기간(7년 이상)은 생물의학 연구 분야에서 가장 헌신적인 젊은 과학자를 제외한 모든 과학자들을 멀어지게 하기에 충분하다. 아무리 좋은 시나리오라도 PS는 36세에 테뉴어 트랙의 후보자가 된다. 그러나 많은 PS는 테뉴어 트랙 포지션에 대한 수요가 공급을 초과하기 때문에 몇 년 더 포스닥의 지위를 유지한다. 종종, 그들의 조교수로의 고용과 임명은 공식적으로 또는 비공식적으로 NIH의 성공적인 자금 지원(예: K 또는 R 상)에 좌우되지만, MD가 첫 R01을 받은 PS의 평균 연령은 43.8세이다. MD/PhD를 가진 사람들의 평균 연령은 44.3세이다. 많은 PS는 첫 번째 교직원 임명을 시작할 때 큰 부채 부담을 가지고 있는데, 이 상황은 상당한 재정적 압박을 유발하고 가족의 안정적인 지원을 위한 수단을 제공하지 못한다.

During both medical school and postgraduate training, there is a financial disincentive to pursue a PS career relative to a career in clinical practice—that is, there is the potential for a much greater burden of educational debt and a significant delay in eligibility for stable, paid employment.7,51,52 Even if an MD/PhD student is supported through a fellowship, the significant duration of medical school training (seven years or longer), coupled with incremental postdoctoral research training, is sufficient to sway all but the most committed young scientists away from a career in biomedical research. In a best-case scenario, a PS becomes a candidate for a tenure-track position at the age of 36.5 However, many PSs retain their postdoctoral status for several additional years because the demand for tenure-track positions exceeds the supply.52 Often, their employment and appointment as assistant professor are formally or informally contingent on successful funding from the NIH (such as a K or R award), yet the average age of PSs with an MD receiving their first R01 is 43.8 years; for those with an MD/PhD, the average age is 44.3 years.5 Many PSs have large debt burdens when beginning their first faculty appointment, a situation that creates substantial financial duress and does not provide the means for the stable support of a family.

제도적 지원 부족
Inadequate institutional support

제도적 지원은 여러 가지 형태를 취할 수 있으며 임상의사나 박사 연구자와 같은 다른 사람과 비교할 때 PS의 고유한 요구의 결과인 경우가 많다. PS는 연구에 소비하거나 연구 자금 확보에 적용할 수 있는 시간에 영향을 미치는 증가하는 양의 임상 수익을 창출해야 한다. 비슷하게, PS는 종종 임상의 동료들보다 적은 임금을 받으며 종종 외부 자금을 통해 그들의 급여와 연구팀의 다른 사람들의 급여의 많은 부분을 충당할 것으로 기대됩니다. 불행하게도, 그들이 소속된 기관은 외부 자금 부족이 발생할 때, [브리지 연구비 지원]을 제대로 제공하지 않는 경우가 많다. 마지막으로, PS에 대한 P&T 지표는 종종 시대에 뒤떨어지고 팀 과학에 대한 기여, 독립 PS로서의 경력을 확립하는 데 계속 증가하는 시간 또는 빅 데이터, 정밀 의료 및 팀 과학 분야에서 충족되어야 하는 요구를 고려하지 않는다.

Institutional support can take several forms and is often the result of the unique needs of PSs when compared with others, such as clinicians or PhD researchers. PSs are asked to generate increasing amounts of clinical revenue, which affects the time they can spend on their research or apply to securing research funding.52 Similarly, PSs are often paid less than their clinician counterparts and are often expected to obtain a large portion of their salary, and the salaries of others on their research team, through external funding. Unfortunately, their home institutions are often not optimally forthcoming with bridge funding when lapses of external funding occur.7 Finally, the metrics for P&T for PSs are often outdated and fail to take into account contributions to team science, the ever-increasing length of time needed to establish a career as an independent PS, or the demands that will need to be met within the arenas of big data, precision medicine, and team science.

일과 삶의 균형에 대한 어려움
Difficulties with work–life balance

PS는 일반적으로 그들 중 많은 수가 가정을 꾸리고 있는 시점에서 노동력으로 들어가고 있다. 일과성 비경력적 책임(예: 가족 및 건강 문제)은 종종 PS가 일시적으로 인력에서 이탈할 것을 요구할 수 있다. PS들이 소속된 기관은 직장과 가정의 경쟁적인 요구를 수용하고, 가능한 한 유연한 옵션을 제공하며, 결과적으로 PS 직원의 경력 궤적이 악영향을 받지 않도록 해야 한다. [세대 차이]는 후배들에게 매력적이지 않은 작업 환경으로 이어질 수 있다. 예를 들어, 현재 의대에 입학하는 개인과 하위 교수로 학계에 입학하는 사람들은 일과 삶의 균형을 점점 더 중요하게 생각한다. 이러한 가치 체계를 뒷받침하는 연구들은 일과 삶의 균형을 이루는 것이 스트레스, 감정적 피로, 그리고 소진을 줄일 수 있다는 것을 증명했다. 
PSs are generally entering the workforce at a time when many of them are also starting families. Episodic noncareer responsibilities (e.g., family and health issues) can often demand that PSs temporarily remove themselves from the workforce. PSs’ home institutions need to accommodate the competing demands that work and family often present, provide flexible options whenever possible, and ensure that the career trajectories of their PS faculty are not adversely affected as a result. Generational differences may lead to work environments that are unappealing to junior faculty. For example, individuals now entering medical school and those entering academia as junior faculty increasingly value a balance between work and life. Supporting this value system, studies have demonstrated that achieving a work–life balance can reduce stress, emotional exhaustion, and burnout.47,53,54

PS 인력 소모 감소를 위한 권장 사항
Recommendations Aimed at Reducing Attrition From the PS Workforce

PS 파이프라인의 소모 감소를 위한 AAIM 컨센서스 컨퍼런스 권고안은 다음과 같았다.
The AAIM consensus conference recommendations for reducing attrition from the PS pipeline were to

  • (1) "멘토 양성" 교육을 포함한 정형화된 멘토링 프로그램 구현 및 멘토링 결과의 주기적인 검토
  • (2) 교육에서 독립적 연구 경력으로의 PS 전환을 지원하는 것을 특별히 목표로 하는 보조금 프로그램을 수립한다.
  • (3) NIH 또는 VA 경력 개발 보조금을 수여받은 개인에 대한 학자금 대출 상환 기회를 확대한다.
  • (4) 경력개발상(Career Development Awards)에 등재된 멘토에게 급여 지원을 제공한다.
  • (5) PS 간 부서 전체의 급여 형평성을 보장한다.
  • (6) 보호 시간 제공 및 필요한 경우 교량 자금 지원을 통해 PS 교수진이 독립적인 연구자가 될 수 있는 안정적인 환경을 제공한다.
  • (7) 생물의학 발전에 대한 PS의 기여에 대한 환경의 변화를 수용하고 P&T 의사결정 과정에 투명성을 유지하기 위해 P&T 기준을 재고한다.
  • (8) 산업계와의 파트너십 확대를 포함한 연구 및 연구 자금 지원을 위한 새로운 방법을 추구한다.
  • (9) PS 경력 개발 데이터 저장소(목록 1)를 구축한다.

 

  • (1) implement formalized mentoring programs, including “mentoring the mentor” training, and periodic reviews of mentoring results;
  • (2) establish grant programs specifically targeted to supporting the PS transitioning from training to an independent research career;
  • (3) expand student loan repayment opportunities for individuals who are awarded an NIH or a VA career development grant;
  • (4) provide salary support for mentors named on career development awards;
  • (5) ensure department-wide salary equity among PSs;
  • (6) provide a stable environment for PS faculty to become independent researchers through provision of protected time and, when necessary, bridge funding;
  • (7) reconsider criteria for P&T to accommodate the changing environment for PSs’ contributions to biomedical advances and be transparent in P&T decision-making processes;
  • (8) pursue new avenues for research and research funding, including expanding partnerships with industry; and
  • (9) establish a repository for PS career development data (List 1).

 

"멘토 멘토링" 교육을 비롯한 정형화된 멘토링 프로그램 구현 및 멘토링 결과 주기적 검토
Implement formalized mentoring programs, including “mentoring the mentor” training, and periodic reviews of mentoring results

정형화된 멘토링 프로그램은 멘티 뿐만 아니라 궁극적으로 교수진의 성공을 통해 기관의 명성을 높일 수 있다. 따라서 팀 기반, 다세대, 다기관 및 다문화 멘토링 그룹은 기관의 하위 교수진에게 광범위하고 긍정적인 영향을 미칠 수 있다. 멘토링 주제는 여러 분야를 다루어야 한다. 구체적인 연구 주제 외에도, 멘토링은 연구의 책임있는 수행, 연구비 지원서 작성, 원고 출판, 리더십, 경력 협상 및 일과 삶의 균형 등에 대해 제공되어야 한다. 멘토 양성 및 멘토링 결과의 주기적인 평가는 기관의 멘토링 프로그램의 필수 구성 요소가 되어야 한다.

Formalized mentoring programs may help not only the protégé but may also ultimately enhance the reputation of the institution through the successes of its faculty. Team-based, multigenerational, multi-institutional, and multicultural mentoring groups, therefore, could have a wide-reaching and positive impact on an institution’s junior faculty members. Mentoring topics should cover several areas; in addition to specific research topics, mentoring should be provided on the responsible conduct of research, grant writing, publication of manuscripts, leadership, career negotiation, and work–life balance. Training of mentors and periodic evaluations of mentoring results should be required components of an institution’s mentoring program.

교육에서 독립적 연구 경력으로의 PS 전환을 지원하기 위한 특별 보조금 프로그램 수립
Establish grant programs specifically targeted to supporting the PS transitioning from training to an independent research career

전환 기간은 젊은 PS에게 특히 취약한 시기이며, PS가 [Training에서 독립적인 연구 커리어로 전환되는 시기]는 이탈Attrition 현상이 발생할 가능성이 더 높은 시기이다. NIH는 현재의 K99/R00 프로그램과 유사한 이 전환 단계에서 PS를 보호하기 위해 특별히 지정된 기금을 적립해야 한다. NIH 연구 섹션은 많은 예비 데이터를 수집하지 않았을 수 있는 매우 유망한 개인을 수용하기 위해 그들의 기대를 재보정할 필요가 있다.
Periods of transition are a particularly vulnerable time for young PSs, and the period when a PS is transitioning from training to an independent research career is one in which attrition may be more likely occur. The NIH must set aside funds specifically designated for PSs with the purpose of protecting them in this transition phase, similar in nature to the current K99/R00 program. NIH study sections need to recalibrate their expectations to accommodate highly promising individuals who may not have amassed a large body of preliminary data.

NIH 또는 VA 경력 개발 보조금을 받은 개인에 대한 학자금 대출 상환 기회 확대
Expand student loan repayment opportunities for individuals who are awarded an NIH or a VA career development grant

많은 PS는 많은 양의 학자금 대출 채무를 축적했는데, 이것은 학계를 떠나 더 수익성이 높은 직업을 가지기로 한 결정에 영향을 미칠 수 있다. NIH 대출 상환 프로그램은 생물의학 연구 경력을 쌓기 위해 자격을 갖춘 의료 전문가를 모집하고 유지하는 것을 돕기 위해 고안되었습니다. 이러한 대출 상환 프로그램 참여자들은 연구 경력을 더 오래 유지하고, 더 많은 연구 보조금을 신청하고 수령하며, 독립적인 조사원이 될 가능성이 더 높은 것으로 나타났다. PS에 대한 대출 상환 기회가 강화되어야 한다.

Many PSs have amassed large amounts of student loan debt, which can factor into their decision to leave academia for a more lucrative profession. NIH loan repayment programs are designed to help recruit and retain highly qualified health professionals into biomedical research careers. Participants in these loan repayment programs have been shown to remain in research careers longer, apply for and receive more research grants, and be more likely to become independent investigators.55 Loan repayment opportunities for PSs should be enhanced.

경력개발상에 선정된 멘토에 대한 급여 지원 제공
Provide salary support for mentors named on career development awards

멘토 경력 개발 상을 받은 젊은 조사원들은 주로 다른 일정이 멘토링 일정보다 우선하기 때문에, 그들은 종종 그들의 멘토들과 함께 보낸 시간을 그들의 기금 기관에 과도하게 보고한다고 지적한다. NIH와 다른 기금 기관은 멘토가 독립적인 연구 경력을 확립하려는 젊은 연구원들의 개발에 수행하는 중요하고 시간이 많이 걸리는 역할을 인식할 필요가 있다. 멘토는 자신의 시간에 대한 보상을 받아야 하며, 자신의 노력과 생산성에 대해 보고할 때 멘토링에 소요된 시간의 비율을 공식적으로 기록할 수 있어야 합니다.
Young investigators with mentored career development awards note that they often overreport the time spent with their mentors to their funding agency,5 mainly because their mentors’ other commitments sometimes take precedence over their mentoring needs. The NIH and other funding agencies need to recognize the important and time-consuming role that mentors play in the development of young investigators looking to establish independent research careers. Mentors should be compensated for their time and allowed to formally record the percentage of time spent mentoring when reporting on their levels of effort and productivity.

PS 간 부서 전체의 급여 형평성 보장
Assure department-wide salary equity among PSs

몇몇 의과대학에서 급여 형평성이 해결되지 않은 채로 남아 있다는 것은 널리 인식되고 있으며, 특히 젠더 간 불평등의 가장 높은 원인이 된다. 부서 의장은 급여 정책을 투명하게 하고, 급여 지급자에게 급여 지급을 제안할 때 급여 분배와 스타트업 패키지에 대해 논의해야 하며, 이후 정기적으로 부서 직원들에게 급여 분배를 보고해야 한다.
It is widely recognized that salary equity remains unresolved in several of the nation’s medical schools, with gender as the highest source of disparity.56,57 Department chairs should be transparent in their salary policies, discuss salary distribution and startup packages when offering a salaried position to a PS, and report salary distributions to department faculty on a periodic basis thereafter.

보호 시간 제공 및 필요한 경우 브리지 자금 지원을 통해 PS 교수진이 독립적인 연구자가 될 수 있는 안정적인 환경 제공
Provide a stable environment for PS faculty to become independent researchers through provision of protected time and, when necessary, bridge funding

PS의 경력 개발은 장기적인 투자입니다. 소득 발생은 수년 단위의 latency period 이후에야 증가한다. 부서 의장과 그 기관은 젊은 PS의 기능과 궤적에 대한 광범위한 비전을 수용하고 이러한 지연을 반영하는 장기 예산을 구성해야 한다. 여기에는 멘토링 감독, 경력 개발 프로그래밍, 보조금 검토, 동료에서 교직원으로의 전환을 위한 자금 지원 등이 포함될 수 있다. 새로운 PS 교수진들이 [연구 경력을 발전]시키면서, 동시에 [자신의 급여를 지원할 수 있을 만큼 충분한 임상 수익을 창출]할 수 있다는 기대는 비현실적이다. 또한 부서 의장은 PS 교수진의 장기적인 일과 삶의 균형을 수용할 수 있는 유연한 옵션을 제공하는 것을 적극적으로 고려해야 한다.
The career development of a PS is a long-term investment; income generation usually increases only after a latency period that is measured in years. Department chairs and their institutions must embrace a broad vision of the function and trajectory of the young PS and construct a long-term budget that reflects this delay. This may include providing mentorship oversight, career development programming, grant reviews, and funding support for the transition from fellow to faculty.58 The expectation that new PS faculty members can generate clinical revenue sufficient to support their salaries while simultaneously developing their research careers is unrealistic. Additionally, department chairs should actively consider providing flexible options to accommodate their PS faculty members’ long-term work–life balance.

생물의학 발전에 대한 PS의 기여에 대한 환경의 변화를 수용하고 P&T 의사결정 과정에 투명성을 유지하기 위해 P&T 기준을 재고한다.
Reconsider criteria for P&T to accommodate the changing environment for PSs’ contributions to biomedical advances and be transparent in P&T decision-making processes

팀 기반 연구는 P&T 심의에서 적절하게 평가되어야 한다. 전통적으로 개별 연구는 금본위제였지만, 지식의 진보가 여러 분야의 기여를 필요로 하는 시대에 팀 기반 연구는 점점 더 일반화되고 중요해지고 있다. P&T 위원회는 현재의 연구 방향을 뒷받침하기 위해 연구자의 필수 기여자로서의 지위를 인정하고 누가 주 연구원으로 지명되든 간에 성공적으로 자금을 지원받은 보조금 제안을 장학금의 증거로 간주하는 정책을 개발해야 한다. 팀 과학 연구의 모델 내에서, 논문의 1저자 자리를 위한 경쟁에 대한 강조는 없어야 한다deemphasized. 마지막으로, 승진 및 종신 재직권 수여에 추가 시간이 필요한 PS에 대한 P&T 고려사항은 패널티 없이 제공되어야 한다.
Team-based research must be valued appropriately in P&T deliberations. Traditionally, individual research has been the gold standard; however, team-based research is becoming increasingly common and more important in an era where advancement of knowledge requires the contributions of multiple disciplines. In support of the current direction of research, P&T committees must develop policies that recognize a researcher’s status as an indispensable contributor and consider a successfully funded grant proposal as evidence of scholarship regardless of who is named as the principal investigator. Within the model of team science research, competition for first-author position on a publication should be deemphasized. Finally, P&T considerations for PSs needing additional time for promotion and the award of tenure should be provided without penalty.

산업계와의 파트너십 확대를 포함한 연구 및 연구 자금 지원을 위한 새로운 방법 모색
Pursue new avenues for research and research funding, including expanding partnerships with industry

비록 NIH가 PS에 대한 대부분의 연구 지원을 제공하지만, 그것이 유일한 지원원으로 여겨져서는 안 된다. 다른 연방 및 주 정부 기관 외에도 민간 및 공공 재단, 전문 사회 및 협회, 산업 및 외국 소스도 연구에 기꺼이 자금을 대려고 한다. 빅 데이터 이니셔티브가 보편화됨에 따라 기관들은 상호 이익이 될 수 있는 파트너십을 수용할 수 있게 될 것입니다.

Although the NIH provides the majority of research support for PSs, it should not be considered the only source of support. In addition to other federal and state agencies, private and public foundations, professional societies and associations, industry, and foreign sources are often willing to fund research. As big data initiatives become more commonplace, institutions would be well served to accommodate partnerships that can be mutually beneficial.

PS 커리어 개발 데이터 저장소 구축
Establish a repository for PS career development data

PS에 대한 [연구 커리어 개발 과정의 개선을 위한 합리적인 계획을 세울 수 있는 자료]가 부족하다. 데이터 저장소는 향후 의사 결정을 위한 강력한 기반을 제공합니다. 최소한 리포지토리는 다음을 포함해야 합니다.

  • (1) 사용된 훈련 경로에 대한 설명
  • (2) 외부 연구비 지원,
  • (3) 성공적으로 지원된 외부 연구비,
  • (4) 모든 교육을 완료한 후 최소 5년 동안 수집된 PS에 대한 임명 및 고용 데이터.

There is a paucity of data with which to make rational plans for improvement in the research career development process for PSs. A data repository would provide a strong foundation for future decisions. At a minimum, the repository should include

  • (1) a description of training pathways used,
  • (2) external grant applications,
  • (3) external grants successfully funded, and
  • (4) appointment and employment data for PSs collected for a period of at least five years after completion of all training.

요약
Summary

PS 노동력의 적절한 평가는 생물의학 연구의 세계 리더로서의 미국의 지위를 유지하는 데 매우 중요하다. 앞으로, 학술 기관, 정부, 그리고 민간 부문은 직업 선택으로서 생물의학 연구의 일반적인 분야를 홍보하기 위해 협력해야 한다. K-12 교육 시스템의 과학 및 수학 커리큘럼의 향상과 현재 노동력에서 대표성이 부족한 다양한 그룹에 대한 직업 선택으로서의 PS의 홍보도 있어야 한다. 
The proper valuing of the PS workforce is critical to maintaining the status of the United States as the world leader in biomedical research. Moving forward, academic institutions, the government, and the private sector must work together to promote the general field of biomedical research as a career option through the enhancement of science and math curricula in the K–12 education system and the promotion of the PS as a career choice to diverse groups that are currently underrepresented in the workforce.

학문의학은 또한 팀 과학, 빅데이터, 정밀의학을 육성함으로써 생물의학 발전이 달성되는 새로운 방식을 수용해야 하며, 이러한 시책에 관여하는 연구자들이 인정받을 수 있는 메커니즘을 확립해야 한다. 강력하고 실행 가능한 멘토 프로그램을 통해 젊은 PS 교수진을 지원하고 바람직한 독립 연구 경력을 확립하는 데 필요한 지원을 제공하는 조치가 시행되어야 한다. 학계는 관심 있는 젊은 의사들이 연구 경로를 추구하도록 장려하고 모든 진로가 번창하도록 강력한 수준의 지원을 제공하는 효율적인 진로를 만들고 감독해야 한다. 마지막으로, 산업 및 기타 원천과의 새롭고 창의적인 파트너십은 생물의학 발전에 자금을 지원하는 데 도움이 될 수 있다.

Academic medicine must also embrace the new ways in which biomedical advances are achieved by fostering team science, big data, and precision medicine, and must establish mechanisms for researchers involved in these initiatives to be recognized. Measures must be implemented to support young PS faculty through strong, viable mentorship programs and the provision of the support necessary to establish desirable independent research careers. Academia must create and oversee efficient career tracks that encourage interested young physicians to pursue a research pathway and provide robust levels of support so that all career pathways will flourish. Finally, new and creative partnerships with industry and other sources could help fund biomedical advances.

 

 


 

Acad Med. 2018 Apr;93(4):565-573. doi: 10.1097/ACM.0000000000001950.

U.S. Physician-Scientist Workforce in the 21st Century: Recommendations to Attract and Sustain the Pipeline

Affiliations collapse

Affiliation

1R.A. Salata is STERIS Endowed Chair of Excellence in Medicine, professor, and chair, Department of Medicine, Case Western Reserve University, University Hospitals Cleveland Medical Center, Cleveland, Ohio. M.W. Geraci is John B. Hickam Professor of Medicine and chair, Department of Medicine, Indiana University School of Medicine, Indianapolis, Indiana. D.C. Rockey is professor and chair, Department of Internal Medicine, Medical University of South Carolina, Charleston, South Carolina. M. Blanchard is professor and chief of medical education, Department of Internal Medicine, Washington University School of Medicine, St. Louis, Missouri. N.J. Brown is professor and chair, Department of Medicine, Vanderbilt University School of Medicine, Nashville, Tennessee. L.J. Cardinal is assistant professor and program director, Internal Medicine Residency Program, Stony Brook University School of Medicine, Stony Brook, New York, and John T. Mather Memorial Hospital, Port Jefferson, New York. M. Garcia is associate professor and associate director, Internal Medicine Residency Program, University of Massachusetts Medical School, Worcester, Massachusetts. M.P. Madaio is professor and chair, Department of Medicine, Medical College of Georgia, Augusta, Georgia. J.D. Marsh is professor and chair, Department of Medicine, University of Arkansas for Medical Science, Little Rock, Arkansas. R.F. Todd III is professor emeritus, Department of Medicine, Baylor College of Medicine, Houston, Texas.

PMID: 28991849

PMCID: PMC5882605

DOI: 10.1097/ACM.0000000000001950

Abstract

The U.S. physician-scientist (PS) workforce is invaluable to the nation's biomedical research effort. It is through biomedical research that certain diseases have been eliminated, cures for others have been discovered, and medical procedures and therapies that save lives have been developed. Yet, the U.S. PS workforce has both declined and aged over the last several years. The resulting decreased inflow and outflow to the PS pipeline renders the system vulnerable to collapsing suddenly as the senior workforce retires. In November 2015, the Alliance for Academic Internal Medicine hosted a consensus conference on the PS workforce to address issues impacting academic medical schools, with input from early-career PSs based on their individual experiences and concerns. One of the goals of the conference was to identify current impediments in attracting and supporting PSs and to develop a new set of recommendations for sustaining the PS workforce in 2016 and beyond. This Perspective reports on the opportunities and factors identified at the conference and presents five recommendations designed to increase entry into the PS pipeline and nine recommendations designed to decrease attrition from the PS workflow.

 

변화 외에는 다른 선택이 없다: COVID-19이후 의학교육의 미래 (Acad Med, 2022)
We Have No Choice but to Transform: The Future of Medical Education After the COVID-19 Pandemic
Catherine R. Lucey, MD, John A. Davis, MD, PhD, and Marianne M. Green, MD

 

 

의학교육은 [우리나라가 필요로 하는 의료 인력], 즉 [우리의 다양한 환자와 지역사회의 건강에 긍정적인 영향을 미칠 수 있도록 집단적으로 준비된 인력]을 교육하기 위해 존재한다. 코로나19 범유행의 혼란은 매년 수만 명의 잘 훈련된 의사를 졸업시키는 인력 파이프라인의 연속성을 위협했다. 그러나 기관 내 및 기관 전반에 걸친 협업 작업, 혁신적인 사고, 위기 관리는 교육 지도자들이 의료 교육의 연속성을 유지할 수 있게 해주었다. 팬데믹 위기의 종말이 다가옴에 따라, 전국의 교육자들은 팬데믹이 미국 의학 교육의 전략적 변곡점 즉, 우리 연구의 기초가 환자의 건강과 건강 관리 요구를 더 잘 해결하기 위해 바뀔 수 있고 변화해야 하는 시기를 촉진했는지 여부를 고려하고 있다. 
Medical education exists to educate the physician workforce that our nation needs: a workforce that is collectively prepared to positively impact the health of our diverse patients and communities. 1 The disruptions of the COVID-19 pandemic threatened the continuity of the workforce pipeline that graduates tens of thousands of well-trained physicians each year. Yet, collaborative work, innovative thinking, and crisis management within and across institutions enabled educational leaders to sustain the continuum of medical education. As the end of the pandemic crisis seems within reach, educators across the country are considering whether the pandemic has catalyzed a strategic inflection point for American medical education—a time when fundamentals of our work can and must change to better address the health and health care needs of our patients. 2,3

경제, 기술, 정치, 사회 규범의 변화든 간에 모든 산업의 위기는 종종 전략적 변곡점을 촉발한다.

  • 위기는 일부 기존 전략의 가치를 강화하는 동시에, 현재 작업의 취약성과 누락된 요소를 조명한다.
  • 위기는 현상에 대한 의존을 불가능하게 만들고, 살아남기 위해 실험과 혁신을 필요로 한다.
  • 위기는 이해관계자들이 한 때 불가능하다고 여겨졌던 것이 실현 가능할 뿐만 아니라 바람직하다는 것을 깨닫게 함으로써 변화에 대한 안일함과 저항을 극복한다. 
  • 본질적으로, 위기는 지도자들에게 변혁 외에는 다른 선택(실패를 빼면)을 주지 않기에 변화를 촉진한다.

Crises in all industries, whether due to changes in economics, technology, politics, or social norms, often precipitate a strategic inflection point. 4 

  • These crises illuminate the vulnerabilities and missing elements of current work at the same time they reinforce the value of some existing strategies.
  • They make reliance on the status quo impossible, necessitating experimentation and innovation to survive.
  • They overcome complacency and resistance to change by helping stakeholders realize that what was once thought to be impossible is not only feasible but also desirable.
  • In essence, crises catalyze change because they present leaders with no choice but to transform—or to fail.


2020년 3월에 선언된 COVID-19 대유행의 첫 해는 의료 교육에 대한 현재의 접근 방식에 대해 축하할 것이 많다는 것을 보여주었다. 개인과 의사팀이 한 작업은 의료교육의 핵심역량 중심의 교육의 효과를 부각시켰다. 의사 및 보건의료전문인력은 남다른 전문직업성을 보여주었다.

  • 의료 자원이 부족한 지역사회로 이동을 자원했다.
  • 문제를 해결하기 위해 과학적 지식을 사용하여 전염병을 예측하고, 바이러스학, 면역학 및 생리학 개념을 활용하여 새로운 치료 전략을 설계했으며, 새로운 치료제를 찾아내고 잘 설계된 임상시험에서 시험하였다.
  • 제한된 자원의 배치에 대한 윤리적 접근 방식을 모색했고, 집에서 환자를 돌볼 수 있는 새로운 치료 모델을 설계하기 위해 시스템 기반 개선에 대한 지식을 사용했다.
  • 전체적으로, 의사들은 모든 지역사회를 위한 교육, 홍보 및 문제 해결에 참여하기 위해 의사소통과 전문 간 팀워크에 대한 기술을 사용했다.

The first year of the COVID-19 pandemic, which was declared in March 2020, illustrated that there is much to celebrate about current approaches to medical education. The work done by individual and teams of physicians highlighted the effectiveness of education centered on medical education’s core competencies. Physicians and other health professionals exhibited extraordinary professionalism.

  • They volunteered to travel to communities with limited health care resources.
  • They used their scientific knowledge to solve problems, applying epidemiologic principles to predict the pandemic; leveraging concepts in virology, immunology, and physiology to design new care strategies; and identifying new therapeutic agents and testing them in well-designed clinical trials.
  • They sought ethical approaches to the deployment of limited resources and used their knowledge of systems-based improvement to design new care models that enabled care of patients in their homes.
  • Throughout, physicians employed skills in communication and interprofessional teamwork to engage in education, outreach, and problem solving for all communities.

 

의료교육 생태계의 단층선
Fault Lines in Medical Education Ecosystem

그러나, 초기의 대유행 위기는 또한 의료 시스템, 의료 교육 기관, 그리고 전문 단체들의 생태계가 우리 나라가 필요로 하는 인력을 준비하는 방법에 있어서 단층을 드러냈다. 개별 의사의 전문성과 헌신에도 불구하고, 전염병은 우리 환자들의 건강을 위협하고 있는 많은 해결되지 않은 문제들을 부각시켰다.

  • 만성질환이라는 Noncommunicable epidemics은 (심장병, 당뇨병, 비만, 물질 사용 장애 등) 전염병 발병률과 사망률을 증가시켰다.
  • 의사의 지리적, 전문적 분포 불량으로 인해 도시 내, 시골 지역, 그리고 아메리카 원주민의 지역사회에 의사 수와 유형이 부족하게 되었다.
  • 건강 및 건강 관리 불균형의 치명적인 엔데믹endemic 상태는 유색인종 커뮤니티에서 질병과 사망률의 극적으로 다른 수준을 초래했다.
  • 명백하게, 올해 우리는 심각한 건강 상태와 도전적인 사회 문제의 상호작용이 많은 지역사회에 재앙적인 결과를 초래하는 [Syndemic의 시대]에 살고 있다는 우리의 이해를 구체화했다. 

However, the initial pandemic crisis also uncovered fault lines in the ways in which the ecosystem of health care systems, medical education institutions, and professional organizations prepare the workforce our nation needs. Despite the expertise and commitment of individual physicians, the pandemic highlighted the many unsolved problems that are threatening the health of our patients

  • Noncommunicable epidemics of chronic diseases, such as heart disease, diabetes, obesity, and substance use disorder, contributed to pandemic morbidity and mortality.
  • Physician geographic and specialty maldistribution left communities in inner cities, rural areas, and on Native American Land with insufficient numbers and types of physicians.
  • The pernicious endemic state of health and health care disparities resulted in dramatically different levels of morbidity and mortality in communities of color.
  • With clarity, this year crystallized our understanding that we are living in an era of syndemic conditions, where the interaction of serious health conditions with challenging social problems leads to catastrophic outcomes for many communities. 5,6

대유행은 의학 교육의 재설계에 대한 요구가 증가하는 20년 말에서 일어났다. 이러한 권고사항 중 많은 수가 대유행 대응 및 다음과 같은 단층선과 관련된 전략을 제안했다.

  • 더 큰 사회적 책무에 초점을 맞춥니다. 
  • 사회, 행동, 인구 및 데이터 과학을 포함하는 기초 과학의 범위 확장 
  • 핵심 임상 기술로서 시스템 개선을 채택한다. 
  • 보다 공정하고 효과적인 평가 전략과 함께 역량 기반, 시간 변동 교육의 구현 
  • 의사-환자 관계를 넘어선 관계를 통합하기 위한 프로페셔널리즘의 핵심 원칙의 재고 
  • 전문직 간 교육의 중시prioritization
  • 학부 및 대학원 의학 교육(UME 및 GME) 간 이행 재설계
  • 교육 프로그램의 모든 측면에서 다양성, 형평성, 포함의 달성. 

The pandemic occurred at the end of 2 decades of increasing calls for redesign of medical education. 5,6 Many of these recommendations proposed strategies relevant to the pandemic response and these fault lines:

  • a focus on greater social accountability;
  • an expansion of the canon of basic sciences to include social, behavioral, population, and data sciences;
  • adoption of systems improvement as a core clinical skill;
  • implementation of competency-based, time-variable training along with more equitable and effective assessment strategies;
  • reconsideration of core tenets of professionalism to incorporate relationships beyond the doctor–patient relationship;
  • prioritization of interprofessional education;
  • redesign of the transition between undergraduate and graduate medical education (UME and GME);
  • and attainment of diversity, equity, and inclusion in all aspects of the educational program. 7–12

그러나, 변화에 대한 명확하고, 정의되고, 국가적으로 받아들여지는 긴급성 없이, 이러한 권고된 개혁 전략의 채택은 산발적이었고, 의료 교육의 변화는 점진적으로 이루어졌다. 그러한 비전이 없는 경우, 변화의 이익은 변화의 위험보다 덜 설득력 있는 것으로 간주된다.

However, without a clear, defined, nationally accepted urgency to change, the uptake of these recommended reform strategies has been sporadic and change in medical education has been incremental. In the absence of such a vision, the benefits of change are viewed as less compelling than the risks of change.

변화를 촉진하는 긴급성
Urgency Catalyzes Change

대유행은 UME와 GME의 확립된 시스템을 위협하는 희소성, 위험성 및 불확실성의 요소를 도입했다(표 1 참조). 그 결과 의료 교육에 대한 중단은 위에서 설명한 불완전하게 채택된 많은 개혁의 필요성을 검증했을 뿐만 아니라 변화 저항을 초월하는 긴급성의 힘을 보여주었다. 전체적으로, 의과대학, 레지던트 프로그램, 학술 건강 시스템, 국가 면허 및 인증 기관, 전문 기관들은 만약 그들이 바뀌지 않는다면, 수백만 명의 사람들이 죽을 것이라고 인식했다. 이러한 긴박감이 이 생태계의 모든 이해 관계자들을 변화시켰고, 그들은 함께 거의 하룻밤 사이에 환경을 변화시켰습니다. 

The pandemic introduced elements of scarcity, risk, and uncertainty that threatened the established systems of UME and GME (see Table 1). The resulting disruptions to medical education not only validated the need for many of the incompletely adopted reforms outlined above but also demonstrated the power of urgency to transcend change resistance. Collectively, medical schools, residency programs, academic health systems, national licensing and accreditation agencies, and professional organizations recognized that, if they did not change, millions of people would die. It was this sense of urgency that catalyzed all the stakeholders in this ecosystem to change, and together they transformed the landscape almost overnight. 

 

리더십 팀은 의료 교육의 각 단계에서 높은 기술을 가진 의사들로 구성된 코호트를 반드시 졸업시키기 위한 작업에 착수하면서도, 유행병에도 불구하고 기준을 낮추지 않았다. 그들은 주요 교육 요소를 보호하기 위해 전략을 세웠고 확립된 전략을 더 이상 사용할 수 없을 때 작업을 지속할 수 있는 새로운 접근 방식을 설계하도록 혁신했다(표 2 참조).  

Leadership teams embarked on work to graduate a cohort of highly skilled physicians from each phase of medical education, without fail and without lowering standards despite the pandemic disruptions. They strategized to protect key educational elements and innovated to design novel approaches to sustain their work when established strategies were no longer available (see Table 2). 13

 

전염병에도 불구하고, 학생과 교육생의 수업을 졸업할 수 있는 프로그램의 능력을 유지하기 위해 사용된 실험은, [교실과 임상 교육에 대한 다양한 접근 방식을 사용하여 성공할 수 있다는 것]을 보여주었다. [질병의 분자적 기반]뿐만 아니라, [환자와 지역사회가 건강과 질병을 경험하는 맥락]도 다루어야 하는 필요성이 명확했기에, [의사가 Syndemic 조건을 인식하고 협력할 수 있도록 준비하는 교육 전략]의 중요성을 조명했다. 아마도 가장 중요한 것은 [바이러스가 지역사회, 주 경계, 국경을 넘어 대혼란을 일으킨 것]처럼, 모든 사람으로 하여금 [의료 교육 전략과 개혁도 제도적 및 프로그램 경계를 넘어야 한다는 것]을 상기시켰다는 점이다.
The experimentation that was employed to sustain programs’ ability to graduate classes of students and trainees despite the pandemic showed that success can be achieved using many different approaches to classroom and clinical education. The clarity of the need to address not only the molecular basis of disease but also the context in which patients and their communities experience health and illness illuminated the importance of an educational strategy that prepares physicians to recognize and collaborate to tackle syndemic conditions. Perhaps most importantly, a virus that wreaked havoc across communities, state lines, and national borders reminded all that medical education strategies and reform must also cross institutional and program borders.

의료 교육의 미래에 대한 비전은 [재난과 위기관리 과정]과 함께, 다음 유행병에 대비하기 위한 의사 인력 준비의 필요성에 초점을 맞출 수 있다. 그러나 [성공적인 의학교육 전략의 스트레스 테스트]는 [위기가 닥쳐서 개인, 기관, 조직에 의한 짧은 기간 동안 특별한 일을 해내기를 요구할 때조차 Workforce가 최상의 기능을 하게 만드는 방법]이 되어서는 안 된다. 그보다, [의학교육이 환자와 지역사회를 위해 최적의 인력을 생산했는지에 대한 스트레스 테스트]는 우리가 권력과 특권에 상관없이 매일, 모든 지역사회에서, 모든 환자에게 고품질의, 공평한, 환자 중심의 치료를 얼마나 안정적으로 제공하는가 하는 것이다.
Visioning for the future of medical education could focus simply on the need to prepare the physician workforce to be ready for the next pandemic, with coursework in disaster and crisis management. But the stress test of a successful medical education strategy should not be how the workforce functions at its best, when a crisis calls for a short period of extraordinary work by individuals, institutions, and organizations. Instead, the stress test of whether medical education has produced the optimum workforce for our patients and communities is how reliably we deliver high-quality, equitable, patient-centered care every day, in every community, to every patient, regardless of power or privilege.

대유행의 종말이 다가옴에 따라, 사람들은 대유행 기간 동안 의료 교육의 변화를 주도했던 긴박감이 사라졌다고 생각할 수 있다. 만약 우리가 [만성 질환의 신데믹 상황, 부정적인 사회적 건강결정요인, 건강 관리의 차이에서 기인하는 지속적인 질병과 사망률]에 초점을 맞춘다면 지금의 긴박성은 계속될 수 있다. 만약 우리가 이러한 죽음을 막기를 원한다면, 우리는 의료 교육 생태계 전반에 걸쳐 변화할 수밖에 없습니다.

As the end of the pandemic looms, one might assume that the sense of urgency that drove transformational change in medical education during the pandemic is lost. That urgency can continue if we focus on the ongoing morbidity and mortality attributable to the syndemic conditions of chronic diseases, adverse social determinants of health, health care disparities, and more. If we hope to prevent these deaths, we have no choice but to transform—throughout the ecosystem of medical education.

미국 의학교육의 변혁적 비전
A Transformative Vision for Medical Education in the United States

변혁은 aspirational하고 inspirational한 의학교육의 미래에 대한 비전을 필요로 한다. 즉, 의학교육뿐만 아니라 직업과 더 넓은 사회에서 이해 관계자들을 고무시킬 수 있는 개인을 위한 문샷이다. 우리는 다음과 같은 비전과 약속을 제안합니다.
Transformation requires a vision for the future of medical education that is aspirational and inspirational: a moonshot on behalf of personkind that can galvanize stakeholders not only in medical education but also in the profession and broader society. We propose the following vision and promise.

우리의 비전
Our vision

2020년 COVID-19 대유행의 여파로, 미국의 의료 교육 생태계는 모든 공동체의 모든 사람들이, 그들이 필요로 하는 시스템에서, 그들이 원하는 의사들에게 접근할 수 있도록 보장하여, 그들이 예방 가능한 질병과 죽음으로부터 자유롭고, 건강하고, 충실한 삶을 살 수 있도록 하기 위해 노력할 것을 약속한다.
In the wake of the 2020 COVID-19 pandemic, the U.S. medical education ecosystem commits to working to ensure that every person in every community has access to the physicians that they want in the systems they need so that they may live long, healthy, and fulfilling lives, free of preventable illness and death.

우리의 약속
Our promise

우리는 [의학교육의 연속적 변혁]의 10년을 시작할 것입니다.

  • 의료 교육 및 프로그램이 존재하는 지역사회에 대한 모든 이해당사자의 지원을 받고 관여한다. 
  • 우수성, 사회적 책임, 사회적 정의, 지속적인 개선 및 학습자 복지의 원칙에 의해 인도됩니다.

We will embark on a decade of transformation of the continuum of medical education;

  • supported by and involving all stakeholders in medical education as well as the communities in which our programs exist; and
  • guided by principles of excellence, social accountability, social justice, continuous improvement, and learner well-being.

 

혁신을 위한 10년 만기 10개 시점 플랫폼
A 10-Year, 10-Point Platform for Transformation

 

이 비전을 실현하기 위해, 우리는 향후 10년 내에 달성해야 하는 의료 교육의 연속성에 대한 10가지 목표를 제안한다(목록 1 참조). 이러한 목표는 전염병에 대응하기 위해 교육자가 수행한 실험에 의해 정보를 얻고, 의료 교육의 효과적인 전략에 대한 확립된 문헌에 의해 뒷받침된, 변혁적 비전transformative vision을 달성할 인력을 구축하는 우리의 능력을 강화한다. 성공을 위해서는, [의료 교육의 연속체에 걸쳐 동기화되고 시너지 효과를 발휘하는 행동]이 필요할 뿐만 아니라, 개별 프로그램과 학교에서부터 의료 교육과 의료계를 대표하는 국가 조직에 이르는 [통제 지점control points에서의 조정된 노력]이 필요하다. 각 업무 영역에는 일반적으로 성공적인 전략 계획에서 발견되는 모든 요소, 즉 거버넌스, 책임 구조, 메트릭스, 리소스, 커뮤니케이션 전략 및 이해관계자 입력과 같은 포괄적인 접근 방식이 필요합니다.

To realize this vision, we propose 10 goals for the continuum of medical education that must be accomplished in the next decade (see List 1). These goals strengthen our ability to build the workforce that will achieve the transformational vision, informed by experiments conducted by educators to respond to the pandemic and bolstered by the established literature on effective strategies for medical education. Success will require synchronized and synergistic action across the continuum of medical education, as well as coordinated efforts at control points that range from individual programs and schools to national organizations representing medical education and the medical profession. Each area of work requires a comprehensive approach, with all elements typically found in successful strategic plans: governance, accountability structures, metrics, resources, communication strategies, and stakeholder input.

목표 1: 전국의 모든 지역사회에서 보건 및 의료 개선을 위해 헌신하는 성공적인 노동력을 위한 국가적 비전 채택
Goal 1: Adopt a national vision for the successful workforce, committed to improving health and health care in all communities across the country

원칙:
Principle:

현재와 미래의 의료진은 국가 및 세계 보건 위협이 생물학, 행동, 사회 시스템 및 환경 조건의 복잡한 상호 작용에서 비롯된다는 것을 이해하도록 교육해야 한다. 그들은 만성적인 증후군 문제를 해결하고 주기적인 유행병에 대응하기 위해 우리의 다양한 지역사회를 지원하기 위해 집단적으로 일하는 데 필요한 지식, 성향 및 기술을 준비해야 한다. 
The current and future physician workforces should be educated to understand that national and global health threats result from a complex interplay of biology, behavior, social systems, and environmental conditions. They must be prepared with the knowledge, dispositions, and skills needed to work collectively in support of our diverse communities to solve chronic syndemic problems as well as to respond to periodic pandemics. 5

건강에 대한 이러한 복잡한 도전에 대한 해결책을 이해, 제안 및 제정하기 위해, 의사 인력들은 다양한 과학 및 학술 분야의 엄청난 발전을 사용하고 기여할 준비가 되어 있어야 한다. 지적으로, 그들은 충실함과 동정심을 가지고 오늘날의 지식을 적용할 수 있을 뿐만 아니라, 떠오르는 애매한 문제들을 통해 빠르게 추론할 수 있어야 한다. 그들은 너무 복잡하고 너무 큰 것으로 오랫동안 무시되어 온 건강 관리 격차와 같은 사악한 문제를 찾고 해결해야 하는 필요성을 받아들여야 한다.
To make sense of, propose, and enact solutions to these complex challenges to health, the physician workforce must be prepared to use and contribute to the tremendous advances in a diverse set of scientific and scholarly disciplines. Intellectually, they must be capable not only of applying today’s knowledge with fidelity and compassion but also of rapidly reasoning through emerging ambiguous problems. They must accept the imperative to seek out and address the wicked problems, like health care disparities, that have long been neglected as too complex and too large.

학생부터 전공의, 교수진, 의사까지, 이상적인 유행 후 노동력은 모든 정체성과 관련하여 다양해야 하며 문화적 겸손을 가지고 자신과 다른 사람들에게 접근하는 데 능숙해야 한다. 노동력은 사람과 인구의 건강을 개선하기 위해 필요한 작업에 참여할 수 있는 특정한 마음 습관을 배양하도록 교육되어야 한다(표 3 참조). 그들은 다면적인 원인에 대해 이해하고 다면적인 해결책을 제안하고 실험하기 위해 보건의료전문가들 사이에서 집단적으로 일할 수 있어야 한다. 그들은 기꺼이 사회 정의, 엄격한 과학, 그리고 건강, 의료 서비스 전달 및 의료 교육을 위한 강력하고 신뢰할 수 있는 공평한 시스템의 재정, 설계 및 지속적인 개선을 옹호해야 한다. 마지막으로, 그들은 우리의 일상 업무에 존재하며 위기 상황에서 증폭될 수 있는 의무에 대한 요구를 수용하는 데 동의해야 한다.

The ideal postpandemic workforce, from students to residents to faculty and practicing physicians, must be diverse with regard to all identities and skilled at approaching people different than themselves with cultural humility. That workforce must be educated to cultivate specific habits of mind that enable them to engage in the needed work to improve health for people and populations (see Table 3). They must be able to work collectively within and across health professions to understand multifaceted causes as well as propose and experiment with multifaceted solutions. They must be willing to advocate for social justice; rigorous science; and the financing, design, and continuous improvement of robust and reliably equitable systems for health, health care delivery, and medical education. Finally, they must agree to accept the call to duty that exists in our everyday work and may be amplified in times of crisis.

의사들이 개별적으로 그리고 집단적으로 팬데믹 위기를 해결하기 위해 가정하고 신데믹 컨디션을 해결하기 위해 가정해야 하는 역할의 범위는 CanMEDs 역량에 의해 잘 요약된다.  모든 의사가 모든 의료 분야에서 기본 역량을 개발하고 특정 분야의 전문지식을 개발하듯이, 모든 의사는 일부에 대한 전문지식을 갖춘 이러한 모든 역할에 대한 기본 전문지식을 개발해야 한다. 의사-과학자의 경로는 강화되고 다양화되어야 한다. 의사-공공보건 전문가, 의사-커뮤니티 파트너십 전문가, 의사-반인종주의 전문가가 문제를 분석하고 해결할 수 있도록 유사한 번역 역할을 고안할 수 있다. 보건 및 의료 문제에 대한 보다 통합적이고 체계적인 해결책에 기여하는 비생의학 과학 분야에 대한 깊은 이해를 통합한다.

The breadth of roles that physicians individually and collectively assumed to address the pandemic crisis and must assume to address syndemic conditions is well summarized by the CanMEDS competencies. 14 Just as all physicians develop a basic competency in all medical fields and expertise in specific disciplines, all physicians must develop basic expertise in all of these roles with expertise in some. The physician–scientist pathway must be strengthened and diversified. 15,16 Similar translational roles could be devised for physician–public health experts, physician–community partnership experts, or physician–antiracism experts to analyze and solve problems incorporating deep understanding of nonbiomedical science disciplines that contribute to more integrative and systematic solutions to health and health care challenges.

[미래의 의사가 누구인가에 대한 명확한 비전]과 함께, 우리는 또한 [현재 의사 인력이 차세대 의사를 이 비전의 일부로 교육할 준비가 되어 있는지]를 확실히 해야 하며, 그렇게 하기 위해서는, [현재의 의사 인력]이 이러한 중요한 노력에 대비하기 위해 [지속적인 교육과 개발을 받을 수 있도록] 해야 한다. 나머지 목표 각각에서, 우리는 의료 교육 프로그램의 교육 우선 순위뿐만 아니라 우리의 개업 의사와 건강 관리 시스템에서 이러한 기술의 육성을 고려하는 것이 필수적이다. 그리고 교육을 통해 아래 필요한 변화를 이끌어내기 위해 그들이 필요로 하는 기술을 배양하기 위해 우리가 취해야 할 조치입니다. 

In conjunction with this clear vision of who the physician of tomorrow should be, we are likewise called to ensure that our current physician workforce is ready to educate the next generation of physicians as part of this vision, and to do so, that they receive ongoing education and development to prepare them for this critical endeavor. In each of the remaining goals, it is imperative that we consider not simply the educational priorities of our medical education programs but also the fostering of these skills in our practicing physicians and health care systems, and the steps we must take to cultivate the skills they need to bring about the transformation needed below through education.

목표 2: 의료 및 의료 교육에서 [구조적 인종차별의 결과 및 징후]를 적극적으로 찾고 제거함으로써 의료 교육 및 의료 보건 분야에서 사회적 정의를 실현합니다.
Goal 2: Achieve social justice in medical education and health care across the country by actively seeking out and eliminating the consequences and manifestations of structural racism in medicine and medical education

원칙:
Principle:

의료계는 모든 지역사회의 모든 환자들이 다음과 같은 확신을 가질 수 있도록 소외된 지역사회의 건강과 건강관리를 위협하는 구조적, 대인관계적 인종차별을 다룰 도덕적, 전문적인 책임이 있다.

  • 의료 시스템은 [의료 격차를 찾아 제거]하도록 설계된다.
  • 모든 의사는 의료 및 의료 교육에서 [구조적 인종차별을 다루도록 설계된 커리큘럼을 교육]을 받았으며, [문화적 겸손함]으로 의사-환자 관계에 전념한다.
  • 의과대학은 [다양한 모집단이 번영할 수 있는 기회를 증가시키는 전략]을 사용하여, 의사가 기여하는 [모든 임무 영역과 모든 전문 분야를 다양의 다양성을 높이는] 데 전념하고 있다.

The medical profession has a moral and professional responsibility to address the structural and interpersonal racism that threatens the health and health care of marginalized communities with the same rigor and commitment that it has addressed patient safety and quality so that all patients in all communities have confidence that:

  • health systems are designed to seek out and eliminate health care disparities;
  • all physicians have been educated in a curriculum designed to address structural racism in medicine and medical education and are committed to engaging in doctor-patient relationships with cultural humility; and
  • medical schools recognize the imperative of and are committed to diversifying all mission areas and all specialties in which physicians contribute, using strategies that increase the opportunity for diverse populations to thrive.

지금까지 문헌에는 [구조적 인종차별]이 열악한 건강과 건강 관리 성과에 영향을 미치며, 소수 공동체 학생들이 의과대학에서의 기회가 어떻게 제한되는지를 조심스럽게 문서화했다. 

The literature has carefully documented the many ways in which structural racism contributes to poor health and health care outcomes and limits the opportunity for students from minority communities to enter, thrive once within, and successfully pursue the most competitive careers following medical school. 17–19

[사회 정의를 달성하는 데 필요한 계획의 포괄성]은 Frye 외 연구진에 의해 요약된다. "인종차별을 없애기 위해서는 사고, 믿음, 행동, 그리고 존재의 혁명만이 문제를 해결할 것입니다."  유색인종에 대한 의료 착취와 실험의 역사, 생물학적인 구조로서의 인종에 대한 잘못된 가르침, 유색인종을 의료계에서 배제함으로써 초래된 피해를 공개적으로 인정하고 복구하는 데 전념해야 한다.

The comprehensiveness of the plan needed to achieve social justice is summarized by Frye et al: “To eliminate racism, nothing short of a revolution in thinking, believing, acting, and being will solve the problem.” 20 The profession must publicly acknowledge and commit to repairing the damage that has been done by the history of medical exploitation and experimentation on people of color, false teachings about race as a biological construct, and exclusion of people of color from the medical profession.

이 목표를 달성하기 위해서는 [의료 교육 생태계 전반에 걸친 포괄적인 전략]이 필요하며, 여기에는 문화 변화가 필수적이다. (보건의료 분야에서 일하고, 배우고, 돌보고, 발견하는) 모든 사람들은 [최고의 과학, 의학, 교육으로 우리 공동체를 위해 봉사하는 능력]은 [사회 정의를 성취하기 위해서는 헌신하는 다양한 노동력]을 필요로 한다는 것을 받아들여야 한다. 의료 시스템과 의료 교육의 모든 정책과 절차는 역사적으로 의학에 의해 소외된 집단의 사람들에게 미치는 차등적 영향을 검사해야 한다. 미국 의과대학의 문화와 관행을 정하는 의과대학 입학전략, 레지던트 후보자의 선발과 랭킹, 교수채용이 재설계돼야 다양성 달성이 가속화될 수 있다. 학생과 전공의에 대한 모든 평가 프로세스, 교직원을 위한 승진 프로세스, 리더십 선발 프로세스도 마찬가지로 편향에 대해 평가되어야 하며, 형평성과 다양성에 최적화되어야 한다. 

Achieving this goal requires a comprehensive strategy across the entirety of the medical education ecosystem with culture change as an essential element. All people who work, learn, care, and discover in the health professions must accept that our ability to serve our communities with the best science, medicine, and education demands a diverse workforce, with all committed to achieving social justice. All policies and procedures in health care systems and medical education must be examined for differential impact on people from groups that have been historically marginalized by medicine. Admissions strategies to medical school, selection and ranking of residency candidates, and selection of faculty who set the culture and practices of U.S. medical schools must be redesigned to accelerate achievement of diversity. All assessment processes for students and residents, advancement processes for faculty, and selection processes for leadership must be similarly evaluated for bias and optimized for equity and diversity.

교육 연속체에 걸쳐, 커리큘럼은 단지 유색인종만이 아니라, 모든 의사가 의료에서의 인종차별의 역사와 보건과 의료에 대한 구조적 인종차별의 파괴적인 결과를 이해하고 구조적 역량과 반인종차별에 대한 기술로 준비하도록 보장하는 내용을 통합해야 한다. 교수진은 신데믹의 개념을 통합하기 위해 기존 강의를 재설계하고, 생물학적 구인으로서 인종을 제거하며, 모든 인구에게 존중되는 언어와 사례를 채택하도록 교육되어야 한다. 국가 차원에서 인가 기관에는 책임 전략이 포함되어야 한다. 또한, 의과대학은 우수성의 핵심 척도로서 [형평성과 포용의 달성을 우선시]하지 않는다면 [어떤 전국적 종합 랭킹 전략에 참여하는 것을 거부]해야 한다.

Curricula across the education continuum must incorporate content that ensures that all physicians, not just those of color, understand the history of racism in medicine and the devastating consequences of structural racism on health and health care and are prepared with skills in structural competency and antiracism. Faculty must be educated to redesign existing lectures to incorporate the concept of syndemics, to eliminate race as a biological construct, and to employ language and cases that are respectful to all populations. At the national level, accountability strategies must be imbedded in accreditation agencies. Furthermore, medical schools should decline to participate in any national summative ranking strategy that does not prioritize achievement of equity and inclusion as a core measure of excellence.

목표 3: 현재와 미래의 모든 의료진이 질병과 질병으로 고통받는 현상의 원인을 해결하는 데 필요한 다양한 역할과 책임을 수용하도록 커리큘럼을 설계합니다.
Goal 3: Design curricula to prepare all in the physician workforce, present and future, to embrace the breadth of roles and responsibilities needed to address syndemic causes of suffering from illness and disease

원칙:
Principle:

의학교육의 근간을 이루는 기초과학과 임상기술의 규범은 [의사가 해결해야 할 문제의 유형]과, 그들이 [사용할 수 있어야 하는 도구]에 기초하여 재정의되어야 한다.
The canon of basic sciences and clinical skills that form the backbone of medical education must be redefined based on the types of problems physicians will be called upon to solve and the tools that they must be able to use.

대유행은 모든 의사들이 전통적인 생물의학 과학을 넘어서는 복잡한 질병의 메커니즘을 이해할 수 있어야 한다는 것을 보여주었다. 이를 위해서는 학교와 프로그램이 더 광범위한 학문 분야를 포함하기 위해 필요한 "기초과학"을 재인식해야 한다(표 4 참조). 사실을 가르치고 평가하는 것에서 벗어나, [각 분야의 문턱 개념]으로 초점을 이동하면 커리큘럼의 공간 부족에 대한 우려를 최소화할 수 있다. 모든 의사에게 요구되는 기준 역량은 각기 다른 과학 분야가 자신의 작업과 관련된 새로운 발견을 읽고 비판적으로 평가할 수 있도록 질문을 조사하는 방법을 이해하는 데 필요한 역량으로 정의할 수 있다. 다양한 영역에서 보다 발전된 역량은 번역 및 발견 기반 의사의 역할과 일치합니다. 국가 면허 시험은, 검색 가능한 사실보다는, [현대의 문제를 해결하고 개념 숙달을 테스트]하는 데 필요한 지식체에 우선 순위를 부여하는 내용으로 레거시 문제를 재설계할 준비를 해야 한다.

The pandemic illustrated that all physicians must be able to understand complex mechanisms of disease that extend beyond traditional biomedical sciences. This requires schools and programs to reconceptualize the required “basic sciences” to include a broader set of scholarly disciplines (see Table 4). Shifting a focus away from teaching and assessing facts and toward a focus on threshold concepts of each of these disciplines can minimize concerns about lack of space in the curriculum. Baseline competency required of all physicians can be defined as the competency needed to understand how different scientific disciplines investigate questions so that they can read and critically evaluate new discoveries relevant to their work. More advanced competencies in different areas fit with the role of translational and discovery-based physicians. National licensing exams must be prepared to redesign legacy questions with content that gives equal priority to the bodies of knowledge needed to address contemporary problems and tests mastery of concepts rather than searchable facts.

전염병 대란은 또한 임상 기술 훈련이 어떻게 진화해야 하는지에 대한 통찰력을 제공했다. =원격 의료와 원격 전자 모니터링]의 빠른 보급은 [모든 의사에게 일상화되어야 하는 새로운 기술 세트]와 [구현의 잠재적 함정]을 드러내었다. 생물학적 구성체로서 인종을 부적절하게 사용하는 방법이 팬데믹에서 볼 수 있는 건강 관리 격차의 유형에 기여할 수 있는 방법의 노출은 인종, 인종 차별 및 불리한 사회적 요인이 임상 프레젠테이션, 임상 추론 연습에 적절하게 통합되는 방법을 재설계해야 할 것이다. 환자 중심의 진료기록카드입니다.

The pandemic disruptions also provided insights into how clinical skills training must evolve. The rapid uptake of telemedicine and remote electronic monitoring introduces a new set of skills that should become routine for all physicians as well as potential pitfalls in their implementation. 21,22 The exposure of ways in which the inappropriate use of race as a biological construct can contribute to the types of health care disparities seen in the pandemic will require redesign of the way race, racism, and adverse social factors are respectfully incorporated into clinical presentations, clinical reasoning exercises, and the patient-oriented medical record. 23 

[컴퓨터 보조 진단 추론]의 유망한 미래를 충족시키려면, 의사들은 이러한 시스템이 해결책을 제안하는 방법과 컴퓨터 생성 편향 요소가 어디에서 어떻게 나타날 수 있는지 가르쳐야 한다. 마지막으로, "모든 사람의 일손을 모을 필요"를 요구하는 전염병은, 훈련의 각 단계에서, 모든 의사에게 임상 기술 지침의 핵심 측면으로서, 전문 간 협업 관리와 팀 기반 시스템 개선의 중요성을 입증했다. 

To fulfill the promise of computer-assisted diagnostic reasoning, physicians must be taught how these systems propose solutions and where and how elements of computer-generated bias may appear. Finally, the pandemic, with its “all hands on deck” needs, demonstrated the importance of interprofessional collaborative care and team-based systems improvement as core aspects of clinical skills instruction for all physicians at each stage of training. 7,24,25

목표 4: 의료 교육 프로그램을 지역 사회 및 정부와 협력하여 이러한 문제에 교육 프로그램을 집중함으로써 전국 지역사회에서 질병과 사망의 가장 긴급한 원인을 식별하고 해결한다.
Goal 4: Identify and address the most pressing causes of morbidity and mortality in communities across the nation by challenging medical education programs to partner with local communities and governments to focus educational programs on these issues

원칙:
Principle:

각 의과대학과 레지던트 프로그램은 [커리큘럼과 학습 경험을 설계하는 데 있어 가지고 있는 자유도latitude]를 사용하여, 그들 자신이 속한 지역의 건강 및 건강 관리 과제와 관련된 내용을 우선시하고 또한 그들 기관의 고유한 사명을 발전시켜야 한다.
Each medical school and residency program should use the latitude they have in designing curricula and learning experiences to prioritize content that is relevant to the health and health care challenges in their communities, while also advancing the unique mission of their institution.

감염의 곡선을 평평하게 만들어야 하는 공중 보건 위기 상황에서, 학술 보건 시스템은 의료 및 사회적으로 서비스가 부족한 지역사회에 의료 서비스를 제공하기 위해 교수진, 학생 자원봉사자, 지역사회 지도자들과 함께 열심히 일했다. 의료 교육에 대한 새로운 비전에서, 개별 기관은 유행병 준비의 필요성뿐만 아니라, [지역사회 내에서 진행 중인 질병과 사망률의 미해결 원인]을 해결하기 위해, [커리큘럼과 학생 학습 경험을 설계할 책임]을 수락할 것이다. 그렇게 하려면 단방향 참여 활동에서 상호적이고 존중적인 파트너십으로 이동하기 위해 지역사회 서비스 학습 경험에 대한 의과대학 접근방식을 재설계해야 한다.  

In the setting of a public health crisis that required flattening the curve of infections, academic health systems worked intensely with faculty and student volunteers and community leaders to bring health care to medically and socially underserved communities. In the new vision for medical education, individual institutions would accept the responsibility to design their curricula and student learning experiences to address the need for pandemic preparation as well as the ongoing, unsolved causes of morbidity and mortality within its community. Doing so would require redesigning medical school approaches to community service-learning experiences to move from unidirectional engagement activities to reciprocal and respectful partnerships. 26

목표 5: 의료 교육 전반에 걸쳐 프로그램 평가 전략의 표준을 채택하여 성장 마인드셋을 촉진하고 평생 학습 의사를 지원하며 학습 환경의 형평성을 촉진합니다.
Goal 5: Facilitate growth mindsets and support lifelong learning physicians—and promote equity in learning environments—by adopting a standard of programmatic assessment strategies across the continuum of medical education

원칙:
Principle:

평가의 형평성은 학습자가 평가되는 학습 환경과 학습자가 접하는 교수와의 상호작용이 [경쟁보다는 성장을 촉진하도록 설계]되고, 모든 학습자가 [형평성에 초점을 맞춘 전략]에 기초하여 평가되고, 점수를 받고, 진급하며, [미래 성공을 예측하는 성취에 대한 입증]에 기반하여 인정받고 진입할 수 있는 기회를 의미한다. 
Equity in assessment means that the learning environments in which our learners are assessed and the faculty interactions that learners have are designed to foster growth rather than competitiveness; that all learners are assessed, graded, and advanced based on strategies that focus on equity; and that the opportunity to be recognized and to enter into desirable careers is based on a learner’s demonstration of achievements that predict future success in the field of medicine. 27

평가는 다음과 같이 사용됩니다.

  • 학습을 가이드하고,
  • 학습자를 더 발전된 역량에 맞게 코치하고,
  • 주어진 학습자가 환자 치료와 학습에서 더 많은 독립성을 가질 준비가 되었을 때를 결정하고,
  • 장래의 직업을 위해 졸업생을 선발할 때

학습자는 여러 기관에 걸쳐 이동하기에, [공정하고, 성장에 초점을 맞춘 평가 전략]은 [경계를 초월해야] 하며, 따라서 의학교육 생태계의 병혁을 위해서는 [평가에 대한 국가적 접근법]이 필수적이다.

Assessment is used to

  • guide learning,
  • coach learners to more advanced competencies,
  • decide on when a given learner is ready for more independence in patient care and learning, and
  • select graduates for future careers.

With the movement of learners across many different institutions, equitable and growth-focused assessment strategies must transcend boundaries and thus, a national approach to assessment is essential to a transformed medical education ecosystem.

GME, CME, MOC는 현재 기준 기반 합격/불합격 평가 전략이 사용됩니다. 그럼에도 불구하고 UME 기관들은 규범적 평가 전략(예: 최고 등급)을 고수하고 더 세분화된 등급(예: 우등, 합격, 불합격)을 사용한다. 이러한 등급 매김과 순위 매김은 학습자들 사이의 [성장 사고방식]보다는, 성과 양성, 학습자 스트레스 증가, 팀워크 감소, 교육 및 직업 기회의 불평등 등 몇 가지 부정적인 결과와 관련이 있다. 팬데믹은 [일부 학생에게서 우수성을 식별하는 것]보다 [모든 의사에서 역량을 식별discerning하는 것에 초점을 맞추는 것]의 중요성을 강조했고, 세분화된 등급 전략 유지의 장애물이 되었다. 이러한 통찰력과 혼란은 순위에 대한 평가로 인해 야기되는 해악과 한계를 인식하고 대신 야심차고 실무적인 의사들의 평가를 위한 국가 접근 방식으로 프로그램 평가를 채택할 수 있는 기회를 제공한다.

Current practices in GME, Continuing Medical Education, and maintenance of certification employ criterion-based, pass/fail assessment strategies. Despite this, UME institutions have remained adherent to normative assessment strategies (e.g., top of the class) and use more granular grades (e.g., honors, pass, fail). This grading and ranking approach has been associated with several adverse consequences: fostering a performance rather than growth mindset among learners, increasing learner stress, decreasing teamwork, and inequities in educational and career opportunities. 28–30 The pandemic simultaneously emphasized the importance of focusing on discerning competency in all physicians rather than identifying excellence in some and presented barriers to sustaining granular grading strategies. These insights and disruptions present an opportunity to recognize the limitations of and harm caused by assessment for ranking and instead adopt programmatic assessment as the national approach for assessment of aspiring and practicing physicians.

프로그램적 평가는 규범적 결정이 아닌 기준 기반 결정을 지원하기 위해 많은 출처로부터 정성적 및 정량적 데이터를 수집한다. 이러한 데이터를 활용하여 학습자에게 빈번한 피드백을 제공하므로, 고부담 총괄 사건(학습의 평가)에 앞서 개선(학습을 위한 평가)을 위한 코칭이 가능하다. 

프로그램 평가는 단일 교수진이 역량을 결정하거나 해당 역량을 문서화하는 단일 평가 도구에 의존하지 않습니다. 대신, 학습자의 실제 능력에 대한 그림을 제공하기 위해 평가가 수행된 상황에 대한 여러 스냅샷 (예: 보건 전문가 팀의 모든 구성원의 의견, 필기 작업, 시험 점수, 동료 평가 검토)을 통합합니다.  

Programmatic assessment collects qualitative and quantitative data from many sources to support criterion-based rather than normative decisions. It uses these data to provide frequent feedback to learners, enabling coaching for improvement (assessment for learning) before the high-stakes summative event (assessment of learning). 31 

Programmatic assessment does not rely on a single faculty member to decide on competency or a single assessment tool to document that competency. Instead, it aggregates multiple snapshots of performance (e.g., input from all members of the health professions team; review of written work, exam scores, peer evaluations) and a description of the context in which the assessment took place to provide a picture of the learner’s true abilities 

프로그램 평가에는 많은 이점이 있습니다. 고부담의 총괄적 피드백에 앞서, 여러 가지의 형성적 피드백을 제공하는 평가 전략은, 피드백을 찾고 사용하고자 하는 학습자의 의지를 높이고, Grading에 대한 불안감을 감소시킨다. 여러 평가자의 피드백의 여러 인스턴스를 사용하면 개별 또는 특정 평가 도구의 개별 학습자에 대한 편견이 미치는 영향을 최소화할 수 있다. Normative한 전략보다는 Crietrion 전략, 더 세분화된 등급보다는 Pass/Fail이 [관찰된 성능의 작은 차이가 획득 보상의 큰 차이로 이어질 때 발생하는 불평등]을 완화할 것이다.  마지막으로, 포괄적인 데이터 합성을 통해 모든 이해 관계자가 평가에 대해 더 큰 확신을 가질 수 있습니다.  
Programmatic assessment has many benefits. Assessment strategies that provide multiple elements of formative feedback before high-stakes summative feedback increase the willingness of learners to seek and use feedback and decrease anxiety about grading. The use of multiple instances of feedback from multiple evaluators can minimize the impact of bias on individual learners from an individual or a particular assessment instrument. 32,33 Criterion rather than normative strategies and pass/fail rather than more granular grading mitigate the inequity that results when small differences in observed performance translate into larger differences in earned rewards. 34 Finally, comprehensive data synthesis enables all stakeholders to have greater confidence in their assessment. 31

학습 및 역량 평가에 대한 프로그램 평가 및 평가의 이점에 대한 증거는 명확합니다. 그러나 경쟁적 프로그램에서 [전공의 선발의 용이성을 위해 의대생의 순위를 매기는 것]에 대한 확고한 견해를 감안할 때, 평가가 수행되는 방식과 그러한 평가의 결과를 재설계하라는 국가적인 지시National directive가 성공적일 것이다.
The evidence on the benefits of programmatic assessment and assessment for learning and competency evaluation is clear. However, given entrenched views on the imperative for ranking medical students for ease of residency selection in competitive programs, nothing short of a national directive to redesign the ways in which assessments are conducted, and the results of those assessments are used, will be successful.

목표 6: 역량 기반 교육 구현을 통한 교육 효율성 향상과 함께 환자 안전 보호
Goal 6: Protect patient safety while improving the efficiency of training by implementing competency-based training

원칙:
Principle:

의학교육의 연속체에 걸친 학습자들은 다음 번 시도에서 성공하는 데 필요한 폭넓은 역량을 성공적으로 입증했을 때에만 다른 교육의 기회로 발전할 수 있는 능력을 가져야 한다.
Learners across the continuum of medical education should have the ability to advance to another educational opportunity only when, but as soon as, they have successfully demonstrated the breadth of competencies needed to succeed in that next endeavor.

[대부분의 의료 교육 프로그램, 면허 기관, 인가 기관 및 인증 위원회]는 역사적으로 [프로그램의 일부 시간 조합, 특정 순환 또는 최소 사례 수]를 역량의 대리지표로 의존해 왔다. 35 임상 훈련 기회의 팬데믹 관련 희소성 환경에서 그리고 정부 관계자들이 의사 인력을 보강하기 위해 학생들의 조기 졸업을 요청함에 따라, 이러한 [전통적인 요구사항]이 완화되었고, 그 결과 의사 인력 파이프라인은 줄어들지 않고 계속 유지될 수 있었다.
Most medical education programs, licensing agencies, accreditation organizations, and certifying boards have historically relied on some combination of time in program, on specific rotations, or case volume minimums as proxies for competence. 35 In the setting of pandemic-related scarcity of clinical training opportunities and as government officials requested early graduation of students to bolster the physician workforce, these traditional requirements were relaxed, allowing the physician workforce pipeline to continue unabated.

역량 기반 시간 변동(CBTV) 교육은 중요한 역량이 부족한 의사로부터 환자를 보호하면서 의료교육 프로그램의 유연성을 높일 수 있는 전략이다.  CBTV는 교육의 다음 단계 또는 단계로 발전하기 위한 명확한 기준을 설명하며, 능력에 대한 시간적 제약 대신 각 개인의 입증된 능력에 의존한다. CBTV는 모든 필수 영역에서 역량을 입증한 학습자가 조기에 진출하여 가정 기관 내에서 또는 지정된 거주지에서 또는 유행병 대응 팀에서 새로운 역할을 맡을 수 있는 기회를 제공할 수 있다.

Competency-based, time-variable (CBTV) education is a strategy that can increase the flexibility of the medical education program while protecting patients from physicians with critical competency deficiencies. 36 CBTV describes clear criteria for advancement to the next phase or stage of education, relying on the demonstrated abilities of each individual rather than the time-bound proxies for competence. CBTV can provide the opportunity for learners who have demonstrated competency in all required domains to advance early and assume a new role within their home institution or at a designated residency, or on a pandemic response team.

또는 새로운 기술을 추가하는 데 집중할 수도 있습니다. CBTV는 일부 학습자가 예상 능력을 달성하는데 더 많은 시간이 필요하다는 것을 허용한다. 이러한 상황에서 CBTV는 학습자가 안전할 때까지 진행하지 않도록 보장하는 중요한 안전망을 제공합니다. 경험적 데이터는 역량 기반 교육이 매우 효과적일 수 있음을 뒷받침한다. 그러나, CBTV의 완전한 도입은 [임상 작업량을 관리하기 위해 일정 수의 전공의에게 의존하는 내부 시스템]과 [매년 의과대학과 레지던트 사이의 단일 전환 시점과 같은 외부 시스템]에 의해 제한된다. 캐나다는 모든 레지던시 프로그램을 역량 기반 접근으로 옮기기 위한 야심찬 프로그램에 착수했다.  
Alternatively, they may choose to focus on adding new skills. CBTV allows that some learners need more time to achieve expected competency. In this circumstance, CBTV provides an important safety net for ensuring that learners do not progress until it is safe that they do so. Empiric data support that competency-based training can be highly effective. Its full benefits are constrained, however, by internal systems that rely on a certain number of residents to manage the clinical workload and external systems, such as a single transition point between medical school and residency each year. Canada has embarked on an ambitious program to move all residency programs to a competency-based approach. 37

CBTV는 또한 교육 환경의 효율성을 증가시킬 수 있다. 한 학생이 훈련의 한 측면에서 더 빠르게 발전한 경우, 기본 역량을 달성하는 데 더 많은 시간이 필요한 동료에게 귀중한 임상 학습 경험을 부여할 수 있습니다. CBTV는 또한 질병이나 가족 구성 활동으로 인해 훈련이 변경된 개인에게 개인과 직업의 균형을 지원할 수 있다.
CBTV can also increase efficiency in the educational environment. If one student has progressed more rapidly in one aspect of their training, they can cede valuable clinical learning experiences to peers who need more time to achieve baseline competency. CBTV can also support personal–professional balance in individuals whose training is altered because of illness or family building activities.

목표 7: 국가 시스템을 재설계하고 [국가 기술 플랫폼]에 투자하여 선발 프로세스의 공정성, 경제성, 효율성 향상
Goal 7: Increase equity, affordability, effectiveness, and efficiency of selection processes by redesigning national systems and investing in national technology platforms

원칙:
Principle:

의과대학 입학 및 GME 교육을 위한 선발을 위한 정책과 운영 절차는 전환 비전을 달성하기 위해 조정되어야 하며 최적의 결과를 지원하도록 설계되어야 하며 또한 학생과 프로그램의 [nonvalue-added 작업을 최소화]해야 한다.
Policies and operational procedures for admission into medical school and selection for GME training should be aligned to achieve the transformational vision and designed to support optimal outcomes, while also minimizing nonvalue-added work for students and programs.

의과대학과 레지던트 지원 과정이 전염병으로 인하여 [All-virtual]로 전환되면서 인해 학습자들은 일반적인 면접 시즌에 요구되는 수천 달러의 여행 비용 없이 프로그램을 탐색하고 자신의 능력을 증명할 수 있었다. 이것은 더 큰 부를 가진 사람들에게 더 이상 혜택을 주지 않음으로써 입학 절차에서 감당할 수 있을 뿐만 아니라 형평성을 증가시켰다. 그러나 대유행은 국가 전공의 매칭 프로그램(NRMP), 전자 전공의 지원 절차(ERAS) 및 프로그램별 선택 및 순위 결정 관행의 기존 관행이 프로세스의 형평성과 효율성을 개선하고 불필요한 학습자 스트레스를 줄이기 위해 재설계할 가치가 있는 영역을 강조하였다.

The pandemic-related move to all-virtual medical school and residency application processes allowed learners across the continuum to explore programs and demonstrate their abilities without the thousands of dollars in travel expenses that the typical interview season demands. This not only increased affordability but also equity in the admission processes by not further advantaging those with greater wealth. However, the pandemic highlighted areas where the legacy practices of the National Residency Matching Program (NRMP), the Electronic Residency Application Process (ERAS), and program-specific selection and ranking practices merit redesign to improve the equity and efficiency of the process and decrease unnecessary learner stress.

[의료 교육의 연속체 전체에 걸쳐 학습자를 추적]할 수 있는 [보다 표준화되고 강력한 성과 데이터베이스의 개발과 광범위한 채택]은 프로그램으로 하여금 [전공의 및 그 이상의 성공에 필요한 광범위한 역량]에 관한 학습자 성장 궤적은 물론, 현재 성과 수준을 평가할 수 있게 할 것이다.  인공지능 전략은 학점 평균과 고부담 시험의 점수보다 더 넓은 데이터 세트를 사용하여 다양한 유형의 학습자를 식별할 수 있게 함으로써 입학 절차를 간소화할 수 있는 가능성을 가지고 있다. (상대평가normative가 아니라) 준거Criterion 기반의 표준 평가서를 설계, 채택하면 프로그램과 학교 교수진 사이의 은밀한 사이드바 대화에서 종종 논의되는 중요한 문제의 유형을 강조할 수 있다. [각 레지던트 프로그램을 성공적으로 이수할thrive 개인의 유형에 대한 투명하고 접근 가능한 정보]는 학습자가 지원하는 프로그램의 수를 줄이고, 프로그램이 임의 선별 지표를 사용하여 심층적으로 검토하는 지원 프로그램의 수를 줄이도록 유도하는 지원 프로그램의 홍수를 최소화할 수 있다.  

The development and widespread adoption of a more standardized and robust performance database that could track learners across the continuum of medical education would enable programs to evaluate learner growth trajectories as well as their current performance levels in the broad set of competencies needed to succeed in residency and beyond. 11 Artificial intelligence strategies hold promise for streamlining admissions processes by enabling the identification of different types of learners, using a wider dataset than grade point averages and scores from high-stakes exams. 38 Design and adoption of criterion-based (rather than normative) standardized letters of evaluation could highlight the types of critical issues that often are discussed in surreptitious sidebar conversations between programs and school faculty. Transparent and accessible information about the type of individual who will thrive in each residency program could decrease the number of programs that learners apply to and minimize the flood of applications that prompt programs to use arbitrary screening metrics to cut down on the number of applications they review in depth. 39

미국 의료 면허 시험 1단계에 대한 합격/불합격 보고로 이행이 임박함에 따라 많은 사람들이 NRMP 및 ERAS 프로세스의 실질적인 재설계를 제안하게 되었다. 제안에는 다음이 포함되었습니다. 

  • 지원에 대한 전공-특이적, 증거 기반 상한선
  • 인터뷰 시 프로그램 선호도 순위, 
  • 다단계 매칭 

NRMP 프로세스의 보다 근본적인 재설계는 다음을 포함할 수 있다. 

  • 팬데믹이 필요한 시기에 인력진입이 용이하도록 연 2회 경기 사이클 
  • CBTV 교육 환경에서 학습자와 프로그램을 위한 유연성 향상 
  • 가임, 육아 또는 질병 관련 휴직을 가진 학습자에게 필요한 경우 변경된 교육 궤적에 대한 지원 
  • 의사-과학자를 비롯하여, 학생집단을 위하여 독립에 필요한 교육 부채와 시간을 줄인다.

The impending move to a pass/fail reporting on the U.S. Medical Licensing Examination Step 1, along with the current pressures faced by programs dealing with high volumes of applications and applicants struggling with a maldistribution of interview slots, has prompted many to propose substantial redesign of the NRMP and ERAS processes. Proposals have included

  • specialty-specific, evidence-based caps on applications;
  • student preference ranking of programs at the time of interviews; and
  • a multistaged match. 40–43 

More fundamental redesign of the NRMP processes might include

  • a twice-a-year match cycle to facilitate entry into the workforce during times of pandemic need;
  • increased flexibility for learners and programs in an environment of CBTV education;
  • support for altered educational trajectories as often required for learners with childbearing, child-rearing, or illness-related leaves of absence; and
  • decrease educational debt of and time to independence for populations of students, including but not limited to physician–scientists.

목표 8: 학습자와 의사의 웰빙을 우선시하여 인력 보호
Goal 8: Protect the workforce by prioritizing learner and physician well-being

원칙:
Principle:

미래와 현재의 의사들은 그들의 복지가 보호되는 환경에서 배우고 일할 수 있어야 하며, 그래야 그들은 개인 생활뿐만 아니라 직업 생활에서도 번창할 수 있다.
Aspiring and practicing physicians should be able to learn and work in environments in which their well-being is safeguarded so that they can thrive in their personal as well as professional lives.

언론의 이야기는 대유행 기간 동안 개인 의료 서비스 제공자들이 짊어진 엄청난 부담을 보여주었고, 종종 다른 가족의 사랑하는 사람들을 돌보면서 그들의 건강을 보호하기 위해 그들 자신의 가족을 남겨두었다. 전국적으로 보건 시스템은 이러한 특별한 시기에 건강 관리를 제공하는 신체적, 사회적, 정서적 부담을 해결하는 것을 돕기 위해 지원을 제공하는 새로운 전략을 신속하게 시행했다.  의료 기관, 산업 및 사회 단체에 의해 COVID-19 환자를 돌보는 일선 제공자들에게 식사, 새로운 정신 건강 지원 방법, 예배 서비스 및 호텔 숙박이 제공되었다. 그러나 교육생을 포함한 다른 일선 의료 서비스 제공자들은 노인/의존 의료, 육아, 그리고 지속 가능한 K-12 교육 프로그램의 부재로 인해 그들의 전문적인 책임을 지속하기 위해 고군분투했다.
Stories in the media showcased the extraordinary burden that individual health care providers shouldered during the pandemic, often leaving their own families to safeguard their health, while caring for the loved ones of other families. Across the nation, health systems quickly put in place new strategies to provide support to help address the physical, social, and emotional burden of providing health care during these extraordinary times. 44 Meals, novel methods of mental health support, chaplaincy services, and hotel accommodations were offered to frontline providers caring for patients with COVID-19 by health care institutions, industries, and social organizations. However, other frontline care providers, including trainees, struggled to sustain their professional responsibilities because of the absence of elder/dependent care, childcare, and sustainable K-12 education programs.

직업 생활과 개인 생활의 균형을 맞추는 스트레스는 전염병 이후 지속될 것이다. 많은 문헌에서 의학에 종사하기 시작한 사람들이 또래들보다 지치고, 우울하며, 자살 충동을 겪을 가능성이 더 높다는 것을 암시한다. 의료와 과학 분야의 여성들은 간호 책임을 관리하는 어려움 때문에 직업을 떠날 가능성이 더 높으며, 이것은 전염병으로 인해 악화되는 현상이다.  

The stresses of balancing professional and personal lives will endure following the pandemic. Ample literature suggests that those who embark on careers in medicine are more likely than peers to suffer from burnout, depression, and suicidal ideation. Women in medicine and science are more likely to leave the profession because of challenges managing caregiving responsibilities, a phenomenon exacerbated by the pandemic. 45

대유행의 와중에 [의료제공자를 케어하기 위하여 업무 책임을 변경하고 더 큰 사회적 지원을 제공할 수 있는 능력]은 재난이 발생할 때 이러한 유형의 개입이 가능하다는 증거를 제공한다. 현재와 미래의 의료 인력의 건강과 복지를 유지하기 위해, 의료 대학과 의료 시스템은

  • [부가가치가 없는 문서 작업에 대한 요구를 영구적으로 제거]하고,
  • [쉽게 접근할 수 있는 강력한 웰빙 및 정신 건강 지원 시스템]을 구축하며,
  • 다른 조직과 협력하여 저렴하고 고품질이며 쉽게 접근할 수 있는 돌봄 시스템을 확장하여 working families를 지원해야 한다.

The ability to alter work responsibilities and provide greater social support to care for the caregivers in the midst of a pandemic provides evidence that these types of interventions are feasible when disaster strikes. To sustain the health and well-being of our current and future health care workforces, medical schools and health systems should

  • advocate with payers to permanently remove requirements for nonvalue-added documentation work;
  • build robust systems with easily accessible well-being and mental health support; and
  • collaborate with other organizations to expand affordable, high-quality, and easily accessible caregiving systems to support working families.

의과대학과 레지던트 프로그램은

  • 유연하고 잠재적으로 단축된 훈련 시간을 지원하기 위해 역량 기반 훈련을 수용해야 한다. 
  • 불필요한 스트레스를 증가시키는 임의적이고 경쟁적인 평가 전략과 같은 관행을 제거한다. 
  • 전공의와 동료들에게 적절한 유급 출산 및 육아 휴가를 보장한다.  

Medical schools and residency programs should

  • embrace competency-based training to support flexible and potentially shortened training times;
  • eliminate practices, such as arbitrary and competitive assessment strategies that increase unnecessary stress; and
  • guarantee adequate amounts of paid childbearing and child-rearing leave for residents and fellows. 46

 

목표 9: 혁신적인 파트너십을 통해 전국 과소 서비스 지역사회의 의료 접근 문제 해결
Goal 9: Address health care access issues for underserved communities across the nation through innovative partnerships

원칙:
Principle:

모든 환자들은 건강한 공동체의 중요한 구성 요소로서 급성, 만성, 생명을 위협하는 질병에 대한 예방 및 치료 관리에 즉시 접근할 자격이 있다.
All patients deserve ready access to preventive and therapeutic care for acute, chronic, and life-threatening illnesses as a critical component of a healthy community.

이 전염병은 전국의 지역사회에서 의사들과 의료 시스템의 지리적 분포가 잘못되었다는 점에 관심을 갖게 만들었다. 의료 전문가들로 구성된 방문 팀은 자원이 부족한 지역사회에 절실히 필요한 지원을 제공했다. 재해 대응의 매우 중요한 요소이긴 하지만, 이러한 팀들은 어느 시점에서 건강에 대한 지속적인 위협과 관련하여 이러한 커뮤니티를 여전히 미비한 상태로 남겨 두어야 합니다. 
The pandemic drew attention to the geographic maldistribution of physicians and health care systems in communities across the nation. Visiting teams of health professionals provided desperately needed support to underresourced communities. While a critically important element of disaster response, those teams must leave at some point leaving those communities still underserved with respect to the ongoing threats to health. 

모든 커뮤니티가 필요한 의사에게 접근할 수 있도록 하는 혁신적 비전을 달성하는 것은 매우 복잡한 과제이며, 학술적 보건 시스템과의 긴밀한 협업이 필요하며, 또한 모든 지역사회에서 교육 및 의료에 자금을 대기 위한 정책과 절차를 고안할 수 있는 지역, 주 및 연방 기관과의 협력도 필요하다. 지리적 또는 인구학적 접근 문제를 해결하기 위한 전략이 존재한다. 대학과 의과대학은 소수민족 봉사기관 및 소외된 지역사회에 있는 고등학교와 지역사회 및 주립대학과의 강력한 파이프라인 프로그램을 구축하기 위해 협력할 수 있다. 이러한 파이프라인 프로그램은 의료 교육 및 인력 전문가가 설계하고 지속 가능한 방법으로 학습자를 주의 깊게 의과대학에 입학시키고 이를 통해 레지던트 프로그램으로 육성해야 한다. 전국의 의과대학들은 또한 학생들이 출신 지역 사회에 가까이 다가갈 수 있도록 하기 위해 의료 서비스가 부족한 지역에 지역 캠퍼스를 건설할 수 있으며, 지역 캠퍼스가 이 지역들에 대한 장기적인 헌신 가능성을 높이도록 뿌리내리게 할 수 있다. 지역사회에 남아 있는 것에 대한 허용 가능한 보상을 보장하거나, 이러한 지역사회로 돌아가는 학생들의 부채 탕감은 지속 가능한 노동력의 가능성을 더욱 증가시킬 것이다.

Achieving a transformational vision to ensure that all communities have access to the physicians they need is a tremendously complex undertaking, requiring close collaboration not only with academic health systems but also with local, state, and federal agencies that can devise policy and procedures to fund education and health care in all communities. Strategies exist to address geographic or demographic access issues. Universities and medical schools can collaborate to establish robust pipeline programs from minority-serving institutions and with high schools and community and state colleges in underserved communities. These pipeline programs must be designed by medical education and workforce experts and resourced in a sustainable way to carefully nurture learners into and through medical school into residency programs. Medical schools across the nation could also build regional campuses in medically underserved areas to allow students to be close to their communities of origin, enabling them to put down roots that increase the likelihood of a long-term commitment to those regions. Debt cancelation for students who return to these communities, along with guarantee of an acceptable compensation for remaining in the communities would further increase the likelihood of a sustainable workforce.

보다 야심찬 프로그램은 [지리적으로 서비스가 부족한 지역의 의사 수를 빠르게 증가]시키거나, [의료계의 모든 구성원들로 하여금 어려움에 처한 지역사회를 지원할 의무가 있다는 기대를 확립]할 수 있다. 예를 들어, 연방정부는 모든 의과대학 졸업생들이 의과대학 등록금, 등록금 및 생활비를 연방 인수하는 대가로 1차 이사회 인증에 따른 국가 복무 기간에 동의하도록 요구할 수 있다. 이것은 매년 몇 주 또는 주말 근무가 필요한 헌신적인 연간 근무 또는 주 방위군 전략과 동등한 형태를 취할 수 있다. 
More ambitious programs could quickly increase the number of physicians in geographically underserved regions and establish an expectation that all members of the medical profession have an obligation to support communities in need. For example, the federal government could require all medical school graduates to agree to a period of national service following first board certification in exchange for federal underwriting of medical school tuition, fees, and living expenses. This could take the form of dedicated years of work or of the equivalent of the National Guard strategy, with weeks or weekends of work required each year.

목표 10: 보건 및 웰빙을 지원하는 의료계, 공공, 주 및 연방 정부 간의 사회 계약 강화 및 공포
Goal 10: Strengthen and promulgate the social contract between the medical profession, the public, and state and federal governments in support of health and well-being

원칙:
Principle:

의료 전문직업성의 원칙은 의사가 환자를 돌보고 우리 지역 사회의 건강을 향상시키기 위한 일에서, [의료계와 개별 의사가 착수하기를 기대할 수 있는 일을 사회에 선언]한다. 그 선언은 또한 사회가 최고의 결과를 얻기 위해 의사와 직업과 협력하여 해야 하는 일에 대해서도 분명해야 한다.
The tenets of medical professionalism proclaim to society the work that they can expect the medical profession and individual physicians to embark upon as they care for patients and work to improve the health of our communities. That proclamation must also be clear about the work that society needs to do in partnership with physicians and the profession to achieve the best outcomes.

의료 전문직업성의 바탕이 되는 [사회 계약]은, 의사들이 자기에 대한 위험과 상관없이 아프고 다친 사람들을 돌보는 의무에 응답하기를 암묵적으로 기대한다. 그 대가로, 전문직에는 자율규제의 권리가 주어진다.  대유행 기간 동안 의사들(및 다른 의료 전문가들)은 치명적인 바이러스로 고통 받는 환자들을 돌보는 데 대응했고, 어떤 상황에서는 기관 및 국가 차원의 시스템 장애와 공공 보건에 대한 불충분한 투자로 인해 적절한 지원이나 보호 없이 그렇게 했다.

The social contract on which medical professionalism is based implicitly expects physicians to respond to a call to duty to care for the sick and injured, regardless of the risk to self. In exchange, the profession is afforded the right to self-regulation. 47 During the pandemic, physicians (and other health professionals) did respond to care for patients suffering from a deadly virus and, in some circumstances, did so without adequate support or protection because of failures of systems at the institutional and national level and inadequate investment in public health.

대유행의 교훈은 의료 전문성에 관한 의사 헌장에 명시된 [환자 복지, 환자 자율성, 사회 정의의 기본 원칙의 건전성]을 강화한다. 그러나 정부 관료와 사회의 영향을 받지 않은 구성원들이 내린 결정과는, 대조적으로 대유행 기간 동안 의사와 환자가 견뎌내야 했던 경험lived experience은 [상호 기대와 책임에 대한 명확한 사회 계약의 재설계가 늦었음]을 시사한다. 의료계의 사회계약을 재설계할 때에는 [신데믹에 준비된 의사의 확장된 책임 세트를 수용하겠다는 서약]이 포함될 수 있다. 여기에는 본 비전에 요약된 일련의 영향력 있는 약속들이 포함된다. 

  • 공중위생을 지지하는 사회적 조건을 강력하고 신속하게 옹호한다. 
  • 의료 및 의료 교육에서 구조적 억압의 결과를 뒤집는다. 
  • 의료 분야의 의료 격차, 차별 및 성 희롱을 제거한다. 
  • 의료 서비스를 제공하기 위해 일하는 모든 사람들의 복지를 촉진하는 시스템을 구축해야 합니다.

The lessons from the pandemic reinforce the soundness of the fundamental principles of primacy of patient welfare, patient autonomy, and social justice outlined in the Physician Charter on Medical Professionalism. 47 However, the lived experience endured by physicians and patients during the pandemic in contrast to decisions made by government officials and unimpacted members of the society suggests that a redesign of the social contract with clarity about mutual expectations and responsibilities is overdue. 48 A redesign of the social contract from the medical profession might include a pledge to embrace an expanded set of responsibilities for the syndemically prepared physician. Those include the set of impactful commitments outlined in this vision to

  • forcefully and expeditiously advocate for social conditions that support public health;
  • reverse the consequences of structural oppression in health care and medical education;
  • eliminate health care disparities, discrimination, and gender harassment in medicine; and
  • build systems that foster well-being for all of those who work to provide health care.

이러한 책임은 정책 영역에서 Workforce가 [냉정하고 중립적인 관찰자로서의 전문적 정체성]을 벗어나, [더 큰 영향력과 옹호자 역할]을 하도록 바꿔놓는다. 이 [수정된 역할]을 받아들이면서, 의사들과 보건 전문직의 다른 구성원들은 모든 수준의 정부와 광범위한 대중이 인구에 대한 건강을 최적화하는 결정을 내릴 수 있도록 지도하기 위해 의무와 이타주의에 대한 그들의 헌신을 활용할 수 있다. (예: 빈곤 제거, 의료 접근성 개선, 기후 변화 및 환경 독소 해결)  또한 의료 전문가에 대한 불필요한 위험을 제거합니다. (예: 제대로 이행되지 않은 공중 보건 지침, 불충분한 보호 장비, 소모 및 도덕적 고통을 유발하는 시스템 및 정책)

These responsibilities move the workforce away from a professional identity as dispassionate and neutral observers in the policy realm to one of greater influence and advocacy. 49 In accepting this revised role, physicians and other members of the health professions can leverage their commitment to duty and altruism to guide governments at all levels and the broader public to make decisions that both optimize health for populations (e.g., eliminating poverty, improving access to health care, addressing climate change and environmental toxins) and eliminate unnecessary risks to health care professional (e.g., from poorly implemented public health directives, inadequate protective equipment, systems and policies that precipitate burnout and moral distress).

결론들
Conclusions

의학교육은 대학, 보건 시스템, 인증 기관, 규제 기관, 면허 기관, 전문 조직 및 인증 위원회를 포함하는 복잡한 생태계 내에 존재한다. 의대를 비롯한 학술기관은 과학 혁신과 코스워크, 채점, 승진 및 종신 재직권 등 핵심 과정의 안정성을 위해 설계된다. 생태계의 복잡성, 안정성의 편안함, 기존 관행에 대한 교수진의 자신감, 새로운 아이디어의 위험과 실현 가능성에 대한 우려가 결합되어, 중대한 변화를 "변형하는 것 외에는 다른 방법이 없을 때까지" 어려운 일이거나 선택해도 되는 일로 남겨둔다. .

Medical education exists within a complicated ecosystem that includes universities, health systems, accrediting bodies, regulatory agencies, licensing bureaucracies, specialty organizations, and certifying boards. Academic institutions, including medical schools, are designed for innovation in science and stability in core processes such as coursework, grading, and promotion and tenure. The complexity of the ecosystem, the comfort of stability, the confidence of faculty about existing practices, and the concerns about risk and feasibility of new ideas combine to make significant change challenging and optional—until there is no option but to transform.

결과적으로, [혁신의 시급성]을 포착하기 위해서는 [협력적이고 전략적으로 설계된 조치]가 필요할 것이다. 국가 지도력은 변화를 향한 진전을 문제 해결뿐만 아니라 거버넌스 전략을 수립하고, 시스템을 구축하고, 측정 기준을 설정하고, 책임 구조를 설계하기 위해 필요할 것이다. 국립 의학 아카데미는 전문가들을 소집하여 중요한 문제와 변화를 뒷받침할 수 있는 잠재적 해결책에 대한 증거를 수립, 종합 및 전파하는 신뢰할 수 있는 기관으로 자리매김했다. [의사 책무성 연합]은 조직들의 조직으로서, 전염병 동안 리더십을 보여주었고, 현재 UME에서 GME로의 전환을 개선하기 위해 노력하고 있다.  
Consequently, seizing the urgency to transform will require collaborative and strategically engineered action. National leadership will be needed to establish governance strategies, build systems, establish metrics, and design accountability structures for, as well as troubleshoot progress toward transformation. The National Academy of Medicine has established itself as a trusted body to convene experts to establish, synthesize, and disseminate evidence on critical problems and potential solutions to support change. The Coalition for Physician Accountability, as an organization of organizations, has demonstrated leadership during the pandemic and is currently working to improve the UME-to-GME transition.

변혁에 성공하기 위해서는, 이 노력에 학계 보건 시스템의 지도자로서 미국 의과 대학 [학장 협의회]와 [교육 병원 협의회]가 참여해야 한다. 이들은 교육과 의료가 만나는 최전선에서 이 작업을 감독하는 데 필요한 신뢰도, 전문 지식의 폭 및 권한의 범위를 가진 사람들이다. 보건의료 전문직교육은 양질의 헬스케어가 시작되는 곳이기 때문에, 국립보건원이 효과적인 교육전략에 대한 연구에 자금을 지원하는 기관을 출범시켜야 할 시점이다.

To succeed in transformation, they should be joined by the Association of American Medical Colleges Council of Deans and Council of Teaching Hospitals, as convened leaders of academic health systems, who have the necessary credibility, breadth of expertise, and scope of authority to oversee this work at the frontlines, where education and health care meet. Since health professions education is where high-quality health care begins, it is time for the National Institutes of Health to launch an institute that funds research into effective educational strategies.

코로나19 범유행과 관련 인종 불안은 우리가 환자와 사회의 요구를 완전히 충족시키기 위해 미국의 건강 관리 및 의료 교육 시스템을 재설계하기 위한 다년간의 이니셔티브를 시작하도록 용기를 북돋워야 하는 변화된 힘이다. 의료 교육을 주도하고 규제하는 사람들이 대유행에서 얻은 교훈을 분석하고 적용한다면 2020년은 전략적 변곡점으로 볼 것이다. [다음 유행병] 뿐만 아니라, [환자와 커뮤니티의 미해결 의료 요구]를 해결하기 위해 의사 인력 준비를 최적화하려면

  • 의료 교육 프로그램의 목표에 대한 관심 
  • 개별 의사의 역량 및 역할 
  • 의료진의 구성, 배치 및 책임 
  • 의학교육의 연속성을 감독하는 시스템의 설계가 필요합니다. 

The COVID-19 pandemic and associated racial unrest are once in a generation, transformational forces that should embolden us to embark upon a multiyear initiative to redesign the American health care and medical education systems to fully meet the needs of patients and society. The year 2020 will be viewed as a strategic inflection point if those who lead and regulate medical education analyze and apply lessons learned from the pandemic. Optimizing the preparation of the physician workforce to address the next pandemic as well as the unsolved health care needs of our patients and communities will require

  • attention to the goals of medical education programs;
  • the competencies and roles of individual physicians;
  • the composition, deployment, and responsibilities of the physician workforce; and
  • the design of systems that oversee the continuum of medical education.

잘 훈련된 의사들의 건강 관리 요구를 충족시킬 수 있는 강력한 파이프라인으로 기대되고 자격이 있는 사회를 대표하여 이러한 위기 및 미래의 위기를 성공적으로 헤쳐나가려면 생태계 내의 모든 사람이 변혁을 선택할 수 있도록 해야 합니다.

Successfully navigating this and future crises on behalf of a society that expects and deserves a robust pipeline of well-trained physicians to meet their health care needs requires a commitment from all within the ecosystem to make the choice to transform.

 

목록 1 의료 교육 혁신을 위한 10개 시점, 10년 플랫폼

  • 전국의 모든 지역사회에서 보건 및 건강 관리 개선에 초점을 맞춘 성공적인 노동력에 대한 국가 비전을 채택한다.
  • 의료·의료교육에서 구조적 인종차별의 결과와 징후를 적극적으로 발굴하고 제거함으로써 의료교육과 보건의료에 있어 사회적 정의를 실현한다.
  • 질병과 질병으로 고통받는 현상의 원인을 해결하는 데 필요한 광범위한 역할과 책임을 수용하기 위해 현재와 미래의 모든 의사 인력을 준비하는 커리큘럼을 설계한다.
  • 의료 교육 프로그램을 지역 사회 및 정부와 협력하여 이러한 문제에 교육 프로그램을 집중함으로써 전국 지역사회에서 질병과 사망의 가장 긴급한 원인을 식별하고 해결한다.
  • 의료 교육 전반에 걸쳐 프로그램 평가 전략의 표준을 채택하여 미래의 의사들에게 성장 마인드를 촉진하고 평생 학습을 지원하며 학습 환경의 형평성을 촉진합니다.
  • 역량 기반 교육을 구현하여 교육 효율성을 향상시키면서 환자 안전을 보호합니다.
  • 국가 시스템을 재설계하고 국가 기술 플랫폼에 투자하여 선택 프로세스의 공정성, 경제성, 효율성 및 효율성을 높입니다.
  • 학습자와 의사의 복지를 우선시하여 인력을 보호하십시오.
  • 혁신적인 파트너십을 통해 전국의 과소 서비스 지역사회에 대한 의료 접근 문제를 해결합니다.
  • 의료계, 공공계, 주정부 및 연방정부 간의 건강 및 웰빙을 지지하는 사회적 계약을 강화하고 공포한다.

List 1 A 10-Point, 10-Year Platform for Medical Education Transformation

  1. Adopt a national vision of the successful workforce focused on committing to improving health and health care in all communities across the country.
  2. Achieve social justice in medical education and health care across the country by actively seeking out and eliminating the consequences and manifestations of structural racism in medicine and medical education.
  3. Design curricula to prepare all in the physician workforce, present and future, to embrace the breadth of roles and responsibilities needed to address syndemic causes of suffering from illness and disease.
  4. Identify and address the most pressing causes of morbidity and mortality in communities across the nation by challenging medical education programs to partner with local communities and governments to focus educational programs on these issues.
  5. Facilitate growth mindsets and support lifelong learning in future physicians—and promote equity in learning environments—by adopting a standard of programmatic assessment strategies across the continuum of medical education.
  6. Protect patient safety while improving efficiency of training by implementing competency-based training.
  7. Increase equity, affordability, effectiveness, and efficiency of selection processes by redesigning national systems and investing in national technology platforms.
  8. Protect the workforce by prioritizing learner and physician well-being.
  9. Address health care access issues for underserved communities across the nation through innovative partnerships.
  10. Strengthen and promulgate the social contract between the medical profession, the public, and state and federal governments in support of health and well-being.

 

 


Acad Med. 2022 Mar 1;97(3S):S71-S81. doi: 10.1097/ACM.0000000000004526.

We Have No Choice but to Transform: The Future of Medical Education After the COVID-19 Pandemic

Affiliations collapse

Affiliations

1C.R. Lucey is professor of medicine, executive vice dean, and vice dean for education, University of California, San Francisco School of Medicine, San Francisco, California.

2J.A. Davis is professor of medicine, associate dean for curriculum, and interim associate dean for students, University of California, San Francisco School of Medicine, San Francisco, California.

3M.M. Green is Raymond H. Curry, MD Professor of Medical Education, professor of medicine, and vice dean for education, Northwestern University Feinberg School of Medicine, Chicago, Illinois.

PMID: 34789658

PMCID: PMC8855762

DOI: 10.1097/ACM.0000000000004526

Free PMC article

Abstract

Medical education exists to prepare the physician workforce that our nation needs, but the COVID-19 pandemic threatened to disrupt that mission. Likewise, the national increase in awareness of social justice gaps in our country pointed out significant gaps in health care, medicine, and our medical education ecosystem. Crises in all industries often present leaders with no choice but to transform-or to fail. In this perspective, the authors suggest that medical education is at such an inflection point and propose a transformational vision of the medical education ecosystem, followed by a 10-year, 10-point plan that focuses on building the workforce that will achieve that vision. Broad themes include adopting a national vision; enhancing medicine's role in social justice through broadened curricula and a focus on communities; establishing equity in learning and processes related to learning, including wellness in learners, as a baseline; and realizing the promise of competency-based, time-variable training. Ultimately, 2020 can be viewed as a strategic inflection point in medical education if those who lead and regulate it analyze and apply lessons learned from the pandemic and its associated syndemics.

의학교육의 고약한 문제: 학습자 평가에서 형평 달성하기(Acad Med, 2020)
Medical Education’s Wicked Problem: Achieving Equity in Assessment for Medical Learners
Catherine R. Lucey, MD, Karen E. Hauer, MD, PhD, Dowin Boatright, MD, and Alicia Fernandez, MD

 

 

의료 및 기타 보건 분야의 다양성이 증가하면 소수민족minority populations에게 제공되는 의료의 질과 접근성이 향상되고, 소수민족과 다수 학생 모두의 교육 환경이 개선되며, 팀 기반 문제 해결이 최적화되고, 의료 연구의 집중과 관련성이 확장된다. 부분적으로 인증 기준과 국가 기관에 의해 추진된 많은 의과대학과 레지던트 프로그램은 그들의 수업의 다양성을 증가시키기 위해 전인적holistic 입학 전략을 성공적으로 사용했다. 그러나, 비슷한 다양성의 증가는 명예 사회honor soceity, 전공의 선발 프로그램, 그리고 의학 전문 분야에서 그리고 미국 의과대학의 교수진들 사이에서 실현되지 않았다. 경쟁이 심한 커리어나 프로그램에 진입하는 것은 종종 학생들의 성적과 학업 수상에 의존하기 때문에, 이러한 관찰은 의과대학의 평가 관행이 [구조적이고 대인관계적인 편향]을 받는지에 대한 우려를 불러일으켰다.

Increasing diversity in medicine and other health professions improves access and the quality of care provided to minority populations, enhances the educational environment for both minority and majority students, optimizes team-based problem solving, and expands the focus and relevance of medical research.1–4 Driven in part by accreditation standards and national organizations,5–8 many medical schools and residency programs have successfully used holistic admissions strategies to increase the diversity of their classes. However, similar increases in diversity have not been realized in honor societies, selective residency programs, and medical specialties, and among faculty in U.S. medical schools.9 Because entry into competitive careers and programs is often dependent on student grades and academic awards, these observations have prompted concerns about whether the assessment practices of medical schools may be subject to structural and interpersonal bias.

의과대학은 평가의 형평성에 대한 이러한 우려에 대응할 [도덕적 책임]이 있다. 평가는 학습을 안내하고, 학생의 진보를 가능하게 하며, 직업 선택과 기회에 영향을 미치며, 또한 졸업생들의 역량을 이해 관계자들에게 보장한다. 의학교육의 불평등한 평가는 의약분야에서 과소대표된 그룹(underrepresented in medicine, UIM)의 학습자에게 진급 및 진로기회에 대한 장벽을 영구화한다. 비록 근거가 없더라도, [불평등한 평가의 가능성에 대한 우려] 그 자체로 UIM 학습자에게 부담을 줄 뿐만 아니라, 그들의 수행perform을 기대하는 학습 환경을 더 어렵게 만든다.
Medical schools have a moral responsibility to respond to these concerns about equity in assessment. Assessment guides learning, enables student progress, and impacts career choice and opportunity while also assuring stakeholders of graduates’ competence. Inequitable assessments in medical education perpetuate barriers to advancement and career opportunities for learners from groups underrepresented in medicine (UIM). Even if unfounded, concerns about the possibility of inequitable assessments burden UIM learners and add to the challenging nature of the learning environments in which they are expected to perform.

평가의 형평성은 [사악한 문제]의 정의를 충족시킨다.10 [사악한 문제]는 갈등, 불확실성, 역동적 긴장, 맥락적 영향에 대한 취약성이 특징이다.

  • 많은 교수진들은 학생들을 가르치고 평가하는 우리의 현재 접근 방식이 방어가능하고, 보람 있는 공로와 열심히 일하는 것이라고 믿는다.
  • 한편, 어떤 사람들은 그것이 역사적으로 의대생, 전공의, 그리고 교수진의 대다수를 구성했던 사람들에게 [교육의 기회와 직업 특권의 상태를 영속적으로 유지해온 동일한 구조적 인종차별]에 의해 더럽혀졌다고 믿는다.

평가에서 형평성 문제를 탐구하는 문헌은 문제의 복잡성에 대한 더 큰 명확성을 제공하고 있지만, 평가에서 [형평성의 본질]에 대한 근본적인 질문을 해결하거나, 관찰된 차이에 대한 해결책을 제안하지 못했다.
Equity in assessment meets the definition of a wicked problem.10 Wicked problems are characterized by conflicts, uncertainty, dynamic tensions, and susceptibility to contextual influences.

  • Many faculty believe that our current approach to teaching and assessing students is defensible, rewarding merit and hard work.
  • Increasingly, others believe that it has been tainted by the same structural racism that has perpetuated a state of educational opportunity and career privilege for populations that have historically constituted the majority of medical students, residents, and faculty.

The literature that explores issues of equity in assessment is providing greater clarity into the complexity of the problem but has yet to resolve the fundamental questions about the nature of equity in assessment or propose solutions to observed differences.


이 [사악한 문제]를 해결하기 위해서는, 모든 의과대학과 레지던트 프로그램에서 교육자들의 일치된 노력이 필요할 것이다. 이 작업을 촉매하는 데 도움이 되도록, 우리는 평가에서 형평성의 공유 정신 모델을 확립하기 위한 핵심 개념을 정의함으로써 본 논문을 시작한다. 우리는 문헌에 대한 검토를 계속하고, 의료 교육 평가의 형평성에 대한 우려를 탐구하며, 조직 우수 분야의 작업을 모델링한 제안된 프레임워크를 따른다. 마지막으로, 우리는 향후 연구가 탐구해야 할 도전과 논쟁에 대해 설명한다.

Addressing this wicked problem will require concerted work by educators in all medical schools and residency programs. To help catalyze this work, we begin this paper by defining key concepts to establish a shared mental model of equity in assessment.11 We continue with a review of the literature, exploring concerns about equity in assessment in medical education, and follow with a proposed framework modeled on work in the field of organizational excellence. Finally, we describe challenges and controversies that future research should explore.

평가에서 형평성이란 무엇인가?
What Is Equity in Assessment?

[형평성]은 [공정함]과 [사회적 정의]가 실현된 상태이다. 따라서 [형평한equitable 평가 시스템]은 미래의 교육 및 직업 기회를 촉진한다. 평가의 형평성은 모든 학생들이 의학 분야에서 미래의 성공을 예측하는 성취의 시연에 기초하여 학습, 평가, 지도, 등급, 고급, 졸업 및 후속 기회를 위해 선택될 수 있는 공정하고, 불편부당한impartial 기회를 가질 때 존재한다. 그리고 [학습 경험이나 평가]가 모두 [학습자나 평가자의 개인적 또는 사회적 특성]과 관련된 [구조적 또는 대인적 편견에 부정적인 영향]을 받지 않아야 한다. [공평한 평가 시스템]은 다수 학습자와 소수 학습자 모두가 더 많이 배우고 더 잘 배울 수 있도록 해야 한다. 
Equity is the state of being fair and achieving social justice.12,13 An equitable assessment system thereby facilitates future educational and career opportunities. Equity in assessment is present when all students have fair and impartial opportunities to learn, be evaluated, coached, graded, advanced, graduated, and selected for subsequent opportunities based on their demonstration of achievements that predict future success in the field of medicine, and that neither learning experiences nor assessments are negatively influenced by structural or interpersonal bias related to personal or social characteristics of learners or assessors. An equitable assessment system should enable both majority and minority learners to learn more and learn better.14

평가 자본의 구성 요소
Components of equity in assessment


평가에서 형평에는 내재적 형평, 맥락적 형평, 도구적 형평의 세 가지 요소가 있다(그림 1 참조). 

There are 3 components to equity in assessment: intrinsic equity, contextual equity, and instrumental equity (see Figure 1).

[내재적 형평성]은 평가 프로그램 및 사용된 평가 도구의 설계가 [역사적으로 의료계에서 소외된 그룹에 대한 편견을 최소화함]을 의미한다. [확립된 준거]는 고품질의 평가 전략을 정의하고 또한 평가의 형평성을 달성하기 위한 노력에 inform한다. 이러한 준거에는 다음이 포함됩니다.

Intrinsic equity means that the design of the program of assessment and the assessment tools used minimize bias against groups historically marginalized by the medical profession. Established criteria define high-quality assessment strategies and also inform efforts to achieve equity in assessment. These criteria include:

  • (1) 타당성 또는 일관성,
  • (2) 재현성 또는 일관성,
  • (3) 등가성,
  • (4) 실현 가능성,
  • (5) 교육적 효과,
  • (6) 촉매 효과, 그리고
  • (7) 수용 가능성
  • (1) validity or coherence,
  • (2) reproducibility or consistency,
  • (3) equivalence,
  • (4) feasibility,
  • (5) educational effect,
  • (6) catalytic effect, and
  • (7) acceptability.15 

이러한 준거를 준수하여야, 교육자들이 [커리큘럼과 평가를 얼라인]하고, [가치 있는 것을 반영하여 측정]하며, [학습을 가이드]하고, [환자와 대중에게 시스템의 책임성을 보장]할 수 있다. 이러한 준거가 충족되지 않을 경우 평가의 불평등inequity이 발생할 수 있습니다. 표 1은 이러한 기준에 대한 정의를 요약하고 이를 충족하지 못하는 것이 평가의 불평등을 가능하게 하는 방법의 예를 제공한다.

Adhering to these criteria guides educators to align curriculum and assessment and to ensure that what is measured reflects what is valued, guides learning, and ensures accountability of the system to patients and the public. When these criteria are not met, inequity in assessment may result. Table 1 summarizes definitions for these criteria and provides an example of how failing to meet them can enable inequity in assessment.

 

[맥락적 형평성]은 [학습 경험과 평가 전략이 구현되는 환경의 공정성]을 의미한다. 맥락적 형평성에는 다음에 대한 형평성이 포함된다.

  • 해당 환경 내에 할당된 환경과 과제, 
  • 학습 환경 내부 및 외부에서 가용한 지원 및 사회 구조
  • 평가 절차를 구현하는 감독자의 준비

이러한 요인들은 학습자들이 경험하는 환경에 영향을 미치므로, 학습자들이 최고의 능력에서 수행하고 평가되어야 하는 기회입니다.

Contextual equity refers to fairness in the learning experience and the environment in which assessment strategies are implemented. Contextual equity includes fairness in:

  • assigned environments and tasks within those environments,
  • support and social structures available within and outside the learning environments, and
  • the preparation of supervisors who implement assessment procedures.

These factors impact the climate experienced by learners and, thus, the opportunity learners have to perform and be assessed at their peak abilities.

의료 교육에서 평가의 형평성은 또한 [도구적 형평성]에 대한 주의를 필요로 한다. 이는 사회적 계층이나 개인적 특성에 관계없이 모든 사람에게 공평한 기회를 창출하기 위해 이해관계자와 평가 프로세스의 결과를 공유하고 사용하는 방법을 의미한다. [도구적 형평성]은 평가가 설계된 맥락에서 [후속 성과를 과대 또는 과소 예측하지 않는 방식으로 결과를 공유하고 사용]할 때 존재한다(표 2 참조).

Equity in assessment in medical education also requires attention to instrumental equity: How results of assessment processes are shared with and used by stakeholders to create equitable opportunities for all, regardless of their social class or personal characteristics. Instrumental equity is present when the results are shared and used in a manner that neither over- nor underpredicts subsequent performance in the context for which assessment was designed (see Table 2).

 

[내재적, 맥락적, 도구적 형평성]은 평가의 [성과에 대한 형평성]에 집합적으로 기여하는 [프로세스 형평성 가치]이다.
이 때 'outcomes'란 평가 결과에 따라 달라지는 개인(예: 인기 많은 전공의 프로그램 선발) 또는 인구집단(예: AHS 내 교수진의 다양성)에게 제공되는 기회를 의미한다.
Intrinsic, contextual, and instrumental equity are process equity values that collectively contribute to equity in assessment outcomes: the opportunities afforded to individuals (such as selection for a prestigious residency) or populations (such as diversity of faculty in academic health systems) based on the consequences of assessment.

 

심리 측정의 엄격성에 초점을 맞추면 임상 학습 환경에서 평가의 형평성이 짧아지는 이유
Why a focus on psychometric rigor shortchanges equity in assessment in the clinical learning environment

[맥락적 형평성(평가가 이루어지는 학습 환경의 공정성)]은 그 정의상 복잡한 임상 환경에서 본질적으로 성취하기 어렵다. 학습자는 다양한 환자, 임상 조건, 팀 역학, 시간 제약, 감독자 기술 및 기타 요소를 경험합니다. 이러한 [변동성]으로 인해 평가 조건도 마찬가지로 변동적이며, [고부담 시험]에서 추구하는 [엄격한, 통제되고, 재현 가능한 조건]이라는 기대와 충돌한다. 예를 들어, 고위험 국가 면허 및 인증 시험 환경에서 [심리측정적 엄격성(흔히 "객관적"으로 선전되는 재현 가능하고 신뢰할 수 있는 결과)]을 추구하는 것은 전적으로 실현 가능하다. 그러나 이러한 시험은 의사 수행과 관련된 역량의 일부 측면만 측정하므로, 이러한 시험만 사용할 경우 향후 환자 치료에 대한 미미한 예측 능력만 있을 뿐이다. 

The definition of contextual equity—fairness in the learning environment in which assessment occurs—is inherently challenging in the complex clinical environment. Learners experience different patients, clinical conditions, team dynamics, time constraints, supervisor skill, and other factors. This variability makes the conditions for assessment similarly variable, and in conflict with traditional expectations for tightly controlled, reproducible conditions sought for high-stakes testing. For example, it is entirely feasible to pursue psychometric rigor—reproducible, reliable results that are often touted as “objective”—in the environments of high-stakes national licensing and certification examinations. However, these examinations only measure some aspects of the competencies relevant to physician performance and thus, used alone, have only modest predictive ability for future patient care.16–20 For most competencies other than knowledge, patient care skills are an essential component of the valid and equitable assessment of learner performance.

지식을 제외한 대부분의 역량의 경우, patient care skill은 학습자 수행의 유효하고 공평한 평가의 필수적인 구성요소이다. [임상 기술의 공평한 평가equitable assessment를 위한 조건을 만드는 것]은 지금까지 의료 교육자들에게 어려운 일이었다. 평가의 심리측정학 시대에, [WBA의 신뢰성 또는 재현성]에 주로 초점을 두는 것은 [평가자들이 서로 다른 수준의 학습자 수행의 유사한 등급을 제공하도록 충분히 훈련될 경우 공정성을 얻을 수 있을 것이라는 가정]을 부채질했다. 그러나 임상 수행능력 평가는 [매우 신뢰도가 높은 평정]이라는 비전에는 크게 미치지 못했다. 사실, 더 최근의 문헌은 우리가 학습자들이 접하는 임상 과제, 맥락, 그리고 다른 지도자들의 복잡성을 의미 있는 반영으로 등급의 가변성을 수용한다고 주장한다. 이 가이드는 [맥락적 형평성의 중요성]을 인정한다. 맥락적 형평성을 고려하지 않으면, 아래에 설명된 것처럼 [불평등한inequitable 평가 관행]이 영속될 것이다.

Creating the conditions for equitable assessment of clinical skills has thus far been challenging for medical educators. In the psychometric era of assessment, the major focus on reliability or reproducibility of workplace assessments fueled an assumption that fairness would result if raters were sufficiently trained to provide similar ratings of different levels of learner performance. However, assessment of clinical performance has fallen grossly short of this vision of highly reliable ratings. In fact, more recent literature advocates that we embrace the variability in ratings as a meaningful reflection of the complexity of clinical tasks, contexts, and different supervisors whom learners encounter.21–24 This guidance embraces the importance of contextual equity; failure to consider contextual equity perpetuates inequitable assessment practices, as described below.

기존 문헌: 의료 교육 평가의 형평성에 대한 우려는 보장된다.
Existing Literature: Concerns About Equity in Assessment in Medical Education Are Warranted

평가의 형평성 문제에 대한 탐구는 의대 입학, 진도 및 졸업에 사용되는 평가의 편향, 공정성, 차이, 차등 달성 등의 개념과 레지던스 프로그램과 교수진 경력을 위한 성공적인 경쟁에 초점을 맞춘 여러 연구로 시작되었다. 이러한 연구는 UIM과 WRIM 학생과 전공의 사이의 표준화된 시험, 임상 평가, 등급 및 학술상에서의 모집단 그룹 차이를 일관되게 문서화하며, 이는 사실상 항상 WRIM 학습자에게 유리하다. 게다가, 연구들은 또한 평가 결과의 사소한 차이가 레지던트 및 직업 기회에 강력한 영향을 미칠 수 있다는 것을 문서화했다. 
Exploration into the question of equity in assessment has begun with multiple studies focused on concepts such as bias, fairness, differences, and differential attainment in assessments used for entry to, progress through, and graduation from medical school and successful competition for residency programs and faculty careers.25–35 These studies consistently document population group differences in standardized examinations, clinical assessments, grading, and academic awards between UIM and well-represented in medicine (WRIM) students and residents, differences that virtually always favor WRIM learners. Furthermore, studies have also documented that minor differences in assessment outcomes can have a powerful impact on residency and career opportunities.9,30

고위험 표준화 시험에서 모집단 그룹 차이가 존재함
Population group differences exist in high-stakes standardized exams

국가 고위험 표준 시험은 종종 의과대학에 입학할 학생들을 선발하고 가장 경쟁력 있는 특기, 레지던트 프로그램, 그리고 진로에 들어가기 위해 사용된다. 불행하게도, 이러한 많은 시험들에서, 백인 이외의 동료들보다 백인 지원자들을 선호하고 여성들보다 남성 지원자들에게 호의적favor인 인구집단 간 차이가 존재한다.

  • 의과대학 입학시험(MCAT)은 의과대학 입학사정관이 어떤 지원자에게 의과대학 면접과 합격을 제안할지를 결정하기 위해 사용하는 가장 중요한 선발 기준 중 하나이다. 비록 개별 여성과 UIM 학생들이 MCAT 점수의 범위에 걸쳐 점수를 매기지만, MCAT 점수에 집단 간 차이가 존재하며, 평균적으로 흑인 및 히스패닉 학생들은 백인 동료들보다 낮은 점수를 받는다.
  • 마찬가지로, 미국 의료 면허 시험(USMLE) 1단계 시험은 거주자 선택에 중요한 역할을 했다. 유사한 모집단 그룹 차이는 USMLE 1단계에서 입증되었다. 연구에 따르면 흑인, 히스패닉, 아시아계 의대생들은 백인 학생들보다 평균 USMLE 1단계 점수가 낮고, 여성들은 평균적으로 남성들보다 낮은 점수를 받는 것으로 일관되게 나타났다. USMLE 1단계 점수의 이러한 그룹 차이는 학생들의 이전 학업 성취도에 의해 설명되지 않으며, 학생들의 총 성적 평균과 MCAT 점수를 감안한 후에도 지속된다.

National high-stakes standardized exams are often used to select students for entry into medical school and into the most competitive specialties, residency programs, and careers. Unfortunately, in many of these exams, population group differences exist that consistently favor White applicants over their non-White peers and men applicants over women.

  • The Medical College Admission Test (MCAT) is one of the most important selection criteria used by medical school admissions officers to determine which applicants are offered medical school interviews and acceptance.36 Although individual women and UIM students score across the range of MCAT scores, population group differences exist in MCAT scores, with Black and Hispanic students, on average, scoring lower than their White peers.35,37,38 
  • Similarly, the United States Medical Licensing Exam (USMLE) Step 1 exam has played an important role in residency selection.39 Similar population group differences have been demonstrated on the USMLE Step 1. Studies have consistently shown that Black, Hispanic, and Asian medical students, on average, have lower USMLE Step 1 scores than White students and women, on average, score lower than men.40–42 These group differences in USMLE Step 1 scores are not explained by students’ prior academic achievement, and they persist even after accounting for students’ total grade point average and MCAT scores.43

의과대학 학생들의 미래 성과에 대한 MCAT의 예측 능력과 미래의 면허 시험 수행에 대한 USMLE 1단계 시험에 대한 심리측정학 분석에 따르면 [시험의 본질적instrinsic 편향의 증거는 없다]. MCAT, USMLE 및 기타 고위험 표준 시험의 모집단 차이를 설명하는 일반적인 이론은 [UIM 학생들에게 제공되는 교육 기회에 대한 구조적 인종차별의 결과]에서 차이가 발생한다는 것이다. 최근 USMLE 1단계 시험에 대한 합격/불합격 채점 변경은 면허를 위한 의료 지식에서 최소한의 역량 보장을 유지하면서 불평등을 해결하기 위한 유망한 전략을 나타낸다.
Psychometric analysis of the predictive ability of the MCAT on future performance of students in medical school and the USMLE Step 1 exam on performance on future licensing exams shows no evidence of intrinsic bias of the exams.35 The prevailing theory explaining population group differences in the MCAT, the USMLE, and other high-stakes standardized exams is that the differences result from consequences of structural racism on educational opportunities afforded to UIM students.35,38 The recent change to pass/fail scoring for the USMLE Step 1 examination represents a promising strategy to address inequity while maintaining assurance of minimal competence in medical knowledge for licensure.

MCAT와 USMLE 시험의 경우, 광범위한 점수를 가진 학생들은 의과대학, 레지던트 및 의사 실습에서 미래에 성공할 수 있다. 그러나 많은 의과대학(MCAT)과 레지던트 프로그램(USMLE)은 면접과 입학을 위해 고려하는 지원자를 가장 높은 점수를 받은 지원자로 제한하는 것을 선택한다. 그들은 이런 이유를 댄다.

  • 많은 수의 지원자들을 효율적으로 심사할 필요성에 대한 우려,
  • 점수의 작은 차이가 갖는 예측 능력에 대한 잘못된 믿음,
  • U.S. News & World Report에 따르면 기관 순위를 높이기 위해, 신입생이 가장 높은 시험 지표를 갖게 하라는 지도부의 압력.

이러한 시험에서 입증된 모집단 차이를 감안할 때, 최고 점수자에게만 기회를 제한하는 것은 UIM 학생들에게 시스템적 불이익을 주는 것이며, 의과대학 수업과 레지던트 프로그램을 다양화하는 데 장벽을 제공한다. 

For both the MCAT and USMLE examinations, students with a broad range of scores are capable of future success in medical school, residency, and physician practice. However, many medical schools (for the MCAT) and residency programs (for the USMLE) choose to restrict the candidates they consider for interviews and admission to those with the highest scores.38,44 They cite

  • concerns about need to efficiently screen large numbers of applicants,
  • false beliefs about the predictive ability of minor differences in scores, and
  • pressure from leadership to craft a class with the highest exam metrics to increase institutional rankings according to U.S. News & World Report.

Given the demonstrated population group differences on these exams, this restriction of opportunity to the highest scorers systematically disadvantages UIM students and presents a barrier to diversifying medical school classes and residency programs.37,45,46

 

서술적 평가, 성적, 상에는 모집단 그룹 차이가 존재한다.
Population group differences exist in narrative evaluations, grades, and awards

[서술적 평가]와 [의과대학 성적]은 전공의, 펠로우, 개업의로서 미래의 성공에 필요한 역량에 대한 보다 총체적인 관점을 제공하는 것으로 생각된다. 교직원과 관리자에 의한 학생에 대한 부서별 및 기관별 평가에서도 모집단의 차이가 존재한다. 서술적 평가와 추천서에서 교수진이 사용하는 의대생에 대한 설명은 성별, 성별, 인종, 민족성에 따라 다양하다. 이러한 차이는 (백인이 아닌 학생보다) [백인 학생에게 유리]하다.
Narrative evaluations and medical school grades are thought to provide a more holistic view of the competencies needed for future success as a medical resident, fellow, or practicing physician. Population group differences also exist in departmental and institutional assessments of students by faculty and administrators. Descriptions of medical students used by faculty in narrative evaluations and letters of recommendation vary by sex, gender, race, and ethnicity. These differences favor White students over non-White students.

의학생 수행평가(MSPE)는 레지던트 선발을 목적으로 의과대학에서 학생 성과를 요약하기 위해 작성한 서류다. 최근 MSPE에 대한 연구에서 백인 학생들은 백인 이외의 또래에 비해 "최고", "우수", "우수"와 같은 "뛰어난" 단어로 묘사될 가능성이 더 높았다. 게다가, 여학생들은 남학생들보다 "자상하고" "연민"으로 묘사될 가능성이 더 높았고, [지능과 능력을 나타내는 단어]로 묘사될 가능성이 더 낮았다. 핵심 임상실습 평가에서 언어에 대한 또 다른 최근 연구는 평가자들이 그들의 단어 선택을 통해 성 고정관념을 강화한다는 것을 발견했다. 예를 들어, 여성은 남성보다 "사랑스러운" 것으로 묘사될 가능성이 더 높았고, 남성은 "과학적인" 것으로 묘사될 가능성이 더 높았다.
Medical student performance evaluations (MSPEs) are the documents prepared by medical schools to summarize student performance for the purpose of residency selection. In a recent study of MSPEs, White students were more likely to be described with “standout” words such as “best,” “excellent,” and “outstanding” compared with their non-White peers.32 Further, female students were more likely than males to be described as “caring” and “compassionate” and less likely to be described with words that denote intelligence and competence. Another recent study of language in core clerkship evaluations found that evaluators reinforce gender stereotypes through their choice of words. For example, women were more likely than men to be described as “lovely,” while men were more likely to be described as “scientific.”3

연구들은 또한 수여된 성적에서 인종과 민족적 차이를 보여주었다. 한 학술 의료 센터는 최근 역사적으로 UIM(흑인 또는 아프리카계 미국인, 히스패닉, 미국 인디언/알래스카 원주민 또는 하와이/태평양 원주민) 학생들이 백인 학생들에 비해 모든 임상실습에서 절반의 "Honors" 점수를 받았다는 것을 발견했다. 응급의학(EM) 프로그램에 지원하는 2,884명의 의대생들의 순위를 매기기 위해 사용된 표준 평가서의 수치적 글로벌 평가 순위를 조사한 결과, 흑인 지원자들이 여러 영역에서 백인 지원자들보다 낮은 등급을 받았으며, 여기에는 응급의학과에서 미래의 성공 평정, 순위 목록 예측, 전체 지원자 순위 등이 포함된다.

Studies have also demonstrated racial and ethnic differences in awarded grades. A single academic medical center recently found that students historically UIM (Black or African American, Hispanic, American Indian/Alaska Native, or Native Hawaiian/Pacific Islander) received half as many “honors” grades across all clerkships compared with White students.9 An examination of numeric global assessment rankings in the Standard Letters of Evaluation used to rank 2,884 medical students applying to emergency medicine (EM) programs found that Black applicants were rated lower than White applicants across several domains, including ratings on future success in EM, rank list prediction, and overall applicant ranking.47

[알파 오메가 알파 아너 소사이어티(AOA)]의 회원 자격을 위한 학생 선발에서도 집단 차이가 발생한다. AOA 회원 자격은 미래의 의학에서의 성공을 예측하고 있으며, 회원 자격은 종종 학생들이 가장 경쟁력 있는 레지던트 자리를 얻는 데 유리하다. 최근의 연구는 아시아 의대생들이 백인 학생들보다 AOA에 선발될 확률이 약 50% 낮다는 것을 보여주며, 사회 구성원의 인종과 민족적 불균형을 드러낸다. USMLE 1단계와 2단계 점수, 이중 학위, 연구 생산성, 리더십 활동 및 지역사회 봉사에 전념하는 시간 등 수많은 학업 성취도를 감안하더라도, 흑인 의대생이 백인 학생보다 AOA에 선출될 가능성이 거의 80% 낮다. 이러한 차이는 인종과 소수민족 의대생들이 동등한 성취에 대해 차등적으로 보상을 받는다는 것을 암시한다. 일부 기관들은 이러한 관측 때문에 AOA 회원 자격을 정지하기로 결정했다.

Population group differences also arise in selection of students for membership in the Alpha Omega Alpha Honor Society (AOA). AOA membership is predictive of future success in academic medicine, and membership often advantages students in obtaining the most competitive residency positions.39,48,49 Recent studies reveal racial and ethnic disparities in society membership, with Asian medical students being approximately 50% less likely than White students to be selected into AOA. Black medical students are nearly 80% less likely than White students to be elected into AOA, even when accounting for numerous measures of academic achievement including USMLE Step 1 and 2 scores, dual degrees, research productivity, and hours dedicated to leadership activities and community service.30 This disparity suggests that racial and ethnic minority medical students are differentially rewarded for comparable achievement. Some institutions have chosen to suspend membership in AOA because of these concerning observations.50

서술적 평가, 사무원 직급, 추천서, 명예회원의 이러한 차이는 개인과 직업 모두에게 지속적이고 부정적인 결과를 준다. 2005~2015년 미국 의대 졸업생들을 분석한 결과, 흑인 또는 아프리카계 미국인, 히스패닉계, 아시아계, 미국 인디언/알래스카 원주민 졸업생들은 모두 USMLE 1단계 점수를 감안하더라도 백인 졸업생들보다 GME에서 연수 자리를 확보할 가능성이 낮았다. 게다가, 의대 졸업 후 GME에 배치되지 않은 흑인 및 히스패닉 졸업생들의 수는 연구 내내 증가했다. GME 교육은 의료 면허 취득을 위해 필요하기 때문에, 의과대학 졸업 후 입학을 연기하거나 레지던트 프로그램에 들어갈 수 없는 것은 상당한 학생 부채를 가지고 있는 학생들에게 상당한 경제적 결과를 초래한다. 직업 다양화를 위한 목표에 대한 결과는 분명하다.
These differences in narrative assessments, clerkship grades, letters of recommendation, and honor society membership impart sustained, negative consequences for both individuals and the profession. In an analysis of U.S. medical school graduates from 2005 to 2015, Black or African American, Hispanic, Asian, and American Indian/Alaskan Native graduates were all less likely than White graduates to secure training positions in graduate medical education (GME), even after accounting for USMLE Step 1 scores.51 Moreover, the number of Black and Hispanic graduates unplaced in GME after medical school graduation increased throughout the study. Because GME training is requisite for medical licensure, delayed entry or inability to enter a residency program after medical school has substantial economic consequences for students who may also have considerable student debt. The consequences on goals to diversify the profession are clear.

 

의료교육 평가에서 모집단 차이의 잠재적 원인
Potential causes of population group differences in assessment in medical education

인구 집단 차이는 소수 인종, 민족, 성 소수자 사이의 의료 교육 평가에서 존재한다. 이 문제에 대한 간단한 설명을 찾는 것은 유혹적이다. 일부에서는 평가에서 모집단 차이의 존재만으로도 평가 과정에서 명백한 편견과 차별을 확인한다고 주장해왔다. 확실히, 일부 평가는 잘못 설계될 수 있고, 일부 평가자는 일관되게 편향될 수 있다. 다른 사람들은 집단 차이가 영향을 받는 집단 내의 다른 적성을 반영한다고 주장한다. 실제로, 의과대학 내에서, 많은 다른 사회 집단과 정체성의 다른 학생들은 다양한 전공에 대한 다른 적성과 관심을 보여준다. 만약 이 문제의 원인이 [개별 학습자 또는 평가자 수행]에 있다면, 우리는 [서로 다른 평가 방법]을 가진 [서로 다른 기관]에서 수행된 연구에서, [동일한 결과]를 볼 것으로 기대하지 않을 것이다. WRIM 학생을 유리하게 하는 차이의 [보편성과 일관성]은 체계적 힘이 작동하고 있을 가능성이 있음을 시사한다.
Population group differences exist in medical education assessments between majority and racial, ethnic, and gender minorities; they constrain individuals’ opportunities and contribute to challenges in diversifying the profession. It is tempting to seek a simple explanation to this problem. Some have argued that the mere existence of population group differences in assessment confirms overt bias and discrimination in the assessment process. Certainly, some assessments may be poorly designed, and some assessors may be consistently biased. Others have posited that population group differences reflect differential aptitude within affected populations. Indeed, within any medical school, different students from many different social groups and identities demonstrate different aptitudes for and interest in various specialties. If the origins of this problem resided with individual learner or assessor performance, we would not expect to see the same results in studies done at different institutions with different assessment methods. The universality and consistency of differences advantaging those from groups WRIM suggest that systematic forces are likely operational.

다른 사악한 문제와 마찬가지로, 평가의 불평등 문제를 해결하기 위해서는 가능한 원인과 잠재적인 해결책에 대한 더 넓은 시각이 필요하다. 공공 보건에 사용되는 [사회-생태학적 모델]은 개인의 결과가 더 광범위한 조직 및 사회 시스템의 맥락에서 고려되어야 한다는 것을 인식한다. 평가에서 형평성 문제에 이 모델을 적용하면 관찰된 모집단 차이의 가능한 원인에 대한 통찰력을 제공하고 여러 수준에서 개입을 계획할 필요성을 보여준다(그림 2 참조).

As with other wicked problems, solving the problem of inequity in assessment requires a broader view of possible causes and potential solutions. The social–ecological model used in public health recognizes that individual outcomes must be considered in the context of broader organizational and social systems.52 Applying this model to the issue of equity in assessment provides insights into possible causes of observed population group differences and illustrates the need to plan interventions at multiple levels (see Figure 2).

 

평가의 형평성에 대한 우리의 작업 정의는 평가의 불평등에 대한 그들의 잠재적 기여에 대한 제도적 시스템을 테스트하는 데 사용될 수 있다. 평가의 형평성은 학생들이 다음을 할 수 있는 공평한 기회를 가질 때 존재한다. 

  • 학습(맥락적 형평성); 
  • 평가, 코칭(학습을 위한 평가) 
  • 성적, 진급, 졸업(학습의 평가) 
  • 입증한 성과에 기초한 후속 기회에 선발. 이 때 입증한 성과는
    • 미래의 성공을 예측해야 하고(도구적, 순위를 위한 평가)
    • 학습 경험이나 평가가 학습자, 평가자 또는 환경의 개인적 또는 사회적 특성과 관련된 [구조적 또는 대인적 편견에 의해 영향을 받지 않아야] 한다.

Our working definition of equity in assessment can be used to test institutional systems for their potential contributions to inequity in assessment. Equity in assessment is present when students have equitable opportunities to:

  • learn (contextual equity);
  • be evaluated, coached (assessment for learning);
  • be graded, advanced, graduated (assessment of learning); and
  • be selected for subsequent opportunities based on demonstrated achievements
    • that predict future success in medicine (instrumental, assessment for ranking) and
    • that neither learning experiences nor assessments are influenced by structural or interpersonal bias related to personal or social characteristics of the learner, assessor, or context of the assessment. 

이러한 조건이 충족되지 않으면 평가의 불평등이 존재한다. 

Inequity in assessment exists if these conditions are not met. Supplemental Digital Appendix 1 at https://links.lww.com/ACADMED/B18 summarizes examples of inequity in each of these domains relevant to assessment.

프로그래밍 평가 전략을 설계하는 교육자의 직접적인 통제 하에 있지 않을 수도 있지만 [맥락적 형평성]을 고려하는 것은 필수적이다. [특정 모집단에 체계적으로 불이익을 주는 학습 환경의 과제]를 해결하지 않고, [내재적 및 도구적 평가 절차와 정책에서 형평성]만을 최적화하는 작업이 수행된다면, 평가 결과의 불평등은 유지될 것이다. 
It is vital to consider contextual equity, even though it may not be under the direct control of educators who design programmatic assessment strategies. If work is done to optimize equity in intrinsic and instrumental assessment procedures and policies without addressing challenges in the learning environment that systematically disadvantage one population and not others, then inequity in assessment outcomes will remain. Case studies outlined in Supplemental Digital Appendix 2 at https://links.lww.com/ACADMED/B18 illustrate how the elements of inequity impact learners in the clinical learning environment.

모집단 그룹 차이는 불평등이나 편견이 아닌 다른 이유로 발생할 수 있습니다. [특정 모집단이 평가 프로세스에 의해 평가되고 측정된 특성을 일관되게 보여줄 가능성]이 더 높기 때문에 모집단 그룹 차이가 존재할 수도 있다. 위제세케라와 동료들은 공감과 환자 중심성을 강조하는 기준으로 여성이 남성보다 2배 이상 골드 휴머니즘 아너 소사이어티(GHHS)에 가입할 가능성이 높다고 확인했다. 평가에서 형평성에 대한 우리의 [작업 정의working definition]는 [특정 모집단이나 그룹이 가치 있는 특성을 일관되게 보여줄 가능성이 더 높은지] 또는 [선택 과정이 불평등한지] 여부에 대한 질문을 탐구하기 위한 렌즈이다.

  • 여성이 남성보다 공감과 환자 중심성이 더 뛰어난가(개인의 적성과 성취도)
  • 남성이 공감과 환자 중심성을 보여주는 방법이 평가자 및/또는 평가 방법에 의해 동등하게 포착되었는가(내재적 형평성)
  • 남성과 여성은 이러한 특성을 입증하기 위해 예상되는 방법으로 코칭을 받을 수 있는 기회가 동등한가? ('학습을 위한' 맥락과 평가)
  • 평가 맥락은 남성과 여성이 이러한 특성을 입증할 수 있는 동등한 기회를 허용하는가? ('학습의' 맥락과 행동)
  • 마지막으로, 조직적 가치 설명: 
    • 이러한 특성이 미래의 의사들에게 측정되고 개인을 구별하는 데 사용될 만큼 충분히 중요한가? (본질적 및 도구적 형평성) 

Population group differences may occur for reasons other than inequity or bias. Population group differences may exist because one population is consistently more likely to demonstrate the characteristics valued and measured by the assessment process. Wijesekera and colleagues identified that women were more than twice as likely as men to be inducted into the Gold Humanism Honor Society (GHHS), with criteria emphasizing empathy and patient centeredness.53 Our working definition of equity in assessment is a lens to explore the question of whether one population group is consistently more likely to demonstrate the characteristics valued or whether the selection process is inequitable.

  • Do women have more empathy and patient centeredness than men (individual aptitude and achievement)?
  • Are the ways that men demonstrate empathy and patient centeredness equally captured by assessors and/or by the assessment method (intrinsic equity)?
  • Do men and women have equal opportunity to receive coaching (context and assessment for learning) in the expected ways to demonstrate these traits?
  • Does the assessment context allow men and women equal opportunities to demonstrate these traits (context and conduct of learning)?
  • And finally, an organizational value statement:
    • Are these traits important enough to future physicians to be measured and used to differentiate among individuals (intrinsic and instrumental equity)?

이 예는 남성과 여성 학생을 다르게 형성하는 선행 기관, 문화 및 경험의 중요성을 강조하며, 평가 전략에 대한 유효한 질문을 제기하는 동시에 이러한 특징의 입증에 진정한 차이를 초래할 수 있다. GHHS가 이러한 발견에 어떻게 반응하는지는 제도적 가치를 반영하고 구체화하며 궁극적으로 촉진할 것이다.

This example both highlights the importance of antecedent institutions, cultures, and experiences that shape men and women students differently and may lead to true differences in demonstration of these traits while also raising valid questions about assessment strategies. How the GHHS responds to these findings will reflect, embody, and ultimately promote institutional values.

의료교육의 공정성 평가체계
A Framework for Equitable Assessment in Medical Education

의료 교육 평가의 형평성과 공정성에 대한 문헌의 통찰, 의료 교육 평가에서 평가의 차이가 존재하는 이유에 대한 가설, 고품질 평가를 지원하는 이론을 바탕으로 [평가의 형평성을 고려하기 위한 프레임워크]를 제안한다. 이 프레임워크는 효과적인 조직이 목적 중심적이고 원칙적인 플랫폼에서 개선 작업을 시작한 후 문화를 형성하고 시스템을 구축하며 이러한 원칙을 반영하는 결과를 달성할 수 있는 도구를 선택하는 것을 인식하는 조직 우수성을 위한 Shingo 모델을 기반으로 합니다. 목록 1은 [평가의 형평성을 위한 Shingo 모델] 적용을 가이드하는 원칙을 요약한 것이다.
Drawing on insights from the literature on equity and fairness in medical education assessments, hypotheses for why disparities in assessment exist in medical education assessment, and theories supporting high-quality assessment, we propose a framework for considering equity in assessment. This framework is based on the Shingo model for organizational excellence, which recognizes that effective organizations begin their improvement work from a purpose-driven and principled platform and then move to shape the culture, build the systems, and select the tools that can achieve the results that reflect those principles.54 List 1 outlines principles that guide application of the Shingo model to equity in assessment.

가이드 원칙
Guiding principles

특정 기관의 평가 결과는 여러 기관 및 조직(전공의 및 펠로우십 프로그램, 면허 및 인증 위원회, 병원 자격 부여 부서, 전문 사회 및 정부 당국)에 의해 사용될 것이기 때문에, 의학교육에서의 [평가의 형평성에 대한 모델]은 [프로그램 및 의료 기관의 경계를 평등을 초월]해야 한다. 따라서 의료 교육에서 평가에서 형평성을 성공적으로 달성하려면 의료 및 의료 교육에서 우리의 업무에서 필수적인 요소로서 형평성을 발전시키기 위한 [전국적인 집단적 약속]이 필요하다.
Because results of assessments at any given institution will be used by multiple institutions and organizations (residency and fellowship programs, licensing and certifying boards, hospital credentialing units, professional societies, and governmental authorities), a model for equity in assessment in medical education must transcend program and institutional borders. Thus, successfully achieving equity in assessment in medical education requires a nationwide, collective commitment to advance equity as an essential element in our work in health care and medical education.

의학교육에서 모든 평가의 목적은 [모든 졸업생]이 [모든 환자]에게 [고품질의 환자 중심적이고 공평한 치료]를 제공하는 데 [필요한 역량]을 입증하는 것이다. 이러한 목적은 의료 및 의료 교육 문화의 설계, 구현 및 지속적인 개선, 학습자를 평가, 평가, 승진, 졸업 및 인증하기 위해 사용하는 시스템과 전략, 그리고 전략을 구현하기 위해 선택하는 도구를 추진해야 합니다.

The aim of all assessment in medical education is to ensure that every graduate of schools and training programs has demonstrated the competencies needed to provide high-quality, patient-centered, equitable care for all patients. This purpose must drive the design, implementation, and continuous improvement of the culture of medicine and medical education; the systems and strategies we use to assess, grade, promote, graduate, and certify learners; and the tools we select to implement our strategies.

문화
Culture

문화는 조직의 규범, 기대, 신념, 가치를 나타냅니다. 문화적 규범은 명시적이고 암묵적이며 조직 내 개인들이 보여주고 보상하는 행동에 반영된다. 분위기climate는 [문화의 개별적인 경험]이다.
Culture represents an organization’s norms, expectations, beliefs, and values. Cultural norms are both explicit and tacit and are reflected in the behaviors exhibited and rewarded by individuals in the organization. Climate is the individual experience of culture.


형평성과 포용을 지지하는 문화를 달성하려면 우리가 의학에서 수월성을 정의하고, 개발하고, 인식하는 방법에 대한 오랜 믿음의 재보정이 필요하다. 21세기에는 복잡한 만성질환 환자를 돌보기 위해 필요한 팀 기반 전달 모델이 모든 팀원이 우수해야 한다. 그러므로 우리 환자와 공동체의 건강에 중요한 것은 [최고의 의사가 얼마나 훌륭한가]가 아니라, [모든 의사가 얼마나 훌륭한가]이다. 이 견해는 평가의 형평성과 잘 맞아떨어진다. 우리의 평가 문화는 모든 학습자들이 이러한 성장을 지원하기 위해 헌신하는 시스템과 다른 전문가들의 도움을 받아 의료 경력을 통해 성장하고 발전해야 한다는 믿음을 수용해야 한다. 우리의 초점은 [졸업반 중 상위 10%를 식별하는 것]이 아니라, [모든 졸업생이 안전하고 질 높은 환자 치료에 필요한 역량 임계값을 초과하는지 확인하는 평가를 설계하는 것]이어야 한다.
Achieving a culture that supports equity and inclusion requires recalibration of long-standing beliefs about how we define, develop, and recognize excellence in medicine. In the 21st century, the team-based delivery model needed to provide care for patients with complex chronic diseases requires that all team members be excellent. Therefore, what matters to the health of our patients and communities is not how good the very best physician is, but how good every physician is. This view aligns well with equity in assessment. Our culture of assessment must embrace the belief that all learners can and must grow and develop throughout their medical careers, aided by systems and other professionals committed to supporting this growth. Our focus must be to design assessments to ensure every graduate exceeds the competency thresholds necessary for safe, high-quality patient care, rather than to identify the top 10% of a graduating class.

평가 시스템
Systems of assessment

시스템은 평가에서 내재적 형평성을 지원하도록 설계되어야 한다.
Systems must be designed to support intrinsic equity in assessment.

교육자는 다음과 같은 시스템을 설계해야 한다.

  • 평가 기준을 명시적으로 밝히고,
  • 학습 기회를 균등화하고,
  • 모든 학습자에게 형성적 피드백을 제공하고,
  • 개별 평가자의 무의식적 편견이 학습자의 성적에 미치는 해로운 영향을 최소화하고,
  • 성과 사고방식보다는 성장형 사고방식을 인식하고 보상

Educators must engineer systems that

  • explicitly articulate criteria for assessment,
  • equalize the learning opportunities,
  • provide formative feedback for all learners,
  • minimize the deleterious impact of unconscious bias of any individual evaluator on a learner’s grades, and
  • recognize and reward growth rather than performance mindset.

경험적 데이터가 공평한 평가 프로그램의 설계를 안내하는 것은 거의 없지만, 평가를 위한 두 가지 현재 프레임워크는 형평한 평가 프로그램의 개발을 지원할 수 있다:competency-based medical education (CBME) and programmatic assessment focused on equity. 이러한 접근법은 평가 및 평가 결과의 불평등에 기여하는 개인과 그룹의 무의식적 편견을 최소화할 수 있는 잠재력을 가지고 있다.

While little empirical data guide the design of equitable programs of assessment, 2 current frameworks for assessment align with and can support development of equitable programs of assessment: competency-based medical education (CBME) and programmatic assessment focused on equity. These approaches have the potential to minimize unconscious bias in individuals and groups that contribute to inequities in assessment and assessment outcomes.

[CBME]는 의학교육의 기대 성과를 정의하고 이정표를 사용하여 역량 달성 예상 궤적을 요약한다. CBME의 평가는 의과대학에서 독립적인 실습으로 이어지는 연속체에 있는 모든 개인들이 계속해서 배우고 성장하고 있다는 믿음에 기초한다. 이와는 대조적으로, [전통적인 평가 방식]은 [성장을 지원하는 것]이 아니라, [단점이 있는 학습자를 식별]하는 데 초점을 맞추고 있습니다. 이러한 [결핍deficit 접근법]은 불균형적으로 UIM 학습자에게 불리하며, 모든 학습자의 성장 마인드를 배양하기 위해 평가 정보를 사용할 기회를 놓친다. 학습의 관점에서, [고군분투하는 학습자를 식별하는 데 초점을 맞추는 것]은 전형적으로 [모든 학습자가 개발이 필요한 영역을 가지고 있고 지속적으로 학습하고 성장하는 것으로 가정되는 발달 초점developmental focus]과 배치된다. 철저한 의예과 교육을 받지 못하는 것은, UIM 학습자에게 불균형적으로 영향을 미치는 흔한 시나리오로, 이렇게 [고군분투하는 학습자]로 분류될 수 있다. 일단 이 딱지가 붙으면, 학습자는 개인적으로나 직업적으로나 그 결과에 시달리게 된다.
CBME defines desired outcomes of medical education and outlines the expected trajectory of competency achievement using milestones.55–57 Assessment in CBME is based on the belief that all individuals on the continuum of medical school into independent practice are continuing to learn and grow.58 In contrast, traditional approaches to assessment focus not on supporting growth but on identifying learners with shortcomings.59–62 This deficit approach disproportionately disadvantages UIM learners and misses the opportunity to use assessment information to foster a growth mindset in all learners. From a learning perspective, a focus on identifying struggling learners typically contradicts a developmental focus in which all learners are assumed to have areas in need of development and to be continuously learning and growing.63 Any learner with less exposure or less rigorous premedical training, scenarios that disproportionately affect UIM learners, is particularly vulnerable to being labeled a struggling learner. Once this label is applied, the learner suffers the consequences, both personally and professionally.

[형평성에 초점을 맞춘 프로그램 평가]는 개별 학습자와 학습자의 궤적에 대한 [총체적이고 균형 잡힌 관점]을 위해 노력합니다. 이 목표는 여러 가지 다른 맥락에서 학습자의 작업의 많은 샘플을 수집하고 분석함으로써 달성된다. 정량적 데이터 외에도 수행에 대한 [내러티브 설명자]와 같은 [정성적 평가]는 학습자 개선을 안내하고 학습자 역량에 대한 엄격한 결정에 기여할 수 있는 수행의 뉘앙스에 대한 정보를 제공한다.64

Programmatic assessment focused on equity strives for a holistic, well-rounded view of individual learners and their trajectory. This aim is achieved by collecting and analyzing many samples of learners’ work in multiple different contexts. In addition to quantitative data, qualitative assessments, such as narrative descriptors of performance, provide information about the nuances of performance that can guide learner improvement and contribute to rigorous decisions about learner competence.64

형평성을 더욱 서포트하기 위하여, [프로그램 평가]에는 진급과 졸업에 대한 높은 이해와 종합적 결정을 하기 위해 개인이 아닌 [위원회에 의존하는 시스템]이 포함된다. 형평성을 높이기 위한 최적의 위원회 구조와 기능의 세 가지 핵심 요소가 있다.

  • 그룹 구성원 자격
  • 데이터 관리
  • 의사 결정 절차가 .

For further support of equity, programmatic assessment includes systems that rely on committees rather than individuals to make high-stakes, summative decisions about advancement and graduation.65,66 Three critical elements of optimal committee structure and function can advance equity:

  • group membership,
  • data management, and
  • decision-making procedures.

 

  • [그룹]은 [많은 데이터 포인트]로 무장하여, ["군중의 지혜"가 충분히 고려된 결정]을 내리기 위해 다양한 의견을 끌어낼 수 있는 기회를 만든다. 구성원들이 의사결정의 질을 강화하기 때문에 [다양한 집단]이 개인이나 동질적 집단보다 낫다. [흔한 편견에 대한 교육]은 공정한 평가를 위하여, [인지적 지름길에 대한 인간의 취약성]이나 [학습자의 기회를 단축시킬 수 있는 개인적 선호]를 인식하게 한다.
  • [이용 가능한 양질의 데이터]와 [잘 조직된 정보에 대한 접근 용이성]은 그룹 의사 결정을 강화합니다. 여러 출처의 균형 잡힌 데이터가 없을 경우, 그룹 구성원은 인상이나 제한된 데이터에 기초한 결정을 내릴 수 없으며, 이는 다시 편향의 위험을 초래하는 과정이다.
  • 마지막으로, [데이터 검토 및 그룹 토론을 위한 구조화된 절차]는 모든 학습자가 사용 가능한 정보의 총체를 기반으로 평가되도록 합니다.
  • A group invites opportunity for the “wisdom of the crowd,” armed with a large number of data points, to draw on a diversity of opinions to make well-considered decisions. Diverse groups outperform individuals or homogeneous groups because members strengthen the quality of decisions made.67 Training about common biases brings awareness of the human vulnerability for cognitive shortcuts and personal preferences that can shortchange every learner’s opportunity for fair assessment.68 
  • The quality of data available and ease of accessing well-organized information strengthen group decision making. Absent well-rounded data from multiple sources, group members may default to making decisions based on impressions or limited data, a process that again introduces risk for bias.
  • Finally, structured procedures for data review and group discussions help ensure that all learners are evaluated based on the totality of information available.

시스템은 상황별 형평성을 해결하도록 설계되어야 합니다.
Systems must be designed to address contextual equity.


평가 결과에서 형평성을 달성하려면 [맥락적 형평성]에 대한 주의가 필요합니다. 평가의 커리큘럼과 프로그램은 모두 다른 제도 시스템, 특히 교수-학습을 위하여 [환자 진료와 교수 지원을 조정하는 시스템]에 크게 의존한다. 평가 시스템을 설계하는 교육자들은 소수자 학습자들을 위한 학습 환경을 최적화하기 위해 학업 건강 시스템의 다른 지도자들과 협력해야 한다.
Achieving equity in assessment outcomes requires attention to contextual equity. Both curricula and programs of assessment are highly dependent on other institutional systems, specifically those that orchestrate patient care and faculty support for teaching and learning. Educators who design systems of assessment must work with other leaders in academic health systems to optimize the learning environment for minority learners.

시스템은 평가 결과에서 도구적 형평성과 형평성을 다루도록 설계되어야 한다.
Systems must be designed to address instrumental equity and equity in assessment outcomes.

인가자(의료교육 및 대학원 의료교육 인가위원회)와 평가 데이터를 수집 및 사용하는 조직의 리더(전국 거주자 일치 프로그램, 인증 위원회)는 [형평성 원칙에 부합하는 데이터 프레젠테이션 시스템]을 설계하여 평가의 형평성을 지원할 수 있다. 교육 기관 및 리더가 [평가 데이터를 의도된 목적으로만 사용할 책임]을 갖게 해야 한다.
Accreditors (Liaison Committee on Medical Education and Accreditation Council for Graduate Medical Education) and leaders of organizations that collect and use assessment data (National Resident Match Program, certifying boards) can support equity in assessment by designing systems of data presentation that align with principles of equity and by holding educational institutions and leaders accountable for using assessment data only for intended purposes.

도구들
Tools

[도구]는 시스템 내에서 원하는 결과를 얻기 위해 개인이 사용하는 기술, 프로세스, 인센티브 및 디스인센티브를 말합니다. 공평한 평가에 사용되는 도구를 선택하여 시스템 우선 순위를 지원하고 운영합니다. 도구에는 다음이 포함된다.

  • 증거 찾기 도구(환자, 임상 추론 및 필기 작업 제품과의 상호작용에 대한 학습자의 직접 관찰 및 토론),
  • 데이터 표시 도구,
  • 데이터 분석 도구,
  • 교수 개발 도구
  • 커뮤니케이션 도구

Tools are the technologies, processes, incentives, and disincentives employed by individuals within the system to achieve desired results. Tools used in equitable assessment are selected to support and operationalize system priorities. Tools include

  • evidence-seeking tools (direct observation of and discussion with learners about interactions with patients, clinical reasoning, and written work products),
  • data display tools,
  • data analytic tools,
  • faculty development tools, and
  • communication tools.

결과.
Results

[결과]는 평가 모델의 가이드 원칙을 보여주고, 확인하게 해주는 측정 가능한 결과입니다. 결과는 원하는 결과를 달성하기 위해 설계된 도구와 시스템을 다듬는 데 필수적인 [피드백 메커니즘]을 제공합니다. 결과는 기관, 조직 또는 전문 의료 교육 커뮤니티의 문화를 강화합니다.
Results are the measurable outcomes that demonstrate and affirm the assessment model’s guiding principles. Outcomes serve an essential feedback mechanism for refining the tools and systems engineered to achieve the desired results. Results reinforce the culture of the institution, organization, or professional medical education community.

의료 서비스 제공과 의료 교육에 있어 형평성을 증진하기 위한 우리의 약속을 이행하기 위해 개인, 기관 및 국가 조직은 목록 1에 설명된 결과를 위해 노력해야 한다. [평가를 위한 형평성 원칙]과 [증거 기반 전략]을 고수한다고 해서, 특정 기관이 class마다 존재하는 모든 인구 집단 차이를 피할 것이라는 보장은 없다. 주어진 class의 크기가 작거나, 해마다 학생들의 흥미와 포부가 다양하기에, 모든 차이도 제거하는 것이 불가능할 수 있다. 대신, 의료 교육에서 평가의 형평성이 달성되었다는 [더 나은 지표]는 [역사적으로 URM이거나 의학에 의해 소외된 그룹의 학습자 모집단]에 대해서 [국가 수준의 차이가 없다는 것]이다.

To fulfill our commitment to advancing equity in health care delivery and in medical education, individuals, institutions, and national organizations must commit to striving for the results outlined in List 1. Adhering to equity principles and evidence-based strategies for assessment does not guarantee that any given institution will avoid all population group differences in their classes. The small sample size of a given class and variability of student interest and aspirations from year to year may make a goal of eliminating any differences unfeasible. Instead, a better indicator that equity in assessment in medical education has been achieved will be the absence of national-level disparities for populations of learners from groups that are historically URM or that have been marginalized by medicine.

연구 의제
Research Agenda

위에서 제안한 평가의 형평성 모델은 의료 교육 시스템에 만연해 있는 불평등을 해결하기 위한 약속을 요구한다. 편견과 차별의 감소를 입증하는 필요한 증거 수집을 안내하는 강력한 연구 의제는 아래에 요약되어 있다.
The above proposed model for equity in assessment demands commitment to addressing inequities that have pervaded the medical education system. A robust research agenda to guide the collection of needed evidence demonstrating reduction in bias and discrimination is outlined below.

평가에서 [내재적 형평성]에 대한 연구
Research into intrinsic equity in assessment

학습자 평가: UIM 학습자의 성공에 대한 장애물과 장벽에 대해 많이 쓰여졌지만, [반-결핍antideficit 렌즈]는 UIM 학습자를 성공을 위해 포지셔닝하는 강점과 특성에 초점을 두는 다른 접근 방식을 취한다. 하퍼의 엄격한 작업은 대학 교육을 준비하고 추구하는 [흑인 남성의 (단점보다는) 성공에 기여한 요소들을 묘사하기 위해 반-결핍 렌즈를 사용]했다. 이 접근법은 UIM 학습자들이 성공을 거두도록 하는 동기, 성과 특징, 개인 및 제도적 특성을 연구하는 모델 역할을 할 수 있다. 

Learner assessment: While much has been written about obstacles and barriers to success for UIM learners, the antideficit lens takes a different approach by drawing focus to the strengths and characteristics that position UIM learners for success. Harper’s rigorous work used an antideficit lens to describe the factors that contributed to success rather than the shortcomings of Black men preparing for and pursuing college education. This approach can serve as a model for studying the motivations, performance features, and individual and institutional characteristics that set UIM learners up for success.69

교육자들은 실제의 성공을 예측하는 학습자 궤적의 특성을 설명하는 엄격한 연구로부터 이익을 얻을 것이다. 그런 다음 교육자는 바람직한 학습자 궤적에 대한 유효한 데이터를 캡처할 수 있는 평가 방법을 결정하여 표준 평가 방법에서 초점을 이동할 수 있다.

Educators will benefit from rigorous studies that explicate the characteristics of learner trajectories that predict success in practice. Educators can then determine which assessment methods can capture valid data about favorable learner trajectories and, thus, shift focus away from normative assessment methods.

[맥락적 형평성] 평가 연구
Research into contextual equity in assessment

학습자 경험: UIM 학습자를 위한 학습 환경의 영향력 있는 측면을 이해하면 연구자들은 환경, 학습자 만족도 및 성취도 사이의 관계를 조사하여, [UIM 학습자의 성취를 최대화할 기회를 방해하는 구조적 장벽을 해결하는 개선 사항]을 알릴 수 있다. 학습 환경의 개인, 사회적, 물리적 및 조직적 요소에 초점을 맞춘 또 다른 접근 방식은 UIM 학습자의 고유한 경험을 평가하고 성장에 역행하는 경험을 해결하기 위한 솔루션을 제안할 수 있는 잠재력을 가진 그룹펜의 프레임워크이다. 

Learner experience: Understanding the influential aspects of the learning environment for UIM learners empowers researchers to examine relationships between the environment, learner satisfaction, and achievement to inform improvements that address any structural barriers impeding UIM learners’ opportunities to maximize their achievement.70 Another approach, with a focus on person, social, physical, and organizational elements of the learning environment, is Gruppen’s framework, which holds potential for evaluating unique experiences of UIM learners and proposing solutions to address experiences that are counter to growth.71

교육과 환자 관리를 모두 최적화하기 위한 이중 목표를 가진 현재 임상 학습 환경은, 해결책을 찾기 위해 조사할 가치가 있는 긴장을 조성한다. 순환형 의학교육 모델에서 학습자와 감독자, 특히 다른 배경이나 정체성을 가질 수 있는 감독자 사이의 [의미 있는 관계와 신뢰를 배양하는 시스템과 구조]에 대한 추가 연구가 필요하다. 이 작업에는 조직 문화와 분위기를 최적화하는 데 중점을 두어야 합니다. 조직은 다양성과 포괄성을 지지하지만, 고위 구성원의 오랜 이데올로기를 바꾸거나 미시적 공격을 최소화하기 위해 고군분투할 수 있다. 이러한 문제에 개입하기 위한 증거 기반 전략이 필요하다.

The current configuration of the clinical learning environment, with dual aims to optimize both education and patient care, creates tensions that deserve investigation to find solutions. Further research is needed into systems and structures that foster meaningful relationships and trust between learners and supervisors, particularly those who may be of different backgrounds or identities, in a rotational model of medication education. This work must include a focus on optimizing organizational culture and climate. An organization may espouse diversity and inclusivity, but struggle to change long-standing ideologies of senior members or minimize microaggressions; evidence-based strategies for intervening on these problems are needed.

평가의 [도구적 형평성]에 관한 연구
Research on instrumental equity in assessment

[교육 프로그램에서 선발]은 의사 결정에 영향을 미칠 수 있는 의식적 또는 무의식적 편향의 가능성이 있기에, 추가 연구를 수행할 가치가 있는 학습자 평가의 또 다른 측면이다. 보건 직업 훈련 프로그램에 대한 입학을 조사하는 현재의 증거는 주로 단일 기관 연구로 구성되어 있지만, 일반적으로 개입이 계층 구성을 다양화하는 데 효과적이라는 것을 고무적으로 보여준다. UIM을 비롯한 다양한 학습자들이 보건 직업 분야에서 성공을 거둘 수 있도록, 선발 뿐만 아니라 학업적 지원에 대한 효과적인 접근 방식을 입증하기 위해 멀티센터, 종적 연구를 통한 추가 연구가 필요하다. 연구 노력은 평가의 긴장을 인정해야 한다. 예를 들어, [학습을 위한 평가] 대 [순위를 위한 평가와 선발] 사이의 긴장은 평가의 형평성에 관한 논의에서 중심적인 것으로 남아있다.

Selection of learners for positions in training programs is another aspect of learner assessment deserving of further research due to potential for conscious or unconscious bias to influence decision making. Current evidence examining admissions to health professions training programs comprises mainly single-institution studies but encouragingly shows that, in general, interventions are effective at diversifying class composition.72 Further research is needed through multicenter, longitudinal studies to demonstrate effective approaches to not only selection but also academic support to ensure that UIM and other diverse learners achieve success in health professions careers. Research efforts must acknowledge tensions in assessment.73 For example, the tension between assessment for learning vs assessment for ranking and selection remains central in discussions regarding equity in assessment.

평가의 형평성을 지원하는 [교수의 역할]에 관한 연구
Research on preparation of faculty for their roles supporting equity in assessment

교수 개발: 연구에 따르면 의사의 암묵적 편견이 환자에게 미치는 부정적인 영향이 있다. 의학 학습자의 평가에도 유사한 편견이 존재한다. 편중 위험을 최소화하는 고품질 평가를 수행하기 위해 교직원 육성의 편익을 어떻게 개입하고 측정할 수 있는지 이해하기 위한 연구가 필요하다.

Faculty development: Studies demonstrate the negative effects of physicians’ implicit bias on their patients74; similar bias exists in evaluation of medical learners.9,30 Research is needed to understand how to intervene and measure the benefits of faculty development to conduct high-quality assessment that minimizes the risks of bias.

[평가 결과]의 형평성에 대한 연구
Research into equity in assessment outcomes

[공정한 평가 실천]이 [학습자 및 학습자가 복무할 환자에게 더 나은 결과를 제공하는지 여부와 방법]을 확인하기 위해 증거가 필요하다. 예를 들어, [제공자의 문화적 역량을 강화하기 위한 개입]은, 선의는 있지만, 모두 원하는 결과를 달성하지는 못한다. 어떤 평가 접근법이 학업적 커리어 뿐만 아니라, 모든 전공 분야와 환경에서 UIM 학습자의 진로 추구를 최적화하는지를 검토하기 위한 연구가 필요하다.

Evidence is needed to confirm whether and how equitable assessment practices produce better outcomes for learners and the patients they serve. For example, interventions to enhance providers’ cultural competency, though well-intentioned, do not all achieve desired outcomes.75 Research is needed to examine what approaches to assessment optimize UIM learners’ pursuit of careers in any and all specialties and settings as well as in academic careers.

[프로그램 평가]를 위한 평가 연구
Research into assessment for program evaluation

평가에서 불평등과 편향에 대응하려면, 프로그램 평가에 세심한 주의를 기울이는 프로그램 접근법이 필요하다. 프로그램 평가에 대한 [현실주의적 접근]은 어떤 개입이 효과가 있는지, 효과가 없는지를 묻는 것뿐만 아니라 개입의 맥락을 고려함으로써 이러한 요구를 충족시킨다. 간단히 말해서, 현실주의 평가는 다음과 같이 묻습니다. "어떤 상황에서 누구에게 효과가 있고, 왜 효과가 있는가?" 맥락을 이해하면 다른 프로그램들이 그들 자신의 문맥에 대한 개입의 타당성과 적용 가능성을 고려할 수 있다.

Counteracting inequity and bias in assessment requires a programmatic approach with careful attention to program evaluation. A realist approach to program evaluation meets these needs not only by asking what interventions work or don’t work but also by considering the context of the interventions. Put simply, realist evaluation asks: “What works for whom in what circumstances, and why?”76 Understanding the context allows other programs to consider the feasibility and applicability of interventions to their own context.

과제 및 의도하지 않은 결과
Challenges and Unintended Consequences

형평성에 대한 논의는 많은 사람들에게 불안감을 주고, 능력(주의)의 개념에 직면한다. 미국 사회의 "근본적 신화"라고 불리는 능력merit은 개인의 재산, 그의 (심리학) 직업윤리와 본질적인 재능으로 여겨진다. 이 때 능력은 오로지 자수성가에 의한 것으로, 사회적 집단이나 부모의 유산이 아니다. 예를 들어, 리베라의 연구는 문화적 자본이 어떻게 엘리트의 아이들이 다음을 할 수 있게 하는지를 설명한다.

  • 면접을 더 잘 수행하고 면접 전에 더 많은 코칭을 받고,
  • 의사 결정권자와의 유대감과 미러링을 가능하게 하는 어린 시절의 경험을 쌓고,
  • 실수의 부정적 여파를 최소화하고 (실수가 고정관념으로 연결되는 학생에 비해),
  • 또는 매우 경쟁력 있는 직업을 확보하는 데 필요한 적합성, 추진력, 기술 및 재능을 발휘합니다. 

Any discussion of equity assessment creates unease for many and confronts the notion of merit. Termed “the foundational myth” of U.S. society, merit is thought to be a property of the individual, his (sic) work ethic and intrinsic talents.77 Merit is Horatio Alger’s alone—not a property of a social group or a parental legacy. Rivera’s research, for example, describes how cultural capital enables children of the elite to:

  • perform better in interviews and receive more coaching before interviews;
  • have childhood experiences that allow for more bonding and mirroring with decision makers;
  • have mistakes discounted (vs students for whom mistakes confirm stereotypes); and
  • otherwise exhibit the fit, drive, skills, and talents necessary to secure a highly competitive job.78 

[진정한 능력주의의 존재에 도전하는 것]은 힘든 싸움으로 남아있다.
Challenging the existence of a true meritocracy remains an uphill battle.

형평성 평가에 대한 논의에 대한 또 다른 도전은 편견과의 연결이다; 많은 교육자들은 무의식적인 편견의 개념을 거부한다. 평가의 형평성은 모든 학습자가 환자를 돌보는 데 필요한 기술, 지식 및 역량을 평가하도록 보장하는 것입니다. 마지막으로, 어떤 평가 시스템도 사회적 불평등으로 인한 집단 차이를 없애지 못할 것이다. 부분적으로, 그것은 엘리트들이 적응하기 때문이다. SAT 시험은 엘리트 대학에 재능 있는 청소년 기회를 제공하기 위해 개발되었다. 개발자들은 시험 준비 서비스가 뒤따를 것이라고는 꿈에도 생각하지 못했다. 평가의 형평성 추진은 학습의 형평성과 사회적 불평등에서 파생되는 기회와 연결되기 때문에 지속적인 품질 개선의 과정이어야 한다.

Another challenge to discussions of equity assessment is the link to bias; many educators reject the notion of unconscious bias. Equity in assessment is about ensuring that we assess all learners for the skills, knowledge, and competencies required to care for their patients. Finally, no system of assessment will do away with group differences due to social inequities. In part, that is because elites adapt. The SAT test was developed to offer talented youth opportunities to elite colleges. Its developers never dreamed that test prep services would follow. Because the drive for equity in assessment is linked to equity in learning and opportunities that derive from social inequities, it must be a process of continuous quality improvement.

결론
Conclusion

우리는 다양한 형태의 평가와 불평등의 다양한 측면을 구별하면서 평가의 형평성 문제를 조사했다. 평가의 불평등에 기초한 증거에 의해 통보된 이 원고는, [형평성을 달성하기 위해 평가를 최적화하기 위한 프레임워크]를 제시한다. 형평성 논의의 근저에 있는 핵심 이슈는 궁극적으로 환자의 건강을 개선할 평가의 형평성을 달성하기 위해 지속적으로 필요한 연구와 관행 개선을 위한 의제로 작용한다. 개별 의과대학은 우리의 학습과 환자 치료 생태계를 설계하고 지속적으로 개선하기 위해 지역적으로 일하고 보건 직업 교육의 형평성을 국가 인력 우선 과제로 만들기 위해 함께 노력함으로써 평가에서 형평성의 사악한 문제에 대한 해결책을 찾기 시작할 수 있다.

We have surveyed issues of equity in assessment, distinguishing various forms of assessment and various aspects of inequity. Informed by the evidence base on inequity in assessment, this manuscript puts forth a framework for optimizing assessment to achieve equity. Key issues underlying debates on equity serve as the agenda for ongoing needed research and practice improvement to achieve equity in assessment that will ultimately improve patients’ health. Individual medical schools can begin seeking solutions to the wicked problem of equity in assessment by working locally to design and continuously improve our learning and patient care ecosystems and by joining together to make equity in health professions education a national workforce priority.

 

List 1 평가의 형평성 달성 : Shingo의 조직 수월성 모델을 기반으로 한 모델
List 1 Achieving Equity in Assessment: A Model Based on the Shingo Model of Organizational Excellence

지침:
Guiding principles:

  • [의학교육의 목적]은 점점 더 다양해지는 환자와 지역사회에, 고품질의 안전하고 공정한 치료를 제공할 수 있고, 그렇게 하는데 헌신할 의사 인력을 준비하는 것입니다.
  • [의학교육 평가의 목적]은 학교나 연수 프로그램을 졸업한 모든 사람이 모든 환자에게 우수하고 공평한 치료를 제공하는 데 필요한 역량을 갖추도록 함으로써 의료교육이 우리의 사회적 계약을 이행하도록 보장하는 것이다.
  • The purpose of medical education is to prepare a physician workforce capable of and committed to providing high-quality, safe, and equitable care to our increasingly diverse patients and communities.
  • The purpose of assessment in medical education is to ensure that medical education fulfills our social contract by ensuring that all who graduate from a school or training program have the competencies needed to provide excellent and equitable care to all patients.

평가 가치의 형평성에 전념하는 문화:
A culture committed to equity in assessment values:

  • 다양성, 형평성, 포함Diversity, equity, and inclusion: 고품질 의료 시스템의 원동력
  • 형평성: 고기능 학습 및 평가 시스템의 필수 특성
  • 모든 개인과 팀의 수월성: 고품질의 환자 치료를 제공하는 데 필요한 종합적인 역량 집합의 달성에 따라 정의됨
  • 성장 및 발전에 대한 헌신: 경력 전반에 걸쳐 지속적으로 우수성을 유지하기 위한 필수 요건입니다
  • Diversity, equity, and inclusion as drivers of a high-quality health care system.
  • Equity as an essential characteristic of high-functioning learning and assessment systems.
  • Excellence in all individuals and teams as defined by achievements in the comprehensive set of competencies that are required to provide high-quality patient care.
  • A commitment to growth and improvement as an essential requirement for sustained excellence over the course of a career.

공평한 학습 및 평가 시스템 및 프로그램:
Equitable systems and programs of learning and assessment:

  • 평가 및 학습에 대한 현대 이론을 사용하여, 공정성의 증거를 중앙에서 설계하고 지속적으로 모니터링합니다.
  • Are centrally designed and continuously monitored for evidence of equity, using contemporary theories of assessment and learning.

 

  • [학습을 위한 평가]에서, [개인과 그룹이 무의식적 편향의 영향을 완화]하여, [내재적 형평성]을 최적화하는 구조와 프로세스에 초점을 맞춥니다.
    • 명시적 기준: 규범적normative 기준에 의존하지 않고 성과를 평가할 수 있도록
    • 다양한 평가 전략 및 측정 기준: 의사가 우수한 치료를 제공하는 데 필요한 여러 역량을 효과적으로 평가할 수 있도록
    • 학습자와 학습자를 평가하는 모든 감독자의 준비: 평가 절차와 원하는 역량 달성 기준을 명확하게 이해할 수 있도록 
    • [모든 학생이 종합적이고 높은 수준의 결정을 내리기 전에 빈번하고, 실행 가능하고, 형성적인 평가]를 받도록 보장하는 전략
  • Focus on structures and processes that optimize intrinsic equity by mitigating the impact of unconscious bias by individuals and groups in assessment for learning, including:
    • explicit criteria by which achievements are assessed, rather than relying on normative criteria
    • a diversity of assessment strategies and metrics to validly assess the breadth of competencies needed for physicians to provide excellent care
    • preparation of all supervisors who assess learners and the learners themselves to have a clear understanding of assessment procedures and desired competency attainment criteria
    • strategies that ensure that all students receive frequent, actionable, formative assessment before summative, high-stakes decisions are made
  • [학습의 평가]에 있어, [개인과 집단이 무의식적인 편견이 미치는 영향을 완화]하여, [내재적 형평성]을 최적화하는 구조와 프로세스에 초점을 맞춥니다.
    • [역량 달성에 대한 종합적 결정]은 [다양한 환자와 함께, 광범위한 임상적 맥락에서, 학습자와 상호 작용하는 여러 관찰자로부터 수집된 증거를 기반]으로 한다.
    • [역량 달성에 대한 종합적 결정]은 [다양한 개인, 평가 절차 및 데이터 분석 전문가로 구성된 위원회]에 의해 이루어지며, 위원회는 [무의식적인 편견과 고장난 집단 사고의 영향]에 대해 교육받는다.
  • Focus on structures and processes that optimize intrinsic equity by mitigating the impact of unconscious bias by individuals and groups in assessment of learning, including:
    • Summative decisions about competency achievement are based on evidence collected from multiple observers who interact with the learner in a wide range of clinical contexts, with a diversity of patients.
    • Summative decisions about competency achievement are made by committees of diverse individuals, expert in assessment procedures and data analysis, and educated about the ramifications of unconscious bias and dysfunctional group think.
  • [맥락적 형평성]을 최적화하는 구조 및 프로세스에 초점을 맞춥니다.
    • 교육과정 환경: [모든 학습자]가 [다양한 복잡성의 임상 상황에 참여]하여, [성과를 극대화할 수 있는 기회]를 최적화
    • 학습 환경: 편향, 고정관념 위협, 측정되지 않은 작업량 등 [불평등한 평가에 기여하는 다양한 불평등한 학습의 원인]을 해결하도록 설계되고 모니터링
    • 교수 업무 할당 및 승진 기준: 학습을 위한 평가를 최적화하는 데 필요한 시간과 노력을  할애할 수 있도록 하고, 인센티브를 제공
  • Focus on structures and processes that optimize contextual equity, including:
    • Curricular environments that afford all learners with the opportunity to learn while participating in clinical situations of varying complexity to optimize their chance of maximizing their achievements.
    • Learning environments designed and monitored to address bias, stereotype threat, unmeasured workload, and other causes of inequitable learning that contribute to inequitable assessment.
    • Faculty work assignments and promotion criteria that enable and incentivize them to dedicate the time and effort needed to optimize assessment for learning.
  • [도구적 형평성]과 [평가 결과의 형평성]을 지원하는 구조와 프로세스를 옹호합니다
  • Advocate for structures and processes that support instrumental equity and equity in assessment outcomes.

평가에서 형평성을 촉진하는 [도구]는 다음과 같다.
Tools that facilitate equity in assessment include:

  • 준거-기반 역량 기술
  • [평가 전략]: [수집이나 해석의 용이성]이 아니라, [의사로서의 미래 성과를 예측하는 능력]에 따라 선택된 정성적 및 정량적 데이터를 통합
  • [교수 개발 및 적시 도구]: 교수진과 학습자가 학습 및 평가에서 역할과 기대를 이해하고 수용하도록 지원
  • [워크플로우, 작업 할당, 테르콜로지 전략]: 감독자가 (환자와 함께, 라운드 중, 차트 검토 중) 학습자 성과에 대한 직접적인 관찰을 사용하여 증거를 수집하고, 주어진 학습자의 역량에 대한 형성적 판단을 내릴 수 있도록 지원하고 보상
  • [코칭 전략]: 피드백에 대한 학습자의 이해 및 피드백-기반 행동 능력을 향상시키기 위함
  • [학습자 진행 상황에 대한 데이터를 수집하고 표시하기 위한 전략 및 테크놀로지]: 학습자 및 코칭스태프와 감독자가 사용할 수 있도록 
  • Criterion-based competency descriptions.
  • Assessment strategies that incorporate qualitative and quantitative data selected for their ability to predict future performance as a physician, rather than on ease of collection or interpretation.
  • Faculty development and just-in-time tools that allow faculty and learners to understand and embrace roles and expectations in learning and assessment.
  • Workflow, work assignment, and technologic strategies that support and reward supervisors to use direct observation of learner performance (with patients, on rounds, during chart review) to gather evidence and make formative judgments about competency of a given learner.
  • Coaching strategies to enhance a learner’s ability to understand and act upon feedback.
  • Strategies and technologies to collect and display data on learner progress for use by learners and their coaches and supervisors.

평가에서 [형평성을 나타내는 결과]는 다음과 같은 증거를 포함한다.
Results that indicate equity in assessment include evidence that:

프로세스 표시기:Process indicators:

  • [평가 절차]는 [향후 성과 예측에 가지는 편익과 한계에 대한 명확히 이해]를 바탕으로 [완전히 정렬]된다.
  • [평가 전략]은 모든 학습자에게 교육 및 직업 기회를 증가시키기 위해 사용되며, 엄격함이 의심되지 않을 때에만 이러한 기회를 예방하는 기능을 한다.
  • [평가 데이터]는 목적대로 사용되며 관련성이 입증되지 않은 상황에서는 사용되지 않습니다.
  • [프로그램]은 평가 프로그램의 타당성, 공정성, 형평성 문제를 [정기적으로 조사]하고, 특정 그룹에 부당하게 불이익을 주는 [모집단 차이를 최소화]하기 위해 노력한다.
  • Assessment procedures are fully aligned with a clear understanding of their benefits and limitations in predicting future performance.
  • Assessment strategies are employed to increase educational and career opportunities for all learners and only function to prevent these opportunities when their rigor is unquestioned.
  • Assessment data are used as intended and not for situations for which their relevance is unproven.
  • Programs routinely investigate issues of validity, fairness, and equity in their programs of assessment and work to minimize population group differences that unfairly disadvantage any particular group.

결과 표시기:Outcome indicators:

  • 의학계에서 [대표성이 낮은 집단]에 대한 [교육 및 직업 기회의 집단 차이]가 제거된다
  • Population group differences in educational and career opportunities for groups underrepresented in medicine are eliminated.

 


 

 

 

Acad Med. 2020 Dec;95(12S Addressing Harmful Bias and Eliminating Discrimination in Health Professions Learning Environments):S98-S108. doi: 10.1097/ACM.0000000000003717.

 

Medical Education's Wicked Problem: Achieving Equity in Assessment for Medical Learners

Affiliations collapse

Affiliations

1C.R. Lucey is executive vice dean/vice dean for education and professor of medicine, University of California, San Francisco, School of Medicine, San Francisco, California.

2K.E. Hauer is professor of medicine, University of California, San Francisco, School of Medicine, San Francisco, California.

3D. Boatright is assistant professor of emergency medicine, Yale University School of Medicine, New Haven, Connecticut.

4A. Fernandez is professor of medicine, University of California, San Francisco, School of Medicine, San Francisco, California.

PMID: 32889943

DOI: 10.1097/ACM.0000000000003717

 

Abstract

Despite a lack of intent to discriminate, physicians educated in U.S. medical schools and residency programs often take actions that systematically disadvantage minority patients. The approach to assessment of learner performance in medical education can similarly disadvantage minority learners. The adoption of holistic admissions strategies to increase the diversity of medical training programs has not been accompanied by increases in diversity in honor societies, selective residency programs, medical specialties, and medical school faculty. These observations prompt justified concerns about structural and interpersonal bias in assessment. This manuscript characterizes equity in assessment as a "wicked problem" with inherent conflicts, uncertainty, dynamic tensions, and susceptibility to contextual influences. The authors review the underlying individual and structural causes of inequity in assessment. Using an organizational model, they propose strategies to achieve equity in assessment and drive institutional and systemic improvement based on clearly articulated principles. This model addresses the culture, systems, and assessment tools necessary to achieve equitable results that reflect stated principles. Three components of equity in assessment that can be measured and evaluated to confirm success include intrinsic equity (selection and design of assessment tools), contextual equity (the learning environment in which assessment occurs), and instrumental equity (uses of assessment data for learner advancement and selection and program evaluation). A research agenda to address these challenges and controversies and demonstrate reduction in bias and discrimination in medical education is presented.

 

학술의학에서 여성의 동등함 추구: 역사적 관점(Acad Med, 2020)
Seeking Parity for Women in Academic Medicine: A Historical Perspective
Kenneth M. Ludmerer, MD

 

역사적으로, 미국의 여성들은 의사가 되기 위해 많은 장애물에 부딪쳤다. 19세기 전반에는 동성애자, 절충주의자, 톰슨인과 같은 대체의학자alternative 신분에서 여성을 찾아볼 수 있었지만, 어떤 Allopathic 의사신분에서도 찾아볼 수 없었다. 1849년 1월, 엘리자베스 블랙웰은 제네바 의과대학에서 MD 학위를 받았고, 이로써 이 나라에서 그렇게 한 최초의 여성이 되었다. 그 후, 20세기 초반의 3분의 2 동안 여성 의사의 수는 평균 약 6%로 약간 증가했다. 이는 다른 직업의 여성 비율(예: 법학 2%, 공학 1% 미만)과 비교했을 때보다는 조금 낫다. 그러나 미국의 여성 의사 비율은 여전히 유럽 국가들의 여성 의사 비율에 뒤지고 있다. 독일에서는 1960년대에 의사의 30%가 여성이었고, 네덜란드는 20%, 영국은 25%, 소련은 75%였다.
Historically, women in the United States have encountered many obstacles to becoming doctors. During the first half of the 19th century, women could be found among the ranks of “alternative” healers such as homeopaths, eclectics, and Thomsonians but not among the ranks of allopathic physicians. In January 1849, Elizabeth Blackwell received the MD degree from Geneva Medical College, thereby becoming the first woman in this country to do so. Subsequently, the number of women physicians grew modestly, averaging around 6% of the medical workforce for the first two-thirds of the 20th century. This compared favorably with the percentage of women in other professions—for example, 2% in law and less than 1% in engineering. The percentage of women doctors in the United States still trailed the percentage of women doctors in European countries, however. In Germany, 30% of physicians were women in the 1960s, while the proportion was 20% in the Netherlands, 25% in Great Britain, and 75% in the Soviet Union.1 Clearly, the opportunities for women to enter medicine reflected cultural norms.

미국 의학계에서 여성의 비율이 역사적으로 낮은 이유를 설명하기 위해 많은 설명이 제시되었다. 초기 연구에서 메리 월시는 의과대학에 입학하는 여성 의사의 수를 제한하기 위해 의료기관이 만든 명백한 장벽에 기인한다고 말했다. 많은 학교들이 여성을 입학시키지 않았고, 어떤 학교에서는 엄격한 쿼터를 설정했다. 이 주장은 그녀의 책 제목에 구체화되어 있다. [의사 구함: 여성은 지원할 필요 없음]

Many explanations have been offered to account for the historically low representation of women in the U.S. medical profession. In an important early study, Mary Walsh attributed this to explicit barriers created by the medical establishment to limit the number of women physicians admitted to medical school. Many schools would not admit women; others established rigid quotas. This argument is embodied in her book’s title: Doctors Wanted: No Women Need Apply.2

하지만, 여성들은 [입학에서의 명백한 차별] 뿐만 아니라 추가적인 장애에 직면했다. Carol Lopate와 Regina Markell Morantz-Sanchez가 보여주었듯이, 모든 직업에 여성의 진입에 대한 사회적 기대는 완화되었다. 전형적인 여성의 역할은 주부와 주부였다. 여성들은 종종 교사, 어드바이저, 친구, 또는 가족 구성원들로부터 힘든 커리어를 추구하라는 격려를 거의 받지 못했다. 그 결과, 상대적으로 소수의 여성만이 의학 분야에서 커리어를 추구했다. 
However, women encountered obstacles in addition to overt discrimination in admissions. As Carol Lopate and Regina Markell Morantz-Sanchez have shown, societal expectations mitigated against the entry of women into medicine, as they did for the entry of women into all professions. The stereotypical woman’s role was that of housewife and homemaker. Women often received little encouragement from teachers, advisers, friends, or family members to enter demanding careers. The result was that relatively few women sought careers in medicine.1,3

1960년대 후반부터 페미니스트 운동의 부활이 탄력을 받으면서, 의학에 종사하는 여성의 수가 급격히 증가했다. 1980년까지 의대생들의 거의 30%가 여성이었고, 1990년에는 그 비율이 약 40%였으며, 2000년에는 거의 50%가 되었다. 

Beginning in the late 1960s, as the revival of the feminist movement gained momentum, the number of women entering medicine rapidly grew. By 1980, nearly 30% of incoming medical students were women; by 1990, the proportion was roughly 40%; and by 2000, it was nearly 50%.4,5

그러나 의학 분야에서 경력을 쌓고자 하는 여성 의사들은 계속해서 많은 장애물에 부딪혔다. 의과대학의 여성들은 항상 어려움을 겪어왔기 때문에 이것은 새로운 것은 아니었다. 대부분의 기관들은 종종 여성들을 강사나 조교수로 임명했지만, 인지도와 승진은 매우 느렸고, 여성 교수진의 급여는 비슷한 지위와 연공서열의 남성들에 비해 관습적으로 낮았다. 직업의학 분야의 창시자이자 그녀의 학장에 의해 그 분야에서 "어떤 남자보다 매우 우월하다"고 여겨지는 사람인 [앨리스 해밀턴]의 경우를 생각해 보자. 그녀는 하버드 의과대학의 유일한 여성 교수이자 임시직 이상의 어떤 것도 그녀에게 제공하는 것을 거부한 것에 대해 개인적으로 (비록 공개적으로는 아니었더라도) 좌절했다. 그녀는 1935년 조교수로 은퇴했고, 그녀의 기관 밖에서는 높은 영예를 얻었지만 그 안에는 없었다.6 세계 2차 세계 대전 이전에 여성 학장을 임명했던 미국의 유일한 의과대학은 펜실베이니아 여성 의과대학이었다.
However, women physicians aspiring to careers in academic medicine continued to encounter many obstacles. This represented nothing new, for women at medical schools had always experienced difficulties. Most institutions frequently appointed women as instructors or assistant professors, but recognition and advancement came very slowly, and salaries for women faculty were customarily lower than those for men of comparable rank and seniority. Consider the case of Alice Hamilton, the founder of the field of occupational medicine and a person considered by her dean as “greatly superior to any man” in the field. She was privately (though not publicly) frustrated at being Harvard Medical School’s only woman faculty member and at the school’s refusal to offer her anything more than a succession of temporary appointments. She retired in 1935 as an assistant professor, highly honored outside her institution but not within it.6 Before World War II, the only medical school in the nation that had appointed a woman dean was Woman’s Medical College of Pennsylvania.7

1970년 이후, 여성들은 내과, 소아과, 정신과, 산부인과, 가정의학과에 더 많은 비율을 차지하면서, Academic medicine에 진입하기 시작했다. 그러나 초기 경력 교수진 수준에서는 여성이 더 높게 나타났다. 1980년에는 전체 교수의 10% 미만이 여성이었고 학과장의 4%만이 여성이었다. 많은 사람들은 이것이 대부분의 여성 의사들이 아직 매우 어리고 고위 학문적, 행정적 임명이 일반적으로 나이든 개인들에게 돌아간다는 사실에 기인한다고 말했다. 그러나 1995년에는 여성인 정교수와 학과장의 비율이 1980년과 변함이 없었고 2015년에는 그 수가 약간 더 높을 뿐이었다. 여성 학장의 수도 비슷하게 낮았다. 여성들은 사업계, 법조계, 그리고 다른 분야뿐만 아니라 다른 과학 및 학문 분야에서 지도적 지위를 얻는 데 있어 유사한 장애에 직면했다. 
After 1970, women began to enter academic medicine in large numbers, with greater proportions entering internal medicine, pediatrics, psychiatry, obstetrics and gynecology, and family medicine. However, women were more highly represented at the early-career faculty level. In 1980, less than 10% of full professors and only 4% of department chairs were women. Many attributed this to the fact that most women physicians were still very young and that senior academic and administrative appointments generally went to older individuals. However, in 1995, the percentage of full professors and department chairs who were women was unchanged from 1980, and in 2015, the numbers were only slightly higher. The number of women deans was similarly low.8–12 Women encountered similar obstacles to obtaining leadership positions in other scientific and academic fields as well as in business, law, and other areas.13–15

여성 의대생, 전공의, 그리고 주니어 교수진의 파이프라인이 남성들과 동등해진 지 한참 후까지도, Academic medicine에서 고위직에 여성들이 현저하게 과소대표되는 것을 설명하는 것은 무엇인가? 설명의 일부는 1970년대 초의 페미니스트 학계에서 생겨난 개념인 "미시적 불평등microinequities"의 존재에 있다. 이 용어는 [고통스럽고 파괴적이며 여성 의사들의 전문적인 발전을 방해하는, 때로는 분명하지 않지만 실질적인 경시slight]를 가리킨다. 예로는 여성을 비하하는 성적 유머, 여성의 직업적 특성을 과소평가하는 동안 여성의 외모에 초점을 맞추는 것, 여성의 생각을 남성에게 돌리는 것, 남성의 경우 "힘있음" 또는 "강력함"으로 여겨질 행동에 대해 여성 의사는 "과다 공격적"으로 분류하는 것 등이 있다. 이러한 예들은 미시적 불평등의 만연에 비추어 볼 때, 의학 문화가 모든 여성들에게 그저 지지하지 않는다는 것을 암시한다. 그러나 다른 요인들도 지도적 역할에서 여성의 대표성을 과소평가하는 데 기여한다. 문헌에는 다음과 같은 여성 교수진이 직면하는 추가적인 문제의 예들로 가득하다.

  • 상급 교수들이 여성 후배들에게 제공하는 멘토링과 후원의 부족,
  • 다른 사람들이 여성 강사의 일에 대해 공로를 뺏으려는 경향,
  • 경력 개발에 도움이 되지 않는 시간이 많이 걸리는 행정 업무 또는 교수 업무를 수행하도록 요청받는 것
  • (의식적이든 무의식적이든) 여성에게서 제도적 자원과 협력의 기회를 주지 않는 것

What accounts for the significant underrepresentation of women in senior positions in academic medicine long after the pipeline of women medical students, residents, and junior faculty reached parity with men? Part of the explanation lies in the presence in medicine of “microinequities,” a concept arising from feminist scholarship of the early 1970s. This term refers to sometimes unapparent but real slights that are painful and destructive and that interfere with the professional development of women physicians.8 Examples include sexual humor disparaging to women, focusing on a woman’s appearance while downplaying her professional attributes, attributing a woman’s ideas to a man, and labeling women physicians as “overly aggressive” for behavior that in a man would be considered “forceful” or “strong.” These examples suggest that, given the prevalence of microinequities, the culture of medicine is simply unsupportive for all women. Other factors contribute to the underrepresentation of women in leadership roles, however. The literature is replete with examples of additional problems encountered by women faculty, including

  • the lack of mentoring and sponsorship provided to junior women faculty by senior professors,
  • the tendency of others to take credit for the work of women instructors,
  • the frequency with which women faculty are asked to do time-consuming administrative or teaching tasks that do not directly advance their career, and
  • the withholding from women (consciously or unconsciously) of institutional resources and opportunities for collaboration.

여성 교수진의 전문적 진보를 가로막는 훨씬 더 큰 장벽은 의과대학의 구조적인 조직, 즉 연구에 우선 순위를 두는 것에서 비롯되었다. 처음부터, 미국의 의과대학(미국 연구 대학)에서는 연구가 승진, 교수직, 지도직 임명에 대한 주요 결정요인으로 작용했다. 미국의 의과대학과 연구대학이 모두 독일 대학 시스템에 뿌리를 두고 있다는 점을 감안할 때 이것은 놀라운 일이 아니었다. 그것은 모든 교수들, 남성들뿐만 아니라 여성들, 그리고 의대 지도자들에게는 "출판 아니면 멸망"이었고, 교수의 가정적 책임에 대해 거의 관심을 보이지 않았다.
An even greater barrier to the professional advancement of women faculty arose from the structural organization of medical schools: the priority placed on research. From the beginning, at the U.S. medical school—as at the U.S. research university—research served as the primary determinant of promotion, faculty rank, and appointment to leadership positions. This was hardly a surprise, given that both the U.S. medical school and research university had their roots in the German university system.16 It was “publish or perish” for all faculty, women as well as men, and medical school leaders showed little concern for a professor’s home responsibilities.

승진, 테뉴어, 리더십에서 연구가 중심에 있다는 점이 여성을 남성보다 훨씬 불리한 위치에 놓이게 했다. 학문적 성공은 [자신의 프로젝트에 대한 단호한 헌신]에 달려 있었고, 일주일에 60시간 또는 70시간의 노동이 필요했다. 기혼 남성들은 종종 그들의 배우자와 동등하게 육아와 가사일에 참여하지 않음으로써 일에 대한 그러한 일편단심적인 헌신을 할 수 있었다. 이와는 대조적으로 기혼 여성들은 일반적으로 집에 도착하자마자 그들의 "제2의 교대 근무"를 맡아야 했다. 충분한 육아휴직, 현장 육아, 또는 테뉴어 시계 일시정지의 선택권을 제공함으로써 여성 교수진을 수용하는 의대가 거의 없다는 사실은 문제를 더욱 복잡하게 만들었다. 또한 영감과 지도력을 얻기 위해 지도적인 역할을 하고자 하는 여성 후배 교수진을 위한 여성 역할 모델이 부족했다. 반면 자녀가 없는 기혼여성 교수진은 남성만큼 자주 발표됐고, 남성 동료들과 견줄 만한 비율로 학계 서열까지 올랐다. 

The centrality of research to promotion, tenure, and leadership placed women at a great disadvantage relative to men. Academic success depended on a single-minded dedication to one’s projects and required 60- or 70-hour work weeks. Married men could often afford such single-minded devotion to work by virtue of not participating equally with their spouses in child-rearing and household chores. Married women, in contrast, typically had to assume their “second shift” of work on arriving home.9,17,18 The fact that few medical schools accommodated women faculty by providing sufficient parental leave, on-site child care, or the option of pausing the tenure clock only compounded the problem. So did a dearth of female role models for women junior faculty members aspiring to leadership roles to turn to for inspiration and guidance. In contrast, married women faculty without children published as frequently as men and rose through the academic ranks at rates comparable to their male colleagues.9,19,20

물론, 많은 여성 의사들은 모성애를 학문적인 의학 분야에서 충실한 경력과 결합하는 데 성공했다. 그러나 성공은 종종 쉽게 이루어지지 않았고, 종종 남성보다 시간이 더 걸렸다. 저명한 여성 교수진들은 그들의 힘든 여정을 묘사했는데, 밤늦게 원고를 쓰고, 그들의 전문적인 시야를 향상시켰을 수도 있는 여행을 최소화하여, 아픈 아이를 돌보기 위해서 예기치 않게 실험실을 떠나야 했을 수도 있다. [보조금과 출판물을 통해 일찍부터 과학적 "생산성"을 입증해야 할 필요성이 높은 중요한 시기]가 [출산을 하게 되는 시기]와 겹친다는 점에서, 최초 교수 발령 직후의 시간이 가장 취약한 시기였다. 
Many women physicians, of course, did succeed in combining motherhood with a fulfilling career in academic medicine. However, success often did not come easily and frequently took longer than for their male counterparts.9,10 Prominent women faculty members have described their difficult journey—writing manuscripts late at night, minimizing travel that might have enhanced their professional visibility, leaving the laboratory unexpectedly to tend to a sick child.10 The time following an initial academic appointment was the most vulnerable period, given that the need to demonstrate scientific “productivity” early on through grants and publications coincided with important childbearing years.17

최근 몇 년 동안 많은 의과대학과 교육병원이 여성 연수생과 내과의사들에게 기회와 만족도를 높이기 위해 노력하고 있다. 예를 들면 다음과 같다.

  • 관리자와 고위 교직원을 위한 성 감성에 대한 교육,
  • 성희롱을 단속하고,
  • 보다 공평한 급여와 자원의 분배를 제공하는 것,
  • 여성들을 위한 멘토링 프로그램을 만들고,
  • 사회적, 직업적 관계를 장려하기 위한 여성 조직을 설립하고,
  • 성차별을 없애고 여성을 위한 건강하고 양육적인 직장 환경을 개발하기 위한 전략을 홍보하는 것

In recent years, many medical schools and teaching hospitals have made efforts to improve opportunities and satisfaction for women trainees and physicians. Examples include

  • training in gender sensitivity for administrators and senior faculty,
  • clamping down on sexual harassment,
  • providing more equitable pay and distribution of resources,
  • creating mentoring programs for women,
  • establishing women’s organizations to encourage social and professional relationships, and
  • promoting strategies to eliminate gender discrimination and develop a healthy and nurturing work environment for women.

특히 주목할 만한 것은 전문가와 개인 및 가족의 책임을 조화시키는 문제를 해결하기 위한 노력이다. 많은 의과대학들은 이 방향으로 중요한 조치를 취해왔다.

  • 육아휴직과 관련된 보다 자유주의적인 정책을 시행하고,
  • 현장 육아 제공,
  • 시간외 회의 제거,
  • 시간제 커리어 트랙 생성,
  • 가족 책임 때문에 추가 시간이 필요한 교수진의 종신 재직 기간 연장 

Particularly notable are the efforts to address the challenge of reconciling professional with personal and family responsibilities. Many medical schools have taken important steps in this direction, such as

  • implementing more liberal policies pertaining to parental leave,
  • providing on-site childcare,
  • eliminating after-hours meetings,
  • creating part-time career tracks, and
  • lengthening the tenure clock for faculty needing additional time because of family responsibilities.


지난 100년 동안 의학계에서 여성의 지위는 극적으로 변화했다. 한 세기 전, 여성들은 심지어 투표하는 것조차 허락되지 않았다. 여성들이 의과대학에 입학하고, 의대 교수에 임용되는 데까지는 50년이 더 걸렸다. 과거의 공공연한 차별은 사라졌고, 미시적 불평등은, 여전히 존재하지만, 더 이상 쉽게 간과되거나 용서되지 않는다. 그러나 여성의 의과대학 입학이 남성과 본질적으로 동일했음에도 불구하고 지도적 지위의 평등은 아직 일어나지 않았다. 이 상황을 바로잡는 것은 사회 정의의 관점에서뿐만 아니라, 그 직업이 노동력의 모든 사람들에게 충실한 경력을 제공할 때만이 가장 강해질 수 있기 때문에 매우 중요한 문제이다. 다양성은 학술 보건소를 포함한 모든 조직이나 직업의 성과에 긍정적인 영향을 미친다.
Over the past 100 years, the position of women in medicine has changed dramatically. A century ago, women were not even permitted to vote. It took another 50 years for women to gain admission to medical school and appointments to medical faculties in non-token numbers. The overt discrimination of the past has disappeared, and microinequities, though still present, are no longer so easily overlooked or forgiven. Parity in leadership positions has yet to occur, however, even though the matriculation of women to medical school has long been essentially equal to that of men.9,21 Correcting this situation is a matter of great importance—not only from the perspective of social justice but also because the profession can be at its strongest only if it offers fulfilling careers to everyone in the workforce. Diversity has a positive impact on the performance of any organization or profession, including academic health centers.

의학 분야에서 여성들에게 가장 중요한 도전은 [직업적인 성공]과 [개인적인 성취]를 모두 달성하는 것이다. 이 도전은 모든 교수진에 영향을 미친다. 오늘날, 남성 의사들 또한 업무 과부하 문제와 그로 인한 개인적, 가족적 관계에 대한 부담에 대해 점점 더 목소리를 높여가고 있다. 남녀 의사 모두 보다 예측 가능한 일정으로 '라이프스타일' 분야에 관심을 표명했으며, 많은 남성 의사들도 육아에 적극적으로 참여하고 개인의 관심사에 더 많은 시간을 할애할 계획이다. 연구가 학문적 의학의 화폐가 되는 것을 멈출 것 같지 않고 바람직하지 않지만, 의학계도 모든 직업과 마찬가지로 그것이 존재하는 사회의 관습mores와 가치에 절묘하게 민감하다. 더 나은 일과 삶의 균형을 이루기 위한 운동이 더 일반화될 경우, 학문적 의학 분야의 커리어 패스도 재구성될 가능성이 있다. 여성과 남성 모두가, 높은 학문적 기준을 확고히 유지하면서 테뉴어 및 승진 달성을 위한 유연한 시간프레임을 보편적으로 이용하는 미래를 상상하는 것은 그럴듯하다. 만약 이것이 일어난다면, 그것은 의학 분야에서 여성들에게 깊은 유산을 나타낼 것이다. 그들의 전문적인 희생과 더 공평한 문화에 대한 옹호 세대는 그것의 문화를 바꿀 것이기 때문이다.

The central challenge to women in academic medicine remains: achieving both professional success and personal fulfillment.22 This challenge affects all faculty. Today, male physicians have also become increasingly vocal about the problem of work overload and the resultant strains on personal and family relationships. Physicians of both genders have declared their interest in “lifestyle” fields with more predictable schedules, and many male physicians plan to participate actively in child-rearing and devote more time to personal interests. Although it is unlikely and undesirable that research will ever cease to be the currency of academic medicine, the medical profession, like all professions, is exquisitely sensitive to the mores and values of the society in which it exists. Should the drive to achieve better work–life balance become more generalized, it is possible that career paths in academic medicine might be restructured. It is plausible to imagine a future in which flexible time frames to achieve tenure and promotion are universally available to both women and men, with high scholarly standards firmly maintained. If this occurs, it will represent a profound legacy for women in academic medicine, for their generations of professional sacrifice and advocacy for a more equitable culture will have changed its culture.

 


Acad Med. 2020 Oct;95(10):1485-1487. doi: 10.1097/ACM.0000000000003556.

Seeking Parity for Women in Academic Medicine: A Historical Perspective

Affiliations collapse

Affiliation

1K.M. Ludmerer is professor of medicine, professor of history, and the Mabel Dorn Reeder Distinguished Professor of the History of Medicine, Washington University in St. Louis, St. Louis, Missouri.

PMID: 33002905

DOI: 10.1097/ACM.0000000000003556

Abstract

In this Invited Commentary, the author applies a historical lens to explore a fundamental paradox in U.S. medical education: the fact that long after women gained parity with men in matriculation to medical school, women remain highly underrepresented in leadership positions in academic medicine. The reasons for this are many and complex, but at the core are the subtle but hurtful indignities ("microinequities") experienced by women physicians and an academic culture that expects single-minded dedication to work, regardless of the costs to faculty members' personal lives. Achieving parity for women in academic leadership will require changing the culture of medical schools and teaching hospitals to correct these 2 fundamental obstacles. In recent years, many medical schools and teaching hospitals have made efforts to improve opportunities and satisfaction for women trainees and physicians, enacting reforms to improve work-life balance for all faculty. It is plausible to imagine a future in which flexible time frames to achieve tenure and promotion are universally available to both women and men, with high scholarly standards firmly maintained. If this occurs, it will represent a profound legacy for women in academic medicine, for their generations of professional sacrifice and advocacy for a more equitable culture will have changed its culture.

임상 교수자의 교육개발 참여의 모순: 활동이론 분석(Adv Health Sci Educ Theory Pract. 2019)
Contradictions in clinical teachers’ engagement in educational development: an activity theory analysis
Agnes Elmberger1 · Erik Björck2,3 · Matilda Liljedahl1,4 · Juha Nieminen1 · Klara Bolander Laksov1,5

 

 

 

서론
Introduction

보건 전문 교육(HPE) 내에서 전문화된 교육을 실시해야 한다는 요구가 반복적으로 제기됨에 따라, 많은 의과대학은 임상의의 교육 역할을 지원하기 위한 교육 개발 활동을 제공하고 있습니다. 연구는 그러한 활동의 배치, 범위 및 효과와 개별 임상 교사가 이러한 프로그램에 참여하는 이유에 초점을 맞추고 있다. 그러나 임상교사의 [교육개발 참여에 대한 시스템적 영향]에 대해서는 충분히 알려져 있지 않다.

Due to recurrent calls to professionalise teaching practice within health professions education (HPE) (Mclean et al. 2008), many medical universities offer educational development activities to support clinicians in their teaching role. Research has focused on the arrangement, scope and effectiveness of such activities (De Rijdt et al. 2013; Leslie et al. 2013; Steinert et al. 2016; Stes et al. 2010), as well as the reasons why individual clinical teachers participate in these programs (Steinert et al. 2010). However, not enough is known about systemic influences on clinical teachers’ engagement in educational development.

[교육 개발]은 "교수진 자체 또는 교직원과 함께 일하는 다른 사람에 의해 계획되고 실행되는 행동"을 기술한다. 고등교육교사의 이러한 교육개발 참여에 대한 이전의 연구는 [내재적 요소]와 [직업적 동기]의 중요성을 보여주었다. 또한, 의학 교육자들 사이에서 개인, 그룹 및 기관 차원에서 교육 발전의 장벽과 기회를 조사하기 위한 노력이 있었다.
Educational development describes “actions, planned and undertaken by faculty members themselves or by others working with faculty, aimed at enhancing teaching” (Amundsen and Wilson 2012, p. 90). Previous research into higher education teachers’ participation in such educational development has shown the importance of both intrinsic factors and professional motives (Knight et al. 2006). Also, there have been efforts to investigate barriers to and opportunities for educational development at individual, group and institutional levels among medical educators (Stenfors-Hayes et al. 2010).

임상 환경에 있는 교사에 초점을 맞추어, 현재의 문헌은, 개인 및 전문적 개발, 같은 생각을 가진 동료와 만날 기회 등, 교육 개발에 참가하기 위한 [시간 관련 장벽]과 [개인의 동기 요소]에 대한 통찰력을 제공합니다. 단, 주로 [임상 교사 개개인에 중점]을 두고 있지만, 교수자가 소속된 복잡한 임상 환경을 인식하고, 교육 개발에 참여하는 데 있어 [시스템적 관점]을 포함하는 것이 중요하다.
Focusing on teachers situated in clinical environments, the current literature offers insights into time-related barriers and individual motivation factors to participate in educational development, including personal and professional development and opportunities to meet like-minded colleagues (Sorinola et al. 2013; Steinert et al. 2009, 2010; Zibrowski et al. 2008). However, the emphasis has primarily been on individual clinical teachers, while it would be valuable to include a systemic perspective on their engagement in educational development, recognising the complex clinical environment of which they are part (Amundsen and Wilson 2012; O’Sullivan and Irby 2011; Steinert et al. 2006).

[개인과 시스템 사이의 상호작용]에 주목하는 한 이론은 [활동 이론]이다. HPE의 복잡한 문제를 연구하기 위한 도구로 제안되었으며, 이전에는 직장 학습의 다양한 측면을 다루기 위해 적용되었다.
One theory that pays attention to interactions between the individual and the system is activity theory (Engeström et al. 1999; Engeström 1987; Virkkunen and Newnham 2013). It has been proposed as a tool for studying complex issues in HPE (Varpio et al. 2017) and has previously been applied to address different aspects of workplace learning (Reid et al. 2015; de Feijter et al. 2011; Larsen et al. 2017) and group interactions (Kent et al. 2016).


[활동체계(그림1)]는 분석의 기본단위로 간주된다. 이 시스템은 [인간 활동의 객체 지향적인 본질]을 주제로 묘사하고 있습니다. 즉, 분석의 관점으로 선택된 개인 또는 집단이 성과를 도출하는 대상에 대해 작업하는 것이다. 활동의 대상object은 활동을 향한 동기(예: 환자 치료)이지만, 그 결과outcome는 활동의 산물(예: 건강 개선)이다. 그 대상object은 개인적인 동기 부여와 연결된 [개인 수준], 즉 '특정 물체the specific object' 또는 사회적 의미와 연결된 [시스템 수준], 즉 '일반화된 물체the generalized object'에 존재할 수 있습니다.

The activity system (Fig. 1) is seen as the basic unit of analysis. It depicts the object-oriented nature of human activity with a subject, i.e. the individual or group whose viewpoint is chosen as the perspective of analysis, working on an object resulting in outcomes (Engeström and Sannino 2010; Leont’ev 1978; Vygotskij and Cole 1978). While the object of an activity is the motive directing it, e.g. patient care, the outcome is the product of the activity, e g. improved health. The object can be present at the individual level where it is connected to personal motivation, called ‘the specific object’, or at the system level connected to societal meaning, referred to as ‘the generalized object’ (Engeström and Sannino 2010).

 

활동 시스템은 또한 [주체와 객체subject and object 사이의 상호작용]을 위한 [중재 도구]의 사용, 즉 [객체object의 달성을 위해 도구tool가 어떻게 주체의 작업을 중재mediate하는지]를 묘사합니다. 이러한 도구는 우리의 문화 역사 및 사회 환경에서 비롯되었으며, 일정과 같은 구체적이거나 언어개념과 같은 추상적일 수 있습니다(Nicolini 2012). 이 주체subject는 [규칙이 활동을 규제하고, 분업division of labour이 공동체 내에서 어떻게 일을 분배하는지를 지정]하는 사회 문화 공동체의 일부이다. 모든 요소는 상호 연결되고 함께 주체의 목적 달성을 중재하거나 방해합니다.
The activity system also depicts the use of mediating tools for the interaction between subject and object, or in other words, how tools mediate the subject’s work towards achieving the object (Engeström and Sannino 2010; Leont’ev 1978; Vygotskij and Cole 1978). Such tools originate from our cultural history and social environment and can be concrete, such as a schedule, or abstract, such as language and concepts (Nicolini 2012). The subject is part of a social and cultural community in which rules regulate the activity and where a division of labour specifies how work is divided within the community. All elements interconnect and together mediate, or hinder, the subject’s ability to achieve the object (Engeström and Sannino 2010).

활동 시스템은 다양한 견해, 전통 및 문화를 구성하며, 잘못 정렬되면 인접 활동 시스템 내부 및 사이에 [모순]을 일으킨다. [모순]은 역사적, 시스템적 긴장이며, 이는 활동의 방해로 나타난다. 그것들은 경험적 연구에서 포착하기 어렵지만, 그들의 징후는 개인의 설명과 말과 행동의 구성에서 인식될 수 있다.
Activity systems comprise a multiplicity of views, traditions and cultures which, when misaligned, give rise to contradictions within and between neighbouring activity systems (Engeström 1987). Contradictions are historic and systemic tensions, which manifest as disturbances in the activity. They are challenging to capture in empirical studies, however, their manifestations can be recognised in individuals’ accounts and constructs of words and actions (Engeström and Sannino 2011).

활동 이론은 개인과 시스템 간의 복잡한 상호작용을 이해하기 위한 도구를 제공하며 교육 개발에 참여하는 시스템성의 일부에 대처하는 데 도움을 줄 수 있습니다. 따라서 본 연구의 목적은 활동 이론의 관점을 채택하여 임상 교사가 교육 개발에 참여하는 것이 어떻게 그들이 행동하는 시스템에 의해 영향을 받는지를 탐구하는 것이었다. 구체적인 조사 질문은 다음과 같습니다.

  • (1) 임상 교사는 어떤 시스템에 속하며 이러한 시스템의 모순은 무엇입니까? 그리고. 
  • (2) 교육 시스템에서 모순은 어떻게 드러납니까?

Activity theory affords a tool for understanding complex interactions between individuals and systems and can aid in addressing parts of the systemness of engaging in educational development. Thus, the aim of this study was to employ an activity theory perspective to explore how clinical teachers’ engagement in educational development is affected by the systems they act within. Our specific research questions were:

  • (1) what systems are clinical teachers part of and what are the contradictions in these systems? and
  • (2) how do the contradictions manifest in the system of education?

방법
Methods

이 연구는 [현실의 구성이 연구자와 연구 대상물 사이의 상호작용을 통해 도출된다는 것]을 인정하는 [해석주의적 접근법]을 채택했다. [활동 이론]을 이론적 틀로 적용하였고, 질적 데이터 수집 방법을 사용하여 다양한 경험을 수집하였다. 연구 그룹은 정성적 방법과 HPE(KBL, ML), 임상 교육(EB, AE) 및 교육 심리학(JN)에 대한 전문 지식을 가진 연구자로 구성되었다. 이를 통해 저자들이 반사적인 데이터 수집과 분석에 관여하는 동적인 논의가 가능해졌다.
The study employed an interpretivist approach, acknowledging that constructions of reality are elicited through interactions between the researcher and the object under study (Bunniss and Kelly 2010). Activity theory (Engeström 1987) was applied as a theoretical framework, and qualitative data collection methods were used to gather various experiences. The research group consisted of researchers with expertise in qualitative methods and HPE (KBL, ML), clinical education (EB, AE) and educational psychology (JN). This enabled a dynamic discussion whereby the authors engaged in reflexive data collection and analysis.

설정
Setting

연구는 스웨덴에 있는 대규모 단일 시설 의과대학에서 수행되었으며, 20개 이상의 학부 HPE 프로그램을 제공했으며, 그 중 일부는 많은 양의 임상실습도 포함하고 있다. 이러한 임상실습은 환자 치료, 연구 및 교육이라는 세 가지 업무를 수행하는 학술 병원에서 이루어집니다. 임상 교사는 다양한 임상 작업을 유지하면서 교육자로서의 역할을 하도록 임명된 임상 의사입니다. 대학에는 의학 교육 센터와 임상 교육 센터가 있으며, 두 센터 모두 임상 교사에게 교육 개발 지원을 제공합니다. 각 보건 분야별 전문 분야별 교육 개발은 별도로 담당한다.
The study was conducted in a large single-faculty medical university in Sweden, offering over 20 undergraduate HPE programmes, several of which include a large amount of clinical clerkships. These clerkships take place in academic hospitals which have the threefold task of patient care, research and education. Clinical teachers are clinicians appointed to roles as educators while maintaining varying amounts of clinical work. The university has a centre for medical education and a centre for clinical education, both of which offer educational development support to clinical teachers. Each health profession discipline is separately in charge of educational development for their professionals.

참가자
Participants

이 연구는 팀 차원에서 교육 개발을 실시하는 것을 제안했던 이전 연구 결과에서 나온 대규모 연구 프로젝트의 일부였습니다. 따라서 임상교사 팀은 자신의 직장에서 교육개발 프로젝트를 추진할 수 있도록 지원하는 것을 목적으로 하는 [교육개발 프로그램]에 참여하도록 초대되었습니다. 5개 팀이 참가했는데, 그 중 3개 팀이 다학문이었다. 연구에 초대된 17명의 참가자 중 한 명은 개인적인 이유로 참석하지 못했다. 16명의 참가자는 2개의 전문병원과 5개의 외과 및 내과 임상과를 대표하며 물리치료사 7명, 의사 4명, 간호사 3명, 작업치료사 1명, 병원 사회복지사 1명으로 구성됐다. 두 명은 남자였고 평균 연령은 45세였다. 교육에 대한 적극적인 참여 기간은 다음과 같다. 5년 이상(8명), 3~5년(5명), 1~2년(2명), 1년(1명).

The study was part of a larger research project in which previous findings had suggested conducting educational development on a team level (Barman et al. 2016; Söderhjelm et al. 2018). Therefore, teams of clinical teachers were invited to participate in an educational development program aiming to support them in pursuing educational development projects in their own workplace. Five teams, of which three were multi-disciplinary, participated in this one-year program. Of the 17 attendees invited to join the study, one was unable to participate for personal reasons. The 16 participants represented two academic hospitals and five clinical departments in surgery and internal medicine, and comprised seven physiotherapists, four physicians, three nurses, one occupational therapist and one hospital social worker. Two were male, and the mean age was 45 years. The duration of active participation in education was: 5+ years (8 participants), 3–5 years (5 participants), 1–2 years (2 participants) and 1 year (1 participant).

3명의 저자가 교육개발 프로그램에서 강의하고 있었기 때문에, 참가자는 다른 저자의 연구(AE)에 초대되어 자발적인 참가이며, 프로그램에서의 성과 평가에 영향을 미치지 않는다는 것을 명확히 알렸습니다. 모든 개별 참가자들로부터 사전 동의를 얻었으며, 스톡홀름 윤리 검토 위원회로부터 윤리적 승인을 받았습니다.
As three of the authors (EB, ML, KBL) were teaching in the educational development program, the participants were invited to the study by another author (AE) and clearly informed that participation was voluntary and would bear no impact on the assessment of their performance in the program. Informed consent was obtained from all individual participants, and ethical approval was received from the Stockholm Ethical Review Board (nr: 2016/1425-31).

데이터 수집
Data collection

포커스 그룹은 참여를 촉진하기 위해 프로그램 데이와 함께 개최되었습니다. 인터뷰 가이드는 액티비티 이론을 사용하여 작성되었으며 다음과 같은 세 가지 중점 영역으로 나뉩니다. 개인, 그룹 및 조직. 인터뷰 주제의 예는 다음과 같습니다: 교육 및 교육 발전을 추구하기 위한 원동력, 경영진과 지역사회가 교육 문제에 어떻게 관심을 기울였는지, 그리고 임상 작업장의 교육 구조.
Focus groups were held in conjunction with a programme day to facilitate participation. The interview guide was developed using activity theory and was divided into three focus areas: the individual, the group and the organisation. Examples of topics were: the driving forces for pursuing education and educational development, how management and the community attended to educational matters and the structure of education in the clinical workplace.

3개의 포커스 그룹 각각에 5~6명의 참가자가 있었다. 첫 번째 그룹은 임상 훈련 병동으로 작업하는 두 개의 팀으로 구성되었고, 두 번째 그룹은 서로 다른 병원에 있지만 환자 특성 및 업무 측면에서 유사한 부서의 두 개의 팀으로 구성되었으며, 세 번째 그룹은 하나의 더 큰 팀으로 구성되었다. 각 포커스 그룹에는 진행자(AE, KBL, ML)와 관찰자(JN, EB, 연구 보조 JC)가 있어 후속 질문에서 진행자를 지원했습니다. 약 1시간 동안 진행된 포커스 그룹 인터뷰는 AE에 의해 음성녹음 및 문자 그대로 기록되었으며 모든 개인 데이터는 비식별화되었다.

Each of the three focus groups had five to six participants. The first group consisted of two teams working with clinical training wards, the second group of two teams from similar departments in terms of patient characteristics and tasks, though at different hospitals, and the third group of one larger team. Each focus group had a moderator (AE, KBL, ML) and an observer (JN, EB, research assistant JC) who supported the moderator in asking follow-up questions. The focus group interviews, lasting approximately one hour, were audio recorded and transcribed verbatim by AE, and all personal data were de-identified.

분석.
Analysis

학술 병원의 활동 시스템은 녹취록(AE, EB, KBL)를 읽고 다시 읽고, 잠재적 시스템(AE, EB, KBL)을 식별하며, 새롭게 드러나는emerging 시스템(모든 저자)에 대해 논의함으로써 모색되었다. 그런 다음 [딜레마, 갈등, 비판적 충돌 및 이중 구속]으로 구분될 수 있는 [모순의 담론적 징후]를 조사했다. 딜레마와 갈등은 각각 'but'과 'no'와 같은 언어적 단서로 표현된다. 비판적인 갈등은 감정적인 설명을 포함한 이야기적 스토리를 사용하여 표현되는 반면, 이중 구속은 무력감의 표현으로 표현됩니다. 모순의 징후를 식별하기 위해 언어적 신호와 데이터의 세심한 읽기가 사용되었다. 서로 다른 종류의 징후들이 서로 겹치고 얽혀 있다는 것을 인정하면서 그룹화 되었다.

The activity systems of the academic hospital were sought by reading and re-reading transcripts (AE, EB, KBL), identifying potential systems (AE, EB, KBL), and discussing the emerging systems (all authors). The data were then interrogated for discursive manifestations of contradictions, distinguishable as dilemmas, conflicts, critical conflicts and double binds (Engeström and Sannino 2011). Dilemmas and conflicts are expressed with the linguistic cues ‘but’ and ‘no’, respectively. Critical conflicts are expressed using narrative stories, including emotional accounts, while double binds are represented by expressions of helplessness (Engeström and Sannino 2011). The linguistic cues and a careful reading of the data were used to identify manifestations of contradictions. The different kinds of manifestations were grouped, acknowledging that they overlapped and intertwined.

다음으로, 주제적 접근방식을 적용하였다. 즉, 발현 부호화(AE), 주제별 코드 대조(AE, KBL, ML), 새로운 주제 검토(모든 저자)이다. 분석의 이 단계에서는 모순 분석 중에 나타난 요소와 시스템 간의 중재도 고려했다.
Next, a thematic approach (Braun and Clarke 2006) was applied as follows: coding of manifestations (AE), collating codes into themes (AE, KBL, ML), and reviewing the emerging themes (all authors). At this stage of the analysis, we also considered the mediations between elements and systems that emerged during the analysis of contradictions.

우리는 교육 개발 프로그램에 대한 저자의 일부(EB, ML, KBL) 관여가 분석에 영향을 미쳤을 수 있음을 인정한다. 따라서 우리는 [데이터에 의해 뒷받침되지 않는 가정]에 지속적으로 이의를 제기하면서, 합의에 도달할 때까지 진행 중인 분석에 대해 반복적으로 논의했다. 또한 주 작성자(AE)는 의사결정과 진행 중인 분석에 대한 [반성을 문서화]하여 성찰 로그를 작성하였다.
We recognise that some of the authors’ (EB, ML, KBL) involvement in the educational development program might have influenced the analysis. Therefore, we iteratively discussed the ongoing analysis until consensus was reached, continuously challenging any assumptions not supported by the data. Also, the main author (AE) kept a reflective log, documenting decisions and reflections on the ongoing analysis.

결과.
Results

학술병원 활동체계: 환자진료, 연구 및 교육
Activity systems of the academic hospital: patient care, research and education

활동 이론에 따라 학술 병원의 활동을 환자 진료, 연구 및 교육 대상이 각각 지시하는 [세 가지 활동 시스템]으로 나누었다(표 1). 이러한 활동은 학술병원이 원하는 "건강의 향상"이라는 결과를 얻기 위해 결합된다. 임상 교사는 이 세 가지 시스템 중 몇 가지 또는 모두 대상이었지만 역할과 책임은 달랐다. 이하에서는, 이러한 시스템간의 모순에 대해, 그 모순과 중재자가 교육 활동에 어떻게 나타나는지에 대해 논의한다.

In keeping with activity theory, we divided the activity of the academic hospital into three activity systems directed by the objects of patient care, research and education respectively (Table 1). These activities join together in the desired outcome of the academic hospital: improved health. The clinical teachers were subjects in several or all of these three systems, yet with different roles and responsibilities. In the section below, the contradictions between these systems will be described followed by a discussion of how the contradictions, as well as mediators, manifested in the activity of education.

학술병원 시스템 간의 모순되는 대상
Contradicting objects between the systems of the academic hospital

세 가지 활동 시스템은, 학술 병원의 성과를 달성하기 위해 함께 협력해야 했기 때문에, 밀접하게 상호 연결되었지만, 환자 치료, 연구 및 교육의 대상이 일치하지 않음에 따라 시스템 간에 모순이 발생한 것이 분명했다(그림 2, 1행 #1). 시간이 끊임없이 부족했기 때문에, 일부 활동이 다른 활동보다 우선시되었고, 시스템 간의 모순을 드러내었으며, 여러 활동이 학술 병원의 업무에서 지니는 가치가 얼마나 불평등한지를 반영하였다.

The three activity systems were closely interconnected as they had to work together to achieve the outcome of the academic hospital, however it was evident that contradictions arose between the systems as their objects of patient care, research and education were not aligned (Fig. 2, line #1). As time was constantly scarce, some activities were prioritized over others, manifesting the contradiction between the systems and reflecting how activities held unequal value in the work of an academic hospital.

 

우리 과는 스트레스를 받고 압박이 가해지면 바로 교육을 중단합니다. (참가자1, 초점그룹3)
Our department drops education as soon as it gets stressed and the pressure is on, then it’s the patient first and education last. (Participant 1, Focus group 3)

이러한 모순으로 인해 개별 교사는 [여러 활동 시스템의 일부]가 되는 데 어려움을 겪었습니다. 활동들 사이에 시간이 나뉘어야 했습니다. 그래서 교사들은 서로 다른 역할과 정체성 사이에서 고민하고 있었습니다. 교육에 종사하는 것과 동료이자 임상의가 되는 것, 그리고 때로는 연구원이 되는 것 사이에서 협상을 해야 했습니다.
This contradiction left the individual teacher struggling with being part of several activity systems where time had to be divided between activities. Hence, the teachers were torn between conflicting roles and identities where they had to negotiate between engaging in education and being a colleague and clinician, and sometimes also a researcher.

우리는 동료들이 교육 업무에 시간을 들여야 할 때 그들이 필요로 하는 지원을 받지 못하기 때문에 부담을 느낍니다. 만약 우리가 거기에 착륙해서 우리가 필요로 하는 며칠 반의 시간을 가질 수 있다면, 우리는 지금과 같은 부담 없이 교육 업무를 더 잘 추진할 수 있을 것입니다. […] 교육 업무를 위해 하루를 예약한 경우, 누군가 일정과 함께 앉아 있는 경우: 

"아니, 교육 업무 때문에 하루 종일 필요하니?" "한나절 클리닉을 할 수 있니?" "적어도 몇 시간 정도는 일할 수 있니?" 
그리고 나서 너무 분명해져서 내가 스스로 자수하려고 노력하지 않으면 내 동료들은 많은 환자와 높은 처리량을 가진 거대한 일을 하게 될 거야. […] 시스템에 공간이 거의 없는 것이 가장 번거롭습니다.(P5, FG 3)

We feel pressured because our colleagues don’t get the back-up they need when we need to take time for educational work and if we could just land in that and be able to take those days and half days that we need to take, then we could pursue the educational work even better, without feeling pressured like we are now. […] If you have reserved a day for educational work and someone is sitting with the schedule:

‘No, do you need the whole day for educational work?’ ‘Can you do clinic half a day?’ ‘Can you at least work some hours?’ and then it becomes so clear that if I don’t try to turn myself inside out, my colleagues will have a huge job with lots of patients and a high throughput. […] That’s the most troublesome, that there is hardly any space in the system at all. (P5, FG 3)

 

이러한 대학병원의 활동간의 끊임없는 교섭에 의해, 교사는 일반적인 교육 업무에 거의 시간을 할애할 수 없게 되어, 결과적으로, 교육 활동과 본질적으로 연계된 활동인 교육 개발educational development에도 거의 시간을 할애할 수 없게 되었다.
This constant negotiation between the activities of the academic hospital left the teachers with little time for educational work in general, and consequently also little time for educational development which was an activity intrinsically interconnected to the activity of education.

교육 개발 작업을 할 여유는 없고, 가능한 한 좋은 품질로 해야 할 최소한의 일에 집중합니다. 그러나 당신은 교육을 더 발전시키고 싶기 때문에 여가 시간에 하지 않으면 그럴 시간이 없습니다.(P2, FG 3)
There is no extra time to carry out educational development work, and instead, you focus on the minimum that needs to be done with as good quality as possible. But you would like to develop the education further, and you don’t have the time for that if you don’t do it in your spare time. (P2, FG 3)

 

교육 활동 시스템의 모순과 중재자의 표현
Manifestations of contradictions and mediators in the activity system of education

 

교육의 가치관과 제정된 가치관의 불일치
Misalignment between espoused and enacted values of education


대학병원의 상반된 대상들 사이의 모순은 교육활동에서 여러 가지 방법으로 나타나서 활동과 그 요소들을 형성하였다. 이러한 표현들 중 하나는 학술병원이 [지지하는espoused 가치들(병원이 주장하는 가치들)]과 [집행되는enacted 가치들(병원이 실제로 하는 일을 통해 암시하는 가치들)] 사이의 불일치에 관한 것이었다.

The contradiction between the conflicting objects of the academic hospital manifested in the activity of education in several ways, thus shaping the activity and its elements. One of these manifestations concerned the misalignment between the espoused values of the academic hospital (what the hospital says it values) and its enacted values (what the hospital implies it values through what it actually does).

중시하는 가치:학술병원에서 일하는 데 필수적인 교육
Espoused values: education as an integral part of working in an academic hospital

학원에서 일하는 데 있어서 공식적인 의무이자 필수적인 부분으로서 교육에 대한 가치관과 규범이 있는 것 같았고, 단지 교육적인 역할을 하는 사람들에게만 국한된 책임이 아니었다. 또한, 참가자들은 교육에 대한 경영진의 접근법이 의료계의 교육에 대한 일반적인 접근법에 어떻게 영향을 미칠 수 있는지 설명했으며, 일부 참가자들은 명확한 교육 초점을 가진 경영진을 묘사했다.

There seemed to be espoused values and norms about education as an official obligation and integral part of working in an academic hospital and not just a responsibility limited to those with an appointed educational role. Further, the participants described how management’s approach towards education could impact the general approach towards education in the clinical community where some participants described having a management with an articulated educational focus.

그것 [경영]은 큰 영향을 끼친다. 이것은 교육이 공간을 차지할 수 있다는 것을 보여주는 하나의 방법입니다. 그들이 말하는 것처럼, 뿐만 아니라, 뭔가 일어나고 있다는 것을 의미하기도 합니다. 그들이 교육과 함께 일하고 싶어한다는 것입니다. 그래서 경영진은 이해관계가 있는지 없는지, 무관심하다는 의사를 전달하고, 이를 직원들 사이에서 반영하고 있다고 생각합니다.(P4, FG 2)
It [management] has a huge impact. It’s a way of signalling that education is allowed to take space, not only as they say, but also that something happens, that they want to work with it [education]. So I think that management communicates either that they have an interest or that they don’t care, and this is reflected [among the staff]. (P4, FG 2)

 
 
집행된 가치관: 교육에 대한 지원과 공식적인 인식 부족
Enacted values: lacking support and formal acknowledgment for education

이러한 [지지된 가치]들이 병원의 [집행된 가치]들과 맞지 않는 것처럼 보였다. 예를 들면, 교육 업무에 대한 경영진의 지원이나 참여buy-in의 결여에 반영되어 교육 활동을 규제하는 룰을 형성하고 있다(그림 2의 2행).
These espoused values seemed to misalign with the enacted values of the hospital. For example, the misalignment was reflected in the lack of support and buy-in from management for educational work and as such, this misalignment shaped the rules that regulated the activity of education (Fig. 2, line #2).

제가 원하던 피드백을 받지 못했습니다. 그들은 학생 병동wards를 원하고, 우리가 감독하기를 원하지만, 그에 대한 자원을 얻지 못하기 때문에 어렵다. 물론 힘든 싸움을 하는 것과 같죠. 대학에서는 임상학과와 계약하기를 원하지만, (학과장 책상에) 아직 계약하지 않고 있습니다.[…] 물론 긍정적인 응원은 있지만, 때로는 매우 소모적인 때가 있습니다. (P6, FG 1)
I haven’t really gotten the feedback that I wanted. It’s difficult because at the same time as they say that they want student wards and want us to supervise, we don’t get the resources for it. It’s like fighting an uphill battle, of course. The university wants us to sign a contract with the clinical department, which I have done, but it’s still lying there [at the department head’s desk], I haven’t got it signed […] But of course, there is positive cheering, but sometimes it’s backbreaking. (P6, FG 1)

또, 일부의 참가자는, 학과 이사회에 교육 대표가 없거나, 경영진이 교육 논의에 거의 참가하지 않았다고 이야기했다. 한 가지 경우, 경영진은 교육 문제에 대한 [책임을 임상 교사에게 완전히 위임한 것]으로 묘사되었다. 이는 경영진의 지원과 참여buy-in 부족이 강조되었으며, 환자 관리, 연구 및 교육 간의 노동 분담이 교육에 대한 책임을 교육적 역할을 가진 사람들에게 전가한 반면, 교육적 대표자는 결정이 내려진 포럼 밖에 남겨둔 것을 반영했다.

Further, some participants related that educational representatives were missing from the department’s board of directors or that management rarely took part in educational discussions. In one case, management was described as having delegated the responsibility for educational matters fully to the clinical teachers. This highlighted the lack of support and buy-in from management and reflected how the division of labour between patient care, research and education had shifted the responsibility for education to those with educational roles, while leaving educational representatives outside the forums in which decisions were made.

P1: 음, 만약 당신이 임시 교사와 몇몇 임상 교사를 가지고 있다면, 당신은 관리자로서 교육에 대해 신경 쓸 필요가 없다는 것이 항상 느껴져 왔다. […] 그러면 담당자가 있기 때문입니다. […] 그래서 저는 (매니저들이) 그들도 이 일에 관여해야 한다는 것을 이해하려고 노력했다고 생각합니다.
P1:
 Well, the feeling has always been that if you have an adjunct teacher and some clinical teachers then you as a manager don’t need to care about education. […] Because then you have people that are supposed to take care of it. […] And that’s where I feel I might have struggled a bit, trying to get them [the managers] to understand that they must also be involved in it.

인터뷰 담당자: 당신은 그들이 어떻게 관여해야 한다고 생각합니까?
Interviewer:
 How do you think they should be involved?

P1: 음, 당신은 학생들이 있다는 것을 알아야 합니다. 아니요, 하지만 우리는 이것에 대해 많은 시간을 가지고 이야기했습니다. 그래서 누군가는 학생 기간 동안 스케줄을 짜고 학생과 가르치는 데 실제로 얼마나 많은 시간이 걸리는지 이해합니다. 이제 임상 일을 하면서 회복하려고 노력해야 해
P1:
 Well, you should know that you have students [laughs]. No, but we’ve talked a lot about this with time, so who does the scheduling during the student period and understands how much time it actually takes with students and teaching. Now you have to try to pull through while doing your clinical job at the same time.

P5: 네, 좋은 설명이었습니다. 예를 들어, 교육은 항상 환자가 먼저이기 때문에 시간을 끌 수 없습니다.
P5:
 Yes that was a good description. Like, [education] cannot take any time because it’s always the patient first.

P1: 그리고 그건 그들이 (관리자들이) 그게 뭔지 모르기 때문이라고 생각해요. […] 매니저들은 '그건 네가 알아서 할 거야'라고 말합니다.(FG3)
P1:
 And I think it’s because they [the managers] don’t understand how it is. […] They [the managers] have like ‘well you’ll take care of that’. (FG3)



또 다른 가치관과 제정된 가치관의 불일치의 징후는 많은 교사들이 [교육 업무에 대한 공식적인 인정이 부족하다는 것]을 경험했다는 것이다. 이러한 공식적인 인정의 부족은 예를 들어 교육에 종사하는 임상의에 대한 강의의 부족을 포함하였고, 이러한 인정의 부족이 어떻게 교육자의 진로를 이탈하게 되었는지에 대해 논의하였다.

Another manifestation of the misalignment between the espoused and enacted values was that many teachers experienced a lack of formal acknowledgment for educational work, despite the espoused values of education as integral to academic hospitals. This lack of formal acknowledgment included for example the lack of lectureships for clinicians engaged in education and some discussed how this lack of formal acknowledgment might have led to others leaving the educator career path.

 

임상 작업장에서 교육에 대한 공식적인 논의를 확립하는 데 어려움
Difficulties establishing formal discussions on education in the clinical workplace

참가자들은 [교육에 종사하는 동료들과의 교육 토론]이 어떻게 그들의 참여를 촉진하고 그들의 교육 역할을 지원함으로써 교육 활동 시스템의 도구 역할을 수행했는지에 대해 설명했다. 이러한 논의는 부분적으로 [비공식적인 장소]에서 이루어졌으며, 여기서 교사와 동료들은 근무일 동안 교육적인 대화를 나누었다. 이러한 비공식 모임에서 실제로 모이는 것은 일정이나 점심 습관 등의 일상과 시설, 교육에 관심이 있는 동료가 근처에 있고, 이러한 논의가 이루어질 수 있는 장소에 접근할 수 있는 것에 의해 중재mediate되었다(그림 2, 3a).
The participants described how educational discussions with peers also engaged in education nurtured their engagement and supported them in their teaching role, thus acting as a tool in the education activity system. These discussions partly occurred in informal arenas, where teachers and peers had educational conversations during the working day. The actual coming together in these informal gatherings was mediated by routines and facilities such as schedules and lunch habits, having educationally interested peers nearby as well as having access to meeting places where these discussions could take place (Fig. 2, line #3a).

만약 이 사람들이 교육에도 관심이 있다는 것을 안다면, 여러분 자신이 있는 상황에서 소규모 그룹에 속해 있는 것이 매우 고무적이라고 생각합니다. 교육 개발 코스는 기초를 형성하지만 그 후에 시행되어야 하고, 그리고 나서 여러분은 영감을 주고, 지원하고, 함께 발전시킬 수 있는 팀을 만들기 위해 '지금 여기서 우리가 어떻게 나아갈 수 있을까?'라고 함께 생각하는 몇몇 친구들이 필요합니다.(P4, FG 2)

I find it very inspiring to be in smaller groups if you know that these people are also interested in education, in a context where you yourself are situated. Educational development courses form a base but then it’s supposed to be implemented, and then you need some friends who think together ‘how can we proceed here and now?’ so that you have a team where you can inspire and support and develop together. (P4, FG 2)

 


또한, 교육적 논의는 [교육에 할당된 일정일scheduled day] 등 [공식적인 장소에 대한 접근]으로 중재되었다. 여기서 임상 교사는 병원의 다른 교사들과 만나 교육 문제를 논의한다. 그러나, 이러한 공식 경기장은 종종 외부로 나가 대학에 의해 시작되었으며, 매우 드물었다(보통 1년에 한두 번). 일부 사업장에서는 교육계의 챔피언이 부문 차원의 교육 논의를 공식화하기 위한 노력을 기울였다(그림2 3b). 다른 경우, 참가자들은 [임상 커뮤니티에서 공식 또는 체계적인 교육 토론의 기회를 거의 또는 전혀 경험하지 못했으며], 교육은 학술 병원에서 커뮤니티의 공통 의제에서 누락되었다(그림 2, 3c행). 이는 직장 내 특정 토론을 다른 커뮤니티가 허용하거나 허용하지 않는 방법을 나타내어 교사들이 교육에 대해 논의하기 위해 모이는 방식을 형성했다.
Further, educational discussions were also mediated by access to formal arenas such as scheduled days assigned for education, where clinical teachers would meet with other teachers in the hospital as well as with representatives from the university to discuss educational matters. However, these formal arenas were often off-site and initiated by the university, as well as being quite infrequent (usually one or two times a year). In some workplaces, champions in the educator community had made efforts to formalize educational discussions at a departmental level (Fig. 2, line #3b). In other cases, participants experienced few or no opportunities for formal or structured educational discussions in the clinical community, with education apparently missing from the common agenda of the community in the academic hospital (Fig. 2, line #3c). This indicated how different communities either allowed or disallowed certain discussions in the workplace and thus shaped the way in which teachers gathered to discuss education.

직장에서 다른 일을 하려고 하는 것은 주로 나와 교수[전임상교사]이다. 
실제로 회의의 구조나 정례는 없습니다. 한 학기에 한 번이지만, 뭐랄까, 명확한 계획이 없습니다.(P4, FG2)
In the workplace, then it’s mostly me and the professor [the former clinical teacher] that tries to carry out different things and we don’t have any real structure or regularity for meetings actually, it’s once a semester but without, what shall I say, any clear plan. (P4, FG2)

 

임시 교육 임용으로 교육 업무에 지장을 초래하다
Transient educational appointments hinder educational work

대학병원의 [분업division of labour]은 [교육활동의 규칙]을 형성해, 교사의 교육목표를 향한 업무에 방해가 되는 것 같다(그림2의 4행). 부분적으로, 이것은 [교육적 역할의 직원 배치 방식]과 관련이 있었다. 일부 참가자들은 특별히 교사직에 지원했지만, 그들 중 [다수는 커리어 궤적에서 의도적으로 교사직을 추구하지 않았다]. 대신, 임상 교사의 임명은 종종 임상 커뮤니티의 구성원들에게 [교육적 역할을 할당함]으로써 수행되었다. 예를 들어, 한 부서는 레지던트 프로그램의 일환으로 [레지던트들을 임상 교사로 로테이션 시킬 것]을 계획했습니다.
The division of labour in the academic hospital shaped the rules of the activity of education, and appeared to impede teachers in their work towards their object of education (Fig. 2, line #4). Partly, this had to do with how educational roles were staffed. While some participants had specifically applied for a teaching position, many of them had not intentionally sought the teaching position as part of a career trajectory. Instead, the appointment of clinical teachers was often carried out by allocating educational roles to members of the clinical community. As an example of this, one department was planning for residents to rotate as clinical teacher as part of their residency.

제가 부탁받았거나 교수님과 학과장이 제게 임상 선생님이 되는 것에 관심이 있냐고 물었고, 그 때쯤에는 뭐가 수반되는지는 몰랐습니다만, 그 느낌이나, 재미있었던 것 같습니다. 그리고 생각해볼 틈도 없이 '네'라고 대답했기 때문에 교육에도 관심을 갖게 된 것은 그 과정에서였습니다.(P1, FG1)
I was asked to do it, or our professor and our head of department asked me if I was interested in being a clinical teacher […] and by then I didn’t know what it entailed, but it felt, or it sounded fun. And I said yes without having had the time to reflect on it so it was during the process that I also became interested in education. (P1, FG 1)

게다가, 교사로서의 고용은 종종 1년 또는 2년으로 제한되었고, 이것은 (교육적) 역할이 종종 개인들 사이에서 순환한다는 것을 의미했다. 이는 [지속성을 저해]하기 때문에 장기적인 관점에서 교육 업무와 교육 발전의 기회를 제한하는 것으로 경험되었다.

Moreover, the employment as teacher was often limited to one or two years which meant that the role often shifted between individuals. This was experienced as limiting the opportunities for educational work and educational development in a longer-term perspective as it hindered continuity.

P3: 2년간 과제가 있고, 이직률이 상당히 높기 때문에 (교사로서) 교육을 받지 않았기 때문에 이 직책을 익히려면 시간이 좀 걸리고, 그리고 나서 정말로 그만둘 때가 되었습니다.
P3:
 We have our assignments for two years, and it’s a pretty high turnover, and as we don’t have any education [as teachers], it takes some time to acquaint oneself with the position, and then it’s time to quit really.

P4: 교육적인 개발 작업을 하고 싶은 경우는 곤란합니다. 그러면 갑자기 새로운 동료가 소개되어야 하기 때문입니다.(FG 3)
P4:
 And that makes it difficult if you want to carry out some [educational] development work because then, all of a sudden, there’s a new co-worker who needs to be introduced. (FG 3)

 

교사 정체성 개발 방해
Impeding the development of a teacher identity

참가자들은 공식적인 교육훈련과 교육지식이 부족했기 때문에 [교육자로서의 역할에 완전히 공감하지 못하는 듯] 보였다.
The participants did not seem to identify fully with the role as educator as they lacked formal training and knowledge within education.

하지만 교육훈련이 없기 때문에 내가 알고 있는 아주 작은 것 이상의 것이 있다는 것을 깨달았을 뿐이다. 우리는 교사teacher가 아니다.(P3, FG 3)
But you just realise that there is much more than the tiny, tiny bit that I know because we don’t have any educational training; we’re not teachers. (P3, FG 3)



이와 같이, 교육 제도의 룰이나 규범 중 하나가, 교육자 커뮤니티의 적법한 멤버가 되어, 교육자의 역할과 자신을 동일시하기 위해서, 정식적인 교육 훈련이 필요하다고 생각되었다(그림 2의 5a행). 그 때문에, 참가자는, 정식 연수를 실시하는 툴로서 교육 개발 활동을 일부 요구하고 있어, 교육 개발은 교사로서의 정체성의 확립과 교육자의 커뮤니티에의 소속감을 중개할 수 있다(그림 2 제5 b항).
As such, it seemed as if one of the rules or norms of the education system was that formal training in education was required to become a legitimate member of the educator community and to identify oneself with the educator role (Fig. 2, line #5a). Therefore, the participants partly sought out educational development activities as a tool offering formal training and thus, educational development could mediate the establishment of an identity as teacher and the sense of belonging to the community of educators (Fig. 2, line #5b).

저는 실제로 변화를 주러 온 것이 아닙니다. 모든 것에 익숙하지 않기 때문에 배우러 온 것입니다. 교수-학습은 새로운 것입니다.그러므로, 이 [교육 개발 프로그램]은 과학이나 여러분이 다루는 것으로서 [교육]에 들어가는 방법입니다. (P2, FG 1 )
I’m not really here to change so much, I’m here to learn because I’m so new in everything, teaching and learning is new […] So this [the educational development program] is a way of entering it [education] as a science or something you work with. (P2, FG 1)

 

교육은 임상 업무에서 창조적인 공간을 매개한다.
Education mediates a creative space in routinized clinical work

교육이 [시스템 수준]에서 [일반화된 대상generalized object]이었던 교육 활동 시스템은, 참가자들에게 [개별 수준]에서 몇 가지 [잠재적 결과]를 제공했다. 부분적으로 이러한 성과는 교육이 개인 및 전문적 개발을 매개하는 교육에 대한 개인적인 관심에 관한 것이다(그림2의 6행). 또한, 많은 선생님들은 [환자 진료 활동의 창의성을 위한 공간]에 만족하지 못했고 [일상화된 임상 작업]에 충분히 자극을 받지 못했다. 따라서, [교육적 역할]은 manoeuvre을 하고, 자기주도할 수 있는 자유로, 창조적인 공간을 [매개]하고, 기존의 임상 업무와는 질적으로 다른 작업 방식을 수반하는 것으로 끌렸다.

The activity system of education, in which education was the generalized object on the system level, provided the participants with several potential outcomes on an individual level. Partly, these outcomes related to a personal interest in teaching where education mediated personal and professional development (Fig. 2, line #6). Also, many of the teachers were unsatisfied with the space for creativity within the activity of patient care and felt insufficiently stimulated by clinical work which had become routine. Therefore, the educational role attracted as it mediated a creative space with a freedom to manoeuvre and to be self-directed, and entailed a qualitatively different way of working than traditional clinical work.

그것은 자유입니다. 대학병원에는 많은 것들이 통제되고 있습니다. 그리고 이 역할에서는, 제 모든 아이디어의 배출구가 생깁니다.[…] 그러니까, 즐겁고, 일이 일어나기 때문에, 제 자유는 거기에 있습니다. (P3, FG 3)
It’s the freedom. There is so much that is controlled in an academic hospital, and in this role, I get an outlet for all my ideas, […] I mean, it’s fun, things happen, so it’s where my freedom is. (P3, FG 3)

 

활동 보완 - 교육 레버 리서치
Complementing activities—education levers research

위에서 설명한 바와 같이, 교사들은 교육 업무에 대한 공식적인 인정의 부족을 경험했다. 그러나 일부 부서에서는 예를 들어 연구에 시간과 자금을 제공하는 등 교사들의 작업에 대한 보상을 하려는 노력이 있었다.
As described above, the teachers experienced a lack of formal acknowledgement for educational work. However, there were efforts in some departments to remunerate teachers for their work, for example by offering time and funding for research.

임상교사는 자신의 시간의 33%를 교육용으로 남겨두고 있다. […] 저희 부서에서는 교직이 연구에 33%의 시간을 더 벌어들이고 있습니다[…] 예산은 이 33%의 연구비를 지원하는 특정 예산에서 나옵니다.(P1, FG 1)
The clinical teacher has 33% of his or her time reserved for education. […] In our department, the teaching role generates an additional 33% time for research […] money comes from a specific budget that funds this 33% [time] for research. (P1, FG 1)

또, 교육은 아카데믹 커리어 내의 자격으로서 인식되고 있기 때문에, 교육에 임하는 것은 연구 활동에 한층 더 지렛대를 제공한다(그림 2의 7행).
Also, as education was perceived as a qualification within an academic career, engaging in education offered further leverage in the activity of research (Fig. 2, line #7).

우리 과에서 가르치고 싶은 의욕을 갖게 하는 또 다른 점은 연구가 많다는 것입니다. 그리고 특히 임상 교사로서 의대생들을 가르치는 것은 연구에 매우 가치가 있습니다. 그래서 그 때문에 가르치려는 많은 사람들이 있습니다. (P1, FG 1)
Another thing that makes people motivated to teach in our department is that we have a lot of research. And teaching, especially on that level [as clinical teacher], teaching medical students, is very meriting in research, so there are lots of people [in the department] who want to teach because of that. (P1, FG 1)

 

논의
Discussion


본 연구에서는 활동 이론의 관점을 사용하여, [임상 교사가 교육 개발에 참여하는 것]이 어떻게 그들이 활동하는 [시스템에 의해 영향]을 받는지 조사했다. 임상 교사는 학술 병원의 세 가지 상호작용 활동 시스템인 [환자 치료, 연구, 교육 시스템]의 일부라는 것을 발견했습니다. 이 세 가지 활동은 서로 다른 대상을 가지고 있기 때문에 모순이 발생하여 일부 활동이 다른 활동보다 우선시되었다. 교사의 우선순위는 학술 병원의 우선순위와 상호 작용하여 협상되는 것처럼 보이기 때문에 이는 교육 및 교육 발전에 여러 가지 영향을 미칩니다.

In this study, we employed an activity theory perspective to explore how clinical teachers’ engagement in educational development was affected by the systems they act within. We found that the clinical teachers were part of three interacting activity systems of the academic hospital: the systems of patient care, research and education. Contradictions arose between these three activities as they had differing objects, resulting in some activities being prioritised over others. This has multiple implications for education and educational development, as teachers’ priorities seem to be negotiated in interaction with the priorities of the academic hospital.

우리의 연구결과는 [교육이 (공동체가 특정 활동을 허용하거나 허용하지 않는) 학술병원의 소외된 활동임]을 시사한다. 우리의 연구에서, 이것은 참여 임상 교사에 의해 논의된 많은 예에서 드러났습니다. 예를 들면 다음과 같습니다.

  • 학술병원이 지지하는 가치와 제정된 가치 사이의 불일치
  • 임상 작업장에서 공식적인 교육 논의를 할 수 있는 제한된 기회
  • 의사결정이 내려지는 포럼(회의)에 교육 대표자가 부족함
  • 일정과 작업 부하에 의해 교사에게 부과되는 교육과 환자 치료 간의 지속적인 협상

결국, 대학병원의 [상충하는 목적]은 [임상교수자들이 끊임없이 다른 방향으로 끌려간다는 것]을 의미했다.
Our findings suggest that education is a marginalised activity of the academic hospital where the community allows or disallows certain activities. In our study, this manifested in a number of examples discussed by the participating clinical teachers, including

  • the mismatch between the espoused and enacted values of the academic hospital,
  • the limited opportunities for formal educational discussions in the clinical workplace,
  • the lack of educational representatives in the forums in which decisions were made, and
  • the constant negotiation between education and patient care imposed on the teachers by scheduling and workloads.

Thus, the competing objects of the academic hospital meant that the teachers were constantly pulled in different directions.

병원의 환자 진료든, 대학의 연구든, [교육과 조직의 다른 업무 간의 이러한 긴장감]은 [교육 변화와 교육 개발을 수행할 수 있는 교사들의 가능성을 저해하는 것]으로 묘사되어 왔다. 이는 교육 수준이 낮은 병원에서는 교사 기관과 교육 관행을 개발할 기회가 줄어드는 조직의 리더십과 문화와 관련이 있다고 제안되어 왔다. 이와 같이, 교사의 우선 순위는 학술 병원의 가치나 실천과 밀접하게 관련되어 있는 것 같습니다. 또, 본 연구에서는, 교육과 환자 진료의 모순이, 교사의 교육 개발이나 변화를 추구할 기회를 제한할 가능성이 있는 것을 시사하고 있습니다.
This tension between education and other tasks of an organisation, whether it is patient care in hospitals or research in universities, has been described as impeding teachers’ possibilities to carry out educational change and educational development (Cantillon et al. 2016; Jääskelä et al. 2017; Stenfors-Hayes et al. 2010; Zibrowski et al. 2008). It has been suggested that this relates to leadership and culture in an organisation (Jääskelä et al. 2017; O’Sullivan and Irby 2011), where teachers’ agency and their opportunities to develop educational practices is decreased in hospitals where education has low status (Cantillon et al. 2016). As such, teachers’ priorities seem to closely interact with the values and practices of the academic hospital, and our study suggest that the contradictions between education and patient care may restrict teachers’ opportunities to pursue educational development and change.

[임상교사가 어떻게 학술병원에서 모순되는 대상과의 활동 사이에서 끌려가는지pulled]를 보여주는 이 연구에 비추어 볼 때, 어떻게 하면 이러한 교사들이 교육 개발에 참여할 수 있을지에 대한 불타는 의문은 여전히 남아 있다. 이 복잡한 문제를 해결할 수 있는 몇 가지 가능한 방법은 본 연구에서 제시한 중재 사례이며, 그 중 하나는 교육적인 토론educational discussions였다. 이러한 [토론]은 교사들의 교육적 역할을 지원하고 교육자들의 커뮤니티를 형성할 수 있게 해주었기 때문에 [교육 활동에서 중요한 도구]로 떠올랐다. 이는 교사 커뮤니티가 교사들의 교육에 대한 이해를 집단적으로 증진시키고, 직장이 가치 있는 학습의 근원으로 부각되는 이전 조사 결과를 고려할 때, 특히 중요한 것으로 보인다. 따라서, 직장에서 [교육적 토론을 가능하게 하는 경기장arenas]을 조성하는 것이, 전문 병원의 교육 개발자나 관리자에게 있어서 중요한 과제로 부상한다. 이는 교육자 공동체를 촉진·유지해, 임상 직장에서의 학습·교육 발전을 가능하게 하고 있다.

In the light of the present study illustrating how clinical teachers are pulled between activities with contradicting objects in the academic hospital, the burning question remains how to enable these teachers to engage in educational development. Some possible ways to address this complex question were those instances of mediation suggested by this study, one of which was educational discussions. These discussions emerged as a crucial tool in the activity of education as they supported teachers in their educational role and enabled the creation of communities of educators. This appears especially important considering previous findings where communities of teachers have been found to collectively advance teachers understanding of education, with the workplace being highlighted as a valuable source of learning (Jääskelä et al. 2017; Knight et al. 2006; O’Sullivan and Irby 2011; Roxå and Mårtensson 2009). Therefore, creating arenas allowing educational discussions in the workplace emerges as an important task for educational developers and managers in academic hospitals, thus promoting and sustaining communities of educators and enabling learning and educational development in the clinical workplace.

위의 내용은 교육발전을 위한 직장학습과 교육자 커뮤니티의 중요성을 강조하지만, 이 연구의 일부 참가자들은 공식적인 교육훈련이 부족했기 때문에 스스로를 교수자라고 생각하지 않았다. 따라서, 교육 제도의 ['규칙'] 중 하나는 교육 공동체의 합법적인 구성원이 되기 위해서는 공식적인 훈련이 필요하다는 것으로 보였다. 이것은, 여기나 그 외의 장소에서 설명되고 있는 것과 같이, 교육에 있어서의 지식과 스킬을 높이기 위해서, 교육 개발 활동에 종사하는 인센티브와 관련됩니다. 참여자들이 교사의 정체성을 개발하고 교육 공동체의 합법적인 구성원이 될 수 있는 기회를 제한시키는 또 다른 요인은 [교육적 역할의 일시성transience]이었다. 교육적 역할은 종종 [능동적으로 추구]되기 보다는 [수동적으로 할당]되었다. 이전의 연구는 교사 정체성이 직장 문화와 관련하여 협상된다는 것을 시사하고 있으며, 이는 우리 연구에서 학술 병원의 가치와 실천이 참가자들의 교사로서의 의식을 더욱 저해하는 이유를 설명할 수 있다. 우리의 연구결과는 교육개발이 임상의의 교사 정체성 형성과 교육자 커뮤니티에서의 정당한 멤버십을 매개하는 도구로서 기능할 가능성을 시사한다. 이와 같이, 교육개발은 직장에서 경험하는 모순된 가치관을 극복하는 데 중심적인 역할을 할 수 있다. 따라서 우리는 교육개발에 있어서 [교수자의 정체성]에 초점을 맞추자는 이전의 제안에 동의한다.

While the above underscores the importance of workplace learning and communities of educators for educational development, some of the participants in this study did not percieve themselves as teachers as they lacked formal training in education. Accordingly, one of the ‘rules’ of the education system seemed to be that one needs formal training to become a legitimate member of the educator community. This relates to the incentive to engage in educational development activities to increase knowledge and skills within teaching as described here and elsewhere (Bouwma-Gearhart 2012; Steinert et al. 2010; Stenfors-Hayes et al. 2010). Another factor that might have limited participants’ opportunities to develop teacher identities and become legitimate members of the educator community was the transience of educational roles, which were often allocated rather than sought out. Previous research suggests that teacher identity is negotiated in relation to the culture of the workplace (Cantillon et al. 2016), which could explain why the values and practices of the academic hospital in our study might have further impeded the participants’ sense of being teachers. Our findings suggest that educational development have the potential to function as a tool mediating the formation of clinicians’ teacher identity and their legitimate membership in the educator community. As such, educational development may have a central role to play in overcoming some of the contradicting values experienced in the workplace. We therefore agree with previous suggestions to focus on teacher identity in educational development (Steinert and MacDonald 2015; Stone et al. 2002).

본 연구결과는 [임상교사가 참여하는 시스템]이 [교육실천을 발전시키고, 임상직장의 교육변화를 실시conduct하며, 교사로서의 정체성을 발전시킬 기회가 있는지 여부]를 판단하는 데 중요하다는 것을 시사하기에 교육발전에 대한 함의가 있다. 이러한 이유로, 교육 개발자는, [개별 교사]에 초점을 두기 보다는, [고유의 규칙, 분업, 커뮤니티에의 대처에 의해서 활동 시스템의 개발]로 초점을 옮겨야 한다고 생각한다. 따라서 우리는 다른 사람들과 동의하며 향후 교육 개발 활동에서 [임상교사가 일하는 상황]을 고려하는 것이 필수적이라고 생각한다. 또, [의료 현장의 권력자(경영진 등)]도, 교육 개발 활동에 참가할 필요가 있습니다. 그래야만, 직장의 교육 리더십을 확립해, 교육의 진보를 인정받아 가치 있는 임상 작업장을 만들 수 있습니다. 또, 특히, 항상 그렇지만은 않았던 것을 고려하면, 임상교수자나 그 외 교육 담당자를 임상 부문의 의사결정조직decision making bodies에 포함시키는 것을 강하게 지지한다. 상기의 개입은, 의사결정에 있어서의 교육적인 관점을 촉진하는 것 뿐만이 아니라, 대학병원의 활동을 보다 제휴시켜, 임상 교사가 교육 개발에 임하는 것을 서포트하는 것이 바람직하다.

The findings of the present study have implications for educational development in suggesting that the systems clinical teachers participate in are important in determining whether or not they have opportunities to develop their teaching practice, to conduct educational change in the clinical workplace, and to develop their identities as teachers. For these reasons, we believe that educational developers should shift focus from individual teachers to also developing activity systems by addressing the inherent rules, division of labour and communities. We therefore concur with others and regard it as imperative that the context in which clinical teachers work is taken into account in future educational development activities (Jääskelä et al. 2017; O’Sullivan and Irby 2011). Moreover, we suggest that those with power in the clinical workplace, such as management, also need to take part in educational development activities as it would enable us to establish educational leadership in the workplace (Bolander Laksov and Tomson 2017) and to create clinical workplaces in which the advancement of teaching is recognised and valued (Knight et al. 2006). Also, we strongly support the inclusion of clinical teachers or other educational representatives in the decision-making bodies of clinical departments, especially considering the finding that this was not always the case. The above interventions taken together would not only promote an educational perspective in decision-making but would hopefully also help us to better align the activities of the academic hospital, thus supporting clinical teachers in engaging in educational development.

게다가 임상 교육자로서의 진로를 추구할 수 있는 가능성을 확대하는 것을 시사하고 있습니다. 이를 위해서는 교육적 역할을 임상의에게 할당하거나 임명하는 것에서 벗어나야 하는 교육에서의 채용 관행에서 출발하여 교육이 적합한 교육적 진로가 필요합니다. 대신, 이러한 임명은 명확하고 집중적인 직무 기술 및 보상 체계 구축을 통해 매력적으로 만들어져야 한다. 조사결과에서 지적된 바와 같이, 이러한 보상구조 중 하나는 교육강연회나 이와 유사한 역할을 하는 것이 될 수 있으며, 이는 임상의의 교육경로를 가시화하고 매력적으로 만드는 데 기여할 수 있다.
Further, the findings suggest expanding the possibilities to pursue a career as clinical educator. This would require distinct educational career paths where education is meriting, starting with the hiring practices in education where we should move away from allocating or appointing educational roles to clinicians. Instead, these appointments must be made attractive by having a clear and focused job description, and also through the establishment of reward structures. As pointed out in the findings, one such reward structure could be to create educational lectureships or similar roles, as this would contribute to making the educational career path for clinicians visible and appealing.


마지막으로, 본 연구에서 강조된 바와 같이, [학술 병원의 활동 시스템 간의 모순]으로 인해, [단순히 시간을 추가하는 것]만으로는 임상 교사의 교육 개발 참여를 지원하는 데 충분하지 않으며, 그 시간이 다시 환자 진료, 연구 및 교육 간에 불균등하게 분배될 위험이 있다고 생각합니다. 대신, 한 가지 해결책은 임상 교사에게 [교육적 개발이 요구되는 시스템을 구축하는 것]이며, 워크샵과 강좌에 참석하거나 교육 회의에 참석하거나 자신의 직장에서 교육 개발을 추구하거나 그러한 활동에 시간을 할당하는 것이다. 이를 위해서는 대학 내 병원과 교수진 개발 단위 간의 지속적인 대화가 요구되며, 여기서 지원은 교육 활동 시스템뿐만 아니라 개별 임상 교사의 요구에 맞춰 조정된다.
Lastly, due to the contradictions between the activity systems of the academic hospital as highlighted in this study, we believe that simply adding more time is insufficient in supporting clinical teachers engagement in educational development, risking that time is again distributed unevenly between patient care, research and education. Instead, one solution could be to establish a system in which educational development is required of clinical teachers, with time earmarked for such activities whether it be attending workshops and courses, partaking in educational conferences or pursuing educational development in the own workplace. This would call for a continuous dialogue between the hospital and faculty development units in the university, where the support is tailored to the needs of the individual clinical teacher, as well as to the activity system of education.

한계 및 향후 연구
Limitations and future research

이 연구는 오직 한 개의 의과대학만을 포함하고 있으며, 참가자들은 한 개의 교육 개발 프로그램에서 추출한 것이기 때문에, 결과의 전달 가능성은 제한적일 수 있다. 그러나 여러 직업과 임상 환경이 제시되어 교육 개발에 참여한 다양한 배경과 다양한 경험을 제시하였다.
Given that this study only included one faculty of medicine, with participants drawn from one educational development program, the transferability of findings might be limited. However, several professions and clinical environments were represented, indicating diverse backgrounds and various experiences of engaging in educational development.

흥미롭게도, 이 연구 결과는 장점, 자금, 시간을 제공함으로써 연구 활동을 활용하는 교육을 제안합니다. 효과가 반대 방향으로도 진행되는지, 아니면 이것이 이러한 활동을 조정하는 방법이 될 수 있는지, 그리고 이것이 왜 더 탐구할 가치가 있는지 알 수 없다. 또, 이 연구에는 다른 건강 직업의 참가자가 포함되었지만, 교육 발전의 기회에 관한 직업간의 차이에는 초점을 맞추지 않았다.
Interestingly, the findings suggest education to lever the activity of research by providing merits, funding and time. We do not know if the effect goes also in the opposite direction, or if this might serve as a way of aligning these activities, why this could merit further exploration. Also, while this study included participants from different health professions, it did not focus on differences between professions regarding the opportunities for educational development, a question requiring further studies.

마지막으로, 이 연구는 정규 교육 개발에 참여하는 교사들의 참여에 대한 통찰력을 제공하지만, 그러한 활동에 참여하지 않는 교사들과 그들이 직면할 수 있는 장벽에 대한 해답은 아직 남아 있다.

Lastly, while this study offers insight into the engagement of teachers who do participate in formal educational development, there are still unanswered questions about teachers who do not participate in such activities and the possible barriers that they encounter.

결론
Conclusion

본 연구에서는 활동 이론의 관점을 사용하여 임상 교사가 교육 개발에 참여하는 것이 어떻게 그들이 행동하는 시스템에 의해 영향을 받는지 조사했다. 우리의 결과는 임상 교사를 환자 치료, 연구 및 교육 시스템이 공존하고 상호작용하는 학술 병원의 일부로 배치하고, 이러한 시스템 간에 대상이 잘못 정렬됨에 따라 모순이 발생함을 시사합니다. 또한, 연구결과는 [임상교사의 우선순위]가 [학술병원의 우선순위]와 상호 작용하여 협상된다는 것을 시사한다. 학술병원의 우선순위에서 교육활동의 가치가 떨어지고 우선순위가 낮은 것으로 보이는 경우, 교육발전의 기회를 제한한다.

In this study, we employed an activity theory perspective to explore how clinical teachers’ engagement in educational development was affected by the systems they act within. Our results situate clinical teachers as part of an academic hospital where the systems of patient care, research and education co-exist and interact, and suggest that contradictions arise between these systems as their objects are misaligned. Further, the findings suggest that the priorities of clinical teachers are negotiated in interaction with the priorities of the academic hospital, where the activity of education appears to be less valued and prioritised, thus limiting the opportunities for educational development.

따라서 임상교사 개개인의 지원·육성을 위해서는 교육개발활동도 중요하지만, 교육의 진보를 촉진하고 중시하는 제도 정비에 중점을 두어 임상교사의 교육개발에 대한 관여를 중개해야 한다. 이에 따라 교육발전에 있어 학술병원의 경영진과 리더를 포함한 병원 내 의사결정기관에 교육대표를 포함시키고, 직장에서의 교육발전을 촉진하기 위한 교육자 커뮤니티 형성을 지원하고 싶다. 마찬가지로, 예를 들어 명확한 보상 구조를 가진 뚜렷한 교육 진로 확립을 통해 교육의 가치 및 보상 방식을 바꾸는 것은 임상 교사들과 그들의 교육 관행 개선을 위한 추구를 지원하는 데 도움이 될 수 있습니다.

Therefore, while educational development activities are important in supporting and developing individual clinical teachers, we must also focus on developing systems where the advancement of education is promoted and valued, thus mediating clinical teachers’ engagement in educational development. Accordingly, we would like to suggest including educational representatives in decision-making bodies in the hospital, including management and leaders of academic hospitals in educational development, as well as supporting the creation of communities of educators to better enable educational development in the workplace. Similarly, changing the way in which teaching is valued and rewarded, for example by establishing distinct educational career paths with clear reward structures, might hopefully serve to support clinical teachers and their pursuit of improving their teaching practice.

 


Adv Health Sci Educ Theory Pract. 2019 Mar;24(1):125-140. doi: 10.1007/s10459-018-9853-y. Epub 2018 Oct 3.

Contradictions in clinical teachers' engagement in educational development: an activity theory analysis

Affiliations collapse

Affiliations

1Department of Learning, Informatics, Management and Ethics, Karolinska Institutet, Tomtebodavägen 18A, 171 77, Stockholm, Sweden. agnes.elmberger@ki.se.

2Department of Molecular Medicine and Surgery, Karolinska Institutet, Stockholm, Sweden.

3Department of Clinical Genetics, Karolinska University Hospital, Stockholm, Sweden.

4Department of Learning, Informatics, Management and Ethics, Karolinska Institutet, Tomtebodavägen 18A, 171 77, Stockholm, Sweden.

5Primary Health Care Unit, Institute of Medicine, The Sahlgrenska Academy, University of Gothenburg, Gothenburg, Sweden.

6Department of Education, Stockholm University, Stockholm, Sweden.

PMID: 30284068

PMCID: PMC6373255

DOI: 10.1007/s10459-018-9853-y

Free PMC article

Abstract

Many medical universities offer educational development activities to support clinical teachers in their teaching role. Research has focused on the scope and effectiveness of such activities and on why individual teachers attend. However, systemic perspectives that go beyond a focus on individual participants are scarce in the existing literature. Employing activity theory, we explored how clinical teachers' engagement in educational development was affected by the systems they act within. Three focus groups were held with clinical teachers from different professions. A thematic analysis was used to map the contradictions between the systems that the participants were part of and the manifestations of these contradictions in the system of education. In our model, clinical teachers were part of three activity systems directed by the objects of patient care, research and education respectively. Contradictions arose between these systems as their objects were not aligned. This manifested through the enacted values of the academic hospital, difficulties establishing educational discussions in the clinical workplace, the transient nature of educational employments, and impediments to developing a teacher identity. These findings offer insights into the complexities of engaging in educational development as clinical teachers' priorities interact with the practices and values of the academic hospital, suggesting that attention needs to shift from individual teachers to developing the systems in which they work.

Keywords: Activity theory; Clinical teacher; Contradictions; Educational development; Faculty development; Health personnel; Qualitative research; Undergraduate medical education.

 

임상추론 평가방법: 스코핑 리뷰와 실용적 가이드(Acad Med, 2019)
Clinical Reasoning Assessment Methods: A Scoping Review and Practical Guidance

Michelle Daniel, MD, MHPE, Joseph Rencic, MD, Steven J. Durning, MD, PhD, Eric Holmboe, MD, Sally A. Santen, MD, PhD, Valerie Lang, MD, MHPE, Temple Ratcliffe, MD, David Gordon, MD, Brian Heist, MD, MSc, Stuart Lubarsky, MD, MHPE, Carlos A. Estrada, MD, MS, Tiffany Ballard, MD, Anthony R. Artino Jr, PhD, Ana Sergio Da Silva, PhD, Timothy Cleary, PhD, Jennifer Stojan, MD, MHPE, and Larry D. Gruppen, PhD 

 

 

임상적 추론의 정의는 매우 다양하다.1 이 논문의 목적상 [임상 추론]은 '임상 의사가 환자를 진단하고 치료하기 위해 데이터를 관찰, 수집 및 해석하는 기술, 프로세스 또는 결과로 정의]된다. 임상 추론은 맥락적 요소와 상호작용하는 [의식적 및 무의식적 인지 작업]을 모두 수반한다. 맥락적 요인에는 [환자의 고유한 상황과 선호도, 그리고 진료 환경의 특성이 포함]되며 이 밖에도 많은 것들이 있다. 임상 추론의 여러 구성 요소를 식별할 수 있다1:

  • 정보 수집, 
  • 가설 생성, 
  • 문제 표현 형성, 
  • 감별 진단 생성,
  • 우선적 또는 작업 진단 선택,
  • 진단 정당성 제공,
  • 관리 또는 치료 계획 개발.

Definitions of clinical reasoning vary widely.1 For the purposes of this paper, clinical reasoning is defined as a skill, process, or outcome wherein clinicians observe, collect, and interpret data to diagnose and treat patients.2,3 Clinical reasoning entails both conscious and unconscious cognitive operations interacting with contextual factors.4,5 Contextual factors include, but are not limited to, the patient’s unique circumstances and preferences and the characteristics of the practice environment. Multiple components of clinical reasoning can be identified1:

  • information gathering,
  • hypothesis generation,
  • forming a problem representation,
  • generating a differential diagnosis,
  • selecting a leading or working diagnosis,
  • providing a diagnostic justification, and
  • developing a management or treatment plan.6 

다양한 분야(예: 인지 심리학, 사회학, 교육)의 많은 이론(예: 스크립트, 이중 과정 및 인지 부하 이론)이 임상 추론에 대한 연구를 제공한다. 이러한 임상 추론의 정의와 이러한 다중 이론은 현재 연구의 기초를 제공한다.

A number of theories (e.g., script, dual process, and cognitive load theories) from diverse fields (e.g., cognitive psychology, sociology, education) inform research on clinical reasoning.7,8 This definition of clinical reasoning and these multiple theories provide the foundation for the current work.

효과적인 임상 추론은 임상 역량의 핵심이다. 대학원 의학 교육 인증 위원회, 9개의 CanMED 프레임워크 및 유럽의 조정 프로젝트(의학)는 모두 임상 추론을 핵심 역량으로 설명한다. 의료 교육 연속체에 걸쳐 임상 역량(임상 추론 포함)의 개발을 보장하려면 평가에 대한 증거 기반 접근법이 필요하다. 현재 임상추론에 대한 광범위한 평가가 있으며, 이러한 도구의 기반이 되는 문헌은 광범위하게 분산되어 있으며, 다양한 분야와 여러 의학 전문 분야를 넘나들고 있어서 [특정한 목표, 요구 및 자원에 맞는 평가를 선택 및 구현]하려는 교수자를 어렵게 만든다. 또한 여러 평가들이 서로 다른 맥락(예: 직장 기반 및 비직장 기반 환경)에서 사용하도록 설계된다. 임상추론 평가방법은 수와 다양성이 많아서 목적에 적합한 평가를 선택하는 데 어려움이 있고, 임상추론 평가가 진보하려면 현재 근거의 통합이 필요하다.

Effective clinical reasoning is central to clinical competence. The Accreditation Council for Graduate Medical Education,9 the CanMEDS framework,10 and the Tuning Project (Medicine) in Europe11 all describe clinical reasoning as a core competency. Ensuring the development of clinical competence (including clinical reasoning) across the medical education continuum requires an evidence-based approach to assessment. There is currently a wide array of clinical reasoning assessments, and the literature on which these tools are based is widely dispersed, crossing different fields and multiple medical specialties, which presents a challenge for medical educators attempting to select and implement assessments aligned with their particular goals, needs, and resources. These assessments are often designed for use in different contexts (e.g., workplace- and non-workplace-based environments).12 The sheer number and diversity of clinical reasoning assessment methods create challenges for selecting assessments fit for the purpose, so a synthesis of the current evidence is needed to advance assessment practices for this core competency.

우리의 목표는 의료 교육자에게 참고가 되는 평가 방법의 실용적인 개요를 만드는 것이었다. 임상 추리 평가 문헌의 풍부함과 복잡성을 고려하여 다음 질문을 탐구하기 위해 범위 검토를 수행하기로 결정했다. 어떤 임상적 추론 평가 방법을 사용할 수 있습니까? 이러한 평가 방법의 정의 기능은 무엇이며, 일반적으로 어떻게 사용됩니까? 각 방법에 대한 타당성 고려사항(내용, 대응 프로세스, 내부 구조, 다른 변수와의 관계, 임상 실무 성과에 대한 결과 또는 결과)은 무엇입니까? 각 방법의 실현 가능성 문제, 장점 및 단점은 무엇입니까? 각 방법의 상대적 강점과 약점을 임상 추론 평가 프로그램을 구축하는 데 어떻게 사용할 수 있는가?

Our aim was to create a practical compendium of assessment methods to serve as a reference for medical educators. Given the richness and complexity of the clinical reasoning assessment literature, we chose to perform a scoping review to explore the following questions: What clinical reasoning assessment methods are available? What are the defining features of these assessment methods, and how are they typically used? What are the validity considerations (content, response process, internal structure, relationships to other variables, and consequences or outcomes on clinical practice performance) for each method? What are the feasibility issues, advantages, and disadvantages of each method? How might the relative strengths and weaknesses of each method be used to construct a clinical reasoning assessment program?

방법
Method

방법론 검토
Review methodology

우리는 이 검토를 수행함에 있어 구성주의적 연구 패러다임을 채택했다. 우리는 우리의 질문이 탐색적이었고 예비 검색에서 복잡하고 이질적인 문학의 본체가 밝혀졌기 때문에 scoping methodology 을 선택했다. 우리는 임상 추리 평가 방법의 광범위한 분야를 설명하기를 원했지만, 의학 교육자에 대한 관련성을 보장하기 위해 실용적인 적용에 초점을 맞추고 싶었다. 우리는 가장 일반적으로 사용되는 방법에 대해 보고하지만, 모든 것을 망라하려고 하지는 않습니다. 이 검토는 STORES(Structured Approach to Reporting in Healthcare Education of Previdence Compositation) 스테이트먼트에 따라 제시된다. 
We adopted a constructivist research paradigm in conducting this review. We chose a scoping methodology because our questions were exploratory and because preliminary searches had revealed a complex and heterogeneous body of literature.13 We wanted to describe the broad field of clinical reasoning assessment methods,14 yet remain focused on practical applications to ensure relevance for medical educators. We report on the most commonly used methods, but we do not seek to be exhaustive. This review is presented in accordance with the STORIES (Structured Approach to the Reporting in Healthcare Education of Evidence Synthesis) statement.15

검색 전략
Search strategy

초기 검색 및 기사 선택 프로세스에서 확립된 PRISMA(Preferred Reporting Items for Systematic Reviews and Meta-Analyses) 가이드라인을 따랐습니다. 경험이 풍부한 연구 사서가 검색 전략을 설계하는 데 도움을 주었습니다(보조 디지털 부록 1 참조). 임상 추론을 위한 수많은 동의어는 잘 알려진 임상 추리 평가 방법뿐만 아니라 광범위한 평가 용어와 결합되었다. 검색일로부터 2016년 2월 29일까지 Ovid MEDLINE, CINAHL, ERIC, PsycINFO, Scopus, Google Scholar, New York Academy of Medicine Grey Literature Report에서 검색을 실행했습니다. 검색된 인용문은 체계적인 검토를 수행하기 위한 온라인 데이터 관리 시스템인 DistillerSR(캐나다 온타리오주 오타와)에 업로드되었습니다.

We followed established PRISMA (Preferred Reporting Items for Systematic Reviews and Meta-Analyses) guidelines16 for our initial search and article selection process. An experienced research librarian helped design the search strategy (see Supplemental Digital Appendix 1 at https://links.lww.com/ACADMED/A631). Numerous synonyms for clinical reasoning were combined with a broad range of assessment terms, as well as well-known clinical reasoning assessment methods. We ran the search in Ovid MEDLINE, CINAHL, ERIC, PsycINFO, Scopus, Google Scholar, and the New York Academy of Medicine Grey Literature Report from each database’s inception through February 29, 2016, the date of our search. Retrieved citations were uploaded in DistillerSR (Evidence Partners, Ottawa, Ontario, Canada), an online data management system for performing systematic reviews.

기사 심사 및 리뷰
Screening and review of articles

임상 추론 평가 문헌의 초기 탐구를 위한 광범위한 포함 기준에서 시작했다.

  • (1) 훈련 또는 실습의 모든 단계에서 건강 전문직(예: 의학, 간호, 치과, 물리 또는 직업 치료), 
  • (2) 모든 연구 설계 유형, 
  • (3) 임상 추론 평가 방법(또는 도구)을 명시적으로 연구한 모든 기사 (또는 동의어(예: 임상, 진단, 치료, 예후 의사결정 또는 문제 해결). 보충 디지털 부록 1 참조).

We began with broad inclusion criteria for our initial exploration of the clinical reasoning assessment literature:

  • (1) any health profession (e.g., medicine, nursing, dentistry, physical or occupational therapy) at any stage of training or practice;
  • (2) all study design types; and
  • (3) any article that explicitly studied a method (or tool) of clinical reasoning assessment (or synonymous terms—e.g., clinical, diagnostic, therapeutic, or prognostic decision making or problem solving; see Supplemental Digital Appendix 1 at https://links.lww.com/ACADMED/A631).

영어로 된 기사가 아닌 경우, 의사결정을 임상 추론의 더 큰 인지 과정 대신 특정 임상 문제(예: 심방 세동의 경우)에만 적용한 경우 또는 기사가 연구를 구성하지 않는 논문 또는 해설인 경우 기사는 제외되었다. 리뷰 기사는 데이터 추출에서 제외되었지만 눈덩이 확대를 통해 추가 기사를 식별하는 데 사용되었다. 최종 합성에 앞서, 우리는 의대생, 레지던트 또는 의사에 관한 연구에 초점을 맞추기로 결정했고, 검토를 위한 총 기사 수를 줄이고, 임상 추론에 초점을 맞추도록 다른 보건 직업에 대한 강조를 제거하기로 했다. (또한 비판적 사고와 같은 다른 건강 직업의 관련성이 있는 것이 아니라 별개의 구조에 대해서도 마찬가지입니다.)

Articles were excluded if they were not in English, if decision making was applied only to a specific clinical problem (e.g., a case of atrial fibrillation) instead of the larger cognitive processes of clinical reasoning, or if the article was an essay or commentary that did not constitute research. Review articles were excluded from data extraction but were used to identify additional articles via snowballing. Prior to the final synthesis, we decided to focus on medical student, resident, or physician studies and de-emphasized the other health professions to both reduce the total number of articles for review and ensure that the focus was on clinical reasoning (and not on related but distinct constructs in the other health professions, such as critical thinking).17

다양한 작가 조합이 여러 단계로 기사를 검토했다. 잠재적으로 관련된 제목과 요약은 작가 쌍에 의해 선별되었다. 전문 기사는 포함 및 제외 기준에 따라 다양한 작가 쌍에 의해 적격성을 평가받았다. 적격성 평가를 위한 전문 기사의 평가에 앞서, 우리는 우리 팀의 요약과 집합적 전문지식에 대한 예비 분석을 바탕으로 평가 방법별로 그것들을 분류했습니다. 우리는 염두에 두고 있었다.

  • 오래된 방법이 출판된 기사(예: 객관식 질문[MCQ])에 더 자주 표시될 수 있다.
  • 일반적인 교육 관행은 자주 작성되지 않을 수 있다(예: 구술 사례 프레젠테이션(OCP)).
  • 실현 가능성이 구현 및 사용에 영향을 미칠 수 있다(예: fMRI).

Different combinations of authors (M.D., J.R., S.J.D., E.H., S.A.S., V.L., T.R., D.G., B.H., S.L., C.A.E., T.B., A.R.A., A.S.D.S., T.C., J.S., L.D.G.) reviewed the articles in multiple stages. Potentially relevant titles and abstracts were screened by pairs of authors. Full-text articles were then assessed by different pairs of authors for eligibility based on the inclusion and exclusion criteria. Prior to the assessment of full-text articles for eligibility, we sorted them by assessment methods based on our preliminary analyses of the abstracts and the collective expertise of our team. We were mindful

  • that older methods may be more frequently represented in published articles (e.g., multiple-choice questions [MCQs]),
  • that common educational practices may not necessarily be written about often (e.g., oral case presentations [OCPs]), and
  • that feasibility may affect implementation and use (e.g., functional magnetic resonance imaging).

각 평가 방법은 해당 기사를 추가로 검토하고 합성한 두 명의 저자에게 할당되었다. 어느 단계에서든 의견 불일치는 논의를 통해 해결되었으며, 필요한 경우 제3의 저자가 참여하였다. 데이터 추출 수준에서 코헨 카파 통계량을 사용하여 기준 간 합의를 평가했다.

Each assessment method was assigned to a pair of authors who further reviewed and synthesized those articles. Disagreements at any stage were resolved through discussion to reach consensus, with involvement of a third author if needed. Interrater agreement was assessed using Cohen kappa statistic at the data extraction level.


데이터 추출 양식을 사용하여 다음을 포함한 평가 방법의 특성에 대한 정보를 수집했다.

  • 자극(예: 서면 Vignette, 표준화된 환자(SP), 실제 환자)
  • 응답 형식(예: 선택된 응답, 작성된 자유 텍스트, 성능)
  • 채점(예: 고정 답안, 체크리스트, 글로벌 등급 척도)
  • 일반적인 용도(예: 낮은, 중간, 높은 수준의 의사결정)

A data extraction form (see Supplemental Digital Appendix 2 at https://links.lww.com/ACADMED/A632) was used to capture information on the characteristics of assessment methods, including

  • the stimulus (e.g., written vignette, standardized patients [SPs], real patients);
  • response format (e.g., selected response, constructed free text, performance);
  • scoring (e.g., fixed answer, checklist, global rating scale); and
  • common uses (e.g., low-, medium-, or high-stakes decisions).

이 양식은 도구의 타당성 및 타당성뿐만 아니라 방법과 관련된 주제(예: 맥락의 영향)에 관한 정보도 포착했다. 이 검토의 목적상, 우리는 타당성을 복수의 근거 소스(예: 내용, 대응 프로세스)가 있는 통합된 구성으로 보았다.18 이것은 scoping review였기 때문에 article의 품질은 공식적으로 평가되지 않았다. 추출은 평가 방법에 대한 모든 기사를 완전히 검토하거나 새로운 평가 통찰력을 제공하지 않을 때까지 진행되었습니다.

The form also captured information regarding a tool’s feasibility and validity, as well as any themes (e.g., the influence of context) related to the method. For the purposes of this review, we viewed validity as a unified construct with multiple sources of evidence (e.g., content, response process).18 Because this was a scoping review, the quality of articles was not formally assessed. Extraction proceeded until all articles for an assessment method had been fully reviewed or no new assessment insights were forthcoming.

Data 합성
Data synthesis

추출된 데이터를 사용하여 각 평가 방법을 요약하고 일반적인 자극, 대응 형식, 점수, 일반적인 용도, 타당성 고려 사항, 타당성 문제, 장점 및 단점을 설명하는 설명적 부록을 구성했다. 타당성 고려사항은 교육 및 심리 테스트 표준에 설명된 메시의 5개 영역에 따라 제시된다. 이 부록에는 텍스트를 뒷받침하는 참고문헌이 몇 가지 나열되어 있지만, 일부 방법에서는 60개가 넘는 기사가 있었기 때문에 검토한 기사 전체 목록은 포함되어 있지 않습니다. 일부 경우, 우리는 이러한 부록과 결과의 핵심 사항을 뒷받침하기 위해 (검토에 포함된 목록 외의) 추가적인 seminal references 자료를 사용했다. 이러한 참고 자료는 포함 기준을 충족하지 못했기 때문에 검토에 포함되지 않았다.
We used the extracted data to construct descriptive appendixes that summarize each assessment method, describing common stimuli, response formats, scoring, typical uses, validity considerations, feasibility issues, advantages, and disadvantages. Validity considerations are presented according to Messick’s five domains as described in Standards for Educational and Psychological Testing.19 These appendixes list some references to support the text, but they do not include the full list of the articles reviewed because, for some methods, there were over 60 articles. In some cases, we used additional seminal references (outside of those included in the review) to support key points in these appendixes and in the Results below; these references were not included in the review because they did not meet the inclusion criteria.

검토 과정에서 특정 평가 방법이 임상 추론의 다른 구성 요소를 측정하는 데 다른 방법보다 더 적합하다는 것이 명백해졌다(위 참조). [임상추론 평가 방법 선택을 위한 실용적 가이드 제작]을 목표로 했기 때문에, 우리는 집단적 판단을 사용하여, 임상추론의 다양한 구성 요소를 측정할 수 있는 평가 방법을 식별했다. 

Over the course of the review, it became apparent that certain assessment methods were better suited than others to measure different components of clinical reasoning (see above). Because we aimed to produce a practical guide for medical educators to select clinical reasoning assessment methods, we used our collective judgments to identify assessment methods more or less capable of measuring the different components of clinical reasoning.

우선, 각 컴포넌트의 작업 정의에 합의했습니다(표 1). 다음으로 Qualtrics(2018년 버전, Qualtrics, Provo, Utah, Provo)를 통해 전체 작성자 그룹에 설문조사를 보내 각 평가 방법을 다양한 구성 요소를 평가할 수 있는 능력 측면에서 평가하도록 요청했습니다. (0 = 주소 미지정, 1 = 2차 또는 주변기기, 2 = 1차 초점, NA = 응답 불가). 결과의 평균을 산출하여 다음과 같은 척도로 보고했습니다. 0.0~0.5 = 불량, 0.6~1.0 = 평균, 1.1~1.5 = 양호, 1.6~2.0 = 매우 양호.

First, we agreed on working definitions for each of the different components (Table 1). Next, we sent a survey via Qualtrics (version from 2018, Qualtrics, Provo, Utah) to the full author group, asking them to rate each assessment method in terms of its ability to assess the different components (0 = not addressed, 1 = secondary or peripheral, 2 = primary focus, NA = cannot answer). We averaged the results and reported them on the following scale: 0.0–0.5 = poor, 0.6–1.0 = average, 1.1–1.5 = good, and 1.6–2.0 = very good.

 


표 1 임상 추론의 다양한 구성 요소에 대한 작업 정의
Table 1 Working Definitions for the Different Components of Clinical Reasoning

정보 수집 Information gathering72,73

  • 가설을 생성하거나 구체화하는 데 필요한 데이터를 얻는 과정입니다. 이 과정은 일반적으로 기록 작성, 물리적 수행, 실험실 또는 방사선 데이터 획득, 의료 기록 검토 등을 포함하는 능동적active 프로세스이지만, (관찰을 통한 것처럼) 암묵적일 수도 있습니다. 수집할 정보의 선택은 질병의 지식 표현(예: 스크립트, 스키마)에 의해 결정됩니다.
  • The process of acquiring the data needed to generate or refine hypotheses. This is usually an active process that includes taking a history, performing a physical, acquiring lab or radiographic data, reviewing the medical record, etc., but may be implicit (through observation) as well. The selection of information to gather is driven by knowledge representations of disease (i.e., scripts, schema).

가설 생성 Hypothesis generation74,75

  • 의사가 환자의 임상 소견을 설명할 수 있는 질병을 찾는 초기 비분석적 또는 분석적 과정입니다. 가설 생성은 정보 수집을 피드백하는 반복 프로세스에서 질병의 지식 표현을 활성화하는 것을 포함한다(예: 가설 생성은 더 많은 정보 수집으로 이어지고, 더 많은 가설 생성 및/또는 개선으로 이어진다).
  • An early nonanalytic or analytic process by which a physician tries to find diseases that can explain a patient’s clinical findings. Hypothesis generation involves activation of knowledge representations of disease in an iterative process that feeds back on information gathering and vice versa (e.g., hypothesis generation leads to more information gathering, which leads to more hypothesis generation and/or refinement).

문제 표현 Problem representation74,76

  • [의미적 한정자]와 [주요 발견]을 포함하는 요약으로 전달될 수 있는, 사례의 모든 관련 측면(환자의 임상 소견, 생체 심리학적 차원 등)의 역동적 정신적 표현.
  • A dynamic mental representation of all the relevant aspects of the case (including the patient’s clinical findings, biopsychosocial dimensions, etc.) that can be communicated in a summary that includes semantic qualifiers and key findings.

감별 진단 Differential diagnosis77,78

  • 문제 표현의 최선의 요약 범주를 나타내는 진단 가설의 목록(참고: 전공이 달라지면 감별진단의 우선 순위가 달라질 수 있다. 예를 들어, EM에서는 생명을 위협하는 질병이 먼저 나열되는 경우가 많은 반면 IM에서는 일반적으로 가장 가능성이 높은 질병이 먼저 나열된다.) [자신감의 강도]와 [표현에 대한 증거가 변화함]에 따라 우선적 진단leading diagnosis이 나타난다.
  • A list of diagnostic hypotheses that represent the best summary categorizations of the problem representation (Note: Different specialties may have different priorities when it comes to ordering the differential; e.g., in EM, life-threatening diseases are often listed first, whereas in IM, the most likely diseases are usually listed first). As the strength of confidence and evidence for these representations change, a leading diagnosis emerges.

선행 진단 또는 실제 진단 Leading or working diagnosis79

  • 비록 확정적이지 않더라도, 추가 검사를 진행하거나 치료를 시작하기 위해, 특정 질병일 확률이 의사 자신의 임계값을 초과한 진단입니다
  • A diagnosis for which a physician’s probability of a given disease has crossed his or her threshold to pursue additional testing or to initiate treatment, even if the diagnosis is not definitive.

진단의 정당성 Diagnostic justification77,80

  • 정보 수집의 증거(핵심 임상 소견)를 사용하여, 가능한 한 하나 이상의 진단을 선택하고, 다른 가능한 진단을 비교 및 대조하면서 그 선택을 옹호하려는 시도. 정당화는 사회적으로 필요할 때 의사소통(구술 또는 서면)을 수반하는 경우가 많으며, 선행 임상 추론 과정의 일부가 아닐 수도 있습니다.
  • The attempt to use the evidence (key clinical findings) from information gathering to choose one or more diagnoses as most likely and to defend that choice, comparing and contrasting other possible diagnoses. Justification often involves communication (orally or in writing) when socially required and may not be part of the a priori clinical reasoning process.

관리 및 치료 
Management and treatment79,81

  • 임상추론 뒤에 따라오는 행동으로서, 예측, 관리, 치료, 예방 전략, 증상완화(삶의 질 향상 포함) 및 그러한 행동의 정당화를 포함한다.
  • The actions that follow the clinical reasoning process, including prognostication, management, treatment, prevention strategies, and palliation of symptoms (including improvement of quality of life) and justification for such actions.

 

결과.
Results

초기 데이터베이스 검색과 눈덩이 확장으로 14,709개의 레코드가 생성되었습니다. 중복으로 1,849장을 삭제하고, 12,860장의 레코드는 제목과 추상별로 심사했습니다. 이 심사 후, 11,421개의 기사는 임상 추론의 평가와 관련이 없다는 이유로 제외되었다. 나머지 1,439개 기사는 포함 및 제외 기준에 따라 전문 평가를 받았다. 이 단계에서 901개 기사는 분석에서 제외되었으며, 주된 이유는 임상 추론 평가 방법을 명시적으로 연구하지 않았기 때문이다. 결국, 검토 대상에는 538개 조항(1966년부터 2016년까지)이 포함되었다(그림 1 및 보충 디지털 부록 3 참조). 이 기사들 중 161개는 다른 건강 직업에 초점을 맞췄다. 최종 종합에서는 의대생, 레지던트, 의사 관련 기사 377건만을 중점적으로 다루었다. 이 방법에 대해 계산된 측정기 간 합치도 0.83에서 0.86 사이의 범위에서 높았다.

The initial database search and snowballing yielded 14,709 records. We removed 1,849 as duplicates, leaving 12,860 records to be screened by title and abstract. After this screening, 11,421 articles were excluded because they did not pertain to the assessment of clinical reasoning. The 1,439 remaining articles underwent full-text evaluation based on inclusion and exclusion criteria. At this stage, 901 articles were excluded from the analysis, with the main reason being that they did not explicitly study a clinical reasoning assessment method. In the end, 538 articles (from 1966 to 2016) were included in the review (see Figure 1 and Supplemental Digital Appendix 3 at https://links.lww.com/ACADMED/A633). Of these articles, 161 focused on other health professions. In the final synthesis, we focused exclusively on the 377 articles related to medical students, residents, and physicians. The interrater agreement calculated for the methods was high, ranging from 0.83 to 0.86.

 

포함된 기사에는 임상 전 의대생부터 임상 의대생, 레지던트 및 개업의에 이르기까지 광범위한 학습자가 포함되었습니다. 기사에 실린 작품들은 많은 다른 나라들에서 나왔지만, 대부분은 미국, 유럽, 캐나다에서 왔다. 우리는 기사를 20개의 다른 평가 방법(실험적 또는 참신한 범주 및 19가지 방법)으로 묶었다.

  • 일부 방법에는 다수의 기사가 있었다(예: 스크립트 일치 테스트 및 기술 강화 시뮬레이션 각각 60개 이상).
  • 일부 방법들은 매우 적은 수의 논문만이 검색되었다(예: 임상 또는 종합 통합 퍼즐(CIPs)과 차트 자극 리콜(CSR)은 각각 3개였다.)

보충 디지털 부록 4는 공통 자극, 대응 형식, 점수 매기기, 일반적인 사용, 타당성 고려사항, 타당성 문제, 장점 및 단점을 포함하여 각 평가 방법을 요약하는 설명 부록을 제공하고 있으며, 이를 뒷받침하는 참고 자료를 제공한다.

The included articles encompassed a broad array of learners from preclinical medical students to clinical medical students, residents, and practicing physicians. The work in the articles came from many different countries; however, the majority came from the United States, Europe, and Canada. We clustered the articles into 20 different assessment methods (an experimental or novel category and 19 methods; see below).

  • Some methods had a large number of articles (e.g., script concordance testing and technology-enhanced simulation each had over 60).
  • Others had very small numbers of articles (e.g., clinical or comprehensive integrative puzzles [CIPs] and chart-stimulated recall [CSR] each had 3).

Supplemental Digital Appendix 4 (at https://links.lww.com/ACADMED/A634) shows the descriptive appendixes we constructed that summarize each assessment method, including common stimuli, response formats, scoring, typical uses, validity considerations, feasibility issues, advantages, and disadvantages, as well as supporting references.

방법은 매우 이질적이었지만, 우리는 신뢰성의 연속체를 따라 세 가지 광범위한 범주를 식별했다. 

  • 비작업장 기반 평가(Non-WBAs),
  • 시뮬레이션 임상 환경 평가
  • 작업장 기반 평가(WBAs)

Although the methods were quite heterogeneous, we identified three broad categories, along a continuum of authenticity:

  • non-workplace-based assessments (non-WBAs),
  • assessments in simulated clinical environments, and
  • workplace-based assessments (WBAs).

우리는 이러한 범주에 예외가 있으며 일부 방법이 현실적으로 여러 범주에 배치될 수 있다는 것을 인식한다(예: 자체 조절 학습 미세 분석(SRL-M)). 독특하거나 참신하거나 탐색적인 평가는 실험적이거나 참신한 방법 그룹에 배치되었다. 중요한 방법들이 결국 이 작업 본체에서 나올 수 있지만, 이러한 방법들에 대해 상세히 보고하는 것은 가능하지 않았으며, 이러한 방법들은 보충 디지털 부록 4에서만 다루어진다.

We recognize that these categories have exceptions and that some methods could realistically be placed in multiple categories (e.g., self-regulated learning microanalysis [SRL-M]). Assessments that were unique, novel, or exploratory were placed into an experimental or novel methods group. Although important methods may ultimately emerge from this body of work, it was not feasible to report on all of these methods in depth, and they are only addressed in Supplemental Digital Appendix 4 (at https://links.lww.com/ACADMED/A634).

비WBA
Non-WBAs

우리는 주로 "교실" 평가 또는 비 WBA에 초점을 맞춘 10가지 방법을 식별했다.
We identified 10 methods that largely focused on “classroom” assessments or non-WBAs.

MCQ는 최대 5개의 잠재적 답변 또는 대안이 뒤따르는 임상적 답변으로 구성되며, 단일 최선의 답변, 대안 조합, 각 대안에 대한 참 또는 거짓 또는 매칭을 요구하도록 구성될 수 있다. 

  1. MCQs consist of a clinical vignette followed by up to five potential answers or alternatives and may be structured as to require a single best answer, a combination of alternatives, true or false for each alternative, or matching.20

확장 매칭 질문(EMQ)은 대안 목록에서 선택된 단일 최선의 답변과 함께 임상적 질문을 사용하는 MCQ와 유사하지만, 여러 질문에 적용되는 더 긴 잠재적 답변 목록(5개 이상)을 포함하고 있다. 

  1. Extended matching questions (EMQs) resemble MCQs in their use of a clinical vignette with a single best answer selected from a list of alternatives, but they contain longer lists of potential answers (more than five) that are applied to multiple questions.21,22

단답형 또는 장답형(메세지) 질문은 임상적 질문에 이어 몇 단어에서 여러 문장에 이르는 길이의 구성된 자유 텍스트 응답을 사용하여 하나 이상의 질문에 답하는 방법을 설명한다. 

  1. Short- or long-answer (essay) questions describe a method wherein a clinical vignette is followed by one or more questions answered using constructed free-text responses that range in length from a few words to several sentences.23,24

변형에세이문제(MEQ)은 사례의 일련 정보를 시간순으로 제공하는 방법입니다. 한 문항이 제시되면, 학습자는 작성된 자유 텍스트(에세이) 형식으로 결정을 문서화해야, 그 다음 문항을 볼 수 있습니다.

  1. Modified essay questions (MEQs) are a method wherein serial information is provided about a case chronologically.25,26 After each item, learners must document a decision in a constructed free-text (essay) format before they can view subsequent items.

환자 관리 문제(PMP)는 진단 및 관리에 특정 리소스를 사용할 수 있는 컨텍스트가 풍부한 임상 시나리오로 구성됩니다. 학습자는 조치를 위한 여러 대안 중에서 선택해야 하며, 사례를 계속 진행하면서 그러한 조치의 결과(예: 심전도[ECG] 결과)가 제공됩니다.

  1. Patient management problems (PMPs) consist of context-rich clinical scenarios, where specific resources are available for diagnosis and management.27,28 The learner must select among multiple alternatives for action, and the results of those actions are then provided (e.g., electrocardiogram [ECG] findings) as they continue working through the case.

주요 기능 검사(KFE)에는 임상 의사 결정의 중요한 단계에 초점을 맞춘 2~3개의 질문이 뒤따른다. 주요 특징은 사례별로 다르다(예: 벼락 두통은 지주막하 출혈 진단의 핵심 특징이다).

  1. Key feature examinations (KFEs) contain clinical vignettes followed by two to three questions focused on the critical steps in clinical decision making.29,30 Key features are case specific (e.g., a thunderclap headache is a key feature in the diagnosis of subarachnoid hemorrhage).

스크립트 일치 테스트(SCT)는 임상 추론 중에 새로운 정보가 처리되는 방법을 나타내도록 설계된 불확실성과 관련된 짧은 임상 시나리오로 구성된다. 학습자는 일련의 질문에 답해야 합니다(예: X를 고려하고 있었는데, Y를 찾은 경우, 이 답은 가능성이 더 높아지거나 가능성이 낮아지거나 변경되지 않습니다). 응답은 "전문가"의 참조 패널에서 얻은 응답과 비교되며, 이는 임상 상황에 따라 임상의의 응답의 가변성을 설명한다.

  1. Script concordance tests (SCTs) comprise short clinical scenarios associated with uncertainty that are designed to represent the way new information is processed during clinical reasoning.31,32 Learners must answer a series of questions (e.g., if you were thinking X and then you found Y, this answer would become more likely, less likely, or no change). Responses are compared with those acquired from a reference panel of “experts,” accounting for the variability of clinicians’ responses in different clinical situations.

CIP는 그리드 형태를 취하며, 종종 확장된 매칭 크로스워드 퍼즐과 유사합니다. 많은 발견이 컬럼(예: 이력, 물리, 심전도, 실험실, 병태생리학, 약리학)에 배치되고 관련 진단은 행에 배치된다(예: 심근경색, 폐색전증, 대동맥 박리). 학습자는 열 내 항목과 행 간 항목(소견에 가장 적합한 "일치" 선택)을 비교 및 대조하여 각 진단에 대한 기본적인 질병 스크립트를 작성하도록 요청받습니다.

  1. CIPs take the form of a grid, often analogized to an extended matching crossword puzzle.33,34 A number of findings are placed in columns (e.g., history, physical, ECG, labs, pathophysiology, pharmacology), and related diagnoses are placed in rows (e.g., myocardial infarction, pulmonary embolism, aortic dissection). The learner is asked to compare and contrast items within a column as well as across the rows (selecting the best “match” for the finding), building basic illness scripts for each diagnosis.

개념 지도는 학습자가 그래픽 일러스트를 작성함으로써 영역에 대한 지식 및 지식의 구성을 나타내는 개략적인 평가 방법입니다. 맵은 자유 형식 또는 위계형일 수 있으며, 개념과 개념 간의 관계를 모두 나타냅니다.

  1. Concept maps are a schematic assessment method wherein learners represent their knowledge of a domain, as well as the organization of that knowledge, by creating a graphical illustration.35,36 Maps may be free-form or hierarchical, outlining both concepts and the relationships between the concepts.

구술시험은 한 명 이상의 교직원이 임상적 추론 및 의사결정 능력 및 직업적 가치를 평가하기 위해, 대본이 없거나 반대본semiscripted 방식으로 실시하는 구두평가입니다. 

  1. Oral examinations are verbal assessments conducted by one or more faculty member in either an unscripted or semiscripted fashion to assess clinical reasoning and decision-making abilities, as well as professional values.37,38

영상, 비디오 및 기타 형식은 서면 시험 자료를 보완하거나 보완하는 데 사용될 수 있지만, 대부분의 비 WBA는 [서면] 임상 실험 자료, 또는 [시나리오]를 [자극]으로 사용한다. 비 WBA 방법 중 하나만 언어 자극(구강 검사)을 사용합니다.

The majority of non-WBAs use written clinical vignettes or scenarios as the stimuli, though images, videos, and other formats may be used to supplement or complement the written testing materials. Only one non-WBA method uses a verbal stimulus (oral examinations).

[응답 형식]은 주로 '쓰기written'이지만, 유형(예: 선택된 답변, 구성된 자유 텍스트)은 다양합니다.

The response formats are predominately written, though there is variability in type (e.g., selected answers, constructed free text).

[스코어링 프로세스]는 다양합니다. [단일 정답, 합계 방식]이 일반적입니다(MCQ, EMQ, PMP, KFE 등). 채점은 가중치 부여(즉, 특정 항목이 다른 항목보다 많이 반영됨) 또는 가중치 부여되지 않음(즉, 모든 항목이 동등하게 계산됨), 보상적(즉, 일부 백분율을 틀리고도 합격할 수 있음) 또는 비보상적(즉, 합격하려면 100% 점수가 필요함)될 수 있다. 문항별 채점 또는 전반적 등급 척도는 [단문형 또는 장문형 주관식 응답 및 MEQ]에 사용되며, [규범-기준 또는 준거-기준]으로 채점할 수 있다. CIP 그리드 및 컨셉 맵에는 보다 복잡한 스코어링 시스템이 있습니다. SCT 응답은 "골드 스탠다드"(즉, 전문가 패널의 응답)와 적합성을 비교하여, 그 응답을 선택한 전문가 패널의 비율에 따라 각 항목에 대해 부분적 또는 완전한 점수를 받는다.

Scoring processes vary. Aggregated, fixed-answer responses are common (e.g., MCQs, EMQs, PMPs, KFEs). Scoring can be weighted (i.e., certain items count more than others) or unweighted (i.e., all items count equally) and compensatory (i.e., can get some percentage wrong and still pass) or noncompensatory (i.e., a score of 100% is required to pass). Itemized and global rating scales are used for short- or long-answer constructed free-text responses and MEQs, and they can be norm- or criterion-referenced. CIP grids and concept maps have more complex scoring systems. SCT responses are compared for fit to a “gold standard” (i.e., the expert panel’s responses), and the examinee receives partial to full credit for each item depending on the proportion of the expert panel that chose that response.

중부담 및 고부담 시험에서는 여러 가지 비 WBA 방법이 사용된다(예: MCQ와 KFE는 종합 과정 종료 평가 및 의료 면허 검사에 일반적으로 사용된다). 다른 방법(예: CIP, 개념도)은 충분히 조사되지 않았으며 현재 형성적 평가 또는 연구에 가장 적합하다.

Several non-WBA methods are used for medium- to high-stakes examinations (e.g., MCQs and KFEs are commonly used for summative end-of-course assessments and medical licensing examinations). Other methods (e.g., CIPs, concept maps) are less well explored and are currently most suitable for formative assessments or research.


타당성 고려사항, 실현가능성 문제, 장점 및 단점은 각 방법마다 매우 고유하다. 보충 디지털 부록 4에서는 이러한 차이점에 대해 자세히 설명하지만, WBA 이외를 위한 몇 가지 테마는 여기에서 언급됩니다.

  • MCQ, EMQ 및 KFE는 가장 자주 사용되는 비WBA이며, 맥락 특이성을 최소화하는 광범위한 샘플링의 이점을 가지고 있습니다.
  • 이러한 방법은 높은 내적 일관성을 제공할 수 있는 최고의 기회를 제공하므로, 고부담 평가에 가장 큰 효용성이 있습니다.
  • 전문가 합의 및 블루프린트 덕분에 이러한 방법은 내용 타당성 증거가 강력할 수 있습니다. 이러한 방법은 내용의 통제와 일관성이라는 이점도 있으며, 각 문제에 대한 "정답"이 있다. "정답"이 있다는 것은 WBA에서 항상 가능한 것은 아닙니다.

Validity considerations, feasibility issues, advantages, and disadvantages are highly specific to each method. Supplemental Digital Appendix 4 (at https://links.lww.com/ACADMED/A634) details these differences, but a few themes for non-WBAs warrant mention here.

  • MCQs, EMQs, and KFEs are the most frequently used non-WBAs, and they have the advantage of broad sampling that helps minimize context specificity.
  • They offer the best chance of high internal consistency and thus have the greatest utility for high-stakes assessments.
  • Content validity evidence for these methods can be strong because of expert consensus and blueprinting. These methods also offer the advantage of content control and consistency; there is a “right” answer to each problem, a feature not always possible in WBAs, which allows a measurement of accuracy.

 

또한, 모든 비 WBA 방법은 표준화된 일련의 문제에 걸쳐 학생을 평가할 수 있습니다. 이는 WBA에서는 불가능한 것입니다. 비 WBA 방법에 대한 가장 큰 타당성 문제는 [응답 프로세스 증거]에 있다. 많은 가능성에서 정답을 선택하거나 지식 조직의 그래픽 표현을 개발하거나 사전 정의된 목록에서 정보를 선택하는 것은 일반적으로 실제 임상 추론 활동을 대표하지 않습니다. 이러한 방법의 대부분은 [전체 태스크 평가]보다 [파트 태스크 평가]에 중점을 두고 있습니다. 
(즉, WBA 방법보다 임상 추론의 구성 요소를 더 적게 측정한다. 그림 1 참조). 

Further, all non-WBA methods allow students to be assessed across a standardized set of problems, something that is not possible in the workplace. The greatest validity challenge for non-WBA methods is in response process evidence. Selecting a correct answer from a number of possibilities, developing a graphic representation of knowledge organization, or even selecting information from a predefined list are not generally representative of authentic clinical reasoning activities in practice. Many of these methods emphasize part-task, rather than whole-task assessment (i.e., they measure fewer components of clinical reasoning than WBA methods; see Chart 1).

부분 과제 평가는 임상 실습으로 기술을 성공적으로 이전할 수 없기 때문에 임상 추론 역량을 결정하기 위해 비 WBA에 크게 의존하는 [방어가능성]에 의문이 있다. 이러한 방법 중 일부는 [내부 구조 증거]뿐만 아니라 [다른 변수와의 관계에 대한 증거]를 광범위하게 가지고 있지만, 다른 방법은 이러한 형태의 타당성 증거가 부족하다. 비 WBA는 [종종 면허, 인증 및 자격 증명 결정뿐만 아니라 총괄적 합격 또는 불합격 판단]을 내리는 데 사용되기 때문에 임상 실무 성과에 대한 결과 또는 결과는 중요하다. 학습에 대한 형성 평가는 비 WBA가 진행 테스트 및 임상 추론의 개발에 미치는 영향을 위해 사용될 때 발생할 수 있다(예: 인지 네트워크 개발에 도움이 되는 개념도 사용).

The defensibility of relying heavily on non-WBAs to determine clinical reasoning competence is questionable because part-task assessments cannot ensure successful transfer of skills into clinical practice. Several of these methods have extensive evidence of their relationship to other variables, as well as internal structure evidence, but others lack these forms of validity evidence. Consequences or outcomes on clinical practice performance are significant because non-WBAs are often used to make summative pass or fail judgments as well as licensing, certification, and credentialing decisions. Formative assessment for learning can occur when non-WBAs are used as progress tests and for the effect they have on the development of clinical reasoning (e.g., using concept maps to help develop cognitive networks).

시뮬레이션된 임상 환경에서의 평가
Assessments in simulated clinical environments

시뮬레이션된 임상 환경에서 발생하는 두 가지 방법이 확인되었다.
Two methods were identified that occur in simulated clinical environments.

객관적 구조화 임상검사(OSCE)는 임상추론을 포함하여 학생의 임상능력에 대한 성과 기반 평가입니다. OSCE는 종합 평가를 제공하기 위해 SP, 관찰자 등급, 서면 노트 및 기타 방법을 포함하는 다양한 임상 태스크를 수험자가 실행하는 여러 스테이션으로 구성됩니다.

  1. Objective structured clinical examinations (OSCEs) are performance-based evaluations of students’ clinical skills including, but not exclusively focused on, clinical reasoning.39,40 OSCEs comprise multiple stations where examinees execute different clinical tasks, incorporating SPs, observer ratings, written notes, and other methods, to provide a comprehensive assessment.

기술 강화 시뮬레이션은 학습자가 임상 치료를 모방하는 도구 또는 장치와 물리적으로 상호작용하는 다양한 평가 방법을 설명합니다. 여기에는 학습자 입력에 따라 변경될 수 있는 정적 고충실도 마네킹에서 가상 현실 환자 아바타까지 다양한 계측기가 포함될 수 있습니다.

  1. Technology-enhanced simulation describes a variety of assessment methods wherein learners physically interact with a tool or device that mimics clinical care.41,42 These can encompass a range of instruments from static high-fidelity mannequins to virtual reality patient avatars that can change in response to learner input.

 

  • 시뮬레이션 임상 환경에서 평가는 일반적으로 SP, 고충실도 마네킹 또는 가상 환자 아바타를 [자극]으로 사용한다.
  • OSCE 및 기술 강화 시뮬레이션의 [응답 형식]은 일반적으로 작업 수행 또는 구성된 구두 또는 서면 응답입니다.
  • [채점]은 종종 이분법적(즉, 완료 여부) 또는 행동적으로 고정된 항목별 체크리스트를 통해 이루어집니다. 글로벌 평가 척도가 흔하다.
  • [용도]를 보면, OSCE는 형성적 평가와 높은 단계의 종합 평가에 모두 사용됩니다. (예: 미국 의료 면허 시험 2단계 임상 기술 및 캐나다 의료 위원회 자격 시험 파트 2) 반면 기술 혁신 시뮬레이션은 주로 조형 평가에 사용된다.

 

  • Assessments in simulated clinical environments typically use SPs, high-fidelity mannequins, or virtual patient avatars as stimuli.
  • The response format for OSCEs and technology-enhanced simulations is usually task performance or constructed verbal or written responses.
  • Scoring is often via itemized checklists that may be dichotomous (i.e., done or not done) or behaviorally anchored. Global rating scales are also common.
  • OSCEs are used for both formative and high-stakes summative assessments (e.g., the United States Medical Licensing Examination Step 2 Clinical Skills and the Medical Council of Canada’s Qualifying Examination Part 2), whereas technology-enhanced simulations are mainly used for formative assessments.

 

타당성 고려 사항, 실현 가능성 문제, 장점 및 단점은 보충 디지털 부록 4에 자세히 설명되어 있지만, 몇 가지 주제는 강조되어야 합니다. [내용 타당성] 측면에서 이러한 방법을 블루프린트 할 수 있으며, 이럴 경우 임상 실무와의 연계가 합리적이다(이러한 평가의 authenticity는 대부분의 비 WBA보다는 높지만, 실제 WBA보다는 낮다). 고도로 구성되고 표준화된 재현 가능한 스테이션은 SP 및 평가자 교육에 주의를 기울여야 합니다. 이러한 표준화된 환경에서는 실제 임상 실습 중에 발생하는 평가보다 [맥락적 요인을 제어할 수 있는 능력]이 더 크다. 평가의 블루프린트는 내용특이성을 고려하여 합격에 필요한 필수적 기능feature을 식별해야 합니다(글로벌 평가 척도의 명확한 앵커 포함). 다른 평가 척도(즉, 비 WBA 및/또는 WBA)와의 성과 상관관계는 낮은 수준부터 중간 수준까지이며, 이는 형성 평가에는 허용되지만 높은 단계의 최종 결정에는 바람직하지 않다. 시뮬레이션 환경에서 평가는 여러 임상 추론 구성 요소를 측정하는 능력(그림 1)으로 평가되지만, 실제적인 주요 문제는 [개발 및 관리]가 자원 집약적이라는 것이다.

Validity considerations, feasibility issues, advantages, and disadvantages are detailed in Supplemental Digital Appendix 4 (at https://links.lww.com/ACADMED/A634), but a few themes warrant highlighting. In terms of content validity, these methods can be blueprinted, and their alignment with clinical practice is reasonable (higher than most non-WBAs, yet less authentic than true WBAs). Highly organized, standardized, reproducible stations require attention to SP and rater training. There is greater ability to control contextual factors in these standardized environments than in assessments that occur during actual clinical practice. Blueprinting for these assessments must attend to content specificity and distinguish what essential features are required to pass (with clear anchors for global rating scales). Performance correlations with other assessment measures (i.e., non-WBAs and/or WBAs) are only low to moderate, which is acceptable for formative assessments but is less than desirable for high-stakes summative decisions. Assessments in simulated environments are valued for their ability to measure multiple clinical reasoning components (Chart 1), but a major practical problem is that they are resource-intensive to both develop and administer.

WBA
WBAs

인증된 임상 환경 또는 WBA의 평가에 초점을 맞춘 7가지 방법이 확인되었다.
Seven methods were identified that focus on assessments in authentic clinical environments or WBAs.

직접 관찰(direct observation)은 성능 또는 임상 관찰이라고도 하며, 실제 임상 상황에서 학습자에 대한 데이터를 수집하는 관찰자(일반적으로 교수진)의 존재를 나타냅니다. 다양한 평가 도구가 직접 관찰을 위해 사용되었지만(예: 미니 임상 평가 연습[mini-CEX]) 임상 추론을 평가하도록 명시적으로 설계된 것은 아니다.

  1. Direct observation, also known as performance or clinical observation, describes the presence of an observer (typically a faculty member) who collects data about learners in authentic clinical contexts.43 A variety of assessment tools have been used for direct observation43 (e.g., the mini-clinical evaluation exercise [mini-CEX]),44 though they are not all explicitly designed to assess clinical reasoning.

글로벌 평가는 교직원 평가 양식의 공통 컴포넌트입니다. 직접 또는 간접 관찰에 기초한 임상 추론 성과에 대한 개별 판단 또는 게슈탈트 교사를 포착합니다.

  1. Global assessments are common components of faculty evaluation forms.45,46 They capture individual judgments or preceptor gestalt about clinical reasoning performance based on direct or indirect observations.

OCP는 임상 사례에 대한 체계적인 구두 보고입니다. 학습자가 무엇을 포함하거나 제외할 것인지, 데이터 구성, 평가와 계획의 구조와 내용에 대해 신중하게 선택할 때 학습자의 진단 및 치료 추론의 증거가 평가된다. 평가자는 학습자의 이해와 추가 정보를 탐색할 수 있습니다.

  1. OCPs are structured verbal reports of clinical cases.47,48 Evidence of a learner’s diagnostic and therapeutic reasoning is assessed as the learner makes deliberate choices about what to include or exclude, data organization, and the structure and content of the assessment and plan. Raters can probe learners for understanding and additional information.

서면 메모는 사례에 대한 임상 정보를 체계적인 방식으로 전달하는 또 다른 수단이다. 이 경우 서면 보고서를 통해. 다양한 도구 중 하나(예: 사후 메모, IDEA[해석 요약, 차등 진단, 추론 설명 및 대안] 평가 도구51)를 사용하여 평가할 수 있다. OCP와 마찬가지로 임상 추론은 메모의 여러 특징, 특히 요약문(주요 특징과 의미 한정자를 포함하는 사례의 캡슐화), 문제 목록, 차등 진단의 우선순위 부여, 정당성 및 관리 계획에서 평가할 수 있다.

  1. Written notes are another means of communicating clinical information about a case in a structured way—in this case, via a written report.49 They may be assessed by using one of a variety of tools (e.g., postencounter notes,50 the IDEA [interpretive summary, differential diagnosis, explanation of reasoning, and alternatives] assessment tool51). Similar to OCPs, clinical reasoning may be assessed from multiple features of a note, particularly the summary statement (an encapsulation of the case containing key features and semantic qualifiers), problem list, prioritization of the differential diagnosis, justification, and management plan.

CSR은 실제 임상 조우로부터의 [임상 문서 검토], 평가자가 근본적인 사고 과정을 조사하는 [구두 검사], 향후 진단 의사 결정을 개선하기 위한 [행동 계획]을 포함한 [피드백]으로 구성된 하이브리드 형식입니다. 

  1. CSR is a hybrid format consisting of clinical documentation review from an actual clinical encounter, an oral examination where an evaluator probes underlying thought processes, and feedback that may include action plans to improve future diagnostic decision making.52,53

Think aloud(TA)는 학습자에게 개별 과제를 부여하고 작업을 수행하는 동안 자신이 가졌거나 가졌던 여과되지 않은 생각을 음성으로 표현하도록 하는 기술입니다. TA는 일반적으로 작업을 완료하는 동안(동시) 관리되지만, 작업 완료 직후(지연) 수행될 수도 있습니다.

  1. Think aloud (TA) is a technique where learners are given a discrete task and asked to voice the unfiltered thoughts they have or had while performing the work.54,55 TAs are typically administered while completing the task (simultaneous) but may also be performed immediately following task completion (delayed).

SRL-M학습자가 [시작, 중간, 끝이 있는 임상 활동]에 [접근, 수행, 성찰]할 때, 학습자의 [생각, 행동, 느낌]에 대한 즉각적인 [태스크 수준 정보를 수집]하도록 설계된, [구조화된 인터뷰 프로토콜]이다. TA의 특징과 조합하여 메타인식을 평가할 수 있습니다.

  1. SRL-M describes a structured interview protocol designed to gather in-the-moment, task-level information about learners’ thoughts, actions, and feelings as they approach, perform, and reflect on a clinical activity that has a beginning, middle, and end.56,57 Combined with features of the TA, it can assess metacognition.


WBA 방법은 실제 환자를 [자극]으로 의존한다. 이러한 방법의 [응답 형식]에는 환자와의 임상 성과(직접 관찰, 글로벌 평가) 또는 작성된 구두 또는 서면 자유 텍스트(OCP, 서면 노트, CSR, TA, SRL-M)가 포함된다. [채점] 메커니즘은 매우 다양하며 다양한 유형의 항목별 또는 글로벌 등급 척도를 포함한다 (표준 참조, 기준 참조, 위탁 척도, 감독 척도), 체크리스트 등. WBA는 임상 사무직 및 레지던트 기간 동안 형성 평가에 가장 일반적으로 [사용]됩니다. 이러한 정보를 총괄적 의사결정에 사용할 경우, 일반적으로 [다수의 관측값 또는 글로벌 평가]를 합산한다. 일반적으로 사용되는 WBA는 [형성 평가에 사용되는 직접 관찰(예: 미니 CEX)]과 [임상 사무직 및 레지던트 로테이션 종료 총괄 평가에 사용되는 글로벌 평가]이다. 구두 발표와 서면 메모는 교수진의 최종 글로벌 평가에 영향을 미칠 수 있지만 고부담 평가에는 거의 사용되지 않습니다. TA와 SRL-M은 일반적으로 연구 맥락에 더 많이 관여하지만 어려움을 겪고 있는 학습자의 교정조치에 사용되어 왔다. 

WBA methods rely on real patients as stimuli. Response formats for these methods include clinical performance with patients (direct observation, global assessment) or constructed verbal or written free text (OCPs, written notes, CSR, TA, SRL-M). Scoring mechanisms vary widely and include itemized or global rating scales of various types (norm referenced, criterion referenced, entrustment scales, supervision scales), as well as checklists, etc. WBAs are most commonly used for formative assessment during clinical clerkships and residency. When they are used to make summative decisions, multiple observations or global assessments are typically aggregated. The workhorses of WBAs are direct observation (e.g., mini-CEX), which is typically used for formative assessments; and global assessments, which are typically used for end-of-rotation summative assessments during clinical clerkships and residency rotations. Oral presentations and written notes may influence a faculty rater’s final global assessment but are infrequently used for high-stakes assessments. TA and SRL-M are typically more involved in research contexts but have been used for the remediation of struggling learners.58,59

WBA 방법의 타당성 고려 사항, 실현 가능성 문제, 장점 및 단점에 대한 자세한 내용은 보충 디지털 부록 4에 요약되어 있지만, 여기서는 몇 가지 주제를 강조합니다. WBA의 큰 강점은 [임상 추론의 여러 구성 요소를 측정하는 능력]이다(그림 1). 이러한 방법은 실제 임상 환경에서 이뤄지므로 [내용 타당도 증거]와 [응답 프로세스 타당성 증거]가 합당하다. 그러나 임상 실무의 비체계적 성격은 [특정 임상 문제의 내용 적용 범위와 과다 또는 과소 표현]과 관련하여 문제를 제기할 수 있다. [내부 구조 증거(예: 항목 분석 데이터, 점수 척도 신뢰성, 표준 측정 오류)]는 이러한 방법 중 많은 수가 복잡한 행동의 관찰을 소수의 평가 결과로 정량화할 관찰자(시설 구성원)를 필요로 한다는 점에서 문제가 있다. 판단 과정에 편견과 불일치가 내재되어 있다. 이러한 타당도 위협을 줄이기 위한 핵심 전략은 [여러 평가자에 의한 다양한 임상 문제 집합에 대한 적절한 수의 관찰시간 경과에 따라 보장하는 것]이다. 일반화 이론의 관점에서 판단을 위해 허용 가능한 신뢰성에 도달하기 위해 12 - 14개의 미니 CEX가 필요하기 때문에, 이 정도가 되지 않는다면 WBAs를 사용하는 방어가능성에 의문이 있다. WBA의 도입에는 시간, 교수개발, 책무성, 평가에 참여하는 교수에 대한 인정 등이 과제가 되고 있습니다. 이는 임상환경이 [수련생의 감독이나 평가]보다 [생산성]을 중시하는 경우가 많기 때문입니다.

The details of validity considerations, feasibility issues, advantages, and disadvantages of WBA methods are summarized in Supplemental Digital Appendix 4 (at https://links.lww.com/ACADMED/A634), but we will highlight a few themes here. A great strength of WBAs is their ability to measure multiple components of clinical reasoning (Chart 1). Because these methods are embedded in authentic clinical environments, there is reasonable content and response process validity evidence. The nonsystematic nature of clinical practice, however, can present challenges with regard to content coverage and over- or underrepresentation of certain clinical problems. Internal structure evidence (e.g., item analysis data, score scale reliability, standard errors of measurement) is problematic in that many of these methods require an observer (faculty member) to quantify their observation of a complex behavior into a small number of assessment outcomes. Biases and inconsistencies are inherent in this judgment process.60–62 A key strategy to reduce these threats to validity is to ensure an adequate number of observations across a diverse set of clinical problems by multiple raters over time. The defensibility of using WBAs for summative pass/fail and remediation decisions is questionable without this because, from a generalizability theory perspective, 12 to 14 mini-CEXs are needed to reach acceptable reliability for judgments. Challenges to implementing WBAs include time, faculty development, accountability, and recognition for faculty who engage in these assessments, as clinical environments often value productivity over the supervision and evaluation of trainees.

 

논의
Discussion

이 검토는 현재 이용 가능한 임상 추론 평가 방법의 메뉴를 요약하고 타당성 고려사항, 타당성 문제, 장점 및 단점을 각각 강조한다. 특히 차트 1과 보충 디지털 부록 4는 평가 프로그램의 구축에 도움이 됩니다. 교육자는 각기 다른 타당성 고려사항을 가진 서로 다르지만 상호 보완적인 여러 임상 추론 평가 방법 중에서 선택할 수 있다. 조사 결과에 근거한 실용적인 가이던스는 리스트 1에 기재되어 있습니다.
This review summarizes the currently available menu of clinical reasoning assessment methods and highlights validity considerations, feasibility issues, advantages, and disadvantages for each. Chart 1 and Supplemental Digital Appendix 4 (at https://links.lww.com/ACADMED/A634) in particular can help inform the construction of programs of assessment.63 Educators can select from a number of different but complementary clinical reasoning assessment methods, each with different validity considerations. Practical guidance based on our findings is given in List 1.

임상 추론 평가 방법의 기존 메뉴의 가치는 역량 기반 교육의 렌즈를 통해 가장 잘 이해할 수 있다. 의학 교육자가 학습자가 임상 추론의 역량을 ensure하려면 임상 추론의 모든 구성요소에 대한 강력한 평가를 제공해야 한다12(표 1 참조). 또한 적절한 샘플링을 준비해야 한다. 이는 여러 평가 방법을 사용해야만 달성할 수 있습니다. 
The value of the existing menu of clinical reasoning assessment methods can perhaps best be understood through the lens of competency-based education. If medical educators want to ensure that learners are competent in clinical reasoning, they must provide robust assessment of all components of clinical reasoning12 (see Table 1). Further, they must also arrange for adequate sampling. This can only be accomplished by employing multiple assessment methods.63

차트 1을 자세히 살펴보면 일반적으로 사용되는 [많은 형태(MCQ, EMQ, KFE, SCT)의 비 WBA]는 [정보 수집, 가설 생성 및 문제 표현 평가]에서 [평균에 불과하다]는 것을 알 수 있습니다. 이들의 강점은 감별 진단 평가, 선도 진단, 관리 및 치료에 있습니다. 시뮬레이션된 임상 환경과 WBA에서의 평가는 정보 수집을 평가하는 데 더 우수하며, 직접 관찰과 OSCE가 이 영역에서 가장 강력하다. SRL-M 및 TA 전략은 학습자가 추론 과정에서 숨겨진 이러한 단계를 명확하게 설명하도록 하기 때문에 가설 생성 및 문제 표현을 측정하기 위한 효과적인 도구입니다. 교육자는 임상 추론의 다양한 구성요소를 평가하는 데 강한 전략을 신중하게 조합함으로써(예를 들어 MCQ + SRL-M + OSCE) 더 큰 역량의 모든 구성요소에 대한 평가를 확실하게 시작할 수 있습니다.
A close look at Chart 1 demonstrates that many forms of non-WBAs in common use (MCQs, EMQs, KFEs, SCTs) are only poor to average at assessing information gathering, hypothesis generation, and problem representation. Their strengths lie more in assessing differential diagnosis, leading diagnosis, and management and treatment. Assessments in simulated clinical environments and WBAs are better at assessing information gathering, with direct observation and OSCEs being the strongest in this domain. SRL-M and TA strategies are effective tools for measuring hypothesis generation and problem representation because they force learners to articulate these otherwise hidden steps in the reasoning process.64 By carefully combining strategies that are strong at assessing the different components of clinical reasoning (e.g., MCQs + SRL-M + OSCEs), educators can begin to ensure assessment of all components of the larger competency.

물론 "전체"로서의 임상적 추론 능력은 "부분"의 합보다 더 크다. 평가 프로그램을 구성할 때 [임상 추론의 모든 구성 요소를 평가하는 것]은 필요하지만 충분하지는 않다. 학습자가 기술을 임상 실습으로 이전할 수 있도록 보장하기 위해 전체 작업 평가(즉, 전체 임상 추론을 다루는 평가)가 필요하며, 광범위한 표본 추출을 위해 부분 작업 평가가 필요하다. 전체 및 파트 태스크 평가(예: 직접 관찰, OSCE 및 MCQ, KFE 및 EMQ와 결합된 글로벌 평가)의 조합은 평가 프로그램의 기초를 형성할 수 있다.
Of course, clinical reasoning competence as a “whole” is more than the sum of its “parts.”65 When constructing an assessment program, it is necessary, but not sufficient, to ensure assessment of all components of clinical reasoning. Whole-task assessments (i.e., those that cover the full range of clinical reasoning) are needed to ensure that learners can transfer skills into clinical practice,66 while part-task assessments are needed to achieve broad sampling. Combinations of whole- and part-task assessments (e.g., direct observations, OSCEs, and global assessments combined with MCQs, KFEs, and EMQs) can form a foundation for a program of assessment.

교육자는 또한 방법 중에서 선택할 때 평가의 [타당성, 사용가능성, 방어가능성]을 고려해야 합니다. 차트 1을 보면, 평가자가 주로 WBA를 사용하는 경우, 실제 임상 환경에서 임상 추론의 모든 구성 요소에 대한 강력한 적용 범위를 확보하고 학습자가 유능하다고 쉽게 간주할 수 있다고 결론지을 수 있다. WBA는 매우 중요하며 현재의 역량 기반 교육 프로그램에서 더욱 강조할 가치가 있지만, 실현 가능성과 비용(교직원의 시간과 비용에 관한)이 종종 [표본으로 삼을 수 있는 사례의 수와 다양성을 제한]하기 때문에, 임상 추론을 평가하기 위하여 배타적으로 WBA만 사용하게 되면 내용특이성과 맥락특이성에 의해 제약을 받을 것이다. 이러한 관점에서 볼 때, 비 WBA(예: MCQ, EMQ, KFE)를 활용하여 맥락특이성의 문제를 줄이고, [블루프린트, 통제, 일관성 및 정확성]을 확보하는 동시에, 광범위한 표본을 확보함으로써, 임상 추론 평가 프로그램에 중요한 가치를 더할 수 있다. 따라서 타당성과 실현가능성을 모두 고려한다면, 모든 평가 프로그램에서는 [비 WBA, 시뮬레이션 환경의 평가, WBA의 균형]을 유지하는 것이 중요하다.

Educators must also consider the validity, feasibility, and defensibility of assessments when choosing among methods. Looking at Chart 1, one might conclude that if assessors predominately used WBAs, they would obtain robust coverage of all components of clinical reasoning in authentic clinical environments and easily be able to deem a learner competent. Although WBAs are critically important and deserve greater emphasis in current competency-based educational programs,67,68 the limitations of an exclusively WBA approach to assessing clinical reasoning rest in the problem of content and context specificity because feasibility and cost (with regard to faculty time and money) often limit the number and variety of cases that can be sampled. Seen in this light, non-WBAs (e.g., MCQs, EMQs, KFEs) add important value to a program of clinical reasoning assessment by ensuring broad sampling, while lessening issues of context specificity and providing opportunities for blueprinting, control, consistency, and accuracy. Thus, for validity and feasibility reasons, it is critical to have a balance of non-WBAs, assessments in simulated clinical environments, and WBAs in any assessment program.

이러한 균형을 잡는 것이 교육적 맥락에 따라 어려울 수 있습니다. 예를 들어,

  • [학부 의학교육 프로그램]은 종종 MCQ, OSCE, 글로벌 평가, 구두 발표 및 서면 메모의 조합을 사용하여 추론을 평가합니다. 이러한 프로그램은 [직접 관찰]과 같은 특정 방법의 사용을 개선하는 동시에 현재 충분히 평가되지 않을 수 있는 임상 추론의 구성 요소를 얻기 위해 TA 또는 SRL-M과 같은 새로운 방법을 통합하기를 원할 수 있다.
  • [졸업후 의학 교육]에서 학습과 평가의 대부분은 임상 환경에서 이루어지며, 종종 MCQ로 구성된 기술 강화 시뮬레이션과 훈련 중인 검사를 통해 강화된다. 광범위한 평가 방법을 통합하고, 현재 사용 중인 평가 방법을 개선하며, 바쁜 임상 환경에서 도구에 대한 평가자를 교육하는 것은 쉽지 않을 것입니다.

WBA가 개선되면, 이러한 보다 전체적인holistic 평가가 우세할 수 있으며, 비 WBA는 주로 [불확실성과 재교육 상황]에서 주로 사용될 수 있다. 그러나 이러한 전환을 효과적으로 하기 위해서는 여전히 많은 연구가 필요하다.

Creating such a balance can be challenging depending on the educational context.

  • For example, undergraduate medical education programs often use a combination of MCQs, OSCEs, global assessments, oral presentations, and written notes to assess reasoning. These programs may wish to improve the use of certain methods, such as direct observation, while also incorporating novel methods, such as TA or SRL-M to get at components of clinical reasoning that may be currently underassessed.
  • In graduate medical education, the bulk of learning and assessment happens in the clinical environment, augmented occasionally by technology-enhanced simulation and in-training examinations, which are largely comprised of MCQs. Incorporating a wider range of assessment methods, improving on assessment methods currently in use, and training raters on tools in busy clinical settings will be daunting.

As WBAs improve, it may be possible that these more holistic assessments can predominate, and non-WBAs can be used largely for situations of uncertainty and remediation; however, much research is still needed to make this transition effectively.

궁극적으로, 기관은 평가 프로그램이 임상 추론의 구성요소에 대한 완전한 적용 범위를 제공하는지 확인해야 한다(표 1과 차트 1). 프로그램은 [전체 태스크 방법]과 [부분 태스크 방법]을 모두 사용할 필요가 있을 뿐만 아니라, [타당성]에 대한 다양한 위협과 관련하여 방법에 대한 균형 잡힌 표현을 제공해야 한다(보조 디지털 부록 4 참조). 임상 추론을 위한 프로그램적 평가는 여전히 많은 기관에서 초기 개념이지만, 이 리뷰는 이 분야가 미래에 이동해야 한다는 것을 시사한다. 의료기관은 임상 추론의 빈번한 평가를 수행하여 여러 출처에서 여러 방법을 사용하여 다양한 맥락 또는 환경에 걸쳐 세로 방향으로 정보를 수집해야 한다. 이는 시간과 교직원 육성의 필요성 때문에 현실에서 어려운 일이지만, 높은 수준의 종합적 결정이나 역량 결정을 내릴 때 평가 프로그램의 방어성에 매우 중요합니다. 또한 환자 안전을 보장하는 것도 중요하다.69 현재 평가 관행이 비 WBA, 시뮬레이션 임상 환경의 평가 및 WBA의 적절한 균형을 이루는지 여부는 논란의 여지가 있지만 이 검토의 범위를 완전히 벗어나 있다.
Ultimately, institutions must ensure that their programs of assessment offer complete coverage of the components of clinical reasoning (Table 1 and Chart 1). Programs will need to use both whole- and part-task methods as well as provide a balanced representation of methods with regard to various threats to validity (see Supplemental Digital Appendix 4 at https://links.lww.com/ACADMED/A634). Programmatic assessment for clinical reasoning is still a nascent concept at many institutions, yet this is where this review suggests the field needs to move in the future. Institutions need to conduct frequent assessments of clinical reasoning, gathering information longitudinally from multiple sources, using multiple methods, across various contexts or settings. This is challenging in the real world because of time and the necessity of faculty development, yet it is critical for the defensibility of an assessment program when making high-stakes summative decisions or competency determinations. It is also critical to ensure patient safety.69 Whether our current assessment practices strike the right balance of non-WBAs, assessments in simulated clinical environments, and WBAs is debatable but beyond the scope of this review to fully address.

우리의 논의는 주로 임상추론역량과 [학습의 평가AoL]에 초점을 맞췄지만, [학습을 위한 평가AfL]를 고려하는 것도 중요하다. 많은 동일한 원칙이 적용되지만, 학습을 위한 평가는 보다 형성적이며, 임상 추론 과정을 학습하고 가르치는 데 높은 가치가 있기 때문에, [다른 범위의 타당성 증거]를 사용할 수 있다(즉, 방법이 목적에 적합해야 한다). 예를 들어, CIP와 개념 지도는 학생들이 질병 스크립트를 개발하고 연결을 형성하도록 돕는다는 점에서 학습에 큰 효용을 가지고 있으며, 진단 전문지식의 기초라고 생각되는 코딩 및 검색 네트워크의 개발을 촉진한다. 직접 관찰 및 기술 강화 시뮬레이션과 같은 전체 작업 임상추론 평가는 다수의 관찰 없이 총괄적 판단을 하는 데 적합하지 않더라도 형성적 피드백을 얻는 데 필수적인 수단이다.

Although our discussion has largely focused on determining clinical reasoning competency and assessment of learning, it is also important to consider assessment for learning. While many of the same principles apply, assessment for learning is more formative and may employ methods that have a different range of validity evidence because of their high value for learning and teaching the clinical reasoning process (i.e., the method is fit for the purpose). For example, CIPs and concept maps have great utility for learning in that they help students develop illness scripts and form connections, facilitating the development of coding and retrieval networks, which are thought to be the basis of diagnostic expertise.70,71 Whole-task clinical reasoning assessments, such as direct observations and technology-enhanced simulations, are essential means of obtaining formative feedback, even if they are not well suited for making summative judgments without large numbers of observations. 


의사의 역량으로서의 임상 추론의 중요성은 평가의 엄격함과 혁신을 요구한다. 이 검토는 임상 추론 평가 방법에 상당한 혁신이 있었음을 보여주지만, 아직 해야 할 일이 많이 남아 있다. 우리는 이 집계된 자료가 교육자들이 임상 추론 평가 방법의 기존 메뉴와 그 중에서 선택하는 방법에 대해 더 잘 알 수 있도록 돕기를 바란다. 우리는 이 방법들의 개선을 이끌기 위해 지속적이고 엄격한 타당성 증거 수집의 필요성을 강조한다. 의대, 레지던트 프로그램 및 면허 위원회가 학습자의 역량을 자신 있게 결정할 수 있도록 다양한 방법을 임상 추리 평가의 유효한 프로그램에 가장 잘 결합하는 방법을 결정하기 위한 미래 연구도 필요하다.

The importance of clinical reasoning as a physician competency mandates rigor and innovation in the assessment of it. This review demonstrates that there has been considerable innovation in clinical reasoning assessment methods, but there remains much work to be done. We hope this collated resource will help educators become more aware of the existing menu of clinical reasoning assessment methods and how to choose among them. We emphasize the need for ongoing and rigorous gathering of validity evidence to guide improvements in each of these methods. Future research is also needed to determine how to best combine various methods into valid programs of clinical reasoning assessment to allow medical schools, residency programs, and licensing boards to confidently determine the competence of their learners.

 

220402 Clinical Reasoning Clinical_Reasoning Supplementary acadmed_2019_01_24_daniel_acadmed-d-18-00787_sdc4.pdf
0.41MB

List 1 2016년 임상추론평가방법 범위 검토의 임상추론평가를 위한 실무지침
List 1 
Practical Guidance for Clinical Reasoning Assessment From a 2016 Scoping Review of Clinical Reasoning Assessment Methods

  • 임상 추론 평가 프로그램의 일부로 다양한 평가 방법(즉, 비 WBA, 시뮬레이션 임상 환경의 평가 및 WBA)을 사용해야 한다.
  • Multiple assessment methods (i.e., non-WBAs, assessments in simulated clinical environments, and WBAs) should be used as part of a clinical reasoning assessment program.
  • 많은 개별 평가 방법은 적절한 항목 또는 사례의 수, 광범위한 표본 추출 및 충분한 시험 시간으로 높은 단계 평가( 0 >= 0.8)에 대한 적절한 [신뢰성]을 얻을 수 있다.
  • Many individual assessment methods can obtain adequate reliability for high-stakes assessment (≥ 0.8) with an adequate number of items or cases, broad sampling, and sufficient testing time.
  • 역량을 확신ensure하려면, 내용 및 상황 특이성을 수용하기 위한 다양한 환경에서 다양한 임상 문제를 다루는 많은 평가가 종적으로 필요하다.
  • To ensure competence, a large number of assessments are needed, administered longitudinally, that cover a variety of clinical problems in diverse settings to accommodate content and context specificity.
  • 평가방법은 임상 추론, 타당성, 실현가능성, 방어가능성, 목적적합성 등 다양한 구성 요소의 적용범위에 기초하여 선택해야 한다.
  • Methods should be chosen based on coverage of the different components of clinical reasoning, validity, feasibility, defensibility, and fit for the purpose of the assessment.
  • 전체작업평가 및 부분작업평가 방법을 함께 사용하면(즉, 임상 추론의 모든 구성 요소와 일부 구성 요소를 포괄하는 방법)은 전체 구조의 측정과 적절한 표본 추출을 보장할 수 있다.
  • Whole- and part-task assessment methods (i.e., those that cover all versus a few components of clinical reasoning) used together can ensure measurement of the whole construct and adequate sampling.
  • 비 WBA(예: MCQ, EMQ, KFE)는 광범위한 샘플링, 블루프린팅, 통제, 일관성이라는 장점이 있다. 정확성도 평가할 수 있습니다.
  • Non-WBAs (e.g., MCQs, EMQs, KFEs) have the advantage of broad sampling, blueprinting, control, and consistency. They can also assess accuracy.
  • MCQ와 KFE[내용, 내부 구조, 임상 수행능력에 대한 성과 또는 후과]에 관한 최선의 타당성 증거를 가지고 있다. 그러나 [응답 프로세스]에 관한 경우, 그들은 중요한 문제를 안고 있다.
  • MCQs and KFEs have the best validity evidence regarding content, internal structure, and consequences or outcomes on clinical practice performance; however, they have significant issues with cueing when it comes to response process.
  • [비 WBA]는 [전체 과제를 더 많이 측정하는 경향이 있는 시뮬레이션과 WBA]에 비해, 임상 추론의 구성요소의 수가 더 제한적이다.
  • Non-WBAs measure a more limited number of components of clinical reasoning compared with simulations and WBAs, which tend to measure more of the whole task.
  • WBA는 실제 임상 프랙티스에 포함되기에, [내용 및 응답 프로세스의 타당성]에 대한 신뢰성을 제공합니다.단, 내용 커버리지가 체계적이지 않습니다.
  • WBAs are embedded in actual clinical practice, lending authenticity to content and response process validity; however, content coverage is not systematic.
  • 일반화 이론의 관점에서 판단의 허용 가능한 신뢰성에 도달하기 위해서는 다수의 측정이 필요하기 때문에 요약 의사결정에 WBA를 사용하는 것의 방어가능성은 의문을 갖게 만들 수 있다. WBA의 경우 [장기간에 걸쳐 복수의 평가자에 의한 평가]가 필수적입니다.
  • The defensibility of using WBAs for summative decisions is questionable because, from a generalizability theory perspective, a large number of measurements are needed to reach acceptable reliability for judgments. Ensuring evaluation by multiple raters over time is also essential for WBAs.
  • [전체 과제 임상 추론 평가](즉, 정보 수집에서 차등 진단, 관리 및 치료까지 모든 작업을 포괄하는 평가)는 형성적 피드백과 학습을 위한 평가에 필수적이다.
  • Whole-task clinical reasoning assessments (i.e., those that cover the full range of tasks from information gathering to differential diagnosis to management and treatment) are essential for formative feedback and assessment for learning.
  • [시뮬레이션된 임상 환경과 WBA의 평가]는 학습자가 개발 및 관리에 시간과 자원이 많이 소요되지만 전체 과제에 대해 평가되도록 하기 때문에 모든 포괄적인 평가 전략의 필수적인 부분이다.
  • Assessments in simulated clinical environments and WBAs are essential parts of any comprehensive assessment strategy because they ensure that learners are assessed on the whole task, though they are time- and resource-intensive to develop and administer.

Abbreviations: WBAs indicates workplace-based assessments; MCQs, multiple-choice questions; EMQs, extended matching questions; KFEs, key feature examinations.

 


Acad Med2019 Jun;94(6):902-912.  doi: 10.1097/ACM.0000000000002618.

Clinical Reasoning Assessment Methods: A Scoping Review and Practical Guidance

Affiliations collapse

Affiliation

1M. Daniel is assistant dean for curriculum and associate professor of emergency medicine and learning health sciences, University of Michigan Medical School, Ann Arbor, Michigan; ORCID: http://orcid.org/0000-0001-8961-7119. J. Rencic is associate program director of the internal medicine residency program and associate professor of medicine, Tufts University School of Medicine, Boston, Massachusetts; ORCID: http://orcid.org/0000-0002-2598-3299. S.J. Durning is director of graduate programs in health professions education and professor of medicine and pathology, Uniformed Services University of the Health Sciences, Bethesda, Maryland. E. Holmboe is senior vice president of milestone development and evaluation, Accreditation Council for Graduate Medical Education, and adjunct professor of medicine, Northwestern Feinberg School of Medicine, Chicago, Illinois; ORCID: http://orcid.org/0000-0003-0108-6021. S.A. Santen is senior associate dean and professor of emergency medicine, Virginia Commonwealth University, Richmond, Virginia; ORCID: http://orcid.org/0000-0002-8327-8002. V. Lang is associate professor of medicine, University of Rochester School of Medicine and Dentistry, Rochester, New York; ORCID: http://orcid.org/0000-0002-2157-7613. T. Ratcliffe is associate professor of medicine, University of Texas Long School of Medicine at San Antonio, San Antonio, Texas. D. Gordon is medical undergraduate education director, associate residency program director of emergency medicine, and associate professor of surgery, Duke University School of Medicine, Durham, North Carolina. B. Heist is clerkship codirector and assistant professor of medicine, University of Pittsburgh School of Medicine, Pittsburgh, Pennsylvania. S. Lubarsky is assistant professor of neurology, McGill University, and faculty of medicine and core member, McGill Center for Medical Education, Montreal, Quebec, Canada; ORCID: http://orcid.org/0000-0001-5692-1771. C.A. Estrada is staff physician, Birmingham Veterans Affairs Medical Center, and director, Division of General Internal Medicine, and professor of medicine, University of Alabama, Birmingham, Alabama; ORCID: https://orcid.org/0000-0001-6262-7421. T. Ballard is plastic surgeon, Ann Arbor Plastic Surgery, Ann Arbor, Michigan. A.R. Artino Jr is deputy director for graduate programs in health professions education and professor of medicine, preventive medicine, and biometrics pathology, Uniformed Services University of the Health Sciences, Bethesda, Maryland; ORCID: http://orcid.org/0000-0003-2661-7853. A. Sergio Da Silva is senior lecturer in medical education and director of the masters in medical education program, Swansea University Medical School, Swansea, United Kingdom; ORCID: http://orcid.org/0000-0001-7262-0215. T. Cleary is chair, Applied Psychology Department, CUNY Graduate School and University Center, New York, New York, and associate professor of applied and professional psychology, Rutgers University, New Brunswick, New Jersey. J. Stojan is associate professor of internal medicine and pediatrics, University of Michigan Medical School, Ann Arbor, Michigan. L.D. Gruppen is director of the master of health professions education program and professor of learning health sciences, University of Michigan Medical School, Ann Arbor, Michigan; ORCID: http://orcid.org/0000-0002-2107-0126.

PMID: 30720527

DOI: 10.1097/ACM.0000000000002618

Abstract

Purpose: An evidence-based approach to assessment is critical for ensuring the development of clinical reasoning (CR) competence. The wide array of CR assessment methods creates challenges for selecting assessments fit for the purpose; thus, a synthesis of the current evidence is needed to guide practice. A scoping review was performed to explore the existing menu of CR assessments.

Method: Multiple databases were searched from their inception to 2016 following PRISMA guidelines. Articles of all study design types were included if they studied a CR assessment method. The articles were sorted by assessment methods and reviewed by pairs of authors. Extracted data were used to construct descriptive appendixes, summarizing each method, including common stimuli, response formats, scoring, typical uses, validity considerations, feasibility issues, advantages, and disadvantages.

Results: A total of 377 articles were included in the final synthesis. The articles broadly fell into three categories: non-workplace-based assessments (e.g., multiple-choice questions, extended matching questions, key feature examinations, script concordance tests); assessments in simulated clinical environments (objective structured clinical examinations and technology-enhanced simulation); and workplace-based assessments (e.g., direct observations, global assessments, oral case presentations, written notes). Validity considerations, feasibility issues, advantages, and disadvantages differed by method.

Conclusions: There are numerous assessment methods that align with different components of the complex construct of CR. Ensuring competency requires the development of programs of assessment that address all components of CR. Such programs are ideally constructed of complementary assessment methods to account for each method's validity and feasibility issues, advantages, and disadvantages.

 

왜 이 학생이 시험을 잘 못 볼까요? 자기조절학습을 활용한 문제 진단 및 해결 (Acad Med, 2018)
Why Does This Learner Perform Poorly on Tests? Using Self-Regulated Learning Theory to Diagnose the Problem and Implement Solutions 
Mary A. Andrews, MD, MPH, William F. Kelly, MD, and Kent J. DeZee, MD, MPH

 

 

문제
Problem

많은 의학 학습자는 객관식 임상시험에 의한 지식테스트에 어려움을 겪고 있으며, 이러한 학습자의 교정에는 리소스가 많이 소요됩니다.1 재교육 방법remediation은 시험기법과 연습문제 작성의 강조에서 의학지식과 임상추론을 개선하기 위한 포괄적인 노력까지 다양합니다. 그러나 최근 검토 결과 그러한 개입의 효과에 대한 근거는 미약했다. 더욱이 교정조치는 종종 교육 이론의 의미 있는 근거 없이 개발되고 구현된다. 여기에서는, 자기조절학습(SRL) 이론에 근거하는, 즉석에서 사용할 수 있는 새로운 테스트 응시 평가 및 교정 프레임워크를 소개하고, 센터에서의 구현을 설명하며, 영속적인 문제에 대한 이 유망한 솔루션의 대규모 연구의 기반을 마련한다.
Many medical learners struggle on multiple-choice, clinical-vignette-based knowledge tests, and remediating these learners is resource intensive.1 Remediation methods range from emphasizing test-taking techniques and completing practice questions, to comprehensive efforts to improve medical knowledge and clinical reasoning.1–3 However, recent reviews found only weak evidence of the effectiveness of such interventions.4,5 Furthermore, remediation methods are often developed and implemented without meaningful basis in educational theory.4 Here we introduce a novel, ready-to-use test-taking assessment and remediation framework based on self-regulated learning (SRL) theory; describe implementation at our center; and lay the foundation for a large-scale study of this promising solution to a perennial problem.

SRL 이론은 많은 분야에서 성과를 향상시키기 위해 성공적으로 사용되어 온 교육 평가 프레임워크입니다. 6,7 SRL은 "개인 목표 달성에 계획되고, 순환적으로 적응되는, 자기 생성적 생각, 감정 및 행동"으로 정의되어 있습니다. SRL 하위 프로세스는 세 가지 태스크 중심 범주로 나눌 수 있습니다: 사전 생각, 퍼포먼스, 그리고 자기 성찰입니다. 이전 연구에서는 SRL 하위 프로세스와 의과대학 성과 간의 상관관계를 보여 왔다. 예를 들어 의과대학 입학시험 점수 조정 후 의과대학 2학년 학생들의 전략적 계획이 미국 의학면허시험 1단계 점수와 유의하게 관련되어 있었다. 시험 성적에 대한 SRL 기반 평가는 어려움을 겪고 있는 수험생을 진단하고 교정하는 데 유용한 수단이라고 가정했습니다.

SRL theory is an educational assessment framework that has been successfully used to improve performance in many disciplines.6,7 SRL has been defined as “self-generated thoughts, feelings, and actions that are planned and cyclically adapted to the attainment of personal goals.”8 SRL subprocesses can be divided into three task-centered categories: forethought, performance, and self-reflection.7 Prior research has shown correlations between SRL subprocesses and medical school performance; for example, strategic planning by second-year medical students was significantly associated with United States Medical Licensing Examination Step 1 scores after adjusting for Medical College Admission Test scores.9 We postulated that an SRL-based assessment of test-taking performance would be a useful means of diagnosing and remediating struggling test takers.

접근
Approach

이 방법은 정의된 교육 과제 동안 학습자에게 다른 지점에서 질문을 함으로써 자기 규제 프로세스의 동적, 컨텍스트별 특성을 포착하는 자기조절학습 마이크로 분석 및 훈련(SRL-MAT)의 형태로 설계되었다. 이 방법은 2012년 초 한 저자(K.J.D)에 의해 개발되었으며, 공동 저자에 의해 다듬어졌으며, 클리어리 등이 설명한 5단계 SRL 미세 분석 프로토콜 개발 프로세스와 유사하지만 유사하다. 이 프로젝트는 품질 개선 이니셔티브로 수행되었으며 기관 검토 위원회는 연구가 아니라고 판단했습니다.
This method was designed as a form of Self-Regulated Learning Microanalytic Assessment and Training (SRL-MAT), which captures the dynamic, context-specific nature of self-regulatory processes by posing questions to the learner at different points during a defined educational task.7 The method was developed by one author (K.J.D.) in early 2012, refined by the coauthors, and predates but closely resembles the five-step SRL microanalytic protocol development process described by Cleary et al.6 This project was undertaken as a quality improvement initiative and the institutional review board determined that it was not research.

우리는 라이센스, 인증 및 훈련 중인 시험(ITE)에서 일반적으로 발생하는 유형의 객관식 임상 비그넷 테스트 질문에 답하는 특정 과제를 선택했고, [과제 전략, 자가 평가, 인과 관계 귀인, 적응적 추론]을 위한 대상 SRL 하위 프로세스를 식별했다. 테스트 질문에 올바르게 대답하는 작업에 특화된 SRL 미세 분석 질문을 개발했다(표 1). 과제 전략 질문을 설계하여 훈련자가 잘 개발된 질병 스크립트를 사용하여 올바른 진단에 도달하는 정도를 평가하였습니다. 이는 어려움을 겪는struggling 수험생과 임상 추론 연구에 대한 과거 경험에서 효과적인 전략임을 알 수 있기 때문입니다. 

We selected the specific task of answering a multiple-choice, clinical vignette test question of the type commonly encountered on licensing, certification, and in-training examinations (ITEs) and identified target SRL subprocesses for this task: task strategies, self-evaluation, causal attributions, and adaptive inferences.7,8 We developed SRL microanalytic questions specific to the task of answering test questions correctly (Table 1). We designed the task strategy questions to assess the extent to which the trainee uses well-developed disease scripts to arrive at the correct diagnosis, as past experience with struggling test takers and clinical reasoning research have shown this to be an effective strategy.10 

우리는 학습자가 다음의 활동을 하는 동안 시행될administered 과업수행전략 질문을 설계함으로써 SRL 하위 프로세스를 작업의 시간적 차원에 연결했다: 시험 문제 풀기, 문제풀기-정답고르기 과정 중 특정 지점에서의 자기평가 질문, 선택한 답이 맞는지 학습자에게 알려준 후 인과 관계 귀인, 적응적 추론 문제를 해결하기. [학습자 수행능력의 과거 특징]과 [특정 미세 분석 질문에 대한 학습자의 답변]을 바탕으로 SRL 결함을 식별하는 분류 시스템을 개발했다. 이는 클리어리 등이 추천한 개방형 질문의 완전한 전사 및 독립적 코딩과는 다르지만, 실용성과 사용 편의성을 위해 이 분류 체계를 선택했다. 이 방법은 교사와 학습자가 1시간 세션에서 일대일로 사용하고 학습자의 자기 평가와 연습을 위해 고안되었습니다.

We linked SRL subprocesses to the temporal dimensions of the task by designing the task strategy questions to be administered while the learner works through the test question, self-evaluation questions at specified points during the question–answering process, and causal attribution and adaptive inference questions after the learner was informed whether the selected answer was correct. We developed a categorization system that identified the SRL deficiency based on historical features of the learner’s performance and on the learner’s answers to specific microanalytic questions. This differs from the full transcription and independent coding of open-ended questions recommended by Cleary et al,6 but we chose this categorization scheme for practicality and ease of use. This method was designed for one-on-one use by a teacher and learner in a one-hour session, and for learner self-assessment and practice.

 

미세 분석 질문은 질문 검토 양식(QRF, 부록 1 참조)으로 통합되었습니다. 이 양식을 사용할 때, 교사는 먼저 학습자에게 ITE, 의사면허시험의 Step들, NBME의 과목시험 등을 포함한 객관식 임상시험 기반의 의학지식 테스트에 대한 이전 성과가 어땠는지를 기술하도록 요구한다. 그런 다음, 교수자는 [학습자의 교육 수준에 적합한 임상 실습 질문]을 학습자에게 제시하고, [이 문제를 실제 테스트 문제인 것처럼 풀도록] 요청합니다. 유일한 차이점은 학습자가 큰 소리로 읽고 생각해야 한다는 것입니다. 

The microanalytic questions were combined into a Question Review Form (QRF; see Appendix 1). When using the form, the teacher first asks the learner to describe prior performance on multiple-choice, clinical-vignette-based medical knowledge tests, including ITEs, steps of licensing examinations, National Board of Medical Examiners subject matter examinations, etc. The teacher then presents the learner with a clinical-vignette-based practice question appropriate to the learner’s training level and asks the learner to engage the question as if it were an actual test question, with the only difference being that the learner should read and think out loud.

이 첫 번째 테스트 질문의 경우, 교수자는 학습자를 중단시키지 않고, 미세 분석 질문을 하지 않고, 문제풀기를 쭉 진행합니다. 교사는 학습자의 시험문제에 대한 참여engagement 수준을 아래의 범위로 기록한다. 

  • 매우 피상적인 참여(예: 내부 주석이나 정보에 대한 해석 없이 문제 전체를 큰 소리로 읽는 것)에서
  • 매우 적극적인 참여(예: 임상 정보의 우선 순위와 해석, 문항줄기를 읽는 동안 감별진단을 생성 및 수정)까지

For this first test question, the learner proceeds through the question without interruption from the teacher or administration of any microanalytic questions. The teacher notes the learner’s level of engagement with the test question, which can range from

  • very superficial (e.g., reading the entirety of the question out loud without any interior commentary or interpretation of the information) to
  • highly engaged (e.g., actively prioritizing and interpreting the clinical information and generating and refining a differential diagnosis while reading the stem).

이러한 초기 중단 없는 Think-aloud 연습은 임상 비게트에 제시된 정보에 쉽게 관여하지 않는 학습자의 미발달 질병 스크립트와 같은 특정 시험 응시 결함을 시사할 수 있다.

This initial uninterrupted think-aloud exercise may suggest a particular test-taking deficiency, such as underdeveloped disease scripts in the learner who does not readily engage with the information presented in the clinical vignette.

그런 다음 교사는 QRF와 함께 두 번째 시험 문제를 제시합니다. 선생님은 시험문제의 마지막 문장(예: "진단 내용은 무엇입니까?")을 다룹니다. 또는 "관리에서 차선책은 무엇입니까?"라고 말한 후 학습자에게 QRF 항목 1~6에 답하도록 합니다. 

  • 항목 1~4는 임상 계통에서 질병 스크립트를 식별하는 전략을 사용하는 학습자의 기술을 평가한다. 항목 2 - 4는 학습자의 질병 스크립트의 특수성(즉, 학습자가 질병의 다양한 하위 유형을 얼마나 잘 인식할 수 있는지)을 평가한다. 
  • 항목 5 - 6은 질문-답변 과정의 정의된 지점에서 자가 평가 시 학습자의 기술을 평가하는 자신감 척도이다. 항목 6을 완료한 후 교사는 질문(예를 들어 "관리에서 다음 최선의 단계는 무엇입니까?")을 풀지만 정답은 풀지 않습니다. 

The teacher then presents a second test question along with the QRF. The teacher covers the last sentence (e.g., “What is the diagnosis?” or “What is the next best step in management?”) and asks the learner to answer QRF Items 1 through 6 after thinking aloud through the clinical vignette.

  • Items 1 through 4 assess the learner’s skill in using the strategy of identifying the disease script in the clinical stem. Items 2 through 4 assess the specificity of the learner’s disease scripts (i.e., how well the learner can recognize different subtypes of disease).
  • Items 5 through 6 are confidence scales which assess the learner’s skill at self-evaluation at defined points in the question–answering process. After completing Item 6, the teacher uncovers the question (e.g., “What is the next best step in management?”) but not the answers.
  • 학습자는 질문에 대한 답을 예측하고 해당 답변에 대한 자신감을 평가합니다(항목 7-8). 
  • 그런 다음, 교사는 정답 선택지를 공개하고, 학습자는 선택지를 본 후 예상 답안(또는 유사한 답안)에 대한 자신감을 평가하며(9~11번 항목) 또는 답안 변경 여부를 결정한다(12번 항목). 
  • 그런 다음, 교사가 정답을 밝히고, 학습자는 인과적 속성과 적응적 추론(항목 14~15)을 평가하는 문제에 답합니다. 이 방법은 교사가 다음 섹션에서 설명하는 시험 문제 중 하나를 식별하기에 충분한 증거를 축적할 때까지 새로운 시험 문제에서 반복된다. 각 문제는 SRL 하위 프로세스 부족에 해당한다.
  • The learner predicts the answer to the question and rates his or her confidence in that answer (Items 7–8).
  • Then the teacher reveals the answer choices and the learner rates his or her confidence in his or her predicted answer (or similar answer) after seeing the choices (Items 9–11), and decides if he or she wants to change his or her answer (Item 12).
  • The teacher then reveals the correct answer, and the learner answers the questions assessing causal attributions and adaptive inferences (Items 14–15). The method is repeated with new test questions until the teacher has accumulated enough evidence to identify one of the test-taking problems outlined in the following section, each of which corresponds to an SRL subprocess deficiency.

이 평가 도구는 내과 레지던트 내의 품질 개선 이니셔티브로서 2012-2013학년도 중 2학년 내과 레지던트 16명에게 1명의 교직원이 관리했습니다. 평가방법의 이론적 근거를 설명하고, 방법의 관리방법을 검토하며, 역할극을 통해 교수진의 연습을 허용하는 90분짜리 워크숍도 개발되었습니다.
As a quality improvement initiative within the internal medicine residency, this assessment tool was administered by one faculty member to 16 second-year internal medicine residents during academic year 2012–2013. A 90-minute workshop, which describes the theoretical basis for the assessment method, reviews how to administer the method, and allows for faculty practice with the method via role-play, was developed as well.

결과
Outcomes

약 20명의 고군분투하는 학습자에게 이 방법을 사용한 결과, 대부분의 시험 문제를 다음과 같이 분류할 수 있었다.

  • 스크립트 인식 부족,
  • 스크립트 특이성 부족,
  • 조기 종결,
  • 자신감 부족,
  • 부적응적 인과 귀인
  • 부적절한 적응적 추론

이러한 테스트의 결함에 대해서는, 이하에 간단하게 설명합니다.비디오의 예와 각 타입의 식별과 수정에 관한 상세한 것에 대하여는, 보충 디지털 부록 1을 참조해 주세요.
After using this method with approximately 20 struggling learners, we found that most test-taking problems could be categorized as follows:

  • lack of script recognition,
  • lack of script specificity,
  • premature closure,
  • underconfidence,
  • maladaptive causal attributions, and
  • inappropriate adaptive inferences.

These test-taking deficiencies are briefly described below; video examples and more details about identifying and remediating each type are available in Supplemental Digital Appendix 1 at https://links.lww.com/ACADMED/A389.

첫 번째 시험풀이 결함은 [스크립트 인식 부족]이며, 이는 진단 추론을 위한 질병 스크립트의 작업 전략을 부적절하거나 비효율적으로 사용하는 것을 뜻한다. 이러한 학습자는 임상 스템을 읽는 동안 임상 데이터를 전혀 또는 사실적으로 잘못 해석할 수 없으며 QRF 항목 1 - 4에 답변할 수 없습니다.
The first test-taking deficiency is lack of script recognition, which reflects inappropriate or ineffective use of the task strategy of disease scripts for diagnostic reasoning. These learners offer no or factually incorrect interpretations of clinical data while reading the clinical stem, and they cannot answer QRF Items 1 through 4.

두 번째 유형의 시험풀이 결함은 [스크립트 특이성 부족]이며, 이것도 [과제수행전략]의 문제입니다. 이 결핍을 가진 학습자는 일반적인 질병 범주(우울증 등)를 인식함으로써 두 가지 선택지로 답을 좁히지만, 질병의 특정 임상 하위 유형이나 심각도(노인의 우울증 등)와 그 하위 유형과 관련된 진단 전략, 치료 또는 예후 차이를 인식하지 못한다. 이러한 학습자는 QRF 항목 2 ~ 4에 대해 불완전하거나 부정확한 답을 제시합니다.
The second type of test-taking deficiency is lack of script specificity, which is also a task strategy problem. Learners with this deficiency narrow down the answer to two choices by recognizing a general disease category (such as depression), but do not recognize the specific clinical subtype or severity of disease (such as depression in the elderly) and the differences in diagnostic strategy, therapy, or prognosis related to that subtype. These learners will give incomplete or inaccurate answers to QRF Items 2 through 4.

세 번째 테스트 부족은 [메타인지 모니터링 단계]의 문제인 [조기 종결]입니다. 이러한 결함을 보이는 학습자는 진단을 조기에 결정하고 진단과 일치하지 않는 정보를 무시하거나 과소평가하며 선택한 진단과 일치하지 않는 사실을 QRF 항목 4에 나열하거나(그러나 진단 변경을 거부함) 불일치를 단순히 인식하지 못할 수 있습니다.
The third test-taking deficiency is premature closure, a metacognitive monitoring problem. Learners who exhibit this deficiency make an early decision on the diagnosis, ignore or downplay information inconsistent with the diagnosis, and may list facts that are inconsistent with the chosen diagnosis in QRF Item 4 (yet refuse to change the diagnosis) or simply fail to note the inconsistencies.

네 번째 시험결과는 [메타인지 모니터링과 자기평가 단계]의 문제인 [자신감 부족]이다. 이 결함이 있는 학습자는 여러 번의 시험에 불합격한 전력이 있을 수 있으며, 이로 인해 심지어는 정확한 추론을 하고서도, 자기자신의 임상추론을 믿지 않게 된다. SRL 평가 과정에서 이러한 학습자는 올바른 진단을 식별하고 정답을 예측한 경우에도 중간에서 낮은 절반까지의 등급(QRF 항목 5~6,8)에 대한 자신감을 평가합니다.

The fourth test-taking deficiency is underconfidence, which is a metacognitive monitoring and self-evaluation problem. Learners with this deficiency may have a history of several examination failures and have consequently learned to distrust their clinical reasoning, even when it may be correct. During the SRL assessment, these learners rate their confidence on the middle to lower half of the scale (QRF Items 5–6, 8) even when they have identified the correct diagnosis and predicted the correct answer.

다섯 번째 시험풀이시 결함은 SRL의 [자기 성찰 단계]의 결함인 [부적절한 인과 귀인]이다. 이러한 결함은 정답이 맞고, 오답이 틀린 이유에 대한 피상적 또는 잘못된 설명에서 명확하게 드러난다 (QRF 항목 14).
The fifth test-taking deficiency is inappropriate causal attributions, which is a deficiency in the self-reflection phase of SRL. This deficiency is evident from superficial or incorrect explanations of why the right answer is correct and the wrong answer is incorrect (QRF Item 14).

마지막 시험결과는 [부적절한 적응적 추론]이며, 이는 자기성찰의 문제이기도 하다. 이 결함이 있는 학습자는 실습 질문에 답한 후 지식 격차를 식별할 수 있지만 효과적인 학습 계획(QRF 항목 15)을 명확하게 설명할 수는 없습니다.
The last test-taking deficiency is inappropriate adaptive inferences, which is also a self-reflection deficiency. Learners with this deficiency may be able to identify knowledge gaps after answering a practice question, but are unable to articulate an effective learning plan (QRF Item 15).

이 방법을 사용하여 시험 미비점을 식별하고 개선 전략을 제안함으로써 소수의 학습자만이 과거 제어를 사용하지만 시험 성과가 향상되었음을 알 수 있습니다. 이 내과 레지던트에서의 과거 6년간의 평균 ITE 성적 향상은 3년째에 4.6점이었다. 이 평가를 받은 주민의 2013년 ITE 점수는 2년차부터 3년차까지 평균 9.3점(표준편차: 7.7)으로, 과거 데이터에 근거해 예상되는 개선점의 약 2배였다.
In using this method to identify test-taking deficiencies and suggest strategies for improvement, we have found improved test performance, albeit in a small number of learners and using historical controls. Over the previous six years in this internal medicine residency, the average second-year ITE score improvement was 4.6 points in the third year. The average improvement in 2013 ITE score from second year to third year for the residents who underwent this assessment was 9.3 points (standard deviation: 7.7), which is about twice the expected improvement based on historical data.

다음 단계
Next Steps

테스트 성적이 낮은 학습자의 공통적이지만 어려운 문제에 SRL 미세 분석의 새로운 응용 프로그램을 도입했습니다.7 이 방법은 SRL 이론의 견고한 기반, 개별화된 치료 계획 및 상대적 구현 용이성을 포함하여 기존 시험 응시 교정 방법보다 장점이 있다. 적은 수, 동시적 통제집단의 부족, 평균으로의 회귀 가능성에 의해 제한되기는 하지만, 단일 센터 구현의 결과는 유망하다. 이 방법을 사용하기 위해 교직원이 훈련하는 데 필요한 시간은 다를 수 있지만, 우리는 90분짜리 워크숍 형식으로 비디오 예시와 롤 플레이를 사용하고 있습니다.

We have introduced a novel application of SRL microanalysis to the common yet challenging problem of learners who underperform on tests.7 This method has advantages over existing methods of test-taking remediation, including solid foundation in SRL theory, individualized treatment plans, and relative ease of implementation. Although limited by small numbers, lack of contemporary control group, and the possibility of regression towards the mean, the results of our single-center implementation are promising. While the time needed to train faculty to use this method may vary, we have used a 90-minute workshop format with video examples and role-play (Supplemental Digital Appendix 1, https://links.lww.com/ACADMED/A389) at our institution and others.

실현 가능성과 효과성에 대한 대규모 연구에 의해 교육 개입이 뒷받침되어야 하기에, 다음 단계는 대규모 무작위 대조 시험의 설계와 수행이다. 이 연구에는 과목시험이나 면허시험에 불합격한 학생, ITE 점수가 낮은 학생 등 다양한 프로그램 및 훈련 수준의 학습자가 참여해야 하며, 이 방법의 어떤 측면이 개선에 가장 큰 도움이 되는지 평가해야 합니다. 위에서 설명한 분류 시스템은 역사적 특징과 SRL 평가에 의존하며 단일 기관에서 쉽게 구현되어 왔지만, 이 시스템의 신뢰성과 타당성은 더 넓은 환경에서 연구되어야 한다.
Recognizing the need for educational interventions to be supported by large-scale studies of feasibility and effectiveness, the next steps for this method are the design and conduct of a large randomized controlled trial.4,5 This study should include learners from different programs and training levels, such as students who fail a subject matter examination or licensing exam and trainees with low ITE scores, and should assess which aspects of the method contribute the most to improvement. While the categorization system outlined above, which relies on historical features plus SRL assessment, has been easily implemented at a single institution, the reliability and validity of this system should be studied in broader settings.

객관식 임상시험에 기초한 의학지식시험에서 저조한 성적을 보이는 학습자는 어디에나 있으며, 저조한 시험성적은 심각한 직업적 결과를 초래할 수 있다. 시험에서 고군분투하는 학습자를 지원하기 위해 이론적으로 건전하지만 즉시 실행할 수 있는 개입이 부족하기 때문에, 이 개입과 다른 개입의 효과를 전파하고 조사할 필요가 가장 중요하다.

Learners who underperform on multiple-choice, clinical-vignette-based medical knowledge tests are ubiquitous, and poor test performance can have serious professional consequences. Given the paucity of theoretically sound yet ready-to-implement interventions for assisting learners who struggle on tests, the need to disseminate and investigate the effectiveness of this and other interventions is paramount.4,5

 


Acad Med. 2018 Apr;93(4):612-615.  doi: 10.1097/ACM.0000000000001422.

Why Does This Learner Perform Poorly on Tests? Using Self-Regulated Learning Theory to Diagnose the Problem and Implement Solutions

Affiliations collapse

Affiliation

1M.A. Andrews is assistant professor, Department of Medicine, Uniformed Services University of the Health Sciences, Bethesda, Maryland. W.F. Kelly is associate professor, Department of Medicine, Uniformed Services University of the Health Sciences, Bethesda, Maryland. K.J. DeZee is professor, Department of Medicine, Uniformed Services University of the Health Sciences, Bethesda, Maryland.

PMID: 30248085

DOI: 10.1097/ACM.0000000000001422

Abstract

Problem: Learners who underperform on standardized tests are common throughout all levels of medical education and require considerable faculty time and effort to remediate. Current methods for remediating test-taking difficulties are typically not grounded in educational theory or supported by high-quality evidence.

Approach: A test-taking assessment was developed based on self-regulated learning (SRL) microanalytic assessment and training and used during academic year 2012-2013. This method assesses the SRL subprocesses of strategic planning, self-monitoring, causal attributions, and adaptive inferences during the educational task of answering test questions. The method was designed for one-on-one use by teacher and learner, and for learner self-assessment and practice.

Outcomes: At one academic institution, this method was used to categorize learners into struggling test-taker subtypes which correspond to deficiencies in the SRL subprocesses outlined above. A learning plan based on the SRL deficiency was developed for each struggling test-taker subtype. In a small number of internal medicine residents with low in-training examination scores, use of this method yielded improvements in 2013 in-training examination score that doubled the expected improvement based on historical averages.

Next steps: This method is a novel application of SRL theory to a commonly encountered problem in medical education: the learner who performs poorly on tests. Large-scale, multicenter studies of medical learners at a variety of training levels and program types are needed to determine the effectiveness and generalizability of this intervention.

 

의학교육에서 동료지원학습(PAL): 체계적 문헌고찰과 메타분석(Med Educ, 2021)
Peer-assisted learning in medical education: A systematic review and meta-analysis
Clarissa Brierley BSc MSc1 | Leila Ellis BSc MBChB2 | Emily Roisin Reid BA MA1

 

 

1 도입
1 INTRODUCTION

동료 지원 학습(PAL)은 '전문 교사가 아닌 유사한 사회 집단의 사람들이, 서로 돕고 가르침을 통해, 스스로 학습하는 것'으로 정의되며, 의과대학에서 종종 시행되는 보충 교육의 한 형태이다. PAL은 고학년 학생들이 저학년 학생들을 가르치는 '니어 피어 티칭'과 같은 수준의 학생들이 교습과 튜터의 역할을 번갈아 맡는 '피아 투 피어 티칭'을 포함한 다양한 교육 방법을 포괄하는 용어이다. PAL은 의대생에게 졸업 시 GMC(General Medical Council)가 요구하는 교육 기술을 개발할 기회를 제공할 뿐만 아니라 선행학습 강화와 학업성취도 향상시킵니다. 또, 연구 결과, 커리큘럼내의 PAL은 스탭의 시간을 최적화해, 전체적인 자원의 가용성을 높이는 것으로 나타났습니다. PAL은 교직원과 학생 사이의 접촉 기회를 줄인다는 비판을 받아왔으며, PAL 학생들은 문제 기반 학습(PBL)의 맥락에서 문제를 독립적으로 분석하는 데 어려움을 겪고 있다. 따라서 PAL이 가장 큰 가치가 있는 맥락은 의학 교육에서 추가적인 관심 분야이다.

Peer-assisted learning (PAL), defined as ‘people from similar social groupings who are not professional teachers helping each other to learn and learning themselves by teaching’, is a form of supplemental teaching often implemented in medical schools.1, 2 PAL is an umbrella term encompassing a range of teaching methods, which include ‘near-peer teaching’, where students of a higher year teach students of a lower year, and ‘peer-to-peer teaching’, where students at the same level interchangeably take on the roles of tutors and tutees.3-5 PAL not only provides the opportunity for medical students to develop the teaching skills required by the General Medical Council (GMC) on graduating but also additionally helps reinforce their prior learning and improves their own academic performances.6, 7 Research has also shown that intra-curricular PAL increases overall resource availability by optimising staff time.8, 9 PAL has been criticised for reducing opportunity for contact between faculty and students, and in the context of problem-based learning (PBL), PAL students have reported difficulties in independently analysing problems.10 The context in which PAL is of greatest value is therefore an additional research area of interest within medical education.

PAL은 수십 년 동안 고등교육에 편입되어 왔으며, 영국 의과대학에서 채택되기 전에는 미국에서 시험 성적과 긍정적인 상관관계가 나타났다. 2010년 미국의 한 조사에 따르면, 응답한 의과대학 중 76%가 의학 교육 중에 어떤 형태로든 학생이 PAL에 참여하였다. PAL은 처음에는 저성취 학생을 대상으로 한 튜토리얼 프로그램 또는 이미 확립된 교육에 학생 교사를 포함시키는 프로그램의 형태를 취했습니다. 
PAL has been incorporated into tertiary education for decades, and a positive correlation with exam performance was shown in the United States before it was adopted by medical schools in the United Kingdom.11-13 A 2010 survey in the United States indicated that 76% of responding medical schools had students who engaged in some form of PAL during their medical education.14 PAL initially took the form of tutorial programmes targeted at low achieving students, or programmes that incorporated student teachers into already established teaching.12, 15-19

PAL은 1990년대 초반부터 학부 교육에서 실시되어 왔지만, PAL이 학생에게 미치는 영향에 대한 연구는 질적 연구 및 추적 기간이 짧은 학생에 대한 연구 형태로 이루어져 왔다. 이들은 학생들의 능력에 대한 인식 향상뿐만 아니라 학생들의 자기 보고 자신감 향상, 학생들의 기술과 지식의 개발도 보고했다. 2016년 체계적인 검토는 동료 교습을 통해 가르친  성과와 교직원이 가르친 성과를 비교했다. 그룹 간에 유의하게 다른 결과가 식별되지는 않았지만, PAL은 PAL의 혜택이 다를 수 있는 [다양한 교육 맥락에서 PAL 전달의 이질성]을 반영하려는 시도 없이, (마치 모든 PAL이) 단일하고 균일한 것처럼 취급되었다. 
Although PAL has been implemented in undergraduate education since the early 1990s, research into PAL's impact on students has been in the form of qualitative studies and those with short follow-up durations.8, 20-23 These reported an improvement in students' self-reported confidence, the development of students' skills and knowledge, as well as improved perception of students' abilities.8, 20-23 A systematic review in 2016 compared outcomes for undergraduate medical students taught through peer teaching with those taught by faculty.24 Although no significantly different outcomes between groups were identified, PAL was treated as a single, uniform entity, with no attempt to reflect the heterogeneity of PAL delivery in varying educational contexts, where the benefit of PAL may differ.24

본 연구는 의대생을 대상으로 실시한 PAL의 모든 무작위 연구를 체계적으로 검토했다. PAL의 효과를 확립하는 것이 주된 목적이었고, 그 대신 학업성취도를 선택했다. 두 번째 목표는 PAL이 가치를 부가할 수 있는 특정 의료 교육 환경을 식별하는 데 초점을 맞춘다. 우리는 중장기적으로 평가했을 때 임상 전과 학생의 성과, 절차적 기술 또는 이론적 지식의 가르침, 그룹 간 PAL이 학업 성취도에 미치는 영향 사이의 차이를 식별하기 시작했다.

This study systematically reviewed all randomised studies of PAL conducted using medical students as subjects. The principal aim was to establish the effectiveness of PAL, choosing academic performance as a proxy measure. The secondary aims focus on identifying the specific medical education setting where PAL may add value. We set out to identify any differences between the performance of preclinical and clinical students, the teaching of procedural skills or theoretical knowledge, and the impact of PAL on academic achievement between groups when assessed in the medium to longer term.

2 방법
2 METHODS

2.1 프로토콜 및 등록
2.1 Protocol and registration

이 검토는 체계적 검토 및 메타 분석을 위한 선호 보고 항목(PRISMA)과 증거 합성 보고 교육(STORYS) 진술에 대한 STructured approach를 준수했다. 윤리적 승인이 필요하지 않았다.
This review conformed to the Preferred Reporting Items for Systematic Reviews and Meta-Analyses (PRISMA) and STructured apprOach to the Reporting In healthcare education of Evidence Synthesis (STORIES) statements.25, 26 No ethical approval was required.

2.2 검색 전략
2.2 Search strategy


4개의 전자 데이터베이스(MEDLINE, Ovid Embase, Web of Science and Education Research Complete)에 대한 문헌 검색은 2020년 4월에 C. B.에 의해 수행되었고 2021년 7월에 업데이트되었다. PAL에 대한 다양한 변형이 의료 교육 내에서 시행되고 있으며, 이 용어는 종종 서로 바꿔서 사용됩니다.4 이 다양성은 가능한 많은 관련 연구를 얻기 위해 사용된 검색어에 반영되었다. 각 데이터베이스에 대한 전자 검색 전략에는 의료 주제 제목(MeSH) 용어, 부울 조합 및 20개 키워드의 잘라내기 사용이 포함되었다. 검색어 개발 중에 대상 사서에게 상담했습니다. Embase 검색 전략은 표 S1에 요약되어 있습니다.
A literature search of four electronic databases (MEDLINE, Ovid Embase, Web of Science and Education Research Complete) was conducted by C. B. in April 2020 and updated in July 2021. Many different variations on PAL are being practised within healthcare education, and the terminology is often used interchangeably.4 This variety was reflected within the search terms used in order to obtain as many relevant studies as possible. The electronic search strategy for each database included the use of Medical Subject Headings (MeSH) terms, Boolean combinations and truncations of 20 keywords. A subject librarian was consulted during search term development. Our Embase search strategy is summarised in Table S1.

검색은 저널 기사를 포함했고 제목, 추상, 인간 연구 및 영어로 된 기사들로 제한되었다. 회색 문헌은 포함되지 않았다. 출판 시기에 대한 제한은 없었다. 검토에 포함된 모든 논문의 참조 목록에서 관련 기사를 검색했습니다. 모든 레퍼런스에 대해 전방 인용 검색을 실시했습니다. 모든 원본 연구 기사는 검토를 위해 검색되었으며, 참고 문헌 관리 프로그램인 ENDNOTE X9.2를 사용하여 검색 라이브러리를 만들었습니다.

The search incorporated journal articles and was limited to titles, abstracts, human studies and those in the English language. No grey literature was included. No limits were imposed on the time of publication. The reference lists of all papers included in the review were searched for relevant articles. We performed forwards citation searching for all references. All original research articles were retrieved for examination, and a search library was created using ENDNOTE X9.2, a bibliography management program.

2.3 연구의 선택
2.3 Study selection

기사 제목과 요약은 표 1의 포함 및 제외 기준에 따라 한 명의 검토자(C. B)가 체계적인 검토를 위해 선별 및 선정하였다.

Article titles and abstracts were screened and selected for systematic review by one reviewer (C. B.) based on the inclusion and exclusion criteria in Table 1.


학생의 학습에 영향을 주는 변수의 수를 최소한으로 억제하고, 리모트 또는 온라인 교습을 포함함으로써 발생하는 추가 편견을 피하고 싶기 때문에, 교습이 직접 행해진 연구만을 포함했습니다. 전문 스크리닝은 두 명의 저자(C. B.와 L. E.)가 수행했으며, 합의 수준은 96.4%였다. 갈등은 토론과 합의에 의해 해결되었다.

We only included studies where teaching had occurred face to face as we wished to minimise the number of variables influencing student's learning and avoid the additional biases caused by including remote or online teaching. Full-text screening was performed by two authors (C. B. and L. E.), with the agreement level being 96.4%. Conflicts were resolved by discussion and consensus.

연구는 모든 무작위 연구 암에 대해 평가에서 얻은 전체 평균 및 표준 편차 또는 표준 오차/신뢰 구간(CI)의 보고에 기초해 메타 분석에 포함되도록 선택되었다.

Studies were selected for inclusion in the meta-analysis based on the reporting of, at a minimum, the overall mean and standard deviation or standard error/confidence interval (CI) obtained at assessment for all randomised study arms.

2.4 데이터 수집
2.4 Data collection

적격 연구의 데이터 추출은 두 명의 독립 검토자(C. B.와 L. E.)에 의해 수행되었고, 이후 데이터를 교차 검사했다. 데이터 추출 양식은 학습 설계, 설정, 사용된 용어, 학생 교사와 학습자의 수와 특성, 학습 포함/제외 기준 및 1차 및 2차 결과와 같은 개별 학습 요소를 기록하기 위해 구성되었다. 개입 구분, 제공된 동료 교사 훈련, 제공된 교육의 빈도, 기간 및 세부 사항이 기록되었습니다. 연구 결과는 기록되었고, 가능한 경우 평균, 표준 편차, p 값, 표준 오차, 시험 점수 및 최대 가능 점수로 제한되었다. 피어 티칭 상호작용의 영향은 '커크패트릭의 학습 수준'의 수정된 모델을 사용하여 분류되었다. 데이터가 누락되거나 보고되지 않은 경우 해당 작성자에게 연락하여 응답이 없는 경우 2차 연락하여 4개월의 시간을 부여하였다. 개인이 포함된 연구의 품질은 Cochrane Risk of Biases Tool을 사용하여 평가되었다. 
Data extraction of eligible studies was conducted by two independent reviewers (C. B. and L. E.) who subsequently cross-checked data. A data extraction form was constructed to record individual study elements, such as study design, setting, terminology used, numbers and characteristics of student teachers and learners, study inclusion/exclusion criteria as well as the primary and secondary outcomes. Details of intervention arms, any peer teacher training provided, as well as the frequency, duration and details of teaching provided were recorded. Study outcomes were recorded and, where available, were limited to mean, standard deviation, p value, standard error, test score and the maximum possible score. The impact of peer-teaching interaction was classified using modified models of ‘Kirkpatrick's levels of learning’.27 In the event of missing or unreported data, corresponding authors were contacted and, where there was no response, contacted a second time and given 4 months to respond. The quality of the individual included studies was assessed using the Cochrane Risk of Bias Tool.28

2.5 데이터 분석
2.5 Data analysis

연구에 보고된 개입 후 평가 점수는 교육 방법의 효과성에 대한 객관적인 척도로 사용되었다. 객관식 설문지(MCQ)와 객관식 구조 임상 검사(OSCE)를 통해 학생을 평가한 경우, 가르친 자료를 검토했다. 교육에 포함된 자료가 이론적인 경우 필기 시험 결과를 연구의 주요 결과로 선택한 반면, 실용적이라면 OSCE 결과를 보고했습니다. 연속 데이터를 추출할 수 있는 경우, 95% CI의 표준화 평균 차이(SMD)가 각 연구 비교에 대해 계산되었다. 평균 또는 SD 결과가 보고되지 않은 경우 저자에게 요청하거나, 가능한 경우 답변이 없는 경우 Wan 등의 공식을 사용하여 계산했다. 
Postintervention assessment scores reported in the studies were used as an objective measure of teaching method effectiveness. Where students were assessed by both a multiple-choice questionnaire (MCQ) and an objective structured clinical examination (OSCE), the material taught was reviewed. If the material covered in teaching was theoretical, the written exam outcome was chosen as the primary outcome of the study, whereas, if practical, then the OSCE outcome was reported.29-34 Where continuous data could be extracted, the standardised mean differences (SMDs) with 95% CI were calculated for each study comparison. Where the mean or SD results were not reported, these were requested from the authors or, where possible and in the absence of a reply, calculated using the formula of Wan et al.35

또한 계획된 [하위그룹 분석]이 포함되었습니다.

  • 임상 전 의료 교육 대 임상 의료 교육에서 동료 교육의 효과 분석
  • 동료 교육이 실무/절차적 기술에 미치는 영향 분석(OSCE에 의해 평가됨) 대 이론적 지식(서면에 의한 시험에 의해 평가됨) 
  • 그리고 단기적 지식 보유와 중기적 지식 보유에 대한 동료 교육 효과 분석.

Additionally, planned subgroup analyses included

  1. analysis of effect of peer teaching in preclinical versus clinical medical education;
  2. analysis of impact of peer teaching on practical/procedural skills (assessed by OSCE) versus theoretical knowledge (assessed by written examination); and
  3. analysis of effect of peer teaching on short-term versus medium-term knowledge retention.

적절한 데이터를 추출할 수 없고, 해당 저자에게 연락하여 자료를 구할 수 없어, 메타분석에 포함되지 않은 기사는 6건이었다. 포함된 연구 사이의 이질성을 설명하기 위해 무작위 효과 모델을 사용했다. 연구 간의 이질성은 I2 테스트를 통해 평가되었다. 통계 분석은 검토 관리자에 대해 수행되었다. Stata를 사용하여 깔때기 그림을 만들었습니다. 

Six articles were not included in the meta-analysis as the appropriate data could not be extracted and could not be sourced by contacting the respective corresponding authors.36-41 We used a random-effect model to account for the heterogeneity amongst the included studies. The heterogeneity between studies was assessed with the I2 test. Statistical analyses were performed on Review Manager.42 The funnel plot was created using Stata.43

두 명의 검토자는 교육 개입의 결과를 평가하는 데 널리 사용되는 방법인 커크패트릭 프레임워크의 수정된 버전을 사용하여 각 연구의 교육적 영향을 독립적으로 평가했다. 참가자의 학습경험에 대한 인식(레벨 1), 참가자의 개입에 대한 인식 수정(레벨 2a)과 그들의 지식 및/또는 기술(레벨 2b), 직장으로의 학습 이전(레벨 3), 조직 관행의 변화(레벨 4a) 및 파티의 이익에 따른 연구를 분류한다.(레벨 4b)27 PRISMA가 권장한 선택, 성능, 소모, 검출 및/또는 보고 편향의 위험에 대한 연구도 분석되었다. 

Two reviewers independently assessed each study for their educational impact using the modified version of the Kirkpatrick framework, a widely used method of appraising the outcome of educational interventions.27, 44 It classifies studies according to the inclusion of

  • participants' perceptions of the learning experience (Level 1),
  • modification of participants' perceptions of the intervention (Level 2a) and
  • their knowledge and/or skills (Level 2b),
  • transfer of learning to the workplace (Level 3),
  • change in organisational practice (Level 4a) and
  • benefits to patients (Level 4b).27 

Studies were also analysed for risk of selection, performance, attrition, detection and/or reporting bias, as recommended by PRISMA.25

3 결과
3 RESULTS

3.1 연구의 선택
3.1 Study selection

전자 데이터베이스 검색에서 4731개의 기록을 확인했다(그림 1). 중복 제거 후, 3098개의 기록이 제목과 요약별로 선별되었고, 3033개는 포함 기준을 충족하지 못해 제외되었다. 포함된 연구의 참조 목록을 수동으로 검토한 결과 포함 대상인 다른 두 개의 연구가 확인되었다. 총 65개의 전문 기사가 적격성을 평가받았고, 38개는 제외되었다. 제외 사유는 그림 1과 같다. 체계적 검토와 정성 분석에 총 27개의 연구가 포함되었다. 이 중 21개 연구는 메타 분석에 포함하기에 충분한 데이터(각 코호트에 대해 보고된 평균 점수, SD 및 참가자 수)를 포함했다.

The electronic database search identified 4731 records (Figure 1). After removal of duplicates, 3098 records were screened by title and abstract, and 3033 were excluded for failure to meet inclusion criteria. Manual review of reference lists of included studies identified another two studies for inclusion.2932 A total of 65 full-text articles were assessed for eligibility, and 38 were excluded. Reasons for exclusion are shown in Figure 1. In total, 27 studies were included in the systematic review and qualitative analysis. Of these, 21 studies contained sufficient data (mean scores, SD and number of participants reported for each cohort) to be included in the meta-analysis.

3.2 연구특성
3.2 Study characteristics

포함할 수 있는 27개 기사는 표 S2에 요약되어 있다. 학생 2656명, 교사 225명(8개 기사 포함) 27개 연구 중 13개 연구는 임상 전 학생을 대상으로 한 반면 14개 연구는 임상 학생을 대상으로 했다. 프로그램을 설명하는 데 사용되는 용어는 매우 다양했으며 피어 트레이닝, 피어 튜터링, 피어 티칭, 니어 피어 티칭, 피어 주도 티칭, PAL 및 피어 어시스트 티칭이 포함되었습니다. 

The 27 articles eligible for inclusion are summarised in Table S2. A total of 2656 students and 225 student teachers (eight articles did not report the number of student teachers included30, 34, 38, 40, 41, 45-47). Of the 27 studies, 13 involved preclinical students as subjects, whereas 14 studies involved clinical students. Terminology used to describe the programmes varied greatly and included peer training,36, 45 peer tutoring,29, 39, 47 peer teaching,31, 32, 48-50 near-peer teaching,37 peer-led teaching,38 PAL31, 33, 34, 40, 41, 46, 51-57 and peer-assisted teaching.30, 58, 59

OSCE 결과 데이터는 17개 연구에서 사용되었고 MCQ 결과는 4개 연구에서 사용되었습니다. 13개의 연구에서, 참가자들은 여러 스터디 세션이 아닌 단일 학습 이벤트에 노출되었고, 주로 절차적 실무 기술을 가르쳤다. 지시의 빈도는 가변적이었다.

OSCE results data were used in 17 studies30-34, 37, 45-48, 50, 52, 53, 55, 57-59 and MCQ results for four studies.29, 49, 52, 56 In 13 studies, participants were exposed to a single learning event,32-34, 38, 40, 46-50, 53, 55, 59 rather than multiple study sessions, and it was primarily procedural practical skills that were taught. The frequency of instruction was variable.

3.3 편견의 위험
3.3 Risk of bias

포함된 연구의 편향 위험은 그림 2에 요약되어 있다. 12개 연구는 무작위화 방법을 보고하지 않았으며, 24개 연구는 배분이 은폐되었는지 여부를 명확하게 기록하지 못했다. 실험 참가자들의 눈을 멀게 하는 연구는 없었다. 9개의 연구에서 블라인딩에 대한 불충분한 정보가 제공되었지만, 검토된 대부분의 연구에서 검출 편향이 여전히 낮았다. 과반수는 모든 결과 데이터를 보고했고, 따라서 낮은 소모attrition 편향을 보였으며, 4개의 연구는 최종 분석에서 참가자가 제외되었기 때문에 보고 편향이 높았다. 그림 3에서 볼 수 있는 SMD의 깔때기 그림은 유의한 비대칭을 나타내며, 이는 연구가 결합된 효과 크기에 대해 대칭적으로 분포되지 않기 때문에 출판 편향을 시사한다.

The risk of bias of the included studies is summarised in Figure 2; 12 studies did not report the methods of randomisation, and 24 failed to clearly record if allocation was concealed. No studies overtly blinded participants. In nine studies, insufficient information was provided on blinding; however, detection bias remains low in the majority of studies reviewed. The majority16 reported all their outcome data and therefore had low attrition bias, and four studies had high reporting bias due to participants being excluded from the final analysis.32, 45 The funnel plots for SMD seen in Figure 3 show significant asymmetry, suggesting publication bias as the studies are not distributed symmetrically about the combined effect size.

 

 

3.4 결과의 종합
3.4 Synthesis of results

자격 기준을 충족하는 27개 연구 중 6개는 전체 코호트에 대한 적절한 측정 가능 결과의 보고 부족으로 인해 메타 분석에 포함될 수 없었다. 메타 분석에 포함된 모든 연구의 결과는 그림 4의 숲 그림에 요약되어 있다. 

Of the 27 studies meeting eligibility criteria, six could not be included in the meta-analysis due to a lack of reporting of appropriate measurable outcomes for the entire cohort. Results of all studies included in the meta-analysis are summarised in the forest plot in Figure 4.29-34, 37, 45-53, 55-59

메타 분석에 포함될 수 있는 연구 내에서 PAL에 참여하는 의대생은 비 PAL 수단으로 학습한 학생에 비해 중재 후 평가 결과가 개선되었다(SMD = 0.52 [95% CI 0.18 - 0.85]; 21개 연구, n = 2267; I2 = 93%) (그림 4). 5개의 연구에서 PAL 교습을 경험한 학생들의 중재 후 테스트 점수가 유의하게 향상되었음을 보여주었고, 15개의 연구는 유의미한 차이를 보여주지 않았으며, 1개의 연구에서는 (PAL보다) [PAL이 아닌 것이 더 나음]을 보여주었다. Z 점수는 3.02였고, 전체 p 값은 .003이었습니다. [초판 후 2020년 11월 8일 수정 추가] 이 항의 데이터 값은 이 버전에서 수정되었습니다.]

Within the studies eligible for inclusion in the meta-analysis, the medical students participating in PAL had improved results in their postintervention assessment compared with those who were taught by non-PAL means (SMD = 0.52 [95% CI 0.18 to 0.85]; 21 studies, n = 2267; I2 = 93%) (Figure 4). Five studies demonstrated significantly improved postintervention test scores for those students who had experienced PAL teaching, 15 studies showed no significant difference and one study showed that non-PAL was better than PAL. Z score was 3.02, with an overall p value of .003. [Correction added on 8 November 2020 after first publication. The data values in this paragraph have been corrected in this version.]

3.5 임상전 의대생 동료교육의 효과
3.5 Effect of peer teaching in preclinical versus clinical medical students

그림 S1A에서 볼 수 있듯이, PAL 교육은

  • [임상 학생]의 개입 후 평가 점수를 크게 향상시켰다. (SMD = 0.63 [95% CI 0.12 - 1.14]) 11개 연구, n = 1516, I2 = 95%, p 값 = 0.02, Z 점수 = 2.42)입니다. 
  • [임상 전 학생]에 대한 영향은 유의하지 않았다(SMD = 0.39[95% CI -0.04 - 0.82]; 10개 연구, n = 751, I2 = 87%, p 값 = 0.08, Z 점수 = 1.77)입니다. 

As shown in Figure S1A, PAL teaching led to a significant improvement in postintervention assessment scores of clinical students (SMD = 0.63 [95% CI 0.12 to 1.14]; 11 studies, n = 1516; I2 = 95%; p value = .02; Z score = 2.42). The impact on preclinical students was not significant (SMD = 0.39 [95% CI −0.04 to 0.82]; 10 studies, n = 751; I2 = 87%; p value = .08; Z score = 1.77). [Correction added on 8 November 2020 after first publication. The data values in the last sentence have been corrected in this version.]

3.6 동료 교습이 실제 기술 교습에 미치는 영향 대 이론적 지식
3.6 Effect of peer teaching on teaching practical skills versus theoretical knowledge

그림 S1B에서 볼 수 있듯이, PAL 교육은

  • 술기를 가르친 학생들의 중재 후 평가 점수를 크게 향상시켰다(SMD = 0.69 [95% CI 0.28 ~ 1.10]; 17개 연구, n = 1758, I2 = 94%, p 값 = .001, Z 점수 = 3.27)입니다.
  • 이론을 가르친 학생에 대한 영향은 크지 않았다(SMD = -0.11 [95% CI -0.29 - 0.06]; 
    네 가지 연구, n = 509, I2 = 0%, p 값 = .21, Z 점수 = 1.27)입니다.

As shown in Figure S1B, PAL teaching led to a significant improvement in postintervention assessment scores of students taught practical skills (SMD = 0.69 [95% CI 0.28 to 1.10]; 17 studies, n = 1758; I2 = 94%; p value = .001; Z score = 3.27). The impact on students taught theory was not significant (SMD = −0.11 [95% CI −0.29 to 0.06]; four studies, n = 509; I2 = 0%; p value = .21; Z score = 1.27).

3.7 동료교육이 단기 및 중기 지식 보유에 미치는 영향
3.7 Effect of peer teaching on short-term versus medium-term knowledge retention

중간값과 범위 학습 시점 평가는 각각 6주, 4~8주였습니다. 그림 S1C에서 보듯이,

  • 과정 완료 후 4주 이후에 테스트한 학생들은 PAL 방법(SMD = 1.20 [95% CI 0.07 ~ 2.34)으로 학습한 경우 훨씬 더 좋은 성과를 보였다. 5가지 연구, n = 659, I2 = 97%, p 값 = 0.04, Z 점수 = 2.08)입니다. 
  • 과정 이수 후 4주 이내에 평가된 학생들은 PAL 방법과 비 PAL 방법으로 학습한 경우(SMD = 0.12[95% CI -0.10 - 0.33]) 큰 차이를 보이지 않았다. 13개 연구, n = 1309, I2 = 71%, p 값 =.28, Z 점수 = 1.09)

The median and range time to point of study assessment was 6 weeks and 4 to 8 weeks, respectively. As shown in Figure S1C,

  • students tested over 4 weeks after course completion performed significantly better if they had been taught by PAL methods (SMD = 1.20 [95% CI 0.07 to 2.34]; five studies, n = 659; I2 = 97%; p value = .04; Z score = 2.08).
  • Students assessed within 4 weeks of course completion did not perform significantly differently if taught by PAL versus non-PAL methods (SMD = 0.12 [95% CI −0.10 to 0.33]; 13 studies, n = 1309; I2 = 71%; p value = .28; Z score = 1.09).

각 연구의 광범위한 교육적 영향을 평가하기 위해 수정된 커크패트릭 모델을 사용하여, 17개의 연구는 개입에 대한 참가자들의 반응을 보고했다(레벨 1), 15개의 태도 변화(레벨 2A), 26개의 기술 지식 수정(레벨 2B). 2명은 행동 변화(레벨 3), 1명은 조직 관행의 변화(레벨 4A), 그리고 참가자의 학생이나 동료의 변화(레벨 4B)에 주목했다. 리뷰에서 발견된 가장 높은 영향은 레벨 4A였다. 이는 저자들이 신체검사를 1학년까지 가르칠 때 4학년 지도교사만을 교사로 삼는 계획이 진행 중이라고 보고한 것에 의해 달성되었다. 그들은 그들의 연구에서처럼 신체검사가 성공할 것으로 예상했기 때문이다. 표 S2는 검토한 각 기사에 의해 달성된 영향 수준을 요약한다.

Using the modified Kirkpatrick model to evaluate the wider educational impact of each study,

  • 17 studies reported the reactions of participants to the intervention (Level 1),
  • 15 a change in attitude (Level 2A) and
  • 26 a modification of knowledge of skills (Level 2B).
  • Two noted a change in behaviour (Level 3),
  • one a change in the organisation practice (Level 4A) and
  • none a change amongst the participants' students or colleagues (Level 4B).

The highest impact found in the review was Level 4A. This was achieved by the authors reporting that plans were underway to only use fourth-year student preceptors as teachers when teaching physical examination to first years as they anticipated it being as successful as in their study.28 Table S2 summarises the impact levels achieved by each article reviewed.

4 토론
4 DISCUSSION

4.1 전체적인 결과
4.1 Overall outcome

이 체계적 검토의 주요 결과는 [동료들의 참여가 의대생들의 학업 성취도를 크게 향상시킨다는 것]이다. 이 연구는 21개의 PAL 프로그램을 객관적으로 평가하기 위한 정량적 척도를 배치하고, 의료 교육 내 PAL 사용 증가를 뒷받침하는 문헌에 기여한다. 
The principal finding of this systematic review is that peer involvement significantly improves medical students' academic performance. This study deploys quantitative measures to objectively assess 21 PAL programmes and contributes to the literature supporting the increased use of PAL within medical education.11, 13, 24, 60-62

2차 결과는 의대생 코호트와 PAL이 가장 유익한 맥락을 식별하려고 했다. 리뷰는 PAL이 교육의 [임상 단계에서 학생들에게 특히 유용하다]는 것을 확인했다. 학생들은 일반적으로 이 단계에서 더 독립적이며, 임상 환경에서 기술을 습득하는 데 더 많은 시간을 할애하고 교육 세션에서 더 적은 시간을 보낸다. 이러한 맥락에서 PAL의 성공은 PAL이 독립적인 학생 학습을 지원하는 데 적합한 도구라는 것을 의미합니다.
The secondary outcomes sought to identify the medical student cohorts and the context in which PAL is most beneficial. The review identified that PAL is particularly useful to students in the clinical stages of their education. Students are generally more independent at this stage, spending more time acquiring skills in clinical settings and less time at didactic teaching sessions. The success of PAL in this context implies that it is a suitable tool to support independent student learning.

또한, 연구결과는 PAL이 [practical and procedural 임상기술 교육]에 가장 적합하며, [이론적인 지식]만으로 평가한 학생에 비해, 실제 평가 결과가 크게 향상된다는 것을 보여준다. 이러한 [기술을 습득하는 것]은 의대생을 후배 의사로 만드는 데 매우 중요합니다. 분명히, [임상 과제clinical tasks]는 소그룹의 동료 보조 교육이 도움이 되며, 여기서 학생들은 그들의 기술을 연습하고 연마하면서 튜터와 동료 모두로부터 배울 수 있다. 이러한 중요한 발견을 고려할 때, 의과대학 커리큘럼은 의대생을 가까운 또래의 교육에 공식적으로 통합하는 것을 고려해야 한다. 주니어 닥터에 대한 수요가 의대생 졸업생 수를 계속 앞지르고 있고, 코호트 규모가 클수록 학교의 교육 능력 증가가 요구된다는 점을 고려하면 특히 가치가 있을 수 있다.63,64 이러한 증가된 역량은 학생들이 필요한 교육 기술을 배울 수 있도록 지원하는 한편 PAL 프로그램의 확대에 의해 제공될 수 있다. 졸업과 동시에 모든 참가자가 학습을 강화할 수 있도록 합니다.

Furthermore, findings demonstrate that PAL lends itself best to the teaching of practical and procedural clinical skills, resulting in a significant improvement in practical assessment outcomes when compared with students assessed on theoretical knowledge alone. The acquisition of these skills is critical in shaping medical students into junior doctors. Evidently, clinical tasks lend themselves to small-group, peer-assisted teaching, where students can learn both from the tutor and each other while practising and honing their techniques. Given this significant finding, medical school curricula should consider formally integrating medical students in the teaching of their near peers. This may be particularly of value given that demand for junior doctors continues to outstrip medical student graduate numbers, and larger cohort sizes demand increased teaching capacity of the schools.63, 64 This increased capacity could be delivered by the expansion of PAL programmes, while supporting students to learn teaching skills required of them upon graduating and allowing all participants to fortify their learning.6

이 리뷰는 또한 PAL이 학생의 성적에 [더 오랫동안 영향을 미친다는] 것을 확인했다. PAL에 참여하는 학생들은 수업 종료 후 [1개월 이상 경과한 후 평가]했을 때 비참가자보다 훨씬 나은 성과를 보였지만, [피어티칭 발생 직후 평가했을 때]는 개입 간에 큰 차이가 없었다. 포함된 연구는 장기적인 결과를 보고하지 않았지만, 이러한 중간 시점에서도 볼 수 있는 차이는 관심 대상이다. 정성적 연구에 따르면 PAL의 실제 경험에 영향을 미치는 [상황적 요인]이 학습 과정의 핵심이다. 이것들은 정량적으로 평가하기에는 복잡하지만, [학습에 대한 PAL의 영향]이 [중기-장기] 차원에서 확인된다는 연구의 관찰을 설명할 가능성이 높다
This review also identified that PAL has a longer lasting impact on student performance. Students participating in PAL performed significantly better than non-participants when assessed more than 1 month after the teaching ended, whereas there was no significant difference between the interventions when students were assessed shortly after teaching occurred. No included studies reported long-term outcomes, yet the difference seen even at these medium-term time points is of interest. Qualitative studies have suggested that contextual factors impacting on the lived experience of PAL are core to the learning process.65, 66 These are complex to evaluate quantitatively but likely account for our study's observation that PAL's effect on learning is seen in the medium to long term.

중기-장기 차원에서 PAL의 효과가 확인된다는 것과 연관된 사실은 다음이 있다.. 

  • 덜 공식적인 PAL 교육 환경이 뒷받침될 때 학생들의 신뢰수준이 시간이 지남에 따라 높아진다. 
  • PAL 환경의 역동적이고 상호작용적인 특성이 기억 형성에 도움이 된다.  
  • 각 학생이 질문 형성과 질문에 참여할 때, 다른 또래의 학습 과정에 노출되면 상호 이해도가 높아집니다.

PAL 프로그램이 이 실습에 참여하는 의대생들의 단기 및 장기 학업 성과에 미치는 긍정적 및 부정적 영향을 규명하기 위해 여러 연구가 이전에 모색되었다. 그들은 또한 의과대학에서 동료 교사의 장기적인 효과에 대해 어떠한 결론도 도출할 수 없다고 결정했다.

They include the fact

  • that student confidence levels increase over time when supported by the less formal PAL teaching setting,
  • that the dynamic and interactive nature of the PAL environment aids with memory formation and
  • that the exposure to other peers' learning processes as each student participates in question forming and asking leads to greater mutual understanding.6768 

Several studies have previously sought to establish the positive and negative effects that PAL programmes have on the short- and long-term academic outcomes of the medical students engaged in this practice.16, 60, 69-73 They also determined that it was not possible to draw any conclusions about the long-term effects of peer teaching during medical school.61, 62

주관적인 학생 평가를 이 검토의 범위를 벗어난 것으로 간주하여, 이러한 결과는 커크패트릭 프레임워크를 사용하여 각 연구에서 PAL의 교육적 영향을 분류할 때 통합되었다. 이전의 연구에 따라, 이러한 보건 교육 개입은 더 넓은 조직에 대한 영향이 없다는 점에서 더 높은 커크패트릭 수준(3과 4)에서 영향을 보여주지 못했다. 
Having regarded the subjective student assessments as beyond the scope of this review, those findings were incorporated when categorising the educational impact of PAL in each study using the Kirkpatrick framework.74 In line with previous research, these health education interventions failed to show impact at the higher Kirkpatrick levels (3 and 4) in that there was no impact demonstrated on the wider organisation.27, 75, 76

여기에 보고된 예비 조사 결과는 PAL 프로그램을 지원하고 장기적인 학업 성과를 지속적으로 평가하는 것의 중요성을 더욱 강조한다.

The preliminary findings reported here further underscore the importance of supporting PAL programmes and continuing to assess long-term academic outcomes.

4.2 연구의 강점 
4.2 Study strengths

이 검토의 주요 강점은 의과대학 환경에서 PAL의 영향을 객관적으로 평가한 고품질 연구에 대한 포괄적인 평가라는 것이다. PAL에 발표된 무작위 연구의 대부분에 대해 객관적 결과 측정이 보고된다. 평균과 SD를 사용할 수 없는 경우 SMD를 계산하고 데이터 집합을 극대화하기 위해 원시 데이터에 대해 작성자에게 직접 연락했다. 이를 통해 메타 분석에 11%(3/27)의 연구가 추가되었다. 또한, 이 검토는 PAL이 의료 교육을 강화할 수 있는 특정 환경에 새로운 초점을 두고 PAL의 영향을 평가하는 가장 포괄적인 체계적 검토이다.

The principal strength of this review is that it is a comprehensive assessment of high-quality studies, which have objectively assessed the impact of PAL in the medical school setting. Objective outcome measures are reported for the majority of randomised studies published in PAL. Where the mean and SD was not available, authors were contacted directly for the raw data to allow the computation of the SMD and maximise the dataset. In doing so, an additional 11% (3/27) of studies were added to the meta-analysis. Furthermore, this review is the most comprehensive systematic review evaluating the impact of PAL with a novel focus on the specific settings in which PAL may enhance medical education.

4.3 연구의 한계와 향후 연구 방법
4.3 Study limitations and future avenues of research

이 검토에는 몇 가지 본질적인 한계가 있다. 깔때기 그림(그림 3)은 연구의 유의한 출판 편향을 보여준다. 이들은 인구, 통제 그룹, 교육 환경 및 방법론이 서로 다른 고도로 이질적이었다. 추가적인 편견은 교육 시험이 그 성격상 임상시험만큼 정확하게 통제될 수 없다는 사실에서 비롯되며, 긍정적 결과 발표만을 선호하는 편향은 덜 바람직한 효과를 보이는 연구의 부재를 설명할 수 있다. 마찬가지로, 표준 오차(SE)에 대해 표시된 SMD의 깔때기 그림은 왜곡되기 쉬우며, 이는 출판 편향의 존재와 정도를 과대평가할 수 있다. 따라서 이 또한 근본적인 원인으로 배제할 수 없다.77.
This review has several intrinsic limitations. The funnel plot (Figure 3) shows the significant publication bias of the studies. They were highly heterogeneous, with different populations, control groups, educational settings and methodologies. Further bias stems from the fact that educational trials by their very nature cannot be controlled as precisely as clinical trials, and the bias in favour of publishing positive results may explain the absence of studies showing a less favourable effect. Equally, it has been found that funnel plots of the SMD plotted against the standard error (SE) are susceptible to distortion, which may lead to an overestimation of the existence and extent of publication bias—this therefore also cannot be excluded as the underlying cause.77

추가적인 한계는, 많은 연구에서 자원자를 사용했다는 것이고, 이는 높은 자기 선택 편향으로 이어졌을 수 있다. 이상적으로는, 장래의 연구에는, PAL의 개입을 실시하거나 받는 학생의 랜덤 배정이 포함됩니다.
An additional limitation is the use of volunteers in many of the studies, which may have led to a high self-selection bias. Ideally, future studies would include the random allocation of students to both deliver and receive the PAL intervention.

이 리뷰는 또한 PAL 프로그램에서 가르칠 학생으로 선택된 [의대생들에게 요구되는 교육 역량]에 대해서도 다루지 않았다. 교육 역량은 어떤 연구에서도 진정으로 통제되지 않았으며, 이에 대해 평가하거나 보고한 연구는 거의 없었습니다. 이것은 자주 연구되지 않는 PAL의 또 다른 측면과 관련되어 있습니다. PAL이 학생 교사에게 미치는 영향은 무엇입니까? PAL에 종사하는 172명의 최종 학년 시험에 대한 2014년 소급 분석에서는 이 학생들이 동시대 학생들보다 1-3% 더 우수한 것으로 확인되었으며, 12명의 해부학 PAL 튜터를 대상으로 한 2018년 비교 연구에서도 이러한 연구 결과가 뒷받침되었습니다. 이러한 연구결과는 PAL의 튜터로 하여금 주요 스킬을 강화하고 지식 통합을 강화해주기에, 튜티학생에게만 PAL의 교육적 영향이 있는 것이 아님을 시사한다. 관찰된 낮은 Kirkpatrick 수준에 반영되어 있는 이 문제를 다루는 빈약한 증거 기반에 접근하는 한 가지 가능한 방법은 학생 교사가 되는 학생들의 성과를 종방향으로 연구하는 것일 수 있다.

This review also did not address what teaching competencies are required of those medical students who choose to teach on PAL programmes. Teaching competency was not truly controlled for in any studies, and few studies assessed or reported on them. This relates to a further aspect of PAL, which is not often researched; what is the impact of PAL on the student teachers? A 2014 retrospective analysis of final-year examinations of 172 students engaged in PAL did establish that those students outperformed their contemporaries by 1–3%, and a 2018 comparative study of 12 anatomy PAL tutors supported these findings.7, 78 These findings point towards the educational impact of PAL being further reaching than on the tutees alone, with the delivery of PAL reinforcing key skillsets and enhancing consolidation of knowledge in the peer tutor. One potential means of approaching the poor evidence base addressing this question (as reflected in the low Kirkpatrick levels observed) may be to longitudinally study the performance of students progressing to student teachers.

메타 분석 결과를 해석할 때 고려해야 할 마지막 고려사항은 포함된 모든 연구의 커리큘럼, 학습 주제 및 그룹 크기에서 유의미한 이질성이다. 이는 표 S2에 표시된 데이터에서 명확하다. 의학 교육을 표준화하고 종합하는 것은 분명 어렵기 때문에 이러한 결과를 바탕으로 취해야 할 조치를 마련하는 것이 더욱 어려워진다. 우리의 2차 결과는 PAL이 가치가 있는 정확한 시나리오를 제시함으로써 이 복잡성을 인정하고 설명하려고 노력했고, 따라서 데이터의 본질적인 이질성을 감소시켰다.
A final consideration that must be taken into account when interpreting the results of our meta-analysis is the significant heterogeneity in the curricula, topics taught and group sizes of all included studies, which are clear from our data displayed in Table S2. It is clearly hard to standardise and synthesise medical education and thus also makes it more challenging to formulate actions to be taken based on these results. Our secondary outcomes sought to acknowledge and account for this complexity by teasing out the exact scenarios where PAL is of value, thus decreasing the intrinsic heterogeneity in the data.

5 결론
5 CONCLUSIONS


이 체계적인 검토는 PAL이 PAL에 참여하는 의대생들의 학업 성취에 큰 영향을 미친다는 것을 뒷받침하는 강력한 데이터를 제공한다. 이는 비 PAL 개입에 비해 의대생이 PAL 개입 후 더 나은 성과를 보였으며, 그 효과는 실제 임상 기술을 습득하는 동안 임상 연도의 학생에서 가장 두드러졌다. 이 효과는 중기적으로 유지되었다. 궁극적으로, 이 연구는 의대생 커리큘럼에 PAL의 공식 통합이 교육 능력의 개발을 지원하고 중장기적으로 유지되는 특히 임상 능력의 측정 가능한 향상을 보장한다는 고무적인 증거를 제공한다.

This systematic review provides robust data to support that PAL has a significant effect on the academic achievements of medical students who engage in it. It demonstrates that medical students performed better after PAL interventions compared with non-PAL interventions, with the effect being most pronounced in students in the clinical years of training during the acquisition of practical clinical skills. This effect was maintained in the medium term. Ultimately, the study provides encouraging evidence to suggest that the formal integration of PAL in medical student curricula supports both the development of teaching skills and confers a measurable improvement in academic performance, particularly in clinical skills, which are maintained in the medium to long term.

 

 


Med Educ. 2022 Apr;56(4):365-373.  doi: 10.1111/medu.14672. Epub 2021 Oct 24.

Peer-assisted learning in medical education: A systematic review and meta-analysis

Affiliations collapse

Affiliations

1Warwick Medical School, University of Warwick, Coventry, UK.

2Torbay and South Devon NHS Foundation Trust, Torquay, UK.

PMID: 34595769

DOI: 10.1111/medu.14672

Abstract

Objectives: The prevalence of peer-assisted learning (PAL) featuring alongside the core medical curriculum is increasing; however, the evidence base for PAL's efficacy on academic performance is limited. This systematic review of randomised studies of PAL in medical school sets out to assess the impact of PAL on academic outcomes in medical school and evaluate whether PAL confers a benefit in specific educational contexts.

Methods: A literature search was conducted across MEDLINE, Ovid Embase, Web of Science and Education Research Complete. Titles and abstracts were screened, and records were selected following strict eligibility criteria. Following full-text assessment for eligibility, two reviewers independently extracted data from the final selection of records and a meta-analysis was performed. Studies were classified using a modified version of Kirkpatrick's levels of learning. Student test scores were standardised by calculating the standardised mean difference (SMD).

Results: Twenty-seven randomised controlled trials were eligible for inclusion, and twenty-one provided sufficient and complete data to enable meta-analysis. There was a significant improvement in the academic performance of medical students who received PAL compared with those in the control group (SMD = 0.52 [95% confidence interval 0.18-0.85]; p = .003). The impact of PAL was greater amongst clinical medical students (SMD = 0.63; p = .02) than preclinical medical students (SMD = 0.39; p = .08) and when used for teaching practical skills (SMD = 0.69; p = .001) compared with theory (SMD = -0.11; p = .21). Students taught by PAL also achieved better results in assessments conducted more than four weeks after course completion (SMD = 1.20; p = .04). [Correction added on 8 November 2020 after first publication. The data values in the Results section have been corrected in this version.] CONCLUSIONS: Medical students experiencing PAL benefit in terms of academic performance, relative to those not receiving PAL. PAL is of greatest value in the clinical stages of training and for practical skills. The long-term outcomes of PAL remain a priority for future research.

수행능력저하를 믿지 않는 것에서 실패를 인식하기까지: 티핑 포인트 모델(Med Educ, 2021)
The shift from disbelieving underperformance to recognising failure: A tipping point model
Andrea Gingerich1 | Stefanie S. Sebok-Syer2 | Lorelei Lingard3 | Christopher J. Watling3

 

1 도입
1 INTRODUCTION

[Fail해야하는 수련생을 만나는 것]은 많은 감독관들에게 엄중한 시험이다. 슈퍼바이저가 테스트에 어떻게 반응하는지는 훈련생에게 매우 중요하며 치명적일 수 있습니다. 또, 업무량이나 감정에 미치는 영향을 생각하면, Fail을 보고하는 감독관에게도 영향이 크다. 부정적인 후폭풍을 먼저 고려한다면, 수습생의 실적 실패를 보고하지 않는 것은 평가 프로세스에 참여하는 것을 꺼리는(또는 원치 않는) 것으로 간주됩니다. 이에 대응하기 위한 방법으로 양식을 수정하는 것부터, 시스템을 재구성하는 것에 이르기까지 다양한 변화들이 평가 디자인에 통합되었다.

  • [평가 양식 수준의 대응책]으로는 부정적인 평가 판단을 기록하는 더 힘든 작업을 피하기 위해 [감독관이 실습생에게 제공한 면밀한 감독을 기록하도록 하는 것]이 포함된다. 예를 들어, 감독자는 O-SCORE(Ottawa 수술 능력 수술실 평가) 척도의 '설득' 등급을 선택하는 것을 Mini-CEX(Mini Clinical Evaluation eXercise) 척도의 '불만족' 등급을 지정하는 것보다 덜 꺼릴 수 있습니다.
  • [평가 시스템 수준의 대응책]은 평가 데이터 제공자 및 진행 의사결정자로서 동시에 기능해야 하는 압박을 완화하기 위해 [평가 순간을 의사결정 순간과 분리하는 프로그램적 평가 접근법]을 포함한다. 예를 들어, 감독자는 다른 많은 평가와 결합되어 진행 결정을 내리기 위해 다른 이해관계자가 사용하는 저부담 평가에 대해 추가적인 개선이 필요한 영역을 덜 꺼릴 수 있으며, 훈련 중인 평가 보고서 하나를 제출하여 수습자의 진행을 중단시키는 것보다 덜 꺼릴 수 있다.

Coming face to face with a trainee who needs to be failed is a stern test for many supervisors. How supervisors respond to the test is highly consequential, and potentially catastrophic, for the trainee. It can also be consequential for the supervisor, many of whom report workload and emotional repercussions that interfere with assessment demands.1-6 When negative repercussions are prioritised, not reporting a trainee's failing performance becomes framed as reluctance1, 6-19 (or even unwillingness)20, 21 to engage in the assessment process. In response, countermeasures to reluctance have been incorporated into assessment designs with changes that range from revised forms through to reconfigured systems.

  • Countermeasures on assessment forms include having supervisors record the close supervision they provided for a trainee during a task to avoid the more daunting task of recording negative evaluative judgements.22 For example, supervisors may be less reluctant to select the ‘talk them through’ rating on an O-SCORE (Ottawa Surgical Competency Operating Room Evaluation) scale23 than to assign an ‘unsatisfactory’ rating on a Mini-CEX (Mini Clinical Evaluation eXercise) scale.24 
  • Countermeasures in assessment systems include the programmatic assessment approach of separating assessment moments from decision moments to relieve the pressure of simultaneously functioning as the assessment data provider and the progression decision maker.25 For example, supervisors may be less reluctant to note domains requiring further improvement on a low stakes assessment that is combined with many other assessments and used by other stakeholders to make progress decisions,26 than to stop a trainee's progression by submitting a single ‘unsatisfactory’ in-training evaluation report.27 

그러나 이러한 대응책은 여전히 개별 감독관이 평가 데이터와 유사한 개인으로 구성된 위원회가 교정조치 의무화, 진행 변경 또는 프로그램 연습생 퇴출에 큰 위험을 수반하는 결정을 내릴 때 중요한 의견을 제공한다. 다양한 대책을 시도한 것의 증거는 긍정적이지만, 여전히 [관습적 tick-boxing]이나 [토큰 코멘트]가 확인되고, 이는 중요한 평가 정보가 항상 제공되지는 않을 수 있음을 시사한다. 

However, these countermeasures still rely on individual supervisors to provide critical comments as assessment data and committees composed of similar individuals to make high stakes decisions to mandate remediation, alter progression, or remove a trainee from a programme. Although early evidence from the implementation of various countermeasures is promising,28-30 findings of bureaucratic tick-boxing and token comments suggest that important assessment information may not always be provided.28, 30-32

[수련생을 fail시키는 것에 대한 감독관의 거부감]을 탐색하는 이전 작업은 감독관에 의해 보류된 평가 정보를 수집하기 위한 해결책을 찾는 데 도움이 됩니다.

  • [프로세스의 초기 단계]는 실패가 감지되고, 특징지어지고, 확인되는 중요한 순간이지만, 여기에 대한 관심은 적습니다.
  • 최근의 작업에서는, 상사가 어떻게 실적이 저조한 연수생을 인식하는지를 보다 잘 이해하려고 노력했습니다.또, 상사가 예기치 않은 실적 저하의 징후에 직면했을 때에, 불신하는 시기phase of disbelief을 특정했습니다.
    • 이러한 불신disbelief은 수행능력이 저조한 훈련생을 만났을 때의 놀라움이나 당혹감과 관련이 있다.
    • 수행능력이 저조한 간호대생에 대해 간호교사가 경험하는 불안하고 불편한 직감과 현저하게 유사했다.
    • 감독관은 수련생을 의심하기도 하지만, 흔히 그렇듯이, 그들은 또한 그들이 목격한 것을 이해하기 위해 추가적인 관찰을 수집하는 경향도 있었다.
  • [불신하는 것]에서 [수행능력 저하를 인정하는 것]으로의 이행은 수련생(또는 수련생의 부족한 영역)이 교육에 얼마나 반응하는지에 따라 결정되며, 동시에 계속적이고 강화된 감독 노력이 무의미할 것이라는 깨달음과 일치한다.
  • 그러나, [수행능력 저하의 불신]에서 [실패의 인정]으로의 전환은 충분히 탐색되지 않았다.

Previous work exploring supervisors' reluctance to fail trainees helpfully invites solutions for gleaning assessment information withheld by supervisors.1, 2, 16, 19, 20, 33, 34 Less attention has been directed to earlier phases of process—those critical moments where failure is noticed, characterised and confirmed. In recent work, we sought to better understand how supervisors recognise trainees who are underperforming and we identified a phase of disbelief as supervisors encountered unexpected signs of underperformance.35 This disbelief was related to surprise or bewilderment at encountering an underperforming trainee and was strikingly similar to the unsettling and uncomfortable gut feelings experienced by nursing instructors while interacting with underperforming nursing students.36 Although supervisors tended to give the trainee the benefit of the doubt, as is common,6, 8, 12, 16, 37, 38 they were also inclined to gather additional observations to make sense of what they were seeing.35, 36 The shift from disbelieving to recognising underperformance hinged on perceiving how responsive the trainees (and the deficits) were to teaching and coincided with a realisation that continued, intensified supervisory efforts would likely be futile.35 However, the shift from disbelieving underperformance to recognising failure has been underexplored.

이러한 변화는 결국 [실패의 증거를 보고할 것인지에 대한 의사결정]을 초래하는 더 큰 과정 내에 존재하는 특정한 측면이지만, 평가 프로세스에 대한 참여를 개선하기 위해서는 이해하는 것이 매우 중요합니다. 실패는 드문 일이기는 하지만 실제로 일어났을 때는 매우 중요하며, 발생했어야 했지만 발생하지 않았을 때는 더욱 중요하기 때문에 신중한 연구가 필요합니다. 따라서 본 연구에서는 다음과 같은 질문을 합니다. 슈퍼바이저는 Failure를 어떻게 인정하게 되는가? 특히, [수행능력 저하의 초기 징후를 믿지 않는 것]으로부터 [수련생의 실패를 인정하는 것]으로의 이행에 대해 검토하기 위해서, 가장 역량이 저조한 수련생과 협업한 경험을 설명하도록 감독자를 초대했다.
Although this shift is a specific aspect within the larger process that eventually results in decisions about reporting evidence of failure, it is a critical aspect to understand in order to improve engagement in assessment processes. While failure is admittedly rare, it is so consequential when it does occur—and perhaps even more so when it should have occurred but does not—that it demands careful study. Therefore, in this study we ask the question: How do supervisors recognise failure? In particular, we invited supervisors to describe their experiences working with the least competent trainees to examine the shift from disbelieving early signs of underperformance to recognising failure.

2 방법
2 METHODS

2.1 개요
2.1 Overview

이 연구는 감독관들이 [무역량incompetence을 보여주는 훈련생들을 어떻게 평가하는지]를 조사하는 연구 프로그램 내에 위치하고 있다. 우리의 초기 연구는 특별히 실패를 인식하는 데 초점을 맞추지 않았다. 그러나 우리는 장기간의 교정조치 및 프로그램에서 해고되는 동안 심각한 underperformance을 인식하는 것과 관련된 몇 가지 주제를 식별했다. 그 후 목적적이고 이론적인 표본 추출을 사용하여 의사 상사의 추가 모집과 함께 이러한 연구되지 않은 주제를 조사했다. 이와 같이, 이 연구는 감독관이 저조한 성과를 인식하는 방법을 탐색하기 위해 이전에 수집된 데이터와 새로운 데이터를 결합하여, underperforming 훈련생이 진급하도록 둬서는 안 되며, 유급시킬 필요가 있다는 것을 어떻게 인식하는지 더 잘 탐색한다. 실적 저하의 불신의 징후에서 실패를 인식하는 것으로의 이행에 초점을 맞추고 있는 것은, 상사가 다른 사람과 교류하면서 어떻게 생각하는지를 연구하는 것입니다. 우리는 구성주의 기반 이론 방법론(CGT)을 사용하여 개별 감독자가 사회적 맥락의 규칙과 기대에 따라 다른 감독자와 상호작용할 때의 경험에 초점을 맞추도록 데이터 수집과 분석을 안내했다. 이 프로젝트는 Northern British Columbia 대학의 연구 윤리 심사 위원회로부터 승인을 받았습니다.

This study is situated within a programme of research investigating how supervisors assess trainees who demonstrate incompetence. Our earlier study was not focused specifically on recognising failure; however, we identified some themes related to recognising profound underperformance during prolonged remediation and dismissals from programmes. We subsequently investigated these underexplored themes with additional recruitment of physician supervisors using purposive and theoretical sampling. As such, this study combines data collected previously to explore how supervisors recognised underperformance with new data collected to better explore how they recognised that an underperforming trainee should not be allowed to progress and needed to be failed. Our focus on the shift from disbelieving signs of underperformance to recognising failure involves studying how supervisors think while interacting with others. We used constructivist grounded theory39 methodology (CGT) to guide data collection and analysis to focus on the experiences of individual supervisors as they interact with others according to the rules and expectations of social contexts. This project received approval (E2018.0613.065) through the University of Northern British Columbia's research ethics review board.

2.2 참가자 및 모집
2.2 Participants and recruitment

2018-2019년에 캐나다 브리티시 컬럼비아의 비수술 전문 분야 의사 22명을 인터뷰한 결과, 학습에 관여할 수 없거나 학습에 관여하지 않아 불안정한 진행이 정체된 것으로 나타났다. 앞에서 기술한 바와 같이, 우리는 추가적인 데이터 수집에 관여함으로써, 감독관이 현저하게 실적이 저조한 훈련생과 어떻게 작업하고 있는지, 그리고 훈련생의 성과가 실패했을 때 어떻게 그들이 인지하게 되는지에 대한 이해를 깊게 하기로 결정했다. 원참가자 대부분이 여성이고 모두 비외과 전문직이었기 때문에, 우리는 남성참가자와 외과 및 시술 우위의 전문직 종사자를 대상으로 신규 모집 노력을 집중했다. 우리는 주요 정보 제공자와 눈덩이 표본을 사용하여 4년제 의과대학 프로그램 또는 대학원 레지던트 프로그램 중 하나에서 임상 환경에서 훈련생에게 실패하거나 교정한 경험이 있는 의사를 식별하고 초대했다. 우리는 다양한 전문성, 임상 환경 및 관점의 변화를 극대화하기 위해 주 전역에 분산된 수많은 브리티시컬럼비아 대학(UBC) 의학부 사이트에서 감독에 대한 다양한 수준의 경험을 가진 참가자를 찾았다. 

In 2018–2019, we interviewed 22 physicians from non-surgical specialties in British Columbia, Canada, and characterised underperformance as stalled progression due to the inability to engage in learning or precarious progression due to unwillingness to engage in learning.35 As noted previously, we decided to deepen our understanding of how supervisors experience working with markedly underperforming trainees and how they come to recognise when a trainee's performance merits failure, by engaging in additional data collection. Since the majority of the original participants were female and all were from non-surgical specialties, we concentrated new recruitment efforts on male participants and those from surgical and procedurally dominant specialties. We used key informants and snowball sampling to identify and invite physicians with experience failing or remediating trainees in the clinical setting, in either the 4-year medical school programme or in one of the postgraduate residency programmes. We sought participants with varying levels of experience with supervision from diverse specialties, clinical settings and numerous University of British Columbia (UBC) Faculty of Medicine sites distributed across the province to maximise variation in perspectives.

2019년 5월부터 2020년 1월 사이에 20명의 의사(남성 7명)를 추가로 모집하고 면접했으며, 이 중 13명이 외과 또는 프로시져 중심의 전공 출신이었다. 따라서 최종 참가자 샘플은 17개 전문분야를 대표하는 42명(남성 11명)의 참가자로 구성되었다. 총 28명의 참가자는 의료 전문 분야(예: 가정의학, 내과, 정신의학, 종양학)였고, 14명의 참가자는 외과 또는 시술 지배적 전문 분야(예: 정형외과, 산부인과 및 산부인과 및 응급의학)였다. 농촌, 북부, 원격 지역사회에서 실습한 참가자(20명)  또는 캐나다 브리티시컬럼비아주의 대도시(22명)에서. 임상 감독관 역할의 모든 경험을 공유했습니다.또한 17명의 참가자가 리더 역할의 경험을 공유했습니다. 리더십 역할의 경험에는, 큰 리스크의 진행에 관한 의사결정에 공헌했습니다. 대다수의 사람들은 그들의 리더 역할을 'programme director'라고 명명했고, 우리는 그들의 정체성을 보호하기 위해 이 용어를 모든 리더 역할을 지칭하는 데 사용합니다.

Between May 2019 and January 2020, we recruited and interviewed an additional 20 physicians (7 male) of whom 13 were from surgical or procedure-dominant specialties. The final participant sample thus consisted of 42 participants (11 male) representing 17 specialities/subspecialties. A total of 28 participants were from medical specialities (e.g. family medicine, internal medicine, psychiatry, medical oncology), and 14 participants were from surgical or procedure-dominant specialties (e.g. orthopaedics, obstetrics and gynaecology and emergency medicine). Participants practised in rural, northern and/or remote communities (20); or in large metropolitan cities (22) in the province of British Columbia, Canada. All shared experiences from a clinical supervisor role; 17 participants also shared experiences from a leadership role that involved contributing to high stakes progression decisions. The majority named their leadership role ‘programme director’, and to protect their identity, we use this term to refer to all of the leadership roles.

2.3 데이터 수집
2.3 Data collection

CGT 방법론에 따라 인터뷰 프로세스에 대해 반복적인 접근법을 취했습니다. 처음 22번의 인터뷰에서는 임상 작업장에서 실적이 부진한 연수생을 감독한 경험을 모집하는 것으로 시작했습니다. 'incompetent'과 'incompetence'라는 용어의 사용에 대한 부정적인 반응으로 인해, 우리는 다양한 용어를 시도하고, 성과가 낮은 훈련생에 대한 대화를 이끌어내기 위해 촉구했습니다. 고군분투하는 훈련생과 저조한 훈련생에 대한 충분한 데이터가 있었기 때문에, 후자의 20개의 인터뷰는 실패를 고려해야 할 상황을 가장 많이 나타낼 가능성이 있는 극단적인 성과 저하의 사례에 초점을 맞췄습니다. 인터뷰 질문은 참가자들을 초청하여 의대생과 레지던트들을 감독한 경험을 공유하도록 했다. 이들은 상당히 성과가 저조하고 광범위한 교정조치가 필요했으며 징계조치를 발동했거나 프로그램 탈퇴를 요구받았어야 했다.

Following CGT methodology, we took an iterative approach to the interview process. We began by inviting experiences with supervising underperforming trainees in the clinical workplace in the first 22 interviews. Due to negative reactions to our use of the terms ‘incompetent’ and ‘incompetence’,35 we tried various terms and prompts to elicit conversation on underperforming trainees. As we had sufficient data describing struggling and underperforming trainees, the latter 20 interviews focused on the more extreme cases of underperformance that had the most potential to be indicative of situations where failure should be considered. Interview questions invited participants to share their experiences supervising medical students and residents who profoundly underperformed, required extensive remediation, invoked disciplinary actions or were asked (or should have been asked) to leave the programme.

분석은 반복적 사이클을 통해 데이터 수집에 정보를 제공하였다. 부록 1에서 설명한 바와 같이, 반구조적인 인터뷰 가이드의 4회 반복은 매우 성과가 없는 훈련생에 대한 풍부한 설명을 도출하는 데 초점을 맞추고 있습니다. 

  • 슈퍼바이저에게 미치는 실질적인 영향에 대한 대화를 강조하기 위해 
  • 불합격 훈련생에 대한 경험을 말로 표현하도록 감독관에게 장려하고 
  • 불합격 또는 불합격하지 않은 훈련생에 대한 설명을 초대합니다. 

인터뷰는 평균 51분(37~68분 범위)을 전화 또는 직접 실시했으며, 음성녹음, 전문 전사자에 의해 기록되고 분석 전에 비식별되었다. 

Analysis informed data collection through iterative cycles. As depicted in Appendix 1, the four iterations of the semi-structured interview guide evolved from a focus on eliciting rich descriptions of profoundly underperforming trainees,

  • to emphasising conversation about the substantial impacts on the supervisor,
  • to encouraging supervisors to put their experiences with failing trainees into words and
  • through to inviting descriptions of failing, or not failing, underperforming trainees.

Interviews averaged 51 min in duration (ranging from 37–68 min) were conducted by telephone or in-person, audio-recorded, transcribed by a professional transcriptionist and de-identified prior to analysis.

2.4 데이터 분석
2.4 Data analysis

  • 불합격 훈련생과 관련된 최초 22개 면접에서 식별된 예비 코드는 후속 면접을 위한 데이터 수집에 사용되었습니다.
  • 주요 주제와 개념에 라벨을 붙인 초점focused 코드를 식별하기 위해 분석된 3~6개의 인터뷰 사이클마다 후속 20개의 인터뷰 분석이 반복되었다.
  • 전체 연구팀은 매 주기 후에 만나 인터뷰 데이터에 대해 논의하고, 테마를 식별하며, 감독관의 Failure 인식과 인식된 failure에 대한 대응에 라벨을 붙인 진화하는 코드를 수정했다.
  • CGT에 따르면, 우리는 참가자가 공유한 콘텐츠, 사용하는 언어, 그리고 그 정보를 공유하는 방법에 주의를 기울임으로써 발전된 참가자의 관점에 대한 우리의 이해에 라벨을 붙임으로써 데이터에서 무슨 일이 일어나고 있는지를 정의하기 위해 코드를 사용했다.40 
  • 상세한 언어 분석을 완료하지는 않았지만, 우리는 문자록의 두드러진 언어적 특징을 코드화하고, 음성으로 볼륨, 망설임, 감정을 코드화하기 위해 녹음을 들었다.
  • 42개의 스크립트 세트 전체에 걸쳐 지속적인 비교를 사용하여 코드를 재방문, 확장 및 개선했습니다.
  • 코딩 프레임워크는 인터뷰 38회 이후 데이터를 충분히 요약하였고, 마지막 4개의 인터뷰는 식별된 개념을 보강, 상세화, 명확화하는 데 사용하였다. 
  • 그런 다음 이론 코드를 식별하기 위해 집중된 코드로 나타나는 링크와 패턴을 논의했다. 이론 코드는 데이터를 넘어서도 여전히 기초가 되는 해석을 나타냅니다.40
  • The preliminary codes identified in the first 22 interviews that pertained to failing trainees were used to inform data collection for the subsequent interviews.
  • Analysis of the subsequent 20 interviews continued iteratively with each cycle of 3–6 interviews analysed to identify focused codes that labelled the major themes and concepts.
  • The full research team met after each cycle to discuss the interview data, identify themes and modify the evolving codes that labelled supervisors' recognition of failure and responses to recognised failure.
  • As per CGT, we used the codes to define what was happening in the data by labelling our understanding of the participants' perspectives that was developed by attending to the content that they shared, the language they used and how they shared that information.40 
  • Although we did not complete a detailed linguistic analysis, we did code for salient linguistic features41 in the transcripts and listened to the recordings to code for volume, hesitation and emotion in the spoken words.
  • We used constant comparison across the entire set of 42 transcripts to revisit, expand and refine the codes.
  • The coding framework sufficiently summarised the data after 38 interviews with the last 4 interviews reinforcing, elaborating and clarifying the identified concepts.
  • We then discussed the links and patterns represented by the focused codes to identify theoretical codes. The theoretical codes represent an interpretation that extends beyond, and yet is still grounded in, the data.40

CGT에서, 의미는 연구자들의 다양한 관점과 참여자 및 데이터와의 상호작용을 통해 구성된다. 따라서, 우리 팀은, 지도·임상 학습 상황(AG, CW, LL), 평가·평가자(AG, SS-S), 사회인지(AG), 언어학(LL), 대학원장(CW)으로서 연수생을 감독하고, 감독자를 감독하는 생활 경험(생계)에 의한 전문지식 분석을 실시했습니다.

In CGT, meaning is constructed through the differing perspectives of the researchers and through their interaction with the participants and the data.40 As such, our team engaged with analysis drawing on their expertise with studying supervision and clinical learning contexts (AG, CW, LL), assessment and raters (AG, SS-S), social cognition (AG), linguistics (LL) and lived experience supervising trainees and overseeing supervisors as postgraduate dean (CW).

토론에서는 각 연구자의 관점이 데이터 해석에 어떻게 기여했는지에 대한 성찰성reflexivity이 포함되었다. 예를 들어, 팀의 한 구성원은 처음에 학습자로서, 그 다음에는 감독자로서, 그 다음에는 리더로서 의학 교육을 경험했습니다. 그는 학습자로서는 실패나 교정을 경험하지 않았지만, 감독자로서, 그리고 교육 프로그램의 감독 책임을 지는 리더로서도 경험했습니다. 그는 자신의 경험을 연구팀과 공유했고, 우리는 학습자를 지원하는 교육 책임과 안전한 경우에만 학습자가 진보할 수 있도록 하는 사회적 책임 사이의 긴장에 대해 정기적으로 성찰했다. 팀의 비임상사들은 이러한 긴장감을 더욱 맥락화하기 위해 환자와 환자의 가족으로서의 기대와 교육자로서의 경험을 성찰했다.

Discussions included reflexivity on how each researcher's perspective contributed to interpretation of the data. For example, one member of team has experienced medical training first as a learner, then as a supervisor and then as a leader. While he did not experience failure or remediation as a learner, he did as a supervisor and even more so as a leader with responsibility for oversight of training programmes. He shared his experiences with the research team, and we reflected regularly on the tension between the educational responsibility to support learners and the social responsibility to ensure that learners only progress if it is safe for them to do so. The non-clinicians on the team reflected on their expectations as patients and as family members of patients, as well as on their experiences as educators, to further contextualise this tension.

성찰성 토론은 집행된 연구 방법에 대해서도 정밀히 조사했다. 예를 들어, 우리는 음성 인터뷰 질문이 참가자들이 특정 언어를 사용하거나 특정 반응을 이끌어내지 않았는지 확인하기 위해 녹취록을 검토했다. 메모는 데이터 수집에 관한 결정을 기록하고 감사 추적 역할을 하기 위해 사용되었습니다. 분석 과정 동안 데이터에 대한 우리의 진화된 이해를 기록하기 위해 메모를 사용했습니다. 데이터 관리 및 코딩에는 NVivo 소프트웨어 버전 11(QSR International Pty Ltd, Chadstone, Victoria, Australia)을 사용했습니다.

Reflexivity also included scrutiny of the enacted research methods. For example, we reviewed transcripts to verify that the spoken interview questions did not lead participants to use particular language or elicit specific reactions. We used notes to record decisions regarding data collection and to serve as an audit trail. We used memos to record our evolving understanding of the data during the analytic process. We used NVivo software version 11 (QSR International Pty Ltd, Chadstone, Victoria, Australia) for data management and coding.


참가자는 전문을 내과계열의 경우 'M' 또는 외과계열 또는 시술중심 계열의 경우 'S'로 표기하고, 그 뒤에 면담 순서를 나타내는 번호를 붙인다.

Participants are referred to by a letter to indicate their specialty as ‘M’ for medical or ‘S’ for surgical or procedure-dominant followed by a number to indicate their interview sequence.

3 결과
3 RESULTS

상사의 경험에 따르면, 실패를 인식하는 것은 실패를 나타내는 '의심할 수 없는' 직장에서의 성과 실패 패턴을 감지함으로써 '의심의 이점'을 극복하는 것이다. 우리는 우리의 조사와 관련된 세 가지 측면에 대한 조사 결과를 제시한다.

  • 먼저, 실패를 나타내는 연습생의 performance 패턴patterns 을 기술함으로써 실패로 인식되는 것을 제시한다.
  • 그런 다음, 성적 부진한 훈련생과 함께 작업한 경험과 실패를 인식하면서 감독관들이 어떻게 감정을 표현하는지express emotion  제시한다.
  • 마지막으로, 실패에 대한 인식이 슈퍼바이저와 슈퍼바이저-트레이닝의 관계를 넘어 동료와의 검증 및 합의 구축building consensus 에 어떻게 영향을 미치는지 제시합니다.

According to supervisors' experiences, recognising failure involves overcoming the ‘benefit of the doubt’ by detecting patterns of failing performance in the workplace that are ‘beyond a doubt’ indicative of failure. We present the findings for three interrelated aspects of our inquiry:

First, we present what is recognised as failure by describing the patterns of trainee performance indicative of failure.

Then, we present how supervisors express emotion while recounting their experiences of working with underperforming trainees and recognising failure.

Finally, we present how recognition of failure extends beyond the supervisor and supervisor-trainee relationship to involve verifying and building consensus with colleagues.

3.1 패턴 식별
3.1 Identifying patterns

의료 및 외과 전문 분야의 감독자들은 성적이 저조한 훈련생들을 처음 접했을 때, "기본적인" 기술인 "최소한의 일"을 할 수 없는 고년자 레지던트들을 "이해할 수 없었다"고 불신하는 단계를 묘사했다(S35). 프로그램 디렉터는 감독관이 "교대 2일째"에, 예를 들어 레지던트 프로그램에 전념하고 있는 지적으로 여겨지는 훈련생이 실적이 저조하다는 것을 알게 되었을 때 "믿을 수 없다"고 말할 것이라고 말했습니다(M26). 
나는 앉아서 환자들에게 그녀의 설명을 들었다. 나는 부정확한 정보에 놀랐다. 정보의 전달 방법에 놀랐다(S30). 그들은 이 단계에서 훈련생에게 의심을 품게 되었지만, 그들이 보고 있는 것을 이해하려고 노력했기 때문에 관찰 내용을 문서화하는 것을 거부했습니다.

Supervisors across medical and surgical specialties described a phase of disbelief when first encountering underperforming trainees: ‘it's just baffling to me’ when upper year residents cannot do ‘some bare minimum things’ that are ‘basic’ skills (S35). Programme directors shared that supervisors called them “on day two of the rotation and they will say ‘I just can't believe this’” (M26) when they discovered, for example, that a trainee who was considered to be intelligent and dedicated to the residency programme was underperforming: ‘I sat down and listened to her explanation to the patients. I was surprised with the inaccuracy of information. I was surprised with the way the information was delivered’ (S30). They gave the trainee the benefit of doubt during this phase and resisted documenting observations as they were trying to make sense of what they were seeing:

'제가 말씀드렸듯이, 그가 과도기를 거치고 적응하는 것을 제가 좀 더 일찍 제안했던 적이 있습니다. 왜냐하면 저는 그것이 제가 공식적인 평가를 해야 할 기준을 충족시키지 못한다고 느꼈기 때문입니다. 우리는 항상 그 후에 이야기했지만, 그 상호작용을 꼭 문서화하지는 않았다.' (S42)
‘There were some times early on where I kind of put it up to, as I say, him going through that transition phase and kind of settling in, if you will, because I just felt like it didn't quite meet the bar that I needed to trigger a formal assessment. We always talked about things afterwards but not to necessarily write it down on paper with those interactions.’ (S42).


[underperformance를 불신하게 하는 징후]에서 [실패를 인식하는 것]으로의 전환하는 과정에는 반드시 [실패를 보여주는 underperformance의 식별]을 감독관이 수행해야 하는 필요성이 포함된다. 이들은 사고 발생 빈도, 일관성 및 규모를 수치화하여 고장을 특징지었다. 
「내가 몇번이나 보여주려고 했던 방식대로 하지 않는 것을 반복한다」(S35). 프로그램 디렉터는 피드백을 받았음에도 불구하고 여러 감독관의 보고서를 통해 실패를 수량화함으로써, 종종 서로 다른 맥락으로 다른 사건을 기술함으로써 유사한 특징을 보였다. 즉, '반복적인 순환이 그와 함께 어려움을 겪고 있다'(S28), '나는 사람들이 [프로그램으로 보고한 모든 구두 불만을 정리했다.이 10쪽짜리 편지를 썼어' (M29) 그 때문에, 「패턴을 찾을 수 없었다」(S25)는 「실패는 한 번만 일어난 것이 아니다」(S25)와 함께, 「어떤 이유에서는 말할 수 없다」(S30), 「감독이 불가능하다」(M36), 「완전히 이해할 수 없다」(M6), 「배우는 능력이 없다」(S34), 「절대로 배우지 못할 것이다」(10)라고 판단한다.

The shift from disbelieving signs of underperformance to recognising failure necessarily includes the need for supervisors to identify underperformance that is representative of failure. They characterised failure by quantifying its frequency, consistency and magnitude across incidents: ‘repeatedly not doing something the way that I tried to show them numerous times how to do it’ (S35). Programme directors similarly characterised failure by quantifying it through reports from multiple supervisors, often in different contexts, describing different incidents, over time, despite receiving feedback: ‘repeated rotations having difficulty with him’ (S28) and ‘I compiled all the verbal complaints that people had [reported to me as program director] and wrote him this 10 page letter’ (M29). Therefore, recognising failure hinged on finding ‘a pattern, it didn't just happen once’ (S25) along with a determination that the trainee is ‘for some reason unteachable’ (S30), ‘unsupervisable’ (M36) and ‘completely unfixable’ (M6) because ‘they just couldn't do it’ (S34) and ‘just couldn't learn’ (M10) ‘so they're not going to learn it’ (M13).

실패가 어떻게 인식되는지에 대한 설명에서 압도적인 증거, 엄청난 오류외부인으로부터 얻은 통찰이라는 세 가지 패턴을 식별했다. 

We identified three patterns within the descriptions of how failure was recognised: overwhelming evidence, egregious error and outsider's insight.

[압도적인 증거 패턴]은, 「지속적인 곤란」과 「부적절한」기술의 반복 시연(S24)을 특징으로 하고, 「그때까지 빵과 버터의 아이템으로서 익혔어야 했다」(M10). 패턴은 특정 도메인으로 제한되거나 글로벌할 수 있습니다. 
「전면, 준비중도 아니고, 관여중도 아니고, 기술력도 없다」(S35). 이것은 감독관과 프로그램의 압도적인 증거의 패턴이었다: '나와 모든 사람들이 그와 그의 능력에 대해 매우 우려할 정도로 그의 일을 정말로 하기에는 다면적인 실패가 있었다.' (S34).

The overwhelming evidence pattern features ‘persistent difficulty’ and ‘repeated demonstration of inadequate’ skills (S24) that the trainee ‘should've learned by then as a bread and butter item’ (M10). The pattern could be restricted to particular domains or be global: ‘it's the whole picture, it's not being prepared, it's not being engaged, it's not having any technical skills’ (S35). This was a pattern of overwhelming evidence compelling action from the supervisor and the programme: ‘there was a multifaceted failure on his part to really do the job to the point where I and everyone was very concerned about him and his abilities [… he was] the one we failed.’ (S34).

[심각한 오류 패턴]에서는 failure 인식은 당황스러운 오류 또는 누락의 발견으로 촉발되었습니다. 핵심 기술을 수반하는 대규모 사고 하나만으로도 이전에 성적이 저조하다고 분류되지 않은 훈련생에게도 실패를 나타내는 데 충분할 수 있습니다. 
「긴급하게도, 실제로는 나쁜 오퍼레이터는 아니고, 매우 좋은 사람이었습니다만, 나에게 있어서 너무나 명백하고 괴상한 것을 빠뜨린 것은, 큰 레드 플래그가 되어 난데없이 나타난 것입니다」(S37). 마찬가지로, 몇 가지 작고 용서할 수 있는 실수 뒤에 일어난 한 번의 터무니 없는 실수는 실패를 의미했다. 왜냐하면 그것은 환자의 안전을 위태롭게 하는 그들의 지식, 기술 또는 이해의 상당한 차이를 드러냈기 때문이다. '커리어-데미징' 세부사항(S37)이 훈련생들을 식별할 수 있기 때문에 여기에 구체적인 예를 포함할 수는 없지만, 이 감독관은 당신의 전문이 비행기 재건에 관한 것일 때 날개가 없다는 것을 깨닫지 못한 채 '본질적으로 날개 없는 비행기를 만드는 것과 같다'고 계속해서 설명했다. 훈련생이 자신의 행동의 중요성을 인식하지 못하는 것 같았을 때 실패를 문서화할 필요성이 증가하였다. 
"당신이 수술을 하려고 할 때 출혈을 일으켰을 때, 그는 '오야, 하지만 그건 정상이야'라고 말할 것입니다."(S39). 마찬가지로, 감독관들은 실수에 대해 적절한 후회나 후회를 보이지 않을 때 훈련생을 낙제시키는 과정에 더 관여하는 경향이 있다고 설명했습니다.
"[절대 이벤트에 대한] 피드백을 받는 것은 경솔한 성격이었기 때문에 "오 마이 갓, 내가 그렇게 했다는 것을 믿을 수 없어, 정말 미안해" (S25)가 아니었다." 하지만, 인식 부족과 반성의 부족은 드물고 예상치 못한 것으로 묘사되었다.

In the egregious error pattern, recognising failure was triggered by the discovery of a disconcerting error or omission. A lone incident of great magnitude that involved a core skill could be sufficient in indicating failure, even for a trainee who had not been previously classified as underperforming: ‘surgically, they were actually not a bad operator, and they were actually a very nice person, but missing something so obvious and egregious to me was a huge red flag and came out of nowhere’ (S37). Similarly, a single egregious blunder that followed several smaller and excusable mistakes signalled a failure, because it too revealed a substantial gap in their knowledge, skills or understanding that risked patient safety. Specific examples cannot be included here because the ‘career damaging’ details (S37) could identify the trainees, but this supervisor went on to explain that ‘essentially it's the same as building an airplane without wings’ without realising that it does not have wings when your speciality is all about rebuilding airplanes. The necessity to document failure was increased when the trainee seemed not to recognise the significance of their actions: “‘remember when you got into [iatrogenic] bleeding when you were trying to do the operations' and he would be like ‘oh ya, but that's normal’” (S39). Similarly, supervisors described being more inclined to engage in the process of failing a trainee when they did not show appropriate regret or remorse for the mistake: “it was this flippant nature to getting the feedback [on a never-event] so it wasn't like ‘oh my goodness I can't believe I did that, I'm so sorry’” (S25). However, lack of recognition and lack of remorse were both described as rare and unexpected.

세 번째 패턴은 다른 부서의 동료나 연수생 등 [외부인이 상사에게 귀찮은 경험을 털어놓음으로써 생겨난 인식]이며, 상사는 자신이 '미처 몰라보았던' 결손에 불을 붙였다(S42). 외부인의 통찰력은 레지던트가 겪고 있는 특별한 어려움에 관심을 끌었다. '[누락]은 주치의들에게 매우 걱정거리였다. 특히 내가 참석한 것은 아니었다.- '그거 알아, 이 남자는 그의 행동 때문에 안전하지 않다'고 말한 것은 가정의사였다(S38). 직접 경험해 본 사람이 즉흥적으로 한 말은 이전에 간과되었던 패턴을 제자리걸음을 하게 하고 조치가 필요하다는 것을 확인하는 듯했다. 
"이것은 우리에게 약간의 스펙트럼을 보여주는데 큰 도움이 되었고, 그가 더 많은 피드백과 지원을 필요로 하는 영역을 실제로 가지고 있다는 것을 인식시켰다."(S42)
The third pattern involved recognition sparked by having an outsider, like a colleague from another department or a trainee, divulge a troublesome experience to the supervisor that illuminated a deficit that they had been ‘a little bit blind to’ (S42). The outsider's insight drew attention to a particular difficulty the resident was grappling with: ‘[the omission] was so concerning to the attendings—it wasn't me [an obstetrics attending] specifically—it was a family doctor that said ‘you know what—this guy is unsafe’ because of his behaviour’ (S38). The off-the-cuff comment from someone with first-hand experience seemed to cause the previously overlooked pattern to click into place and to confirm that action needed to be taken: ‘it really helped show us a little bit of the spectrum and recognise that we really did have an area that he needed increased feedback and support’ (S42).

 

3.2 감정의 표현
3.2 Expressing emotion

우리가 감독관에게 그들이 처음 깨달은 것이 실패라는 것을 깨달았을 때, 그들은 그것을 정확히 지적할 수 없었고 말로 표현할 수 없었다: '완전히 기억할 수 없다. 잠깐... 하지만, 한 순간은 완전히 기억나지 않아요, 음... 그리고, 제 말은..." (M36) 예를 들어, 고객이 현재 인식하고 있는 것이 문제가 되어, 향후의 대처가 필요하게 될 가능성이 있다고 생각하는 방향으로의 전환의 힌트가 포함되어 있습니다.
When we pressed supervisors to go back to the moment when they first realised that what they were noticing was failure, they could not pinpoint it and could not put it into words: ‘I can't totally remember. One moment … but, you know, I can't totally remember one moment, ummm … and, you know, I mean …’ (M36). There were examples that contained hints of a shift towards thinking that something that they were noticing now may become problematic and need to be dealt with in the future:

'… 휴무일이나 산발적인 일회성 문제라기보다는, 개인적인 문제점에 가까웠기 때문에 계속 진행 중인 일이 아닐까 걱정했어요. 그래서 모르겠어요. 그녀는 이런 종류의 것들이 그녀의 길을 따라 올라오고 적응하면서 보상하고 배울 수 있을지도 모른다. 아니면, 더 좋은 용어가 없기 때문에, 기본적으로 사람들을 화나게 하고, 결국엔 부정적인 피드백과 프로그램에 의해 뭔가 더 큰 조치가 취해진다는 의견을 충분히 얻을 수도 있습니다.' (M13)
‘… with her I would worry that it's going to be something ongoing because it seemed more of a personality source of the problem than just an off-day or a sporadic one-time kind of thing. So, I don't know. She might be able to compensate and learn from these type of things as they come up and adjust in her way through. Or she might, you know, for lack of a better term basically piss people off all the way through and eventually gets enough negative feedback and comments that something—some bigger measure—is taken by the program.’(M13)

위의 인용문에 포함된 문구는 유일한 용도가 아닙니다. 「이 때문에 일을 망친 사람의 예」(M15)는, 「정말 좌우를 망쳤다」(S30)와 같이, 지극히 성적이 나쁜 훈련생의 묘사를 부드럽게 강조했다. 또, 「내가 왜 더 이상 이 일을 하고 있는지」(M27) 등, 「그것이 얼마나 화가 났는지」(M41) 등, 낙제하는 연습생을 감독하는 것에 대한 반응을 나타내는 데도 사용되었습니다. 일부는 갑자기 말을 끊고 어조와 단어 선택에 대해 사과했다. 
'… 그는 정말 심한 설사를 하고 있었습니다. 미안합니다만, 너무 심한 것 같습니다만, 그는 단지 입을 다물고 싶지 않을 뿐입니다」(M29) 또, 참가자는, 불합격의 연수생에 대한 경험을 이야기하면서, 목소리를 높였다. 예를 들어, 어떻게 연습생이 부정직하다고 판단했는지에 대해 이야기하면서, 「대부분의 경우는 거짓말을 계속하고 있을 뿐이고, 이것은 어려운 일입니다.」라고 하는 것은, 내가 바로 여기 있는 것 같기 때문에, 내가 모른다고 생각하는 것입니까(S39). 그들은 기만과 조작을 묘사할 때 목소리를 높였다. "저는 그들이 어디에 있는지, 글쎄요, 그들은 그저 독약처럼 병적인 존재라고 생각할 수 있습니다." 성격은 "오 마이 갓, 어떻게 당신은 의학에 들어갔나요?"와 똑같습니다." (M14) 또, 「감시」(M41)을 포함한 생생한 이미지를 사용해, 실적이 현저하게 저하하는 연수생이 자신에게 미칠 수 있는 영향을 전달했습니다.

The expletive in the above quote was not an isolated usage. Mild swearing accentuated the descriptions of profoundly underperforming trainees: ‘an example of somebody who has screwed up because of this’ (M15) as in ‘really screwing up left and right’ (S30). It was also used in expressing their reaction to supervising a failing trainee including: ‘wondering why the hell am I doing this anymore’ (M27) because of ‘how much that pissed me off’ (M41). Some abruptly stopped midsentence to apologise for their tone and choice of words: ‘… he had this very loquacious diarrhoea that would just—sorry, I'm sounding really awful, aren't I—but, he would just like not shut up …’ (M29). In addition, participants raised their voices while describing their experiences with failing trainees. For example, while sharing how they determined that a trainee was being dishonest: ‘most of the time they just keep lying—and this is the hard thing—and I find this so hard myself because I'm like I'M RIGHT HERE, DO YOU THINK I DON'T KNOW?’ (S39). They raised their voices when describing deception and manipulation: ‘I can think of 2, maybe 3 trainees, where they're—I don't know, pathological, like they're just poison—the personality is just like ‘OH MY GOD, HOW DID YOU GET INTO MEDICINE’ kind of thing’ (M14). They also used vivid imagery including allusions of being ‘persecuted’ (M41) to convey the impact that profoundly underperforming trainees could have on them:

'제가 선고받은 형량을 말씀드리죠. 직장에서 누군가를 지켜보고, 내내 움츠리고, 누군가 제 환자를 괴롭히는 것처럼 느껴지고, 말을 걸면 화가 나죠.' 이것이 제가 가장 두려워하는 것입니다. 그에게 6개월 동안 가르쳤다면 아마 정맥을 열었을 것입니다.'(36).
‘I'll tell you what I'm sentenced to—a six month period of time where in my workplace I'm watching someone, cringing the whole time, feeling as though someone is bullying my patients and if I talk to them they get angry with me—this is my worst fear […] and I would've probably opened a vein if I had to teach him for six months.’ (M36)

실패를 인식하는 구체적인 경험을 공유하면서, 가장 흔히 언급되는 감정은 좌절감이었다
'잘못된 결정을 내린 연습생에게 미안하지 않다'임상적 판단은 시간이 따라오는 것 같아요자신의 잘못을 깨닫고 아픈 환자에게 도움을 청할 수 있는 능력이 없는 것에 실망했다고 생각합니다.(M7) 실패하는 훈련생을 감독하는 것이 어떤 것인지 직접 물었더니 좌절감이 다시 일반적인 대답으로 나타났습니다. 
'답답하다, 좀 뜬다' (M18). 가벼운 욕설과 그 경험을 떠올릴 때 사용하는 언성이 합쳐진 것은 분노를 나타낸다는 것이 우리의 해석이었다.
The emotion that was most commonly named while sharing specific experiences of recognising failure was frustration: ‘I don't begrudge the trainee for making the wrong decision—I think clinical judgement, that comes with time—I think I was frustrated that they didn't have the ability to see the error in their ways and to call for help for a sick patient’ (M7). When we asked directly what it was like to supervise trainees who were failing, frustration again appeared as a common response: ‘it's frustrating, it's kind of eye-opening’ (M18). Our interpretation was that the combination of mild swearing and raised voices used while recalling those experiences was indicative of anger.

참가자들이 그들의 경험을 공유하는 또 다른 측면은 그들이 사용하는 언어의 뚜렷한 변화였다. 감독관은 현재의 확실한 상태에서 불합격하는 훈련생을 거칠고 분명한 말로 묘사하는 경향이 있었습니다. 
「재해였다」(M2) 「재해다」(M26) 「위험했다」(S28), 「전혀 부적절했다」(S30). 우리의 분석 결과, 그들이 자주 선택한 표현에는 부스터를 사용하는 것이 포함되어 있는 것으로 확인되었습니다. Hyland에 따르면, 부스터는 발언에 대한 확신, 자신감 및 헌신을 표현하기 위해 사용되는 커뮤니케이션 전략이며, 특정 가정이나 결론에 대한 지지를 설득력 있게 요청하기 위해 사용될 수 있다. 우리는 이 단락에서 제시된 인용문에 사용된 부스터의 예에 밑줄을 그었다. 감독관들은 '이 때문에 내가 소송을 당할까 봐' 고심했습니다. (M20) 정말 큰 실수였고 저는 정말 화가 났습니다.

Another aspect of how participants shared their experiences was a distinct change in the language that they used. Supervisors tended to describe failing trainees from a current state of certainty using harsh, unequivocal language: ‘It was a disaster’ (M2) ‘he's a disaster’ (M26) ‘he was dangerous’ (S28) and ‘entirely inappropriate’ (S30). Our analysis identified that their choice of phrasing frequently included the use of boosters. According to Hyland, boosters are a communicative strategy used to express conviction, confidence and commitment to a statement and may be used to persuasively solicit support for particular assumptions or conclusions.41 We have underlined examples of the boosters used within the quotes presented in this paragraph. Supervisors grappled with ‘fearing that I'm going to get sued because of this [omission by the resident …] was a really big miss and I was really upset by it’ (M20).

드물게 수습생의 행동이 감독자를 법적 절차에 참여시키는 '대형 소송'(M29)을 초래하기도 했다. 그러나, 그들은 수습생을 결정하는 것이 '환자 안전의 표준을 충족하지 못하고, 실제로 해를 끼치고 있다'고 강조하였다(S25). 실패에 대한 문서화가 필요했다. 
'환자에게 완전히 위험한 사람은 지나칠 수 없다'(M14). 그리고 환자와 직업에 해를 끼치지 않기 위해 실패를 보고하는 것이 그들의 의무가 되었다: '그것은 나의 의무이다. 즉, 해야 합니다. 그렇지 않으면 저는 학생을 실망시키고 public을 실망시키는 것입니다.(M16) 왜냐하면 '환자의 안전에 관한 우리의 책임은 명백하기 때문입니다'(M41) 변경 후, 유일하게 적절한 옵션은 드물고 어려운 옵션임에도 불구하고 '이 옵션에는 플래그를 붙여야 한다'(M31)였다. 
'내 커리어에서 나는 한 사람을 유급시켰으며, 그들은 정말 유급해야 한다고 생각한다.' (M36)

In rare cases, the actions of a trainee ‘prompted a huge lawsuit’ (M29) that involved the supervisor in legal proceedings. However, they emphasised that determining a trainee was ‘not meeting a standard of patient safety—it's actually causing harm’ (S25) necessitated documentation of failure: ‘I can't pass someone if they're downright dangerous to the patient’ (M14). It then became their obligation to report failure to prevent harm to patients and the profession: ‘that is my duty. That is, I have to. That's—otherwise I am letting down the student and I am letting down the public’ (M16) because ‘it's obviously our responsibility in terms of the safety of our patients’ (M41). After making the shift, the only appropriate option was ‘this one had to be flagged’ (M31), even though it was a rare and difficult option: ‘in my career I think I've failed one person and they really needed to be failed’ (M36). Such conviction may have been needed because reporting failure, and even underperformance, could come at a cost, such as having the trainee file ‘a complaint’ (M17) against them.

이러한 확신은 보고의 실패나 실적 저하는 수습생에게 '고발'(M17)을 하게 하는 등의 대가를 치르게 될 수 있기 때문에 필요했을 수 있다. 훈련생이 수행능력이 저조할 수 있다는 것을 처음 발견한 것에 대한 의구심을 채운 것과 대조적으로, 훈련생이 프로그램을 진행해서는 안 된다는 것을 인식한 것에 대한 설명은 확실성, 확고한 언어, 강렬한 감정, 그리고 잠재적인 피해를 방지해야 한다는 의무감으로 가득 차 있었다. 예측 가능한 비용에도 불구하고 조치를 취해야 합니다.
In contrast to the benefit of the doubt that filled their descriptions of first discovering that a trainee might be underperforming, the descriptions of having recognised that a trainee should not progress in the programme were filled with certainty, firm language, intense emotion and a sense of duty to prevent harm that held the potential to mobilise action despite foreseeable costs.

4 컨센서스 구축
4 BUILDING CONSENSUS

지금까지 우리는 상사에게 초점을 맞추어 실패에 대한 인식을 개인의 마음에서 주로 일어나는 것으로 제시해 왔지만 실패에 대한 인식에는 동료와의 사회적 상호작용도 포함되어 있었다. 특히 실패를 인식하기 위해서는 슈퍼바이저가 본 내용을 다른 사람과 논의하여 그 해석을 이해하고 검증해야 합니다. 그 후 실패가 인정되어 연수생의 다음 단계로 넘어가는 과정이 변경되었기 때문에 감독관, 부서 또는 위원회의 그룹 내에서 여러 사람의 합의가 필요했다. 이제 실패를 인식하는 [집합적 경험]에 초점을 맞춥니다. 프로그램 디렉터는, 「우리는 그것을 용인하지 않는다」(기간, 완전 정지)라고 하는 결정을 내린 시점(S34)에 이르렀다고 설명했습니다.왜냐하면, 「충분한 병리학적 문제가 될 것 같다」라고 하는 경우에는, 통상, 연수생을 포함한 모든 사람이 졸업하는 것보다, 그것들을 삭제하는 것이, 실제로 도움이 되기 때문입니다(S37).. 다만, 복수의 슈퍼 바이저로부터의 합의와 문서화가 필요했습니다.
Up until this point we have focused on the supervisor and presented recognition of failure as something that occurs mostly in the minds of individuals but recognising failure also included social interactions with colleagues. In particular, recognising failure involved supervisors discussing what they were seeing with others to make sense of it and to verify their interpretations. After that, having failure become recognised, so that a trainee's progression to the next phase was altered, required consensus across multiple people within a group of supervisors, department or committee. We now turn our focus to the collective experience of recognising failure. Programme directors described departments and committees reaching a point where they had decided ‘we're not going to tolerate it—period—full stop’ (S34) because when it is ‘pathological enough it's going to be a serious issue then it usually is actually better served for everybody, including the trainee, to remove them than to graduate them’ (S37). However, it required agreement and documentation from multiple supervisors:

'위험한 환자 치료를 제공할 수 있을 것 같은 정말 배신적인 훈련생에게 우리 모두는 책임감을 가지고 있고 종종 단결해서 그렇게 한다.' 즉, 우리는 의사 그룹 사이의 합의를 구한다는 것입니다. 그래서 '이 사람이 이 일을 했다'고 말하는 것은 단지 하나의 스승이 아닙니다. '너도 일주일 동안 그런 일이 있었니?' '응, 나도 그랬고 다른 동료도 그랬다.' 그래서 우리 셋이서 다 같이 하면 숫자에 있어서 강점이니까, 사실 의문을 가질 수가 없어. 만약 그것이 단지 어떤 것의 일회성이라면, 그것은 확실히 밝히기 어려울 것입니다.(S40)

‘For the truly treacherous trainee that I think would provide dangerous patient care, we all have that responsibility to stand forward and we often do that united. Meaning we look for consensus among our physician group so it's not just one preceptor saying ‘this one did this.’ It's a ‘did you have something like that in your week?’ ‘Yes, I had something too and so did one of my other colleagues', okay, so the three of us if we put it all down together, it's a strength in numbers, we can't really be questioned. If it's just a one-off of something, then it could be really hard to pin down.’ (S40)

이러한 실패에 대한 집단적 인식은 보다 면밀한 관찰이 필요한 훈련생에게 주의를 환기시키는 데 도움이 되었다. 그러나 '모두가 눈치채고 있었다'(M41)는 연수생의 평판이 감독 및 평가 방식에 영향을 미칠 수 있음을 인정하였다. 성적 부진한 연수생들은 감독 강화를 위해 감독자들 사이에서 논의되었다. 이것은 동료가 '교사와 토론하고 다른 교사들에게 이것이 일회성이 아니며 이 사람이 잠재적으로 위험하다는 것을 확실히 하기 위해'를 시작했을 때 비공식적으로 행해졌다(M12). 또한 심각한 사건에 대한 대응으로 프로그램 내에서 공식적으로 발생하였습니다. 
'누군가가 그 오류를 발견해 저지하지 않았다면 환자에게 나쁜 일이 일어날 수 있었기 때문에 훈련위원회와 어텐딩과의 큰 논의가 될 수 있었다.'(M5) 

This collective recognition of failure was helpful in bringing attention to a trainee who needed closer observation. However, when it was the case that ‘everybody was noticing’ (M41), it was acknowledged that the trainee's reputation could affect how they were supervised and assessed. Underperforming trainees were discussed among supervisors in order to provide increased supervision. This was done informally when a colleague initiated ‘discussing with the preceptors and making sure the other preceptors know this isn't just a one-off or that this person is potentially dangerous’ (M12). It also happened formally within the programme in response to a serious incident: ‘had someone not picked up that error and stopped it, something bad could've happened to the patient and so it became a big discussion within our training committee and with the attendings’ (M5).

감독관들은 특별한 주의가 필요한 시기를 논의했다. '현미경을 가지고 있으면 흔들기가 매우 어렵다'가끔은 정당하다고 생각한다.(M14). 연습생이 각별한 주의를 '부당한 대우'로 인식하는 것이 명확해진 사례도 있었지만(S22), 감독자와 프로그램은 이를 필요한 감독 및 적절한 피드백으로 해석하였다. 이러한 의견 차이는 일반적으로 훈련생이 피드백에 저항하고 있다는 인식과 관련이 있었습니다. 예를 들어, 프로그램 책임자와 토론할 때, 의대생은 '왜 실제로 그가 한 일이 옳은 일이었는지, [선입자들이] 잘못 해석했거나 이해하지 못했는지, 또는 그들이 틀렸고 그가 옳았다'고 설명할 것이다(S22). 이러한 행동은 '모든 사람이 실제로 능력 문제를 인식하지 않고 […] 나를 이해하려고 하는[…] 통찰력 부족에 기인하는 경향이 있습니다(S25).

Supervisors discussed times when the extra attention was deserved: ‘once you have a microscope on you it's very hard to shake the microscope—I think sometimes it's justified’ (M14). There were examples where it had become clear that the trainee perceived the extra attention as ‘being mistreated’ (S22), but the supervisors and programme interpreted it as necessary supervision and appropriate feedback. This difference of opinion commonly involved the perception that the trainee was being resistant to feedback. For example, when in a discussion with the programme director, a medical student would ‘explain why actually what he had done was the right thing to do and that [preceptors] had misinterpreted or they didn't understand or that they were wrong and he was right’ (S22). This behaviour tended to be attributed to ‘lack of insight [… with thinking] everybody is out to get me […] instead of actually recognising, no, there are some actual competency issues’ (S25).

또한 이러한 집단적인 관심으로 인해 훈련생이 개선을 쉽게 입증할 수 없는 상황이 발생할 수 있다. 감독관들은 '한번 실수하면 현미경 아래 있다가 갑자기 모든 것을 훨씬 더 가까이서 검사한다'(M19)고 인정했고, 이 특별한 주의는 훈련생들에게 스트레스를 주고 학습에 지장을 주었다. 이들은 '프리셉터와 레지던트 사이에 인격적 충돌이 있고 poor한 레지던트가 제대로 된 일을 할 수 없으며 모든 것이 문서화되어 있다'와 같이 특별한 관심이 정당화되지 않았다고 느끼는 사례를 공유했다(M2). 레지던트 프로그램 책임자는 자신이 처한 싱크홀로부터 벗어날 수 없다.소규모 학습 커뮤니티 내에서 '매우 무서운 사건'(S39)에 관여한다는 평판을 가진 전공의를 관리하는 것이 얼마나 어려웠는지 언급했다. 그것은 '이력을 모르는 사람들로부터 그들의 수술 능력에 대한 공정한 평가를 받기 위해 지방 밖으로 그들을 보내는' 등의 전략을 요구할 수 있다(S39)
The collective attention could also create situations where the trainee could not readily demonstrate improvement. Supervisors acknowledged that ‘once you've made a mistake, you're under a microscope and suddenly everything you do is examined that much closer’ (M19), and this extra attention caused stress for the trainee and interfered with their learning. They shared examples where they felt the extra attention was not justified, such as when there was a ‘personality conflict between the preceptor and the resident and that poor resident can't do anything right—and everything's documented—but this person can't emerge from the sinkhole that they've gotten into’ (M2). Residency programme directors discussed how difficult it was to manage residents with reputations for being involved with ‘very scary events’ (S39) within their small learning communities. It could require strategies like sending them ‘out of province to get a fair assessment of their operative skills from people that didn't know their history’ (S39).

심각한 성과 저하의 보증 실패에 대한 광범위한 인식에도 불구하고, 일부 훈련생은 로테이션에 실패하지 않았거나 프로그램에서 해고되지 않은 것으로 보고되었다. 불충분한 서류나 무력한 평가 과정이 그러한 교육생들을 졸업하게 하는 경우, 프로그램 디렉터는 "[… 이 전공의]가 합격하여 대중에게 공개되는 것에 대한 도덕적 고통"을 겪게 될 것이다(M29) 그러나 이는 '전공의가 심각한 문제라는 반박할 수 없는 증거가 있더라도 이들을 프로그램에서 완전히 빼내는 것은 매우 어려운 일이다(S37). 실패한 훈련생에 대한 경험은 정책, 커리큘럼 또는 평가에 대한 목표적이고 실질적인 변경을 통해 프로그램에 큰 영향을 미쳤다.
Despite widespread recognition of profound underperformance warranting failure, it was reported that some of the trainees did not fail the rotation or were not dismissed from the programme. When insufficient documentation or impotent assessment processes allowed such trainees to graduate, programme directors would experience ‘moral distress over [… this resident] passing and being released to the public’ (M29). But it happened because ‘even when there's irrefutable evidence that a resident is a serious, serious problem, getting them out of the program entirely is very, very difficult to do’ (S37). Experiences with failing trainees profoundly impacted programmes through targeted and substantial changes to policies, curricula or assessment.

5 토론
5 DISCUSSION

수련생을 낙제시키는 것은 쉽지 않다. '실패실패failure to fail' 현상에 대한 문헌은 감독관이 역할의 기대를 충족시키는 것을 꺼리는 것을 강조하는 경향이 있지만, 우리의 작업은 복잡하고 종종 힘든 집합적 프로세스에 상당한 깊이의 이해를 더합니다. 신뢰할 수 없는 저성능에서 실패를 인식하는 것으로의 전환에는 지속적이거나 교정되지 않는 수행능력 저하non-rectifiable underperformance의 패턴을 통해 그 규모 또는 확산성을 수량화함으로써 실패를 검증하는 프로세스가 수반된다는 것을 발견했다. 식별된 패턴에는 훈련생이 상당한 학습 격차를 드러내는 '터무니없는' 실수를 저질렀다는 것을 발견하고, 훈련생의 행동이 부적절하고 더 이상 무시할 수 없다는 것을 증명하는 공정한 동료로부터 보고서를 받고, 훈련생이 기대대로 행동할 수 없다는 것을 반복적으로 확인하는 것, 하면 안 될 것을 계속 하는 것이 포함된다. 모든 패턴은 훈련생이 감독이 있음에도 위험한 환자 치료를 제공할 위험이 있음을 나타냅니다. 그 시점에서, 감독자와 프로그램 디렉터는 환자와 직업에 대한 피해를 방지하기 위한 자신들의 의무를 견지하기 위해 훈련생이 실패하는 과정에 관여해야 한다고 느꼈다. 성과가 저조하다는 초기 징후를 믿지 않는 것에서 훈련생은 실패해야 한다는 인식으로 전환하는 과정을 더 자세히 설명하면 추가적인 통찰력을 얻을 수 있습니다.
Failing a trainee is not easy. While the literature on the ‘failure to fail’ phenomenon tends to emphasise supervisors' reluctance to fulfil the expectations of their roles, our work adds considerable depth of understanding to a collective process that is complex and often arduous. We found that the shift from disbelieving underperformance to recognising failure involves a process of verifying failure by quantifying its magnitude or pervasiveness through patterns of persistent or notorious and non-rectifiable underperformance. The identified patterns include discovering that a trainee had committed an ‘egregious’ blunder that reveals a substantial learning gap, receiving a report from an impartial colleague that verifies a trainee's behaviour is inappropriate and can no longer be ignored and repeatedly seeing that a trainee cannot do what was expected of them and/or continues to do what was not expected of them. All patterns signalled that the trainee was at risk of providing dangerous patient care, even with supervision. At that point, supervisors and programme directors felt compelled to engage in the process to fail a trainee to uphold their duty to prevent harm to patients and the profession.5, 6, 9, 10, 12, 16, 33 Additional insights can be gained by further elaborating the shift from not believing early signs of underperformance to recognising that the trainee should be failed.

5.1 고장 인식의 티핑 포인트 모델
5.1 A tipping point model of recognising failure

본 연구의 주요 기여는 patterns of failure이 비정상적인 소음이 아닌, 신뢰할 수 있는 신호credible signal로 어떻게 인식되는지를 조사하는 것이다. [믿을 수 없는 저성능]에서 [실패를 인식하는 것]으로의 전환은 [임계치를 넘은 것]과 비슷하며 티핑 포인트의 심리적 과정을 연상시킨다. [티핑 포인트]에 대한 연구는 [사회적 정보의 작은 변화도 어떤 사람을 한 범주에서 다른 범주로 전환하는 인상 업데이트에 혼합compound될 수 있다는 것]에 초점을 둔다. 티핑 포인트는 누군가의 행동을 상황적 요인으로 돌리는 것에서 그 사람의 선호도, 성격, 도덕성, 그리고 그 사람의 다른 특징에 기인하는 것으로의 변화를 나타낼 수 있다. 단순히 변화가 일어났다는 것을 진단하는diagnose 것이 아니라, 언제 변화가 일어났는지를 진단하는 능동적인 과정이다. 실패한 연수생을 티핑 포인트로 인식하는 과정을 개념화함으로써, 우리는 그 문헌을 참고하여 그 과정을 더 탐구할 수 있다.
A key contribution of our work is examining how patterns of failure are recognised as credible signal rather than anomalous noise. The shift from disbelieving underperformance to recognising failure seems akin to a threshold being crossed and is reminiscent of the psychological process of a tipping point.42, 43 Research on tipping points focuses on how small changes from new social information compound into impression updating that shifts the corresponding person from one category into another.43 Tipping points can mark the shift from attributing someone's behaviour to situational factors to attributing it to their preferences, personality, morality and other characteristics of the person.44 It is an active process where people diagnose when a change has been made rather than just note that a change has occurred.43 By conceptualising the process of recognising a failing trainee as a tipping point, we can draw on that literature to further explore the process.

[티핑 포인트]는 [식별된 변화에 대응하여 행동할 가능성이 높아지는 방향으로의 전환]을 의미합니다. 티핑 포인트의 행동을 유도하는 측면은 [실패를 인식하는 것]이 프로그램을 동원하여 수행능력이 [저조한 훈련생을 반드시 현미경 아래 둘 필요가 있다]는 참가자들의 기억과 공감을 불러일으킨다. 그러나 참가자들은 또한 현미경의 초점을 훈련생에게 맞추면 더 이상 그럴 자격이 없을 때에도 현미경을 흔드는 데 어려움을 겪을 수 있다고 우려했다. 티핑 포인트의 비대칭성이 이를 설명하는 데 도움이 됩니다. 티핑 포인트 연구는 사람들이 [개선과 같은 변화]의 속도보다 [감소하는 속도]를 더 빨리 진단하고, [개선의 징후를 행운의 징조로 무시하는 경향]이 있음을 보여준다. 또한, [티핑 포인트]는 [사람들이 예상하는 것보다 더 빨리 발생]하고, [증거는 적기 때문]에, 훈련생 평가와 관련된 사람들은 실패가 정당하다고 판단하는 데 얼마나 부지런한지 과대평가할 수 있습니다. 도덕적 티핑 포인트에서도 유사한 비대칭성이 있어서, 도덕적 쇠퇴(즉, 나쁜 행동을 저지르는 것)에 따른 처벌이 동일한 도덕적 개선(즉, 좋은 행동을 저지르는 것)에 대한 보상보다 더 기꺼이 발생함을 보여준다. [실패 실패 현상]에 대처하기 위한 노력은 수행능력 저하의 문서화를 꺼리는 것을 완화하는 데 초점이 맞춰져 있지만, 티핑 포인트 연구는 수행능력 저하를 확인한 후에도 프로세스가 어떻게 잘못될 수 있는지를 보여 줍니다. 우리는 훈련생에게 [유급이라는 섣부른 라벨]을 붙이는 것을 막아내는데 도움이 되는 행동 패턴을 찾기 위해 상관의 초기 불신과 시간을 재구성하고 싶을지도 모른다. 우리의 연구결과는 슈퍼바이저가 성적이 낮은 훈련생들을 적절히 낙제시키는 데 도움이 되는 새로운 대화를 시작합니다.

Tipping points imply a shift towards becoming more likely to act in response to identifying change.42, 43 The action inducing aspects of a tipping point resonate with our participants' recollections that recognising failure can mobilise the programme to put an underperforming trainee under a much needed microscope. However, participants were also concerned, once the microscope was focused on a trainee, that they could have difficulty shaking it, even when it was no longer deserved. The asymmetry of tipping points helps to explain this. Tipping point research shows that people more quickly diagnose a trend as declining than the same rate of change as improving and have a tendency to dismiss possible signs of improvement as lucky flukes.42, 43 Furthermore, tipping points happen faster and with less evidence than people estimate,45 which implies that those involved with assessing trainees may overestimate how diligent they are in determining that failure is warranted. A similar asymmetry in moral tipping points shows that moral decline (i.e. committing bad behaviours) is more willingly punished than identical moral improvement is rewarded (i.e. committing good behaviours).44 Although efforts to address the failure to fail phenomenon have focused on alleviating reluctance to document underperformance, tipping point research highlights how the process can go awry with a disinclination to see improvement after underperformance has been verified. We may want to reframe supervisors' initial disbelief and time spent searching for patterns of behaviour as helpful in fending off premature labelling of a trainee as failing. Our findings open a new conversation on helping supervisors to appropriately fail underperforming trainees.

티핑 포인트에 대한 연구는 감정의 영향에 많은 관심을 기울이지 않고 인지적인 측면에 집중하는 경향이 있다. 우리의 연구는 실패를 인식하는 방향으로의 전환이 있을 때 [분노]가 함께 발생하는 것으로 파악한다. 상급자에 대한 감정과 감정적 영향은 [훈련생들에게 유급을 주는 것에 대한 거부감]을 부추기는 것으로 확인되었습니다. 우리는 그것이 다른 역할을 할 수도 있다고 제안합니다. 분노는 실패를 인식하는 촉매 역할을 할 수도 있고, 어쩌면 그 부산물일 수도 있다. 우리의 방법론은 정확한 역할을 결정하는 것을 허락하지 않지만, 인터뷰를 통해 분노를 표출하고 묘사할 수 있게 했다. (불경스러운 말을 포함한) 분노의 반응이 실패-실패 연구에 보고된 경우는 거의 없기 때문에, 주목할 만하다고 생각되었다. 
Research into tipping points has tended to focus on its cognitive aspects, without much attention given to the influence of emotions. Our work identifies anger as co-occurring with the shift towards recognising failure. Emotions and emotional repercussions for supervisors have been identified as fuelling reluctance to fail trainees.3, 7, 8, 11, 13, 16, 46 We suggest that it may also play another role. Anger may be functioning as a catalyst in, or perhaps is a by-product of, recognising failure. Our methodology does not allow its precise role to be determined, but it did allow anger to be expressed and described in interviews. It struck us as remarkable, since angry reactions (including profanity) have rarely been reported in failure to fail research.4 

그러나 그것은 [무능하다는 증거]가 [경멸]을 불러일으키는 심리학 연구와 일치한다. 사람들이 화가 났을 때, 그들은 부정적인 평가가 수반될 것으로 예상되는 평가 작업을 수행할 가능성이 더 높은 것으로 밝혀졌다.48 [분노]는 잘못 인식된 결과를 바로잡기 위한 목표로 잘못에 대한 다른 사람의 책임을 평가하는 것을 수반하는 도덕적 감정이다. 가치관과 도덕적 신념이 위협받았을 때 사람들이 경험하는 감정이다. 그것은 호혜성, 정직성, 공정성, 타인에 대한 관심과 같은 상호작용을 이끄는 사회적 규칙을 위반함으로써 위계적이고 공동체의 의무에 관한 사회적 규범이 위반되었을 때 경험된다. 분노는 통제되어야 하는 부정적인 감정으로 보여지는 경향이 있지만, '정당한 분노는 사람들을 이익과 가치를 지키도록 동원하는 데 도움을 줄 수 있다.' 분노의 행동 경향은 상사가 학습자의 실패를 인정하고, 불신을 극복하도록 유도하는 데 도움이 될 수 있습니다.

But it is consistent with psychology research where demonstrations of incompetence have elicited contempt.47 When people are angry, they have been found to be more likely to perform an evaluative task that is expected to involve a negative evaluation.48 Anger is a moral emotion49 that involves appraising another person's responsibility for wrongdoing with the goal to correct the resulting perceived wrong.50 It is an emotion that people experience when their values and moral convictions have been threatened.50, 51 It is experienced when social norms regarding hierarchical and communal obligations have been violated52 through the breaking of social rules that guide interactions like reciprocity, honesty, fairness and concern for others.50, 53 Although anger tends to be seen as a negative emotion that needs to be controlled, ‘justifiable anger can help mobilise people to defend their interests and values’.54 It may be that the action tendencies of anger help to prompt supervisors to overcome disbelief in order to recognise failure.


그러나 분노는 때때로 행동에 위험한 촉매가 될 수 있다. 분노는 차이를 인식하고 다른 사람의 관점에 대해 추론하는 것과 같은 관점을 감소시킬 수 있습니다. 현재의 견해를 재검토해봐야 하는 새로운 정보에 대한 검토를 방해할 수 있다. 분노는 [반대되는 증거와 주장]을 경시하고, 자신의 견해만을 뒷받침할 증거를 확인해서, 상대를 공격할 정보를 찾게 만드는 [편향된 검색]을 자극할 수 있다. 분노는 적대적이고 징벌적인 감정과 연관된 타인에 대한 비난other condemning  감정이다. 화해의 기회를 줄인다. 중요한 것은, 그것은 임상 직장에서 괴롭힘 또는 따돌림에 선행할 수 있다는 것이다. 분노의 동원적인 측면은 훈련생 실패에 대한 거부감을 극복하는 데 도움이 될 수 있지만, 그러한 측면은 이후의 정보 탐색과 의사결정을 왜곡시킬 수 있다. 평가 시스템은 수행능력 저하에 대한 슈퍼바이저의 감정적인 반응을 전략적으로 이용하는 것으로부터 이익을 얻을 수 있을지는 모르지만, 관련된 왜곡을 상쇄하기 위한 대응책을 도입할 필요가 있습니다.

Anger, however, may sometimes be a dangerous catalyst for action. Anger can reduce perspective-taking, such as recognising differences and making inferences about someone else's point of view.55 It can impede consideration of new information that might prompt a reconsideration of currently held views.54 It can fuel a biassed search for information to attack the violator56 along with confirming evidence to bolsters one's views while downplaying opposing evidence and arguments.54 Anger is an other condemning emotion49 associated with feelings of being antagonistic and punitive.57, 58 It lessens chances for reconciliation.47 Importantly, it can be antecedent to harassment, bullying or mobbing in the clinical workplace.59, 60 The mobilising aspects of anger may help supervisors to overcome reluctance in failing a trainee, but there is the possibility for those aspects to distort subsequent information seeking and decision making. Our assessment systems may be able to benefit from strategically capitalising on supervisors' emotional responses to underperformance, but they must ensure that countermeasures are incorporated to offset any associated distortions.

[요약하면, 실패를 인식하기 위한 티핑 포인트 모델의 개요를 설명했다].

  • 성과가 저조하다는 징후에 직면했을 때, 상사는 우선은 불신감을 느끼고, 자신이 관찰하는 수련생을 이해하기 위해 감독을 강화하여 추가 증거를 찾으면서, ['의심으로부터의 이득']을 얻을 수 있다.
  • 수련생의 진행이 정체되고, 강화된 감독에도 반응이 없을 경우, [수행능력이 저조하다고 식별]된다.
  • 엄청난 오류가 발견되거나, 외부인의 통찰력이 간과했던 징후를 입증하거나, 수행능력 저하가 지속되고 있다는 압도적인 증거가 뒤따른다면 [실패를 인정]하게 될 수 있다.
  • 분노, 그리고 연습생에게 해를 끼치지 않도록 해야 한다는 의무감과 함께, 유급시킬지 말지에 대한 '의심을 넘어', 실패를 인정하면, 티핑포인트의 문턱을 넘는다.
  • 인정의 확실성에 대한 힌트를 얻은 후, 평가 프로세스 참여를 통한 불합격 보고가 이뤄질 수 있지만, progression의 복원 및 개선의 징후를 제대로 보지 못하고 놓칠 수도 있다.

In summary, we outline a tipping point model for recognising failure.

  • Upon being confronted by signs of underperformance, supervisors may experience disbelief and give the trainee the ‘benefit of the doubt’ as they seek additional evidence through increased supervision to make sense of what they are observing.
  • When the trainee's progression remains stalled and unresponsive to intensified supervision, underperformance is identified.
  • If an egregious error is discovered, or an outsider's insight substantiates overlooked signs, or a pattern of overwhelming evidence of continued underperformance follows, failure becomes recognisable.
  • Together with anger and a sense of duty to prevent the trainee from causing harm, the threshold of the tipping point is crossed with recognition ‘beyond a doubt’ that the trainee should fail.
  • Having tipped into the certainty of recognition, reporting of failure through engagement in assessment processes may be mobilised but discerning signs of restored progression and improvement may be obscured.

5.2 평가에 미치는 영향
5.2 Implications for assessment

우리의 연구는 평가 설계에 대한 잠재적 영향을 조사하지는 않았지만, 우리는 티핑 포인트 모델과 감독관이 추가적인 반성을 위해 질문을 제기하지 않는 실패를 인식하는 방법에 대한 개선된 이해를 사용할 것이다. 티핑 포인트 모델은 티핑 포인트 전 및 후 단계를 제공합니다.

Although our study did not investigate potential impacts on assessment designs, we will use the tipping point model and our improved understanding of how supervisors recognise failure to pose questions for further reflection. A tipping point model offers a pre- and post-tipping point phase.

[티핑 시점 전 단계]에서는 관찰된 내용에 대한 불신과 불확실성이 있을 수 있으며, 따라서 이러한 불완전한 이해를 문서화하는 것을 꺼릴 수 있습니다.

  • 우리의 WBA는 트레이너와 충분한 시간 동안 협력하여 슈퍼바이저가 불신을 극복하고 검증된 정보를 보고할 수 있도록 하고 있는가?
  • 이것이 불가능할 경우, 우리의 평가는 시스템이 평가 정보로 효과적으로 활용할 수 있도록 불완전하게 이해된 관찰과 경험을 감독자가 문서화하는 것을 지원하고 있는가?

평가 프로세스는 프로그램 디렉터와 역량 위원회가 접근할 수 있지만, 슈퍼바이저는 접근할 수 없는 여러 측면의 평가 데이터 내에 평가를 적절히 배치할 수 있는 경우, 감독관이 관찰 및 피드백과 함께 의문을 기록하도록 장려할 수 있다. 그 후 [역량 위원회]는 [상호 작용 시간이 제한된 개별 슈퍼바이저]가 수행할 수 없는 [수행능력 저하의 패턴]을 조기에 식별하는 데 초점을 맞출 수 있습니다.

In the pre-tipping point phase, there may be disbelief and uncertainty in what is being observed and therefore reluctance to document those incomplete understandings.

  • Are our workplace-based assessments based on a sufficient period of time working with trainees to allow supervisors to move through any disbelief and report substantiated information?
  • If this is not possible, do our assessments support supervisors in documenting incompletely understood observations and experiences in ways that the system can effectively use as assessment information?

Assessment processes could encourage supervisors to record their doubts along with their observations and feedback if programme directors and competence committees could appropriately situate the assessments within the longitudinal and multifaceted array of assessment data that they have access to but the supervisor does not. Competency committees could then focus on the early identification of patterns of underperformance that individual supervisors with limited interaction time cannot.


[티핑 포인트 후 단계]에서는 실패에 대한 인식을 동원하는 분노, 확실성 및 의무감이 있을 수 있습니다.

  • 교육생 성과에 대한 낮은 위험 평가를 기록하기 위한 신호로서 감독관이 좌절감을 사용하도록 장려한 경우, 건설적인 평가 코멘트의 문서화가 증가할 수 있는가?
  • 한편, 고장 후에 제공된 정보가 지나치게 감소에 집중되어 있을 가능성에 대처하고, 의사결정자가 개선의 증거를 이용할 수 있도록 하기 위한 대응책을 마련하고 있는가.

상급자가 일단 훈련생이 실패했다는 것을 인식하면, [개선의 징후를 발견하는 것]이 더 어렵다는 것을 알 수 있으며, 훈련생이 지속적으로 어려움을 겪고 있는 측면과 함께 [훈련생이 잘하고 있는(또는 더 나은) 측면]을 주목하도록 장려할 수 있습니다. 이와 유사하게, 프로그램 디렉터와 역량위원회는 사전에 예상되는 개선 패턴을 명시하는 것을 우선시할 수 있다.

In the post-tipping point phase, there may be anger, certainty and a sense of duty that mobilises recognition of failure.

  • If supervisors were encouraged to use feelings of frustration as a signal to document low stakes assessments of trainee performance, could documentation of constructive assessment comments be increased?
  • On the other hand, do our systems have countermeasures in place to combat the possibility that information provided after failure has been recognised may be overly focussed on decline and to ensure that evidence of improvement is accessible to decision-makers?

Supervisors could be informed that it is more difficult to see signs of improvement once they have recognised a trainee is failing and be encouraged to note aspects that the trainee is doing well (or better) along with the aspects that they continue to struggle with. Similarly, programme directors and competency committees could prioritise specifying expected patterns of improvement in advance61 with their noted absence indicative of failure.

 

5.3 제한사항 및 향후 연구
5.3 Limitations and future research

우리의 방법론은 참가자가 과거의 감독 경험을 상기시키는 것에 의존했기 때문에, 우리는 그들이 설명한 훈련생의 성과가 저조했다는 것을 검증할 수도 없고, 유급시키고자 판단했던 것의 적절성을 판단할 수도 없다. 우리의 방법에는 언어 요소 코딩, 언어 표현 및 음성 음량의 변화가 포함되었지만, 우리의 감정 해석은 여전히 주관적이다. 우리는 또한 인터뷰 중 경험을 떠올리며 표출되고 보고된 분노는 실패를 인식하면서 경험했던 분노를 나타내는 것이라고 추론한다. 
Since our methodology relied on participants recalling past supervisory experiences, we cannot verify that the trainees they described were underperforming nor determine the appropriateness of wanting to stop their progression in the programme. Although our methods included coding linguistic elements, expressions of speech and changes in spoken volume along with discussing our interpretations within the research team, our interpretation of emotions remains subjective. We also infer that the anger expressed and reported while recalling experiences during interviews is indicative of anger experienced while recognising failure.

이 민감한 주제에 대한 논의를 장려하기 위해 인터뷰 중에 다양한 질문 기법을 사용해야 했습니다. '능력 없는 훈련생'이나 '가장 걱정을 많이 일으킨 훈련생'과 같은 질문을 사용한 [리드인 질문]은 실패 사례가 적은 극단적인 사례에 대한 논의를 불러일으켰을 수 있습니다. 우리는 대조적인 사례를 공유하도록 요청했고, 참가자들이 이 제한을 해결하기 위한 방법으로서 추가 사례를 논의할 시간을 허용했다. 

We needed to use various questioning techniques during interviews to encourage discussion on this sensitive topic. Our lead-in questions using prompts like ‘least competent trainees' or ‘trainees who caused the most worry’ may have generated discussion on extreme cases at the expense of less obvious cases of failure. We did invite contrasting examples to be shared and allowed time for participants to discuss additional examples as ways to address this limitation.

우리의 분석은 [성과가 저조하다고 믿지 않는 초기 징후]에서 [훈련생은 실패해야 한다는 인식으로의 전환]에 초점을 맞췄다. 이 과정을 면밀히 검토함으로써 티핑포인트 조사와의 연계를 도출하고 이를 활용해 공정을 이해할 수 있었다. 그러나 [티핑 포인트] 개념은 데이터 수집 완료 후 분석 중에 도입되었기 때문에 분석을 지시하는 sensitising concept은 아니었다. 향후 연구에서 민감한 개념으로 사용하면 인터뷰의 내용과 형식을 형성하여 티핑 포인트의 개념의 중심을 잡을 수 있다. 

Our analysis focused on the shift from disbelieving early signs of underperformance to recognising that a trainee should be failed. By closely examining this link in the process, we were able to draw connections to tipping point research and use it to gain understanding of the process. However, the tipping point concept was not a sensitising concept that directed our analysis, as it was introduced during analysis that followed the completion of data collection. Its use as a sensitising concept in future studies could shape the content and format of interviews to centre the concept of the tipping point.

또, 수행능력 저하 인식 후의 순서에 대해서는 분석을 실시하지 않았습니다. 실패 기록, 프로그램 수강생 퇴출, 역량 기반 교육 및 프로그램 평가 시스템 내 호소에 대한 대응 등 감독관이 프로세스의 후속 단계에 어떻게 관여하는지를 계속 검토하기 위해서는 추가 연구가 필요하다. 우리는, 개선의 인식의 저하나 그 외의 불완전한 평가 증거의 수정과 함께, 저실적의 조기 특정과 실패의 보고의 증대를 서포트하기 위해서, 평가 시스템을 어떻게 개선할 수 있는지에 대한 조사를 장려한다.

In addition, we did not focus our analysis on the steps following recognition of failure. Further research is needed to continue examining how supervisors engage with subsequent steps in the process such as documenting failure, removing a trainee from a programme and responding to appeals within competency-based education and programmatic assessment systems. We encourage investigation into how our assessment systems can be refined to support earlier identification of underperformance and increased reporting of failure while also correcting for decreased recognition of improvement and other imperfect assessment evidence.

6 결론
6 CONCLUSION

[실패를 인정하는 것]은 쉬운 일이 아니며, [실패 패턴에 대응하는 방법을 결정하는 것] 역시도 복잡하다는 것을 증명했습니다. 실패가 티핑포인트로 인식되고, 분노가 티핑포인트와 공존한다는 것은, 감정이라는 것이 실패를 인정하는 장벽뿐만 아니라 실패를 인정하는 원동력이 될 가능성을 높인다. 티핑 포인트 모델은 티핑 포인트에 도달하기 전에 실적 저하의 우려가 있는 것을 슈퍼바이저가 보고할 수 있도록 지원하기 위한 재구성을 제공합니다.이를 통해 훈련생과 슈퍼바이저를 조기에 지원할 수 있습니다. 하지만, [분노]와 [피해를 방지해야 한다는 의무감]이 동반된 상태로 [티핑 포인트의 문턱]을 넘으면 [훈련생을 유급시켜야 한다는 확신감을 경직시킬 위험]이 있다고 경고한다. 따라서, 일단 Failure가 확인되면 평가 시스템 내에서 [개선을 감지]하는 데 어려움을 겪을 수 있기에, 여기에 대한 대응책을 확실하게 보완해야 함을 의미한다. [실패는 드문 사건]이며, 많은 관련자들에게는 고통으로 남을 가능성이 높지만, 실패가 어떻게 인식, 문서화 및 감시되는지에 대한 이해는 평가 시스템의 지속적인 개선을 알려줄 수 있다.

We have shown that recognising failure is no easy feat, and deciding how to respond to patterns of failure is equally complex. Our model of the shift from disbelieved to recognised failure as a tipping point and our identification that anger co-occurs with the tipping point raises the possibility for emotions to be a driver of, and not only a barrier to, recognising failure. The tipping point model offers a reframing to support supervisors in reporting suspected underperformance before the tipping point has been reached so that early support for the trainee, and the supervisor, can be initiated by decision-makers. But it also warns that crossing the threshold of the tipping point, with accompanied anger and a sense of duty to prevent harm, risks ossifying the sense of certainty that a trainee needs to fail. Thus, it offers the impetus to ensure countermeasures within our assessment systems compensate for difficulties in detecting improvement once failure has been verified. Failure is a rare event and likely to remain distressing for many involved but enhanced understanding of how it is recognised, documented and monitored can inform continued improvements to assessment systems.

 


Med Educ. 2022 Apr;56(4):395-406. doi: 10.1111/medu.14681. Epub 2021 Nov 4.

The shift from disbelieving underperformance to recognising failure: A tipping point model

Affiliations collapse

Affiliations

1Division of Medical Sciences, University of Northern British Columbia, Prince George, British Columbia, Canada.

2Department of Emergency Medicine, Stanford University, Stanford, California, USA.

3Schulich School of Medicine & Dentistry, Centre for Education Research & Innovation, Western University, London, Ontario, Canada.

PMID: 34668213

DOI: 10.1111/medu.14681

Abstract

Context: Coming face to face with a trainee who needs to be failed is a stern test for many supervisors. In response, supervisors have been encouraged to report evidence of failure through numerous assessment redesigns. And yet, there are lingering signs that some remain reluctant to engage in assessment processes that could alter a trainee's progression in the programme. Failure is highly consequential for all involved and, although rare, requires explicit study. Recent work identified a phase of disbelief that preceded identification of underperformance. What remains unknown is how supervisors come to recognise that a trainee needs to be failed.

Methods: Following constructivist grounded theory methodology, 42 physicians and surgeons in British Columbia, Canada shared their experiences supervising trainees who profoundly underperformed, required extensive remediation or were dismissed from the programme. We identified recurring themes using an iterative, constant comparative process.

Results: The shift from disbelieving underperformance to recognising failure involves three patterns: accumulation of significant incidents, discovery of an egregious error after negligible deficits or illumination of an overlooked deficit when pointed out by someone else. Recognising failure was accompanied by anger, certainty and a sense of duty to prevent harm.

Conclusion: Coming to the point of recognising that a trainee needs to fail is akin to the psychological process of a tipping point where people first realise that noise is signal and cross a threshold where the pattern is no longer an anomaly. The co-occurrence of anger raises the possibility for emotions to be a driver of, and not only a barrier to, recognising failure. This warrants caution because tipping points, and anger, can impede detection of improvement. Our findings point towards possibilities for supporting earlier identification of underperformance and overcoming reluctance to report failure along with countermeasures to compensate for difficulties in detecting improvement once failure has been verified.

의학교육을 위한 평등한 학습환경 만들기: 사회적 정체성의 편향과 교차(Med Educ, 2021)
Towards equitable learning environments for medical education: Bias and the intersection of social identities
Naike Bochatay1 | Nadia M. Bajwa2,3 | Mindy Ju1 | Nital P. Appelbaum4 | Sandrijn M. van Schaik1

 

 

1 도입
1 INTRODUCTION

전 세계의 의학 교육자들은 [확립된 규범]이 어떻게 [체계적으로 특정 개인을 선호하고 다른 개인을 차별하는지]를 점점 더 평가하고 있습니다. 이러한 불평등은 부분적으로 [특정 집단의 사회적 정체성에 기초한 편견]으로 설명된다. 사회심리학자는 그룹 간 관계를 연구하기 위해 [사회적 정체성 접근법]을 사용하고 있으며, 버포드는 10년 전 의료 교육에 이 접근법을 도입했다.1 그 후 많은 연구가 일반적으로 한 번에 상호 배타적인 두 개의 사회 집단에 초점을 맞춘 보건전문직의 사회적 정체성을 조사했다(예: 간호사 대 의사). 이러한 연구로부터 중요한 교훈을 얻었지만, 이 연구들은 [사람은 (자신이 속한) 여러 사회 집단을 동시에 동일시하는 경우가 많다는 것]을 간과하는 경향이 있다. 게다가 우리 사회가 다양해짐에 따라, 개인은 점점 더 많은 수의 집단과 동일시하게 되어, 집단간의 관계가 복잡해지고 있다. 결과적으로, 사회 심리학자들은 그러한 관계의 증가하는 복잡성을 고려한 그룹 간 관계에 대한 연구를 요구해왔다. 

Across the globe, medical educators are increasingly evaluating how established norms systematically favour certain individuals and discriminate against others. These inequities are explained in part by bias towards certain groups of people based on their social identities. Social psychologists use the social identity approach to study intergroup relations, and Burford introduced this approach to medical education a decade ago.1 Subsequently, a number of studies examined social identity in the health professions, typically focused on two mutually exclusive social groups at a time (e.g. nurses vs. physicians). Although important lessons have been learnt from these studies, they tend to overlook that individuals often identify with multiple social groups simultaneously.2, 3 Furthermore, as our societies become more diverse, individuals identify with a growing number of groups, which increases the complexity of intergroup relations.2, 4 Consequently, social psychologists have called for research into intergroup relations that takes into account the increasing complexity of such relations.2, 4, 5

[사회적 정체성과 관련된 그룹 간 관계intergroup relations]에 대한 사회심리학자들의 연구를 활용하면 편견을 초래하는 메커니즘을 더 깊이 이해할 수 있고 모두를 위한 공평한 학습 환경을 촉진하기 위한 의학교육자들의 노력에 도움이 될 수 있다.

Drawing on social psychologists' work on intergroup relations as they pertain to social identities may provide a deeper understanding of the mechanisms that lead to bias and can help medical educators in their efforts to promote equitable learning environments for all.

 

2 배경: 의학교육에서의 사회적 정체성
2 BACKGROUND: SOCIAL IDENTITIES IN MEDICAL EDUCATION

2012년에 버포드는 의학 교육에서 사회 집단 간의 상호작용을 이해하기 위한 유용한 프레임워크로서 [사회 정체성 접근법]을 소개하는 논문을 발표했다. 사회심리학자인 타지마펠과 터너에 의해 개발된 이 접근법은 민족중심주의, 편견, 차별에 대한 타지마펠의 연구와 터너의 자기분류이론에서 비롯된 사회적 정체성 이론으로 구성되어 있다. [사회적 정체성 접근법]은 특정 집단이 다른 집단과 경쟁하거나 심지어 차별함으로써 특권의 위치를 유지하는 방법을 이해하는데 도움을 준다. 이와 같이, 그것은 [여러 사회 집단 간의 권력 투쟁에 관한 이론]이다.
In 2012, Burford published a paper introducing the social identity approach as a useful framework to understand interactions between social groups in medical education.1 This approach, developed by social psychologists Tajfel and Turner, comprises social identity theory, originating from Tajfel's work on ethnocentrism, prejudice and discrimination6, 7 and Turner's self-categorisation theory.8 The social identity approach helps understand how certain groups seek to maintain their position of privilege by competing with or even discriminating against other groups. As such, it is a theory of power struggles between different social groups.

[사회적 정체성 접근법]에 따르면, 개인의 자아 의식sense of self은 자신이 소속되었다고 느끼는 사회적 그룹에 의해 영향을 받으며, 이러한 그룹을 [내집단in-group]이라고 한다. 이러한 자기 분류를 통해 개인은 내집단 구성원을 호의적으로 보고, 외집단과 차별화하며, 이를 통해 내집단에 대한 긍정적인 이미지를 유지한다.9 한 개인이 다수의 내집단에 속하기 때문에, '다면적 사회적 정체성multiple social identities'를 갖는데, 이는 '개인의 자아 이미지의 측면이 [자신이] 소속된 것으로 인식하는 사회적 범주에서 파생된 것'으로 정의된다. 후자는 맥락에 따라 달라지는데, 이는 [사회적 범주의 현저성salience of a social category]이라고 불리는 현상이다. 

According to the social identity approach, individuals' sense of self is influenced by the social groups to which they feel they belong, termed the in-groups. This self-categorisation leads individuals to view members of in-groups favourably and differentiate them from out-groups, which helps to maintain the in-group's positive image.9 As individuals belong to multiple in-groups, they have multiple social identities, defined as ‘those aspects of an individual's self-image that derive from the social categories to which [they] perceive [themselves] as belonging’.9 The latter vary depending on context, a phenomenon referred to as salience of a social category.9 

또한, 개인이 [어떤 사회 집단과 동일시]할 수 있는지는 [기존 규범]에 따라 결정된다. 이는 개인이 보통 집단의 속성을 갖는다는 의미이다. 이는 프로토타입의 개발이나 사회 집단의 주요 특징의 표현으로 이어집니다. 사회는 [지배적인 사회 집단의 프로토타입]을 긍정적으로 보는 경향이 있는 반면, [권력이 작은 집단의 프로토타입]에 대해서는 부정적인 고정관념을 가지고 있는 경우가 많습니다. 예를 들어, 개인을 소외된 인종 집단으로 분류하는 것은 개인을 비개인적으로 비개인화할 수 있으며, 따라서 그들은 그들 집단의 원형만을 대표하고, 그에 따라 고정관념을 형성할 수 있다. 이것은 [고정관념 위협]을 통해 행동에 영향을 미칠 수 있습니다. 고정관념 위협이란 개인이 그들의 사회 집단과 관련된 부정적인 고정관념에 순응하는conform 것을 말한다. 그것은 또한 개인이 그들이 동일시하는 집단이 부정적으로 평가되고 있다고 인식할 때 사회적 정체성 위협으로 이어질 수 있다. 

Furthermore, existing norms determine which social groups an individual can identify with; individuals usually have to possess the attributes of the group. This leads to the development of prototypes or representations of the main characteristics of the social group.10 Prototypes of social groups dominant in society tend to be viewed positively whereas prototypes of groups with less power often carry negative stereotypes. For example, categorisation of individuals into marginalised racial groups can depersonalise individuals so that they only represent the prototype of their group, thereby creating a stereotype.11 This can affect behaviours through stereotype threat where individuals conform to negative stereotypes associated with their social group.12 It can also lead to social identity threat when an individual perceives that a group they identify with is being judged negatively.13

Burford가 도입한 사회적 정체성 접근법에 대해 의학 교육자들은 열광적으로 반응했습니다. 구글 스콜라에 따르면 2021년 7월 이 기사는 227개의 인용문을 가지고 있다. 의학 교육에서 사회적 정체성 접근법을 사용한 기사의 분석을 통해, 우리는 대부분 서로 격리된 다른 사회적 정체성을 검토한다는 것을 깨달았다. 이러한 고립된 일련의 연구에서 저자는 [여러 사회적 정체성을 동시에 갖는 것]의 영향을 고려하지 않고, 자신이 발견한 문제를 해결하기 위한 권장사항을 제시합니다. 따라서, [교차성intersectionality]의 관점에서 사회적 정체성을 연구하는 것은 의학 교육의 편견에 대한 우리의 이해를 심화시키는 강력한 접근법이 될 수 있다.

Medical educators responded enthusiastically to Burford's introduction of the social identity approach1: the article had 227 citations in July 2021 according to Google Scholar. Through an analysis of articles using the social identity approach in medical education, we realised that most examine different social identities in isolation from each other. In these siloed sets of studies, authors make recommendations to tackle the problems they uncovered without considering the impact of having multiple social identities simultaneously.2-4 Thus, studying social identities through the lens of intersectionality may be a powerful approach to deepening our understanding of bias in medical education.



[교차성Intersectionality]은 개인의 경험을 형성하는 데 있어서, [서로 다른 사회적 정체성]이 상호작용하는 방식을 말한다. 그것은 흑인 여성이 인종 차별 반대론자와 페미니스트 토론에서 어떻게 소외되었는지를 조명하기 위해 개발되었다. 의학 교육의 사회적 정체성에 대한 연구는 지금까지 교차성에 제한적인 관심만을 가져왔다. 의료연수생과 전문직 종사자가 가지는 다면적 사회적 정체성을 가짐을 고려한다면, [교차성]이 복잡한 그룹 간 관계의 맥락에서 편견과 불평등에 대한 이해를 깊게 하고 편견을 완화하는 방법을 찾는 다른 렌즈를 제공할 수 있다고 가정할 수 있다. 
Intersectionality refers to the ways in which different social identities interact to shape an individual's experience.14 It was developed to illuminate how black women were marginalised in both antiracist and feminist discourses.15 Research on social identities in medical education has to date paid limited attention to intersectionality. Considering the multiple social identities held by medical trainees and professionals,16-19 we posit that intersectionality can deepen our understanding of bias and inequities in the context of complex intergroup relations and provide a different lens through which to look for ways to mitigate bias.

이 기사에서 우리는 일반적으로 편견을 유발하는 세 가지 사회적 정체성, 즉 인종, 성별 및 직업에 초점을 맞추어 의학 교육의 사회적 정체성에 대한 선행 연구를 검토한다. 우리는 각 범주에서 편견과 불평등을 완화하기 위한 전략을 분석하고 교차성의 렌즈를 통해 이것들이 어떻게 결합될 수 있는지에 대한 비전을 제안한다. 기사 전체에서 가상의 의료연수생인 아이다를 예로 들 수 있다. 우리는 그러한 예를 사용하는 것이 특정 그룹의 모든 사람을 대표하는 것으로 보이는 경우 고정관념을 영구화할 위험이 있다는 것을 인식한다. 이러한 위험을 인식하면서, 우리는 Vignette가 기존의 고정관념과 의학 교육을 탐색하는 여러 정체성을 가진 개인에게 편견이 나타나는 방법을 설명하고 교차 렌즈 적용의 잠재적 영향을 보여줄 수 있기를 바란다.

In this article, we examine prior studies on social identity in medical education, focusing on three social identities that commonly elicit bias: race, gender and profession.20, 21 We analyse strategies to mitigate bias and inequities in each category and propose a vision for how these can be combined through the lens of intersectionality. Throughout the article, we use a fictional medical trainee, Aida, as an example. We recognise that using such an example carries the risk of perpetuating stereotypes if one vignette is seen as representative of everyone in a certain group. Acknowledging this risk, we hope that the vignette can illustrate existing stereotypes and the ways in which bias presents itself to individuals with multiple identities navigating medical education, as well as demonstrate the potential impact of applying an intersectionality lens.

3 편견을 유발하는 사회적 정체성
3 SOCIAL IDENTITIES THAT ELICIT BIAS

아이다는 미국 버지니아주 리치몬드의 낮은 사회경제적 이웃에 사는 흑인 여학생입니다. 그녀는 아이다가 10살 때 구명 수술을 받은 이모에 의해 길러졌다. 그 후, 아이다는 외과의사가 되고 싶어 했다. 그녀는 가족 중 처음으로 대학에 가고 공부를 지원하기 위해 대학 기간 동안 일을 해야 한다. 결과적으로, 그녀는 과외 활동을 할 시간이 제한되었고, 그녀의 대학 지도교수는 이것이 그녀가 의대에 입학할 수 있는 기회를 희박하게 만든다고 경고한다. 좋은 성적에 고무되어 그녀는 입시 공부를 하고 있다. 아이다는 평판이 좋은 의대에 입학했을 때 의기양양해져서 성공하기 위해 열심히 일한다. 그녀는 반에서 유일한 흑인 학생이고 종종 자신이 어울리지 않는다고 느낀다. 그녀는 똑똑하다는 평판을 받고 있어 환자와의 교감이 쉽지만, 에이다는 그녀의 평가가 동료만큼 긍정적이지 않다는 것을 깨닫고, 그녀의 능력에 의문을 품게 된다.
Aida is an African American female student from a lower socio-economic neighbourhood in Richmond, Virginia (USA). She was raised by her aunt, who underwent a lifesaving surgery when Aida was 10. Since then, Aida has wanted to become a surgeon. She is the first in her family to go to college and has to work during college to support her studies. As a result, she has limited time to engage in extracurricular activities, and her college advisor warns her that this makes her chances to be admitted to medical school slim. Encouraged by good grades, she studies for entrance exams and applies anyway. Aida is elated when she is admitted to a reputable medical school and works hard to succeed. She is the only black student in her class, and she often feels that she does not fit in. She has a reputation to be smart and connects easily with patients, yet Aida notices that her evaluations are never as positive as her peers', making her question her abilities.

3.1 인종
3.1 Race


아이다의 사례는 인종과 관련된 사회적 정체성이 의과대학에 입학하는 과정에서 어떻게 돌출salient되는지를 보여준다. 왜냐하면 그것들은 다른 인종 집단에게 주어지는 기회들에 영향을 미치는 경향이 있기 때문이다. 이는 미국과 같은 제도적 인종차별의 역사적 맥락을 가진 국가들에서 특히 두드러지지만, 전 세계 소수 민족 집단과 관련해서도 유사한 패턴이 나타난다. 소수 인종과 소수 민족 출신의 학생들은 [자원과 기회의 접근 면에서 불평등이 심한] 교육 시스템을 통과해야 한다. 결과적으로, 그들은 의대를 고려할 가능성이 적다. 그들이 그것을 고려할 때, 그들은 입학 절차에서 암묵적인 편견에 직면하게 되고, 따라서 의과대학에 입학하는 인종과 인종적 배경의 학생들의 수는 일반 인구에서 그들의 비율을 밑돌고 있다. 실제로 의과대학이 URM 비율을 높이려는 노력에도 불구하고 미국의 의과대학에 입학하는 URM 수는 감소하고 있다. 

Aida's example illustrates how social identities associated with race are salient during the process of entering medical school, as they tend to influence opportunities afforded to different racial groups.22, 23 This is especially apparent in countries with a historical context of systemic racism like the United States,24-27 although similar patterns also occur with regards to ethnic minority groups throughout the world.28 Students from racial and ethnic minorities must traverse educational systems fraught with inequity in terms of access to resources and opportunites.29, 30 As a result, they are less likely to consider medical school.31 When they consider it, they face implicit bias in admission processes,22 such that the number of students from racial and ethnic backgrounds under-represented in medicine (URM) entering medical schools remains below their percentage in the general population.30, 32 In fact, despite medical schools' efforts to increase the percentage of URMs, the numbers of URMs entering medical school in the United States is decreasing.30

URM 학생들은 의대에 입학하자마자 종종 평가와 다른 형태의 구조적 인종차별에 대한 편견에 직면한다. 그들은 자신들이 의대생의 전형적인 이미지에 맞지 않는다는 것을 끊임없이 상기시키기 때문에 [고정관념 위협]과 미세공격성microaggrssion을 경험할 수 있습니다.38 URM 학생들이 훈련 중에 겪는 불평등은 그들의 경력 내내 지속됩니다. 그들은 지위와 자율성을 제공하는 직업적 정체성과 전통적으로 의학적으로 대표되지 않는 사회 단체에 가입할 수 있는 인종적 정체성을 통합해야 한다. URM 의사는 의사라는 원형적 정체성과 맞지 않으면서, 의료 그룹 내 소속에서 발생하는 '이중 의식double consciousness'이라는 내적 갈등에 시달릴 수 있습니다. 또한 URM 의사가 직면하는 여러 고정관념은 역할에 대한 적합성에 따라 특정 역할에 대한 접근을 제한합니다. 이는 URM 의사의 역할 모델 부족으로 인해 악화되는 배제 문화를 조성한다.

Upon entering medical school, URM students often face bias in assessment and other forms of structural racism.22, 33-37 They may experience stereotype threat and microaggressions as they are consistently reminded that they do not fit the typical image of a medical student.38 The inequities that URM students encounter during their training persist throughout their career. They must integrate their professional identity, which affords them status and autonomy, and their racial identity, which gives them membership to a social group traditionally not represented in medicine.38-40 URM physicians may struggle with an internal conflict of ‘double consciousness’ from belonging to the medical in-group while not fitting in with the prototypical identity of a physician.30, 41, 42 In addition, the multiple stereotypes URM physicians face limit their access to certain roles based on perceived fit for the role.1 This creates a culture of exclusion that is aggravated by the lack of role models for URM physicians.43

[인종 불평등을 줄이기 위한 전략]은 종종 행정 및 정책 접근법, 차별 철폐 조치, URM 학습자의 교육 및 자금 지원 기회를 포함하며, 궁극적으로는 URM 의사의 수를 늘리는 것을 목표로 한다. 그러나 이러한 전략은 [편견을 유발하는 근본적인 사회적 정체성]을 다루지 않는다. 예를 들어, 많은 의과대학들이 차별 철폐 조치를 채택하고 있지만, 이 전략은 제한된 수의 URM 지원자와 그들에게 불이익을 주는 편향된 선발 과정으로 인해 방해를 받고 있다. 따라서 인종 정체성에 대한 편견을 해소하기 위한 노력은, [제도적 편견을 식별]하고, [다양성을 촉진하는 조직 문화]를 만들고, [의학에서 규범을 재정의하기 위한 구조적 변화]를 포함해야 한다(예: 학습자가 성공했다고 판단하는 방법). 또한 입학위원회의 다양성을 높이고 암묵적인 편견에 민감하게 반응함으로써 URM의 채용을 개선할 수 있습니다. 멘토십은 URM 학습자를 지원할 수 있는 더 많은 기회를 제공합니다. 한 연구에서 URM 학습자는 동료 멘토링에 참여함으로써 인종적 정체성과 직업적 정체성을 결합할 수 있었고, 이는 의료 및 URM 사회적 그룹 모두에 소속감을 주장할 수 있게 했다. 또한 동일한 학습자는 비 URM 의사로부터 받은 멘토링을 그룹 내 의료에 대한 회원 자격을 인정하는 방법으로 인식했다. 따라서, 사회적 정체성에 초점을 맞춘 전략은 의학 교육의 인종 불평등을 해결할 수 있는 유망한 방법을 제공한다.

Strategies to reduce racial inequities often aim to increase the number of URM physicians, including administrative and policy approaches, affirmative action, and educational and funding opportunities for URM learners.44 Yet these strategies do not address the underlying social identities that elicit bias. For example, many medical schools embrace affirmative action, but this strategy is hampered by the limited number of URM applicants and a biased selection process that disadvantages them.29 Efforts to address bias towards racial identities therefore need to include structural changes to identify institutional bias, create organisational cultures that promote diversity and redefine norms (e.g. how we determine that a learner is successful) in medicine.45, 46 Furthermore, increasing the diversity of admissions committees and sensitising them to their implicit biases may improve recruitment of URMs.22 Mentorship offers further opportunities to support URM learners.47, 48 In one study, URM learners were able to merge their racial and professional identities through engaging in peer-mentoring, which enabled them to assert their belonging to both the medical and URM social groups.39 The same learners also perceived mentorship from non-URM physicians as a way to recognise their membership to the medical in-group.39 Thus, strategies that focus on social identities offer promising ways of addressing racial inequities in medical education.

아이다는 임상실습 기간 동안 임상 환경에 들어가면서 외과의사가 되고 싶다는 자신의 꿈을 다시 생각하게 된다. 수술 교대로 강의하는 동안 회의실을 둘러보다가 [벽에 걸린 모든 초상화가 백인 남성]임을 알게 된다. 다른 사람들이 그 부서에서 몇 안 되는 (백인) 여성 외과의들을 언급하는 것을 들으면, 그들은 '오만하고bossy' 함께 일하기 어렵다고 말합니다. 겁에 질렸음에도 불구하고, 아이다는 여성 외과의사 중 한 명에게 조언을 구한다. 그녀는 수술 훈련을 받는 데 필요한 것을 가진 사람은 거의 없으며 내과가 그녀에게 더 적합할 수도 있다고 한다. 아이다는 그 후 기본적인 봉합 기술조차 배우지 못하고 수술이 그녀에게 너무 기술적이라는 것을 확신하게 된다. 그녀는 내과 레지던트 연수를 택했다.

As Aida enters the clinical environment during clerkships, she rethinks her dream of becoming a surgeon. Looking around the conference room during lectures in her surgery rotation, she notices that all the portraits on the wall are of white men. When she hears others mention the few (white) female surgeons in the department they talk about them as being ‘bossy’ and difficult to work with. Despite feeling intimidated, Aida asks one of the female surgeons for advice. She is told that very few people ‘have what it takes’ to make it through surgery training and that internal medicine may be a better fit for her. Aida subsequently struggles learning even basic suturing techniques and becomes convinced that surgery is too technical for her. She opts for residency training in internal medicine.

3.2 젠더
3.2 Gender

에이다의 Vignette는 성별 정체성과 관련된 편견이 직업 결정과 기회에 어떻게 영향을 미칠 수 있는지를 보여주는 하나의 예를 제공한다. 2008년 이후 의과대학 졸업자의 거의 50%를 여성이 차지하고 있으며 미국 의과대학 교원의 41%를 차지하고 있음에도 불구하고 성 불평등은 지속되고 있다. 여성들은 종종 리더십 지위, 학술상, 보상과 관련하여 소외당한다. 사회적 정체성 접근법을 사용하면, 우리는 왜 그리고 어떻게 학술 의학이 계속해서 여성들을 위한 '배제 문화'를 만들어 내는지 이해할 수 있다. 
Aida's vignette provides one example of how bias associated with gender identities can influence career decisions and opportunities. Even though women have constituted nearly 50% of medical school graduates since 2008 and make up 41% of faculty in medical schools in the United States, gender inequities persist.49 Women are often marginalised with regard to leadership positions, academic awards and compensation.50-53 Using the social identity approach, we can understand why and how academic medicine continues to create a ‘culture of exclusion’ for women.54

성별은 개인이 어떤 전공에서 수련을 받을지의 결정에 영향을 미친다. 이 현상은 종종 라이프스타일 결정에 의해 설명된다. 여성들은 primary caretaker으로서의 역할을 수용하기 위해 [정규 근무시간을 가진 전문직]을 선택하는 경향이 있다. 그러나 핏/적합성fit의 개념으로 더 잘 설명할 수 있습니다. 그룹이 적합성fit을 요구하면 [그룹 내 차이를 최소화]하고, [그룹 외 차이를 최대화]하려고 합니다. [적합성fit]은 여성을 신경외과와 같은 남성 지배적인 전문분야에서, 남성을 산부인과나 산부인과와 같은 여성 지배적인 전문분야에서 벗어나게 하고 있다. 그 결과, 주어진 그룹 내 또는 전문 분야와 관련된 프로토타입(성별 기반) 정체성이 영속화perpetuated됩니다.  

Gender impacts the specialties that individuals train in.55-57 This phenomenon is often explained by lifestyle decisions; women tend to select specialties with regular working hours to accommodate their role as primary caretaker.58 However, it may be better explained by the concept of fit. When a group invokes fit, they attempt to minimise in-group differences and maximise out-group differences. Notions of fit are keeping women out of male dominated specialties, such as neurosurgery, and men out of female dominated specialties, such as obstetrics and gynaecology.56 As a result, prototypical (gender-based) identities associated with a given in-group or specialty are perpetuated.55

의과대학에서 여성이 남성보다 많음에도 불구하고, 의학은 전통적으로 남성 중심적인 직업이었고, 여성 의사들은 여러 사회적 정체성을 협상하고 서로 다른 그룹의 규범을 고수한다. 예를 들어, 소생술을 이끄는 여성들은 사회 정체성 위협의 한 예인 지도자로서 인식된 평가 절하를 보상하기 위해, (의도적으로) 더 남성적으로 행동할 수 있다. 아이러니하게도, 이러한 행동 변화는 전형적인 남성적 행동을 보이는 여성들에 대한 백래시 효과를 초래할 수 있다. 리더십과 다른 역할에서 여성의 성과를 떨어뜨릴 수 있는 고정관념 위협과 함께, 사회적 정체성 위협은 여성들에게 영향을 미친다. [능력이 떨어진다고 인식되는 것에 대한 걱정]이 유발하는 감정적, 정신적 피로는 남성보다 여성에서 더 높은 번아웃이 나타나는 현상에 기여할 가능성이 있다. 

Despite women now outnumbering men in medical school, medicine has traditionally been a male-dominated profession,59, 60 and female physicians negotiate multiple social identities and adhere to norms of different in-groups.61 For instance, women leading resuscitations may enact more masculine behaviours to compensate for perceived devaluation as a leader,62 an example of social identity threat.63 Ironically, this change in behaviour can lead to a backlash effect against women who demonstrate more stereotypically male behaviours.64 Together with stereotype threat, which may lead to decreased performance of women in leadership and other roles, social identity threat impacts women. The resulting emotional and mental exhaustion from worry over being perceived as less capable likely contributes to the higher rates of burnout noted in women as compared with men.65, 66

많은 기관들이 [공식적인 정책과 절차]를 통해 성 불평등을 해결하려고 노력했지만, 이러한 노력은 직장 내 [비공식적 상호작용]에 대처하지 못했다는 비판을 받아왔다. 그러나, 사회적 정체성이 발휘되고 두드러지는 때는 '비공식적 상호작용'의 순간이다. 이 문제를 해결하기 위해, 개인과 사회 집단을 대상으로 한 개입이 도움이 될 수 있다. 예를 들어, 한 학술 의료 센터의 모든 교직원을 대상으로 한 개입에서 짧은 프레젠테이션이 참가자들의 결정과 행동에 편견이 어떻게 영향을 미칠 수 있는지에 대한 인식을 높인 것으로 나타났다. 사업에서는, 남성과의 제휴를 촉진하는 개입이 주목을 받고 있다. 남성 동반자는 남성이 '여성과의 관계 구축, 성별에 의해 부여된 사회적 특권 이해, 직장 및 사회에서의 성 불평등 문제를 해결하기 위한 적극적인 노력'에 전념할 때 발생한다. 따라서 Allyship은 내집단(남성)과 외집단(여성)을  연결시켜주므로, 사회적 집단은 더 이상 다른 집단과 거리를 두지 않고 함께 모이게 된다. 그룹에 대한 개인의 인식 변화는 수학과 과학 교육과 같이 성별이 두드러진 특징인 다른 환경에서 고정관념의 위협을 감소시키는 것으로 나타났다. 
Many institutions have tried to tackle gender inequities through formal policies and procedures, but these efforts have been criticised for failing to address informal interactions in the workplace.67, 68 It is during these informal interactions, however, that social identities play out and become salient.54, 59 To address this problem, interventions targeting individuals and social groups may be helpful. For example, an intervention targeting all faculty at an academic medical centre found that a brief presentation increased participants' awareness of how bias can affect their decisions and behaviours.69 In business, interventions that promote male allyship have generated attention. Male allyship occurs when men commit to ‘building relationships with women, […] understanding the social privilege conferred by their gender, and demonstrating active efforts to address gender inequities at work and in society’.70 Allyship thus bridges the in-group (men) and out-group (women), so social groups no longer distance themselves from others but come together. Changes to individuals' perceptions of the group have been shown to decrease stereotype threat in other settings where gender is a salient characteristic, such as math and science education.71

아이다는 레지던트를 시작하면서 간호사의 존경과 우정을 얻으려고 한다. 그녀를 모르는 사람들은 그녀가 하얀 코트를 입지 않으면 종종 청소부로 오인하고, 바로잡아주었을 때도 종종 그녀가 의사라는 것을 믿기 힘들어 한다. 트레이닝이 진행됨에 따라 팀장으로서의 요구는 높아지고 있지만, 동시에, 그녀는 자신의 결정에 의문을 느끼고 있기 때문에 그 역할에 대한 자신의 주장을 하는 데 어려움을 겪고 있다. 어느 날 소생 중 간호사는 그녀의 명령을 무시했고, 아이다가 그녀의 요청을 반복하자 간호사는 동의하지 않는다고 말했다. 아이다는 폭발했다. "당신이 의사입니까, 아니면 제가 의사입니까?" 에이다는 자신이 함께 일하기 어려운 사람으로 변했다는 것을 깨닫고, 어쩌다 이렇게 된건지 놀란다.
When Aida starts residency, she tries to earn the respect and friendship of nurses. People who do not know her often mistake her for a janitor if she is not wearing her white coat, and when she corrects them, they often struggle to believe that she is a physician. As she progresses in her training, she is increasingly called upon as team leader, yet at the same time, she has trouble asserting herself in that role because she feels questioned in her decisions. One day during a resuscitation, a nurse ignores her orders, and when Aida repeats her requests, the nurse says she disagrees. Aida snaps: ‘Are you the doctor, or am I?’ Aida realises she has turned into the person who is difficult to work with and wonders how she ended up here.

3.3 직업
3.3 Profession

아이다의 사례는 의료 교육 중에 전문직업적 정체성이 어떻게 두드러져 고립과 갈등으로 이어질 수 있는지를 강조하고 있습니다. 의학 교육 입학을 전에 형성된 인종적, 성별적 정체성과 달리, 직업적 정체성과 학문적 정체성은 훈련 중에 형성된다. 이 과정은 보다 임상적인 책임을 지는 새로운 역할로의 전환과 다른 보건 분야의 학습자와의 상호작용을 통해 이루어집니다. 학부 의학 교육 수준에서 학습자들은 종종 다른 전문가들에게 긍정적인 태도를 보입니다. 예를 들어, 전문직간활동에 참여한 학생들은 다른 보건의료계 동료들로부터 받은 피드백을 똑같이 유용하고 긍정적인 것으로 평가했습니다. 이것은 이 단계에서는 [학생 정체성]이 발달중인 [전문직 정체성]에 비해 더 중요한 정체성이라는 것을 암시한다. 
Aida's example highlights how professional identities can become salient during medical education and lead to silos and conflict. Unlike racial and gender identities, which pre-date individuals' entrance into medical education, professional and disciplinary identities are formed during training. This process occurs through transitions into new roles with more clinical responsibilities72-75 and through interactions with learners from other health professions.76, 77 At the undergraduate medical education level, learners often have positive attitudes towards other professionals.78 For example, students participating in an interprofessional activity rated feedback from peers with different health professional backgrounds as equally useful and positive.79 This suggests that the student identity as an overarching identity is more salient at this stage than the developing professional identities.80

[레지던트 기간] 동안 학습자는 [외집단 구성원]과의 상호작용을 통해 자신의 직업적 정체성을 강화합니다. 이것은 전공의들이 [처음으로 자신을 의사라고 느낀 것이 간호사와 일할 때였다]고 보고하는 것에서 예시된다. 왜냐하면 스스로를 다른 의료 팀과 구별할 수 있게 해주었기 때문이다. 이 단계에서 학습자는 자신의 전문 분야와 관련된 추가적인 사회적 정체성을 개발합니다. 이러한 정체성은 시간이 지남에 따라 더욱 강해집니다. 이론적으로, 이것은 의사가 특정 전공분야의 전문가가 되기 위해 하는 투자(예: 시간, 돈, 노력), 그들이 거치는 [치열한 사회화 과정] 및 그들이 수행하는 [전문적 직무]로 설명할 수 있다. 전공의들은 전문 분야, 기관, 훈련하는 나라에 따라 직업 궤적이 다르다. 그 결과, 점점 동일시하게 되는 내그룹이 작아지게 된다. 트레이닝이 끝난 시점에서, 의사는 프로페셔널 그룹이나 스페셜 그룹내의 멤버쉽을 얻을 수 있는 복수의 사회적 정체성을 개발했습니다.

During residency, learners strengthen their professional identities through interactions with members of out-groups.81 This is exemplified by residents reporting that the first time they felt like doctors was when working with nurses, as it enabled them to distinguish themselves from the rest of the healthcare team.82, 83 At this stage, learners develop additional social identities related to their discipline of specialisation. These identities become stronger over time. Theoretically, this is explained by the investments (e.g. time, money and effort) physicians make to become specialists in a given discipline, the intense socialisation processes they go through and the specialised work they perform.84 Residents have different career trajectories depending on the specialty,72 the institution85 and the country they train in.86 As a result, they identify with increasingly smaller in-groups.87-91 At the end of their training, physicians have developed multiple social identities that afford them membership into professional and specialty in-groups.

전문적 정체성은 의사가 업무를 수행할 수 있게 하지만 효과적인 협업을 방해할 수도 있습니다. 이는 권력power의 정도가 다른 [여러 사회 집단 간의 경쟁과 충돌]에 기인하며, 이 과정에서 내집단 구성원을 선호하게 되고, 결과적으로 외집단 구성원을 덜 호의적으로 대하게 된다.  전문 그룹 간의 편견을 완화하기 위해, 모든 보건 전문 교육 수준에서 Interprofessional Education(IPE; 프로페셔널 간 교육)이 점점 더 많이 채택되고 있습니다. IPE는 서로 다른 전문 그룹의 구성원이 '서로에 대해, 서로로 부터, 그리고 서로와 함께' 배울 수 있도록 하는 것을 목표로 한다. IPE 내에서는 그룹 간 관계 개선에 초점을 맞춘 전략도 있습니다. 이러한 전략에는 [팀 성찰성]의 증대가 포함되어 있고, 팀 전체가 공동 작업을 성찰함으로써 [집단적 역량]을 개발할 수 있을 때 얻어진다. 

Although professional identities enable physicians to perform their work, they can also impede effective collaboration. This is due to competition and conflict between different social groups with varying degrees of power,91-97 which often lead individuals to favour members of their in-groups and, consequently, treat out-groups less favourably.98 To mitigate bias between professional groups, interprofessional education (IPE) is increasingly adopted at all levels of health professions education.99, 100 IPE aims to enable members of different professional groups to ‘learn about, from and with each other’.101 Within IPE, some strategies focus on improving intergroup relations. These strategies include increasing team reflexivity, which occurs when an entire team reflects upon their work together to enable development of collective competence.102 

또, 다음의 4개의 분야에 있어서의 스킬의 개발도 포함됩니다.

  • (a) 사회적 자본의 구축: 호의와 상호작용할 수 있는 안전한 공간을 창출하여 개인 간의 관계를 발전시킨다. 
  • (b) 관점 수용: 다른 사람의 관점을 이해하고 포용하는 능력
  • (c) 우선 순위 교섭
  • (d) 갈등 관리: 그룹 간 차이를 완화하기 위함

They also include developing skills in four areas103:

  • (a) social capital building, to develop relationships between individuals by creating goodwill and a safe space to interact;
  • (b) perspective taking, which is the ability to understand and embrace others' viewpoint104;
  • (c) negotiating priorities; and
  • (d) managing conflicts, to mitigate intergroup differences.103 

마지막으로 Paradis와 Whitehead는 학습자의 수준과 경험을 고려한 개발상 적절한 이니셔티브에 초점을 맞추어 권력과 갈등에 대한 명확한 대응을 제안합니다. 이러한 전략을 적용하는 것은 전문성과 전문성의 차이를 해소하는 데 도움이 될 수 있기 때문에, 프로간 팀이 가장 중요한 사회적 그룹이 될 수 있습니다. 

Finally, Paradis and Whitehead propose explicitly addressing power and conflict, focusing on developmentally appropriate initiatives that take learners' level and experience into account.100 Applying these strategies may help bridge professional and specialty differences so that the interprofessional team can become the most salient social group.83, 105

4 사회적 정체성과 편견에 관한 교차 렌즈
4 AN INTERSECTIONAL LENS ON SOCIAL IDENTITIES AND BIAS

이전 섹션에서는 인종, 성별 및 직업과 관련된 사회적 정체성이 서로 분리된 의료교육의 편견과 불평등에 어떻게 기여하는지에 대해 논의했으며, 이는 문헌에서 어떻게 표현되는지를 반영했다. 그러나 사회심리학자들이 지적하고 아이다의 사례에서 입증되었듯이, 여러 사회적 정체성은 종종 개인의 경험에 동시에 영향을 미치며, 이는 여러 사회 집단에서 개인의 소외를 초래한다. 이러한 주변부화의 집합aggregated marginalisation은 [교차성]의 관점에서 이해할 수 있다. 예를 들어, 아이다의 인종적 정체성과 성별적 정체성의 교차점은 그녀가 수술 직업에 적합하다는 인식에 영향을 미쳤다. 예를 들어 백인과 여성 등 사회적 정체성이 다른 아이다는 그녀가 접한 소수의 백인 여성 외과의사들로부터 더 많은 격려를 받았을지도 모른다. 그녀는 또한 외과에 더 큰 적합감sense of fit을 가지고 있었을지도 모른다. 
In the previous sections, we discussed how social identities related to race, gender, and profession contribute to bias and inequity in medical education separate from each other, reflecting how they are represented in the literature. However, as noted by social psychologists and demonstrated in Aida's example, multiple social identities often influence individuals' experience simultaneously,2-4 which leads to marginalisation of individuals from multiple social groups. This aggregated marginalisation can be understood through the lens of intersectionality. For instance, the intersection of Aida's racial and gender identities affected her perceived fit for a career in surgery. With a different set of social identities, for example white and female, Aida may have received more encouragement from the few white female surgeons she encountered. She may also have had a greater sense of fit for a career in surgery.

레지던트 기간 동안, 아이다가 간호사들과 싸우는 것은 간호사들이 아이다의 여러 사회적 정체성을 받아들이지reconcile 못했기 때문일 것이다. 실제로, 이러한 정체성은 내부 의사나 팀장의 원형 이미지에 맞지 않습니다. 동시에, 아이다는 자신의 개인적 정체성과 직업적 정체성을 조화시키기 위해reconcile 고군분투할 수도 있고, 정체성의 충돌한다고 보았을 수도 있다. [내집단의 구성원이라고 인식하지 않으면서, 내집단에 속해 있는] 이러한 [이중 의식double consciousness]은 [정체성 부조화identity dissonance]를 촉발할 수 있으며, [정체성 부조화]란 [양립할 수 없는 것처럼 보이는 사회적 정체성 사이에서 개인이 경험하는 내면의 갈등]을 의미한다. 

During residency, Aida's struggles with nurses may have been rooted in nurses' inability to reconcile Aida's multiple social identities. Indeed, these identities do not fit the prototypical image of an internist or a team leader.64 At the same time, Aida may struggle to reconcile her personal and professional identities and may view them as conflicting. This double consciousness of belonging to the medical in-group while not being recognised as a member of the group30, 41, 42 can trigger identity dissonance, which refers to internal conflicts individuals experience between social identities that seem irreconcilable.106

5 사회적 정체성의 교차점에 대처함으로써 편견과 불평등을 완화한다.
5 MITIGATING BIAS AND INEQUITIES BY ADDRESSING THE INTERSECTION OF SOCIAL IDENTITIES


따라서 교차성은 여러 사회적 정체성이 그룹 간 관계에 어떻게 영향을 미치는지, 그리고 의학 교육 중 개인의 경험에 어떻게 영향을 미치는지에 대한 이해를 깊게 하는데 도움을 준다. 그것은  한 번에 하나의 사회적 정체성에 초점을 맞추기 보다는, 편견의 여러 원천을 고려함으로써 [편견과 불평등]을 다루기 위한 포괄적인 접근을 이끌 수 있다.

Intersectionality thus helps deepen our understanding of how multiple social identities impact intergroup relations and influence an individual's experience during medical education. It can also guide a more comprehensive approach to addressing bias and inequities, taking different sources of such bias into account rather than focusing on one social identity at a time.

의학 교육의 서로 다른 사회적 정체성과 관련된 편견에 대한 고립된 문헌에서 추론하여, 우리는 모든 사회적 정체성에 대한 편견을 완화하기 위한 [세 가지 주요 전략]을 제안한다. 

Extrapolating from the siloed literatures on bias related to different social identities in medical education, we propose three main sets of strategies to mitigate bias across all social identities.

첫 번째는 개인에 초점을 둔다. 사회적 정체성과 정체성들의 교차성에 대한 인식을 불러일으키기 위한 전략으로서, 내집단과 외집단의 차이를 탐색하는 기술을 기르는 것이다. [스스로를 어떤 사회 집단과 동일시하고 있는지, 그리고 이것이 어떻게 내집단에 대한 선호와 외집단에 대한 편견을 야기할 수 있는지를 인식하는 것]은 편견의 근원이 무엇이든 편견을 완화하기 위한 중요한 첫 번째 단계이다. IPE 문헌에 의해 제안된 그룹 간의 차이를 해결하기 위한 개인 스킬 개발에는 소셜 캐피털 구축, 관점 검토, 협상 및 갈등 관리가 포함됩니다. 보건 분야의 모든 학습자와 실무자가 [자신의 암묵적인 편견과 신념에 민감]하다면, 그들은 자신의 사회적 정체성이 사회 집단 내에서 어떻게 교차하는지를 더 잘 알게 될 것이다. 이 목표를 달성하기 위해서는 사회적 정체성과 교차성을 다루는 관련 학습 활동을 핵심 의과대학 커리큘럼, 레지던트 트레이닝 및 교직원 개발에 통합해야 합니다.

The first set focuses on individuals and includes strategies to generate awareness of social identities and their intersection to build skills to navigate in-group versus out-group differences. Recognising what social groups individuals identify with and how this can lead to in-group preference and bias towards out-groups is an important first step in mitigating bias regardless of the source.98 Individual skill development to navigate differences between groups proposed by the IPE literature include social capital building, perspective taking, negotiation and conflict management.100, 103 If all learners and practitioners in the health professions are sensitised to their implicit biases and beliefs, they may become more aware of how their own social identities intersect within social groups.16 To reach this goal, relevant learning activities addressing social identity and intersectionality need to be integrated into core medical school curriculum, residency training and faculty development.

편견을 완화하기 위한 두 번째 전략은, [특정 사회 집단에 초점]을 두고, 내집단 결속을 강화하고 [집단 내 교차하는 사회적 정체성을 포함하는 집단적 정체성]을 구축하는 것을 목표로 한다. 이러한 전략에는 [그룹 내 멘토쉽]이 포함되어 있으며, 멘티로 하여금 자신을 그룹과 점차적으로 동일시하면서 신뢰를 쌓는 데 도움이 될 수 있습니다. 또한 사회집단(CAUCUSes) 내에서의 논의는 내집단과 외집단의 사회적 정체성과, 그에 따른 편견과 불평등과 관련된 이슈를 검토하는 것을 포함한다. 이러한 전략은 내집단을 '낙인 찍힌 사회적 정체성과 연계된 부정적인 고정관념의 타당성, 관련성, 수용성에 문제를 제기하는' [정체성-안전한 환경identity-safe environment]으로 전환하는 데 도움을 줄 수 있다. [정체성-안전 환경]에서는 고정관념과 사회적 정체성 위협이 감소하며, (성별, 인종 또는 기타 범주와 관련된) [사회적 정체성을 직업적 정체성에 필수적인 것]으로 간주한다. 이 목표를 달성하기 위해, 교차 멘토링 프로그램은 학습자가 그룹 내 멤버 자격을 획득할 수 있도록 의료 커리큘럼 전반에 걸쳐 구현되어야 한다. 이러한 프로그램에는 여러 사회적 정체성을 공유하는 개인뿐만 아니라 그룹 간의 차이를 메우기 위한 장비를 갖춘 개인도 포함되어야 하며, 훈련생의 그룹 구성원으로 인정받는 느낌을 지원해야 한다. 

A second set of strategies to mitigate bias focuses on specific social groups, and aims to strengthen in-group cohesion and build a group identity inclusive of social identities that intersect within the group. These strategies include mentorship within in-groups, which can help individuals build trust as they progressively identify with their groups.39, 47, 48, 107 They also include discussions within social groups (caucuses) to examine issues associated with social identities for both the in- and the out-group and the resulting bias and inequities.70, 108 These strategies may help transform in-groups into identity-safe environments that ‘challenge the validity, relevance, or acceptance of negative stereotypes linked to stigmatized social identities’.109 In identity-safe environments, stereotype and social identity threat are reduced and social identities associated with gender, race or other categories are viewed as integral to professional identities.110 To achieve this goal, intersectional mentorship programmes need to be implemented throughout the medical curriculum to support learners gain membership into in-groups. These programmes need to include individuals who share multiple social identities as well as individuals who have different social identities but are equipped to bridge intergroup difference, to support trainees' feeling recognised as members of the group.39

세 번째 전략은 [그룹 간 관계]를 대상으로 할 수 있습니다. Allyship은 그룹 간 차이를 해소하는 데 기여할 수 있습니다. [소속감을 기르는 것]이 그룹 간 편견의 문제에 대한 가장 생산적인 해결책일 수 있기 때문에, [팀 성찰성]을 길러줌으로써 서로 다른 사회적 집단에 속한 개인을 [더 큰 집단larger group에 소속되어있다는 강한 멤버십 인식]을 발달시키는데 도움을 줄 수 있다. 또한, 사회적 집단 간의 갈등과 권력을 address하는 것도 집단 간의 관계를 개선할 수 있다. 이를 달성하기 위해 편견을 완화하려는 기존 이니셔티브(예: IPE, 다양성, 형평성 및 포함에 대한 훈련, 성평등 훈련)를 그룹 간 관계 개선을 광범위하게 모색하는 훈련에 결합할 수 있다. 예를 들어, 전문 교육 프로그램은 학습자가 서로 다른 전문적 정체성을 어떻게 보유하고 있는지 성찰하도록 장려할 수 있지만, 전문적 경계를 다지기 위해 그룹 내 소속감을 발전시키는 데 도움이 될 수 있는 다른 여러 정체성을 공유할 수 있습니다.
A third set of strategies can target intergroup relations. Allyship may contribute to bridging intergroup differences.38, 70 Team reflexivity may also help individuals from different social groups develop a stronger sense of membership into the larger group,102 as fostering belongingness may be the most fruitful solution to problems of intergroup bias.111 Additionally, addressing power and conflict between social groups may improve intergroup relations.100 To accomplish this, existing initiatives that seek to mitigate bias (e.g. IPE; trainings in diversity, equity, and inclusion; gender equity trainings) could be combined into trainings that broadly seek to improve intergroup relations. For instance, interprofessional education programmes may encourage learners to reflect upon how they hold different professional identities but share multiple other identities that can help them develop in-group belongingness to bridge professional boundaries.

이 세 가지 주요 전략은 그룹 간 편견의 사회적 측면에 초점을 맞추고 있다. 이 논문의 범위를 벗어나지만, 이를 뒷받침하는 구조적 변화 없이는 공정한 학습 환경을 조성하는 데 성공하지 못할 것이다. 그러나 우리는 사회적 정체성의 교차점에 대처함으로써 편견과 불평등을 완화하기 위한 전략을 결합하는 우리의 비전이 아이다의 궤적을 바꾸기 시작하는 길을 제공한다고 믿는다. 만약 이 모든 전략을 사용한다면,

  • 아이다는, [사람은 독특한 방식으로 그들의 경험을 형성하는 여러 개의 교차하는 사회적 정체성을 가지고 있다는 것]을 모든 사람이 인식하는 환경에 합류하게 될 것이고, 그녀는 의료계에서 더 강한 소속감을 느끼게 될 것이다.
  • 동료들과 함께 그녀는 자신의 관점을 공유하고, 다른 사람들을 이해하고, 의견 불일치를 토론하는 기술을 개발했습니다.103
  • 아이다의 멘토들은 공동의 그룹mutual group 멤버쉽을 바탕으로 그녀와 공감하고, 인식에 따라 가장 적합하다고 생각되는 기술이나 관심사에 맞는 전문성을 찾도록 격려합니다.
  • 아이다의 레지던트 기간 동안, 팀원들은 그녀의 인종과 성별을 기준으로 그녀를 판단하기 보다는 그녀의 전문성과 능력을 중심으로 평가했을 것이다.
  • 마지막으로, 충돌이 있는 경우, 아이다와 그녀의 팀은 상호 이익이 되는 해결책을 찾기 위해 팀의 성찰성을 발휘할 것이다.
  • 그 결과, 아이다는 정체성의 불협화음을 경험하지 않을 수 있으며, Self-aware한, 자신과 다른 사람의 여러 정체성을 수용하는, 편견에 대처할 수 있는 능력을 갖춘, 자신감있고 협력적인 의사로 발전할 수 있는 공간과 지지를 받을 것이다.

These three main sets of strategies focus on social aspects of intergroup bias, and although beyond the scope of this article, they will not be successful in creating equitable learning environments without structural changes to support them. However, we believe that our vision for combining strategies to mitigate bias and inequities by addressing the intersection of social identities offers an avenue to start changing Aida's trajectory. If all these strategies were used,

  • Aida would join an environment in which everyone is aware that they hold multiple intersecting social identities that shape their experiences in unique ways and she would feel a stronger sense of belonging in the medical community.111 
  • Together with her peers, she would develop skills to share her perspective, understand others, and discuss disagreements.103 
  • Aida's mentors would identify with her based on mutual group memberships and would encourage her to find the specialty that truly matches her skills and interests rather than one that she appears most fit for based on perceptions.474864107 
  • During Aida's residency, team members would appreciate her professionalism and competence rather than judging her based on her racial and gender identities.
  • Finally, in situations of conflict, Aida and her team would engage in team reflexivity to find mutually benefitting solutions.102 
  • As a result, Aida may not experience identity dissonance106 and would have the space and support to develop into a confident, collaborative physician who is self-aware, embraces her own and others' multiple identities and is equipped to address bias.

우리는 이 대체 궤적이 지나치게 이상적으로 들릴 수 있고, 우리의 비전이 의학 교육의 불평등 문제를 완전히 다루기에 충분하지 않을 수 있다는 것을 인식한다. 그러나 우리의 비전이 의학 교육자들에게 공평하고 지원적인 학습 환경을 촉진하는 방법에 대한 아이디어를 제공할 수 있기를 바랍니다. 여기서는 편견을 유발하는 흔한 세 가지 주요 사회적 정체성(인종, 성별 및 직업)에 초점을 맞췄지만, 교차성은 모든 사회적 그룹에 대한 인정appreciation을 필요로 한다. 사회 경제적 지위나 성적 성향과 같은 다른 사회적 정체성이 어떻게 편견을 이끌어내는지 조사하는 것은 학습자와 실무자의 경험을 형성하기 위해 서로 다른 사회적 정체성이 어떻게 교차하는지에 대한 우리의 이해를 풍부하게 할 수 있다. 게다가, 의학 교육에서 사회적 정체성이 어떻게 교차하는지에 대한 우리의 이해는 이 영역의 경험적 연구 부족으로 인해 제한된다. 의학 교육에 참여하는 모든 사람을 지원하는 방법을 완전히 이해하기 위해서는 여러 정체성을 가진 사회 집단을 명시적으로 조사하는 더 많은 연구가 필요하다.
We recognise that this alternative trajectory may sound overly idealistic and that our vision may not be sufficient to fully address issues of inequity in medical education. However, we hope that our vision will provide medical educators with ideas for how to promote equitable and supportive learning environments for all. Although we have focused on three main social identities that commonly elicit bias in this article (race, gender and profession), intersectionality requires appreciation of all social groups.20, 21 Examining how other social identities such as socio-economic status112 or sexual orientation elicit bias can enrich our understanding of how different social identities intersect to shape learners' and practitioners' experiences. Furthermore, our understanding of how social identities intersect in medical education is limited by lack of empirical studies in this domain. More research that explicitly examines social groups with multiple identities is needed to fully understand how to support everyone entering medical education.

6 마무리 코멘트
6 CONCLUDING COMMENTS

Burford가 의학 교육 커뮤니티에 사회적 정체성 접근방식을 도입함에 따라 다양한 사회적 정체성에 대한 풍부한 연구가 이루어졌습니다. 그러나 이 연구는 한 번에 하나의 사회적 정체성에 초점을 맞추는 경향이 있다. 이 기사에서, 우리는 그러한 연구가 교차성의 관점에서 어떻게 보일 수 있는지를 분석했다. 우리는 의학 교육의 연구들이 인종, 성별, 직업적 정체성과 관련된 불평등을 어떻게 논의하는지, 그리고 이러한 불평등을 해결하기 위해 채택된 전략을 검토했다. 우리는 서로 다른 사회적 정체성에 대한 편견을 완화하기 위한 기존 전략이 교차성을 수용하고 모두에게 공평한 학습 환경을 촉진하기 위해 어떻게 결합될 수 있는지에 대한 비전을 제안했다. 우리는 결코 우리의 비전이 복잡하고 얽혀 있으며 오랜 역사적 뿌리를 가진 근본적인 문제에 대해 신속하고 완전한 해결책을 제공한다는 것을 의미하는 것은 아니다. 그러나 우리는 교차성을 수용하고 사회적 정체성에 걸쳐 편견을 해소하는 전략을 채택하는 것이 올바른 방향으로 가는 하나의 결실 있는 단계가 될 수 있다고 믿는다.

Burford's introduction of the social identity approach to the medical education community1 has generated rich research into different social identities. Yet this research has tended to focus on one social identity at a time. In this article, we analysed how such research may be viewed through the lens of intersectionality. We examined how studies in medical education discuss inequities pertaining to racial, gender, and professional identities and the strategies that have been adopted to address these inequities. We proposed our vision for how existing strategies to mitigate bias towards different social identities may be combined to embrace intersectionality and promote equitable learning environments for all. We by no means aim to imply that our vision offers a quick or complete fix for the underlying problems, which are complex and intertwined, many with long historic roots. Yet we believe that adopting strategies that embrace intersectionality and seek to address bias across social identities can be one fruitful step in the right direction.


Med Educ. 2022 Jan;56(1):82-90.

 doi: 10.1111/medu.14602. Epub 2021 Aug 24.

Towards equitable learning environments for medical education: Bias and the intersection of social identities

Affiliations collapse

Affiliations

1Department of Pediatrics, University of California San Francisco, San Francisco, California, USA.

2Unit of Development and Research in Medical Education, Faculty of Medicine, University of Geneva, Geneva, Switzerland.

3Department of General Pediatrics, Children's Hospital, Geneva University Hospitals, Geneva, Switzerland.

4Department of Education, Innovation and Technology, Baylor College of Medicine, Houston, Texas, USA.

PMID: 34309905

DOI: 10.1111/medu.14602

Abstract

Context: Medical educators are increasingly paying attention to how bias creates inequities that affect learners across the medical education continuum. Such bias arises from learners' social identities. However, studies examining bias and social identities in medical education tend to focus on one identity at a time, even though multiple identities often interact to shape individuals' experiences.

Methods: This article examines prior studies on bias and social identity in medical education, focusing on three social identities that commonly elicit bias: race, gender and profession. By applying the lens of intersectionality, we aimed to generate new insights into intergroup relations and identify strategies that may be employed to mitigate bias and inequities across all social identities.

Results: Although different social identities can be more or less salient at different stages of medical training, they intersect and impact learners' experiences. Bias towards racial and gender identities affect learners' ability to reach different stages of medical education and influence the specialties they train in. Bias also makes it difficult for learners to develop their professional identities as they are not perceived as legitimate members of their professional groups, which influences interprofessional relations. To mitigate bias across all identities, three main sets of strategies can be adopted. These strategies include equipping individuals with skills to reflect upon their own and others' social identities; fostering in-group cohesion in ways that recognise intersecting social identities and challenges stereotypes through mentorship; and addressing intergroup boundaries through promotion of allyship, team reflexivity and conflict management.

Conclusions: Examining how different social identities intersect and lead to bias and inequities in medical education provides insights into ways to address these problems. This article proposes a vision for how existing strategies to mitigate bias towards different social identities may be combined to embrace intersectionality and develop equitable learning environments for all.

의학교육의 사회적 권력과 위계에 대해 생각하기(Med Educ, 2021)
Thinking about social power and hierarchy in medical education
Meredith Vanstone1,2 | Lawrence Grierson1,2

 

1 도입
1 INTRODUCTION

[사회적 권력]은 단일한 권위적인authoritative 정의를 가지고 있지 않다. 우리는 [권력]이 [다른 사람에게 영향을 미치는 능력]이라는 견해에 동조한다. 이러한 관점은 권력이 작동하는 방법 중 하나가 [위계 구조]의 확립과 운영을 통해서라는 것을 알 수 있게 한다. [계층][사람이나 집단을 사회적 자원의 소유에 따라 층화stratifies하는 조직적 형태organizational form]이다. 임상 환경은 매우 위계적이며, 임상 작업과 학습은 상호 작용에 좌우되며, 이는 의료 교육과 직접적으로 관련된 권력과 위계를 고려하게 한다.4
Social power has no single authoritative definition. We align ourselves with the view that power is the ability to influence others.1, 2 This perspective allows us to see that one of the ways power operates is through the establishment and operationalization of hierarchies, an organisational form that stratifies people or groups based on their possession of social resources.3 The clinical environment is intensely hierarchical, and clinical work and learning are contingent on interaction, which makes consideration of power and hierarchy directly relevant to medical education.4

본 논문에서 우리는 의학교육에 대한 권력과 위계의 여러 개념화의 유용성에 대한 반성을 제공하며, 이러한 개념이 의학 교육 문헌에 암묵적으로 나타난 몇 가지 방법을 다룬다. 우리는 이러한 개념의 통합이 생산적일 수 있는 곳에 대한 제안을 제공하며, 의학교육의 위계 내에서 권력이 작동하는 여러 가지 방법에 대한 이해를 제한할 수 있는 일반적인 가정에 반대한다.
In the current paper, we offer reflections on the usefulness of several conceptualizations of power and hierarchy to medical education, addressing some of the ways these concepts have appeared, often implicitly, in medical education literature. We offer suggestions for where the incorporation of these concepts may be fruitful and counter common assumptions that may constrain understanding of the multiple ways power operates within hierarchies in medical education.

2 학제 간 협력의 과제와 기회
2 CHALLENGES AND OPPORTUNITIES OF INTERDISCIPLINARITY

전통적으로, 학계academics는 특정 학문분야disciplines에서 훈련을 받는데, 이는 [수용된 형태의 지식] 주위에 경계를 제공하고, 학문분야 그룹의 규범을 탐색하는 능력으로 '내부자'와 '외부자'를 정의한다. 많은 분야들이 '권력'의 상징적 일반화를 개발했는데, 이는 정교한 이론적 작업을 효과적이고 효율적으로 진행할 수 있도록 하는 크고 복잡한 아이디어 집단을 내부자에게 불러오는 약어이다. 권력에 대한 이러한 이해는 뿌리째 뻗어나가고 때로는 예측할 수 없는 방식으로 교차하는 정원 뿌리처럼 다양한 장소에서 성장해 왔습니다. 많은 학문들은 그들 자신의 이론이나 권력의 개념화를 신중하게 다루며, 소중한 유산prized heritage이나 하이브리드 변종을 개발한다.
Traditionally, academics are trained in a particular discipline, which provides a boundary around accepted forms of knowledge, defining ‘insiders’ and ‘outsiders’ by their ability to navigate the norms of the disciplinary group. Many disciplines have developed their own symbolic generalisation of ‘power’, a shorthand that calls to insiders a large and complex body of ideas that allow sophisticated theoretical work to proceed effectively and efficiently.5 These understandings of power have grown from a variety of locations, like garden roots that branch rhizomatically and intersect in sometimes unpredictable ways. Many disciplines carefully tend to their own theories or conceptualizations of power, developing prized heritage or hybrid varieties. 


의학 교육과 같은 [학문 간 분야interdisciplinary field]에서 학자들은 지식을 창출하고 실질적인 문제를 해결하기 위해 다양한 분야에서 통찰력과 전문성을 가져옵니다. 따라서 우리는 권력이 무엇이고, 권력이 어떻게 작동하고, 우리 분야에서 어떻게 사용될 수 있는지에 대한 내부 합의가 부족하다. 이러한 합의의 부족이 권력이라는 개념이 무관하다는 의미는 아니다. 의학교육 이외의 교육 연구는 권력이 학습과 평가와 관련을 갖는 다양한 방법을 지적합니다. 비록 몇몇 의학 교육 학자들이 이러한 이론들에 정통하고, 그들의 학술활동에 유의미하게 포함시키지만, 권력에 대한 개념은 전통적으로 의학에 대한 질문을 외부인들이 들여다보거나, [권력에 대한 미묘한 사회과학연구]를 수행하기 위해 의학 맥락을 사용하는 다른 분야의 연구자들에 의해 받아들여져 왔다. 최근 권력 이론에 관여하는 의학 교육 연구자의 수가 증가하고 있지만, 역사적으로 보자면, 결정적 관련이 있을 듯한 의학 교육 연구에서 권력이 누락되어 있는 예가 더 많다. (의학 교육의 힘의 부재에 대한 해설은 파라디스, 화이트헤드, 도네토 참조).

In an interdisciplinary field like medical education, scholars bring insights and expertise from a variety of locations to generate knowledge and solve practical problems.6, 7 Accordingly, we lack internal agreement about what power is, how it operates and how it can be used in our field. This lack of consensus does not reflect irrelevance of the concept. Education research outside of medicine points to the many ways in which power is relevant to learning and assessment.8, 9 Although some medical education scholars are well versed in these theories and incorporate them meaningfully into their scholarship, the concept of power has traditionally been brought to bear on questions of medical education by outsiders looking in, or researchers in other fields using the context of medicine to conduct nuanced social science research about power.10-13 Although there has been a recent increase in the number of medical education researchers engaging with theories of power, historically there are many more examples of power remaining absent from medical education inquiry where it seems crucially relevant (see Paradis and Whitehead14 and Donetto15 for commentaries on the absence of power in medical education).

여러 가지 면에서 우리는 우리 스스로도 의학교육연구라는 학제간 분야에 진출한 사람으로서 [사회적 권력과 그 관련성에 대한 모호한 이해]를 대변한다고 생각한다. 이 분야의 많은 사람들처럼, 우리는 [사회적 권력에 대한 분야 자체의 개념diciplinary conception이 없는 전통]에서 훈련을 받았습니다. 의학 교육 연구를 통해, 우리는 많은 상호작용적 현상에서 [사회적 구조]라는 구인이 공명한다는 것을 서서히 식별하기 시작했습니다.

  • 아급성 환자의 교육적 가치를 확인하고,
  • 예상되는 증거를 이용할 수 없을 때 진단 의혹을 전달하고,
  • 학대 및 학대를 보고하고,
  • 의과대학 입학 정책과 관행을 제정하고,
  • 의학 학습자가 임상 계층 내에서 낮은 지위를 어떻게 경험하는지 이해한다. 

In many ways, we feel we represent the medical education researchers who entered this interdisciplinary field with only a vague understanding of social power and how it might be relevant. Like many in this field, we trained in traditions that do not have their own disciplinary conception of social power. Through our medical education research, we have slowly begun to identify the resonance of this construct for many interactional phenomena:

  • ascertaining the educational value of subacute patients,16 
  • communicating diagnostic suspicions when expected evidence is not available,17 
  • reporting mistreatment and abuse,18 
  • enacting policies and practices of medical school admissions,1920 and
  • understanding how medical learners experience their low-status position within the clinical hierarchy.2122 

우리는 유용하고 공명적이지만 권력의 개념에 언제 어디서 기대야 하는지, 그리고 어떤 학문분야적 개념에 관여해야 하는지 해석하는 것이 종종 어렵다는 것을 알게 되었습니다. 이를 위해 우리는 다양한 개념과 그 사이의 긴장과 갈등과 씨름하고 있습니다. 여기서부터 우리는 의학교육의 [인식론적 아비투스]에 대해 다음과 같이 말하고 있다.

We have found that while useful and resonant, it has often been difficult to parse when and where to lean into the concept of power–and which disciplinary concepts of power to engage. To do this, we have grappled with the multiplicity of concepts, and the tensions and conflicts between them. It is from this location that we offer the following to the epistemic habitus of medical education.



Albert와 Paradis에 의해 기술된 '인식론적 아비투스Epistemic habitus'는 [과학적 실천이 사회화에 의해 형성되는 방식]을 가리키며, 각 분야마다 [과학, 그리고 과학이 어떻게 수행되어야 하는지에 대한 암묵적인 가정]으로 운영된다. 우리는 [권력과 위계]가 의학 교육 연구자들이 던지는 많은 질문과 관련이 있기 때문에, 의학 교육 연구의 틀과 수행에 있어 명시적으로 고려되어야 한다는 요구를 받아들인다. 이를 운용하는 최선의 방법은 연구자의 개별 주제와 이론적 헌신theoretical commitments에 따라 달라집니다. 이 오퍼링에는 모든 학제간 연구와 마찬가지로 취약점이 있으며, 학제간 그룹에 유용한 정보를 제공하려고 할 때 개별 학제의 기준을 충족하지 못할 수 있습니다. 우리는 하나의 일관성 있는 통합(사실 불가능하다고 생각한다)을 제공하는 것이 아니라, 오히려 '권력'이 의학 교육 학술활동에 유용할 수 있는 몇 가지 방법의 스냅숏을 제공한다. 아마도 더 정확히 말하면, 우리는 권력과 계급에 관한 몇 가지 일반적인 가정에 관심을 끌어내고자 하며, 이 분야의 의학 교육 연구를 제약하고 있다고 생각하기 때문이다

‘Epistemic habitus’, as described by Albert and Paradis, refers to the way that scientific practices are shaped by socialisation, wherein each field operates with a set of tacit assumptions about science and how it should be carried out.23 We pick up the call that power and hierarchy are relevant to many of the questions medical education researchers ask and so should be granted explicit consideration in the framing and conduct of medical education research.14, 15, 24 The best way to operationalise this will vary, being dependent on the individual topics and theoretical commitments of the researchers. There is a vulnerability in this offering, as with all interdisciplinary research, that in attempting to present something of use to an interdisciplinary group, we may fail to meet the standards of individual disciplines. We do not seek to offer a single coherent synthesis—indeed we believe this to be impossible—but rather a snapshot of some of the ways power may be useful to medical education scholarship. Perhaps more pointedly, we wish to draw attention to some common assumptions about power and hierarchy, which we believe are constraining medical education research in this area.

3 사회적 권력이란 무엇인가?
3 WHAT IS SOCIAL POWER?

[사회적 권력]은 다양한 방식으로 발전된 복잡한 개념이다. 어떤 사람들은 주권력sovereign power 또는 다른 사람에 대한 권력power over을 통해 '다른 사람의 행동에 영향을 미치는 능력' 또는 [다른 사람의 생각, 감정 또는 행동에 영향을 미치기 위하여 자신의 의지will를 사용하는 방법]으로 이해한다. 다른 개념화에서 권력은 [사회적 관계에서 자원의 비대칭적 통제력] 또는 [모든 상호작용을 통해 흐르는 확산된 힘으로서, (다른 어떤 것보다) 진리와 지식에 대한 인식에 영향을 줌으로써 개인을 형성]하는 것이라고 기술된다. 이러한 정의를 비교할 때, 일반적으로 학자들은 이러한 측면 중 하나를 전제로 하지만, 권력은 상호작용(마이크로) 및 구조(매크로) 수준에서 모두 작동한다는 점에 주목한다.
Social power is a complex concept that has been developed in diverse ways. Some understand it through the lens of sovereign power, or power over others, as ‘the ability to influence the behaviour of others’2 or a way of using one's will to affect the thought, emotion or actions of others.1, 25 In other conceptualizations, power has been described as asymmetric control of resources in social relations3, 26 or a more diffuse force that flows through all interactions, generatively shaping individuals by (among other things) impacting their perception of truth and knowledge.27 In comparing these definitions, we note that power operates on both an interactional (micro) and structural (macro) level, although typically scholars foreground one of these aspects.

많은 학자들은 권력이 존재하며 사회적 관계 내에서만 행사된다는 것에 동의할 것이다; 권력은 개인의 영구적인 측면이 아니다. 어떤 관계에서는 [영향력을 행사할 수 있는 권력을 주는 지식, 역할 또는 자원]이 다른 관계에서는 관련이 없을 수 있습니다. 예를 들어, 상급 레지던트가 의대생에 대해 가지고 있는 권력은, 그 사람이 담당 의사에게 보고하면 소멸되고, 그들이 가족 구성원의 주택 개조 프로젝트를 도울 때 완전히 부재할 수 있습니다. 권력의 관계적 맥락을 인정하면서, 우리는 [권력의 구조적이고 영속적인 측면]이 [개인의 사회적 관계를 넘어 존재한다]는 것을 인식해야 한다. 예를 들어, [인종과 성별과 같은 사회적 정체성]은 많은 관계에 걸친 권력 관계를 유발한다.
Many scholars would agree that power exists and is exercised only within social relationships; it is not an enduring aspect of an individual.28 The knowledge, role or resources that give a person power to influence in one relationship may not be relevant in a different relationship.3, 28 For example, the power a senior resident has over medical students dissipates when that person reports to their staff physician and may be completely absent when they help a family member with a home renovation project. While acknowledging the relational context of power, we must also recognise that some structural and enduring aspects of power exist beyond individual social relationships. For example, social identities such as race and gender invoke power relations across many relationships.

무엇보다 우리가 [지식 체계와 통제 시스템을 생산하기 위해 구조적 방식이 작동한다는 것]을 고려한다면, [사회적 상호작용에 권력이 편재함ubiquity of power]은 명백하다. [구조적인 수준에서 권력의 작동]에 초점을 맞춘 학자들은 [사회 구조]가 [권력이 작동하는 것]을 정상화하고, 그러한 [구조 속에 포합embedded되어 있는 관찰자]이 [종종 권력을 보지 못하게 만든다는 것]을 강조할 것이다. 푸코는 이것을 권력의 '모세혈관'으로 묘사한다. 권력은 매우 미묘하고 광범위하게 [사고 및 행동 방식을 확립]하기에, 권력은 사회적 생활에서 감지할 수 없는 부분이 된다. 따라서 권력이란 것은 항상 의식적으로 또는 의도적으로 행사되는 것은 아니며, 그 메커니즘이 숨겨져 있을 때 가장 큰 영향을 미칠 수 있습니다. 

The ubiquity of power in our social interactions is especially evident when we consider the structural ways it operates to produce systems of knowledge and control.27 Scholars who focus on the operation of power at a structural level would emphasise that social structures normalise the operations of power, making them often invisible to observers embedded within those structures.29 Foucault would describe this as the ‘capillary’ aspect of power, establishing ways of thinking and acting so subtly and pervasively that they become an imperceptible part of social life.1, 27 Power is therefore not always wielded consciously or intentionally and can be at its most impactful when its mechanisms are hidden.30

4 위계/계층이란?
4 WHAT IS HIERARCHY?

권력이 작동하는 방법 중 하나는 [권력의 구조적 특징]을 [메소 수준의 조직 형태]로 변환할 수 있는 잠재력을 가진 위계적 구조를 확립하고 유지하는 것이다. 이러한 맥락에서, 우리는 [위계]를 [자원의 통제나 영향력과 같은 '가치 있는 사회적 차원에 대한 개인 또는 집단의 순위rank order']로 이해한다. 위계는 임상 환경의 잘 알려진 특징이다. 수십 년 동안, 사회학자들은 의학의 [위계적 조직]과 이 ['수직적 계층화vertical stratification']가 제공하는 기능에 대해 의문을 제기해 왔다. Friedson이 설명한 바와 같이 의료계는 [지식과 역할에 따라 의사결정을 내리고 집행할 수 있는 권력]을 부여함으로써 [표준을 만들고 집행]할 수 있습니다. 이것은 의료의 전문직업적 자율성과 자치에 필수적이다.
One of the ways power operates is by establishing and maintaining hierarchies, which have the potential to translate structural features of power into meso-level forms of organisation. In this context, we understand hierarchy to be a ‘rank order of individuals or groups with respect to a valued social dimension’ such as control of resources or ability to influence.3 Hierarchies are a well-recognised feature of the clinical environment. For decades, sociologists have interrogated the hierarchical organisation of medicine and the function that this ‘vertical stratification’ serves.31-33 As Friedson has described, imbuing power to make and enforce decisions based on knowledge and role allows the medical profession to create and enforce standards.31, 34 This is essential to medicine's professional autonomy and self-governance.


다른 학술 기관들은 위계가 어떻게 생성되고 유지되며 기능하는지에 대한 이해가 서로 다를 것이다. 의학 교육에서, [상호작용적 권력]을 가진 학자들이 가지고 있는 계급의 개념은 특히 생성적 렌즈generative lens일 수 있다. [상호작용적 권력]에 초점을 두고 본다면, [위계(구조)]가 [사회 환경 내에서 성공하기 위해 개인과 타인의 행동을 통제하도록 장려한다]는 견해를 갖게 된다. 이러한 관점에서, [위계(구조)]는 [공식적으로 제도화instituted]되고, [비공식적으로 개발]되며, [명시적이고 규칙에 의해 설명]되거나, [암묵적이고 주관적으로 이해]될 수 있다. 위계에 대한 이러한 이해는 권력이 통치되어야 할 합법성과 합의된 동의consensual agreement를 통해 작동한다는 것을 암시한다. 이러한 [합의적 참여consensual participation]의 개념은 (학습자가 종종 임상 작업장의 사회적 환경 내에서 이점을 얻기 위해, 의료의 위계에 참여하고자 하는) 의학교육과 매우 관련이 있습니다. 그러나 이러한 관점은 [인종, 성별, 계급 및 소득과 관련된 구조적 형태의 권력]과 같이, 임상적 위계에 결정적으로 중요한 것으로 표시된 다른 유형의 권력에서는 벗어날 것이다.

Other bodies of scholarship will offer different understandings of how hierarchies are generated, sustained and function. In medical education, the notion of hierarchy held by scholars of interactional power may be a particularly generative lens. A focus on interactional power may lead to a view that hierarchies encourage individuals to govern their own and others' behaviour in order to succeed within the social environment.3 In this view, hierarchies can be formally instituted and informally developed and explicit and delineated by rules or implicit and understood subjectively, taken-for-granted. This understanding of hierarchy implies that power operates through legitimacy and consensual agreement to be governed.2 This concept of consensual participation is very relevant to medical education, where learners are often eager to engage the medical hierarchy in order to gain advantage within the social environment of the clinical workplace.21, 35, 36 However, this perspective will elide from view other types of power that some mark as crucially important to clinical hierarchies, such as structural forms of power relevant to race, gender, class and income.11, 37-39

위계에 대한 이러한 견해와 일부 대안 사이의 대조를 설명하기 위해, [사회적 권력에 대한 서로 다른 이해를 가진 두 집단]이 위계를 어떻게 고려할 수 있는지 생각해보자.

  • 권력에 대한 [구조주의자]의 견해에 동의하는 사람들은 계층화된 사회 구조의 다원적plural 개념을 옹호할 가능성이 높으며, [일부 구조와 관계]가 [다른 구조와 관계]보다 더 강력하기 때문에 계층화된 사회 구조가 예시instantiated된다.
  • 하지만 이러한 견해는 [권력은 분산되어] 있으며, [기저 구조나 메커니즘을 통해 흐른다기보다는], 감시, 감독, 판단 및 검사의 결합을 통해 달성되었다고 설명하는 푸코와 같은 [후기 구조주의자]들에 의해 거부된다.

To illustrate the contrast between this view of hierarchy and some alternatives, consider how hierarchy may be considered by two groups with different understandings of social power.

  • Those who subscribe to a structuralist view of power are likely to advocate for a plural conception of stratified social structures, with hierarchies instantiated because some structures and relations are more powerful than others.4041 
  • This view is rejected by post-structuralists such as Foucault who describes power as dispersed and achieved through the confluence of surveillance, supervision, judgement and examination rather than flowing through some underlying structure or mechanism.2740

 

5 위계 구조는 임상 작업과 학습에 어떻게 영향을 미칩니까?
5 HOW DO HIERARCHIES INFLUENCE CLINICAL WORK AND LEARNING?

 

권력은 단지 탄압과 억압에 관한 것이 아니다. 비록 권력이 억제, 처벌, 제한에 사용될 수 있지만, 여러 분야의 학자들은 오랜 기간동안 [권력이 진실을 정의하고, 정상화하고, 주제를 만들고, 칭찬과 보상을 통해 행동을 장려함으로써 어떻게 생산적으로 작용하는지]를 강조해왔다. [조직화된 권력]의 한 가지 형태로서, 우리는 [위계]도 유사한 다양한 효과를 갖는다고 이해한다. [위계]는 단순히 해롭기만 한 것은 아니다. 이러한 다양한 효과는 의료 교육 연구에서는 널리 인식되지 않았다. 의료 교육 연구에서는 대부분의 전형적인 위계 구조가 가볍게만 언급되며, 지위가 낮은 개인에게 개방적인 의사소통을 하지 못하게 함으로서 해를 끼치는 임상 환경의 특징으로 설명된다.
Power is not just about repression and oppression. Although power can be used to constrain, punish and limit, scholars working in multiple traditions emphasise how power operates productively by defining truth, normalising, creating subjects and encouraging action through praise and reward.2, 27, 42 As one organising form of power, we understand hierarchy to have a similar multitude of effects—they are not simply harmful. This multiplicity of effects has not been widely recognised in medical education research, where most typically hierarchy is mentioned only in passing, described as a feature of the clinical environment that harms individuals on low ranks by preventing open communication.

위계는 실제로 해로울 수 있습니다. 임상에서의 위계('지위 비대칭' 또는 '권한 구배'라고도 함)이 상사가 실수를 했을 때 목소리를 내는 것을 꺼리게 함으로써 환자 안전을 저해할 수 있다는 충분한 증거가 있다.36. 위계는 또한 전문가 간 팀워크와 협업을 방해할 수 있다. 임상적 위계의 존재는 교육생들이 무지함, 오류 또는 도움을 요청하기보다는 '가식fake it'을 하도록 장려할 수 있습니다. 위계의 하위 구성원이 되면 훈련생은 상사의 지시가 있을 때 도덕적으로 잘못된 행동을 하게 됩니다. 또한 위계 구조의 확립된 특성을 이해하면 임상 환경에서 [상급자로부터 경험하는 학대 및 괴롭힘을 보고하는 연수생이 거의 없는 이유]를 설명할 수 있습니다. 

Hierarchies can indeed be harmful. There is ample evidence that clinical hierarchies (sometimes called ‘status asymmetry’ or ‘authority gradients’43) can impede patient safety by contributing to a reluctance to speak up when a superior makes an error.36, 44-46 Hierarchies can also obstruct interprofessional teamwork and collaboration.47-50 The presence of the clinical hierarchy may encourage trainees to ‘fake it’ rather than disclose ignorance, error or ask for help.4, 51, 52 Being a low-status member of a hierarchy can result in trainees performing acts they know are morally wrong when instructed by a supervisor.53-55 An understanding of the entrenched nature of hierarchy also helps explain why few trainees report mistreatment and abuse they experience from superiors in the clinical environment.18, 56, 57

우리 분야에서는 [위계 구조의 생산적 영향]과 환자와 학습자 모두에게 [긍정적인 영향의 가능성]은 덜 조사된다.3 우리는 사회질서를 확립하기 위한 위계구조와 예상되는 행동규칙을 이해한다. 의대생들은 이러한 (위계구조의) 규칙을 이해하고 준수하는 것이 전문성을 발휘하고 동료 및 상사와의 성공적인 관계를 발전시키는 중요한 방법이라고 설명했습니다. 위계는 또한 공동의 목표와 역할 기대의 확립을 통해 사회 질서를 제정하고, 효과적인 조화를 촉진할 수 있으며, 환자 안전과 학습자의 편안함에 중요한 기능을 수행하며, 임상 의사결정에 대한 '가장 책임있는' 한 사람을 배치한다. 계층은 임시 팀의 신속한 구성과 효율성을 실현하기 위해 필요한 구조와 안정성을 생성하는 상호작용에 대한 기대를 위한 템플릿을 제공할 수 있습니다. 이 구조는 고위험 및 시간에 쫓기는 상황에서 의사결정과 합의에 필수적인 '신속한 신뢰'를 촉진한다. 
Examined less frequently in our field are the productive effects of hierarchy and the potential of positive impacts for both patients and learners.3 We understand hierarchies to establish a social order and expected rules for conduct. Understanding and adhering to these rules have been described by medical students as an important way to demonstrate professionalism and develop successful relationships with peers and supervisors.21, 58 Hierarchies can also enact social order and facilitate effective coordination through the establishment of shared goals and role expectations,59 which serve a valuable function for patient safety and learner comfort, placing one person as the ‘most responsible’ for clinical decisions. Hierarchies can provide a template for expectations of interaction that generate the structure and stability necessary to enable the quick formation and efficiency of temporary teams. This structure promotes the ‘swift trust’ essential for decision making and agreement in high-risk and time-pressured situations.60

위계 구조는 [학습자가 추구할 표준을 제시하는 롤모델, 코치 및 멘토]를 제공함으로써 교육에 도움이 됩니다. 이 계층은 일부 개인들을 그들의 피드백과 지시가 중요하고 신뢰할 수 있는 위치에 놓이게 한다. 신뢰할 수 있는 피드백 제공자 및 바람직한 역할 모델(능력, 지식, 조직 권한 및 임상 작업에서 존경할 만한 성과)로 만드는 특성에 대한 설명은 일부 학자들이 주권력을 이해하는 방식에 공명하여 긍정적인 영향의 가능성을 보여준다. 
Hierarchies benefit education by providing identifiable role models, coaches and mentors who demonstrate a standard to which learners can aspire.61 The hierarchy places some individuals in a position where their feedback and instruction are seen to be important and credible.61, 62 Descriptions of the characteristics that make a person a credible feedback provider and a desired role model— competence, knowledge, organisational authority and admirable achievements in clinical work— resonate with the way some scholars understand sovereign power, demonstrating the potential for positive forms of influence.61-64

6 유동성 및 석회화 양쪽에 대한 계층 구조
6 HIERARCHIES AS BOTH FLUID AND CALCIFIED

권력과 위계의 개념은 의학 교육 연구자가 학습자가 임상적 위계에서 [자신의 위치를 최적화하는 암묵적 또는 명시적 목적을 가지고 임상 직무현장을 탐색하는 방법]을 이해하는 데 유용한 이론적 렌즈 역할을 한다.
The concepts of power and hierarchy serve as useful theoretical lenses to help medical education researchers understand how learners navigate the clinical workplace, often with the implicit or explicit aim of optimising their position in the clinical hierarchy.

많은 전문직 위계는 경력, 지식 및 자원을 축적하면서 계급 간에 이동하면서 [유동성]을 보입니다. 수련단계에서 위계는 높은 유동성을 가지고 있으며, 학습자는 매년 rank가 바뀌면서 미래의 레지던트, 펠로우십 및 취업 선택 과정에 적극적으로 자리매김하고 있다. 의사가 독립 진료에 들어가면 임상적 위계가 강화되어 전문적 지위를 최적화할 기회가 줄어듭니다. 이러한 [석회화]는 훈련 중에 유리한 위치를 차지할 수 있는 기회를 압박할 수 있습니다. 권력의 개념화는 의학 학습자가 자신의 위치를 최적화하기 위해 행동하는 방법 및 자신에게 작용하는 힘을 포함하여 이러한 과정을 경험할 수 있는 이유와 방법을 이해하는 데 도움이 됩니다.
Many professional hierarchies exhibit fluidity, with individuals moving between ranks as they accumulate experience, knowledge and resources. Medical trainee hierarchies have a high degree of fluidity, with learners changing rank with every year, actively positioning themselves for future residency, fellowship and employment selection processes. The clinical hierarchy solidifies once a physician enters independent practice, with fewer opportunities to optimise one's professional position. This calcification may pressurise the opportunity to position oneself favourably during training. Conceptualizations of power help us understand why and how medical learners may experience this process, including ways in which they act to optimise their position and forces which act upon them.

지금까지 우리는 의학에서 전문적인 지명designation과 경험이 [사회 질서의 순위ranks]를 형성하는 방식에 초점을 맞췄다. 그러나 의료 직장은 사회적 공백 내에 위치하지 않으며, [다른 형태의 사회 계층화]가 클리닉에서 작용하고 있으며, 의대생, 주니어 레지던트, 선임 레지던트, 펠로우 및 주치의의 임상 계층 위에 [다른 계층이 중첩]되어 있다. 이 밖에도, 전문 분야간의 [프로페셔널 내 위계 구조] 및 전문 분야간의 [프로페셔널 간 위계 구조]를 인식할 수 있습니다. 또한 [특정 집단에 권력을 축적하고 통합할 기회를 부여하는 구조적 권력]을 포함하여 [여러 형태의 권력 관계에 의해 어떻게 개인 간의 상호작용이 형성되는지]를 고려하는 것이 필수적이다. [권력의 구조적 형태와 관련된 위계]는 유동성이 적을 수 있다. 개별 의학 학습자를 여러 계층에 포함시키는 사회적 정체성의 다양성을 인식하는 것은 그들의 경험을 이해하는 데 중요하다. 다른 위계질서가 임상 등급의 위계질서를 대체하거나 복잡하게 만들 수 있는 시기와 방법을 고려하는 것은 이 분야의 연구를 풍부하게 할 것이다.
So far, we have focused on the way in which professional designation and experience form the ranks of the social order in medicine. However, the medical workplace is not located within a social vacuum, and numerous other forms of social stratification are at work in the clinic, superimposing other hierarchies on top of the clinical hierarchy of medical student, junior resident, senior resident, fellow and attending physician.15 Beyond this, we might recognise intraprofessional hierarchies between specialties and interprofessional hierarchies between professions.12, 48, 65 It is also imperative to consider how interactions between individuals are shaped by other forms of power relations, including structural forces that privilege particular groups with opportunities to accumulate and consolidate power. Hierarchies related to structural forms of power may be less fluid. Recognising the multiplicity of social identities that embed individual medical learners in several hierarchies is important to understanding their experiences. Considering when and how other hierarchies might supercede or complicate the hierarchy of clinical ranks will enrich research in this area.

7 임상 계층 내 힘의 수직적 흐름
7 VERTICAL FLOW OF POWER IN THE CLINICAL HIERARCHY

주권력Sovereign power, 즉 '파워오버power over'는 [개인이 권력을 행사하는 방식]에 초점을 맞추고 있으며, 일반적으로 단방향적인 방식으로 위계를 따라 흐른다. 이 메시지는 일반적으로 억압적이고 지시적이며 조용한 구조로 지시되는 의학교육에서 위계구조가 다뤄지는 [전형적인 방식]과 공명하고 있습니다.
Sovereign power, or ‘power over’, focuses on the ways in which power is exerted by individuals, typically in a unidirectional way down the hierarchy. This message has resonated with the typical way hierarchies are treated in medical education, where they are typically gestured to as oppressive, directive and silencing structures.

그러나 Agency를 행사함으로써 [권력이 '상향'으로 작동할 수 있는 방법]을 고려하는 것도 유용할 것이다. 조직 관리 문헌에서 나온 권력의 개념화는 여기에서 유용할 수 있습니다. 다양한 사회 및 임상 계층에서 자신의 위치에 따라 의료 학습자는 다양한 유형의 자원을 이용할 수 있지만, 모든 사람은 [위계 속에서 유동성에 유리하게 영향을 미치기 위해 이용 가능한 자원을 어떻게 사용하는지에 대해 계획하고 전략을 수립]할 수 있는 행위자성Agency를 가지고 있다. 종종 이것은 '긍정적인 인상 심어주기'를 의미하는데, 이는 다른 조직적 맥락에서 잘 연구되어 왔지만 대부분 의학 교육에는 없는 일반적인 '상향 영향력upward influence' 전략tactic 중 하나이다.
However, it will also be useful for medical education researchers to consider the ways in which power can also work ‘upward’, mainly through the exercise of agency.66 Conceptualizations of power from the organisational management literature can be useful here. Depending on their positionality in the various social and clinical hierarchies, medical learners will have different types of resources available to them, but they all have the agency to plan and strategize about how to use what is available in order to favourably influence their fluidity within the hierarchy.21, 29 Often, this means cultivating positive impressions,67, 68 a common ‘upward influence’ tactic that has been well-studied in other organisational contexts but is mostly absent from medical education.29, 69, 70

행위자성agency이라는 개념, 또는 [권력의 지배력prevailing force에 반대하는 개인의 자율성 정도]는, 합의가 없으며 논란이 있다. 캠벨은 에이전시의 가능성에 대한 이해가 권력을 어떻게 개념화하느냐와 어떻게 밀접하게 관련되어 있는지를 보여주는 유용한 구별을 제공한다:

  • '행위자의 권력power of agency'은 행동을 시작하고 유지하는 행위자actor의 능력이다;
  • '에이전틱 파워agentic power'는 사회 구조의 구속력으로부터 독립적으로 행동하는 행위자actor의 능력을 가리킨다.

The concept of agency, or the degree of autonomy that can be attributed to individuals opposing the prevailing forces of power, is a controversial concept without consensus. Campbell71 offers a helpful distinction that illuminates how an understanding of the potential for agency is closely related to how one conceptualises power:

  • ‘the power of agency’ is an actor's ability to initiate and maintain action;
  • ‘Agentic power’ refers to an actor's ability to act independently of the constraining power of social structure.

의대생들이 임상적 위계를 탐색하는 방법에 대한 연구에서, 우리는 학습자들이 [에이전시의 힘‘the power of agency’]을 행사하는 것을 관찰했다. 즉, [임상적 위계에서 낮은 지위의 개인]으로서 그들은 [단지 높은 지위의 개인들]이 그들에게 가하는 힘에 반응하는 것이 아니라, 행위자-주도적 권력actor-initiated power에 관여했다는 것을 의미한다. 우리가 관찰한 의대생들은, Goffman이 말하는 인상 관리impression management에 참여하기 위해, 그들이 이용할 수 있는 사회적 자원을 모아 그들의 에이전시에 힘을 쏟았다. 이 용어는 개인이 다른 사람에게 원하는 반응이나 감정을 주입하기 위해 자신을 수행적인 방식으로 표현하는 방법을 말합니다. 보다 바람직한 전문적 지위를 달성하기 위한 광범위한 프로젝트의 일환으로, 학생들은 [감독관이 어떤 행동을 중시하는지 추론]하고, 다음 만남에서 [그러한 기대에 부응하기 위해 상당한 시간과 에너지를 투자]합니다. 이는 낮은 임상적 위계의 개인이 윗사람의 행동에 영향을 미치기 위해 행동하는 방법의 한 예이다. 상황을 평가하고 감독관이 원하는 것을 추론한 다음 필요한 인상을 주기 위해 행동을 형성하기 위해 상당한 사회적 통찰력이 필요하다.
In our study of how medical students navigate clinical hierarchies,21 we observed learners exercising the power of agency, meaning that as lower status individuals in the clinical hierarchy they engaged in actor-initiated power rather than simply reacting to the power that is exerted on them by higher status individuals.72 The medical students we observed exerted their agency by marshalling the social resources available to them to engage in what Goffman would call impression management.67, 68 This term refers to the way in which individuals will express themselves in a performative way so as to inculcate a desired reaction or feeling within others.67 As part of a broader project to achieve a more desirable professional position, the students would infer which behaviours were valued by their supervisors and would then invest significant time and energy in preparing to perform to those expectations in the next encounter. This is an example of the ways in which individuals who are low in the clinical hierarchy act to influence the behaviours of those above them; it requires significant social acumen to assess the situation, infer what is desired by the supervisor and then mould one's behaviour to make the necessary impression.


만약 우리가 같은 연구를 [에이전트 파워agentic power]의 관점에서 본다면, 우리는 완전히 새로운 일련의 고려사항에 직면하게 된다. 첫째, 우리는 [의대생의 자율권 행사 가능성]을 제한하는 [더 큰 사회 구조]를 볼 것이다. 여기서 비판적 관점을 가지기 위해서는 [특정한 이론체에 의해 가이드되어, 학생의 자율성을 억압하는 다양한 형태의 권력]을 이해하는 것을 필요로 한다. 예를 들어, Bocatay와 동료들은 교차 분석을 사용하여, 의과대학에 대한 학생들의 경험이 그녀의 특정한 정체성에 의해 어떻게 형성되는지를 강조하여, [권력이 임상 환경을 통해 사람의 여정에 어떤 영향을 미치는지]에 대한 완전히 다른 관점을 만들어 냅니다. 그들은 [어떻게 구조적인 형태의 권력]이 [고정관념의 위협, 자원에 접근할 기회의 감소, 의료진입 촉진 기회의 감소, 평가의 편향, 구조적 인종차별 및 관련 microaggression, 직업적/인종적 정체성이 통합된 내적 갈등, 인식된 '적합성'에 기초한 특정 역할에 대한 제한된 접근]을 통해 [학생들을 배제의 문화]에 embed 시키는지를 기술한다.
If we view the same study from the lens of agentic power, then we encounter an entirely new set of considerations. First, we would see the larger social structures that constrain the possibility that a particular medical student could exercise their autonomy. A critical perspective here would require us to understand the various forms of power that work to oppress the autonomy of the student, guided by a specific body of theory. For example, Bochatay and colleagues use an intersectional analysis to highlight how a medical student's experience of medical school is shaped by her particular identities, generating an entirely different perspective of how power influences a person's journey through the clinical environment.73 They describe how structural forms of power may embed students in a culture of exclusion through stereotype threat, fewer opportunities to access the preceding resources and opportunities to facilitate entry into medicine, bias in assessment, structural racism and related microaggressions, an internal conflict integrating professional and racial identities, and limited access to certain roles based on perceived ‘fit’.73

 

8 임상 계층 내 힘의 수평 흐름
8 HORIZONTAL FLOW OF POWER IN THE CLINICAL HIERARCHY

또한 의료 학습자의 경험을 계층이 어떻게 형성하는지를 이해하기 위해서는 권력의 수평적 흐름에 대한 관심이 중요합니다. '권력의 수평적 흐름'이라는 말은, 동일한 수직 순위를 공유하는 개인의 상호 작용 및 그 개인들 사이의 2차적 위계를 지칭한다. 학습을 위한 피어 투 피어 상호작용의 중요성과 공유 목표와 활동에 대한 참여와 관련된 책임을 고려할 때 임상 위계 내 수평적 상호작용은 의료 교육과 매우 관련이 있다. 
Attention to the horizontal flow of power is also important for understanding how hierarchies shape the experiences of medical learners. By horizontal power flow, we refer to the interactions of individuals who share the same vertical rank, as well as the secondary stratification of those individuals. Horizontal interactions within the clinical hierarchy are very relevant to medical education, given the recognised importance of peer-to-peer interactions for learning and the accountability associated with engagement in shared goals and activities.59

교실과 클리닉에서는 사회적 규범이 그룹 내에서 허용되는 행동을 확립합니다. 여기서, 그룹 구성원은 [다른 그룹 구성원의 행동을 감시]하고, [비공식적인 사회적 제재나 보상]을 사용하여 [일부 유형의 행동을 장려하고, 다른 유형의 행동을 억제할 것]이 장려된다. 벵거는 이것을 ['수평적 책임']이라고 불렀는데, 이 경우 그룹의 상호 활동이나 목표는 협상과 실천 기준의 시행을 필요로 한다. 수십 년 전, Friedson과 Rhea는 어떻게 의사 그룹이 지시, 우호적인 토론 또는 수치심을 제공하는 것과 같은 개입을 통해 서로의 행동을 비공식적으로 관찰하고 형성했는지에 대해 기록했습니다. 최근 Tarrant 등은 [동료의 행동을 형성하기 위해 사용하는 다양한 전략]을 설명했습니다. 여기에는 조언이나 도움의 제안, 질문, 주의사항, 날카로운 말, 교육, 농담 등이 들어간다. 일부(예: 조롱과 증거 호출)는 위계에서 유사한 위치를 공유하는 사람들 사이에서 발생할 가능성이 더 높았지만, 이러한 상호작용 전략은 수직적, 수평적 위계에서 모두 사용되었다. 동료의 피드백과 협업에 대한 향후 조사에서는 의학에서 학습자가 [동료와 피드백을 공유하기 위한 의지와 신뢰성]에 대해 위계적 위치hierarchical positions가 어떻게 영향을 미치는지 고려할 수 있다. 이는 중요한 피드백을 공유하기를 꺼리는 발견을 설명하고 팀의 역동성을 개선하기 위한 제안을 제공하는 데 도움이 될 수 있기 때문이다.
In the classroom and the clinic, social norms establish acceptable behaviour within groups. Here, group members are incentivised to monitor the behaviour of other group members and use informal social sanctions or rewards to encourage some types of action and to discourage others. Wenger has called this a ‘horizontal accountability’, where the mutual activities or goals of a group require the negotiation and enforcement of standards of practice.59 Decades ago, Friedson and Rhea documented how a group of physicians monitored and shaped each other's behaviour informally through interventions such as offering instruction, friendly discussion, or shame.34 More recently, Tarrant and colleagues described a variety of strategies to shape the behaviour of peers: suggestions and offers of advice or help, questions, reminders, sharp words, education and banter.74 These interactional strategies were used both vertically and horizontally, although some (e.g., bantering and invoking evidence) were more likely to occur between those sharing similar positions in the hierarchy.74 Future inquiry into peer feedback and collaboration may consider how hierarchical positions influence the willingness and credibility of medical learners to share feedback with peers, as it may help explain findings of reluctance to share critical feedback and offer suggestions for improving team dynamics.75, 76

[권력의 구조적 형태]는 [동일한 임상 등급에 있는 개인]들 사이에서의 [수평적 계층화] 또는 [차별화differentiation]와도 관련이 있다. 젠킨스는 의학에서 비공식적인 수평적 위계에 대한 그녀의 관찰을 설명하기 위해 지위 분리의 개념을 도입한다. 젠킨스는 미국 병원 두 곳의 내과 레지던트들을 대상으로 한 연구에서 계급, 국가 출신 및 교육 혈통이 미국에서 교육받은 의학박사(MD)와 오스테오패스 의학박사(DO) 학위를 가지고 있거나 국제적으로 교육받은 레지던트들 간의 뚜렷한 분리를 초래하는 것을 관찰했습니다. 그녀는 사회적 가치를 바탕으로 그룹이 계층화될 때 신분 분리가 발생하며, 이러한 분리는 사회적 계층, 후원 및 훈련의 불평등에 기초한 계층화의 누적 효과에서 비롯된 능력의 차이에서 비롯된다고 가정한다.

Structural forms of power are also relevant to horizontal stratification or the differentiation of individuals at the same clinical rank. Jenkins introduces the concept of status separation to explain her observation of informal horizontal hierarchies in medicine.13 In her study of internal medicine residents at two American hospitals, Jenkins observed how class, national origin and educational pedigree results in a distinct separation between residents who are US-trained Doctors of Medicine (MDs) and those who have a Doctor of Osteopathic Medicine (DO) degree or trained internationally.13 She posits that status separation occurs when a group is stratified on the basis of social worth and that this separation results from perceived differences in merit that emanate from the cumulative effects of stratification based on social class, sponsorship and inequalities in training.

[권력의 구조적 형태와 관련된 특징]에 기초한 이러한 유형의 [수평적 계층화]는 [의과대학 입학 과정에 사용되는 '능력merit'의 정의]에 반영된다. 능력merit은 종종 자원, 연결 및 기회에 대한 접근을 reward하는 역할을 한다. 기준을 설정한 집단에서 [지원자마다 사회적 자본에 접근할 수 있는 기회가 다르다는 것]을 인정하지 않을 때 [구조적 권력]이 작용하며, 이는 '우수성excellence'을 입증하거나 강화할 수 있는 기회에 영향을 미칩니다. [사회적 자본에 대한 이러한 차등적 접근]은 종종 인종, 계급 및 성별에 기초한 특권과 관련이 있으며, 시간이 지남에 따라 일부 집단을 교육, 학습 및 의료 개업에서 배제하는 복합적인 효과가 있습니다. [억압적인 유산oppresive legacies]이 의학 학습자의 경험을 형성하는 방식을 인식하는 것이 향후 작업의 핵심 영역입니다. 
This type of horizontal stratification based on features related to structural forms of power is echoed in the definitions of merit used in medical school admissions processes, which often serve to reward access to resources, connections and opportunities.19, 77 Structural power is at work here when the group who sets the standards does not acknowledge that applicants vary in their access to opportunities to access social capital,78 which influences their opportunity to demonstrate or enhance ‘excellence’.20 This differential access to social capital is often related to privilege based on race, class and gender77, 79 and has a compounding effect over time, excluding some groups from teaching, learning and practicing medicine. Acknowledging the ways that oppressive legacies shape the experiences of medical learners is a key area for future work.80-82

9 결론
9 CONCLUSION


이 에세이에서는, 의학교육 scholarship에 권력과 위계질서가 어떻게 통합될지에 대해 몇 가지 고려사항을 제시한다. 임상 작업 공간을 형성하는 여러 위계와 이러한 위계의 [유동성]과 [석회화]의 영향을 강조함으로써, 우리는 의학 교육에서 힘의 방향 흐름에 대한 일반적인 가정이 실제로 이러한 개념의 통합을 더 의미 있는 방법으로 제한하는 데 기여할 수 있다는 주장을 펼친다. 건강 전문가들이 배우고 실천하는 방법에 대한 우리의 집합적인 연구에서는 학습자들이 마주치는 상호작용적이고 구조적인 형태의 파워가 어떻게 행동, 신념 및 스킬을 형성하는지 검토할 수 있는 많은 기회가 있습니다. 이러한 질문들을 수용하는 것은 교육 과학자들에게 친숙한 문제들에 대한 많은 새로운 관점을 열어준다.

In this essay, we offer some considerations for how power and hierarchy might be incorporated into medical education scholarship. By highlighting the multiple hierarchies that shape clinical workplaces, and the effect of the fluidity and calcification of these hierarchies, we make the argument that common assumptions about the directional flow of power in medical education may actually serve to constrain the incorporation of these concepts in a more meaningful way. In our collective study of the ways that health professionals learn and practice, there are many opportunities to examine how the interactional and structural forms of power learners encounter shape their actions, beliefs and skills. Bringing these questions to bear opens up many new perspectives on familiar issues for education scientists.

 


Med Educ. 2022 Jan;56(1):91-97.

 doi: 10.1111/medu.14659. Epub 2021 Sep 15.

Thinking about social power and hierarchy in medical education

Affiliations collapse

Affiliations

1Department of Family Medicine, McMaster University, Hamilton, Ontario, Canada.

2McMaster FHS Program for Education Research, Innovation and Theory (MERIT), McMaster University, Hamilton, Ontario, Canada.

PMID: 34491582

DOI: 10.1111/medu.14659

Abstract

Context: Social power has been diversely conceptualised in many academic areas. Operating on both the micro (interactional) and macro (structural) levels, we understand power to shape behaviour and knowledge through both repression and production. Hierarchies are one organising form of power, stratifying individuals or groups based on the possession of valued social resources.

Discussion: Medicine is a highly organised social context where work and learning are contingent on interaction and thereby influenced greatly by social power and hierarchy. Despite the relevance of power to education research, there are many unrealized opportunities to use this construct to expand our understanding of how physicians work and learn. Hierarchy, when considered in our field, is typically gestured to as an omnipresent feature of the clinical environment that harms low-status individuals by repressing their ability to communicate openly and exercise their agency. This may be true in many circumstances, but this conceptualization of hierarchy neglects consideration of other aspects of hierarchy that may be generative for understanding the experiences of medical learners. For example, medical learners may experience the superimposition of multiple hierarchies, some of which are fluid and some of which are calcified, some of which are productive and helpful and some of which are oppressive and harmful. Power may work 'up' and 'across' hierarchical ranks, rather than just from higher status to lower status individuals.

Conclusion: The conceptualizations of how social power shapes human behaviour are diverse. Often paired with hierarchy, or social arrangement, these social scientific ideas have much to offer our collective study of the ways that health professionals learn and practice. Accordingly, we posit that a consideration of the ways social power works through hierarchies to nurture or harm the growth of learners should be granted explicit consideration in the framing and conduct of medical education research.

침묵 또는 질문? 학생-중심 교육에서 토론 행동의 문화간 차이(Studies in Higher Education, 2014)
Quiet or questioning? Students’ discussion behaviors in student-centered education across cultures
Janneke M. Frambacha*, Erik W. Driessena, Philip Behb and Cees P.M. van der Vleutena

 

 

서론
Introduction

많은 연구들이 커뮤니케이션 스타일이 문화적 맥락에 따라 다르다는 널리 알려진 개념을 확인했습니다. 이는 학생들이 또래 및 선생님과 소통하는 방식에도 적용됩니다. 최근, 종래의 교사 중심의 대처와는 본질적으로 다른, 학생 중심의 교육을 도입하는 고등 교육 기관의 수가 세계적으로 꾸준히 증가하고 있다. 학생중심교육은 교사의 가르침보다는 학생의 학습에 초점을 맞추는 것을 목표로 하고 있다(캐논과 뉴블 2000). 교육기관들이 이 접근방식을 수용하는 것은 부분적으로 학생들이 평생학습, 비판적 사고, 동기 부여 및 독립적인 문제 해결 기술을 자극하는 것으로 여겨지는 그들 자신의 학습을 하도록 장려하기 때문이다. 학생 중심 교육의 교육 도구 중 하나는 학생들이 학습 주제, 문제 사례 또는 프로젝트에 대한 비판적인 토론에 적극적으로 참여할 것으로 기대되는 소그룹 작업입니다. 토론에 적극적으로 참여하는 것은 학생들의 협업 능력, 독립성, 동기 부여 및 비판적 사고를 향상시키는 것을 전제로 한다.

Many studies have confirmed the widely acknowledged notion that communication styles differ across cultural contexts (e.g. Gudykunst 2005; Hu and Fan 2011; Smith 2011). This also applies, by implication, to the way students communicate with their peers and their teachers (Hofstede 1986). In recent years, there has been a steady increase in the number of higher education institutions worldwide that have introduced student-centered education, which is intrinsically different from traditional teacher-centered approaches. The former aims to focus on students' learning rather than on teachers' teaching (Cannon and Newble 2000). Institutions embrace this approach partly because it encourages students to take charge of their own learning, which is assumed to stimulate lifelong learning, critical thinking, motivation, and independent problem-solving skills (Barrows 1996; Cannon and Newble 2000; Lonka and Ahola 1995). One of the educational tools in student-centered education is small group work, where students are expected to actively engage in critical discussions about learning topics, problem cases, or projects. Active participation in discussions is assumed to enhance students' collaborative skills, independence, motivation, and critical thinking (Del Favero et al. 2007; Schmidt and Moust 1998).

몇몇 작가들은 이러한 유형의 [상호작용적이고 독립적인 행동]이 개인주의와 언어적 상호작용에 대한 집중과 같은 전형적인 서구적 가치를 반영한다고 주장해왔다. 다른 문화의 가치들은 학생 중심의 접근법에 존재하는 서양의 가치들과 양립할 수 없을 수도 있다. 이는 학생 중심의 교육에서 다른 문화권의 학생들의 의사소통 스타일이 어떻게 표현되고 형성되는지에 대한 질문으로 이어지며, 이는 학생 중심의 고등교육에서 과정과 결과의 문화 간 차이를 밝혀줄 수 있다(아마 의도하지 않을 수도 있다). 연구에 따르면 학생 중심 교육에서 대화형, 팀 기반 및 교사 독립적인 토론은 [서구 이외의 환경에서 학습 접근법 및 커뮤니케이션 스타일에 부합하지 않기 때문에] 긴장을 유발할 수 있다. 학생 중심 교육에서 학생들은 목소리를 높이고, 질문을 하고, 다른 사람들의 의견에 도전하는 등 다소 적극적인 행동을 보일 것으로 예상되며, 이에 대한 학생들의 반응은 문화마다 다를 수 있으며, 이로 인해 학습 과정과 결과가 다른 방식으로 형성될 수 있습니다.

Several authors have contended that this type of interactive and independent behavior reflects typically Western values, such as individualism and a focus on verbal interaction (Altinyelken 2010; Frambach et al. 2012; Nguyen et al. 2009). Values of other cultures may not be compatible with the Western values residing in the student-centered approach. This leads to the question as to how the communication styles of students from different cultures are expressed and shaped in discussions in student-centered education, which might shed light on – possibly unintended – cross-cultural differences in processes and outcomes in student-centered higher education. Research has indeed indicated that interactive, team-based and teacher-independent discussions in student-centered education can cause tensions due to their not being consistent with learning approaches and communication styles in non-Western settings (Frambach et al. 2012; Gwee 2008; Khoo 2003; Wang, Harding, and Mai 2012). In student-centered education, students are expected to show rather assertive behaviors – such as speaking up, asking questions, and challenging the opinions of others – and students' responses to this may vary between cultures thereby shaping learning processes and outcomes in different ways.

특히 동서양의 문화에서 커뮤니케이션 스타일의 문화적 차이는 광범위하게 연구되어 왔다. 동양 문화는 개인주의로 여겨지는 서양 문화와는 대조적으로 종종 집단주의로 특징지어진다. 집단주의는 개인보다는 집단에 관심을 갖는 것, 집단 구성원의 상호의존성, 집단 규범과 가치관에 의해 형성되는 행동들을 말한다. 그러나 동서양의 [지역 내 문화적 다양성]은 [지역 간 문화적 다양성]보다 클 수 있으며, 집단주의 또는 개인주의로 직설적으로 특징지을 수 없다는 점에 유의해야 한다. 그러나 기존연구는 동양 문화에서는 [개인주의 문화의 보다 대립적이고 직접적이며 거침없는 스타일]보다, [조화로운 그룹 관계, 갈등의 회피, 간접적인 의사소통을 선호하는 경향이 있는 집단주의적 의사소통 스타일]을 일반적으로 선호한다는 것을 보여주었다. 따라서 개인주의 서양문화와 집단주의 동양문화의 구분이 학생 중심의 교육 논의에서 학생들에 의해 입증되는 의사소통 행동에서 문화 간 차이로 이어질 가능성이 높다고 가정하는 것이 타당해 보인다.

Cross-cultural differences in communication styles have been extensively researched, particularly in Eastern and Western cultures (e.g. Brew et al. 2011; Smith 2011; Yeung and Kashima 2012). Eastern cultures are often characterized as collectivistic, in contrast to Western cultures, which are regarded as individualistic (Hofstede 2001; Triandis 1995). Collectivism refers to being concerned with the group rather than the individual, interdependence of group members, and behaviors that are shaped by group norms and values (Hui and Triandis 1986). It should be noted though that cultural diversity within Eastern and Western regions can be larger than across, and they cannot be characterized straightforwardly as either collectivistic or individualistic. Previous research has, however, shown a general preference of Eastern cultures for collectivistic communication styles, which tend to favor harmonious group relations, avoidance of conflict, and indirect communication as opposed to a more confrontational, direct, and outspoken style of individualistic cultures (Brew et al. 2011; Oetzel et al. 2001; Smith 2011). Consequently, it seems logical to assume that the distinction between individualistic Western cultures and collectivistic Eastern cultures is likely to lead to cross-cultural differences in communicative behaviors demonstrated by students in discussions in student-centered education.

이 사회문화 연구는 서로 다른 문화 지역에 있는 3개 고등교육 기관의 학생 중심 교육에서 학생들의 의사소통 행동 전개와 토론 과정을 조사함으로써 이러한 문화 간 차이의 존재와 성격을 확인하려고 시도했다. 동아시아, 중동, 서유럽. 이와 같이, 이 연구는, 학생 중심 교육에서, 커뮤니케이션 스타일의 크로스 컬쳐의 차이가 어떻게 표현되고 형성되는지, 그리고 이것이 고등 교육에서 학생 중심 방법의 크로스 컬쳐 적용성에 어떻게 영향을 미칠 수 있는지에 대한 통찰력을 제공하는 것을 목표로 하고 있다.

This sociocultural study attempted to identify the existence and nature of such cross-cultural differences by investigating the discussion process and the development of students' communicative behaviors in student-centered education in three institutions of higher education in different cultural regions: East Asia, the Middle East, and Western Europe. This way, the study aims to provide insight into how cross-cultural differences in communication styles are expressed and shaped in student-centered education, and how this may impact on the cross-cultural applicability of student-centered methods in higher education.

문제 기반 학습
The case of problem-based learning

문제 기반 학습(PBL)은 이 사례 연구의 대상으로 선정된 학생 중심의 교육 모델입니다. 원래 서양에서 개발된, 더 구체적으로 1960년대 캐나다의 의학 교육에서 개발된 PBL은 비록 그 효과는 논란의 여지가 있지만, 전 세계의 다른 분야와 국가로 퍼져나갔다. PBL은 교사 중심의 강의 기반 교육 접근과 달리 학생들이 자신의 학습 과정을 지시하고 적극적으로 지식을 구축하며 문제 해결 및 팀 커뮤니케이션 기술을 개발하도록 장려함으로써 교육 과정의 중심에 놓입니다. 튜토리얼은 PBL에서 중심적인 역할을 하며, 이 기간 동안 소수의 학생들이 지식 전달자가 아닌 퍼실리테이터 역할을 하는 튜터의 도움을 받아 문제 사례로 제시된 학습 문제를 공동으로 논의합니다(Barrows 1996).
Problem-based learning (PBL) is the student-centered educational model that was selected as the object of this case study. Originally developed in the West, more specifically in medical education in Canada in the 1960s, PBL has spread to different disciplines and countries around the world (Barrows 1996; Gwee 2008; Savin-Baden 2000), though its effect remains controversial (Dochy et al. 2003; Kirschner, Sweller, and Clark 2006; Schmidt et al. 2009). In contrast to teacher-centered, lecture-based educational approaches, PBL places students at the center of the educational process by encouraging them to direct their own learning processes, construct knowledge actively, and develop problem-solving and team communication skills (Dolmans et al. 2005; Visschers-Pleijers 2006). Tutorials take a central role in PBL, during which a small group of students collaboratively discusses a learning issue presented as a problem case, aided by a tutor who acts as a facilitator rather than a knowledge transmitter (Barrows 1996).

PBL이 전 세계에 퍼져있음에도 불구하고, PBL의 문화 간 적용가능성에 의문이 제기되어 왔다.

  • Walker, Bridges, Chan(1996)은 중국 내에서의 PBL의 구현에 대한 연구에서 문화적 긴장이 그룹 역학, 토론 과정 및 커뮤니케이션 문제에 영향을 미치고 있으며, 중국 학생들은 공손함, 화합, 일치의 강한 의식을 보이고 있으며, 토론에서 직접적으로 논쟁을 도입하는 것을 꺼린다는 것을 발견했다.
  • Khoo(2003)는 대립에 대한 두려움, 권위에 대한 의존과 존중, 거침없는 것에 대한 혐오, 질문하는 것을 꺼리고, 수업 토론에 대한 낮은 참여 등 PBL과 양립할 수 없는 여러 아시아 문화 태도를 묘사했다. 그러나 그는 또한 강한 자기 훈련과 학생들 간의 협업 등 PBL과 상당히 양립할 수 있는 측면을 식별했다.
  • 또, Hussain씨등(2007)은, 아시아의 3개 대학에서 PBL에 대해 긍정적인 반응을 보이고 있지만, 동시에, PBL 세션에서는, 학생이 비판적인 사고를 전개하는 것을 억제하고 있어, 대립하지 않는 태도로 일관하고 있다. 그러나 그들은 서양 대학에서도 비판적 사고를 달성하는 것이 학생들에게 어려울 수 있다고 강조한다(Hussain et al. 2007)

Despite PBL's spread around the world, its cross-cultural applicability has been questioned.

  • In a study of the implementation of PBL in a Chinese context, Walker, Bridges, and Chan (1996) found that cultural tensions affected group dynamics, the discussion process, and communication issues, with Chinese students showing a strong sense of politeness, harmony, and conformity as well as reluctance to directly introduce arguments in the discussion.
  • Khoo (2003) described several Asian cultural attitudes that might be incompatible with PBL, such as fear of confrontation, dependency on and respect for authority, a distaste for outspokenness, reluctance to ask questions, and low participation in class discussions. He also identified aspects, however, that seem quite compatible with PBL, such as strong self-discipline and collaboration among students.
  • Also Hussain and others (2007) report positive reactions to PBL in three Asian universities, but at the same time they show inhibitions to students' development of critical thinking during PBL sessions, due to a non-confrontational attitude. However, they emphasize that in Western universities too the achievement of critical thought might be difficult for students (Hussain et al. 2007).


비서구권 환경에서의 PBL의 실시에 관한 연구는 동아시아에서 실시되고 있지만, 중동에서 실시되고 있는 몇 안 되는 연구에서는 PBL에 관한 유사한 과제나 어려움이 이 지역에서 발생하고 있으며, 적어도 부분적으로 문화적 요인에 기인하고 있는 것으로 보인다. 이러한 고려사항을 바탕으로 PBL은 본 연구에서 검토해야 할 토론 기반, 학생 중심의 교육 모델로 선정되었습니다.

Although the majority of studies on the implementation of PBL in non-Western settings has been conducted in East Asia, the few studies that were conducted in the Middle East suggested that similar issues and difficulties with PBL are encountered in this region, and that these seem to be, at least partially, attributable to cultural factors (Bridger 2007; Frambach et al. 2012; Mpofu 1999; Yazigi, Nemr, and Abou Jaoude 2004). Based on these considerations, PBL was selected as the discussion-based, student-centered educational model to be examined in this study.

사회문화적 접근법
A sociocultural approach

서구와 비서구 환경에서 학생 중심 교육에 대한 경험적 비교 연구가 부족하기 때문에, 문화뿐만 아니라 교육 및 가능한 다른 요소들이 학생들의 토론 행동에 미치는 영향을 탐구하기 위해 [사회문화적 접근법]을 사용했다. [사회문화이론]은 러시아 학자들, 특히 비고츠키(1978)의 연구에 기초하고 있으며, 다른 학자들, 예를 들어 로고프(1993)와 엥게스트롬(1999)의 연구에 대해 자세히 설명하고 있다. [사회문화이론가]들은 개인은 본질적으로 환경에 의해 영향을 받거나 중재되며, 환경을 벗어나서는 이해될 수 없다고 강조한다. 개인은 자신의 사회적, 문화적, 맥락적 환경을 지속적으로 [내면화]하면서, 동시에 자신의 내적 가치와 신념을 [외부화]함으로써 주변 환경에 영향을 미칩니다. 이러한 사회문화적 관점은 다음과 같은 질문으로 이어졌다: 세 문화권의 학생들은 그들의 문화적 배경을 외부화하고 동시에 PBL의 토론 측면을 내부화하는 것, 그리고 이것이 그들의 토론 행동과 기술을 어떻게 형성하는가?
Because of the paucity of empirical comparative studies of student-centered education in Western and non-Western settings, a sociocultural approach was used to explore the impact not only of cultural but also of educational and possibly other factors on students' discussion behaviors. Sociocultural theory is based on the work of several Russian scholars, notably Vygotsky (1978), on which others have elaborated, e.g. Rogoff (1993) and Engeström (1999). Sociocultural theorists emphasize that individuals are inherently influenced, or mediated, by their environment and cannot be understood outside of it (Rogoff and Chavajay 1995; Vásquez 2006). Individuals continuously internalize their social, cultural, and contextual surroundings, while at the same time influencing their surroundings by externalizing their inner values and beliefs (Engeström and Miettinen 1999). This sociocultural perspective led to the following research question: to what extent do students across three cultures externalize their cultural backgrounds and simultaneously internalize the discussion aspect of PBL, and how does this shape their discussion behaviors and skills?

위에서 설명한 바와 같이, 사회문화적 접근방식은 PBL과 학생들의 문화적 배경 외에 학생들의 토론 행동을 중재할 수 있는 다른 요소들을 고려할 수 있다. 흥미롭게도, [서양에서의 PBL의 실시에 관한 연구]도 PBL 과정의 문제점, 특히 소그룹 논의의 피상적인 문제를 밝혀냈다. 제도적, 조직적, 교육적 측면과 같은 문화적 요소 외에 더 많은 맥락적 요소들이 역할을 할 수 있다. 탐구적이고 개방적인 사회문화적 관점을 채택함으로써, 본 연구는 맥락적 요소를 폭넓게 포괄하여 문화 전반에 걸친 학생 중심의 고등교육에서 학생들의 토론 행동과 기술을 형성하는 영향을 포괄적으로 파악하는 것을 목표로 했다. 문제 기반 학습에서 학생들의 행동과 발전을 연구하기 위해 사회문화 이론을 어떻게 사용할 수 있는지에 대한 보다 광범위한 논의는 Frambach et al. 2012를 참조한다.

As remarked above, a sociocultural approach allows for consideration of other factors – besides PBL and students' cultural backgrounds – which might mediate students' discussion behaviors. Interestingly, research on the implementation of PBL in the West has also revealed problems with the PBL process, notably superficiality of small group discussions (Moust, Van Berkel, and Schmidt 2005). More contextual factors besides cultural ones may play a role, such as institutional, organizational, and curricular aspects. By adopting an explorative and open sociocultural perspective, this study aimed for broad coverage of contextual factors to build a comprehensive picture of the influences shaping students' discussion behaviors and skills in student-centered higher education across cultures. For a more extensive discussion of how sociocultural theory can be used to study students' behavior and development in problem-based learning see Frambach et al. 2012.

방법
Method

방법론
Methodology

이 연구를 이끈 사회문화적 관점과 일관되게, 참가자들은 자연스러운 환경에서 조사되었다. [비교적, 도구적 사례 연구](Stake 2000)는 특정 이슈를 [문화적 및 맥락적 설정을 포괄하는 전체적 현상]으로 조사할 수 있게 하면서, 여러 사례를 비교하면 사례 간의 차이와 유사성에서 발생하는 통찰력을 제공할 수 있기 때문에 이러한 목적에 적합하다고 간주되었다.

Consistent with the sociocultural perspective that guided this study, the participants were investigated in their natural setting. A comparative, instrumental case study (Stake 2000) was deemed suitable for this purpose, because it enables investigation of an issue as a holistic phenomenon, encompassing its cultural and contextual setting, while comparison of multiple cases could provide insight arising from differences and similarities across cases.

설정
Setting

PBL은 의학 교육(원래 개발된 분야)에서 가장 널리 사용되고 있기 때문에 이 연구는 의과대학에서 실시되었습니다. 정보 비교를 가능하게 하기 위해 서로 다른 비서양 환경의 서양 의과대학 1개와 의과대학 2개를 포함하기로 결정했다. 후자의 선발을 위해 9명의 국제 의학 교육 전문가에게 다음 기준을 충족하는 의대를 제안하도록 요청되었다.

  • (1) 비서양 문화 환경에서의 위치 
  • (2) 학부 커리큘럼에서 실질적인 교육 방법으로서의 PBL 
  • (3) 5년 이상의 PBL 커리큘럼 경험 

As PBL is most widely used in medical education – the discipline where it was originally developed – the study was conducted in medical schools. To enable informative comparisons, it was decided to include a Western medical school and two medical schools in different non-Western settings. For selection of the latter, nine international medical education experts were asked to suggest medical schools that met the following criteria:

  • (1) location in a non-Western cultural setting;
  • (2) PBL as a substantial teaching method in the undergraduate curriculum;
  • (3) more than five years of experience with PBL in the curriculum.

22개의 제안 중 11개는 모든 기준을 충족했으며, 그 중에서 홍콩의 의과대학과 중동의 아랍 지역의 의과대학이 서로 다른 동양 문화 지역에서의 위치에 따라 선택되었다. 중동학교는 익명을 원했기 때문에 국가적인 위치는 밝혀지지 않았다. 중동 국가들이 공유하고 있지만 문화적인 특징도 분명히 다르기 때문에, 문화적인 요소들과 다른 맥락적 요소들에 대한 두터운 서술이 중동이라는 용어의 폭을 극복하기 위해 사용되었다. 네덜란드의 한 의대를 서양의 사례로 선정한 것은 실용적인 이유에 의한 것이지만, 그 학교는 선정 기준 2와 3을 충족시켰지만, 필연적으로 기준 1에 불합격했다. 이 연구는 홍콩과 중동 학교의 윤리 심사 위원회에서 승인되었지만 네덜란드 학교에서는 승인할 필요가 없었다.

Eleven of 22 suggestions met all criteria, from which a medical school in Hong Kong and a medical school in the Arab part of the Middle East were selected based on their locations in different Eastern cultural regions. Since the Middle Eastern school wished to remain anonymous, its national location is not revealed here. Thick description of cultural and other contextual factors was used to overcome the wideness of the term Middle East, as Middle Eastern nations share but evidently also differ in cultural characteristics. The selection of a medical school in the Netherlands as a Western case was based on pragmatic reasons, but the school met selection criteria two and three, while of necessity failing criterion one. The study was approved by the ethical review boards of the Hong Kong and the Middle Eastern schools, while no approval was required for the study at the Dutch school.

표 1은 3개 학교의 PBL 측면을 몇 가지 나열한 것입니다. 설립 이래, 네덜란드와 중동의 학교에서는, PBL을 학부시절의 주요한 교육 방법으로 사용해, 교사 중심의 강의는 비교적 적었습니다. 홍콩학교는 1990년대 PBL을 전통적인 교사 중심의 교육과정에서 학생 중심의 교육과정으로 전환하는 것을 목표로 전반적인 교육과정 개혁의 일환으로 시행했다. 이 개혁으로 인해 강의 기반과 PBL이 혼재된 커리큘럼이 탄생했습니다.

Table 1 lists several PBL aspects for the three schools. Since their foundation, the Dutch and the Middle Eastern school had used PBL as the major educational method in the undergraduate years, with relatively few teacher-based lectures. The Hong Kong school had implemented PBL as part of an overall curriculum reform in the 1990s aimed at moving from a traditional teacher-centered curriculum to a student-centered one. The reform resulted in a hybrid curriculum that was partly lecture-based and partly PBL.

데이터 수집
Data collection

연구는 PBL의 문화 간 적용 가능성에 대한 광범위한 연구 프로젝트의 틀 안에서 이루어졌기 때문에, 데이터 수집 방법은 그룹 논의 외에 다른 PBL 측면에도 초점을 맞췄다. 각 기관에서는 2009년 11월부터 2010년 4월까지 1개월간의 현장조사 기간 동안 데이터가 수집되었다. 중동 및 홍콩 학교에서는 첫 번째 저자가 데이터를 수집하고 네덜란드 의과대학에서는 외부 연구 보조자가 데이터를 수집하여 해당 학교의 외부인이 데이터를 수집했음을 확인했습니다. 몇 가지 정성적 데이터 수집 방법을 사용했다.
As the study was conducted within the framework of a broader research project on the cross-cultural applicability of PBL (Frambach et al. 2012), data collection methods focused also on other PBL aspects besides group discussions. In each of the institutions, data were collected during one month of fieldwork between November 2009 and April 2010. In the Middle Eastern and Hong Kong schools, data were collected by the first author and in the Dutch medical school by an external research assistant to ensure that data collection was done by an outsider to the school in question. Several qualitative data collection methods were used.

첫째, PBL에 관여하는 학생, 튜터, 주요 스탭을 대상으로, 각각 평균 1시간씩, 총 88명의 심층 인터뷰를 실시했습니다. 인터뷰는 다음 질문을 중심으로 반구조화되어있었다.

  • PBL과 관련된 관행, 경험, 인식, 선호도 및 어려움
  • PBL 토론 세션 
  • PBL 및 PBL 토론에 대한 학생들의 적응적 행동 
  • 토론 및 기타 PBL 관련 기술 개발 
  • 연도별 변화 및 차이, 
  • 학생의 과거 교육 경험 
  • 문화적 및 기타 맥락적 요소의 특성, 의미 및 영향 

First, a total of 88 individual in-depth interviews were conducted with students, tutors, and key staff involved in PBL, lasting an average of one hour each. The interviews were semi-structured, with questions focusing on

  • practices, experiences, perceptions, preferences, and difficulties relating to PBL;
  • PBL discussion sessions;
  • adaptive behaviors of students in response to PBL and PBL discussions;
  • the development of discussion and other PBL-related skills;
  • changes and differences between year levels;
  • students' past educational experiences; and
  • the nature, meaning, and influence of cultural and other contextual factors.

참가자들은 구두 및 서면 동의를 요구받았고, 그들은 감사의 의미로 상징적인 선물을 받았다. 인터뷰는 오디오 녹음과 문자 그대로 녹음되었다.

The participants were asked to give oral and written informed consent, and they received a symbolic gift as gratitude. The interviews were audio recorded and transcribed verbatim.

인터뷰 참가자들은 남녀 학생, 서로 다른 PBL 그룹의 학생, 그리고 지역 환경에서 태어나고 자란 학생들을 포함하기 위해 의도적으로 모집되었다. 이것은 더 풍부한 비교 정보를 얻을 수 있을 것으로 기대되었기 때문에, 얼마 동안 다른 나라에서 살고 학교를 다닌 많은 학생들도 포함되었습니다. 경험된 어려움과 토론 행동과 기술에 대한 차이를 감지하기 위해 1학년과 3학년 학생 수가 거의 동일했다. 학생들은 강의와 PBL 세션에서 발표를 통해 모집되었다. 이 튜터들은 또한 다른 교육 배경을 가진 튜터들과 1학년과 3학년 때부터 튜터들을 포함시키기 위해 의도적으로 선발되었다. 표 2는 학생 및 튜터 샘플에 대한 인구통계학적 데이터를 보여줍니다. PBL과 관련된 핵심 인력은 눈덩이 샘플링을 통해 선발되었다. 각 기관에서는, 처음부터 PBL의 실시에 관여해, 다양한 코디네이트 역할을 완수해 온, (이전) 의학·교육부장, 의학교육부장, 및 스탭이 포함되어 있었다.
Interview participants were recruited purposively to include both male and female students, students from different PBL groups, and students born and raised in the local setting. A number of students who had lived and attended school in another country for some time were also included, because this was expected to yield richer comparative information. Approximately equal numbers of students from the first and the third year were included to detect differences with respect to experienced difficulties and discussion behaviors and skills. The students were recruited through announcements in lectures and in PBL sessions. The tutors were also selected purposively to include tutors with different disciplinary backgrounds, and tutors from the first and third year. Table 2 presents demographic data on the student and tutor samples. Key staff involved in PBL were selected through snowball sampling. At each institution they included (former) deans of medicine and/or education, directors of medical education departments, and staff who were involved in the PBL implementation from the beginning and had performed a range of coordinating roles.

 

둘째, 총 32개의 PBL 토론 세션이 관찰되었습니다. 토론 행동, 학습과 커뮤니케이션의 문화적 차이, 그리고 토론에 영향을 미칠 수 있는 다른 문맥적 요소에 초점을 맞춘 관찰 시트가 개발되었습니다. 관측치의 경우 첫 번째 및 세 번째 해의 서로 다른 PBL 그룹이 랜덤하게 선택되었습니다. 세션에 앞서, 연구자가 간략하게 소개되었고 학생들은 평상시와 같이 세션을 진행하도록 요구받았다. 연구자는 세션에 참여하지 않고 현장 메모를 하고 관찰 시트를 작성했다. 표 3은 세 기관에 걸쳐 관찰과 인터뷰가 어떻게 분포되었는지를 보여준다.
Secondly, a total of 32 PBL discussion sessions were observed. An observation sheet was developed which focused on discussion behaviors, cultural differences in learning and communication, and other contextual factors that might affect the discussions. For the observations, different PBL groups from the first and the third year were randomly selected. Before the session, the researcher was briefly introduced and the students were asked to conduct the session as usual. The researcher took field notes and filled in the observation sheet, without participating in the session. Table 3 shows how the observations and interviews were distributed over the three institutions.

 

셋째, PBL의 실시 및 적용에 관한 문서는 주요 직원으로부터 입수하였으며, 여기에는 학생용 안내 책자, 코스 일정, 문제 사례, 학생 평가를 위한 양식, 커리큘럼에 대한 정보, PBL의 일반적인 평가 등이 포함되어 있습니다. 마지막으로, 강의, 교무실, 여가 활동 중 참가자의 관찰을 통해 제도 및 지역 문화에 대한 추가적인 상황별 정보를 수집했다. 연구원들은 이 정보를 연구 저널에 기록했다.
Thirdly, documents about the implementation and application of PBL were obtained from key staff, such as information booklets for students, course schedules, problem cases, forms to evaluate students, information about the curriculum, and general evaluations of PBL. Finally, additional contextual information about the institutional and local culture was collected by participant observation during lectures, in faculty offices, and during leisure activities. The researchers recorded this information in a research journal.

 

데이터 분석
Data analysis

특정 단계별 주제 분석 유형인 템플릿 분석을 사용하여 데이터를 분석하였다(King 2004, 2010). Template Analysis에서는 [계층적으로 구조화된 테마로 구성된 일련의 코딩 템플릿]을 개발하여, 데이터에 반복적으로 적용하는 과정에서 [분석 진행에 따라 테마가 지속적으로 변경]된다. 그림 1은 다양한 템플릿과 관련 단계를 보여줍니다. 우선, 연구진은 학생들이 토론 세션에서 겪는 어려움이나 세션에 대처하기 위해 개발한 전략과 같이 분석에서 식별될 것으로 예상되는 선험적인 주제를 공식화했다. 첫 번째와 두 번째 저자는 인터뷰 녹취록의 하위 샘플을 이러한 주제로 독립적으로 코드화했다. 이 과정에서 새로운 주제를 식별하고, 기존 주제를 수정하고, 중복된 주제를 삭제했다. 코딩은 정성 데이터 분석용 소프트웨어 프로그램인 Atlas.ti 버전 6.2를 사용하여 수행되었습니다. 두 저자는 토론을 통해 주제 발생 및 해석에 대한 합의를 이룬 후 인터뷰 성적서의 절반에 적용되는 초기 코딩 템플릿을 개발했다.
Template Analysis, a specific step-wise type of thematic analysis, was used to analyze the data (King 2004, 2010). In Template Analysis a succession of coding templates consisting of hierarchically structured themes is developed and iteratively applied to the data with themes being modified continuously as the analysis progresses. Figure 1 presents the different templates and the related steps. To start with, the researchers formulated themes that were a priori anticipated to be identified in the analysis, such as difficulties that students encountered in the discussion sessions, or strategies which they developed to deal with the sessions. The first and second author independently coded a subsample of the interview transcripts with these themes, during which they identified new themes, modified existing themes and deleted redundant themes. Coding was performed using Atlas.ti Version 6.2 (Scientific Software Development, GmbH, Berlin, Germany), a software program for qualitative data analysis. After reaching agreement on the occurrence and interpretation of themes through discussion, the two authors developed an initial coding template, which was applied to half of the interview transcripts.

최종 템플릿이 개발되고 녹취록의 절반에 반복적으로 적용된 후, 연구원들은 PBL 토론의 긴장과 어려움, 학생들의 변화와 발전, 그리고 변화에 영향을 미치는 요소들에 대한 패턴, 원인, 빈도, 의미, 그리고 경도의 식별에 초점을 맞추면서 연구 결과를 해석했다.3개 기관 간의 비교 및 기관 간 및 기관 내 1학년과 3학년 간의 비교.

After the final template was developed and iteratively applied to the first half of the transcripts, the researchers interpreted the findings while focusing on the identification of patterns, causes, frequency, meaning, and salience with regard to

  • tensions and difficulties in PBL discussions,
  • students' change and development,
  • factors influencing student behaviors, and
  • comparisons between the three institutions and between first-year and third-year students across and within the institutions.

해석에서 얻어진 초점 템플릿은 증거확인을 위해 특히 주의를 기울여 나머지 절반의 녹취록에 적용되었으며, 관찰 시트, 현장 노트, 문서 및 연구 저널 분석에도 사용되었다. 최종 해석은 문화와 다른 문맥적 요소, 학생들의 의사소통 행동에서의 문화 간 차이, PBL 토론과 관련된 발전 사이의 관계를 포함하는 개념적 모델을 낳았다.

The focused template that resulted from the interpretation was applied to the remaining half of the transcripts with particular attention for disconfirming evidence, and was also used to analyze the observation sheets, field notes, documents and research journal. A final interpretation resulted in a conceptual model encompassing the relationships between cultural and other contextual factors, cross-cultural differences in students' communicative behaviors and development in relation to PBL discussions.

신뢰도
Trustworthiness

연구의 신뢰성을 높이기 위해 몇 가지 조치가 취해졌다.

  • 첫째, 여러 데이터 수집 방법을 통해 데이터의 삼각측량을 달성했습니다.
  • 둘째, 포화 상태가 될 때까지 데이터 수집을 계속했다.
  • 셋째, 코드화 과정은 반복적이었고, 검증되지 않는 증거에 대한 검색을 포함했으며, 두 연구자에 의해 독립적으로 수행되었다.
  • 넷째, 연구자의 편견에 대한 인식을 높이기 위해 연구자는 현장조사 중에 반사적인 연구일지를 작성했다.
  • 다섯째, 조사기관의 외부인 연구자가 수집한 자료로 참가자의 솔직한 답변을 유도할 수 있다고 가정했다.
  • 마지막으로 인터뷰 참가자 샘플 중 회원 체크를 실시했습니다. 예비 결과의 요약에 동의하고 코멘트를 제공할 것인지를 묻는 질문에 대해 확인 응답과 함께 몇 가지 추가 코멘트와 설명을 받았다. 후자는 데이터의 분석과 해석에서 고려되었다.

Several measures were taken to enhance the study's trustworthiness.

  • First, triangulation of data was achieved through multiple data-collection methods.
  • Second, data collection continued until saturation occurred.
  • Third, the coding process was iterative, included a search for disconfirming evidence, and was conducted independently by two researchers.
  • Fourth, to increase awareness of researcher bias the researchers kept a reflexive research journal during fieldwork.
  • Fifth, the data were collected by researchers who were outsiders to the institutions they investigated, as this was assumed to encourage participants to give honest answers.
  • Finally, a member check among a sample of the interview participants was conducted. In response to the question asking whether they agreed with summaries of preliminary results and would provide comments, confirmatory responses were received as well as some additional comments and clarifications. The latter were taken into account in the analysis and interpretation of the data.

 

결과.
Results

4개의 데이터 소스(인터뷰, 관찰, 문서 및 컨텍스트 정보)의 결과는 통합된 방식으로 표시됩니다. 이들 3개 학교의 학생들은 PBL을 내면화하고 문화적 배경을 다른 정도로 외부화하는 것으로 조사돼 토론 행태에서 문화 간 차이를 보였다. 토론에서 목소리를 높이고, 질문을 하고, 다른 사람에게 도전하는 행동은 네 가지 문화적 요인에 의해 영향을 받는 것으로 나타났습니다. 

  • (1) 불확실성과 전통, 
  • (2) 그룹 관계와 체면  
  • (3) 위계적 관계 및 
  • (4) 성취와 경쟁

The results from the four data sources (interviews, observations, documents, and context information) are presented in an integrated manner. Students of the three schools were found to internalize PBL and externalize their cultural backgrounds to different degrees, which led to cross-cultural differences in discussion behaviors. Behaviors of speaking up, asking questions, and challenging others in the discussion were found to be influenced by four cultural factors:

  • (1) uncertainty and tradition,
  • (2) group relations and face,
  • (3) hierarchical relations, and
  • (4) achievement and competition.

서양의 경우와 비교해 보면, 비서구권의 경우 이들 요인이 토의 과정에 더 큰 영향을 주었고, 대체로 부정적인 쪽이었다.
Compared with the Western case, the two non-Western cases showed a stronger impact of these factors, which generally had an adverse effect on the discussion process.

그러나 다음과 같은 6가지 맥락적 요인도 토론 행동을 억제하거나 강화하는 것으로 확인되었기 때문에 이러한 관계는 간단하지 않았다. 

  • (1) 선행 중등교육의 특성
  • (2) PBL 구현 범위, 
  • (3) 학생의 개인적인 특성, 
  • (4) 교육의 언어 
  • (5) 튜터의 행동 
  • (6) 평가 시스템 

This relationship, however, was not straightforward, as six other contextual factors were also found to either inhibit or enhance discussion behaviors:

  • (1) the nature of students' prior school education,
  • (2) the scope of PBL implementation,
  • (3) students' personal characteristics,
  • (4) language of instruction,
  • (5) tutor behavior, and
  • (6) the assessment system.

3개 학교에서 1학년부터 3학년까지의 학생들의 토론 행동과 기술, 그리고 그들의 발전은 문맥적 요소, 문화적 요소, PBL 토론 세션 간의 복잡한 상호작용에 의해 형성되었다. 개념 모델은 그림 2에 나와 있습니다. 이하에서는, 모델내의 다양한 요소 및 그 상호작용에 대해, 중요도가 아니고, 그 요소에 대해 설명합니다.또, 인터뷰의 인용문을 참조해 설명하겠습니다. 표 4는 토론 역학을 억제하거나 강화할 수 있는 상황적 요인의 가능성에 대한 자세한 개요를 제공한다.

In the three schools, the students' discussion behaviors and skills and their development from the first to the third year were shaped by complex interactions between contextual factors, cultural factors, and the PBL discussion sessions. The conceptual model is presented in Figure 2. Below, the different factors in the model and their interactions are discussed – not in order of importance – and illustrated by quotes from the interviews. Table 4 provides a detailed overview of the potential of the contextual factors to inhibit or enhance discussion dynamics.

 

 

불확실성과 전통
Uncertainty and tradition

중동의 경우, [불확실성의 감정]학생들이 토론에서 목소리를 내는 것을 방해하는 것으로 보인다. 특히 1학년 학생들은 PBL 토론회에서 불확실성을 경험했고, 이는 중등교육에서의 교사 중심적 성격으로 인해 악화되었다(아래 선행교육에 대한 설명 참조). 관련 사전 지식 없이 문제 사례를 논의해야 하는 것은 불확실한 감정을 불러일으켜 학생들이 목소리를 낼 수 없게 했다. 튜터의 설명대로:
In the Middle Eastern case, feelings of uncertainty appeared to inhibit students from speaking up in the discussion. First-year students in particular experienced uncertainty in the PBL discussion sessions, which was aggravated by the teacher-centered nature of their secondary school education (see the discussion on prior education below). Having to discuss a problem case without relevant prior knowledge gave rise to feelings of uncertainty, which prevented students from speaking up. As a tutor explained:

1학년은 학생들에게 어렵다. 그들은 많은 어려움에 직면해 있다. 교육제도는 중등학교의 제도와는 다르다. 토론회에서 그들은 아직 의학 지식이 없었기 때문에 매우 화가 났고 혼란스러웠다. 그래서 그들은 아무 말도 하지 않았다…. 그들은 아무 말이나 생각하는 것을 두려워한다. (중동 가정교사 5)
The first year is difficult to students. They face many difficulties…. The system of education is different from the system in secondary schools. In the discussion meeting, they were very angry and confused, because they did not yet have any medical knowledge. So they did not say anything…. They are afraid to say anything, to think. (Middle East tutor 5)

그러나 중동 학생들은 불안감에 대처하기 위한 [불확실성 저감 전략]을 개발하여 토론회에서 불확실성을 해소하였다. 예를 들어, 토론 세션 전에 선배 학생에게 문제 사례의 토픽에 대해 물어보았다(사례가 매년 조금씩 바뀌었기 때문에).이것에 의해, 상급생은 세션을 준비할 수 있었습니다. 또한, 일부 학생들은 실제 세션 전에 비공식 미팅을 조직하여 모든 학습 주제가 다루어졌는지 확인하고 누가 무엇을 말할 것인지에 대해 합의함으로써, 튜터와의 공식적인 토론 세션의 불확실성을 대부분 없앴다. 한 3학년 학생은 다음과 같이 말했다.
However, the Middle Eastern students developed uncertainty-reducing strategies to cope with their anxiety, thereby mitigating their feelings of uncertainty in discussion sessions. For example, before the discussion session, they asked about the topic of the problem case from senior students – since the cases changed only slightly year to year – which enabled them to prepare for the session. Also, some students organized informal meetings before the actual session, in which they checked if all the learning topics had been covered and agreed on who would talk about what, thereby eliminating most of the uncertainties for the formal discussion session with the tutor. A third-year student commented:

보고 세션 전에, 우리는 학급 그룹과 작은 미팅을 갖고 정보에 대해 논의하려고 합니다. 그래서 세션 전에 우리는 모든 학습 목표를 달성하려고 노력하고, 그 후에 세션에서는 모두가 모든 점에서 문제를 논의할 준비가 되어 있습니다.(중동 3학년)
Before the debriefing session, we have a small meeting with a group of the class and try to discuss the information…. So before the session we try to fulfill all the learning objectives and after that, in the session, everyone is ready to discuss the problem from all points. (Middle East third-year student 3)

 

홍콩에서도 학생 사이에 불확실성이 발견되었지만, PBL의 실시 범위(이하의 실시 범위에 대한 설명 참조)에 의해, 학생의 목소리를 억제하지 않는 범위까지 불안감을 경감할 수 있었다. 네덜란드의 경우, 불확실한 느낌도 있었지만, 다른 두 기관에 비해 덜했다. 네덜란드 1학년 학생들은 [예상되는 토론의 깊이]에 대해 불확실하다고 말했다. 인터뷰와 관찰의 또 다른 결과는 3학년 학생들이 1학년 학생들보다 적극적으로 참여하고 토론에 소통하는 데 더 자신감이 있다는 것이다.

In Hong Kong, uncertainty among students was also found, but the scope of PBL implementation (see discussion on the scope of implementation below) enabled students to reduce their anxiety to the extent that it did not inhibit them from speaking up. In the Dutch case, feelings of uncertainty were also present, but to a lesser degree compared with the other two institutions. First-year Dutch students indicated that they felt uncertain about the expected depth of the discussion. Another result from the interviews and observations was that in all three institutions, third-year students were more confident than first-year students in participating actively and communicating in the discussions.

중동의 경우 주로 발견된 요인은 [전통]이었는데, 이는 불확실성과 강하게 관련되어 있었다. [불확실성]이 모호한 상황과 더 연관이 있었다면, [전통]은 전통을 존중하여 변화를 반대하고, 온건하고 겸손하며, 독실한 태도를 자극하는 것이었다. 이것은 질문을 억제하는 효과가 있었다. 한 직원은 [전통적인 종교적 관점]이 학생들이 토론에서 질문하기를 꺼리는 데 어떻게 기여할 수 있는지를 설명했습니다.
A factor that was mainly found in the Middle Eastern case was tradition, which was strongly related to uncertainty – though the latter related more to ambiguous situations, whereas the former was about opposing change out of respect for tradition, and stimulating a moderate, humble, and devout attitude. This had the effect of inhibiting questioning. A staff member explained how a traditional religious perspective could contribute to students' reluctance to ask questions in the discussion:

이슬람에서는 [하람]이 금지되어 있고, 만약 당신이 그것을 저지르면, 당신은… 그것은 악마이며… 당신은 결코 낙원을 볼 수 없을 것이다. [할랄]은 정반대입니다.그것은 받아들일 수 있는 것입니다.그것은 좋은 일입니다.그리고 그렇게 하면 낙원에 가게 됩니다. 아이의 첫 번째 달갑지 않은 질문(예를 들어, 신에 대한 질문, 생명을 발견하려는 아주 어린 아이들의 매우 환상적인 질문을 알고 있다)과 함께, 우리는 그에게 이것은 하람이며 금지되어 있다고 말한다. "당신은 이 질문을 해서는 안 된다." 그래서 질문 자체가 금지되어 있습니다. 아기에게 이 말을 계속하면 얼마 후 그는 하람이나 할랄로 생명을 빼앗고 하람을 피하려고 한다.(중동 직원 5)

In Islam, Haram is prohibited, and if you commit it, you will go to … it is evil … you will never see paradise. Halal is the opposite, it is something acceptable, it is good to do, and if you do it, you will go to paradise. With the first unwelcome question from a child [referring to previous quote: questions about God for example, you know the very fantastic questions of the very young children trying to discover life], we tell him that this is Haram and this is prohibited, ‘you should not ask this question’. So the question itself is prohibited. When you keep telling your baby this, after some time, he takes life as Haram or Halal and he tries to avoid what is Haram. (Middle East staff 5)

그러나 중동과 홍콩 참가자들 모두 [전통적인 가치관이 사회 전반에 걸쳐 변화하고 있다]는 점에 주목했다(아래 위계관계에 대한 논의 참조).
However, it was noted by both Middle Eastern and Hong Kong participants that traditional values were changing throughout society (see the discussion on hierarchical relations below).

선행 교육 제도
Prior education system


중등교육이 전통적이고 교사 중심일수록, 토론에 참가하는 데 있어서 장해가 되는 것을 알 수 있었다(표4). 중등교육은 중동과 홍콩 응답자 모두에게 교사 중심이라는 특징이 있었다. 네덜란드의 중등학교는 보다 학생 중심적인 것이 특징이며, 네덜란드 학생들은 중고등학교 교육을 PBL 토론에 참여하는 데 장애물로 보지 않았다. 그럼에도 불구하고 그들은 PBL 시스템에 익숙해질 시간이 필요했다. 학생들이 어려움을 겪는 정도에 영향을 미칠 수 있는 측면은 나이였다. 표 2는 중동 학생들이 대학에 입학할 때 홍콩이나 네덜란드 학생들보다 평균 연령이 낮았고, 이것은 부분적으로 더 높은 불안감의 원인이 될 수 있다는 것을 보여준다.

The results indicated that the more traditional and teacher-centered the secondary education of students had been, the more obstacles they experienced to participating in discussions (Table 4). Secondary school education was characterized as teacher-centered by both the Middle Eastern and Hong Kong respondents. Dutch secondary schools were characterized as more student-centered, and Dutch students did not see their previous education as an obstacle to participating in PBL discussions. Nevertheless, they also needed time to get used to the PBL system. An aspect that might also be of influence on the degree to which students experienced difficulties was age. Table 2 shows that the Middle Eastern students had a lower average age than the Hong Kong and Dutch students when entering university, which might partly account for a higher level of anxiety.

흥미롭게도, 홍콩과 중동의 경우, 국제 중등학교에 다닌 경험이 있거나 서양의 교육 경험이 있는 학생(표2)은, 영어의 유창함이나 태도에 있어서, 보다 목소리가 큰 것이 특징이다. 이것은 선행 교육 경험의 영향을 강조한다. 홍콩의 한 가정교사는 다음과 같이 설명했다.
Interestingly, in the Hong Kong and Middle Eastern cases, students who had attended international secondary schools or who had had Western educational experiences (Table 2) were characterized as more vocal, in terms of both fluency in the English language and attitude. This underlines the influence of prior educational experiences. A Hong Kong tutor explained:

(국제 중등학교에 다녔던) 학생들은 표현과 의사소통을 매우 잘 합니다. 그들은 그곳에 갈 수 있는 것이 얼마나 중요한지 알고 있다. 많은 지역 학생들은 아직 그것을 모른다. '만약 뭔가를 알면, 객관식 문제도 풀 수 있고, 좋은 직업도 가질 수 있을 것'이라고 생각해요.(홍콩 가정교사1)
These students are very much coached to express and communicate…. They know how important it is to be able to go out there. Many local students don't know that yet. They think, ‘If I know it, I can do multiple choice and I will have a good career.’ (Hong Kong tutor 1)

 

실시 범위
Scope of implementation

그 결과, PBL 세션이 아니라 [강의를 통해 학습 내용을 많이 다룰수록], 학생들이 자신의 지식을 구축하기 위해 PBL 세션에서 비판적이고 심도 있는 토론에 참여할 가능성은 낮아졌습니다(표 4). Hong Kong School의 하이브리드 강의 기반 접근법(표 1)에서는 학생들은 종종 PBL 세션에서 [강의에서 배운 사실적 지식을 반복]했으며, [비판적인 질문을 하거나 기존의 견해에 도전함으로써 자신의 지식을 구축하려는 시도]를 하지 않았다. 한편, 홍콩 하이브리드 어프로치는 불확실성을 줄여, 학생들이 토론에서 목소리를 내는 것을 두려워하지 않게 했다. 왜냐하면 강의의 결과로서 사전 지식이 높기 때문이다.

The results indicated that the more learning content was covered in lectures instead of in PBL sessions, the less likely students were to engage in critical and in-depth discussions during the PBL sessions to construct their own knowledge (Table 4). In the hybrid, partly lecture-based approach of the Hong Kong school (Table 1), the students often repeated factual knowledge from the lectures in the PBL sessions rather than asking critical questions about it or trying to construct their own knowledge by challenging existing views. On the other hand, the Hong Kong hybrid approach reduced uncertainty, making students less afraid to speak up in the discussions, because of their higher degree of prior knowledge as a result of the lectures.

그룹 관계 및 체면
Group relations and face

중동 학생들은 그룹 관계에 강한 가치를 두는 것으로 밝혀졌는데, 이는 그들이 아직 다른 그룹 구성원을 알지 못한다면 토론에 참여하는 것을 불편하게 만들 수 있다.
Middle Eastern students were found to lay strong value on group relations, which could make them feel uncomfortable about taking part in the discussion if they did not know the other group members yet.

특히 1학년 때는 우리 반에 아는 사람도 없었고, 아는 학생도 없었다. 우리는 모두 수줍음을 많이 탔고, 토론 시간에 전혀 말을 하지 않았다, 그것은 좋지 않았다. 부끄러워서 말을 많이 안 했어요.(중동 3학년 2)
Especially in the first year, I didn't know the people in my class, I didn't know anyone of the students. We were all very shy, we didn't talk at all in the discussion session, that was not nice. I felt shy, I didn't talk too much. (Middle East third-year student 2)

 

하지만 잠시 후, 학생들이 친구가 되고 서로를 신뢰하게 되자, 그들은 참여에 더 자신감을 느꼈다. 학교는 이러한 그룹 포커스에 맞게 정책을 조정했고, 네덜란드에서는 6주, 홍콩에서는 1학기까지 그룹이 함께 지낼 수 있도록 허용되어 토론에 편안하게 참여할 수 있는 안전한 그룹 환경이 조성되었습니다. 반면 네덜란드 학생들은 6주마다 그룹을 바꾸는 것에 만족한다고 말했는데, 이것은 그들에게 지속적인 참여 도전을 의미했다.

After a while, however, when students became friends and grew to trust one another, they felt more confident in participating. The school had adapted its policy to this group focus, and groups were allowed to stay together for one year, as opposed to six weeks in the Dutch case and up to one semester in Hong Kong, which created a safe group environment to comfortably participate in discussions. Dutch students on the other hand indicated they were happy about changing groups every six weeks, which for them meant a continuous challenge to participate.

홍콩에서도 학생들이 집단 관계에 집중하는 것을 발견했는데, 이는 주로 학생들이 [다른 사람 앞에서 자신과 다른 사람들의 체면을 유지하는 것]에 대한 우려로 표현되었다. 이는 그들이 목소리를 높이고, 질문을 하고, 동료들에게 도전할 준비가 덜 되었다는 점에서 그들의 행동에 영향을 미쳤다. 예를 들어, 학생들은 [체면을 구기는 것]을 우려했기 때문에, 내용과 발음이 모두 정확하다고 확신할 때에만 무언가를 말할 것이라는 것을 의미한다.
In Hong Kong too, students were found to focus on group relations, which was mainly expressed in students' concern about maintaining their own and others' face in front of the group. This affected their behavior in that they were less ready to speak up, ask questions, and challenge their peers. For example, concern about losing face meant that students would only say something if they were sure it was correct, both content-wise and pronunciation-wise (see the discussion on language of instruction below).

중국인에게 체면은 매우 중요합니다. 얼굴이란 내가 일을 잘못하면 모두가 나를 비웃을 것이고 나는 기분이 안 좋을 것이라는 뜻이다. 저는 제 자신을 부끄럽게 했고, 학교 교육도, 부모님도 부끄럽게 했습니다. 아마도 그것은 말을 많이 하지 않는 것과 관련이 있을 것이다. 우리 부모님은 항상 나에게 수다를 떨기보다는 듣는 것이 더 낫다고 가르치셨다. 일반적으로 중국인들은 좀 더 내성적이다. 두 번째, 말을 할 때는 말을 잘 해야 합니다. 말을 잘 못하면 말을 못하는 두 가지 이유가 있다. 내 생각에 그 중 하나는 그들이 매우 당황한다는 것이다. 그래서 단어를 발음하는 대신 시도조차 하지 않는다.(홍콩 직원 1)
You see, for the Chinese, face is very important. Face means that if I do a poor job everyone will laugh at me, and I'll feel terrible. I have shamed myself; I've shamed my school education, my parents. Probably that is related to not speaking too much. My parents have always taught me it's better to listen than to blablabla. Generally the Chinese are more reserved. Secondly, if you speak, then make sure you speak well. If you can't speak well then there's a double reason for not speaking. I think an element of that is that they're very embarrassed. So instead of pronouncing a word they don't even try. (Hong Kong staff 1)

 

게다가 홍콩 학생들은 [질문을 하는 것]을 지식 부족을 드러내는 것으로 해석해서 질문하기를 주저했고, 이는 그룹 앞에서 체면을 구기는 것으로 인식됐다. 홍콩과 중동의 학생들도 조화롭고 우호적인 그룹 관계를 중시했기 때문에 그들의 [그룹 구성원의 체면 상실에 대해 걱정]했다. 그 결과, 그들은 동료들과 직접 대화하거나, 비판적인 질문을 하거나, 그들의 발언을 반대하거나, 토론회에서 그들의 행동에 대해 언급하는 것을 꺼렸다. 네덜란드 학생들은 그룹 관계보다는 토론 과정에 더 관심이 많았고, 그룹 구성원에 대한 비판을 더 기꺼이 표현하는 것으로 밝혀졌다.

Furthermore, Hong Kong students were hesitant to ask questions, because they interpreted this as revealing a lack of knowledge, which they perceived as loss of face in front of the group. Hong Kong and Middle Eastern students were also concerned about their group members' face loss, because they valued harmonious and friendly group relations. Consequently, they were reluctant to challenge their peers by directly speaking to them, asking them critical questions, opposing their statements, or commenting on their behavior in the discussion session. Dutch students were found to be more concerned with the discussion process than with group relations, and were more ready to express criticism of group members.

당신은 그저 '당신은 너무 많은 말을 하고 항상 방해하고 있는 것 같아요'라고 말한다. 그냥 그렇게 말해. 그리고 당신은 '나는 당신이 항상 준비가 잘 되어 있고 그룹에 대한 당신의 기여가 마음에 든다'고만 말한다. 그래, 그냥 솔직하게 말해. (네덜란드 3학년 2)
You just say, ‘I think you talk way too much and you are interrupting all the time’. You just say that. And also, you just say, ‘I think you are really well prepared always and I like your contributions to the group’. Yeah, you just say it honestly. (Dutch third-year student 2)

그러나 중동과 홍콩 학생들은 PBL의 목적과 과정에 익숙해진 반면, 토론에서 비판적인 발언을 할 준비가 되어 있었다.
However, while gaining familiarity with the purpose and process of PBL, Middle Eastern and Hong Kong students were more ready to make critical comments in the discussion.

글쎄요, 가끔 동료들에게 말하기 어려운 것도 있지만, 그것이 동료들에게 도움이 되기 때문에, 나는 그들에게 말하지 않으면 안 됩니다.(중동 1학년)
Well, sometimes there are some things that are hard to say to my colleagues, but it is for their own good, so I have to tell them. (Middle East first-year student 2)

마지막 블록의 튜터 선생님은 비판을 매우 강조했습니다. 그는 의사로서 다른 사람의 의견에 감탄하지 말고 비판적인 사고를 가져야 한다고 말한다. 때로는 그렇게 직접적으로 비판하는 것이 부끄럽지만, 나는 이것이 피할 수 없는 단계라고 생각한다.부끄럽거나 도망치려고 하지 말고 익숙해져야 한다고 생각한다.(홍콩 1학년 7)
My tutor of the last block, he emphasized criticism very much. He says that being a doctor, you should have critical thinking instead of admiring others' opinions…. Sometimes it embarrasses me to criticize so directly, but I think this is a step that you cannot avoid so we should get used to it, not feeling ashamed or trying to escape from it. (Hong Kong first-year student 7)

성격의 차이
Personality differences

세 기관 모두 학생 개개인의 토론 행태에서 큰 차이가 관찰되었다. 성별에 따른 차이(표 2)는 발견되지 않았다. 매우 조용하거나 매우 지배적인 학생들은 그룹에 의해 평가받지 못했다(표 4).

In all three institutions, large differences in discussion behaviors were observed between individual students. Differences based on gender (Table 2) were not found. Very quiet or very dominant students were not appreciated by the group (Table 4).

나는 아무도 말을 하지 않는 그룹에 속했다. 말을 시키려면 사람들을 가리켜야 한다.
I was in a group in which nobody said anything, you had to point at people to get them to talk. (Dutch third-year student 3)

몇몇은 꽤 지배적이고 그들은 단지 말을 많이 할 것이다. 그럼 목소리를 낼 기회도 없어. (홍콩 3학년 2)
Some are quite dominating and they will just talk a lot. Then you don't have a chance to speak up. (Hong Kong third-year student 2)

수업에 쓰는 언어
Language of instruction

토론 행동은 수업에 쓰는 언어에 의해서도 영향을 받았다(표 4). 홍콩 세션은 대부분의 학생들과 튜터들의 제2외국어인 영어로 진행되었고, 이는 영어 실력이 기준에 미치지 못한다고 느끼는 사람들에게 문제가 되었다. 대부분의 교사들은 영어 수준이 적절했지만, 학생 개개인에 따라 큰 차이가 발견되었다(현지 학생과 국제 중등학교에 다녔던 학생의 언어 차이는 아래의 선행 교육 제도에 대한 논의를 참조). 체면을 구기는 것에 대한 우려는, 비록 그들이 정말로 할 말이 있다고 느꼈을지라도, 단지 [어떻게 말해야 할지 모른다는 이유]만으로 이 학생들이 침묵하게 만들 것이다. 중동의 경우, 학생들은 세션 동안 비공식적으로 아랍어를 말할 수 있게 되었고, 이는 상호작용과 참여를 강화시켰다.
Discussion behaviors were also affected by the language of instruction (Table 4). The Hong Kong sessions were conducted in English, the second language of most students and tutors, which was a problem for those who felt their English fluency was not up to standard. While most tutors had an adequate level of English, large differences were found between individual students (see the discussion on the prior education system below for language differences between local students and students who had attended international secondary schools). Concerns about loss of face would cause these students to remain silent – even if they felt they really had something to say – just because they did not know how to say it. In the Middle Eastern case, the students were informally allowed to speak Arabic during the sessions, which enhanced interaction and participation.

계층적 관계
Hierarchical relations

홍콩과 중동의 경우, 위계적 관계에 초점을 맞춘 것이, 튜터에게 접근하는 방법에 있어서 학생들의 토론 행동에 영향을 주는 것으로 밝혀졌다. 1학년 학생에 대해 설명했듯이 학생들은, 자신보다는, 튜터를 지식의 원천으로 의존하는 경향이 있었다.

In the Hong Kong and Middle Eastern cases, a focus on hierarchical relations was found to influence students' discussion behaviors in terms of how they approached the tutor. Students were inclined to depend on their tutor as a source of knowledge, rather than on themselves, as this tutor explained about first-year students:

그들은 뭔가 말하고 싶거나 의논하고 싶을 때마다 나를 쳐다본다. 나는 그들에게 나를 보지 말라고 말하려고 한다. 나는 세션의 중심이 아니라 그들이 세션의 중심이다. 하지만 그들은 여전히 선생님이 모든 것의 중심이 되어야 하고, 답을 주는 사람이어야 하며, 그들보다 우위를 점해야 한다고 생각합니다. 지금도 이런 느낌이지만, 제가 말씀드린 것처럼 조금 지나면 그 반대의 느낌이 들 거라고 생각합니다.(중동 과외3)
Every time they want to say something or to discuss anything, they look at me. I try to tell them not to look at me. I am not the center of the session, they are the center of the session…. But they still feel that the teacher should be the center of everything, should be the one to give the answers, and should be the one who has the upper hand on them…. They still feel like this, but I think it will take a transition time, as I told them, after a while, you will feel the reverse. (Middle East tutor 3)

그 결과는 실제로 학생들이 토론하는 동안 튜터 대신 [스스로에게 의지하는 법을 점점 더 많이 배웠다는 것]을 보여주었다. 홍콩에서는 PBL 도입 이후 학생과 교직원 간의 관계가 전반적으로 위계성이 낮아지고 있다는 점에 주목했다.
The results did indeed show that students increasingly learned to depend on themselves instead of on the tutor during the discussions. In Hong Kong, it was noted that relations between students and staff had generally become less hierarchical since the implementation of PBL.

정말 좋은 건 지난 10년 동안 학생들이 날 보고 웃었다는 거야. 길거리와 병동에서 학생들이 저를 보고 웃는 것을 보고 '왜 저 남자가 저를 보고 웃는 거죠? 맞아, 그는 내 PBL 그룹에 있었어. 'X교수님 안녕하세요'라고 합니다. 대단하지 않나요? 옛날에는 X교수가 강의하는 것을 알면 내가 질문할까 봐 도망가려고 했을 것이다. (홍콩 직원 1)
What is so nice is that in the last ten years I've students smiling at me, you know. I see students smiling at me on the streets and on the wards, and I say ‘Why is that guy smiling at me? Oh yes, he was in my PBL group’. They say ‘Hi Professor X’. Isn't that nice? In the old days, if they know you're Professor X giving a lecture, they would be trying to run away, because they're afraid I would ask them a question. (Hong Kong staff 1)

중동과 홍콩의 사례에서 위계(및 그룹) 관계의 중요성의 또 다른 효과는 학생들이 튜터를 도전해서는 안 된다고 느꼈다는 것이다. 선생님에 대한 존경심은 학생들에 의해 높이 평가되었고, 학생들이 선생님에 대해 실제로 반대할지라도 공개적으로 반대하는 것은 무례한 것으로 간주되었다.
Another effect of the importance of hierarchical (and group) relations in the Middle Eastern and Hong Kong cases was that students felt the tutor should not be challenged. Respect for the teacher was valued highly by the students, and openly disagreeing with a teacher was considered disrespectful, even though students might actually disagree with the teacher.

나는 일반적으로 중국인들이 도전challenge하려는 의지가 적다고 생각한다. 그들은 끝까지 질문을 안 할 것이다. 그들이 반드시 독자 분께 납득이 가는 것은 아니지만, 그들의 의견 차이를 말하지 않을 수도 있습니다. 그것은 위계적 수준속에서 평온하다는 증거이다. 그들은 더 조용하다. (홍콩 가정교사 1)
I think Chinese people in general are less willing to challenge. They are the last ones to question. It is not that they are necessarily convinced by you, but they may not voice their disagreement. It is proof of serenity on hierarchical level. They are quieter. (Hong Kong tutor 1)

흥미롭게도, 홍콩과 중동의 경우, 응답자들은 그들의 사회가 전통적인 가치에서 벗어나고 있으며, 사람들은 더욱 목소리를 높이고 권위에 도전하려고 하고 있으며, 이는 토론이나 다른 곳에서 학생들의 행동에 반영되었다.
Interestingly, in both the Hong Kong and Middle Eastern cases, respondents characterized their society as moving away from traditional values, with people becoming more vocal and willing to challenge authority, which was reflected in students' behavior in the discussions and elsewhere.

확실히 90년대 이후 세대의 학생들은 권위에 도전할 용의가 훨씬 더 많다. (홍콩 과외 3)
Certainly the post-nineties generation of students is far more willing to challenge authority. (Hong Kong tutor 3)

이 세대의 학생들은 우리 세대와는 다르다. 그들 세대는 더 자신감이 있다…. 몰라, 우리는 노인들에 대해 더 존경심을 느꼈어. (중동 가정교사1)
Students in this generation are different from our generation. They are more confident as a generation…. I do not know, we felt more respect for the older people. (Middle Eastern tutor 1)
 
네덜란드의 경우, 튜터에 대한 비판적인 태도는 드물지 않았고, 심지어 몇몇 튜터는 격려하기도 했다.

In the Dutch case, a critical attitude towards the tutor was not unusual, and was even encouraged by some tutors

제가 항상 말하죠. 제 모든 그룹에게요. 예를 들어, 제가 어떻게 하고 있는지에 대해 동의하지 않는 것이 있다면, 그렇게 말씀하셔야 합니다. 그리고 학생들은 그렇게 한다. (네덜란드 과외 4)
I always say, every time to all of my groups, like, if there is anything you don't agree with, about how I'm doing it, you should say so. And students do that. (Dutch tutor 4)


네덜란드 사회는 일반적으로 비서구 사회보다 덜 위계적인 것으로 특징지어졌고, 이것은 학생들이 토론하는 동안 그들의 지도교사에게 접근하는 방법에 영향을 미쳤다고 주장되었다.
Dutch society was generally characterized as less hierarchical than non-Western societies, and it was argued that this affected how students approached their tutor during the discussions.

모든 사람이 평등하고 모든 사람의 의견이 중요하며 모든 사람이 발언권을 가지고 있기 때문이라고 생각합니다. 그리고 종종 임상의사이기도 하고 물론 제 위에 서기도 하지만 그 차이는 그리 크지 않습니다. 우리는 그를 비판하거나 비판적인 질문을 하지 않을 정도로 수줍음을 타지 않는다. (네덜란드 3학년 5명)
I think it is due to, everybody is equal and everyone's opinion is important and everyone has a voice…. And there is the tutor, who often is a clinician and of course he stands above me, but the gap is not very big. We are not so shy as to never dare to criticize him or never dare to ask a critical question. (Dutch third-year student 5)

 

튜터의 행동
Tutor behaviors

각 기관마다 튜터의 토론 진행 방법에 큰 차이가 있었고, 학생의 토론 행동에 큰 영향을 주었다. 학생이 발언할 기회가 전혀 없을 정도로 토론을 지배하고 있는 튜터도 있는 반면, 다른 튜터들은 학생들이 막혔을 때 토론을 자극하거나 설명하지 않고, 의욕이 결여된 채 수업 중에 소극적인 태도를 보였다. 어떤 행동도 학생들이 활발한 토론에 참여하도록 자극하지 않았다.
Within each of the institutions, large differences were found in the way tutors facilitated the discussion sessions, and this had a major impact on students' discussion behaviors. While some tutors dominated the discussion to the extent that students had no opportunity to speak at all, other tutors displayed a lack of motivation, remaining passive during the sessions, neither stimulating the discussion nor giving explanations when students got stuck (Table 4). Neither type of behavior stimulated students to engage in a lively discussion.

한때는 모든 토론을 직접 하는 튜터가 있었다. 그리고 우리는 그녀의 말을 잘 듣고 있었고, 우리는 그녀가 말하는 것에 대해 확신하고 있었지만, 우리는 토론하고 있지 않았습니다. 만약 튜터가 말하고 싶어 하면, 우리는 그녀에게 닥치라고 말할 수 없다. (중동 3학년 2)
I once had a tutor who would do the entire discussion herself. And we just listened to her, she was talking very well and we were convinced by what she was saying, but we were not discussing you know…. If the tutor just wants to talk we can't tell her or him to shut up. (Middle East third-year student 2)

성과와 경쟁
Achievement and competition

홍콩과 중동에서는, 응답자의 사회가 성취에 중점을 두는 것이 특징이며, 성공과 최고가 높이 평가되고 있다고 느끼고 있다.
In Hong Kong and the Middle East, respondents felt their society was characterized by a strong focus on achievement, and being successful and being the best were highly valued.

홍콩 학생이나 홍콩 선생님, 홍콩 학부모들이 성적과 시험 성적, 성적에 많은 스트레스를 주는 것은 일반적인 조건이라고 생각합니다. (홍콩 3학년 1)
I think it is a general condition that Hong Kong students or Hong Kong teachers or Hong Kong parents lay a lot of stress on your grades and the exam results, on your performance. (Hong Kong third-year student 1)

모든 학생은 자신의 커리어에서 가장 위대한 학생이 되고자 하며 훌륭한 교수가 되고자 한다. 우리 교수진에서 나는 최고의 의사가 되는 것을 꿈꾼다. (중동 3학년)
Every student seeks to be the greatest one in his career and wants to be a great professor. In our faculty, I dream of becoming the greatest doctor. (Middle East third-year student 3)

경쟁은 성취와 밀접한 관련이 있었고, 학생들은 그들의 또래들 사이에서 최고가 되기 위해 지속적으로 경쟁했다. 토론 세션 후 일부 학생들은 동료들과 정보를 공유하는 것을 꺼렸다.
Competition was closely related to achievement, with students continuously competing to be the best among their peers. A consequence for the discussion sessions was that some students were reluctant to share the information with peers.

학생들 중 최고가 되겠다는 생각을 하게 되면, 세션 사이에 발견한 정보를 비밀로 하게 된다.그걸 혼자만 알고 있는 거예요. 그들은 다른 학생들과 정보를 교환하는 것은 다른 학생들이 너보다 더 잘할 것이라고 생각한다. (중동 3학년)
The idea of being the best one on the list, or the top of the list, in the minds of some students is that you have to keep the information that you find between the sessions secret, you keep it to yourself. They think that exchanging information with other students will mean that the other students will be better than you. (Middle East third-year student 3)


성취와 경쟁의 문화적 요소들은 네덜란드 학생들 사이에서 덜 두드러지는 것으로 확인되었지만, 이 학생들 역시 시험에 초점을 맞춘 것으로 특징지어졌다. 그러나, 모든 기관에서, 궁극적으로 시험 지향의 초점이 어느 정도까지 토론 행동을 억제하거나 강화했는지를 결정하는 것은 평가 시스템의 특성이었다.

The cultural factors of achievement and competition were found to be less prominent among the Dutch students, although these students too were characterized as exam focused. In all the institutions, however, it was the nature of the assessment system that ultimately determined to what extent an exam-directed focus inhibited or enhanced discussion behaviors.

평가 시스템
Assessment system

토론 세션에서의 평가는 토론 행동에 영향을 미쳤다(표 4). 홍콩의 경우, 지도교사가 학생들의 참여와 의사소통 측면을 지속적으로 평가하여 학생들의 최종 성적에 기여하였다. 이 평가와 성취에 초점을 맞춘 결과, 홍콩 1학년 학생들은 토론에 참여할 것에 대한 불안감을 극복하고 동료들의 참여와 토론, 도전을 갈망하게 되었다.

Assessment during the discussion sessions influenced discussion behaviors (Table 4). In the Hong Kong case, the tutor continuously assessed students on participation and communication aspects, which contributed to students' final grades. As a result of this assessment and their focus on achievement, first-year Hong Kong students managed to overcome their anxiety about contributing to the discussions, and became keen to participate, debate, and challenge their peers.

처음 2년 동안은 말을 많이 할수록 점수가 높아지기 때문에 말하기 위해 싸우고 있다.(홍콩 3학년)
In the first two years … you are just fighting to talk, because the more you talk supposedly the higher the mark you get. (Hong Kong third-year student 4)

대부분의 학생들은 지속적인 평가에 집중한다. 그들은 항상 점수 때문에 걱정한다. 그래서 우리는 튜토리얼에서 무언가를 말해야 한다.그렇지 않으면 그날 점수가 나오지 않을 것이다.(홍콩 1학년4)
Most of the students focus strongly on the continuous assessment. They are always worrying about the scores… They say, ‘So we have to say something in the tutorial, otherwise there will no score that day.’ (Hong Kong first-year student 4)

반면 홍콩 3학년생은 1학년생보다 활동성이 떨어지는 것으로 나타났다. 그들은 PBL 평가에서 낙제하는 것은 사실상 불가능하다는 것을 알아냈다. 왜냐하면 매우 극단적인 경우에만 튜터가 학생들을 낙제시키기 때문이다. 이것은 학생들이 수업 시간에 열심히 할 필요가 없게 만들었다. 네덜란드 사례에서도 학생들은 세션에서 자신의 행동에 대한 평가가 실질적인 결과를 가져오지 않는다고 느꼈다. 중동의 경우, 학생들은 토론에 대한 기여의 내용에 대해 평가받지 못했다는 것을 깨달았기 때문에 목소리를 낼 수 있다는 자신감을 느꼈다.

Third-year Hong Kong students, by contrast, were observed to be less active than the first-year students. They had discovered that, in practice, it was virtually impossible to fail the PBL assessment, because only in very extreme cases tutors would fail students. This made it unnecessary for the students to try hard in the sessions. In the Dutch case too, students felt that the assessment of their behavior in the sessions had no substantial consequences. In the Middle Eastern case, students felt more confident to speak up as they realized they were not assessed on the content of their contributions to the discussion.

우선 나는 우리 반에서 말을 많이 하지 않았다. 하지만 그 후, 학위나 시험과 관련된 것이 아니라는 생각을 하게 되었습니다. 우리는 그 주제에 대해 우리가 알고 있는 것에 대해 자유롭게 말할 수 있을 뿐이다.(중동 3학년 10)
First I was not talking much in our class. But after, I got the idea that it is not something related to degrees and exams and something like that. We are just free to talk about what we know about that subject. (Middle Eastern third-year student 10)

 

논의
Discussion

주요 조사 결과
Main findings

이 연구의 목적은 PBL 토론에서 3개 문화에 걸친 학생들의 문화적 배경이 어떻게 표현되었는지, 그리고 이것이 학생들의 토론 행동과 기술을 어떻게 형성했는지 조사하는 것이었다. 학생들의 배경과 관련된 4가지 문화적 요소가 학생들에 의해 외부화 되어 토론 과정에 방해가 되었다. [불확실성과 전통, 그룹 관계와 체면, 위계적 관계, 성취와 경쟁]은 일반적으로 학생들이 토론에서 목소리를 높이고 질문을 하고 다른 사람들에게 도전하는 것을 방해하는 것으로 밝혀졌다. 다만, 중동의 경우는 그룹 관계에 초점을 맞추고, 홍콩의 경우는, 평가 제도의 성격과 함께 성과에 초점을 맞추고 있는 것으로, 논의의 역학 관계도 개선되고 있는 것을 알 수 있었다. 네덜란드 사례의 문화적 가치는 이 연구에서 확인된 네 가지 문화적 요인의 덜 존재하는 것을 반영하는 것으로 보였으며, 이는 일반적으로 토론 역학을 강화하는 것으로 밝혀졌다.
The aim of this study was to investigate how the cultural backgrounds of students across three cultures were expressed in the PBL discussions, and how this shaped students' discussion behaviors and skills. Four cultural factors related to students' backgrounds were externalized by the students, causing interference with the discussion process. Uncertainty and tradition, group relations and face, hierarchical relations, and achievement and competition were generally found to inhibit students from speaking up, asking questions, and challenging others in discussions. However, a focus on group relations in the Middle Eastern case and, in the Hong Kong case, a focus on achievement coupled with the nature of the assessment system were found to improve discussion dynamics as well. Cultural values in the Dutch case seemed to reflect a lesser presence of the four cultural factors identified in this study, which in general was found to enhance discussion dynamics.

이전의 연구에서는 이러한 [문화적 요소들이 의사소통 행동과 관련이 있다]는 사실도 밝혀졌습니다. 예를 들어, 황 교수와 다른 사람들(2003)은 체면 감퇴에 대한 우려와 질문하기를 꺼리는 것의 관계를 지적했다. 구디쿤스트의 문화 간 의사소통 이론은 불확실성, 집단 관계, 그리고 위계 관계 사이의 관계를 그리고 다른 한편으로는 낯선 사람이나 더 높은 지위의 사람들과의 의사소통에 대한 더 높은 수준의 불안감을 가정한다. Fassinger(1995)는 성취와 교실 상호 작용 사이의 관계를 보고했으며, 만약 학생들의 성적이 긍정적인 영향을 미칠 것이라고 인식한다면 학생들의 참여가 증가하였다. [불확실성과 전통]뿐만 아니라 [그룹 관계와 체면]이라는 문화적 요소는 각각 두 개의 개별적인 요소를 포함한다고 주장할 수 있다. 그러나 조사 대상 주제에 대한 상호 관련성이 높기 때문에, 본 연구에서는 문화 및 문화 요소를 분류하고 개념화할 수 있는 다양한 가능성과 관점이 존재함을 유의해야 한다.

Previous research has also found these cultural factors to be related to communication behaviors. Hwang and others (2003), for example, pointed to a relation between concern about face loss and reluctance to ask questions. Gudykunst's intercultural communication theory posits relationships between uncertainty, group relations, and hierarchical relations on the one hand and higher levels of anxiety about communicating with strangers or higher status persons on the other hand (Gudykunst 2005). Fassinger (1995) reported a relationship between achievement and classroom interaction, with students' participation increasing if they perceived it would have a positive effect on their grades. The cultural factor of uncertainty and tradition, as well as group relations and face, can be argued to include two separate factors each. Because of the high degree of interrelatedness with regard to the topic under investigation, however, in this study they were conceptualized as single factors, though it should be noted that a range of different possibilities and perspectives for categorizing and conceptualizing culture and cultural factors exists (e.g. Geertz 1973; Hofstede 2001; Trompenaars and Hampden-Turner 1998).

문화적 요인 외에도, 학생들의 토론 행동을 억제하거나 강화하는 6가지 맥락적 요인이 확인되었다. 모든 요소가 상호 관련성이 있기에, [문화적인 요소]와 [맥락적인 요소]를 구별한다는 것이 때로는 어려웠지만, 이 여섯 가지 요소는 문화보다는 [조직적인 결정이나 개인의 특징]과 더 관련이 있었다. 3개 기관 모두 중등 학교의 성격, PBL의 실시 범위, 학생의 인성, 지도 언어, 지도자의 행동, 평가 시스템이 논의에 영향을 미치는 것으로 나타났다.
In addition to cultural factors, six mediating contextual factors were identified that, depending on their nature, either inhibited or enhanced students' discussion behaviors. While the distinction between cultural and other contextual factors was sometimes hard to make considering the interrelatedness of all factors, these six factors related more to either organizational decisions or individual characteristics rather than culture. In the three institutions alike, the nature of the secondary school system, the scope of PBL implementation, students' personalities, language of instruction, the behavior of tutors, and the assessment system were found to impact on the discussions.

이것은 이전의 연구보고에 따르면 다음과 같은 강력한 영향력과 일치한다.

  • 중동 및 홍콩 학생을 대상으로 한 전통적인 교사 중심 및 시험 중심 중등학교
  • 서양 교육 모델에서 비서양 학생의 언어 문제
  • PBL 실행 범위, 학생 간의 성격 차이, 평가 시스템, 토론 세션에서 튜터의 주요 중재 역할의 중요성

This is consistent with previous research reporting the strong influence of

  • traditional, teacher-centered and exam-focused secondary schools on students in the Middle East and Hong Kong (Al Kadri et al. 2011; Bridger 2007; Chan 1999; Leung, Ginns, and Kember 2008);
  • language difficulties of non-Western students in Western educational models (Bridger 2007; Khoo 2003; Ladyshewsky 1996); and
  • the importance of the scope of PBL implementation, personality differences between students, the assessment system, and the major mediating role of the tutor in discussion sessions (Dochy et al. 2003; Dolmans et al. 2005; Moust, Van Berkel, and Schmidt 2005).

[개인 간 차이]가 [선호하는 의사소통 스타일에 대한 문화적 차이]보다 크다는 것을 발견한 이전 연구에서 [성격차이]의 역할이 더욱 강조되었다(Park et al. 2012).

The role of personality differences is furthermore emphasized by previous research that found individual variations to be larger than cultural variations in preferences for direct communication styles (Park et al. 2012).

현재의 연구는 맥락적 요인, 문화적 요인, 그리고 학생 중심의 교육 모델 사이의 상호작용이 학생들이 PBL의 토론 측면을 어떻게 내면화하고 결과적으로 그들의 토론 기술이 어떻게 발전하는지를 결정한다는 것을 보여주었다. 각 교육기관에서는 1학년에서 3학년으로 넘어감에 따라 이러한 능력이 증가하는 것으로 나타났다. 일반적으로 학생들은 자신감을 얻었고, 토론에 참여하고, 질문을 하고, 다른 사람의 발언이나 행동에 대해 비판하고, 이의를 제기하는 데 있어서 때로는 그들 자신의 대처 전략에 의해 도움을 받는 것을 더 편안하게 느꼈다. 그러나 토론행태와 기술발달률에서 3개 기관의 학생들은 상당한 차이를 보였다. 
The current study showed that interactions between contextual factors, cultural factors, and the student-centered educational model determined how students internalized the discussion aspect of PBL, and consequently how their discussion skills developed. In each of the institutions, these skills were found to increase as students moved from first to third year. Generally, students gained confidence and felt more comfortable – sometimes helped by their own coping strategies – in participating in the discussions, asking questions, and criticizing and challenging the statements or behaviors of others. The students at the three institutions differed considerably, however, in the rate of development of discussion behaviors and skills.

비서구 의과대학에서 [4대 문화요소의 영향]이 서구 의과대학보다 강하다는 것은, 일반적으로 비서구 학생들이 학생 중심의 토론에 더 많은 어려움을 겪었다는 것을 의미하며, 이는 교사 중심의 중등교육 시스템의 전통적인 특성으로 인해 더욱 커진 문제이다. PBL의 실시 범위에서의 두 비서방 기관 간의 차이는 토론 행동과 기술 개발의 차이를 고려했다. 홍콩에서의 하이브리드 실장은 학생들이 적극적으로 토론에 참여하도록 자극했지만, 중동(또는 네덜란드)의 경우와 같이 '온전한' PBL의 도입은 학생들이 토론을 통해 지식을 쌓도록 장려하여 학생들이 더 비판적으로 참여하도록 자극했다.정기적인 논의

The stronger impact of the four cultural factors in the non-Western schools compared to the Western school generally meant that students experienced more difficulty in engaging in student-centered discussions, a problem that was augmented by the traditional nature of their teacher-centered secondary school systems. The difference between the two non-Western institutions in the scope of PBL implementation accounted for differences in the development of discussion behaviors and skills. While the hybrid implementation in Hong Kong stimulated students to actively engage in discussions because the lectures reduced their feelings of uncertainty, the ‘full’ PBL implementation in the Middle Eastern case – and in the Dutch case – encouraged students to use the discussions to build knowledge, which stimulated them to engage in more critical discussions.

 

시사점
Implications

문화적 및 상황적 과제
Cultural and contextual challenges


이 연구결과는 [학생 중심 교육의 문화 간 적용 가능성에 대해 제기된 의구심]을 정당화한다. 그들은 또한 학생 중심의 토론 기반 교육 모델이 서구 문화보다 비서양 문화에서 더 많은 어려움이 많고, 학생들의 토론 행동과 기술 면에서 다른 과정과 결과를 초래한다는 것을 보여준다. 서구 사례와 두 개의 비서구 사례의 비교는 학생 중심의 토론에서 학생들의 행동과 기술에 영향을 미치는 [문화 간 차이의 개념적 모델]을 산출했다. 이 연구는 다른 맥락적 요소를 모델에 포함시킴으로써 [문화적인 요소]와 [연관된 맥락적 요소]의 주요 매개 역할을 강조하고, [문화적 요소와 토론 행동 및 기술 간의 관계가 간단하지 않다]는 가정을 정당화한다. 게다가 [맥락적 요인이 상당부분 관여한다는 것]은, 학생 중심의 토론 기반의 교육 방법이 [그 방법과 문화적 가치가 양립할 수 있는 서양 문화]를 포함하여, [모든 문화에서 어려움이 발생할 가능성]이 높으며, 여기에 [맥락적 요인이 더해져서 학생들의 적응을 복잡하게 할 수 있다]는 것을 암시한다. 그러나, 이러한 과제에도 불구하고, 이 연구는 다른 문화권에서 고등교육에서 학생 중심의 접근방식을 사용하는 것이 상당히 실현 가능하다는 것을 증명하는 것으로 보인다. 이 주장은 세 기관이 각각 10년 이상 이 모델을 적용해왔다는 사실에 의해 뒷받침된다. 분명히, 어려움은 학생 중심의 고등교육에서 문화적으로 다르고, 맥락에 따라 다르면서도 탄탄한 토론 과정과 공존할 수 있다.

The findings justify doubts that have been expressed (see the introductory discussion) about the cross-cultural applicability of student-centered education. They also show that a student-centered, discussion-based educational model poses more challenges in non-Western cultures than in a Western culture, leading to different processes and outcomes in terms of students' discussion behaviors and skills. The comparison of a Western case and two non-Western cases yielded a conceptual model of cross-cultural differences affecting students' behaviors and skills in student-centered discussions. By incorporating other contextual factors in the model, the study underscores the major mediating role of contextual factors in relation to cultural factors, and justifies the assumption that the relationship between cultural factors and discussion behaviors and skills is not straightforward. Moreover, the substantial involvement of contextual factors implies that a student-centered, discussion-based educational method is likely to pose challenges in any culture, including Western cultures in which cultural values might be compatible with the method, but other contextual factors could complicate students' adaptation. Despite these challenges, however, this study appears to demonstrate that it is quite feasible to use a student-centered approach in higher education in different cultures – a claim that is supported by the fact that the three institutions had each been applying the model for over a decade. Apparently, difficulties can coexist with cross-culturally different, context-specific, yet solid discussion processes in student-centered higher education.

개인주의의 복잡성-집단주의
The complexity of individualism–collectivism

이 연구는 집단주의적 동양문화와 개인주의적 서양문화의 구분이 학생들의 의사소통 행동에 반영되어 집단주의적 성향으로 인해 학생 중심의 교육이 비서양적 환경에서 더 많은 도전을 초래할 것이라는 기대를 확인하는 것으로 보인다. 이전의 연구는 [불확실성과 전통, 집단 관계와 체면, 위계 관계]와 같은 문화적 요소들이 모두 [집단주의]라는 문화적 개념과 관련이 있으면서, 상호 연관되어 있다는 것을 보여주었다. 하지만, 두 비서구적인 사례들은 또한 [경쟁과 성취]에 강한 초점을 두고 있었으며, 이는 종종 집단주의보다는 [개인주의]와 관련이 있다.
This study appears to confirm the expectation that a distinction between collectivistic Eastern cultures and individualistic Western cultures would be reflected in students' communication behaviors, and consequently, that student-centered education may pose more challenges in non-Western settings due to their collectivist orientation. Previous research showed that the cultural factors of uncertainty and tradition, group relations and face, and hierarchical relations are interrelated, while they were all related to the cultural concept of collectivism (Gudykunst 2005; Oetzel et al. 2001). However, the two non-Western cases were also characterized by a strong focus on competition and achievement, which is often associated with individualism rather than collectivism (Fontaine et al. 2008; Liao and Bond 2011).

이전의 많은 연구들은 [집단주의와 개인주의의 개념]이 일반적으로 생각하는 것보다 훨씬 더 복잡하다는 것을 시사했다. 예를 들어, 참여자들이 개인주의와 집단주의적 얼굴의 관심사 모두에서 높은 점수를 받은 홍콩의 연구들에서 증명되었다. 따라서, 어떤 사회는 어떤 측면에서는 집단주의로 정의될 수 있지만, 다른 측면에서는 개인주의로 정의될 수 있는데, 이것은 이 연구의 결과와 일치하는 것처럼 보인다. 문제는 이것이 토론 중심, 학생 중심 교육의 간문화적cross-cultural 구현에서 어떻게 이루어지느냐는 것이다. 본 연구의 결과는 성취의 개인주의적 요소에 초점을 맞추는 것이 집단주의적 요소의 효과를 완화할 수 있음을 보여준다. 다만, 이는 특정 맥락적 요소에 크게 의존적이며, 특히 평가 시스템이 그러하다. 추가 연구는 어떻게 집단주의와 개인주의적인 요소들이 문화 전반에 걸친 고등교육에서 토론 과정을 최적화하기 위한 균형으로 사용될 수 있는지 조사할 수 있다.

A number of previous studies has suggested that the concepts of collectivism and individualism are far more complex than is generally thought, as for example is evidenced by studies in Hong Kong, in which participants scored high on both individualism and collectivistic face concerns (Hwang, Francesco, and Kessler 2003; Liao and Bond 2011). Thus, some societies may be defined as collectivistic in certain aspects, but as individualistic in others, which seems consistent with this study's findings. The question is how this plays out in the cross-cultural implementation of discussion-based, student-centered education. The results of the current study suggest that a focus on the individualistic factor of achievement – which also other studies have found to be of major importance in Hong Kong and of influence on Hong Kong students (Brown and Wang 2011) – can mitigate the inhibiting effects of collectivistic factors, although this depends heavily on certain contextual factors, notably the assessment system. Further research might investigate how collectivistic and individualistic factors can be used as a balance to optimize discussion processes in higher education across cultures.

학습 접근법의 유연성
The flexibility of learning approaches

학생 중심 교육은, 비서구 환경에 있는 학생이나 교사와 특정의 과제에 직면하고 있는 것처럼 보이지만, 그 결과, 비서구권 학생은 어느 정도, 커뮤니케이션이나 토론에 관한 학습 행동을 서구 학생 중심 모델에 맞추어 조정하고 있는 것을 알 수 있다. 그러나 동시에, 비서양의 문화적 배경과 맥락적 배경은 이러한 행동과 기술의 개발을 방해할 수 있다. 흥미롭게도, 이전 연구들은 [서양에서 공부하던 중국 학생들]이 서양의 방식에 맞게 다른 학습 방식을 적응시킬 수 있거나, 적어도 [같은 과정을 중국에서 수강하는 학생들]보다 그들의 방식을 더 잘 적응시킬 수 있다는 것을 보여주었다. 그래서, 학생들이 다른 문화 환경에서 배우는 경우 그들의 학습 방식을 매우 바꿀 수 있는 반면, 그들 자신의 문화 환경(학습 및 토론 접근방식이 덜 유연하지만, 여전히 변화할 수는 있는)에 새로운 방법을 적용하면 더 많은 문제에 직면할 수 있다.

Although student-centered education seems to confront students and teachers in non-Western settings with specific challenges, the results indicate that non-Western students, to a certain degree, do adapt their learning behaviors in respect of communication and discussion to fit with the Western student-centered model. At the same time, however, a non-Western cultural and contextual background may inhibit the development of these behaviors and skills. Interestingly, previous studies have showed that Chinese students who were studying in the West were very capable of adapting their different learning approach to fit with the Western method (Gieve and Clark 2005; Gu and Schweisfurth 2006), or at least adapted their approaches more than students taking the same course in China (Wang, Harding, and Mai 2012). So, while students might be very able to change their learning approach when learning in a different cultural environment, they may encounter more problems when a new method is applied in their own cultural setting, in which their learning and discussion approaches seem to be less flexible, but still able to change.

제한사항 및 결론
Limitations and conclusions

본 연구의 한계는 자체 보고 인터뷰 데이터에 대한 의존도가 높다는 점이며, 이는 주의 깊게 해석되어야 한다. 그러나 데이터의 신뢰성은 서로 다른 소스 및 서로 다른 참가자 그룹의 데이터를 삼각측량함으로써 향상되었다. 두 번째 한계는 종적이 아닌 단면적 학생 표본이 개별 학생의 실제 장기 발달에 대한 조사를 방해했다는 것이다. 그러나 면접에서 3학년 학생들은 대학에 입학한 이후 그들의 발전에 집중하라는 요구를 분명히 받았다. 1학년이 된 기분이 어땠는지에 대한 그들의 기억은 연구에서 1학년 학생들이 표현한 견해와 대체로 일치했다.
A limitation of the study is its heavy reliance on self-reported interview data, which should be interpreted with caution. The trustworthiness of the data, however, was enhanced by triangulation of data from different sources and different groups of participants. A second limitation is that the cross-sectional rather than longitudinal student sample prevented investigation of the actual long-term development of individual students. However, in the interviews the third-year students were explicitly asked to focus on their development since their enrolment in university. Their recall of what it felt like to be a first-year student generally coincided with the views expressed by the first-year students in the study.

이 정성적 연구의 결과는 일반화에 도움이 되지 않는다. 그러나, 연구자는 관련 인자에 대한 두꺼운 설명을 제공함으로써 연구의 전이가능성이 향상되었기 때문에, 자신의 환경에 적용할 수 있다고 생각하는 측면과 시사점을 결과로부터 얻을 수 있다. 미래의 연구는 비슷한 문화적 환경뿐만 아니라 다른 다양한 상황에서 더 많은 사례를 조사할 수 있으며, 나아가 논의의 측면을 넘어 학생 중심 교육의 다른 측면에 초점을 맞출 수도 있다. 이 연구에서 제시된 개념 모델은 그러한 연구의 출발점이 될 수 있다.
The findings from this qualitative study do not lend themselves to generalization. However, researchers might take from the results those aspects and implications they deem applicable to their own setting, as the study's transferability was enhanced by providing thick description of the factors involved. Future research might investigate more cases in different as well as in similar cultural settings, and furthermore focus on other aspects of student-centered education beyond the discussion aspect. The conceptual model presented in this study could serve as a starting point for such research.

이번 연구결과는 여러 문화에 걸쳐 고등교육자들이 문화간cross cultural 차이에 대한 미래 연구는 [맥락적 요소의 역할]을 고려해야 하며, 특히 [문화적 요소의 영향을 중재하는 맥락적 요소]를 연구해야 한다. 다른 문화 발견의 맥락화를 통해 연구의 생태학적 타당성은 실제 상황에 더 잘 근접할수록 증가할 수 있다. 맥락과 문화의 영향에 초점을 맞춤으로써, 이 연구는 [학생 중심 교육]의 과정과 결과, 또는 학생의 행동과 기술이 [맥락]에 따라 다를 수 있다는 것을 인정하면서도, 학생 중심 교육의 문화 간cross-cultural 적용 가능성에 대한 증거를 제공했다.

The results of the current study emphasize that educationalists in higher education across cultures, and future research on cross-cultural differences in education should consider the role of contextual factors, specifically in mediating the effects of cultural factors. By contextualization of cross-cultural findings the ecological validity of a study can be increased as it better approximates real-life situations. By focusing on the influence of context and culture, this study has provided evidence for the cross-cultural applicability of student-centered education, although it should be accepted that its process and outcome, or students' behaviors and skills, are likely to differ across contexts.

 

 


Abstract

A tool used in student-centered education is discussion among students in small learning groups. The Western origin of student-centered education, coupled with cross-cultural differences in communication styles, may detract from its cross-cultural applicability. This study investigates how in student-centered education, students' cultural backgrounds are expressed in discussions and shape students' discussion behaviors and skills. A comparative case study using problem-based learning as a student-centered model was conducted in three medical schools located in East Asia, Western Europe and the Middle East. Four cultural factors were found to potentially cause students, especially those in the non-Western schools, to refrain from speaking up, asking questions, and challenging others in discussions. Six contextual factors mediated the influence of the cultural factors. The findings were incorporated in a conceptual model. The conclusion seems justified that student-centered education is feasible in different cultural contexts, but across these contexts, processes and outcomes are likely to differ.

 

프로포절 준비 프로그램: NIH 연구비 지원 촉진을 위한 그룹 멘토링, 교수개발 모델(Acad Med, 2022)
The Proposal Preparation Program: A Group Mentoring, Faculty Development Model to Facilitate the Submission and Funding of NIH Grant Applications
Anne Marie Weber-Main, PhD, Kimberly A. Thomas-Pollei, PhD, John Grabowski, PhD, Clifford J. Steer, MD, Paul D. Thuras, PhD, and Matt G. Kushner, PhD 

 

 

학술 의학academic medicine 분야의 연구 중심적 교직원은 보조금 제안서 개발, 특히 NIH(National Institutes of Health) 애플리케이션의 형태와 기능 면에서 높은 수준의 역량을 개발해야 합니다. 전통적으로, 초기 경력 조사관들은 "사회적 견습생social apprenticeship"을 통해 연구비신청서 쓰기 기술을 개발했습니다. 이 과정은 경험이 풍부한 연구자들의 멘토링에 크게 의존하지만, 동료들과의 상호작용, 자금 조달 기관 관계자와의 토론, 성공적인 애플리케이션의 모델링, 검토 패널 참여 및 검토자의 비평 분석을 포함할 수도 있다. 그러나, 멘토링 능력이 강한 환경에서도, 다른 요소들은 사회적 견습제도에 부담을 줄 수 있다. 예를 들어, 선임 조사관senior investigators 은 자신의 제안을 개발하고 (다시) 제출해야 하며, 진행 중인 프로젝트를 실행해야 합니다.이 때문에, 이러한 어려운 과제에 대해 다른 사람에게 조언할 수 있는 시간이 잠식될 수 있습니다.

Research-intensive faculty members in academic medicine must develop a high level of competency in grant proposal development, particularly the form and function of National Institutes of Health (NIH) applications. Traditionally, early-career investigators develop grant-writing skills through “social apprenticeship.” 1 This process relies heavily on mentoring from experienced researchers but can also involve interactions with peers, discussions with funding agency officials, modeling of successful applications, participation on review panels, and analysis of reviewers’ critiques. 2,3 Even in environments with a robust mentoring capacity, however, other factors can strain the social apprenticeship system. For example, senior investigators must develop and (re)submit their own proposals, as well as execute ongoing projects, which can erode the time they have available to mentor others in this challenging task.

박사 전 및 박사 후 프로그램과 과학 학회는 이러한 훈련 요구에 대응하기 위해 점점 더 많은 연구비지원서 쓰기 과정, 세미나 및 워크샵을 제공하고 있습니다. 비슷한 노력이 여러 AHC에 걸쳐 일어났다. 임상 및 번역과학상 허브는 KL2 학자를 대상으로 한 집중적인 보조금 쓰기 훈련, 연구 자금을 요구하는 커뮤니티 및 학술 팀에 대한 지원, 프로젝트 리더 역할로 이행하는 이들을 위한 워크숍 기반 커리큘럼과 멘토링 등 초기 경력 교직원에게 다양한 프로그램을 제공하고 있습니다. 이와 같은 포괄적인 프로그램은 연구비 취득을 촉진하지만, 지원 가능한 investigator의 수에 제한이 있습니다.또, 참가자와 함께 일하는 멘토가, 실제로 학자가 복잡한 제안서 작성 프로세스를 성공적으로 진행하는데 필요한 수준의 피드백을 제공하고 있다는 보장은 없습니다.
Pre- and postdoctoral programs and scientific societies increasingly offer grant-writing courses, seminars, and workshops to address this training need. 4–8 Similar efforts have occurred across academic health centers. Clinical and Translational Science Award hubs offer a variety of programs to early-career faculty including intensive grant-writing training for KL2 scholars, assistance to community–academic teams seeking research funding, and a workshop-based curriculum plus mentorship for those transitioning to research project leadership roles. 9–14 Comprehensive programs such as these promote grant acquisition but are limited in how many investigators they can support. 9 Moreover, there is no guarantee that the mentors with whom participants choose to work are actually providing the level of feedback that scholars need to successfully navigate the complex proposal writing process.

미네소타 대학 의과대학 의과대학에서의 이 트레이닝의 요구에 대응하기 위해서, 2007년에 시니어 교수가 연구비지원서 작성 그룹을 실시했습니다. 이것은 경험이 풍부한 교수진이 NIH에 대한 첫 번째 제안서를 작성하기 위해 적극적으로 후배 교수진을 지도한 4개월간의 소그룹 세션이었습니다. 이 이니셔티브는 호평을 받아 그 이후에도 지속적으로 제안되었으며, 제안 준비 프로그램(P3)의 설립을 예고했습니다. 시간이 지남에 따라 다른 부서의 교수들이 P3에 정기적으로 참여하기 시작했고, P3의 관리와 자금 지원은 교무처(Office of Faculty Affairs)가 담당하게 되었습니다. 현재, 3개의 P3 사이클이 연간 제공되고 있으며, 각 사이클은 3개의 표준 NIH 연간 제출 마감일 중 약 1개월 전에 종료되도록 구성되어 있습니다. 2020년 겨울 현재, P3는 13년간 계속 운영되고 있으며, 25개 이상의 학과에서 271명이 입학하고 있다.
To address this training need in the University of Minnesota Medical School’s Department of Medicine, senior faculty implemented a grant-writing group in 2007. This was a 4-month-long series of small group sessions in which experienced faculty actively guided junior faculty in developing their first proposal to the NIH. This initiative was well received and continuously offered thereafter, heralding the establishment of what became the Proposal Preparation Program (P3). Over time, faculty from other departments began routinely participating in P3, leading to its management and funding being assumed by the medical school’s Office of Faculty Affairs (OFA). Presently, 3 P3 cycles are offered annually, each structured to end approximately 1 month before 1 of the 3 standard NIH annual submission deadlines. As of winter 2020, P3 has operated continuously for 13 years, matriculating 271 individuals from over 25 departments.

이 기사에서는 유사한 이니셔티브를 구현하고자 하는 독자들의 이익을 위해 P3에 대해 설명합니다. 먼저 프로그램의 교육학적 원칙과 운영 절차를 개략적으로 설명하겠습니다. 다음으로 참가자에 대한 데이터(인구학적 특성, 제안서 제출 및 자금 지원 결과, 자체 보고 기술 획득)와 프로그램에 대한 양적 및 질적 피드백을 제시한다. P3에 대한 제도적 투자수익률, 한계 및 향후 방향에 대한 논의로 마무리한다.

This article describes P3 for the benefit of readers who might wish to implement a similar initiative. We begin by outlining the program’s pedagogical principles and operating procedures. Next, we present data for participants (demographic characteristics, grant proposal submission and funding outcomes, self-reported skills gains) and their quantitative and qualitative feedback on the program. We conclude with a discussion of institutional return on investment in P3, limitations, and future directions.

 

교육학적 원칙
Pedagogical Principles

P3는 소규모 P3 멘토 팀이 NIH 보조금 제안을 적극적으로 작성하는 후배 교수 집단과 협업하는 [그룹 멘토링 모델]을 채택하고 있다. 멘토와 참가자는 4개월에 걸쳐 10번 만나 간단한 교육적 프레젠테이션을 한 후 세션 사이에 검토된 각 참가자의 초안 작성에 대해 논의합니다(그림 1). 이 프로그램은 모의 NIH 리뷰 세션으로 끝납니다. P3의 운영 세부 사항은 시간이 지남에 따라 발전해 왔지만, 그 근본적인 교육학적 원칙은 변하지 않았습니다.
P3 employs a group mentoring model in which a small team of P3 mentors work collaboratively with a cohort of junior faculty actively writing NIH grant proposals. Mentors and participants meet 10 times over 4 months for brief didactic presentations followed by discussion of each participant’s developing drafts as reviewed between sessions (Figure 1). The program concludes with a mock NIH review session. Although P3’s operational details have evolved over time, its underlying pedagogical principles have remained constant.

 

원칙 1
Principle 1

생물의학 연구비 신청은 매우 미묘한nuanced 장르로, 숙달하기 어렵고, 일반적으로 가르쳐지지 않습니다. 대부분의 교직원이 P3에 참여하고 있는 것은 만족스러운 과학적 글쓰기 기술뿐 아니라, 수준 높은 연구 제안서에서 기대되는 구체적인 내용, 수사 패턴, 그래픽 요소 및 조직 구조에 대한 지식이 거의 없기 때문입니다. P3 멘토는 이러한 [암묵적 글쓰기 규범]을 적용하는 데 풍부한 경험을 가지고 있으며, 경험이 적은 조사관에게 자신의 글이 리뷰어의 장르 중심 기대에 얼마나 부합하는지 평가하고 이러한 기대를 더 잘 충족시키기 위한 전략적 수정을 시행하는 데 있어 효과적으로 지도할 수 있습니다.
The biomedical research grant application is a highly nuanced and distinct genre of writing that is challenging to master and not typically taught. 3,15,16 Most faculty join P3 with satisfactory scientific writing skills but little knowledge of the specific content, rhetorical patterns, graphic elements, and organizational structure expected in high-quality research proposals. P3 mentors, who have extensive experience in applying these implicit writing norms, can effectively guide less experienced investigators in evaluating how well their writing is meeting reviewers’ genre-driven expectations and in implementing strategic revisions to better satisfy these expectations.

원칙 2
Principle 2

연구비지원서 작성 기술은 고품질 피드백과 성찰 연습의 반복 사이클을 통해 효과적으로 개발될 수 있습니다. P3는 대부분의 단기 보조금 작성 워크숍에서 제공하는 간단한 지침을 훨씬 능가합니다. 참가자들은 몇 달 동안 반복적인 쓰기/검토 과제를 완료함으로써 어려운 스킬을 체계적이고 신중하게 연습합니다. Revision은 다양한 전문지식을 가진 멘토 및 동료들의 피드백 주기에 따라 이루어집니다. 게다가, 학습은, 고부가가치의 단기적 목표, 즉 자신의 연구를 위한 자금을 얻고자하는, 참가자의 내재적 동기 부여에 의해서 촉진된다.
Grant-writing skills can be effectively developed through iterative cycles of high-quality feedback and reflective practice. 17–19 P3 goes well beyond the brief instruction offered by most short-term grant-writing workshops. Participants engage in several months of systematic, deliberative practice of a difficult skill through completing iterative writing/review assignments. Revisions are guided by cycles of feedback from mentors and peers with diverse expertise. Moreover, learning is facilitated by the intrinsic motivation of participants pursuing a high-value, near-term objective: acquiring funding for their own research.

원칙 3
Principle 3

과학 작문에서의 기술 개발 및 생산성은 훈련을 [능동적인 학습자로 이뤄진 소규모 동료 그룹 내에 배치함]으로써 향상됩니다. P3 참가자들은 자신의 작품에 대한 피드백뿐만 아니라 동료들이 개발한 비평 초안도 받습니다. 이 접근방식은 참가자들이 다른 사람들과 연습 사이클에 참여하고 모방(또는 회피)하기 위해 다른 글쓰기 예에 노출되기 때문에 [대리 학습vicarious learning]을 촉진합니다. 리뷰어로서, 참가자들은 독자의 관점에서 공감하는 것을 보다 쉽게 개발하면서 자신의 글에서 최대한 명확성을 추구합니다. 초안을 평가하고 정기적으로 문제 영역에 대처하는 프로세스는 쓰기 과제를 정상화하는 데 도움이 됩니다. 또한 쓰기 프로세스의 고유한 분리를 완화하면서 쓰기 생산성을 지원하는 구조와 책임도 제공합니다.
Skill development and productivity in scientific writing are enhanced by situating training within small peer groups of active learners. 20–23 P3 participants not only receive feedback on their work but also critique drafts developed by their peers. This approach promotes vicarious learning, as participants are engaging in practice cycles with others and exposed to other writing examples to emulate (or avoid). As reviewers, participants more readily develop empathy from a reader’s perspective while striving for maximum clarity in their own writing. The process of evaluating drafts and addressing problem areas at regular intervals helps normalize writing challenges. It also provides structure and accountability to support writing productivity while mitigating the inherent isolation of the writing process.

원칙 4
Principle 4

퀄리티를 높이려면, 다양한 과학자들이 쉽게 이해할 수 있도록 연구비 지원서를 작성해야 한다. P3는 많은 NIH 스터디 섹션 멤버들과 마찬가지로 멘토와 참여자들이 일반적으로 연구 주제와 특정 참가자들의 응용 프로그램에 대한 접근법에 대한 깊은 콘텐츠 지식이 부족하기 때문에 본질적으로 이 목표를 홍보합니다. P3 피드백 프로세스는 참가자들에게 높은 수준의 명확성(예: 분야별 전문 용어 최소화)특수성(예: 비전문가 독자들에게 과학적 질문의 중요성을 전달)을 가지고 프로젝트의 요소를 설명하도록 촉구한다. 이러한 요구사항은 가려졌을지도 모르는 약점을 조명하고, 가독성을 개선합니다. 중요한 것은 프로그램의 최종 모의 NIH 검토 세션이 참가자들의 제안이 [각 분야의 최첨단 기술을 반영]하도록 하기 위해 구체적으로 구현되었다는 점이다.

Writing a grant application so that it can be easily understood by a wide range of scientists contributes to its quality. 16,24 P3 inherently promotes this goal because its mentors and participants—like many NIH study section members—commonly lack deep content knowledge in the research topics and approaches in a particular participant’s application. The P3 feedback process pushes participants to explicate elements of their project with a high degree of clarity (e.g., minimizing field-specific jargon) and specificity (e.g., conveying the significance of their scientific question to nonexpert readers). These requirements illuminate otherwise obscured weaknesses and improve readability. Importantly, the program’s final mock NIH review session was specifically implemented to help ensure that participants’ proposals reflect the cutting edge of their respective fields.

운용 절차
Operational Procedures

리더십, 멘토 및 조직 지원
Leadership, mentors, and organizational support

현재 5명의 P3 교수 멘토(임상연구 및 번역연구 경력 3명, 기초과학연구 경력 2명)가 사이클당 약 10명의 교수진 참가자와 연계되어 있습니다. 이 낮은 멘토 대 참가자 비율은 참가자들이 모든 세션에서 상세한 피드백을 받을 수 있도록 합니다. 각 멘토는 0.15의 풀타임 상당(FTE)을 적용받으며, 의대 OFA(3명 멘토), 대학 임상번역과학연구소(CTSI; 1명 멘토), 멘토의 학술부(멘토 1명)에서 자금을 지원받는다. 0.30FTE에서 OFA의 지원을 받는 5명의 멘토 중 한 명이 프로그램 디렉터(PD)도 맡고 있습니다. PD는 신청 절차, 그룹 멘토링, 작문/검토 과제, 모의 NIH 검토 세션, 프로그램 평가 등을 조율합니다. 교무처 직원은 프로그램 공지, P3로의 전자 지원서 관리, 회의실 예약, 원격 참가자에 대한 기술 지원, 온라인 코스 사이트 유지 및 설문 조사를 지원합니다.
Currently, 5 P3 faculty mentors (3 with backgrounds in clinical and translational research, 2 in basic science research) engage with a cohort of approximately 10 faculty participants per cycle. This low mentor-to-participant ratio ensures that participants receive detailed feedback at every session. Each mentor is expected to apply 0.15 full time equivalent (FTE) to the program, which is funded by the medical school’s OFA (3 mentors), the university’s Clinical and Translational Science Institute (CTSI; 1 mentor), or the mentor’s academic department (1 mentor). One of the 5 mentors, supported by the OFA at 0.30 FTE, also serves as the program director (PD). The PD coordinates the application process, group mentoring sessions, writing/review assignments, mock NIH review session, and program evaluation. OFA staff assist with sending program announcements, managing electronic applications to P3, reserving meeting rooms, providing technical support for remote participants, maintaining the online course site, and administering surveys.

모든 멘토는 NIH R 시리즈 조성금의 수석 조사원(PI), 박사 후 펠로우 또는 교직원의 멘토, NIH 과학 리뷰 그룹 멤버로 활동한 경험이 있습니다. 이러한 자격을 갖춘 바쁜 교직원을 채용하는 것은 어려울 수 있습니다. 따라서 P3 활동에 할애된 [주당 평균 6시간(0.15FTE)]을 기준으로 멘토들의 노력을 지원하고 있습니다. 우리 팀은 2016년부터 2021년 사이에 은퇴자를 대체할 새로운 멘토를 단 한 명만 영입할 정도로 비교적 안정적이었습니다. 새로운 멘토가 영입되면, 그들은 정규 멘토 팀에 합류하기 전에 우선 1회의 P3 사이클 동안 임시ad hoc 역할을 합니다. 이를 통해 P3를 직접 체험하고 피드백 기술을 개발하며 그룹 멘토링 프로세스에 익숙해질 수 있습니다.

All mentors have had experience serving as principal investigators (PIs) for NIH R-series grants, mentors for postdoctoral fellows or faculty, and NIH scientific review group members. Recruiting busy faculty with these qualifications can be challenging. Therefore, mentors’ effort is supported based on an average 6 hours per week (0.15 FTE) devoted to P3 activities. Our team has remained relatively stable; we recruited just 1 new mentor between 2016 and 2021 to replace a retiree. When new mentors are recruited, they first serve in an ad hoc role for 1 P3 cycle before joining the regular mentor team. This enables them to experience P3 firsthand, develop their feedback skills, and become acculturated to the group mentoring process.

참가자 자격 및 선발
Participant eligibility and selection

모든 의과대학 교수에게 발송되는 교무처OFA 뉴스레터에는 P3가 설명되어 있으며 온라인 신청에 대한 링크가 제공됩니다. 의 대상은 첫 NIH R시리즈(연구) 또는 K시리즈(연구경력개발) 지원서를 준비하는 조기취업 의대 교수입니다. 이 프로그램은 때때로 의과대학 외부에서 지원자를 받아들이거나 다른 국가 기금 기관에 제안서를 제출합니다. 박사 후 펠로우는 연수 종료가 가까워지고 미네소타 대학 교수 임명을 수락한 경우에만 고려됩니다. 신청서에는 계획된 제안서 (예: 직함, 자금 조달 메커니즘, NIH 연구소)와 신청자(예: 학적, 학위, 보호 연구 시간)에 대한 기본 정보를 받는다. 신청자는 P3에서 작업하고자 하는 연구비지원서 신청에 대한 [구체적 목적 및 바이오스케치] 요소의 초안도 제출합니다. 이 자료들은 그들의 프로젝트가 얼마나 잘 구성되어 있는지, 그리고 지원자가 "작성할 준비가 되어 있는지"에 대한 통찰력을 제공합니다. 핵심 연구 아이디어가 처음이거나 불확실한 상태에서 P3에 진입하는 참가자는 종종 보조를 맞추는데 어려움을 겪기 때문에 이 평가는 중요하다.

Routine OFA newsletters sent to all medical school faculty describe P3 and provide a link to the online application. Eligible P3 applicants are early-career medical school faculty preparing their first NIH R-series (research) or K-series (research career development) application. The program occasionally accepts applicants outside of the medical school or working on proposals to other national funding agencies. Postdoctoral fellows are considered only if they are nearing the end of their training and have received and accepted a University of Minnesota faculty appointment. The application captures basic information about the planned proposal (e.g., title, funding mechanism, NIH institute) and the applicant (e.g., academic track, degree, protected research time). Applicants also submit a draft of the Specific Aims and Biosketch components for the grant application they propose to work on in P3. These materials offer insight into how well formed their project is and whether the applicant is “ready to write.” This assessment is critical, as participants who enter P3 while their core research ideas are inchoate or otherwise uncertain often struggle to keep pace.

일반적으로 사이클당 15~20개의 신청을 접수하고 10개를 선발합니다. 모든 승인/거부 결정은 프로그램 멘토가 공동으로 합니다. 최대한 많은 인원을 지원하는 것이 목표이기 때문에 퀄리티 랭킹보다는 [적격여부 심사]를 중시합니다. 우선, 부적격자를 명확하게 배제한다(예를 들면, NIH R01 조성금의 PI로서 경험이 있는 사람, 2세션 이상의 스케줄 상충을 보고하는 사람, 교직원의 임명을 가지지 않는 사람). 다음으로 의과대학 교수(P3의 프라이머리 스폰서)를 우선합니다. 추가 삭감이 필요한 경우, 집필 준비 상태가 의심스럽다고 생각되는 지원자는 거절합니다(예: 출판물 부족, 중요한 파일럿 데이터 부족, 목적 불명). 받아들여지지 않는 분들을 위해 향후 사이클에 들어갈 수 있는 가능성을 높이기 위한 제안을 하고 있습니다. 합격하지 못한 지원자에게 원고 작성 워크숍 등의 대체 프로그램을 안내합니다.

We typically receive between 15 and 20 applications per cycle and accept 10. All accept/reject decisions are made collaboratively by the program mentors. Because the goal is to support as many people as possible, we emphasize eligibility screening rather than competitive quality rankings. First, we eliminate clearly ineligible applicants (e.g., those with prior experience as PI of an NIH R01 grant, report scheduling conflicts for more than 2 sessions, do not hold a faculty appointment). Next, we prioritize faculty from the medical school (P3’s primary sponsor). If additional cuts are needed, we reject applicants whose readiness to write is deemed questionable (e.g., insufficient publications, lack of critical pilot data, ill-defined aims). For those not accepted, we offer suggestions for improving their chances of admission to a future cycle. Where warranted, we direct unsuccessful applicants to alternative programs such as manuscript preparation workshops.

회의 일정 및 할당 작성
Meeting schedule and writing assignments

코호트는 15주에 걸쳐 2시간 세션 동안 10회 만난다. 처음 5세션은 매주, 나머지 5세션은 격주로 진행됩니다(예상대로 작성/수정 범위를 늘리기 위해). PD는 세션 간에 한 명의 참가자의 응용 프로그램을 읽고 편집하고 주석을 달아줄 1명의 동료(peer)와 1명의 멘토(mento)를 번갈아 할당합니다. 서면 리뷰는 다음 세션 전에 참가자에게 전송됩니다.

  • 세션 1은 소개, 프로그램의 개요 및 일반적인 글쓰기 원칙에 초점을 맞춥니다.
  • 세션 2-5의 처음 15~20분은 특정 제안 섹션을 작성하기 위한 지침을 제공하는 교훈적인 프레젠테이션에 할애됩니다.
  • 세션 2-9에서 각 참가자는 할당된 검토자가 자신의 비판 사항을 구두로 요약하고 그룹이 식별된 문제에 대한 해결책을 논의하는 약 15분 정도의 시간을 받는다. 세션 사이에 참가자들은 받은 피드백에 따라 초안을 수정하고 정해진 쓰기 과제 일정에 따라 새로운 자료를 개발합니다.
  • 세션 10은 모의 NIH 검토 세션(아래 설명)으로 실시됩니다.

보충 디지털 부록 1은 P3 사이클의 샘플 스케줄을 제공합니다.

The cohort meets for ten ~2-hour sessions over 15 weeks. The first 5 sessions occur weekly, the remainder biweekly (to accommodate increases in the expected scope of writing/revising). The PD assigns 1 peer and 1 mentor (on a rotating basis) to read, edit, and comment on a single participant’s application between the sessions. The written reviews are to be sent to the participant before the upcoming session.

  • Session 1 is focused on introductions, an overview of the program, and general writing principles.
  • The first 15–20 minutes of sessions 2–5 are devoted to didactic presentations offering guidance for writing specific proposal sections.
  • In sessions 2–9, each participant receives a ~15-minute block of time during which the assigned reviewers orally summarize their critiques and the group discusses solutions to the problems identified. Between sessions, participants revise their draft based on the feedback received and develop new material following a prescribed schedule of writing assignments.
  • Session 10 is conducted as a mock NIH review session (described below).

Supplemental Digital Appendix 1, at https://links-lww-com-ssl.access.hanyang.ac.kr/ACADMED/B168, provides a sample schedule for a P3 cycle.

[쓰기 과제]

  • Biosketch 섹션과 Specific Aims 섹션(세션 1-2)에서 시작하여
  • 중요성과 혁신 섹션(세션 3-5),
  • 마지막으로 접근 섹션(세션 6-9)으로 이어집니다.

K 시리즈 지원서를 작성하는 참가자는 지원서의 후보 배경, 경력 목표 및 목표, 교육 계획 섹션을 동시에 작성합니다. 기타 애플리케이션 컴포넌트(예: 예산)는 간략하게 설명되지만 작성/검토 스케줄에는 포함되지 않습니다. 참가자들은 각 그룹 세션 이틀 전에 대학의 온라인 학습 관리 시스템 내 사이트(캔버스)에 초안을 업로드합니다. 이것에 의해, 참가자는 매주 세션 사이에 5일, 격주 세션 사이에 12일의 기입이 가능하게 됩니다. 참가자들은 마지막 초안 이후 주요 변경 사항을 페이스 시트face sheet에 간략히 요약하고, 특히 피드백이 필요한 특정 텍스트 또는 문제를 제시합니다. 초안이 제출되면, 리뷰어는 할당된 지원서를 세션 전에 2일 동안 읽고/비평할 수 있습니다.
Writing assignments begin with

  • the Biosketch and Specific Aims sections (sessions 1–2),
  • followed by the Significance and Innovation sections (sessions 3–5), and
  • finally, the Approach section (sessions 6–9).

Participants writing K-series applications concurrently develop their application’s Candidate Background, Career Goals and Objectives, and Training Plan sections. Other application components (e.g., Budget) are briefly discussed but not included in the writing/review schedule. Participants upload drafts to a site within the University’s online learning management system (Canvas; Instructure, Salt Lake City, Utah) 2 days before each group session. This gives participants 5 days to write between weekly sessions and 12 days between biweekly sessions. Participants briefly summarize on their face sheet major changes since the last draft and indicate specific text or issues on which they especially need feedback. Once drafts are submitted, reviewers have 2 days to read/critique their assigned applications before the session.


지원자는 P3의 속도와 시간 약속에 대해 미리 경고합니다(일주일에 10시간 정도 쓰기/재작성, 안전 점검 과제 완료, 그룹 세션 참석). 속도가 빠듯하지만, 참가자들은 공식화된 쓰기 스케줄과 그룹 설명 책임이 쓰기 작업의 우선순위를 정하는 데 도움이 된다는 것을 공유했습니다. 종종 진행상의 문제상황(예: 신청 유형의 변경, 건강 또는 가족 문제, 목표에 대한 상당한 조정)을 반영하여 수정된다. 그러나 사이클 종료까지 완전한 초안(구체적 목표 페이지, Biosketch, 6페이지 또는 12페이지)을 작성하는 목표는 [모든 참가자가 모의 NIH 검토 세션에 이러한 자료를 제출할 것]이라는 기대expectation에 반영되어 있습니다.

Applicants are forewarned about P3’s pace and time commitment (estimated 10 hours per week to write/rewrite, complete the peer review assignment, and attend the group session). While the pace is demanding, participants have shared that the formalized writing schedule with group accountability helps them to prioritize writing tasks. Assignments are occasionally modified to accommodate progress barriers (e.g., change in application type, health or family issues, substantial adjustments to the aims). However, the goal of producing a complete draft by the end of the cycle—Specific Aims page, Biosketch, plus 6- or 12-page grant body—is reflected in the expectation that all participants will submit these materials for the mock NIH review session.

트레이닝 자료 및 커뮤니케이션 물류
Training materials and communication logistics

P3 Canvas 사이트는 할당, 슬라이드 세트 및 보충 자료의 저장소 역할을 합니다. 제안 섹션마다 최소 2개의 지원 문서가 포함되어 있습니다.각 섹션의 목적을 정리한 템플릿, 포함해야 할 주요 요소, 답변해야 할 질문, 권장 순서 및 길이, P3 참가자였던 지원 신청서의 예시 섹션입니다. 또한 P3에서 달리 다루지 않은 섹션(예: 프로젝트 요약, 예산 정당성, 환경, K 제안에 대한 지원서)에 대해 NIH가 주석 없이 제작한 지침을 제공한다. 재료는 새로운 NIH 지침을 반영하기 위해 쉽게 추가, 교체 또는 개조할 수 있습니다. 또, 참가자는 P3 이후의 레퍼런스를 위한 주요 트레이닝 자료를 다운로드해 보관하는 것이 좋습니다.

The P3 Canvas site serves as the repository for assignments, slide sets, and supplemental materials. We include a minimum of 2 supporting documents for each proposal section: a template developed by the mentors that summarizes the purpose of the section, key elements to include, questions to answer, and a recommended order and length; and an example section from a funded application written by a former P3 participant. We also provide unannotated NIH-produced guidance for sections not otherwise addressed in P3 (e.g., Project Summary, Budget Justification, Environment, letters of support for K proposals). Materials can be easily added, replaced, or adapted to reflect new NIH guidance. Additionally, participants are encouraged to download and retain key training materials for their reference post-P3.

리뷰 프로세스
Review process

PD는 P3 피어 1명과 P3 멘토 1명을 할당하여 주어진 참가자의 초안을 비판적으로 읽고 피드백을 제공합니다. 참가자는 세션당 1개의 초안을 리뷰하고, 멘토는 보통 2개의 초안을 리뷰합니다. 처음에는 전공 배경과 무관하게 참가자 및 멘토 간에 검토할 과제를 회람한다. 이 연습은 그룹 구성원들이 모든 제안에 익숙해지도록 하는 한편, 참가자들에게 여러 명의 독자들로부터 피드백을 받는 혜택을 준다. 참가자들이 Approach sections을 개발하기 시작하면, 포괄적 범주(기본 과학, 임상 연구) 내에서 검토자-수정자 일치도를 조정한다.
The PD assigns 1 P3 peer and 1 P3 mentor to critically read and provide written feedback for a given participant’s draft. Participants review 1 draft per session, while mentors typically review 2. Initially, review assignments are rotated among participants and mentors independent of scientific background. This practice familiarizes group members with all proposals, while giving participants the benefit of receiving feedback from multiple readers. Once participants begin developing their Approach sections, attempts are made to align reviewer–reviewee matches within broad categories (basic science, clinical research).

멘토와 참가자들은 [각 제안 섹션의 지정된 기준/목적의 과학(가능한 한), 글쓰기 스타일, 명료, 구성, 완성도 및 달성 등 리뷰에 어떻게 접근해야 하는지에 대한 일반적인 지침]을 참고자료집으로 받는다. 상세 검토자가 제공해야 하는 시간이나 수준을 명시하지 않지만 검토당 최소 1시간을 할애하고(특히 더 많은 자료가 포함된 이후의 세션에서), 실행 가능한 권장사항을 제공할 것을 제안한다. 검토자는 추적된 편집 및 주석을 초안에 포함합니다. 또한 초안 표지에 2-5개의 주요 비판 중 일부를 나열하고 독자로서 가장 우려되는 문제를 강조하기 위해 제안된 수정사항을 제시하였다.
Mentors and participants are given general guidance in how they should approach their reviews, including attention to the science (as able), writing style, concision, organization, completeness, and fulfillment of the designated criteria/purpose of each proposal section as outlined in the program’s supporting materials. We do not specify the time spent or level of detail reviewers should provide but suggest they devote at least 1 hour per review (especially in later sessions, which include more material) and provide actionable recommendations. Reviewers embed tracked edits and comments within the draft. Additionally, they list on the draft’s cover page a subset of 2–5 major critiques with suggested corrections to highlight the issues that most concerned them as readers.


그룹 세션 동안에는, 할당된 2명의 검토자는 각각 5분씩 미리 준비한 검토에서 나온 주요 강점, 비판 및 수정 아이디어를 그룹에 구두로 요약할 수 있습니다. 그런 다음 그룹 토론에 5분을 더 할애하여 다른 사람의 질문과 피드백을 받습니다. 토론은 종종 서면 피드백에서 제시된 포인트를 넘어서기 때문에 참가자들은 메모를 하는 것이 좋습니다. 일부 참가자(~20%)는 세션 중에 수용할 수 있는 것보다 더 광범위한 피드백과 문제 해결이 필요합니다. 이 경우, 가장 가까운 과학적 배경을 가진 멘토는 일반적으로 그룹 밖에서 개별 대화나 편집 세션을 가질 것을 제안합니다. 멘토는 이러한 "추가" 상담에 일주일에 1시간 이상을 할애하는 경우가 거의 없습니다. 이러한 지원은 필요할 때 참가자의 진행률 변화를 수용하려는 의지와 결합되어 중퇴를 줄이는 데 도움이 된다. 그럼에도 불구하고, 중퇴는 (사이클당 평균 1명꼴로) 발생하며, 보통 다른 책임과의 예상치 못한 충돌이나 제안의 방향이나 시기에 큰 변화가 있을 때 발생합니다.

During group sessions, the 2 assigned reviewers have 5 minutes each to orally summarize for the group the major strengths, criticisms, and revision ideas that emerged from their preprepared reviews. Then, an additional 5 minutes is spent in group discussion, with questions and feedback from others welcomed. Participants are encouraged to take notes because the discussion often extends beyond the points provided in the written feedback. Some participants (~20%) require more extensive feedback and problem-solving than can be accommodated during the session. When this occurs, a mentor with the closest matching scientific background typically suggests having an individual conversation and/or editing session outside of the group. Mentors rarely spend more than 1 hour per week in these “extra” consultations. This support, combined with a willingness to accommodate variation in participants’ rate of progress when necessary, helps to mitigate dropout. Nonetheless, dropouts do occur (on average 1 per cycle), usually for unanticipated conflicts with other responsibilities or a major change in the direction or timing of their proposal.

모의 NIH 리뷰 세션
Mock NIH review session

사이클이 시작될 때 참가자들은 프로그램의 [모의 NIH 검토 세션에서 "외부 검토자"로 활동할 미네소타 대학 교직원을 고르도록] 지시받는다. 이상적인 검토자는 R01(또는 동등한) 보조금에서 PI로 활동한 경험이 있고, NIH 검토자로 활동한 적이 있으며, 참가자의 현재 또는 최근 협력자가 아니며, 가장 중요한 것은 참가자의 연구 분야에 대한 전문 지식과 경험이 있는 교수진이다. 스스로 적절한 외부 검토자를 고를 수 없는 참가자는 P3 멘토의 도움을 받는다. PD는 식별된 검토자에게 공식 초대장을 발송하여 다음과 같이 요청한다.

  • 대략 P3 사이클 중간 지점에서 참가자의 특정 목적 페이지를 비판한다.
  • 사이클 종료 직전에 동일한 참가자의 전체 신청에 대한 NIH 스타일의 서면 검토를 제공한다.
  • 토론을 위해 서면 비평의 구두 요약을 전달하기 위해 코호트의 모의 NIH 검토 세션에 참석한다.

At the beginning of the cycle, participants are directed to identify a University of Minnesota faculty member to serve as their “external reviewer” for the program’s mock NIH review session. Ideal reviewers are faculty who have served as PI on an R01 (or equivalent) grant, served as an NIH reviewer, are not a current or recent collaborator of the participant, and, most important, have expert knowledge and experience in the participant’s research area. Participants who cannot identify an appropriate external reviewer on their own are aided by P3 mentors. The PD sends out formal invitations to the identified reviewers requesting that they

  • critique the participant’s Specific Aims page at roughly the P3 cycle midpoint;
  • provide a written NIH-style review of the same participant’s full application just before the cycle’s end; and
  • attend the cohort’s mock NIH review session to deliver an oral summary of their written critique for discussion.


외부 검토자는 비평서를 작성할 때 표준 NIH 연구신청서 리뷰 템플릿을 사용하고, 전체 영향과 개별 평가 기준에 대해 점수(1 = 최고, ~ 9 = 최악)를 할당해야 한다. 이들은 NIH의 정기적인 리뷰와 마찬가지로 어플리케이션에 점수를 매기도록 지시받습니다.단, 누락된 섹션은 무시합니다. 또한 자신이 발견한 취약점에 대한 구체적인 해결책을 제시합니다. 서면 비평은 세션 직전 또는 직후에 참가자와 공유됩니다. 각 참가자에게는 20분간의 리뷰 블록이 할당됩니다. 처음 10분 동안은 외부 리뷰어가 중단 없이 비평을 전달합니다. 나머지 10분은 식별된 문제에 대한 가능한 해결책에 대한 비공식 그룹 토론에 사용됩니다. 외부 검토자는 일반적으로 세션이 끝난 후 참가자에게 신청 내용에 대해 자세히 논의하도록 요청합니다.

External reviewers are asked to use the standard NIH grant review template in writing their critique, and to assign scores (1 = best, through 9 = worst) for overall Impact and the individual scored criteria. They are instructed to score the application as they would a regular NIH review, with 2 exceptions: ignore missing sections; and offer specific remedies for the weaknesses they identify. Written critiques are shared with participants shortly before or after the session. Each participant is assigned a 20-minute review block. For the first 10 minutes, the external reviewer delivers their critique without interruption. The remaining 10 minutes are spent in informal group discussion about possible solutions to the problems identified. External reviewers commonly invite the participant to discuss their application further following the session.

참가자 및 결과 데이터
Participant and Outcomes Data

P3는 교직원 육성 프로그램으로서 그 영향에 대해 과학적으로 엄격한 결론을 내릴 수 있도록 설계되지 않았습니다. 그럼에도 불구하고, 지난 13년 동안 우리는 프로그램 참가자, 그들의 보조금 신청서 제출, P3 이후의 자금 지원 성공, 프로그램의 장점과 단점에 대한 그들의 평가를 제공하는 상당한 양의 데이터를 입수했다. 최근까지 이 정보는 다양한 방법으로 산발적으로 수집되었다. 이러한 제한에도 불구하고, 이용 가능한 데이터는 프로그램의 도달 범위와 영향에 대한 유용한 통찰력을 제공한다(미네소타 대학 기관 검토 위원회는 이 데이터 수집이 인간 연구를 구성하지 않으므로 면제된 것으로 판단했다).

As a faculty development program, P3 was not designed to provide scientifically rigorous conclusions about its impact. Nonetheless, over the past 13 years, we have acquired a substantial body of data that offers a reasonably representative description of the program’s participants, their grant application submissions, funding successes following P3, and their assessment of the program’s strengths and weaknesses. Until recently, this information was collected sporadically and with varying methods. Notwithstanding these limitations, the available data provide useful insight into the program’s reach and impact. (Note that the University of Minnesota Institutional Review Board determined that this data collection does not constitute human research and was therefore deemed exempt.)

인구 통계 데이터
Demographic data


2007년 여름부터 2020년 겨울까지 28개의 P3 사이클이 실시되어 271명의 참가자가 참가했습니다. 인구통계학적 데이터는 처음에는 기록되지 않았다. 그러나 최근 참가자들의 대규모 하위 집합(n = 178, 주기 11-28, 2013년부터 2020년까지 발생)에 대해 이 정보를 수집했다. 데이터는 포스트 프로그램 조사와 프로그램 애플리케이션을 조합하여 작성되었습니다. 이러한 데이터를 통합해, P3 참가자의 가장 포괄적인 그림을 입수할 수 있습니다(표 1). 그림과 같이, 이 참가자 중 여성이 조금 더 많았다. 참가자는 주로 백인 또는 아시아인으로, 백인의 76%, 아시아인의 13%, 흑인 2%, 아메리카 인디언/알래스카 원주민 0.4% 등 폭넓은 교직원의 인종/민족 분열을 대략 반영하고 있습니다. 표 1과 같이, 참가자의 과반수는 의대 교수(프로그램의 창시, 프라이머리 스폰서, 채용의 중점을 반영)이며, 거의 대부분이 조교수였다. 거의 모든 P3 사이클에 중요한 임상 책임을 지는 일부 교직원이 포함되었지만, 대다수는 상당한 연구 보호 시간과 함께 연구 집약적인 위치에 있었다. P3 참여 기간 동안 개발된 가장 일반적인 제안 유형은 NIH R01 제안이었으며, 멘토링된 K 제안 및 기타 R-Series 적용 사례가 그 뒤를 이었다.

From summer 2007 through winter 2020, 28 P3 cycles were conducted, engaging 271 unique participants. Demographic data were not recorded initially. However, we have collected this information on a large subset of more recent participants (n = 178, cycles 11–28, occurring from 2013 through 2020). Data were compiled from a combination of postprogram surveys and program applications. We merged these data to provide the most comprehensive picture of P3 participants that is available to us (Table 1). As shown, a slight majority of this participant sample were female. Participants were predominantly White or Asian, roughly mirroring the racial/ethnic breakdown of our broader faculty (76% Caucasian, 13% Asian, 2% Black, 0.4% American Indian/Alaska Native). As shown in Table 1, a majority of the participants had PhDs, were faculty of the medical school (reflecting the program’s origination, primary sponsor, and recruitment emphasis), and nearly all were assistant professors. The majority were in research-intensive positions with significant protected time for research, although nearly every P3 cycle has included some faculty with significant clinical responsibilities. The most common type of proposal developed during P3 participation was NIH R01 proposals, followed by mentored K proposals and other R-series applications.

NIH 보조금 제안서 제출 및 자금 지원 비율
NIH grant proposal submission and funding rates

참가자의 제안서 제출과 자금조달 결과에 관한 데이터는 두 가지 출처에서 나왔다. 첫 번째 설문조사는 2007년부터 2018년까지 P3에 참여한 모든 개인에게 전송되었다(1-23주기). 이 표본에는 220명의 개인이 포함되었으며, 이들 중 194명이 확인될 수 있었다(나머지는 대학을 떠난 상태였다. 전송된 194개 조사 중 83개 조사(응답률 43%)가 반환되었지만, 이 중 8개 조사에서는 P3를 완료하지 못한 것으로 나타나 75개 조사가 분석을 위해 남겨졌다. 실행 가능한 응답자의 주요 결과는 다음과 같습니다. 88%(66/75)가 P3 신청을 목표한 연구비 지원 기관에 제출했으며, 그 중 35%(23/66)가 자금 지원을 받고 있다고 응답했습니다. 모든 응답자(제출자 및 비제출자) 중에서의 연구비 획득 비율은 31%(23/75)였다. 제출자 중 76%(50/66)는 P3를 완료한 후 첫 번째 NIH 제출 마감일에, 91%(60/66)는 첫 번째 NIH 제출 마감일 내에 제출했다고 보고했습니다. 자금 지원을 받은 응답자에게 직접 비용을 표시하도록 요청했지만 23명 중 12명(52%)만이 이 정보를 제공했다. 응답자의 평균 총 직접 비용은 $875,188(K 시리즈 보조금 절반과 R 시리즈 보조금 절반)이었습니다.
Data regarding participants’ proposal submissions and funding outcomes came from 2 sources. The first was a survey sent to all individuals who participated in P3 from 2007 through 2018 (cycles 1–23). This sample included 220 individuals, 194 of whom could be identified (the remainder had left the university). Eighty-three of the 194 surveys sent were returned (43% response rate), but 8 of these indicated they did not complete P3, leaving 75 surveys for analyses. Key outcomes for viable respondents were as follows: 88% (66/75) reported submitting their P3 application to their targeted funding agency, and 35% of submitters (23/66) reported being funded. The funding rate for all respondents (submitters and nonsubmitters) was 31% (23/75). Of those who submitted, 76% (50/66) reported doing so in the first NIH submission deadline after completing P3, and 91% (60/66) reported having submitted within the first 2 NIH submission deadlines. We asked funded respondents to indicate the amount of direct costs they received, but only 12 of 23 responders (52%) provided this information. For these respondents, the average total direct cost was $875,188 (half K-series grants and half R-series).

P3 참가자의 NIH 보조금 신청 활동에 대한 두 번째 데이터 소스는 미네소타 대학의 SPA(후원 프로젝트 관리)였습니다. 이 분석을 위해, 우리의 표본은 2007년부터 2016년까지 P3에 참여한 모든 개인이었다(n = 165, 사이클 1~17). 2016년을 P3 완료의 컷오프, 2017년을 제출/수상 데이터 수집의 컷오프로서 사용하여 모든 사람이 NIH 제안서를 제출하고 자금을 획득할 수 있도록 했다. 우리의 데이터 쿼리는 P3 참여 후 취득한 NIH 조성금, 50,000달러 이상의 기금(보조금 등 비주요 자금 메커니즘 제외) 및 참가자가 PI로 기재된 조성금으로 제한되었다. 이러한 제약으로 인해 우리가 제시하는 자금조달 비율과 금액은 실제 총액을 밑돌 가능성이 높다. 
Our second data source for P3 participants’ NIH grant application activity was the University of Minnesota’s Sponsored Projects Administration (SPA). For this analysis, our sample was all individuals who participated in P3 from 2007 through 2016 (n = 165, cycles 1–17). We used 2016 as the cutoff for P3 completion but 2017 as the cutoff for submission/award data collection to ensure everyone had at least 1 year post-P3 in which to potentially submit NIH proposals and acquire funding. Our data query was restricted to NIH grants acquired after P3 participation; funding > $50k (to exclude nonprimary funding mechanisms such as supplements); and grants on which the participant was listed as PI. Because of these restrictions, the funding rates and amounts we present likely underrepresent the actual total.

이번 분석 참여자 165명 중 121명(73%)은 P3 완료 후 최소 1건의 NIH 제안서를 PI로 제출했다. 제출자의 90%(109/121)는 P3 프로그램을 완료한 후 2년 이내에 제출했습니다. P3 이후 NIH 제안서를 제출한 121명 중 52명(제출자의 43%, 그룹 전체의 32%)이 어느 시점에서 NIH 자금 조달에 성공했으며, 제출자의 절반 가까이가 P3 완료 후 1년 이내에 자금을 조달했다. 이 그룹의 P3 참가자가 획득한 NIH의 총 자금은 1억9300만 달러를 약간 웃돌았다. 이러한 결과는 참가자들이 P3 참여 중에 작업한 특정 보조금 신청을 포함할 수도 있고 포함하지 않을 수도 있다. 그러나, 이러한 장기 누적 결과는 프로그램의 전체 목표를 적절히 반영하는 것으로 간주될 수 있다. 즉, 참가자들이 성공적인 보조금 신청을 작성하기 위해 배운 것을 적용하는 것이다..

Among the 165 participants in this analysis, 121 (73%) submitted at least 1 NIH proposal as PI since completing P3. Slightly over 90% of submitters (109/121) did so within 2 years of completing the P3 program. Of the 121 individuals who submitted NIH proposals at any time since P3, 52 (43% of submitters, 32% of the entire group) were successful in acquiring NIH funding at some point, with nearly half of submitters (24/52, 46%) funded within 1 year of P3 completion. Total NIH funding obtained by P3 participants in this group was just over $193 million. These outcomes may or may not include the specific grant application that participants worked on during their P3 participation; however, these longer-term cumulative outcomes can be considered a relevant reflection of the program’s overall objective: that participants apply what they learn to write successful grant applications across their career.

 

평가
Evaluations

2007년부터 2015년까지(n = 153, 주기 1~15), 프로그램 완료 직후 모든 P3 참가자에게 평가 설문조사를 보냈다. 응답률 74%에 대한 114건의 설문조사가 반환되었다. 그 설문조사는 질적 질문들과 양적 질문들의 혼합을 포함하고 있었다. 대부분의 응답자들은 P3가 설득력 있는 제안서를 개발하고, 자신의 글을 비판적으로 평가하고, 글 쓰는 시간을 계획하는 능력을 향상시켰다는 데 동의하거나 강하게 동의했다. "이 프로그램에 참여함으로써 습득한 추가적인 지식이나 기술은 무엇입니까?"라는 개방형 설문 질문에 대한 72개의 답변도 유익했습니다(표 2는 설명 가능한 답변을 제공합니다). 두 명의 저자는 이러한 응답을 4가지 광범위한 주제로 검토 및 그룹화했다. 

  • NIH 검토 프로세스와 검토자의 기대에 대한 지식 향상, 
  • 작성 과정 중 시간 관리 개선, 
  • 기술 작성 및 문서 설계에 대한 기술력 강화, 그리고 
  • 작업중인 초안에 대한 피드백을 주고 받는 것의 가치

From 2007 through 2015 (n = 153, cycles 1–15), we sent evaluation surveys to all P3 participants shortly after their completion of the program; 114 surveys were returned for a 74% response rate. The surveys contained a mix of qualitative and quantitative questions. Most respondents agreed or strongly agreed that P3 improved their abilities to develop a compelling proposal, critically appraise their own writing, and plan their writing time (see Supplemental Digital Appendix 2, available at https://links-lww-com-ssl.access.hanyang.ac.kr/ACADMED/B168, for quantitative survey outcomes). Seventy-two responses to the open-ended survey question “What additional knowledge or skills did you acquire by participating in this program?” were also informative (Table 2 provides illustrative responses). Two authors reviewed and thematically grouped these responses into 4 broad themes:

  • greater knowledge of the NIH review process and reviewer expectations;
  • improved time management during the writing process;
  • stronger skills in technical writing and document design; and
  • greater appreciation of the value of giving and receiving feedback on drafts in progress.

2016년 이후 OFA와 P3 리더십 교체로 평가가 차질을 빚었다. OFA는 2019년부터 P3 이후 새로운 평가를 도입했다. 이 온라인 설문조사는 3주기(n = 40, 25-28회차)의 참가자들에게 이 글을 작성했을 때 시행되었다. 28개의 설문조사가 70%의 응답률을 보였다. 응답자의 과반수(82%, 23/28)는 P3 그룹 세션 밖에서 주당 6시간 이상을 제안 작업에 소비한다고 응답했다. P3의 Canvas 사이트를 통해 제공되는 자료는 응답자의 86%(24/28)가 "중요한critical" 리소스로 평가했습니다. 응답자의 89%(25/28)는 P3가 제안서를 제출하고 연구비 수주 가능성에 "실질적인 기여"를 했다고 보고했다. 응답자의 82%(19/23)는 제안서 초안에 대한 세션 내 토론이 P3 멘토가 제공한 서면 검토보다 적어도 "적당한" 가치를 더했다고 보고하였다. 그러나 나머지는 구두 토론이 거의 가치를 더하지 않는다고 생각했다. 이에 대해, 우리는 아래에 언급하는 초안에 대해 보다 심도 있는 구두 토론을 할 수 있는 시간을 가질 수 있는 방법을 시험적으로 시행하고 있습니다.
Evaluations were disrupted after 2016 due to transitions in OFA and P3 leadership. Beginning in 2019, the OFA introduced a new post-P3 evaluation. This online survey was administered to participants from 3 cycles (n = 40, cycles 25–28) as of this writing; 28 surveys were returned for a 70% response rate. A majority of respondents (82%, 23/28) reported spending 6 or more hours per week outside of the P3 group session working on their proposal. The materials provided through P3’s Canvas site were rated by 86% of respondents (24/28) as “critical” resources. Eighty-nine percent of respondents (25/28) reported that P3 made a “substantial contribution” to the likelihood of their submitting the proposal and obtaining funding. Eighty-two percent of respondents (19/23) reported that in-session group discussions of draft proposals added at least “a moderate amount” of value above and beyond the written reviews that P3 mentors provided; however, the remainder thought the oral discussions added little value. In response, we are piloting methods that allow time for more in-depth oral discussion of drafts, which we address below.

이 조사는 또한 참가자들에게 프로그램의 장점과 단점에 대해 질적 피드백을 요청했다(표 2는 예시적인 답변을 제공한다). 확인된 강점으로는 적극적인 제안서 작성 중에 받은 실질적이고 시기적절한 피드백과, P3 멘토가 참가자의 성공을 위해 했던 투자가 포함된다. 건설적인 비판 중에는 일부 리뷰의 퀄리티에 대한 "불공평함"면담의 비효율성에 대한 우려가 있었다. 또, 참가자는 컨텐츠 전문가로부터의 이전의 피드백에 대해서도 희망하고 있습니다. 이는 위에서 설명한 바와 같이 사이클의 중간 외부 리뷰를 시작하기 전이었습니다. 이하에 기술한 바와 같이, 이러한 문제에 대처하기 위해서, 프로그램의 몇개의 추가 변경을 시험적으로 실시하고 있습니다.

The survey also solicited participants’ qualitative feedback on what they considered to be the program’s strengths and weaknesses (Table 2 provides illustrative responses). Identified strengths included the substantive and timely feedback received during active proposal development and the investment that P3 mentors have in participants’ success. Among the constructive criticism offered was concern about “unevenness” in the quality of some reviews and inefficiencies in the conduct of in-person sessions. Participants also expressed a desire for earlier feedback from content experts; this was before our initiation of the mid-cycle external review, described above. As noted below, we are piloting some additional changes to the program to address these concerns.

이점, 기회 및 미래 방향
Benefits, Opportunities, and Future Directions

NIH 보조금 신청서의 작성, 제출 및 자금 지원을 촉진하기 위한 P3 모델은 단기 워크숍에서 제공되는 기본 지침이나 특이적 멘토링 상호작용에 대한 의존도를 넘어선다. 참가자는 다음과 같은 몇 가지 P3 특징으로부터 이득을 얻었다.

  • 각 개발 단계에서 다양한 경험이 풍부한 교수진과 동료들로부터 상세한 피드백을 받으면서 제안서을 개선할 기회 
  • 초기에 쓰고 고쳐쓰는 것을 필요로 하는 잘 짜여진 일정과 시간에 맞춰 완성되는 "최종 산출물"
  • 뛰어난 조사자가 연구의 중요성, 프로젝트의 과학적 엄격성 및 팀의 역량을 전달하기 위해 사용하는 기술에 대한 미묘한 통찰력

이 프로그램은 지역 연구 멘토링 능력이 더 제한적인 학부를 포함한 여러 부서의 교직원들을 지원할 수 있습니다. 우리 기관에서는 모든 KL2 및 BIRCH 학자와 일부 K12 학자가 P3에 지원해야 합니다. 이러한 실천은 P3의 가치가 장기적인 지도 트레이닝 프로그램에 종사하는 연구자에게까지 확대된다는 우리 기관의 자신감을 보여준다.

The P3 model for facilitating the writing, submission, and funding of NIH grant applications goes beyond the basic instruction offered in short-term workshops or a reliance on idiosyncratic mentoring interactions. Participants benefit from several P3 features:

  • the opportunity to develop a proposal while receiving detailed feedback from a diverse group of experienced faculty and their peers at each stage of development;
  • a well-defined schedule that requires early and frequent writing and rewriting and a “finished product” on a timeline; and
  • nuanced insight into the techniques that accomplished investigators use to communicate their research’s significance, their projects’ scientific rigor, and their team’s competence.

The program can support faculty from multiple departments, including those with more limited local research mentoring capacity. At our institution, all KL2 and BIRWCH scholars (Building Interdisciplinary Research Careers in Women’s Health), and some K12 scholars, are required to apply to P3. This practice demonstrates our institution’s confidence that P3’s value extends even to researchers engaged in longer-term, mentored training programs.

Rubio와 동료들은 연구 프로젝트를 개선하고 자금을 확보하는 데 도움이 되는 경험적 훈련 이니셔티브의 가치를 설명했다.10 그들은 피츠버그 대학, 마운트 시나이의 Icahn 의과대학 및 펜실베니아 대학의 "P3-like" 프로그램을 언급하지만, 이러한 운영 세부사항과 결과에 대해 언급했다. 프로그램은 설명되지 않습니다. 유사한 구조화된 프로그램의 결과에 대한 다른 발표된 보고서를 검색하여 Duke University 의과대학에서 4개월 간의 독립과 K클럽 프로그램을 설명하는 단 1개의 보고서를 확인했습니다. 18 이러한 프로그램의 경우, 5년간에 걸쳐 제출된 R과 K의 신청에 대한 수상률은 35%로, 우리 기관의 성과와 거의 동일합니다. 샌프란시스코 캘리포니아 대학의 보고서는 P3의 모의 NIH 검토 프로토콜과 유사한 방식으로 보조금 제안서의 내부 제출 전 검토를 수행하기 위한 프로그램을 기술했다. 25 이 프로그램의 경우, 12개월 동안 내부 안전 점검을 거친 제안의 85%(23/27)가 이후에 제출되었고(P3 제출 비율과 매우 유사), 제출된 신청의 52%(12/23)가 자금을 지원받았다.

Rubio and colleagues described the value of experiential training initiatives for helping junior investigators refine their research projects and secure funding. 10 They mention “P3-like” programs at the University of Pittsburgh, Icahn School of Medicine at Mount Sinai, and University of Pennsylvania, but operational details and outcomes for these programs are not described. We searched for other published reports on the outcomes of similarly structured programs and identified just 1, which describes the 4-month Path to Independence and K Club programs at Duke University School of Medicine. 18 For these programs, the award rate for submitted R and K applications combined was 35% over 5 years, which is nearly identical to our outcome. A report from the University of California, San Francisco described a program for conducting internal presubmission review of grant proposals—an approach similar to P3’s mock NIH review protocol. 25 For that program, 85% (23/27) of proposals that underwent internal peer review over a 12-month period were subsequently submitted (very similar to the P3 submission rate), and 52% (12/23) of submitted applications were funded.

이런 기존 연구에 더하여, 우리는 유사한 프로그램을 도입하려는 다른 기관에 적응 가능한 청사진을 제공한다. 그러나 P3를 지원하는 데 필요한 자원은 일부 교육기관에게 한계가 될 수 있으며, 특히 P3가 해당 교육기관에서 "적합"하고 성공 여부를 판단하기 전에 더욱 그렇습니다. 이러한 경우, 소규모 파일럿 프로그램으로 시작하는 것을 고려할 수 있다. 이는 5~7명의 참가자와 함께 일하는 단 2명의 멘토들이 주도하는 단일 부문 이니셔티브(연간 2사이클)로 시작된 P3 모델도 그랬었다. 
Our outcomes add to this limited body of literature while offering an adaptable blueprint for other institutions seeking to implement a similar program. However, the resources needed to support P3 could be a limitation for some institutions, especially before determining its “fit” with and success at their institution. In these cases, potential adopters might consider starting with a smaller pilot program. This aligns with the P3 model, which began as a single-department initiative (2 cycles per year) led by just 2 mentors working with 5–7 participants.

투자수익률
Return on investment

P3 모델의 스탭은 연간 0.9명의 교직원 FTE와 OFA 스탭의 서포트 시간을 더하고 있습니다. 따라서 20만달러는 연간 운영비용의 합리적인 추정치입니다. 이 투자의 수익은 과거 참가자가 획득한 외부 보조금 달러로 수량화할 수 있습니다. 우리의 SPA 데이터에 따르면 P3 참가자는 10년간 NIH 자금(직간접 비용)으로 1억9300만달러를 획득했습니다. 이 기간 동안 P3의 운영 비용은 180만 달러(P3의 9년간 연간 20만 달러)로 추산된다. 이는 P3 운영에 투자된 1달러당 NIH 자금으로 107달러의 수익률을 나타낸다. 그러나, 이러한 자금의 일부는 P3의 참여 없이도 획득될 것이 거의 확실하다.

Staffing for our P3 model engages 0.9 faculty FTE per year, plus additional OFA staff support time. Thus, $200k is a reasonable estimate of its annual operating costs. The return on this investment can be quantified by external grant dollars obtained by past participants. Our SPA data show that P3 participants obtained $193 million in NIH funding (direct and indirect costs) over 10 years. The operating cost of P3 over that period is estimated at $1.8 million ($200k per year for the 9 years of P3 to obtain 10 years of funding data). This represents a return of $107 in NIH funding for each $1 invested in P3’s operation. However, some of this funding would almost certainly have been obtained even without P3 participation.

무작위 제어 실험의 결정적인 데이터가 부족하기 때문에, 우리는 P3 제출자의 35%의 연구비 수주 성공률(P3 참가자 조사 응답자의 88%가 제출자)과 2018년 NIH의 모든 기관 및 자금 조달 메커니즘에 대해 문서화된 약 20%의 자금 조달 성공률을 비교할 수 있다.26 이러한 추정치를 사용하여 매년 P3에 참여하는 제출자는 30명 중 9명NIH 기금을 받게 되는데, 이는 P3가 없었다면 30명의 제출자 중 6명이 NIH 기금을 받게 될 것으로 예상된다. 자금을 지원받은 P3 신청에 대한 평균 직접 비용은 $875,188(위 데이터 참조)인 것으로 판명된 이 3개의 추가 보조금은 P3에 귀속될 수 있는 특정 연도에 기관이 수령한 $3,439,489($2,625,564 + 추정 간접 비용)에 해당한다. 연간 운영 비용이 20만 달러라고 가정하면, 특정 연도에 P3 운영에 지출된 1달러당 기관은 받지 못했을 외부 자금으로 약 17달러를 받는 것으로 추정할 수 있습니다.
Lacking definitive data from a randomized controlled experiment, we can compare the 35% funding success rate of P3 submitters (88% of P3 participant survey respondents were submitters) to the ~20% funding success rate documented across all NIH institutes and funding mechanisms for 2018. 26 Using these estimates, we can extrapolate that 9 of the 30 submitters who participate in P3 each year will receive NIH funding, compared with 6 of 30 submitters expected to receive NIH funding based on the national average. Having found that the average direct cost for a funded P3 application is $875,188 (see data above), these 3 additional grants per year represent $3,439,489 ($2,625,564 direct costs plus $813,925 estimated indirect costs) received by the institution in a given year that can be attributed to P3. Assuming $200,000 annual operating costs, we can estimate that for every $1 spent to operate P3 in a given year, the institution receives about $17 in external funding it would likely not otherwise have received.


P3가 보조금을 제출하는 개인 수의 증가로 이어진다면 ROI도 좋은 영향을 받을 것이다. P3 참가자의 88%의 제출율은 상당하지만, P3가 없었다면 이들 중 몇 명이 연구비지원서를 제출했을지 추정할 수 있는 실증적 수단이 없다. 그러나 P3의 구조와 기대는 보조금 작성 포부를 실제 서면 및 제출된 제안으로 전환하는 데 도움이 된다고 가정하는 것이 타당하다. 마지막으로, P3 참가자들이 경력 전반에 걸쳐 추가 보조금(P3 제안서 외)을 찾고 자금을 조달할 가능성이 더 높다면 투자 수익률은 호의적으로 영향을 받을 것이다. 과거 P3 참가자의 약 73%가 NIH 조성 제안을 제출하고, 그 중 43%가 NIH 자금 조달에 성공했다는 것은 알고 있지만, P3에 참가하지 않은 다른 의과대학 교수와는 비교할 수 없다.

Return on investment would also be favorably affected if P3 leads to an increase in the absolute number of individuals who are submitting grants. While the 88% submission rate for P3 participants is substantial, we have no empirical means of estimating how many of these individuals would have submitted grants in the absence of P3 participation. However, it is reasonable to posit that P3’s structure and expectations help to facilitate the conversion of grant-writing aspirations into actual written and submitted proposals. Finally, return on investment would be favorably affected if P3 participants were more likely to seek and obtain funding for additional grants (beyond their P3 proposal) across their career. We know that about 73% of past P3 participants submitted NIH grant proposals and 43% of these were successful in obtaining NIH funding, but we are unable to compare this with other medical school faculty who did not participate in P3.

제한 사항
Limitations

우리의 조사 데이터는 적당한 응답률에 의해 제한되며, 따라서 결과가 모든 P3 졸업생들을 대표하지 않을 가능성이 있다(즉, 데이터가 무작위로 누락되지 않았다). P3 보조금을 제출한 사람들은 그렇지 않은 사람들보다 조사에 응답하는 데 더 동기 부여가 되었을 수 있다. 응답자의 88%가 P3 제안을 제출했다고 보고한 반면, 기관 데이터에 따르면 전체 P3 참가자의 73%가 최소 1개의 NIH 보조금을 제출한 것으로 나타났다. 후자의 데이터 세트에는 샘플링된 9년간의 모든 참가자가 포함되어 있기 때문에 가장 자신 있는 데이터 세트가 있습니다. 그러나 P3에 참여하지 않고 제안서를 제출하고 NIH 자금을 지원받았을 비율은 아직 알 수 없다. RCT를 하는 것은, 가능한 한 많은 자격 있고 관심 있는 교직원을 지원해야 한다는 프로그램의 의무mandate와 일치하지 않습니다.
Our survey data are limited by the modest response rate, which leaves open the possibility of results not being representative of all P3 alumni (i.e., data not missing at random). Those who submitted their P3 grants may have been more motivated to respond to surveys than those who did not. There is some evidence for this because 88% of respondents reported having submitted their P3 proposal, whereas the institutional data show that 73% of all P3 participants submitted at least 1 NIH grant. We can be most confident in the latter dataset because it includes all participants over the 9 years sampled. However, we still cannot know what proportion of these individuals would have submitted proposals and received NIH funding without having participated in P3. A randomized controlled trial is not consistent with the program’s mandate of supporting as many qualified and interested faculty as logistically feasible.

장래의 방향
Future directions

우리는 효율성과 합리적인 프로그램 확장을 계속 추구합니다. 세션 중에 코호트를 2개의 그룹으로 나누는 접근법(기본 과학 프로젝트 제안자와 임상 또는 지역사회 기반 연구 제안자 간 또는 주어진 주기 중 가장 말이 되는 K와 R 중 하나)을 시범 테스트하여 검토가 2개의 다른 방에서 동시에 진행되도록 한다. 이 「병렬 처리」에 의해, 참가자의 작업에 대해 논의하는 시간이 2배로 증가해, 동료나 멘토간의 전문 지식 제휴가 강화됩니다. 또한 P3 졸업생들을 위한 간단한 재제출 프로그램을 계획하고 있습니다. 또 다른 목표는 URM 집단에서 교수진의 참여를 늘리는 것이다. 델의 CTSI는, URM 교직원을 대상으로 한 프리 K 스콜라 프로그램을 서포트하고 있습니다. 이 프로그램은 향후의 사이클에 있어서, 보다 다양한 P3 지원자 풀에 공헌할 것으로 예상됩니다.
We continue to seek efficiencies and reasonable program expansions. We are pilot testing an approach that divides the cohort into 2 groups during sessions (roughly split between those proposing basic science projects and those proposing clinic- or community-based research or between Ks and Rs, whichever makes the most sense in a given cycle) so that reviews are proceeding simultaneously in 2 different rooms. This “parallel processing” doubles the time available for discussing participants’ work while supporting greater expertise alignment among peers and mentors. Additionally, we are planning a brief program for P3 alumni working on resubmissions. Another goal is to increase participation of faculty from underrepresented minority groups. Our CTSI supports a Pre-K Scholars program for underrepresented faculty, which we anticipate will contribute to a more diverse P3 applicant pool in future cycles.


COVID-19 대유행에 대응하여, 우리는 여기에 설명된 절차에 실질적인 변경 없이 본 문서 작성 현재 2개의 완전 가상 P3 사이클을 완료했다. 평가 응답자들은 만장일치로 첫 번째(소개) 세션과 마지막(NIH 검토) 세션을 제외하고 COVID-19가 통제된 후에도 가상적으로 P3 세션을 계속 실행할 것을 권고했다. NIH National Research Mentoring Network (NRMN)의 일환으로 2014년부터 2019년까지 P3가 전국 규모로 구현됨으로써 하이브리드 또는 완전 온라인 접근법의 실행 가능성이 더욱 뒷받침되고 있다.17 P3의 NRMN 적응은 주로 여러 기관의 교수진에 가상 형식으로 전달되었다. 67명의 참가자로 구성된 6개의 NRMN-P3 코호트가 프로그램 완료 후 3~18개월 동안 추적되었습니다. 초기 데이터에 따르면 NIH 제안서 제출률은 67%(45/67), 제출된 NIH 신청에 대한 자금 조달률은 33%(15/45)이다. 27   
In response to the COVID-19 pandemic, we completed 2 fully virtual P3 cycles as of this writing, with no substantive changes to the procedures described here. Evaluation respondents unanimously recommended that we continue to run P3 sessions virtually even after COVID-19 is controlled, with the exception of the first (introduction) and last (mock NIH review) sessions. The viability of a hybrid or completely virtual approach is further supported by P3’s implementation on a national scale from 2014 through 2019 as part of the NIH National Research Mentoring Network (NRMN). 17 The NRMN adaptation of P3 was delivered in a predominately virtual format to cohorts of faculty from different institutions. Six NRMN-P3 cohorts of 67 participants were tracked for 3 to 18 months after program completion. Early data show an NIH proposal submission rate of 67% (45/67) and a funding rate for submitted NIH applications of 33% (15/45). 27

결론적으로, P3는 수명, 긍정적인 결과 및 적응성의 실적이 있습니다. 프로그램의 절차, 원칙 및 구조에 대한 우리의 설명은 독자들이 자신의 기관 내에서 비슷하게 성공적인 모델을 구현할 수 있도록 해야 한다.

In conclusion, P3 has a track record of longevity, positive outcomes, and adaptability. Our description of the programs’ procedures, principles, and structure should enable readers to implement a similarly successful model within their own institutions.


Acad Med. 2022 Jan 1;97(1):53-61.

 doi: 10.1097/ACM.0000000000004359.

The Proposal Preparation Program: A Group Mentoring, Faculty Development Model to Facilitate the Submission and Funding of NIH Grant Applications

Affiliations collapse

Affiliations

1A.M. Weber-Main is associate professor, Department of Medicine, University of Minnesota Medical School, Minneapolis, Minnesota.

2K.A. Thomas-Pollei is adjunct assistant professor, Department of Medicine, University of Minnesota Medical School, Minneapolis, Minnesota.

3J. Grabowski is retired professor, Department of Psychiatry, University of Minnesota Medical School, Minneapolis, Minnesota.

4C.J. Steer is professor, Departments of Medicine and Genetics, Cell Biology and Development, University of Minnesota Medical School, Minneapolis, Minnesota.

5P.D. Thuras is research associate, Department of Psychiatry, University of Minnesota Medical School, and health science specialist, Minneapolis VA Health Care System, Minneapolis, Minnesota.

6M.G. Kushner is professor, Department of Psychiatry, University of Minnesota Medical School, Minneapolis, Minnesota.

PMID: 34380935

DOI: 10.1097/ACM.0000000000004359

Abstract

This article describes the University of Minnesota Medical School Proposal Preparation Program (P3). P3 is designed to develop grant-writing skills for assistant professors preparing their first K- or R-series application to the National Institutes of Health (NIH). Three 4-month P3 cycles are conducted annually. For each cycle, a cohort of around 10 assistant professor participants and 5 regular faculty mentors meet for ten ~2-hour group sessions. Participants receive iterative oral and written feedback on their proposals in development within a small, interdisciplinary, group mentoring setting providing structure, accountability, guidance, and support. Between sessions, 1 peer and 1 mentor are assigned (on a rotating basis) to critique each participant's developing application. The sessions include a brief mentor-led presentation on a particular grant section followed by discussion of each participant's application conducted by the assigned reviewers. The cycle concludes with a mock NIH review session, in which each participant is matched with a University of Minnesota faculty content expert who critiques their completed application using NIH guidelines. In a survey sent to all past P3 participants as of 2018 (n = 194), 88% of respondents reported having submitted their P3-developed NIH grant, and 35% of these submitters reported funding success. A separate analysis of institutional data for all past P3 participants as of 2016 (n = 165) showed that 73% submitted at least 1 NIH proposal since completing P3 and that 43% of these had acquired NIH funding, for a combined total of $193 million in funding awarded. The estimated rate at which participants obtained funding for their P3-developed grant application (~35%) exceeds the national annual NIH grant funding rates (~20%) by approximately 50%. This article provides the practical information needed for other institutions to implement a P3-like program and presents a cost-benefit analysis showing the advantages of doing so.

비-서구 문화권에서 의료 전문직업성 프레임워크: 내러티브 개괄(Med Teach, 2016)
Medical professionalism frameworks across non-Western cultures: A narrative overview
A. Al-Rumayyana, W. N. K. A. Van Mookb,c, M. E. Magzoubd, M. M. Al-Erakye,f, M. Ferwanaa, M. A. Khana and D. Dolmansb

 

서론
Introduction

지난 25년 동안, 의료 전문직업성에 대한 정의와 합의에 관한 상당한 문헌이 출판되었습니다. 그러나 서양문화의 전문 의료기관이 실시한 연구에서는 이를 [사회와 의료전문직의 계약 이행]으로 규정했다. 1980년대 초 미국내과학회(ABIM)는 다음과 같은 전문성 요소를 결정하는 휴머니즘 프로젝트를 시작했습니다: 책임감, 이타심, 탁월함, 의무, 성실성, 명예. 이 프로젝트는 적어도 미국 사회에서 현대 의학 전문성의 요소와 의미를 정의하는 데 중요한 공헌으로 여겨졌다.
Over the past 25 years, substantial literature has been published on definitions and consensus on medical professionalism (Cruess et al. 2000; ABIM Foundation et al. 2003). However, studies done by professional medical organizations in Western culture thus defined it as a fulfillment of the medical profession’s contract with society (Sohl & Bassford 1986; Pellegrino & Relman 1999). In the early 1980s, the American Board of Internal Medicine (ABIM) started its project on Humanism in which the following elements of professionalism were determined: accountability, altruism, excellence, duty, integrity, and honor (Evetts 2003; Zijlstra-Shaw et al. 2012). This project was considered an important contribution to defining the elements and meaning of contemporary medical professionalism at least in the American society.

이와 관련, 미국 내과의사협회, 미국 내과의사협회, 미국 내과의사위원회 및 유럽 내과의사연맹은 2002년에 의료 전문성에 관한 의사 헌장을 제정했다. 이 중요한 문서에는 사회 정의, 환자 자율성, 환자 복지의 우선을 포함한 의료 전문직업성의 세 가지 기본 토대와 10가지 전문직업적 책임을 함께 열거되어 있다.

  • 환자와의 정직성, 
  • 전문적 역량, 
  • 환자의 기밀성에 대한 헌신, 
  • 질 향상 및 진료 접근성 향상, 
  • 환자와의 적절한 관계 유지, 
  • 과학적 지식, 
  • 신뢰 유지, 
  • 이해 충돌 관리, 
  • 전문직업적 책임
  • 유한 자원의 분배. 

In a related important development, the American College of Physicians, the American Society of Internal Medicine, the American Board of Internal Medicine, and European Federation of Internal Medicine established a Charter for Physician on medical professionalism in 2002. This important document listed three basic foundations of medical professionalism including, social justice, patient autonomy, and primacy of patient welfare, (General Medical Council 2001) along with 10 professional responsibilities, that include:

  • honesty with patients,
  • professional competence,
  • commitment to patients’ confidentiality,
  • improving quality and access to care,
  • maintaining appropriate relationships with patients,
  • scientific knowledge,
  • maintaining trust,
  • managing conflicts of interest,
  • professional responsibilities, and
  • just distribution of finite resources (ABIM Foundation et al. 2003).

그 결과, 역량 기반 커리큘럼과 전문 트레이닝 프로그램이 도입되고 있어 전문성은 학부·대학원 연수·평가 프로그램의 불가결한 부분이 되고 있습니다. 이러한 변화들 중 일부는 일부 사회와 문화로 제한될 수 있는 반면, 다른 것들은 다른 것들보다 더 두드러진다.

As a result, the competence-based curriculum and professional training programs are being introduced, and professionalism is made an integral part of undergraduate and postgraduate training and assessment programs. Some of these changes may be limited to some societies and cultures, whereas others are more prominent in others.

의대생에게 의학 전문직업성을 가르칠 때는 [환자의 이익을 의사의 이익보다 우선시]하는 것을 포함한 기본적인 사회적 계약을 반영해야 한다(Cruess 2006). 따라서 Physician Charter의 편집자가 말한 것처럼, 의료 전문직업성의 사회문화적 맥락의 중요성은 더욱 가치 있고 두드러진다. "이 문서는 헌장 저자들이 의술을 실천한 서양 문화 이외의 문화에서 의학의 전통을 반영하는가?" (Blank et al. 2003) 의료 전문직업성에 대한 보편적인 진실은 없다. Ho et al(2011)은 의료전문성 적용성의 서구적 틀에 도전하여 대만 이해관계자의 가치와 문화유산을 반영한 전문성 틀을 제안했다(Irvine 1997). 많은 연구자들은 의학 전문직업성은 [어떤 문화에서든 맥락적 연결에 관한 명확한 기술이 필요하다]고 제안했다. 문화적 배경은 이론적으로는 전문직업성 개념에 문화적 특정 요소를 추가할 수 있지만(Hafferty 2006), 다른 한편으로는 매우 제한적인 것으로 나타났다. 전문직업성 개념에 대한 영역이 중복되어 있어 전문직의 전문직업성적 특성에 대한 공감대는 아직 검증되지 않았다.

When medical professionalism is taught to medical students, it should reflect the underpinning social contract including placing the of patients’ interests above those of physicians (Cruess 2006). The importance of a sociocultural context of medical professionalism thus becomes more valuable and outstanding as voiced by the Physician Charter editor; “Does this document reflect the tradition of medicine in cultures other than those in the West, where the authors of the charter have practiced medicine?” (Blank et al. 2003).There is no universal truth about medical professionalism. Ho et al. (2011) challenged the Western framework of medical professionalism applicability and proposed a framework of professionalism reflecting the values and the cultural heritage of Taiwanese stakeholders (Irvine 1997). Many researchers suggested that medical professionalism needs a clear description that should be contextually linked to any culture (Van De Camp et al. 2004; Wear & Kuczewski 2004; Hafferty 2006; Woodruff et al. 2008). Cultural backgrounds may theoretically add cultural-specific elements to the concept of professionalism (Hafferty 2006), but on the other hand these are herein shown to be very limited (Cruess et al. 2010). The areas on the concept of professionalism are overlapping; therefore, the consensus on professional characteristics for professionals is not yet validated.

의학교육에서 [여러 문화권에 걸친 전문직업성의 개념화]를 강조하는 것은 [사회적 핵심 가치와 지역사회의 필요성에 대한 인식 차이]에 대응한 것이다. 동양 세계의 가치와 신념은 [집단의 역동성과 존엄화된 페르소나]의 관점에서 유교적 전통에 의해 추진되는propelled 반면, [전문직업성의 진화와 담론]은 서양 문화에서 더 두드러진다(Cruess 2006). 포함된 연구 중 일부에서는 서양의 전문직업성 개념을 문자 그대로 활용했고, 다른 연구에서는 다른 출처의 개념을 인용했다. 이러한 인용은 문화적 전통이 의료 전문성에 미치는 영향에 다른 개념을 가져왔다.
The emphasis on conceptualization of professionalism in medical education across cultures has come in response to perceived differences in societal core values and community needs. While Eastern world values and beliefs are propelled by Confucian traditions in terms of group dynamics and dignified persona (Ho et al. 2011), the evolution and discourse of professionalism are more prominent in the Western culture (Cruess 2006). In some of the included studies, utilization of the Western concept of professionalism was literal (Akhund et al. 2014; Nishigori et al. 2014), and other studies (Ho et al. 2011; Chandratilake et al. 2012; Al-Eraky et al. 2014) included cited concepts from other sources (Cruess et al. 2002; Cruess 2006; Cruess et al. 2010). These citations brought different concepts on the influence of cultural traditions on medical professionalism.


비서방 문화권, 특히 중국과 사우디아라비아의 다른 조사자들은 이러한 추세를 따랐다. Pan 등은 [모든 맥락을 포용하며, 모든 맥락에 적용할 수 있는 전문적 프레임워크는 없다]고 주장했다. 이 연구는 세 가지 비서구적인 전문성 프레임워크를 식별한다. 목표는 세 가지이다.

  • (1) 세 가지 프레임워크와 그 문화 고유의 요소를 설명한다.
  • (2) 세 가지 프레임워크 간의 공통점을 설명한다. 
  • (3) 그 차이점을 설명한다.

Other investigators from non-Western cultures especially China and Saudi Arabia followed this trend Pan et al. (2013). They all advocated that there is no professionalism framework that is comprehensive and applicable in all contexts. This study identifies three non-Western framework of professionalism; the aim is three folds:

  • (1) to describe the three frameworks and their culture-specific elements,
  • (2) to describe the commonalities among the three frameworks, and
  • (3) to describe the differences between them.

방법들
Methods

이 연구의 목적을 실현하기 위해 내러티브 개괄narrative overview을 사용했다. 서술적 개요는 일반적으로 각 기사의 내용을 요약한 형식으로 저자들의 연구 결과를 보고한다. 이 방법을 사용하는 가장 큰 이유는 기준에 부합하는 기사를 4개만 발견했기 때문입니다. 둘째, 저자들이 비서양 문화권의 전문성 등 중요한 이슈를 조명해 토론을 자극하고 현안 질문에 답하려 할 때 가장 적합하다. 우리의 경우, 우리는 포괄적인 문헌 검토와 기사 선정 기준의 파악을 통해 앞서 언급한 연구 질문에 답하려고 노력하고 있다.

A narrative overview was used to realize the objectives of this study. A narrative overview reports the authors’ findings in a condensed format that typically summarizes the contents of each article (Green et al. 2006). The main justification of using this method is the fact that we found only four articles that met the criteria. Second, it is most suitable when the authors intend to bring an important issue such as professionalism in non-Western cultures to light for stimulating discussion and try to answer a pending question. In our case, we are trying to answer our research questions addressed earlier through conducting a comprehensive literature review, and identifying selection criteria of articles.

문헌 검색
Literature search

이 검토에는 1947년부터 현재까지 가장 중요한 국제 생물의학 문헌을 다루는 PubMed, Embase(최신 데이터베이스, PsychInFO, Educational Resources Information Center(ERIC; 교육 정보 센터), 사회학적 추상화, TIMELIT(Topics in Medical Education) 등 여러 방법이 사용되었다. PubMed는 1966년부터 시작되는 문헌을 다루는 우리의 연구와 더 관련이 있다. 2002년부터 2014년까지 PubMed 데이터베이스에 대한 검색을 제한했습니다. 그 해 「Physician Charter」가 확립되었기 때문입니다. 표 1은 검색에 사용된 용어를 보여 줍니다. 선택된 모든 연구의 참조는 이후 손으로 검색되었다. 체계적인 검토, RCT, 보고서 및 저널 기사를 포함한 정량적 및 정성적 연구가 연구의 목적으로 사용되었다. 표 2는 데이터베이스의 히트 수를 나타내고 있습니다. 두 명의 검토자는 총계와 요약본을 스캔하여 선택된 모든 연구의 포함 기준을 평가했다. 기사의 참조 리스트를 스캔 해, 의료 프로페셔널리즘과 같은 중요한 작업을 통합할 수 있는 한층 더 관련 있는 연구를 취득했습니다. 그 후, 동일한 두 검토자가 편견의 위험을 고려하여 전문 기사를 검색하여 검토하였다.

Multiple methods was used in this review including: PubMed; Embase (an up-to-date database, PsychINFO, Educational Resources Information Centre (ERIC); Sociological Abstracts; and Topics in Medical Education (TIMELIT) were covering the most important international biomedical literature from 1947 to the present day. PubMed is more relevant to our study which covers the literature starting from 1966. We limited our search on PubMed database from 2002 to 2014 because the “Physician Charter” was established in that year. Table 1 showed the terms used for the search. References of all selected studies were subsequently hand-searched. Quantitative and qualitative research including systematic reviews, RCT, reports, and journal articles was used for the purpose of the study. Table 2 showed the numbers of hits in the database. Two reviewers assessed the inclusion criteria of all selected studies by scanning the totals and the abstracts. The reference list of the articles was scanned to retrieve the further relevant studies enabling us to incorporate seminal work such as the Medical Professionalism. Subsequently, full text articles was retrieved and reviewed by the same two reviewers taking in consideration the risk of biases.

 

 

포함 기준
Inclusion criteria

비서양 문화에서 의료 전문성을 다루는 연구는 다음과 같은 선정 기준에 따라 선정되었습니다. 
(1) 의사, 의대생, 의대교사, 의료교육자, 구급대원을 모집한 의료전문성에 관한 모든 종류의 원본 기사 
(2) 비서양 문화 전반에 걸친 의료 전문성과 그 치수를 정의한 연구 
(3) 영어로 출판된 연구

Studies addressing medical professionalism in non-Western culture were selected based on the following selection criteria:

  • (1) any type of original article on medical professionalism that recruited physicians, medical students, medical teachers, medical educators, and paramedical staff,
  • (2) research that defined medical professionalism and its dimensions across non-Western cultures, and
  • (3) studies published in English language.

 

제외 기준
Exclusion criteria

비의료/패러메디컬을 포함한 서양 문맥에서 수행된 연구는 제외되었다.

Studies conducted in Western context, included non-medical/paramedical, and in non-English language were excluded.

 

결과.
Results

144개의 전문이 추가 검토를 위해 최종 후보 명단에 올랐으며, 131개의 연구는 비의료 전문성에 중점을 두었기 때문에 제외되었다. 비서양 문화에서 전문직업성을 다룬 기사는 13건뿐이었다. 이 13개 연구 중 [오직 4개 연구]만이 문화 특이적 요소를 포함하는 독특한 비서구적 프레임워크를 가지고 있었다. 이 네 가지 연구로부터 오직 세 개의 다른 프레임워크만이 중국어로 확인되었고 대만 연구는 둘 다 하나의 프레임워크에 초점을 맞추고 있었다. 표 3은 포함된 연구의 특성을 보여준다. 상자 1 ~ 3은 세 가지 프레임워크를 설명합니다. 다른 9개의 연구는 서양의 관점을 통해 전문성을 보기 때문에 제외되었다. 표 4는 3개의 비서양 문화에서 발견된 24개의 속성을 보여줍니다. 3개의 프레임워크에서 공통되는 속성은 3개뿐이며, 12개의 속성은 적어도 2개의 문화에서 공유됩니다. 나머지 9가지 속성은 각 문화마다 고유하다. 즉, 적어도 하나의 문화에서 발견된다.
One hundred and forty-four full-texts were shortlisted for further review; 131 studies were excluded due to its focus on non-medical professionalism. Only 13 articles addressed professionalism in non-Western culture. From these 13 studies, only 4 studies had a unique non-Western framework which includes culture-specific elements. From these four studies, only three different frameworks were identified as the Chinese and the Taiwanese studies were both focusing on one framework. Table 3 presents the characteristics of the included studies. Boxes 1–3 describe the three frameworks. The other nine studies were excluded because they look at professionalism through a Western lens. Table 4 presents 24 attributes found in the three non-Western cultures. Only 3 attributes are common among the three frameworks, while 12 attributes are shared by at least two cultures. The remaining nine attributes are unique to each culture i.e. are found at least in one culture.

 

 

Box 1 중국 문화의 관점에서 본 프레임워크
Box 1 Framework from Chinese cultural perspective

중국의 문화적 관점에서 Ho et al(2011) 프레임워크는 그리스 사원 형태의 스턴의 의료 전문성 프레임워크로 구성되며,

  • 3개의 기본 원칙(소통, 임상 능력, 윤리),
  • 4개의 기둥(설명성, 휴머니즘, 우수성, 이타주의)
  • 빔(integrity)을 포함하고 있다. 빔은 기둥을 위에서 가로지르고 있다. 빈 기둥이 있어서 전문직업성의 가치를 추가하는데 사용할 수 있다.

From China’s cultural perspective, Ho et al. (2011) framework consists of Stern’s medical professionalism framework in the shape of a Greek temple and includes

  • three basic principles (communication, clinical competence, and ethics),
  • four pillars/columns (accountability, humanism, excellence, and altruism), and
  • a beam (integrity), the beam across the top of the columns. Included blank columns are to be used for additional values for professionalism.

그들은 중국 문화에서 integrity과 관련된 문화 개념인 자중(자기 존엄과 존경)을 사용했다. 저자들은 존경과 자긍심을 갖는 것이 전문성 발달의 기본 단계라고 생각하고 그것을 지지 기둥의 맨 위에 대들보로 배치했다. 의료 전문성의 이러한 속성은 서양 문화와 유사하지만, 모든 참가자들이 Zizhong의 개념과 관련된 "integrity"을 추가하기로 동의했기 때문에 이 프레임워크는 Stern에서 벗어난다. 이 틀은 대만과 중국 신앙체계의 문화적 뿌리에 깊이 박혀 있다. Ho와 그녀의 동료들에 대한 연구는 그들의 문화적 맥락에서 전문직업성의 개념을 개발하기 위해 공동체의 의료 전문가들과 구성원들이 포함되었다.

They used the cultural concept of Zizhong (self-dignity and respect) which is associated with integrity in Chinese culture. The authors consider that to be respectful and self-dignified is a fundamental steps in professional development and placed it as a beam on the top of the supporting column. Although these attributes of medical professionalism are similar to Western culture, this framework derails from Stern as all participants agreed to add “integrity” relating to the concept of Zizhong. This framework is deeply embedded in cultural roots of the Taiwanese and Chinese belief system. The study of Ho and her coworkers included allied health professionals and members from the community to develop the concept of professionalism in their cultural context.

Pan et al(2013)은 동일한 개념을 사용했다. 그러나 팀워크, 건강증진, 자기관리, 경제 등 네 가지 카테고리를 통합했다. 이 연구에 따르면, 8개의 범주가 integrity, 임상 능력, 커뮤니케이션, 휴머니즘, 윤리, 이타주의, 설명 책임, 탁월성을 포함한 기존의 틀을 제공했습니다. 이러한 범주는 Ho et al(2011) 및 서구 지향 문화 체계와 유사하다.
Pan et al. (2013) used the same concept. However, they integrated four additional categories of: teamwork, health promotion, self-management, and economics. According to this study, eight categories offered a preexisting framework, which included integrity, clinical competence, communication, humanism, ethics, altruism, accountability, and excellence. These categories are similar to Ho et al. (2011) and Western-oriented cultures frameworks.

 

박스 2 아라비아 프레임워크
Box 2 The Arabian framework

[아라비아 맥락]이란 아랍어를 공용어로 하고, 이슬람교가 대다수 인구의 종교인 중동의 아라비아 국가들에 의해 행해지고 있는 문화, 전통, 믿음, 그리고 행동의 혼합으로 인식될 수 있다. 이러한 행동과 전통은 반드시 이슬람 교리로부터 나온 것은 아니지만, 이러한 나라들 사이에서는 몇 가지 공통된 가치관이 표준으로 받아들여지고 있다. 비록 인종 집단, 부족, 지역 문화, 그리고 지역 실체에 차이가 있지만, 아랍 세계는 여러 독립 국가의 집합이라기 보다는 하나의 중요한 사회이다. 아라비아 맥락에서 알-에라키 외 연구진(2014)은 이슬람의 가치에 기초한 아라비아 문화의 맥락에서 의료 전문성의 [4대문 모델]을 설명했다. 8개의 전문적 속성이 다음과 같은 4개의 테마로 분류되었다.

  • (1) 자기자신을 다루는 것: 자기인식(taqwa)와 자기관리(ehtesab)
  • (2) 과제를 다루는 것: 수월성 다루기, 전문성 개발에 대한 헌신, 성찰적 실천
  • (3) 타인을 다루는 것: 환자, 동료 및 학생에 대한 존중, 전문적 기밀 유지
  • (4) 알라(신)를 다루는 것: 기존 문헌과 다르게, 자기-책무와 자기-동기가 알라(신)와 연계되어서, 이것은 (사람이 아닌) 알라로부터 전문직이 받는 보상이라고 정의했다.

The Arabian context can be perceived as the blend of culture, traditions, beliefs, and behaviors that are being practiced by nations of Arabian countries in the Middle East, where Arabic is the official language and Islam is the religion of majority of the population. Those behaviors and traditions are not necessarily derived from Islamic doctrines, but some common values have been accepted as the norm among populations of these countries. Although there are differences in ethnic groups, tribes, local cultures, and regional entities, the Arab world is a single, overarching society rather than a collection of several independent states. In Arabian context, Al-Eraky et al. (2014) described the Four Gates model of medical professionalism in the context of Arabian culture that is based on the value of Islam. Eight professional attributes were grouped into four themes which include:

  • (1) dealing with self that includes two attributes of self-awareness (taqwa) and self-management (ehtesab),
  • (2) dealing with tasks that deals with excellence, commitment to professional development, and reflective practice,
  • (3) dealing with others that reflects attributes of respect for patients, colleagues and students, and maintaining professional confidentiality, and
  • (4) dealing with Allah (God), a different stream in the literature that reflects attributes of self-accountability and self-motivation that link with Allah defined it as a reward professionals receive from Allah, not from people.

박스3 일본문화의 관점에서 본 프레임워크
Box 3 Framework from Japanese cultural perspective

니시고리 외 연구진(2014년)은 일본의 문화적 맥락에 대해 "무사의 길"은 전문성에 대응한다는 가치체계라고 표현했다. 이 개념은 사무라이의 고대 무사들로부터 추출된 일본의 개인 행동 규범을 상징한다. 무사도의 틀에서 일곱 가지 주요 덕목은 청렴, 정직, 자애, 공손, 용기, 명예, 충직이다

With respect to Japanese cultural context, Nishigori et al. (2014) described the concept of Bushido as a value system that means, “the way of the warrior,” is corresponding to professionalism. This concept symbolizes a Japanese code of personal conduct extracted from the ancient warriors of Samurai. Seven principal virtues were grouped in the framework of Bushido are

rectitude (gi),
honesty (sei),
benevolence (jin),
politeness (rei),
courage (yu),
honor (meiyo), and
loyalty (chugi).

청렴은 사람이 이성에 따라 흔들림 없이 생각하고, 결정하고, 행동하는 방식을 나타냅니다. 그것은 사무라이의 가장 중요한 속성으로 여겨지는 첫 번째 속성이다. 

용기(氣)는 일본의 틀에 특화된 두 번째 덕목이며, 즉 위험에 직면했을 때 어떻게 서고 걷고 행동하고 적절한 행동을 하는지를 나타내는 용기(氣)의 정신이다.

세 번째 덕목인 자애(진)는 사랑, 동정, 연민의 개념을 결합한다. 그것은 인간의 영혼에서 가장 높은 속성으로 평가된다. 그것은 의학에 의해 "인혜로운 예술로서의 약"으로 번역되어 왔다.

일본인은 병원 직원이나 가족 등 집단의 이익과 요구에 대한 충성심을 중시해 개인의 이익과 요구보다 집단의 요구를 중시한다. 그러므로, 무사도는 가족과 그 구성원의 이익을 결합했다.

Rectitude (gi) represents the way a person thinks, decide, and behave based on reason, without wavering. It is the first attribute considered as the most important attribute of the Samurai.

Courage (yu) is the second virtue which is culture specific to Japanese framework means the spirit of bearing and daring, in other word, how one stands, walks, behaves, and doing the appropriate acts when facing danger.

Benevolence (jin), as a third virtue, combines the concepts of love, sympathy, and pity. It is valued as the highest attribute in the soul of human. It has been translated by medical practice as “medicine as a benevolent art.”

The Japanese have considered loyalty (chu-gi) to the interests and needs of the group such as hospital staff and family, and they place the needs of groups above individual interest and needs. Therefore, Bushido combined the interests of family and its members.

논의
Discussion

이 섹션에서는 먼저 세 가지 프레임워크에 대해 논의한 후 이들 간의 공통점과 차이점에 대해 논의한다.
In this section, we will discuss first the three frameworks followed by discussion of commonalities and differences among them.

중국의 프레임워크는 전문직업성의 개념화에 [자기존엄, 팀워크, 건강증진, 자기관리] 등의 측면에서 새로운 범주의 전문직업성을 추가했다. Pan et al (2013) 프레임워크의 강점은 지명된 그룹 기술(NGT)을 사용하는 다원적 전문가 그룹이 중국뿐만 아니라 다른 아시아 문화에서 의료 프로페셔널리즘의 사회적 문화적 속성을 우선시했다는 것이다.
The Chinese framework added new categories of professionalism in terms of self-dignity, team work, health promotion, and self-management to the conceptualization of professionalism. The strength of Pan et al.’s (2013) framework is that multidisciplinary expert groups using Nominated Group Technique (NGT) prioritized social and cultural attributes of medical professionalism which can benefit health-care providers not only in China but also in other Asian cultures.

아랍 문화에서 4대문 모델은 종교 중심 사회에서는 효과가 있을 수 있지만, 비이슬람 아랍 학생이나 교사, 또는 인도주의적 가치를 가진 기관에서는 효과가 없을 수 있습니다. 4개 게이트 모델은 4개의 논리적 영역(게이트)에서 결합되는 연결된 전문적 품질의 구조적 패턴으로 연결하기 위해 독립형 속성의 짧은 목록으로서 의료 전문성에 대한 고전적 인식에서 변화를 제안한다.
The Four-Gates Model in the Arab culture may work for faith-driven societies, but not for non-Muslim Arab students or teachers, or in institutions with humanistic values. The Four-Gates model suggests a move from the classical perception of medical professionalism as a short list of standalone attributes, to link them in a structural pattern of connected professional qualities as coupled in four logical domains (Gates).

자기 책임(self-accountability)을 사용하는 대신, Al-Eraky et al(2014)는 taqwa라는 용어를 도입했다. 프로페셔널리즘에서, 행동과 그 결과에 대한 의사의 본질적인 감각은 그들이 알라에게 대답할 수 있기 때문이다. 자기 동기부여에 대해서는, 의사들이 교육, 학습, 연구에 최선을 다하고 그 대가로 알라로부터 보상을 기대하는 새로운 ehtesab의 구조가 도입되었다. 흥미롭게도, 4게이트의 관심의 중심은 개인이고, 이는 8가지 속성 중 4가지 속성에서 "자신"의 존재로 나타난다. 의료 전문성은 우선 복잡한 의료 시스템에서 일할 수 있도록 전문가들을 준비시키는 것부터 시작됩니다. 요약하면, 6개의 속성으로 이루어진 마지막 3개의 테마는 각각 서구 문화의 틀과 비슷하지만, 이 아라비아 문화 관점에 대한 연구는 사회적 책무social accountability의 개념을 신의 대한 책무divine accountability과 연결시켰다. 위에서 설명한 바와 같이, 프로페셔널리즘의 보편적 속성은 지역 규범과 신념 체계에 따라 다양한 맥락에서 다르게 해석된다.
Instead of using self-accountability, Al-Eraky et al. (2014) introduced the term taqwa; in professionalism, an intrinsic sense of doctor for action and its consequences because they are answerable to Allah. For self-motivation, a new construct of ehtesab in which doctors perform their best in teaching, learning, and research and in return expect reward from Allah was introduced. Interestingly, the center of attention of the Four-Gates is the individual, which is reflected with the presence of “self” in four out of eight attributes. Medical professionalism starts by preparing professionals – themselves – to work in a complex health-care system. In summary, although the last three themes each consisting of six attributes are similar to frameworks of Western culture, this study on the Arabian cultural perspective linked the concept of social accountability with divine accountability. As indicated above, the universal attributes of professionalism are interpreted differently in various contexts, based on the local norms and belief systems.

일본의 문화에 대해서는 의사 헌장 등 자주 언급되는 서양의 전문 가이드의 특성을 부시도 개념과 비교했다. 그들은 종교, 전통, 미덕의 효과를 포함한 속성들 사이의 유사점과 차이점을 설명했다. 연구진은 일본 문화에서 부시도의 7가지 원칙은 의학 전문성에 적용 가능하며 의사 헌장에 상당하다고 주장했다. 눈에 띄는 차이는 부시도에는 있지만 몇 가지가 '의사 헌장'에는 없다는 것이다. 무사도에는 일반적으로 '사회를 위한 행동 규범'으로 설명되는, '청렴' '용기' '예의' '명예' 등이 있다. 반대로 환자 자율성의 개념은 부시도 체제에서는 누락되어 있지만 서양 문화에서는 높이 평가되고 있다.
In regard to the Japanese culture, the attributes of a frequently referenced professionalism Western guide such as the Physician Charter were compared to the Bushido concept. They described the similarities and differences between the attributes including the effect of religion, traditions, and virtues. The researchers suggested that in Japanese culture Bushido’s seven principles were applicable to medical professionalism and were fairly comparable to Physician Charter (Nishigori et al. 2014). The notable differences pointed out was the omission of several commitments such as rectitude, courage, politeness, and honor in the Physician Charter that are mentioned and discussed in Bushido, as the Charter described medical professionalism, whereas Bushido explained generally as a code of conduct for the society. Prominent of other differences is the concept of patient autonomy of the individual which is omitted in the Bushido framework but is highly regarded in Western culture.

따라서 전문성에 대한 비서구적 관점을 다루는 연구는 의료인의 전문적 속성에 관한 몇 가지 주요 유사점과 차이점을 확인했다. 이러한 유사성과 차이는 다음 섹션에서 자세히 다룰 것이다.
The studies addressing non-Western perspectives on professionalism thus identified several key similarities and differences regarding professional attributes of medical practitioners. These similarities and differences will be addressed in more details in the next sections.

 

서양 이외의 연구에서 인용된 전문성의 공통점
Commonalities of professionalism cited in non-Western studies

이 세 가지 틀은 아랍 문화에 대한 믿음과 중국과 일본 문화에 대한 전통과 같은 문화적 규범에 의해 주도되고 깊이 영향을 받는다. 3개의 기사에서 총 24개의 속성이 식별되었다(표 4). 많은 개념들이 비서양적 문맥을 다루는 연구들 사이에서 비교될 수 있을 뿐만 아니라, 서양 문화와도 매우 유사했다. 예를 들어 이타주의, 정직과 진실성, 존경, 책임, 팀워크, 윤리, 임상 능력, 헌신과 소통, 환자의 권리와 환자의 보호 등이다. 

특히 동양에서 존중respect은 [강한 유대감connectivity]을 가지고 있으며, 가르치는 것뿐만 아니라 의료 환경에서 전문직업성을 실천하는 데에도 영향을 미친다. 이는 서양에서도 마찬가지지만, 현대 서구 사회에서는 교육과 환자 진료에 대한 의미가 다르다. 서양 이외의 사회에서는, 의학 교사와 학생, 그리고 의사와 환자의 직업적인 관계는, 가부장적 접근에 근거하고 있다. 이는 주로 전문직이 결정을 내리는 가부장적 접근에 기반하고 있으며, 서양에서는 더 이상 일반적인 관행으로 여겨지지 않는다. 요약하자면, 요소적 유사성은 전문성의 세 가지 비서구적 프레임워크 모두에서 공통분모이다.

These three frameworks are driven and deeply influenced by cultural norms such as faith in Arab culture and tradition in Chinese and Japanese cultures. A total of 24 attributes were identified from the three articles (Table 4). Many concepts not only were comparable among the studies addressing non-Western context, but also very much comparable to Western culture, such as altruism, honesty and integrity, respect, accountability, teamwork, ethics, clinical competence, commitment and communication, and protection of patient’s rights (Chiu et al. 2010; Adkoli et al. 2011; Ho et al. 2011; Pan et al. 2013; Akhund et al. 2014; Al-Eraky et al. 2014; Nishigori et al. 2014) and patients (Cruess et al. 2010; Chandratilake et al. 2012; Leung et al. 2012; Akhund et al. 2014). Notably, in the Eastern world (Al-Eraky et al. 2014; Nishigori et al. 2014), respect has a strong connectivity and influences not only in teaching but also practicing professionalism in medical settings. This is also true in the Western world, but its meaning for teaching and patient care is different in the contemporary Western society. In the non-Western society, the professional relationship between a medical teacher and a student, and likewise, the doctor and the patient is based on the paternalistic approach where decisions are usually made by professionals (Cruess et al. 2010), which has been abandoned as common practice in the Western world, moving toward shared decision-making. In summary, elemental similarities are common denominators in all three non-Western frameworks of professionalism.

서양 이외의 연구에서 인용된 전문성의 차이
Differences of professionalism cited in non-Western studies

세 가지 비서양 프레임워크에서 기술된 몇 가지 중요한 측면은 서구 프레임워크에서 두드러지게 누락되었다. 앞서 말한 세 개의 틀에 대한 깊은 문화적 영향의 공통점은 또한 각각의 문화가 MP에 반영되는 그들만의 고유한 가치를 가지고 있기 때문에, 그들 사이의 주요한 차이점의 원천이다. 세 개의 틀 사이의 주요한 차이점은 문화, 우선순위 그리고 각 특성에 대한 해석과 관련이 있다. 예를 들어, 9개의 attribute는 3개의 프레임워크에서 공통 또는 공유되지 않습니다.
Several important aspects described in three non-Western frameworks were notably absent from the Western frameworks. The commonalities stated earlier by the deep cultural influence on the three frameworks are also a source of major differences between them due to the fact that each culture has its own unique values that are reflected in MP. The main differences between the three frameworks are related to culture and prioritization as well as interpretation of attributes. For instance, nine attributes are not common or shared by the three frameworks.

Ho et al(2011)이 Zzong 문화 개념에서 도출한 자기 존엄성과 존중Self-dignity and respect 은 Integrity과 동일하다. Al-Eraky et al(2014)은 알라(신)를 다루는 형태로 아라비아 문화의 의료 전문성의 틀에 독특한 차원을 도입했으며, 이 주제 아래 자기 책임(taqwa)과 자기 동기 부여(ehtesab)가 기술되었다. Pan et al(2013)과 Ho et al(2011)의 프레임워크는 특히 건강 증진, 자기 관리, 팀워크 및 전문성 촉진을 위한 경제적 고려사항 등 4가지 추가 주제 측면에서 다른 두 모델과 다르다.

Self-dignity and respect derived from the Zizhong culture concept by Ho et al. (2011) equate with integrity; Al-Eraky et al. (2014) introduced a unique dimension to the framework of medical professionalism in Arabian culture in the form of dealing with Allah (God), and under the umbrella of this theme, self-accountability (taqwa) and self-motivation (ehtesab) were described. Pan et al.’s (2013) and Ho et al.’s (2011) framework differs from the other two models in terms of four additional themes, especially health promotion, self-management, team work, and economic consideration in promoting professionalism.

이 리뷰는 비서방 연구 간의 차이점을 비교하면서 중국, 홍콩, 대만 지역에서 옹호, 형평성, 인본주의 및 경제적 고려의 속성을 발견한 반면 사우디아라비아와 일본의 문화에서는 전문성의 필수적인 속성을 발견했다. 이러한 속성은 의료 전문가 정신의 필수 요소로 간주되지 않는다. 이전 절에서 설명한 이러한 유사점과 차이점은 사회적, 경제적, 문화적 배경과 관련이 있다.
While comparing the differences between the non-Western studies, this review found the attributes of advocacy, equity, humanism, and economic considerations essential attributes of professionalism in the region of China, Hong Kong, and Taiwan whereas in Saudi Arabia and Japan’s culture, these attributes are not considered essential elements of medical professionalism. These similarities and differences described in the previous sections relate to social, economic, and cultural backgrounds.

실제적 의미
Practical implication

또, 이 조사 결과나 문화의 직업적 속성에 대한 영향에 근거해, 아랍 문화에 대한 신앙이나 일본 문화에 있어서의 부시도등의 사회문화적 요소를 배경 변수로 포함시키는, 직업적 속성에 긍정적이든 부정적이든, 확장된 전문성의 틀을 제안할 수 있다. 속성의 우선순위 부여는 각 문화에 대한 중요성을 반영합니다. 제안된 모델은 환자 및 제공자 만족도와 같은 건강 고발자에 대한 전문적인 속성의 결과인 세 번째 수준을 추가하여 완성할 수 있다.
Based on the findings and the effect of culture on professional attributes, the study may propose an extended framework of professionalism to include sociocultural factors as background variables such as faith in Arabic culture and Bushido in Japanese culture; these background factors positively or negatively influence professional attributes. The prioritization of the attributes reflects the importance to each culture. The proposed model may be completed by adding a third level which is the outcome of professional attributes on health indictors such as patient and provider satisfaction as well as better health care.

이 연구는 전문직업성이 맥락적이라는 강력한 증거를 제시하며, 따라서 논리적으로 보자면, 의학 교육에서 전문직업성을 가르치고 평가할 때 [고유한 문화적 요소]를 커리큘럼과 CPD 프로그램에 포함시켜야 할 것이다. 그러나 제안된 확장된 전문성 모델과 다양한 맥락에서 전문성을 가르치고 평가하는 데 미치는 영향을 개발하고 경험적으로 테스트하기 위해서는 추가 연구가 필요합니다.

This study provides strong evidence that professionalism is contextual, and therefore including culture-specific elements in curricula and continuous professional development programs regarding teaching and assessing professionalism in medical education seems a logical consequence. Further research is however needed to develop and empirically test the suggested extended model of professionalism and the impact on teaching and assessing professionalism in different contexts.

 

연구의 한계
Limitations of the study

이 연구의 한계 중 하나는 방법으로서의 서술적 검토의 활용이다. 소수의 연구에 의존하는 이러한 유형의 검토는 발견의 일반화에 영향을 미치는 편향적인 요소를 우주에 가져올 수 있다 29-30. 다만, 개요를 실시하는 모든 스텝에 주의해, 보다 객관적으로 하기 위한 모든 조치를 취했습니다.
One of the limitations of this study is the utilization of narrative review as a method. This type of review which depends on few studies may bring an element of bias which affects generalization of findings to the universe 29-30. However, we took all the measures to make it more objectives by carefully following all the steps of conducting an overview.

결론들
Conclusions


이 서술적 개요는 네 가지 주요 발견을 드러냈습니다. 

첫째, 일본, 아랍권, 중국을 대표하는 알-에라키 외 연구진(2014년), 호 외 연구진(2011년), 판 외 연구진(2013년)의 세 가지 문화 맞춤형 비서구 프레임워크 개발을 시도한 연구는 4개뿐이었다. Pan et al(2013)은 Ho와 관련자들에 의해 개발된 프레임워크를 확장했다. 이러한 연구는 문화 고유의 요소를 출발 지역을 대표하는 의료 전문직업성의 독특한 개념적 프레임워크에서 제공했다. 

둘째, 확인된 세 개의 비서구 프레임워크는 보편적으로 칭찬받는 속성의 공통점을 가지고 있지만, 그것들은 다양한 문화에서 다르게 해석되었다. 예를 들어, Integrity은 중국 유교적 가치에서 Zizhong과 관련이 있는 반면, 자기 동기 부여와 자기 책임성은 아라비아 문맥에서 각각 taqwa와 ehtesab으로 해석되었다. 따라서 그 차이는 속성의 해석과 우선순위 부여에 관한 것이다. 의료 전문가 정신은 상황에 따라 다릅니다. 모든 국가에서 인정받을 수 있는 단일한 프로페셔널리즘의 틀은 없다. 전문직이 무엇에 전념하는지를 이해하고 그 개념을 의대생과 의사의 전문적 정체성 형성에 반영하기 위해서는 문화지향적 전문성 개념이 필요하다. 마지막으로, 저자는 의료에 대한 결과로 이어지는 속성의 배경으로서 문화를 포함하는 확장된 프레임워크를 제안한다.

This narrative overview revealed four major findings.

First, only four studies attempted to develop a three culture-tailored non-Western framework for medical professionalism (Nishigori et al. 2014); Al-Eraky et al. (2014), Ho et al. (2011), and Pan et al. (2013) representing Japan, Arab world, and China, respectively were identified. Pan et al. (2013) extended the framework developed by Ho and associates (Ho et al. 2011). These studies provided culture-specific elements in a unique conceptual framework of medical professionalism representing the region they originated from.

Second, the three identified non-Western frameworks have commonalities of universally praised attributes, but they were interpreted differently in various cultures. For instance, integrity was relevant to Zizhong in Chinese Confucian values, while self-motivation and self-accountability were interpreted as taqwa and ehtesab in Arabian context, respectively. The differences thus concern the interpretation and prioritization of the attributes. Medical professionalism is context-specific. There is no single framework on professionalism that can be globally acknowledged. A culture-oriented concept of professionalism is necessary to understand what the profession is dedicated to and to incorporate the concept into the medical students’ and physicians’ professional identity formation. Finally, the authors propose an extended framework to include culture as background to attributes leading to an outcome on health care.

 


Med Teach. 2017 Apr;39(sup1):S8-S14.

 doi: 10.1080/0142159X.2016.1254740. Epub 2017 Mar 5.

Medical professionalism frameworks across non-Western cultures: A narrative overview

 

1a College of Medicine , King Saud bin Abdulaziz University for Health Sciences , Riyadh , Saudi Arabia.

2b Department of Medical Education , Maastricht University , Maastricht , The Netherlands.

3c Department of Intensive Care Medicines , Maastricht University Medical Centre , Maastricht , The Netherlands.

4d World Health Organization - Eastern Mediterranean Regional Office , Cairo , Egypt.

5e Department of Medical Education , University of Dammam , Dammam , Saudi Arabia.

6f Department of Medical Education , University of Zagazig , Zagazig , Egypt.

PMID: 28417688

DOI: 10.1080/0142159X.2016.1254740

Abstract

Background: Medical professionalism is context-specific, but most literature on professionalism stems from Western countries. This study is about benchmarking of different frameworks on professionalism and interpreting the commonalities and discrepancies of understanding professionalism across different cultures. We need to study the cultural underpinning of medical professionalism to graduate future "global" practitioners who are culturally sensitive enough to recognize differences (and also similarities) of expectations of patients in various contexts.

Aim: This study aims at describing culture specific elements of three identified non-Western frameworks of professionalism, as well as their commonalities and differences.

Method: A narrative overview was carried out of studies that address professionalism in non-Western cultures in the period 2002-2014.

Results: Out of 143 articles on medical professionalism, only four studies provided three structured professionalism frameworks in non-Western contexts. Medical professionalism attributes in non-Western cultures were influenced by cultural values. Out of the 24 identified attributes of professionalism, 3 attributes were shared by the three cultures. Twelve attributes were shared by at least two cultures, and the rest of the attributes were unique to each culture.

Conclusions: The three frameworks provided culture-specific elements in a unique conceptual framework of medical professionalism according to the region they originated from. There is no single framework on professionalism that can be globally acknowledged. A culture-oriented concept of professionalism is necessary to understand what the profession is dedicated to and to incorporate the concept into the medical students' and physicians' professional identity formation.

 

대만 의과대학생의 문화간 전문직업성 딜레마 내러티브: 서양의학과 대만문화의 긴장(Adv Health Sci Educ Theory Pract. 2017)
Taiwanese medical students’ narratives of intercultural professionalism dilemmas: exploring tensions between Western medicine and Taiwanese culture
Ming-Jung Ho1 • Katherine Gosselin1 • Madawa Chandratilake2 • Lynn V. Monrouxe3 • Charlotte E. Rees4

 

서론
Introduction

세계화 시대에 의료 종사자들은 다양한 문화적 배경을 가진 사람들을 치료하고, 일하고, 소통해야 합니다. [문화적 역량]은 양질의 의료 서비스를 제공하는 데 필수적인 것으로 널리 인정되어 왔습니다. 그러나 문화적 역량훈련은 서양 의학 커리큘럼에 포함되었지만, 유사한 훈련은 서양 이외의 의학 교육 맥락에서 아직 관심을 끌지 못하고 있다. 동시에, 세계적인 이주와 그에 수반되는 문화의 흐름에 매료된 기존 의학 교육 문헌은 서양의 맥락에서 '기타' 또는 소수 문화에 초점을 맞추는 경향이 있다. 현재의 문헌은 대만과 같은 비서양 국가에서 서양 의학을 배우는 비서양 학생들이 겪는 도전을 대부분 무시하고 있다.
In an era of globalization, healthcare practitioners must treat, work and communicate with people from diverse cultural backgrounds. Cultural competence has been widely acknowledged as essential to the provision of quality healthcare (Anderson et al. 2003; Betancourt 2006). However, while cultural competence training has been incorporated in Western medical curricula (Betancourt 2003; Brach and Fraser 2000), similar training has yet to gain traction in non-Western medical education contexts. At the same time, enamored with global migration and its attendant flows of culture, existing medical education literature has tended to focus on ‘other’ or minority cultures within Western contexts. Current literature largely ignores the challenges experienced by non-Western students learning Western medicine in non-Western countries, such as Taiwan.

대만의 문화간 전문직업성 딜레마
Intercultural professionalism dilemmas in Taiwan

대만에서는 의대생들이 환자 진료에서 직면하는 문화적 문제를 다룰 준비가 잘 되어 있지 않다는 연구 결과가 나왔다. 비록 짧은 교육 개입이 학생들의 문화-간cross-cultural 커뮤니케이션 기술을 향상시켰지만, 장기간의 유지는 걱정거리이다. 게다가 서구의 틀에 근거한 문화적 역량에 대한 일부 정량적 평가는 대만 문맥에서 유효하지 않거나 신뢰할 수 없는 것으로 판명되어 그 적용성에 의문이 제기되어 왔다. 여전히, 현재 대만에서 문화적 역량에 대한 관념은 [대만 문화에서 서양 의학의 도전]을 간과하고, 소수민족이나 '외국foreign' 문화와의 만남에 초점을 맞추는 경향이 있다. 대만과 같이 서양 이외의 맥락에서 서양 의학을 훈련받은 의대생들에게는 문화 간 딜레마가 더 뚜렷할 수 있다.

In Taiwan, research suggests that medical students are not well prepared to deal with cultural issues encountered in patient care (Lu et al. 2014). Although brief educational interventions have improved students’ cross-cultural communications skills, long-term retention is of concern (Ho et al. 2008, 2010). Moreover, some quantitative assessments of cultural competence based on Western frameworks have been found invalid or unreliable in the Taiwanese context, which has raised the question of their applicability (Ho and Lee 2007). Still, existing notions of cultural competence in Taiwan tend to focus on encounters with minority or ‘foreign’ cultures (Kleinman and Benson 2006), overlooking the challenges of Western medicine in Taiwanese culture. For medical students trained in Western medicine in non-Western contexts, as in Taiwan, intercultural dilemmas may be more pronounced.

문화 및 문화 역량
Culture and cultural competence

  • [문화]는 가치, 규범, 실천, 역할 및 관계에서 나타나는 믿음과 행동의 패턴을 나타내기 위해 사용되는 광범위한 용어입니다.
  • [각 개인]은, 단일 집단의 정체성을 보여주기보다는, 단순한 인종, 민족, 종교를 넘어 문화적 영향을 미치는 독특한 [키메라]입니다(베탕쿠르 2003). 
  • 이것을 확장하면, [문화적 역량]은 다양한 문화적 관행과 신념으로 특징지어지는 대인관계와 맥락에서 효과적으로 작동할 수 있는 능력을 의미한다(베탕쿠르 2006). 이 능력은 또한 '문화 상대주의', '문화 간 효과', '문화적 겸손', 그리고 '초국가적 능력'으로 언급되어 왔다.

Culture is a broad term used to signify patterns of belief and behavior, as manifest in values, norms, practices, roles and relationships (Anderson et al. 2003; Betancourt 2003). Far from denoting a singular group identity, each individual is a unique chimera of cultural influences beyond simply race, ethnicity or religion (Betancourt 2003). By extension, cultural competence implies the ability to operate effectively in interpersonal interactions and contexts characterized by diverse cultural practices and beliefs (Betancourt 2006). This ability has also been referred to as ‘cultural relativism’ (Sobo and Loustaunau 2010), ‘cross-cultural efficacy’ (Núñez 2000), ‘cultural humility’ (Tervalon and Murray-García 1998) and ‘transnational competence’ (Koehn and Swick 2006).

문화적 역량에 대한 이전의 움직임은 학생들에게 문화 간 지식과 기술을 전수하는 것을 추구했는데, 이때 주로 [문화적 고정관념]과 [과도하게 단순화된 문화 간 및 문화 내 이질성]에 의존해왔다. 그러나 문화적 역량에 대한 최근의 접근은 환자를 위한 공감적이고 개인화된 치료를 제공하기 위하여 [문화적 배경을 통합하는 것]으로 옮겨가고 있습니다.

Earlier movements towards cultural competence sought to impart students with cross-cultural knowledge and skills (Kripalani et al. 2006; Altshuler et al. 2003) relying on cultural stereotypes and oversimplifying inter- and intra-cultural heterogeneity (Koehn and Swick 2006; Dreher and Macnaughton 2002). Recent approaches to cultural competence, however, have shifted towards the integration of cultural background in the provision of empathic, individualized care for patients (Tervalon and Murray-García 1998; Koehn and Swick 2006; Dreher and Macnaughton 2002).

문화 간 역량에 대한 이론적 관점
Theoretical perspectives on intercultural competence

많은 학자들이 교육, 학습 및 의료 분야에서 [문화 간 역량intercultural competence]을 탐구해 왔지만, 우리는 특히 관리 연구로부터 문화 간 커뮤니케이션에 이르기까지 프리드먼과 베르토인 안탈의 공헌을 바탕으로 하고 있습니다. 우리가 이 이론을 선택한 것은 행동과학 및 정체성 기반 갈등의 개념을 바탕으로 한, [문화 간 역량]에 대한 [행동지향적 접근법] 때문이다(Friedman and Bertoin Antal 2005). 이 작가들은 [문화적 역량]은 [문화 간 역량]과 다르다고 정의한다. 그들의 관점에 따르면,

  • [문화적 역량]은 문화-간 상호작용에서 미성찰적 행동을 의미한다. 즉, 학습된 [기술, 지식 또는 '다른' 문화에 대한 가정]에 의존하는 것이다.
  • [문화 간 역량]은 '현실 협상negotiating reality'을 수반한다. 이는 높은 옹호와 높은 탐구의 신중한 조합을 통해 상호 문화적 인식과 반성을 창출하는 과정이다. [옹호]란 자신의 문화를 표현하고 대변하는 것이다. [탐구]란 자신과 타인의 문화를 탐구하고 성찰하는 것이다.

While many scholars have explored intercultural competence in teaching and learning and healthcare contexts (Byram 1997; Leininger 1996; Srivastava 2007), we draw specifically on Friedman and Berthoin Antal’s contributions from management studies to cross-cultural communication (Berthoin Antal and Friedman 2008; Friedman and Berthoin Antal 2005, 2006). We chose this theory because of its action-orientated approach to intercultural competence, drawing on concepts of action science and identity-based conflict (Friedman and Berthoin Antal 2005). These authors define cultural competence as differing from intercultural competence (Berthoin Antal and Friedman 2008; Friedman and Berthoin Antal 2005, 2006).

  • In their view, cultural competence denotes non-reflective action in cross-cultural interactions; reliance on a set of learned skills, knowledge or assumptions about ‘other’ cultures. 
  • Intercultural competence, on the other hand, involves ‘negotiating reality’: a process of generating mutual cultural awareness and reflection through a careful combination of high advocacy and high inquiry (Berthoin Antal and Friedman 2008), where advocacy involves expressing and championing one’s own culture and inquiry means exploring and reflecting upon one’s own and others’ cultures (Friedman and Berthoin Antal 2005).

프리드먼과 베르토인 안탈에 따르면,

  • [높은 옹호/낮은 탐구] 접근법에는 타인의 가치를 고려하지 않고 자신의 가치를 장려하는 것이 포함됩니다. 의료 환경에서 드물지 않다. '의료 중심medicocentric' 의료인을 만난다거나, 위계적 의사-환자 관계이다.
  • [낮은 옹호/높은 탐구] 접근법은 자신의 견해를 공유하지 않고, 타인의 견해와 가치를 탐색하는 것을 포함하며, 이는 환자 치료에 잠재적인 해를 끼친다.
  • [낮은 옹호/낮은 탐구] 접근법은 다른 문화와의 만남에서 철수하거나 이탈하는 것으로 해석될 수 있다.
  • [높은 옹호/높은 탐구]은 가장 바람직한 접근법이다. 탐구, 토론 및 상호 이해 정신으로 열린 의견 교환이다.

A high advocacy/low inquiry approach involves exhorting one’s own values without considering those of others—not uncommon in healthcare settings, where one might encounter ‘medicocentric’ practitioners (Campinha-Bacota and Munoz 2001; Pfifferling 1981) and hierarchical provider-patient relationships (Chandratilake et al. 2012).

On the other hand, a low advocacy/high inquiry approach involves exploring the views and values of others without sharing one’s own views, with potential detriment to patient care.

A low advocacy/low inquiry approach can be interpreted as withdrawal or disengagement from a cross-cultural encounter.

The most desirable approach, according to Friedman and Berthoin Antal, is high advocacy/high inquiry: an open exchange of views in the spirit of exploration, discussion and mutual understanding (Berthoin Antal and Friedman 2008; Friedman and Berthoin Antal 2005).

서구의 [크로스 컬쳐 프레임워크]가 대만에 적용될 수 있는지는 의문이지만, 기존의 독자적인 이론 프레임워크가 없기 때문에, 높은 옹호/높은 탐구가 최선이라는 결론을 정해두지는 않되, 프리드먼과 베르토인 안탈의 모델을 휴리스틱 장치로서 사용하였다. [서양의 이론 체계를 사용하지 않는 것]의 대안은 [이론 체계를 전혀 사용하지 않는 것]이었다. 그러나 우리는 [이론이 질적 분석 과정에 엄격함을 가져올 것]이라고 생각했기 때문에, 무-이론 접근법theory-free approach를 따르지 않기로 결정했다(Rees and Monrouxe 2010).

Although the applicability of Western cross-cultural frameworks is questionable in the context of Taiwan, due to a lack of existing indigenous theoretical frameworks, we adopt Friedman and Berthoin Antal’s model as a heuristic device to analyze our data without commiting to their conclusion that high advocacy/high inquiry is ncessarily the best. The alternative to not using a Western theoretical framework was to not use a theoretical framework at all. However, we decided against this theory-free approach as we felt that theory would bring rigour to the qualitative analytic process (Rees and Monrouxe 2010).

 

근거 및 조사 질문
Rationale and research questions

비서양적 맥락에서의 의학 교육이 점점 서구화됨에 따라, 서양의학과 비서양 문화 사이의 단절을 다룰 필요가 있다. 대만에서는 의과대학의 정식 커리큘럼이 서양의 표준(서양의 프로페셔널 코드와 환자의 자율성, 기밀성, 정보에 근거한 동의를 나타내는 커뮤니케이션 모델 등)을 따르고 있지만, 임상 실무의 비공식 및 숨겨진 커리큘럼은 현지 문화에 영향을 받는다. 예를 들어, [가족]은 [환자의 자율성을 훼손할 정도]로 의료 의사결정에 중요한 역할을 한다.
As medical education in non-Western contexts becomes increasingly Westernised, there is a need to address any disconnects between Western medicine and non-Western cultures. In Taiwan, while the formal curriculum in medical schools follows Western standards, including formal teaching and assessment of Western professional codes and communication models articulating patient autonomy, confidentiality and informed consent, the informal and hidden curriculum in clinical practice is affected by local culture. For example, families play important roles in medical decision-making, to the degree of compromising patient autonomy (Ho et al. 2012).

환자 중심의 돌봄, 상호 이해 및 공동 의사결정을 장려하는 기존 문화역량 모델(베탕쿠르 2006)에 따라 대만 학생들의 문화 간 딜레마 내러티브 분석에 '문화 간 역량intercultural competence'이라는 개념을 채택했다. 이 이야기들은 학생들의 [전문직업성 딜레마]에 대한 탐구를 통해 도출되었다: 그들이 목격했거나 참여한 상황들, 그들 자신의 문화적 관점에서 볼 때 부도덕하거나 부적절하거나 프로답지 않다고 생각하는 상황들(Christakis and Pondtner 1993). 의대생들은 문화적 차이를 수반하는 전문성 딜레마에 자주 직면하기 때문에, 문화적 역량을 키우는 것이 학생들의 전문성 학습과 실천에 핵심이다. 따라서 이 백서에서는 다음 두 가지 조사 질문에 대해 설명합니다. 

  • (1) 학생들의 문화 간 전문성 딜레마 이야기에서 대만 문화의 어떤 측면이 강조됩니까? 
  • (2) 이러한 딜레마에 대응하여 대만 의대생들은 어떤 옹호와 질문을 조합하여 이야기합니까?

In line with existing models of cultural competence that encourage patient-centered care, mutual understanding and joint decision-making (Betancourt 2006), we employed the concept of ‘intercultural competence’ (Friedman and Berthoin Antal 2005) in our analysis of Taiwanese students’ intercultural dilemma narratives. These narratives were elicited through an exploration of students’ professionalism dilemmas: situations that they witnessed or participated in, which they believe to be immoral, improper or unprofessional from their own cultural perspective (Christakis and Feudtner 1993). Since medical students frequently encounter professionalism dilemmas involving cultural differences, developing cultural competence is key to students’ learning and practice of professionalism (Ho et al. 2008; Monrouxe and Rees 2012). This paper, therefore, addresses two research questions:

  • (1) Which aspects of Taiwanese culture are highlighted in students’ intercultural professionalism dilemma narratives?
  • (2) Which combinations of advocacy and inquiry do Taiwanese medical students narrate in response to these dilemmas?

방법들
Methods

연구 설계
Study design

이 연구는 대만 의대생들의 전문직업성 딜레마에 대한 이야기를 조사하는 대규모 연구 프로젝트의 일부입니다. 질적 내러티브 인터뷰를 사용하였으며, [지식을 '사회적 상호 작용을 통해 협상되는 것'으로 개념화]하고, [다중적 현실의 존재를 인정]하는 [사회적 구성주의social constructionism]에 의해 뒷받침된다(Crotty 2003). 따라서 우리는 데이터에서 몇 가지 기본적인 정량적 패턴을 확인했음에도 불구하고 이 연구에서 정성적 해석적 접근법을 취한다.
This study is part of a larger research project investigating Taiwanese medical students’ narratives of professionalism dilemmas. It employs qualitative narrative interviewing (Monrouxe and Rees 2012; Monrouxe et al. 2014) and is underpinned by social constructionism, which conceptualizes knowledge as negotiated through social interaction and acknowledges the existence of multiple realities (Crotty 2003). We therefore take a qualitative interpretive approach in this study, despite identifying some basic quantitative patterns in our data (Maxwell 2010).

맥락
Context

대만의 의학교육은 서양의학과 전통 의학을 어느 정도 수용하는 문화적 배경에도 불구하고 서양의학 교육에 기반을 두고 있다. 대만의 의학 학위는 보통 7년이며, 본 학교에서는

  • 4학년 학생들이 일주일에 하루 오후를 신체 검사와 환자력 검사를 배우는 데 소비합니다.
  • 5학년과 6학년 학생은 다양한 임상 부서에서 임상실습을 하며 관찰하고, 환자 진료에 대한 제한된 책임을 맡습니다.
  • 7학년 학생들은 환자 진료에서 직접적이지만 감독된 책임을 지는 인턴으로 활동합니다.

Taiwanese medical education is based on Western medical education (Ho et al. in press), despite the cultural backdrop embracing both Western and traditional medicine to varying degrees (Huang et al. 2014). Taiwanese medical degrees are typically seven years, and in the participating school,

  • year 4 students spend one afternoon per week learning to do physical examinations and take patient histories.
  • Year 5 and 6 students undertake clerkships in different clinical departments, observing and taking on limited responsibilities in patient care. Finally,
  • year 7 students act as interns with direct but supervised responsibilities in patient care.

참가자 모집
Participant recruitment

윤리적 승인에 따라, 우리는 참가자를 모집하기 위해 전자 게시판과 학생회 대표들의 도움을 이용했습니다. 2013-2014년에 대만 의과대학 14개 초점 그룹이 64명의 학생을 대상으로(20~33세, 평균 연령 = 24.5세) 4-7년차에 실시되었다. 초점 그룹에는 4학년 학생 10명(여자 4명, 남자 6명), 5학년 학생 15명(여자 3명, 남자 12명), 6학년 학생 16명(여자 3명, 남자 13명), 7학년 학생 23명(여자 4명, 남자 19명)이 포함됐다.

Following ethical approval, we used electronic bulletin boards and assistance from student association representatives to recruit participants. In total, 14 focus groups at one Taiwanese medical school were conducted with 64 students in 2013–2014 (15 females and 49 males, reflective of the school’s gender ratio) in Years 4–7 (age ranged from 20 to 33, mean age = 24.5). The focus groups included 10 students from Year 4 (4 females, 6 males), 15 students from Year 5 (3 females, 12 males), 16 students from Year 6 (3 females, 13 males), and 23 students from Year 7 (4 females, 19 males).

데이터 수집
Data collection

그룹 전체에서 인터뷰의 일관성을 확보하기 위해 두 명의 저자가 실시한 이전의 연구에 근거한 토론 가이드를 채용했다. 그룹 참가자 집중, 소개 및 기본 규칙 토론에 대한 전반적인 환영을 받은 후, 우리는 오리엔테이션 질문으로 각 그룹 토론을 시작했습니다. [O학년 의대생으로서, 전문직업성에 대해 어떻게 알고 계십니까?] 그런 다음, 참가자들은 그들의 전문성에 대한 정의에 대한 논의를 바탕으로 전문직업성 딜레마에 대해 공유하도록 요구받았다. 문헌에서 [전문직업성 딜레마]는 비윤리적, 비전문가적, 비도덕적 또는 잘못된 사건을 목격하거나 참여하는 학생들의 일상적인 경험으로 정의된다. 전문직업성 딜레마에는 윤리적 딜레마가 포함되지만 이에 국한되지는 않습니다. 학생들의 전문직업성 딜레마가 소진된 후, 우리는 인터뷰를 끝내고, 토론에 중요한 기여를 한 참가자들에게 감사를 표하고, 떠나기 전에 설문지를 작성하도록 요청했습니다. 여기에는 기본 인구통계(예: 연령, 성별)와 교육 관련 세부사항(예: 연구 연도)이 포함되어 표본과 각 하위 그룹의 특성을 정의할 수 있었다.
We employed a discussion guide based on previous studies conducted by two of the authors (Monrouxe and Rees 2012; Monrouxe et al. 2014) in order to ensure consistency in interviewing across the groups. After a general welcome to focus group participants, introductions and a discussion of ground rules, we started each group discussion with an orienting question: “what is your understanding of professionalism as a [state year] medical student?”. Then, participants were asked to share their professionalism dilemmas based on their discussion of their definitions of professionalism. In the literature, professionalism dilemmas are defined as day-to-day experiences of students in which they witness or participate in an event that they find unethical, unprofessional, immoral or wrong (Christakis and Feudtner 1993). Professionalism dilemmas include, but are not limited to, ethical dilemmas. Once students’ professionalism dilemmas were exhausted, we closed the interviews, thanking participants for their important contributions to the discussions and asking them to complete a questionnaire before they left. This included basic demographic (e.g. age, gender) and education-related details (e.g. year of study) so that we could define the characteristics of our sample and each sub-group.

 

데이터 분석
Data analysis

그룹 토론은 오디오 녹음, 문자 변환, 익명화 및 ATLAS.ti 버전 7.5.2에 입력되었습니다. 첫째, 일반화된 대화가 아닌 코딩의 주요 단위로 개인적인 사고 기록(특정 사건의 이야기)을 식별했다. (예: "항상 있는 일입니다…"). 총 233건의 개인적 사건 내러티브가 확인되었다. 이 데이터의 1차 주제 분석은 [프레임워크 분석]의 5단계를 사용하여 수행되었다.

Group discussions were audio-recorded, transcribed, anonymized and entered into ATLAS.ti Version 7.5.2 (Scientific Software Development GmbH, Berlin, Germany). First, we identified personal incident narratives (i.e. stories of specific events) as the primary unit for coding, rather than generalized talk (e.g. “it happens all the time…”). In total, 233 personal incident narratives were identified. A primary thematic analysis of this data was undertaken using the five stages of framework analysis (Ritchie and Spencer 1994):

  1. 1. 모든 저자는 주제와 하위 주제를 식별하기 위해 독립적으로(각각 최소 6개의 대본) 데이터를 숙지했다. 5명의 저자 중 2명은 영국과 호주에서 전문직업성을 위해 이전에 개발된 코딩 프레임워크에 대한 지식을 바탕으로 [연역적인 방식]으로 이를 수행했다. 다른 세 명의 저자는 이 과정을 [귀납적인 방식]으로 수행했다.
    1.
    All authors familiarised themselves with the data independently (at least 6 transcripts each) in order to identify themes and sub-themes. Note that two of five authors did this in a deductive manner based on their knowledge of a previously developed coding framework for professionalism from the UK and Australia (Monrouxe and Rees 2012; Monrouxe et al. 2014). The other three authors engaged in this process in an inductive fashion.
  2. 2. 우리는 서로의 통찰력을 공유하고 상호 합의된 코딩 프레임워크를 개발하기 위해 함께 모였습니다. 학생의 내러티브에서 식별되는 가장 일반적인 주제 중 하나가 [문화간 딜레마]였고, 문화간 딜레마 내러티브의 2차 분석을 실시하기로 결정하였으며, 이 논문의 초점이 되었다. 그런 다음, 우리는 문화간 전문직업성 딜레마에 대한 추가적인 코딩 프레임워크를 개발했고(예를 들어, 학생들은 어떤 유형의 문화 간 딜레마를 경험했는가) 데이터를 코드화하기 위해 프리드먼과 베르토인 안탈(2005)의 옹호와 질문 조합을 사용했다.
    2.
    We came together to share our insights and to develop a mutually-agreed coding framework. As intercultural dilemmas were among the most common themes identified in students’ narratives, we decided at this point to undertake a secondary analysis of intercultural professionalism dilemma narratives, which became the focus of this paper. We then developed an additional coding framework for intercultural professionalism dilemmas (for example, what types of intercultural dilemmas did students experience?) and employed Friedman and Berthoin Antal’s (2005) combinations of advocacy and inquiry, to code the data.
  3. 3. 두 번째 저자는 모든 문화 간 전문지업성 딜레마 내러티브를 코드화하고, 연구 보조자는 코드화를 재확인했다(승인 참조). 이견은 제1저자와의 논의를 통해 해결되었다.
    3.
    The second author coded all intercultural professionalism dilemma narratives and a research assistant double-checked the coding (see acknowledgements). Disagreements were resolved through discussion with the first author.
  4. 4. 데이터를 차트화했다(즉, 주제 내에서 패턴을 탐색했다).
    4.
    The data were charted (i.e., patterns were explored within the themes).
  5. 5. 이 주제들은 프리드먼과 베르토인 안탈(2005)의 이론 체계와 기존 문헌에 비추어 해석되었다.
    5.
    These themes were interpreted in light of Friedman and Berthoin Antal’s (2005) theoretical framework and existing literature.

 

결과.
Results

우리는 109개의 문화 간 딜레마를 확인했는데, 그 중 98개(90%)는 대만 문화 문제를, 10개(9%)는 국제 문화 문제를, 그리고 1개(1%)는 둘 다와 관련된 이야기(Monrouxe와 Rees 2017)를 확인했다.
We identified 109 intercultural dilemmas, 98 (90%) of which referred to one or more Taiwanese cultural issues and 10 (9%) to international cultural issues, as well as one narrative (1%) referring to both (Monrouxe and Rees 2017).

 

학생들의 문화 간 딜레마에서 대만 문화의 어떤 측면이 인용되는가?
Which aspects of Taiwanese culture are cited in students’ intercultural dilemmas?

다음과 같은 대만 문화 주제가 확인되었으며, 여러 주제와 관련된 서술이 일부 확인되었다.

  • (1) 가족 관계 및 역할(n = 37),
  • (2) 지방 정책(n = 33),
  • (3) 말기 의료(n = 15),
  • (4) 한의학(n = 15),
  • (5) 젠더 관계(n = 11)
  • (6) 대만어
  • (7) 기타 문화적 이슈

각 주제와 설명에 대한 설명은 표 1을 참조하십시오.
The following Taiwanese cultural themes were identified, with some narratives involving multiple themes:

  • (1) Family relations and role (n = 37);
  • (2) Local policy (n = 33);
  • (3) End-of-life care (n = 15);
  • (4) Chinese medicine (n = 15);
  • (5) Gender relations (n = 11);
  • (6) Taiwanese language (n = 7); and
  • (7) Other cultural issues (n = 8).

See Table 1 for a description of each theme and illustrative narratives.

 

대만 학생들은 어떤 옹호와 탐구를 조합하여 이야기합니까?
Which combinations of advocacy and inquiry do Taiwanese students narrate?

109개의 문화 간 딜레마 내러티브 중 62개는 옹호/탐구 프레임워크를 적용하기에 대인관계에 대한 충분한 세부사항을 제공했다(정의와 예는 표 2 참조). 이하에, 특정된 옹호와 탐구의 조합의 예를 나타냅니다.
Of the 109 intercultural dilemma narratives, 62 provided sufficient detail about interpersonal interactions to apply the advocacy/inquiry framework (see Table 2 for definitions and examples). Below, we provide examples of the combinations of advocacy and inquiry identified.

 

낮은 옹호/낮은 탐구
Low advocacy/low inquiry

대부분의 학생들의 내러티브는 대만의 문화적 딜레마에 관여하는 것을 꺼리는 것을 반영했다. 흥미롭게도, 학생들은 종종 그러한 경우에 불확실하거나 실망감을 표현했다. 한 7학년 학생은 자기 친적 이야기를 했다. 친척은 폐색전증으로 혈액을 희석하면서 한약을 사용하기 시작했다. 이 학생은 양약과 한약의 조합이 친척의 사망으로 이어졌다고 의심했다.

Most of the students’ narratives reflected their reluctance to engage with Taiwanese cultural dilemmas, though a few observed superiors taking the same approach. Interestingly, students often expressed uncertainty or disappointment in such cases. In a narrative combining end-of-life care, the role of the family and Chinese medicine, a Year 7 student shared that her own relative, while taking blood thinner for a pulmonary embolism, began to use Chinese medicine. The student suspected that the combination of Western and Chinese medicines led to her relative’s death:

대학에서 전통의학 동아리에 가입했는데... 그래서 배웠어요. 인삼과 동콰이 항응고 효과에 대한 연구가 있어요. (Y7F2)
I participated in a traditional medicine club in the university… So I learned… that there… [is] some research about… ginseng and… dong-quai hav[ing an] anticoagulation effect. (Y7F2)

 

하지만 친척이 죽었다는 소식을 듣고 그녀는 관여하지 않기로 결정했다.
Yet, upon hearing of her relative’s death, she chose not to get involved:

가족에게는 설명하지 않았다… 왜냐하면 그 환자의 딸이 아버지가 전통 의학을 찾아야 한다고 제안했기 때문이다… 그들은 전통 의학이 항응고 효과도 있다는 것을 알지 못한다. (Y7F2)
I didn’t explain that to the family… because I think it’s the patient’s daughter that suggest[ed] that… [her] father should seek… traditional medicine… They… don’t know that traditional medicine also include[s] some anticoagulation effect. (Y7F2)

 

그러나 이 학생의 한의학 지식은 흔치 않았다. 서양 생물의학 교육을 받은 대부분의 학생들은 전통의학을 배우는 데 거의 관심을 보이지 않았다. 한 학생은 환자가 한의학을 언급했을 때 더 이상 묻지 않고 이 점을 공유했다.
This student’s familiarity with Chinese medicine was, however, uncommon. Most students, having been trained in Western biomedicine, expressed little interest in learning about traditional medicine. One student shared that, instead of inquiring further when a patient mentioned Chinese medicine:

그냥 적어두지만 독소가 아닌 한 아무도 신경 쓰지 않을 겁니다. (Y5M4)
I just write [it down], but I think nobody cares about that as long as it is not some kind of toxin. (Y5M4)


대만에서는 죽음을 둘러싼 문화적 금기사항 때문에 위독한 환자나 노환자의 가족은 종종 환자와 상의하지 않고 중요한 임종 결정을 내린다. 한 7학년 학생은 가족이 환자에게 자신의 상태를 말하는 대신 혼수상태에 빠질 때까지 기다려 DNR오더를 내린 암 환자의 이야기를 들려주었다. 이 학생은 이러한 방식에 불편함을 표시하며 다음과 같이 말했다.

Due to cultural taboos surrounding death in Taiwan, the families of critically ill and elderly patients often make important end-of-life decisions without consulting patients. A Year 7 student shared the story of a patient with cancer whose family, rather than telling the patient about his condition, waited until he was in a coma to sign a ‘do not resuscitate’ order. The student expressed discomfort with this practice, saying:

하지만 그건 말이 안 돼요. 환자가 소생하지 않는다는 것을 알려야 하는데... 대만 문화, 이런 상황은 정말 흔해요. (Y7M5)
but that doesn’t make sense, because we should let the patient know that he will [not be resuscitated]… but I think in… Taiwanese culture, this situation is really common. (Y7M5)

 

이 학생은 다음과 같은 딜레마에 직면한 의대생들 사이에서 낮은 지지/낮은 질의 응답이 일반적이라고 관찰했다.
The student observed that a low advocacy/low inquiry response is common among medical students faced with this type of dilemma:

몇몇 의대생들은 그런 이상한 상황을 마주하고 싶지 않기 때문에 그냥 물러설 것이다. (Y7M5)
some of the medical students will just withdraw… because they d[o]n’t want to face that strange situation. (Y7M5)

높은 옹호/낮은 탐구
High advocacy/low inquiry

일부 학생들은 높은 옹호/낮은 탐구 방식을 사용하여 자신의 경험을 공유했지만, 대부분은 이 방식을 사용한 상관에 대해 비판적이었다. 예를 들어, 한 5년차 학생은 환자 치료에 가족이 관여하는 사건에 대한 치프 레지던트의 높은 옹호/낮은 탐구 접근법의 비효율성에 주목했다. 환자의 며느리는 [의대생들이 시어머니를 방문하는 것]에 대해 불만을 표시했다.
While some students shared their own experiences using a high advocacy/low inquiry approach, most were critical of their superiors who used this approach. For example, a Year 5 student noted the ineffectiveness of a chief resident’s high advocacy/low inquiry approach in an incident concerning family involvement in patient care. When a patient’s daughter-in-law expressed frustration with the medical students visiting her mother-in-law:

치프 레지던트도 조금 화가 나서 '여기는 교육병원이니 학생들을 거절하면 안 된다'고 말했다. (Y5F3)
the chief resident was also a little bit angry and [told] her, ‘this is the teaching hospital, so you should not decline the students’. (Y5F3)


그러나 이 학생은 치프 레지던트가 종종 대만 가족의 비난을 받는 [며느리에 대한 시댁의 압박]에 대해 알아보기 위해 노력하지 않았다는 것을 인정했다.

The student recognized, however, that the chief resident made no effort to inquire about family pressures on the daughter-in-law, who often bears the brunt of a Taiwanese family’s blame:

우리는 다른 전공의와 다른 치프 레지던트로부터 그녀가 환자의 유일한 간병인이라는 이야기를 들었습니다만, 다른 가족들은 그녀에게 '어머니를 잘 돌봤나요?'라고 질문할 수도 있습니다. 우리 할머니 잘 보살펴드렸니?' 가족들로부터 엄청난 압박감을 받고 있는 것 같아요. 거기엔 그녀 한 명밖에 없어요. (Y5F3)
We’ve heard from other residents and [another] chief resident that she’s the only caregiver of the patient, but the other [family members] may… question her, ‘Did you take good care of my mother? Did you take good care of my grandmother?’ So maybe she’s under great pressure [from] the family, and there’s only one of her. (Y5F3)

한 6학년 학생은 표 2와 같이 한약을 사용하는 환자와의 상호작용에서 '의학중심주의'가 뚜렷한 한 교수를 관찰하였다. 한 5학년 학생은 이 관찰을 반복하면서 다음과 같은 의사를 묘사했다.
A Year 6 student observed a professor whose ‘medicocentrism’ was evident in interactions with patients who used Chinese medicine, as indicated in Table 2. A Year 5 student echoed this observation, describing a doctor who:

한약을 가지고 귀찮게 만들고 싶지 않다. 그래서 그는 그냥 '오, 제발 이 약을 드세요, 한약은 먹지 마세요.'라고 말한다.(Y5M3)
doesn’t want to bother himself [with]… Chinese medicine, so he just say[s], ‘oh come on… please just take this drug, don’t take Chinese medicine’. (Y5M3)

 

학생은 이 접근방식이 다음과 같이 환자에게 해를 끼칠 수 있다고 인식했다.
This approach, the student recognized, may harm the patient, as it:

의사가 처방하는 약의 성질을 설명하지 않기 때문에 환자의 순응도가 좋지 않다. (Y5M3)
results in… bad compliance… because the doctor just simply doesn’t explain what kind[s] of characteristics the drug that he prescribe[s has]. (Y5M3)

높은 옹후/높은 탐구
High advocacy/high inquiry


학생들은 종종 선배의사가 취한 [높은 옹호/높은 탐구 접근법]에 감탄하고, 다른 학생들은 이 접근방식을 성공적으로 사용하는 것을 자랑스럽게 여겼다. 예를 들어 표 1에서 설명한 바와 같이, 이제 많은 대만인들이 만다린어를 구사하여 더 이상 대만어로 의사소통을 할 수 없게 되었다. 일반적으로 짧은 환자와의 만남에서는 언어 능력을 배울 수 없지만, 한 5학년 학생은 자신이 어떻게 대만어를 하는 환자들과 더 잘 소통하고 배울 수 있었는지에 대해 이야기했습니다.

Students often admired the high advocacy/high inquiry approaches taken by their superiors, with others being proud to share their own successful use of this approach. For example, as explained in Table 1, many Taiwanese people speak Mandarin and are no longer able to communicate in Taiwanese. Although language skills cannot typically be learned during brief patient encounters, a Year 5 student related how she was better able to communicate with and learn from Taiwanese-speaking patients:

저는 대만어로 할 수 있는 단어를 제한적으로 사용하려고 합니다. 또한 그들이 자신의 방식으로 이해한 것을 알려주면 더 많은 대만어를 배울 수 있기 때문에 단어를 더 잘 설명할 수 있습니다. 좋아지고 있어요. (Y5F3)
I try to use the limited words I can speak in Taiwanese and when they tell us what they understand in their own way, I can learn more Taiwanese word[s]… so I can use the words [t]o explain better to them so… I’m improving. (Y5F3)

 

환자에게 더 물어봄으로써 그녀는 다음과 같이 할 수 있었다.
By further inquiring of the patient, she could:

그들이 이해하고 있는 것을 확인하고 더 잘 이해할 수 있도록 한다. (Y5F3)
make sure [of] what they understand… and make [a] better understanding. (Y5F3)

 

표 2에서 강조된 바와 같이, 4학년 학생은 가족이나 친구와 한의학에 대해 이야기할 때 공감과 정직으로 응답하면서 높은 지지와 높은 관심을 보였다.
As highlighted in Table 2, a Year 4 student exercised high advocacy/high inquiry when talking about Chinese medicine with family and friends, responding with empathy and honesty.

 

낮은 옹호/높은 탐구
Low advocacy/high inquiry

소수의 학생들은 낮은 옹후/높은 탐구의 접근법에 대한 경험과 관찰을 공유했는데, 그 중 많은 수가 환자에게 치명적인 진단에 대해 알리는 것을 가족이 거절하는 것에 관한 것이었다. 6학년 학생은 환자의 자율성에 대한 신념과 합법성에 대한 우려를 억누르면서 가족의 관점을 존중하는 방법을 공유했습니다.

A few students shared experiences and observations of low advocacy/high inquiry approaches, many of which concerned families’ refusals to inform patients about fatal diagnoses. A Year 6 student shared how he respected a family’s point of view while suppressing his belief in patient autonomy and concerns about legality:

그 가족은 의사에게 아버지에게 아버지의 건강에 대해 말하지 말라고 설득했다. 그들은 그가 행복하게 살기를 원했고 어떤 치료도 거부했다. 하지만 사실 환자의 자율성을 존중하기 위해 환자의 몸에서 무슨 일이 일어나고 있는지 환자에게 알려야 합니다. 하지만 대만에서는 사회적 또는 전통적 가치나 규범 때문에 가족이 결정하는 것을 존중하는 경향이 있습니다. 하지만 그건... 법에 있어요. 말기 환자라도 치료 계획이나 선택지에 대해 말해줘야 하지만 실제로는 쉽지 않다. (Y6M8)
the family sort of lie[d], persuade[d] the doctors… not [to] tell… their father about… his health. They wanted [him] to live happily and… refuse[d] any medical treatment. But actually, in order to respect the patient’s autonomy, we’re supposed to tell the patient about what’s going on in his body. But in Taiwan… perhaps due to… social or traditional value[s] or norms… we tend to… respect what [the] family decide[s]. But it’s… in the law. It sa[ys] even the terminal[ly] ill patient, you have to tell him about the treatment plan or his options… but in practice… [it’s] usually not easy to. (Y6M8)


한편, 표 2에서 강조된 바와 같이, 6학년 학생은 자신의 신념에 관계없이, 말기 치료 시 한약 사용을 존중하는 이유로 환자의 자율성을 들었다. 비슷한 상황에서, 한 7학년 학생은 방문진들이 침과 피를 흘리기 위해 한의사를 방문하는 것을 반대하지 않는 것을 관찰했다.
On the other hand, as highlighted in Table 2, a Year 6 student cited patient autonomy as a reason to respect the use of Chinese medicine during end-of-life care, regardless of her own beliefs. In a similar situation, a Year 7 student observed how a visiting staff did not oppose a visit from a Chinese medicine doctor to administer acupuncture and blood-letting.

 

논의
Discussion

이 연구에서 우리는 대만의 의대생들이 공유하는 [전문직업성 딜레마의 거의 절반]과 [문화간 딜레마의 거의 대부분]이 서양의학과 대만 문화의 긴장을 우려하는 것임을 관찰했다.

  • 첫 번째 조사 질문에서는 대만 문화 간 전문성 딜레마에 대해 가족관계와 역할, 지방정책과 입법, 종말관리와 죽음, 전통의학, 성관계와 규범, 대만어 및 기타 문화적 신념과 실천 등 7가지 주제를 특정했다.
  • 두 번째 연구 질문에 대해,
    • 대부분 낮은 옹호/낮은 탐구 접근법을 언급하였고, 이는 학생들이 대체로 문화 간 딜레마에 빠져나가는 쪽을 선택했다는 것을 시사한다.
    • 흥미롭게도, 학생들은 종종 높은 탐구/높은 옹호로 분류된 경험에 대해 긍정적으로 말하면서,
    • 높은 옹호/낮은 탐구로 분류된 내러티브에서는 종종 윗사람을 비판했습니다.
    • 낮은 옹후/낮은 탐구의 경우, 그들은 종종 불확실성이나 실망감을 표현했다.

In this study we observed that, nearly half of the professionalism dilemmas shared by Taiwanese medical students related to culture and nearly all were intercultural dilemmas, in that they concerned tensions between Western medicine and Taiwanese culture.

  • In terms of our first research question, we identified seven themes for Taiwanese intercultural professionalism dilemmas: family relations and role, local policy and legislation, end-of-life care and death, traditional medicine, gender relations and norms, Taiwanese language and other cultural beliefs and practices.
  • With respect to our second research question, we found that
    • a low advocacy/low inquiry approach was narrated the majority of the time, suggesting that students typically opted out of engagement with intercultural dilemmas.
    • Interestingly, students frequently spoke positively about experiences classified as high inquiry/high advocacy,
    • while they often criticized superiors in narratives categorized as high advocacy/low inquiry.
    • In cases of low advocacy/low inquiry, they often expressed uncertainty or disappointment.

조사결과와 기존 문헌과의 비교
Comparison of findings with existing literature

우리는 영국과 호주에서 학생들의 내러티브를 수집하는 데 사용된 것과 동일한 포커스 그룹 방법론과 내러티브 인터뷰를 사용했다. 이전 연구는 아마도 서양의학을 배우는 서양 맥락의 학생들이 포함되었기 때문에 문화 간 딜레마를 발견하지 못했는데, 이는 학생들이 이러한 문화 간 긴장을 경험할 기회가 적다는 것을 의미했다. 대만 의대생들의 문화 간 딜레마는 부분적으로 [서양적 방식의 의학과 대만적 방식의 수련]으로 설명될 수 있다. 이러한 서구화된 의료 문화는 대만 학생들을 대만의 특정 가치관, 관행, 신념과 충돌시킬 수 있다. 비록 서양의학과 비서양의 문화 사이의 갈등이 비서양의 환경에서 더 뚜렷하게 나타날 수 있지만, 비슷한 도전은 서양의 맥락에서 존재하는 것으로 밝혀졌다.

We employed the same focus group methodology with narrative interviewing as was used to collect student narratives in the UK and Australia (Monrouxe and Rees 2012). However, the previous study did not find intercultural dilemmas, probably because it involved students in a Western context learning Western medicine, which meant fewer opportunities for students to experience such intercultural tensions. The intercultural dilemmas expressed by our Taiwanese medical students may, in part, be explained by the Western style of medicine and medical training in Taiwan. Such Westernised medical culture can set Taiwanese students at odds with certain Taiwanese values, practices and beliefs (Dreher and Macnaughton 2002). Although the conflict between Western medicine and non-Western cultures may be more pronounced in non-Western settings, similar challenges have been found to exist in Western contexts (Westerhaus et al. 2015).

대만에서 대부분의 학생들이 낮은 옹호/낮은 탐구 방식을 통해 [문화 간 딜레마에 관여하지 않기로 선택했다는 것]은, [문화적 지식]만 가지고 있는 것은 부족하다는 것을 보여준다. 학생들의 낮은 지지/낮은 질문 접근법에 대한 의존은 그들의 권위와 경험 부족으로 설명될 수 있으며, 이는 학생들이 민감한 상황에서 결정을 내리는 것을 방해한다. 사실, 대만과 같은 [중등도 위계 사회]에서, 학생의 목소리를 듣고자 하지 않기 때문에, 문화적 갈등과 같은 복잡한 문제를 다루는 것은 보통 윗사람에게 맡겨질 수 있다. 문화 간 역량은 공감 및 개인화된 환자 관리와 관련이 있기 때문에, 아시아 학생들 사이에서 이전에 보고된 낮은 공감 수준이 이탈에 기여했을 수 있다. 또한, 감정적으로 충전된 시나리오(예: 수명 만료 관리)에서는 자신의 감정을 조절하기 위하여 withdraw했을 수도 있다. 대만의 이전 연구에 따르면 완화의료 종사자들은 [환자를 개종하려 들지 말고, 교육하고, 지원하며, 환자 가족과 공공연하게 소통해야 한다는 것]을 인식하고 있습니다. '체면'이 중요한 대만에서는 낮은 옹호/낮은 탐구 접근법이 선호될 수 있으며, 이는 환자가 [부정적인 체면(즉, 원하는 대로 행동할 자유)]을 유지하면서 학생들이 자신과 환자의 [긍정적인 체면(즉, 자기 이미지)]을 유지할 수 있게 해준다.

That most students opted out of engagement with Taiwanese intercultural dilemmas through low advocacy/low inquiry approaches highlights that cultural knowledge alone is insufficient. Students’ reliance on a low advocacy/low inquiry approach might be explained by their lack of authority and experience, which precluded them from taking decisions in sensitive situations. Indeed, students in a moderately hierarchical society like Taiwan (Hofstede n. d.) may leave their superordinates to deal with complex issues like cultural conflicts, as their voices might not be heard (Sidanius and Pratto 1999). As intercultural competence is related to empathy and individualised patient care, the low empathy levels previously reported among Asian students may have contributed to disengagement (Berg et al. 2015). Also, in emotionally charged scenarios (e.g., end-of-life care), students might withdraw in an effort to regulate their own emotions (Gross 1998; Gross and Thompson 2007). Previous research in Taiwan indicates that palliative care workers recognize that they should not proselytize, but educate, support and openly communicate with patients’ families (Hu et al. 2002). In Taiwan, where ‘face’ is important, a low advocacy/low inquiry approach might be preferred, permitting students to maintain their own and the patients’ positive face (i.e., self image) while allowing patients to maintain their negative face (i.e., freedom to act as they wish: Goffman 1967; Johnson et al. 2004).

[높은 옹호/높은 탐구 접근법]은 의미가 명시적이고 직접적으로 표현되는 저맥락 커뮤니케이션 스타일(일반적으로 서양 맥락)에 가장 적합해 보일 수 있지만, 우리의 조사 결과(학생들이 높은 옹호/높은 탐구 내러티브에 대해 긍정적으로 말한 것)는 문화간 역량은 고맥락 의사소통 맥락(일반적으로 아시아 맥락)의 경우에도 효과가 있을 수 있음을 시사한다. 의사와 환자는 고맥락의 커뮤니케이션 환경에서 덜 명확하게 의사소통을 할 수 있지만, 다른 관점을 표현하고 상호 이해를 위해 노력할 수 있는 문화적으로 적절한 방법을 찾을 수 있다.
Although a high advocacy/high inquiry approach might seem best-suited to low context communication styles (typically found in Western contexts), where meanings are expressed explicitly and directly, our findings (that students spoke about high inquiry/high advocacy narratives positively) suggest that intercultural competence might also work in high context communication settings (typically in Asian contexts). Physicians and patients may communicate less explicitly in high context communications settings, but could still find culturally appropriate ways to express differing perspectives and work towards mutual understanding (Gudykunst et al. 1996; Nishimura et al. 2008).

방법론상의 과제와 강점
Methodological challenges and strengths

우리의 연구와 관련하여 많은 방법론적 문제가 있다. 

  • 첫째, 포커스 그룹은 단일 대만 의과대학에서 실시되었으며 다른 기관 학생들의 경험과 관찰을 반영하지 않을 수 있다. 예를 들어, 대만의 몇몇 의과대학 학생들은 중국과 서양 의학을 공부한다. 서양의학과 한의학을 포함한 프로그램을 선택하는 학생들은 이문화간의 전문성 딜레마를 다르게 생각할 수 있다. 
  • 둘째, 이 연구는 대만의 문화 간 딜레마를 검토하기 위한 것이 아니라 지역 문화를 이차 분석의 테마로 파악했다. 즉, 우리는 학생들에게 그들의 내러티브의 문화적 측면에 대한 논리와 반응을 묻지 않았다. 
  • 마지막으로, 프리드먼과 베르토인 안탈이 개발한 프레임워크는 높은 옹호/높은 탐구 접근법을 지지하지만, 이 프레임워크 기저의 가정이 [비서구 문화 환경]에서는 완전히 적용되지 않을 수 있다. 예를 들어, Friedman과 Bertoin Antal은 다국적 기업 구성원 간의 권력 관계가 본 연구에서 설명한 의사-환자 및 교사-학생 상호 작용과 다른 국제 비즈니스 맥락에서 프레임워크를 개발했습니다. 본 연구의 맥락에서, 옹호는 존중이 없는 것으로, 탐구는 무례한 것으로 해석될 수 있는 상황이 있습니다. 따라서 다른 문화적 맥락과 시나리오에서 높은 옹호/높은 질의 접근방식을 신중하게 적용해야 할 수 있다.

There are a number of methodological challenges concerning our study.

  • First, focus groups were conducted at a single Taiwanese medical school and may not reflect the experiences and observations of students at other institutions. For example, students at some medical schools in Taiwan study both Chinese and Western medicine. Students who opt for programs including Western and Chinese medicine might conceptualize intercultural professionalism dilemmas differently.
  • Second, this study did not set out to examine Taiwanese intercultural dilemmas, but instead identified local culture as a theme for secondary analysis, meaning that we did not ask students for their reasoning of and reactions towards the cultural aspects of their narratives.
  • Finally, although Friedman and Berthoin Antal’s Western-developed framework advocates for a high advocacy/high inquiry approach, the assumptions underpinning this framework might not be wholly applicable in non-Western cultural settings. For example, Friedman and Berthoin Antal developed their framework in the context of international business, in which the power relationships among members of multinational corporations differ from the doctor-patient and teacher-student interactions outlined in our study. In the context of our study, there are circumstances in which advocacy might be interpreted as disrespectful, and inquiry as rude. Thus, high advocacy/high inquiry approaches may need to be applied thoughtfully in different cultural contexts and scenarios.

이러한 도전에도 불구하고, 본 논문은 많은 방법론적 강점을 가지고 있다. 

  • 우선, 우리가 아는 한, 우리의 연구는 대만 학생들의 문화 간 딜레마와 이러한 딜레마에 직면한 옹호와 질문의 조합을 고려한 첫 번째 연구이다. 대만 문화는 표면적으로는 환자, 학생 및 의료 전문가를 포괄하지만, 우리는 '외국' 또는 '소수민족' 문화뿐만 아니라, 어떤 맥락에서든 ['내부home' 문화 또한 학생의 학습과 환자 치료에 어떤 challenge가 될 수 있음]을 강조한다. 
  • 둘째, 본 연구는 경영 문헌에서 의학 교육 분야에 이르기까지 유용한 프레임워크인 문화 간 역량을 소개합니다. 상기 경고에도 불구하고, 우리는 문화 간 역량 프레임워크가 문화 간 전문성 딜레마에 접근하는 데 유용한 기초가 될 수 있다고 믿는다.  
  • 마지막으로, 우리는 비서양의 의학 교육 맥락에서 문화적 역량에 대한 기존 연구의 제한된 부분을 추가하지만, 대만의 경험 측면은 문화적 환경 전반에 걸쳐 의학 교육자들에게 공감을 줄 수 있다.

Despite these challenges, our paper has a number of methodological strengths.

  • First, to our knowledge, our study is the first to consider Taiwanese students’ intercultural dilemmas and the combinations of advocacy and inquiry employed in the face of these dilemmas. Though Taiwanese culture ostensibly encompasses patients, students and healthcare professionals, we highlight how ‘home’ cultures—not just ‘foreign’ or minority cultures—can pose challenges to student learning and patient care in any context.
  • Second, our study introduces a useful framework—intercultural competence—from the management literature to the field of medical education. Despite the caveats mentioned above, we believe the intercultural competence framework can serve as a useful basis from which to approach intercultural professionalism dilemmas.
  • Finally, we add to the limited body of existing research on cultural competence in non-Western medical education contexts (Ho et al. 2008; Lu et al. 2014), though aspects of the Taiwanese experience may resonate with medical educators across cultural settings.

 

교육 실무에 미치는 영향
Implications for education practice

대만 학생이 주로 [낮은 옹호/낮은 탐구] 방식을 채택한다는 것은, 이들이 [문화 간 딜레마에 휘말릴 때 직면하는 어려움]이 무엇인지 보여주며, 학생들의 [문화 간 역량 향상]에 더 관심을 기울일 필요가 있음을 시사한다. 이는 이전의 연구가 한편으로는 문화적 차이를 다루지 못하면 불만족스러운 환자, 오진 및 최적의 건강 결과를 초래할 수 있다는 점을 시사하는 것을 고려할 때 매우 중요하다. 한편, 강력한 의사-환자 간 커뮤니케이션은 환자 만족도와 순응도를 향상시키고, 환자 중심의 커뮤니케이션 모델은 환자의 건강을 향상시킵니다. 우리의 연구는 의료 종사자들이 어떤 맥락에서든 문화적 격차를 효과적으로 메울 수 있도록 이해, 교육 및 실천의 전환이 필요하다는 것을 시사합니다.

Taiwanese students’ frequent adoption of a low advocacy/low inquiry approach highlights the challenges faced in engaging with intercultural dilemmas and suggests that attention needs to be paid to developing students’ practices of intercultural competence. This is crucial given that previous research suggests, on the one hand, that failure to address cultural differences can result in dissatisfied patients, misdiagnoses and less optimal health outcomes (Barker 1992; Lavizzo-Mourey and Mackenzie 1996); and, on the other hand, that strong physician-patient communication improves patient satisfaction and compliance (Beckman and Frankel 1984; Betancourt et al. 1999) and patient-centered models of communication can improve patient health (Epstein and Street 2007; Mead and Bower 2002). Our study suggests the potential need for a shift in understanding, teaching and practice towards intercultural competence, so that healthcare practitioners can effectively bridge cultural gaps in any context.

따라서 우리는 교육자가 지역 커뮤니케이션 스타일에 맞게 문화 간 역량에 대한 가르침을 조정하고 문화 간 역량을 언제 사용해야 하는지에 대한 이해를 높일 수 있다고 믿는다. 실제로, [문화간 역량]에 대해서 어떻게 학생들을 교육시킬지를 고려할 때, 우리의 연구결과는 [의료계의 문화]와 [역할모델]이 학생들의 학습과 실천에 중요하다는 것을 보여준다. 일부 학생은 상급자가 모델링한 [높은 옹호/낮은 탐구 접근법]의 부정적인 의미를 인식했으며, 다른 학생들은 'negotiating reality'에 있어 상급자의 능숙함에 감탄했다. 의학 교육자들이 일부 학생들에 의해 부정적인 롤모델로 인식되었다는 사실은 교수개발이 필요함을 보여준다. 공식 커리큘럼은 또한 [지역의 요구]를 반영하기 위해 다시 초점을 맞출 수 있다. 대만의 경우, 일반적으로 접하는 문화 간 딜레마(예를 들어 대만어, 한의학)와 관련된 특정 지식 및 기술(예: 대만어)이 커리큘럼에 포함될 수 있다.

We believe, therefore, that educators could adapt their teaching of intercultural competence to suit local communication styles and foster understanding of when to use intercultural competence. Indeed, in considering how we might educate students for intercultural competence, our findings indicate the importance of medical culture and role modeling to students’ learning and practice. Some students recognized the negative implications of high advocacy/low inquiry approaches role modeled by their superiors, while others expressed admiration for superiors’ adeptness in ‘negotiating reality’. The finding that medical educators were recognized by some students as negative role models warrants further faculty development. Formal curricula could also be refocused to reflect local needs. In the Taiwanese case, certain knowledge and skills related to commonly encountered intercultural dilemmas (e.g., Taiwanese language, Chinese medicine) could be incorporated into the curriculum.

문화 간 역량 육성은 공식 및 숨은 커리큘럼에서 장기적이고 통합된 교육을 필요로 하는 복잡한 노력이 될 것입니다. 학생들이 경험을 쌓을수록, 그들은 프로네시스(즉, 실용적인 지혜)를 실천하고 옹호와 질문의 다른 조합이 특정 환경에 더 적합하다는 것을 발견할 수 있다.

Fostering intercultural competence will be a complex endeavor, requiring long-term and integrated teaching in formal and hidden curricula (Berthoin Antal and Friedman 2008). As students gain experience, they may practice phronesis (i.e. practical wisdom) and find that different combinations of advocacy and inquiry are better suited to particular circumstances (Dowie 2000; Hofmann 2002).

추가 연구에 대한 시사점
Implications for further research

본 연구는 대만 학생들의 문화 간 딜레마의 표면만을 긁어낼 뿐이지만, 다른 비서양의 의과대학에서의 문화 간 및 문화 간 역량 이니셔티브를 조사하고 서양의학과 전통 의학을 배우는 사람들의 견해를 이끌어내기 위해 더 많은 연구가 필요하다. 추가적인 종단적 연구는 학생들이 임상 경험이 쌓이면, [사용하는 옹호/탐구 조합]이 달라지는지 여부를 탐구해야 한다. 추가적인 연구는 또한 프로페셔널리즘 내러티브의 문화적 측면에 대한 학생들의 논리와 반응을 탐구할 수 있다. 그것은 학생들이 이러한 문화적 딜레마를 서술하면서 교차하는 개인과 직업적 정체성을 어떻게 구성하는지 탐구하기 위해 교차성 이론에 기초한 서술적 조사를 사용할 수 있다. 마지막으로, 학생, 교사 및 의료 전문가들이 특정 옹호/문의 접근법을 채택하는 이유와 방법을 이해하기 위해 문화 관련 경험과 관찰에 초점을 맞출 수 있습니다.

While our study only scratches the surface of intercultural dilemmas for Taiwanese students, further research is now needed to investigate cultural and intercultural competence initiatives at other non-Western medical schools and elicit views from those learning both Western and traditional medicine. Additional longitudinal research should explore whether students employ different combinations of advocacy and inquiry as they gain clinical experience. Further research could also explore students’ reasoning of and reactions towards the cultural aspects of professionalism narratives. It could employ narrative inquiry, drawing on intersectionality theory (Tsouroufli et al. 2011; Monrouxe 2015), to explore how students construct their intersecting personal and professional identities while narrating these cultural dilemmas. Finally, additional research could focus explicitly on the culture-related experiences and observations of students, teachers and healthcare professionals, with the aim of understanding why and how they adopt certain advocacy/inquiry approaches.

결론들
Conclusions

우리의 연구결과는 대만의 의대생들 사이에서 문화 간 역량 향상의 필요성을 강조하고 자신의 교육적 맥락에서 문화 간 역량을 육성하고자 하는 의학 교육자들에게 통찰력을 제공한다. 의료 종사자는 다수의 문화적 문제와 일상적으로 마주치는 문제를 협상할 수 있는 기술과 도구를 갖추어야 할 뿐만 아니라 문화적 배경에 관계없이 모든 환자에게 고품질의 개인화된 치료를 제공할 준비가 되어 있어야 합니다. 서양의학과 비서양문화 사이의 유사한 단절을 목격한 글로벌 의학 교육자는 이 연구를 자신의 의료 환경에서 문화 및 문화 간 역량의 교육과 실천을 재고하기 위한 기초로 사용할 수 있다.

Our findings highlight the potential need for improved intercultural competence among Taiwanese medical students and offer insights for medical educators seeking to foster intercultural competence in their own educational contexts. Not only should healthcare practitioners be equipped with the skills and tools to negotiate everyday encounters with majority cultural issues, but they must be prepared to provide high quality, individualized care to any patient, regardless of cultural background. Global medical educators witnessing a similar disconnect between Western medicine and non-Western cultures may use this study as a basis from which to reconsider the teaching and practice of cultural and intercultural competence in their own healthcare settings.

 


 

 

Adv Health Sci Educ Theory Pract. 2017 May;22(2):429-445.

 

 doi: 10.1007/s10459-016-9738-x. Epub 2016 Nov 26.

 

Taiwanese medical students' narratives of intercultural professionalism dilemmas: exploring tensions between Western medicine and Taiwanese culture

Affiliations collapse

Affiliations

1Department of Medical Education & Bioethics, National Taiwan University College of Medicine, Taipei, Taiwan.

2Faculty of Medicine, University of Kelaniya, Ragama, Sri Lanka.

3Chang Gung Medical Education Research Center (CG-MERC), Chang Gung Memorial Hospital, Linkou, Chang Gung Medical Foundation, 5. Fu-Hsing St., Kuei Shan Dist., Taoyuan City, 333, Taiwan, ROC. monrouxe@cgmh.org.tw.

4Faculty of Medicine, Nursing and Health Sciences, Monash University, Clayton, VIC, Australia.

PMID: 27888427

DOI: 10.1007/s10459-016-9738-x

Abstract

In an era of globalization, cultural competence is necessary for the provision of quality healthcare. Although this topic has been well explored in non-Western cultures within Western contexts, the authors explore how Taiwanese medical students trained in Western medicine address intercultural professionalism dilemmas related to tensions between Western medicine and Taiwanese culture. A narrative interview method was employed with 64 Taiwanese medical students to collect narratives of professionalism dilemmas. Noting the prominence of culture in students' narratives, we explored this theme further using secondary analysis, identifying tensions between Western medicine and Taiwanese culture and categorizing students' intercultural professionalism dilemmas according to Friedman and Berthoin Antal's 'intercultural competence' framework: involving combinations of advocacy (i.e., championing one's own culture) and inquiry (i.e., exploring one's own and others' cultures). One or more intercultural dilemmas were identified in nearly half of students' professionalism dilemma narratives. Qualitative themes included: family relations, local policy, end-of-life care, traditional medicine, gender relations and Taiwanese language. Of the 62 narratives with sufficient detail for further analysis, the majority demonstrated the 'suboptimal' low advocacy/low inquiry approach (i.e., withdrawal or inaction), while very few demonstrated the 'ideal' high advocacy/high inquiry approach (i.e., generating mutual understanding, so 'intercultural competence'). Though nearly half of students' professionalism narratives concerned intercultural dilemmas, most narratives represented disengagement from intercultural dilemmas, highlighting a possible need for more attention on intercultural competence training in Taiwan. The advocacy/inquiry framework may help educators to address similar disconnects between Western medicine and non-Western cultures in other contexts.

Keywords: Cultural competence; Culture; Intercultural competence; Intercultural professionalism dilemmas; Professionalism.

보건의료전문직 학생이 경험하는 전문직업성 딜레마: 단면 연구(J Interprof Care. 2020)
Professionalism dilemmas experienced by health professions students: a cross-sectional study
Xin Wanga,b and Ming-Jung Hob,

 

서론
Introduction

의학에서 [전문직업성]은 일반적으로 사회에 의해 의사가 기대하는 행동과 속성으로 정의된다. 전문직업성은 보건 전문가 교육의 핵심 역량이며(Stern, 2006), 환자 중심의 치료와 환자 안전의 중심이다. 보건 전문 교육자들은 전문직업성을 가르치고 평가하는 데 상당한 시간과 자원을 투자하지만 보건 전문직 학생들은 전문직업성 딜레마에 직면했을 때 종종 어려움을 겪습니다.
Professionalism in medicine is commonly defined as the behaviours and attributes expected of a doctor by society (Cruess, Cruess, & Steinert, 2009; Ho, Yu, Hirsh, Huang, & Yang, 2011). Professionalism is a core competency of health professions education (Stern, 2006), and is central to patient-centred care and patient safety (Holtman, Frost, Hammer, McGuinn, & Nunez, 2011). Although health professions educators devote considerable time and resources to teaching and assessing professionalism (Cruess & Cruess, 1997, 2006), health professions students are often challenged when confronted with professionalism dilemmas (Binyamin, 2017; Ho, Gosselin, Chandratilake, Monrouxe, & Rees, 2017; Ho, Lin, Chiu, Lingard, & Ginsburg, 2012; Monrouxe, Chandratilake, Gosselin, Rees, & Ho, 2017).

[전문직업성 딜레마]는 동시에 또는 완전히 충족될 수 없는 상충하는 가치 사이에서 바람직하지 않은 선택을 요구하는 윤리적 충돌상황을 의미한다(Cuban, 2001). 전문직업성 딜레마는 학생들의 직업적 태도와 행동에 부정적인 영향을 미칠 수 있습니다(예: 불충분하고 비지능적이라고 느끼는 것과 같은 감정적인 고통으로 학생들의 학습을 방해합니다). 최근의 연구들은 직장에서의 불안과 불신과 같은 전문직 간 딜레마의 다른 해로운 결과들을 묘사했다.
This refers to conflictual ethical situations that require undesirable choices between competing values that cannot be simultaneously or fully satisfied (Cuban, 2001). Professionalism dilemmas can negatively impact students’ professional attitudes and behaviours (e.g. hinder students’ learning with emotional distress, such as feeling inadequate and unintelligent) (D’eon, Lear, Turner, & Jones, 2007; Satterwhite, Satterwhite, & Enarson, 2000). Recent studies have described other detrimental consequences of interprofessional dilemmas, such as anxiety and mistrust in the workplace (Marshall & Robson, 2005; McKenzie, 2015; Sexon & Orchard, 2016).

전문직업성 딜레마에 대한 학생들의 경험과 관련된 문헌이 증가하고 있지만, 대부분의 연구는 여러 분야에 걸쳐 보건 전문가 학생들을 비교 탐구하기 보다는 하나의 특정 분야에 초점을 맞추고 있습니다. 이 연구는 여러 분야의 보건 전문직 학생들이 경험하는 전문직업성 딜레마를 찾아 비교함으로써 이러한 격차를 해소하는 것을 목표로 한다.
Whilst there is a growing body of literature related to student experiences of professionalism dilemmas, most studies focus on one specific discipline, rather than conducting a comparative exploration of health professions students across disciplines. This study aims to bridge this gap by uncovering and comparing professionalism dilemmas experienced by health professions students from different disciplines.

배경
Background

효과적인 전문직군 간 협력은 환자의 결과 향상과 안전한 작업 환경을 지원합니다(Marshall & Robson, 2005; McKenzie, 2015). 그러나 실증적 조사에 따르면 전문직간 관행interprofessional practice은 갈등과 장벽으로 가득합니다. 연구자들은 효과적인 전문직간 관행을 저해할 수 있는 여러 가지 요인을 확인했습니다. 이러한 요인에는 다른 건강 직업에 대한 고정관념, 의사소통 문제, 불평등한 권력 분배 및 위계적 구조가 포함됩니다.
Effective interprofessional collaboration supports better patient outcomes and safer working environments (Marshall & Robson, 2005; McKenzie, 2015); however, empirical research has shown that interprofessional practice is rife with conflicts and barriers (Hean, Craddock, Hammick, & Hammick, 2012; Khalili, Orchard, Laschinger, & Farah, 2013; Körner et al., 2016; Monrouxe & Rees, 2017). Researchers have identified a number of factors that can inhibit effective interprofessional practice; these factors include stereotypes of other health professions (Hind et al., 2003; MacDonald, Bally, Ferguson, Murray, & Fowler-Kerry, 2010; Rotz & Dueñas, 2016; Tunstall-Pedoe, Rink, & Hilton, 2003), communication problems (Childers, Cole, Lyons, & Turley, 2016), unequal power distributions (Nugus, Greenfield, Travaglia, Westbrook, & Braithwaite, 2010), and hierarchies (Lingard et al., 2012).

게다가, 문헌에서는 점차 보건의료 전문직 학생들의 [이중 정체성 개발]이 미래의 전문직 간 역량의 주요 결정 요소라는 것을 증명했다.
Furthermore, a growing body of literature has demonstrated that health professions students’ development of a dual identity is a principal determinant of future interprofessional competence (Baker, Lee, Martimianakis, & Reeves, 2011; Khalili et al., 2013; Monrouxe & Rees, 2017; Stull & Blue, 2016).

의료 전문가의 [이중 정체성]은 그들의 전문직 정체성과 전문직간 정체성을 뒷받침합니다.

  • [전문직 정체성]은 개인이 전문직 집단(예: 간호사)과 동일시하는 것을 말한다. 이 용어는 그들이 누구인지, 그리고 그들의 직업의 일원으로서 행동하는 것이 무엇을 의미하는지 포착합니다.
  • 한편, [전문직간 정체성]은 보다 넓은 전문가간 그룹(예: 보건 전문가) 내에서 개인의 정체성을 나타내며, 보다 넓은 전문가간 팀의 일부로서 다른 사람들과의 정체성을 나타냅니다. 전문직간 정체성의 개념은 직업적 정체성에 대한 기존의 생각을 단일 직업군을 넘어 확장합니다.

Health professionals’ dual identity underpins their professional identity and interprofessional identity.

  • Professional identity refers to an individual’s identification with their professional group (e.g. nurse). The term captures who they are and what it means to be and to act as a member of their profession (Mackey, 2007; Monrouxe & Rees, 2017; Stull & Blue, 2016).
  • On the other hand, interprofessional identity describes an individual’s identification within a wider interprofessional group (e.g. health professionals), and with others as part of a broader interprofessional team (Monrouxe & Rees, 2017). The concept of interprofessional identity broadens existing ideas of professional identity beyond the singular occupational group.

Kalili의 [전문직 간 사회화 프레임워크]에 따르면 [이중 정체성]이 결여된 전문직은 자신의 전문직 정체성을 유지하기 위해 전문직 간 협업을 거부할 수 있습니다. 대부분의 의료 전문가들은 타인의 역할을 이해하는 능력과 전문가 간 팀의 일원으로서 훈련할 기회를 제한하면서 [학문적 고립disciplinary isolation]을 교육받는다(Hall, 2005). 이번 연구는 서로 다른 보건의료전문직의 학생들이 [이중 정체성]의 관점을 통해 전문직업성 딜레마에 어떻게 직면하는지 조사하기 위해 전문직간 사회화에서 이중 정체성의 이론적 프레임워크를 사용한다.
According to Khalili’s interprofessional socialization framework (Khalili, Orchard, Laschinger, & Farah, 2013), professionals who lack a dual identity may resist interprofessional collaboration in order to maintain their own professional identity. Most health professionals are educated in disciplinary isolation, limiting both their ability to understand others’ roles and opportunities to train as part of an interprofessional team (Hall, 2005). This study uses the theoretical framework of dual identity in interprofessional socialization to examine how students from different health professions face professionalism dilemmas through a dual identity perspective.

의대생들이 임상 환경에서 직면하는 전문직업성 딜레마에 대한 잘 발달된 문헌들이 있다. 이전의 연구들은 간호, 치과, 약국, 직업 치료, 물리 치료 프로그램을 포함한 다양한 보건의료전문직에서 학생들의 직장 기반 딜레마를 조사했다. 그러나, 대부분의 연구는 하나의 전문직에 초점을 맞추고 있으며, 학생들의 전문직업성 딜레마에 대한 삶의 경험을 조사하기 위해 질적인 방법을 사용한 사람은 거의 없다. 보건 분야의 학생들을 연구하기 위해 질적인 방법을 사용한 몇 안 되는 논문들은 여러 분야를 비교하지 않았다.
There is a well-developed body of literature on professionalism dilemmas faced by medical students in clinical settings (Christakis & Feudtner, 1993; Ginsburg & Lingard, 2011; Ho et al., 2017, 2012; Monrouxe et al., 2017; Monrouxe & Rees, 2012; Monrouxe, Rees, Dennis, & Wells, 2015; Monrouxe, Rees, Ho, & Chandratlake, 2017; Monrouxe, Rees, & Hu, 2011; Rees, Monrouxe, & McDonald, 2012). Previous studies have examined students’ workplace-based dilemmas in various health professions, including nursing (e.g. Erdil & Korkmaz, 2009; Gunther, 2011; Park et al., 2003; Rees, Monrouxe, & McDonald, 2015; Solum, Maluwa, & Severinsson, 2012; Yeh, Wu, & Che, 2010), dentistry (Duley, Fitzpatrick, Zomosa, Lamber, & Mitchell, 2009; Green, 1981; Sharp, Kuthy, & Heller, 2005; Wilson & Avers, 2004), pharmacy (Lowenthal1, 1988; Lowenthal2, 1988; Lowenthal, Klein, & Overton, 1986), occupational therapy (Barnitt, 1993; Kinsella, Park, Appiagvei, Chang, & Chow, 2008), and physiotherapy programs (Gedde, Wessel, & Williams, 2004; Mansbach, Bachner, & Melzer, 2010; Mansbach, Melzer, & Bachner, 2012). However, most studies have focused on a single profession, and few have used qualitative methods to examine students’ lived experiences of professionalism dilemmas. The few papers that have used qualitative methods to study health professions students (Monrouxe & Rees, 2017; Monrouxe, Rees, Endacott, & Teman, 2014; Rees et al., 2015) did not compare across disciplines.

[이중 정체성] 관점을 통해 학생들이 겪는 건강 직업의 실제 전문성 딜레마를 조사하는 연구가 부족하다. 본 연구는 질적 방법과 이중 정체성 관점을 활용하여 다른 보건 분야의 학생들이 임상 훈련에서 경험하는 전문성 딜레마를 조사함으로써 이러한 격차를 해소하려고 시도한다. 다음의 연구 질문에 답하는 것을 목적으로 하고 있습니다.

  • 임상 환경에서 여러 건강 전문직 학생들이 경험하는 전문성 딜레마의 유형은 무엇입니까?
  • 다른 분야의 보건 전문직 학생들이 경험하는 전문성 딜레마의 빈도와 유형에는 어떤 차이가 있습니까?

There is a dearth of research investigating the actual professionalism dilemmas health professions students experience through a dual identity perspective. This study attempts to bridge this gap by utilizing qualitative methods and a dual identity perspective to examine professionalism dilemmas experienced in clinical training by students from different health professions. It aims to answer the following research questions:

  • What are the types of professionalism dilemmas experienced by different groups of health professions students in clinical settings?
  • What differences (if any) exist in the frequency and types of professionalism dilemmas experienced by health professions students from different disciplines?

방법들
Methods

리서치 디자인.
Research design

우리는 학생들의 전문직업성 딜레마에 대한 경험을 탐색하고 이해하기 위해 내러티브 탐구narrative inquiry를 사용했다. 서사적 조사는 lived experience 연구에 널리 사용된다(Clandinin, 2006; Connelly & Secretin, 1990). 해석적 해석학과 현상학에 기반을 둔, 그것은 서술(글쓰기, 구두, 시각)을 모으고, 사람들이 자신의 경험에서 기인하는 의미에 초점을 맞추는 질적 방법이며, "인간의 삶의 복잡성에 맞는 통찰력"을 제공하고자 한다(Joselson, 2006, 페이지 4). 윤리적 문제를 강조하고 사람들의 경험에 대한 새로운 이해를 형성할 수 있다(Clandinin & Huber, 2010). 우리는 프로페셔널리즘 딜레마에 대한 생생한 경험을 수집하기 위해 주요 데이터 수집 도구로서 내러티브 인터뷰와 포커스 그룹을 사용했습니다(Monrouxe & Rees, 2012).
We used narrative inquiry to explore and make sense of students’ experiences of professionalism dilemmas. Narrative inquiry is widely used in studies of lived experience (Clandinin, 2006; Connelly & Clandinin, 1990). Grounded in interpretive hermeneutics and phenomenology, it is a qualitative method that gathers narratives (written, oral, visual) and focuses on the meanings that people ascribe to their experiences, seeking to provide “insight that befits the complexity of human lives” (Josselson, 2006, p. 4). It can highlight ethical matters as well as shape new understandings of people’s experiences (Clandinin & Huber, 2010). We used narrative interviews and focus groups as our main data collection tools to gather lived experiences of professionalism dilemmas (Monrouxe & Rees, 2012).

참가자 및 모집
Participants and recruitment

대만 국립대학 의과대학에서 임상경험이 있는 보건계 학생을, 학급 대표나 학과장의 발표, 눈덩이처럼 불어나는 등, 참가시키고 있습니다. 이 연구에는 간호, 치과, 약국, 의료기술, 작업치료, 물리치료 등이 참여했다. 이 연구에 참여할 학생을 모집했는데, 학부 3학년 37명, 대학원 1학년 19명 등 56명이었습니다. 각 분야의 참가자 수는 간호(n = 8), 치과(n = 9), 약국(n = 15), MT(n = 9), OT(n = 6), PT(n = 9)와 같았다(표 1 참조). 연구 표본의 남성 대 여성 성비는 전체 학생 인구의 성비에 가까웠다(표 1 참조).

We invited health professions students with clinical experience from the National Taiwan University College of Medicine to participate through announcements by class representatives and department administrators, and snowballing. Nursing, dentistry, pharmacy, medical technology (MT), occupational therapy (OT), and physiotherapy (PT) students participated in this research. We recruited 56 students to participate in this study, including 37 senior students in the undergraduate program and 19 graduate students in their first year of study. The number of participants from each discipline was as follows: nursing (n = 8), dental (n = 9), pharmacy (n = 15), MT (n = 9), OT (n = 6), and PT (n = 9) (See Table 1). The male to female gender ratio in our study sample was close to that of the overall student population (see Table 1).

일반적으로 학부생보다 임상 경험이 많은 상급생으로 채용을 제한했습니다. 연구 후반기에 몇몇 참가자들은 대학원 첫 학기에 있었다.
We limited our recruitment to undergraduate seniors as they generally have more clinical experience than undergraduate students in other years. At the latter phase of our study, some participants were in their first semester of graduate study.

 

데이터 수집
Data collection

학생을 부문별, 연도별로 그룹화해, 합계 56명(남 24명, 여 32명)의 포커스 그룹을 13개 실시했습니다. 먼저, 우리는 보건 전문직 학생들의 전문직업성과 전문직업성 딜레마에 대한 이해를 조사하기 위해 일반적인 질문을 했다. 그리고 나서, 그들은 그들이 직면했던 전문직업성 딜레마에 대해 설명하도록 요구받았다. 학생들은 그들이 무엇을 하고 왜 그랬는지 포함하여 자유롭고 공개적으로 말하도록 격려받았다. 인터뷰는 모두 중국어로 진행됐다. 대표적인 인용문은 영어로 번역되어 결과 섹션에 제시되어 있습니다.
We grouped students by discipline and year and conducted thirteen focus groups with a sum of 56 students (24 males, 32 females). First, we asked general questions to probe health professions students’ understandings of professionalism and professionalism dilemmas. Then, they were asked to describe a professionalism dilemma that they have encountered. Students were encouraged to speak freely and openly, including what they did and why. All interviews were conducted in Mandarin. Representative quotes have been translated into English and are presented in the Results section.

데이터 분석
Data analysis

평균적으로, 각 그룹 인터뷰는 약 70-90분 동안 지속되었다. 모두 참가자의 동의를 얻어 음성녹음, 녹음, 익명으로 작성되었다. 우리는 Template Analysis(Template Analysis)를 사용하여 인터뷰를 코드화했다(King, 1998). 우리는 이것을 두 가지 이유로 사용했다.

  • 첫째, 미리 정의된 테마를 사용할 때 유연하다.
  • 둘째, 연구자가 데이터를 해석할 때 조정(새로운 코드 추가 또는 관련 없는 코드 삭제 등)할 수 있다(King, 2004; Slade, Haywood, & King, 2009).

On average, each group interview lasted about 70–90 minutes. All were voice-recorded, transcribed, and anonymised with participants’ consent. We coded the interviews using Template Analysis (King, 1998). We used it for two reasons: firstly, it is flexible in terms of using pre-defined themes; secondly, it allows the researcher to make adjustments (such as adding new codes or deleting irrelevant ones) during his/her interpretation of the data (King, 2004; Slade, Haywood, & King, 2009).

분석을 위한 선행 템플릿으로 Monrouxe 등(2014)에 의해 개발된 코딩 프레임워크를 채택했다. 연구원들은 인터뷰 내용을 읽고 NVivo 9 소프트웨어(QSR International Pty Ltd, Doncaster, Victoria, Australia)를 사용하여 이전에 개발된 템플릿에 따라 코드를 작성했습니다. 연구진은 원본 템플릿의 23개 테마를 수정하여 데이터에서 찾을 수 없는 8개의 테마를 제거하고 전문가 간 딜레마 및 인력 부족 딜레마를 포함한 2개의 새로운 테마를 추가하였습니다. 마지막으로, 대화록을 독립적으로 코드화한 두 명의 연구자가 코드화를 함께 검토하고 전체 팀과의 논의를 통해 의견 불일치를 해결했다. 최종 코딩 템플릿에는 17개의 테마가 포함되어 있으며 다음 섹션에서 설명합니다.
We adopted a coding framework developed by Monrouxe et al. (2014) as a priori template for our analysis. Researchers read the interview transcripts and coded them according to the previously developed template using NVivo 9 software (QSR International Pty Ltd., Doncaster, Victoria, Australia). Researchers modified the original template’s 23 themes by removing eight themes not found in our data and adding two new ones, including interprofessional dilemmas and lack of manpower dilemmas. Finally, two researchers who coded the transcripts independently reviewed the coding together and resolved disagreements through discussions with the whole team. Our final coding template includes 17 themes and will be presented in the next section.

우리는 결과를 시각화하기 위해 레이더 차트를 사용했다. 가장 일반적으로 보고된 6개의 테마가 차트에서 주요 범주로 사용되었습니다. 차트의 척도는 백분율 값 범위이며 각 분야의 분포 차이를 강조하기 위해 레이더 차트에 각 주제의 백분율 범위를 투영했다.
We used radar charts to help visualize the results. The six most commonly reported themes were used as main categories in the charts. The scale for the charts is in percentage value range and the percentage coverage of each theme was projected on the radar chart to highlight the distribution differences between each discipline.

 

결과 및 조사 결과
Results and findings

결과는 다음 두 부분으로 나누어져 있습니다.

  • (1) 보건 전문직 학생들이 유형 및 빈도별로 가장 일반적으로 보고하는 전문성 딜레마 
  • (2) 가장 일반적으로 보고된 딜레마의 전체 분포(레이더 차트를 통해 표시됨)와 각 개별 분야에 대한 지배적인 딜레마(있는 경우)의 설명과 함께.

We present the results in two parts:

  • (1) the professionalism dilemmas most commonly reported by health professions students by type and frequency;
  • (2) the overall distribution (represented through radar charts) of the most commonly reported dilemmas and the dominant one(s) (if any) for each individual discipline, along with illustrative narratives.

딜레마의 종류
Types of dilemmas

435개의 개인 사고 내러티브(PIN)가 식별되어 17개 주제 중 하나 이상에 코드화되어 있으며(전체 목록은 표 2 참조), 상위 6개 주제가 가장 일반적으로 보고되고 있습니다(표 3 참조).

Four hundred and thirty-five Personal Incident Narratives (PINs) were identified and coded to one or more than one of the 17 themes (See Table 2 for the full list), and the top six themes are the most commonly reported (See Table 3).

 
 
 
 

[전문직 간 딜레마]는 가장 일반적으로 식별되는 주제였으며 보건직 전반에 걸쳐 존재했습니다. 약학과 학생이 가장 많은 전문직 간 딜레마를 보고했으며, 다음으로 MT, PT, 치과, 간호 및 OT 학생이 그 뒤를 이었다(그림 1 참조).
Interprofessional dilemmas were the most commonly identified theme and existed across health professions. Pharmacy students reported the most interprofessional dilemmas, followed by MT, PT, dental, nursing, and OT students (See Figure 1).

 
 

분야별 딜레마 분포
Distribution of dilemmas by discipline

우리는 분야별로 딜레마 유형과 빈도에 큰 차이가 있음을 발견했다.

  • MT, 약학 및 PT 학생들은 동료와 관련된 딜레마(HCP에 의한 환자 안전과 존엄성 침해, 전문가 간 딜레마, 도전적인 행동과 내부고발에 관한 딜레마)에 직면했다(그림 1 참조).
  • OT 학생들은 특히 환자의 가족(가족이 환자 치료 딜레마에 미치는 영향)에 의해 어려움을 겪었다(그림 1 참조). 
  • 치과 및 간호학과 학생들은 동료와 관련된 딜레마와 동료와 관련이 없는 딜레마를 비슷한 정도로 경험했다고 보고했다(그림 1 참조).

We found significant differences in dilemma type and frequency among different disciplines:

  • MT, Pharmacy and PT students encountered more colleague-related dilemmas (patient safety and dignity breaches by HCPs, interprofessionalism dilemmas, dilemmas about challenging behaviour and whistle-blowing) (see Figure 1);
  • OT students were particularly challenged by patients’ family members (impact of family on patient care dilemma) (see Figure 1).
  • Dental and Nursing students reported experiencing both colleague-related dilemmas and non-colleague-related dilemmas to a similar extent (see Figure 1).

레이더 차트는 차이를 시각화하는 데 도움이 됩니다.

  • [세 가지 동료 관련 주제]가 X축 위에 있다: [HCP에 의한 환자 안전 및 존엄성 침해, 전문직 간 딜레마, 도전적 행동 및 내부고발에 관한 딜레마]
  • [비-동료 관련 주제]는 X축 아래에 있으며, 보건 전문직 학생의 환자 안전 및 존엄성 침해, 가족의 영향 등을 포함한다.환자 치료 딜레마 및 정체성 딜레마에 대해 설명합니다.

Radar charts help to visualize the differences.

  • Three colleague-related themes are located above the X-ray, including patient safety and dignity breaches by HCPs, interprofessionalism dilemmas, dilemmas about challenging behaviour and whistle-blowing;
  • the non-colleague-related themes are placed below, and include patient safety and dignity breaches by health professions students, impact of family on patient care dilemmas, and identity dilemmas.

 

치과의
Dental

결과에서 동료와 무관한 전문성 딜레마의 분포는 치과 학생들에게 동등했다. 동료 관련 딜레마가 전체의 47.5%를 차지했다. 비-동료 관련 딜레마가 52.5%를 차지했다(그림 1 참조). 치과 학생들에게 가장 흔하게 보고된 두 가지 딜레마는 전문가 간 딜레마와 보건 전문가 딜레마에 의한 환자 안전 및 존엄성 침해였다. 예를 들어, 전문성 간 딜레마에 대한 질문을 받았을 때, 한 치과 대학원생이 의사들과 비효율적인 협업 경험을 공유했습니다.

The results show that the distributions of colleague-related and non-colleague-related professionalism dilemmas were equal for dental students. Colleague-related dilemmas accounted for 47.5% of the total; non-colleague-related dilemmas covered 52.5% (see Figure 1). Interprofessionalism dilemmas and patient safety and dignity breaches by health professional dilemmas were the two most commonly reported dilemmas for dental students. For example, when asked about interprofessionalism dilemmas, a graduate dental student shared his experience of an ineffective collaboration with physicians:

"한 번은 상사가 X과 의사의 조언을 구하는 것이 좋다고 해서 그와 이야기를 나누러 간 적이 있습니다. 의사는 동의하지 않았지만 명확한 설명을 해주지 않았고, 나는 그가 어디서 왔는지 이해하지 못했다.(대학원 치과그룹2)
“I remember once, my supervisor said it is better to seek the advice of a physician from X department, so we went to speak to him. The physician disagreed with us, but didn’t give clear explanations, and I didn’t understand where he was coming from.” (Graduate Dental Group 2)

치과 학생과 의사는 같은 환자를 치료했음에도 불구하고 서로의 지식과 기술에 대한 인식이 부족하여 정보 격차가 발생했습니다. 의사는 그의 설명이 치과 학생에게는 충분하지 않다는 것을 깨닫지 못했고 치과 학생은 의사가 왜 동의하지 않는지 이해하지 못했다.

Despite working on the same patient, the dental student and the physician lacked awareness of each other’s type of knowledge and skills, leading to an information gap: the physician didn’t realize that his explanation was not enough for the dental student, and the dental student didn’t understand why the physician disagreed.

동료와 관련이 없는 딜레마에 대해 질문을 받았을 때, 일부 학생들의 서술은 정체성 딜레마에 대한 그들의 경험을 반영했다. 예를 들어, 한 7학년 학생은 다음과 같이 말했습니다.
When asked about non-colleague-related dilemmas, some students’ narratives reflected their experience of identity dilemmas. For example, a Year 7 student said:

"제가 학생인 줄 모르고 치과의사인 줄 알았던 환자들도 있어요. 왜냐하면 그들이 상담 클리닉에 왔을 때 "치과의사에게 진찰을 받을 거예요"라는 말을 듣고 나서 그들을 소개받았기 때문입니다." (6학년 치과 그룹 1)
‘‘Some patients didn’t know I was a student, they thought I was a dentist … because when they came into the consulting clinic, they were told ‘You will be seen by a dentist’, and then I was introduced to them’’ (Year 6 Dental Group 1)

이 학생은 불편함에도 불구하고 자신의 신원에 대한 환자의 오해를 바로잡거나 관여하지 않기로 결정했다.
The student chose not to get involved or correct the patients’ misunderstanding of his identity, despite his discomfort.

약국.
Pharmacy

약대생들은 다른 분야의 학생들보다 [동료와 관련된 딜레마]에 더 많이 직면했다. 39%(n=41)를 커버한 [비동료 관련 딜레마]에 비해, 동료 관련 딜레마는 약학 학생이 보고한 전체 딜레마의 약 61%(n=64)를 차지했다(그림 1 참조). 약대생들은 비효율적인 전문가간 협업의 직접적인 결과로 많은 전문직 간 딜레마가 보고되었습니다. 예를 들어, 한 대학원생이 왜 그 약학 학생이 환자를 위해 다른 검사를 원하는지 이해하지 못한 임상의에게 부당한 대우를 받았던 경험을 공유했다. 임상의의 관점에서 보면, 문제는 이미 해결되었습니다.
Pharmacy students encountered more colleague-related dilemmas than students of any other discipline. Colleague-related dilemmas accounted for approximately 61% (n = 64) of the overall reported dilemmas by pharmacy students, as compared to non-colleague related dilemmas which covered 39% (n = 41) (see Figure 1). A significant number of interprofessionalism dilemmas were reported by pharmacy students as a direct result of ineffective interprofessional collaboration. For example, a graduate student shared his experience of being treated unfairly by a clinician who didn’t understand why the pharmacy student wanted another test for the patient. From the clinician’s point of view, the problem had already been solved:

"몇 가지 처방전 때문에 매우 나쁜 부작용을 가진 환자가 있었는데... 그리고 임상의는 그에게 복용을 중단하라고 요청했습니다. 하지만 정확히 어떤 약이 원인인지 알고 싶었죠... 제가 필요한 건 그 환자의 소변 검사를 통해 확인되는 것이었어요. 그래서 나는 임상의에게 갔지만 그는 약간 짜증이 나서 '왜 이 일에 대해 나에게 잔소리할 필요가 있는가?'라고 말했다. 문제가 해결됐어! 이제 좀 그만하지 않겠어요?' (대학원 약학 그룹 1)
‘‘I had a patient who had very bad side effects because of some prescriptions … And the clinician asked him to stop taking them. But I wanted to know exactly which medicine caused it … All I needed was to have a urine test of that patient to confirm it. So I went to the clinician … but he was … kind of annoyed and said ‘Why do you have to nag me about this? The problem is solved! Can you stop doing this for fun?’’’ (Graduate Pharmacy Group 1)

이 딜레마는 주로 임상의사가 약사와 임상의사 사이의 문제 정의의 차이를 인식하지 못했기 때문에 일어났다(이 경우 임상의사는 부정적인 부작용을 주요 인과 인자로 본 반면 약사는 진짜 문제가 약의 선택에 있다고 느꼈다). 또 다른 약대생은 많은 갈등은 타인의 직업에 대한 인식과 존경의 결여에서 비롯된다는 자신의 신념을 강조하며 끝을 맺었다.

This dilemma was mainly caused by the clinician’s unawareness of differences in problem definitions between pharmacists and clinicians (in this case, the clinician saw negative side effects as the chief causal factor, while the pharmacist felt that the real problem lay in the choice of medicine). Another graduate pharmacy student concluded by emphasizing his belief that many conflicts are caused by a lack of recognition and respect for others’ professions:

"제 생각에 가장 큰 문제는 임상의들이 우리의 역할을 이해하지 못하고 있다는 것입니다. 우리는 임상의들이 무엇을 하는지 알지만, 그들은 우리에 대해 제한된 지식을 가지고 있다. 그래서 우리가 함께 일할 때 그들은 우리에게 무엇을 요구해야 할지 몰랐습니다.그들은 우리가 공동작업에서 어떤 역할을 해야 할지 몰랐습니다.(대학원 약학그룹2)
‘‘I think the big problem is … clinicians don’t understand our roles. We know what clinicians do, but they have limited knowledge about us. So when we were working together, they didn’t know what to ask from us … they didn’t know what kind of role we were supposed to play in collaborative work.’’ (Graduate Pharmacy Group 2)

간호
Nursing

치과 학생들의 경우처럼, 간호학과 학생들은 6가지 주요 주제를 모두 비슷한 비율로 경험했다고 보고했다. 간호학과 학생의 경우, 가장 일반적으로 보고된 딜레마의 55%가 동료와 관련이 있는 반면, 45%는 동료와 관련이 없는 딜레마였다. [동료 관련된 전문성 딜레마]와 [동료 비관련 전문성 딜레마] 사이에는 큰 차이가 없었다. 이 그룹에서 가장 자주 보고된 주제는 HCP에 의한 환자 안전과 존엄성 침해와 관련된 딜레마였다. 예를 들어 간호학과 4학년 학생은 다음과 같이 말했다.

As was the case with dental students, nursing students reported experiencing all six main themes at similar rates. For nursing students, 55% of the overall most commonly reported dilemmas were colleague-related, while 45% were non-colleague-related. There was no significant difference between colleague-related and non-colleague-related professionalism dilemmas. The most frequently reported themes for this group were dilemmas involving patient safety and dignity breaches by HCPs. For example, a Year 4 nursing student stated:

한 직원은 좋은 사람이었지만 사무실에서 환자에 대해 상당히 부적절한 방법으로 불평했다. 그녀가 바빴다는 것은 알지만, 솔직히 말해서 그 환자는 무리하지 않았다. 우리도 결국 그녀처럼 공감을 잃을까?(4년차 간호그룹 1)
‘‘There was one staff member [who] was a nice person, but she complained about her patient in a quite inappropriate way in the office. I understand she has been busy, but that patient [was] not being unreasonable, to be honest … and I wonder if we will eventually lose our empathy just like her. ‘‘ (Year 4 Nursing Group 1)

한편, 많은 간호학과 학생들에 의해서도 전문직 간 딜레마가 보고되었다. 한 4학년 학생은 그녀의 설명을 듣지 않은 의사로부터 "환자를 잘 돌보지 않았다"는 비난을 받았던 경험을 털어놓았다.

Meanwhile, interprofessionalism dilemmas were also reported by many nursing students. A Year 4 student shared her experience of being blamed for “not looking after the patient well” by a physician who did not listen to her explanation:

" 그 환자는 다음날 아침 수술을 받을 예정이었기 때문에 그 전에는 음식이나 음료가 허용되지 않았습니다. 저는 그와 그의 가족들에게 이 사실을 여러 번 상기시켰지만, 그는 (설명서를) 따르지 않고 수술 전에 물을 마셨습니다. 의사는 조금 짜증이 났고, 저를 비난했지만, 아무도 내 설명을 들으려 하지 않았다. 사실 24시간 지켜볼 수 없어요.다른 일이 있어요.(간호그룹 4년차)
“ … because that patient was going to have an operation the next morning, food or drink were not allowed for him before that. I had reminded him and his family members about this, quite a few times … however, he didn’t follow (the instruction) and had some water before the operation. The physician was a bit annoyed, and I was the one blamed, but no one wanted to hear my explanations. The fact is, I can’t watch him 24/7, I have other work to do.” (Year 4 Nursing Group 1)

이 학생은 의사가 자신의 업무량을 알지 못해 화가 나고 화가 났다며 자초지종을 파악하지 못한 채 그녀를 비난했다.
This student said she was upset and angry because the physician was not aware of her workload, and blamed her without seeking to understand the full story.

의료 기술
Medical technology


MT 학생들이 보고한 전문성 딜레마는 대부분 동료와 관련된 것이었다. MT 학생 중 HCP에 의한 환자 안전 및 품위 침해와 관련된 전문성 간 딜레마 및 딜레마가 가장 많이 보고되었습니다. 한 4학년 학생은 자신이 이해하지 못하는 명령을 받고 의사로부터 더 자세한 정보를 찾는다고 말했습니다. 그러나 역할 경계로 인해 '소통 채널 없음'을 사용할 수 없었습니다.

The professionalism dilemmas reported by MT students were mostly colleague-related. Among MT students, interprofessionalism dilemmas and dilemmas related to patient safety and dignity breaches by HCPs were the most frequently reported. A Year 4 student described being given orders that he didn’t understand, and seeking out further details from a physician. However, due to role boundaries, there was ‘no communication channel’ available:

"어떤 순서가 적절하지 않은 것 같습니다. 환자에게 왜 그 모든 검사가 필요한지 모르겠습니다. 의사와 상담하고 싶습니다만, 의사와의 연락 창구는 없습니다. MT는 의사와의 협의가 아니라 의사의 지시를 이행할 의무가 있습니다.(제4년차 MT 그룹 1)
“Some order seems … inappropriate … I don’t see why the patient needed all those tests. I would like to talk to the physician … but there is no communication channel between us … you know, the MT is expected to be under a certain obligation to implement a physician’s orders, not to discuss with them about that.” (Year 4 MT Group 1)

작업 요법
Occupational therapy

OT 학생들이 경험한 딜레마의 분포는 더 큰 차이가 있었다. OT 학생의 경우, 가장 일반적으로 보고된 딜레마의 45%(n = 18)가 환자 치료에 대한 가족의 영향과 관련이 있었다. 일부 OT 학생들은 환자의 가족이 진단이나 치료 과정에 개입하거나 영향을 준 유사한 사건의 경험을 보고했다. 예를 들어, 4년차 OT 학생은 가족 구성원의 주장에 따라 작업 치료 세션을 해야 하는 경우를 보고했습니다.
There was greater variance in the distribution of dilemmas experienced by OT students. For OT students, 45% (n = 18) of the most commonly reported dilemmas were related to the impact of family on patient care. Some OT students reported experiences of similar incidents, wherein the patient’s family intervened or influenced the diagnosis or treatment processes. For example, a Year 4 OT student reported a case in which they were forced to give occupational therapy sessions following the insistence of a family member:

"작업치료에 대한 의욕이 없는 노부인이 있었지만, 그 노부인의 가족은 병원에 있는 동안에는 작업치료를 해야 한다고 주장했다. 우리가 그녀에게 운동을 시키려고 할 때마다, 그녀는 항상 잠든 척했어요. 그래서 우리는 수동적인 운동을 할 수밖에 없었다."(4년차 OT 그룹 2)

‘‘There was an old lady [who] was not motivated for occupational therapy sessions herself, but her family insisted she should do it during her stay in the hospital. Every time we try to get her to do some exercises, she always pretended she was asleep. And so we had no choice but to do passive exercises.’’ (Year 4 OT Group 2)

대만에서는 문화적 차이로 인해 [고령 환자의 가족이 환자를 위해 의료 결정을 내리는 경우]가 많은데, 학생들은 이 관행에 불쾌감을 표시했다.
Due to cultural differences in Taiwan, the families of elderly patients often make medical decisions for the patients; the student expressed discomfort with this practice.

물리치료
Physical therapy

MT나 약학과 학생들처럼 물리치료 학생들도 동료와 관련된 딜레마를 많이 경험했다. PT학생이 가장 많이 경험하는 딜레마의 약 61%를 동료와 관련된 딜레마가 측정되었으며, 비동료와 관련된 딜레마는 38%였다(그림 1 참조). PT 학생의 경우, HCP에 의한 환자 안전과 품위 침해에 관한 딜레마가 가장 높게 나타났으며, 전문직 간 딜레마와 함께 가장 많이 보고된 주제 중 두 가지였다. 예를 들어, 한 4학년 학생은 장비 부족 시 환자 치료에 3대의 기계 대신 1대의 기계만 사용하도록 요구받았습니다.
Like MT and pharmacy students, physical therapy students also experienced a high volume of colleague-related dilemmas. In total, colleague-related dilemmas measured about 61% of the most commonly experienced dilemmas for PT students, and non-colleague-related dilemmas stood at 38% (see Figure 1). For PT students, dilemmas concerning patient safety and dignity breaches by HCPs scored the highest, and, along with interprofessionalism dilemmas, were two of the most reported themes. For example, a Year 4 student described being asked to use only one machine instead of three for a patient’s treatment during an equipment shortage:

환자는 무릎과 허리를 모두 치료해야 했습니다.즉, 동시에 3대의 기계를 사용해야 했습니다. 그 당시에는 모든 환자를 위한 기계가 충분하지 않았던 것 같습니다.그래서 치료 효과가 떨어지더라도 그 환자에게는 1대의 기계만 사용하라는 지시를 받았습니다.(4년차 PT 그룹 1)
“The patient needed treatment on both of his knees as well as his lower back, which means I needed to use three machines at the same time. Apparently, we didn’t have enough machines for all patients at that time … So I was told to use only one machine on that patient (who actually needed three), even though the treatment would be less effective … ” (Year 4 PT Group 1)

또 다른 4학년 학생은 자신의 경험을 전문직 간 딜레마에 대해 공유했습니다.
Another Year 4 student shared his experience with interprofessionalism dilemmas:

예를 들어 무릎이 아픈 환자에게도 같은 진단을 내리기도 했는데, 의사는 우리가 같은 치료를 해주길 기대했습니다. 그러나 우리가 알고 있는 바로는, 평가 결과, 동일하지 않은 것을 알 수 있었고, 환자 중 한 명은 다른 치료가 필요했고, 진단은 정확하지 않았다. 이것은 우리에게 있어서 어려운 상황입니다…그들(의사)에게 어떻게 말을 걸어야 할지 모릅니다」(4년째 PTGroup1)
“For example, sometimes patients with aching knees were given the same diagnosis, and the physician expected us to give them the same treatment. However, after evaluation, according to our knowledge, we found they were not the same, and that one of the patients needed a different treatment, and the diagnosis he received was not accurate. And that is a difficult situation for us … we don’t know how to talk to them (the physicians).” (Year 4 PTGroup1)


같은 그룹의 다른 학생은 상황의 어려움을 더 설명했다.
Another student from the same group further explained the difficulty of the situation:

전문 분야와 직군에 따라 환자의 치료에 대한 의견이 다르면 의사 소통이 어려워집니다. 서로의 지식이나 기술을 잘 모르기 때문만이 아니라 커뮤니케이션 능력도 매우 중요합니다. 우리가 당신의 전문지식을 문제삼는 것이 아니라, 제안을 하고 싶다는 메시지를 전달하는 것이 중요합니다.(제4년차 PT Group1)
“We are from different disciplines and professions, and when we have different opinions towards a patient’s treatment, it is difficult to communicate. Not only because we are not familiar with knowledge and skills held by each other; communication skills are also very important. It is important to deliver the message that we are not challenging their professional knowledge, but rather just want to provide suggestions.” (Year 4 PTGroup1)

치과, 약학, 간호 및 MT 그룹의 학생들과 유사하게, PT 학생들도 비효율적인 의사소통을 경험했다고 보고했습니다. 대만에서는, 많은 학생이, 팀원간의 정보 갭을 만들어, 오해를 불러일으키거나 화가 나거나 하는 등, 경솔하지 않은 경청이나 비효율적인 커뮤니케이션의 악영향을 인식하고 있었다.

Similar to students from Dental, Pharmacy, Nursing, and MT groups, PT students also reported experiencing ineffective communication. In the Taiwanese context, many students recognized the negative influences of non-respectful listening and ineffective communication, such as creating an information gap between team members, causing a misunderstanding and feeling upset or angry.

논의
Discussion

우리의 연구에서 두 가지 중요한 발견이 나왔다. 첫째, [전문직간 딜레마]는 대만 보건 전문직 학생들이 임상 경험 중에 직면하는 가장 흔한 전문직업성 딜레마입니다. 이는 의학에 초점을 맞춘 전문성에 관한 기존 문헌에는 명료하지 않은 새로운 차원이다. 이 연구 결과는 또한 이전에 문서화된 것보다 더 광범위한 전문가 간 딜레마를 포착함으로써 전문성 딜레마 문헌을 확장합니다.

Two significant findings emerged from our study. Firstly, interprofessional dilemmas are the most common professionalism dilemma faced by Taiwanese health professions students during their clinical experience. This is a new dimension not articulated in the existing literature on professionalism, which tends to focus on the medical professions (Tsou, Shih, & Ho, 2015). This finding also expands the professionalism dilemmas literature by capturing a broader array of interprofessional dilemmas than previously documented (Monrouxe et al., 2014; Monrouxe & Ree, 2012; Rees, Monrouxe,Ternan, & Endacott, 2015).

여기에 제시된 프로페셔널 간 딜레마에 대한 학생 내러티브는 Kalili 등의 [전문직 간 협업에서 이중 정체성에 대한 프레임워크]를 뒷받침합니다. 배경 섹션에서 제시된 바와 같이, [단일 전문직군 교육 시스템] 내에서 전문직의 사회화는 [단일 전문적 정체성]을 조장하고, [다른 사람의 역할에 대한 이해]를 제한한다. 이것은 [고정관념, 내그룹 편애, 전문직군 간의 차별적 편견]을 고착화함으로써 전문가 간 협업을 방해한다. 게다가 다른 전문직이 어떻게 문제를 정의하고 접근하고 있는지에 대한 이해가 없는 경우, "같은 것을 보면서도look at, 같은 것을 보지seeing 않는" 경우가 있습니다.
The student narratives of interprofessional dilemmas presented here support Khalili and his colleagues’ framework of dual identity in interprofessional collaboration (Khalili et al., 2013). As presented in the background section, health professional socialization within a uniprofessional educational system fosters a uniprofessional identity and limits health professionals’ understandings of other’s roles. This hinders interprofessional collaboration by entrenching stereotypes, in-group favouritism, and out-group discriminatory bias among professional groups. Furthermore, if interprofessional team members do not have an understanding of how other professions define and approach problems, then they may “look at the same thing without seeing the same thing” (Pertrie, 1976).

우리의 결과에 따르면 대부분의 [전문직 간 딜레마]는 보건의료 전문가들이 [다른 전공을 하는 동료의 역할, 경험 및 전문지식에 대한 인식 부족]으로 인해 발생한다는 것을 보여줍니다. Khalili et al(2013)은 [전문가 간 정체성의 개발]이 학습자 자신의 전문적 역할을 넘어, [협업과 팀워크를 위한 모든 전문적 역할에 대한 공통의 이해]를 갖게 됨으로써, "내-그룹in-group" 관점을 확장하는 데 도움이 된다는 것을 발견했습니다. 우리의 연구결과는 그러한 훈련의 필요성을 강조한다.
Our results indicate that most interprofessional dilemmas are caused by health professionals’ lack of awareness of their extradisciplinary colleagues’ roles, experience, and expertise. Khalili et al. (2013) found that development of interprofessional identity can help to expand ‘‘in-group’’ perspective beyond learners’ own professional roles to a shared understanding of all professional roles for collaboration and teamwork. Our findings underscore the need for such training.

둘째, 우리는 분야마다 다양한 프로페셔널리즘 딜레마의 분포에 직면한다는 것을 증명한다. 이전의 다전문 그룹 연구는 학생들이 직면했던 전문성 딜레마 목록을 만들어냈지만, 이 연구는 연구 결과를 학문적으로 비교하고 딜레마 분포의 차이를 밝혀냄으로써 독자들에게 새로운 관점을 제공한다.
Secondly, we demonstrate that different disciplines encounter distinct distributions of the various professionalism dilemmas. While previous multi-professional group studies produced a list of professionalism dilemmas that students encountered (Monrouxe et al., 2014; Rees et al., 2015), this research offers the reader a new perspective by comparing the findings cross-disciplinarily and revealing differences in dilemma distributions.

예를 들어 치과 의사는 일반적으로 환자 치료에서 독립적으로 일하기 때문에, 치과 학생들은 혼자서 환자를 치료할 때 전문직업성 딜레마에 직면할 가능성이 더 높습니다. OT 학생들은 환자의 대부분이 노인이고 대만에서는 노인의 가족이 의료 결정을 내리는 경우가 많기 때문에 '가족이 환자 치료에 미치는 영향' 딜레마에 직면할 가능성이 높다. 동료와 관련된 딜레마는 MT, 약학, 간호 및 PT 학생의 전문직업성 딜레마 프로필에서 주도적인 위치를 차지하고 있습니다. 이들은 의사 및 기타 HCP의 명령에 따르도록 요구되며, 일부 작업이 지나치게 시간이 많이 소요되거나 까다롭다고 생각되는 경우에도, [위계질서와 역할 경계]로 인하여 순응해야 하는 상황이 만들어진다. 이 결과는 개인 전문가의 행동이 그들이 일하는 사회적 규범과 조직적 맥락에 의해 형성된다는 것을 암시한다.

For example, dental students are more likely to encounter professional dilemmas when treating patients by themselves, as dental practitioners generally work independently in patient treatment (Masella, 2007). OT students are more likely to encounter ‘impact of family on patient care’ dilemmas, as many of their patients are elderly people, and in Taiwan, families of elderly patients often make medical decisions for them. Colleague-related dilemmas occupy a leading position in MT, Pharmacy, Nursing, and PT students’ professionalism dilemmas profile: they are expected to obey orders from physicians and other HCPs, and even if they feel that some tasks are excessively time-consuming or exacting, hierarchies and role boundaries necessitate their compliance. This result suggests that the actions of individual professionals are moulded by the social norms and organizational context(s) in which they work.

시사점
Implications

우리의 연구결과는 실질적인 함의를 담고 있다.
Our findings bear practical implications. 

첫째, [전문직 간 정체성]의 결여가 전문가 간 딜레마의 주요 원인이기 때문에, 보건 전문가 교육은 전문가 간 교육, 즉 '협업과 관리의 질을 개선하기 위해 서로와 배우고, 서로에게서 배우고, 서로에 대해 배우는 것'을 강조함으로써 혜택을 받을 수 있다. 이는 보건 전문직 학생들의 [이중 정체성] 개발을 돕고, 그들 자신의 전문직과 더 큰 전문직 간 관리 팀 모두에 대한 소속감을 형성할 것이다(Monrouxe & Rees, 2017). 보건 전문 교육학은 그들의 실천이 위치한 더 큰 사회 시스템과 제도 구조에 반응해야 한다.
Firstly, since a lack of interprofessional identity is a primary cause of interprofessional dilemmas, health professions education could benefit from greater emphasis on interprofessional education, ‘learning with, from and about each other to improve collaboration and the quality of care’ (Oates, 2016). This will assist health professions students’ development of a dual identity, building a sense of belonging to both their own profession and the larger interprofessional care team (Monrouxe & Rees, 2017). Health professions pedagogy should be responsive to the larger social systems and institutional structures in which their practice is situated (McMurtry, Rohse, & Kilgour, 2016).


둘째, [존중이 결여된 경청과 비효율적인 의사소통]이 전문직 간 딜레마의 주요 요인 중 일부라는 우리의 발견에 대처하기 위해, 보건의료전문직 학생들은 전문직 간 의사소통 기술에 대한 더 많은 훈련을 받아야 한다.

Secondly, to address our findings that non-respectful listening and ineffective communication are some of the primary factors in interprofessional dilemmas, health professions students could benefit from more training in interprofessional communication skills (Carpenter & Dickinson, 2008; Clark, 2006; Oates, 2016).

셋째, 많은 연구 참여자들은 [인터뷰 과정에서 무언가를 배웠다]고 느꼈으며, 커리큘럼에서 비슷한 성찰 연습을 보고 싶다고 털어놓았다. 그들은 프로페셔널리즘의 딜레마 경험을 반영하면 그들 자신의 접근 방식을 비판적으로 검토하고 다른 사람의 관점을 고려할 수 있다고 느꼈다. 그 결과, 그들은 미래의 딜레마에 대처하는 것에 대해 더 자신감을 느꼈다. 이것은, 전문가간 교육에서의 성찰을 지지하는 이전의 출판물을 반향한다.

Thirdly, many participants in our study confided that they felt they had learned from the interview process, and would like to see similar reflection exercises in their curricula. They felt that reflecting on professionalism dilemma experiences enabled them to critically examine their own approaches and to consider others’ perspectives. As a result, they felt more confident about coping with future dilemmas. This echoes previous publications that advocate reflection in interprofessional education (Clark, 2009; Zarezadeh, 2009).

제한 사항
Limitations

연구의 잠재적인 한계를 염두에 두는 것이 중요합니다. 첫째, 대만에서 의대를 한 곳밖에 공부하지 않았기 때문에 우리의 결과가 보편적이라고는 할 수 없습니다. 추가 연구를 통해 이 연구 방법론을 대만 및 다른 나라의 다른 의과대학으로 확대할 수 있다. 둘째, 우리의 샘플 사이즈는 상대적으로 작았다. 우리는 6개의 보건 전문가 학생 그룹에 걸쳐 다른 표본 크기를 가지고 있었다. (간호학과 8명에서 약학과 15명까지) 그 결과, 특정 유형의 딜레마가 과소 보고되거나 과도하게 표현되었을 수 있습니다. 그럼에도 불구하고, 우리는 각 직업에 대해 두 개 이상의 포커스 그룹을 실시했고, 추가 포커스 그룹에서 새로운 테마가 나오지 않은 후에야 모집을 중단했습니다.

It is important to bear in mind potential limitations of our study. Firstly, our results are not necessarily universal, as we studied only one medical school in Taiwan. Further studies could extend this research methodology to other medical schools in Taiwan and other countries. Secondly, our sample sizes were relatively small. We had different sample sizes across the six health professions student groups (from 8 nursing students to 15 pharmacy students). As a result, certain types of dilemmas may have been underreported or overrepresented. Nevertheless, we conducted more than one focus group for each profession and stopped recruiting only after no new themes emerged from additional focus groups.

코멘트를 정리하다
Concluding comments

이 연구는 프로페셔널리즘 딜레마에 대한 우리의 이해를 넓힌다. 우리가 아는 한, 다른 분야의 보건 전문직 학생들의 전문성 딜레마 경험을 질적으로 비교한 것은 처음이다. 그렇게 함으로써 우리는 전문직 간 딜레마가 보건직 학생들에게 직장 내 전문직의 지배적인 딜레마라는 것을 보여줄 수 있었다.
This research broadens our understanding of professionalism dilemmas. To the best of our knowledge, it is the first to compare the professionalism dilemma experiences of health professions students from different disciplines qualitatively. Doing so allowed us to show that interprofessional dilemmas are a dominant workplace professionalism dilemma for health professions students.


딜레마 유형에 대한 유의한 분야 간 차이가 발견되었다. 다른 분야의 보건 전문직 학생들은 다양한 유형의 딜레마에 영향을 받는데, 특히 그러한 학문적 차이 때문이다. 조사 결과, 특정 분야의 보건 전문 교육자는 해당 분야의 학생들이 직면할 가능성이 높은 특정 전문성 과제에 보다 잘 대처할 수 있도록 교육과 학습을 재구성할 것을 권장합니다.

Significant disciplinary differences regarding dilemma types were found. Health professions students of different disciplines are affected by different types of dilemmas, due specifically to those disciplinary differences. As a result of our findings, we recommend that health professions educators of specific disciplines restructure teaching and learning to better address the specific professionalism challenges that are more likely to be faced by their field’s students.

 

 


 

J Interprof Care. May-Jun 2020;34(3):259-268.

 doi: 10.1080/13561820.2019.1649645. Epub 2019 Sep 13.

Professionalism dilemmas experienced by health professions students: a cross-sectional study

Affiliations collapse

Affiliations

1School of Humanities, Jiangnan University, Wuxi, China.

2Department of Medical Education & Bioethics, National Taiwan University College of Medicine, Taipei, Taiwan.

3Center for Innovation and Leadership in Education, Georgetown University Medical Center, NW Washington, DC, USA.

PMID: 31516056

DOI: 10.1080/13561820.2019.1649645

Abstract

Health professions students will invariably confront professionalism dilemmas. These early encounters significantly influence future professional attitudes and behaviours. Heretofore, studies concerning professionalism dilemmas experienced by health professions students across disciplines have been limited. To address this issue, we recruited 56 students with clinical experience from the National Taiwan University College of Medicine in the nursing, dentistry, pharmacy, medical technology, occupational therapy, and physiotherapy programs to participate in this research to compare health professions students' understandings of professionalism and their experiences of professionalism dilemmas. We used group interviews to uncover students' experiences of professionalism dilemmas. We identified the six most commonly reported professionalism dilemmas and found that interprofessional dilemmas were the dominant workplace professionalism dilemma for health professions students. We also identified significant disciplinary differences regarding dilemma types and frequencies. We employed the framework of dual identity development to better understand the role of professional and interprofessional identities in interprofessional dilemmas. The professionalism dilemmas that individual students encountered were shaped by disciplinary differences. Our findings suggest that the development of a sense of belonging to both their own profession and a broader interprofessional care team in health professions students can increase the effectiveness of interprofessional healthcare teams.

Keywords: Professionalism dilemma; interprofessional education; professionalism; qualitative method.

 

성격은 무엇인가? 두 개의 미신과 하나의 정의(New Ideas in Psychology, 2020)
What is personality? Two myths and a definition

Raymond M.Bergner1

 

"어떤 것들은 결코 당연하게 여겨져서는 안 됩니다. 그 중에서도 여러분 분야의 핵심에 있는 말의 정확한 의미입니다."
“Certain things should never be taken for granted, among them … the precise meaning of words that are at the heart of your discipline.”

-N. Angier, 2009, p. D1.

"저는 명확하고 합의된 정의를 사용하는 것이 우리의 학문(성격심리학)을 더욱 재생시키는 하나의 열쇠라고 생각합니다."
“I see the use of clear and consensual definitions as one key to the further regeneration of our discipline (personality psychology).”

-J.D. Mayer, 2007, p. 1.


수년 동안 저는 성격 심리학 수업을 해왔습니다. 그렇게 함으로써, 저는 수업 첫날에 들어와서 학생들에게 다음과 같이 연설했을지도 모릅니다. "성격심리학에 오신 것을 환영합니다. 이번 시간에는 성격이라는 매우 중요한 주제에 대해 알아보겠습니다. 그러나 시작하기 전에 면책 사항disclaimer을 발표해야 합니다. 우리는 성격이 무엇인지 잘 모릅니다. 안타깝게도, 아시다시피, 우리 분야는 '성격'을 어떻게 정의해야 하는지에 대한 의견 일치를 보지 못했습니다. 그래서 본질적으로, 우리는 여러분에게 우리의 주제의 본질을 정확하고 확실하게 말할 수 없습니다. 기본적으로 성격이 무엇인지 말할 수 없습니다. 따라서 절차적으로 이 분야의 다른 권위자들의 이론과 연구 결과를 연구할 때, 우리는 각각의 경우에 대해 제안했다는 개념에 따를 것이다. 비록 서로 다르겠지만, 그 결과는 모두 같은 것, 그러니까 '성격'을 연구한다고 주장하지만, 실제로 다른 것을 공부하고 있을지도 모릅니다. 우리 분야의 몇몇 사람들은 이 문제에 대해 고민하는 것 같지만, 대부분은 그렇지 않습니다.
For many years, I taught a class in the psychology of personality. In doing so, I might have (but never did) walked in on the opening day of class and addressed my students as follows: “Welcome to personality psychology. In this class, we will be investigating the very important topic of human personality. Before we begin, however, I must issue a disclaimer. We're not sure what personality is. Unfortunately, you see, our field has so far come to no consensus in the matter of how to define ‘personality’. So, in essence, we cannot state for you precisely and definitively the nature of our subject matter-- cannot tell you basically what personality is. Procedurally, then, as we study the theories and research findings of different authorities in this area, we will in each case just go along with the conception that each of them has proposed, even though these will differ one from another, and even though the result may be that, although they all claim to be studying the same thing, “personality”, they may actually be studying different things. A few people in our field seem bothered by this problem, but most of us are not.”

현재의 성격 텍스트로 눈을 돌리면, 그 분야의 모든 주요 전문가인 저자들은 방금 언급한 거부권을 발행한다: 성격 심리학 분야는 지금까지 "성격"이라는 용어의 어떤 합의된 정의에도 도달할 수 없었다. 예를 들어

  • Feist, Feist 및 Roberts(2013)는 "모든 성격 이론가들이 하나의 정의를 받아들일 수는 없다"고 주장한다.
  • Mischel, Shoda, and Ayduk (2007)는 "인격이라는 용어는 많은 정의를 가지고 있지만, 보편적으로 받아들여지는 것은 아니다"라고 말하는 반면,
  • Engler (2009)는 "이론가들은 각자 성격이라는 용어의 이해를 우리에게 제시한다"고 주장한다.

전형적으로, 이러한 저자들은 정의적인 문제에 대해 조금 더 논의한 후, 그리고 그들의 주제에 대한 합의된 공식화의 부재가 중요한 문제를 나타낸다고 주장하지 않고, 성격에 대한 다른 이론적 접근법의 발표로 넘어간다. 

If one turns to virtually any current personality text, the authors, all leading experts in the field, issue (if less polemically) the disclaimer just stated: the field of personality psychology has not to date been able to come to any consensus definition of the term “personality”.

Typically, these authors, after little further discussion of definitional matters, and without asserting that the absence of a consensus formulation of their subject matter represents a significant problem, move on to presentations of different theoretical approaches to personality.


이 문서에서 제안하는 성격의 개념화는 이 상황을 해결하기 위한 시도를 나타냅니다. 

  • 이 논문의 파트 1은 과학에서 경험 이전의 개념에 대한 몇 가지 전통적인 기억을 제시한다. 
  • 파트 2는 널리 받아들여지고 있지만 그럼에도 불구하고 성격의 본질에 대해 의문스러운 두 가지 제안을 소개하고 질문한다. 
    • (a) 그 용어가 개인 내부의 근본적인 원인 실체를 가리키는 것. 
    • (b) 성격에 대한 연구는 전체 사람을 위한 연구라고 생각합니다. 
  • 제3부에서는 "개성"의 정의, 이 정의를 상세하게 설명하고 명확히 하는 몇 가지 논의 및 이전의 모든 정의와 다른 방법에 대해 설명합니다. 
  • 제4부에서는 "그래서?"에 대해 설명합니다. 일반적으로 합의된 정의를 갖는 것과 제안된 정의를 수용하는 것 모두 어떤 이점이 있는가? 

The proposed conceptualization of personality in this paper represents an attempt to address this situation.

  • Part 1 of the paper presents some traditional reminders about the pre-empirical status of concepts in science.
  • Part 2 introduces and calls into question two widely accepted but nonetheless questionable propositions about the nature of personality: (a) that the term refers to an underlying causal entity within a person, and (b) that the study of personality is the study of the whole person.
  • Part 3 presents a definition of “personality”, some discussion elaborating and clarifying this definition, and an explication of the ways in which it differs from all previous definitions.
  • Part 4 discusses the “so what?” question: what benefits accrue both to having a consensus definition in general and to acceptance of the proposed definition in particular?

현재의 분석은 비트겐슈타인(1953)의 일반적인 언어 철학에 크게 힘입은 프레임워크인 기술심리학(Descriptive Psychology)의 개념적 프레임워크 내에서 생성되었다. 바라건대, 현재의 빅5와 성격에 대한 다른 특성 접근과 잘 조화를 이루고 그들을 위한 개념적 기초가 될 수 있는 이 공식은 성격 심리학에서 현재의 개념적 혼란을 개선하는 데 도움이 될 것이다. 

The present analysis was generated within the conceptual framework of Descriptive Psychology (Ossorio, 2006; see also; Bergner, 2010; Schwartz, 2019; Shideler, 1988), a framework heavily indebted to the ordinary language philosophy of Wittgenstein (1953). Hopefully, this formulation, one that coordinates well with current Big 5 and other trait approaches to personality, and which might serve as a conceptual underpinning for them, will prove helpful in ameliorating the current conceptual confusion in personality psychology.

1. 개념에 대한 몇 가지 주의사항
1. Some reminders about concepts

내가 동료들에게 정의(및 파라메트릭 분석과 같은 기타 개념적 공식)를 제시할 때, 종종 발생하는 질문은 제시된 공식에 경험적 뒷받침이 있는지 여부이다. 이 질문에 답하면서, 전통적인 과학 관행에서 몇 가지 상기시켜주는 것이 순서입니다. [개념concepts은 이론이 아닙니다]. 이론과 달리, 개념concepts은 경험적 명제로 구성되어 있지 않다. 개념을 정의할 때 정확하거나 부정확할 수 있지만 개념 자체는 참도 거짓도 아닙니다. 예를 들어 "척추동물", "힘" 및 "아이소토프"라는 개념은 참(또는 "검증 가능") 또는 거짓(또는 "falsable")이 아닙니다. 만약 생물학 교수가 "척추동물은 등뼈나 척추를 가진 생물"이라고 말하거나 물리학 교수가 "힘은 신체를 가속시키는 어떤 영향"이라고 말한다면, 우리는 그러한 주장에 대한 경험적 뒷받침이 있었는지 묻지 않을 것이다. 독신남에게 아내가 있는지 없는지를 경험적으로 판단하는 것보다 힘이 신체를 가속시키는 것을 경험적으로 결정하는 실험을 더 이상 하지 않을 것이다.

When I have presented definitions (and other conceptual formulations such as parametric analyses) to colleagues, a question that often arises is that of whether or not the formulation presented has any empirical support behind it. In responding to this question, some reminders from traditional scientific practice are in order. Concepts are not theories. Unlike theories, they are not comprised of empirical propositions. While one might be correct or incorrect in defining a concept, concepts themselves are neither true nor false (Bergner, 2010; Harré & Tissaw, 2005; Ossorio, 1981, 2006; Schwartz, 2019). The concepts “vertebrate”, “force”, and “isotope”, for example, are not true (or “verifiable”) or false (or “falsifiable”). If the biology lecturer states, “A ‘vertebrate’ is a creature that possesses a backbone or spinal column”, or the physics professor states, “A ‘force’ is ‘any influence that causes a body to be accelerated,” we would not ask if there was empirical support for such claims. One would no more do an experiment to empirically determine if forces accelerate bodies than one would to empirically determine whether bachelors have wives.

과학에서 개념의 위치는 오히려 필수불가결한 사전 경험적pre-empirical 요소이다. Lyons(1980)는 개념의 필수불가결성에 대해 언급하면서 그 점을 잘 지적하고 있다. "감정"을 정의할 필요성을 부인했던 동료 감정 연구자에 대해 라이언스는 "어떤 이는 토끼로 간주되는 것에 대해 전혀 알지 못한 채 토끼를 연구하기 위해 돌진하는 것과 같은 상황이 되어야 한다고 말하고 싶다"고 답했다. 예를 들어 물리학자가 먼저 "힘", "역비례성", "점질량"의 개념(경험적으로 확립되지 않은 의미의 규정)을 가지고 있지 않다면, "힘은 두 점 사이의 거리에 반비례한다"는 경험적 주장을 공식화할 수 없었을 것이다. 만약 어떤 경험적 현상을 구별하기 위한 적절한 개념을 먼저 가지고 있지 않다면, 그 현상에 대해 어떤 것을 엄격하게 말하는데 매우 불리할 것이다(예를 들어, 이론을 공식화하거나, 연구 가설을 말하는 것).

The place of concepts in science, rather, is that of being indispensable pre-empirical elements (Bergner, 2010; Harré & Tissaw, 2005; Ossorio, 1981, 2006; Schwartz, 2019). Lyons (1980), in commenting on their indispensability, puts the point well. Objecting to a fellow emotion researcher who had denied the necessity of defining “emotion”, Lyons responded that, “One is tempted to say that the resulting situation must be like that of sallying forth to study rabbits while having no idea of what is to count as a rabbit” (p. xi). If the physicist, for example, did not first have the concepts of “force,” “inverse proportionality”, and “point mass” -- all of which have stipulated, not empirically established, meanings -- he or she could not even have formulated, much less tested, the empirical claim that “a force is inversely proportional to the distance between two point masses?” If one did not first have an adequate concept for distinguishing any empirical phenomenon, one would be at great disadvantage in saying anything rigorously (e.g., formulating a theory or stating a research hypothesis) about that phenomenon.


[정의](용어의 올바른 적용을 위해 필요하고 충분한 조건의 사양)는 물론 정확/부정확 하나 적절/부적절 할 수 있다. 역사적으로, 과학에서, 정의에 대해서 제기되는 적정성의 기준은 다음과 같은 것이다. 

  • 첫째, 그리고 특히 오랜 공통 사용 역사를 가진 개념에 관해, 그 정의는 직관적으로 받아들여질 수 있는가, 아니면 우리의 언어적 직관에 위배되는가? 후자의 예로는 "나는 '사랑'을 상호 강화로 정의한다" 또는 "나는 '정신적 질환'을 자기 나라의 정부 당국에 대한 불복종으로 정의한다"와 같은 말이 있을 것이다. 
  • 둘째, 그것들이 유용한가? 예를 들어, 역사적으로, 뉴턴의 "힘"과 "질량"의 개념에 대한 새로운 공식은 그의 만유인력 이론의 창조에 필수적이었다. 

Definitions -- specifications of the necessary and sufficient conditions for correct application of a term (Gupta, 2015; Ossorio, 1981, 2006) -- can of course be correct or incorrect, and more or less adequate. Historically, in science, the criteria of adequacy to be posed of them, very different in nature than those for theories, are ones such as the following.

  • First, and especially with respect to concepts with a long history of common usage, is the definition intuitively acceptable, or does it so violate our linguistic intuitions that language seems to be used anarchically (Ossorio, 19812006)? Examples of the latter might occur were I to say such things as, “I define ‘love’ as mutual reinforcement”, or “I define ‘mental disorder’ as disobedience to the governmental authorities in one's country”.
  • Second, are they useful (Ossorio, 19812006)? Historically, for example, Newton's novel formulations of the concepts of “force” and “mass” were indispensable to the creation of his theory of universal gravitation (Gleick, 2003). 

따라서, 이 기사에서 제안하는 성격의 정의와 성격 문헌의 모든 경쟁자들은 [직관적인 수용성]과 [유용성]이라는 기준을 적절히 갖추고 있다.
Thus, the standards that the definition of personality proposed in this article, as well as all of its competitors in the personality literature, are appropriately held to are those regarding their intuitive acceptability and their usefulness.

2. 성격에 관한 두 가지 신화
2. Two myths about personality

2.1. 신화 #1: "인격"이란 근본 원인 실체를 말한다.
2.1. Myth #1: The term “personality” refers to an underlying causal entity

많은 사람들은, [성격]은 전체 또는 부분적으로 행동의 기초가 되고 영향의 원인으로 그것과 관련된 어떤 실체(예: 구조 또는 메커니즘)로 보인다. 예를 들어, 아마도 가장 유명하고 여전히 널리 인용되는 정의에서,

  • Allport(1961)는 성격은 "한 사람의 특징적인 행동과 사고를 결정하는 정신-물리 시스템의 개인 내의 역동적인 조직"이라고 말했다.
  • 보다 최근에, 라센과 버스(2017)는 성격을 "개인의 심리적 특징과 메커니즘의 집합으로, 조직화되어있고, 비교적 지속적이며, 정신 내, 신체적, 사회적 환경과의 상호작용과 적응에 영향을 미치는 것"으로 개념화했다.
  • Funder(2016)는 부분적으로 인과관계를 나타내는 공식에서 성격은 "개인의 생각, 감정, 행동의 특징적인 패턴을 지칭하며refer, 이것이 모여서 그 패턴 뒤의 (숨겨지거나 숨겨지지 않은) 심리적 메커니즘을 만드는 것"고 주장한다.

On many accounts, personality is seen, in whole or in part, as some entity (e.g., a structure or mechanism) that underlies behavior and is related to it as cause to effect. For example, in perhaps the most famous and still widely cited (e.g., Funder, 2016, p. 340) definition,

  • Allport (1961) stated that personality is “the dynamic organization within the individual of those psycho-physical systems that determine his characteristic behavior and thought” (p. 28).
  • More recently, Larsen and Buss (2017) conceptualized personality as “the set of psychological traits and mechanisms within the individual that are organized and relatively enduring and that influence his or her interactions with, and adaptations to, the intrapsychic, physical, and social environments” (p. 4).
  • Finally, Funder (2016), in a partially causal formulation, contends that personality “refers to a person's characteristic patterns of thought, emotion, and behavior, together with the psychological mechanisms -- hidden or not -- behind these patterns” (p. 5).

이 관점의 문제점. 이 관점의 가장 큰 어려움은 직관적인 [수용가능성]에 관한 것입니다. 이러한 우려는 다음 가설에서 포착되었습니다. Jill을 잘 아는 Jack은 어느 날 Susie에게 Jill을 "주장스럽다assertive"고 표현합니다. 수지는 잭에게 그 성격 용어를 사용할 때, [그녀가 자주 하는 방식으로 행동하게 만드는 메커니즘이나 구조, 정신-신체 체계와 같은 질 내부의 무언가]를 말하는 것이냐고 묻습니다. 잭의 답변은 이렇다.

  • "아뇨, 저는 그녀가 이렇게 행동하게 될 수 있는 내부 메커니즘이나 구조, 시스템을 말하는 것이 아닙니다. 내가 그런 걸 어떻게 알아요? 제 말은 질은 다른 사람과의 관계에서 자신의 권리와 욕구를 표현하고 강하게 추구하는 경향이 있다는 것입니다. 저는 오랫동안 그녀가 이것을 꽤 꾸준히 하는 것을 봐왔고, 제가 볼 때, 그녀는 연극을 하지 않았고, 아무도 그녀에게 강요하거나 돈을 주거나 그녀의 의사에 반해서 이런 행동을 하도록 영향을 주지 않았기 때문에, 그것은 단지 그녀의 개인적인 성향인 것 같습니다. 그게 바로 그 용어입니다. 

Problems with this view. The central difficulty with this view concerns its intuitive acceptability. This concern is captured in the following hypothetical. Jack, who knows Jill very well, one day describes her to Susie as “assertive”. Susie asks Jack if in using that personality term he is referring to an inner something within Jill -- for example, a mechanism or structure or psycho-physical system -- that is causing her to behave in the way that she often does. Jack replies:

  • “No, I'm not referring to an inner mechanism or structure or system that might be causing her to behave this way. How would I even know about such a thing? I mean only that Jill is a person who tends to express and to pursue strongly her personal rights and desires in her relationships with others. I have observed her doing this pretty consistently for a long time and, as far as I can see, she is not play-acting and no one is forcing her, paying her, or in any other way influencing her to behave this way against her will, so it seems like it is just her own personal inclination. That's what I mean by the term.”

여기서 잭은 "민속" 또는 "보통 언어" 개념으로 여겨지는 것을 제시하고 있다; 나의 궁극적인 공식은 그의 것과 모든 면에서 동일하지는 않지만, 직관적인 수용성의 기준은 내가 그것에서 너무 멀리 벗어나지 않도록 요구한다. (NB: Jack이 Jill의 성격 특성에 대해 [동료 평가]를 할 경우, 이것이 그가 채택할 개념이라는 것을 알 수 있습니다. 만약 연구자가 사람 내면의 "정신-신체psycho-physical 시스템"과 같은 다른 것을 측정하고 있다고 믿는다면, 이는 잘못된 것이다.)

Here, Jack is giving what would be considered a “folk” or an “ordinary language” conception; while my ultimate formulation will not be identical in every particular with his, the criterion of intuitive acceptability requires that I not stray too far from it. (NB: It might be noted that, if Jack were to do a peer rating of Jill's personality traits in the context of a research study, this is the conception he would be employing. If the researcher believed that he or she was measuring something else such as an inner “psycho-physical system”, this would be mistaken.)

잭의 분석과 일관되게, 기술 심리학 체계 내의 저자들은 "성격"이라는 용어가 사람에 대한 특정한 사실을 의미한다고 주장해 왔다. 행동, 사고 및 감정에 대한 인과 관계에 있는 기본 메커니즘, 구조 또는 시스템을 지정하지 않으며, 이러한 메커니즘과 구별됩니다. 이 개념에서 [(관찰할 수 없는 내적 원인 실체에 대한) 추론]이 아니라 [관찰]을 통해 질이 자기주장이간함(또는 외향적, 관대함 또는 우울함 등)임을 알게 된다. 이러한 특성이 추가 설명에 적합하다는 주장에는 문제가 없겠지만 -- 예를 들어, 질의 어린 시절 경험, 특정 신념의 보유, 유전적으로 획득된 소인 보유 등을 언급함으로써-- 우리는 ["주장이 강함"과 같은 단어]와 [겉으로 보이는 행동을 야기하는 "메커니즘"이나 "심리-신체 시스템"]과 같은 관찰할 수 없는 [내적 실체]를 혼동하지 않는다. 이 모든 것은 매우 공적인public 특성이 있는 "성격"이라는 용어의 [라틴어 어원]과 일치한다: "마스크"를 뜻하는 페르소나.


Consistent with Jack's analysis, authors within the framework of Descriptive Psychology (Bergner, 2017; Ossorio, 1978, 2006; Schwartz, 2019) have maintained that the term “personality” designates certain facts about persons. It does not designate any underlying mechanisms, structures, or systems that stand in a causal relationship to behavior, thought, and emotion, and as such are distinct from them. On this conception, we learn that Jill is assertive (or extraverted or generous or depressive, etc.) primarily through observation, not inference to an unobservable inner causal entity. While there would be no problem with the contention that such characteristics are amenable to further explanation -- for example, by reference to Jill's childhood experiences, her holding of certain beliefs, or her possession of genetically acquired predispositions -- we do not confuse words like “assertiveness” with unobservable inner entities such as “mechanisms” or “psycho-physical systems” that are causing her overt behavior. All of this is in keeping with the very public Latin etymology of the term “personality”: persona, meaning “mask”.

마지막으로, 어떠한 대상물 X를 설명하는 것과 달리, 「X」의 올바른 사용에 필요한 충분한 조건을 기재하는 것으로, 종래에는 대상물 X가 무엇인지를 특정하는 사업을 하고 있습니다. 우리는 인과관계나 다른 설명적 주장을 하는 사업을 하고 있지 않다. [사전]은 [요약된 단어의 의미]이지, 그 단어들이 언급하는 [현상의 원인]이 아니다. 총각은 미혼 성인 남성이다; 무엇이 여러 총각들로 하여금 그러한 상태에 있게 만드는지는 별개의, 정의와는 무관한, 경험적인 문제이다.

Finally, in defining, as opposed to explaining, any given subject matter X, we are traditionally in the business of identifying what subject matter X is by stating the necessary and sufficient conditions for correct usage of the term “X” (Gupta, 2015; Ossorio, 1981). We are not in the business of making causal or other explanatory claims. A dictionary is a compendium of word meanings, not of the causes of phenomena referred to by those words. A bachelor is an unmarried adult male; what might cause many bachelors to have that status is a separate, non-definitional, empirical matter.

 

2.2. 제안 #2: 성격을 연구하는 것은 전인whole person을 연구하는 것이다.
2.2. Proposition #2: The study of personality is the study of the whole person

심리학 문헌에서는 성격을 사람 전체와 동일시하고, 그 연구는 사람 전체와 동일시하는 경향이 널리 퍼져 있다.

  • 예를 들어 McAdams(2009)는 다음과 같이 기술했다. 성격심리학은 전인에 관한 과학적 연구다. 심리학은 많은 것에 관한 것이다. 지각과 주의력, 인식과 기억, 뉴런과 뇌회로…우리 (성격심리학자들)는 개개의 인간을 복잡한 전체로서 이해하려고 노력한다…그리고 인간의 개개인성individuality에 대한 과학적으로 신뢰할 수 있는 설명을 구축하려고 한다.
  • 유사한 맥락에서 세르본과 퍼빈(2013)은 다음과 같이 주장한다. " …성격의 개념은 포괄적입니다. 이는 개인의 모든 측면을 의미한다." (p.8); 
  • 옥스퍼드 심리학 사전은 그것이 "개인의 특징적인 행동적, 정신적 특징의 총합"이라고 주장하는 반면,
  • 마지막으로, 펀더(2016)는 다음과 같이 선언했다. "이 정의(즉, "개성"의 정의)는 성격 심리학자들에게 전체 인물을 연구해야 하는 독특한 사명을 부여한다." (p.5)

In the psychological literature, there is a widespread tendency to equate personality with the whole person, and its study correspondingly with the study of the whole person.

  • For example, McAdams (2009) has stated that “Personality psychology is the scientific study of the whole person … psychology is about many things: perception and attention, cognition and memory, neurons and brain circuitry … We (personality psychologists) try to understand the individual human being as a complex whole … (and) to construct a scientifically credible account of human individuality” (p. 2).
  • In a similar vein, Cervone and Pervin (2013) assert that “ … the notion of personality is comprehensive. It refers to all aspects of persons” (p. 8); while
  • the Oxford Dictionary of Psychology maintains that it is “the sum total of the behavioural and mental characteristics that are distinctive of an individual” (Colman, 2006, p. 564; cf.; APA Dictionary of Psychology, 2007, p. 689).
  • Finally, Funder (2016) has declared that, “This definition (i.e., of “personality”) gives personality psychologists their unique mission to study whole persons ” (p. 5).


이 입장을 다루기 위한 비공식적인 시작으로서, 다시 한 번 직감적인 수용 가능성의 관점에서, "전체 인물"에 대한 다음과 같은 설명을 고려한다. "사라"는 56세의 이혼한 백인 여성이다. 그녀는 현재 대학에 다니고 있는 두 아이의 헌신적인 엄마로 그들의 삶에 매우 관여하고 있다. 그녀는 무엇보다도 적극적이고, 외향적이며, 배려심이 있고, 모험심이 강하고, 사회적으로 의식이 있는 사람으로 친구들에 의해 묘사된다. Sarah는 컴퓨터 공학의 고급 학위를 가지고 있으며, 그 분야의 실무자로 일하고 있으며, 일에 전념하고 있으며, 동료들에게 상당한 전문 지식을 가지고 있는 것으로 여겨지고 있습니다. 그녀는 시민 문제에 적극적이며 때때로 지역 시민 단체에서 리더 역할을 맡기도 했다. 그녀의 관심사는 자전거 타기, 정원 가꾸기, 정치, 연극, 오페라 등이다. 열성적인 여행자인 그녀는 비교적 쉽게 외국어를 습득할 수 있는 능력이 있다. 비록 종교적으로 매우 적극적이지는 않지만, 그럼에도 불구하고 그녀는 그녀의 종교적 유산과 강하게 동일시하고 있으며, 이것은 그녀의 개인적 정체성의 매우 중요한 부분이다. 현재 사라에게 큰 부담이 되고 있는 두 사건은 2년 전 어머니의 죽음과 26년 동안 살아온 남편과의 고통스러운 이혼이다. 최근 그녀는 은퇴에 대해 점점 더 많이 생각하고, 은퇴 후 어떻게 보내고 싶은지에 대한 목표를 세웠습니다. 즉, 가까운 두 명의 여자 친구와 함께 해외 여행을 하는 것입니다.

As an informal beginning to addressing this position, again primarily from the point of view of its intuitive acceptability, consider the following description of a “whole person”. “Sarah” is a 56-year-old divorced Caucasian woman. She is the devoted mother of two children, both currently attending college, and remains very involved in their lives. She is described by her friends, among other things, as an assertive, extraverted, caring, adventurous, socially conscious individual. Sarah has an advanced degree in computer science, works as a practitioner in that field, is dedicated to her work, and is regarded by her colleagues as having considerable expertise. She is active in civic affairs and at times has assumed leadership roles in local civic organizations. Her interests include cycling (she is in excellent physical condition), gardening, politics, theatre, and opera. An enthusiastic traveler, she has a capacity to pick up foreign languages with relative ease. Although not very active religiously, she nonetheless identifies strongly with her religious heritage, and this is a very important part of her personal identity. Two events that weigh heavily on Sarah at the present time are the death of her mother two years ago and a painful divorce the subsequent year from her husband of 26 years. Lately, she thinks more and more of retirement and has set some goals for herself regarding how she would like to spend it; essentially, traveling abroad with two close female friends.

사라에 대해 더 많은 것을 말할 수 있다. 하지만 핵심을 밝히기에 충분하다고 합니다. 성격 특성이 전체 개인의 특성을 모두 이해하는 것은 아니다. 성격은 그러한 특성의 하위 집합만을 구성한다. 사라의 전체적인 모습을 보여주려면, 그녀의 성격에 관한 사실들을 뛰어넘는 많은 말들이 필요하다. 따라서, 일부는 그녀의 성격 특성에 관한 것이지만(외향적이고, 적극적), 지위(어머니, 이혼한 사람, 고급 학위 보유자), 핵심 관계, 직업, 능력, 목표, 종교적 정체성, 관심사, 능력, 나이, 인종, 건강, 현재 개인적인 불행의 근원 등과 같이 많은 직관적으로 보더라도 [성격과는 관련 없는 사실에 대한 정보]가 추가적으로 제시되었다. 직감적으로, 사실상 아무도 "사라는 컴퓨터 프로그래머" 혹은 "두 아이의 부모" 혹은 "현재 불행하다"는 그녀의 성격에 대한 진술이라고 말하지 않을 것이다. 분명히 사라의 사례에서 알 수 있듯이, 한 사람 전체를 묘사하려는 합리적인 시도에는 개인의 성격 특성을 암송하는 것을 훨씬 뛰어넘는 정보가 포함될 것이다. [그 사람 전체whole person]에는 [그 사람의 성격]보다 훨씬 더 많은 것이 있습니다.

More could be said about Sarah. But enough has been said to make the key point: personality characteristics do not comprehend all of the characteristics of the whole person; they comprise only a subset of such characteristics. To provide a picture of Sarah as a whole person, many things needed to be said that go beyond facts about her personality. Thus, while noting some of her personality traits (extraverted, assertive), further information was presented about many intuitively non-personality facts such as her statuses (mother, divorced person, advanced degree holder), core relationships, occupation, competencies, goals, religious identity, interests, capacities, age, race, health, current sources of personal unhappiness, and more. Intuitively, virtually no one would say that “Sarah is a computer programmer” or “a parent of two” or “is currently unhappy” are statements about her personality. Clearly, as illustrated by the case of Sarah, any reasonable attempt to describe a whole person is going to include information that goes well beyond the recitation of an individual's personality characteristics. There is much more to any “whole person” than his or her personality.

인물의 파라메트릭 분석. 이 점을 보다 공식적이고 체계적으로 만들기 위해 다음과 같은 개인 특성 모수 분석이 도움이 될 수 있습니다. 이 분석은 원래 오소리오에 의해 책정된 것으로, 한 사람이 다른 사람과 같거나 다를 수 있는 다양하고 다양한 방법(단순한 성격 방식이 아니라)을 포착할 수 있는 다양한 종류의 사람 특성을 명료하게 표현한 것이다(비교: 색채 과학에서 색상, 포화도 및 밝기는 한 색이 다른 색과 같거나 다를 수 있는 모든 방법을 명확하게 표현하기 위해 필요한 개념적 자원을 제공합니다.) <PC> = <Ds, P, Dr> 이며, 각각은 다음과 같다. 

A parametric analysis of persons. To make this point more formally and systematically, the following parametric analysis of Person Characteristics may be helpful. This analysis, originally formulated by Ossorio (1985; 2006), is an articulation of the various kinds of person characteristics whose specification enables us to capture the many and various ways (as opposed to just the personality ways) in which one person can be the same as, or different from, another person. (Compare: in color science, hue, saturations, and brilliance provide the conceptual resources necessary to articulate all of the ways in which one color can be the same as or different from another color.)<PC> = <Ds, P, Dr>where

PC = 인물 특성
PC = Person Characteristics

Ds = 기질, 개인의 다양한 개인적 경향 또는 성향으로, 일반적으로 행동 빈도의 지속적 패턴에 의해 관찰된다. 여기에는 다음이 포함됩니다. 

  • 특질 (특정 종류의 행동(예: 외향적, 공격적 또는 자기 비판적 행동) 또는 특정 감정 상태(예: 우울하거나 불안한 행동)를 경험하는 성질) 
  • 스타일 (사람이 하는 일이 아니라 그것을 하는 방법(예: 세련되고 화려하거나 우아한 방식으로)으로 해야 하는 배치) 
  • 태도 (예: 기후과학 또는 종교적 신념) 또는 특정 등급의 객체(예: 여성 또는 소수민족)를 특정 특징적인 방식으로(예: 찬성 또는 반대) 보고 다루는 처분) 
  • 흥미 (특정 주제(예: 정치 또는 패션) 또는 활동(예: 체스 또는 춤)을 찾아 마음을 사로잡는 것)

Ds = Dispositions, the various personal inclinations or tendencies of an individual, ordinarily observable by virtue of an enduring pattern of frequency in their behavior. These include 

  • Traits (dispositions to engage in a certain kind of behavior [e.g., extraverted, aggressive, or self-critical behavior]) or to experience certain emotional states [e.g., depressive or anxious ones]);
  • Styles (dispositions having to do, not with what a person does, but with how he or she does it [e.g., in a sophisticated, flamboyant, or gracious fashion]); 
  • Attitudes (dispositions to regard and treat different objects [e.g., climate science or religious belief] or certain classes of object [e.g., women or ethnic minorities] in certain characteristic ways [e.g., approvingly or disapprovingly]); and 
  • Interests (dispositions to find certain topics [e.g., politics or fashion] or activities [e.g., playing chess or dancing] absorbing and captivating).

P = 능력, 주어진 사람에게 가능한 것과 불가능한 것과 관련된 개념. 여기에는 다음이 포함됩니다. 

  • 실력 (피아노 연주, 농구 슛, 외국어 말하기 등 어떤 종류의 성과에 관한 능력) 
  • 지식/신념 (법적 추진에 관한 법률 지식이나 신의 존재에 관한 신념 등 당사자가 행동할 수 있는 사실 및 신념의 집합) 
  • 가치 (성실성, 부의 축적, 모험적인 삶의 방식 등 사람이 일상적으로 행동할 수 있는 동기 부여 우선 사항의 집합).

P = Powers, concepts having to do with what is possible and not possible for a given person. These include the person's 

  • Abilities (i.e., capabilities with reference to some kind of achievement such as playing the piano, shooting a basketball, or speaking a foreign language); 
  • Knowledge/beliefs (the set of facts and beliefs the person has the ability to act on, such as knowledge of the laws governing legal driving or beliefs about the existence of a deity); and 
  • Values (the set of motivational priorities that the person is routinely able to act on, such as a value for integrity, for accumulating wealth, or for an adventurous way of life).

Dr = 파생물, 이전의 두 범주와 달리 행동과 직접적인 관련이 없지만, 기질Disposition과 능력Power을 참조하여 정의되는 개념입니다. 여기에는 다음이 포함됩니다. 

  • 상태 (병들거나 격분하거나 술에 취하거나 하는 등 개인의 통상적인 권력이나 성향에 조직적인 차이가 있는 상태) 
  • 카파시티 (음악 기술을 습득하거나 언어를 배우는 능력 등 개인 특성을 습득할 수 있는 가능성) 
  • 신체화 (신장 6피트, 체중 175파운드, 면역체계 저하 등 사람의 신체적 특징)

Dr = Derivatives, concepts which, unlike the two previous categories, do not have a direct connection to behavior but are defined instead by their reference to Dispositions and Powers. These include 

  • States (states of affairs in which there is a systematic difference in the ordinary powers or dispositions of a person, such as being sick or enraged or drunk); 
  • Capacities (the potential to acquire personal characteristics, such as ones to acquire musical skills or to learn languages); and 
  • Embodiment (the physical characteristics of a person, such as being six feet tall, weighing 175 pounds, or having a compromised immune system) (adapted from Ossorio, 2006, pp. 70–71).

사라와 같은 사람 전체를 묘사하기 위해서는, 그녀의 성격 특성을 구성하는 중요한 부분집합뿐만 아니라 이 모든 범위의 사람 특성이 요구될 것이다. 이 분석에서 성격 특성은 세 가지 [일반적인 파라미터] 중 하나인 기질Disposition과, 네 가지 [하위 파라미터] 중 두 개인 특성Trait 및 스타일Styles로만 구성된다는 것을 알 수 있습니다. (여러 해 동안 성격 강좌에서 학생들에게 '어머니의 성격을 묘사해 달라'고 부탁하는 첫 번째 연습을 했습니다. 응답을 보면, 생성된 설명의 93% 이상이 엄마의 특성 및 스타일과 관련되어 있습니다. 엄마의 능력, 지식/신념, 카파시티, 흥미 및 태도와 관련된 정보는 드물었습니다.) 그러나 이 목록조차도 단순히 성격의 특징을 파악하는 것보다 훨씬 포괄적이기는 하지만, 여전히 전체 인물을 포착하는 데 있어 완전한 것은 아니다. 우리는 사라가 인생에서 중대한 신체적 핸디캡을 일찍 극복한 것, 중요한 시기에 친구를 잃은 것에 죄책감을 느꼈던 것, 또는 그녀가 심한 공공의 굴욕을 겪은 시간을 극복하지 못한 것에 대해 항상 강한 만족감을 가지고 살아왔다고 말할 수 있을 것이다. "전체 인물 팔레트whole person palette"는 개인의 성격 특성을 묘사하는 것보다 훨씬 더 광범위하며, (우리가 소설을 쓰지 않는 한) 사람에 대해 매우 포괄적인 설명을 할 필요가 있을 경우에, 매우 드물게만, 사용하는 팔레트이다.

In order to fully describe a whole person such as Sarah, this entire range of person characteristics would be required, not just that important subset comprising her personality characteristics. On this analysis, it may be noted, personality characteristics comprise items falling under only one of the three general parameters, Dispositions, and under this category only two of the four sub-parameters, Traits and Styles. (Anecdotally, for many years in my personality course, I did an initial exercise in which I asked students simply to “describe your mother's personality”; in response, over 93% of the descriptions generated pertained to the mother's Traits and Styles; information pertaining to her Abilities, Knowledge/Beliefs, Capacities, Interests, and Attitudes was rare.) Even this listing, however, though far more comprehensive than just identifying personality characteristics, is still not exhaustive with respect to capturing the whole person. We might still say of Sarah such things as that she has always lived with a strong sense of satisfaction that she overcame a significant physical handicap early in life, felt guilty that she once failed a friend at a critical time, or never gotten over the time she suffered a severe public humiliation. The “whole person palette” -- the palette which (unless we are novelists) we use only on those very rare occasions where there is a need to give extremely comprehensive descriptions of a person -- is far more extensive than the delineation of an individual's personality characteristics.

 

3. 성격의 정의
3. A definition of personality

이 섹션에서는 "성격"에 대한 새로운 정의를 제안하고, 그 정의를 구성하는 여러 요소에 대한 분석을 실시한다. 이러한 요소 중 일부는 개념의 이전 공식에 나타나며 익숙할 것이고, 다른 요소들은 새로운 것이어서 현재의 공식은 이전 개념과 전반적으로 다르다. 이 섹션에서는 이러한 차이에 대한 설명으로 마무리합니다.
In this section, a new definition of “personality” is proposed, followed by an analysis of the different elements comprising it. Some of these elements appear in previous formulations of the concept and will be familiar, while others are new and thus render the present formulation different overall from its predecessors. The section concludes with a discussion of these differences.

3.1 정의
3.1. The definition

개인의 성격은 그 혹은 그녀가 보여주는 지속적 특질과 스타일의 집합이며, 그 특성은 다음을 나타낸다. 
(a) 이 사람의 기질 (즉, 타고난 성향 또는 개인적 경향) 및 
(b) 이 사람 자신이 속한 사회의 "표준적인 일반 사람"과 어떤 식으로 다른지. 
An individual's personality is the enduring set of Traits and Styles that he or she exhibits, which characteristics represent
(a) dispositions (i.e., natural tendencies or personal inclinations) of this person, and
(b) ways in which this person differs from the “standard normal person” in his or her society

개인의 성격은 파라메트릭 분석에서 위에서 지정한 모든 성격 특성 집합의 하위 집합으로 여기에 공식화됩니다. 그것은 위에서 나열된 10가지 특성 중 두 가지로 구성된 하위 집합이다.

  • 특질([특정 종류의 행동]에 관여하거나 [특정한 감정 상태]를 경험하는 것에 관한 기질)과
  • 스타일(사람이 [무엇을 하는지]가 아니라, [어떻게 하는지]에 관한 기질)

다음에서는 이 정의의 각 특징을 차례로 설명합니다. 
(NB: "행동"은 예를 들어, 개인적으로 자신을 비난하거나, "머리로" 요약하거나, 정신적으로 하루 일정을 계획하는 것과 같은 정신적인 행동을 포함하도록 의도되어 있습니다.)

An individual's personality is formulated here as a subset of the set of all the Person Characteristics specified above in the parametric analysis. It is the subset comprising two of the ten characteristics listed there, 
> Traits (dispositions to engage in a certain kind of behavior or to experience certain emotional states), and 
> Styles (dispositions having to do, not with what a person does, but with how he or she does it).

In the following, each of the features of this definition is discussed in turn. (NB: “Behavior” is intended here to include mental acts such as, for example, privately criticizing oneself, doing a sum “in one's head”, or mentally planning one's daily schedule.)

'지속적'. 이것은 대부분의 성격 정의에서 반복되는 특징입니다. 외향성, 공격성, 불안과 같은 특성은 [상당한 기간에 걸쳐 관찰되는 조건]에서만 성격적 특성으로 단정할 수 있다. 같은 성질을 나타내는 행동이나 감정이 단 한 번만 또는 단기간 동안만 일어난다면, 우리는 그 특성을 보인 "에피소드" 또는 "상태"라고 말한다. 예를 들어, 극심한 불안이나 불안한 상태의 일화이다.

Enduring”. This is a recurring feature in most definitions of personality (e.g., Feist et al., 2013; Larsen & Buss, 2017; Mischel et al., 2007). Characteristics such as extraversion, aggressiveness, and anxiety are aptly predicated as personality characteristics only under conditions where they are observed over a significant period of time. If behaviors or emotions exhibiting the same qualities occur only once or only over a brief period of time, we speak of “episodes” or “states” exhibiting the relevant quality -- for example, an episode of intense anxiety or an anxious state.

NB: 이것은 또한 일반적으로, 사람에 대한 같은 개념[예: "공격적", "적대적", 또는 "부끄러운"]이 다른 종류의 특성을 지칭하기 위해 다른 맥락에서 사용된다는 것을 보여준다. 예를 들어, 다양한 맥락에서 "적대적"이라는 단어는 특성, 상태, 스타일, 태도, 행동 또는 위의 조합을 나타내기 위해 사용됩니다. [예: "성격적인 적대감은 적대적인 대인관계 스타일로 나타난다"]
(NB: This also illustrates the general point that the same person concept [e.g., “aggressive”, “hostile”, or “shy”] is used in different contexts to designate different kinds of person characteristics. The word “hostile”, for example, in various contexts is used to designate a trait, a state, a style, an attitude, a behavior, or some combination of the above [e.g., “His characterological hostility shows up in his hostile interpersonal style.”])

"의미있는" 기간은 무엇입니까? 여기서 통용되는 일반적으로 정해진 규칙은 없다. 그 개념은 모호함에 대한 공통적이고 많은 논란이 되고 있는 특성을 가지고 있다. 즉, 일회성과 비일회성 사이에 명확한 경계가 없습니다. 이러한 이유로, 자신의 연구 목적을 위해 정확하고 확실한 시간 경계를 필요로 하는 성격 연구자는 조작적 정의를 결정할 필요가 있다. 
(예: "이 연구의 목적상, '지속적enduring'이란 3년 이상을 의미합니다.")
What is a “significant” period of time? There is no generally established hard and fast rule to go by here. The concept possesses the common and much-discussed quality of vagueness (Chaplin, John, & Goldberg, 1988; Sorenson, 2018). That is, it lacks a clear boundary between its instances and non-instances. For this reason, any personality researcher requiring a precise, determinate time boundary for his or her research purposes would need to decide upon an operational definition (e.g., “for purposes of this research, by ‘enduring’ we mean three years or more”).

기질. 지속성과 마찬가지로, 기질은 여러가지 성격의 정의에서 반복되는 특징이다. 사실, 그것의 연구에 대한 하나의 두드러진 접근법인 특질 이론trait theory은 종종 "기질적dispositional 접근법"으로 언급된다. 그러나 이 용어의 의미는 철학자들에 의해 충분히 논의되고 있지만, 심리학 문헌에서는 전혀 논의되지 않는다. 예를 들어, 이 단어는 옥스퍼드 심리학 사전에도 나오지 않는 반면, APA 심리학 사전(2007)은 "개인을 다른 사람과 구별하는 반복적인 행동 또는 감정적 경향"이라고 명시할 때 동의어에 해당하는 것 이상을 제공하지 않는다. 기질disposition은 성격 특성의 중요한 측면이기 때문에, 이러한 부재는 심리학 내에서 성격에 대한 전반적인 개념을 완전히 발달시키지 못한 상태로 남긴다.
Disposition. Like enduringness, disposition is a recurring feature in other definitions of personality (e.g., Allport, 1961; McAdams, 2009). Indeed, one prominent approach to its study, trait theory, is often referred to as the “dispositional approach”. However, while the meaning of this term is amply discussed by philosophers (e.g., Choi & Fara, 2016; Romero & Craver, 2015), it is discussed hardly at all in the psychological literature. The word, for example, does not even appear in the Oxford Dictionary of Psychology (Colman, 2006), while the APA Dictionary of Psychology (2007) provides little more than what amounts to a synonym when it states that it is “a recurrent behavioral or affective tendency that distinguishes an individual from others” (p. 90). Since disposition is a critical aspect of personality characteristics, this absence leaves the overall conception of personality within psychology less than fully developed.

[기질disposition]이란 무엇인가? 이러한 개념을 포착하기 위해 사용되는 일반적인 용어는 개인적인 "경향", "성향", "추세"를 포함한다. 어떤 것이 '기질적'이려면, 그 행동 패턴(예: 수줍음 또는 공격적인 행동)은 개인의 개인적 성향을 표현해야 한다. 그러나 이 단순히 동의어의 반복을 넘어서려면, 무엇을 의미해야 하는가? 이는 그 행동 패턴이 (가치관, 지식/신념, 태도 및 관심사와 같은 개인의 행동의 진행 방향과 관련된) [사람의 특성]에 기초해야 한다는 것을 의미합니다. 패턴이 (1) 이것들(가치관, 지식/신념, 태도, 관심사)과 일치하지 않거나, (2) 일관된 것처럼 보이지만 사실은 개인이 어떤 식으로든 행동하도록 압력을 받거나 강요당하거나 동기를 부여받는 등의 영향에 의해 야기되는 것이라면, 그 패턴을 본질적으로 [기질적이지 않고], 성격과 관련이 없는 것으로 간주하는 근거가 된다. "그 영업사원은 사실 유쾌한 사람이 아닙니다. 그가 기분 좋게 행동하는 유일한 이유는 그렇게 하지 않으면 해고될 것이기 때문입니다." 이러한 의미에서, 즉, 개인의 다른 [지속성있는 성격 특징enduring Person Characteristics]을 보여준다는 점에서, 종종 성격 특성은 ('우리가 무슨 일을 하는가' 뿐만 아니라) "우리가 누구인가"에 대한 것이라고 말한다.

What is a “disposition”? Common terms used to capture this notion include personal “inclination”, “proclivity”, and “tendency”; to qualify as dispositional, the pattern of behavior in question (e.g., shy or aggressive behavior) must be expressive of the individual's personal inclinations. However, if we are to take this matter beyond the mere recitation of synonyms, what does this mean? It means that the pattern must be grounded in -- must be expressive of -- other Person Characteristics that pertain to the ongoing direction of the individual's behavior such as his or her Values, Knowledge/Beliefs, Attitudes, and Interests. If the pattern is seen as (1) inconsistent with these or, (2) though seeming consistent, actually brought about by influences such as the individual being pressured, forced, or incentivized to behave in some way, these are grounds for counting the pattern as not dispositional in nature, and so not pertaining to his or her personality: “The salesperson is not actually an agreeable person; the only reason he is behaving agreeably is because he would be fired if he did not do so.” It is in this sense, i.e., of their close relationship to -- their being expressive of -- the individual's other enduring Person Characteristics, that we often say of personality characteristics that they are not just about what we do, but about “who we are”.

성격 용어들은 본질적으로 상대적이다. "빅 5" 성격 특성(외향성, 호감성, 양심성, 신경증, 개방성)에 대한 현재 유비쿼터스 문헌에서는 친숙한 [상대성]이 발전되어 있다. 그것은 현재의 시각과 양립할 수 있는 동시에 일상에서의 관찰과도 일관성이 있는 것입니다. 구체적으로, 이 다섯 가지 특징들을 [차원적인 것]으로 취급한다: 사람들은 다소 외향적이고, 호감도가 높거나 낮으며, 많거나 적거나 신경질적인 정도를 보인다. 예를 들어, 이 변수가 하나의 값만 갖는 것처럼 "그저 원만한" 것은 결코 아니며, 이 차원에서는 항상 상대적으로 높거나 낮습니다.
Personality terms inherently relativistic.
 In the currently ubiquitous literature on the “big five” personality traits (extraversion, agreeableness, conscientiousness, neuroticism, and openness), a familiar kind of relativity is advanced (Digman, 1990; Goldberg, 1990, 1993; John, Naumann, & Soto, 2008). It is one that is both compatible with the present view and consistent with everyday observation. Specifically, this literature treats these five traits as being dimensional: persons are more or less extraverted, high or low on agreeableness, exhibit greater or lesser degrees of neuroticism, and so forth. They are never, for example, “just agreeable”, as if this variable had only one value, but always relatively high or low on this dimension.

하지만, 성격 개념을 규정하는 것에 관한 한, 두 번째 종류의 상대성이 증거이다. 이는 모두 오소리오에 의해 "표준 정상인"으로 지정된 사회적 규범(SNP)에 상대화되어 있다는 것이다. 이 사람은 [한 사회에서 항상 보통 사람들이 하는 것과 똑같이 행동하는 가상의 사람]이다. 예를 들어, 그 혹은 그녀의 행동에 있어서, 이 개인은 "내향적"도 "외향적"도 아니고, "동의적"도 아니고 "불동의적"도 아니며, "시기적"도 "적극적"도 아닌, 어느 정도 그 사이의 센터이다. 사회적 규범에 대한 이러한 상대성 논쟁을 방어하기 위해, 특정 개인이 어떤 차원(예: 내향적-외향적)에 매우 중심적일 때, 우리 언어는 이 차원에 관해 그 또는 그녀에 대한 특정한 성격 설명자를 포함하지 않는다는 것을 주목할 수 있다. 잭이 내성적이지도 않고 외향적이지도 않은 경우(예를 들어, 큰 5개 기준의 중간 정도일 수 있음), "그 점에 있어서는 그저 평균"이라는 일반적인 비특정 표현을 사용하거나 "글쎄요, 그는 정말 수줍음을 타는 것은 아니지만 정말 외향적이지도 않습니다."와 같은 말을 할 수 있는 경우, 이러한 중간수준을 잡아내는 특별한 용어가 없다.

However, when it comes to predicating personality concepts, a second kind of relativity is in evidence. This is that they are all relativized to a societal norm, one designated by Ossorio (1983; Schwartz, 2019; Shideler, 1988) as a “standard normal person” (“SNP”). This is a hypothetical person who always behaves just as the average person in his or her society does. In his or her behavior, for example, this individual is neither “introverted” nor “extraverted”, neither “agreeable” nor “disagreeable”, neither “timid” nor “aggressive”, but more or less dead center in between. In defense of this contention of relativity to a societal norm, it may be noted that when a given individual is very central on some dimension (e.g., introversion-extraversion), our language contains no specific personality descriptors for him or her with respect to this dimension. If Jack is neither introverted nor extraverted (e.g., he might be right in the middle on a big 5-based scale), while we can use a general, nonspecific expression such as that he is “just average in that regard”, or say something like, “well, he's not really shy but he's not really outgoing either”, there is no specific personality term that captures just this intermediate level of social engagement.


이러한 관점에서, 우리가 한 개인의 성격을 개인에게 귀속시킬 때, 우리는 암묵적으로 다른 사람에 대한 개인적 차이뿐만 아니라, 그 사람이 사회의 표준적인 정상인(그리고 사회 내의 하위 공동체)에서 어떻게 벗어나는지도 구분하고 있다. 사회화를 통해 [우리 각자는 우리 사회의 SNP가 어떻게 생겼는지에 대한 개념]을 가지고 있습니다. 그래서 처음 사람을 만났을 때, 우리 사회의 사람들은 보통 예의범절의 기준을 지키고, 우리와 눈을 마주치고, 말할 때 말을 걸고, 듣고, 원치 않는 성적, 공격적 진보를 하지 않는 등의 행동을 하는 것이 사회적 본보기였다. 어떤 사람에 대한 경험이 더 많아지면, 우리는 이를 바탕으로 [한 사람의 행동이 SNP에서 어떻게 벗어나는지]를 나타나는 방향으로 그 사람에 대한 인상을 조정한다. 개인은 자기 자신에 대해 끊임없이 이야기하고 우리가 말하는 어떤 것에 대해서도 전혀 관심이 없는 것처럼 보이며, 우리는 "자기애적" 혹은 "자기 중심적"이라고 생각하기 시작한다. 그 사람은 고개를 숙이고, 말을 적게 하고, 눈을 마주치지 못하는 것처럼 보이고, 우리는 "소심하다"고 생각하기 시작합니다. SNP에서 얼마나 벗어났는지에 대한 관찰에 기초해서, [관찰된 행동이 사회적 규범에서 어떻게 벗어나는지에 의해 나타나는 방향]으로 [성격 속성]을 만든다. 어떤 SNP에 근접할 경우, 그 사람의 성격을 특징짓기 위한 특성이나 스타일 용어를 제공하는 것은 매우 어렵습니다. 그들을 묘사해 달라고 하면, 우리는 다음과 같은 말을 합니다. "글쎄요, 어떤 이유에선지, 나는 그를 묘사하기가 어려워요. 그는 그저, 음, 좀 평범해요."

On this view, then, when we attribute a personality characteristic to an individual, we are marking off, however implicitly, not only her individual differences vis-à-vis other persons, but also how she deviates from the standard normal person in her society (and possibly even a subcommunity within her society) (Ossorio, 1983; Schwartz, 2019). Each of us, by virtue of our socialization, has a conception of what a SNP in our society looks like. Thus, upon first meeting a person, we carry as it were a societal template with us that persons in our society will ordinarily do such things as observe certain standards of politeness, maintain eye contact with us, both speak to us and listen when we speak, not make unwanted sexual or aggressive advances, and much more. Upon further experience with this person, then, in a quasi-Bayesian way, we adjust our impression of them in directions indicated by how their behavior deviates from the SNP. The individual talks non-stop about himself or herself and seems utterly uninterested in anything we say, and we begin to think “narcissistic” or “self-centered”. The individual looks down, says little, and seems unable to make eye contact, and we begin to think “shy”. It is on the basis of these observed deviations from the SNP, then, that we make personality attributions in a direction indicated by how the behavior observed deviates from the societal norm (Ossorio, 1983; Schwartz, 2019; Shideler, 1988). In those rare cases where actual persons closely approximate the SNP, we find it very difficult to provide trait or style terms to characterize their personality. Asked to describe them, we say things like “Well, for some reason, I find it hard to describe him; he's just, well, sort of average.”

사회적 기준에 대한 고유한 상대성을 갖는 성격 특성을 더욱 방어하기 위해, 그들 중 많은 수가 [(행동적 또는 감정적) 누락omission]으로 인한 것으로 간주할 수 있다. 예를 들어, 우리는 존이 "무책임하다", "신뢰할 수 없다" 또는 "무감정적"이라고 말한다. 이러한 경우에 관찰할 수 있는 것은 [무엇의 존재]가 아니라 [예상되는 행동이나 감정의 반복적인 부재]입니다(예: 존은 자주 다른 사람과의 약속을 지키지 않는다). 긍정적인 공공연한 행동이나 감정이 관찰되지 않는다. 대신 관찰자는 [일반적으로 존재하는 것]에 대한 문화적 기준을 가지고 있으며, [그것의 반복적인 부재]할 때 성격 속성으로 나타낸다.
In further defense of personality characteristics possessing an inherent relativity to a societal standard, it may be noted that many of them impute behavioral or emotional omission. We say, for example, that John is “irresponsible”, “unreliable” or “unemotional”. What is observable in such cases is not the presence, but the recurrent absence of expected behaviors or emotions (e.g., John routinely fails to fulfill made commitments to others). No positive overt behavior or emotion is observed. Instead, the observer possesses a cultural standard of what is ordinarily present and marks its recurrent absence with a personality attribution.

성격 특성이 [사회적 규범에 대한 상대적인 것]이자 [그 규범과의 차이의 구별이라는 것]이라는 개념은 다음에도 도움이 된다. 이것은 성격 특성의 속성이 [절대적인 것]이 아니라 [상대적인 빈도]에 근거한다는 사실이다. 다음과 같은 고정 빈도기반 표준은 없습니다. "P가 Y개월 이상 일주일에 N번 이상 행동 X를 하면, 그것은 성격 특성 행동으로 간주될 수 있고, 그렇지 않으면 그렇지 않습니다." 오히려 (성격에 대한) 판단은 SNP 규범에 상대적이며, [특성 속성 행동]의 실제 빈도 자체는 매우 낮을 수 있습니다. 예를 들어, 한 사람은 장기적으로 다른 사람들에게 매우 신뢰할 수 있고, 정당하게 "충성" 특성을 부여할 수 있지만, 그 혹은 그녀는 일년에 한두 번 이상 충성으로 특징지어지는 행동을 할 수 있다. "자기희생", "너그럽다", "용감하다" 등으로 특징지어지는 행동도 마찬가지라고 할 수 있다. 어떤 행동의 주목할 만한 사례의 수가 적더라도, 사회적 규범에서 벗어난 것으로 보일 때, 그 사람이 이러한 특성을 가진 것으로 인식될 수 있다.

The notion of personality characteristics being relative to a societal norm and marking off divergences from that norm helps to clarify something further. This is the fact that the attribution of personality characteristics is not based on absolute but on relative frequency. There are no fixed, frequency-based standards to the effect that, “if P engages in behavior X more than N times per week for over Y months, it may be counted as personality trait behavior, and otherwise not”. Rather, the judgment is relative to the SNP norm and indeed the frequency of trait-attributed behavior may actually be quite low. A person might, for example, be very reliably loyal to others on a long-term basis, and justifiably assigned the trait “loyal”, yet he or she might engage in behavior marked by loyalty no more than once or twice a year. The same can be said for behavior characterized as “self-sacrificing”, “generous”, “brave”, and more. A relatively low number of notable instances of such behavior may cause the person to be perceived as possessing these traits when this is seen as deviating from the societal norm.

마지막으로 SNP template이 문화마다 다르기에, 이 개념은 [문화 간 상대성]이 내재되어 있음을 수반한다는 것을 알 수 있다. 그것은 동일한 행동 패턴일지라도 한 문화(또는 하위 문화)에서는 성격 귀속(예: "공격적")의 근거로 간주될 수 있는 반면, 다른 문화에서는 그렇게 간주되지 않는 익숙한 현상을 설명한다.

Finally, insofar as SNP templates will vary from culture to culture (and, while space does not permit its discussion here, subculture to subculture), it may be noted that this notion carries with it a built-in cross-cultural relativity. It explains the familiar phenomenon that the same pattern of behavior in one culture (or subculture) might be counted as grounds for a personality attribution (e.g., “aggressive”), while in another culture it would not be so counted.

 

3.2. 기존 정의와의 차이점
3.2. Differences from previous definitions

위에서 설명한 바와 같이, 본 정의는 성격 문헌의 다른 정의와 몇 가지 특징을 공유한다. 예를 들어, 개념의 다른 공식에서 나타나는 [지속성][기질성]과 같은 요소를 포함한다. 이러한 중복은 현재의 공식에 대해 무엇이 다른지에 대한 의문을 제기한다. 이 질문에 대한 답변에는 다음과 같은 차이점이 제시되어야 한다.
As noted above, the present definition shares some features with other definitions in the personality literature. For example, it includes elements such as enduringness and dispositionality that appear in other formulations of the concept. These overlaps raise the question of what, if anything, is different about the present formulation. The following articulation of differences should serve to answer this question.

(1) 현재의 정의는 성격의 개념이 "표준 정상인"(SNP)으로 지정된 사회적 템플릿에 대한 내재적 상대성을 수반한다는 주장에서 다른 모든 것과 다르다.
(1) The present definition differs from all others in its claim that the concept of personality carries with it an inherent relativity to a societal template, one designated as a “standard normal person” (SNP).

(2) 현재의 정의는 성격을 행동 및 감정과 분리되어있거나, 행동 및 감정과 인과관계를 이루는 [기저 실체(예: 메커니즘, 시스템 또는 구조)]로 간주하는 일군의 정의와 다르다.
(2) The present definition differs from all those in that group of definitions that regard personality as an underlying entity (e.g., a mechanism, system, or structure) that is separate from, and stands in causal relationship to, behavior and emotion.

(3) 현재의 정의는 [성격이 전인whole person을 지칭한다]고 주장하는 큰 정의 그룹의 모든 정의와 다릅니다. 즉, "개인의 모든 측면을 지칭합니다."
(3) The present definition differs from all those in the large group of definitions that maintain that personality refers to the whole person -- that it “refers to all aspects of persons” (Cervone & Pervin, 2013, p. 8).

(4) 특성을 포함하는 다른 많은 정의와 달리, 현재의 정의에는 [스타일]도 포함됩니다. 즉, 어떤 사람이 [무엇을 하는가]가 아니라 [어떻게 하는가]에 관련된 그 사람의 특성 (예: Susie는 화려하거나 세련되거나 어색합니다).
(4) The present definition, unlike the many others that include Traits, also includes Styles; i.e., person characteristics that pertain not to what a person does, but to how he or she does it (e.g., Susie is flamboyant, sophisticated, or awkward).

(5) 현재의 정의는 이 작가가 성격 특성이 "기질적"인 것이 무엇을 의미하는지 비판적으로 설명하면서 발견할 수 있었다는 점에서 다른 모든 것과 다르다. (가치관이나 태도와 같은) 다른 인간 특징person characteristics에 대한 필요성과 함께 이 표현은, 성격 특징이 단지 [우리가 하는 일]이 아니라, [인간으로서의 우리가 누구인지]에 대한 명제를 이해할 수 있게 한다.
(5) The present definition differs from all others that this author could discover in providing a critical explication of what it means for a personality characteristic to be “dispositional”. This articulation, in turn, with its necessary connection to other person characteristics such as values beliefs, and attitudes, renders intelligible the proposition that personality characteristics are not just about what we do, but about who we are as persons.

여기서 제안된 것과 가장 유사하고, 따라서 그것과 혼동될 가능성이 가장 높은 정의의 그룹은 미국 심리학 협회의 다음 예에 의해 예시된다: "성격은 생각, 느낌, 그리고 행동의 특징적인 패턴의 개인 차이를 말한다." 문헌의 다른 정의와 유사한 이 정의는 현재 정의와 가장 가깝고 따라서 후자가 이전 정의와 실제로 다르지 않다는 인상을 줄 가능성이 가장 높다. APA의 정의는 여기서 설명한 것과 유사하지만 다음과 같은 점에서 다릅니다.

The group of definitions most similar to that proposed in this article, and thus most likely to be confused with it, is exemplified by the following one from the American Psychological Association: “Personality refers to individual differences in characteristic patterns of thinking, feeling and behaving” (https://www.apa.org/topics/personality/). It is this definition, similar to others in the literature (e.g., Funder, 2016 [part one]; Johnson, 1997; McCrae & Costa, 1995), that comes closest to the present one and is thus most likely to create the impression that the latter is not really different from its predecessors. While APA's formulation does have similarities with that presented in this article, it is different in the following ways:

(a) APA의 정의는 모호하며, 그 모호함 속에서 지나치게 포괄적이라는 것을 읽을 수 있다. 개성을 개인의 특징과 스타일에 더 정확하게 제한하는 것과 달리, APA는 널리 사용되는 "생각, 느낌, 행동 패턴의 특징"이라는 문구를 사용하는 것은 개인에 대해 다음의 항목도 포함하는데,

  • 버릇 ("Kathy는 매일 아침 9시에 집을 나서는 버릇이 있다"),
  • 루틴 ("Joe는 매일 아침 9시에 집을 나선다"),
  • 관심사 ("Amy는 콜럼버스 이전의 예술에 관심이 있다."),
  • 태도 ("Sam은 그가 비과학적이라고 생각하는 모든 것에 부정적인 태도를 가지고 있다.") 

이것들은 전형적으로도, 직관적으로도 성격 특성으로 간주되지 않는 개인적 특징입니다.

(a) APA's definition is ambiguous and, in its ambiguity, open to a reading of being overinclusive. In contrast to limiting personality more precisely to an individual's Traits and Styles, APA'S use of the widely employed phrase, “characteristic patterns of thinking, feeling and behaving”, could be taken to include such items as an individual's 

  • habits (“Kathy has a habit of being late.”), 
  • routines (“Joe leaves the house at 9 each morning and parks in the same space at work.”), 
  • Interests (“Amy is interested in pre-Columbian art.”), and 
  • Attitudes (“Sam has a negative attitude toward anything he deems unscientific.”),

personal features that are not typically, or intuitively, regarded as personality characteristics.

(b) 여기서 제안된 정의와 달리, APA 정의는 [기질성, 지속성, 문화적 표준에 대한 내재적 상대성]이라는 중요한 특징이 결여되어 있다.

(b) Unlike the definition proposed in this article, the APA definition lacks the critical features of dispositionality, enduringness, and inherent relativity to a cultural standard.

(c) 여기서 정의한 성격은, [개인이 보여주는 특징과 스타일의 집합]이다. 즉, APA가 ['개인의 차이']라고 말한 것이 아니다. 후자와 같은 주장은 마치 코커 스패니얼이 '개의 한 종류'라기보다는, '개인의 차이'라고 말하는 것과 같으며, "가톨릭은 특정 종파의 하나"가 아니라 '가톨릭은 개인의 차이'라고 말하는 것과 같다. 만약 "코커 스패니얼"을 정의해달라고 요구한다면, 사실상 아무도 "개인적인 차이"라고 말하지 않을 것이다. 또한, 여러 사전의 검사는 이러한 효과에 대한 단일 정의를 제시하지 않았다. [성격 특질 및 스타일]의 개념은 [한 사람이 다른 사람과 어떻게 다른지]를 구분하는 데 사용될 수 있습니다. (같은 이유로, 「잭과 질은 둘 다 매우 부끄러움을 많이 탄다」와 같이 「개인의 동일성individual sameness」이라고 불릴 수 있는, 한 사람이 다른 사람과 같은 것을 나타내는 데도 사용됩니다). 그러나 특질이 그 자체로 "차이"인 것은 아니다. 성격이 무엇인지 아직 알지 못하는 사람에게(따라서 정의를 필요로 하지 않는) 그것을 "차이"로 정의하는 것은 상당히 명확하지 않다. 생각, 느낌, 행동에서 어떤 차이가 있을까? 이런 사람은 우리가 무슨 말을 하고 있는 걸까?라고 생각할 수 있습니다. APA의 정의에서는 이런 것이 전혀 명확하지 않다.

(c) On the present definition, personality is the set of Traits and Styles a person exhibits; it is not, contra APA, “individual differences”. Claiming the latter is like saying “a cocker spaniel is an individual difference” rather than “a type of dog”, or “a Catholic is an individual difference”, rather than “a member of a certain religious denomination”. If asked to define “cocker spaniel”, virtually no one would say, “It is an individual difference”. Further, a check of several dictionaries did not yield a single definition to this effect. Personality trait and style concepts can be and are used to mark off the ways in which one person differs from another person. (For that matter, they are also used to designate the way in which one person is the same as another person [“Jack and Jill are both very shy”], what might be termed “individual samenesses”.) But a trait is not, per se, a “difference”. For someone who does not already know what personality is (and thus does not require a definition), defining it for them as a “difference” carries with it a considerable lack of clarity. What sort of difference in thinking, feeling, and behaving, such a person might wonder, are we talking about?” This is not at all clear from APA's definition.

전반적으로 APA의 정의는 현재보다 더 유사하다. 또한 현재 제안보다 훨씬 덜 정확하고, 더 모호하며, 오해를 불러일으킬 수 있는 개념적 특성을 보여줍니다.
Overall, APA's definition is more unlike than like the present one. Further, it exhibits conceptual qualities that render it considerably less precise, more ambiguous, and possibly misleading than the current proposal.

 

4. 토론: 그래서?
4. Discussion: so what?


"그래서?" 비평가라면 이의를 제기할 수 있다. "왜 우리가 이 모든 것을 신경써야 합니까? 그것은 무슨 소용이 있는가? 성격 개념화 문제에 대해 오랫동안 합의를 이루지 못한 채 아주 잘 지내지 않았습니까? 이 절에서는 지금까지의 반대에 대한 답변을 간략하게 정리하고, 그 외에 두 가지를 소개한다.

“So what?”, a critic might object. “Why should we care about all this? Of what use is it? Haven't we gotten along perfectly fine with our long-term failure to arrive at a consensus in the matter of conceptualizing personality?” In this section, I will briefly recount the answers given to these objections thus far in this article, and then introduce two additional ones.

나는 우리가 충분한 합의의 정의에 도달하지 못한 채, 사실상 '완벽하게 잘 지내지 못했다'고 믿고 있다. 심리학은 과학이고, 우리는 심리학이 그렇다는 것에 자부심을 느낀다. 그러나 수십 년 전 Sigmund Koch(1959)가 개탄한 것처럼 우리는 핵심 주제의 본질에 대해 명확하지 않은 채 이 과학을 계속 추진하고 있다. - "행동", "사람", "자기" 또는 "인격"과 같은 중심 개념을 명확히 하지 않고 있다. 이 상황은 화학자가 동위원소로 계산할 대상을 먼저 결정하지 않고 동위원소 연구에 착수하는 상황과 유사하다. 그 결과 무수히 많은 다른 개념들이 생겨났다.

  • 앞서 언급한 바와 같이, 많은 사람들은 성격을 근본적인 원인 메커니즘, 구조 또는 시스템으로 본다.
  • 다른 사람들은 그것을 전체로 본다.
  • 아직까지도, 가장 주목할 만한 특질 이론가trait theoriests들은, 어휘 가설에 따르면, 대체로 직관적이지만, 개념적으로 성격 특징에 대한 명확하지 않은 개념에 의존합니다.

I believe, and have argued above, that we have not in fact “gotten along perfectly fine” with our failure to arrive at an adequate consensus definition. Psychology is a science, and we pride ourselves on its being such. However, as lamented famously by Sigmund Koch (1959) many decades ago, we continue to push forward with this science without being clear on the nature of its core subject matter -- without articulating such central concepts as “behavior”, “person”, “self”, or, in the present instance, “personality” (Bergner, 2017:; Schwartz, 2019). The situation is comparable to one in which a chemist would set out to study isotopes without first determining what was to count as an isotope. The result has been a myriad of different conceptions. As noted,

일반적으로 이 분야는 직관적으로 받아들일 수 없고 모호하며 오해를 일으킬 수 있는 수많은 정의로 인해 어려움을 겪고 있습니다. 그 결과는 전체적으로 다소 도움이 되지 않고 혼란스러우며 혼란스러운 과학 풍경이다. 앞에서 언급한 것 외에, 본 견해의 이점인 두 가지 추가적 의미는 다음과 같다.

In general, the field suffers from a myriad of definitions that are intuitively unacceptable, ambiguous, and/or potentially misleading. The result overall is a rather unhelpful, confused, and confusing scientific landscape. In addition to the foregoing, two additional implications, both benefits of the present view, are the following.

 

4.1. 특성 기반 설명이 얼마나 진정한 설명인지를 명확히 한다.
4.1. Clarifies how trait-based explanations are genuinely explanatory

많은 작가들은 성격 특성 속성personality trait attributions 이 단지 행동의 규칙성에 대한 서술적인 언급에 불과하다고 주장해 왔고, 따라서 예를 들어, 누군가가 수줍음을 탄다고 말하는 것은 그 혹은 그녀가 동시에 조용하고 내성적이라는 것에 지나지 않는다고 주장해 왔다. 이런 점에서 성격적 특성personality traits에 근거한 설명은 반복과 같다. "아만다는 조용하고 부끄러워서 파티에서 내성적이었다"는 말은, "조용하고 내성적이어서 조용하고 내성적이라는 말"에 불과할 뿐이다. (cf. 몰리에르의 유명한 의사 풍자는 아편이 "숙면적인 미덕을 가지고 있기 때문에" 수면을 유도한다고 설명했습니다.그것은 아편을 섭취하는 것 이상의 의미가 없고, 규칙적으로 수면이 뒤따른다는 것을 의미합니다.) 

A number of authors have claimed that personality trait attributions are nothing more than the merely descriptive noting of regularities in behavior, and thus that saying that someone is, for example, “shy” means nothing more than that he or she is recurrently quiet and withdrawn (Boag, 2011; Holt, 1969; Saucier & Goldberg, 1998). On this account, explanations based on personality traits are tantamount to tautologies. Saying that “Amanda was quiet and withdrawn at the party way because she is shy” would be saying only “she was quiet and withdrawn because she is recurrently quiet and withdrawn”, and so would not be explanatory (cf. Moliere's famous lampoon of the doctor who “explained” that opium induced sleep “because it has a dormitive virtue” -- meaning nothing more than that ingesting it is regularly followed by sleep).

그러나, 현재의 분석에서는, 성격 베이스의 설명을 제공하는 것은, 동조를 말하는 것과 같지 않고, 정말로 설명적이다(익숙한 효율적인 인과관계에서는 아니지만). 우리는 제3자의 행동에 대해 명백하고 수행적으로 묘사된 사실에 전적으로 동의하는 두 사람이 그럼에도 불구하고 그들의 성격 속성에 동의하지 않는 경우에서 이것을 명확하게 볼 수 있다. 예를 들어, [파티에서 아만다의 조용하고 내성적인 행동]에 주목하면서 [윌은 "부끄러워서"라고 주장]하는 반면, [질은 "아니, 그녀가 냉담해서"라고 반대 의견]을 내뱉는다. 그들의 "특징 X가 있기 때문"이라는 설명은 아만다의 행동이 다른 무언가를 표현하고 있다고 생각한다는 것입니다. 즉, 누군가는 다른 곳에서 온 것이라고 말할 수도 있고, 이것이 그들의 속성을 단순히 서술적인 것이 아니라 설명적인 것으로 만드는 것입니다. 본 분석에서는 위에서 언급한 바와 같이 아만다의 다른 인물 특성에서 이와 다른 점을 찾을 수 있습니다. "아만다가 수줍음을 타서"라고 말함으로써, 그들은 그녀가 "조용하고 내성적인"과 같은 노골적인 행동에 영속적으로 관여하고 있다는 것 이상의 것을 말하고 있다. 그들은, 그녀가 가치관, 신념, 태도 등 다른 성격에 기반을 둔 성향을 가지고 행동하고 있다는 점에서 이해되고 있는, [그런 종류의 사람이기 때문에 그렇게 하고 있다]고 말한다. 예를 들어, Amanda의 경우, 이것들은 다른 사람들과 함께 자신을 내세울 때 평가된 사회적 위험과 관련된 지식/신앙 매개 변수 요소를 포함할 수 있습니다.

However, on the present analysis, providing personality-based explanations is not tantamount to uttering tautologies, and is genuinely explanatory (although not in the familiar efficient causal sense) (cf. Nilsson, 2015). We see this clearly in cases where two people who agree entirely on the overt, performatively described facts of a third person's behavior nonetheless disagree in their personality attributions. For example, noting Amanda's quiet and withdrawn behavior at the party, Wil maintains that it is “because she is shy”, while Gil issues a dissenting “no, it's because she is aloof”. Their “because she has trait X” explanations are saying that each thinks Amanda's behavior is expressive of something different -- that it is, one might say, “coming from a different place” -- and it is this that renders their attributions explanatory and not merely descriptive. On the present analysis, as noted above, this something different is to be found in Amanda's other Person Characteristics. In saying “because Amanda is shy”, they are saying more than that she is engaging enduringly in some performatively described overt behavior such as “she is being quiet and withdrawn”. They are saying that she is doing so because this is the kind of person she is, understood in the sense that she is acting on inclinations that are grounded in other of her person characteristics such as her values, beliefs, and attitudes. In Amanda's case, for example, these might include, among other things, Knowledge/Belief parameter factors having to do with appraised social dangers attendant upon putting herself forward with others.

「부끄럼을 타서」와 같이 성격특성-기반의 설명에 대해서, 그것이 최상위 수준의 설명이라고 하는 사람은 거의 없을 것이다. 즉 그 이상의 설명은 할 수 없다고 하는 사람은 거의 없다. 만약 "근데 왜 수줍음을 타느냐"고 묻는다면, 대부분은 아만다의 행동에 대한 완전한 설명을 하지 못한 것을 쉽게 이해할 수 있을 것이고, 다른 요인들에 대한 추가 정보가 있어야 보다 포괄적인 그림을 제공할 수 있을 것이다(예를 들어, 그녀 자신의 개인적 욕구에 대한 평가나 난처한 말을 하는 것에 대한 지속적인 우려). 하지만, 그들은 암시적으로 그녀의 행동이 단지 변덕스러운 반복이 아니며, 강요, 금전적 유인, 또는 그녀가 어떤 사람인지 일관되지 않게 행동하게 하는 다른 영향력에 의해 발생하지 않는다고 보았다. 즉, 위에서 정의한 대로 그녀의 개인적인 성향에 의해 그렇게 행동하는 것이다.

In issuing personality characteristic-based explanations such as “because she is shy”, few people would maintain that they have given final order explanations; i.e., ones beyond which no further explanation can be given. If another person were to ask, “but why is she shy?”, most would readily understand that they have not provided a complete explanation of Amanda's behavior, and that further information about other factors (e.g., her appraisal of her own personal desirability or ongoing concerns about saying something embarrassing) could provide a more comprehensive picture. However, they have by implication indicated that they see her behavior as not just a willy-nilly repetition and as not arising through coercion, monetary inducement, or any other influence that is causing her to behave inconsistently who she is; i.e., with her own personal dispositions as defined above.

위에서 논의한 우리의 신화와 관련하여, 두 가지 점에 주목해야 한다. 

  • 첫째, [성격특성]과 다른 인간특성Person Characteristics과의 관련성을 가정할 때, 우리는 개인의 신념, 가치관, 태도 및 관심사와 같은 비근거적, 비원인적, 비신비한 특징에 대한 효율적인 인과적 메커니즘을 거래해 왔다. 
  • 둘째, 신화 #2에서 표현된 것과 상당히 다른 방식으로, 우리는 개인의 성격과 관련된 (그들 자신이 아닌) 전체 사람의 중요한 요소들을 다시 그림 속으로 끌어들였다.

Relating back to our myths discussed above, two things may be noted.

First, in positing the relatedness of personality traits to other Person Characteristics, we have traded in underlying efficiently causal mechanisms for non-underlying, non-causal, and non-mysterious characteristics such as an individual's beliefs, values, attitudes, and interests.

Second, in a way quite different than that expressed in myth #2, we have brought important elements of the whole person back into the picture as being related to (but not themselves aspects of) an individual's personality.

4.2. 성격사실의 과학적 관찰가능성 합리화
4.2. Rationalizes scientific observability of personality facts

현재의 공식에서 [성격 사실personality facts]은 항상 직접 관찰되는 것은 아니지만, 원칙적으로는 관찰할 수 있는 개인에 관한 사실로 나타난다. 따라서, 특히 기저의 인과관계 실체 설명causal entity accounts과 비교하여, 그들은 과학적 정밀 조사에 도움이 된다. 존의 특징에 관해 우리는 다양한 종류와 각각의 관찰 가능성을 구별할 수 있다. 

  • 그의 명백한 행동과 관련된 특징의 경우(예: 그가 외향적이거나, 적극적이거나, 적대적임), 이러한 특징들은 관련 행동을 [직접 관찰함]으로써 확인할 수 있다.
  • 행동 누락과 관련된 특성(예: John은 무책임하거나 게으르거나 신뢰할 수 없음)의 경우, 관찰할 수 있는 것은 예상되는 [행동이 반복적으로 부재]하는 것이다(예: 그는 일상적으로 다른 사람에 대한 약속을 이행하지 못한다).
  • 사적인 행동이나 정신적인 행동과 관련된 특성(예: 존은 매우 자기 비판적이거나 강박적인 사고를 하는 경향이 있다)의 경우, 이러한 특성은 외부화되어 다른 사람들에게 공개될 수 있다는 점에서 원칙적으로 [관찰할 수 있다](예: 그는 연구자나 치료사에게 자기 비판의 성격을 보고한다).
  • 감정 상태와 관련된 특성(예: 존은 불안하거나 우울함)의 경우, 다른 사람들은 [관찰을 통해] 이러한 특징에 대해 배운다. 예를 들어, 그들은 그의 말에서 두려움을 감지하고, 겁먹은 표정으로 그것을 보거나, 그의 구두 진술에서 그것을 관찰한다.
  • 그러나 다른 경우, 그들은 [추론을 통해] 이러한 상태에 대해 알게 될 수도 있다. 예를 들어, 그들은 존이 사회적 모임을 오랫동안 회피한 것에 근거하여 사회적으로 불안하다고 추론할 수 있다.
  • 마지막으로, 존의 Styles에 관해서(예를 들어, 그는 화려하고, 세련되고, 어색하다), 그러한 특징은 본질적으로 공공연하며, 다른 사람들은 [직접적인 관찰]을 통해 그것을 확인한다.


On the present formulation, personality facts emerge as ones about individuals that, while not always directly observable, are observable in principle. As such, particularly in comparison with underlying causal entity accounts, they lend themselves well to scientific scrutiny. With respect to John's traits, we may distinguish various kinds and the observability of each.

  • In the case of traits having to do with his overt behavior (e.g., that he is extraverted, assertive, or hostile), these can be ascertained through direct observation of the relevant behavior.
  • In the case of traits involving behavioral omission (e.g., John is irresponsible, lazy, or unreliable), what is observable is the recurrent absence of expected behaviors (e.g., he routinely fails to fulfill made commitments to others).
  • In the case of traits having to do with private or mental behavior (e.g., John is very self-critical or prone to obsessive thinking), these are observable in principle in the sense that they can be externalized and thus made public to others (e.g., he reports the nature of his self-criticisms to a researcher or a therapist).
  • In the case of traits having to do with emotional states (e.g., John is anxious or depressive), again others learn about these primarily through observation; e.g., they detect fear in his speech, see it in his frightened expression, and/or observe it in his verbal statements.
  • On other occasions, however, they may learn of these states via inference; e.g., they might infer that John is socially anxious on the basis of his consistent longstanding avoidance of social gatherings.
  • Finally, with respect to John's Styles (e.g., he is flamboyant, sophisticated or awkward), such characteristics are inherently public and others ascertain them through straightforward observation.

여기서 "원칙적으로" 관찰 가능한 것은 이러한 [모든 상황이 본질적으로 관찰 가능한 상태]라는 것을 의미합니다. 이는 실제로 항상 존재하거나 관찰에 의해 항상 입증되어야 한다는 것을 의미하지는 않습니다. 즉, 직접 관찰할 수 있든(예: 외향) 나의 시야에서 보이지 않든(예: 자기 임계성), 그러한 현상은 본질적으로 다른 사람에게 정밀히 조사될 수 있는 현상이다.
Observable “in principle” here is intended to mean that all of these states of affairs are inherently observable ones. It does not mean that they always are in fact or always must be established by observation. It does mean that, whether directly observable (e.g., extraversion) or hidden from view (e.g., self-criticalness), they are phenomena that are, or that by their nature can be rendered available for the scrutiny of others.


이와 관련하여, [성격에 대한 이번 연구의 개념]은, [그 자체로는 관찰할 수 없는 것(기저의 인과 메커니즘이나 구조)이면서, 오로지 추론을 통해서만 확립될 수 있는 무언가]에 비해서 더 선호된다. 게다가 이러한 점에서 추리공제의 종점은 다소 수수께끼처럼 보인다. 명백한 동작을 일으키는 기본 메커니즘이나 구조를 찾고 있다면 정확히 무엇을 찾아야 합니까? 그런 메커니즘은 어떻게 생겼을까요? 내가 그걸 찾으면 어떻게 알아? 이 질문들에 대한 답은 명확하지 않고, 내가 아는 지식에 대한 답변은 그러한 실체를 주장하는 사람들에 의해 만족스럽게 답한 적이 없다.

In this regard, the present conception of personality is scientifically preferable to definitions that render personality something that is itself unobservable (e.g., underlying causal mechanisms or structures) and could only be established by inference. Further, on such accounts, the end point of the inferential deduction would seem to be something rather mysterious. If I am searching for an underlying mechanism or structure that causes overt behavior, what exactly am I looking for? What would such a mechanism look like? How would I know it if I found it? The answers to these questions are far from clear and to my knowledge have never been answered satisfactorily by those positing such entities.

5. 결론
5. Conclusion

이 기사의 첫머리에서, 나는 나탈리 앤지에의 진술을 인용했다. "어떤 것들은 결코 당연하게 여겨져서는 안 된다. 그 중에서도 당신의 훈련의 핵심에 있는 단어들의 정확한 의미이다." 이 기사는 이 분야의 핵심 단어인 "개성"이 합의에 도달하는 어떤 것을 성취하는 방식으로 지금까지 설명되지 않은 성격 심리학의 오랜 상황을 다루었다. 현재 빅5 및 성격에 대한 다른 특성 접근과 잘 조화를 이루며 그들에게 개념적인 기초가 될 수 있는 이 공식은 이 상황을 개선하는 데 도움이 되기를 바랍니다.

At the outset of this article, I quoted Natalie Angier's statement that, “Certain things should never be taken for granted, among them … the precise meaning of words that are at the heart of your discipline” (2009, p. D1). This article has addressed the longstanding situation in personality psychology that the very word at the heart of the discipline, “personality”, has not to date been explicated in a way that has achieved anything approaching a consensus. Hopefully, the formulation presented here, one that coordinates well with current Big 5 and other trait approaches to personality, and which might serve as a conceptual underpinning for them, will prove helpful in ameliorating this situation.

 


Abstract

This article addresses the longstanding problem that the field of personality psychology remains in need of a consensus formulation of its core subject matter, that of the nature of “personality” itself. Part 1 of the article presents some reminders about the traditional pre-empirical status of concepts in science. Part 2 introduces and calls into question two widely accepted but nonetheless questionable propositions about the nature of personality: (a) that the term refers to an underlying causal entity within a person, and (b) that the study of personality is the study of the whole person. Part 3 presents a definition of “personality”, discussion elaborating and clarifying this definition, and an explication of the ways in which it differs from previous definitions. Part 4 discusses some benefits that accrue both to having a consensus definition in general, and to acceptance of the present definition in particular.

자기주도학습에는 "자기" 이상의 것이 있어요: 학부생의 자기주도학습(SDL) 탐색 (Med Teach, 2021)
There is more than ‘I’ in self-directed learning: An exploration of self-directed learning in teams of undergraduate students 
Tamara E. T. van Woezika , Jur Jan-Jurjen Koksmab , Rob P. B. Reuzela , Debbie C. Jaarsmac and Gert Jan van der Wilta 

 

 

서론
Introduction

평생학습은 특히 의학과 같은 복잡한 직업의 훈련에서 고등교육의 중요한 목표가 되었다. 의료 커리큘럼은 종종 매우 역동적인 분야의 자기 주도적인 전문가들에게 필요한 비판적이고 성찰적인 태도의 개발을 포함한다. 자기 주도 학습은 진정한authentic 학습 상황에서 가장 잘 촉진되는데, 이는 학습 상황이 전문적인 실천을 반영한다는 것을 의미합니다. 진정한 의학 학습은 무엇보다도 학생들이 팀을 이루어 일하는 것을 의미하는데, 이것은 전문가들이 자주 접하게 되는 환경이다. 사회환경에서의 학습이 토론과 성찰을 자극하기 때문에 자기주도학습은 아마도 이 환경에서 육성될 것이다(Bolhuis 2003). 팀 내에서 자기 주도 학습이 어떻게 발전하는지를 이해하면, 협업 환경에서 교육을 설계하는 데 도움이 될 수 있습니다. 이 연구의 목적에 대해 자세히 설명하기 전에 자기주도학습과 진정한 학습의 개념에 대해 좀 더 자세히 설명하겠습니다.

Lifelong learning has become an important aim for higher education, especially in training for complex professions such as medicine (Mahan and Clinchot 2014; Delany et al. 2016). The medical curriculum often includes the development of a critical and reflective attitude that is needed for self-directed professionals in their highly dynamic field (Miflin et al. 2000; Murad et al. 2010; Chitkara et al. 2016). Self-directed learning is best promoted in authentic learning situations, meaning that the learning situation reflects professional practice (Jennings 2007; Goldman et al. 2009; Taylor and Hamdy 2013). Authentic learning in medicine means, among other things, that students work together in teams, a setting that professionals will often encounter. Self-directed learning is probably fostered in this setting, because learning in a social environment will stimulate discussion and reflection (Bolhuis 2003). Understanding more about how self-directed learning develops in teams could help designing for education in a collaborative setting. Before we elaborate on this aim of our study, the concepts of self-directed learning and authentic learning will be explained in more detail.

자기주도학습(SDL)은 일반적으로 학생들이 자신의 학습목표를 개발하고 추구하며 학습과정과 결과를 평가하는 (1)능력과 (2)태도로 정의된다. 

Self-directed learning (SDL) is commonly defined as the (1) ability and (2) attitude of students to develop and pursue their own learning objectives and to evaluate their learning process and results (Knowles 1975; Candy 1991; Taylor and Hamdy 2013). 

  • 첫째, [인지능력] 측면에서 SDL은 학습자가 보통 특정 코스에 대해 설정된 미리 정의된 학습 목표를 달성하는 데 도움이 되는 학습 방법인 SRL(Self-Regulated Learning)과 밀접하게 관련되어 있습니다. SRL은 SDL처럼 비판적 사고, 정교화, 학습 과정의 모니터링과 같은 학습 전략을 포함한다.
    • SRL과 SDL이 차이가 있는 것은, SDL은 코스 전체에 걸쳐 보다 장기적인 프로세스를 수반하기 때문에 [학습에 대한 태도]로 해석translate됩니다.
    • SDL에는 목표 설정 및 학습 프로세스의 평가와 조정을 위한 자기 모니터링 기능이 있습니다.
    • 또한 SDL은 몇 가지 학습 전략을 수반할 수 있지만 비판적 사고와 메타 인지적 자기 규제가 없는 경우에는 결함이 있는 것으로 간주됩니다(Candy 1991).
  • First, in terms of cognitive ability, SDL is closely related to self-regulated learning (SRL), which is a way of learning that helps learners to complete predefined learning goals that are usually set for a certain course. SRL involves learning strategies such as critical thinking and elaboration, and monitoring the learning process, as does SDL.
    • SRL and SDL differ in the sense that SDL involves more long-term processes often overarching a course, and therefore translates to an attitude towards learning (Sandars and Walsh 2016).
    • SDL includes goal setting, and self-monitoring to evaluate and steer the learning process (Lloyd-Jones and Hak 2004).
    • Moreover, SDL may entail several learning strategies, but is considered flawed when critical thinking and meta-cognitive self-regulation are absent (Candy 1991).

 

  • 둘째, [SDL에 대한 태도]라고 불리는 것은 학습자 개개인의 SDL 개발에 있어 중요한 몇 가지 특징과 행동으로 구성됩니다. 우리는 이러한 태도를 감정, 개방성 및 동기 부여의 관점에서 정의합니다.
    • Affect는 자신의 감정과 접촉touch하거나 감정과 관련된 행동을 보여주는 것을 의미합니다. 관심이나 흥분을 수반하는 경우, 영향은 SDL에 긍정적인 영향을 미칠 수 있으며, 불안 등 부정적인 감정의 경우 부정적인 영향을 미칠 수 있습니다.
    • 둘째, SDL(Mercer 2011)에 필요한 비판적 사고와 자기 평가를 촉진하기 위해서는, 경험에 대한 개방성, 성장 마인드, 창의성이 중요하다는 것을 알 수 있습니다.
    • 마지막으로 학습목표를 설정하기 위해서는 내적 동기부여가 중요합니다.이러한 목표는 SDL의 열쇠가 됩니다.

 

  • Second, what is referred to as the attitude for SDL consists of some characteristics and behaviour that seem important for the development of SDL in the individual learner (Guglielmino 1978; Fisher and King 2010). We define this attitude in terms of affect, openness and motivation.
    • Affect means to be in touch with your emotion or to show behaviour that is connected to emotions. Affect can have a positive influence on SDL when it involves interest or excitement, as well as negative influence in case of negative feelings such as anxiety (Brookfield 1995; Meyer and Turner 2002; Redwood et al. 2010).
    • Second, openness in terms of being open to experience, having a growth mindset, and being creative is shown to be important to stimulate critical thinking and self-evaluation which are needed for SDL (Mercer 2011).
    • Lastly, motivation in terms of intrinsic motivation is important for setting learning goals, which, as mentioned above, is key for SDL (Abd-El-Fattah 2010; Stockdale and Brockett 2011).

[진정한 맥락에서의 학습]과 [사회적 맥락에서의 학습]은 밀접하게 관련되어 있다. 첫째, SDL은 진정한 학습 환경을 통해 추진됩니다. 이러한 상황에는 팀으로 함께 일하는 상황이 포함되는 경우가 많습니다. 프로젝트, 시뮬레이션, 문제 기반 학습 등 SDL 강화를 목적으로 하는 교육 형식에는 모두 사회적 요소가 포함되어 있습니다. 진정한 학습 상황에서 SDL에게 중요한 것은 개인의 영향과 동기 부여에 대한 영향을 통해 사회적 상호작용이 학습을 결정한다는 것입니다(Johnson 및 Johnson 2009). 둘째, 모든 학습은 사회적이라고 주장할 수 있다. 따라서 SDL은 세계에 관한 지식을 구축하면서 세계를 이해하는 수단이라고 생각할 수 있다(Li 등 2010). 중요한 의미는 SDL의 개발이 컨텍스트를 구성하고 있다는 것입니다. 즉, 자기 주도적인 학습자는 조직 구조와 그룹에 포함되어 있습니다.
The ideas of learning in an authentic context and social context are closely related (Yardley et al. 2012). First, SDL is promoted by means of authentic learning situations, which often include working together in teams. Educational formats aimed at strengthening SDL such as projects, simulations or problem-based learning all involve a social component. Important to SDL in authentic learning situations is that social interaction determines learning because of the influence on individuals’ affect and motivation (Johnson and Johnson 2009). Second, one could argue that all leaning is social (Thoutenhoofd and Pirrie 2015). Hence, SDL may be conceived as a means to come to an understanding of the world, while constructing knowledge in relation to this world (Li et al. 2010). An important implication is that context constitutes the development of SDL. That is, the self-directed learner is embedded in organizational structures and groups.


그럼에도 불구하고 SDL에 대한 연구는 오랫동안 [개별 학습자]에 초점을 맞추고 있습니다. SDL에 대한 이러한 개인주의적 접근방식은 학습자가 개별적으로 작업하거나 행동하지 않는다는 점에서 [몇 가지 문제]를 일으킨다(Schmidt 2000). SDL에 관한 지금까지의 조사에서는, 사회적 환경이 SDL의 개발에 관여하는 것을 알 수 있었습니다. 일반적으로 학습의 경우, 사회적 메커니즘이 심리적 안전에 미치는 영향을 통해 학습 과정과 결과에 영향을 미친다는 것을 알 수 있다. 예를 들어, 팀 활동의 결과는 사회적 역학에 의해 영향을 받습니다. 왜냐하면 이러한 역학은 동기 부여와 토론의 깊이를 방해하거나 증가시킬 수 있기 때문입니다(Dolmans and Schmidt 2006). 게다가 팀워크에 대한 연구는 개방성에 영향을 미치는 사회적 과정이 전문직 경력 전반에 걸쳐 남아있다는 것을 보여준다. 따라서 개별 학습자의 SDL은 그룹 학습 과정과 교육 결과에 쉽게 일반화되지 않을 수 있다(Hommes 등 2014).
In spite of this, studies of SDL have long focused on the individual learner (Merriam 2001). This individualistic approach to SDL poses some problems, given that a learner does not work nor act individually (Schmidt 2000). Previous studies on SDL show that the social environment could play a role in SDL development (Levett-Jones 2005; Lee et al. 2010). For learning in general, we see that social mechanisms influence learning processes and outcomes through their impact on psychological safety (Beachboard et al. 2011; Hommes et al. 2014). For instance, outcomes of team activities are influenced by social dynamics because these can deter or increase motivation and depth of discussions (Dolmans and Schmidt 2006). Moreover, research on working in teams shows that social processes influencing openness remain throughout a professional career (de Groot et al. 2014). Therefore, SDL of the individual learner may not be easily generalized to the group learning process and outcomes in education (Hommes et al. 2014).

장래의 의료진이 팀워크를 실시할 때 SDL을 확실히 사용하고 싶은 경우는, 우선 의학교육에서 SDL을 사용하는 것을 추천합니다. 나아가야 할 방향은, 팀 내에서 학습이 어떻게 발전하는지를 더 이해하는 것입니다. 학생들이 자기 주도적인 학습자가 되기를 원한다면, 우리는 공부 시간 및 일정과 같은 [공식적인 메커니즘]과 팀 내에서의 그룹 결속 및 심리적 안전과 같은 [사회적 메커니즘]을 모두 고려해야 한다(Hommes et al. 2014). 개인의 SDL 행동이 그룹의 역동성에 의해 어떻게 영향을 받는지를 이해하면 교사와 교육자가 학생에게 팀 내 학습 방향을 올바르게 안내하는 데 도움이 됩니다. 따라서, 이 탐색적 연구 프로젝트에서는, [소그룹 학습]에서 SDL이 어떻게 발전하는지를 조사했습니다.
If we want to make sure that future medical professionals do use SDL when they work in teams, we should start with that in medical education. A way forward is to understand more about how learning develops within teams. If we want our students to be self-directed learners, we need to take into account both formal mechanisms such as study time and schedules, as well as social mechanisms such as group cohesion and psychological safety in teams (Hommes et al. 2014). Understanding how SDL behaviour of individuals is influenced by group dynamics will help teachers and educators to properly guide students towards learning in a team. In this exploratory research project, we, therefore, explored how SDL develops in students learning in small groups.

 

연구 프로젝트의 목적
Aim of the research project

우리는 두 가지 목표를 추구했다.

  • 우선, 학생의 SDL을 [의학 교육의 관점]에서 소그룹 학습으로 설명하고 싶다고 생각하고 있습니다.
  • 둘째, [그룹 역학]이 소규모 그룹 학습에서 SDL 행동을 어떻게 방해하거나 촉진하는지 알아보는 것을 목표로 했습니다.

We pursued two aims.

  • First, we wanted to describe students’ SDL in small group learning, in the context of medical education.
  • Second, we aimed to explore how group dynamics impedes or promotes SDL behaviour in small group learning.

 

방법
Method

맥락
Context

본 연구에서는 네덜란드 Nijmegen의 Radboudumc에서 [의학 및 생물의학 전공 1학년 학생들이 8개월 동안 팀을 이루어 건강(관리) 문제를 식별하고 정의하며 이를 위한 혁신적인 솔루션을 개발]하는 이른바 '혁신 프로젝트'의 맥락에서 SDL을 조사하기로 선택했습니다. 그러기 위해서는 혁신 프로젝트가 실제 상황과 매우 유사하도록 하는 분야(의사, 환자, 업계, 의료 관리 등)의 이해관계자와 협력해야 합니다. 중요한 것은 프로젝트 과제가 사전에 정의된 세부 가이드라인 없이 제공된다는 것입니다. 학생은 자신의 프로젝트를 관리하고 학습 프로세스를 지시합니다. 이 설정은 그룹 작업, 목표 설정, 감시가 장기간에 걸쳐 필요하기 때문에 그룹별로 SDL에 대한 조사에 적합합니다.
In this study, we choose to investigate SDL in the context of the so-called ‘Innovation project’, where first year students of medicine and biomedical sciences of the Radboudumc, Nijmegen, the Netherlands, over an 8-month period work in teams to identify and define a health(care) problem, and develop an innovative solution to it. To be able to do so, they need to engage with stakeholders in the field (physicians, patients, industry, healthcare management, etcetera), which ensures that the Innovation project closely resemble an authentic situation. Importantly, the project assignment comes without detailed predefined guidelines; students manage their own projects and hence direct their own learning processes. This setting is suitable for our research on SDL in groups, because it requires group work, goal setting and monitoring over a long period of time.

팀은 4~6명의 학생으로 구성되며, 팀의 45%는 의대생과 생물의대생이 혼합된 팀입니다. 팀은 일반적으로 자신의 이상과 아이디어를 바탕으로 혁신 주제를 자유롭게 선택하거나 친척이나 친구의 건강 문제에 직면할 수 있습니다. 예를 들어, 한 그룹의 학생들이 아이들이 천식 약을 기억하도록 돕는 게임을 고안했다. 또 다른 팀은 안약을 필요로 하는 환자들이 디스펜서를 더 잘 배치하고 복용량을 조절할 수 있도록 도와주는 장치를 고안했다. 이들은 실제 파트너와 협업하고 이해관계자 인터뷰를 기반으로 컨텍스트 분석을 수행하며 혁신적인 아이디어의 일부를 실현하려고 합니다. 학생들은 SDL 전략을 사용할 필요가 있습니다. 자신의 경험과 효과를 반영하고 이를 바탕으로 프로젝트 전체의 장기적인 목표와 관련된 미팅의 학습 목표를 특정해야 한다. 결국, 각 팀은 프로토타입 또는 모델의 형태로 혁신을 제공합니다. 또한, 그들은 자신의 혁신을 설명하는 그룹 보고서를 작성하고, 자신의 학습 과정과 그룹 과정에 대한 성찰 에세이를 개별적으로 작성합니다. 프로젝트의 최종 성적은 보고서와 에세이 결과에 기초한다.
Teams consist of 4–6 students and 45% of the teams are mixed teams with both medical and biomedical students. Teams are free to choose a topic for innovation, which is commonly based on their own ideals and ideas, or encounters with health(care) problems of relatives or friends. For example, a group of students designed a game to help children remember their asthma medication. Another team designed a device to help patients who need eye medication to better position the dispenser and control the dosage. They collaborate with real-world partners, perform a context analysis based on stakeholder interviews and try to realize part of their innovative idea. Students need to use SDL strategies: they reflect on their experiences and effectiveness, and on this basis they identify learning goals for the meetings that relate to their long-term goals for the entire project. In the end, each team delivers an innovation in the form of a prototype or model. In addition, they write a group report explaining their innovation, and they individually write a reflection essay about their own learning process and the group process. The final grade for the project is based on the results of both the report and the essay.

학생들은 자신들의 주제에 대해 어느 정도 전문 지식을 가진 교수자, 소위 '혁신-전문가'로부터 지도를 받을 수 있습니다. 또한 최종 프로젝트와 그룹 프로세스를 코스 마지막에 채점합니다. 그 다음, 학생들은 현실 세계에서 '고객'을 찾습니다. 즉, 혁신 분야의 기업 또는 개인 이해관계자이기 때문에 학생들에게 혁신 개발을 알리거나 도울 수 있습니다. 프로젝트 기간 동안 학생들을 지도하기 위해 과정 내내 한 달에 한 번 워크샵에 참여할 수 있습니다. 워크숍 내용은 다음과 같습니다. 팀워크(Belbin 2014), 이해관계자 분석, 인터뷰 스킬 및 프로젝트 관리에 있어 역할을 이해하는 데 도움이 되는 Belbin 역할.

Guidance is available from teachers with some expertise on the student’s topic, the so-called ‘Innovation-experts’, whom students can approach for support. This person also grades their final project and the group process at the end of the course. Next to that, the students find a ‘Customer’ in the real world: a company or individual stakeholder in the area of the innovation and thus can inform or help the students with the development of their innovation. To guide the students during the project, they can participate in workshops once a month throughout the course. Workshops include: Belbin roles to help understand roles in teamwork (Belbin 2014), stakeholder analysis, interviewing skills, and project management.

 

참가자 선정 및 모집
Selection and recruitment of participants

2016년 11월 이노베이션 프로젝트 과정의 첫 번째 워크숍에서 우리는 모든 학생을 이 연구에 참여시키고 8개월 프로젝트 기간 동안 팀 미팅에서 관찰하도록 초대하였습니다. 학생 그룹을 집중적으로 추적하고 싶었기 때문에 연구자가 대부분의 학생 팀 회의에 참석할 수 있도록 최소 3개 팀, 최대 7개 팀을 포함시키는 것을 목표로 했습니다. 학생들은 그룹 전체가 연구에 참여하기로 동의해야만 모집되었다. 그들은 사전동의서를 작성했고 첫 번째 작성자의 연락처를 받았다. 그 후 학생들은 이메일이나 WhatsApp을 통해 첫 번째 작가에게 연락하여 그들의 약속에 대한 최신 정보를 계속 전달했습니다. 첫 번째 저자가 한 달 넘게 학생들로부터 소식을 듣지 못하자, 그들이 여전히 연구 프로젝트에 참여하고 싶은지에 대한 질문과 함께 독촉장이 보내졌다. 학생들의 그룹 미팅에서, 첫 번째 작가는 대화를 녹음하고 짧은 메모를 했다. 그룹 회의의 녹화 허가를 미리 요청하고 각 녹화 시작은 항상 학생들에게 명시적으로 언급되었습니다. 이 연구의 프로토콜은 네덜란드 의학 교육 협회(NVMO)의 윤리 검토 위원회(파일 번호 677)에 의해 승인되었다.

During the first workshop of the Innovation project course in November 2016, we invited all students to participate in this study and be observed during team meetings throughout the 8-month project. We wanted to intensively follow the groups of students, so to make sure a researcher would be able to attend most meetings of the student teams, we aimed to include at least three teams and a maximum of seven teams. Students were only recruited if the entire group agreed to participate in the study. They filled out an informed consent form and received contact information of the first author. Students then approached the first author via e-mail or WhatsApp, to keep her updated about their appointments. When the first author did not hear from the students for more than a month, a reminder was sent along with the question whether they still wanted to participate in the research project. During the group meetings of the students, the first author made audio recordings of the conversation and kept short notes. Permission to make recordings of the group meetings was asked beforehand and the start of each recording was always explicitly mentioned to the students. The protocol for this study was approved by the ethical review board of the Netherlands Association for Medical Education (NVMO), file number 677.

데이터 수집
Data collection

이 연구는 오디오 녹음에 기초한 정성적 연구로 설정되었다. 이 연구는 Giacomini와 Cook(2000)의 질적 연구에 대한 지침을 따랐다. 이전 연구에 따라 대부분의 학습 행동이 명시적으로 발생할 것으로 예상하였다(Chi 2009). 그룹 프로세스의 일부 측면은 의견 불일치를 나타내는 눈살을 찌푸리거나 반성을 위해 잠시 멈출 시간을 나타내는 웅얼거림처럼 구두로 나타나지 않을 수 있기 때문에 첫 번째 저자는 추가적인 관찰을 하기 위해 항상 동석했다. 오디오 녹음은 분석 전에 녹음되었습니다(단절과 망설임 포함). 학생 이름이 숫자 식별자로 대체되었습니다. 학생들의 목소리는 녹취록 전반에 걸쳐 각각의 학생들이 동일한 식별자를 가지고 있는지 확인하기 위해 추적되었다. 이렇게 하면 그룹뿐만 아니라 그룹 내 개별 학생도 시간이 지남에 따라 그룹 역학에서 패턴을 볼 수 있고 학생들이 역할을 수행하거나 역할을 바꾸는 것을 볼 수 있습니다.
This research was set up as a qualitative study, based on audio recordings. This study followed the guidelines for qualitative research of Giacomini and Cook (2000). Following previous research, we expected most of the learning behaviour to occur explicitly (Chi 2009). Since some aspects of the group process may not manifest themselves verbally, such as a frown indicating disagreement or a hum indicating a moment to pause for reflection, the first author was always present to make additional observations. The audio recordings were transcribed before analysis, including breaks and hesitations. Student names were replaced by numeric identifiers. The students’ voices were traced to make sure each student had the same identifier throughout the transcripts. This way, we could follow not only the group, but also the individual student in the group over time, to see patterns in group dynamics and students taking on roles or changing roles.


학생 팀은 평균 2주에 한 번 만났고, 특히 프로젝트 시작과 종료에 한 주에 두 번 만난 팀도 있었습니다. 회의 중에 학생들은 프로젝트의 진행 상황에 대해 토론하고, 정보를 공유하고, 계획을 세우고, 약속을 정하고, 아이디어를 실험하고, 보고서를 쓰고, 서로를 알아가는 데 시간을 보내고, 불평하고, 어려움을 공유하는 등 여러 활동을 할 수 있다. 우리는 총 39회의 학생회의를 기록했고, 이는 기록된 시간의 23시간 이상에 달했다. 학생들은 몇 번 더 회의를 가졌지만 연구원이 참석하지 못하거나 다른 그룹의 회의가 겹치는 시간이었습니다. 간섭을 최소화하기 위하여, 우리는 첫 번째 저자(TW)만 관찰을 하도록 결정했다.

The student teams met once every 2 weeks on average, with short peak moments when some of the teams met two times in 1 week, especially in the beginning and at the end of the project. During the meetings, students could have several activities: they may discuss the progress of the project, share information, make plans, set appointments, experiment with ideas, write on their report, spend time getting to know each other, complain, share hardship, etc. We recorded 39 meetings of the students in total, which amounted to over 23 h of recorded time. The students had some more meetings, but those were on times when the researcher could not be present or the meeting of different groups was overlapping. For reasons of being minimally intrusive, we decided to let only the first author (TW) make the observations.

 

데이터 분석 및 템플릿 개발
Data analysis and template development

템플릿 분석을 사용하여 데이터를 코드화하고 구조화함으로써 보충 부록에 표시된 템플릿으로 이어졌습니다. 템플릿 분석은 다른 인식론 및 온톨로지에 적용할 수 있는 방법입니다. [사회적 구성주의 패러다임]이 결과를 체계화하기 위해 사용되었습니다. 이러한 관점에서 SDL은 세계를 이해하기 위한 수단으로서 개념화되어 있으며, 세계에 관한 지식을 구축하고 있습니다(Li et al. 2010). 이 인식론과 우리의 연구 목적에 부합하는 주요 관심사는 사회적 맥락이 SDL의 발전을 어떻게 구성하느냐이다. 이는 개별 학습 행동 대신 대화에서 학생과 에피소드 간의 상호작용에 초점을 맞췄다는 것을 의미한다. 참가자가 대화할 때 데이터가 수집되었기 때문에 코드는 이러한 상호작용을 반영합니다. 예를 들어, '정서적 가이드'는 누군가의 감정 표현에 대한 반응을 반영하는 코드이며, '계획과 실행'은 개인이 아닌 그룹 토론에서 이루어졌다.
We used template analysis to code and structure the data (Waring and Wainwright 2008; Brooks and King 2012), which led to the template displayed in Supplementary Appendix. Template analysis is a method that can be adapted to different epistemology and ontology (Braun and Clarke 2006; Brooks et al. 2015). A social constructivism paradigm was employed to frame the results. From this point of view, SDL is conceptualized as a means to come to an understanding of the world, while constructing knowledge in relation to this world (Li et al. 2010). Given this epistemology and in line with our research aims, a major concern is how the social context constitutes the development of SDL (Thoutenhoofd and Pirrie 2015). This means that the focus was on interactions between students and episodes in their conversation, instead of individual learning behaviour. Since data were collected when the participants were in a conversation, the codes reflect this interaction. For instance, ‘Emotional guidance’ is a code reflecting a reaction on someone’s expression of emotion, and ‘Planning and implementation’ took place in group discussions, not individually.

템플릿의 첫 번째 버전은 1년 전에 동일한 코스의 별도의 파일럿 연구에서 처음 개발되었으며, 이는 현재 연구와 유사하며 혁신 프로젝트의 맥락에서 수행되었습니다. 이 템플릿은 처음에 3개의 트랜스크립트의 오픈 코딩에 의해 작성되었습니다. 그런 다음 다양한 설문지(MSLQ, SDL-SRS, SDLRS, PRO-SDL; 문학: Brookfield (1995), de Groot et al. (2014), Lloyd-Jones 및 Turner (2004)에서 SDL 및 관련 학습 행동의 정의를 인용하여 문헌에 맞게 조정했다. 그 결과 43개의 코드로 구성된 초기 코드북이 생성되었습니다. 
A first version of the template was initially developed in a separate pilot study in the same course 1 year earlier, which was similar to the present study and conducted in the context of the Innovation project as well. This template was initially constructed through open coding of three transcripts. These codes were then aligned to literature by taking the definitions of SDL and related learning behaviour from different questionnaires: MSLQ (Pintrich et al. 1993), SDL-SRS (Fisher and King 2010), SDLRS (Guglielmino 1978), PRO-SDL (Stockdale and Brockett 2011); and literature: Brookfield (1995), de Groot et al. (2014), Lloyd-Jones and Hak (2004), Meyer and Turner (2002), Redwood (2010). This resulted in an initial codebook of 43 codes.


다음 단계에서는 현재 프로젝트의 대본을 읽고 성찰성 노트를 보관했습니다. 데이터에 익숙해진 후, 두 명의 연구자(TW와 동료는 학력이 있지만 프로젝트에 공식적으로 참여하지 않은 사람)가 템플릿을 사용하여 4개의 트랜스크립트를 코드화했다. 동기 부여 또는 목표 설정 행동과 관련된 인용문에 대해 차이가 발생했다. 예를 들어, 이러한 차이에 대한 논의는 학생들이 프로젝트나 다른 학습 목표를 완수할 수 있을지 고민한다는 것을 인정하는 '자기 개념' 코드를 추가하는 결과를 낳았다. 다른 예로는 일부 코드의 삭제 또는 조정이 있습니다. 예를 들어, 우리는 '배움의 사랑'을 사용하기로 하고, 밀접하게 연관된 '배움의 욕구'를 없앴다. 다음으로 템플릿은 TW, JK 및 GW에 의해 3개의 추가 트랜스크립트에 사용되었습니다. 코딩의 나머지 차이점을 논의하여 해결하였다(TW, JK, RR, GW). 이를 통해 템플릿의 최종 버전이 생성되었습니다. 그룹 회의의 39개의 모든 대화록은 이 템플릿을 사용하여 코드화되었습니다.
In the next step, the transcripts of the current project were read, and reflexivity notes were kept. After becoming familiar with the data, two researchers (TW and a colleague with an educational background but no formal affiliation to the project) coded four transcripts by use of the template. Differences occurred for quotes relating to motivation or goal-setting behaviour. Discussion about these differences resulted in, for instance, adding a code ‘Self-concept’ to acknowledge that students contemplated whether they would be able to complete the project or other learning goals. Another example is removal or adjustments of some codes: We decided, for instance, to use ‘Love of learning’ and removed the closely related ‘Desire for learning’. Next, the template was used by TW, JK and GW for three additional transcripts. Remaining differences in coding were discussed and settled (TW, JK, RR, GW). This led to the final version of the template. All 39 transcripts of group meetings were coded using this template.

Atlas.ti® 소프트웨어 버전 8을 사용하여 스크립트를 코드화하고 분석했습니다. Atlas.ti에서 프로세스를 보다 잘 이해하기 위해 시퀀싱 분석을 실시하였습니다. 이 방법은 여러 코드 간의 가장 중요한 관계를 이해하는 데 도움이 됩니다. 이 그룹의 프로젝트 보고서 최종 성적, 반영 보고서 및 과정의 최종 성적도 고려되었습니다.
We used Atlas.ti® software version 8 to code and analyse the transcripts. To understand more about the processes, we conducted a sequencing analysis in Atlas.ti. This method helps to understand what the most prominent relations between the different codes are. The group’s final grades for the project report, the reflection report and final grade for the course were also taken into account.

 

성찰성
Reflexivity


저자인 JK, RR, GW, TW는 모두 교사로서 이노베이션 프로젝트에서 적극적인 역할을 했으며, 코스의 이념에 공감했습니다. JK, RR 및 GW에게 이노베이션 프로젝트는 프로젝트가 (바이오) 의학 커리큘럼의 필수적인 부분이 되기 전에 소규모 환경에서 시범적으로 시행한 아이디어였습니다. 학생 전체로 확대하는 것은 고객이 설정한 과제에서 벗어나는 등 일부 타협을 수반했지만, 그들의 약속에는 영향을 미치지 않았습니다. AJ는 연구원으로서 이노베이션 프로젝트에 관여하지 않았지만, 더 큰 규모의 연구 프로젝트에 관여했습니다. 사회적 구성주의적 패러다임은 의미 형성 과정에서 우리를 인도했다. 여기에는 대화록의 상호 작용과 대화록에 부여되는 의미가 모두 함께 만들어졌다고 생각하는 것도 포함됩니다. 환경과 학습자는 서로 영향을 미치지만, 연구자와 그 환경 또한 서로 영향을 끼친다. 이 의미가 어떻게 구성되는지에 대한 이해를 돕기 위해, 우리는 대화록의 일부를 보여주고 어떻게 해석했는지 설명하는 것이 중요하다고 생각합니다.

The authors JK, RR, GW and TW all had an active role in the Innovation project as teachers and sympathized with the ideology of the course. For JK, RR and GW, the Innovation project was an idea that they had piloted in a smaller setting, before the project became an integral part of the (bio)medical curricula. Scaling up to the entire student population did involve some compromises, such as departing from assignments set by clients, but that did not influence their commitment. AJ as researcher was not involved in the Innovation project but affiliated with the larger research project. A social constructivist paradigm guided us in the process of meaning-making. This includes that we think that both the interactions in the transcripts, as well as the meaning we give to the transcripts, is co-created. The environment and learner influence each other, but also the researcher and his/her environment influence each other. To give insight into how this meaning is constructed, we think it is important to show parts of the transcripts and explain how we interpreted this.

결과.
Results

참가자 및 수집된 데이터
Participants and gathered data

세 그룹의 학생들이 이 프로젝트에 참여하기로 합의했다. 그들은 회의를 할 때 연구원에게 연락했다. 그룹에 대한 설명은 표 1에서 찾을 수 있습니다. 이들 3개 그룹 중 2개 그룹은 생물의학과 의대생 모두 혼성팀이었다. 한 팀은 의대생으로만 구성되었다. 남학생 비율(26%)과 의대생 비율(66.6%)은 남학생 30%, 의대생 65%로 학생 수가 많은 것과 비슷했다.

Three groups of students agreed to be part of this project. They contacted the researcher when they had a meeting. A description of the groups can be found in Table 1. Two out of the three groups were mixed teams with both students from biomedical sciences and medicine. One team consisted of only medicine students. The percentage of males (26%) and the percentage of medicine students (66,6%) was comparable to the larger student population with 30% males and 65% students of medicine.

총 39개의 스크립트를 코드화하여 템플릿으로 텍스트의 약 34.19%를 코드화할 수 있었습니다. 텍스트의 다른 부분은 전날 학생들과 있었던 일 또는 다음날 일어날 일 등 잡담을 포함하고 있었다. 그들이 이야기할 주제는 음식, 친구, 대중교통 문제, 또는 프로젝트, 팀, 그리고 학습과 관련이 없는 것으로 보이는 다른 주제들이다. 학습과 관련된 토론(예: 다른 과정이나 바쁜 일정에 대한 토론)은 코드화되었습니다. 표 2는 그룹이 얼마나 자주 관찰되었는지를 요약한 것이다.

We coded 39 transcripts in total and could code about 34.19% of the text with our template. The other parts of the text involved small talk: things that happened with the students the day before or what would happen the next day(s). Topics they would talk about were food, friends, problems with public transport, or other topics that evidently were not related to the project, the team, and learning in general. Discussions that did relate to learning, e.g., about other courses or their busy schedule, were coded. Table 2 summarizes how often the groups were observed.

 

게다가, 많은 녹음물이 소셜 토크나 가십을 포함하고 있기 때문에, 학생들은 자유롭게 대화하는 것처럼 보였는데, 녹음물이나 연구원의 존재에 대해 학생들이 매우 경각심을 가졌다면 아마 일어나지 않았을 것이다. 그들은 종종 연구나 연구자의 상태에 대해 묻곤 했지만, 보통 그들의 대화에 연구자를 끌어들이지 않았다. 성적표 1에서 볼 수 있듯이, 학생들은 서로 녹음에 대해 상기시켰습니다.

Furthermore, students appeared to have talked freely as many recordings involved social talk or gossip, which would probably not occur had the students been highly alert about the recordings or the presence of the researcher. They usually did not engage the researcher in their conversations, although sometimes they would ask about the research or how the researcher was doing. At some points students reminded one another or themselves about the recordings, as can be seen in Transcript 1.

 

소규모 그룹 학습에서의 SDL 설명
Description of SDL in small group learning

첫 번째 연구의 목적은 소규모 그룹 학습의 맥락에서 SDL이 어느 정도 발생하는지를 이해하는 것이었습니다. 템플릿 내 코드의 개요를 표 3에 나타냅니다. 또한 이 표는 코드가 다른 그룹에서 인식된 정도를 나타내며, 각 그룹의 모든 인용에 대한 백분율로 나타냅니다. 템플릿에 대한 자세한 개요는 부록을 참조하십시오. 자기 모니터링, 지식 습득 및 대인 관계가 가장 자주 코드화되었습니다.
The first research aim was to understand the degree to which SDL occurs in the context of small group learning. An overview of the codes in the template is displayed in Table 3. This table also shows the degree to which the codes have been recognized in the different groups, expressed as a percentage of all quotations of each group. A more detailed overview of the template can be found in Supplementary Appendix. Self-monitoring, knowledge acquisition and interpersonal behaviour were coded most often.

 

그룹 다이내믹스와 SDL
Group dynamics and SDL

두 번째 연구 목표는 소규모 그룹에서 그룹 역학이 SDL을 촉진하거나 방해하는 방법을 이해하는 것이었다. Atlas.ti의 시퀀스 분석에서는 자기 모니터링(예를 들어 무엇을 알아야 합니까?)과 비판적 사고(예를 들어, 그러한 가정이 유효한가요?)가 지식 습득을 유도하는 것으로 자주 나타나지만(예를 들어, 다른 정보 소스를 사용하여 학습하는 등), 책임감에 대해서도 마찬가지다(예를 들어 학생이 뭔가 해야 한다고 느낌). 이러한 관계는 단방향적이지 않다: 학생들은 다른 종류의 행동들 사이를 왔다 갔다 할 수 있다. 예를 들어, 스트레스(감정)의 느낌을 표현하는 것이 그룹 내 학생들이 이에 대해 토론하고 서로 지지하도록 만들어줄 수 있는 반면(대인 행동), 그룹 프로세스에 대한 피드백에 대한 직접적인 질문(대인 행동)은 스트레스나 좌절감(감정)을 공유하는 것으로 이어질 수 있다. SDL의 메카니즘을 특정하기 위한 본 연구의 목적을 고려하여 자기 감시, 지식 습득, 비판적 사고 하에 파악된 그룹 역학이 이러한 학습에 영향을 미치는 관계에 초점을 맞추고 있습니다. 또, SDL에 관해서 개인이 팀에 영향을 주는 메카니즘도 포함했습니다.이 메카니즘에 근거해, 다음의 3개의 메카니즘은 다음과 같습니다.

The second research aim was to understand more about the way group dynamics promote or impede SDL in small groups. The sequencing analysis in Atlas.ti shows many relations, for instance self-monitoring (e.g., what do we need to know?) and critical thinking (e.g., is that assumption valid?) are often seen to induce knowledge acquisition (e.g., using different sources of information to learn), but this is also the case for responsibility (e.g., a student feeling he or she needs to do something). These relations are not unidirectional: students can go back and forth between the different kinds of behaviour. For example, expressing feelings of stress (affect) may lead the students in a group to discuss this and support one another (interpersonal behaviour), whereas direct questions for feedback about the group processes (interpersonal behaviour) may lead to sharing feelings of stress or frustration (affect). In view of the aim of our study to identify mechanisms of SDL, we have focused on relations where group dynamics influenced this kind of learning as captured under self-monitoring, knowledge acquisition, and critical thinking. We also included mechanisms by which the individual had an influence on the team in terms of SDL. On this basis, we have identified three main mechanisms, where:

  • [감정]은 [자기 모니터링 또는 책임]으로 이어지는 대인 행동을 유도한다.
  • [개방성]이 [비판적 사고]를 유지시킨다.
  • [논쟁적 대화]는 [배움을 좌절]시킨다.
  1. Affect induces interpersonal behaviour leading to self-monitoring or responsibility
  2. Openness sustains critical thinking
  3. Disputational talk frustrates learning.

이러한 메카니즘에 대해서는, 이하에 자세하게 설명합니다.

We explain these mechanisms in greater detail below.

 

영향 및 대인관계 행동
Affect and interpersonal behaviour

학생 집단에서 [감정]은 [스트레스나 분노]의 감정을 표현하는 방식으로 나타나는 경향이 있다. 학생들은 그들이 경험하는 스트레스, 프로젝트의 결과에 대한 두려움, 또는 때때로 어떻게 동기를 잃는지에 대해 이야기함으로써 그룹 내에서 그들의 감정을 드러낸다. 이러한 발언에 대한 반응은 학생 그룹마다 다르며 다양하다. 어떤 그룹에서는, 그 반응은 대부분 개인적인 것이고 누군가의 기분을 좋게 만드는 것을 목표로 한다. 다른 그룹에서는 대부분 학습 과정으로 반응이 향합니다. 통상적으로, [감정]은 SDL 프로세스의 시작을 나타냅니다. 두 가지 방식의 반응은 모두 최종적으로 SDL 동작으로 이어집니다.
Affect tends to show in the groups of students by expressing emotions of stress or anger. Students show their emotions in the group by talking about the stress they experience, their fears about the outcomes of the project, or how they sometimes lose motivation. The reaction to these remarks differs and varies between the groups of students. In some groups, the reaction is mostly personal and targeted at making someone feel better. In other groups, the reaction is mostly directed towards the learning process. Usually affect marks the start of a SDL process, with both kinds of reaction leading to SDL behaviour in the end.

예를 들어, 한 그룹에서 한 학생이 프로젝트에 대한 동기를 유지하는 데 어려움을 겪고 있다고 말합니다. 그녀는 이 프로젝트를 즐기지 않는 반면, 그녀의 동료들은 그것에 열광하기 때문에 이것에 대해 화가 나 있다. 게다가, 그 그룹은 저녁을 함께 먹고 대학 밖에서 만나는 등 꽤 친해졌다. 학생이 자신의 문제에 대해 목소리를 높이면, 그 그룹은 정확히 무슨 일이 일어나고 있는지 탐색함으로써 그 문제를 추적합니다. 그리고 나서 그들은 어떻게 그들이 학생을 도울 수 있는지에 대한 결론에 도달한다. 이렇게 하면 Transcript 2에서 볼 수 있듯이 그룹이 공동 책임을 집니다.

For instance, in one group a student tells that she has trouble staying motivated for the project. She is upset about this, because she does not enjoy the project, whereas her peers are enthusiastic about it. Moreover, the group has become quite close, having dinner together and meeting up outside university. When the student speaks up about her problem, the group follows up on that by exploring what is going on exactly. They then come to a conclusion about how they can help the student. This way the group assumes a shared responsibility, as seen in Transcript 2.

 

또 다른 예에서, 한 학생은 또한 동기 상실을 언급하고, 마감시한에 의한 압박도 느끼지 않음을 암시한다. 그녀는 또한 의욕이 없는 것에 대해 화가 나 있다. 그녀의 코멘트에도 불구하고, 그녀는 그녀의 어조로 압박감을 전달한다. 그 그룹은 감정을 모방하고 다양한 해결책을 제시함으로써 반응한다. 그런 다음 프로젝트에서 수행할 다음 단계를 결정합니다. 이 경우 동료들의 반응은 개인적인 문제보다는 학습 과정에 초점이 맞춰집니다. 대화 내용은 Transcript 3에 나와 있습니다.

In another example, a student also mentions a loss of motivation, and implies that she misses the pressure from a deadline. She is also upset about not being motivated. Despite her comment, she does convey feelings of pressure in her tone of voice. The group reacts by mimicking the feelings and offering a variety of solutions. They then go on to decide on the next steps to take in the project. In this case, the reaction of the peers is focused on the learning process rather than the personal problem. The conversation is shown in Transcript 3.

 

개방성이 비판적 사고를 유지하다
Openness sustains critical thinking

두 번째 메커니즘은 [개방성]과 [비판적 사고]를 포함한다. Transcript 4에서 한 학생이 문학 검색 결과를 자신의 주제에 대한 생각과 연관지어 질문하고 정보를 놓치지 않도록 합니다(비판적 사고). 또한 학생들은 그것이 어떨지 상상하고 그것에 대한 몇 가지 생각을 실험하기 위해 개방성과 관련된 발언들을 포함한다. 따라서, 이 대본은 개방성과 비판적 사고가 서로를 어떻게 강화시키는지 보여준다.
The second mechanism involves openness and critical thinking. In Transcript 4, one of the students is questioning the results of their literature search by relating it to her own idea about the topic and trying to make sure they have not missed out on information (critical thinking). It also involves some remarks that relate to openness, as students try to imagine what it would be like and experiment with some thoughts on that. Thus, the transcript shows how openness and critical thinking reinforce each other.

정보의 공유와 다양한 지식의 원천의 결합은 Transcript 5에 나타나 있다. 이것은 [지식 습득과 비판적 사고의 관계]를 예시하고 있으며, [개방성]도 이에 한몫하고 있다. Transcript 5는 비판적 사고를 표현하는 학생을 보여준다. 다른 그룹 구성원의 반응은 지식 습득에서 시작해 개방성으로 변한다.

Sharing information and combining different sources of knowledge is seen in Transcript 5. This exemplifies the relation between knowledge acquisition and critical thinking, and that openness plays a role in this as well. Transcript 5 shows a student expressing critical thinking. The reaction of the other group members starts with knowledge acquisition and turns into openness.

 

논쟁적 대화는 배움을 좌절시킨다.
Disputational talk frustrates learning

세 번째 메커니즘은 [논쟁적 대화]에 관한 것입니다. 이것은 학습 과정에서 [생각의 선을 멈추는 상호작용]입니다. 학생들은 종종 [교육조직의 문제]를 인식한다. 예를 들어 디지털 학습 환경에 파일을 업로드할 수 없거나, 회의를 준비하려고 할 때 팀원 개개인의 스케줄로는 업로드할 기회가 없습니다. 이는 좌절감을 야기하고 결국 눈앞의 일에 더 이상 집중할 수 없게 될 수 있습니다. 다음 대본은 대화가 계획에서 논쟁적인 대화로 어떻게 흘러가는지를 보여준다. 이 경우 학생들은 해야 할 일의 양에 압도감을 느끼고 시간에 쫓긴다. 학생들은 최종 보고서를 위한 계획을 세우지 않고 피드백 시간을 계획하지도 않습니다.
The third mechanism concerns disputational talk, which is an interaction that stops the line of thinking, in this case, in a learning process. Students often perceive problems with the organization of education. For instance, when they cannot upload a file to the digital learning environment, or when they try to arrange a meeting, but the schedules of the individual team members leave no opportunity to do that. This may result in feelings of frustration and ultimately escalate in not being able to focus on the task at hand anymore. The next transcript illustrates how the conversation goes from planning to disputational talk. In this case, the students feel overwhelmed by the amount of work they need to do and feel time pressure. The students do not come back to planning for the final report, nor to scheduling a feedback moment.


학생들이 좌절감이나 다른 부정적인 감정들에 어떻게 대처할 수 있는가는 또한 그룹에 달려있다. 어떤 학생들은 부정적인 감정을 공유하는 데 유능하고 그 이후에 나아갈 수 있다. 다른 그룹에서는, 개인 차원이나 그룹 차원 중 하나에서 더 깊은 감정이나 사회적 문제가 있을 때, 그들은 상세한 설명을 삼가는 경향이 있다. 학생들은 동료들로부터 통합을 받기도 하지만, 아래 설명과 같이 항상 원인이나 해결책에 대해 논의하지는 않습니다. 이 그룹에서는 스트레스를 받은 학생들이 다른 학생들이 충분히 열심히 공부하지 않거나 프로젝트에 대한 동기부여가 되지 않는다는 생각을 가지고 있었기 때문에 결국 더 심해졌다. 이것은 좌절과 오해로 이어졌다.
How students can cope with frustration or other negative emotions also depends on the group. Some students are competent at sharing negative emotions and can move on after that. In other groups, when it comes to deeper emotional or social problems on either an individual level or group level, they tend to refrain from elaborating. Although students receive some consolidation from their peers, they do not always discuss the causes or solutions, as shown in the transcript below. In this group, it ultimately escalated, because the students that felt stressed had the idea that the other students did not work hard enough or were not motivated for the project. This led to frustration and misunderstanding.

 

논의
Discussion

학생들이 그룹 작업에서 SDL을 어떻게 사용하는지에 대한 질문에 답하기 위해 1학년 동안 3개의 프로젝트 그룹을 추적했습니다. 모든 그룹은 어느 정도 SDL을 보였지만, [자기 모니터링]와 [대인 행동] 면에서 차이가 있었다. SDL 개발에서 그룹을 지도하려면 이러한 차이를 이해해야 합니다.

따라서 두 번째 연구 질문의 초점은 그룹 역학으로, SDL이 표면화되거나 표면화되지 않는 이유를 설명할 수 있는 행동 패턴을 식별하려고 했다. 본 연구의 결과는 [감정(정동)을 공유 및 토론하는 능력과 개방성]이 [자기 모니터링]과 [비판적 사고] 측면에서 SDL에 긍정적인 영향을 미치는 반면, [논쟁적인 대화]는 이 과정을 저해하는 것으로 보일 수 있음을 시사합니다.

To answer the question how students employ SDL in group work, we followed three project groups of students throughout one academic year. All groups showed SDL to some extent, but there were differences in terms of self-monitoring and interpersonal behaviour. If we want to guide groups in SDL development, we need to understand these differences.

Therefore, the focus of the second research question was on group dynamics, trying to identify patterns of behaviour that could explain why SDL does or does not surface. The results of the present study suggest that a capability to share and discuss emotions (affect) and openness influence SDL positively in terms of self-monitoring and critical thinking, whereas disputational talk sometimes appears to inhibit this process.

 

메커니즘
Mechanisms

첫 번째 메커니즘은 [감정]과 [대인관계 기술]이 SDL 행동을 향한 프로세스에서 중요한 역할을 한다는 것을 나타냅니다. 학생들이 해결해야 할 문제의 지표로서 감정을 인식하는 것은 중요하다. 이것은 학습의 중요한 출발점이 되는 이전의 발견과 일치합니다. 현재의 연구는 [감정]이 [자기 모니터링]와 [비판적 사고]의 관점에서 시간을 효과적으로 사용할 수 있다는 것을 보여준다. 이것은 감정과 감정 조절이 자기 조절에 중요하다는 것을 발견함으로써 입증된다. 감정은 또한 내재적 동기 부여와 학습에 필요한 의미를 지닌 사건을 나타낼 수 있다(Boyd 2002; Redwood 등 2010). 하지만 학생 그룹은 이 문제에 대해 다른 방식으로 대처한다는 것을 알게 되었습니다. 일부 그룹은 감정의 신호 전달 기능을 무시했고, 자기조절이나 비판적 사고를 강화하는 측면에서 이득을 얻지 못하였다.
The first mechanism indicates that affect and interpersonal skills play a key role in the process towards SDL behaviour. It is important for students to acknowledge emotions as an indicator of a problem that needs to be solved. This is in line with previous findings that affect is an important starting point for learning (van Woezik et al. 2019). The present study shows that affect can then lead to effective use of the time in terms of self-monitoring and critical thinking. This corroborates with the finding that emotion and emotion regulation are important for self-regulation (Lajoie et al. 2019). Affect may also indicate events that have meaning, which are necessary for intrinsic motivation and learning (Boyd 2002; Redwood et al. 2010). We did find however, that groups of students deal with this in different ways. Some groups may in fact disregard this signalling function of affect and not benefit from in terms of enhancing self-regulation or critical thinking.

우리는 [개방성]이 비판적 사고를 유지하는 데 중요한 역할을 한다는 것을 발견했다. 새로운 관점에서 문제를 비판적으로 성찰하고 가능한 해결책으로 이어질 수 있는 새로운 사고와 정교함을 장려합니다. 게다가, 개방성은 학생들이 집단 사고에 도전할 수 있게 하는데, 이는 비판적 사고에 대한 이전의 연구와 일치한다. 이러한 개방성의 특징은 성장형 마음가짐과 일치하며, 이는 학습이 실수가 문제가 되지 않는 과정으로 짜여진다는 것을 의미합니다. 본 연구에서는 [대인관계 행동]이 이러한 성장 마인드를 확립하는 데 중요할 뿐만 아니라, 그룹 내에서 [개방성과 비판적 사고]를 유지하는 데 중요하다는 것을 발견했다. 이러한 연구결과는 전문적인 팀워크로 확대되며, 이 팀워크에서는 고품질 상호작용이 잘 발달된 커뮤니티에서 보다 비판적으로 성찰적인 대화가 이루어지며(de Groot 등 2014), 팀은 긍정적인 정서적 학습 환경에서 보다 효과적으로 일한다(Jansen 등 2019).

We found that openness plays a role in sustaining critical thinking. It encourages thinking out of the box and elaboration which may lead to new perspectives helping to critically reflect on problems as well as possible solutions. Moreover, openness enables students to challenge groupthink, which is in line with previous studies on critical thinking (de Groot et al. 2014; Koksma et al. 2017). These features of openness are in line with a growth mindset, meaning that learning is framed as a process where mistakes are not problematic (Dweck and Master 2008). In this study, we found that interpersonal behaviour is important for establishing such a growth mindset as well as sustaining openness and critical thinking in groups. These findings extend to professional teamwork, where more critically reflective dialogues take place in well-developed communities with high quality interaction (de Groot et al. 2014), and teams work more effectively with a positive affective learning climate (Jansen et al. 2019).

이 연구에서, [대인관계 행동]은 그룹마다 다른 것처럼 보였다.

  • 우리가 관찰한 두 그룹에서는 스트레스나 다른 부정적인 감정에 대한 대화가 질문이나 문제 해결 행동으로 이어졌다.
  • 다른 그룹에서는 감정만 피상적으로 논의되었다. 우리는 이 마지막 그룹이 논쟁적인 대화로 더 자주 후퇴하는 것을 보았다.

여기서 [그룹 응집력group cohesion]은 중요한 것으로 보인다: 서로 개인적으로 접근하고 대학 밖에서 만나는 학생들은 감정을 공유하고 피드백을 주고 받으며 비판적인 사고를 할 수 있는 안전한 환경을 구축한다. 이전 연구들은 그룹 응집력이 학습 성과에 중요한 영향을 미친다는 것을 보여주었다. 실제로 비치보드 외 연구진(2011)은 동료와 교사와의 관계성relatedness이 비판적 사고에 긍정적인 영향을 미친다는 것을 보여주고 있다. 따라서 본 연구를 바탕으로 교사들에게 그룹의 관계성relatedness이나 결속을 촉진하는 데 투자할 것을 제안한다. 우리는 다른 연구를 통해 선생님들이 프로젝트의 내용뿐만 아니라 그룹 프로세스 레벨에 대한 성찰을 자극함으로써 그렇게 할 수 있다는 것을 알고 있습니다.

In this study, interpersonal behaviour seemed to vary between the groups.

  • In two of the groups we observed, conversations about stress or other negative emotions led to asking questions and problem-solving behaviour.
  • In the other group, the emotions were only discussed superficially. We saw that this last group fell back to disputational talk more often.

Group cohesion appears to be key here: students who approach one another more personally and meet outside university establish a safe environment with room for sharing emotions, giving and receiving feedback, and critical thinking. Previous studies have shown that group cohesion indeed has an important influence on learning outcomes (Beachboard et al. 2011; Hommes et al. 2014). In fact, Beachboard et al. (2011) show that relatedness to both peers and teachers has a positive influence on critical thinking. Based on the present study, we therefore suggest that teachers invest in stimulating relatedness or cohesion in the groups. We know from other research that teachers could do so by stimulating (guided) reflection on the group process level as well as on the contents of the project (Jansen et al. 2019).


[대인관계 행동]의 또 다른 긍정적인 효과는 커리큘럼에서 [조직 문제에 대한 논쟁적인 대화]에 대항하는 데 도움이 될 수 있다는 것이다. 우리는 학생들이 이러한 조직적인 문제에 대해 이야기하는 데 얼마나 많은 시간을 할애하고 있고, 이러한 문제들이 그들의 학습을 방해하는 방식을 보고 놀랐다. 조직 문제로 인해 스트레스가 더 높은 상황에서, 학생들은 더 산만하거나 부정적인 상호작용을 보일 가능성이 더 높은 것으로 보인다. 이것에 의해, SDL 의 동작이 억제되어 이전의 조사와 일치합니다(Magno 2010). 그러나 한 그룹은 감정 공유와 반사성을 기반으로 학습 행동에 대한 잠재적 위협을 완화하는 데 성공했습니다. 다른 그룹은 더 적은 범위로 그렇게 했다. 이러한 효과는 [적극적으로 경청하고 판단을 보류하는 것]이 팀의 문제를 가장 효과적으로 해결하는 데 도움이 된다고 주장하는 샤인의 대화 이론theory on dialogue과 일치한다(Schein 2003).
Another positive effect of interpersonal behaviour is that it may help to counteract disputational talk about organizational problems in the curriculum. We were surprised to see how much time students spent on talking about such organizational problems and the way these interfered with their learning. In situations with higher stress due to organizational issues, students appear more likely to be distracted or show negative interactions. This inhibits SDL behaviour, which is in line with earlier research (Magno 2010). However, one group was successful in mitigating potential threats to their learning behaviour based on sharing emotions and reflexivity. Other groups did so to a smaller extent. These effects are in line with the theory on dialogue of Schein who argues that active listening and withholding judgment will help solve problems in teams most effectively (Schein 2003).

성찰
Reflections

본 연구의 한계는 자발적으로 연구에 등록한 소수의 학생만 포함할 수 있다는 것이며, 이는 선택 편향으로 이어질 수 있습니다. 그러나, 우리는 오랜 세월에 걸쳐 학생들을 추적해 왔고, 이로 인해 우리는 그들의 상호작용과 사고에 대한 심오한 이미지를 개발할 수 있었다. 게다가, 그 팀들은 상호작용과 동기부여 면에서 상당히 다르다는 것을 증명했다. 학생들이 프로젝트 자체와 커리큘럼 전반에 대해 공개적으로 비판하는 것은 연구원과 보이스 레코더의 존재가 그들의 행동이나 태도에 영향을 미치지 않았음을 시사한다.
Limitations of this study are that we could include only a small number of students, who voluntary enrolled in the study, which may have led to a selection bias. However, we have followed the students over a long period of time, which has enabled us to develop a profound image of their interactions and thinking. Moreover, the teams proved to be fairly different in terms of interaction and motivation. The fact that students sometimes openly criticized the project in itself and the curriculum as a whole suggests that the presence of a researcher and a voice recorder has not influenced their behaviour or attitude.

우리의 탐색적 연구를 바탕으로 SDL과 관련된 소그룹 학습의 메커니즘에 관한 가설을 세울 수 있었습니다. [사회적 구성주의] 관점의 연구가 학습자, 동료, 교사 및 환경 간의 상호작용을 더 잘 이해하는 데 도움이 될 것이라고 생각합니다. 여기서, 감정의 대처가 강조되어야 하는데, 감정이 학습에 큰 역할을 하기 때문이다. 이것은 [법제주의enactivism] (학습에서 감정과 구현에 더 많은 초점을 두는, 정신 철학에서 비롯된 학습의 새로운 패러다임)과 일치한다. 이 패러다임을 사용하여 그룹 다이내믹스와 SDL 간의 상호작용 모델은 논쟁적 대화의 효과 또는 자기 모니터링, 책임 및 대인 행동 간의 상호작용의 기초가 되는 메커니즘에 대한 질문에 답함으로써 추가 조사를 위한 출발점이 될 수 있습니다.

Based on our explorative study, we have been able to formulate some hypotheses regarding the mechanisms at work in small group learning that relates to SDL. We think more research from a social constructivist viewpoint could help to still better understand the interaction between the learner, peers, teachers, and the environment. Here, coping with emotions should be emphasized, as the present study underlines that it plays a large role in learning. This aligns with enactivism: a new paradigm of learning that stems from philosophy of mind, in which more focus is placed on emotion and embodiment in learning (Picard et al. 2004; Stephan et al. 2014; Maiese 2017). Using this paradigm, our model of interaction between group dynamics and SDL could be a starting point for further investigation, answering questions on mechanisms that underlie the effects of disputational talk, or the interaction between self-monitoring, responsibility and interpersonal behaviour.

결론
Conclusion

SDL을 소그룹으로 나누어 진정한 학습환경에서 조사했습니다. SDL에서는 개인의 능력이나 태도에 초점을 맞추는 것을 넘어 [감정과 개방성]의 중요한 역할을 찾아냈습니다. 긍정적인 환경에서 감정을 내보내는channeling 것은 SDL에 대한 행동을 유도하는 데 도움이 됩니다. 동료나 교사와 관련된 개방성은 이 메커니즘에서 큰 역할을 합니다. 1학년 학생들은 성찰과 대인관계 행동을 자신들에게 유리하게 사용할 수 있다. 교사는 학생들이 이러한 기술을 습득하도록 도와야 하며, 학생들과 좋은 관계를 맺음으로써 그룹 과정을 성찰할 수 있도록 도와야 한다.
In conclusion, we investigated SDL in small groups in an authentic learning environment. We moved beyond a focus on individual ability or attitude in SDL, finding important roles for affect and openness. Channelling affect in a positive environment will help to steer behaviour towards SDL. Openness, with relatedness to peers and teachers, plays a large role in this mechanism. First-year students are able to use reflection and interpersonal behaviour to their benefit. Teachers should help students acquire these skills and help them reflect on the group process by establishing a good relationship with the students.

 

용어집
Glossary
영향: 감정과 감정의 조합. 이는 긍정적(예: 기쁨)과 부정적(예: 좌절 또는 불안)일 수 있습니다. 두 가지 모두 메타인지적 영향 또는 영향으로 표현되는 학습에 영향을 미칠 수 있습니다. 영향과 학습 사이의 관계는 인지력에 대한 물리적 또는 내재적 접근법에 의해 설명될 수 있다.
Affect: A combination of emotions and feelings. These can be both positive (i.e., joy) and negative (i.e., frustration or insecurity). Both may have an impact on learning, described as metacognitive affect or affect. The relation between affect and learning may be explained by a physical or embodied approach to cognition.

정규 학습 환경: 진정한 학습환경은 실제 세계에 존재하는(또는 존재할 수 있는) 학습환경입니다. 실천에 기초한 학습 이론과 자기주도 학습은 모두 학습을 위해 이러한 유형의 환경에 의존한다. 이러한 환경은 복잡한 상황에서 연습하는 기술과 지식을 제공하여 학습자가 학습 중인 문제의 필요성과 의미를 이해하는 데 도움이 됩니다.

Authentic learning environment: An authentic learning environment is a learning environment which exists (or may exist) in the real world. Both practice-based learning theory and self-directed learning rely on this type of environment for learning. Such an environment affords practicing skills and knowledge in complex circumstances, helping learners to understand the necessity and meaning of the issue they are learning about.

 


Med Teach. 2021 May;43(5):590-598.

 doi: 10.1080/0142159X.2021.1885637. Epub 2021 Feb 22.

There is more than 'I' in self-directed learning: An exploration of self-directed learning in teams of undergraduate students

Affiliations collapse

Affiliations

1Radboud Institute for Health Sciences, Radboud University Medical Centre, Nijmegen, the Netherlands.

2Radboudumc Health Academy, Radboud University Medical Centre, Nijmegen, the Netherlands.

3Lifelong Learning, Education and Assessment Research Network (LEARN), University Medical Center Groningen, Groningen, the Netherlands.

PMID: 33617387

DOI: 10.1080/0142159X.2021.1885637

 

Abstract

Preparing future professionals for highly dynamic settings require self-directed learning in authentic learning situations. Authentic learning situations imply teamwork. Therefore, designing education for future professionals requires an understanding of how self-directed learning develops in teams. We followed (bio-)medical sciences students (n = 15) during an 8-month period in which they worked on an innovation project in teams of 4-6 students. Template analysis of 39 transcripts of audio-recorded group meetings revealed three mechanisms along which group dynamics influenced self-directed learning behaviour. First, if expressions of emotions were met with an inquisitive response, this resulted in self-monitoring or feelings of responsibility. Second, openness in the group towards creativity or idea exploration stimulated critical thinking. Third, disputational talk frustrated learning, because it adversely affected group cohesion. We conclude that emotions, openness, and relatedness are important drivers of self-directed learning in teams and hence should be given explicit attention in designing collaborative learning for future professionals.

Keywords: Collaborative/peer-to-peer; education environment; study skills; undergraduate.

학습자 동기부여를 촉진하기 위한 임상교육자의 가이드(AMEE Guide No. 137) (Med Teach, 2020)
The clinical educator’s guide to fostering learner motivation: AMEE Guide No. 137
Kayley M. Lyonsa , Jeff J. Cainb , Stuart T. Hainesc , Danijela Gasevicd and Tina P. Brocka

 

 

서론
Introduction

학습자의 의욕은, 학생으로부터 프로페셔널에 이르기까지, 그리고 강의실에서 시뮬레이션 실험실, 임상 배치에 이르기까지, 모든 교육 레벨에서 필수적입니다. 배우고자 하는 욕구가 없으면 학습자는 학습에 필요한 노력을 기울이지 않을 것이다. 강한 의욕을 가진 사람들은 더 많은 노력을 기울일 뿐만 아니라, 도전적인 개념이나 기술을 배울 때 생기는 불가피한 좌절에도 더 탄력적이다. 교실 안팎의 임상교육자는 학습활동 설계, 교육전략의 실시 및 긍정적인 학습환경의 조성을 통해 학습자의 동기부여에 중요한 역할을 합니다. 예를 들어, 건강 전문가 학생은 다양한 업무, 관리자의 열정, 그리고 그들이 받은 피드백의 질로 인해 배치에 더 많은 동기를 부여할 수 있습니다. 이 동기 부여로 인해 학생은 더 많은 책을 읽고, 추가적인 학습 활동에 참여하고, 더 나은 질문을 할 수 있습니다.
Learner motivation is essential at every level of education, from student to professional, and in every setting, from lecture halls to simulation laboratories to clinical placements. Without a desire to learn, learners will not put forth the necessary effort to learn (Bandura 1977; Cook and Artino 2016). Not only do individuals with strong motivation put forth more effort, but also they are more resilient to the inevitable setbacks that arise when learning challenging concepts or skills. Clinical educators, within and outside the classroom walls, play a key role in learner motivation through the design of the learning activities, implementation of instructional strategies, and creation of positive learning environments (Kusurkar et al. 2011b). For instance, a health professional student may find a placement more motivating due to the variety of tasks, enthusiasm of the supervisor, and quality of feedback they received. This motivation then may lead the student to read more, engage in additional learning activities, and ask better questions.


학습 과정에서 학습자의 노력, 관심 및 소유권에 영향을 미치는 것을 이해하려는 몇 가지 동기 부여 이론이 있습니다.
There are several motivation theories that attempt to understand what influences learner effort, interest, and ownership in the learning process.

  • 자기결정이론은 학습자의 자율성(자신의 행동에 대한 통제), 역량(자기효율성), 관계성(소속감 및 유대감)에 대한 요구가 충족될 때 내적 동기부여가 촉진된다고 가정한다(Ryan과 Deci 2000b).
  • 목표 지향 이론은 학습자의 성취 동기 부여에 영향을 미치는 것을 중심으로 합니다. 성과 목표(예: 높은 성적 획득)를 지향할 때, 학습자는 주로 다른 사람의 판단(예: 교육자의 평가)에 관심을 갖는다. 이와는 대조적으로, 숙달 목표 지향의 학습자는 학습한 내용의 본질적 가치에 의해 동기 부여됩니다.
  • 귀인 이론은 학습자의 성공과 실패에 대한 해석이 중요하다는 것을 시사한다. 학습자들은 다양한 정도의 성공 또는 실패를 개인적인 노력, 타고난 능력, 다른 사람, 그리고 운 탓으로 돌린다. 이러한 속성은 차례로 미래의 성공 가능성에 대한 그들의 미래 믿음에 영향을 미친다(Weiner 1985).
  • 기대-가치-비용 이론에 따르면, 동기 부여는 학습자가 성공할 것이라고 믿고(기대), 과제를 중요하게 인식하고(가치), 과제와 관련된 단점(비용)을 고려하는 정도에 의해 영향을 받는다(Barron and Hulleman 2015).
  • 상황학습이론Situative learning theory은 학생들이 사회적 지위에 대한 욕구에 의해 동기부여를 받는다고 가정한다. 상황 학습 이론에서 중요한 것은 의료 공동체에서 존경받는 구성원이 되고자 하는 학습자의 욕구를 이용하는 것이다.

  • Self-determination theory posits that internal motivation is fostered when learners’ needs are met for autonomy (control over one’s actions), competence (self-efficacy), and relatedness (sense of belonging and connectedness) (Ryan and Deci 2000b).
  • Goal-orientation theory centers around what influences the learners’ motivations for achievement. When oriented toward performance goals (e.g. earning high grades), learners are primarily concerned about the judgment of others (e.g. the educator’s evaluation). In contrast, learners with a mastery goal orientation, are motivated by the intrinsic value of what is being learned (Elliot and Hulleman 2017).
  • Attribution theory suggests that learners’ interpretations of their successes and failures are what matters. Learners attribute success or failure in varying degrees to personal effort, innate ability, other people, and luck. These attributions, in turn, influence their future belief in the likelihood of their future success (Weiner 1985).
  • According to expectancy value cost theory, motivation is influenced by the degree to which the learner believes they will be successful (expectancy), perceives the task as important (value), and considers the task-related downsides (costs) (Barron and Hulleman 2015).
  • Situative learning theory postulates that students are motivated by a desire for social standing. What matters in situative learning theory is tapping into the learner’s desire to be a respected member of the health care community (Lave and Wenger 1991).

학습자의 동기를 최적화하는 '실버블릿' 전략은 없지만, 70년 이상의 연구를 통해 학습자의 동기 부여에 대한 설득력 있는 증거가 제시되었습니다. 학습 의욕은 궁극적으로 학습자의 책임이지만, 교육자는 학습자의 동기 부여에 중요한 역할을 합니다. 저자는 스토리 사용, 사고방식 개입, 강사-학습자 관계 개선 등 학습자 동기를 높이기 위해 설계된 수많은 교육 개입을 요약했다(Lin-Siegler et al. 2016). 강사가 성공적으로 적용한 다른 전술로는 교육용 게임 사용(Klein과 Freitag 1991), 학습자와 관련된 콘텐츠 만들기(Frymier와 Shulman 1995), 관심을 끌기 위한 개념 트리 구현(Hirumi와 Bowers 1991) 등이 있다.
Although there is no ‘silver bullet’ strategy to optimise learner motivation, over 70 years of research has produced persuasive evidence on what motivates learners (Maslow 1943; Bandura 1977; Lepper et al. 2005; Cook and Artino 2016). Motivation to learn is ultimately the responsibility of learners; however, educators play an important role in influencing learner motivation. Authors have summarized numerous instructional interventions designed to increase learner motivation, including the use of stories, mindset interventions, and improving instructor-learner relationships (Lin-Siegler et al. 2016). Other tactics that instructors have applied successfully include using an instructional game (Klein and Freitag 1991), focusing on making content relevant to learners (Frymier and Shulman 1995), and implementing concept trees to gain attention (Hirumi and Bowers 1991).

임상 교육자의 과제
The challenge for clinical educators

보건 전문가 교육은 이론 기반의 입증된 학습 동기 부여 전략을 더 많이 적용하는 것으로부터 이익을 얻을 수 있습니다. 그러나, 학생 동기 부여 문헌의 대부분은 전문 용어에 익숙하고 학습 이론을 해석하는 데 익숙한 교육 심리학 독자들을 대상으로 하고 있다. 따라서 동기 이론과 연구는 많은 임상학 교육자들에게 덜 다가갈 수 있습니다. 또한, 학생 동기 부여 문헌은 크고 중복된다. 새로운 임상 교육자가 각각의 동기 이론이 학습 이론의 더 넓은 그림에 어떻게 들어맞는지 이해하는 것은 어려울 것이다. 또한, 임상 교육자는 다양한 교육 전략을 알고 있을 뿐만 아니라 각 교육 전략에 대해 누가, 무엇을, 어디서, 언제, 왜, 어떻게 이해해야 합니다. 이건 너무 벅찰 수 있어요.
Health professions education would benefit from a greater application of theory-based, research-proven learning motivation strategies. However, much of the student motivation literature is directed at an educational psychology audience who is familiar with the professional jargon and is comfortable with interpreting learning theory. Thus, motivation theory and research may be less approachable for many clinician educators. Also, student motivation literature is large and overlapping. It would be difficult for a new clinical educator to understand how each motivation theory fits into the broader picture of learning theories. Furthermore, to be successful, clinical educators need to not only know of a wide variety of instructional strategies, but also have an understanding of the who, what, where, when, why, and how for each instructional strategy. This can be overwhelming.

모티베이션 이론에 익숙한 은유 적용
Applying familiar metaphor to motivation theory

모티베이션 이론과 연구를 보다 접근하기 쉽게 하기 위해 모티베이션 이론과 연구를 의료 전문가에게 친숙한 언어로 번역했습니다. 약물요법 논문과 마찬가지로, 학생의 의욕을 촉진하기 위한 개입을 그 징후, 행동 메커니즘, 투여, 투여, 부작용, 모니터링 등을 기술한 전략 논문으로 분류했다. 표 1은 이들 용어를 비교한 것입니다.

To make motivation theory and research more approachable, we have translated motivation theory and research into language familiar to health professionals. Similar to medicine treatment monographs in drug compendia, we have categorized interventions for fostering student motivation into strategy monographs describing their indications, mechanism of action, administration, dosing, side effects, and monitoring. Table 1 compares these terminologies.

 

우리와 많은 다른 사람들은 과학을 배우는 것이 임상 과학보다 문화적이고 맥락에 의존적이라고 주장하지만(Brown et al. 1989), 임상 교육자들은 임상 과학에 대한 이해를 동기 부여 과학에 적용할 수 있다. 단순화하자면, 동기 부여는 소스, 프로세스, 영향력자 및 결과의 시스템으로 볼 수 있습니다. 동기 부여 결과(예: 노력)를 개선하는 최선의 방법은 [학습자 동기 부여와 관련된 요소를 신중하게 평가하고 목표로 하는 것]이다. 동기 부여에서 학습자의 행동과 관련된 요소는 학습, 과제, 환경, 동료 및 교육자에 대한 믿음일 수 있습니다. 예를 들어, 학생은 1차 진료에서 실습하기를 원하지만 중환자실에 대한 학습이 자신의 미래에 얼마나 중요한지 알지 못하기 때문에 중환자실 배치에 최소한의 노력을 기울일 수 있다. 따라서 의료 처치를 환자의 특징과 선호도에 맞게 개인화하는 것과 마찬가지로, 학습자의 동기를 개선하기 위한 전략은 시간이 지남에 따라 개인화되고 수정되어야 한다. 한 시점에서 학생에게 흥미를 주는 것은, 다른 시점에서는 효과가 없을지도 모른다. 한 학생에게 흥미로운 것은 다른 학생에게는 흥미롭지 않을 수 있다. 따라서 교육자는 학습자의 동기부여를 촉진하기 위한 전술의 종류뿐만 아니라 이러한 전술이 왜 어떻게 작동하는지 이해하는 것도 중요합니다.

Although we and many others argue that learning science is more cultural and context-dependent than clinical science (Brown et al. 1989), clinical educators can still apply their understanding of clinical science to the science of motivation. As a simplification, motivation can be viewed as systems of sources, processes, influencers, and outcomes. The best way to improve motivational outcomes (e.g. effort) is to carefully evaluate and target the factors related to learner motivation (Harackiewicz and Priniski 2018). In motivation, the factors related to learners’ behaviours may be their beliefs around learning, the task, the environment, their peers, and the educator. For example, a student may be putting forth minimum effort on a critical care placement because they want to practice in primary care and do not see how the learning about critical care will be important to their future. Therefore, akin to how medical treatments should be personalized to patient characteristics and preferences, strategies to improve learner motivation must be personalized and modified over time. What may engage students one day, may not work the next. What is interesting to one student, may not be interesting to another. Therefore, it is crucial for educators to not only know the types of tactics for fostering learner motivation but also to understand why and how these tactics work.

임상 교육자를 지원하기 위해 학습자의 동기를 촉진하는 개입을 Vansteenkiste 등의 작업에 따라 부분적으로 세 그룹으로 분류했다. 마찬가지로, 이러한 개입은 다양한 경로를 통해 학습자의 동기를 목표로 한다.

  • 동기 부여 강도 증가— 특정 행동에 대한 학습자 [동기 부여 상태(강력, 양)]를 증가시키기 위한 개입
  • 동기 부여 퀄리티 향상— 학습자의 [동기 부여 유형(즉, 활동에 참여하는 이유)]에 영향을 미치는 개입
  • 동기 부여 노하우 향상— 자신의 동기 부여를 위한 [전술과 전략에 대한 학습자의 지식]을 높이기 위한 개입(즉, 동기 부여 규제 전략).

To assist clinical educators, we have categorized interventions that foster learner motivation into three groups based, in part, by work from Vansteenkiste et al. (2009). In the same way, these interventions target learner motivation via different pathways:

  • Increasing motivation intensity—includes interventions to increase (i.e. strength, quantity) learner motivational state, willingness, and behaviour for a specific action (Vansteenkiste et al. 2009)
  • Enhancing motivation quality—includes interventions to influence the type of motivation for the learner (i.e. why they are engaged in the activity).
  • Improving motivation know-how—includes interventions to increase learner knowledge of tactics and strategies for motivating oneself (i.e. motivation regulation strategies).

 

다음 섹션에서는 기원, 메커니즘 및 결과를 포함한 각 치료 클래스의 기본 이론을 설명한다. 교육자가 사용할 수 있는 구체적인 전략(즉, 개입)과 이를 뒷받침하는 근거를 개략적으로 설명합니다. 임상 교육자가 다양한 환경(즉, 임상 배치, 강의실 및 온라인 학습)에서 개입을 구현하는 방법의 예를 설명한다. 각 섹션의 대응표에는 주요 용어, 표시, 일반 관리, 행동 메커니즘, 투여, 부작용, 모니터링이 정리되어 있다.

In the following sections, we describe the underlying theories of each therapeutic class including origins, mechanisms, and outcomes. We outline specific strategies (i.e. interventions) educators can use and the evidence to support them. We describe examples of how clinical educators may implement the interventions in different settings (i.e. clinical placements, the classroom, and online learning). In each section’s corresponding table, we outline key terms, indications, general administration, mechanism of action, dosing, side effects, and monitoring.

치료 클래스 1: 동기 부여 강도 증가
Therapeutic class 1: increasing motivation intensity

개요 및 이론적 기초
Overview and theoretical underpinnings

학습자 동기 부여의 강도(즉, 강도)는 다음에 의해 결정됩니다. 

  • 동기 부여 상태(예: '동기부여된 느낌이에요'),
  • 특정 행동을 보여주는 것(예: 참여)
  • 동기 부여 신념과 인식(예: '잘 할 자신이 있다')

The strength (i.e. intensity) of learner motivation is determined by

  • the motivational state (e.g. ‘I feel motivated’),
  • displaying certain behaviours (e.g. participation), and
  • holding motivational beliefs and perceptions (e.g. ‘I’m confident I will do well’).

[동기부여의 신념과 인식]은 다음과 같습니다.
Motivational beliefs and perceptions include:

  • 학습자의 과제 난이도 인식(McCaslin 및 Hickey 2001)
  • 과제의 중요성 (Wigfield 등 2017)
  • 교육자 배려에 대한 인식(1998년 Wentzel 및 Wigfield)
  • 학습자 흥미 (Renninger 및 Hidi 2011)
  • 자기 능력에 대한 인식 (Schunk and Pajares 2005).
  • Learner perceptions of task difficulty (McCaslin and Hickey 2001)
  • Task importance (Wigfield et al. 2017)
  • Perceptions of educator caring (Wentzel and Wigfield 1998)
  • Learner interest (Renninger and Hidi 2011)
  • Perceptions of self-competence (Schunk and Pajares 2005).

긍정적인 [동기 부여 신념과 인식]은 [동기 부여 상태, 참여 및 행동]으로 이어집니다.

  • [동기부여 신념과 인식]이 최적화되면 학습자는 학습에 대한 심층적 접근법을 사용하여 자신의 학습을 적응적으로 조절합니다. 예를 들어, 주제(예: 심장학)에 대한 관심이 발달한 학습자는 행동적으로 참여(예: 추가 자료 읽기)하고 해당 주제에 대한 미래 기회를 모색할 가능성이 높다. 학습자는 프롬프트 없이 질병 상태에 대해 읽고 추가적인 연습 기회를 요청할 수 있습니다.
  • [동기부여 상태와 행동]은 또한 [가르침instruction]과 [학습자 성취] 사이의 중재자 역할을 합니다. 예를 들어, 행동 참여도가 높은 학습자는 더 높은 점수와 시험 점수를 달성하고 인턴쉽을 달성하며 환자 치료에 긍정적인 영향을 미칠 수 있다.
  • [동기부여 신념과 인식]은 노력, 지속성 및 선택을 직접 예측하며, 이는 학교, 직장, 사회 환경 및 일상생활에서의 성공을 예측합니다(Marsh et al. 2017).

Positive motivational beliefs and perceptions lead to heightened motivational states, engagement, and behaviours (Wigfield and Guthrie 2000).

  • When motivational beliefs and perceptions are optimized, learners use a deeper approach to learning (Heikkilä and Lonka 2006) and adaptively regulate their own learning (Paris and Turner 1994). For example, a learner with a developed interest in a subject (e.g. cardiology) is more likely to be behaviourally engaged (e.g. reading additional materials) and seek future opportunities in that subject (Renninger and Bachrach 2015). The learner might read about a disease state without prompting and ask for additional practice opportunities.
  • Motivational states and behaviours also serve as a mediator between instruction and learner achievement (Wigfield and Guthrie 2000). For example, a learner with more behavioural engagement may then achieve higher marks and test scores, attain an internship, and positively affect the care of patients.
  • Motivational beliefs and cognitions directly predict effort, persistence, and choices (Wigfield et al. 2017), which, in turn, predict success in school, the workplace, social settings, and daily living (Marsh et al. 2017).

 

모티베이션 강도를 높이기 위한 네 가지 개입
Four interventions to increase motivation intensity

동기 부여 강도를 높이기 위해 임상 교육자는 다음을 수행해야 합니다.

  • 난이도가 적절한 학습 과제를 제공하다
  • 학습자의 호기심과 흥미를 불러일으키다
  • 열정을 모델링하고, 감정적 관심을 보여준다
  • 과제의 관련성 및 유틸리티를 생성

To increase the level of motivation intensity, clinical educators should:

  • Provide optimally challenging learning tasks
  • Spark curiosity and interest among learners
  • Model enthusiasm and show affective concern
  • Create task relevance and utility

학습자 동기 부여의 강도를 높일 수 있는 이 치료 그룹 아래의 네 가지 예시적 개입에 대해서는 보충표 S1을 참조한다. 이 치료 수업에서 다른 개입 유형과 예는 학습자의 관심 증가(Harackiewicz와 Priniski 2018)와 자신의 역량에 대한 인식을 위해 찾을 수 있다.
See Supplementary Table S1 for four exemplary interventions under this therapeutic group that can increase the intensity of learner motivation. Other intervention types and examples, under this therapeutic class, may be found for increasing learner interest (Harackiewicz and Priniski 2018) and perceptions of their own competence (Bandura 1997).

 

난이도가 적절한 학습 과제를 제공
Providing optimally challenging learning tasks

학습자의 [과제 난이도에 대한 인식]이 중요합니다. 교육자는 학습 과제를 선택하고 설계할 때 너무 쉽지도, 너무 어렵지도 않다는 Goldilocks 원칙을 따라야 합니다.이 원칙은 도전적이면서도 부담스럽지 않아야 합니다. 예를 들어, 배치 감독자는 학생이 검토할 수 있도록 할당한 환자의 수와 복잡성을 최적화하여 학생의 과제가 줄어들수록 난이도를 높일 수 있습니다. 교실에서 교육자는 질문의 난이도를 최적화할 수 있습니다. 과제가 너무 쉬우면 학습자는 지루해지지만 너무 어려워질 수 있습니다. 학습자는 자제하거나 정신적 지름길을 택할 수 있습니다. 이 원칙은 온라인 학습에도 적용된다. 온라인 학습을 설계하는 한 가지 방법은 비디오 게임 이후 온라인 학습을 모델링하는 것이다. 비디오 게임은 학습자가 쉬운 과제를 숙달한 후에 난이도를 높인다. 예를 들어 온라인 모듈은 더 어려운 콘텐츠로 넘어가기 전에 마스터 퀴즈를 요구할 수 있습니다.
Learner perceptions of task difficulty matters (Paris and Turner 1994; McCaslin and Hickey 2001). When selecting and designing learning tasks, educators should follow the Goldilocks Principle of not too easy and not too hard—a task should be challenging, but not overwhelming. For example, placement supervisors could optimize the number and complexity of patients they assign for students to review, assigning more difficulty as the challenge decreases for the student. In the classroom, educators could optimize the difficulty of the questions they ask. If the task is too easy, learners may become bored, yet with too much difficulty; learners may withdraw or take mental shortcuts. This principle is also applicable to online learning. One way to design online learning could be modelling online learning after video games. Video games increase the level of difficulty after learners master easier tasks. For example, an online module could require mastery quizzes before moving onto content that is more difficult and subsequently more difficult quizzes.

최적의 난이도는 '몰입'으로 이어질 수도 있습니다. 이는 학습자가 경험하는 동기 부여의 몰입 상태로서, 시간 감각을 잃는 것이다. 예를 들어, 학습자는 몇 시간 동안 저널 기사를 검색하면서 질문에 대한 답을 찾으려고 열중할 수 있습니다. 학습자가 최적으로 도전적인 과제를 성공시키면, 그 결과는 역량 자기 인식의 증가입니다(예: 자신감, 자기 효율성).

Optimal challenges may also lead to ‘flow’ (Csikszentmihalyi 1997); an absorbing state of motivation that learners experience, losing their sense of time. For example, a learner may become absorbed trying to find an answer to a question, searching journal articles for hours. When a learner succeeds over an optimally challenging task, the result is an increase in their competence self-perceptions (e.g. confidence, self-efficacy) (White 1959; Marsh et al. 2017).

호기심과 흥미를 불러일으키다
Sparking curiosity and interest


학습자의 [관심과 호기심이 유발]되면 개인적 관심사가 잘 발달될 수 있습니다. 교육자는 학습 경험을 시작할 때 참신함, 놀라움 및 토론을 통해 학습자의 흥미를 유발하는 방법을 파악할 수 있습니다. 예를 들어, 임상 감독관이 임상 논쟁을 논의할 때 학습자의 관심이 최고조에 달할 수 있다. 교실 교육자는 학생들이 답을 밝히기 전에 질문에 대한 답을 예측하게 함으로써 놀라움을 줄 수 있습니다. 온라인 학습에서는 참신함이 자주 사용됩니다. 사실, 새롭게 인식되는 것은 교육 기술에 대한 학습자의 동기를 예측합니다. 그러나 '새로움 효과novelty effect'는 시간이 지날수록 희미해지는 것으로 알려져 있다.

If learner interest and curiosity is triggered, it may lead to well-developed personal interests (Renninger and Hidi 2011). At the beginning of the learning experience, educators may identify ways to spark learner interest through novelty, surprise, and debate. For example, learner interest may be peaked when clinical supervisors discuss clinical controversies. Classroom educators can create surprises by having students predict answers to questions before they reveal the answer. For online learning, novelty is often used. In fact, perceived novelty predicts learner motivation for education technology. However, the ‘novelty effect’ is known to fade over time (Jeno et al. 2019).

열정 모델링 및 정서적 관심 표시
Modelling enthusiasm and showing affective concern

[교육자와의 관계 및 교육자에 대한 인식]으로 인해 학습자의 동기 부여가 증가할 수 있습니다. 학습자는 열정적인 교육자에 대한 선호도를 설명하는 경우가 많습니다(Mitchell 2013). 주제에 대한 관심은 특히 학습자가 그 사람을 존중하거나 관련시킬 때 전염될 수 있습니다. 일화적으로, 많은 학습자들이 전직 교사의 열정 때문에 직업, 특기 또는 연습 환경을 선택했다고 말한다. 많은 교육자들은 그들이 왜 어떤 주제를 즐기거나 그것이 중요하다고 믿는지에 대해 이야기를 나눌 때 그들의 열정을 드러낸다. 예를 들어, 많은 학습자들은 그들의 학습을 실제 환자들과 연결하는 이야기에 감동합니다.
Learner motivation may increase due to their relationship with and perceptions of the educator. Learners often describe their preference for enthusiastic educators (Mitchell 2013). An interest in a topic can be contagious, especially when the learner respects or relates to that person. Anecdotally, many learners indicate they chose a profession, specialty, or practice setting due to a former teacher’s passion. Many educators often reveal their enthusiasm when they share their stories for why they enjoy a topic or believe it is important. For example, many learners are moved by stories connecting their learning to real patients.

교육자-학습자 관계의 또 다른 동기부여 측면은 학습자가 자신의 [교육자가 자신의 행복을 얼마나 아끼고 있는지]를 믿는 것입니다. 학습자는 교육자가 인간으로서 자신을 돌본다고 믿을 때 무의식적으로 존엄성과 소속감을 느낀다. 품위와 소속감은 학생 동기 부여의 기본이다. 품위나 소속감이 없다면, 학습자들은 주저하고 학습 주제나 환경이 '그들에게 맞지 않는다'고 생각하기 쉽다. 임상 현장에서 임상 교육자는 학생들을 체크하고 어떻게 지내는지 물어봄으로써 보살핌을 보여줄 수 있다. 강의실 교육자는 학생들의 학업과 시간 관리에 대한 압박감을 이해한다는 것을 보여줄 수 있습니다.

Another motivating aspect of the educator–learner relationship is how much a learner believes their educator cares for their well-being. Learners subconsciously feel dignity and belonging when they believe their educator cares for them as a person (Baumeister and Leary 1995). Dignity and belonging are fundamental to student motivation. Without dignity or belonging, learners are likely to withdraw and think the learning topic or environment is ‘just not for them.’ In clinical placements, clinical educators could show caring by checking in with students and asking them how they are doing. Classroom educators could show they understand students’ studying and time management pressures.

과제 관련성 및 유틸리티 생성
Creating task relevancy and utility

학습 과제의 관련성과 유용성에 대한 학습자의 인식이 동기 부여의 강도를 결정합니다. 학습자는 과제 가치에 대한 인식을 가지며, 다음을 통해 판단됩니다.

  • 달성 가치 — 성공에 대한 상대적 중요성
  • 효용 가치 미래에 대한 중요성
  • 내재적 가치 — 작업에서 오는 지속적인 즐거움

The learner’s perceptions of the relevance and usefulness of the learning task determine the strength of their motivation (Eccles et al. 2005). Learners perceptions of task value and are determined by:

  • Attainment value—relative importance for succeeding
  • Utility value—importance for the future
  • Intrinsic value—inherent enjoyment from task

흔히 볼 수 있는 관행과는 달리, 학습자에게 작업의 가치를 말해주기 보다는 보여주는 것이 중요합니다. 학습자에게 과제의 중요성을 "말하면" 역효과가 날 수 있습니다. 대신 임상 교육자는 중요성을 보여주거나 학습자가 과제의 가치를 옹호하도록 해야 합니다. 예를 들어, 임상 교육자는 포괄적인 환자 기록을 가져가고 이것이 어떻게 환자 결과를 향상시키는지 보여줄 수 있다. 강의실 교사 또는 교육 기술은 학습자가 주제 또는 과제가 현재 삶 또는 미래에 중요한 이유를 묻는 질문에 응답하도록 할 수 있습니다(즉, 학습자가 과제 가치를 옹호하도록 함).

Contrary to commonly seen practices, it is important to show learners the value of the task rather than tell them. Telling learners the importance of the task can backfire (Harackiewicz and Priniski 2018). Instead, clinical educators should either show the importance or have the learner advocate for the task’s value. For example, a clinical educator might demonstrate taking a comprehensive patient history and show how this led to an improved patient outcome. A classroom teacher or educational technology could have learners respond to prompts asking them why a topic or task is important to their current lives or their future (i.e. have learners advocate for task value).

 

치료 클래스 2: 동기 부여 품질 향상
Therapeutic class 2: enhancing motivation quality

개요 및 이론적 기초
Overview and theoretical underpinnings

학습자 모티베이션의 질은 학습자의 사고방식, 목표의 원천 및 능력에 대한 속성에 따라 결정됩니다. 동기 부여의 질은 참여, 노력, 지속성 및 장기적인 성과와 관련이 있습니다. 동기 부여 품질을 향상시키는 개입은 학습자의 학습 능력을 향상시킵니다.

  • 역량의 가단성에 대한 신념(성장 마인드) (Dweck and Molden 2017)
  • 자율성(예: 내적 동기 부여) (Ryan 및 Deci 2000b)
  • 성과 목표와 균형을 이룬 내용 숙달을 향한 열망(즉, 숙달 목표와 성과 목표 지향) (Elliot 및 Hulleman 2017)
  • 전문직 또는 학교 내에서의 정체성 형성(1991년 Lave 및 Wenger)
  • 소속감 (1995년 바우미스터와 리어리)
  • 노력과 전략이 학업 실패/성공과 인과 관계가 있다는 믿음(즉, 적응적 인과 귀인)(Perry and Hamm 2017).

The quality of learner motivation is determined by learners’ mindsets, sources for goals, and attributions for their competence. Motivation quality is associated with engagement, effort, persistence, and long-term achievement. Interventions that enhance motivation quality increase the learner’s:

  • Belief that competence is malleable (i.e. growth mindset) (Dweck and Molden 2017)
  • Autonomy (e.g. intrinsic motivation) (Ryan and Deci 2000b)
  • Desire to achieve content mastery balanced with a focus on performance goals (i.e. mastery and performance approach goal orientation) (Elliot and Hulleman 2017), and
  • Identity formation within a profession or school (Lave and Wenger 1991),
  • Feelings of belonging (Baumeister and Leary 1995)
  • Belief that their effort and strategy are causally related to their academic failures and successes (i.e. adaptive causal attributions) (Perry and Hamm 2017).

종종 학습자 [동기 부여의 질적 변화]는 [동기 부여 강도의 증가]와 관련이 있으며, 이는 다시 성과를 예측한다. 예를 들어,

  • 내재적 동기(즉, 퀄리티)는 흥미, 흥분, 역량 자기 인식(즉, 강도)을 예측하여 [더 높은 지속성과 더 높은 성과]로 이어집니다.
  • [목표 지향]은 [학습자가 학습 과제, 행동 및 전략을 인식하고 경험하고 선택하는 방법]에 영향을 미칩니다.
  • 또한, [인과 귀인]은 [미래의 노력, 지속성 및 성과]를 결정합니다.

Often a shift in the quality of learner motivation is associated with increased motivation intensity, which in turn predicts performance.

  • For example, intrinsic motivation (i.e. quality) predicts interest, excitement, competence self-perceptions (i.e. intensity) that leads to greater persistence and higher performance (Ryan and Deci 2000b).
  • Goal orientations affect how learners perceive, experience, and choose learning tasks, behaviours, and strategies (Elliot and Hulleman 2017).
  • Also, causal attributions determine future effort, persistence, and performance (Perry and Hamm 2017).

 

모티베이션 품질을 높이기 위한 네 가지 개입
Four interventions to enhance motivation quality

학습자 동기 부여의 질을 높이기 위해 교육자는 다음을 수행해야 한다.

  • [자율성 촉진 및 구조화]
  • 학습자의 [정체성 모순]을 해소
  • 과제를 [일반적이고 개선 가능한 것]으로 프레이밍
  • 목표에 대한 [숙달적 접근]을 유도

To elicit a higher quality of learner motivation, educators should:

  • Promote autonomy and structure
  • Address learner identity contraindications
  • Frame academic challenges as common and improvable
  • Elicit a mastery approach to learning goals

학습자 동기 부여의 질을 높일 수 있는 이 치료 그룹 아래의 네 가지 예시적 개입에 대해서는 보충표 S2를 참조한다. 권한과 책임의 균형, 학습자가 학문적 성공과 실패를 해석하는 방법, 내재적 동기를 높이기 위한 전술, 전문 커뮤니티 내에서 학습자의 정체성을 확립하는 다른 개입 유형 및 사례를 찾을 수 있습니다.
See Supplementary Table S2 for four exemplary interventions under this therapeutic group that can enhance the quality of learner motivation. Other intervention types and examples may be found for balancing authority with accountability (Engle and Conant 2002), re-training how learners interpret academic successes and failures (Weiner 1985), tactics to increase intrinsic motivation (Kusurkar et al. 2011a) and establishing an identity for learners within a professional community (Lave and Wenger 1991).

자율성·구조화 추진
Promoting autonomy and structure

자율성과 구조를 촉진하는 전략은 외적, 내적 동기 부여에 영향을 미칩니다.

  • 외재적 동기 부여는 학습에 참여하려는 동기가 활동 외부에 있는 경우입니다.
  • 내재적 동기 부여는 학습자가 활동을 본질적으로 만족스럽고 흥미롭고 즐거운 것으로 볼 때 더 높은 품질의 동기 부여 유형입니다.

Strategies to promote autonomy and structure influence extrinsic and intrinsic motivation.

  • Extrinsic motivation is when the motive to engage in learning is external to the activity (Ryan and Deci 2000a).
  • Intrinsic motivation, a higher quality type of motivation, is when the learner views activities as inherently satisfying, interesting, and enjoyable.

학생들이 모든 학습 활동에 의해 내재적 동기를 부여받을 것이라고 믿는 것은 비현실적이다. 교육자는 학습자가 내재적 동기 부여를 받은 학습자와 유사한 방식으로 행동하도록 유도하는 외재적 동기 부여자motivator를 제공할 수 있습니다(Ryan 및 Deci 2000b). 외재적 동기는 연속체에서 발생한다.

  • 한 끝에서 학습자는 [외적인 보상이나 처벌 회피]에 의해서 동기 부여되며, 활동에 내재된 가치를 느끼지 못합니다.
  • 다른 끝에서 학습자는 [활동의 본질적 가치]를 분명히 인식하지만, 외부적 보상이 없을 때 자발적으로 활동을 시작하지는 않을 것이다.

학습 태스크에 대한 자율성과 선택의 폭을 넓힘으로써 학습자는 자신의 고유한 관심사에 따라 이러한 활동을 구체화할 수 있습니다(Ryan 및 Deci 2000b).

It is unrealistic to believe that students will be intrinsically motivated by all learning activities. Educators can provide extrinsic motivators that prompt learners to behave in ways that are similar to learners who are intrinsically motivated (Ryan and Deci 2000b). Extrinsic motivation occurs on a continuum.

  • At one extreme, the learner is only motivated by the extrinsic reward or avoidance of punishment and sees no inherent value in the activity.
  • At the other end of the continuum, the learner clearly sees the intrinsic value of the activity, but would not otherwise voluntarily initiate the activity in the absence of an extrinsic reward.

Offering greater autonomy and choice over learning tasks allows learners the opportunity to shape these activities around their intrinsic interests (Ryan and Deci 2000b).

보다 자율적인 형태의 외적 동기를 유도하기 위해, 교육자들은 [구조를 제공]하면서 학습자의 [자율성을 촉진]해야 한다. 이 두 가지 교육 방식은 antagonistic하지 않다. 예를 들어,

  • 임상에서는 수련생이 어떤 환자를 따르길 원하는지 선택할 수 있도록 허용할 수 있다(즉, 자율성). 그런 다음 수련생이 선택한 환자(즉, 구조)에 따라 자원을 사용하도록 지시할 수 있다.
  • 교실에서는 학생들이 자료를 배우고 성공하기 위해(구조) 적용할 수 있는 효과적인 학습 전략의 몇 가지 유형(즉, 자율성)을 설명할 수 있다.
  • 온라인 플랫폼에서는 교육자가 단계별 지시(구조)를 제공하고 학습자가 이를 자신의 이익에 적용할 수 있는 유연성(자율)을 가질 수 있습니다.

To elicit more autonomous forms of extrinsic motivation, educators should promote learner autonomy while providing structure (Jang et al. 2010). These two instructional styles are not antagonistic (Jang et al. 2010).

  • For example, a clinical supervisor may allow a trainee to choose which patients they would like to follow (i.e. autonomy) and then direct the trainee to resources depending on their choice (i.e. structure).
  • In the classroom, an educator could describe several types (i.e. autonomy) of effective learning strategies that students could apply to learn the material and succeed (i.e. structure).
  • In an online platform, educators could provide step by step directions (i.e. structure) and allow learners’ the flexibility to apply these to their own interests (i.e. autonomy).

학습자 정체성 모순 해결
Addressing learner identity contradictions

학습자 동기 부여의 가장 큰 요인 중 하나는 master practitioner로서의 정체성입니다. 학습자들은 미래 보건의료전문직으로서의 정체성을 지속적으로 형성하고 있으며, 보건의료전문직이 되는 것이 무엇을 의미하는지, 그리고 '좋은' 보건의료전문직이 되는 것이 무엇을 의미하는지를 생각한다. 이러한 자기-내레이션은 학생들이 취하는 연습과 그들이 내리는 결정에 영향을 미친다.

One of the largest drivers of learner motivation is their evolving identity as a master practitioner (Lave and Wenger 1991; McCaslin and Hickey 2001). Learners are continually forming their identity as a future health professional, what it means to be a health professional (e.g. a nurse, pharmacist), and what it means to be a ‘good’ health professional. These self-narrations influence the practices students take up and the decisions they make (Turner et al. 2014).

[모순]은 정체성 발달에 필수적이다. 교육환경과 누군가의 정체성 사이에는 모순이 있을 수 있다. 예를 들어, 만약 테크놀로지에 능숙하지 않다고 생각하면, 온라인 학습에 저항할 수 있다. 또한 학습자는 강의실이나 임상 환경 등 서로 다른 상황 간의 모순을 볼 수 있습니다. 보건 전문직 학생들은 궁극적으로 자신들을 미래의 의료종사자로 생각하기 때문에, 그들은 그들이 생각하는 어떤 수업 활동도 [관행의 규범에 위배된다고 생각한다면] 무시할 가능성이 높다. 교육자들은 그들이 교실에서 조언하는 것과 학생들이 실제로 관찰할 수 있는 것 사이의 모순에 대처하는 것이 중요하다. 임상실습에서 감독관은 [자신의 환경 또는 전문성]과 [학습자가 스스로를 구성원으로 간주하는 환경 또는 전문성] 사이의 모순을 해결할 수 있습니다. 예를 들어, 감염증의 임상 감독관은 덜 전문화된 진료 환경(예: 일차 진료소)에 대한 감염병 지식의 가치를 학습자에게 설명할 수 있다.
Contradictions are vital to identity development. There can be contradictions between an education setting and someone’s identity. For instance, if someone believes they are not adept at technology, they may resist online learning. Also, learners may see contradictions between different contexts such as in the classroom and in the clinical setting (Nolen and Ward 2008). As health professions students ultimately see themselves as future practitioners, they are likely to disregard any school activity they perceive contradicts the norms of practice. In the classroom, it is important for educators to address any contradictions between what they advise and what students may observe in practice. In clinical placements, a clinical supervisor may address contradictions between their setting or specialty and what setting or specialty the learners view themselves as a member. For example, a clinical supervisor in infectious disease may explain to their learners the value of infectious disease knowledge for less specialized practice settings (e.g. primary clinic).

학업 과제를 일반적이고 개선 가능한 것으로 구성
Framing academic challenges as common and improvable

교육자들은 성장 마인드를 이끌어내기 위해 [학업적 도전을 흔하고 개선 가능한 것]으로 프레이밍해야 합니다. 성장 마음가짐이란 학습자가 더 많은 노력과 더 나은 전략이 성과를 향상시킬 것이라고 믿는 것입니다. 반면 고정 마음가짐은 역량은 정적이며 학습자는 잘 수행하거나 잘하지 못할 수 있다는 믿음입니다. 학습자는 노력을 긍정적으로 보고 더 깊은 학습 전략(예: 자가 테스트)을 사용할 용의가 있기 때문에 성장 마인드는 더 높은 품질의 동기 부여로 이어집니다. 사고방식은 동기부여 목적과 신념의 네트워크를 형성한다. 표 2를 참조해 주세요.
Educators should frame academic challenges as common and improvable to elicit a growth mindset (Dweck and Molden 2017). A growth mindset is when the learner believes, often unconsciously, that greater effort and better strategies will enhance their performance. A fixed mindset, in contrast, is the belief that competence is static and that learners either have the ability to perform well or not. A growth mindset leads to higher quality motivation because learners view effort positively and are willing to use deeper learning strategies (e.g. self-testing) (Blackwell et al. 2007). Mindsets shape a network of motivational goals and beliefs. See Table 2.

 

교육자는 교육생에 대한 피드백을 통해 학업 과제를 구상합니다. 학습자의 현재 과제와 관련하여 흔한coomon 어려움을 설명해줄 수도 있습니다. 예를 들어, 학습자에게 교육자도 학생일 때에는 역시 어려움을 겪었다고 말할 수 있다(예: 거부, 시간 관리 미흡, 항생제 이해 어려움). 또한, 학습자에게 개선할 수 있는 방법에 대한 피드백을 제공하고 학습자가 '아직' 도달하지 못했다는 것을 알려주면 과제는 개선 가능한 것으로 분류될 수 있습니다.

Educators frame academic challenges through their feedback to trainees. They may frame challenges as common by relating to learners’ current challenges. For example, they could tell the learner that they also struggled (e.g. rejection, poor time management, difficulty understanding antibiotics) when they were at the learner’s level. Also, challenges can be framed as improvable by providing learners with feedback on how they can improve and letting learners know they are not there ‘yet.’

숙달 접근적 목표 지향 도출
Eliciting a mastery approach goal orientation

[성취 목표]는 학습자가 역량을 추구하는 근본적인 이유입니다. [성취 목표]는 접근 또는 회피에 맞춰질 수 있습니다. 접근 지향(성공에 접근하는 것)은 회피 지향(실패 회피)보다 더 동기 부여가 된다.

  • 접근 목표는 더 나은 수행, 기술 향상 또는 학습 시도와 같은 목표를 향해 노력하는 반면,
  • 회피 목표는 학생들의 외모가 나빠지거나 기술이 저하되거나 실패하는 것을 방지하는 것입니다.

Achievement goals are the underlying reasons why learners pursue competence (Elliot and Hulleman 2017). Achievement goals can be oriented toward approach or avoidance. An approach orientation (i.e. approaching success) is more motivating than an avoidance orientation (i.e. avoiding failure).

  • Approach goals are striving towards a goal such as performing better, improving skills, or attempting to learn, whereas
  • avoidance goals are when students’ motive is to prevent looking bad, a decline in their skills, or failure (Elliot and Hulleman 2017).

예를 들어, 접근 지향을 가진 학생은 '이 과제에서 90%를 받고 싶다'고 말할 것이며, 회피 지향을 가진 학생은 '나는 이 과제에서 나쁜 점수를 받고 싶지 않다'고 말할 것이다.

For example, a student with an approach orientation might approach an assignment by saying ‘I want to get a 90% on this assignment’ compared to a student with an avoidance orientation might say ‘I don’t want to get a bad grade on this assignment.’

달성 목표는 [숙달 지향]과 [성과 지향]으로 더욱 구분됩니다. 숙달 지향이 강한 학습자는 일반적으로 학습 의욕이 더 강합니다. 학생들은 그들의 전문지식을 발전시키기 위해 숙달 목표를 만드는 반면, 성과 지향은 표준에 대한 능력을 달성하거나 증명하려는 욕구로 이어집니다. 예를 들어, 학생은 좋은 점수를 받고 싶어서(즉, 성과 목표) 또는 더 나은 의사가 되고 싶어서(즉, 숙달 목표) 시험을 위해 공부할 수 있습니다.
Achievement goals are further separated into mastery and performance orientations. Learners with a strong mastery orientation are typically more motivated to learn. Students create mastery goals to develop their expertise; whereas performance orientation leads to a desire to attain or demonstrate competence relative to a standard (Elliot and Hulleman 2017). For example, a student may study for a test either because they want to get a good grade (i.e. performance goal) or because they want to become a better physician (i.e. mastery goal).

교육자는 [TARGET 모델]과 학생 중심의 개입을 통해 숙달된 접근 목표의 방향을 도출할 수 있다. 보충표 S2를 참조한다. 교육자들이 숙달된 접근 방식을 도출하는 가장 직접적인 방법 중 하나는 평가를 통해서이다.

  • 상벌은 성과 지향성을 이끌어냅니다.
  • 개선의 기회는 숙달 지향성을 촉진합니다.

예를 들어, 임상 감독자는 훈련생에게 지속적인 피드백을 제공하고 등급이나 표준이 아닌 전문 지식 개발을 중심으로 개선 기회를 제안할 수 있습니다. 마찬가지로, 교실 교사와 온라인 모듈은 개선을 위한 형성적인 피드백을 제공하는 기준, 단계적 및 중간점 평가를 작성할 수 있습니다.

Educators can elicit a mastery approach goal orientation through the TARGET model (Ames 1992) and student-focused interventions (Elliot and Hulleman 2017). See Supplementary Table S2. One of the most direct ways for educators to elicit a mastery approach orientation is through assessment.

  • Rewards and punishments elicit performance orientations.
  • Opportunities for improvement foster mastery orientations.

For example, clinical supervisors can provide trainees ongoing feedback and suggest opportunities to improve framed around developing expertise rather than grades or standards. Likewise, classroom teachers and online modules may create baseline, stepwise, and midpoint assessments that provide formative feedback for improvement.

Supplementary Table S2.docx
0.02MB

치료 클래스 3: 동기 부여 노하우 향상
Therapeutic class 3: improve motivation know-how

개요 및 이론적 기초
Overview and theoretical underpinnings

학습자는, 학습 과제를 의도적으로 증가시키거나 계속하는 것으로, 동기 부여의 레벨을 조절합니다(Wolters 2003). 동기 부여 노하우는 [학습자의 신념과 동기 부여에 대한 지식]과 관련이 있습니다. 여기에는 [학습자가 학습 동기를 얼마나 중요하게 생각하는지], [동기 부여가 어떻게 증가하고 유지되는지]에 대한 지식이 포함될 수 있습니다. 동기 부여 노하우에는 동기 부여 전략에 대한 지식뿐만 아니라 이러한 전술을 사용하는 방법, 시간 및 이유도 포함됩니다. 예를 들어, 동기부여가 떨어지면, 학습자는 자신에게 그 과제가 왜 중요한지를 상기시킬 수 있다.
Learners regulate their level of motivation by intentionally increasing or sustaining their effort in academic tasks (Wolters 2003). Motivation know-how relates to learners’ beliefs and knowledge of motivation. These may include how important learners believe motivation is for their learning and knowledge of how motivation is increased and sustained. (Wolters and Benzon 2013). Motivation know-how also includes knowledge of motivational strategies, as well as how, when, and why to use these tactics (Veenman et al. 2006). For example, when motivation wanes, learners may remind themselves why the task is important to them.

학습자에게 '노하우'(즉, 동기 규제)를 가르침으로써 학습자는 자신에게 동기를 부여하고, 지속하며, 노력을 늘릴 수 있는 더 나은 장비를 갖추게 될 것이다. 학습자가 적극적으로 동기를 조절하면 다음과 같이 됩니다.

  • 향후 행동에 대한 목표를 설정한다(Boekaerts 1996).
  • 자신의 동기 부여 상태, 신념 및 행동을 관찰한다(Wolters 및 Benzon 2013).
  • 의도적으로 동기부여량을 늘리고, 양질의 동기부여를 유도하는 전략을 수립한다(울터스·벤존 2013)
  • 미래의 성과를 조정하기 위한 과거의 동기 부여 상태, 신념 및 행동을 성찰한다(Hadwin et al. 2018).


By teaching learners motivation ‘know-how’ (i.e. motivation regulation), learners will be better equipped to motivate themselves, persist, and increase their effort (Kistner et al. 2010). When learners actively regulate their motivation, they:

  • Create goals for their future behaviour (Boekaerts 1996)
  • Observe their own motivational states, beliefs, and behaviours (Wolters and Benzon 2013)
  • Intentionally enact strategies to increase their motivation quantity and elicit higher quality motivation (Wolters and Benzon 2013)
  • Reflect on their past motivational states, beliefs, and behaviours to adjust future performance (Hadwin et al. 2018)

 

동기 부여 노하우를 개선하기 위한 두 가지 개입
Two interventions to improve motivation know-how

교육자는 다음을 통해 동기 부여 노하우를 개선할 수 있습니다.

  • 동기 조절 전략의 교육
  • 동기 조절을 모델링

Educators can improve motivation know-how by:

  • Teaching motivation regulation strategies
  • Modelling motivation regulation

표 3을 참조해 주세요. Wolters and Benzon (2013)은 또한 대학생들이 동기를 부여하기 위해 사용하는 다양한 유형의 전략을 연구하고 개요를 제시했습니다.
See Table 3. Wolters and Benzon (2013) have also studied and outlined different types of strategies that college students use to motivate themselves.

 

동기 조절 전략의 교육
Teaching motivation regulation strategies

동기부여 조절 전략을 사용함으로써, 학생들은 노력을 기울이고 교육 과제를 완료하려는 의지를 의도적으로 유지하거나 보완합니다. 이러한 전략은 다음과 같이 분류된다.

  • 환경 구조화,
  • 성과 목표의 조절,
  • 숙달 목표의 조절,
  • 자기 상벌,
  • 가치의 조절
  • 관심의 조절

Using motivation regulation strategies, students purposefully maintain or supplement their willingness to exert effort and complete an instructional task (Alexander et al. 1998; Wolters and Benzon 2013). These strategies have been classified as

  • environmental structuring,
  • regulation of performance goals,
  • regulation of mastery goals,
  • self-consequating,
  • regulation of value, and
  • regulation of interest (Wolters and Benzon 2013).

[환경 구조화] 전략에는 산만 제한, 설정 변경, 이상적인 시간에 공부하는 것이 포함됩니다. [자기 상벌]은 자신에게 학업을 마친 것에 대한 보상을 약속하는 것을 포함한다. 수행 목표, 숙달 목표, 가치 및 관심을 사용하여, 학생들은 의도적으로 상기시키고, 설득하고, 생각하고, 이러한 목표, 가치 또는 관심사와 연결시키는 데 관여합니다. 예를 들어, 학생은 의도적으로 학술 자료를 아는 것이 유용한 미래 상황에 연결할 수 있습니다. 대학생을 대상으로 한 조사에서, 학생들은 환경 구조화 전략과 성과 목표 전략을 가장 자주 보고하고, 작업 가치, 관심 또는 숙달 목표 전략을 덜 자주 보고했습니다(Wolters and Benzon 2013).

Environmental structuring strategies include limiting distractions, changing the setting, and studying at ideal times. Self-consequating includes promising oneself a reward for finishing academic work. Using performance goals, mastery goals, value, and interest, students purposefully engage in reminding, convincing, thinking, and connecting to these goals, values, or interest. For example, a student may purposefully connect the academic material to a future situation in which it would be useful to know the material. In a survey of college students, students most frequently reported environmental structuring strategies and performance goal strategies and less frequently employed task value, interest, or mastery goal strategies (Wolters and Benzon 2013).


학습자가 동기를 부여하는 데 어려움을 겪을 경우, 교육자는 무엇을, 언제, 왜, 그리고 어떻게 하는지를 포함한 동기 부여 전략에 대해 명시적으로 논의해야 합니다. 예를 들어, 교실 교육자는 온라인 학습 관리 시스템에 동기 부여 조절 전략을 강조하는 읽을거리를 게시할 수 있습니다. 임상 감독관은 학습자에게 장기적인 프로젝트 또는 학습(예: 보드 시험 학습)을 지속하는 방법을 가르칠 수 있습니다. 예를 들어, 그들은 학습자에게 언제, 왜, 그리고 어떻게 동기를 부여하는지 설명할 수 있다.

When learners have difficulty motivating themselves, educators should explicitly discuss motivation strategies including the what, when, why, and how (Veenman et al. 2006; Kistner et al. 2010). For example, classroom educators could post articles or readings highlighting motivation regulation strategies to their online learning management system. Clinical supervisors could instruct learners on how to persist with long-term projects or study (e.g. board exam studying). For example, they may explain to their learners when, why, and how they keep motivated.

동기 조절 모델링
Modelling motivation regulation

교육자는 동기 조절전략의 사용을 모델링하여 동기 조절을 암묵적으로 육성할 수 있다. 교육자가 전략을 사용하고 있다는 것을 명시적으로 언급하지 않더라도, [교육자의 행동]은 학습자가 동기 조절 행동과 전략을 채택하도록 이끌 수 있다. 예를 들어, 교실 교사는 게임화를 통해 학습의 지루한 측면을 더 즐겁게 만드는 전략을 모델링할 수 있다. 임상 감독관은 업무 가치의 조절을 모델링할 수 있다. 예를 들어, 환자 치료 활동 문서화와 관련된 비용(예: 시간, 노력)과 유익성(예: 팀워크 개선, 향후 방문을 위한 더 나은 데이터)이 비용을 초과하는지를 구두로 설명할 수 있다.
Educators may implicitly foster motivation regulation by modelling the use of motivation regulation strategies (Kistner et al. 2010). Without explicitly mentioning that the educator is using a strategy, an educator’s behaviour may lead learners to adopt motivation regulation practices and strategies. For example, a classroom teacher could model the strategy of making tedious aspects of learning more enjoyable through gamification. A clinical supervisor could model their regulation of task value. For example, they might verbalise the costs associated with documenting patient care activities (e.g. time, effort) and how the benefits (e.g. improved teamwork, better data for a future visit) outweigh the costs.

결론
Conclusion


동기 부여는 성공적인 배움의 열쇠입니다. 보건 전문 교육자들은 학습자 동기 부여의 중요성을 이해하고 있지만, 많은 교육자들이 동기 부여를 높이는 교육을 설계하고 전달하는 데 어려움을 겪고 있습니다. 다행히도, 학생들의 동기 부여에 긍정적인 영향을 미치는 것으로 증명된 증거 기반과 현장 검증 전략이 있다. 이 가이드는 약물 요약 비유를 사용하여 학습자 동기 부여의 강도를 높이고, 학습자 동기 부여의 질을 높이고, 학습자 자신의 동기 부여를 촉진하는 개입의 근거와 예를 제공한다.

Motivation is a key to successful learning. Health professions educators understand the importance of learner motivation; however, many have difficulty designing and delivering instruction that increases motivation. Fortunately, there are evidence-based and field-tested strategies that have been shown to positively influence student motivation. Using a drug compendia metaphor, this guide provides a rationale for and examples of interventions that increase the intensity of learner motivation, increase the quality of learner motivation, and promote learner regulation of their own motivation.

 

Interventions to Increase Motivation Intensity

Defining Key Terms Indications General Administration and Examples Mechanism of Action Dosing and Side Effects Monitoring Underpinnings / References
 
Providing Optimal Challenging Learning Tasks
 
Optimal challenge - When a learner perceives a task as challenging but not overly difficult For Whom?  All learners
 
Outcomes:
·   Improved competence perceptions
·   Use of deeper learning strategies
·   Deeper engagement
 
When? In situations that require deep learning or understanding
Increase task challenge (difficulty and complexity) by using real-world problems and constraints
 
Decrease task challenge by breaking down tasks into pieces, allowing more time, or providing support and hints (e.g., an iterative paper)
 
Continuously calibrate task challenge similar to video games - once learners master an easy level, they continue on to subsequently more difficult levels
 
Predict learners’ perceptions of task difficulty by understanding their goals, previous experiences, and capabilities (e.g., conducting a baseline survey or interview)
Learner perceptions of task challenge emerge in each moment, varying across learners and over time.
 
Optimally difficult tasks produce “flow” – a stimulating motivation state and concentration
With easy tasks, learners may experience boredom which limits learning
 
Difficult tasks may be inaccessible for learners, inviting withdrawal, resentment, and short cuts
Observe for deep vs. surface (i.e., going through the motions) engagement


Observe for learner emotions – bored (i.e., the task is too easy) vs. overwhelmed (i.e., the task is too hard)
Flow (Csikszentmihalyi 1997)
 
Theories of motivation and self-regulation, interventions to invite motivation and regulation (McCaslin and Hickey 2001; Paris and Turner 1994)
 
Sparking Curiosity and Interest Among Learners
 
Curiosity -  A natural desire to know more or engage in new situations because they are surprising or new


Situational Interest -  A content- specific state (e.g., I feel interested)
 
Personal Interest -  Content-specific trait (e.g., I am interested in chemistry)

For Whom? All learners, especially those that are not engaged


Outcomes:
·   Increased learner engagement and attention
·   If supported, sparking situational interest may evolve into personal interests
·   Increased effort and therefore, performance
 
When? At the beginning of learning and then consistently to develop learners’ personal interests
 
Gamification - Use principles from games including badges, levels, rewards, fail-safe environment, and friendly competition


Create novelty and variety: Get novel ideas for teaching by following educators on Twitter, reading blogs, or browsing through education websites


Create surprises by incorporating humour, unusual factors, Socratic questioning
 
Stimulate "friendly controversies" by asking learners to vote or debate positions


Connect content or activity to learners' current interests
Surprise creates a disequilibrium that learners are curious to explore until they reach equilibrium


What is interesting is always intrinsically motivating, but what is intrinsically motivating is not always interesting


Interest states decrease cognitive load, allowing learners to take on greater complexity and difficulty
Too much surprise or novelty may lead to feelings of being overwhelmed, inciting learners to disengage


"Novelty effect" - Learners are initially interested in novel education elements, but this fades as the novelty effect wears off
Observe for learners' attention or engagement


Inventory learners' personal interests
Theories of interest development and interventions to foster interest (Harackiewicz and Knogler, 2018)
 
Educator development on sparking interest (Oyler et al., 2016)

 

Defining Key Terms Indications General Administration and Examples Mechanism of Action Dosing and Side Effects Monitoring Underpinnings / References
 
Modelling Enthusiasm and Showing Affective Concern
 
Modelling - Learners implicitly pick up information through observing others’ thinking, actions, process, and the consequences of those actions

Enthusiasm -  An authentic expression of excitement for the topic or activity

 
Affective Concern -  Learners feel like the educator cares for their well-being and personal development
For Whom? All learners, especially those that may not be interested in the content or activity

Outcomes:

·   Higher ratings of educator effectiveness
·   Related to educator well-being
·   Increased learner participation, effort, and intrinsic motivation, leading to higher achievement
 
When? At the beginning to spark learners’ situational interest and after a difficult task
Enthusiasm for learning and affective concern for the learner should be shown  by instructors, near-peers (resident to a student), actual peers, and practicing professionals


Share stories of what the material or activity means to you
 
Conclude learning with a preview of what is to come next. This increases interest and demonstrates your enthusiasm to see the learners again.


Apply concepts using examples that are either interesting to you or the learners. At times, the educator’s enthusiasm may spark a new interest for learners.
 
(Re-)activate your own enthusiasm by thinking about how learners may use the content in the future or what initially engaged you in the topic.
Learners internalize the values and attitudes of those they admire and relate to

"Emotional contagion" – The emotions of one person can unconsciously influence others’ emotions.

 
Learners perceptions of educators’ affective concern for them contributes to learner feelings of belonging
Learners are adept at perceiving when an educator is being inauthentic or authentic.


Educators may develop burn-out or negative attitudes if they spend too much energy falsely maintaining enthusiasm. Optimally, learners should share in the responsibility of being enthusiastic.
 
“Distracting details” –Learners may disengage if they do not perceive the examples as relevant.
Learners generally comment on educator enthusiasm in learners evaluations of teaching

Observe for learners' attention or engagement
Educator development on enthusiasm (Mitchell, 2013)
 
Interventions to support feelings of belonging (Baumeister and Leary 1995)
 
 
Creating Task Relevance and Utility
 
Relevance - What learners believe is useful to their current personal lives

Utility - What learners believe will be useful in the future


For Whom? All learners


Outcomes:
·   Use of deeper-level learning strategies
·   Increased engagement and interest in the topic
·   Influences learners’ choice to pursue future opportunities
 
When?  In situations where  learners may question the value of the material or activity
Eliminate content that is not relevant nor useful for learners


Improve the "real world" nature of the tasks and activities (e.g., use real-world problems in class).


Task-value interventions” -
Show, don't tell! Show them examples (e.g., news stories, articles) of the relevance or usefulness of the content or activity.


"Saying-is-believing effect" -
The tendency for learners to believe messages that were freely advocated by the learner. For example, ask the learners, in discussion or in writing, why the content or activity is important to their own lives, others, or the community.
“Exchange value” – Learners constantly evaluate whether and to what extent to participate in an activity based on costs and benefits. For example, only studying material on the exam.

Learners determine importance by thinking about the "real world.” Is it realistic? Is it aligned with their goals? Is this what they need to know and be able to do?
If everything is labelled as important, then nothing becomes important

If learners don't think content or activity is relevant or useful, they will go through the motions (i.e., surface-level engagement)
Observe whether learners are going through the motions or going above and beyond (i.e., their level of engagement)
 
Inventory what learners perceive as relevant and useful
Expectancy-value-cost theory, interventions to improve task value
(Renninger and Hidi 2011; Harackiewicz and Priniski, 2018)
 
Communities of Practice theory (Lave and Wenger 1991)

 

Interventions to Enhance Motivation Quality

Defining Key Terms Indications General Administration and Examples Mechanism of Action Dosing and Side Effects Monitoring Underpinnings / References
 
Promoting Autonomy and Structure
 
Autonomy -    When learners wholeheartedly endorse their own actions. The opposite is controlling
 
Structure -  Providing clear information to learners about expectations and how to achieve learning outcomes. The opposite is chaos and confusion.
For Whom? All learners
 
Outcomes:
·   Intrinsic motivation
·   Self-reported and observed engagement
 
When? As often as possible
Provide learners with choices
 
Nurture learners personal interests and responsibility for their own learning
 
Direct learners with “can,” “may,” and “I invite you to” rather than “must,” “need,” and “should.”
 
Explain to learners what it takes to reach the desired outcomes
 
Provide consistent step-by-step directions and smooth transitions
When autonomy and structure are both provided, the basic human needs to feel autonomous and competent are supported
 
Autonomy Support
Activates learner interest, goals, curiosity, and sense of challenge
Learners will see their successes as earned by them and
 experience their own free will, resulting in intrinsic motivation
 
Structure Support
Learners feel greater control over academic challenges (i.e., internal locus of control), resulting in greater confidence (i.e., self-efficacy) 
Too much autonomy may require more educator oversight, coordination, and grading
 
Too little autonomy may lead learners to feel controlled and dependent, leading to frustration, boredom, and defensiveness
 
Too much structure may lead to boredom and reliance on structure
 
Too little structure leads to being overwhelmed, confused, or lost which may lead to taking short cuts and use of surface learning strategies
 
Observe or have learners report on their level of engagement
 
Observe for mediating processes—frustration, boredom, and surface learning strategies
 
Self-determination theory, interventions for supporting autonomy and competence (Ryan and Moller, 2018; Jang, Deci, Reeve, 2010)
 
Defining Key Terms Indications General Administration and Examples Mechanism of Action Dosing and Side Effects Monitoring Underpinnings / References
 
Addressing Learner Identity Contradictions
 
Identity contradictions -  Misalignments between one's identity and an activity. Also, contradictions between different contexts such as the classroom and clinical practice
 
For Whom? Leaners who hold an identity that contradicts with the content area or learning environment (e.g., a learner who does not identify with a specialty)
 
Outcomes:
·   Learner choices
·   Deeper engagement
·   Intrinsic motivation
 
When?  In situations that lead to identity contradictions
Bring in a speaker that learners identify with currently (near peer) or in the future (practicing professional). Have the speaker discuss the value of the activity
 
Create a hybrid across the two contradictions (e.g., having school-based faculty visit clerkships, having clinicians co-teach certain topics)
 
Address learners misconceptions that they internalized from previous experiences, popular culture, and their social network (e.g., through a class discussion)
 
A deep motive of learners is becoming a part of a community of practice (e.g., hospital, clinic). This drives their participation and choices in activities, formulating their identity
 
When a topic or activity contradicts a learners current identity, they will complete the least amount of work as possible. However, this mechanism can be overruled by appealing to learners' future identities, especially their identity to be a "good" health professional.
 
If a learner believes the educator is overinflating the importance of a topic, they may lose trust in the educator
 
If a learner believes the educator is telling them what to do or how to be, they may become defensive
Observing for surface versus deep engagement
 
Ask learners what they do not enjoy or value about the task - it might unearth identity contradictions
Situative motivation (Nolen et al., 2015)
 
Communities of Practice Theory (Lave and Wenger, 1991)
 
Motivational Filters (Horn and Campbell, 2015)
 
Framing Academic Challenges as Common and Improvable
 
Academic challenges -  Events that learners interpret as challenging or failure (e.g., low marks, critical feedback)
 
For Whom?
·    Those who may lack successful models (e.g., first-generation University students, under-represented identities)
·    Low performers who endorse a fixed theory of intelligence
(i.e., fixed mindset)

 
Outcomes:
·   Malleable theory of intelligence (i.e., growth mindset)
·   Increase feelings of belonging, leading to more intrinsic motivation
·   Increased marks and persistence
·   Decreased attrition
 
When? During tough transitions or first perceived failures
"Framing interventions"
·   Frame challenges as common and improvable (e.g., provide statistics or quotes from more senior learners illustrating that challenges to adjusting to the learning environment are common and can be overcome)
·   Share your personal stories of overcoming challenges in academia or practice
·   Have learners write about (or discuss) how to overcome academic challenges
 
"Mindset interventions"
Share and assign reading materials framing intelligence as malleable
 
Some learners will interpret challenges or failure as evidence that they lack intelligence, don't belong in an area, or are "just not a certain type of person" (e.g., critical care person)
 
Framing challenges as common supports learner belief that they belong even though they failed.
 
Framing challenges as improvable supports the belief that they can achieve but require more effort and better strategies
If the interventions are not provided during a period of transition or challenge, the interventions may be seen as another academic exercise
 
Listen to how learners discuss their challenges or failures. Do they see them as permanent or improvable? Common or unique to them?
 
Inventory learners implicit theories of intelligence (i.e., mindsets)
Interventions to support feelings of belonging and relatedness (Jang, Deci, Reeve, 2010; Baumeister and Leary, 1995)
 
Growth mindset interventions (Harackiewicz and Priniski, 2018)

 

Defining Key Terms Indications General Administration and Examples Mechanism of Action Dosing and Side Effects Monitoring Underpinnings / References
 
Eliciting a Mastery Approach Goal Orientation
 
Mastery approach goal orientation - The underlying reason or goal for learning is to further master a task or develop competence
 
Performance goal orientation -  The underlying reason or goal for learning is to outperform their peers (e.g., good marks, higher reputation)
 
For Whom? All learners
 
Outcomes:
·   Elicits a mastery approach goal orientation
·   Increased self-efficacy and interest
·   Improved marks
·   Decreased anxiety and failure avoidance
 
When? In situations where a mastery approach goal orientation is required for complex, long-term learning
The TARGET model for classroom structure
·    Tasks: Optimally challenging, interesting
·    Authority: Learners participate in decisions
·    Recognition: In a private setting
·    Grouping of learners: Mixed-ability
·    Evaluation: Based on self-improvement
·    Time: Flexible
 
"Student-focused" interventions
·    Reframe assessments as an opportunity to learn
·    Define goal orientations and have learners discuss the advantages of a mastery orientation
·    Teach deeper learning strategies (e.g., self-testing, explaining topics to others)
Learners may have both a mastery and performance orientation
 
Learners may have a performance orientation in one unit and a mastery orientation in another
 
Learners underlying reason(s) for learning (i.e., orientation) leads to different patterns of behaviour.
 
Mastery orientation leads to the use of deeper learning strategies, deep engagement, and seeing challenges as motivating.
 
Too much mastery without performance: Learners may lack the strategy or spend too much time on interesting material to attain higher performance
 
Too much performance without mastery: Learners may take short cuts or do the bare minimum, therefore decreasing their long-term learning needed to succeed in the future
 
If instruction on mastery goals is perceived by learners as only advising them to "try harder," they may feel defensive that the educator does not understand how hard they are trying
 
Have learners take a goal orientation inventory
 
Observe for expressions of their orientation (e.g., deep vs. surface level learning strategies)
 
Achievement goal orientation interventions (Ames, 1992; Elliot and Hulleman, 2017)

 


 

 

Med Teach. 2021 May;43(5):492-500.

 

 doi: 10.1080/0142159X.2020.1837764. Epub 2020 Nov 2.

 

The clinical educator's guide to fostering learner motivation: AMEE Guide No. 137

Affiliations collapse

Affiliations

1Faculty of Pharmacy and Pharmaceutical Sciences, Monash University, Parkville, Victoria, Australia.

2College of Pharmacy, University of Kentucky, Lexington, KY, USA.

3School of Pharmacy, University of Mississippi, Jackson, MS, USA.

4Faculty of Medicine, Nursing and Health Sciences, Monash University, Clayton, Victoria, Australia.

PMID: 33136450

DOI: 10.1080/0142159X.2020.1837764

Abstract

Motivation theory and research remain underused by health professions educators. Some educators say it can seem too abstract. To address this, we applied health care language to learner motivation theories. Using a familiar metaphor, we examined the indications, mechanism of action, administration, and monitoring of learner motivation interventions. Similar to the treatment monographs in medicine compendia, we summarized each motivation intervention in the form of a monograph. The purpose of this guide is for health professions educators to develop an understanding of when (i.e. indication) and how (i.e. mechanism of action) learner motivation interventions work. With this information, they can then access ready-to-implement strategies (i.e. administration) to increase their learner interest and assess the effects of these interventions (i.e. monitoring).

Keywords: Motivation; clinical educators; engagement; health professions students; medical students.

 

편향되지 않고, 신뢰할 수 있고, 타당한 학생강의평가도 여전히 불공정할 수 있다 (Assessment & Evaluation in Higher Education, 2020)
Unbiased, reliable, and valid student evaluations can still be unfair
Justin Esarey and Natalie Valdes

 

 

서론
Introduction

학생 강의 평가는 고등교육의 교수들이 얼마나 잘 가르치고 있는지를 평가하기 위해 사용되어야 하는가? 학자들이 학생 평가의 유용성에 대해 토론할 때, 일반적으로 SET가 유효하고 신뢰할 수 있고 편향되지 않은 방식으로 강사의 자질을 측정하는지 여부에 대한 논의의 초점이 맞춰진다. 예를 들어, 많은 연구가 SET가 여성 강사에 대해 편중되어 있는지 여부를 조사했습니다. 편파적이거나 잘못된 SET를 사용하여 인사 결정을 내리는 데 명백한 문제가 있기 때문에 문헌은 양적이면서도 불일치하다. 하지만 SET가 이러한 문제로부터 자유로워지면 어떻게 될까요? 이 경우, SET 점수는 채용할 직업 후보자를 선택하는 데 있어서, 또는 교직원에게 종신 재직권을 부여해야 하는지 여부를 결정하는 데 있어서 타당한 근거가 되는가?

Should student evaluations be used to assess how well faculty in higher education are teaching? When scholars debate the utility of student evaluations of teaching (SETs), the discussion typically centres on whether SETs measure an instructor’s quality in a valid, reliable and unbiased way. For example, many studies have examined whether SETs are biased against female instructors (Langbein 1994; Andersen and Miller 1997; Martin 2016; Mitchell and Martin 2018; Mengel, Sauermann, and Zölitz 2019). The literature is both voluminous and discordant, perhaps because there are obvious problems with using biased or invalid SETs to make personnel decisions. But what if SETs are free from these problems? In that case, are SET scores a sound basis for choosing which job candidate to hire or whether a faculty member should be granted tenure?

이 기사에서, 우리의 컴퓨터 시뮬레이션은 SET를 사용하여 가난한 교사를 식별하면 [경험적 연구에 의해 지원되는 가장 낙관적인 시나리오]에서조차 [허용할 수 없을 정도로 높은 오류율]을 야기할 수 있음을 보여준다. 즉, SET가 (a) 학생의 학습 및 지도의 베스트 프랙티스와 어느정도 상관이 있고, (b) 신뢰성이 있고, (c) 편향되지 않았더라도, SET가 교직원의 교육 성과를 평가하기 위해 사용되는 일반적인 방법은 SET와 강사 간의 분포에 관한 합리적인 가정 하에서 불공평하다. 이는 [SET 점수]와 [강사 자질] 간의 관계가 상당히 부정확하기 때문에 발생합니다. 둘 사이에 상당한 상관관계가 있는 경우에도 마찬가지입니다. 이러한 부정확성은 SET 점수에 대한 본질적으로 무작위적이고 특이한 영향(예: 성격이나 외모)에서 비롯될 수 있으며, 지도와 관련이 없는 점수에 대한 체계적인 영향(예: 특정 성별이나 인종의 교원에 대한 편견)에서 비롯될 수 있다. 그러나 체계적인 편견이 없는 경우에도 SET 점수의 특이적 변화로 인해 발생하는 소음은 SET를 사용하여 교직원의 교육에 대한 올바른 판단을 하는 우리의 능력을 방해합니다.
In this article, our computational simulation shows that using SETs to identify poor teachers can result in an unacceptably high error rate even under the most optimistic scenarios supported by empirical research. That is, even if it is correct that SETs are (a) moderately correlated with student learning and/or instructional best practices, (b) reliable and (c) unbiased, common ways that SETs are used to evaluate faculty teaching performance are unfair under reasonable assumptions about the distribution between SETs and instructor quality. This occurs because there is considerable imprecision in the relationship between SET scores and instructor quality even when there is substantial correlation between the two. This imprecision can come from essentially random and idiosyncratic influences on SET score (such as personality or appearance), or it can come from systematic influences on those scores that are not related to instruction (e.g. bias against faculty members of a certain gender or race). But even when there are no systematic biases, the noise created by idiosyncratic variation in SET score interferes with our ability to use SETs to make correct judgements about a faculty member’s teaching.


컴퓨터 시뮬레이션을 사용하는 이유는 SET 점수가 이상적인 조건에서 교직원의 교육에 대한 행정적 판단에 매핑될 때 어떤 일이 일어나는지 조사할 수 있기 때문입니다. 우리의 접근법은 산업심리학에서 나온 선별과 평가의 오래된 이론 모델과 유사하다. 결과가 분포 가정에 지나치게 의존하지 않도록 원시 점수 대신 상관 백분위수 순위를 시뮬레이션하는 정규 연결사를 사용합니다. copula는 개별 한계 분포 함수를 공동 분포 함수에 연결하는 함수이며, 보다 구체적으로 '표준 균일 일변량 여유를 갖는 다변량 df [분포 함수]'이다(Hofert 2018, 페이지 5–6). 백분위수 순위는 원시 SET 점수 분포에 관계없이 항상 균일하게 분포되므로 다양한 학생 평가 도구와 점수 척도로 많은 대학을 모델링하는 데 더 나은 선택이다. 그러나 특정 한계 분포와 상관 계수는 SET 점수 및 교육 품질의 공동 분포를 고유하게 결정하지 않는다. 따라서 우리의 결론은 합리적으로(보편적이지는 않지만) 일반화할 수 있다고 믿는 일부 분포 가정에 여전히 구속된다. 이 점은 '방법론' 섹션과 '결론'에서 더 자세히 설명되며, 여기서 교직원과 관리자가 SET 점수를 실제로 사용하는 경우의 결과에 대해 논의한다. 

We use computational simulation because it allows us to examine what happens when SET scores are mapped into administrative judgements about faculty teaching under ideal conditions. Our approach is similar to venerable theoretical models of screening and assessment from industrial psychology (Taylor and Russell 1939; Naylor and Shine 1965; Cascio 1980; Owen and Li 1980). To avoid our results being overly dependent on distributional assumptions, we use normal copulas that simulate correlated percentile rankings instead of raw scores. A copula is a function that connects individual marginal distribution functions to a joint distribution function, and more specifically is ‘a multivariate df [distribution function] with standard uniform univariate margins’ (Hofert 2018, pp. 5–6). Percentile rankings are always uniformly distributed regardless of the distribution of raw SET scores and are therefore a better choice for modelling many universities with different student evaluation instruments and scoring scales. However, specific marginal distributions and a correlation coefficient do not uniquely determine a joint distribution of SET scores and instructional quality; our conclusions are therefore still bound to some distributional assumptions that we believe are reasonably (though not universally) generalizable. This point is discussed further in the ‘Methodology’ section and in our ‘Conclusion’, where we discuss the consequences for practical employment of SET scores by faculty and administrators.

다양한 상관관계를 가진 SET 점수 및 교직원 품질 백분위수를 시뮬레이션한 후 여러 평가 절차에서 시뮬레이션된 점수를 사용합니다. 구체적으로는 다음 사항을 조사합니다.
We simulate SET scores and faculty quality percentiles with varying correlation, then use the simulated scores in several assessment procedures. Specifically, we examine:

  • SET 점수를 통한 교직원의 쌍별 비교. 이는 교육 실적에 따른 취업 지원자의 비교 또는 종신 재직권 교수와 최근의 성공 사례의 교육 기록을 비교한 것이다.
  • 개별 교수의 SET 점수와 모든 교직원의 SET 점수의 전체 모집단의 비교. 이는 동료에 비해 성적이 낮은 교수진(예를 들어 점수가 특정 백분위수 순위 이하)이 테뉴어 케이스 또는 기타 체계적인 검토의 일부로 행정처분을 위해 식별되는 절차를 반영한다.
  1. pairwise comparisons of faculty via SET scores. This mirrors the comparison of job candidates on the basis of their teaching performance or the comparison of a faculty member up for tenure to the teaching record of a recent (un)successful case.
  2. comparison of an individual professor’s SET scores to the overall population of SET scores from all faculty members. This mirrors a procedure where faculty members who are under-performing relative to their peers (e.g. whose scores are below a certain percentile ranking) are identified for administrative action as part of a tenure case or other systematic review.

SET 점수와 교직원 교육 품질 사이의 상관관계가 ρ가 약 0.4인 경우(즉, 대체로 경험적 문헌에 의해 지지받는 가장 높은 값)인 상황에서조차, SET 점수의 큰 차이(30% 포인트까지)로 인하여 최고의 교수자를 신뢰성 있게 식별하지 못한다. 게다가 SET 점수가 20백분위 이하인 교직원의 4분의 1 이상이, 실제로 시뮬레이션의 중간값 교직원의 교직원에 비해 더 잘 가르치고 있습니다. SET 점수가 매우 높은 사람도 형편없는 교사가 될 수 있습니다. 95번째 백분위수를 초과하는 SET 점수를 받은 교수는 거의 19%가 중간 교수보다 더 잘 가르치지 못합니다. 이러한 결과는 이변량 정규 분포를 사용하여 SET 점수 및 교직원 품질을 시뮬레이션하여 분석을 반복할 때 확인됩니다. 이 분석의 의미는 교수의 수업instruction에 기반하여 공정하고 정확한 인사 결정을 내리려면 SET 점수보다 학생의 학습이나 지도의 베스트 프랙티스에 실질적으로 더 관련된 교육 성과 측정이 필요하다는 것입니다. 

Even when the correlation between SET scores and faculty instructional quality is ρ ≈ 0.4, roughly the largest value supported by empirical literature (e.g. Cohen (1981) finds an average correlation of 0.43 between overall SET score and student learning), a large difference in SET scores (even as much as 30 percentile points) does not reliably identify the best teacher in a pairwise comparison of simulated faculty members. Moreover, over one quarter of faculty with SET scores at or below the 20th percentile are actually better at teaching than the median faculty member in our simulation. Even those with exceptionally high SET scores can be poor teachers: nearly 19% of those with SET scores above the 95th percentile are no better than the median professor at teaching. These findings are confirmed when we repeat our analysis using a bivariate normal distribution to simulate SET scores and faculty quality. The implication of our analysis is that making fair, accurate personnel decisions based on faculty instruction requires a measure of teaching performance that is substantially more related to student learning or instructional best practices than SET scores alone.

우리 결과에 근거해, 대학내에서의 SET의 사용 방법에 대해 3개의 제언을 실시합니다.

  • 첫째, 목적이 무엇이든 회귀 조정 또는 일치된 하위 표본 분석을 통해, 비교육적instructional 요인(즉, 편향)에 의해 설명되는 SET 점수의 체계적 편차를 제거한 후 이러한 점수를 사용할 것을 권고한다. 이 조정은 평가 점수와 교육의 질 사이의 상관관계를 증가시켜 본질적으로 이 관계의 부정확한 원인을 걸러내고, 따라서 우리의 시뮬레이션에 따르면 불공정한 결정의 가능성을 감소시킨다. 단, 이 절차에서는 SET 점수에 대한 특이적 영향에 의해 발생하는 노이즈를 제거할 수 없습니다. 따라서 우리는 또한 SET 점수만으로는 오해의 소지가 있을 때 독립 평가자, 학생 인터뷰, 전문가에 의한 교수 관찰, 교재 동료 검토 및 SET 점수를 조합하여 교직원의 교수 능력을 훨씬 더 정확하게 파악할 수 있다고 믿는다. 중요한 것은, 이러한 개별적인 조치 각각에 노이즈가 있거나 결함이 있는 경우에도 마찬가지라는 것입니다.
  • 우리는 이러한 여러 형태의 평가를 평균화하는 것이 각각의 독특한 변화를 상쇄시켜 평균 평가와 교직원의 실제 교육 성과 사이의 부정확성을 더욱 감소시킬 수 있다는 것을 보여준다. 교육 품질의 여러 척도를 취득하는 것은 비용이 많이 들기 때문에 SET는 교육에 대한 보다 포괄적인 평가가 필요한 교사를 특정하기 위한 저비용 메커니즘으로 기능할 수 있습니다.이렇게 파악된 많은 교직원이 우수한 교사가 될 것이라는 것을 이해하고 있습니다.
  • 마지막으로, 어떠한 목적으로든 SET 점수에 과도하게 의존하는 경우 주의를 기울일 것을 권장합니다. 이러한 유용성은 일반적으로 관리자 또는 교수진에게 알려지지 않은 SET와 강사 품질 간의 공동 분포 특성에 따라 달라질 수 있음을 보여준다. 우리는 이 마지막 요점이 교육을 평가할 때 여러 평가 메커니즘(SET 점수 포함, 이에 한정되지 않음)을 사용할 필요성을 더욱 강조한다고 믿는다.

Based on our results, we make three recommendations concerning how SETs should be used within universities.

  • First, we advise removing any systematic variance in SET scores explained by non-instructional factors (i.e. biases) via regression adjustment or matched subsample analysis before using these scores for any purpose (as illustrated by Nargundkar and Shrikhande 2014; see also Benton and Li 2017, pp. 3–4). This adjustment increases the correlation between evaluation scores and teaching quality, in essence filtering out a source of imprecision in this relationship and therefore reducing the chance of an unfair decision according to our simulations. However, this procedure cannot remove the noise created by idiosyncratic influences on SET scores. Thus, we also believe that a combination of independent evaluators, interviews with students, teaching observations by experts, peer review of instructional materials, and SET scores can give a much more accurate picture of a faculty member’s teaching proficiency when SET scores alone would be misleading. Importantly, this is true even when each of these individual measures is noisy or flawed.
  • We show that averaging these multiple forms of evaluation can allow idiosyncratic variation in each one to cancel out, resulting in further reduction of imprecision between the averaged assessment and a faculty member’s true teaching performance. Because obtaining multiple measures of instructional quality is expensive, we think that SETs could serve as a low-cost mechanism for identifying faculty in need of this more comprehensive assessment of their teaching–with the understanding that many faculty so identified will be excellent teachers.
  • Finally, we advise caution in over-reliance on SET scores for any purpose: we show that their usefulness can depend on characteristics of the joint distribution between SETs and instructor quality that will typically be unknown to administrators or faculty. We believe this final point further underscores the need to use multiple assessment mechanisms (including but not limited to SET scores) when evaluating teaching.

 

배경
Background

본 연구는 SET의 가치에 대한 평가에서 크고 분할된 문헌을 다루지만, 기본적으로는 SET 점수의 타당성, 신뢰성 및 (무)편향성에 초점을 맞추고 있다는 점에서 통합된다. 다수의 연구에서는 SET를 긍정적으로 평가하는데, 한 41개 연구의 메타 분석은 '일반 과정과 강사 차원이 학생의 성취도와 상당히 강하게 관련되어 있다는 것을 비교적 확신할 수 있다' 그리고 '소견은 다른 학생, 강사, 기관 및 주제 영역에 일반화될 수 있다'고 주장한다. Feldman(1989)에 의한 동일한 데이터의 재분석은 이러한 결론을 대체로 확인시켜 준다. Herbert Marsh의 오랜 연구 기록은 대부분(전부는 아니지만) Marsh가 개발한 SEQ(Student Evaluation of Educational Quality)은 신뢰성과 타당성을 조사하여 SET의 특성을 다음과 같이 주장한다.
Our study enters a literature that is both large and divided in its assessment of the value of SETs, but essentially united in that its focus is on the validity, reliability, and (un)biasedness of SET scores as measures of faculty teaching performance. In favour of SETs, an influential meta-analysis combining the findings of 41 empirical studies argues that ‘we can be relatively certain that the general course and instructor dimensions relate quite strongly to student achievement’ (Cohen 1981, p. 298) and that the ‘findings can be generalized to different students, instructors, institutions, and subject matter areas’ (p. 305). Re-analysis of the same data by Feldman (1989) largely confirms these conclusions. A long record of scholarship by Herbert Marsh (summarized in Marsh 1984, 1987; Marsh and Roche 1997), which mostly (but not exclusively) examines the reliability and validity of the Student Evaluation of Educational Quality (SEEQ) developed by Marsh (1982), argues that SETs are:

  • (a) 다차원 
  • (b) 신뢰성 및 안정성 
  • (c) 주로 교육되는 과정이 아닌 과정을 가르치는 강사의 지도의 기능 
  • (d) 효과적인 교육의 다양한 지표에 대해 상대적으로 유효하다. 
  • (e) 잠재적 편견으로 가정된 다양한 변수에 상대적으로 영향을 받지 않는다. 
  • (f) 교육의 효율을 향상시키는 데 도움이 되다 

 

  • (a) multidimensional;
  • (b) reliable and stable;
  • (c) primarily a function of the instruction of the instructor who teaches a course rather than the course that is taught;
  • (d) relatively valid against a variety of indicators of effective teaching;
  • (e) relatively unaffected by a variety of variables hypothesized as potential biases… and
  • (f) useful in improving teaching effectiveness (Marsh and Roche 1997, p. 1187).

이러한 발견은 나르군드카르와 쉬리칸데(2012)의 독립 연구에서도 확인되었다. 이와 함께 Benton과 Li는 IDEA가 제작한 SET의 교육 등급은 '학습자 및 교사 행동에 대한 외부 학생 등급과 긍정적인 상관 관계'와 함께 학생들의 시험 성적도 보고했습니다. 이러한 등급은 또한 Marsh(1982)가 만든 SET에서 보고된 것과 유사한 학생의 숙련도에 해당하는 여러 차원으로 구분된다. 일반적으로 경험적 연구는 [학생 학습]과 [SET 평정] 사이의 상관관계를 최대 ρ = 0.4 정도로 보고한다.

These findings were confirmed in an independent study by Nargundkar and Shrikhande (2012). Along the same line, Benton and Li (2017, pp. 7–8) reports that student ratings of instruction on a SET produced by IDEA ‘correlate positively with external student ratings of learner and teacher behaviours’ as well as student performance on exams (Benton, Duchon, and Pallett 2013). These ratings also break into multiple dimensions that correspond to student proficiencies (Li et al. 2016) similar to those reported for the SET created by Marsh (1982). Generally, empirical studies report correlations between student learning and SET ratings of around ρ ≈ 0.4 at most.


반면에, 많은 다른 연구들은 SET가 학생의 학습이나 강사의 질을 측정하지 않으며, 성과와 상관없이 체계적으로 일부 그룹에 편향될 수 있다고 주장해왔다. Utl, White, Gonzalez(2017)가 Cohen(1981)과 Feldman(1989)의 데이터를 재분석한 결과, [null 결과는 무시]되고, [과장된 긍정적인 결과를 가진 소규모 연구]만 발표되는 경향에 영향을 받는다는 것을 발견했다. 30개 이상의 수업 섹션을 포함하는 SET 연구만 조사하면 학생 등급과 학생 학습 간의 상관관계가 50% 이상 감소하고, 나중에 발표된 SET 연구를 포함하면 이 상관관계는 최대 ρ = 0.1까지 떨어진다(표 4 참조). Nargundkar와 Shrikhande(2014)는 Marsh의 SET 도구의 유효성을 확인하지만, SET 점수는 학급 규모, 강사 성별, 교육 과정 유형과 같은 비교육적 요인에 의한 일부 내재적 편견을 반영한다. 우리 분야(정치학)에서의 SET에 대한 연구는 특히 강사 성별이 코스 평가에 미치는 영향에 초점을 맞추고 있으며, 코스의 다른 측면이 동등하더라도 여성이 남성보다 낮은 SET 점수를 받는다는 것을 반복적으로 발견해 왔다. 이 연구결과는 여성 교수자에 대한 편견을 발견했지만, 이후 대규모 학제 간 연구에서는 커리어의 초기에서만 그렇다는 것으로 확인되었다.

On the other hand, many other studies have argued that SETs do not measure student learning or instructor quality and may be systematically biased against some groups irrespective of merit. Uttl, White, and Gonzalez (2017) re-analyse the data from Cohen (1981) and Feldman (1989) and find that their results are influenced by the tendency for small studies with exaggeratedly positive results to be published while null results are ignored (Schwarzer, Carpenter, and Rücker 2015, chapter 5; see also Sterling 1959; Sterling, Rosenbaum, and Weinkam 1995; Franco, Malhotra, and Simonovits 2014). When examining only those SET studies that included 30 or more class sections, the correlation between student ratings and student learning falls by 50% or more (see Table 3 in Uttl, White, and Gonzalez 2017); when including SET studies published later, this correlation falls even further to at most ρ ≈ 0.1 (see Table 4). While Nargundkar and Shrikhande (2014) confirm the validity of Marsh’s (1982, p. 55) SET instrument, they also note that SET scores ‘reflect some inherent biases due to noninstructional factors’ (p. 55) such as class size, instructor gender, and the type of course being taught. Work on SETs in our home discipline (of political science) has been particularly focused on the effect of instructor gender on course evaluations, repeatedly finding that women receive lower SET scores than men even when the other aspects of the course are equivalent (Langbein 1994; Andersen and Miller 1997; Martin 2016; Mitchell and Martin 2018). This finding was partially confirmed in a large cross-disciplinary study by Mengel, Sauermann, and Zölitz (2019), who found bias against female instructors but only against those early in their career.

고용과 종신 재직에 대한 결정을 내리기 위해 무효, 신뢰성이 없거나 편향된 학생 평가를 사용하는 것은 분명히 학생과 교수진 모두에게 해가 된다. 대학이 학생의 학습이나 지도의 베스트 프랙티스를 추적하지 않는 SET를 채용, 재직 및 승진 과정의 일부로 사용할 경우, 그들은 성과 대신 무작위 기회에 따라 중요한 결정을 내릴 수 있습니다. 설상가상으로, 편향된 SET는 소수집단 배경의 교수자에게 불이익이 되거나, [인기 없는 필수 과목]을 가르치는 교수에 대한 처벌punish이 될 수 있다. 이것이 중요한 문제라는 것은 인정하지만, 다른 질문을 합니다. SET가 유효하고 신뢰할 수 있으며 편견이 없다면 어떻게 될까요? 뚜렷한 편견이 없고 강사의 질과 중간 정도의 상관관계가 있는 SET 점수는 교직원의 교육 성과를 판단하는 공정한 기준인가? 이 질문에 대한 대답이 '아니오'인 경우, 일반적으로 인식되는 것보다 SET 사용에 더 큰 문제가 있습니다.
Using invalid, unreliable or biased student evaluations to make decisions about hiring and tenure is obviously harmful to students and faculty alike. If universities use SETs that do not track student learning or instructional best practices as a part of their hiring, tenure, and promotion process, they may make important decisions on the basis of random chance instead of merit. Even worse, biased SETs could disadvantage faculty from underrepresented minority groups or punish faculty members who teach unpopular required courses. While we agree that this is an important problem, we ask a different question: if SETs are valid, reliable, and unbiased, what then? Are SET scores without demonstrable bias and moderately correlated with instructor quality a fair basis on which to judge a faculty member’s teaching performance? If the answer to this question is ‘no,’ there is a much bigger problem with the use of SETs than is commonly recognized.

 

방법론
Methodology


SET 점수의 신뢰성, 타당성, 편중성을 교육 능력의 척도로 경험적으로 평가하는 것이 아니라 경험적 문헌에 의해 뒷받침될 수 있는 가장 낙관적인 조건을 가정하고 대학 교직원 평가 및 관리를 위한 도구로서 SET 점수를 사용한 결과를 연구한다.

  • 첫째, 전체 강사 SET 등급이 코스 내의 실제 교육 품질(예: 학생 학습 및/또는 교육 모범 사례)과 중간 정도 상관된다고 가정합니다. 문헌에 보고된 가장 높은 상관관계는 ρ 0 0 0.4 정도이므로 이 상관관계 수준을 연구의 기준으로 사용한다. 우리는 또한 강사의 클래스 평균 SET 점수가 완벽하게 신뢰할 수 있다고 가정한다(즉, 강사의 클래스 평균 SET 점수는 항상 동일하므로 완벽하게 알려져 있다). 이는 다수의 클래스 평균 SET 점수의 평균을 사용하여 교직원을 평가하거나 클래스 평균 SET 점수가 완벽하게 안정되어 있다고 가정하는 것과 같다.
  • 둘째, 관리자가 SET 점수를 전문가가 권장하는 신중하고 현명한 방법으로 사용하고 있다고 가정합니다. 예를 들어, 문헌에 의해 보고된 SET 점수와 품질과의 불완전한 상관관계를 고려할 때, 두 강사 사이에 실질적인 품질 차이가 있다고 결론짓기 전에 관리자가 SET 점수에 큰 차이를 요구한다고 가정한다. 따라서 SET 점수가 동료보다 낮은 강사가 불량 교사로 식별될 경우 관리자는 오류 가능성을 최소화하기 위해 이 컷오프를 낮은 수준으로 설정했을 것으로 가정합니다.
  • 마지막으로, 학생 학습과 무관한 강사 수업 평균 SET 점수의 특이적 차이를 모델링하지만, 이러한 특이적 차이는 안정적이며 특정 그룹(예: 여성 또는 대표성이 부족한 소수자)에 대한 체계적 편견을 대표하지 않는다고 가정한다.

Rather than empirically assessing the reliability, validity, or unbiasedness of SET scores as measures of teaching proficiency, we assume the most optimistic possible conditions that can be supported by empirical literature and then study the outcomes of using SET scores as tools for assessing and managing university faculty.

  • First, we assume that overall instructor SET ratings are moderately correlated with actual instructional quality (e.g. student learning and/or instructional best practices) in the course. The highest correlations reported in the literature are on the order of ρ ≈ 0.4, so we use this level of correlation as the basis for our study. We also assume that an instructor’s class average SET scores are perfectly reliable (i.e. an instructor’s class average SET score is always the same and thus perfectly known). This is equivalent to assuming that a faculty member is assessed using the average of a large number of class-average SET scores, or alternatively that class average SET scores are perfectly stable.
  • Second, we assume that administrators use SET scores in the careful and judicious manner recommended by experts (e.g. Boysen et al. 2014; Benton and Young 2018). For example, we assume that administrators require a large difference in SET scores before concluding that there is a real difference in quality between two instructors, given the imperfect correlation of SET scores with quality reported by the literature. Relatedly, if instructors who receive lower SET scores than their peers are identified as poor teachers, we assume that administrators set this cutoff to a low level in order to minimize the possibility for error.
  • Finally, although we model the idiosyncratic difference in instructor class-average SET scores that is unrelated to student learning, we assume that these idiosyncratic differences are both stable and not representative of any systematic bias against a particular group (e.g. women or under-represented minorities).

 

이러한 가정은 SET 점수, 교육 품질 및 관리 평가 모델에 대한 정보를 제공합니다. 구체적으로는 교직원 i의 클래스 평균 강사 SET 점수 si의 백분위수 순위(원점수나 값이 아닌)와 교사로서의 실제 자질을 연구한다.여기서 qi는 교직원이 학생 학습에 진정으로 기여하는 것 및/또는 교육 모범 사례에 대한 적합성을 나타낸다. 예를 들어,

  • si = 40은 교직원의 전체 SET 점수가 교직원의 총 모집단에서 SET 점수의 40%보다 우수하다는 것을 의미하며,
  • qi = 40은 같은 교직원이 동료의 40%보다 우수하다는 것을 의미합니다. 

These assumptions inform our model of SET scores, the quality of instruction, and administrative assessment. Specifically, we study the percentile rankings (rather than raw scores or values) of a faculty member i’s class average overall instructor SET scores si and their actual quality as a teacher qi, where qi represents a faculty member’s true contribution to student learning and/or their conformity with instructional best practices.

For example, 
> si = 40 means that the faculty member’s overall SET score is better than 40% of SET scores from the total population of faculty members,
> while qi = 40 means that the same faculty member is a better instructor than 40% of his/her peers.

이러한 척도는 백분위수이기 때문에 기본 SET 점수 또는 강사 품질 메트릭이 어떻게 분포되는지에 관계없이 각각은 si ~ U [0, 100] 및 qi ~ U [0, 100]의 균일한 한계 분포를 가집니다. (si, qi)의 공동분포는 si와 qi가 고정공통값 θ에서 상관관계를 갖는 것으로, 상관관계가 θ인 정규연관을 사용하여 이를 모델링한다(Hofert 2018, 페이지 87). 

Because these measures are percentiles, each has a uniform marginal distribution regardless of how the underlying raw SET score or instructor quality metric is distributed: si  U [0, 100] and qi  U [0, 100]. The joint distribution of (si, qi) is such that si and qi are correlated at a fixed and common value of ρ; we model this using a normal copula with correlation ρ (Hofert 2018, p. 87).

그림 1은 모델을 사용하여 교수진의 SET 점수 및 실제 교육 품질 값을 백분위수로 시뮬레이션하는 세 가지 예를 보여줍니다. 산점도(si, qi)의 각 점은 개별 교직원 i의 클래스 평균 SET 점수 백분위수(x축)와 실제 교육 품질 백분위수(y축)를 나타냅니다.

  • 그림 1(a)에서 SET 점수와 실제 강사 품질 사이에는 아무런 관계가 없습니다(표준 = 0).
  • 그림 1(b)에서 SET 점수와 강사 품질 사이의 상관관계는 경험적 문헌에 의해 지원되는 최대값과 거의 일치하는 값으로 설정된다(set = 0.4).
  • 마지막으로, 그림 1(c)은 상관 관계를 매우 높게 설정한다(표준 = 0.9).

Figure 1 shows three examples of how we simulate faculty members’ SET scores and true instructional quality values as percentiles using our model. Each point in a scatter plot (si, qi) represents an individual faculty member i’s class average SET score percentile (on the x-axis) and true instructional quality percentile (on the y-axis).

  • In Figure 1(a), there is no relationship between SET score and true instructor quality (ρ = 0).
  • In Figure 1(b), the correlation between SET score and instructor quality is set at a value roughly consistent with the maximum value supported by empirical literature (ρ = 0.4).
  • Finally, Figure 1(c) sets the correlation extremely high (ρ = 0.9).

각 산점도 상단 및 오른쪽 모서리의 히스토그램에는 SET 점수 백분위수(위 모서리)와 교직원 교육 품질(오른쪽 모서리)의 한계 균일한 분포가 표시됩니다. 각각의 시뮬레이션에서는, 특정의 ρ 를 가지는 통상의 코풀라로부터 다수의 교직원을 추출해, 그러한 교직원을 사용해 SET 스코어의 특정의 관리상의 용도가, 좋은 교사와 나쁜 교사의 구별에 있어서 얼마나 효과가 있는지를 평가합니다. 시뮬레이션에서 각 교직원의 진정한 강사 자질을 알 수 있기 때문에 이상적인 조건에서 이러한 관리 용도가 얼마나 잘 수행되는지 정확하게 평가할 수 있습니다.

The histograms on the top and right edges of each scatter plot shows the marginal uniform distribution of SET score percentiles (top edge) and faculty instructional quality (right edge). Each one of our simulations draws a large number of faculty members from the normal copula with a specified ρ and uses those simulated faculty members to assess how well particular administrative uses of SET scores work in terms of distinguishing good teachers from bad. Because we know the true instructor quality of each faculty member in our simulations, we are able to accurately assess how well these administrative uses perform under ideal conditions.

 

우리의 모델은 테일러와 러셀(1939)의 모델과 유사하며, 테일러와 러셀(1939)은 표준화된 평가(점수 테스트 등)를 사용하여 이 [표준화된 평가]가 [근로자의 직무 성과]와 유의하지만, 불완전하게 상관되어 있을 때(수준 r) 근로자를 선택하는 결과를 연구했다. Taylor와 Russell은 저비용의 전자컴퓨팅 이전에 근무하고 있었기 때문에, (평가의 엄격성(즉, 고용되는 평가 노동자의 비율), 평가의 유효성(r) 및 작업 성과가 최소한 허용 가능한 모집단의 근로자 비율이 주어졌을 때) 평가에 의해 선택된 종업원의 비율을 나타내는 표를 작성했습니다. 이러한 표를 통해 관리자는 복잡한 계산 없이 정보에 입각한 결정을 내릴 수 있었습니다.

Our model is similar to that of Taylor and Russell (1939), who studied the consequences of using a standardized assessment (such as a scored test) to select workers when this assessment is meaningfully but imperfectly correlated (at level r) with those workers’ job performance. Because Taylor and Russell were working at a time before low-cost electronic computing, their main contribution was producing tables showing what proportion of workers selected by the assessment would be acceptable given the stringency of the assessment (i.e. what proportion of assessed workers would be hired), the validity of the assessment (r), and the proportion of workers in the population whose job performance would be at least minimally acceptable; these tables enabled managers to make informed decisions without complex calculation.

같은 이유로 테일러와 러셀은 연속 표준화 평가 지표(예: 시험 점수)와 근로자 품질의 연속 표준화 측정치가 상관 관계 r을 갖는 단위 이변량 정규 밀도에 따라 분포될 것이라고 가정했다. Naylor와 Shine(1965)은 다양한 평가 조건에서 선택된 근로자의 평균 표준화된 업무 성과를 보여주는 이 표의 버전을 작성했다. 이들의 수정된 접근방식은 관리자들이 표준화된 평가를 통해 얼마나 많은 선택이 기준 수준과 비교하여 노동자의 평균 품질을 개선할 수 있는지를 결정할 수 있게 했다.그는 전체 인구입니다. Naylor와 Shine은 이러한 표준화된 품질 점수 사이의 상관 단위 이변량 정규 분포에 대한 가정을 유지했습니다. 이러한 모델은 과거 고등교육 평가 연구에 성공적으로 적용되었다. 예를 들어, Owen과 Li(1980)는 수정된 Taylor-Russell 접근방식을 사용하여 대학 입학 요건으로 최소한의 표준화된 시험 점수 성과를 요구하는 효과를 연구한다. 

For the same reason, Taylor and Russell assumed that the continuous standardized assessment metric (e.g. a test score) and the continuous standardized measure of worker quality would be distributed according to a unit bivariate normal density with correlation r. Naylor and Shine (1965) created a version of these tables showing the average standardized job performance of workers selected under varying assessment conditions; their modified approach allowed managers to determine how much selection via standardized assessment would improve the average quality of a workforce relative to the baseline level of the overall population. Naylor and Shine maintained the assumption of a correlated unit bivariate normal distribution between these standardized quality scores. These models have been successfully applied to the study of assessment in higher education in the past; for example, Owen and Li (1980) study the effectiveness of requiring minimum standardized test score performance as a requirement for college admissions using a modified Taylor–Russell approach.


이 모델을 사용하여 SET 점수의 두 가지 일반적인 관리 용도를 연구합니다.

  • 교직원의 쌍별 비교
  • 각 교직원의 SET 점수를 모든 교직원의 SET 점수 전체 분포와 비교합니다.

We use our model to study two common administrative uses of SET scores:

  1. for pairwise comparison of faculty members; and
  2. for comparison of an individual faculty member’s SET score to the overall distribution of SET scores from all faculty.


이러한 용도는 SET가 의사결정에 정보를 제공할 수 있는 현실적인 시나리오를 다루도록 설계되어 있습니다. 예를 들어, 테뉴어 평가는 종종 최근의 사례를 참고한다. 후보자의 SET 점수와 최근의 테뉴어 사례의 점수를 쌍으로 비교하여 교육 성과에 기초한 결정을 정당화할 수 있다. 채용 결정에는 소수의 교직원을 서로 비교하는 것이 포함됩니다. SET 점수의 쌍별 비교는 어떤 후보가 더 나은 교사인지 판단하기 위해 사용될 수 있습니다. 아마도 가장 가능성이 높은 것은 교직원의 SET 점수를 모든 교직원의 SET 점수 모집단이 많은 것과 비교하여 동료보다 현저히 나쁜 교직원의 SET 점수를 식별할 수 있다는 것입니다. 예를 들어, 강사는 SET 점수가 학과 또는 대학 중간 점수보다 낮은지 여부에 따라 평가될 수 있습니다. 우리는 그러한 비교가 테뉴어 심사나 임기 전 평가의 일부로서 일어날 것이 거의 확실하다고 기대한다.

These uses are designed to cover realistic scenarios in which SETs may inform decision-making. For example, tenure evaluations often make reference to cases from the recent past; pairwise comparison of a candidate’s SET scores to those of a recent tenure case might be used to justify a decision based on teaching performance. Hiring decisions involve comparing a small number of faculty members to one another; a pairwise comparison of SET scores might be used to adjudicate which candidate is a better teacher. Perhaps most likely of all, a faculty member’s SET scores might be compared to the larger population of SET scores from all faculty in order to identify those whose teaching performance is markedly worse than their peers. For example, an instructor might be judged according to whether his/her SET scores are below the department or university median score. We expect that such a comparison is almost guaranteed to happen as part of a tenure review or a pre-tenure evaluation.

Microsoft R Open 3.5.3(R Core Team 2019)의 copula 라이브러리를 이용하여 ρ 의 상관관계를 갖는 일반 copula에서 SET 점수 백분위수와 강사 품질 백분위수 1,000,000개를 추출하여 이러한 절차의 영향을 모델링합니다. 그림 1과 같이 SET 점수 및 강사 품질 백분위수의 각 추첨은 단일 교직원을 나타냅니다. 그리고 첫 번째 절차에서는 첫 번째 50만 SET 점수 추첨과 두 번째 50만 SET 점수 추첨을 비교하여 SET 점수가 높은 교직원이 질 높은 강사이기도 한 시간의 비율을 결정합니다. 두 번째 절차에서는 100만 SET 점수 추첨을 모두 최소 백분위수 임계값과 비교하여 SET 점수가 임계값 미만인 모든 교직원을 모집단에서 분리한 후 SET 백분위수 임계값 미만 교직원의 강사 품질 점수를 조사합니다.

We model the impact of these procedures by sampling 1,000,000 draws of SET score percentiles and instructor quality percentiles from a normal copula with correlation ρ using the copula library (Hofert et al. 2017; Kojadinovic and Yan 2010) in Microsoft R Open 3.5.3 (R Core Team 2019). As illustrated in Figure 1, each draw of a SET score and an instructor quality percentile represents a single faculty member. Then, for the first procedure, we compare the first 500,000 SET score draws to the second 500,000 SET score draws to determine the proportion of the time that the faculty member with the higher SET score is also a higher quality instructor. For the second procedure, we compare all 1,000,000 SET score draws to a minimum percentile threshold, separate all faculty members whose SET score is below that threshold from the population, then examine the instructor quality scores of faculty members who are below the SET percentile threshold.

한 가지 방법론적인 선택은 특히 주의를 요한다. 즉, 원점수 또는 표준화된 점수 대신 일반 코풀라를 사용하여 SET 점수 및 강사 성과 백분위수를 시뮬레이션하는 선택이다(표준 측정, 즉 z 점수는 평균이 0이고 표준 편차가 1로 조정되었다). 이 선택에는 중요한 이점이 있습니다.SET 점수 또는 강사 품질 등급의 특정 한계 분포를 가정하지 않아도 됩니다. 그러나 결론에서 다시 살펴보겠지만, 상관관계 ρ 은 SET 점수와 강사 자질 사이의 많은 가능한 관계와 일치하며, 다른 관계는 SET 점수를 사용하여 교직원을 평가하는 다른 결과를 초래한다. 원점수나 표준점수보다 백분위수에 초점을 맞추면 정확한 한계분포를 지정하는 문제를 피할 수 있고, 모든 SET 점수나 교육 품질 지표가 백분위수 등급의 동일한 분포를 가져야 하므로 분석을 보다 광범위하게 적용할 수 있다. 즉, 대학이 학생에게, 예를 들면, 다른 질문의 표현이나 다른 응답 척도를 사용하는 등, 전체적인 강사의 평가를 요구하는 방법에 관계없이, 그러한 평가의 퍼센티지는 균일하게 분포할 필요가 있습니다.따라서 시뮬레이션에서는 이러한 SET 중 하나를 사용하는 경우의 결과를 보다 잘 모델링할 수 있습니다.
One methodological choice requires particular attention: our choice to simulate percentiles of SET scores and instructor performance using the normal copula rather than raw or standardized scores (a standardized measure, i.e. a z-score, is one that has been rescaled to have a mean of zero and a standard deviation of one). This choice comes with an important advantage: it enables us to avoid assuming any particular marginal distribution of SET scores or instructor quality ratings. However, as we will revisit in the conclusion, a correlation ρ is consistent with many possible relationships between SET score and instructor quality and different relationships result in different consequences of using SET scores to evaluate faculty. Focusing on percentiles rather than raw or standardized scores allows us to sidestep the issue of specifying correct marginal distributions and makes our analysis more broadly applicable, as any SET scores or instructional quality metrics must have the same distribution of percentile ratings. That is, no matter how a university asks its students for an overall instructor rating – for instance, using different question wording or different response scales – the percentiles from those ratings must be distributed uniformly and therefore our simulations are better able to model the consequences of using any one of these SETs.



그러나 우리의 절차에는 한계가 있다.

  • 첫째, 한계 분포 함수와 상관 계수를 지정한다고 해서 SET 점수와 교직원 품질 사이의 고유한 공동 분포를 의미하는 것은 아니다(Hofert 2018, 페이지 47). 동일한 균일하게 분포된 SET 점수와 강사 품질 지표는 모두 동일한 상관 관계를 갖는 다른 패턴을 가질 수 있다. 따라서 우리의 결론은 매우 다양한 공통적인 상황에 일반화되어 있다고 믿지만, 가능한 모든 경우에 반드시 적용되는 것은 아니다.
  • 또한 경험적 문헌은 종종 원시 또는 z-점수의 표준화된 SET 점수와 시험 점수와 같은 학생 성취도의 직접적인 척도 사이의 상관관계를 연구한다. 이러한 척도에 대한 백분위 순위 간의 상관관계가 아니라, 우리는 이러한 차이가 분석의 일부에서 중요하지 않다고 가정해야 한다. 따라서, 우리는 분석을 특정 SET 시스템 사용의 결과에 대한 거울 같은 시뮬레이션이 아니라 합리적이고 가능성 있는 조건에서 무엇이 잘못될 수 있는지를 보여주는 유용한 예시로 간주한다.
  • 결론의 견고성을 높이기 위해 정규 연결부를 통해 균일하게 분포되지만 상관 관계가 있는 백분위수 대신 이변량 정규 분포 SET 점수 및 교직원 품질 지표를 사용하여 분석을 반복했다. 온라인 부록에 보고된 결과는 질적으로 우리의 주요 finding과 유사하다. 결론에서 연구의 의미를 설명할 때 이 방법론적 선택에 대한 논의로 돌아갈 것이다.

However, there are limitations to our procedure.

  • First, specifying marginal distribution functions and a correlation coefficient does not imply a unique joint distribution between SET scores and faculty quality (Hofert 2018, p. 47): the same uniformly distributed SET scores and instructor quality metrics can have different patterns of relationship that all have the same correlation ρ. Consequently, although we believe that our conclusions generalize to a wide variety of common circumstances, they do not necessarily apply to every possible case.
  • Moreover, the empirical literature often studies the correlation between raw or z-score standardized SET scores and direct measures of student achievement like exam scores (e.g. Benton, Duchon, and Pallett 2013, pp. 380–383), not the correlation between percentile rankings for these measures; we must assume that this difference is not consequential in parts of our analysis. Consequently, we consider our analysis an informative illustration of what can go wrong under reasonable and likely conditions, not a mirror-like simulation of the outcome of using any particular SET system.
  • Toward the end of increasing the robustness of our conclusions, we repeated our analyses using bivariate normally distributed SET scores and faculty quality metrics instead of uniformly distributed but correlated percentiles created via a normal copula; the results, which are reported in an online appendix, are qualitatively similar to our main findings. We will return to a discussion of this methodological choice when describing the implications of our study in the conclusion.

 

결과.
Results

그림 2는 평균 SET 점수를 사용하여 교직원을 쌍으로 비교한 결과를 보여줍니다. 이러한 SET 점수가 순전히 무작위로 할당된 경우, SET 점수에 의해 실제로 더 poor한 교수가 더 나은 강사로 식별되는 경우는 50%이다 (즉, si -sj와 qi -qj는 한 쌍의 교직원에 대해 같은 부호를 가집니다). 따라서 50%의 오류율은 평가 성과에 대한 최소 기준입니다. 참고로 분석에서는 si = sj를 qi = qj일 경우에만 올바른 예측으로 취급합니다. 또한 qi = qj일 때만 si = sj이면 올바른 예측으로 취급됩니다. 이것들은 엣지 케이스이며 계산상으로는 발생할 가능성이 거의 없습니다. 

Figure 2 shows the result of conducting pairwise comparisons of faculty members using average SET scores. If these SET scores were assigned purely at random, the faculty member who was truly a poorer instructor would be identified by SET scores as the better instructor 50% of the time (that is, si −sj and qi −qj have the same sign for a pair of faculty members i and j). Therefore, a 50% error rate is the minimum baseline of evaluation performance. As a side note, our analysis treats si = sj as a correct prediction if and only if qi = qj. In addition, when qi = qj only si = sj is treated as a correct prediction. These are edge cases and computationally unlikely to occur. 

 

 

그림 2는 진정한 질과 전체적인 강사 SET 평가 사이에 [중간 정도의 상관관계]가 있더라도 교직원의 수업 평균 SET 점수를 비교하면 허용할 수 없을 정도로 높은 에러율을 얻을 수 있음을 보여준다. 경험적 문헌에 따르면 현실적으로 기대할 수 있는 가장 높은 상관관계는 0.4이다. 품질과 SET 점수 간의 이러한 상관 관계 수준에서 시뮬레이션에서 품질이 낮을수록 평균 SET 점수가 거의 37% 더 높습니다. 즉, SET 점수를 완벽하게 신뢰할 수 있고 교육의 질과 중간 정도의 상관관계를 갖는 것으로 두 교원을 비교하는 것은 잘못된 교원을 1/3 이상의 시간 동안 더 나은 교사로 식별할 수 있습니다. 실제 데이터에서 가능한 것보다 훨씬 높은 θ = 0.9인 경우에도 품질이 낮은 강사는 평균 SET 점수가 14% 이상 더 높습니다.

Figure 2 shows that comparing faculty members’ class average SET scores results in an unacceptably high error rate, even when there is moderate correlation ρ between true quality and overall instructor SET evaluation. Based on the empirical literature, ρ ≈ 0.4 is the highest correlation we can realistically expect. At this level of correlation between quality and SET scores, the poorer quality instructor in our simulation has a higher average SET score almost 37% of the time. That is, using SET scores that are perfectly reliable and moderately correlated with teaching quality to compare two faculty members can identify the wrong faculty member as a better teacher over one third of the time. Even when ρ = 0.9, far higher than possible in real data, the poorer-quality instructor still has a higher average SET score over 14% of the time.

SET 점수가 행정 결정에서 중요한 역할을 한다고 믿는 학자들은 SET 점수에서 매우 작은 차이를 심각하게 받아들이는 것을 지지하지 않는다(Boysen et al. 2014; Benton and Young 2018). 따라서 분석 고정 ρ = 0.4를 반복하여 한 교직원이 다른 교직원보다 더 나은 교직원이라는 결론을 내리기 위해 필요한 백분위수 SET 점수 격차의 크기를 변경하였다. 그 결과는 그림 3에 나타나 있다.

Scholars who believe that SET scores have a role to play in administrative decisions do not endorse taking very small differences in SET score seriously (Boysen et al. 2014; Benton and Young 2018). Therefore, we repeated our analysis fixing ρ = 0.4 and varied the size of the gap in percentile SET scores necessary to conclude that one faculty member is truly a better instructor than another. The result is depicted in Figure 3.

 

강사 품질에 대한 판단을 형성하기 위해 SET 점수 사이의 최소 거리를 요구하는 것은 단순히 SET 점수의 차이를 심각하게 받아들이는 것보다 상당히 개선된다. 그러나 시뮬레이션에서 SET 점수의 차이는 의사결정 오류가 허용 가능한 수준에 도달하기 전에 실제로 매우 커야 한다. 그림 3과 같이 시뮬레이션된 교직원이 39퍼센트 이상의 SET 점수 차이로 분리된 경우에만 오류율이 10%에 도달합니다. 심지어 이러한 비교에서도 poor한 강사는 10번 중 1번 이상 우수한 강사로 식별됩니다. 5%의 오류율은 SET 점수가 약 54% 포인트 떨어져 있는 교직원만을 비교해야 달성될 수 있다. 그러나 시뮬레이션된 쌍별 비교의 약 21%만이 SET 점수에서 적어도 이만큼 큰 차이를 보였다. 즉, 어떤 교수가 더 나은 교사인지에 대한 결정은 할 수 없었다.대부분의 경우에서 그렇습니다.
Requiring a minimum distance between SET scores in order to form a judgement about instructor quality does improve considerably on simply taking any difference in SET scores seriously. However, the gap in SET scores in our simulation must be very large indeed before errors in decision making reach an acceptable level. As Figure 3 shows, only when our simulated faculty members are separated by a SET score difference of over 39 percentile points does the error rate reach 10%. Even these comparisons identify the wrong instructor as better one out of ten times. A five percent error rate can be achieved in our simulation by comparing only faculty members whose SET scores are separated by about 54 percentile points; however, only about 21% of our simulated pairwise comparisons had a difference in SET scores at least this large, meaning that no decision about which professor was a better teacher could be made in the vast majority of cases.


마지막으로, 교직원을 명시적으로 비교하지 않고, 리뷰 프로세스의 일부로서 모든 교직원의 전체 모집단과 비교할 수 있습니다.예를 들어 관리자는 교직원의 SET 점수를 학과 또는 대학 중앙 SET 점수와 비교할 수 있습니다. 상관관계가 0.4로 고정된 정상 코풀라에서 1,000,000 SET 점수와 실제 강사 품질 수준을 추출하여 이 수행 평가를 시뮬레이션한 후 SET 전체 강사 점수의 20번째 백분위 이하 교직원을 low-quality 교사로 식별하였다. 중위수 대신 20번째 백분위수를 사용하는 것은 단순히 뛰어나지 않은 교사가 아니라 최악의 교사를 식별하는 SET의 신중한 관리 사용을 나타내기 위한 것입니다. 마지막으로 SET 점수가 낮은 교직원 모집단에서 진정한 강사 품질 수준의 분포를 조사합니다. 그 결과는 그림 4와 같다.

Finally, faculty may not be explicitly compared to one another but rather compared to the overall population of all faculty as part of a review process; for example, administrators may compare a faculty member’s SET scores to the department or university median SET score. We simulated this performance evaluation by drawing 1,000,000 SET scores and true instructor quality levels from a normal copula with correlation fixed at ρ = 0.4, then identified faculty members at or below the 20th percentile of SET overall instructor score as low-quality teachers. Using the 20th percentile instead of the median is intended to represent a careful administrative use of SETs that identifies the worst teachers, not simply teachers who are not exceptionally good. Finally, we examine the distribution of true instructor quality levels in this population of faculty members with poor SET scores. The result is shown in Figure 4.

 

 

그림 4는 SET 점수와 실제 강사의 질 사이에 중간 정도의 상관관계가 있더라도, 학생 평가에서 가장 성적이 나쁜 일부 학생은 시뮬레이션에서 여전히 좋은 교사임을 보여줍니다. 구체적으로, SET의 20번째 백분위 이하에 있는 모의 교수진의 27% 이상이 실제로 강사 품질의 중위수를 초과했습니다. 실증연구 결과가 뒷받침하는 가장 낙관적인 조건하에서 SET 성적은 상대적으로 낮은 층에서도 열악한 교사로 지목된 교수 4명 중 1명이 실제로 일반 교수보다 더 능력이 있는 시나리오를 만들 수 있다는 점은 불안하다. 이 문제는 사용하는 분포에 대해 대칭적이라는 점에 유의하십시오. 즉, SET 점수가 80번째 백분위수를 초과하는 교직원의 27% 이상이 실제로 교육자로서의 퀄리티에서 중간값 이하에 있습니다.

Figure 4 shows that, even with moderate correlation between SET scores and true instructor quality, some of the worst performers on student evaluations of teaching are still good teachers in our simulation. Specifically, over 27% of simulated faculty members at or below the 20th percentile on SETs were actually above the median of instructor quality. It is disturbing that even a relatively low floor for SET performance under the most optimistic conditions supported by empirical study results can create a scenario where one in four faculty members identified as a poor teacher is actually more capable than the typical professor. Note that the problem is symmetric for the distributions we use: that is, over 27% of faculty members with SET scores over the 80th percentile are actually at or below the median in instructor quality.


실제로, 뛰어난 SET 점수조차 교직원의 질을 나타내는 신뢰할 수 있는 지표가 되지 않습니다. 가장 높은 평가를 받은 교수 선발 과정을 시뮬레이션하기 위해 그림 4의 분석을 반복하여 SET 점수에서 95번째 백분위 이상의 모의 교직원을 식별하였다. 이 엘리트 그룹의 교직원 중 18% 이상이 중간 강사와 다를 바 없다는 것을 알게 되었습니다. SET 점수가 매우 높은 교사의 자질 평가의 완전한 분포는 부록 그림 7을 참조하십시오. 이러한 결과에 근거해, 상당수의 교사상 수상자가, 실제로 보통의 교수에 비해 teaching에 서투른 것을 발견할 수 있을 것이다. 따라서 SET 점수가 낮으면 좋은 교수가 나쁜 것으로 잘못 인식될 뿐만 아니라 보통보다 못한 교수가 매우 숙련된 것으로 인식되는 경우가 많습니다. 앞에서와 마찬가지로, 이 문제는 대칭적적으로 발생한다. 즉, SET 점수가 5퍼센타일 이하(매우 낮은)인 교직원의 18% 이상이 실제로 교사의 질에서 중위수 이상입니다.

Indeed, not even exceptional SET scores are a reliable indicator of faculty quality. To simulate the process of selecting the most highly-rated professors for special recognition, we repeated the analysis of Figure 4 and identified simulated faculty members above the 95th percentile in SET scores. We find that over 18% of this elite group of faculty are no better than the median instructor; see Appendix Figure 7 for the full distribution of teacher quality ratings for those with extremely high SET scores. Based on these results, it would not be unusual to find that a substantial proportion of teaching award winners are actually worse at teaching than the ordinary faculty member. Thus, not only do poor SET scores often mis-identify good professors as bad, they can often identify worse-than-mediocre professors as exceptionally skilled. As before, the problem is symmetric for the distributions that we examine: over 18% of faculty members with SET scores at or below the 5th percentile are actually above the median in instructor quality.

 

결론
Conclusion

우리의 증거는 교직의 학생 평가에 대한 일반적인 사용이 그러한 평가들이 매우 신뢰성이 높고, 어떤 그룹에 대해서도 편견이 없으며, 진정한 교수진의 질과 적당히 상관되어 있을 때 많은 불공정한 결과를 쉽게 만들어 낼 수 있다는 것을 보여준다. 우리가 보는 것처럼, 근본적인 문제는 학생들의 평가 점수에 대한 무관한 영향이 이 점수에 근거해 결정을 내리는 것이 너무 우연에 의한 것이라는 것이다. 동시에, 우리는 학생 평가가 이용 가능한 대안보다 비용 및 표준화 측면에서 상당한 이점을 가지고 있다는 것을 인식하고 있습니다. 어떻게 해야 할까요? 우리는 세 가지 추천을 합니다.

Our evidence indicates that common uses for student evaluations of teaching can easily produce many unfair outcomes when those evaluations are extremely reliable, unbiased against any group, and moderately correlated with true faculty quality. As we see it, the fundamental problem is that irrelevant influences on student evaluation scores make decisions based on these scores too subject to chance. At the same time, we recognize that student evaluations have substantial advantages in terms of cost and standardization over available alternatives. What should be done? We make three recommendations.

첫째, SET를 만들고 독립적인 연구에 의해 뒷받침된 일부 회사가 이미 작성한 권고사항과 일치한다. 우리는 코스 평균 학생 평가 점수가 어떠한 목적에 사용되기 전에, [체계적인 비교육적 영향(즉, 편견)을 제거하기 위해 통계적으로 조정되어야 한다]고 믿는다. 예를 들어, 선형 회귀 분석에서는 성별, 인종 및 과정 유형에 기인하는 과정 평균 SET 점수의 변동을 추출한 후 이러한 점수를 교직원 평가에 사용할 수 있습니다. 이러한 특성이 교육 및 학습과 무관한 한, 결과적으로 조정된 점수는 원시 SET 점수보다 실제 강사 품질과 더 강하게 상관되어야 하며 부정확성은 감소합니다. 또 다른 대안으로, 이러한 특징에 대한 점수를 일치시킨 다음 일치된 그룹 내에서만 비교할 수 있다. 이는 IDEA가 이미 채택한 접근법과 유사하다. 이 절차에서는 SET 점수에 대한 순수하게 랜덤한 영향이나 특이적인 영향을 제거할 수 없습니다.따라서 이 조정에도 SET 점수와 강사 품질 간의 상관관계가 1에 근접할 것으로 예상되지 않습니다. 그러나 우리가 권장하는 조정은 이 상관관계를 최대한 높일 것으로 믿습니다.
First, consonant with the recommendations already produced by some companies that create SETs (e.g. Benton and Young 2018) and supported by independent research (e.g. Nargundkar and Shrikhande 2014), we believe that course-averaged student evaluation scores should be statistically adjusted to remove any systematic non-instructional influences (i.e. biases) before they are used for any purpose. For example, linear regression could extract any variance in course average SET scores attributable to gender, race, and course type before these scores are used to evaluate faculty. As long as these characteristics are irrelevant to teaching and learning, the resulting adjusted scores should be more strongly correlated with true instructor quality than the raw SET scores and imprecision will be reduced. As another alternative, scores could be matched on these characteristics and then compared only within the matched groups; this is similar to the approach already taken by IDEA (Benton and Li 2017, p. 5). This procedure cannot remove purely random or idiosyncratic influences on SET scores, and so even with this adjustment we do not expect that correlation between SET scores and instructor quality will be close to 1. But we believe that the adjustment we recommend will make this correlation as high as it can be.


둘째, 기존 권고사항과 마찬가지로, SET 점수를 사용하여 중요한 인사 결정을 내릴 때, 교직원의 [교육 성과를 종합적으로 평가하기 위해 여러 다른 척도와 연계]하여야 한다고 생각합니다. 모든 방법(SET를 포함하지만 이에 국한되지 않음)은 교수 교육 퀄리티의 노이즈와 문제를 야기할 수 있는 측정을 생성하기 때문에, '교습 평가의 증거로서 적절한 단일 척도는 없다.' 그러나, 모든 측정이 모두 같은 방식으로 노이즈를 발생시키거나 편향되지 않는 한, 교육을 평가하기 위해 모든 측정치를 동시에 사용하면 보다 타당한 평가를 할 수 있습니다. 그림 5를 보면, 실제 교사의 질과 그 평균 소음 측정 사이의 상관 관계를 알 수 있다. 노이즈가 있는 각 측정치는 θ = 0.4의 품질과 상관되며, 측정치는 x축에 표시된 것과 같이 서로 상관됩니다(그림에 공선성으로 표시됨). 측정치 간의 공진성이 낮으면 이러한 측정치에 대한 특이적 영향과 지시적으로 무관한 영향이 각각 다르다는 것을 나타낸다. 측정값 간의 공선성이 높으면 각 측정값의 편중과 불완전성이 매우 유사하다는 것을 의미한다. 그래프에서 알 수 있듯이, 4개의 다른 측정치에 대한 결합된 평가의 타당성은 이러한 측정치가 다른 방식으로 불완전하다면 어떤 개별 측정치보다 훨씬 더 나을 수 있다.

Second, and also consistent with prior recommendations (Benton and Young 2018), we believe that SET scores should be used in concert with multiple, dissimilar measures in order to comprehensively evaluate the teaching performance of faculty members when significant personnel decisions are being made. Because every method (including but not limited to SETs) produces a noisy and possibly problematic measure of faculty instructional quality, ‘no single measure is adequate as evidence for evaluating teaching’ (Benton and Young 2018, p. 3). However, as long as these measures are not all noisy or biased in the same way, employing them all simultaneously to evaluate teaching can result in a more valid assessment. Consider Figure 5, which shows the correlation between true teacher quality and an average of noisy measures thereof. Each noisy measure is correlated with quality at ρ = 0.4, and the measures are correlated with each other as indicated on the x-axis (which we label in the figure as collinearity). When collinearity among the measures is low, it indicates that idiosyncratic and instructionally irrelevant influences on these measures are different for each one. When collinearity among the measures is high, it means that the biases and imperfections of each measure are very similar. As the plot shows, the validity of a combined assessment of four different measures can be substantially better than any individual measure as long as these measures are imperfect in different ways.

 

물론 이런 종류의 종합평가에는 비용이 많이 듭니다. 모든 교직원이 매년 자기평가, 강의계획표 등의 동료검토, 숙련된 전문가의 강의실 직접관찰, 학생 관리자에 의한 광범위한 인터뷰 등을 실시해야 합니다. 따라서 SET 점수는 이 보다 포괄적인 평가를 위해 일부 교직원을 초기에 선별하는 저비용 수단이 될 수 있다고 생각합니다. 시뮬레이션의 증거에 근거해, 이 평가의 대상이 되는 교직원의 대부분이 좋은 교사(및 선발되지 않은 교직원은 나쁜 교사)가 되는 것을 강조하는 것이 중요합니다. 그러므로, 우리는 교수님의 가르침을 집중적으로 평가하기로 한 결정이 징벌적인 것으로 여겨져서는 안 된다고 생각한다. 또, 이 집중 평가는 SET 점수가 낮은 교직원만을 대상으로 실시되어서는 안 됩니다. 여기서 설명한 것처럼, 일부의 저조한 강사가 우연히 좋은 학생 평가를 받게 될 것으로 예상되기 때문에, SET 점수가 좋은 교원의 랜덤 서브셋도 집중 평가를 위해서 선택되어야 한다고 생각합니다.
Of course, this kind of comprehensive assessment is very costly; it requires all faculty to engage in self-assessment, peer review of syllabi and other course materials, direct observation of their classroom teaching by trained experts, extensive interviews by administrators of their students, and the like on an annual basis. Therefore, we believe that SET scores could serve as a low-cost means to initially screen some faculty members for this more comprehensive evaluation. Based on our simulation evidence, we think it important to emphasize that many of the faculty members selected for this evaluation will be good teachers (and some faculty members not selected will be poor teachers). Therefore, we believe that the decision to intensively evaluate a professor’s teaching should not be viewed as punitive. Nor should this intensive evaluation be performed solely on faculty with low SET scores; as we showed in this article, we expect that some poor instructors will receive good student evaluations by chance and thus we think that a random subset of faculty with good SET scores should be selected for intensive evaluation as well.

마지막으로, SET 점수와 교원 질 간의 상관관계가 일정하게 유지되어도, [SET 점수]와 [교수자 퀄리티] 사이의 공동 분포joint distribution 형태가 SET 점수의 유용성에 영향을 미칠 수 있다는 점에 유의해야 한다. 위에서 설명한 바와 같이, 우리의 분석은 백분위수가 항상 균일하게 분포되어 있기 때문에 (원시 SET 점수나 교직원 품질 측정이 아닌) 백분위수 순위 간의 상관관계를 가정한다. 이를 통해 우리의 분석을 보다 다양한 사례에 적용할 수 있습니다. 그러나 동일한 상관 관계가 매우 다른 분포에 해당할 수 있습니다. SET 점수 백분위수에 따라 대학의 교수진을 평가하는 것은 SET 기구나 대학마다 다를 수 있는 교사의 질과 정확히 어떤 관련이 있는지에 따라 여전히 문제가 될 수 있다.

Finally, we think that administrators and faculty members should be mindful that the shape of the joint distribution between SET scores and instructor quality can impact the usefulness of SET scores even when the correlation between SET scores and faculty quality is held constant. As noted above, our analysis presumes a correlation between percentile rankings (rather than raw SET scores or faculty quality measures) because percentiles are always uniformly distributed. This makes our analysis applicable to a broader variety of cases. However, the same correlation can correspond to very different distributions. Evaluating a university’s faculty according to their performance on SET score percentiles can still be problematic depending on precisely how they are related to teacher quality, which might vary both among SET instruments and universities.

이 현상의 간단한 예는 그림 6과 같다. 그림의 두 패널은 X축의 SET 점수와 Y축의 교직원 품질 점수 사이의 관계를 나타냅니다. 두 경우 모두 SET 점수는 평균 0과 표준 편차 1로 표준화됩니다. 두 패널 모두 동일한 ρ = 0.4에서 교직원 품질과 상관된 SET 점수를 나타냅니다.

  • 왼쪽 패널(그림 6(a))은 SET 점수와 교수 퀄리티의 양봉 분포를 나타내고 있습니다. 대부분의 교직원은 평균보다 약간 높은 SET 점수로 분산되어 있으며, 실제 교직원의 질은 널리 분산되어 있지만, 소수의 교직원은 신뢰할 수 있는 저품질 강사이며, SET에서도 점수가 낮은 경향이 있습니다.
  • 오른쪽 패널은 그림 6(a)의 분포와 동일한 분산-공분산 행렬을 가진 이변량 정규(단일) 분포를 보여준다. 수직 점선은 각 사례에 대한 SET 점수의 10번째 백분위수를 나타내며 수평 점선은 중위수 교직원 품질 점수를 나타냅니다.

A simple example of this phenomenon is shown in Figure 6. Both panels of the figure depict a relationship between SET scores on the x-axis and faculty quality score on the y-axis. In both cases, SET scores are standardized with a mean of 0 and a standard deviation of 1; both panels also depict SET scores that are correlated with faculty quality at an identical ρ ≈ 0.4. However,

  • the left panel (Figure 6(a)) shows a bimodal distribution of SET scores and faculty quality: most faculty are distributed around a slightly above-average SET score and are widely dispersed in true quality, but a small number of faculty are reliably low quality instructors and also tend to score poorly on SETs.
  • The right panel shows a bivariate normal (unimodal) distribution with the same variance-covariance matrix as the distribution in Figure 6(a). The vertical dashed line shows the 10th percentile of SET scores for each case, while the horizontal dashed line shows the median faculty quality score.
 

 

  • 그림 6(a)의 쌍봉 분포에서는, SET 점수의 10번째 백분위 이하에 해당하는 사람 중, 1% 미만만 실제로 중위수 강사보다 우수합니다. 따라서, 이 백분위수를 poor한 교수자를 식별하기 위한 차단으로 사용하는 것은 이 시나리오에서 매우 효율적이고 대부분 공평할 것이다.
  • 그림 6(b)의 단일 분포에서는, SET 점수의 10번째 백분위 이하에 해당하는 사람 중, 21% 이상이 실제 퀄리티 면에서 중위수보다 우월하다. 따라서, 이 경우에 poor한 교수자를 식별하기 위해 낮은 SET 점수를 사용하는 것은 불공평합니다.

 

  • In the bimodal distribution of Figure 6(a), fewer than 1% of faculty below the 10th percentile of SET scores are better than the median instructor. Thus, using this percentile as a cutoff to identify poor teachers would be quite efficient and mostly fair in this scenario.
  • However, in the unimodal distribution of Figure 6(b), over 21% of faculty below the 10th percentile of SET scores are nevertheless above the median in terms of true quality. Thus, in this other case, using low SET scores to identify bad instructors would be unfair.

반적으로 모집단에서 진정한 교수 퀄리티의 분포를 직접 관찰할 수 없기 때문에 SET 점수 사용자는 자신이 어떤 상황에 처해 있는지 알 수 없습니다. 이번 연구는 주의를 기울일 필요성을 강조하며, SET 점수가 보다 철저하고 비용이 많이 들며 정확한 교육 성과 조사가 필요하다는 우리의 결론을 강화한다고 생각합니다.

Because we generally cannot directly observe the distribution of true faculty quality in any relevant population, a user of SET scores has no way to know which situation they are in. We think this demonstration underscores the need for caution, and reinforces our conclusion that SET scores are best used as an indicator of the need for a more thorough, costly, and accurate investigation of teaching performance.

 


Scholarly debate about student evaluations of teaching (SETs) often focuses on whether SETs are valid, reliable and unbiased. In this article, we assume the most optimistic conditions for SETs that are supported by the empirical literature. Specifically, we assume that SETs are moderately correlated with teaching quality (student learning and instructional best practices), highly reliable, and do not systematically discriminate on any instructionally irrelevant basis. We use computational simulation to show that, under ideal circumstances, even careful and judicious use of SETs to assess faculty can produce an unacceptably high error rate: (a) a large difference in SET scores fails to reliably identify the best teacher in a pairwise comparison, and (b) more than a quarter of faculty with evaluations at or below the 20th percentile are above the median in instructional quality. These problems are attributable to imprecision in the relationship between SETs and instructor quality that exists even when they are moderately correlated. Our simulation indicates that evaluating instruction using multiple imperfect measures, including but not limited to SETs, can produce a fairer and more useful result compared to using SETs alone.

 

 

진실은 중간 어딘가에 있다: 일본 의학교육의 국제화와 지역화 사이에서 (Med Teach, 2017)
The truth lies somewhere in the middle: Swinging between globalization and regionalization of medical education in Japan 
Takuya Saikia, Rintaro Imafukua, Yasuyuki Suzukia and Nobutaro Banb

 

서론
Introduction

일본 의료의 현변화
Current changes of health care in Japan

의료 교육이 의료의 지역적 및 세계적 변화에 대응함에 따라(Gibbs 및 McLean 2011), 의과대학은 지역사회에 봉사할 의료 전문가를 양성해야 할 사회적 책임을 지고 있습니다. 일본의 의료·의료 교육에 대해 기술한 마지막 논문(오니시·요시다 2004년·고즈 2006년·스즈키 외 2008년)으로부터 근 10년, 일본의 의학교육은 과거 수십년간 사회·의료 개혁의 필요성(2014년 Ban)과 그 이하에 관한 큰 전환점을 맞이하고 있다. 지난 수십 년간 '세계화'의 영향 현재의 일본 의학 교육의 변화와 과제에 대처하기 위해, 박스 1과 같이, 헬스케어의 큰 변화를 몇 개 선택했습니다.

As medical education responds to regional and global changes in healthcare (Gibbs and McLean 2011), medical schools have a social responsibility to train health care professionals to serve local communities. It has been almost a decade since the last paper describing health care and medical education in Japan (Onishi and Yoshida 2004; Kozu 2006; Suzuki et al. 2008), and medical education in Japan is now approaching a major turning point, related to the need for the reformation of society and healthcare in the past few decades (Ban 2014), and under the influence of “globalization” for the past decades. To address the current change and challenge of medical education in Japan, we have selected some major changes in healthcare as shown in Box 1.

 

일본의 번역주의
Japan’s “translationism”

국제화에 대한 일본인의 관점은 일본 의학 교육의 현재 상태에 기초하고 있다. 2010년 일본의 철학자이자 베스트셀러 중 하나인 '일본의 주변국적 인식에 관한 논의'에서 우치다(2009)는 국제화에 대한 일본인의 공통된 견해를 논했다. 우치다씨는, 일본인은 주로 [주변적 상황]에 살고 있다는 인식에 근거해, 세계의 중심이 세계 어딘가에 있다고 생각하는 경향이 있다고 주장했다. 그 때문에, 우치다씨는, 통상, 일본인은 새로운 글로벌 동향이나 컨셉을 오픈 마인드(비판 없이)로 받아 들여, 국제 표준을 따라잡아, 서서히 해석·실행해, 최종적으로 일본 국내에 도입한다고 생각하고 있다. 일본의 다른 철학자인 마루야마와 가토(1998년)는 근대 일본이 19세기 개국 이후 외국 문화를 수입함으로써 더 큰 변혁을 이루었기 때문에 "수입"의 중요성을 언급했다. 해외에서 개념을 수입하는 것은 사실 다른 언어에 대한 이해를 높여야 하며, 19세기 일본 정부는 모든 외국어를 일본어로 번역해야 한다는 번역주의를 채택했다. 그 결정 과정에서 일부 사람들은 영어가 일본의 공용어 중 하나로 받아들여져야 한다고 주장했다. 반면에, 다른 사람들은 영어를 이해하지 못하는 일반인들은 중요하고 학술적인 토론에서 제외되고 사회적 불평등을 야기할 수 있기 때문에 제안된 정책에 동의하지 않았다. 이러한 번역주의는 세계화의 쓰나미에 대한 방파제 역할을 하고 문화적 독립을 유지할 수도 있다. 실제로 번역주의의 적응에 의해, 일본어를 사용하는 것에 의해서, 일본의 전통 문화에 비해, 서서히 외국의 개념이나 제도, 문화를 내면화할 수 있을지도 모른다(마루야마, 카토 1998). 한편, 일본 제품의 외국어로의 번역은 매우 한정되어 있어, 이 기사에 기재되어 있는 레퍼런스의 상당수는 일본어로 되어 있다.
The Japanese perspectives toward internationalization are fundamental to the status quo of Japanese medical education. In “Nihon Henkyo Ron (Discussion on the Japan’s perception of peripheral nationality)”, which was written by a Japanese philosopher and one of the best-selling book in 2010, Uchida (2009) discussed the Japanese common perspectives on internationalization. Uchida claimed that the Japanese are based primarily on their perception that they are living in a peripheral situation, and tend to think that the center is located somewhere else in the world. Therefore, Uchida considers that Japanese usually accept new global trends and concepts with an open mindset (without criticisms), to catch up with international standards, interpret and implement them gradually, and finally incorporate them internally into the Japanese context. Maruyama and Kato (1998), other Japanese philosophers, stated the importance of “import” since modern Japan had achieved further transformation by importing foreign cultures after the opening of the country in the nineteenth century. Importing concepts from overseas actually requires a better understanding of another language and in the nineteenth century, the Japanese government adopted “translationism” that every foreign language should be translated into Japanese. In the process of making the decision, some people argued that English should be accepted as one of the official languages in Japan. On the other hand, others disagreed with the policy suggested, because common people who could not understand English would be excluded from the important and scholarly discussions and possibly resulting in social disparity. Such translationism might function as the breakwater against the tsunami of globalization, and maintain cultural independence. In fact, the adaptation of translationism might enable Japanese to internalize foreign concepts, system, and cultures gradually, in comparison with Japanese traditional cultures, by using Japanese language (Maruyama and Kato 1998). On the other hand, translation of Japanese products into foreign languages has been extremely limited, as many of references in this articles are in Japanese.


이 기사에서는, 박스 2와 같이, 매크로, 메소, 마이크로 레벨의 글로벌 동향과 비교해, 우리 나라의 의학 교육의 「번역」의 개념, 현재의 상황, 변화에 초점을 맞추고 있다.

In this article, we focus on some “translated” concepts, current context and changes of medical education in Japan, in comparison with global trends at macro, meso, and micro level as shown in Box 2.

매크로 레벨(국제, 국내 레벨)
Macro level (international, national level)

이 수준에서는 문화보다는 [사회 시스템]이 교육 변화에 영향을 미칩니다. 고령화 고령화와 지역 내 의사 분포의 불균형에 의해 일본의 사회·질병 구조가 변화하고 있다. 실제로 우리나라의 의사 수는 OECD 국가 중 매우 낮은 수준이며(OECD 2009), 도시화와 의사 부정 분포가 공공연히 주장되었다(타니하라 외 2011). 그 결과, 일본인은 다음과 같은 다양한 어프로치에 의해, 지역사회에서 일하는 의사를 늘리려고 하고 있다.
At this level, the social system rather than culture influences the educational change. The social/disease structure in Japan has been changing due to the super-aging population and the ever-increasing uneven regional distribution of doctors. In fact, the number of physicians in Japan is ranked very low among OECD countries (OECD 2009), and urbanization and physician mal-distribution were claimed publicly (Tanihara et al. 2011). As a result, Japanese are trying to increase the physicians working in the community by various approaches as described below.

의료 전문 분야 중 하나인 일반 진료
General practice as one of the fundamental medical specialty area


지역사회에서 인적/사회적 자원을 효과적으로 활용할 수 있는 [1차 진료의사 양성]은 졸업 후 다양한 수준에서 이루어지고 있다(Ban and Fetters 2011). 2014년에는 프로그램의 표준화 및 전문의의 질 보장을 위한 독립된 제3자 조직으로 재조직되어 재기동되어 general practice가 내과, 외과 등 19개 기본 의학 전공분야 중 하나로 자리매김하고 있다. 전국적인 프로그램이 개발 중입니다. 우리나라는 모든 의료기관에 대한 무료접근 체제를 갖추고 있지만, 게이트키퍼로서의 일반의의의 증가는 환자의 의사접근의 재정비와 의료비 절감에 기여할 것이다.

Training of the primary care physicians who can utilize human/social resources effectively in the community is undertaken at various levels after graduation (Ban and Fetters 2011). In 2014, the Japanese Medical Specialty Board was re-organized and re-started as an independent third party organization for standardizing programs and guaranteeing the quality of specialists, and the general practice is finally positioned as one of 19 fundamental medical specialty areas such as internal medicine and surgery and its development of nationwide programs is under development. Although Japan has a free-access system to all health care institutions, the increase in certified general practitioners as gatekeepers would contribute to the reorganization of the patients’ access to the physicians and reduction of medical expenditure.

커뮤니티 의학 학습
Learning community medicine in the community

국제적인 동향에 맞추어, 의학교육의 모든 수준에서 임상 훈련은 서서히 대학병원에서 지역사회로 이동해 왔다(일본 커뮤니티에 근거하는 의학교육협의회 2015). 레지던트 트레이닝에 대해서는, 2004년에 2년간의 대학원 임상 트레이닝 프로그램이 도입되었습니다(스즈키 외 2008년). 이 프로그램에서는 커뮤니티에서 1개월간의 트레이닝을 의무화하고 있으며, 이는 커뮤니티에서 활용할 수 있는 기초적이고 포괄적인 임상역량을 배양하기 위한 노력의 일환이기도 합니다. 다른 나라의 경향과 같이, 커뮤니티 클리닉에서의 커뮤니티-기반 교육과, 일차의료-지향적 교육은 있어서의 교육이 일본의과대학 80곳 중 77곳에서 도입되고 있다(Takamura et al.2015). 또, 학부 교육에서는, 커뮤니티에의 조기 공개를 실시해, 커뮤니티의 고령자, 임산부, 영유아와의 장기적인 만남이, 사회 주체로서의 자각의 폭을 넓히고, 커뮤니티의 기능을 이해하는 데 성공하고 있다.

To fit with the international trends, clinical training has slowly been relocated from the university hospitals to the community at all level of medical education (Japanese Council for Community-based Medical Education 2015). As to residency training, a two year-postgraduate clinical training program was introduced in 2004 (Suzuki et al. 2008); one month training in the community is now mandatory during this program, which is also a part of efforts to cultivate the basic and comprehensive clinical competencies that can be utilized in the community. As with the trend in other countries, community-based education and primary-care-oriented education, within community clinics has been introduced in 77 out of 80 Japanese medical schools (Takamura et al. 2015). Furthermore, early exposure to the community is provided in undergraduate education; longitudinal encounters with elderly people, pregnant mothers, and infants at the community were all successfully implemented for the first year students to understand the function of the community with broadening their self-awareness as social entities (Saiki et al. 2016).

 

의사들의 분포 문제를 해소하기 위한 치이키와쿠 
“Chiiki-waku” to resolve the maldistribution of doctors

문부과학성은, 지역사회에 봉사하는 의사를 늘리기 위해서, [3개의 시책]을 실시했습니다. 문부과학성은 2008년에 [의과대학 입학정원을 증원]하기로 하고, 2007년 7625명에서 2016년 9262명(21.5%)으로 전국 의과대학 입학정원을 변경했다. 문부과학성의 [2개 의과대학 신설] 결정과 함께, 특히 농촌 지역 취업을 희망하는 학생을 우대하는 [새로운 입시 제도가 도입]되었습니다. 이 혁신에서는, 현내에 거주하는 지방 학생이나, 현내에서 복무할 학생에 대해서, 일정수의 의과대학이 일정 숫자의 입학 정원을 허용하고 있다. 지원자들은 지역사회에서 일하려는 강한 미래 의지를 가질 것으로 기대된다. 입학사정관리는 학업성취도, 고등학교 추천, 면접을 포함한 시험을 바탕으로 이루어진다. 졸업생들이 특정 기간(보통 9년) 동안 지역사회에서 일한다는 점을 고려할 때, 그들은 지방 정부로부터 장학금을 받을 수 있다. 이 「치이키와쿠」를 통해 의대에 입학하는 학생이 계속 증가해, 약 1400명(2016년 문부과학성)의 의과대학이 71개교 이상 있다. 오구치 외 연구진(2015년)은, 「치이키와쿠」의 학생은, 학년 내내 지역·농촌의학에 대해 긍정적인 이미지를 가지고 있어, 그 중에서도 1차 진료나 소아과가 인기가 있는 것을 분명히 했다. [지역틀 졸업자]의 83%가 같은 도도부현에 있는 레지던트 프로그램을 선택하고 있는 것에 비해, [비-지역틀 졸업자]는 45.3%만이 선택하고 있다(오구치 외 2015). 이 지역틀 입학 제도는, 지역·농촌의 장래의 의사 양성에 효과적이라고 생각됩니다.

The Ministry of Education, Culture, Sports, Science & Technology of Japan (MEXT) (http://www.mext.go.jp/en/) had implemented three policies to increase the physicians serving at community. MEXT decided to increase the admission quota of medical schools in 2008, and the nationwide medical student enrollment changed from 7625 in 2007 to 9262 in 2016 (21.5% increase). In addition to MEXT’s decision to establish two new medical schools, a new entrance examination system was introduced that specifically favored students who wished to work in community rural areas. In this innovation, medical schools are allowed to have a certain number of seats for local students living in the prefecture where the medical school exists or any students who will serve in the prefecture community. The applicants are expected to have a strong future will for working in the community. The admission decisions are made based on the examination, including the academic performance, recommendation of high schools and interviews. They can receive a scholarship from the local government, given that the graduates work in the community for an given period; usually nine years. The number of students admitted to the medical school via this “Chiiki-waku” has continued to increase and there are now over 71 medical schools, that accept about 1400 such medical students (MEXT 2016). Oguchi et al. (2015) clarified that students of “Chiiki-waku” had a positive image to regional/rural medicine throughout the period of academic years, and primary care and pediatrics are more popular among them. Eighty-three percent of the regional frame graduates have selected residency program located in the same prefecture of their graduation, compared to 45.3% of the non-regional graduates (Oguchi et al. 2015). This regional frame entrance system seems to be effective for increasing the future doctors in the local/rural community.

JACME의 설립
Establishment of JACME

일본의 의과대학에서는, 「일본의 세계 동향에의 민감성」과「일본의 헨쿄론」(우치다 2009)으로 설명되고 있는 미국에의 역사적 의존성」의 2가지 요인에 의해서, 국제적 인정이 매우 중요한 것으로 인식되고 있다. 또 다른 이유는 일본 의대의 보수적인 상황을 타개하려는 의학교육자들의 동기이다. 2004년에 이미 일반 고등교육의 인증제도가 시작되어 교육기관 전체의 신뢰성을 확보하는 것이 주안점이 되고 있기 때문에, 우리 나라 대학으로서 인정 자체는 새로운 것이 아니다. 그러나 2010년 미국 외대 졸업자 교육위원회(ECFMG)는 "2023년부터 자격증을 취득하려면 ECFMG가 의대 인증을 받아야 한다"(ECFMG 2010)고 발표했다. 그 후, 의학교육을 위한 독자적인 인증 기관을 설립하는 움직임이 급속히 강해지고 있습니다. 문부과학성 및 일본 의과대학연합회(AJMC)가 지원하는 파일럿 QA 프로그램을 마련하여 2013년 4월부터 의과대학에 대한 시험인정을 실시하고 있습니다. 그 결과, 2015년 12월에 JACME(Japan Accreditation Council for Medical Education)가 정식 설립되어 2017년 3월에 세계 의학 교육 연맹으로부터 인정받았다(JACME 2015-2017). JACME가 주관하는 공식 인증 활동은 2017년 4월부터 시행되고 있습니다. 이것은, 우리 나라의 의학교육의 변혁에 영향을 주는 계기가 될 수 있다.

International accreditation is recognized as extremely important by the Japanese leaders in medical schools due to two factors: one is Japan’s sensitivity to global trends and historical dependency on the United States to catch up with international standards, which may be partly explained by the “Nihon Henkyo Ron” (Uchida 2009) as described. Another reason is medical educators’ motivation to break through the conservative situation of medical schools in Japan. Accreditation itself is not something new for Japanese universities since the accreditation system for general higher education had already started in 2004, in which the main focus was to ensure the credibility of educational institutions as a whole. However, in 2010, the US Educational Commission for Foreign Medical Graduates (ECFMG) announced that “ECFMG requires medical school accreditation for international medical school graduates seeking certification beginning in 2023” (ECFMG 2010). Since then, a momentum to build an independent accreditation organization for medical education has rapidly increased. A pilot quality assurance program supported by MEXT and the Association of Japanese Medical Colleges (AJMC) has been organized and has carried out trial accreditation for medical schools since April 2013. As a result, the Japan Accreditation Council for Medical Education (JACME) was formally established on December 2015, and recognized by the World Federation for Medical Education in March 2017 (JACME 2015–2017). Formal accreditation activity, which is organized by JACME, has been implemented since April 2017. This can be an influential trigger of transformation of medical education in Japan.

Meso(조직/조직 수준)
Meso (institutional/organizational level)

이 수준에서, [몇몇 문화적 요소]들이 교육 변화에 영향을 미칠 수 있다. 커리큘럼 개혁, 성과주의 교육, 자기주도적 학습 전략 수립, 효과적인 교사 연수는 세계적으로 주요한 전제입니다. 커리큘럼 개발에는 지역 의료교육기관의 조직 변화(2001년 Genn)가 포함되기 때문에 특정 국가의 커리큘럼 발전에 미치는 문화적 영향도 무시할 수 없다.
At this level, some cultural factors may influence educational changes. As to curriculum reform, outcome-based education, setting self-directed learning strategies and effective teacher training is a major premise globally. Since curriculum development includes organizational change in local medical education institutions (Genn 2001), the cultural influence on the curriculum development in a particular country cannot be ignored.

커리큘럼 개혁
Curriculum reformation

Hofstede 외 연구진(2010)은 일본이 권력 거리에서는 중간, 불확실성 회피에서는 가장 높은 점수를 가지고 있음을 입증했다. 이러한 문화의 특성은 PBL/TBL 및 임상 사무직과 같은 커리큘럼 개혁에 대한 접근 방식에 영향을 미칠 수 있다. Jippes and Majoor(2008)와 Jippes et al.(2013)는 권력 거리 및 불확실성 회피와 같은 Hofstede의 문화적 차원이 PBL 커리큘럼과 통합 커리큘럼의 구현에 부정적인 영향을 미친 국가에서 다음과 같이 제안했다. 스즈키 외 연구진(2008)의 보고에 의하면, 일본의 의대의 90%는 커리큘럼 설계에 PBL 어프로치를 채용하고 있다. 한편, 자격을 갖춘 충분한 튜터 확보나 물적 자원의 가용성 등과 같이 PBL 프로그램을 지속하는 것에 관한 어려움을 보고한 기관도 있다(Okubo 2014). 이러한 어려움으로 인해, 최근 PBL을 사용하는 의과대학 수는 약간 감소 추세를 보이기 시작했다. 또한 구현 방법이 다양하다는 것도 분명해졌다. 예를 들어, PBL은 기초 의학, 임상 과목의 커리큘럼에만 도입되거나 몇 주 동안 다른 커리큘럼에 도입된다(Okubo 2014). 한편, 일본의 일부 의과대학은 PBL에서 팀 베이스 학습(TBL)으로 이행하기 시작했습니다. 의과대학 80곳 중 31곳은 2013년부터 TBL 방식을 채택하고 있지만, 실행하는 방식이 불분명하고, 목적에 대한 적합성은 아직 연구가 필요하다. 임상 사무직은 일본 의료 커리큘럼의 또 다른 약점으로 꼽힌다. 많은 의과대학에서 학생들은 여전히 모든 임상학과를 통해 단기(2주) 교대로 배우고 있지만, 임상실습의 국제 표준은 기본적인 임상 역량을 배우기 위한 핵심 과목의 통합과 집중이다.

Hofstede et al. (2010) demonstrated that Japan has an intermediate score in power distance and highest score in uncertainty avoidance. Such characteristics of culture may influence the approaches to curriculum reformation such as PBL/TBL and clinical clerkship. Jippes and Majoor (2008) and Jippes et al. (2013) suggested that in countries where Hofstede's cultural dimensions such as power distance and uncertainty avoidance negatively influenced the implementation of PBL curriculum and integrated curriculum. As reported by Suzuki et al. (2008), 90% of Japanese medical schools have adopted a PBL approach in the design of their curriculum. On the other hand, some institutions reported the challenges of sustaining a PBL program, such as ensuring the sufficient number of qualified tutors, and the availability of physical resources (Okubo 2014). Due to these challenges, the number of medical schools using PBL has started to show a slight downward trend in recent years. It also has become clear that the ways of implementation are varied. For example, PBL is introduced only for the curriculum in basic medical sciences, clinical subjects only, or introduced for a few weeks in a few other curricula (Okubo 2014). Meanwhile, some medical schools in Japan began to implement, or switch from PBL to team-based learning (TBL); 31 out of 80 medical schools have adopted a TBL approach since 2013 (Okubo 2014), but its implementation is unclear and its fit for purpose still needs further research. Clinical clerkship is considered another weak point of Japan’s medical curriculum. In many medical schools, students still learn through a short (two weeks) rotation through all clinical departments, while international standard of the clerkship is more integration and the concentration of the core subjects to learn basic clinical competencies.


일본에서는 새로운 커리큘럼 학습 전략을 받아들이는 열린 마음이 있을 수 있지만, 실제로는 각 학과의 재량권에 대한 간섭이 있어, 매우 독특하고 간략화된 형태로 되어 가는 경향이 있다. 따라서, 실천 연구(2001년 Genn 2001년)등의 연구를 재검토해, 글로벌한 커리큘럼 경향의 개념을 어떻게 채용해, 우리 나라의 의학 교육에 내재화시키고 있는지를 파악하기 위해서, 커리큘럼 혁신에의 노력과 효과가 필요하다.

In Japan, there may be an open mind to accept new curricula learning strategies; however, in practice, there is an interference with the discretionary rights of each department, and a tendency toward quite unique, shortened and simplified forms. Therefore, efforts and effectiveness for the curriculum innovation are necessary to examine the research such, as action research (Genn 2001), to understand how the concept of the global trends of the curriculum are employed and internalized into Japanese medical education.

 

일본의 교직원 육성
Faculty development in Japan

1969년 일본 의학 교육 협회(JSME)의 설립으로 교수개발이 시작되었다. 일본 최초의 의학교육과·센터는 1972년, 준텐도 대학에 설립되었습니다. 1973년, 3명의 일본인 의료지도자가 시드니에서 세계보건기구(WHO)가 실시하는 지역 교사 양성 프로그램에 참가하고, 1974년에는 후지산 기슭에서 같은 1주간의 「의료 교육자를 위한 의료 교육 워크숍」을 개시했다. 이후 일본에서는 커리큘럼 기획과 교수법을 폭넓게 다루는 워크숍식 세미나가 열렸다. 후생노동성(이하 후생노동성)이 2004년 [2년간의 의무적 레지던트 프로그램]을 개시한 이후, 전국 임상교사 워크숍의 기본 틀이 됐다. 워크숍 참가자는 50세 미만이어야 하며, 프로그램은 16시간 이상 진행되어야 하며, 교육과정 개발 및 피드백 및 직장 기반 평가(문부과학성 2004) 등의 실용적인 방법을 포함해야 합니다. 이 워크숍에는 지금까지 7만 명 이상의 주치의(일본 의사 전체의 약 20%)가 참가해, 인증을 취득했습니다.
Faculty development began in 1969 with the establishment of the Japan Society for Medical Education (JSME). The first department/center of medical education in Japan was established in 1972 in Juntendo University. In 1973, three Japanese medical leaders participated in a Regional Teacher Training Programme provided by the World Health Organization (WHO) in Sydney, and they launched a similar 1-week Japanese program “Medical Education Workshop for Medical Educators” at the foot of Mt. Fuji in 1974. Since then, workshop-style seminars that broadly handle curriculum planning and teaching methods had been held in Japan (Science Council of Japan 1997; Ban 2014). Such workshop have now become the basic framework of the nationwide workshop for clinical teachers in 2004 launched by Ministry of Health, Labour and Welfare of Japan (MHLW) after a compulsory 2-year residency program was started. Participants in the workshop should be less than 50, the program should be run for at least 16 hours, and should contain curriculum development and practical methods such as feedback and workplace-based assessment (MEXT 2004). More than 70,000 attending physicians (about 20% of total Japanese physicians) have participated in this workshop and have been certified so far.

 

의학교육의 전문화 및 자격
Specialization and qualifications of medical education

커리큘럼 개혁이 시작된 1990년 이후 현재 의과대학 80곳 중 75곳에 의학교육을 위한 부서나 센터가 존재한다. 600명 이상의 전임 및 시간제 학부가 고용되어 있으며, 비공식 조직 「의학 교육 단위 협회」(Hatao 1999)아래에서 협력하고 있다. 의료 교육을 담당하는 핵심 교직원이 급증함에 따라 교육 전문가 자격증을 취득할 필요성이 높아졌다. 이러한 움직임은 WFME 글로벌 스탠다드 문서에서 의료 교육 전문가를 각 기관에 배치하고 교육 활동을 관리해야 한다는 문구로 가속화되었다(WFME 2015). 현재 일본에서는 외국인 의학교육 석사과정 졸업생이 20명 안팎에 불과하고, 석사과정도 개설되지 않았다. 석사 프로그램 설립이 예상되는 가운데 JSME의 전국 니즈 평가 조사에서 JSME 회원들은 석사 학위보다는 의학 교육의 기본 자격증을 취득하는 것을 선호하는 것으로 나타났다. 이에 따라 2014년 JSME 주도로 학부/대학원/평생 의학교육의 기획, 교육, 경영, 선도, 연구에 능한 [의학교육 전문가]를 양성하기 위한 [전문가 자격 제도]가 구축되었습니다. 지원자는 (1)교육·학습, (2)학습자 평가, (3)교육과정 개발에 관한 3개의 1박2일 과정에 참가하여 교육활동을 분석하여 3개의 교육실천 반영보고서를 작성해야 합니다. 2017년 3월까지 56명의 [의학교육전문가]가 인증되었습니다. 이들은 의학교육이 제도적, 국가적 차원에서 더욱 발전하기 위해 의견 주도적 역할을 할 것으로 기대된다.

Since 1990, when curricula reform commenced, the number of departments/centers for medical education now number 75 out of 80 present medical school (http://www1.gifu-u.ac.jp/∼medc/unit/unit.htm). More than 600 full-time and part-time faculties are employed and they are collaborating under the informal organization “Society for Medical Education Units” (Hatao 1999). With the rapid increase in core faculty members who are responsible for medical education, there was increasing need to acquire certification as experts in education. This movement was accelerated by the statement from the WFME global standards document, that medical education experts are required to be assigned to each institution and to manage educational activities (WFME 2015). Only around 20 Japanese graduates from foreign Masters programs on medical education are now taking a leadership role in Japan, and no Masters program has yet been established. While the establishment of a Masters program is expected, the nation-wide need assessment survey by JSME demonstrated that the members of JSME prefer to obtain a basic certification in medical education rather than a Master degree (Suzuki et al. 2009). According to these results, expert qualification system led by JSME was established in 2014 to nurture medical education experts who are competent in the planning, teaching, managing, leading and studying of undergraduate/postgraduate/lifelong medical education. Applicants are required to participate in three two-day courses on (1) teaching and learning, (2) learner assessment, and (3) curriculum development, with analyzing their educational activities, then they make three educational practice reflective reports for the certification. By March 2017, 56 Medical Education Specialists have been certified. They are expected to take opinion leadership for further development of medical education at both institutional and national level.

대학 레벨에서는, 의학교육에 관한 세미나나 워크숍이 전국에서 개최되고 있습니다. 특히 기후대학 의학교육 개발센터(MEDC)가 주최하는 의료 교육 세미나나 워크숍은, 2001년부터 6000명 이상의 참가자를 받아 들여 새로운 교육 개념과 방법의 발전에 공헌하고 있습니다. 또, 최근, 2개의 의과대학(교토대, 기후대)에서 보건전문직교육 펠로우쉽 프로그램이 개시되고 있다. 두 프로그램 모두 바쁜 임상의들을 위해 온라인 학습과 캠퍼스 학습의 결합으로 설계되었습니다. 이러한 펠로우들은 각 기관의 현지 상황에 대응하여 균형 잡힌 임상 의무와 교육을 보여줄 것으로 기대된다.
At the university level, seminars and workshops on medical education have been held throughout the country, especially Medical Education Seminars and Workshops hosted by Gifu University Medical Education Development Center (MEDC), which as a National Collaboration Centre has accepted more than 6000 participants since 2001 and contributed to the development of new educational concepts and methods (Saiki et al. 2014). Moreover, Fellowship programs on health professions education have recently begun in two medical schools (Kyoto University, Gifu University). Both programs have been designed as a combination of online learning with campus learning for busy clinicians. Those fellows are expected to show their balanced clinical duties and teaching responding to the local context in each institution.

마이크로(개인, 철학)
Micro (personal, philosophical)

[사회적 구성주의]는 현대 교육 및 학습의 글로벌하고 견고한 이론적 기반 중 하나로 간주됩니다. 이 견해는 지식은 활동을 통해 사회적으로 어떻게 구성되는지에 대한 설명을 제공합니다. 성공적인 학습의 열쇠는 학습자의 적극적인 참여와 교육자의 학습 촉진입니다. 또한 오늘날 성찰은 학습 주기의 중요한 단계로 여겨진다(Kolb 1984). 그러나 학습에 대한 기대와 학습에서 어떤 일이 일어나야 하는지에 대한 개념은 원래 각 국지적 맥락, 즉 상황에 따라 개발되었다. 이 절에서는, 해외로부터의 새로운 교육 개념이나 실천이 어떻게 받아들여져 일본의 의학교육에 동화되고 있는지를 기술한다.
Social constructivism is regarded as one of the global, solid theoretical foundations in contemporary teaching and learning. This view provides an account of how knowledge is socially constructed through activity. Key to successful learning is the learner’s active participation and educator’s facilitation for learning. Additionally, reflection is nowadays seen as an important phase of the learning cycle (Kolb 1984). However, the expectations of learning and concepts about what should happen in learning have been originally developed in each local context, i.e. context-dependent. In this section, how new educational concepts and practices from overseas have been accepted and assimilated into Japanese medical education are described.

일본의 교수법
Japanese approaches to teaching

일본의 의학교육자는 전통적으로 학생의 지식 습득을 바람직한 학습 성과로 중시해 왔으며, [강의 위주의 교습]이 바람직한 교육 전략으로 간주되어 왔다. 한편, PBL, TBL, 플립 교실등의 인터랙티브한 교육 전략을 개발해, 학습자의 자율적인 학습과 문제 해결 능력을 촉진해 왔습니다. 의학 교육의 개혁에 수반해, 일본의 고등 교육에서는, 학습자 중심의 교육 패러다임으로의 이행이 광범위하게 행해지고 있다. 특히, 일본 정부 중앙 교육 협의회(2012년 중앙 교육 협의회)가 대학생의 고등 교육에서의 적극적인 학습을 촉진하는 것의 중요성을 강조했기 때문이다.

The medical educators in Japan have traditionally focused strongly on students’ knowledge acquisition as the desired learning outcome and seen lecture-based teaching as a preferred educational strategy (Onishi and Yoshida 2004). On the other hand, they have also committed to developing the interactive educational strategies over 30 years, such as PBL, TBL and flipped classroom, to promote learners’ autonomous learning and problem-solving skills. Subsequent to the reforms in medical education, a shift to the educational paradigm underpinned by learner-centeredness has been made widely in Japanese higher education, especially as the Central Council for Education of the Japanese Government (Central Council for Education 2012) emphasized the importance of facilitating university students’ active learning in higher education.

일본의 교육 패러다임의 변화 속에서, 「선생님」은 학생 학습의 촉진자 또는 코치로서의 역할을 기대받는다. Saiki et al. (2013)는 일본의 의학 교육자들이 때때로 PBL 튜토리얼에서 튜터/조력자의 역할을 맡는 데 어려움을 겪고 있다고 시사했다. 그들은 학생들의 토론이 실패했을 때, 부분적으로 그들이 경험이 부족하고 촉진자로서 무엇을 해야 할지 완전히 이해하지 못했기 때문에, "적극적인" 개입을 피하는 경향이 있었다. 또, PBL의 교육 효과에 대해서도 회의적인 견해를 가지고 있어, 지금까지의 교습 경험이나 일본어의 불확실성 회피의 문화적 특징에 의해서도 영향을 받을 가능성이 있다. 하지만, 그들이 경험함에 따라, 그들은 새로운 교육적 맥락으로 사회화되었고, 튜터로서 학생들의 학습을 촉진하는 더 나은 방법을 찾으려고 시도했다. 
In the educational paradigm shift in Japan, the “teacher” is expected to be a facilitator or coach for student learning. Saiki et al. (2013) suggested that Japanese medical educators were sometimes struggling to assume the role of the tutor/facilitator in the PBL tutorial. They tended to avoid “active” involvement when students’ discussion failed, partially because they were inexperienced and did not fully understand what to do as a facilitator. They also had a skeptical view of the educational effectiveness of PBL, which could be affected by their previous teaching/learning experiences and by a cultural characteristic of uncertainty avoidance in Japanese (Saiki et al. 2013). However, as they experienced, they were socialized into the new educational context and attempted to find a better way to facilitate student learning as a tutor.

교육 철학에 대한 몇 가지 공통된 이해는 아시아와 서양 문화 사이에 존재한다. 예를 들면, 일본의 반영과 같은 개념은 「한성hansei」입니다. 이는 "과거 행동을 검토하고, 평가하고, 비판하고, 최종적으로 이를 개선하는 것"으로 정의된다(Taylor et al. 2005). [한세이]는 전통적으로 아이의 사회적, 개인적 발달을 촉진하는 기본 기술로 여겨져 일본 아이들이 한세이의 습관을 들일 수 있도록 장려되어 왔다. 하지만 한세이는 사람이 해서는 안 되는 것, 즉 경험의 부정적인 면을 특히 더 강조하기 때문에, 일본인은 개선을 위하여 실수로부터 배우는 것을 의미하는 「카이젠Kaizen」을 더 선호한다. 이러한 경미한 인식의 차이에도 불구하고, 일본의 의학교육에서는, 지역 의료 사무원(미야타, 야기타 2010)의 포트폴리오나 시뮬레이션에 의한 교육의 보고 등, 「서양」의 성찰 개념이 널리 받아들여지고 있다.

Some shared understandings of educational philosophy do exist amongst Asian and Western cultures (Nishigori and Sriruksa 2011). For example, a concept similar to reflection in Japan is “hansei”. It is defined as “reviewing past behavior, evaluating, critiquing, and finally improving upon it” (Taylor et al. 2005). Hansei has been traditionally considered a fundamental skill that promotes a child’s social and personal development so that Japanese children are encouraged to make a habit of hansei. Hansei emphasizes particularly on the negative aspect of an experience, i.e. what people should not do, so that Japanese people prefer to learn from a mistake for better improvement; this is known as “kaizen” (change for the better) (Kato and Smalley 2010). Despite such minor difference of their perception, the “Western” concept of reflection has been widely accepted in Japanese medical education, such as portfolios in community-medicine clerkships (Miyata and Yagita 2010) and debriefing in simulation-based education (Konishi et al. 2015).

 

일본식 학습법
Japanese approaches to learning

왓킨스와 빅스(1996)는 학습자가 교육적 맥락, 이전의 학습 경험 및 학습 개념에 따라 학습에 다른 접근법을 취할 것이라고 주장했다. 예를 들면, 일본인을 포함한 아시아계 학생은, 「기억」과 「이해」의 관계를 서양의 학생과는 다르게 인식했다. 특히, 아시아 학생들은 암기와 이해를 별개의 과정이라기 보다는, [상호 연결된 과정]으로 보고 암기가 초기 학습 과정에서 이해로 이어질 수 있다고 믿는다. 예를 들면, 학습자가 학습 전에 독학 준비를 하도록 장려하는 뒤집힌 교실(일본어로는 요슈)이 받아들여져 일본의 학부 의학 교육에 서서히 도입되고 있다(Nishiya et al. 2014). 이러한 급속한 보급의 배경에는, 거꾸로 된 교실에서의 학습 과정이, 일본인의 학습에의 어프로치와 일치할 가능성이 있기 때문일 것이다.
Watkins and Biggs (1996) argued that learners would take different approaches to learning in accordance with its educational contexts, their previous learning experiences and conceptions of learning. For instance, Asian students, including Japanese, perceived the relationship between “memorizing” and “understanding” differently than Western students did. Specifically, Asian students do not see memorizing and understanding as separate but rather interconnecting processes, and believe that memorization can lead to understanding in the initial learning process (Watkins and Biggs 1996; Marton et al. 1997; Imafuku 2012). For instance, the flipped classroom, in which learners are encouraged to perform self-study preparation before classroom learning (Yoshyu in Japanese) is now embraced and gradually introduced into undergraduate medical education in Japan (Nishiya et al. 2014). The reason behind this rapid spreading out may be that the learning process in flipped classroom might align with an approach to learning by the Japanese.

일본 학습자는 조용하고 비판적이지 않은 정보수집자이며 암기성 학습자라는 고정관념적인 이미지가 여전히 남아 있다. 그러나, 실제로, 그들은 비판적인 평가 없이 교실에서 적극적으로 기부를 하고 다른 사람들의 의견을 받아들이는 것을 항상 꺼리는 것은 아니었다(Tavakol과 Dennick 2010). 예를 들면, 인터랙티브한 교육 환경에서, 일본어를 포함한 아시아 학습자는, 단지 대화중의 침묵을 언어적 해방이라고만 생각하지 않았다. 오히려 침묵은 상충되는 이해에 대처하는 생산적인 자원, 협업적 관행 및 플랫폼으로 간주되었습니다. 이러한 교육학적 맥락에서 새로운 학습 프로세스를 형성하는 것은 어렵다고 생각되는 것 같았지만, PBL의 경험을 쌓아, 그룹 학습의 성공을 위한 논의에 보다 적극적으로 공헌하려고 했다(Imafuku et al. 2014).
There are still stereotypical images of Japanese learners as being quiet, non-critical recipients of information and rote learners. However, in fact, they were not always reluctant to actively make contributions in the classroom and to accept others’ opinions without a critical appraisal (Tavakol and Dennick 2010). For instance, in the interactive educational setting, Asian learners, including Japanese, did not merely regard silence in interaction as verbal disengagement. Rather, silence was seen as a productive resource, collaborative practice and platform of handling conflicting understandings (Nakane 2006; Jin 2012). Although Japanese learners appeared to feel it difficult to shape the new learning process in such pedagogical contexts, they attempted to more actively make contributions to discussions for the successful group learning, as they acquired experience of PBL (Imafuku et al. 2014).

일본의 의학교육의 미시적 관점에서 보면, 학습이나 행동에 대한 일본인의 어프로치를 지나치게 일반화시키는 리스크에 유의할 필요가 있다. 마츠모토(2002)의 주장처럼, 일본인은 보다 집단주의적이라고 하는 고정관념은, 현대 문화에서의 일본인의 정체성과 커뮤니케이션 행동을 명확하게 반영하고 있지 않다.

From the viewpoint of micro level of Japanese medical education, we need to note the risk of over-generalizing the Japanese learners’ approach to learning and behavior. As Matsumoto (2002) claims, the stereotype of Japanese being more collectivistic does not clearly reflect Japanese identity and communication behavior in contemporary culture.

결론들
Conclusions

일본의 의학교육은 아직 유동적이지만, 국제적인 동향에 따라 성공적 발전과 개혁을 볼 수 있다. 국제 트렌드에 대한 열린 마음을 가진 번역주의가 일본을 형성하고 있는 반면, 일본 제품의 외국어로의 번역은 극히 한정되어 있다. 영어권 국가에서 주로 창출되는 지식, 교육용어, 의료교육 모델 등이 의료교육의 글로벌 진전에 기여하는 것이 확실하기 때문에 비영어권 국가에서 동등한 협력을 위해 또 다른 견해와 지혜를 만들어 수출해야 한다. 이를 실현하기 위해, 연구를 통해서 지혜를 수출하고, 설계, 개발, 촉진, 평가, 수송하는 능력을 갖춘 일본의 의학 교육자의 적극적인 참여가 기대된다.

Even though medical education in Japan is still in a state of flux, successful development and reformation can be observed in response to international trends. While “translationalism” with an open mind set for international trends has been shaping Japan, translation of Japanese products into foreign languages has been extremely limited. As knowledge, educational terms, and models of medical education, which are mainly generated in the English-speaking countries surely contributes to the global progression of medical education, another view and wisdom should be produced and exported from non-English speaking countries for the equal collaboration. To realize this, active engagement of Japanese medical educators, who equip the capability to design, develop, facilitate, evaluate, and transport as well as export their wisdom through research are expected.

 


Med Teach. 2017 Oct;39(10):1016-1022.

 doi: 10.1080/0142159X.2017.1359407. Epub 2017 Jul 31.

The truth lies somewhere in the middle: Swinging between globalization and regionalization of medical education in Japan

Affiliations collapse

Affiliations

1a Gifu University Medical Education Development Center , Gifu , Japan.

2b Aichi Medical School of Medicine , Medical Education Center , Aichi , Japan.

PMID: 28758830

DOI: 10.1080/0142159X.2017.1359407

Abstract

Japan is well known as a super-aging society, with a low birth rate, and has been ranked as one of the countries having the highest quality of healthcare system. Japan's society is currently approaching a major turning point with regard to societal and healthcare reforms, which are influenced by international trends and regional needs. Development of Japanese healthcare human resources, including medical students, is now expected to ride the wave of globalization, while resolving regional problems in the training and delivery of healthcare. Terms and global trends in medical education, such as outcome-based education, community-based education, reflective learning, international accreditation of medical education, and professionalization of educators are well translated into the Japanese language and embraced positively among the Japanese medical educators. However, these trends occasionally sit uncomfortably with cultural variations that are often a common approach in Japan; notably, "hansei" (introspection) and "kaizen" (change for the better). In the world facing a new era where people are unsettled between globalism and regionalism, Japan's future mission is to steer a balanced route that recognizes both global and regional influences and produce global health professionals educators.

 

교수 리더십 개발: 시너지적 접근의 사례 연구(Med Teach, 2021)
Faculty leadership development: A case study of a synergistic approach
Ellen Goldman , Nisha Manikoth, Katherine Fox, Rosalyn Jurjus and Raymond Lucas

 

 

서론
Introduction

조직이 환경의 변화 속도가 증가하고 무수한 과제에 직면함에 따라 리더십 훈련과 개발이 매우 중요합니다(Yukl 및 Gardner 2020). 이는 특히 교육 및 의료 서비스 제공 개선 및 조직 성과 향상을 위한 이니셔티브를 교직원이 주도할 수 있는 수많은 기회가 있는 Academic Health Center(AHC)에 해당됩니다. 그러나 필요한 리더십 역량을 개발하기 위한 교육을 받은 교직원은 거의 없습니다. 리더십 개발 프로그램(LDP)을 제공하는 AHC가 증가하고 있지만, 평가 방법은 특히 프로그램 설계와 결과를 연결하는 데 있어 엄격하지 않습니다. 교직원의 개발 자원을 효율적으로 활용해야 한다는 압박감이 높아짐에 따라 교직원의 리더십 개발을 극대화하는 프로그램을 설계하는 방법에 대한 더 많은 지식이 필요합니다.
Leadership training and development is critical as organizations face increasing rates of change and a myriad of challenges in their environments (Yukl and Gardner 2020). This is especially true for academic health centers (AHCs), where faculty members have numerous opportunities to lead initiatives to improve education and care delivery, and to enhance organizational performance. However, few faculty members have had training to develop the requisite leadership competencies. While an increasing number of AHCs are offering leadership development programs (LDPs), evaluation methods lack rigor, particularly in linking program design to outcomes (Steinert et al. 2012; Leslie et al. 2013; Straus et al. 2013; Frich et al. 2015; Lucas et al. 2018; Simas et al. 2019). With increasing pressure to use faculty development resources effectively, we need further knowledge about how to design programs that will maximize faculty leadership development.

리더십 개발에 전념하는 자원에도 불구하고 후원 기관들은 프로그램 효과에 대해 계속 의문을 제기하고 있으며(Lacerenza et al. 2017), 관련 연구는 관찰 가능한 결과를 식별하고 다른 환경 세력으로부터 프로그램 효과를 분리하는 것이 어렵기 때문에 어려운 과제이다(Day and Thornton, Yukl and Gardner 2020). 확인된 공식 프로그램의 메타 분석에서는 요구 분석, 대면 현장 세션, 간격 전달, 다중 전달 방법의 사용, 연습 및 피드백이 프로그램 효율성의 중요한 요소로 파악되었습니다(Lacerenza et al. 2017). 이러한 원칙은 지도 학자들의 권고에 부합하며 의학 교육 문헌에서도 공명을 발견한다. 그러나 프로그램 설계를 안내하려면 학습 방법에 대한 자세한 내용이 필요합니다. 어떤 방법이 가장 효과적입니까? 각 방법은 어떻게 리더십을 기르나요?
Despite the resources devoted to leadership development, sponsoring organizations continue to question program effectiveness (Lacerenza et al. 2017) and related research is challenging because identifying observable outcomes and isolating program effects from other environmental forces is difficult (Day and Thornton 2018; Yukl and Gardner 2020). A meta-analysis of formal programs identified needs analysis, face-to-face on-site sessions, spaced delivery, use of multiple delivery methods, practice, and feedback as critical factors for program effectiveness (Lacerenza et al. 2017). These principles are consistent with recommendations from leadership scholars (DeRue and Myers 2014; Day and Thornton 2018; Yukl and Gardner 2020) and also find resonance in the medical education literature (Frich et al. 2015; Lucas et al. 2018; Simas et al. 2019). Yet more specifics regarding learning methods are needed to guide program design: What methods are most effective? How does each method develop leadership?


Allen과 Hartman(2008)이 제안한 학습 방법을 사용한 Conger(1992)의 프로그래밍 접근방식을 활용하여 앞서 언급한 프로그램 효과 원칙(Lacerenza 등 2017)을 포함하도록 설계된 프로그램의 사례 연구를 통해 이러한 질문을 탐색하려고 했다.

We sought to explore these questions through a case study of a program designed to include the aforementioned principles for program effectiveness (Lacerenza et al. 2017), utilizing Conger’s (1992) programming approaches with learning methods suggested by Allen and Hartman (2008).

Conger(1992)의 선구적 리더십 개발 프레임워크는 리더십에 대한 변혁적 접근법(Northouse 2019)을 기반으로 만들어졌으며, 리더십 이론에 대한 경험적 학습의 원칙을 연결하였다. Conger(1992)는 필요한 기술과 능력을 습득할 수 있다고 보고 리더십 개발 프로그래밍에 필요한 4가지 접근법(개념 이해, 스킬 육성, 피드백, 개인 성장)을 확인하였습니다. 앨런과 하트만(2008)은 콩거(1992)의 네 가지 접근법에 매핑된 27가지 학습 방법의 분류법을 만들었다. 이 분류법은 리더십 개발의 필수요소(즉 경험, 지원 네트워크 및 피드백이 리더십 역량을 개발하는 데 중요하다는 것)를 경험적 학습에 관한 문헌에 통합한다(Merriam et al. 2007).
Conger’s (1992) pioneering leadership development framework built on work underpinning the transformational approach to leadership (Northouse 2019) and connected principles of experiential learning to leadership theory. Seeing the requisite skills and abilities as learnable, Conger (1992) identified four required approaches to leadership development programming: conceptual understanding, skill building, feedback, and personal growth. Allen and Hartman (2008) created a taxonomy of 27 learning methods mapped to Conger’s (1992) four approaches. This taxonomy unites the essence of leadership development—i.e. that experience, supportive networks, and feedback are critical for developing leadership competencies (Yukl and Gardner 2020)—to the literature on experiential learning (Merriam et al. 2007).

[경험]은 (경험에서 의미가 만들어지는) [구성주의적 학습 지향]의 핵심이고, 인지적 지향의 핵심으로서, 여기서 [학습 능력capacity to learn]은 지각, 통찰력 및 의미 창출을 통해 개발된다 (Merriam et al. 2007). 구성주의 및 인지적 성향에 기초한 Kolb의 (2015) 경험적 학습이론에서, [학습]은 [경험, 성찰, 사고 및 행동의 지속적인 발전 과정]이다. 앨런과 하트먼(2008) 분류법의 학습 방법을 결합하면 콜브(2015) 학습 주기의 4단계 모두에서 학습할 수 있는 기회를 제공한다. 이와 같은 [학습 방법과 발달 접근법의 조합]은 [인지적, 경험적 및 사회적 과정을 포함하는 전인적holistic 리더십 개발 경험]을 위한 시너지를 제공합니다.

Experience is

  • core to a constructivist orientation to learning, where meaning is made from experience, and
  • core to a cognitive orientation, where the capacity to learn is developed through perception, insight, and meaning-making (Merriam et al. 2007).

Drawing on Kolb’s (2015) Experiential Learning Theory, based on both constructivist and cognitive orientations, learning is a continuous developmental process of experience, reflection, thinking, and acting. Combining learning methods from Allen and Hartman’s (2008) taxonomy provides opportunity to learn from all four stages of Kolb’s (2015) learning cycle. The combination of learning methods and development approaches provides the synergy for a holistic leadership development experience that includes cognitive, experiential, and social processes.

AHC의 리더십 개발에 관한 문헌은 만족도와 학습 수준을 넘어서는 경우가 거의 없으며(Lucas 등 2018; Simas 등 2019), 평가 설계 프레임워크가 부족하고 대부분 자체 보고 데이터에 의존한다는 점에 주목하면서 보다 엄격한 평가가 시급하다는 점을 식별한다(Leslie 등 2013). 다중 데이터 소스(Steinert 등 2012) 또는 종적 데이터(Frich 등 2015)를 사용하는 프로그램 평가는 거의 없다. 또한 '리더십 훈련의 어떤 측면이 가장 효과적이고 참가자들에게 가장 유용한 과정'을 학습하기 위해 질적 방법을 사용할 필요성에 대한 공감대가 형성되어 있다. 또, LDP의 설계와 성과를 관련짓는 문헌에는 gap이 있다. 단일 전략(예: 성찰, 멘토링)의 효과는 연구되었지만, 많은 방법을 설계에 체계적으로 통합하는 프로그램의 효과는 평가되지 않았다. 따라서 특정 학습 방법이 프로그램 효율성에 어떻게 기여하는지를 확인하기 위해 LDP에 대한 엄격한 평가가 필요하다. 

The literature on leadership development in AHCs identifies an urgent need for more rigorous evaluations, noting that most rarely go beyond levels of satisfaction and learning (Lucas et al. 2018; Simas et al. 2019), lacking a framework for evaluation design and relying mostly on self-reported data (Leslie et al. 2013). Few program evaluations use multiple sources of data (Steinert et al. 2012) or longitudinal data (Frich et al. 2015). There is also consensus on the need for using qualitative methods (Leslie et al. 2013; Straus et al. 2013; Frich et al. 2015) to ‘learn what aspects of leadership training are most effective and what processes are most useful to participants’ (Straus et al. 2013, p. 714). Further, there is a gap in the literature linking design of LDPs to outcomes. The effectiveness of singular strategies (e.g. reflection, mentoring) has been researched, but the effectiveness of a program that systematically integrates many methods into its design has not been evaluated. Thus, there is a need for rigorous evaluations of faculty LDPs to identify how specific learning methods contribute to program effectiveness.

본 연구는 프로그램 결과에 대한 [특정 학습 방법의 효과를 평가]함으로써 문헌의 격차를 해소한다. 한 가지 조사 질문이 연구의 방향을 제시했습니다.

  • Conger(1992)의 리더십 개발에 대한 4가지 접근법 및 관련 학습방법(Allen 및 Hartman 2008)은 참가자, 감독자 및 멘토에 의해 보고된 바와 같이 리더십 역량 향상에 어떻게 기여하는가? 다양한 학습 접근법에 맞는 특정 학습 방법이 리더십 역량 향상에 어떻게 기여하는지 연구했다.

This study addresses a gap in the literature by evaluating the effectiveness of specific learning methods for program outcomes. One research question guided our study:

  • How do Conger’s (1992) four approaches to leadership development and the associated learning methods (Allen and Hartman 2008) contribute to improving leadership competencies as reported by participants, supervisors and mentors? We studied how specific learning methods catering to different learning approaches contributed to improving leadership competencies.

 

방법들
Methods

사례 연구 설계는 [경계지어진 현상]으로서 LDP의 '집약적이고 전체적인 설명과 분석'(Merriam and Tisdell 2016, 페이지 232)을 제공한다. 사례 연구를 통해 다양한 연구 방법과 여러 데이터 소스를 통해 분석 단위로서 프로그램에 심도 있는 집중을 통해 구축 타당성을 보장할 수 있습니다(2014년 Yin). 사례연구의 구조적 요소는 앞서 언급한 LDP 평가의 엄격성에 대한 요구에 대처한다.
A case study research design provides an ‘intensive, holistic description and analysis’ (Merriam and Tisdell 2016, p. 232) of the LDP as a bounded phenomenon. Case study allows for in-depth focus on the program as a unit of analysis through mixed research methods and multiple data sources to ensure construct validity (Yin 2014). The structural elements of a case study address the aforementioned calls for rigor in LDP evaluation.

 

프로그램 설명
Program description

George Washington University Medicine and Health Sciences는 리더십 능력 모델을 사용하여 실시한 니즈 평가에 따라 중간 수준의 교직원을 위한 리더십 개발 프로그램인 Fundamentals of Leadership을 설계했습니다(Lucas et al. 2018). 이 프로그램에는 4가지 학습 목표가 있었습니다. 개인 효과, 대인 효과, 팀 성과 및 변경 관리 향상입니다. 참가자들은 학과장의 서포트에 따라 자기 지명을 하고, 실제 프로젝트에 임할 것을 약속했다. 지원자들은 모두 합격했다.
The George Washington University School of Medicine and Health Sciences designed a leadership development program, Fundamentals of Leadership, for mid-level faculty following a needs assessment conducted using a leadership competency model (Lucas et al. 2018). The program had four learning objectives: to enhance personal effectiveness, interpersonal effectiveness, team performance, and change management. Participants self-nominated with chair support and committed to work on a real-life project. All who applied were accepted.

[교실 내 세션]은 8개월 동안 매달 4시간씩 총 32시간 동안 진행되었습니다. 학습 방법은 프로그램 목표와 앨런과 하트먼(2008) 분류법에 기초했다(표 1의 첫 번째 두 열 참조). 비즈니스, 리더십 및 조직 변화에 대한 고급 교육을 받은 교직원은 변경 리더십, 시간 관리, 협상, 팀 구성, 감성 인텔리전스 및 조직 문화에 대한 세션을 촉진했습니다. 참가자들은 실제 [프로젝트 실행을 위한 계획]을 수립하고 세션 내용을 반영하기 위해 매달 업데이트했습니다. 프로젝트 진행 상황은 동료 보고 중에 코호트 구성원과 공유되었다. 각 참가자는 상호 합의에 의해 선택된 [상급 경영자executive 멘토]와 세션과 세션 사이에 만났습니다. [멘토링 툴킷]은 멘토와 멘티의 혜택과 책임, 생산적인 미팅을 위한 팁, 멘토링 계약을 위한 템플릿 등 제공되었습니다.

In-classroom sessions occurred 4 h per month for 8 months, for a total of 32 h. Learning methods were based on program objectives and Allen and Hartman’s (2008) taxonomy (see first two columns of Table 1). Faculty with advanced training in business, leadership, and organizational change facilitated sessions on change leadership, time management, negotiation, team building, emotional intelligence, and organizational culture. Participants developed an action plan for their real-life projects and updated them monthly to reflect session content. Project progress was shared with cohort members during peer debriefs. Each participant met between sessions with a senior executive mentor selected by mutual agreement. A mentoring toolkit was provided, including benefits and responsibilities of mentor and mentee, tips for productive meetings and a template for a mentoring agreement.

 
 

리서치 어프로치
Research approach

기관 심사 위원회는 그 연구를 면제한다고 간주했다. 익명의 조사 데이터는 각 세션과 프로그램의 가치에 대한 피드백을 제공했습니다. 프로그램 종료 시 프로젝트 프레젠테이션 및 멘토 설문조사를 통해 프로그램 결과에 대한 정보를 제공했습니다. 프로그램 완료 후 3개월 후 참가자 및 작업 감독관과의 개별 인터뷰를 통해 장기적인 영향에 대한 정보를 얻을 수 있었습니다.
The institutional review board deemed the study exempt. Anonymous survey data provided feedback on the value of each session and the program. Project presentations and mentor surveys at program conclusion provided inputs on program results. Separate interviews with participants and their work supervisors, 3 months after program completion, provided information on longer-term impacts.

데이터 수집 및 분석은 프로그램 설계 또는 제공에 관여하지 않은 작성자(NM, KF, RJ)에 의해 완료되었습니다. 복수의 근거 소스(예: 인터뷰, 세션 및 프로그램 평가, 조사)와 수렴하는 조사 라인(예: 참가자, 감독자, 멘토)이 결과를 삼각측량하여 'rigor, 폭, 복잡성, 풍부성 및 깊이'를 추가했다. 데이터 분석은 테마를 식별하기 위해 개방형 코딩과 지속적인 비교 방법(Merriam과 Tisdell 2016)을 사용했으며, 콩거 프레임워크와 앨런과 하트만 분류법(2008)의 이론적 코드를 사용한 두 번째 코딩 주기(2014년 Yin 2014)를 사용했다. 코딩과 주제에 대한 합의는 토론을 통해 이루어졌다.
Data collection and analysis were completed by authors not involved in the program design or delivery (NM, KF, RJ). Multiple sources of evidence (i.e. interviews, session and program evaluations, surveys) and converging lines of inquiry (i.e. participants, supervisors, mentors) triangulated the results, adding ‘rigor, breadth, complexity, richness and depth’ (Denzin and Lincoln 2013, p. 10). Data analysis utilized open coding and constant comparative methods to identify themes (Merriam and Tisdell 2016), followed by a second coding cycle (Yin 2014) with theoretical codes from the Conger (1992) framework and the Allen and Hartman (2008) taxonomy. Consensus on coding and themes was reached through discussions.

 

결과.
Results

조사 참가자는 프로그램을 완료한 최초 두 개 코호트 멤버 21명, 참가자의 작업 감독자 15명 중 11명, 시니어 이그제큐티브 멘토 12명(15명 중 12명)을 포함했다. 코호트 구성원은 피부과, 응급의학, 일반 및 전문 소아과, 내과, 실험실 과학, 신경외과, 신경외과, 병리학, 약리학, 의사 보조, 정신과, 종양학 및 외과 조교, 새로운 프로그램, 클리닉, 센터 및 외과와 관련된 프로젝트를 포함했다. 시스템 개선. 모든 프로젝트에는 복수의 부서가 관여하고 있으며, 커뮤니티 파트너도 있었습니다.

Study participants included all 21 members of the first 2 cohorts who completed the program, 11 (of 15) participants’ work supervisors, and 12 (of 15) of the senior executive mentors. Cohort members included assistant and associate professors in departments of dermatology, emergency medicine, general and specialty pediatrics, internal medicine, laboratory science, neurology, neurosurgery, pathology, pharmacology, physician assistant, psychiatry, oncology, and surgery, with projects concerning new programs, clinics, centers, and system improvements. All projects involved multiple departments; some had community partners.

표 1의 세 번째 열은 리더십 개발에 대한 네 가지 접근법 각각(Conger 1992)과 관련 학습 방법이 리더십 역량 향상에 어떻게 기여했는지 요약한다. 자세한 내용은 아래 설명과 함께 Kirkpatrick 및 Kirkpatrick의 (2016) 평가 수준을 사용하여 프로그램 전반에 대해 논의합니다. 만족, 학습, 행동 및 결과. 인용구 출처는 코호트('C') 1 또는 2의 프로그램 참가자('P'), 감독자('S') 또는 멘토('M')입니다.

The third column of Table 1 summarizes how each of the four approaches to leadership development (Conger 1992) and associated learning methods (Allen and Hartman 2008) contributed to improving leadership competencies. Further description is provided below, followed by a discussion of the program overall using Kirkpatrick and Kirkpatrick’s (2016) evaluation levels: satisfaction, learning, behavior and results. Quote sources are program participants (‘P’), supervisors (‘S’), or mentors (‘M’) from cohort (‘C’) 1 or 2.

 

개념적 이해
Conceptual understanding


리더십 개발에 대한 이러한 접근방식은 리더십 개념에 대한 [인지적 이해]를 구축한다(Conger 1992). 참가자들은 수업 전 독서, 과제 및 강의실 세션에서 다음과 같은 주제를 인용하여 새로운 개념을 제시했습니다.
This approach to leadership development builds cognitive understanding of leadership concepts (Conger 1992). The participants cited the following topics from the pre-class readings, assignments and classroom sessions that offered them new concepts:

[세션]을 통해 리더쉽 스킬에 대해 생각해 볼 수 있는 훌륭한 구성을 얻을 수 있었습니다. 회의 리드하기, 프로젝트 아이디어의 개발, 팀의 동기 부여 등입니다. (P9C1)
[The session] gave me nice constructs to think about my leadership skills … leading a meeting, developing project ideas, motivating my team. (P9C1)

정말로 공명하고 있는 것은, 시간 관리의 그리드입니다.(P3C2 )

What really resonated with me is the grid of (how to achieve) time management. (P3C2)

감성 인텔리전스 세션은 사람들이 어디에서 오는지를 듣고 이해하는 데 매우 적극적인 역할을 할 수 있게 해주었습니다. (P6C1)
The emotional intelligence session allowed me to take a very active role in listening and understanding where people are coming from. (P6C1)

문화에 대해 배우는 것은 매우 중요했습니다.그것을 바꾸는 것은 얼마나 어려운 일입니까.필요한 일을 해야 합니다.(P4C2)
It was really important to learn about culture … how difficult it is to change that …what you might need to do. (P4C2)


다른 이들은 참여 강화(P3C1, P5C1), 의사결정 개선(P6C1), 적절한 위임(P3C2, P7C1) 및 좋은 평가를 받는 피드백(P6C2, P7C1)을 위한 리더십 스타일과 팀 개발 원칙을 이해하는 것의 가치에 주목했다. 한계(표 1 열 4 참조)에는 읽기 자료의 과밀함denseness에 대한 불만과 더 많은 사례 사례에 대한 욕구가 포함되었다.

Others noted the value of understanding leadership styles and team development principles to enhance engagement (P3C1, P5C1), improve decision-making (P6C1), delegate appropriately (P3C2, P7C1), and provide well-received feedback (P6C2, P7C1). Limitations (see Table 1 column 4) included complaints about the denseness of the reading material and desire for more case examples.

스킬 육성
Skill building

리더십 개발에 대한 이러한 접근방식은 실천을 제공한다(Conger 1992). 참가자들은 [강의실 내 역할극과 프로젝트 실행 ]계획 제정이 새로운 스킬을 구축하는 데 도움이 된다고 확인했습니다. 한 사람이 지적했듯이, '클래스는 단순히 '개념이 여기에 있다'는 것이 아니었다. 읽어보세요」라고 끝나지 않았고, 「이 문제에 대처하는 방법의 예는 무엇입니까」…실제 롤플레잉(P3C1)을 했다.
This approach to leadership development provides practice (Conger 1992). The participants identified in-class role plays and enactment of project action plans as helping them build new skills. As one noted: ‘Class was not just “here’s the concept. Go read about it,” but … “what’s an example of how you would deal with this?’ … actual role-playing’ (P3C1).


[프로젝트 실행 계획]은 스킬을 쌓기 위해 가장 자주 인용되는 도구였습니다.
The project action plan was the tool most often cited for building skills:

드릴다운, 목적 설명 작성, 측정 기준 작성, 목표가 부서와 일치하는지 확인하는 것이 중요했습니다.(P3C2)
It was important to drill down … create a purpose statement … metrics … recognize if your goals were in line with your department. (P3C2)

[이 계획]은 매우 집중적이고 구체적이어서 도움이 됩니다.언제 대처해야 할 것을 특정합니다.우선순위의 변경에 따라 손실될 가능성이 있는 것을 추적합니다.(P4C2)

[The plan] helped by being very focused and concrete … identify what to tackle when … keep track of things that might get lost as priorities change. (P4C2)

이 계획을 통해 리더로서 큰 시야를 갖게 되었습니다.중요한 목표를 향해 한 발짝 물러서는 것.현재 진행 상황을 눈으로 확인할 수 있습니다.또, 뛰어난 과제도 볼 수 있습니다. … 그것은 매우 귀중한 것이었습니다.(P1C1)

The plan helped me as a leader have that big-picture view … take a step back at its overarching goals … visually see the progress you’re making … as well as outstanding challenges. … That was incredibly valuable. (P1C1)

그 계획은 구체적인 틀을 만들었다. … 매달 그것에 대해 질문을 받는 것은 당신을 긴장하게 한다. (P5C1)

[The plan] created a tangible framework. … Being asked about it on a monthly basis keeps you on your toes. (P5C1)

매월 계획을 갱신하는 것으로, 시간 관리가 향상되었습니다. 「실제로 필요한 것에 주의를 기울이는 한편, 불필요한 것은 무시하거나, 그 시간을 재할당하거나 합니다」(P5C2) 상사들은 향상된 능력을 알아차렸다: '그의 조직력은 향상되었다. … 그는 이해관계자들을 모아 프로젝트를 완료하기 위해 필요한 것을 지지하고 사람들에게 책임을 물을 수 있었습니다(S6C2). 다른 연구진은 부하 직원의 프로젝트 리더십(S1C2, S4C1, S6C1, S9C1, S9C2)에 대한 자신감, 주장성 및 편안함을 증가시켰다.

Updating the plans monthly improved time management: ‘[I’m] paying attention to the things I actually really need to do and ignoring what I don’t … or reallocating that time’ (P5C2). Supervisors noticed enhanced abilities: ‘His organizational skills improved. … He was able to bring stakeholders together … advocate for what was needed to finish the project … hold people accountable’ (S6C2). Others observed increased confidence, assertiveness, and comfort in their subordinates’ project leadership (S1C2, S4C1, S6C1, S9C1, S9C2).

 

피드백
Feedback

리더십 개발에 대한 이러한 접근방식은 [비판적 평가 및 측정 도구]를 사용하여 피드백을 제공합니다(Conger 1992). 참가자가 실시한 자기 평가에서는, 「의심했던 점 뿐만이 아니라, 장점과 단점에 대한 통찰력 향상에 도움이 되지 않았던 점이 강조되었습니다」(P4C2).
This approach to leadership development provides feedback using critical assessment and measurement tools (Conger 1992). Self-assessments completed by the participants ‘highlighted the things I suspected … as well as ones I did not to help improve [my] insight into [my] strengths and weaknesses’ (P4C2).

멘토 피드백 또한 가치 있었다: '나의 멘토가 나에게 좋은 조언을 해주었다. 계속 만날 수 있는지 물어볼게요.(P2C2) 멘토는 멘티가 역할극 시나리오나 어려운 대화(M1C2, M3C2, M5C2)에 대한 '연습 실행' 역할을 하는 등, 이러한 활동이 사운드보드와 격려의 원천이 되고 있음을 확인했습니다.
Mentor feedback was also valuable: ‘My mentor gave me good advice. I’m going to ask if we could continue meeting’ (P2C2). Mentors confirmed they served as sounding boards and sources of encouragement, with several serving as ‘practice runs’ for their mentee to role-play scenarios or difficult conversations (M1C2, M3C2, M5C2).

[동료 디브리핑] 중에 코호트 구성원으로부터도 귀중한 피드백을 받았다.
Valuable feedback also came from cohort members during peer debriefs:

우리는 모두 두려움, 문제, 뭐 그런 것들을 끄집어내다가 서로에게 이렇게 말하곤 했다. '나도 비슷한 일을 겪었어. 난 이렇게 해왔어. 도움이 되는지 확인해 주세요.(P7C1)
We were all bringing up our fears, problems, whatever … and then we would tell each other: ‘I had similar things. I’ve done it this way. See if that helps.’ (P7C1)

칭찬하든 비판하든, 동료의 피드백은 다른 태도, 경험, 배경을 가진 개인들로부터 나왔기 때문에 특히 도움이 되었습니다. (P1C2)
Whether they praise it or criticize it, [peer feedback] was particularly helpful because it came from [individuals with] different attitudes, different experiences, different backgrounds. (P1C2)

동료와 멘토들의 격려로 프로젝트 리더쉽 이상의 자신감을 얻었습니다.다른 사람의 견해와 피드백을 얻음으로써 자신감을 얻을 수 있었습니다.(P1C1).
Encouragement from peers and mentors provided confidence beyond project leadership: ‘Having other people’s perspective and feedback … gave me more confidence’ (P1C1).

 

개인의 성장
Personal growth

 

리더십 개발에 대한 이러한 접근방식은 행동, 가치 및 욕구의 반영을 유도한다(Conger 1992). 참가자들은 수업 시간을 프로젝트 계획을 갱신하고 위에서 논의한 피드백을 받는 것이 개인 및 그룹의 성찰을 촉진하는 것이라고 생각했습니다.'수업에 도움이 된 것은 성찰 시간……프로젝트나 목적지에 대해서만 생각하는 30분 이었다'(P5C2). 그룹 성찰에 참여하는 것은 또 다른 가치를 제공했습니다. '다른 사람이 자신의 문제를 해결할 수 있도록 도와주면서 자신의 프로젝트에 가져올 수 있는 리더십의 자질을 명확히 했습니다.' (P3C2) P6C1은 이 시간의 중요성을 '한 달 동안 당신이 어떻게 진화했는지 볼 수 있도록 하고, 내가 어떻게 발전하고 있는지 생각해 보고, 내가 앞으로 개선할 수 있는 것은 무엇인가'로 요약했습니다.
This approach to leadership development induces reflection of behaviors, values and desires (Conger 1992). Participants identified class time updating project plans and getting the feedback discussed above as promoting personal and group reflection: ‘The thing that helped me were the class reflects … 30 minutes just to think about my project and where I wanted it to go’ (P5C2). Participating in group reflection provided another value: ‘In helping others work through their problems, it clarified … leadership qualities that I could bring to my own project’ (P3C2). P6C1 summarized the significance of the time as ‘allowing you to look at how you evolved over the month … think about how I am improving … what I can improve moving forward.’

전체적인 평가
Overall evaluation


만족도(1단계), 학습(2단계), 행동(3단계), 결과(4단계)를 평가했다(Kirkpatrick 2016).

  • 참가자들은 내용, 자료, 진행자 및 학습 환경에 대한 만족도가 높다고 보고했다(1 = 강하게 동의하지 않음 ~ 4 = 강하게 동의함). 
  • 학습 내용은 표 1에 기재되어 있습니다. 초월 세션 콘텐츠 학습: 「[프로그램]은, 사물을 보다 선명하게 볼 수 있도록 했습니다…… 내가 무엇을 완수하는지, 어떻게 정리하는지…… 스스로 페이스 업 하는 것에 대해, 훨씬 더 신중해졌습니다」(P9C1) 
  • 리더쉽 행동에 대한 자기 인식적인 변화가 설명되었습니다. '내 직감을 따르기 전에' … 이제 "좋습니다. 여기서 어떤 접근 방식이 작동할까요?"(P3C1)가 되었습니다. P7C1은 병원 경영진과 전략적인 월례 회의를 시작했고 P6C1은 운영을 개선하기 위해 간호 리더십에 접근했습니다. 
  • 결과는 주목할 만하다. 거의 모든 참가자가 프로젝트의 주요 컴포넌트를 구현했습니다. 새로운 임상 센터, 학위 프로그램, 연구 시험, 지역사회 관계 확대. 슈퍼바이저는, 많은 참가자가, 부서내 또는 전문 조직내의 리더로서의 역할과 책임을 한층 더 가지고 있는 것에 주목했습니다.

Satisfaction (level 1), learning (level 2), behavior (level 3), and results (level 4) were evaluated (Kirkpatrick and Kirkpatrick 2016).

Participants reported high satisfaction with the content, materials, facilitators, and learning environment (3.14–3.87 on an agreement scale of 1 = Strongly Disagree to 4 = Strongly Agree. 

Learning is noted in Table 1. Learning transcended session content: ‘[The program] made me see things a lot crisper … be much more intentional about what I take on, how I organize … pace myself’ (P9C1).

Self-perceived changes to leadership behaviors were described: ‘Before I would go with my gut. … Now it’s “all right, what approach is going to work here?”’ (P3C1). P7C1 started strategic monthly meetings with a hospital executive, and P6C1 approached nursing leadership to improve operations. 

Results are notable. Nearly all participants implemented major components of their projects: new clinical centers, degree programs, research trials, expanded community relationships. Supervisors noted many participants had additional leadership roles and responsibilities—either within their departments or with professional organizations.

논의
Discussion

이 연구는 중간 수준의 AHC 교직원을 위한 리더십 개발 프로그램에 평가 엄격성을 적용하고 네 가지 리더십 개발 접근법과 관련된 학습 방법의 이점을 미묘한 이해도를 얻었다(Conger 1992).

  • 개념적 이해 접근방식은 참가자가 새로운 리더십 개념을 인식하는 데 도움이 되었습니다.
  • 스킬 육성 접근방식은 참가자가 새로운 스킬을 연습하는 데 도움이 되었습니다.
  • 피드백 접근방식은 강점과 개발 영역에 대한 인식을 높였습니다.
  • 또한 개인 성장 접근방식은 성찰과 전체적으로 성장하기 위한 자극을 촉진했습니다.

중요한 것은 이러한 접근방식의 조합으로 새로운 프로그램, 클리닉, 센터 및 시스템 개선의 형태로 조직 수준(Kirkpatrick 및 Kirkpatrick 2016)에서 이점을 볼 수 있게 되었다는 점입니다.

This study applied evaluation rigor to a leadership development program for mid-level AHC faculty members and obtained a nuanced understanding of the benefits of learning methods associated with four leadership development approaches (Conger 1992).

  • The conceptual understanding approach helped participants become aware of new leadership concepts;
  • the skill-building approach helped them practice new skills;
  • the feedback approach generated greater awareness about strengths and areas for development; and
  • the personal growth approach fostered reflection and the impetus to grow holistically as leaders.

Importantly, the combination of these approaches made it possible to see benefits at the organizational level (Kirkpatrick and Kirkpatrick 2016) in the form of new programs, clinics, centers and system improvements.


다양한 방법들이 체험 학습 주기를 육성하였다(Kolb 2015). 

  • 독서 및 강의실 모듈은 학습자를 추상 개념화 과정을 거치게 했다. 
  • 역할극 및 사례연구는 구체적인 경험을 제공한다. 
  • 동료 및 멘토로부터 받은 자기 평가와 피드백이 성찰 관찰에 기여한다. 
  • 프로젝트 실행 계획은 활발한 실험을 위한 추진력을 제공했습니다. 

The various methods fostered the experiential learning cycle (Kolb 2015):

  • readings and classroom modules took learners through abstract conceptualization;
  • role plays and case studies offered concrete experience; 
  • self-assessments and feedback from peers and mentors contributed to reflective observation; and
  • project action plans provided the impetus for active experimentation

이러한 학습 방법의 통합은 학습자가 '행위자마다, 그리고 특정 참여에서 일반 분석 분리까지 다양한 정도'를 취하여(Kolb 2015, 페이지 42), 인지적, 경험적, 사회적 과정을 통해 학습 기회를 제공했다.

The integration of these learning methods took the learners ‘in varying degrees from actor to observer, and from specific involvement to general analytic detachment’ (Kolb 2015, p. 42), providing learning opportunities through cognitive, experiential, and social processes.

이 리더십 개발 프로그램의 진정한 가치는 실제 프로젝트에 초점을 맞추기 위해 다양한 학습 방법이 연결되고 서로 연계된 방식입니다.

  • 구조화된 강의실 토론은 참가자들이 자신의 프로젝트에 개념을 적용하도록 장려합니다. 
  • 프로젝트 액션 플랜은 작업을 계속하고 과제를 극복할 수 있는 도구를 제공했습니다. 
  • 멘토 피드백은 참가자의 프로젝트 성공을 지원하는 데 초점을 두었다.
  • 동료 디브리핑는 장애물을 극복하고 새로운 솔루션을 찾기 위한 지원 그룹을 개발했습니다.
  • 개인 및 그룹의 성찰은 개념을 명확히 하고 이를 프로젝트에 적용하는 방법에 도움이 되었습니다. 

The true value of this leadership development program is in the way different learning methods were connected and interwoven to focus on a real-life project:

  • structured classroom discussions encouraged participants to apply concepts to their projects;
  • project action plans provided a tool to stay on task and overcome challenges;
  • mentor feedback focused on helping participants succeed in their projects;
  • peer debriefs developed a support group to overcome obstacles and find new solutions;
  • individual and group reflections helped clarify concepts and how to apply them to the project.

프로젝트의 중심성은 개인적이고 경험적인 방식으로 리더십 개념의 의미를 만드는 것을 촉진했습니다. 다양한 리더십 육성 어프로치와 학습 방법의 통합에 의해 달성된 시너지는 리더십 역량 개발에 기여했을 뿐만 아니라 참가자, 감독자, 멘토 입장에서 리더로서의 자신감을 형성했다(그림 1).

The centrality of the project facilitated meaning-making of leadership concepts in a personal, experiential way. The synergy achieved through the integration of different leadership development approaches and learning methods not only contributed to leadership competency development but also built participants’ confidence as leaders from the participants’, supervisors’ and mentors’ perspectives (Figure 1).

 

제한 사항
Limitations

다른 케이스 스터디와 마찬가지로 이러한 결과는 특정 설정에서 제공되는1개의 LDP를 반영합니다. 또한, 이 결과는 우리 프로그램에서 사용된 특정 학습 방법을 반영합니다. 다른 방법은 다른 결과를 제공할 수 있습니다. 마지막으로 프로그램의 장기적인 영향에 대해 알아보는 것이 도움이 될 것입니다.
As with any case study, these results reflect one LDP offered in a specific setting. In addition, the results reflect the specific learning methods used in our program; other methods might provide different results. Finally, it would be helpful to study the program’s long-term impact.

결론
Conclusion

우리의 연구는 자민당에 대한 엄격한 평가의 예를 제공함으로써 문헌을 추가한다. 특정 학습 방법이 리더십 개발에 어떻게 기여했는지를 파악하여 Conger의 리더십 개발 프레임워크, Allen과 Hartman의 학습 방법 분류법 및 경험적 학습 문헌을 더욱 연결한다. 또한 실제 프로젝트를 중심으로 학습 앵커링의 시너지 효과를 설명하고 개인과 조직에 긍정적이고 의미 있는 결과를 보여줍니다.

Our study adds to the literature by providing an example of rigorous evaluation of an LDP. It identifies how specific learning methods contributed to leadership development, further connecting Conger’s (1992) leadership development framework, Allen and Hartman’s (2008) taxonomy of learning methods, and the experiential learning literature. Moreover, we illustrate the synergistic effect of anchoring learning around a real-life project, and show positive and meaningful outcomes for individuals as well as the organization.

 


Med Teach. 2021 Aug;43(8):889-893.

 doi: 10.1080/0142159X.2021.1931079. Epub 2021 Jun 2.

Faculty leadership development: A case study of a synergistic approach

Affiliations collapse

 

Affiliation

1School of Medicine and Health Sciences, The George Washington University, Washington, DC, USA.

PMID: 34078213

DOI: 10.1080/0142159X.2021.1931079

Abstract

Introduction: Ongoing leadership development is essential for academic health center faculty members to respond to increasing environmental complexity. At the George Washington University School of Medicine and Health Sciences, an 8-month program, based on Conger's leadership development approach emphasizing conceptual understanding, skill building, feedback and personal growth was offered to mid-level faculty charged with developing educational programs, clinical services, and/or research initiatives. We studied how specific learning methods catering to different learning approaches contributed to improving leadership competencies.

Methods: Session and program evaluations, participant interviews, mentor surveys, and supervisor interviews were used for data collection. Themes were identified through open coding with use of constant comparative methods to help find patterns in the data.

Results: Readings and classroom modules provided a broadened, holistic understanding of leadership; role plays and action plans helped participants apply and practice leadership skills; self-assessments and feedback from peers and mentors provided specifics for focusing development efforts; and personal growth exercises provided opportunities to reflect and consider fresh perspectives. Anchoring learning methods around a real-time project led to improved leadership competencies and personal confidence as reported by participants, supervisors and mentors.

Conclusion: A faculty leadership development program that integrates understanding, skill building, feedback and personal growth and connects multiple learning methods can provide the synergy to facilitate behavior change and organizational growth.

Keywords: Leadership development; faculty development; learning process.

 

 

학습 대 수행: 통합적 문헌고찰 (Perspectives on Psychological Science, 2015)
Learning Versus Performance: An Integrative Review
Nicholas C. Soderstrom and Robert A. Bjork

 

 

강의실에서든 현장에서든 교육의 주요 목표는 학습자에게 내구성과 유연성을 모두 갖춘 지식 또는 기술을 갖추게 하는 것입니다. 우리는 지식과 기술이 사용하지 않는 기간 동안에도 계속 사용할 수 있고, 단순히 교육 중에 경험하는 것과 일치하는 컨텍스트에서뿐만 아니라 관련성이 있는 다양한 컨텍스트에서 접근할 수 있다는 점에서 유연하기를 원합니다. 즉, 교육은 [학습]을 촉진하기 위해 노력해야 하며, 이는 [장기적인 유지와 전이를 지원하는 행동이나 지식의 비교적 영구적인 변화]를 의미한다. 그러나 역설적으로 이러한 학습은 획득 과정 중 또는 직후에 관찰되고 측정될 수 있는 행동 또는 지식의 일시적인 변동을 의미하는 [수행]와 구별되어야 한다.

Whether in the classroom or on the field, the major goal of instruction is, or at least should be, to equip learners with knowledge or skills that are both durable and flexible. We want knowledge and skills to be durable in the sense of remaining accessible across periods of disuse and to be flexible in the sense of being accessible in the various contexts in which they are relevant, not simply in contexts that match those experienced during instruction. In other words, instruction should endeavor to facilitate learning, which refers to the relatively permanent changes in behavior or knowledge that support long-term retention and transfer. Paradoxically, however, such learning needs to be distinguished from performance, which refers to the temporary fluctuations in behavior or knowledge that can be observed and measured during or immediately after the acquisition process.

학습과 수행의 구별은 중요한데, 이는 현재 상당한 학습이 수행이 향상되지 않은 상태에서 발생할 수 있고, 반대로 수행의 상당한 변화가 종종 해당 학습의 변화로 변환되지 않는다는 것을 보여주는 압도적 경험적 증거가 존재하기 때문이다. 아마도 훨씬 더 설득력 있는, 특정 실험 조작은 학습과 성과에 반대 효과를 주는 것으로 보여져, 획득 중에 가장 많은 오류를 생성하는 조건이 종종 가장 많은 학습을 생성하는 바로 그 조건이다. 그러한 결과는 사람들이 자신의 학습에 대해 판단을 내리도록 요구받거나 연구원, 교육자, 학생들과의 비공식 대화 중에 정기적으로 불신에 직면한다. 그러나 실제와 이론적 관점 모두에서 흥미롭고 중요한 것은 학습과 수행의 구별에 대한 [반직관적인 특성]입니다.
The distinction between learning and performance is crucial because there now exists overwhelming empirical evidence showing that considerable learning can occur in the absence of any performance gains and, conversely, that substantial changes in performance often fail to translate into corresponding changes in learning. Perhaps even more compelling, certain experimental manipulations have been shown to confer opposite effects on learning and performance, such that the conditions that produce the most errors during acquisition are often the very conditions that produce the most learning. Such results are regularly met with incredulity, whether in the context of metacognitive research in which people are asked to make judgments about their own learning or during informal conversations with researchers, educators, and students. It is, however, the counterintuitive nature of the learning–performance distinction that makes it so interesting and important from both practical and theoretical perspectives.

우리는 [장기 보존 또는 이전으로 측정되는 학습]과 [획득 중 측정되는 성과] 사이의 중요한 차이와 관련된 증거에 대한 첫 번째 통합 검토를 제공한다. 우리는 메타인지 관련 작업과 함께 운동 및 언어 학습 영역의 연구를 통합하려고 시도한다. 그러나 다른 많은 기사에서 학습과 성능의 차이를 소개하고 그 차이를 설명하는 주요 결과를 요약하고 있습니다. 또한, 우리(Soderstrom & Bjork, 2013)는 매년 갱신될 예정인 주석 첨부 참고 문헌 목록을 발행하여 연구자, 교육자 및 기타 연구자들이 주제와 관련된 최신 연구에 보조를 맞출 수 있도록 하고 있습니다.

We provide the first integrative review of the evidence that bears on the critical distinction between learning, as measured by long-term retention or transfer, and performance, as measured during acquisition. We attempt to synthesize research from both the motor- and verbal-learning domains, as well as relevant work in metacognition. We note, however, that a number of other articles provide an introduction to the learning versus performance distinction and summarize key findings that illustrate the distinction (e.g., R. A. Bjork, 1999; Christina & Bjork, 1991; Jacoby, Bjork, & Kelley, 1994; Kantak & Winstein, 2012; Lee, 2012; Lee & Genovese, 1988; Schmidt & Bjork, 1992; Schmidt & Lee, 2011; Wulf & Shea, 2002). As well, we (Soderstrom & Bjork, 2013) have published an annotated bibliography that is slated to be updated annually so as to keep researchers, educators, and others abreast of the newest research relevant to the topic.

 

기초 연구
Foundational Studies

수십 년 전에 수행된 연구는 [수행에 변화가 없으면서도 상당한 학습이 발생할 수 있다는 것]을 보여줌으로써 학습과 성과 사이의 구별을 필요로 했다. 예를 들어, 쥐의 미로 학습은 그들의 행동이 목적이 없는 것처럼 보이는 자유 탐험 기간을 허용함으로써 향상될 수 있다(즉, 성과가 불규칙하다). 수행이 점근선("오버러닝")에 도달한 후 제공되는 추가 연습 시험 결과 망각 속도가 느려지고 재학습 속도가 빨라졌다. 그리고 피로가 앞으로 해야 할 운동 작업의 수행을 방해할 때, 학습은 여전히 진행될 수 있습니다. 이 섹션에서는 이러한 기초 연구를 검토합니다.
Studies conducted decades ago necessitated the distinction between learning and performance by showing that considerable learning could occur in the absence of changes in performance. For example, rats’ learning of a maze could be enhanced by permitting a period of free exploration in which their behavior seemed aimless (i.e., performance was irregular); additional practice trials provided after performance was at asymptote (“overlearning”) resulted in slowed forgetting and more rapid relearning; and when fatigue stalled performance of to-be-learned motor tasks, learning could still transpire. This section reviews these foundational studies.

잠복 학습
Latent learning

[잠복 학습]은 [명백한 강화나 눈에 띄는 행동 변화 없이 발생하는 학습]으로 정의된다. 학습은 '잠재적' 또는 '숨김'이라고 하는데, 그 이유는 그것을 드러내기 위해 어떤 종류의 강화가 도입되지 않는 한 전시되지 않기 때문이다. 예를 들어, 최근 새로운 도시로 이사한 사람이 운전에 대해 우려하여 매일 시내버스를 타고 출근한다고 가정해 보자. 매일 버스를 타고 다니면서, 그 경로는 관찰을 통해 학습될 것이지만, 그러한 학습은 그러한 동기가 필요한 경우에만(예를 들어, 그 사람이 스스로 운전해서 일할 필요가 있을 때) 명확해질 것이다. 잠복 학습의 초기 발견은 흥미롭고 논란이 많았는데, 이는 학습이 강화가 있을 때만 일어날 수 있다는 널리 알려진 가정에 도전했기 때문이다. 초기 잠복학습 연구의 고전적인 리뷰를 위해, 우리는 "인지적 지도cognitive map"의 개념이 도입된 톨만(1948년)을 추천한다. 이 용어는 [자신의 공간 환경의 정신적 표현]을 가리킨다.

Latent learning is defined as learning that occurs in the absence of any obvious reinforcement or noticeable behavioral changes. Learning is said to be “latent,” or hidden, because it is not exhibited unless a reinforcement of some kind is introduced to reveal it. Consider, for example, a person who recently moved to a new city and, apprehensive about driving, decides to ride the city bus each day to work. Riding the bus day after day, the route would be learned through observation, but such learning would only be evident if an incentive was present that required it—say, when it was necessary for the person to drive to work on his or her own. The early findings of latent learning were intriguing and controversial because they challenged the widely held assumption that learning could occur only in the presence of reinforcement. For a classic review of the early latent learning studies, we recommend Tolman (1948), in which the concept of “cognitive maps” was introduced, a term that refers to the mental representation of one’s spatial environment.

Blodgett(1929년), Tolman(1930년)과 Honzik(1930년)에 의해 처음 입증되었지만, 그 결과는 학습과 기억력에 관한 대부분의 교과서에 보고되어 있는 잠복 학습에 대한 고전적인 실험으로 여겨지고 있다. 본질적으로 Blodgett의 복제인 그들의 실험에서, 세 그룹의 쥐들은 총 17일 동안 매일 복잡한 T-maze에 놓였습니다. 한 그룹의 쥐는 골 박스에 도달하기 위해 강화되지 않았습니다.골 박스에 도달할 때마다 다른 그룹은 음식으로 강화되었습니다. 세 번째 그룹은 11일째까지 골대에 도달한 것에 대해 보상을 받지 못했으며, 그 후 정기적으로 보상을 받았다. 이 실험의 결과는 그림 1과 같다. 당연하게도 17일 동안 골박스 찾기에서 오류가 가장 적은 그룹은 정규 강화 그룹이었고, 강화되지 않은 그룹은 오류가 가장 많았다. 잠재 학습의 개념과 일관되게, 지연 강화 그룹은 즉각적인 개선이 발생한 11일째(식품이 도입된 날)까지 단 한 번도 강화하지 않은 그룹과 동일한 오류 수를 보였으며, 오류율은 정규 강화 그룹과 비슷한 수준으로 떨어졌다. 따라서, 보강을 늦추는 것은 쥐들이 실제로 보강이 이루어지지 않은 상태에서 미로를 배운다는 것을 드러냈고 그들의 행동은 오히려 목적 없는 것처럼 보였다. 수행은 정체된 상태로 학습이 이뤄졌다는 얘기다.
Although first demonstrated by Blodgett (1929), Tolman and Honzik (1930) are credited for providing what is now considered the classic experiment on latent learning, the results of which are reported in most textbooks on learning and memory. In their experiment, which is essentially a replication of Blodgett’s, three groups of rats were placed in a complex T-maze every day for a total of 17 days. One group of rats was never reinforced for reaching the goal box—they were simply taken out of the maze when they found it—whereas another group was reinforced with food every time the goal box was reached. A third group was not rewarded for reaching the goal box until Day 11, after which time they were regularly rewarded. The results of this experiment are presented in Figure 1. Unsurprisingly, the group that made the fewest errors in finding the goal box over the 17-day period was the regularly reinforced group, and the group that was never reinforced made the most errors. Consistent with the notion of latent learning, the delayed-reinforcement group showed the same number of errors as the never-reinforced group until Day 11—the day the food was introduced—when an immediate improvement occurred, dropping their error rate to a level comparable to that of the regularly reinforced group. Thus, delaying reinforcement revealed that the rats did, indeed, learn the maze while no reinforcement was provided and their behavior seemed rather aimless. In other words, learning occurred when performance was stagnant.

 

Blodgett(1929)와 Tolman and Honzik(1930)의 연구는 쥐의 잠복학습에 대한 수많은 후속 실험을 촉진하여 이 현상에 대한 우리의 이해를 더욱 향상시켰다. 예를 들어, Seward(1949)는 잠복학습이 30분간의 자유탐험 후에 일어날 수 있으며, 나아가 강화 없이 미로에서 보내는 시간(따라서 성능의 변화가 식별되지 않는 시간)이 미로 학습과 긍정적인 관련이 있음을 보여주었다(Bendig, 1952; 레이놀즈, 1945 참조).
The studies by Blodgett (1929) and Tolman and Honzik (1930) spurred numerous follow-up experiments on latent learning in rats, further refining our understanding of this phenomenon (see Buxton, 1940; Spence & Lippitt, 1946). Seward (1949), for example, showed that latent learning could occur after just 30 min of free exploration and, furthermore, that the amount of time spent in the maze with no reinforcement—and thus during a time when no changes in performance were discernible—was positively related to learning the maze (see also Bendig, 1952; Reynolds, 1945).

잠복학습이 쥐에게만 국한된 것이 아니라는 것도 수십 년 전에 분명해졌다. 그들의 영향력 있는 연구에서, Postman and Tuma(1954)와 Stevenson(1954)은 잠복 학습이 인간에서도 경험적으로 입증될 수 있다는 것을 보여주었다. Stevenson의 실험에서, 3살 정도의 어린 아이들은 상자를 열 수 있는 열쇠를 찾기 위해 일련의 물체를 탐험했습니다. 중요한 것은 탐색된 환경에는 키 이외의 오브젝트 또는 태스크와 무관한 오브젝트도 포함되어 있다는 것입니다. 문제는 핵심 관련 물체를 탐색하는 동안 아이들이 이러한 주변 물체의 위치를 학습할 것인지 여부였다. 즉, 아이들이 잠재 학습을 보일 것인지 여부였다. 실제로 아이들에게 중요하지 않은 물건을 찾으라고 했을 때, 아이들은 그 물건들이 탐색된 환경에 있을 때 상대적으로 더 빨리 찾을 수 있었습니다. 스티븐슨은 또한 아이들에게서 관찰된 잠복 학습의 양이 나이가 들수록 증가한다는 것을 발견했다. 
It was also made clear decades ago that latent learning is not limited to rats. In their influential studies, Postman and Tuma (1954) and Stevenson (1954) showed that latent learning is also empirically demonstrable in humans. In Stevenson’s experiment, children—some as young as 3 years old—explored a series of objects to find a key that would open a box. Critically, the explored environment also contained nonkey objects, or those that were irrelevant to the task. The question was whether the children would learn the locations of these peripheral objects during the exploration of the key-relevant objects—that is, whether the children would show latent learning. Indeed, when the children were asked to find the irrelevant, nonkey objects, they were relatively faster in doing so when those objects had been contained in the explored environment. Stevenson also found that the amount of latent learning observed in the children increased with age.

과잉학습과 피로
Overlearning and fatigue

이미 연주할 수 있음에도 불구하고 계속 연습하는 바이올리니스트, 즉 획득한 퍼포먼스가 이미 점근점에 도달한 바이올리니스트를 생각해 보십시오. 작업에 대한 숙달 기준이 달성된 후에도 작업에 대한 이러한 지속적인 연습은 "[오버러닝]"이라고 하며, 포스트마스터리 시행 횟수를 숙달에 필요한 시행 횟수로 나눈 것으로 나타낼 수 있습니다. 예를 들어 바이올리니스트가 한 곡을 마스터하기 위해 10번의 연습시험이 필요한 후에 추가로 5번 연습했다면, 오버러닝의 정도는 50%가 될 것이다. 난센스 음절을 사용한 에빙하우스(1885/1964)의 유명한 연구로 시작된 과잉학습의 많은 초기 연구는 정보와 기술의 장기적 학습을 향상시키는 방법으로서 과잉학습의 힘을 증명했다. Fitts(1965)는 이러한 발견을 언급하며, "일부... 기준에 도달한 시점을 넘어서까지의 지속적인 연습의 중요성은 아무리 강조해도 지나치지 않다"고 말했다(p.195).

Consider a violinist who continues to practice a musical piece despite already being able to perform it—that is, after acquisition performance is already at asymptote. Such continued practice on a task after some criterion of mastery on that task has been achieved is referred to as “overlearning” and can be expressed by the number of postmastery trials divided by the number of trials needed to reach mastery. For example, if the violinist practiced a piece 5 additional times after needing 10 practice trials to master it, then the degree of overlearning would be 50%. Many early studies of overlearning—starting with Ebbinghaus’s (1885/1964) famous study using nonsense syllables—demonstrated the power of overlearning as a method for enhancing the long-term learning of information and skills. Referencing these findings, Fitts (1965) stated, “The importance of continuing practice beyond the point in time where some . . . criterion is reached cannot be overemphasized” (p. 195).

크루거(1929)는 오버러닝에 대해 가장 많이 인용된 연구를 수행했다. 그의 중요한 실험에서, 두 그룹의 참가자들은 모든 단어를 기억할 수 있을 때까지 반복적으로 단어 목록을 연구했다. 이 시점에서, 대조군은 연구 단계를 끝낸 반면, 오버러닝 그룹의 참가자들은 자료를 계속 연구했습니다. 사실, 그들은 자료를 100% 더 많이 학습했습니다. 즉, 대조군보다 두 배 더 많은 연구 실험에 노출되었습니다. 최대 28일 후에 수행된 보존 테스트에서, 오버러닝 그룹의 참가자들은 연구 단계에서 자료를 습득했지만 오버러닝하지 않은 대조 그룹의 참가자보다 더 많은 항목을 리콜했습니다. 또한 과잉학습의 정도에 따라 보유율이 증가하였다. 후속 연구에 따르면, 오버러닝(과잉학습)은 산문 구절과 같은 보다 복잡한 구두 자료를 유지하는 데 도움이 되며, 재학습relearning 속도, 즉 다소 지연된 후 해당 자료를 다시 학습하는 데 필요한 시간을 단축하는 것으로 나타났습니다.
Krueger (1929) carried out the most frequently cited study on overlearning. In his seminal experiment, two groups of participants repeatedly studied lists of words until all of the words could be recalled. At that point, the control group was finished with the study phase, whereas participants in the overlearning group continued studying the material—in fact, they overlearned the material by 100%, meaning that they were exposed to twice as many study trials as the control group. On a retention test administered up to 28 days later, the participants in the overlearning group recalled more items than participants in the control group, who had mastered the material during the study phase but had not overlearned it. Additionally, retention increased as a function of the degree of overlearning. Subsequent research showed that overlearning aids in the retention of more complex verbal materials, such as prose passages, and accelerates the rate of relearning—that is, the amount of time required to learn the material again after some delay (e.g., Gilbert, 1957; Postman, 1962; see also Ebbinghaus, 1885/1964).

오버러닝(과잉학습)은 또한 운동 기술을 배우는 데 도움이 된다. 크루거(1929)가 단어에 대한 과도한 학습을 보여준 다음 해, 그는(크루거, 1930) 미로 추적 작업에 대해 비슷한 이점을 보였다. 참가자들은 처음에 100% 정확도에 도달할 때까지 과제를 수행했고, 그 후 50%, 100% 또는 200% 더 많이 학습했습니다. 언어 자료와 마찬가지로, 과잉 학습의 양은 장기 보존과 긍정적으로 관련되었습니다. 이후 작업은 M60 기관총의 조립 및 분해(Schendel & Hagman, 1982)를 포함하여 단순하고 복잡한 운동 기술에 대한 오버러닝의 이점을 재현했다(예: Chasey & Knowles, 1973; Melnick, 1971; Melnick, Lersten, Lockhart, 1972). 오버러닝은 다양한 업무에 효과적인 학습 도구인 것 같습니다.

Overlearning also benefits the learning of motor skills. The year after Krueger (1929) demonstrated overlearning for words, he (Krueger, 1930) showed similar benefits for a maze-tracing task. Participants first performed the task until they reached 100% accuracy, after which they overlearned it by 50%, 100%, or 200%. As with the verbal materials, the amount of overlearning was positively related to long-term retention. Later work replicated the benefits of overlearning for simple and more complex motor skills (e.g., Chasey & Knowles, 1973; Melnick, 1971; Melnick, Lersten, & Lockhart, 1972), including the assembly and disassembly of an M60 machine gun (Schendel & Hagman, 1982). Overlearning seems to be an effective learning tool for a wide range of tasks (for a meta-analytic review, see Driskell, Willis, & Cooper, 1992).


과잉학습에 대한 연구와 유사하게, 피로에 대한 초기 연구는 피로가 획득 중에 성능의 추가적인 향상을 방해한 후에도 학습이 발생할 수 있음을 시사했다. 예를 들어 애덤스와 레이놀즈(1954년)는 공군 기초 훈련병들에게 회전바퀴에 달린 목표물을 지팡이로 수동으로 추적해야 하는 회전 추격 임무를 배우게 했다. 시험 사이의 휴식 간격을 바꾸면 피로가 성능 향상을 제한하거나 제거했을 때, 피로가 사라진 후 과제에 대한 후속 테스트에서 드러났듯이 그럼에도 불구하고 학습이 발생하는 것으로 나타났다. 15년 후, Stelmach(1969)는 다양한 훈련 일정이 사다리 오르기 과제의 학습과 수행에 어떻게 영향을 미치는지 조사했다. 한 그룹의 참가자들은 그들이 쉬었던 것보다 더 많이 연습했고, 다른 그룹은 그들이 연습한 것보다 더 많이 쉬었습니다. 훈련 중 성과는 주어진 시험에서 상승한 단의 수로 정의되며, 더 많은 보간 휴식이 허용된 그룹에 유리했다. 다른 그룹은 시험 사이에 휴식을 거의 받지 못했기 때문에 훈련 중에 점점 더 피곤해진다는 것을 고려하면 이 결과는 놀라운 일이 아니다. 그러나 지연된 후, 유지 테스트에서 휴식을 거의 받지 못한 그룹이 잘 쉬었던 그룹을 따라잡은 것으로 밝혀졌는데, 표면적으로는 피로가 단기 성과에서 이득을 억제했을 때, 상당한 학습이 일어났다는 것을 증명했다.

Similar to research on overlearning, early work on fatigue suggested that learning could occur even after fatigue prevented any further gains in performance during acquisition. Adams and Reynolds (1954), for example, had basic trainees from the Air Force learn a rotary pursuit task, which requires one to manually track a target on a revolving wheel with a wand. Varying the length of rest intervals between trials showed that when fatigue limited or eliminated gains in performance, learning nonetheless occurred, as revealed by a subsequent test on the task after the fatigue had dissipated. Fifteen years later, Stelmach (1969) examined how different training schedules affect learning and performance on a ladder-climbing task. One group of participants practiced more than they rested; another group rested more than they practiced. Performance during training, which was defined as the number of rungs climbed on a given trial, favored the group that was permitted more interpolated rest. This finding is not surprising given that the other group, as a result of receiving little rest between trials, became increasingly fatigued during the training. After a delay, however, a retention test revealed that the group that received little rest caught up to the well-rested group, ostensibly demonstrating that substantial learning had occurred when fatigue had stifled any gains in short-term performance.

대응하는 개념상의 차이
Corresponding conceptual distinctions

잠재 학습, 과잉 학습, 피로 및 기타 고려사항에 대한 초기 실험은 훈련 또는 획득 중 관찰할 수 있는 행동(즉, 성과)을 구별하기 위해 초기 학습 이론가(예: Estes, 1955a; Guthrie, 1952; Hull, 1943; Skinner, 1938; Tolman, 1932)를 주도했고 상대적으로 영구적인 변화를 가져왔다. 향후 그러한 행동을 나타낼 수 있는 능력(즉, 학습)에서 발생한다.

  • 헐은 반응의 습관 강도와 반응의 순간적인 반응 잠재력이라는 용어를 사용했고,
  • 에스테스는 그의 변동 모델에서 습관 강도와 반응 강도를 언급했고,
  • 스키너는 반사 예비력과 반사 강도를 구별했다.

경험적으로, 습관 강도 또는 반사 예비력(즉, 학습)은 소멸 또는 망각에 대한 저항성 또는 재학습 속도에 의해 지수화되는 것으로 가정한 반면, 순간 반응 잠재력, 반응 강도 또는 반사 강도(즉, 성과)는 반응의 현재 확률, 속도 또는 대기 시간에 의해 지수화되는 것으로 가정했다.
The early experiments on latent learning, overlearning, and fatigue, plus other considerations, led early learning theorists (e.g., Estes, 1955a; Guthrie, 1952; Hull, 1943; Skinner, 1938; Tolman, 1932) to distinguish between behaviors that can be observed during training, or acquisition (i.e., performance), and the relatively permanent changes that occur in the capability for exhibiting those behaviors in the future (i.e., learning).

> Hull used the terms habit strength of a response and the momentary reaction potential of that response;
> Estes, in his fluctuation model, referred to habit strength and response strength; and
> Skinner differentiated between reflex reserve and reflex strength.

Empirically, habit strength, or reflex reserve (i.e., learning), was assumed to be indexed by resistance to extinction or forgetting, or by the rapidity of relearning, whereas momentary reaction potential, response strength, or reflex strength (i.e., performance) was assumed to be indexed by the current probability, rate, or latency of a response.


인간의 언어 학습 분야에서, Tulving과 Pearlstone의 구분(1966)은 각각 "이용 가능성"(즉, 메모리에 저장된 것)과 "접근가능성"(즉, 주어진 시간에 검색 가능한 것)을 학습과 성과에 완벽하게 매핑한다. 마지막으로, R. A. Bjork와 Bjork(1992)는 인간의 언어 및 운동 학습에 대한 연구의 광범위한 발견을 설명하기 위해 학습과 수행의 구별이 각각 저장 강도와 검색 강도에 의해 색인화되는 새로운 학습 이론을 공식화했다. 이 설명과 학습-성과 구별에 관한 다른 현대의 이론적 관점은 나중에 논의한다.

In the domain of human verbal learning, Tulving and Pearlstone’s (1966) distinction between “availability” (i.e., what is stored in memory) and “accessibility” (i.e., what is retrievable at any given time) also maps, albeit not perfectly, onto learning and performance, respectively. Finally, R. A. Bjork and Bjork (1992), in an effort to account for a wide range of findings in research on human verbal and motor learning, formulated a new theory of learning in which the distinction between learning and performance is indexed by storage strength and retrieval strength, respectively. This account, as well as other contemporary theoretical perspectives regarding the learning–performance distinction, is discussed later.

 

요약
Summary

학습 대 수행의 차이는 잠재 학습, 과잉 학습 및 피로를 연구한 연구자들이 [실제로 학습이 이루어지고 있다는 징후가 없는 상태에서도 훈련 또는 수행의 습득 중에 장기간 학습이 발생할 수 있다는 것을 증명]한 수십 년 전으로 거슬러 올라갈 수 있다. 특히 잠복학습의 결과는 당시 설득력 있고 논란이 많았는데, 이는 학습을 드러내기 위해서는 강화가 필요하지만 학습을 유도할 필요는 없다는 것을 입증했기 때문이다. 요약하자면, 이 초기 작업은 [수행 없는 학습]을 보여주었다. 다음 몇 절에서는 그 반대가 사실임을 보여주는 보다 최근의 증거를 검토한다. 특히, 성능의 향상은 더 많은 성능 오류를 유발하는 조건에 비해 종종 사후 훈련 학습을 방해한다.

The learning versus performance distinction can be traced back decades when researchers of latent learning, overlearning, and fatigue demonstrated that long-lasting learning could occur while training or acquisition performance provided no indication that learning was actually taking place. The results of latent learning studies, in particular, were both compelling and controversial at the time because they verified that, although reinforcement is necessary to reveal learning, it is not required to induce learning. In sum, this early work showed learning without performance. In the next several sections, we review more recent evidence showing that the converse is also true—specifically, that gains in performance often impede posttraining learning compared with those conditions that induce more performance errors.

 

프랙티스의 분산
Distribution of Practice

학습과 수행의 상관관계는 학습해야 할 기술이나 정보의 학습일정을 조작함으로써 반복적으로 발견되어 왔다. 연습 또는 스터디 세션을 몰아치기(즉, 같은 것을 반복해서 연습하거나 공부하는 것)하는 것은 일반적으로 단기 성과에 도움이 되는 반면, 연습 또는 스터디 세션을 시간 또는 다른 활동과 분리하는 것은 일반적으로 장기적인 학습을 촉진합니다. 이 절에서는 실습의 분포가 학습과 성과에 다른 영향을 미치는 것으로 나타난 운동 및 구두 학습 영역의 실험을 차례로 제시한다.
The dissociation between learning and performance has been repeatedly found by manipulating the study schedules of to-be-learned skills or information. Massing practice or study sessions—that is, practicing or studying the same thing over and over again—usually benefits short-term performance, whereas distributing practice or study—that is, separating practice or study sessions with time or other activities—usually facilitates long-term learning. This section presents, in turn, experiments from the motor- and verbal-learning domains in which the distribution of practice was shown to have differential influences on learning and performance.

 

운동 학습
Motor learning

수영하는 사람이 앞, 뒤, 접영을 개선하려고 한다고 가정합니다. 수영 선수의 훈련이 하루에 1시간으로 제한된다고 가정해 보자. 한 가지 훈련 옵션은 다른 스트로크를 20분씩 연습한 후 다음 훈련 세션에서 이전에 연습한 스트로크로 돌아가지 않고 매스(또는 차단)하는 것입니다. 또는 각 스트로크가 다음 스트로크로 넘어가기 전에 10분 동안 연습하도록 연습 일정을 분배(또는 무작위화)할 수 있습니다. 이 일정에 따라 훈련 세션 동안 각 스트로크를 한 번 더 재방문할 수 있습니다. 이 섹션에서는 매스 연습이 훈련 중 빠른 성과 향상을 촉진할 수 있지만, 연습을 분산하면 해당 기술을 장기간 유지할 수 있음을 시사하는 연구를 검토한다.

Suppose a swimmer wishes to improve his or her front, back, and butterfly strokes. Suppose further that the swimmer’s training is restricted to 1 hr per day. One training option would be to mass (or block) the different strokes by practicing each for 20 min before moving on to the next, never returning to the previously practiced strokes during that training session. Alternatively, he or she might distribute (or randomize) the practice schedule such that each stroke is practiced for 10 min before moving on to the next stroke. This schedule would permit each stroke to be revisited one more time during the training session. In this section, we review research that suggests that, whereas massing practice might promote rapid performance gains during training, distributing practice facilitates long-term retention of that skill.

배들리와 롱맨(1978년)과 J.B. Shea와 Morgan(1979)은 연습을 분배하는 것이 단순한 운동 기술의 학습과 수행에 차별적인 영향을 미친다는 것을 보여주는 두 가지 고전 연구를 발표했다. 영국 우체국의 의뢰를 받아, Baddelley와 Longman은 새로 도입된 우편 번호를 키보드에 입력하는 우체국 직원들의 능력을 최적화하는 방법을 조사했다. 문제는 우체국 직원들이 하루 몇 시간씩 연습하면서 가능한 한 빨리 새로운 시스템을 배워야 하는지, 아니면 연습이 더 많이 보급되면 학습이 가장 이득이 될 것인가 하는 것이었다. 매일 연습량과 연습이 발생한 일수를 변화시키면서, 더 분산된 연습은 타자기의 키 입력의 보다 효과적인 학습을 촉진했다. 그러나, 기준에 도달하는 일수 대 시간 수로 측정되는 기술 습득의 효율성에 관해서는 그 반대였다.기준에 도달하기 위해서: 즉, 분산 그룹은 매스 그룹에 대해 특정 수준의 퍼포먼스에 도달하기 위해 더 많은 일수가 필요했습니다. 요약하면, 몰아치기massed 연습은 키 입력의 신속한 습득을 지원했지만, 분산 연습은 기술의 장기 보유를 향상시켰다(Simon & Bjork, 2001 참조). 

Baddeley and Longman (1978) and J. B. Shea and Morgan (1979) published two classic studies that showed that distributing practice has differential effects on learning and performance of a simple motor skill. Commissioned by the British Postal Service, Baddeley and Longman investigated how to optimize postal workers’ ability to type newly introduced postcodes on the keyboard. The question was whether the postal workers should learn the new system as rapidly as possible, practicing several hours per day, or whether learning would profit most if practice was more distributed. Varying the amount of practice per day and the number of days in which practice occurred, more distributed practice fostered more effective learning of the typewriter keystrokes; however, the opposite was true in regard to the efficiency in which the skill was acquired, as measured by the number of days to reach criterion versus the number of hours to reach criterion—that is, the distributed group required more days to reach any given level of performance relative to the massed group. In sum, massed practice supported quicker acquisition of the keystrokes, but distributed practice led to better long-term retention of the skill (see also Simon & Bjork, 2001).

J. B. Shea와 Morgan(1979)은 또한 운동 기술을 장기간 유지하는 데 도움이 된다는 것을 보여주었다. 그들의 중요한 실험에서, 참가자들은 세 가지 다른 움직임 패턴을 배웠는데, 각각의 움직임에는 정해진 순서에 따라 세 개의 작은 나무 장벽(6개 중 한 개)을 넘어뜨리는 것이 포함되었습니다. 두 가지 다른 연습 일정, 즉 차단과 랜덤이 구현되었습니다. 블록 프랙티스 조건에서는 3가지 동작 패턴 각각이 18회 연속적으로 연습된 반면 랜덤 프랙티스 조건에서는 참가자의 입장에서 예측할 수 없는 방식으로 각 패턴의 18회 동작이 다른 패턴에 대한 시험 사이에 혼재되었다. 따라서 중요한 것은 세 가지 작업에 대한 연습 시간이 두 가지 다른 연습 조건에 걸쳐 동일하다는 것이다. 관심사는 서로 다른 연습 일정이 팔 움직임이 실행되는 속도에 어떻게 영향을 주느냐였다. 

J. B. Shea and Morgan (1979) also showed that distributing practice benefits the long-term retention of a motor skill. In their seminal experiment, participants learned three different movement patterns, each of which involved knocking over three (of six) small wooden barriers in a prescribed order. Two different practice schedules were implemented: blocked and random. In the blocked-practice condition, each of the three movement patterns was practiced for 18 trials in succession, whereas in the random-practice condition, the 18 trials of each pattern were intermingled among the trials on the other patterns in a way that was unpredictable from a participant’s standpoint. Importantly, therefore, practice time for the three tasks was equated across the two different practice conditions. Of interest was how the different practice schedules affected the rapidity in which the arm movements were executed.

J.B.의 결과. Shea와 Morgan(1979)은 그림 2에 나와 있다. 첫째, 획득 중에 팔 움직임을 수행하는 데 필요한 짧은 시간에서 알 수 있듯이, 차단된 연습 조건에 할당된 참가자가 무작위 연습 조건의 참가자들보다 더 나은 성과를 보였다. 하지만 각 그룹이 습득한 기술을 얼마나 잘 유지할 수 있을까요? 10분 및 10일 후에 실시되는 유지 테스트에서는 참가자는 블록(B) 또는 랜덤(R) 방식으로 각 스킬에 대해 테스트를 실시하여 참가자의 4개의 서브그룹(B-B, B-R, R-B 및 R-R)을 생성했습니다. 쌍의 첫 번째 문자는 획득 중에 실습이 어떻게 스케줄 되었는지를 나타내며, 두 번째 문자는 각 그룹이 어떻게 테스트되었는지를 나타낸다. 그림 2에서 볼 수 있듯이, 인수 시 차단된 관행의 이점은 지연 후 더 이상 명확하지 않습니다. 실제로 10분 및 10일 후에 학습이 평가될 때 패턴이 역전되었습니다. 즉, 전반적으로 무작위 순서로 기술을 처음 연습한 사람들이 가장 많은 학습을 보였습니다. 블록 방식으로 테스트된 그룹(B-B 대 R-B)을 비교한 결과, 이 연구는 획득 중 [무작위 실행]이 획득 중 [블록식 실행]보다 더 낫다는 것을 보여주었다. 이러한 패턴은 연구자들이 지연된 테스트에서 무작위 순서(B-R 대 R-R)로 테스트된 그룹을 비교했을 때 극적으로 입증되었다. 따라서 Baddeley와 Longman(1978년)과 마찬가지로, Shea와 Morgan은 여러 가지 학습된 이동 패턴의 블록식 관행이 획득 성과를 촉진하는 반면, 동일한 이동 패턴의 인터리빙 관행이 장기 보존을 촉진한다는 것을 보여주었다(이 발견의 복제 및 연장은 Lee & Magill, 1983 참조). 그림 2에는 나타나지 않았지만 Shea와 Morgan은 인터리빙의 전송 이점도 발견했기 때문에 처음에 랜덤 방식으로 스킬을 연습한 참가자들은 새로운 응답 패턴, 즉 연습하지 않은 응답 패턴을 비교적 잘 수행할 수 있었습니다. 

The results of J. B. Shea and Morgan (1979) are shown in Figure 2. First, it is clear that during acquisition, participants assigned to the blocked-practice condition performed better than those in the random-practice condition, as evidenced by shorter times required to perform the arm movements. But how well would each group retain the acquired skills? On retention tests given after 10 min and 10 days, participants were tested on each skill in either a blocked (B) or random (R) fashion, which produced four subgroups of participants: B-B, B-R, R-B, and R-R. The first letter in the pair denotes how practice was scheduled during acquisition; likewise, the second letter denotes how each group was tested. As can be seen in Figure 2, the advantage of blocked practice during acquisition was no longer evident after a delay. In fact, the pattern reversed when learning was assessed after 10 min and 10 days—that is, overall, those who initially practiced the skills in a random order exhibited the most learning. Comparing the groups that were tested in a blocked fashion (B-B vs. R-B), the study showed that random practice during acquisition was better than blocked practice during acquisition. This pattern was dramatically demonstrated when researchers compared the groups that were tested in a random order (B-R vs. R-R) on the delayed test. Thus, similar to Baddeley and Longman (1978), Shea and Morgan showed that blocking practice of several to-be-learned movement patterns facilitated acquisition performance, whereas interleaving practice of those same movements promoted long-term retention (see Lee & Magill, 1983, for a replication and extension of these findings). Although not shown in Figure 2, Shea and Morgan also found a transfer advantage of interleaving, such that participants who initially practiced the skill in a random fashion were relatively better in executing a new response pattern—that is, one that had not been practiced.

J. B. Shea와 Morgan(1979)의 결과는 별도의 학습 과제를 인터리빙하면 장기적인 보존을 강화할 수 있다는 여러 후속 시연과 함께 Battig(1979)가 상황 간섭 효과로 언급한 광범위한 발견의 한 예로 작용한다. 주로 구두 쌍으로 구성된 학습 과제(Battig, 1962, 1972 참조)의 발견에 기초하여, Battig는 습득 중 별도의 학습 과제 간의 가능한 [간섭]을 증가시키는 조건은 습득 프로세스 중 장기 보존과 전이를 향상시킬 수 있다고 제안했다. 예를 들어 테니스에서 포핸드, 백핸드, 서브 스트로크와 같이 학습해야 할 개별 태스크에 무작위로 트라이얼을 혼합하면 스트로크의 구성 요소 간의 간섭이 증가하지만 이러한 기술의 장기 보유를 향상시킬 수 있습니다.

J. B. Shea and Morgan’s (1979) results, together with the multiple subsequent demonstrations that interleaving separate to-be-learned tasks can enhance long-term retention, serve as one example of a broader finding, referred to by Battig (1979) as contextual interference effects. Primarily on the basis of findings from verbal paired-associate learning tasks (see Battig, 1962, 1972), Battig proposed that conditions during acquisition that act to increase the possible interference between separate to-be-learned tasks can enhance long-term retention and transfer, despite their depressing effects on performance during the acquisition process. Randomly intermixing the trials on separate to-be-learned tasks, such as, say, the forehand, backhand, and serve strokes in tennis, increases the interference between the components of those strokes but then can enhance long-term retention of those skills.

J.B.의 결과. Shea와 Morgan(1979)은 많은 후속 연구를 촉진시켰으며, 그 중 다수는 현장 기반이었고 더 복잡한 운동 기술을 조사했다. 그러한 연구에서, 배드민턴 선수들은 차단되거나 무작위로 인터리빙된 연습 일정에 따라 코트 한쪽에서 세 가지 다른 종류의 서브를 배웠다. 유지 간격 후, 선수들은 서브가 연습된 코트의 같은 쪽과 반대쪽에서 서브 테스트를 받았다. 차단된 그룹은 훈련 중에 더 잘 수행했지만, 인터리브 그룹은 코트의 같은 면이든 반대 면이든 상관없이 더 나은 장기 보존을 보였다(S. Goode & Magill, 1986). 따라서 연습을 배포하면 연습한 특정 스킬의 보유가 강화될 뿐만 아니라 그 스킬의 보다 나은 이전(즉, 다른 컨텍스트에서의 스킬 적용)이 촉진됩니다. 분산 연습에 의해 촉진되는 학습 혜택은 또한 야구와 피아노 곡에서 다른 종류의 공을 치는 것을 배우는 것과 어린이와 나이 든 성인 모두에게 증명되었습니다. 단순하고 복잡한 운동 기술에 대한 분산 연습의 영향에 대 한 검토는 Lee(2012)와 Merbah and Meulemans(2011)를 추천한다.

The results of J. B. Shea and Morgan (1979) spurred many follow-up studies, many of which were field based and examined more complex motor skills. In one such study, badminton players learned three different types of serves from one side of the court under blocked or randomly interleaved practice schedules. After a retention interval, the players were tested on the serves from both the same and opposite side of the court from which the serves were practiced. The blocked group performed better during training, but the interleaved group showed better long-term retention, whether tested on the same or opposite side of the court (S. Goode & Magill, 1986). Thus, not only does distributing practice enhance the retention of the specific skill that is practiced, but it also fosters better transfer of that skill—that is, the application of the skill in a different context. The learning benefits promoted by distributed practice have also been demonstrated for learning to hit pitches of different types in baseball (Hall, Domingues, & Cavazos, 1994) and piano pieces (Abushanab & Bishara, 2013) and for both children (e.g., Ste-Marie, Clark, Findlay, & Latimer, 2004) and older adults (e.g., Lin, Wu, Udompholkul, & Knowlton, 2010). For reviews of the effects of distributed practice on motor skills, both simple and complex, we recommend Lee (2012) and Merbah and Meulemans (2011).

 

구두 학습
Verbal learning

운동 영역에서와 같이, 언어 과제의 경험적 증거는 학습 기회를 분산(또는 띄어쓰기)하는 것이 매스하는 것에 비해 학습에 도움이 된다는 것을 시사한다, 언어 문헌에서 발견한 것을 간격두기 효과라고 한다. 간격두기 효과를 최초로 입증한 에빙하우스(1885/1964)는 공간 연구 기회가 질량이 아닌 재료를 망각하기 더 쉽게 만든다는 것을 보여주었다. 수십 년 후, 이 주제에 관한 고전적인 기사가 발표되었습니다(예: Battig, 1966; Madigan, 1969; Melton, 1970). 예를 들어, 현재 검토와 특히 관련이 있으며, 피터슨, 윔플러, 커크패트릭, 솔츠만(1963)은 매스 항목이 종종 단기적으로 더 잘 유지되는 반면(즉, 간격두기가 수행을 손상시킴), 간격이 있는 항목은 장기간에 걸쳐 더 잘 유지된다는 것을 최초로 관찰했다(즉, 간격두기가 학습을 강화시킴). 그 이후 수백 개의 실험에서 간격 효과가 매우 견고하고 신뢰할 수 있음을 입증했다(검토는 Cepeda, Pashler, Vul, Wixted, 2006; Dempster, 1988 참조). 이제 간격 효과의 증거와 이 실험 조작이 학습-성과 구별에 어떤 영향을 미치는지 선택적으로 검토한다. 다음 두 가지 방법으로 간격이 확보되는 상황을 그룹화했습니다. (a) 필요한 정보 또는 절차의 반복 사이에 휴식 또는 관련 없는 활동 기간을 삽입한다. (b) 여러 가지 다른 (아마도 방해될 수 있는) 작업이나 구두 자료의 연구 또는 연습 시험을 인터리브함으로써. 그러나 현재 인터리빙의 이점이 이러한 인터리빙이 도입된 공간의 이점을 넘어서는가 하는 것이 현재 활성 문제이다(예: Birnbaum, Kornell, Bjork, 2013; Kang & Pashler, 2012 참조).

As in the motor domain, empirical evidence from verbal tasks suggests that distributing (or spacing) study opportunities benefits learning relative to massing them, a finding in the verbal literature termed the spacing effect. The first to demonstrate the spacing effect, Ebbinghaus (1885/1964) showed that spacing study opportunities, as opposed to massing them, rendered the material more resistant to forgetting. Decades later, now-classic articles were published on the topic (e.g., Battig, 1966; Madigan, 1969; Melton, 1970). For example, and particularly relevant to the current review, Peterson, Wampler, Kirkpatrick, and Saltzman (1963) were the first to observe that massed items are often retained better in the short term (i.e., spacing impairs performance), whereas spaced items are retained better over the long term (i.e., spacing enhances learning; see also Glenberg, 1977). Since then, hundreds of experiments have demonstrated the spacing effect to be highly robust and reliable (for reviews, see Cepeda, Pashler, Vul, Wixted, & Rohrer, 2006; Dempster, 1988). We now selectively review evidence of the spacing effect and how this experimental manipulation bears on the learning–performance distinction. We note that we have grouped together situations in which spacing is achieved in two different ways: (a) by inserting periods of rest or unrelated activity between repetitions of to-be-learned information or procedures; and (b) by interleaving the study or practice trials of several different—and possibly interfering—to-be-learned tasks or verbal materials. A currently active issue, however, is whether the benefits of interleaving go beyond the benefits of the spacing such interleaving introduces (see, e.g., Birnbaum, Kornell, Bjork, & Bjork, 2013; Kang & Pashler, 2012).

간격두기 효과를 검토하는 대부분의 연구는 단일 단어 또는 짝을 이룬 동료와 같은 비교적 단순한 학습 자료를 사용하여 수행했다. 예를 들어, 한 연구에서 고등학생들은 프랑스어-영어 단어 쌍(예: l'avocat-변호사)을 하루에 30분씩 연속적으로 학습하는 집단 연습 또는 3일마다 10분씩 학습하는 간격(분산) 연습 조건 하에서 배웠다. 각 연습 일정 직후에 투여된 초기 테스트(매스 그룹에 대한 30분 연구 세션 후와 간격 그룹에 대한 세 번째 10분 연구 세션 후)에서 실질적으로 동일한 단기 성과가 관찰되었다. 그러나 7일 후에 투여된 장기 보존 테스트에서, 연구 간격을 둔 참가자들은 연구를 집결한 참가자보다 더 많은 쌍을 회상했다(Bloom & Shuell, 1981년). 마찬가지로, 간격두기 학습 세션은 외국어 단어 쌍의 습득을 실제로 늦출 수 있지만, 몇 년의 기간 동안에도 여전히 우수한 유지로 이어질 수 있다(Bahrick, Bahrick, Bahrick, 1993).
The majority of studies examining the spacing effect have done so using relatively simple to-be-learned materials, such as single words or paired associates. In one study, for example, high school students learned French–English vocabulary pairs (e.g., l’avocat—lawyer) under conditions of either massed practiced, in which the pairs were studied for 30 consecutive minutes on one day, or spaced (distributed) practice, in which the pairs were studied for 10 min on each of three consecutive days. On an initial test that was administered immediately following each practice schedule—after the 30-min study session for the massed group and after the third 10-min study session for the spaced group—virtually identical short-term performance was observed. However, on a long-term retention test administered 7 days later, participants who had spaced their study recalled more pairs than participants who had massed their study (Bloom & Shuell, 1981). Similarly, spacing study sessions, relative to massing them, can actually slow down the acquisition of foreign language vocabulary pairs but can still lead to superior retention—even over a span of several years (Bahrick, Bahrick, Bahrick, & Bahrick, 1993).

간격두기 효과의 나이와 관련된 차이도 조사되었다. 예를 들어, 젊은 성인(18~25세)과 나이 든 성인(61~76세) 모두 미사일이 있거나 간격을 둔 프레젠테이션 일정에 따라 관련이 없는 짝을 이룬 동료(예: 키튼-다임)를 여러 번 연구했다. 연속 큐드-리콜 패러다임을 사용하여 각 항목은 항목의 마지막 프레젠테이션 이후에 2개(단기 보존) 또는 20개(장기 보존)의 개입 항목이 제시된 후 테스트되었다. 놀라운 사실은 나이 든 성인들이 젊은 성인에 비해 전반적으로 더 나쁜 성과를 보인다는 것이다. 보다 흥미롭고 학습-성과 구별과 관련이 있는 두 연령대는 간격별 상호 작용을 보였다. 즉, 단기 보존(즉, 성과)은 [대량 보존 항목]을 선호한 반면, 장기 보존(즉, 학습)은 [간격 있는 항목]을 선호했다. (바로타, 듀첵, 1989년) 

Age-related differences in the spacing effect have also been examined. For example, both younger (ages 18–25) and older (ages 61–76) adults studied unrelated paired associates (e.g., kitten–dime) multiple times according to either a massed or spaced presentation schedule. Using a continuous cued-recall paradigm, each item was tested after either 2 (short retention) or 20 (long retention) intervening items were presented following the item’s last presentation. An unsurprising finding was that older adults performed worse, overall, compared with their younger counterparts. More interesting, and relevant to the learning–performance distinction, both age groups exhibited a spacing-by-retention-interval interaction—that is, short-term retention (i.e., performance) favored the massed items, whereas long-term retention (i.e., learning) favored the spaced items (Balota, Duchek, & Paullin, 1989).

간격은 단순한 자료의 보존성을 높일 뿐만 아니라 산문 구절(예: Rawson & Kintsch, 2005)과 논리(Carlson & Yaure, 1990)와 귀납적 추론과 같은 보다 복잡한 자료의 학습도 개선한다. 특히 눈에 띄는 예는 다양한 유형의 수학 문제를 묶는 것이 아니라 띄어쓰기가 학습을 용이하게 한다는 것을 보여주었다. 참가자들의 과제는 네 개의 다른 모양의 물체의 기하학적 부피를 찾는 방법을 배우는 것이었다. 한 그룹은 한 개체에 대해 4개의 문제를 시도한 후 다음 개체에 대해 4개의 문제로 넘어가는 등 정해진 일정에 따라 연습 문제를 풀었고, 다른 그룹은 무작위로 혼합된 순서로 다양한 모양의 문제를 풀었습니다. 참가자들은 일주일 후에 그 문제에 대해 테스트를 받았다. 연습 단계 동안 참가자들은 이러한 문제를 블록 방식으로, 즉 성능 향상을 대량으로 연습하면 더 많은 문제를 해결할 수 있었습니다. 그러나 장기 보존 테스트에서는 이 패턴이 반대로 나타났다.참가자는 이러한 문제를 1주일 전에 혼합 형식(즉, 공간 활용 학습 강화)으로 연습하면 문제를 해결할 수 있는 능력을 더 잘 유지할 수 있었다(Rohrer & Taylor, 2007). 이러한 결과는 학습과 성과 간의 차이를 예시한다(Rohrer, Dedrick, & Burgess, 2014; Taylor & Rohrer, 2010 참조).

In addition to fostering better retention of simple materials, spacing also improves the learning of more complex materials, such as prose passages (e.g., Rawson & Kintsch, 2005), and the learning of higher-level concepts, such as logic (Carlson & Yaure, 1990) and inductive reasoning (e.g., Kang & Pashler, 2012; Kornell & Bjork, 2008; Kornell, Castel, Eich, & Bjork, 2010). A particularly striking example showed that spacing various types of math problems, as opposed to massing them, facilitates learning. Participants’ task was to learn how to find the geometric volume of four differently shaped objects. One group worked through the practice problems according to a blocked schedule, such that four problems for one object were attempted before moving on to four problems for the next object, and so on; the other group worked through the problems for various shapes in a randomly mixed order. Participants were then tested on the problems 1 week later. During the practice phase, participants were able to solve more of the problems if those problems were practiced in a blocked fashion—that is, massing improved performance. This pattern reversed, however, on the long-term retention test: Participants better retained the ability to solve the problems if those problems were practiced 1 week earlier in a mixed format—that is, spacing enhanced learning (Rohrer & Taylor, 2007). These results exemplify the distinction between learning and performance (see also Rohrer, Dedrick, & Burgess, 2014; Taylor & Rohrer, 2010).

요약
Summary

운동 및 언어 학습 영역의 증거는 장기 학습이 학습해야 할 기술 또는 정보를 시간 또는 기타 개입 활동과 함께 분산(간격두기)함으로써 이익을 얻는다는 것을 보여준다. 그러나 단기적으로는 몰아치기massed 연습이 더 나은 경우가 많다. 따라서, 타이핑, 배드민턴, 외국어 말하기 또는 기하학 문제를 배우고 싶은 경우, 그러한 일정이 연습이나 습득 중에 더 많은 오류를 유발할 수 있더라도 분산 연습 일정을 시행하는 것을 고려해야 한다.

Evidence from the motor- and verbal-learning domains demonstrates that long-term learning profits from distributing (spacing) the practice of to-be-learned skills or information with time or other intervening activities. In the short term, however, massed practice is often better. Thus, whether one wishes to learn how to type, play badminton, speak a foreign language, or solve geometry problems, one should consider implementing a distributed practice schedule, even if such a schedule might induce more errors during practice or acquisition.

 

연습의 변화주기
Variability of Practice

예를 들어 목표 스킬과 관련이 있지만 다른 연습 스킬을 갖는 등 연습이나 학습 세션의 조건을 분산시키는 것은 습득 중 성과에 악영향을 미칠 수 있지만 장기적인 학습과 이전을 촉진할 수 있습니다. 이러한 맥락에서 대부분의 연구는 운동 학습에 초점을 맞췄지만, 언어 학습에 대한 소수의 연구들 또한 연습의 [가변성]의 장기적인 이점을 보여주었다. 우리는 이제 학습과 성과에 대한 연습의 가변성이 분리할 수 없는 영향을 보여준 운동과 언어 학습 전통 모두의 연구를 검토한다.
Similar to distributing practice, varying the conditions of practice or study sessions—for example, by having a trainee practice skills related to but different from the target skill—can also have detrimental effects on performance during acquisition but then foster long-term learning and transfer. Most of the research in this vein has focused on motor learning, although a handful of studies on verbal learning have also demonstrated the long-term benefits of practice variability. We now review research from both the motor- and verbal-learning traditions that has shown dissociable effects of practice variability on learning and performance.

 

운동 학습
Motor learning

운동 학습과 연습의 가변성에 대한 연구는 예를 들어 농구 선수가 정확한 자유투를 하고 싶다면, 파울 라인 자체뿐만 아니라 파울 라인 근처의 다양한 위치에서 연습해야 한다고 제안한다. 이러한 가변 연습은 연습 중에 효과적이지 않은 것처럼 보일 수 있다. 특히 파울 라인에서만 슈팅하는 것에 비해 더 많은 성능 오류가 유발될 가능성이 높지만 장기적인 학습을 촉진할 수 있다. 나중에 자세히 논의하는 바와 같이, 연습 조건을 변경하는 것은 농구 슈팅과 같은 기술의 기초가 되는 일반적인 운동 프로그램에 익숙해지고 매개 변수를 조작하는 것을 배울 수 있기 때문에 학습에 효과적인 것으로 보인다(Schmidt, 1975). 이제 우리는 연습의 가변성을 증가시키는 것이 훈련 또는 획득 중에 더 많은 오류를 야기하는 동시에 장기적인 학습 혜택을 줄 수 있다는 것을 시사하는 모터 러닝 영역의 몇 가지 발견에 대해 논의한다(검토는 Guadnoli & Lee, 2004 참조).
Research on motor learning and practice variability suggests that if a basketball player, for example, wants to shoot accurate free throws, he or she should not only practice from the foul line itself but also from various positions neighboring the foul line. Such variable practice might not appear to be effective during practice—specifically, more performance errors would likely be induced relative to shooting only from the foul line—but would facilitate long-term learning. As discussed in more detail later, varying the conditions of practice seems to be effective for learning because it enables one to become familiar with, and learn to manipulate the parameters of, the general motor program underlying some skill, like shooting a basketball (Schmidt, 1975). We now discuss several findings from the motor-learning domain suggesting that increasing practice variability, while potentially inducing more errors during training, or acquisition, also has the potential to confer long-term learning benefits (for a review, see Guadagnoli & Lee, 2004).


커와 부스(1978)는 연습 조건을 고정시키는 것이 아니라 [바꾸는 것]이 운동 기술에 대한 장기적인 학습을 촉진할 수 있다는 설득력 있는 증거를 제공했다. 연구에서 아이들은 2피트, 4피트(다양한 연습) 또는 3피트(고정 연습) 거리에서 바닥에 있는 목표물을 향해 빈백을 던졌다. 잠시 후, 모든 참가자들은 고정 연습 그룹의 참가자들이 연습한 유일한 거리인 3피트 거리에서 테스트를 받았다. 직감적으로 테스트된 거리에서만 연습한 고정 연습 그룹의 참가자가 테스트된 거리에서 연습한 적이 없는 다양한 연습 그룹의 참가자들보다 더 잘할 수 있다. 그러나 결과는 정반대 패턴을 보였다. 연습 거리를 변경하면 최종 테스트에서 3피트 떨어진 곳에서 보다 정확한 토스가 이루어졌으며, 이는 반복되고 확장된 결과인 Pigott & Shapiro, 1984; Roller, Cohen, Kimball & Bloomberg, 200과 같은 다양한 연습의 이점을 보여준다.1; Wulf, 1991).

In their important article, Kerr and Booth (1978) provided compelling evidence that varying the conditions of practice, as opposed to keeping them fixed, can boost long-term learning of a motor skill. In their study, children tossed beanbags at a target on the floor from distances of 2 and 4 feet (varied practice) or only 3 feet (fixed practice). After a delay, all participants were tested from a distance of 3 feet, the sole distance practiced by participants in the fixed-practice group. Intuition would suggest that participants in the fixed-practice group, who exclusively practiced from the tested distance, would do better than those in the varied-practice group, who never practiced at the tested distance. The results, however, showed the opposite pattern: Varying the practice distances led to more accurate tosses from 3 feet away on the final test, showcasing the benefits of variable practice in producing transfer of a motor skill, a result that has been replicated and extended (e.g., Pigott & Shapiro, 1984; Roller, Cohen, Kimball, & Bloomberg, 2001; Wulf, 1991).

[변화주기 연습]은 농구 슈팅(Landin, Hebert, & Fairweather, 1993)과 포핸드 라켓 기술 습득(Green, Whitehead, Sugden, 1995)과 같은 다른 복잡한 운동 기술의 학습을 촉진할 수 있다. 농구 연구에서, 두 그룹의 참가자들은 3일 동안 농구 자유투를 쏘는 연습을 했다. 고정 연습 조건에서는 참가자들이 기준 거리인 12피트에서만 자유투를 쏜 반면 가변 연습 조건의 참가자들은 기준 거리뿐만 아니라 다른 두 거리(8피트와 15피트)에서도 쐈다. 중요한 것은 두 그룹이 연습한 총 자유투 횟수(120개)가 동일하다는 것이다. 연습 단계로부터 72시간 후에 시행된 유지 테스트는 참가자들이 기준 거리(12피트)에서 10개의 자유투를 쏘는 것으로 구성되었다. 상식적인 예측은 고정 연습 조건의 참가자들이 가변 연습 조건의 참가자들에 비해 그 거리에서 더 많은 자유투를 연습했기 때문에 최종 시험에서 더 많은 자유투를 할 것이라는 것이다. 그러나 직관에 반하는 연구 결과는 가변 연습 조건의 참가자들이 지연 유지 테스트에서 더 많은 자유투를 성공시켰다는 것이다. 여러 위치에서 연습하면 기술의 기초가 되는 일반 운동 프로그램에 더 익숙해질 수 있음을 시사했다.
Subsequent research found that variable practice can foster the learning of other complex motor skills, such as shooting a basketball (Landin, Hebert, & Fairweather, 1993) and mastering a forehand racket skill (Green, Whitehead, & Sugden, 1995). In the basketball study, two groups of participants practiced shooting basketball free throws over a period of 3 days. In the fixed-practice condition, participants shot the free throws exclusively from the criterion distance of 12 feet, whereas participants in the variable-practice condition shot from the criterion distance as well as from two other distances (8 feet and 15 feet). It is important to note that the total number of free throws (120) practiced by both groups was equated. The retention test, administered 72 hr after the practice phase, consisted of participants shooting 10 free throws from the criterion distance (12 feet). Again, the commonsense prediction would be that participants in the fixed-practice condition would make more free throws on the final test because they practiced more free throws from that distance compared with participants in the variable-practice condition. The counterintuitive finding, however, was that participants in the variable-practice condition made more free throws on the delayed-retention test, suggesting that practicing from multiple locations engendered more familiarity with the general motor program underlying the skill.


단순한 [운동 기술의 학습]은 그러한 연습이 [획득 성능acquisition performance]에 해로운 영향을 미치는 경우에도 연습 조건의 변화로부터 이익을 얻는 것으로 반복적으로 나타났다. 이러한 학습-성과 상호작용 효과를 창출한 많은 연구는 타이밍 기술을 조사했다(예: Catalano & Kleiner, 1984; Hall & Magill, 1995; Lee, Magill, & Weeks, 1985; Wrisberg & Mead, 1983; Wulf & Schmidt, 1988). 예를 들어, 한 연구에서, 참가자들은 정확히 200ms 안에 그렇게 하는 것을 목표로 주어진 시작 지점에서 팔로 장벽을 넘어뜨리려고 시도했다. 변수 그룹은 4개의 다른 출발 지점(15, 35, 60, 65cm)에서 연습하는 반면, 상수 그룹은 항상 같은 출발 지점(예: 60cm)에서 연습한다. 그림 3에 표시된 것처럼, 변수 그룹은 획득 중에 일정한 그룹보다 더 나쁜 성능을 보였으며, 목표 시간 200ms 내에 암 이동을 시도할 때 더 많은 절대 오류를 발생시켰지만, 이후 새로운 시작 지점(50cm)을 테스트한 즉시 및 지연(1일) 전달 테스트에서 더 나은 학습을 보였다(McC).Racken & Stelmach, 1977). 유사한 학습-성과 상호작용은 기준 손잡이 힘을 학습하는 데 있어 가변 연습의 영향을 조사한 연구에서 나타났다. 기준력에 도달하기 위해 연습한 참가자와 비교했을 때, 추가 손잡이 힘을 연습한 참가자는 [획득 중에 기준력]에 도달하는 데 더 나쁜 성과를 보였지만 [지연 후 기준력]을 생성하는 데 더 정확했다(C. H. Shea & Kohl, 1991년). 또한 C를 참조한다. H. Shea & Kohl, 1990).

The learning of simpler motor skills has also been repeatedly shown to benefit from varying the conditions of practice, even in cases when such practice has detrimental effects on acquisition performance. Many of the studies that have produced this learning–performance interaction effect have examined timing skills (e.g., Catalano & Kleiner, 1984; Hall & Magill, 1995; Lee, Magill, & Weeks, 1985; Wrisberg & Mead, 1983; Wulf & Schmidt, 1988). For example, in one study, participants attempted to knock over a barrier with their arm from a given starting point, with the goal of doing so in precisely 200 ms. A variable group practiced from four different starting points (15, 35, 60, and 65 cm), whereas a constant group always practiced from the same starting point (e.g., 60 cm). As displayed in Figure 3, the variable group performed worse than the constant group during acquisition, producing more absolute errors when attempting to execute the arm movement in the target time of 200 ms, yet showed better learning on subsequent immediate and delayed (1 day) transfer tests in which a new starting point (50 cm) was tested (McCracken & Stelmach, 1977). A similar learning–performance interaction was shown in a study that examined the effects of variable practice in learning a criterion handgrip force. Compared with those who practiced solely to reach the criterion force, participants who practiced additional handgrip forces performed worse during acquisition at reaching the criterion force but were more accurate in producing the criterion force after a delay (C. H. Shea & Kohl, 1991; see also C. H. Shea & Kohl, 1990).

 

구두 학습
Verbal learning

학생들에게 정기적으로 제공되는 오래되고 널리 알려진 조언 중 하나는 조용한 장소(예를 들어 도서관의 단골 코너)를 찾아 그곳에서 꾸준히 공부하라는 것입니다. 학습 조건을 일정하게 유지하는 것이 학습에 도움이 된다고 생각된다. 그러나 운동 영역의 발견과 유사하게, 연구 결과에 따르면, 연구 세션 중 변화를 유도하는 것(예: 기억해야 할 자료가 연구되는 환경적 맥락의 변화 또는 해결해야 할 문제의 변화 증가)도 언어 학습에 도움이 될 수 있다. 그러한 변화를 유도하는 것은 종종 획득 성능에 무시해도 될 정도의 영향을 미치거나 심지어 이를 방해할 수도 있지만, 소재가 나중에 해당 소재에 쉽게 접근할 수 있는 광범위한 기억 신호와 연관되기 때문에 장기적인 학습을 향상시킬 수 있다. 언어 학습 전통의 여러 연구들이 이것을 경험적으로 증명해 왔다.
One long-standing and widespread piece of advice regularly given to students is to find a quiet location—say, a favorite corner of the library—and to study there on a consistent basis. Keeping study conditions constant, it is thought, benefits learning. However, analogous to findings in the motor domain, studies have shown that inducing variation during study sessions—for example, by varying the environmental context in which to-be-remembered material is studied or increasing the variation of to-be-solved problems—can also benefit verbal learning. Inducing such variation often has negligible effects on acquisition performance, or may even impede it, but it can enhance long-term learning because the material becomes associated with a greater range of memory cues that serve to facilitate access to that material later. Several studies in the verbal-learning tradition have demonstrated this empirically.


한 연구는 자료를 학습하는 물리적 맥락 또는 환경을 변경하는 것이 새로운 맥락에서 해당 자료를 시험볼 때 학습을 강화할 수 있는지 여부를 조사했다. 이는 현대의 표준화된 테스트(예: SAT, GRE)가 종종 낯선 위치에서 시행된다는 점을 고려할 때 여전히 관련성이 있는 문제이다. 참가자들은 먼저 40개의 단어 목록을 연구했다. 참가자의 절반은 미시간 대학 캠퍼스의 특정 장소인 A룸에서, 다른 참가자는 미시건 캠퍼스의 다른 장소인 B룸에서 목록을 연구했습니다. 3시간 후, 각 그룹의 참가자 중 절반은 같은 방에서 단어를 다시 읽었고, 다른 참가자들은 다른 장소에서 목록을 다시 살펴보았다. 두 번째 스터디 세션 후 3시간 후에 시행된 최종 테스트에서 모든 참가자는 중립 위치인 C실에서 단어에 대한 테스트를 받았다. 놀랍게도, 다른 방에서 공부한 참가자들은 같은 방에서 공부한 참가자보다 약 21% 더 많은 단어를 기억했으며, 가변 연습의 기억력 이점을 보여주었다(Smith, Glenberg, Bjork, 1978). 따라서, 참가자들이 새로운 장소에서 물리적 연구 환경을 변화시키면서 시험을 치른 경우, 나중에 동일하거나 유사한 자료를 사용하여 복제한 결과인 학습을 강화했다(Glenberg, 1979; Smith, 1982). 또 다른 연구는 모든 강의가 같은 장소에서 진행되는 것에 비해 4개의 다른 장소에서 연속적으로 4개의 강의를 한 후 참가자들이 통계 개념을 5일 동안 유지하는 것이 더 낫다는 것을 보여줌으로써 보다 복잡한 학습 자료로 이 연구 결과를 복제했다. 그러나 각 통계 강의 직후에 시행된 단기 보존 테스트의 성과는 두 그룹 모두에서 유사했다(Smith & Rothkopf, 1984).
One study examined whether varying the physical context, or environment, in which material is studied can bolster learning when that material is tested in a new context, an issue that remains relevant given that modern standardized tests (e.g., SAT, GRE) are often administered in unfamiliar locations. The participants first studied a list of 40 words. Half the participants studied the list in Room A, a particular location on the University of Michigan campus; the other participants studied the list in Room B, a different location on the Michigan campus. Three hours later, half of the participants in each group restudied the words again in the same room, whereas the other participants studied the list again in the other location. On the final test, administered 3 hr after the second study session, all participants were tested on the words in a neutral location, Room C. Strikingly, participants who studied in different rooms recalled approximately 21% more of the words than participants who studied in the same room, demonstrating the mnemonic benefit of variable practice (Smith, Glenberg, & Bjork, 1978). Thus, if participants were tested in a novel location, varying the physical study environments bolstered learning, a finding that was later replicated using the same or similar materials (Glenberg, 1979; Smith, 1982). Another study replicated this finding with more complex learning material by showing that participants’ 5-day retention of statistical concepts was better when it occurred after four successive lectures given in four different locations as opposed to when all of the lectures were given in the same location. Performance on short-term retention tests administered immediately after each statistics lecture, however, was similar for both groups (Smith & Rothkopf, 1984).

환경 컨텍스트의 변동을 증가시킬 뿐만 아니라, 반드시 단기적인 성과는 아니지만 장기적인 학습과 이전도 획득 단계에서 문제의 변동을 증가시킴으로써 이익을 얻을 수 있다. 예를 들어, 화학 공정 공장의 컴퓨터 기반 시뮬레이션 문제 해결과 관련된 과제에 대한 가변 관행의 영향을 조사한 연구에서, 참가자들은 "전이 역설"을 나타내는 결과 패턴을 생성했다. 특히, [낮은 가변성 문제]와 비교하여 [매우 가변적인 연습 문제]는 연습 중에 더 많은 [수행] 오류를 유발했지만, 이후 테스트에서 해결된 새로운 문제 수에서 입증되었듯이 [학습]에 긍정적인 영향을 미쳤다(Van Merrienboer, de Crook, & Jelsma, 1997). 이러한 부호화의 가변성은 또한 유추적 추론(Gick & Holyoak, 1983)과 기하학적 문제 해결(Paas & Van Merrienboer, 1994), 텍스트 자료(Mannes & Kintsch, 1987)와 얼굴-이름 쌍의 보존(Smith & Handy, 2014)을 강화하는 것으로 나타났다. 

In addition to increasing the variation of the environmental context, long-term learning and transfer but not necessarily short-term performance can also profit from increasing the variation of problems during an acquisition phase. For example, in a study that examined the effects of variable practice on a task that involved troubleshooting a computer-based simulation of a chemical process plant, participants produced a pattern of results indicative of a “transfer paradox.” Specifically, highly variable practice problems, relative to low-variability problems, induced more performance errors during practice but had positive effects on learning, as evidenced by the number of new problems solved on a later test (Van Merrienboer, de Croock, & Jelsma, 1997). Such encoding variability has also been shown to enhance analogical reasoning (Gick & Holyoak, 1983) and geometrical problem solving (Paas & Van Merrienboer, 1994), as well as the retention of text material (Mannes & Kintsch, 1987) and face–name pairs (Smith & Handy, 2014).

언어 자료로 가변 연습의 학습 이점을 입증한 또 다른 연구에서, 참가자들은 나중에 테스트된 아나그램을 반복적으로 풀거나(예: 연습 단계에서 LDOOF가 세 번 풀리고 테스트에 나타났음) 테스트된 아나그램의 여러 버전을 풀어서 아나그램을 푸는 연습을 했다.d나중에 (예를 들어 DOLOF, FOLOD 및 OOFLD가 실행되었고 LDOF가 테스트에 나타났다.) 관심사는 아나그램의 여러 변형을 해결하는 것, 즉 문제의 가변성을 높이는 것이 나중에 아나그램을 푸는 참가자들의 능력을 향상시킬 수 있는가 하는 것이었다. 실제로 가변 연습 조건의 참가자들은 연습 단계에서 아나그램을 해결하는 데 비교적 오랜 시간이 걸리고 단기적인 수행 저하가 드러났지만, 그들은 이후 테스트에서 상대적으로 더 많은 아나그램을 풀었다(M. K. Goode, Geraci, & Roediger, 2008). 운동 학습에 대한 이전 섹션에서 검토한 결과 중 몇 가지와 마찬가지로, 이 결과는 직관적이지 않다. 왜냐하면 가변 실습 그룹은 나중에 테스트된 특정 아나그램을 해결하려고 시도하지 않은 반면, 다른 그룹은 연습 단계에서 세 번 풀었기 때문이다. 따라서 이러한 결과는 [테스트 받지 않을 다양한 거리에서 목표물]을 던지는 것이 [테스트 받을 거리]에서만 그러한 연습하는 것보다 학습에 더 낫다는 커와 부스의 운동 학습 실험의 결과를 개념적으로 복제한다.

In yet another study that demonstrated learning benefits of variable practice with verbal materials, participants practiced solving anagrams by either repeatedly solving the anagram that was tested later (e.g., LDOOF was solved three times during the practice phase and appeared on the test) or solving multiple versions of the anagram that was tested later (e.g., DOLOF, FOLOD, and OOFLD were practiced and LDOOF appeared on the test). Of interest was whether solving multiple variants of the anagram—that is, increasing the variability of the problems—would enhance participants’ ability to solve the anagrams later. Indeed, despite participants in the variable practice condition taking relatively longer to solve the anagrams during the practice phase, revealing a short-term performance decrement, they solved relatively more of the anagrams on a later test (M. K. Goode, Geraci, & Roediger, 2008). Like several of the results reviewed in the previous section on motor learning, this result is counterintuitive because the variable practice group never attempted to solve the specific anagram that was later tested, whereas the other group solved it three times during the practice phase. Thus, these results conceptually replicate the outcome of Kerr and Booth’s (1978) motor-learning experiment, in which tossing beanbags at a target from various nontested distances was better for learning than practicing those tosses from the tested distance.

요약
Summary

단순하고 복잡한 운동 기술의 장기 보존 및 이전은 훈련 중 수행에 무시할 수 있거나 부정적인 영향을 미칠 수 있는 연습에도 불구하고, 그러한 운동 기술의 단일 반복보다는 여러 번 반복을 수행하는 연습 유형에서 종종 이익을 얻습니다. 언어 학습 실험에서도 같은 것이 밝혀졌는데, 이는 해결해야 할 문제의 변화를 증가시키거나 기억해야 할 자료가 연구되는 환경적 맥락을 변화시켰다. [변화주기 연습variable practice]은 작업을 성공적으로 수행하는 데 필요한 일반적인 기초 운동 기술 또는 지식 기반에 대한 친숙함을 넓히는 것으로 보입니다.
The long-term retention and transfer of motor skills—both simple and complex—often profit from the type of practice that entails one to perform multiple iterations, rather than a single iteration, of those motor skills, despite such practice potentially having negligible or even negative effects on performance during training. The same has been revealed in verbal-learning experiments that have increased the variation of to-be-solved problems or varied the environmental context in which to-be-remembered material was studied. Variable practice, it seems, broadens one’s familiarity with the general underlying motor skill or knowledge base needed to successfully perform a task.

인출 연습
Retrieval Practice


수십 년에 걸친 연구에 따르면 테스트에 의해 촉발된 인출 프로세스는 실제로 인출된 정보를 중요한 방식으로 변화킨다. 즉, 테스트는 [메모리에 저장된 내용에 대한 수동적 평가]일 뿐만 아니라(종종 교육에서 전통적인 관점처럼), [메모리에 저장된 내용을 수정하는 매개체]로서도 작용한다. 본 절에서는 이러한 결론을 도출하는 운동 및 언어 학습 영역의 증거를 검토한다. 예를 들어, 모터 스킬 문헌에서는, 스스로 학습한 움직임이, 외부로부터 유도되거나 단순히 관찰된 움직임보다 일반적으로 더 잘 학습된다. 마찬가지로, 언어 정보에 대한 기억을 테스트하거나 참가자들이 직접 정보를 생성하도록 하는 것은 수정 피드백이 제공되지 않는 경우에도 반복해서 읽는 것에 비해 해당 자료의 장기 보존을 향상시킵니다. 학습-수행 구별과 관련된 중요한 발견은 [종종 장기 보존을 촉진하는 인출 연습 조건]이 반대 조건과 비교하여 [단기적으로 도움이 되지 않는 것으로 보일 수 있다]는 것이다.

Decades of research suggest that the retrieval processes triggered by testing actually changes the retrieved information in important ways. That is, tests act not only as passive assessments of what is stored in memory (as is often the traditional perspective in education) but also as vehicles that modify what is stored in memory. This section reviews evidence from both the motor- and verbal-learning domains that lead to such a conclusion. In the motor-skills literature, for example, to-be-learned movements that are self-produced are typically better learned than those that are externally guided or simply observed. Likewise, testing one’s memory for verbal information, or having participants generate the information themselves, enhances long-term retention of that material compared with reading it over and over, even in cases when corrective feedback is not provided. A critical finding, relevant to the learning–performance distinction, is that conditions of retrieval practice that often facilitate long-term retention frequently may appear unhelpful in the short term compared with their counterpart conditions.

운동 학습
Motor learning

체조 플립이나 골프 스윙과 같은 운동 기술을 가르칠 때 강사가 원하는 동작을 통해 학습자를 물리적으로 지도하는 것은 흔한 일입니다. 직관적으로 이러한 유형의 지도가 유익해야 한다는 것을 알 수 있습니다. 실제로 연구 결과에 따르면 학습자가 지도 없이 기술을 생산하려고 시도할 때보다, 습득 중 수행 오류를 줄이는 것으로 나타났습니다(즉, 학습자가 스스로 기술을 습득하도록 권장됨). 문제는 지도guidance에 더 이상 의존할 수 없는 장기 학습 평가에서는 그 반대의 경우가 많다는 점이다. 즉, 가이드 없이 기술을 자주 연습하면 습득 중에 가이드를 받는 것보다 더 나은 학습을 할 수 있다(자동차 관련 작업의 지침 연구에 대한 검토는 Hodges & Campagnaro, 2012 참조). 운동 기술에 대한 장기적인 학습(반드시 단기적인 성과는 아님)은 테스트와 학습자가 기억해야 할 운동 기술을 직접 생성할 수 있는 경우(스킬을 선택하는 경우와는 달리)에서도 이익을 얻는다.
When teaching a motor skill, such as a gymnastics flip or a golf swing, it is commonplace for instructors to physically guide the learner through the desired motions. Intuition suggests that this type of instruction should be beneficial; indeed, research has shown that guiding learners reduces performance errors during acquisition compared with when learners attempt to produce the skill without guidance (i.e., are encouraged to retrieve the skill on their own). The problem is that on assessments of long-term learning when guidance can no longer be relied on, the reverse is often true—that is, practicing a skill without guidance frequently produces better learning than does being guided during acquisition (for a review on guidance research in motor-related tasks, see Hodges & Campagnaro, 2012). The long-term learning of motor skills, but not necessarily short-term performance, also profits from a test (as opposed to a restudy opportunity) and when learners are permitted to generate their own to-be-remembered motor skills (as opposed to when the skills are chosen for them).


가이드의 효과에 대한 초기 연구는 참가자들이 나중에 그러한 동작을 스스로 수행하도록 요청받았을 때 물리적 지원을 제공하는 것이 긍정적인 영향을 미쳤으며, 이는 초기의 가이드는 학습에 이득을 준다는 것을 시사한다. 그러나, 이러한 연구에서 유지 간격은 특히 짧았고, 따라서 장기 학습에 대한 주장은 미약했다. 수십 년이 지난 후에야 지침의 장기적 영향을 검토하는 첫 번째 연구가 등장했다. 그러한 연구에서, 참가자들은 다른 사람에 의해 신체적으로 이끌리든 그렇지 않든 간에 조이스틱 추적 과제를 연습했다. 가이드가 있는 그룹은 훈련 중 및 초기 단기 성과 테스트에서 가이드가 없는 그룹을 능가했지만, 6주 후에 실시된 후기 보존 테스트에서는 가이드가 없는 그룹이 가이드가 없는 그룹보다 더 나은 학습을 보여주었다. 또한, 유도 그룹은 과제를 수행한 적이 없고 단순히 지켜본 참가자 그룹보다 더 잘 유지되는 것을 보여주지 못했다(Baker, 1968; 암스트롱, 1970 참조).

Early research on the effects of guidance (e.g., Melcher, 1934; Waters, 1930) showed that providing physical assistance during the acquisition of simple to-be-learned movements had positive effects when participants were subsequently asked to perform those movements on their own, suggesting that learning profits from initial guidance. However, the retention intervals in these studies were particularly short, and thus any claims of long-term learning were tenuous. It was not until decades later that the first studies to examine the long-term effects of guidance emerged. In one such study, participants practiced a joystick pursuit-tracking task while either being physically guided by another person or not. The guided group outperformed the unguided group during training and on initial short-term performance tests, but on a later retention test administered 6 weeks later, the unguided group demonstrated better learning than the guided group. Furthermore, the guided group failed to show better retention than a group of participants who had never performed the task but simply watched (Baker, 1968; see also Armstrong, 1970).

후속 연구는 가이드의 학습 및 성과 효과를 복제하고 확장했습니다. 예를 들어, 레버를 다양한 위치로 조작하는 작업과 관련하여, 물리적으로 유도된 그룹은 획득 중에 더 잘 수행했지만(즉, 성능 오류를 줄였다) 유지 간격 후에는 안내되지 않은 그룹에 비해 더 악화되었다(Winstein, Pohl, & Lewthwaite, 1994). 마찬가지로, 암 확장이 포함된 격월별 조정 작업 훈련 중 안내 연습은 성과 오류를 방지했다. 그러나 부분 지침이 제공되거나 지침이 제공되지 않은 조건에 비해 장기 학습이 덜 이루어졌다(Feijen, Hodges, & Beeek, 2010; Tsutsui & Imanaka, 2003 참조). 마지막으로, 하네스(harness)가 크리켓 스포츠와 관련된 볼링 기술을 적절히 수정하는 데 도움이 될 수 있는지 여부를 조사한 연구에서, 하네스(harness)가 적용된 제한은 단기적으로는 기술을 개선했지만, 하네스(harness)를 사용하지 않았을 때와 비교하여 어떠한 장기적 학습 이익도 창출하지 못한 것으로 밝혀졌다. 명백히, 훈련 중 가이드가 학습에 미치는 영향과 수행에 미치는 영향은 다를 수 있다.

Subsequent research has replicated and extended the learning and performance effects of guidance. For example, on a task that involved manipulating a lever to various positions, a physically guided group performed better during acquisition (i.e., made fewer performance errors) but worse after a retention interval, relative to an unguided group (Winstein, Pohl, & Lewthwaite, 1994). Likewise, during training of a bimanual coordination task that involved arm extensions, guided practice prevented performance errors; however, it also yielded less long-term learning compared with conditions in which partial guidance or no guidance was provided (Feijen, Hodges, & Beek, 2010; see also Tsutsui & Imanaka, 2003). Finally, in a study that examined whether a harness could serve as an aid to properly modify the bowling technique involved in the sport of cricket, it was found that the restriction applied by the harness improved techniques in the short term but failed to yield any long-term learning benefits, compared with when no harness was used (Wallis, Elliot, & Koh, 2002). Clearly, guidance during training can have differential effects on learning and performance.

[인출 연습]이 학습과 성과에 미치는 영향을 검토하는 또 다른 간단한 방법은 학습자가 먼저 학습한 기술을 관찰한 후 학습자를 테스트(즉, 스스로 기술을 복제하거나 검색하도록 요구함)하거나 재현할 필요 없이 기술을 다시 제시할 수 있도록 하는 것입니다. 그 후 시행된 테스트는 재표현 시험과 관련하여 검색 관행이 학습을 향상시키는지 여부를 밝혀낼 수 있다. 모터러닝 영역의 경험적 연구가 검색 관행의 잠재적인 이점을 더 잘 이해하기 위해 이러한 방법을 사용했다는 것은 놀라운 일이다. 주목할 만한 예외로, 한 연구는 팔 위치 결정 작업을 학습하는 데 인출 연습의 영향을 조사했다. 학습한 자세에 대한 초기 프레젠테이션 후, 참가자들은 그 위치에서 여러 번 테스트를 받았거나 테스트를 거치지 않고 반복적으로 재제시되었다. 인출 연습을 한 참가자는 단순히 여러 번 관찰한 참가자에 비해 팔 자세를 장기간 유지하는 것이 더 좋았다. 그러나 습득acquisition 과정에서 수행을 평가할 때는 그 반대였다(Hagman, 1983). 후속 모터 기술 연구는 이러한 유형의 [인출 연습이 제공하는 장기적 학습 이점]을 재현했다(즉, 테스트 대 재학습; Boutin et al., 2012; Boutin, Panzer, & Blandin, 2013).

Another, rather simple way to examine the effects of retrieval practice on learning and performance is to allow learners to first observe the to-be-learned skill and then either test the learners (i.e., require them to reproduce, or retrieve, the skill on their own) or present the skill again without the requirement to reproduce it. A subsequently administered test could then reveal whether retrieval practice, relative to re-presentation trials, enhances learning. It is surprising that scant empirical work in the motor-learning domain has used this sort of method to better understand the potential benefits of retrieval practice. Representing a notable exception, one study examined the effects of retrieval practice on learning an arm-positioning task. After an initial presentation of to-be-learned positions, participants either were tested on the positions several times or were simply re-presented with them over and over without being tested. Participants who engaged in retrieval practice showed better long-term retention of the arm positions than those who simply observed the positions multiple times. The opposite was true, however, when performance was assessed during acquisition (Hagman, 1983). Subsequent motor-skills research replicated the long-term learning benefits conferred by this type of retrieval practice (i.e., testing vs. restudying; Boutin et al., 2012; Boutin, Panzer, & Blandin, 2013).

마지막으로, 운동 기술의 학습은 다른 형태의 인출 연습으로부터 이익을 얻습니다. 즉, 학습자에게 동작을 선택해주기보다, [학습자가 자신의 동작을 생성할 수 있도록] 합니다. 이 사전 선택 효과에 대한 가장 초기적이고 가장 설득력 있는 시연 중 하나에서, 참가자들은 이전에 스스로 선택했거나 실험자가 부과한 빠른 팔 움직임을 재현했다. 획득 단계에서 그러한 장기 학습의 지표를 수집할 수 없음에도 불구하고, 신속성과 정밀도 측면에서 팔 움직임을 유지하는 것은 선택 그룹에 유리하다. (Stelmach, Kelso, Wallace, 1975) 사전 선택 효과는 모터 학습 문헌에서 가장 강력하고 신뢰할 수 있는 효과 중 하나로 빠르게 나타났다(Martenuik, 1973 참조, 조기 검토는 Kelso & Wallace, 1978 참조).

Finally, the learning of motor skills profits from another form of retrieval practice—namely, permitting learners to generate their own to-be-learned movements as opposed to the movements being selected for them. In one of the earliest and most convincing demonstrations of this preselection effect, participants reproduced rapid arm movements that were either previously selected by themselves or imposed by the experimenter. Retention of the arm movements—in terms of both rapidity and precision—favored the selection group, even though no indicators of such long-term learning could be gleaned from the acquisition phase (Stelmach, Kelso, & Wallace, 1975). The preselection effect quickly emerged as one of the most robust and reliable effects in the motor-learning literature (see also Martenuik, 1973; for an early review, see Kelso & Wallace, 1978).

 

구두 학습
Verbal learning

운동 학습 영역의 연구와 마찬가지로, 언어 자료의 인출 연습(또는 테스트)을 조사하는 경험적 작업은 수십 년 전으로 거슬러 올라가며, 그 중에서 기억에서 정보를 인출하는 것은 단순히 정보가 기억 속에 존재한다는 것을 드러내는 것 이상을 한다는 공감대가 형성되었다. 실제로 검색 행위는 성공적으로 검색된 정보를 미래에 더 기억하기 쉽게 만든다는 점에서 "기억 수정자memory modifier"(R. A. Bjork, 1975)이며, 광범위한 소재와 결과를 사용하여 수명 전체에 걸쳐 입증된 [테스트 효과]라고 불리는 발견이다. 측정(검토 내용은 Carpenter, 2012; Roediger & Butler, 2011; Roediger & Karpicke, 2006a 참조). 다시 말해, 인출 연습은 그 자체로 [강력한 학습 사건]입니다. 그러나 단기적으로, 인출 연습은 종종 테스트 대신 재료가 재처리되는 조건에 비해 기억의 이점을 제공하지 못하는 것으로 보인다. 우리는 이제 학습과 수행의 구별을 필요로 하는 언어 학습 영역의 인출 연습에 대한 작업을 고려합니다.

Similar to the research in the motor-learning domain, empirical work investigating retrieval practice (or testing) of verbal material dates back decades, out of which has emerged the consensus that retrieving information from memory does more than simply reveal that the information exists in memory. In fact, the act of retrieval is a “memory modifier” (R. A. Bjork, 1975) in the sense that it renders the successfully retrieved information more recallable in the future than it would have been otherwise, a finding that has been termed the testing effect, which has been demonstrated across the life span using a wide range of materials and outcome measures (for reviews, see Carpenter, 2012; Roediger & Butler, 2011; Roediger & Karpicke, 2006a). In other words, retrieval practice is itself a potent learning event. In the short term, however, retrieval practice often appears to fail to confer any mnemonic benefits compared with conditions in which the material is restudied instead of tested. We now consider work on retrieval practice in the verbal-learning domain that has necessitated the distinction between learning and performance.

테스트 효과에 대한 최초의 대규모 연구는 게이츠(1917년)와 스피처(1939년)로 거슬러 올라갈 수 있지만, 1970년대에 이르러서야 연구자들은 검색 연습이 학습과 성과에 차이를 가져올 수 있다는 설득력 있는 증거를 제공했다. 예를 들어, 한 연구에서 참가자들은 40개의 단일 단어를 세 번 공부한 후 SSST(자유 리콜 테스트)를 치르거나 세 번 프리 리콜 테스트(STT)를 치렀습니다. 두 그룹이 모두 테스트된 이 절차의 네 번째 단계에서 SST 조건에 할당된 참가자들은 STTT 조건의 참가자들보다 더 큰 단기 호출 성능을 보였다. 즉, 반복 연구가 반복 테스트보다 더 좋았다. 그러나 이틀 후 평가된 장기 리콜은 STTT 조건을 선호했다(Hogan & Kintsch, 1971). 이 연구결과는 나중에 반복 연구가 5분 후 반복 테스트보다 더 나은 리콜로 이어졌지만(50% 대 28%), 2일 후 실시된 지연 리콜 테스트에서 반복 테스트가 비록 미미하지만 반복 연구를 능가한다는 연구 결과에서 반복 테스트보다 더 잘 재현되고 확장되었다(25% 대 23%; Thompson, Wenger, & Bartling, 1978). 같은 해, 확장된 간격 테스트 스케줄은 동등한 간격 테스트 스케줄보다 학습된 이름을 더 잘 기억하는 것으로 확인되었지만, 이 두 조건 모두 주어진 프레젠테이션 직후에 여러 테스트를 연속적으로 시행하는 대량 테스트 조건보다 더 나은 장기 학습으로 이어졌다. 이름, 획득 단계에서 거의 오류 없는 성능을 보인 조건입니다(Landauer & Bjork, 1978).
Although the first large-scale studies on the testing effect can be traced back to Gates (1917) and Spitzer (1939), it was not until the 1970s that researchers provided compelling evidence that retrieval practice can have differential effects on learning and performance. In one study, for example, participants studied 40 single words either three times before taking a free-recall test (SSST) or once before taking three free-recall tests (STTT). During the fourth phase of this procedure in which both groups were tested, participants assigned to the SSST condition showed greater short-term recall performance than those in the STTT condition—in other words, repeated studying was better than repeated testing. Long-term recall assessed 2 days later, however, favored the STTT condition (Hogan & Kintsch, 1971). These findings were later replicated and extended in a study that found that repeated studying led to better recall than repeated testing after 5 min (50% vs. 28%) but that repeated testing trumped repeated studying, albeit only slightly, on a delayed recall test administered 2 days later (25% vs. 23%; Thompson, Wenger, & Bartling, 1978). That same year, expanded-interval testing schedules were found to produce better recall of to-be-learned names than equal-interval testing schedules, but both of these conditions led to better long-term learning than did a massed-testing condition, in which several tests were administered in succession immediately after the presentation of a given name, a condition that showed nearly errorless performance during the acquisition phase (Landauer & Bjork, 1978).

[인출 연습]과 관련하여 학습 성과 상호 작용에 대한 설득력 있는 데모를 제공한 다른 연구에서, 한 그룹의 참가자(반복 연구)는 40단어 목록을 5회 연속(SSSS) 학습한 반면, 다른 그룹(반복 테스트)은 4회 연속 리콜 테스트(STTT) 전에 목록을 한 번 학습했다. 최종 리콜 테스트는 5분 또는 1주일 후에 (각 그룹의) 다른 그룹의 참가자들에게 시행되었다. 반복 스터디 그룹은 즉시(5분) 테스트에서 반복 테스트 그룹을 큰 폭으로 앞섰지만, 지연된 (1주일) 테스트에서는 반대 패턴이 관찰되었다. 구체적으로는 반복 테스트가 반복 연구보다 더 나은 장기 보존으로 이어졌다. 또한 시간이 지남에 따라 잊어버리는 것이 반복 학습 그룹에서 반복 실험 그룹보다 훨씬 더 두드러졌기 때문에 시험이 기억을 안정시키는 데 도움이 된다는 것이 분명했다. 1주일 리콜을 5분 리콜의 백분율로 구체적으로 고려할 때, 반복 학습과 반복 테스트가 각각 약 75%, 30%의 망각과 관련이 있다는 것을 발견했다(Wheeler, Ewers, & Buonanno, 2003).

In another study that provided a convincing demonstration of a learning-performance interaction as it relates to retrieval practice, one group of participants (repeated study) studied a 40-word list five consecutive times (SSSSS), whereas another group (repeated test) studied the list once before four consecutive recall tests (STTTT). Final recall tests were then administered to different groups of participants (from each group) after 5 min or 1 week. The repeated-study group outperformed the repeated-test group by a large margin on the immediate (5 min) test, but on the delayed (1 week) test, the opposite pattern was observed—specifically, repeated testing led to better long-term retention than did repeated studying. It was also clear that testing helped stabilize memory, as forgetting over time was far more pronounced in the repeated-study group than the repeated-test group. When specifically considering 1-week recall as a percentage of 5-min recall, researchers found that repeated studying and repeated testing were associated with approximately 75% and 30% forgetting, respectively (Wheeler, Ewers, & Buonanno, 2003).

지금까지 우리는 비교적 단순한 학습 자료(예: 단일 단어, 단어 쌍)를 사용한 테스트 효과에 대한 연구를 검토했다. 그러나 교육적으로 관련된 자료를 더 많이 사용할 경우 검색 연습이 학습과 성과에 차이를 줄 수 있다는 것도 분명하다. 그러한 연구 중 하나는 참가자들이 태양과 해달과 같은 일반적인 주제를 다루는 산문 구절을 처음 연구하는 것이었다. 한 가지 조건에서는 참가자들이 전체 지문을 다시 공부한 반면, 다른 조건에서는 참가자들이 피드백 없이 연구된 자료를 기억하는 능력에 대해 테스트를 받았다. 그런 다음 5분, 2일 또는 1주일 후에 각 조건의 다른 참가자 그룹에 최종 리콜 테스트를 시행했다. 그림 4와 같이 결과는 명확합니다. 5분 후, 지문을 다시 공부한 참가자들은 피드백 없이 중재 시험을 치른 참가자들보다 기억력이 더 좋았다. 그러나 지연된 보존 테스트에서는 테스트 그룹이 restudy 그룹보다 2일 1주 후에 더 많은 자료를 인출하는 등 상당한 반전이 있었으며, 이 결과는 이후 연구의 두 번째 실험에서 복제되고 확장되었다(Roediger & Karpicke, 2006b). 이 연구(및 이와 유사한 다른 연구)의 결과가 특히 인상적인 것은 최초 테스트 중에 테스트 조건의 참가자에게 피드백이 제공되지 않았다는 것이다. 즉, 시험 조건의 참가자는 처음에 기억할 수 있는 소재(약 70%)에만 재노출되었다. 반면, restudy 상태의 참가자들은 최종 보존 테스트 전에 전체 통로에 다시 노출되었다. 이러한 단점에도 불구하고, 테스트 그룹의 참가자들은 장기적으로 더 많은 정보를 보유했다.

Thus far, we have reviewed studies on the testing effect that have used relatively simple learning materials (e.g., single words, word pairs); however, it is also clear that retrieval practice can have differential effects on learning and performance when more educationally relevant materials are used. One such study involved participants first studying prose passages covering general topics, such as the sun and sea otters. In one condition, participants then restudied the passage in its entirety, whereas in another condition, participants were tested, without feedback, for their ability to recall the studied material. Final recall tests were then administered to different groups of participants from each condition after 5 min, 2 days, or 1 week. The results, which are shown in Figure 4, are clear. After 5 min, participants who restudied the passage showed better recall performance than did participants who took an intervening test without feedback. On the delayed retention tests, however, there was a significant reversal such that the tested group recalled more of the material after 2 days and 1 week than the restudy group, a finding that was subsequently replicated and extended in the study’s second experiment (Roediger & Karpicke, 2006b). What makes the results of this study (and others like it) particularly impressive is that no feedback was given to participants in the tested condition during the initial test, which means that participants in the test condition were reexposed only to the material they were initially able to recall—approximately 70% of the passage—whereas participants in the restudy condition were reexposed to the entire passage before the final retention tests. Despite this disadvantage, participants in the tested group retained more information over the long term.

 

테스트 효과와 밀접하게 관련된 현상인 생성 효과generation effect에 대한 연구도 검색 관행의 장기적 학습 이점을 지적한다. 전형적인 생성 실험에서 참가자들은 학습해야 할 항목을 직접 생성하도록 요구받습니다. 예를 들어, 단어를 제시했을 때 반대되는 항목을 생성함으로써(예: hot-)--?)—또는 단순히 항목을 읽습니다(예: 긴-짧은). 그 후, 일반적으로 단서 제시(hot---)로 구성된 나중에 유지 시험이 시행된다.?, 긴----?) 및 참가자에게 대응하는 목표(콜드, 쇼트)를 상기하도록 요구합니다. Slamecka와 Graf(1978; Jacoby, 1978 참조)는 의미 기억에서 [항목을 생성하는 것]이 [단순히 읽는 것]보다 학습에 더 낫다는 것을 최초로 입증한 것으로 종종 인정된다. 이 발견은 다양한 재료, 절차 및 결과 측정을 사용하여 수백 번 반복되었다. 현재 목적에서는 참가자들이 학습 단계(거의 발생하지 않음)에서 모든 생성 항목을 성공적으로 생성할 수 없는 한 생성된 항목은 각 항목 직후에 테스트를 수행한 경우 항상 판독 항목보다 획득 성능이 떨어집니다. 이는 테스트 효과 연구에서 실패한 인출 시도와 마찬가지로, 생성 시도가 실패하면 나중에 테스트될 재료에 노출되지 않기 때문입니다. 이러한 단기적인 [수행] 측면의 장애에도 불구하고, 생성(연습)은 여전히 장기 [학습]을 강화한다.

Research on the generation effect, a closely related phenomenon to the testing effect, also points to the long-term learning benefits of retrieval practice (for important differences between the generation effect and the testing effect, see Karpicke & Zaromb, 2010). In a typical generation experiment, participants are asked to either generate the to-be-learned items themselves—for example, by producing opposites when presented with a word (e.g., hot–???)—or to simply read the items (e.g., long–short). A later retention test is then administered, which usually consists of presenting the cues (hot–???, long–???) and asking participants to recall their corresponding targets (cold, short). Slamecka and Graf (1978; see also Jacoby, 1978) are often credited as the first to demonstrate that generating items from semantic memory is better for learning than simply reading them, a finding that has been replicated hundreds of times using various materials, procedures, and outcome measures (for a review, see Bertsch, Pesta, Wiscott, & McDaniel, 2007). For current purposes, it is important to note that unless participants can successfully generate every to-be-generated item during the study phase (which almost never happens), generated items will always be associated with worse acquisition performance than read items if a test was given immediately after each item. This is because, similar to unsuccessful retrieval attempts in testing-effect studies, unsuccessful generation attempts prevent exposure to the material that will be tested later. Despite this short-term performance hindrance, generation still enhances long-term learning.

학습-수행의 차이를 지지하는 더욱 설득력 있는 증거는 습득 중에 부정확할 것이 확실시되는 생성 시도로부터 학습이 이익을 얻을 수 있다는 연구로부터 나온 것이다(Kane & Anderson, 1978; Slamecka & Fevreiski, 1983).다시 한번 경험적인 관심을 가질 수 있습니다.
Even more compelling evidence in favor of the learning–performance distinction comes from research that has revealed that learning can profit from generation attempts that are assured to be incorrect during acquisition, a phenomenon that was demonstrated some time ago (Kane & Anderson, 1978; Slamecka & Fevreiski, 1983) and is now garnering considerable empirical attention once again (Grimaldi & Karpicke, 2012; Hays, Kornell, & Bjork, 2013; Huelser & Metcalfe, 2012; Knight, Ball, Brewer, DeWitt, & Marsh, 2012; Kornell, Hays, & Bjork, 2009; Potts & Shanks, 2014; Yan, Yu, Garcia, & Bjork, 2014).

[실패한 생성의 잠재적 편익]에 대한 이러한 관심의 부활은 참가자들이 약하게 연관된 단어 쌍을 연구하는 패러다임을 사용한 연구에 의해 촉발되었다. 그 중 일부는 연구를 위해 온전하게(예: 고래-동물) 제시되는 반면, 다른 일부는 참가자들에게 그 자체로 큐를 기반으로(예: 고래---)를 요구한다.?) 먼저 예측해야 할 반응을 예측합니다. 결정적으로, 실험자들은 약하게 연관된 쌍을 재료로 선택함으로써 참가자들이 거의 항상 정확한 표적을 추측하지 못하게 할 수 있습니다. 즉, 고래를 제시하면 참가자들은 거의 항상 포유류가 아닌 다른 것(예: 큰 것, 바다, 파란색)을 생성하게 된다. 그럼에도 불구하고, 이 패러다임을 사용하는 여러 실험 설계에 걸쳐, 인코딩 전에 실패한 인출 시도가 학습을 향상시키는 것으로 밝혀졌다(Kornell 등, 2009). 이 효과에 대한 한 가지 가능한 설명은, 학습된 응답을 예측하려고 하면 큐 워드(단서 단어)와 관련된 광범위한 의미 네트워크가 활성화되고, 큐에 대한 응답을 쉽게 연관시킬 수 있다는 것입니다. 보다 일반적으로, 본 연구는 반직관적으로 보일 수 있지만, 일부 상황에서는 [습득 중 오류가 발생하면 실제로 장기 보존이 촉진될 수 있다]는 것을 보여줍니다.

This resurgence in interest in the potential benefits of failed generation was spurred by research using a paradigm in which participants study weakly related word pairs, some of which are presented intact (e.g., whale–mammal) for study, whereas the others require that the participants, on the basis of the cue by itself (e.g., whale–???), first try to predict the to-be-learned response. Critically, by choosing weakly related pairs as the materials, experimenters can ensure that participants almost always fail to guess the correct target. That is, when presented with whale, participants will almost always generate something other than mammal (e.g., big, ocean, blue). Nevertheless, across multiple experimental designs using this paradigm, failed retrieval attempts prior to encoding were found to enhance learning (Kornell et al., 2009). One possible explanation for this effect is that attempting to predict the to-be-learned response activates the broad semantic network associated with the cue word, which, in turn, may facilitate associating the response to the cue (Grimaldi & Karpicke, 2012; Hays et al., 2013; Huelser & Metcalfe, 2012; but see Potts & Shanks, 2014). More generally, this research indicates—as counterintuitive as it may seem—that the production of errors during acquisition can, under some circumstances, actually boost long-term retention.

요약
Summary

운동 및 구두 학습 영역의 증거는 [인출 연습]이 [학습]과 [수행]에 반대되는 영향을 미칠 수 있다는 것을 보여준다. 운동 학습 연구에 따르면 전반적으로 [신체적 가이드는 훈련 중 수행 오류를 감소시키지만, 가이드 없는 능동적 참여는 더 나은 장기 기술 유지를 촉진한다는 것]이 밝혀졌다. 마찬가지로, 언어 자료의 검색을 연습하는 것은 획득 중이나 즉각적인 기억 테스트에 도움이 되지 않는 것처럼 보일 수 있지만, 장기 기억을 보존하거나 안정시키는 데 상당한 이점을 제공합니다. 따라서 트레이너와 강사가 인출 연습을 커리큘럼에 포함시키고 학생들이 자신의 학습을 최적화하기 위한 수단으로 자신을 테스트하는 것은 신중해 보일 것이다.
Evidence from both the motor- and verbal-learning domains shows that retrieval practice can have opposing effects on learning and performance. Motor-learning studies have revealed that, on the whole, physical guidance often reduces performance errors during training but that unguided, active involvement promotes better long-term retention of skills. Likewise, practicing retrieval of verbal materials may appear unhelpful during acquisition and on immediate memory tests, but it provides substantial benefits in preserving or stabilizing long-term memory. It would seem prudent, therefore, that trainers and instructors incorporate retrieval practice into their curriculum and that students test themselves as a means to optimize their own learning.

 

메타인지
Metacognition

교육자와 학생은 어떤 활동이 오래 지속되는 학습에 도움이 되는지 어느 정도 알고 있습니까? 특히, 학습자가 자신의 자율 학습을 최적의 방법으로 관리하기 위해 알아야 할 것은 무엇인가? 이러한 중요한 질문은 [메타인지]와 관련이 있으며, 이는 넓게 해석하면 사고에 대해 생각하는 것을 의미한다(Nelson, 1996 참조). 학습과 기억의 영역에서, 구체적으로 다음을 나타낸다.

  • (a) 학습과 기억의 작동 방식에 대한 지식과 이해
  • (b) 자신의 지속적인 학습과 기억 또는 타인의 학습과 기억의 모니터링과 통제 사이의 상호작용

To what extent are educators and students aware of what activities are beneficial for long-lasting learning? In particular, what does a learner need to know to manage his or her own self-regulated learning in an optimal way? These important questions concern metacognition, which, broadly construed, refers to thinking about thinking (see Nelson, 1996). In the domain of learning and memory, it denotes more specifically

주관적 경험이 후속 행동을 결정하는 데 인과적 역할을 하기 때문에, 사람들이 자신의 학습에 대해 어떻게 생각하고 감시하는지를 설명하는 것이 가장 중요하다. (예를 들어, 어떤 자료를 재보존해야 하는지, 그리고 얼마 동안 재보존해야 하는지를 결정하는 것). 또한, 그래서 그러한 행동의 적절성은 [학습자의 주관적 경험의 의미와 타당성]에 따라 결정된다(Nelson & Narens, 1990 참조).

Elucidating how people think about and monitor their own learning is paramount because subjective experience plays a causal role in determining subsequent behavior (e.g., deciding what material should be restudied and for what duration), and thus the appropriateness of such behavior will necessarily depend on the meaning and validity of learners’ subjective experiences (see Nelson & Narens, 1990).

학습과 수행이 분리될 수 있다는 압도적인 경험적 증거에도 불구하고, [습득 중 성과]가 [장기 학습]의 [매우 불완전한 지표]라는 것은 교수자와 학습자 모두에게 이해하기 어려운 것으로 보인다. 그 결과 학습에 효과적인 것은 학습에 효과적이라고 생각하는 것에 대한 메타인지 평가와 종종 잘못 조정된다(리뷰는 R. A. Bjork, 1999 참조). 이러한 단절은 학습에 대한 학생들의 믿음 조사에서 명확히 입증되었다. 예를 들어, 한 연구에서는 경험적으로 지원되는 6가지 학습 전략에 대한 학부생의 인식을 조사했는데, 이 중 3가지(스페이스 대 매스, 테스트 대 리스터디, 생성 대 리딩)는 이 리뷰의 이전 섹션에서 논의했습니다. 압도적으로 학생들은 [단기 수행성과]를 향상시키는 것으로 알려진 전략을 가장 효과적이라고 지지했다. 이는 학생들이 집중 학습과 간격 학습 중 하나를 선택할 때 두드러지게 나타나는 패턴이다. 조사 대상 학생의 93.33%가 간격 학습보다 집중 학습에 더 효과적이라고 잘못 지지했다(J. McCa).be, 2011). 연구 관점에서 볼 때, 간격두기 효과는 지난 세기에 수백 번 입증되었으며 모든 기억 연구에서 가장 강력하고 신뢰할 수 있는 효과 중 하나로 부상했다는 점을 고려하면 이는 상당히 주목할 만한(그리고 놀라운) 것입니다. 다행히도, 이 같은 연구는 인지 과정이나 효과적인 학습 기법에 대한 표적 지도와 같은 교육 개입이 이러한 오해를 개선하는 데 도움이 된다는 사실도 밝혀냈다.

Although there is overwhelming empirical evidence that learning and performance are dissociable, there appears to be a lack of understanding on the part of instructors and learners alike that performance during acquisition is a highly imperfect index of long-term learning. As a consequence, what is effective for learning is often misaligned with our metacognitive assessments of what we think is effective for learning (for a review, see R. A. Bjork, 1999). This disconnect has been clearly demonstrated in surveys of students’ beliefs about learning. For example, one study investigated undergraduates’ awareness of six empirically supported learning strategies, three of which—spacing versus massing, testing versus restudying, and generating versus reading—we have discussed in earlier sections of this review. Overwhelmingly, students endorsed as most effective those strategies known to enhance short-term performance, a pattern that was strikingly evident when students were confronted with choosing between massed or spaced study: 93.33% of surveyed students incorrectly endorsed massed study as being more effective for learning than spaced study (J. McCabe, 2011). From a research perspective, this is quite remarkable (and alarming) considering that the spacing effect has been demonstrated hundreds of times in the past century and has emerged as one of the most robust and reliable effects in all of memory research. Fortunately, this same study also found that educational interventions—for example, a cognition course or targeted instruction on effective learning techniques—helped ameliorate these misconceptions.

다른 설문조사는 학생들이 어떻게 스스로 공부하는지 조사했다. 예를 들어, 대학생 472명을 대상으로 한 설문조사에서 대부분의 학생들이 재독서rereading 전략을 사용하여 보고한 것으로 나타났다. 또한, 90%의 학생이 자가 테스트를 사용한다고 보고했지만, 대부분의 학생은 자가 테스트가 직접적인 학습 이점을 제공한다고 믿기 보다는 지식의 차이를 식별하기 위해 그렇게 보고했습니다. 또, 64%의 학생이, 한번 습득했다고 느끼면, 그 자료를 재검토하지 않는다고 응답한 반면, 36%의 학생만이, 그 정보에 대해 재검증 또는 테스트한다고 응답했습니다(Kornell & Bjork, 2007년, 같은 결과에 대해서는, Hartwig & Dunlosky, 2012 참조). 또 다른 설문조사는 학생들이 재독서에 비해 검색 연습의 이점을 일반적으로 알지 못하는 것으로 나타났다. 자신의 학습 전략을 보고하고 순위를 매기도록 요구받았을 때, 84%의 학생이 재독서를 선택한 전략 중 하나로 꼽은 반면, 11%의 학생들만이 검색 연습을 전혀 사용하지 않는다고 보고했습니다(Karpicke, Butler, & Roediger, 2009). 학생들은 재독서가 학습의 지표로 잘못 해석되는 자료에 대한 높은 유창함이나 친숙함을 만들어 내기 때문에 재독서를 선호한다는 주장이 있었다. 다시 말해, 학생들은 재독서가 상대적으로 더 큰 성과로 이어지기 때문에 재독서를 선호하는 것처럼 보인다.

Other surveys have investigated how students study on their own. For example, a survey of 472 college students found that most students reported using a rereading strategy. Additionally, although 90% of students reported using self-testing, most them reported doing so in order to identify gaps in their knowledge, rather than because they believed that self-testing conferred a direct learning benefit. Moreover, 64% of students reported not revisiting material once they felt like they had mastered it, while only 36% of students reported that they would restudy or test themselves later on that information (Kornell & Bjork, 2007; for similar results, see Hartwig & Dunlosky, 2012). Another survey showed that students are generally unaware of the benefits of retrieval practice compared with rereading. When asked to report and rank their own study strategies, 84% of students ranked rereading as one of their strategies of choice, whereas only 11% of students reported using retrieval practice at all (Karpicke, Butler, & Roediger, 2009). It was argued that students prefer rereading because it produces a heightened sense of fluency or familiarity with the material, which students misinterpret as an index of learning. In other words, students seem to favor rereading because it leads to relatively greater perceived gains in performance.

능력에 대한 유사한 환상은 사람들이 자신의 학습을 모니터링하거나 평가할 수 있는 방법과 정도를 조사한 연구에서 입증되었다. 그러한 실험 연구는 후향적 판단retrospective judgments과 전향적 판단prospective judgments을 모두 사용해 왔다. 후향적 판단, 즉 과거의 경험을 평가해야 하는 학습의 주관적 평가와 관련하여, 사람들은 종종 상대적으로 비효율적인 학습 조건을 지지하는 잘못을 범한다. 예를 들어 영국 우체국 직원을 대상으로 한 Baddeley와 Longman의 연구(1978)에서는 데이터 입력(즉, 키 입력) 기술의 장기 보유를 위해 분산 연습이 매스하는 것보다 더 나았다. 그러나 분산 연습 그룹의 학습자는 자신이 몰아치기 연습 그룹에 비해서 실패했다고 느꼈기 때문에 상대적으로 훈련에 덜 만족한다고 보고했다. 사실 이는 획득 단계에서 사실이었다. 따라서 학습자들은 [단기 수행성과]를 [장기 학습]에 대한 신뢰할 수 있는 가이드로 해석하는 것으로 보인다.

Similar illusions of competence have been demonstrated in research that has examined how and to what degree of accuracy people can monitor or evaluate their own learning. Such experimental research has used both retrospective and prospective judgments. With respect to retrospective judgments—that is, subjective evaluations of learning that require the learner to assess some past experience—people often erroneously endorse relatively ineffective conditions of learning. In Baddeley and Longman’s (1978) study involving British postal workers, for example, distributing practice was better than massing it for the long-term retention of data entry (i.e., keystroke) skills; however, learners in the distributed-practice group reported being relatively less satisfied with their training because they felt they were falling behind the massed-practice group, which, in fact, was true during the acquisition phase. Thus, learners appear to interpret short-term performance as a reliable guide to long-term learning.


이러한 편향된 루향적 판단은 귀납적 학습 테스트 후에도 나타났다. 예를 들어, 한 연구에서 참가자들은 학습 일정에 따라 화가의 그림 스타일을 학습했습니다. 즉, 화가의 모든 그림은 새로운 화가의 그림으로 넘어가기 전에 연속적으로 제시되었습니다. 즉, 여러 화가의 그림이 함께 섞였습니다. 마지막 유도 테스트에서, 참가자들은 새로운 그림을 제시받았고 이전에 공부했던 화가들 중 누가 그 그림을 그렸는지 확인하도록 요구받았다. 이러한 테스트는 귀납적 학습의 테스트로 간주되는데, 이러한 테스트에서 성공하려면 일련의 예시로부터 화가의 일반적인 그림 스타일을 추출해야 하기 때문이다. 그 결과 귀납적 학습은 집중적인 학습 스케줄에 비해 간격이 있는 학습 스케줄에 의해 향상되는 것으로 나타났다. 그러나 흥미로운 점은 인덕션 테스트 후에 어떤 학습 일정이 학습에 도움이 되었는지를 물었을 때 압도적 다수의 참가자가 '몰아치기'를 지지한다는 것이다(Kornell & Bjork, 2008). 이 결과는 참가자들이 인터리빙을 통해 학습에 도움이 되는 테스트를 이미 경험했다는 점을 고려하면 더욱 주목할 만하다. 귀납적 학습에 대한 후속 연구는 학습자가 자신의 학습 일정을 선택할 수 있는 경우 매스매싱을 선호하는 것으로 나타났다(Tauber, Dunlosky, Rawson, Wahlheim, 2013). 따라서 몰아치기massing는 [학습]이라고 잘못 해석되는 [습득 수행 중의 유창함]을 만들어 낼 뿐만 아니라, 학습자들은 학습을 몰아치기massing하는 것이 효과적인 학습 방법이라는 잘못된 이론을 가지고 있는 것 같다.
Such biased retrospective judgments have also been shown after tests of inductive learning. In one study, for example, participants learned artists’ painting styles according to a study schedule that was either massed (blocked)—that is, every painting from an artist was presented successively before moving on to the paintings from a new artist—or spaced (interleaved)—that is, paintings from several artists were mixed together. On a final induction test, participants were presented with new paintings and were asked to identify which of the previously studied artists painted them. Such a test is considered a test of inductive learning because success on such a test requires one to have extracted the artists’ general painting styles from sets of exemplars. The results clearly showed that inductive learning was enhanced by the spaced study schedule compared with the massed schedule. It is interesting to note, however, that when asked after the induction test which study schedule helped them learn better, an overwhelming majority of participants endorsed massing (Kornell & Bjork, 2008). This finding is all the more remarkable given that participants had already experienced the test in which their learning profited from interleaving. Subsequent research on inductive learning has demonstrated that learners, when permitted to choose their own study schedule, also prefer massing (Tauber, Dunlosky, Rawson, Wahlheim, & Jacoby, 2013). Thus, not only does massing produce a sense of fluency during acquisition performance that is misinterpreted as learning, but learners also seem to hold the misguided theory that massing one’s study is an effective way to learn.

회고적 판단처럼, [전향적 메타인지 판단]도 단기 성과에 의해 큰 영향을 받을 수 있습니다. 현재 목적에서 가장 관련성이 높은 사전 판단은 그리고 현대 메타인지 연구에서 가장 경험적인 관심을 끄는 판단은 [학습의 판단judgment of learning (JOL)]이며, 일반적으로 획득 또는 인코딩 단계에서 요청된다. 여기서 학습자는 일부 정보가 나중에 기억될 가능성을 (보통 0%~100% 규모로) 예측해야 합니다. 즉, JOL은 학습자가 자신의 학습을 예측하는 것이다. 이러한 예측을 수집하면 학습자가 학습한 정보와 학습하지 않은 정보를 결정하는 방법과 이러한 예측이 이후의 테스트에서 실제 학습과 얼마나 잘 일치하는지를 조사할 수 있습니다. 언어 학습에 대한 일부 초기 연구는 JOL이 실제 학습을 비교적 잘 예측했다는 것을 보여주었지만, 이 영역의 보다 최근의 JOL 문헌은 [사람들의 즉각적인 JOL은 미래 학습에 대해 진단하지 않으며, 역량에 대한 놀라운 환상을 드러내고 JOL이 기억력이 아닌 단서에 기초하는, 본질적으로 추론적인 것]이라는 설득력 있는 증거를 드러낸다. 이제 학습자의 JOL이 학습에 대한 오해를 드러낸 몇 가지 예에 대해 논의합니다(자세한 내용은 Schwartz & Efklides, 2012 참조).

Prospective metacognitive judgments, like retrospective ones, can also be heavily influenced by short-term performance. For current purposes, the most relevant prospective judgment—and the one that garners the most empirical attention in contemporary metacognitive research—is the judgment of learning (JOL), which is typically solicited during an acquisition, or encoding, phase. Here, learners are asked to predict—usually on a 0%–100% scale—the likelihood that some information will be remembered later. In other words, JOLs involve learners predicting their own learning. Collecting such predictions permits an examination of how learners decide which information has been learned and which has not and how well those predictions correspond to actual learning on a later test. Although some early work on verbal learning showed that JOLs predicted actual learning relatively well (e.g., Arbuckle & Cuddy, 1969), the more recent JOL literature in this domain is rife with examples in which people’s immediate JOLs are not diagnostic of future learning (e.g., Benjamin, Bjork, & Schwartz, 1998; Castel, McCabe, & Roediger, 2007; Koriat & Bjork, 2005; Koriat, Bjork, Sheffer, & Bar, 2004; Mazzoni & Nelson, 1995; Rhodes & Castel, 2008; Roediger & Karpicke, 2006b; Soderstrom & McCabe, 2011; Yue, Castel, & Bjork, 2013), revealing striking illusions of competence and compelling evidence that JOLs are inferential in nature, based on cues rather than on memory strength (see Koriat, 1997). We now discuss several examples in which learners’ JOLs have exposed misconceptions about learning (for a more comprehensive review, see Schwartz & Efklides, 2012).

일반적으로, 학습자는 자신의 학습을 예측하는 데 과신하는 경향이 있으며, 안정성 편향stability bias이라고 불리는 것을 정기적으로 보여주는 경향이 있다. 이것은 검색된 정보(즉, 성과)의 현재 접근성이 시간에 걸쳐 안정되어 있을 것이라고 믿는 경향이 있다. 나중의 학습을 강화하다 안정성 편향의 특히 두드러진 예를 보여준 연구에서 참가자들은 관련 단어 쌍과 관련 없는 단어 쌍을 연구하여 각 항목 뒤에 JOL을 만들었다. 다른 그룹의 참가자들에게 즉시 테스트, 1일 후 테스트 또는 1주일 후 테스트를 통해 쌍을 얼마나 잘 기억하는지 예측하도록 요청했습니다. 그림 5에서 볼 수 있듯이, 참가자들은 보존 간격에 대한 명백한 무감각함을 나타내는 결과 패턴을 만들었습니다. 구체적으로는, 3개의 보존 간격에 걸쳐 동등한 JOL이 주어졌습니다. 그러나, 예상대로, 실제 리콜은 보존 간격의 함수로 감소하였다. 또한 그림 5에서는 JOL이 단어 쌍의 관련성에 매우 민감했기 때문에 저자들은 JOL의 유창성, 즉 연구 중에 정보가 얼마나 쉽게 처리되는지에 대한 결론을 내릴 수 있었습니다. 다른 매우 관련성이 높은 정보를 희생하더라도 JOL을 크게 촉진할 수 있습니다. 이 경우에는 보존 간격입니다.

Generally speaking, learners tend to be overconfident in predicting their own learning and regularly exhibit what has been termed the stability bias, which refers to the tendency to believe that current accessibility of retrieved information (i.e., performance) will remain stable across time, rather than appreciating those factors that may impair or enhance later learning (Kornell & Bjork, 2009; see also Ariel, Hines, & Hertzog, 2014; Kornell, 2011). In a study that demonstrated a particularly striking example of a stability bias, participants studied related and unrelated word pairs, making JOLs after each item. Separate groups of participants were asked to base their predictions on how well they would remember the pairs on an immediate test, a test after 1 day, or a test after 1 week. As illustrated in Figure 5, participants produced a pattern of results demonstrating apparent insensitivity to retention interval—specifically, equivalent JOLs were given across the three retention intervals. However, and as expected, actual recall decreased as a function of retention interval. Also evident in Figure 5 is that JOLs were highly sensitivity to the relatedness of the word pairs, which led the authors to conclude that encoding fluency, or how easily information is processed during study, can largely drive JOLs (Koriat et al., 2004; see also Begg, Duft, Lalonde, Melnick, & Sanvito, 1989; Koriat, 2008; Undorf & Erdfelder, 2011; for an alternative account, see Mueller, Tauber, & Dunlosky, 2013), even at the expense of other extremely relevant information—in this case, retention interval.

 

다른 연구에서는 [인코딩 유창성]과 같이 [인출 유창성retrieval fluency] (즉, 획득 단계에서 기억되는 정보가 얼마나 쉽게 검색되는지)이 JOL 크기에 영향을 미칠 수 있다는 추측을 뒷받침한다(예: Benjamin 등, 1998; Hertzog, Dunlosky, Robinson, & Kidder, 2003 참조). 이에 대한 한 시연에서, 참가자들은 비교적 쉬운 일반 지식 질문에 답했고, 그 후 항목별로 그들이 나중에 무료 호출 테스트에서 주어진 답을 기억해 낼 수 있을 가능성, 즉 그들이 쿼 없이 특정 답을 제시했을 가능성을 예측했다.스틱이 다시 제공되고 있습니다. 그 결과 생성에 가장 짧은 시간이 걸린 응답은 느리게 생성된 응답에 비해 더 높은 JOL이 주어졌습니다. 다시 말해, 참가자들은 단기적인 수행성능(이 경우, 검색 대기 시간)에 따라 JOL을 작성했습니다. 그러나 나중에 리콜을 실시한 결과 반대의 양상을 보였다. 생성에 더 오랜 시간이 걸린 답변은 생성된 답변보다 더 빠른 속도로 리콜되었다. 아마도 답변 생성에 관련된 노력이 후속 리콜과 긍정적으로 관련되어 있기 때문이다(Benjamin et al., 1998). 따라서 [인출 유창성]이 JOL 및나중의 리콜과 관련이 있지만, 이 관계의 방향은 주관적으로 평가(JOL을 통해)되거나 객관적으로 평가(최종 리콜을 통해)되었는지에 따라 달랐으며, 이는 무엇보다도 학습자는 [단기 수행성과에 대한 이득]에 빠져 있으며, 그러한 이득을 [장기 학습의 이득]과 그릇되게 혼동할 수 있음을 보여준다.

Other research supports the conjecture that retrieval fluency (i.e., how easily to-be-remembered information is retrieved during an acquisition phase), like encoding fluency, can also influence JOL magnitude (see, e.g., Benjamin et al., 1998; Hertzog, Dunlosky, Robinson, & Kidder, 2003). In one demonstration of this, participants answered relatively easy general-knowledge questions, after which time they predicted, on an item-by-item basis, the likelihood that they would be able to recall a given answer on a later free-recall test—that is, the likelihood they would be able to recall having given a particular answer without the question being provided again. The results indicated that answers that took the shortest time to generate were given higher JOLs compared with those answers that were generated slowly. In other words, participants based their JOLs on short-term performance—in this case, retrieval latency. Later recall, however, showed the opposite pattern: Answers that took a longer time to generate were recalled at a higher rate than were answers generated more quickly, presumably because the effort involved in generating an answer is positively related with its subsequent recall (Benjamin et al., 1998). Thus, while retrieval fluency was related to both JOLs and later recall, the direction of this relationship differed whether it was assessed subjectively (via JOLs) or objectively (via final recall), demonstrating, among other things, that learners are captured by gains in short-term performance and can mistakenly conflate such gains with long-term learning.

일반적으로, 학습자에게는 인출의 이득도 인식되지 않는다(예: Karpicke, 2009; Kornell & Son, 2009 참조). 앞에서 설명한 바와 같이 테스트 효과는 [인출 연습이 학습 이벤트로 작용하여, 인출된 정보를 (그렇지 않은 경우보다) 미래에 더 기억하기 쉽게 만든다는 것]을 의미한다(Roediger & Karpicke, 2006a 참조). 참가자들이 산문 구절을 연구한 후 해당 구절에 대한 테스트를 받았거나 다시 수행한 Roediger와 Karpicke(2006b) 연구에서, 장기 보존을 학습 단계로부터 1주일 후에 측정했을 때, [획득 시 테스트 기회의 함수]로 증가했다. 그러나 참가자들은 반대 패턴, 특히 1주일 후에, 시험 없이 여러 번 지문을 학습했을 때 가장 좋을 것이라고 예측했다. 이는 사실상 단기(5분 이후)적으로 확인되는 수행의 패턴이다. 학습자들은 (단기)수행성능을 향상시키는 것이 무엇이든 장기적인 유지에도 도움이 된다고 생각하는 것 같습니다.
The benefits of retrieval, more generally, are not appreciated by learners either (see, e.g., Karpicke, 2009; Kornell & Son, 2009). As discussed previously, the testing effect refers to the finding that retrieval practice acts as a learning event, rendering retrieved information more recallable in the future than it would have been otherwise (see Roediger & Karpicke, 2006a). In Roediger and Karpicke’s (2006b) study in which participants studied prose passages and then were either tested on those passages or restudied them, long-term retention, measured 1 week after the study phase, increased as a function of testing opportunities during acquisition. However, participants predicted the opposite pattern—specifically, that learning after 1 week would be best when the passages were studied multiple times without being tested, a pattern of performance that was, in fact, demonstrated in the short term (after 5 min). Again, learners seem to assume that whatever boosts performance will also profit long-term retention.

마지막으로, [간격 있는(분산된) 일정]에 비해 [집중된(블록된) 일정]으로 학습하거나 연습된 자료 및 기술에 더 높은 JOL이 부여된다. 한 가지 예에서 참가자들은 기억해야 할 단어 목록을 제공받았다. 목록 내에서 각 항목의 두 번째 반복은 첫 번째 프레젠테이션 직후(대량화) 또는 여러 다른 항목 뒤에(스페이스화) 발생하였다. 참가자들은 집적된 항목이 간격 있는 항목보다 더 잘 기억될 것이라고 예상했지만, 실제 리콜은 그 반대 패턴을 보였다(Zechmeister & Shaughnessy, 1980). 이후 간단한 키 입력 패턴 학습에서도 유사한 결과가 발견되었습니다. 분산된 연습이 키 입력 학습에서 상대적으로 더 큰 장기적 이익으로 이어졌음에도 불구하고, 참가자들은 단기 성능을 향상시킨 연습 블록이 지연 후에 더 나을 것이라고 예측했다(Simon & Bjork, 2001). JOL과 실제 학습의 불일치(사람의 JOL은 집단 연습을 선호하지만 실제 학습은 분산 연습을 통해 더 많은 이익을 얻는다는 점)는 피아노 선율을 학습하기 위해 재현되었습니다(Abushanab & Bishara, 2013). 
Finally, as is the case with retrospective judgments, higher JOLs are given to material or skills that are studied or practiced in a massed (blocked) schedule compared with a spaced (distributed) schedule. In one example, participants were presented with a list of to-be-remembered words. Within the list, a second repetition of each item occurred either immediately after its first presentation (massed) or following a number of other items (spaced). Participants predicted that the massed items would be better remembered than the spaced items, whereas actual recall showed the opposite pattern (Zechmeister & Shaughnessy, 1980). An analogous result was subsequently found for the learning of simple keystroke patterns: Despite the fact that distributed practice led to relatively greater long-term gains in learning the keystrokes, participants predicted that blocked practice—which did boost short-term performance—would be better after a delay (Simon & Bjork, 2001). This mismatch between JOLs and actual learning—that people’s JOLs favor massed practice, whereas actual learning profits more from distributed practice—has also been replicated for the learning of piano melodies (Abushanab & Bishara, 2013).

일반적으로 사람들은 어떤 활동이 장기 보존에 도움이 되는지 알지 못하고, 학습자가 자신의 지속적인 학습을 정확하게 모니터링하는 데 어려움을 겪는다는 점을 고려할 때, 자기조절학습을 최적화하기 위해 메타인지적 정교함을 촉진하는 방법을 식별하는 것이 중요하다(R. A. Bjork 등, 2013 참조). 예를 들어, 강사와 학생은 장기 학습을 촉진하는 학습 전략의 유형을 숙지해야 합니다(이 중 일부는 현재 리뷰에서 이미 논의한 내용입니다). 교사들이 그러한 전략의 사용을 장려하거나, 학생들이 그러한 전략을 채택 할 것으로 기대하기는 쉽지 않다. 또한 메타인지 연구는 학습자가 [정확한 예측]을 할 수 있고, 그 결과로 효과적인 관리자가 될 수 있도록, [사람들의 모니터링 능력을 향상시키는 방법]을 찾기 위해 노력해야 한다. 다행히도, 이 주제에 대한 연구의 수는 증가하고 있으며, 이러한 작업의 중요성을 고려할 때 우리가 바라는 추세는 계속된다.

Given that people are generally unaware of what activities are beneficial for long-term retention and that learners, by and large, have trouble accurately monitoring their own ongoing learning, it is important to identify ways to foster metacognitive sophistication in order to optimize self-regulated learning (see R. A. Bjork et al., 2013). Instructors and students, for example, need to become familiar with the types of learning strategies that promote long-term learning—some of which we have already discussed in the present review—before we can expect the use of such strategies to be encouraged by teachers or adopted by their pupils (for a review of the utility of various study strategies, see Dunlosky, Rawson, Marsh, Nathan, & Willingham, 2013). As well, research in metacognition should endeavor to find methods of improving people’s monitoring capabilities such that learners become accurate forecasters and, as a result, effective managers, of their own ongoing learning. Fortunately, the number of studies on this topic is mounting (e.g., Castel, 2008; DeWinstanley & Bjork, 2004; Koriat & Bjork, 2006; D. P. McCabe & Soderstrom, 2011; Nelson & Dunlosky, 1991; Soderstrom & Bjork, 2014; Soderstrom & Rhodes, 2014; Thiede & Anderson, 2003; Tullis, Finley, & Benjamin, 2013), a trend that we hope continues given the importance of such work.

 

요약
Summary

메타인식에 대한 조사와 실험 연구 모두 학습자들은 [단기 수행성과]를 [장기 학습]과 혼동하고, 표면적으로는 "지금 도움이 된다면 나중에 도움이 될 것이다."라고 생각한다는 것을 밝혀냈다. 학습에 대한 믿음에 대한 현존하는 조사 문헌은 대체로 학생들이 [단기적인 성과 향상을 가져올 수 있지만] [장기적인 학습을 촉진하지는 않는 전략]을 지지하고 사용한다는 것을 시사한다. 마찬가지로, 사람들이 자신의 진행 중인 학습을 어떻게 감시하는지를 조사한 연구는 소급적 판단과 전향적 판단 모두 종종 역량에 대한 두드러진 환상을 낳는 편견인 획득 요인에 의해 크게 영향을 받는다는 것을 밝혀냈다. 사람들은 그들의 주관적인 경험에 따라 행동하기 때문에, 효과적인 학습이 수반되는 것을 알고 배우는 방법을 배우는 것이 필수적이다. 그러한 메타인지적 정교함은 교육 초기에 길러지는 것도 중요하다.
Both survey and experimental research in metacognition have revealed that learners often mistakenly conflate short-term performance with long-term learning, ostensibly thinking, “If it’s helping me now, it will help me later.” The extant survey literature on beliefs about learning suggests that students, by and large, endorse and use strategies that may confer short-term performance gains but do not foster long-term learning. Likewise, research that has examined how people monitor their own ongoing learning has revealed that both retrospective and prospective judgments are heavily influenced by acquisition factors, a bias that often produces striking illusions of competence. Given that people act on their subjective experiences, it is imperative that people learn how to learn by becoming knowledgeable of what effective learning entails. It is important, too, that such metacognitive sophistication is fostered early on in one’s education.

 

현대 이론의 관점
Contemporary Theoretical Perspectives

앞서 논의한 바와 같이, 수십 년 전의 학습 이론가들(예: Estes, 1955a; Guthrie, 1952; Hull, 1943; Skinner, 1938; Tolman, 1932; Tulving & Pearlstone, 1966)은 학습과 수행성과를 구별하는 그들 자신의 이론에서 용어를 사용했다. 잠복학습, 과잉학습, 피로에 대한 초기 연구를 고려할 때, 이러한 구별은 필요했습니다. 운동 및 언어 학습 영역에서 보다 최근의 경험적 작업을 설명하기 위해, 현대 학습 이론가들은 또한 [장기 학습을 특징짓는, 행동과 지식의 비교적 영구적인 변화와 훈련] 또는 [획득 과정에서 발생하는 성과에 대한 일시적인 변동]을 구별한다. 이 검토의 이전 섹션에서 보고된 여러 경험적 발견 중 몇 가지에 대한 가능한 설명을 간략히 언급했지만, 이제 학습과 수행의 차이를 다루는 지배적인 현대 학습 이론에 대해 더 자세히 논의한다.
As discussed earlier, learning theorists from decades ago (e.g., Estes, 1955a; Guthrie, 1952; Hull, 1943; Skinner, 1938; Tolman, 1932; Tulving & Pearlstone, 1966) used terms in their own theories that distinguished between learning and performance. Given the early research on latent learning, overlearning, and fatigue, this distinction was necessary. To account for more recent empirical work in the motor- and verbal-learning domains, contemporary learning theorists also differentiate between the relatively permanent changes in behavior and knowledge that characterize long-term learning and the temporary fluctuations in performance that occur across the training or acquisition process. Although we briefly mentioned possible explanations of several of the various empirical findings reported in previous sections of this review, we now discuss in more detail the dominant contemporary learning theories that address the distinction between learning and performance.

R. A. 비요크와 비요크(1992)는 광범위한 기본적인 인간 학습 현상에 대한 설명을 공식화하기 위해 [저장 강도]와 [인출 강도]의 용어를 도입하여 새로운 불용 이론theory of disuse에서 학습-수행 차이를 부활시켰다.

  • [저장 강도]는 기억 표상(지식 및 절차)이 다른 기억 표상과 [통합되거나 확립되는 정도]를 의미하며,
  • [인출 강도]는 [현재의 정신적 및 환경적 단서]가 주어졌을 때, 현재 [기억 표상]에 대한 접근 또는 활성화가 얼마나 용이한지를 의미한다.

R. A. Bjork and Bjork (1992), in an attempt to formulate an account of a wide range of fundamental human learning phenomena, resurrected the learning–performance distinction in their new theory of disuse by introducing the terms storage strength and retrieval strength.

  • Storage strength refers to the degree to which memory representations (i.e., knowledge and procedures) are integrated or entrenched with other memory representations, whereas
  • retrieval strength represents the current ease of access or activation of those memory representations given current mental and environmental cues.

[현재 수행성능]은 관찰할 수 있으며, [인출 강도]에 따라 지수화됩니다. [장기 학습]은 [저장 강도]에 따라 색인화되며, 
이는 [학습 또는 실습 기회 동안 검색 강도의 이득을 향상]시키거나, [시간 및 개입 및 간섭 사건에 따른 인출 강도의 손실을 막음]으로써 [잠재 변수]로 작용한다.
또한 [인출 용량]과 달리 [저장 용량]은 무한하며 한 번 축적되면 손실되지 않는 것으로 간주됩니다. 기억의 [저장 강도]가 영구적이라는 후자의 가정은 Bjork와 Bjork의 새로운 불용 이론이 Thorndike의 본래 불용 법칙(1914)과 다른 점이다. Thorndike는 [기억]은 계속 사용하지 않으면 시간이 지남에 따라 기억은 부패하고 결국 완전히 사라질 수 있다고 주장했다.

Current performance, which can be observed, is indexed by retrieval strength, whereas long-term learning is indexed by storage strength, which acts as a latent variable by enhancing the gain of retrieval strength during opportunities for study or practice and impeding the loss of retrieval strength across time and intervening or interfering events. Furthermore, storage capacity, unlike retrieval capacity, is assumed to be limitless and, once accumulated, never lost. This latter assumption—that the storage strength of memories are permanent—distinguishes Bjork and Bjork’s new theory of disuse from Thorndike’s (1914) original law of disuse, which asserted that memories, without continued use, will decay over time and can eventually disappear entirely.

[새로운 불용 이론]에 따르면, [저장 강도]의 증가는 현재 [인출 강도]의 음의 가속 함수로 표현됩니다. 즉, 스터디 또는 테스트 이벤트가 발생할 때 메모리에 더 쉽게 액세스할 수 있는 표현이 많을수록 이러한 표현에 대한 [저장 강도]의 이득을 덜 얻을 수 있습니다.

  • 따라서 현재의 [인출 강도]를 높이는 조건은 [단기적으로는 성과에 도움]이 될 수 있지만, [장기 학습]을 특징짓는 [영구적 유형의 변화]를 생성하지는 못할 것이다.
  • 이와는 대조적으로 현재의 [인출 강도]를 감소시키는 상황(즉, 잊어버리는 것을 발생시키는 상황)은 예를 들어 학습 또는 연습 세션을 분산하고, 학습 조건을 변화시키며(일정성을 유지하는 것이 아니라), 인출 연습을 장려하는(재학습에 비해) 것은 [저장 강도]에서 상대적으로 더 큰 이득을 가져오고, 장기 보존 및 전이가 강화됩니다.

According to the new theory of disuse, gains in storage strength are expressed as a negatively accelerated function of current retrieval strength—that is, the more accessible representations are in memory when study or test events occur, the less gains in storage strength can be achieved for those representations.

  • Consequently, conditions that increase current retrieval strength might benefit performance in the short term but will fail to produce the type of permanent changes that characterize long-term learning.
  • In contrast, situations that reduce current retrieval strength (i.e., produce forgetting)—for example, distributing study or practice sessions (as opposed to massing them), varying the conditions of learning (as opposed to keeping them constant), and encouraging retrieval practice (as opposed to restudy)—yield relatively greater gains in storage strength and thus lead to enhanced long-term retention and transfer.

R. A. Bjork(2011)가 주장한 바와 같이, 이러한 [인출 강도]와 [저장 강도]의 상호작용(즉, 망각으로 학습이 촉진될 수 있음)은 적응적이면서도 반직관적이며 치료 및 훈련에 광범위한 영향을 미칩니다(R. A. Bjork & Bjork, 2006; Lang, Craske, & Bjork, 1999 참조).

As argued by R. A. Bjork (2011), this interplay between retrieval strength and storage strength—namely, that forgetting can foster learning—is adaptive, yet counterintuitive, and has broad implications for treatment (see R. A. Bjork & Bjork, 2006; Lang, Craske, & Bjork, 1999) as well as training.

공식적 모델의 관점에서, [새로운 불용 이론]은 [맥락적-변동성 모델]과 많은 속성을 공유한다(예: Estes, 1955a, 1955b에 의해 제안된 영향력 있는 [자극-변동 모델]로 거슬러 올라가는 Mensink & Raaijmakers, 1988 참조). 기본적인 생각은 수행-학습 유기체는 시간과 사건이 진행되면서 외부 및 내부 환경의 다른 측면이 "표본화"됨에 따라 점진적으로 변화하거나 변동하는 현재의 단서에 의해 크게 영향을 받는다는 것이다. 예를 들어, 대량 실행에서와 같이 신호가 변화하지 않거나 천천히 변화할 경우 성능은 빠르게 향상되지만, 유지 간격에 따라 신호가 변화함에 따라 망각도 빨라집니다. 획득 시험 전반에 걸쳐 맥락 변동이 도입되거나 자발적으로 발생함에 따라, 성능은 더 느리게 개선될 것이지만, 지연 후 또는 변경된 컨텍스트에서 측정되는 것처럼 학습이 향상되는 학습 응답과 더 많은 총 단서가 관련될 것이다. 기본적으로 Estes의 초기 언어를 차용하자면, 응답 강도response strength (성과)는 일부 목표 응답이 현재 단서에 얼마나 관련되어 있는지에 따라 지수화되는 반면, 습관 강도habit strength (학습)는 일부 목표 응답이 일부 과제와 상황을 특징짓는 전체 단서의 범위에 얼마나 관련되어 있는지에 따라 지수화된다.

From a formal-modeling standpoint, the new theory of disuse shares a number of properties with contextual-fluctuation models (see, e.g., Mensink & Raaijmakers, 1988, whose model traces back to the influential stimulus-fluctuation model proposed by Estes, 1955a, 1955b). The basic idea is that the performing–learning organism is heavily influenced by current cues, which gradually change or fluctuate as time and events go on and different aspects of the external and internal environments are “sampled.” When cues are not changing, or are changing slowly, as in massed practice, for example, performance will increase rapidly, but forgetting will be rapid as well, as cues change across a retention interval. As contextual variation across acquisition trials either is introduced or occurs spontaneously, performance will improve more slowly, but more total cues will become associated with to-be-learned responses, which will enhance learning, as measured after a delay or in an altered context. Basically, to borrow Estes’s initial language, response strength (performance) is indexed by how associated some target response is to the current cues, whereas habit strength (learning) is indexed by how much some target response is associated to the whole range of cues that characterize some task and situation.

특히 운동기술 문헌에서 [운동제어 스키마 이론]과 [다시 불러오기reloading 가설]은 각각 [변화주기 연습 및 분산 연습]에 의해 생성된 학습 및 성과 효과에 대한 설명을 제공한다. 원래 슈미트(1975)에 의해 가정된 [운동 제어 스키마 이론]은 변화주기 연습(즉, 목표 기술과 관련이 있지만 조금은 다른 기술을 반복 연습하는 것을 의미함)이 [한 기술의 기초가 되는 일반적 모터 프로그램 또는 스키마]에 영향을 미치기 때문에 장기 학습을 촉진한다고 주장한다(슈미트, 2003 참조). 이 개념을 구체화하기 위해 개별 운동 기술(예: 농구 슈팅, 테니스 공 서브, 골프 클럽 스윙)은 타이밍, 속도 및 힘과 같은 고유한 파라미터와 관련된 단순한 동작 클래스의 조정과 구현을 수반한다는 점을 고려한다. 주어진 기술을 실행하는 데 필요한 움직임의 파라미터를 성공적으로 재구성하기 위해, 학습자는 한 움직임 클래스를 지배하는 다양한 규칙이 다른 관련 움직임 클래스를 지배하는 규칙과 어떻게 관련이 있는지 그리고 그러한 상호의존성이 결과에 어떻게 영향을 미치는지 이해할 필요가 있다. 스키마 이론에 따르면, 이것을 하는 효과적인 방법은 연습된 기술의 변화를 증가시켜 원하는 목표를 달성하기 위해 필요한 움직임 매개변수를 조정하는 방법을 배우는 것이다. 본 리뷰에서 이미 논의한 바와 같이, [연습 시의 변화주기]는 취득 시에 고정 연습 조건보다 더 많은 오류를 유발할 수 있는 가능성을 가지면서도, 장기 보유 및 이전에서 상당한 이득을 가져오는 경우가 많다.

In the motor skills literature, specifically, the schema theory of motor control and the reloading hypothesis offer highly cited explanations for the learning and performance effects produced by variable and distributed practice, respectively. Originally postulated by Schmidt (1975), the schema theory of motor control claims that variable practice—that is, practicing iterations of a skill that are related to but different from the target skill—fosters long-term learning because it sensitizes one to the general motor program, or schema, underlying a skill (see also Schmidt, 2003). To flesh out this notion, consider that discrete motor skills (e.g., shooting a basketball, serving a tennis ball, swinging a golf club) involve the coordination and implementation of classes of simpler movements, each associated with unique parameters, such as its timing, speed, and force. In order to successfully reconstruct the parameters of the movements required to execute a given skill, learners need to become familiar with how the various rules that govern one class of movements are related to the rules that govern the other relevant classes of movements and how such interdependencies affect outcomes. An effective way of doing this, according to schema theory, is to increase the variation of the practiced skill such that one is required to learn how to adjust the necessary movement parameters to achieve desired goals. As we have already discussed in this review, practice variability, while having the potential to induce more errors during acquisition compared with fixed practice conditions, often leads to substantial gains in long-term retention and transfer.

[분산 연습]과 관련된 학습 이익 측면에서, [다시 불러오기reloading 가설]은 연습 세션을 시간 또는 다른 활동으로 공백으로 두는 것이 학습된 기술을 실행하는 데 필요한 모터 프로그램의 "새로고침" 또는 재생을 장려한다고 주장한다(Lee & Magill, 1983, 1985). 이는 연습 세션 사이에 삽입된 간격이 관련 모터 명령에 일시적으로 액세스할 수 없게 되기 때문입니다. [분산 연습] 중에 [명령어를 새로고침하기 위해 요구되는 어려운 처리]는 스킬이 반복적으로 수행되는 [블록된(대량) 연습]에 비해 학습을 용이하게 하지만, [단기적인 수행을 저해]하는 것으로 보인다. 

In terms of the learning benefits associated with distributed practice, the reloading hypothesis asserts that spacing out practice sessions with time or other activities encourages the “reloading,” or reproducing, of the motor programs needed to execute to-be-learned skills (Lee & Magill, 1983, 1985). This is because the spacing inserted between practice sessions results in a temporary loss of access to the relevant motor commands. The effortful processing required to reload the commands during distributed practice appears to facilitate learning but impede short-term performance, compared with blocked (massed) practice in which skills are performed over and over again.

마지막으로, 성과를 해칠 수 있는 것이 학습에 도움이 될 수 있다는 일반적인 생각은 [바람직한 어려움 프레임워크]에 담겨 있다(R. A. Bjork, 1994; E. L. Bjork & Bjork, 2011; R. A. Bjork, 2013 참조). 분산 연습, 가변 연습, 인출 연습와 같은 조작은 상대 조건에 비해 뛰어난 [장기 보존 및 전이]를 지원하므로 "바람직하다desireable"고 할 수 있습니다. 그러나 이러한 효과적인 학습 조작은 습득이나 훈련 중에 성과를 저하시킬 수 있고, 결과적으로 (강사와 학생 모두에게) 효과적이지 못한 것으로 해석될 수 있다는 점에서 "어렵다difficult"고도 할 수 있다. 비직관적으로 보일지 모르지만, 습득하는 동안 어려움에 직면하고 해결함으로써 생겨난 [능동적 인지 과정]은, [기억 속에 이미 존재하는 지식]과 [새로운 정보]를 효과적으로 연결하거나 정착시키는 역할을 한다

Last, the general idea that what can hurt performance can help learning is captured in the desirable difficulties framework (R. A. Bjork, 1994; see also, E. L. Bjork & Bjork, 2011; R. A. Bjork, 2013). Manipulations such as distributed practice, variable practice, and retrieval practice are “desirable” because they support better long-term retention and transfer compared with their counterpart conditions. Such effective learning manipulations are also “difficult,” however, in the sense that they can degrade performance during acquisition or training and, consequently, are likely to be interpreted as ineffective by instructors and students alike. As unintuitive as it may seem, the active cognitive processes engendered by confronting and resolving difficulties during acquisition serves to effectively link or entrench new information with knowledge that already exists in memory.

또한 이러한 활성 프로세스는 장기 보유에 대한 추후 평가에서도 채용될 가능성이 높기 때문에, [바람직한 어려움]의 개념은 일반적으로 [전이-적합 처리 원칙] 및 이와 관련된 [부호화 특수성 원칙]과 일치한다. 이 두 가지는 모두 기억력이 향상될 것이라고 주장하는데, 즉, 관련된 연구와 테스트 과정이 겹칠 정도이다. 그러나 학습자가 어려움을 극복할 수 없는 경우(예: 이전에 접한 정보를 검색 연습 중에 성공적으로 검색할 수 없는 경우) 바람직하지 않게 된다는 점에 유의해야 합니다. 따라서 연구자들에게 있어 지속적인 과제는 학습에 어려움이 바람직한 시기와 바람직하지 않은 시점을 식별하여 강사의 교육 관행과 학생들의 학습 행동을 적절히 알리는 것이었다.

Furthermore, given that these active processes are also likely recruited during later assessments of long-term retention, the notion of desirable difficulties generally accords with the principle of transfer-appropriate processing (Morris, Bransford, & Franks, 1977) and the related encoding specificity principle (Tulving & Thomson, 1973), both of which contend that memory will improve to the extent that the engaged study and test processes overlap. It is important to note, however, that when the difficulties cannot be overcome by the learner—for example, when previously encountered information cannot be successfully retrieved during retrieval practice—they become undesirable (see McDaniel & Butler, 2010). Thus, an ongoing challenge for researchers has been to identify when difficulties are desirable for learning and when they are not, so as to appropriately inform the instructional practices of instructors and the study behaviors of students.

 

요약
Summary

현재의 몇 가지 이론적 관점은 [단기 수행성과]와 [장기 학습]의 중요한 차이를 만든다. 새로운 불용 이론에 따르면, [학습과 수행성과]에 대한 분리 가능한dissociable 효과는, [저장 강도(새로운 지식과 이전 지식이 통합되는 정도)][검색 강도(어떤 정보 접근이 상대적으로 쉬운지)] 사이의 적응적 상호작용의 결과로 발생합니다.

  • [운동 제어의 스키마 이론]은 [변동 연습]이 학습자에게 [운동 기술의 기초가 되는 일반적인 운동 프로그램을 숙지]시킴으로써 장기 보존과 전이를 촉진한다고 주장한다.
  • [다시 불러오기 가설]은 [분산 연습]이 학습자가 습득 중에 [학습한 운동 기술을 재로드하거나 재생산하도록 장려]한다고 주장한다. 이는 획득 도중에는 학습하지 않은 것처럼 보일지라도, [잠재적인 학습 사건]이다.
  • [바람직한 어려움 프레임워크]는 획득 또는 훈련 중에 (객관적으로나 주관적으로나) 어려울 것으로 보이는 조작이 [능동적 부호화 프로세스]를 발생시키기 때문에 장기 보존 및 전이를 위해 바람직할 수 있다고 제안합니다.

Several current theoretical perspectives make the crucial distinction between short-term performance and long-term learning. According to the new theory of disuse, dissociable effects of learning and performance arise as a result of the adaptive interplay between storage strength—the extent to which new and prior knowledge is integrated—and retrieval strength—the relative ease with which information can be accessed.

  • The schema theory of motor control claims that variable practice promotes long-term retention and transfer by familiarizing learners with the general motor programs that underlie motor skills.
  • Likewise, the reloading hypothesis asserts that distributed practice encourages learners to reload or reproduce the to-be-learned motor skills during acquisition, which is a potent learning event, despite appearing not to be during acquisition.
  • Finally, the desirable difficulties framework proposes that manipulations that appear to be difficult—both objectively and subjectively—during acquisition or training can be desirable for long-term retention and transfer because they engender active encoding processes.

 

결론
Concluding Comments


우리는 학습 간의 중요한 차이를 필요로 하는 압도적 경험적 증거에 대한 첫 번째 통합 리뷰를 제공했다.

  • [학습]은 장기 보존 및 전이를 지원하는 행동 또는 지식의 상대적 영구적 변화이며,
  • [수행]은 트레이닝이나 교습instruction 중간 또는 직후에 관찰되거나 측정되는 행동 또는 지식의 일시적 변동이다.링 .

We have provided the first integrative review of the overwhelming empirical evidence that necessitates the critical distinction between

  • learning—the relatively permanent changes in behavior or knowledge that support long-term retention and transfer—and
  • performance—the temporary fluctuations in behavior or knowledge that are observed and measured during training or instruction or immediately thereafter.

 

▶[거의 한 세기 전으로 거슬러 올라가서, 잠재 학습, 오버러닝 및 피로에 대한 초기 연구]는 [눈에 띄는 수행의 변화가 없을 때에도 실질적인 학습이 발생할 수 있다는 것]을 보여줌으로써 학습-수행 구분에 대한 첫 번째 통찰력을 제공했습니다. 인간과 비인간 동물 모두와 함께 수행된 이 연구는 그 당시 학습 이론가들을 그들의 학습 이론과 기억 이론에서 상응하는 개념적 차이를 만들었다.

[모터 스킬과 언어 학습 문헌에 대한 보다 최근의 연구]는 그 반대의 경우도 사실임을 입증했다. 특히 단기 성과에 변화가 종종 장기 학습과 아무런 관련이 없다는 것이다. 실제로 분산 프랙티스, 가변 프랙티스 및 검색 프랙티스에 대한 다양한 연구 결과에 따르면 학습과 성과는 상충될 수 있으며, 따라서 획득 성능을 저하시키는 것으로 보이는 조건이 가장 지속적이고 유연한 학습을 제공하는 바로 그 조건인 경우가 많습니다.

마지막으로, [메타인지 연구]는 [습득 중 일시적인 이득]은 지도자와 학생들을 속여서, 영구적인 학습이 이루어졌다고 생각하게 하고, 능력에 대한 강력한 환상을 만들어 낼 수 있다는 것을 암시한다.

Dating back nearly a century ago, early research on latent learning, overlearning, and fatigue provided the first insights into the learning–performance distinction by showing that substantial learning could occur in the absence of any discernible changes in performance. This work—conducted with both humans and nonhuman animals—compelled learning theorists at that time to make corresponding conceptual distinctions in their own theories of learning and memory.

More recent research in the motor-skills and verbal-learning literatures have demonstrated the converse to also be true—specifically, that changes in short-term performance often bear no relationship to long-term learning. In fact, the results of various studies on distributed practice, variable practice, and retrieval practice suggest that learning and performance can be at odds, such that conditions that appear to degrade acquisition performance are often the very conditions that yield the most durable and flexible learning.

Finally, research in metacognition suggests that fleeting gains during acquisition are likely to fool instructors and students into thinking that permanent learning has taken place, creating powerful illusions of competence.

학습과 성과는 분리될 수 없다는 것은 이론, 연구, 그리고 실천에 광범위한 영향을 미칩니다. 학습과 기억의 현재(또는 미래) 포괄적인 이론은 [장기적인 학습과 전달을 특징짓는 행동과 지식의 비교적 영구적인 변화]와 [그러한 행동과 지식의 습득 중에 발생하는 수행의 순간적인 변화]를 어떤 식으로든 구별할 필요가 있다. 마찬가지로, 학습을 최적화하는 요소를 설명하는 데 관심이 있는 연구원들은 주어진 변수를 조작하는 효과가 보존 간격과 매우 잘 상호작용할 수 있다는 가능성을 인지해야 한다. 즉, 변수variable는 학습과 성과에 차등적인 영향을 미칠 수 있다. 따라서 실험자는 연구에 단기 및 장기 측정값을 모두 포함할 것을 권장합니다.
That learning and performance are dissociable has widespread implications for theory, research, and practice. Any present (or future) comprehensive theory of learning and memory needs to distinguish, in some way, between the relatively permanent changes in behavior and knowledge that characterize long-term learning and transfer and the momentary changes in performance that occur during the acquisition of such behavior and knowledge. Likewise, researchers interested in elucidating factors that optimize learning should be cognizant of the possibility that the effects of manipulating a given variable might very well interact with retention interval—in other words, the variable might have differential influences on learning and performance. As such, we recommend that experimenters include both short- and long-term measures in their studies.

마지막으로 강의실에서든 현장에서든 지도instruction와 연습의 목표는 [학습을 촉진하는 것]이어야 하기 때문에, 강사와 학생은 [학습과 수행의 차이]를 이해하고, 현재의 수행 습득acquisition performance를 촉진한다고 해서 반드시 미래에 명확해질 유형의 학습이 이뤄지는 것은 아님을 이해할 필요가 있다. 오히려, 교육 중에 더 느려지거나 더 많은 오류를 유발하는 조건은 종종 더 나은 장기적 학습 성과로 이어지기 때문에, 강사와 학생들은 아무리 그렇게 하고 싶지 않더라도, 자신의 교육 및 학습 전략에 대해 가장 저항이 적은 길을 포기하는 것을 고려해야 한다. 결국, 교육 개입은 과거에 사용된 방식이나 직관이 아니라, 증거에 근거해야 한다.

Finally, given that the goal of instruction and practice—whether in the classroom or on the field—should be to facilitate learning, instructors and students need to appreciate the distinction between learning and performance and understand that expediting acquisition performance today does not necessarily translate into the type of learning that will be evident tomorrow. On the contrary, conditions that slow or induce more errors during instruction often lead to better long-term learning outcomes, and thus instructors and students, however disinclined to do so, should consider abandoning the path of least resistance with respect to their own teaching and study strategies. After all, educational interventions should be based on evidence, not on historical use or intuition.

 


Perspect Psychol Sci. 2015 Mar;10(2):176-99.

 doi: 10.1177/1745691615569000.

Learning versus performance: an integrative review

Affiliations collapse

 

Affiliations

1Department of Psychology, University of California, Los Angeles nsoderstrom@psych.ucla.edu.

2Department of Psychology, University of California, Los Angeles.

PMID: 25910388

DOI: 10.1177/1745691615569000

 

Abstract

The primary goal of instruction should be to facilitate long-term learning-that is, to create relatively permanent changes in comprehension, understanding, and skills of the types that will support long-term retention and transfer. During the instruction or training process, however, what we can observe and measure is performance, which is often an unreliable index of whether the relatively long-term changes that constitute learning have taken place. The time-honored distinction between learning and performance dates back decades, spurred by early animal and motor-skills research that revealed that learning can occur even when no discernible changes in performance are observed. More recently, the converse has also been shown-specifically, that improvements in performance can fail to yield significant learning-and, in fact, that certain manipulations can have opposite effects on learning and performance. We review the extant literature in the motor- and verbal-learning domains that necessitates the distinction between learning and performance. In addition, we examine research in metacognition that suggests that people often mistakenly interpret their performance during acquisition as a reliable guide to long-term learning. These and other considerations suggest that the learning-performance distinction is critical and has vast practical and theoretical implications.

Keywords: instruction; learning; memory; motor learning; performance; training; verbal learning.

친절한 학습환경과 고약한 학습환경의 두 가지 세팅(Current Directions in Psychological Science, 2015)
The Two Settings of Kind and Wicked Learning Environments
Robin M. Hogarth1, Tomás Lejarraga2, and Emre Soyer3

 

의학 작가 루이스 토마스는 장티푸스를 초기에 정확하게 진단한 것으로 명성을 얻은 뉴욕의 한 병원 의사의 이야기를 20세기 초로 거슬러 올라간다. 의사는 혀의 생김새가 매우 진단적이라고 믿었다. 따라서 그의 임상 기술은 비관적인 예측을 하기 전에 환자의 혀를 촉진하는 것을 포함했다. 불행하게도, 그는 변함없이 옳았다. 하지만, 토마스가 말했듯이, "그는 티푸스 메리보다 손만 사용하여 더 효과적인 보균자였다." (토마스, 1983, 페이지 22)

Medical author Lewis Thomas recounted a story, dating from the early 20th century, of a physician in a New York hospital who acquired a reputation for accurately diagnosing typhoid fever in its early stages. The physician believed that the appearance of the tongue was highly diagnostic. Hence, his clinical technique included palpating patients’ tongues before making his pessimistic forecasts. Unfortunately, he was invariably correct. But, as Thomas stated, “He was a more effective carrier, using only his hands, than Typhoid Mary” (Thomas, 1983, p. 22).

Hogarth(2001)는 [고약한 학습 환경]의 개념을 도입하는 데 이 예를 사용했다. 그는 이러한 상황을 [행동이나 관찰의 결과 형태의 피드백이 빈약poor하거나, 오해의 소지가 있거나, 심지어 누락되는 상황]이라고 설명했다. 이와는 대조적으로 [친절한 학습 환경]에서 [피드백은 결과를 적절한 행동이나 판단과 직접 연결하며 정확하고 풍부]합니다. 사람들의 직관이 언제 정확할지를 결정할 때, 이 프레임워크는 학습이 이루어진 조건의 중요성을 강조한다. [친절한 학습 환경]은 정확한 직관적 판단을 위한 필수 조건이지만, [고약한 학습 환경]에서 획득한 직관은 잘못될 수 있습니다.

Hogarth (2001) used this example in introducing the concept of wicked learning environments. He described these as situations in which feedback in the form of outcomes of actions or observations is poor, misleading, or even missing. In contrast, in kind learning environments, feedback links outcomes directly to the appropriate actions or judgments and is both accurate and plentiful. In determining when people’s intuitions are likely to be accurate, this framework emphasizes the importance of the conditions under which learning has taken place. Kind learning environments are a necessary condition for accurate intuitive judgments, whereas intuitions acquired in wicked environments are likely to be mistaken.

이 기사의 목표는 이 차이를 자세히 설명하고 학습 환경의 유형을 보다 완벽하게 분류하는 것입니다. 그렇게 함으로써, 우리는 인간을 주로 이용 가능한 정보를 반영하는 순진한 직관적인 통계학자로 모델화할 수 있다는 견해를 채택한다(Fiedler & Juslin, 2006). (또한 Kaneman의 "당신이 보는 것이 거기 있는 전부이다" 은유도 참조). 따라서, 학습 환경의 특성에 대한 세심한 관심은 교정 절차를 제안할 뿐만 아니라 판단 편견의 원천을 식별하는 데 중요하다.

Our goal in this article is to elaborate on this distinction and to provide a more complete classification of types of learning environments. In doing so, we adopt the view that humans can be modeled as naive intuitive statisticians (Fiedler & Juslin, 2006) whose judgments mainly reflect the information available to them (see also the “what you see is all there is” metaphor of Kahneman, 2011). Thus, careful attention to the characteristics of learning environments is important for identifying sources of judgmental biases as well as suggesting corrective procedures.

2개의 설정 프레임워크
The Two-Settings Framework

확률론적 예측의 렌즈를 통해 추론을 개념화한다. 표본을 관측하고 통계량을 계산한 다음 모집단 또는 다른 표본에서 해당 통계량을 추정합니다(예: 평균을 추정하는 경우). 이론적 정당성은 단순한 가정에 의존합니다. 즉, 표본은 동일한 기본 모집단에서 무작위로 추출됩니다. 
We conceptualize inference through the lens of probabilistic prediction. One observes a sample, calculates a statistic, and then estimates that statistic in the population or a different sample (as when, e.g., one estimates a mean). The theoretical justification relies on a simple assumption: Samples are randomly drawn from the same underlying population.

이 공식은 판단 및 의사결정 연구에서 매우 중요했습니다. 규범적인 벤치마크를 제공하고(Tversky & Kaneman, 1974), 기술 모델을 제안한다(Gigerenzer, 1991). 그러나 우리는 의사결정의 기초가 되는 심리적 문제를 고려하기에는 적합하지 않다고 주장한다. 왜냐하면 사람들은 하나의 기초가 되는 모집단 대신에 두 개의 모집단, 즉 우리가 말하는 것처럼 두 개의 상황settings을 다루어야 하기 때문이다. 
This formulation has been critical in judgment and decision-making research. It provides normative benchmarks (Tversky & Kahneman, 1974) and suggests descriptive models (Gigerenzer, 1991). However, we contend that it is ill-suited for considering the psychological issues underlying decision making because, instead of one underlying population, people have to deal with two populations, or as we shall say, two settings.

첫 번째 설정에서는 상황(예: 두 변수가 어떻게 공변covary하는지)에 대해 학습한다. 두 번째는 첫 번째에서 습득한 지식을 사용하여 행동을 취하거나 예측을 합니다. 하나는 [학습]으로, 다른 하나는 [선택 또는 예측]으로 특징지어집니다. 예를 들어, 당신이 테스트를 사용하여 입사 지원자를 선택하는 인사 관리자라고 가정해 보십시오. 이 시험은 과거에도 정확했다. 따라서 현재 결정(예측)의 경우 두 설정(과거 및 현재)의 특징이 일치할 때 검정이 정확할 것으로 기대할 수 있습니다. 예를 들어, 현재 후보들은 과거와 비슷한가요? 우리는 이 과정에서 관리자가 (암시적 또는 명시적으로) 관련 인스턴스의 참조 클래스reference class , 즉 추론이 참조하는 특정 그룹을 염두에 두어야 한다고 강조한다. 참조 클래스가 다르면 추론이 다를 수 있습니다.
In the first setting, people learn about a situation (e.g., how two variables covary). In the second, they take an action or make a prediction using the knowledge acquired in the first. One setting is characterized by learning and the other by choice or prediction. To illustrate, imagine you are a personnel manager who uses a test to select job candidates. This test has been accurate in the past (learning). Thus, for current decisions (predictions), the test can be expected to be accurate when the features of the two settings (past and present) match. For example, are the present candidates similar to those in the past? We emphasize that in this process, the manager must also have in mind (implicitly or explicitly) a reference class of relevant instances—that is, the specific group to which the inference refers. Different reference classes can imply different inferences.

두 상황(예: 과거와 현재)이 동일한 기본 모집단에서 무작위로 추출된 샘플이라고 가정하기보다는 두 가지 다른 설정을 가정한다. 첫 번째를 L(학습용)이라고 하고 두 번째를 T(타깃용)라고 하고 이 두 가지가 어떻게 일치하는지 묻습니다. 그림 1의 왼쪽에서는 L과 T의 정보 요소가 일치하거나 일치하지 않는 6가지 방법을 고려하며, 이를 통해 [친절한 학습 환경]과 [고약한 학습 환경]에 대해 서로 다른 태스크 구조를 정의할 수 있습니다. 친절함이나 사악함 정도는 분명 다를 수 있습니다. 다만, 여기서의 의도는 분류에 한정되어 있습니다.

Rather than assuming that both situations (e.g., past and present) are random samples from the same underlying population, we posit two distinct settings. We refer to the first as L (for learning) and the second as T (for target) and ask how these match. On the left-hand side of Figure 1, we consider six ways in which the elements of information in L and T do or do not match, and these, in turn, allow us to define different task structures for kind and wicked learning environments. Clearly, kindness or wickedness can vary in degree. However, our intention here is limited to classification.

 

 

 

 

 

그림 1의 오른쪽은 작업 선택 시나리오를 사용하여 왼쪽의 사례를 보여 줍니다. 각 산점도에는 관리자가 과거 지원자의 시험 점수와 직무 성과 간의 관계에 대해 학습할 때 경험한 데이터가 표시됩니다(L). 그 후, 이 정보를 이용해 새로운 후보의 성과를 예측한다(T).

The right-hand side of Figure 1 illustrates the cases on the left using the job-selection scenario. Each scatter plot shows the data experienced by the manager in learning about the relation between test scores and job performance from past applicants (L). Subsequently, this information is used to predict the performance of new candidates (T).

[사례 A와 B는 친절한 학습 환경]을 나타냅니다. A에서는 L과 T의 요소가 완벽하게 일치합니다. 오른쪽 예제에서 X와 Y의 상관 관계는 1.0입니다. 검정에서 성능을 완벽하게 예측할 수 있습니다.
Cases A and B represent kind learning environments. In A, there is a perfect match between the elements of L and T. In the example on the right, the correlation between X and Y is 1.0. Performance can be predicted perfectly from the test.


[사례 B]에서 랜덤오차의 존재는 매칭이 기껏해야 근사치임을 것을 의미합니다. 오른쪽의 X와 Y의 관계는 직선이 아닌 타원으로 표시됩니다. 기술적으로 이러한 불일치는 L과 T 사이의 교차점을 의미한다(아래 설명되는 E와 동일). 
그러나 B는 E와 다르다. 전자의 경우 불일치는 전적으로 무작위 요인에 기인한다.)

Case B reflects that the presence of random error means that matches are at best approximate. The relation between X and Y on the right is represented by an ellipse as opposed to a straight line. Technically, such mismatches imply an intersection between L and T (as does E, explained below; however, B differs from E in that in the former, the mismatch is entirely due to random factors).

[사례 C ~ F는 고약한 학습 환경]을 나타냅니다. C에서 L은 T의 서브셋이다. T에는 L에서 추론할 수 없는 요소가 있다. 예로는 사건이나 작용에 의해 데이터가 체계적으로 제한되는 생존자 편향이 있다(Einhorn & Hogarth, 1978). 오른쪽 예에서는 테스트에서 낮은 점수를 받은 사람(X < 10)은 작업에 선택되지 않았기 때문에 성능 데이터를 사용할 수 없습니다.
Cases C through F represent wicked learning environments. In C, L is a subset of T. There are elements in T that cannot be inferred from L. Examples include the survivorship bias, in which data have been systematically restricted by events or actions (Einhorn & Hogarth, 1978). In the example on the right, performance data are not available for people scoring low on the test (X < 10) because they were not selected for the job.


D에서 T는 L의 서브셋이다. 이는 학습과 예측 사이의 참조 클라스reference class 구성에 변화가 있다는 사실을 모르는 경우에 발생할 수 있다. 예를 들어, 지역 대학이 입학 기준을 낮췄기 때문에 지원자 풀이 바뀌었다고 가정해 봅시다. 그 때문에, 그 자리에 지원하는 졸업생 가운데, 높은 자격을 갖춘 지원자가 없습니다. 그러나 인사담당자는 이를 깨닫지 못하고 있다.

In D, T is a subset of L. This can occur when the person is unaware that there has been a change in the composition of the reference class between learning and prediction. For example, imagine that the applicant pool changes because the local university has lowered its admission standards, such that there are no highly qualified candidates among the graduates applying for the job. However, the personnel manager does not realize this.

E에서는 체계적인 요인 때문에 L과 T의 원소가 교차하고 T에서 예측 능력이 제한됩니다. 이 사례는 자기충족적 예언 또는 소위 치료 효과를 포착합니다. 선발 모델에서는, [선발된 사람(X > 10)]은, 조직적으로 업무 성과를 긍정적으로 평가하는 특별한 「대우」를 받는다(예를 들면, 훌륭한 멘토가 있다). 인사담당자는 편향된 학습표본에 노출되어 있다.
In E, the elements of L and T intersect because of systematic factors, and the ability to predict in T is limited. This case captures self-fulfilling prophecies or so-called treatment effects. In terms of the selection model, those chosen (X > 10) receive special “treatment” that systematically biases job performance positively (e.g., they have excellent mentors). The personnel manager is exposed to a biased learning sample.

사례 E는 또한 C와 D의 조건을 포착한다. 이 예에서 고용주는 시험 점수가 낮은 후보자에 대한 성과 측정치를 준수하지 않으며(X < 10), 학습 표본은 관리자가 알지 못하는 지원자 풀의 변화에 의해 편향된다.
Case E also captures the conditions of both C and D, where, in our example, an employer does not observe performance measures for candidates with low test scores (X < 10) and the learning sample is biased by the change in the applicant pool, of which the manager is unaware.

마지막으로 케이스 F에서는 T와 L은 공통 요소가 없습니다. 이 경우 성능 예측에 사용되는 변수는 이와 관련이 없습니다(예: 물리적 외관).

Finally, we note Case F, in which T and L have no elements in common. In this case, the variable used to predict performance is not related to it (e.g., physical appearance).

사악함의 특징
Features of Wickedness

나쁜 학습 환경은 환경의 특성일 뿐만 아니라 추론(자기충족적 예언, 사례 E 등)을 하는 사람이 취한 행동의 결과로 나타날 수 있다. 예를 들어, 과거에 관측된 데이터 범위를 초과하는 예측을 요청받은 경우 Case C 상황이 발생할 수 있다(Feiler, Tong, Larrick, 2012). 여기서 불일치는 개인의 행동에 의해 유발되지 않는다.
A wicked learning environment can emerge as a result of actions taken by the person making the inferences (as in self-fulfilling prophecies, Case E) as well as the characteristics of the environment. For example, a Case C situation could arise if someone were asked to make predictions beyond the range of data observed in the past (Feiler, Tong, & Larrick, 2012). Here, the mismatch is not triggered by the individual’s actions.

우리의 분류 체계에서는 별개이지만 친절과 사악함은 연속체처럼 정도가 다를 수 있다. 예를 들어, 케이스 A는 B보다 친절하고, 케이스 A는 E나 F보다 친절합니다. 하지만 미스매치가 무작위 요인에 의한 것이라면 어떻게 될까요? 예를 들어 B에서는 노이즈가 예측 능력을 감쇠시킵니다. 실제로 노이즈가 많으면 케이스 B의 예측능력은 케이스 C와 같은 일부 악질적인 환경보다 본질적으로 저하될 수 있습니다. 그러나 우리의 프레임워크는 불일치의 근본적인 원인이 전자의 경우 [무작위random]이지만 후자의 경우 [체계적systematic]이라는 것을 분명히 보여준다.
Although discrete in our classification scheme, kindness and wickedness can vary in degree as on a continuum. For instance, Case A is kinder than B, which is kinder than E or F. But what happens when mismatches are due to random factors? In B, for example, noise attenuates predictive ability. In fact, with much noise, predictive ability could be inherently lower in Case B than in some wicked environments, such as Case C. However, our framework clearly indicates that whereas the underlying cause of mismatch is random in the former, it is systematic in the latter.

우리는 특히 샘플이 작을 때 샘플의 크기와 다양성도 중요한 역할을 하도록 학습이 정보의 순차적 축적을 수반하는 것으로 예상한다. 그러나 종종 불일치mismatch에는 체계적 요인과 무작위적 요인이 모두 포함되며 더 큰 표본을 관측하는 것은 도움이 되지 않을 수 있습니다.
We envisage learning as involving the sequential accumulation of information, such that the size and variability of samples also play important roles—particularly when samples are small. Often, however, mismatches involve both systematic and random factors, and observing larger samples might not help.

우리의 프레임워크는 L과 T의 정보 요소만을 다루고 있습니다. 예를 들어 개인이 외부정보(예: 프라이밍)를 고려하는 이유나 추론을 할 때 정보가 어떻게 통합되는지는 설명하지 않는다. 이러한 문제는 많은 오류가 외부 정보(Kahneman, 2011) 및 부적절한 집계 규칙(예: 곱셈multiplicative 집계여야 할 때 덧셈additive 집계를 사용; Larrick & Soll, 2008)에 주의를 기울이는 데 기인할 수 있기 때문에 중요하다. 그러나, L과 T 사이의 정보 일치를 구별함으로써, 우리는 특이한 심리 과정 대신에 업무 특징에 기인하는 판단 오류의 근본적인 원인을 더 잘 분리할 수 있다.

Our framework deals only with the elements of information in L and T. It does not explain, for example, the reasons why individuals consider extraneous information (e.g., as in priming) or how information is aggregated in making inferences. These issues are important because many errors can be attributed to attention paid to extraneous information (Kahneman, 2011) and/or inappropriate aggregation rules (e.g., using additive aggregation when it should be multiplicative; Larrick & Soll, 2008). However, by distinguishing information matches between L and T, we can better isolate the underlying sources of judgmental errors that are due to task features as opposed to idiosyncratic psychological processes.

우리의 프레임워크는 문헌의 특정 레이블에 의해 식별된 일부 편견이 여러 원인을 가질 수 있다는 것을 보여준다. 예를 들어 환상 상관illusory correlation 을 생각해 봅시다. 한편, 이는 필터링된 관찰을 경험함으로써 유도될 수 있다. 즉, 이변량 분포의 일부가 관측치에서 가려지기 때문에 L에 대한 개인의 경험은 치우쳐 있습니다. 반면, 채프먼과 채프먼(1969)에 의해 조사된 현상은 인식된 상관관계에 대한 이전의 믿음의 역할에 관한 것이다. (Denrell & Le Mens, 2011도 참조).

Our framework reveals that some biases identified by specific labels in the literature can have multiple causes. Consider, for example, illusory correlation (Fiedler, 2000b). On the one hand, this can be induced by experiencing filtered observations. That is, the individual’s experience in L is biased because part of a bivariate distribution is obscured from observation. On the other hand, the phenomenon investigated by Chapman and Chapman (1969) is about the role of prior beliefs on perceived correlations. (See also Denrell & Le Mens, 2011.)


또, 우리의 견해는, 일반적으로 정보를 무시해, 단순한 의사결정 룰을 수반하는 휴리스틱 의사결정 프로세스의 예측의 정확성을 나타내고 있습니다(Gigerenzer & Gaissmaier, 2011). 성공적인 휴리스틱스는 환경의 두 가지 주요 기능인 정보의 집약 방법과 redundancy을 활용합니다(Hogarth & Karelaia, 2007). 이와 같이 L과 T의 교차로에서 동작한다. 예를 들어, 사람들이 두 가지 대안 중 하나를 선택하기 위해 인식 휴리스틱을 사용할 때(Goldstein & Gigerenzer, 2002), 
그들은 그들이 예측하려고 하는 것과 관련이 있는 기억 속에서 이용 가능한 정보에 근거하여 판단한다.

Our perspective also speaks to the predictive accuracy of some heuristic decision processes that typically ignore information and involve simple decision rules (Gigerenzer & Gaissmaier, 2011). Successful heuristics exploit two key features of the environment: how information is aggregated and redundancy (Hogarth & Karelaia, 2007). As such, they operate in the intersection of L and T. For example, when people employ the recognition heuristic to select one of two alternatives (Goldstein & Gigerenzer, 2002), they base their judgments on information available in memory that happens to be correlated with what they are trying to predict.

디폴트로서의 매칭
Matching as a Default

사람들은 종종 L에서의 match를 T로 투영하는 것을 디폴트 전략으로 사용한다(Kahneman & Tversky, 1973). 여기에는 여러 가지 이유가 있을 수 있습니다. 첫째, 추론은 종종 정확한 답을 제공하는 것이 아니라 방향을 제시하기만 하면 된다(Hogarth, 1981).
People often use a default strategy that projects a match from L to T (Kahneman & Tversky, 1973). There could be several reasons for this. First, inferences often need only to suggest a direction as opposed to providing precise answers (Hogarth, 1981).

둘째, L에서 요소가 누락된 것을 알고 있다고 가정합니다. 어떻게 해야 할까요? 많은 것이 누락된 것으로 알려진 것에 달려 있다(Elwin, 2013). 그러나 규범적 관점에서, 누락된 관측치(사례 C)와 비대표적인 학습 세트(사례 D)에 대해 수정하는 방법은 불분명하다. 
Second, assume that a person knows that elements are missing from L. What should be done? Much depends on what is known to be missing (Elwin, 2013). However, from a normative perspective, it is unclear how to correct for missing observations (Case C) and unrepresentative learning sets (Case D).

셋째, 디폴트 매칭 전략은 인지적으로 단순합니다. 디폴트를 조정하려면 메타인지 능력이 필요합니다(Fiedler & Kutzner, 프레스).1 
Third, default matching strategies are cognitively simple. Adjusting defaults requires meta-cognitive ability that people may not possess (Fiedler & Kutzner, in press).1

다른 프레임워크와의 관계
Relationships to Other Frameworks

다른 학자들은 편견을 설명하기 위해 두 가지 설정 사이의 차이를 이용했다. Gilbert와 Wilson(2007)은 정서적 예측에 대한 연구에서 미래의 결과에 대한 사람들의 이미지와 실제로 일어나는 일을 비교했다. 예를 들어, 컨버터블을 살 때, 사람들은 아름다운 날씨에서 운전하는 즐거움을 상상할 수 있지만, 악천후와 관련된 다른 시나리오는 고려하지 못한다.
Other scholars have used differences between two settings to explain bias. In their work on affective forecasting, Gilbert and Wilson (2007) contrasted people’s images of future outcomes with what actually happens. For example, when buying a convertible, a person may imagine the joys of driving in beautiful weather but fail to consider other scenarios involving bad weather.

두 설정 간 일치의 중요성은 [학습 전이transfer]에 관한 문헌에서 받아들여지고 있다. 흥미롭게도, 손다이크(1903)의 영향력 있는 이론은 "동일한 요소"와 배움이 획득되고 적용되는 환경에서 이들 요소 간의 일치라는 관점에서 틀을 짰다. 하지만 그의 관심사는 사실이나 기술을 배우는 것이었다. (예: 테니스를 배우는 것이 다른 라켓 스포츠로 옮겨지는가?)

The importance of matches between two settings is acknowledged in the literature on transfer of learning (Barnett & Ceci, 2002). Interestingly, Thorndike’s (1903) influential theory was framed in terms of “identical elements” and the match between these elements in the settings where learning is acquired and applied. However, his concern was with learning facts or skills (e.g., does learning to play tennis transfer to other racquet sports?).

다른 사회과학자들은 데이터 세트를 이용할 때 두 설정 간의 일치에 대해 우려를 표합니다. 예를 들어, 통계학자와 기계학습 전문가는 표본에서 얻은 결과가 반드시 일반화되지는 않는다는 것을 알고, 표본 외 추론을 테스트하기 위한 기술을 개발했다.
Other social scientists show concern about the matches between two settings when exploiting data sets. For example, statisticians and machine-learning experts know that results obtained in samples do not necessarily generalize and have developed techniques for testing out-of-sample inferences.

역동적인 환경이나 비안정적 환경에 대해서는 명확하게 고려하지 않았습니다. 어느 레벨에서는, 그러한 환경은 악질적입니다(케이스 E 의 가능성이 있습니다). 그러나 첫 번째 세팅에서 역동적 변화의 특성을 추론할 수 있다면 [친절한 환경]이 될 수도 있습니다. 예를 들어 경험을 통해 계절의 사이클을 배우는 것을 고려해 보십시오.

We have not explicitly considered dynamic or nonstationary environments. At one level, such environments are wicked (a likely Case E). However, if the nature of the dynamic change can be inferred from the first setting, these environments can be kind. Consider, for example, learning seasonal cycles from experience.

시사점
Implications

우리의 프레임워크는 기술적이고 규범적인 의미를 가지고 있다. 특정 업무에서 추리적인 판단을 검토하는 맥락에서, 우선 이 맥락이 친절한 환경인지 고약한 환경인지에 관심을 갖는다.

  • 만약 친절환 환경이라면, 우리는 정확한 추론을 위해 필요한 조건을 가지고 있다. 따라서 모든 오류는 개인에게 귀속되어야 한다(예: 부적절한 정보 집계).
  • 만약 고약한 환경이라면, 작업 기능에서 오류가 발생하는 방식을 식별할 수 있습니다. 단, 작업 기능은 사람의 행동에 의해 영향을 받을 수도 있습니다. 즉, 우리의 프레임워크는 오류의 원인을 특정하는 데 도움이 됩니다(태스크 구조 또는 사람). 

Our framework has descriptive and prescriptive implications. In the context of examining inferential judgments in a particular task, it first draws our attention to whether this is kind or wicked.

  • If kind, we have the necessary conditions for accurate inference. Therefore, any errors must be attributed to the person (e.g., inappropriate information aggregation).
  • If wicked, we can identify how error results from task features, although these can also be affected by human actions. In short, our framework facilitates pinpointing the sources of errors (task structure and/or person).

표 1은 이러한 관점에서 본 문헌의 몇 가지 현상을 나열한다. 예를 들어, 네 번째 항목인 "온풍로" 효과를 생각해 보십시오. 여기서, 과거의 결과(학습)에 대한 개인의 경험은 그녀가 현재 선택하는 것(목표)을 결정하지만, 그 결과는 이후의 학습을 편향시킨다.

Table 1 lists some phenomena in the literature viewed from this perspective. For example, consider the “hot stove” effect, the fourth entry. Here, a person’s experience of past outcomes (learning) determines what she selects currently (target), but then the outcome of this biases her subsequent learning.

 

 

판단의 편견을 바로잡기 위한 많은 시도가 있었다. 친절한 환경은 정확한 판단을 위한 필수 조건이기 때문에, 우리의 프레임워크는 의도적으로 친절한 환경을 만드는 것을 제안합니다. 실제로, 이 추론은 사람들이 확률론적 과정의 순차적 결과를 경험하게 함으로써 친절한 환경을 설계하고(Hogarth & Soyer, 2011) 적절한 확률론적 진술을 할 수 있는 능력을 조사했던 시뮬레이션 경험에 대한 우리의 작업에 동기를 부여했다. 일반적으로 잘못 대답하는 문제에 직면했을 때, 이러한 친절한 환경에서 참가자들의 판단은 매우 정확했습니다. 게다가, 참가자들은 그들의 반응에 자신감을 가지고 있었다.

There have been many attempts to correct judgmental biases (Soll, Milkman, & Payne, in press). Since kind environments are a necessary condition for accurate judgments, our framework suggests deliberately creating kind environments. Indeed, this reasoning motivated our work on simulated experience, in which we engineered kind environments by letting people experience sequential outcomes of probabilistic processes (Hogarth & Soyer, 2011) and investigated their ability to make appropriate probabilistic statements. Facing problems that are typically answered erroneously, participants’ judgments in these kind environments were quite accurate. Moreover, the participants were confident in their responses.

시뮬레이션 방법론을 제안하는 것은 우리뿐만이 아니다. 이러한 방법은 예를 들어 재정 결정 및 기후변화의 영향을 이해하는 데 유용한 것으로 입증되었다(Sterman, 2011). 우리의 프레임워크는 시뮬레이션 방법이 유용할 것 같은 시기를 지정하는 데 기여할 수 있다. 
We are not alone in suggesting simulation methodology. These methods have proven useful, for example, in financial decisions (Goldstein, Johnson, & Sharpe, 2008; Kaufmann, Weber, & Haisley, 2013) and understanding the implications of climate change (Sterman, 2011). Our framework can contribute to specifying when simulation methods are likely to be useful. 

환경을 친절하게 만드는 것의 이점을 강조하지만, 때로는 나쁜 환경을 악용하는 것이 이득이 될 수도 있습니다. 예를 들어, 플라시보를 제공함에 있어서, 목표는 [사람들이 경험으로부터 잘못된 교훈을 얻어야 한다]는 것이다. 우리의 프레임워크는 그러한 개입을 개념화하는데 사용될 수 있다.
Although we highlight the advantages of making environments kind, we note that it may sometimes also pay to exploit wicked environments. In providing placebos, for example, the goal is that people should draw the wrong lesson from experience. Our framework can be used to conceptualize such interventions.

최근, Erev와 Roth(2014)는 학습 행동의 관점에서 경제적 합리성으로부터의 편차를 조사했다. 그들은 학습환경이 에이전트를 "모든 에이전트에 대해 평균적이고 대부분의 시간 동안 최고의 성과"로 이끌 때 행동을 극대화할 가능성이 높다고 주장했다. Erev와 Roth는 종래의 최대화 모델을 사용하는 것을 가정하는 대신, 행동 최대화의 성공과 실패를 에이전트가 무엇을 어떻게 학습했는지에 기인하고, 따라서 암묵적으로 그들이 종류의 학습 환경에 노출되었는지 또는 사악한 학습 환경에 노출되었는지에 기인하기 때문에 그들의 기여는 중요하다.
Recently, Erev and Roth (2014) examined deviations from economic rationality from the perspective of learning behavior. They argued that maximizing behavior is likely when the learning environment leads agents to “the best payoff for all agents on average, and most of the time” (p. 10818). Their contribution is important because, instead of postulating the use of conventional maximization models, Erev and Roth attributed successes and failures in maximizing behavior to what and how agents have learned and thus, implicitly, to whether they have been exposed to kind or wicked learning environments.

이러한 생각들은 친절하고 사악한 학습 환경의 개념이 경제적 인센티브 계획의 설계에 유용할 수 있다는 것을 암시한다. 즉, 경제 주체들이 솔루션을 극대화할 수 있다고 가정하는 대신 적절한 대응, 즉 현물 환경에서 적절한 대응을 이끌어낼 수 있는 경험을 제공해야 한다. 이를 달성하는 방법은 아직 불확실하지만, 이러한 관점에서 문제를 제기하는 것은 큰 진전이다.

These ideas suggest that the concepts of kind and wicked learning environments can be useful in the design of economic incentive schemes. That is, instead of assuming that economic agents can calculate maximizing solutions, one should provide experiences that lead to appropriate responses—that is, in kind environments. Although the way to achieve this remains uncertain, posing the problem in these terms is a major step forward.

 

 


Abstract

Inference involves two settings: In the first, information is acquired (learning); in the second, it is applied (predictions or choices). Kind learning environments involve close matches between the informational elements in the two settings and are a necessary condition for accurate inferences. Wicked learning environments involve mismatches. This conceptual framework facilitates identifying sources of inferential errors and can be used, among other things, to suggest how to target corrective procedures. For example, structuring learning environments to be kind improves probabilistic judgments. Potentially, it could also enable economic agents to exhibit maximizing behavior.

의사소통, 학습, 평가: 디지털 학습 환경의 차원 탐색(Med Teach, 2019)
Communication, learning and assessment: Exploring the dimensions of the digital learning environment
Brent Thomaa , Alison Turnquista , Fareen Zaverb, Andrew K. Hallc,d and Teresa M. Chane

 

 

서론
Introduction

[임상 학습 환경]은 훈련 중인 의사의 학습 경험에 미치는 영향을 이해하고 교육 결과를 개선하는 개입을 테스트하기 위해 연구되었습니다. 테크놀로지 향상에 의해 촉진된 [디지털 의학digital medicine]은 의료계 및 임상 환경에서 점차적으로 더 큰 역할을 담당하게 되었습니다. 팩스, 전화 및 종이 기록을 통한 커뮤니케이션이 점차 강화되거나 전자 메시지와 전자 건강 기록으로 대체되었습니다(Mcelroy et al. 2013). 디지털 공간은 전자(Thoma et al. 2014)와 오픈 액세스 형식으로 제공되는 교과서, 가이드, 의학 저널 등의 자료를 출판하여 학습의 공통 공간으로 부상하였습니다. 오픈 액세스 리소스는 리소스가 제한된 환경에서의 교육에 특히 유용합니다. 디지털 자원의 사용이 증가함에 따라 온라인 진료 커뮤니티가 생겨났고, 의사들의 디지털 옹호 활동에 대한 요구가 증가하고 있습니다(Taichman 등. 2018). 수습생 평가는 더 자주 이루어지며 종종 전자 포트폴리오로 통합된다(Chan et al. 2018). 디지털 공간이 학습의 원천이자 임상 작업의 중요한 자원으로 부상하는 것을 더 이상 무시할 수 없습니다.
The clinical learning environment has been studied to understand its impact on learning experiences for physicians in training and to test interventions that improve educational outcomes. Facilitated by enhancements in technology, digital medicine has taken on a progressively larger role in the work and lives of the medical profession and in the clinical environment. Communication via fax, telephone, and paper records has increasingly enhanced or been replaced by electronic messages and electronic health records (Mcelroy et al. 2013). The digital space also has emerged as a common space for learning through the publication of resources such as textbooks, guides, and medical journals available in electronic (Thoma et al. 2014) and open access formats (Cadogan et al. 2014; Thoma et al. 2014). Open access resources are particularly beneficial for education in resource-constrained environments (Frehywot et al. 2013; Thurtle et al. 2016). The growing use of digital resources has resulted in online communities of practice (Thoma et al. 2018; Ting et al. 2018), and increasing demands for physicians to be engaged in digital advocacy (Taichman et al. 2018). Trainee assessments are more frequent and are often aggregated into electronic portfolios (Chan et al. 2018). The emergence of the digital space as a source of learning and as a critical resource for clinical work can no longer be ignored.

이 디지털 학습 환경의 검사는 연구 및 개선 노력과 관련된 건축, 심리학, 사회학 및 교육 등 다양한 분야의 작업을 사용하여 임상 학습 환경을 검토하기 위한 대규모 노력의 일환으로 수행되었다. 최근 범위 검토에서는 임상 학습 환경에 대한 문헌의 일반적인 한계로 개념적 명확성 결여를 식별했으며, 물리적 및 가상 구성요소가 가장 주의를 덜 받고 상대적으로 제대로 정의되지 않았다는 점을 추가로 지적했다(Gruppen 등 2018). 우리는, 다음의 3개의 중요한 측면을 강조해, 디지털 학습 환경에 관한 개념의 명확성을 향상시키는 것을 목표로 하고 있습니다. 

  • (1) 디지털 커뮤니케이션, 
  • (2) 디지털 학습 리소스, 
  • (3) 디지털 평가 및 평가. 

또, 장래의 장학금이나 개선 노력을 위해서, 실천적인 제언과 가이던스를 제공하고 있습니다. 우리는 의도하지 않은 부정적인 결과를 피하면서 학습 환경에서 디지털 기술의 진보를 활용하는 방법에 초점을 맞추고 있습니다.

This examination of the digital learning environment was undertaken as part of a larger effort to examine the clinical learning environment, using work from different disciplines such as architecture, psychology, sociology, and education that are relevant to research and improvement efforts. A recent scoping review identified a general lack of conceptual clarity as a general limitation in the literature on the clinical learning environment, further noting that its physical and virtual components had received the least attention and were relatively poorly defined (Gruppen et al. 2018). We seek to improve conceptual clarity about the digital learning environment by highlighting three critical dimensions:

  • (1) digital communication,
  • (2) digital learning resources, and
  • (3) digital assessment and evaluation.

We also offer practical recommendations and guidance for future scholarship and improvement efforts. We focus on ways to take advantage of the advances in digital technology in the learning environment while avoiding unintended negative consequences.

디지털 학습 환경의 3차원
Three dimensions of the digital learning environment

학습 환경에서 디지털 테크놀로지의 사용에 관한 문헌을 분석하고, 의사 교육에 디지털 테크놀로지를 사용하는 것에 관한 선행 연구와 심의의 대상이 되고 있는 3개의 영역을 특정했다: 디지털 커뮤니케이션, 디지털 학습 리소스 및 디지털 평가.

We analyzed the literature on the use of digital technology in the learning environment and identified three domains that have been the subject of prior study and deliberation on the use of digital technology in physician education: digital communication, digital learning resources, and digital assessment.

디지털 통신
Digital communication

디지털 커뮤니케이션에 관한 연구에 따르면, 80% 이상의 의사가 환자 치료를 목적으로 정보 접근을 위해 인터넷을 사용하는 가운데, 학습자도 자기 기기를 점점 더 많이 기관 내로 반입하고 있는 것으로 나타났다(Patel et al. 2015). 인스턴트 메시징은 의료기관에서 인정한 채널(예: WhatsApp)을 벗어나는 커뮤니케이션 도구를 자주 사용하는 후배 의사들 사이에서 가장 일반적인 주요 커뮤니케이션 소스인 것으로 나타났습니다.
Research on digital communication acknowledged that learners are increasingly bringing their own devices into their institutions (Mcelroy et al. 2013) with >80% of physicians using the internet to access information for the purpose of patient care (Patel et al. 2015). Instant messaging was found to be the most common primary communication source among junior doctors (Katz-Sidlow et al. 2012) with frequent use of communication tools that fall outside of institutionally-recognized channels (e.g. WhatsApp) (Ellanti et al. 2017; Ganasegeran et al. 2017; Przybylo et al. 2014).

디지털 학습 자원
Digital learning resources

온라인 교육 자원의 가용성(Cadogan et al. 2014)과 의학 학습자의 온라인 교육 자원 사용률 모두 증가하고 있다. 학습자가 자주 사용하는 리소스로는 온라인 레퍼런스뿐만 아니라 블로그, 팟캐스트, 위키 및 앱을 통해 제공되는 새로운 무료 콘텐츠가 꼽혔습니다. 학습 자원의 광범위한 사용은 이러한 자원을 중심으로 구축된 [가상의 실천 공동체 출현]에 기여하고 있습니다.
Availability of online educational resources (Cadogan et al. 2014) and their use by medical learners (Purdy et al. 2015) are both increasing in prevalence. In addition to established online references, novel free content available via blogs, podcasts, wikis, and apps were cited as frequently utilized resources by learners (Purdy et al. 2015). The wide use of learning resources has contributed to the emergence of virtual communities of practice built around these resources (Thoma et al. 2018; Ting et al. 2018).

디지털 평가 및 평가
Digital assessment and evaluation

새로운 프로그램 평가 모델이 의료 교육(Schuworth 및 Van der Vleuten 2011)에 구현되고 있으며, 평가 프로세스에서 분석 및 시각화해야 하는 데이터가 압도적으로 많다. 평가 데이터 관리의 메카니즘으로서 폭넓은 전자 포트폴리오가 실장되고 있습니다만, 표준화, 사용의 용이성, 기능성, 유연성, 프라이버시에 관한 구체적인 우려가 대두되고 있습니다. [학습 분석learning analytics]학습 행동을 설명하고 예측하기 위해 통계 및 계산 방법을 사용하는 것으로서, 이러한 기법을 도입하여 데이터를 학습자에게 피드백을 제공하고 교사에게 지침을 제공하는 유용한 정보로 변환하는 데 도움이 될 수 있다(Boscardin et al. 2017). 또한 학습자 평가 데이터와 환자 결과를 결합하여 학습자 성과에 대한 통찰력을 얻을 수 있다(Arora 2018).
Novel programmatic assessment models are being implemented in medical education (Schuwirth and Van der Vleuten 2011) which require an overwhelming amount of data to be analyzed and visualized in assessment processes (Chan et al. 2018). A broad array of electronic portfolios are being implemented as a mechanism for assessment data management, but specific concerns are emerging relating to standardization, ease of use, functionality, flexibility, and privacy (Gruppen et al. 2018; Sonnenberg et al. 2017). Adoption of techniques from the field of learning analytics, which uses statistical and computational methods to describe and predict learning behaviors (Cooper 2012), may help to translate this data into useful information that provides feedback for learners (Boscardin et al. 2017) and guidance to teachers (Friedman et al. 2016). It also may be possible to combine learner assessment data with patient outcomes to gain insights on learner performance (Arora 2018).

 

디지털 학습 환경을 설명하는 3가지 사례 세그먼트
Three case segments to illustrate the digital learning environment

정형외과 수련생이 관련된 사례의 세 가지 세그먼트를 사용하여 디지털 학습 환경의 세 가지 영역을 강조하고 이점과 과제를 탐색합니다. 또한 소규모 그룹 토론과 컨센서스 컨퍼런스의 갤러리 보드를 통해 컨센서스 컨퍼런스의 참가자에게 의견을 구했습니다.
We use three segments of a case involving an orthopedic surgery trainee to highlight the three domains of the digital learning environment and to explore benefits and challenges. We also sought input from consensus conference participants through small group discussions and a gallery board at a consensus conference.

세그먼트 1: 디지털 통신
Segment 1: Digital communications

정형외과 레지던트 1년차인 사리는 집에 있는 레지던트 선배와 주치의와 함께 온콜 대기하고 있다. 그녀는 오토바이를 타고 있던 젊은 여성이 차에 치였을 때 그녀를 평가하기 위해 불려갔다. 그녀는 다발성 골절과 기형적인 하지입니다. Sari는 WhatsApp 그룹을 통해 자신의 평가와 환자의 X-레이 사진을 상사에게 전달합니다. 그녀는 그들에게서 즉시 지도를 받는다. 사리가 환자를 돌보며 병동 환자에 대한 간호사의 WhatsApp 메시지에 응답하는 동안 그녀의 상사는 수술실을 불러 응급 수술을 위해 병원으로 간다.
Sari, a first-year orthopedic surgery resident, is on call with a senior resident and an attending who are both at home. She is called to assess a young female who was riding a motorcycle when she was hit by a vehicle. She has multiple fractures and a deformed lower extremity. Sari relays her assessment along with pictures of the limb and the patient’s x-rays to her supervisors via a WhatsApp group. She receives guidance from them instantly. While Sari is caring for the patient and responding to WhatsApp messages from the nurses regarding ward patients, her supervisors call in the OR staff and make their way to the hospital for an emergent operation.


사례의 첫 번째 세그먼트에서 임상 상호작용에 대한 설명은 임상 학습 환경에서 디지털 커뮤니케이션에 관한 세 가지 주제를 강조한다.

  • (1) 효율성 향상 
  • (2) 대면상호작용을 대체하는 디지털 통신 
  • (3) 임상적 맥락에서 환자 정보의 보안과 프라이버시에 관한 우려. 

첫 번째 주제와 관련하여, 이 사례에서는 이미지를 포함한 데이터 전송의 신속성이 어떻게 의료의 퀄리티와 적시성을 향상시키는지, 감독의사가 [작업 부하를 보다 쉽게 관리할 수 있는지]를 강조하고 있습니다. 디지털 통신 기술의 잠재적인 이점으로는 다음이 있습니다. 

  • 시간 효율성(Ellanti 등 2017), 
  • 중단 감소
  • 팀 조정 개선(Wu 등 2011)

쉽게 액세스할 수 있는 통신의 잠재적인 단점은 24시간 내내 사용할 수 있고 디지털 세상과의 연결이 끊길 수 없다는 것입니다(Ragsdale 및 Hoover 2016). 또한 데이터 보안, 특히 오픈 액세스 애플리케이션의 경우에도 문제가 있습니다. EHR은 기록에 대한 접근성을 개선하고, 중요한 실험실 값을 강조하며, 의약품 오류를 예방하는 데 있어 역할을 할 수 있지만(King et al. 2014), 학습자 효능감learner efficiency을 저해하는 것으로 느껴졌다.

The description of the clinical interaction in the first segment of the case underscores three themes around digital communication in the clinical learning environment:

  • (1) enhanced efficiency;
  • (2) digital communication replacing face-to-face interaction; and
  • (3) concerns regarding the security and privacy of patient information in a clinical context.

Related to the first theme, the case emphasizes how the immediacy of transmitting data, including images, can enhance the quality and timeliness of care while allowing supervising physicians to more easily manage their workload. Potential benefits of digital communication technologies include

  • time efficiencies (Ellanti et al. 2017),
  • decreasing interruptions (Locke et al. 2009; Patel et al. 2010), and
  • improving team coordination (Wu et al. 2011).

A potential disadvantage of readily accessible communications is the expectation of round-the-clock availability and the inability to disconnect from the digital world, which may contribute to overwork and burnout (Ragsdale and Hoover 2016). In addition, there are concerns about data security (Drake et al. 2016; HIPAAnswers 2017; Johnston et al. 2015; Shah et al. 2013), particularly for open access applications. Electronic health records may have a role to play in improving access to records, highlighting critical lab values, and preventing medication errors (King et al. 2014), but were felt to inhibit learner efficiency (Berg and Goorman 1999; Mcelroy et al. 2013).

직접 대화하는 것이 디지털 통신으로 대체될 경우 [유익성과 위해성]이 있습니다. 정보를 물리적으로 전달할 필요 없이 디지털 방식으로 전달하면 [효율성]이 향상되고, 디지털 커뮤니케이션은 잠재적으로 학습자와 교사 사이의 권력 구배gradient와 위계를 줄일 수 있으며, 이는 학습과 환자 치료에 도움이 될 수 있다(Green et al. 2017). 이러한 이점은 [이메일 또는 텍스트로 정보가 전달될 때 상황별 정보가 손실될 수 있다는 우려]와 균형이 필요하다. 디지털 커뮤니케이션을 광범위하게 사용하면 학습자와 감독자 간의 직접 접촉이 줄어들 수 있으며, 이는 학습자의 전문성 개발과 고품질 학습에 중요한 대화의 기회를 감소시킬 수 있습니다. 환자 및 동료와의 관계에서 발생하는 "작업의 즐거움joy of work"의 감소와 관련된 우려가 추가되었다(Linzer et al. 2017).

There are benefits and risks when in-person interactions are replaced with digital communication. Having information relayed digitally rather than needing to be present physically increases efficiency, and digital communication can potentially reduce power gradients and hierarchies between learners and teachers, which may benefit learning and patient care (Green et al. 2017). These benefits may be balanced by concerns about the loss of contextual information when information is conveyed via email or text. Extensive use of digital communications may result in a reduction of in-person contact between learners and supervisors, which may reduce opportunities for dialog important for learners’ professional development and high-quality learning. Added concerns relate to a reduction in the “joy of work” that results from engaging with patients and colleagues (Linzer et al. 2017).

잠재적으로, 가장 심각한 우려 사항은 디지털 미디어를 통해 [전송되는 건강 정보의 보안 및 개인 정보 보호]와 관련이 있습니다. 법적 및 물류적 관심사에는 어떤 애플리케이션을 사용할지 결정하는 방법, 애플리케이션이 데이터 보호 전송을 용이하게 하는 정도, 환자의 정보 디지털 전송에 대한 동의를 보장하는 방법이 포함되었다(Prochaska et al. 2015). 또한 의료 시스템이 스토리지, 보안 및 액세스를 포함한 디지털 통신 사용에 대한 기술적 지원을 어떻게 보장할 것인지에 대한 의문도 있습니다. 디지털 기록이 의료-법적 맥락에서 어떻게 사용될 수 있는지에 대한 우려도 있다. 
Potentially, the most serious concerns relate to the security and privacy of health information transmitted via digital media. Legal and logistical concerns included how to determine which applications to use, the degree to which applications facilitate protected transmission of data, and how to ensure patient consent for digital transmission of their information (Prochaska et al. 2015). In addition, there are questions regarding how the healthcare system will ensure technical support for the use of digital communication, including storage, security, and access. There are also concerns about how digital records might be used in a medico-legal context.

세그먼트 2: 디지털 학습 자원
Segment 2: Digital learning resources

사리의 경우는 이후 며칠간 정형외과 프로그램의 화제에 올랐다. 다른 거주자들은 팔뚝과 환자의 엑스레이 사진을 보여달라고 요청했고 사리는 그들의 거주자인 WhatsApp 그룹에 그것들을 공유했다. 이 사건으로 많은 관심을 받고 많은 것을 알게 된 그는 자신의 학습을 위해 자주 사용하는 정형외과 블로그에 글을 올렸다. 이 사건을 더욱 설득력 있게 하기 위해, 그녀는 환자의 팔뚝과 그녀의 핸드폰에 있는 엑스레이 사진을 포함시켰다. 이 게시물은 소셜 미디어에 널리 퍼졌고 전 세계 사람들에 의해 수천 번 조회되었다.
Sari’s case was the talk of the orthopedics program for the next few days. Other residents asked to see the photos of the limb and the patient’s x-rays and Sari shared them on their resident WhatsApp group. Having received so much interest and learned a lot from the case, she wrote it up for an orthopedic surgery blog that she used frequently for her own learning. To make the case more compelling, she included the images of the patient’s limb and x-rays that she had on her phone. The post was spread widely on social media and viewed several thousand times by people from around the world.

 

두 번째 세그먼트에서 설명한 바와 같이 환자 데이터의 교육적 사용에서 세 가지 주제가 나타난다. 

  • (1) 귀중한 교육 정보의 접근 및 보급 확대 
  • (2) 교육 콘텐츠의 품질 보장 
  • (3) 임상적 만남이라는 맥락을 넘은 환자 정보의 디지털 공유에 대한 우려.

Three themes emerge from the educational use of the patient data in the case, as described in the second segment:

  • (1) expanded access and dissemination of valuable teaching information;
  • (2) ensuring the quality of educational content; and
  • (3) concerns with the digital sharing of patient information beyond the context of the clinical encounter.

디지털 학습 자원은 정보와 학습 자원에 대한 접근을 개선할 수 있는 상당한 잠재력을 가지고 있습니다. 온라인 커뮤니티(Thoma et al. 2018)를 통해 전 세계에 최신 콘텐츠를 빠르게 보급하는 것은 지식 전달을 늘리고 지식을 "민주화"하는 강력한 방법입니다. 실제로 훈련생들은 스스로 학습하기 위해 POC(Point of Care) 리소스를 사용하는 동시에 환자와 더 많은 후배 학습자를 물리적인 학습 환경에서 가르치고 있습니다.
Digital learning resources have significant potential to improve access to information and learning resources. The rapid dissemination of up-to-date content worldwide through an engaged online community (Thoma et al. 2018) is a powerful way to increase knowledge transmission and to “democratize” knowledge. Indeed, trainees are increasingly using point-of-care resources to both learn for themselves, but also teach patients and more junior learners in their physical learning environments (Patocka et al. 2018).

공유 온라인 학습 커뮤니티가 지역 수준에서 학습을 보완할 수 있는 잠재력은 전반적인 학습을 상당히 강화하고 강화할 수 있다. 때때로 임상의와 훈련생은 더 나은 환자 치료를 위해 [크라우드-소싱된 의견]을 이용할 수 있지만, 이를 위해서는 환자의 동의와 연결된 임상의의 [신뢰할 수 있는 실천 공동체]가 필요하다. 견고한 실무 커뮤니티의 멤버와 연계하면 지식 보급, 교직원 육성, 임상 치료에도 도움이 됩니다. 블로그나 팟캐스트와 같은 정적 학습 자료는 대화형 교육 및 학습을 대체할 수 없지만 온라인 커뮤니티의 힘은 온라인 커뮤니티의 공백을 메우고 교육생을 지역 환경을 넘어 교사와 연결시켜 무한한 디지털 학습을 촉진할 수 있다는 것입니다.
The potential of a shared online learning community to supplement learning at the local level could significantly augment and enhance overall learning. Occasionally, clinicians and trainees might harness the power of crowd-sourced opinions to enhance patient care (Wainwright et al. 2018), but this requires consent from patients and a trustworthy community of practice of connected clinicians. Connecting members of a robust community of practice can help with knowledge dissemination, faculty development, and even clinical care (Chan et al. 2015; Lin et al. 2017; Thoma et al. 2018; Ting et al. 2018). Whereas static learning materials such as blogs and podcasts cannot replace interactive teaching and learning, the power of online communities is that they can rise up to fill the void and connect trainees to teachers beyond their local environments and foster digital learning that knows no bounds.

동시에 의료 학습의 원천으로서 디지털 자료의 중요성이 높아짐에 따라 교육 콘텐츠와 경험의 질에 대한 우려가 커지고 있다(Lin 등 2015; Thoma 등 2015). 조사 결과에 따르면, 특히 무료 온라인 리소스에서 많은 정보에 대한 피어-리뷰가 부족하여 [신뢰할 수 없는 정보]가 될 가능성이 높다. 온라인 학습 커뮤니티는 약간의 피어리뷰 기능을 제공할 수 있으며, 이는 "발표 후post-publication" 검토의 형태를 취할 수 있다. 이러한 노력의 대부분은 최근에 시작되었으며, 디지털 교육 컨텐츠의 품질 관리는 기존 자료에 비해 덜 견고할 수 있습니다. 일부 온라인 자료의 초점은 핵심 지식을 훼손하는 희귀하지만 흥미로운 콘텐츠에 집중된다는 관측도 추가되었습니다(Stuntz 및 Clontz 2016).

Concurrently, the growing importance of digital materials as sources of medical learning has resulted in concerns about the quality of the educational content and experience (Lin et al. 2015; Thoma et al. 2015). Findings show a lack of peer review of much of the information, particularly in free online resources (Sidalak et al. 2017; Thoma et al. 2015) which likely results in less reliable information. Online communities of learning may provide for some peer review functions, which may take the form of a “post-publication” review (Sidalak et al. 2017; Thoma et al. 2015). Many of these efforts have been initiated recently, and quality control for digital education content may be less robust relative to traditional materials. Added concerns included the observation that the focus for some online materials is on rare but exciting content to the detriment of core knowledge (Stuntz and Clontz 2016).

환자 정보(데이터 또는 이미지)가 임상 영역을 넘어서는 경우, [환자의 익명성]을 보장할 필요성과 함께 이러한 교육이라는 특정한 용도에 대한 [환자 동의 부족]에 대한 우려가 추가된다. 이는 특히 디지털 데이터 공유에서 문제가 발생하는데, 이는 신속하고 광범위한 전파의 가능성 때문이다.
When patient information (data or images) transcends the clinical realm, there are added concerns about the lack of specific patient consent for these educational uses, along with concerns about the need to ensure patient anonymity. This is particularly problematic with digital sharing of data, due to the potential for rapid, wide-spread dissemination.

 

세그먼트 3: 디지털 평가 및 평가
Segment 3: Digital assessment and evaluation

Sari는 환자의 치료에서 자신의 역할에 대해 평가받았고, 환자 관리의 최적성에 미치지 못한 측면을 반영했습니다. 이러한 평가와 성찰은 그녀와 그녀의 프로그램이 그녀의 진행 상황을 추적하는 데 도움이 되는 기관 e-포트폴리오에 저장되었습니다. 불행하게도, 환자는 좋은 임상 결과를 얻지 못했고 그녀의 치료에 관여한 병원과 임상팀을 상대로 소송을 제기했다. 사리는 의료기록과 더불어 환자의 법무팀이 기관의 e-포트폴리오에 업로드된 사건과 관련된 자신의 평가와 반성을 소환했다는 사실을 알고 실망했다.
Sari was evaluated on her role in the patient’s care and reflected on the aspects of her patient management that were less than optimal. These assessments and reflections were stored in an institutional e-portfolio that helped her and her program to track her progress. Unfortunately, the patient did not have a good clinical outcome and filed a lawsuit against the hospital and clinical team involved in her care. Sari is dismayed to learn that, in addition to the medical records, the patient’s legal team has subpoenaed her evaluations and reflections related to the case that had been uploaded to the institution’s e-portfolio.

세 번째 사례 세그먼트의 평가 차원에서는 평가에 디지털 데이터를 사용하는 것과 관련된 세 가지 주제에 주목합니다.

  • (1) 평가 수행 방법에 대한 새로운 접근법 
  • (2) 평가 데이터 활용 방법의 변경 
  • (3) 평가 데이터의 보안과 프라이버시, 그리고 의도하지 않은 사용 가능성에 대한 우려. 

The assessment dimensions of the third case segment draw attention to three themes related to the use of digital data in assessment:

  • (1) new approaches in how assessments are done;
  • (2) change in how assessment data are utilized; and
  • (3) concerns about the security and privacy of assessment data and their potential unintended use.

디지털 평가 시스템은 평가를 보다 쉽게 수행하고, POC(Point of Care) 평가를 활용하여 신뢰성을 높이고, 역량 중심의 평가를 운용함으로써 평가를 개선할 수 있습니다. 디지털 평가 데이터는 수집, 통합 및 분석이 용이하며, 이를 통해 훈련생의 역량에 대한 보다 완전한 그림을 바탕으로 판단을 촉진할 수 있으며, 교육생과 교사가 장기적인 피드백과 코칭을 지원할 수 있는 성찰 또는 리뷰를 할 수 있습니다. 마지막으로, 디지털 평가는 수습생 데이터를 임상 결과와 연결(Arora 2018)하고 프로그램 평가 및 평가 연구를 수행하며, 교수개발을 촉진할 수 있는 능력을 증가시킬 수 있다. 교육생들이 교수진, 학습 경험 및 전체 교육 프로그램에 대한 피드백을 제공하기 위해 전자 도구를 사용하는 것은 학습 참여와 활성화에 도움이 된다(Pilibert et al. 2017). 기술적으로 강화된 평가 프로그램은 디지털 관리 플랫폼과 전자 포트폴리오를 활용하며, 이러한 포괄적인 데이터 저장소가 새로운 표준이 됩니다. 디지털 평가의 사용 증가와 전자 도구의 품질, 신뢰성 및 효용성의 증가가 논의의 초점이 되어 왔습니다.

Digital assessment systems may improve assessments by making them easier to perform, increasing authenticity by utilizing point-of-care assessment, and operationalizing competency-focused assessment. Digital assessment data are easier to collate, synthesize, and analyze which can facilitate judgments based on a more complete picture of trainee competence and reflection or review by trainees and teachers that could support longitudinal feedback and coaching. Finally, digital assessments may increase the capacity to link trainee data to clinical outcomes (Arora 2018), conduct program evaluation and assessment research, as well as facilitate faculty development. Use of electronic tools for trainees to provide feedback on their faculty, learning experience, and overall educational program has benefits to learning engagement and activation (Philibert et al. 2017). Technologically enhanced programs of assessment will harness digital management platforms and electronic portfolios, with these comprehensive data repositories becoming the new standard (Gruppen et al. 2018; Lockyer et al. 2017). The growing use of digital assessments and increases in the quality, reliability, and utility of electronic tools has been a focus of discussion.

전자 포트폴리오의 사용이 증가함에 따라 구현, 커스터마이즈, 데이터 액세스 및 관리에 있어 몇 가지 과제가 발견되었습니다. 새로운 디지털 평가 프로세스가 빠르게 도입됨에 따라 평가 설계에 폭넓은 이해관계자가 참여해야 합니다. 디지털 평가가 (학습자가 매우 중시하는) 귀중한 대면 피드백을 대신해서는 안 됩니다.
As the use of electronic portfolios increases, studies have shown some challenges in implementation, customization, and data access and management (Dyer and Cohen 2018; Sonnenberg et al. 2017). With the rapid uptake of novel digital assessment processes, there must be wide stakeholder engagement in assessment design. Digital assessments should not take the place of valuable face-to-face feedback, which is highly valued by learners.

마지막으로, Bawa-Garba 사례(Dyer 및 Cohen 2018)에서 예시된 것처럼, 학습자 평가 데이터의 보안(2017년 코헨)과 의료-법적 조치에서의 발견 및 사용 가능성에 대한 심각한 우려가 남아있다. 이 사례는 정직한 성찰의 촉진과 디지털 평가 또는 성찰에서 임상적 결함을 식별하고 문서화하는 잠재적 의학적 법적 결과 사이의 긴장을 식별했다. 이러한 디지털 평가 시스템의 큰 잠재력에도 불구하고 구현이 현재의 최상의 평가 관행best assessment practice을 유지하고, 의도하지 않은 결과를 방지하려면 주의가 필요합니다. 교육기관은 학습자 평가 데이터를 특히 주의하고 보호해야 한다. 왜냐하면 학습자 평가 데이터가 [보안적 문제가 있거나not secure, 징벌적으로 사용될 가능성이 있다는 인식]이 생기면, 효과적인 교육과 지속적인 품질 향상에 필요한 성찰 문화를 저해할 수 있기 때문이다. (Dyer 및 Cohen 2018).
Finally, serious concerns remain regarding the security of learner assessment data (Cohen 2017) and its potential for discovery and use in medico-legal actions, as exemplified by the Bawa–Garba case (Dyer and Cohen 2018). This case identified tension between the promotion of honest reflection and the potential medico-legal consequences of identifying and documenting clinical deficiencies in digital assessments or reflections. Despite the great potential of these digital assessment systems, care is required to ensure that implementation maintains current best assessment practices (Norcini et al. 2018) and avoids unintended consequences. Institutions should be particularly cautious with and protective of learner assessment data as any perception that it is not secure, or has the potential to be used in a punitive way, will inhibit the reflective culture needed for effective education and continuous quality improvement (Dyer and Cohen 2018).

 

논의
Discussion

사회에 테크놀로지가 폭넓게 통합되고 있는 것을 고려하면, 테크놀로지가 의료와 의사 및 기타 의료 전문가의 교육에 점점 더 많은 영향을 미치고 있는 것은 놀랄 일이 아닙니다. 디지털 학습 환경의 3차원에 대해 특정하고 탐구한 테마는 학습자, 교사 및 의료 시스템에 영향을 미칩니다.
Considering the extensive integration of technology in society, it is no surprise that technology is having an increasing impact on healthcare and the education of physicians and other health professionals. The themes we identified and explored for the three dimensions of the digital learning environment have implications for learners, teachers, and health care systems.

[디지털 혁신에 대한 접근을 무시하거나 제한하는 것]과 같은 제도적 전략은 suboptimal한 성과만 초래할 수 있습니다. 학습자는 [기관의 통제 밖에 있는 개방형 커뮤니케이션 도구]를 사용하여 기관의 지시를 회피하거나 환자 데이터를 손상시킬 수 있는 회피책을 개발할 수 있습니다. 또한 의료 시스템 리더는 학습 환경에 대한 메이시 재단의 컨센서스 보고서(Macy Foundation 2018)에서 권장한 바와 같이, EHR 내의 디지털 인프라, 학습 관리 시스템 및 학습 기능을 포함한 학습을 지원하기 위한 디지털 기술의 채택을 지원해야 합니다. 외부 혁신을 활용하는 것은, 특히 기관이 위험, 유익성 및 기존 관리 및 학습 프로세스에 최적으로 통합될 수 있는 방법을 알고 있다면, 유익한 영향을 미칠 수 있습니다. (학습자나 교사 등) 최종사용자가 도입 전에 학습환경에서 디지털 테크놀로지를 확장하는 이니셔티브에 관여할 필요가 있음을 시사합니다. 디자인 사고(Gottlieb et al. 2017)와 같은 보다 최근의 혁신 패러다임은 의료 교육 환경에서 최종 사용자와 새로운 디지털 기술 간의 연결을 연결하기 위해 노력하고 있습니다.

Institutional strategies such as ignoring or restricting access to digital innovations may result in suboptimal outcomes. Learners may circumvent institutional dictates by using open communication tools outside of the institution’s control or develop workarounds that may compromise patient data. Health systems leaders also need to support the adoption of digital technology to support learning, including digital infrastructure, learning management systems, and learning capabilities within the electronic health record, as recommended in the Macy Foundation’s consensus report on the learning environment (Macy Foundation 2018). Harnessing external innovations can have a beneficial impact, especially when institutions are aware of their risks, benefits, and how they can be optimally integrated into existing care and learning processes, suggesting a need to involve end-users such as learners and teachers in initiatives to expand digital technology in the learning environment prior to their deployment. More recent paradigms of innovation such as design thinking (Gottlieb et al. 2017) are trying to bridge the connections between end-users and new digital technologies in the healthcare learning environment.

디지털 테크놀로지는, 교재나 그 외의 자원을 폭넓게 이용할 수 있게 해, 원격 의료나 원격 교육을 사용해 의료나 교수에 관한 전문 지식을 제공함으로써, 자원이 부족한 환경에서의 학습을 향상시킬 수도 있습니다. 디지털 원격 학습 자원은 개발도상국의 접근 교육을 강화하는 동시에 교직원의 효율성과 효율성을 높일 수 있는 접근성과 비용 효율적인 기회를 제공할 수 있다(Frehywot 등. 2013).
Digital technologies also can enhance learning in resource-poor environments, by making textbooks and other resources widely available, and bringing medical and teaching expertise across distances using telemedicine and tele-education. Digital distance learning resources can provide accessible, cost-effective opportunities to enhance access education in developing economies (Beux and Fieschi 2007), and concurrently enhance faculty efficiency and effectiveness (Frehywot et al. 2013).

우리는 디지털 학습 환경에 대한 연구에서 교육 분야와 사회문화 분야의 교집합을 발견했다. 이것은 놀라운 일이 아닌데, 테크놀로지가 사회문화 시스템, 규범 및 기대를 변화시키기 때문이다. 또한 [어떻게 사람과 테크놀로지가 상호작용하는지를 이해함]으로써 이익을 얻는 [사회공학적 시스템]이 등장하였기 때문이다. 이러한 맥락에서 디지털로 확장되는 광범위한 세계에 연결되어왔던 현재의 학습자가 [자연스럽게 테크놀로지를 사용할 수 있다는 것]을 인식하는 것이 중요합니다. 이것이 교수자의 디지털 테크놀로지 도입에도 변화를 가져올 수 있습니다. 동시에, 이 테크놀로지에 정통한 그룹은, 규제 및 시큐러티 요건을 이해하고 존중하는 것을 포함해, 의료에 있어서의 디지털 미디어의 한계와 위험에 대한 이해를 높일 필요가 있습니다. 3개 영역의 조사 내내 일관된 주제는 디지털 정보의 보안과 프라이버시 보호의 중요성에 있었다.환자와 학습자의 관계 여부에 관계없이 말이다.

We found overlap in research on the digital learning environment with the work in the education and sociocultural space. This is not surprising as technology changes sociocultural systems, norms, and expectations, with the sociotechnical systems that emerge from the introduction of technology benefitting from an understanding of how people and technologies interact (Coiera 2004). In that context, it is important to appreciate that learners have grown up connected to an extensively digitally augmented world, and use technology naturally. They may drive changes in the adoption of digital technology for their teachers (Franko and Tirrell 2012). At the same time, this technologically-literate group needs an enhanced understanding of the limitations and perils of digital media in healthcare, including understanding and respecting regulatory and security requirements. A consistent theme throughout the examination of the three domains was the importance of protecting the security and privacy of digital information (Rosenbaum 2010), regardless of whether it pertains to patients or learners.

디지털 학습 환경의 3차원에 대한 탐구를 바탕으로 디지털 기술을 학습 환경에 완전히 통합하기 위한 지역 기관 및 국가의 노력을 안내하기 위한 연습 포인트(박스 1)를 제공합니다.
Based on our exploration of three dimensions of the digital learning environment, we offer practice points (Box 1) to guide local institutional and national efforts to fully integrate digital technology into their learning environment.

결론들
Conclusions

급속히 진화하는 디지털 학습 환경에 대해 설명하고, 교육기관, 학습자 및 교사가 교육 및 환자 치료에 디지털 테크놀로지의 힘을 활용하기 위해 검토해야 할 과제와 함께 그 이점에 대한 관점을 제시했습니다. 디지털 커뮤니케이션, 디지털 학습 자원 및 디지털 평가의 3가지 차원을 조사함으로써 디지털 학습 환경의 정의를 더욱 명확하게 하기 위해 노력했습니다. 향후 작업은 임상 학습 환경의 디지털 영역 정의에서 더 큰 개념적 명확성을 달성하여 향후 조사와 개선 노력을 구체화하는 데 초점을 맞춰야 한다. 디지털 공간은 의학 교육의 혁신을 위한 중요한 영역이며, 이를 현재의 임상 및 교육 실무에 완전히 통합하려는 노력은 디자인 사고와 같은 혁신 패러다임의 적용으로부터 이익을 얻을 수 있다.
We described the rapidly evolving digital learning environment and offered a perspective on its benefits, along with challenges that need to be considered as institutions, learners, and teachers seek to harness the power of digital technology for education and patient care. We sought to provide added clarity to the definition of the digital learning environment by examining three dimensions: digital communication, digital learning resources, and digital assessment and evaluation. Future work should focus on achieving greater conceptual clarity in the definition of the digital domains of the clinical learning environment to help frame future investigations and improvement efforts. The digital space is a critical area for innovation in medical education, and efforts to fully integrate it into current clinical and educational practice may benefit from the application of current paradigms of innovation such as design thinking.


박스 1. 디지털 학습 환경에 관한 실용적인 힌트.

  • 환자 및 학습자 정보의 보안과 개인 정보 보호는 무엇보다 중요합니다.
  • 교육기관은 디지털 학습 환경에서 유창성fluency과 혁신을 추진하는 학습자와 교직원을 지원해야 합니다.
  • 시니어 임상의는 학습자가 자주 사용하는 디지털 자원의 정확성, 타당성 및 유용성을 검토 및 관리하는 데 중요한 역할을 할 수 있습니다.
  • 기관은 커뮤니케이션을 위한 신기술의 이용을 제한하기보다는 수용해야 한다.
  • 혁신이 도입되면 교육 및 학습 환경에 미치는 영향을 고려해야 합니다.
  • 리소스가 제한된 환경에 있는 학습자와 교직원은 고품질의 디지털 학습 리소스에 접근할 수 있어야 합니다.
  • 디지털 테크놀로지는 기존 테크놀로지를 활용할 수 있도록 설계해야 합니다.

Box 1. Practical tips on the digital learning environment.

  • The security and privacy of patient and learner information are paramount.
  • Institutions should support learners and faculty who are driving fluency and innovation in the digital learning environment.
  • Senior clinicians can have an important role in reviewing and curating the digital resources frequently utilized by learners for accuracy, validity, and utility.
  • Institutions should embrace rather than restrict the utilization of novel technologies for communication.
  • As innovations are introduced their impact on the teaching and learning environment should be considered.
  • Learners and faculty in resource-constrained settings should have access to high-quality digital learning resources.
  • Digital technologies should be designed to leverage existing 

 

 


Med Teach. 2019 Apr;41(4):385-390.

 doi: 10.1080/0142159X.2019.1567911. Epub 2019 Apr 11.

Communication, learning and assessment: Exploring the dimensions of the digital learning environment

Affiliations collapse

Affiliations

1a Department of Emergency Medicine , University of Saskatchewan , Saskatoon , Saskatchewan , Canada.

2b Department of Emergency Medicine , University of Calgary , Calgary , Alberta , Canada.

3c Department of Emergency Medicine , Queen's University , Kingston , Ontario , Canada.

4d Royal College of Physicians and Surgeons of Canada , ‎ Ottawa , Ontario , Canada.

5e McMaster Program for Education Research, Innovation and Theory (MERIT), Division of Emergency Medicine , McMaster University , Hamilton , Ontario , Canada.

PMID: 30973801

DOI: 10.1080/0142159X.2019.1567911

Abstract

Advances in technology make it possible to supplement in-person teaching activities with digital learning, use electronic records in patient care, and communicate through social media. This relatively new "digital learning environment" has changed how medical trainees learn, participate in patient care, are assessed, and provide feedback. Communication has changed with the use of digital health records, the evolution of interdisciplinary and interprofessional communication, and the emergence of social media. Learning has evolved with the proliferation of online tools such as apps, blogs, podcasts, and wikis, and the formation of virtual communities. Assessment of learners has progressed due to the increasing amounts of data being collected and analyzed. Digital technologies have also enhanced learning in resource-poor environments by making resources and expertise more accessible. While digital technology offers benefits to learners, the teachers, and health care systems, there are concerns regarding the ownership, privacy, safety, and management of patient and learner data. We highlight selected themes in the domains of digital communication, digital learning resources, and digital assessment and close by providing practical recommendations for the integration of digital technology into education, with the aim of maximizing its benefits while reducing risks.

복잡성 해결하려고 노력하기: 전문직정체성 발달의 창으로서 의과대학생의 환자 조우 성찰적 글쓰기(Med Teach, 2018)
Grappling with complexity: Medical students’ reflective writings about challenging patient encounters as a window into professional identity formation
Hedy S. Walda, Jordan Whitea, Shmuel P. Reisa,b, Angela Y. Esquibelc and David Anthonya

 

서론
Introduction

의학 교육의 기본 목표는 직업 정체성 형성(PIF)의 적극적이고 건설적이며 변화적인 과정이다. PIF는 "자아의 표현으로, 직업의 특성, 가치, 규범이 시간에 따라 내재화되면서 단계적으로 달성되며, 결과적으로 개인의 의사로서의 생각하고, 행동하고, 느끼게 한다." 의료 교육자는 학습자의 복잡하고 반복적인 PIF 프로세스를 지원하는 커리큘럼을 설계하여 성찰적이고 휴머니즘적이며 탄력적인 의료 전문가의 구성을 촉진한다(Wald 등 2015). 이와 같이, 우리는 PIF의 진화하는 프로세스(Fins et al. 2003) 내에서, 그리고 연습의 복잡함 내에서 수용 가능한 행동 과정과 "존재"의 방식에 대해 가치 중심의 선택을 하기 위한 도덕적 행위자(Pellegrino 1987)로서 학습자를 준비하고 "강화"하는 것을 목표로 한다(Bryan).nd Babelay 2009). 「실천적 지혜」를 육성하는 메타인식과 메타감정적 스킬을 가지는 성찰적인 프로의 자아를 개발하는 것은, 건강한 PIF 프로세스를 서포트하는 것으로, 전문직 역량의 핵심입니다(Wald and Reis 2010). PIF 프로세스의 핵심 추진 요소로서의 경험에서 학습하기 위한 가이드된 성찰은 전문 지식과 가치의 의미 있는 조합을 배양하는 데 도움이 됩니다(Rabow et al. 2010).

A fundamental goal of medical education is the active, constructive, transformative process of professional identity formation (PIF) (Wald 2015a). PIF, “a representation of self, is achieved in stages over time during which the characteristics, values, and norms of a profession are internalized, resulting in an individual thinking, acting, and feeling like a physician” (Cruess et al. 2014). Medical educators strive to design curricula supporting learners’ complex, iterative PIF process to facilitate the formation of reflective, humanistic, and resilient health care professionals (Wald et al. 2015). As such, we aim to prepare and “fortify” our learners as moral agents (Pellegrino 1987) within the evolving process of PIF for making values-laden choices (Fins et al. 2003) about acceptable courses of action and ways of “being” (Wald 2015b) within complexities of practice and when encountering difficult or morally ambiguous circumstances (Bryan and Babelay 2009). The development of a reflective professional self with metacognitive and meta-affective skills (Epstein 2008; Chick et al. 2009) fostering “practical wisdom” (Epstein 1999) supports healthy PIF process and is core to professional competency (Wald and Reis 2010). Guided reflection for learning from experience as a key driver of PIF process helps cultivate a meaningful combination of expertise and values (Rabow et al. 2010).

[상호작용적 (가이드된) 성찰적 글쓰기(IRW), Interactive (guided) reflective writing (IRW)][미래의 행동과 "존재"를 안내하는 더 깊은 의미와 이해를 달성하기 위한 지식과 경험에 대한 비판적 분석]으로 정의되는 [성찰 능력]을 육성할 수 있다(Mann 등 2007). [성찰 능력]은 [자기조절]과 [임상 상황에서 치료적 자아]의 사용에 필수적이며, 피드백과 진단 정확도의 효과적인 사용과 관련이 있다(Mamede 등 2008). IRW 연습은 다음과 같은 효과가 있다.

  • 공감적 참여의 촉진
  • 중요한 교육적 시점에서 통과 의식의 서포트,
  • 취약자에 대한 전문직업적 책임에 대한 신념 유도
  • 문화적 겸손윤리적 딜레마에 대한 이해 촉진

Interactive (guided) reflective writing (IRW) (Wald et al. 2009) can foster reflective capacity, defined as a critical analysis of knowledge and experience to achieve deeper meaning and understanding (Mann et al. 2007) guiding future behavior (Driessen 2008) and “being” (Wald 2015b). Reflective capacity is essential for self-regulation and use of therapeutic self in clinical situations (Head et al. 2012) and is linked to both effective use of feedback (Bing-you and Trowbridge 2009) and diagnostic accuracy (Mamede et al. 2008). IRW exercises may

  • foster empathic engagement (Dasgupta and Charon 2004),
  • support rites of passage at critical educational junctures (Wald et al. 2010),
  • elicit beliefs about professional responsibilities toward the underserved (Ross et al. 2010), and
  • promote both cultural humility (Lie et al. 2010) and understanding of ethical dilemmas (House et al. 2015).

최근 학생들의 성찰적 글쓰기(RW) 내에서의 낮은 성찰 능력은 전문직업적 실수와 관련이 있었다(Hoffman et al 2016). 임상실습 특이적 RW 연습은 학생들이 그들의 성찰적 실천을 강화하고, 임상실습 경험이 그들의 학습과 개인 및 전문적 발전에 미치는 영향을 고려할 수 있는 기회를 제공한다. 또한, RW는 의료 및 산부인과 레지던트들의 자기 성찰과 전문성을 증진하고 개업의들의 공감을 증진하기 위해 의료 전문가 수명 주기 전반에 걸쳐 효과적으로 사용되어 왔다(Misra-Hebert et al. 2012). (비판적 성찰을 강화하는) IRW를 은유적으로 "회복탄력성 운동"이라고 표현하듯, 관점수용 및 공감적 관심에 대한 성찰 기술은 번아웃으로부터의 보호 효과가 있습니다(Lamoth 등 2014).

Recently, lower reflective ability within students’ reflective writings (RWs) was associated with professionalism lapses (Hoffman et al. 2016). Clerkship-specific RW exercises offer opportunities for students to enhance their reflective practice, and to consider the impact of clerkship experiences on their learning and on their personal and professional development (Carr and Carmody 2006; Fischer et al. 2008; Levine et al. 2008; White 2008; Plack et al. 2010; Bradner et al. 2015) Furthermore, RW has been used effectively throughout the medical professional life cycle for promoting self-reflection and professionalism in medical and obstetric residents (Brady et al. 2002; Learman et al. 2008) as well as enhancing empathy among practicing physicians (Misra-Hebert et al. 2012). Reflective skills in perspective taking and empathic concern may be protective against burnout (Lamothe et al. 2014), with IRW (enhancing critical reflection) metaphorically described as a “resiliency workout” (Wald et al. 2015).

이에 따라, 우리는 "마음의 일work of the heart"을 포함한 임상 경험에 대한 서사적 성찰을 위한 "교육적pedagigic 공간"의 가치에 관심을 가져왔다. "새로운emerging 의사들이 자신의 경험을 성찰, 비판적 인식, 문화적 겸손 및 공감을 구체화하는 전문 정체성(PI)에 더 완벽하게 통합할 수 있는 기회를 제공"한다. 2009년에는 경험적 학습을 위한 가정의학의 핵심 개념에 대한 비판적 성찰 촉진을 포함한 이러한 목표를 달성하기 위해 가정의학 사무원(FMC) 내 IRW 커리큘럼을 개발하였다(Wald et al. 2015). 커리큘럼 구조는 1학년부터 2학년까지의 학생의 IRW 경험을 바탕으로 하며, 4개의 성찰 티어로 구성되어 있습니다. 

  • (1) 커뮤니티 멘토 경험(롤 모델링), 
  • (2) IRW(글쓰기 프로세스 자체), 
  • (3) 소그룹의 협업적 성찰과 전문직간 교수팀의 피드백 
  • (4) 구조화된 프레임워크에 의해 지도되는 소그룹 교수진의 개별화된 형성적 피드백을 통해 보다 심층적인 성찰 프로세스를 촉진합니다. 

In line with this, we have been interested in the value of “pedagogic spaces” for narrative reflection on clinical experiences (Clandinin and Cave 2008) including the “work of the heart” (Freshwater and Stickley 2004) to “offer emerging physicians opportunities to more fully incorporate their experiences into a professional identity (PI) that embodies reflection, critical awareness, cultural humility, and empathy” (Wear et al. 2015, p. 289). In 2009, we developed an IRW curriculum within the Family Medicine Clerkship (FMC) to meet such objectives including promoting critical reflection on key concepts of family medicine for experiential learning, recently described in more detail (Wald et al. 2015). The curriculum structure builds on students’ IRW experience from years 1–2 and includes four reflection tiers:

  • (1) community mentor experience (role modeling),
  • (2) IRW (the writing process itself),
  • (3) small-group collaborative reflection and feedback from an interprofessional faculty team, and
  • (4) individualized written formative feedback from small group faculty who are guided by structured frameworks (Reis et al. 2010; Wald et al. 20102012), promoting a more in-depth reflective process (Wald et al. 2015; Wen et al. 2015).

성찰적 자기평가(전문성 발달의 구성요소)를 촉진할 뿐만 아니라, 소규모 그룹 프로세스에서 성찰적 글쓰기(RW)는 환자 치료 프로세스에 대한 통찰력을 배양하고 학생과 실무자의 복지를 촉진합니다.

In addition to promoting reflective self-assessment (as a component of professional development), reflective writing (RW) in a small group process cultivates insights into the process of patient care and promotes student-practitioner well-being (Shapiro et al. 2006).

우리는 (의료 업무에서 도전적이고 의미 있는 순간을 포함하여) [결정적 사건에 대해 쓰는 것]이 전문적인 경험의 맥락에서 학습자의 가치와 태도를 다루는 효과적인 수단이라는 점에서 "도전적이거나 어려운" 환자 조우 RW 프롬프트를 선택했다(Branch 2005). [어려운 환자와의 만남]을 성찰하는 것은 좌절, 분노, 불확실성과 같은 감정에 대한 자각뿐만 아니라 자기 조절과 감정이 의료 행위에 미치는 영향에 대한 통찰력도 발달시키는 데 도움을 줄 수 있다.
We selected a RW prompt of a “challenging or difficult” patient encounter given that writing about critical incidents (including challenging and meaningful moments in medical practice) is an effective means of addressing learners’ values and attitudes in the context of professional experiences (Branch 2005). Reflecting upon challenging patient encounters can also help develop self-awareness of emotions such as frustration, anger and/or uncertainty as well as insights into self-regulation and the impact of emotions on medical practice.

학생들은 의대 3학년에 students에서 practitioner로 전환하면서 극적인 변화를 겪는다. 의과대학 3학년은 "훈련의 목표 지점, 전문적인 기술과 환자에 대한 태도 개발의 중요한 단계"이다(Chen 2012). 의대생 발달에 영향을 미치는 3학년 동안의 '감정적 해방emotionally evocative 사건'에는 임상팀의 역할에 대한 적응, 적절한 멘토와 역할 모델 특정, 환자의 옹호 및 요구에 대한 대응 학습, 가장 보람 있는 진로 선택 등이 포함됩니다. 학생들에게 3학년 경험을 이해하고 대처하는 방법을 가르치는 보다 체계적인 방법(공식적인 성찰 연습 커리큘럼 포함)의 필요성이 점점 더 인식되고 있다.
Students undergo dramatic changes in the third year of medical training as they transition from students to practitioners. The third year of medical school is a “pivotal point in training, a crucial step in the development of professional skills and attitudes toward patients” (Chen 2012). “Emotionally evocative” events affecting medical student development within the third year include adjusting to roles on clinical teams, identifying appropriate mentors and role models, learning to advocate for patients and respond to their needs, and choosing a career path that is most rewarding (Murinson et al. 2008). The need for more structured ways (including formal reflective practice curricula) to teach students how to understand and cope with their third-year experiences is now increasingly recognized (Treadway and Chatterjee 2011).

RW는 PIF(Wong and Trolope-Kumar 2014)의 역동적이고 건설적인 성격의 "창구"로 설명되어 왔지만, 학생들의 RW(3학년 포함)에서 드러나는 새로운 PIF 프로세스는 충분히 검토되지 않았다. FMC 학생의 RW에 대한 연구를 실시해, 환자의 만남에 대한 도전의 경험과 전문성 향상에의 공헌에 대해 자세하게 학습했습니다.
While RW has been described as a “window” into the dynamic, constructed nature of PIF (Wong and Trollope-Kumar 2014), the emerging PIF process as revealed in students’ RWs (including third-year students) has been understudied. We undertook a study of FMC students’ RWs to learn more about their experience of challenging patient encounters and its contribution to their professional development.

 

방법들
Methods

샘플 및 데이터
Sample and data

(구조화된 글쓰기 프롬프트에 대한) 두 가지 RW 과제를 완료하는 것은 6주 FMC의 필수 커리큘럼 구성요소입니다. 어려운/도전적인 환자 조우 관련 RW는 2010년 5월부터 2012년 10월까지 사무원 코디네이터에 의해 FMC에 참여하는 학생들로부터 수집되었습니다. 이 그룹에서는 다양성을 극대화하기 위해 3학년 초·후반 학생들의 내러티브가 포함된 50개의 RW가 무작위로 선택되었다.
Completion of two RW assignments (to structured writing prompts) is a required curriculum component of our six-week FMC. RWs about a difficult/challenging patient encounter were collected by the clerkship coordinator from students participating in the FMC from May of 2010 to October of 2012. From this group, 50 RWs which included narratives from students both early and late in their third year for maximum diversity were randomly selected.

 

분석.
Analysis

단계 1 – 테마 특정
Phase 1 – Identification of themes


연구팀은 시험 단계 훈련 중 몇 가지 내러티브의 주제 분석과 후속 데이터 분석을 위해 몰입 결정 과정을 이용했다. 몰입/결정화는 질적분석 프레임워크(Borkan 1999)로, "보고 가능한 해석에 도달할 때까지" 성찰 및 직관적 통찰력과 결합된 데이터의 집중적인 텍스트 검토 주기를 포함한다. HW, JW, AE의 연구원들은 개별적으로 서술문을 읽고 주제와 패턴에 대해 메모했다. 분석팀(HW, JW, AE, DA)은 정기적으로 만나 각 팀원의 교육 및 교육 관점의 근본적인 편견이 데이터 해석에 어떻게 영향을 미치는지 논의하고, 연구 결과를 공유하며, 주제 발견 간의 중복과 차이점을 논의하고, 서로 다른 해석을 탐색하고, 궁극적으로는 테마의 누적 목록을 종합했습니다. 

Members of the research team utilized an immersion-crystallization process for thematic analysis of several narratives during a pilot phase training and for subsequent data analyses. Immersion/crystallization is a qualitative analysis framework (Borkan 1999) involving cycles of concentrated textual review of data, combined with reflection and intuitive insights, “until reportable interpretations” are reached. Researchers HW, JW, AE individually read the narratives and took notes about themes and patterns. The analysis team (HW, JW, AE, DA) met regularly to discuss how each team member’s underlying biases from their training and teaching perspectives may be affecting their interpretation of the data (Barry et al. 1999), share their findings, discuss overlap and differences among their findings of themes, explore divergent interpretations, and, ultimately, to compile a cumulative list of themes.

조사 결과에 대한 토론과 비교를 통해 차이를 조정하고 포화를 결정하였습니다. 그 후 연구원들은 각각의 주제에 대한 최종 합의뿐만 아니라 최종 주제 체계에 대한 합의에 도달하기 위해 그들의 새로운 주제들을 비교하기 위해 만났다. 이 분석 과정에서는 내러티브 내에서 26가지 주제를 식별했다. 연구팀은 그 다음 주제를 토픽 카테고리로 분류하는 방법에 대한 합의에 도달하기 위해 반복 주기의 주제 목록으로 작업했다. 이 접근방식을 통해 팀은 텍스트 전체를 사용하여 작업하고, 여러 팀원이 여러 번 텍스트를 검토하고, [주제와 그룹을 도출]할 수 있었습니다. 이 단계가 완료된 후에야 직접 콘텐츠 분석을 위한 이론적 프레임워크가 논의되어 2단계에서 사용되었습니다.

Through discussion and comparison of findings, differences were reconciled and saturation determined. The researchers then met to compare their emergent themes in order to reach consensus on a final thematic scheme, as well as final consensus on each theme. This analysis process identified 26 distinctive themes within narratives. The research team next worked with the resulting list of themes in iterative cycles to come to a consensus of how to group the themes into topical categories. This approach allowed the team to work with the texts in their entirety, to go through the texts multiple times by multiple team members, and to derive themes and their grouping. Only after this phase was completed was a theoretical framework for directed content analysis discussed and subsequently used for phase 2.

단계 2 – 주제와 카테고리의 해석 및 모델 개발에 대한 적용
Phase 2 – Interpretation of themes and categories and application to the development of a model

마지막으로, 이러한 주제와 카테고리는 직접 내용분석을 사용하여 추가로 분석되었습니다. 내용분석에 대한 직접적인 접근법의 목표는 [현상에 대한 이론적 프레임워크를 검증하거나 개념적으로 확장하고 초기 코딩 주제 또는 코드 간의 관계를 결정하는 데 도움이 되는 것]입니다. 이 데이터 분석의 최종 단계는 이전 단계를 통해 RW 내의 중심 요소로 식별된 PIF의 구축을 지향했다.
Finally, these themes and categories were further analyzed using directed content analysis (Hsieh and Shannon 2005; Karnieli-Miller et al. 2010). The goal of the directed approach to content analysis is to validate or conceptually extend a theoretical framework about a phenomenon and help determine the initial coding theme or relationships between codes (Hsieh and Shannon 2005). This final phase of data analysis was directed at the construct of PIF, identified through the previous phase as a central element within the RWs.

이 2단계 분석은 전체 분석팀에 의해 수행되었으며, PIF 내 주제 및 범주 상호 관계를 논의하기 위해 여러 번 만났다. 저자 SPR은 분석의 신뢰성과 신뢰성에 대한 경험이 풍부한 외부 감사인 역할을 했습니다. 이 과정과 모든 저자들 간의 추가 협의를 통해, 팀은 데이터에 의해 뒷받침되고 이론적으로 의미가 있는 학생 PIF의 새로운 기능 모델에 대한 합의에 도달했다(아래에서 논의). 전문가간 연구팀은 다양한 전문지식을 활용하여 관련 연구원의 특성과 질적 평가에 대한 반사성을 제공하였다.
This Phase 2 analysis was conducted by the entire analysis team, which met several times to discuss thematic and category interrelationships within PIF. Author SPR served as an experienced external auditor of trustworthiness and credibility of the analysis. Through this process and further consultations between all authors, the team reached consensus on an emergent functional model of student PIF that was supported by the data and made theoretical sense (discussed below). The interprofessional research team brought a wide array of expertise to the endeavor, contributing pertinent researcher characteristics and reflexivity to the qualitative assessment (O’Brien et al. 2014).

조사 결과
Findings

26개의 독특한 주제를 가진 5개의 주제 카테고리(표 1)가 학생들의 RW 분석에서 나타났다. 주제 스펙트럼의 극성이 명백할 때(아래 설명되어야 함) 여러 개의 예시와 함께 각 주제의 구체적인 예가 보충 표 2에 제시되어 있다. 긴급 PIF 모델은 그림 1에 나와 있다.
Five distinct thematic categories with 26 unique themes (Table 1) emerged from analysis of the students’ RWs. Specific examples of each theme, with multiple illustrative quotes when polarities of a theme’s spectrum were apparent (to be described below), are provided in Supplementary Table 2. The emergent PIF model is presented in Figure 1.

 

주제 카테고리
Thematic categories

첫 번째 주제 카테고리인 [감정의 역할]은 학생들의 RW에 기술된 것처럼 강력한 감정을 포착합니다. 학생들은 종종 자신의 강한 감정에 대한 통찰력을 전달했는데, 이는 고통이나 불편함과 관련될 수 있고 왜 특정한 상호작용이 어려운지를 더 잘 이해하도록 도울 수 있다. 학생들은 또한 다른 사람들의 감정을 자주 인지했다(환자, 가족, 주치의). 마찬가지로, 이러한 인식은 약간의 불편함을 야기하거나 방문의 복잡성에 대한 이해를 증진시킬 수 있다. 학생들은 종종 두 가지 특정한 감정, 즉 공감과 연민(또는 더 구체적으로 말하면 환자에 대한 공감 또는 공감을 경험하거나 경험하지 않는 것에 대한 감정 반응)과 격려와 환멸의 감정과 관련된 두 가지 감정들에 대해 글을 씁니다. 
The first thematic category, the role of emotions, captures powerful emotions as described in the students’ RWs. Students frequently conveyed insight into their own strong emotions which could be associated with distress or discomfort and which could help them better understand why a particular interaction was challenging. Students were also frequently aware of the emotions of others (patients, family members, attending physicians). Similarly, this awareness could create some discomfort and/or promote increased understanding of the complexity of the visit. Often, students wrote about two specific emotions – empathy/compassion (or more specifically, their emotional response to experiencing or not experiencing empathy or compassion for a patient), and associated feelings of encouragement or disillusionment.

예를 들어, 한 학생은 이렇게 썼다. 갑자기 수치심에, 나는 그녀의 가정 상황이 엉망이라는 것을 깨달았고, 그녀는 일주일도 안 되어 두 번째로 병원에 입원했지만, 나는 내력 수집을 시도하는 동안 그녀를 극복해야 할 장애물로 빠르게 지목했다. 앞으로 나아가기 위한 마비된 시도에서 공감을 표시하는 것을 소홀히 하고 인터뷰를 어떻게 진행해야 할지 생각만 했습니다. 

For example, one student wrote, “With an abrupt sensation of shame, I realized that her family situation was a mess, she was back in the hospital for the second time in less than a week, and yet during my attempt to collect a history I had quickly pegged her as an obstacle to overcome. In my paralyzed attempt to move forward, I neglected to display any empathy and merely thought of how best to move the interview forward.” 

수치심을 느끼고 인식하고 이를 학습 경험으로 활용할 수 있는 것은 이 학생이 개인 및 직업적 성장을 위한 도전을 높이 평가하면서 미래의 직업에서 도전하는 환자의 상호작용을 보다 효과적으로 관리하는 데 도움이 될 수 있습니다. 이 인용문은 학생들이 공감에 어려움을 겪었던 환자와의 만남에 대해 얼마나 자주 글을 썼는지 보여주며, 어떻게 하면 이런 일이 재발하지 않도록 할 수 있을지에 대해 반성하고 있다.

Feeling shame, recognizing it, and being able to use it as a learning experience may help this student more effectively manage challenging patient interactions in his/her future career while appreciating the challenge as cultivating personal and professional growth. This quote illustrates how students frequently wrote about patient encounters in which their empathy had been challenged but expressed discomfort with this and reflected on how they might be able to prevent this from recurring.

두 번째 주제 범주인 [인지의 역할]은 학생들이 RW에서 자주 겪는 성찰적 사고 과정을 설명한다. 학생들은 "실생활에서 배우는 것과 책에서 배우는 것"을 구분해야 하는 도전적인 환자 상호작용에 대해 썼을 뿐만 아니라, 이전 경험을 바탕으로 환자를 분류하거나 라벨을 붙이기 시작하는 것에 대해서도 썼다(예: "약물 찾는 사람"). 학생들의 RW는 의사가 되는 것이 무엇을 의미하는지에 대한 이해의 변화와 씨름하고 있으며, 환자 진료와 관련된 것으로 인식되는 자신의 무능함을 고려한다고 설명했다. 이 카테고리의 테마는 학생들이 성찰을 통해 능동적인 인지 과정에 참여하고 있으며, 이는 도전을 제시하는 환자에 대한 반응을 형성하고 자신의 전문성 발달에 대한 사려 깊은 참여를 용이하게 한다는 것을 나타냅니다. 

The second thematic category, the role of cognition, describes thought processes that students frequently reflected upon in their RWs. Students wrote about challenging patient interactions that required them to distinguish between “learning in real life versus learning from a book” as well as about beginning to categorize or even label patients based on previous experiences (e.g. “drug seekers”). Students’ RWs described grappling with changes in their understanding of what it means to be a physician and considering their own perceived incompetence as it related to patient care. The themes in this category indicate that students are engaging in an active cognitive process through reflection that helps shape their response to those patients who present challenges and facilitates thoughtful engagement in their own professional development.

한 학생이 썼듯이, "이 상황은 특히 제게는 어려웠습니다. 왜냐하면 이것은 환자가 마취제를 찾는 행동을 보이는 첫 번째 환자였기 때문입니다. 만약 제가 의사와 함께 있는 환자를 보지 않았다면 제가 그 행동을 알아채지 못했을지도 모르겠습니다. 곰곰이 생각해보면서, 의사와 이야기를 나눴는데, 그녀는 이 환자들에게 찾아봐야 할 몇 가지 징후를 설명해줬고, 더 말이 되는 일이었습니다. 의대생으로서 이런 상황을 미리 인지하고 대처하는 법을 배워야 합니다. 또 다른 사람은 환자를 평가하는 데 있어 병력 파악이 가장 중요한 부분이라는 말을 몇 번이고 듣지만 환자는 로봇이 포함된 정보가 아니라 실제 사람이라는 것을 기억해야 한다. 사회적 상호 작용의 기본 원칙을 사용할 필요가 있습니다."

As one student wrote, “This situation was particularly challenging for me because this was my first patient encounter where the patient was exhibiting narcotic-seeking behavior. I am not even sure I would have recognized the behavior if I would not have seen the patient with the physician. In reflection, I spoke to the physician and she explained to me some of the signs to look for with these patients and things made more sense. As a medical student new to the clinical scene, I have to learn how to recognize situations like this ahead of time and learn how to react to them.” Another wrote, “Additionally, we are told again and again how getting the history is the most important part of evaluating the patient, but we have to remember that patients are not information containing robots, but instead real people. We need to use basic principles of social interaction.

세 번째 주제 카테고리는, [상황적 맥락에 맞춰 행동으로 반응하는 것]으로, 학생들이 [특정한 상황이 그들의 행동에 특정한 변화를 야기하고 있거나, 야기해야 한다는 것]을 적극적으로 인식하는 과정을 묘사한다. 학생들은 환자와의 만남에서  코스를 바꾸는 상황을 기술했다. 자신이 압도당하거나, 상황을 차선적 방식으로 처리하거나, 다른 접근법을 취해야 한다는 것을 인식하기도 했다. 그들은 효과적인 프로토-의사proto-physician로서 계속 기능하기 위해 그들이 무엇을 해야 하는지 깨달았을 뿐만 아니라, 그들이 그들의 환자들을 위해 무엇을 해야 한다고 느꼈는지 묘사했다.

The third thematic category, behaviorally responding to situational context, describes the process by which students actively recognize that a particular situation is causing, or should cause, a specific change in their behavior. Students wrote about steps that they took during patient encounters to change course when they recognized that they were overwhelmed, suboptimally managing the situation, or otherwise needing to take a different approach. They described things they did for their patients that they felt made an impact as well as what they realized they needed to do for themselves to continue to function as effective proto-physicians.

예를 들어, 한 학생은 다음과 같이 썼다. "나는 그것이 상황을 악화시킬 것이라고 생각하기 때문에 그녀의 문화적 비방에 대응하지 않고 회피했다. 저는 사실 그녀가 그런 비방들을 믿지 않는다고 느꼈습니다.그것들은 단지 항생제의 문턱을 낮추기 위해 저와 직원들 사이에서 출세를 유도하는 데만 도움이 된다고 느꼈습니다. 도전적인 환자의 상호작용에 대한 특정한 반응을 인식하고 선택하는 것은 이 학생이 잠재적으로 감정적으로 흥분한 만남을 효과적으로 탐색하는 데 도움이 되었습니다. 

For example, one student wrote, “I chose to avoid addressing her cultural slurs because I feel that it would only have inflamed the situation. I actually felt that she did not believe those slurs, but that they served only to elicit a rise out of myself and the staff in order to lower our threshold for antibiotics.” Recognizing and specifically choosing a particular response to a challenging patient interaction helped this student effectively navigate a potentially emotionally charged encounter.

또 다른 학생은 "따라서 다음 번에 환자가 나를 병신이라고 잘못 부르면, 아마도 나는 다른 많은 사람들이 자신의 역할을 다하고 있다는 것을 상기시켜준 것에 대해 조용히 감사할 것이다."라고 썼다.

Another student wrote, “So the next time a patient wrongfully calls me a jerk, maybe I’ll silently thank him a little for reminding me that there are plenty of other people out there pulling their weight.” 

이러한 인용문은 잠재적으로 도발적인 상황에서 학생의 반응을 선택하게 한 인식을 나타내며, 학생이 경험될 수 있는 모욕 등 환자의 부정적인 의견에 대한 관점을 얻는 데 도움을 줍니다. 이 범주는 환자가 마주치는 과정에서 학생들이 자신의 행동을 적응시키는 방법을 배우는 성숙(및 회복탄력성 구축) 과정을 포착합니다.

These quotes illustrate the awareness informing the student’s response choice within a potentially provocative situation, and help the student gain perspective on patients’ negative comments including insults that may be experienced. This category captures the maturation (and/or resilience building) process by which students learn to adapt their behaviors to challenges within patient encounters.

네 번째 주제 범주인 [PIF에 영향을 미치는 환자 요인]은 학생이 의사로서의 전문적 성장에 기여하는 것으로 식별한 환자 요소를 포함합니다. 이러한 요인에는 환자 및 그 가족과의 의견 차이, 환자의 건강에 영향을 미치는 사회적 문제, 환자에 대한 신뢰에 대한 의문을 제기하는 문제가 포함된다. 

The fourth thematic category, patient factors that impact PIF, includes patient factors identified by students as contributing to their professional growth as physicians. Such factors include disagreements with patients and their families, social issues that impact patients’ health, and issues that raise questions of trust in patients.

한 학생은 다음과 같이 썼다. "나는 통제된 약물을 피하는 유일한 예외를 제외하고, 다른 환자들처럼 약물을 찾는 환자들을 계속 치료하는 것이 매우 중요하다고 생각한다. 저는 이것이 어떤 사람이 어디에서 왔는지, 어떤 경험을 했는지, 그리고 그것이 환자의 행동의 특성에 어떻게 영향을 미치는지 이해하는 좋은 예라고 생각합니다. 또 약물 남용 문제가 있는 사람들이 실제 병리학 앞에서 적절한 통증 조절과 관리를 받을 수 있도록 하는 것이 제가 직면한 딜레마의 완벽한 예라고 생각합니다. 

One student wrote, “I really think that it is extremely important to continue to treat drug seeking patients like any other patient with the only exception being to avoid controlled substances. I think that this is a great example of understanding the background of where someone is coming from and what they have experienced and how it influences the specific nature of the behaviors of patients. I also think that it is a perfect example of the exact dilemma I am faced with, which is to ensure that those with narcotic abuse issues receive proper pain control and management in the face of real pathology.” 

이 딜레마(진통제에 어려움을 겪은 전력이 있는 환자의 통증 관리 방법)는 학생 자신의 전문성 발달에 영향을 미치는 약물 남용 환자와 관련된 문제로 학생에 의해 인식된다.

  • 학생들은 미래에 이러한 만남들을 어떻게 인식하고 관리할 것인가?
  • 이러한 유형의 환자 상호작용이 야기할 수 있는 문제를 인지한 후, 학생은 향후 실습에서 어떻게 적절한 관리 표준을 유지할 것인가?

높은 자기 인식과 함께 이러한 요소들을 비판적으로 성찰하면 학생들이 미래의 환자와 상호작용하고 치료하고자 하는 방법에 대한 이해를 촉진할 수 있으며, 잠재적으로 건강한 PIF를 지원할 수 있습니다.

This dilemma – how to manage pain in a patient with a history of difficulties with pain medications – is recognized by the student as an issue associated with patients with substance abuse that impacts the student’s own professional development –

  • How will the student perceive and manage these encounters in the future?
  • How will the student maintain appropriate standards of care in future practice after recognizing the challenges that this type of patient interaction can create?

Critically reflecting on these factors with heightened self-awareness can foster students’ understanding of the way they wish to interact with and treat their future patients, potentially supporting healthy PIF.


다섯 번째 주제 범주, [PIF에 영향을 미치는 외부(비환자) 요인]에는 역할 모델(일반적으로 교훈), 환자 치료 관계의 종적 성격의 영향1차 진료와 관련된 특정 속성이 포함된다. 환자 자신과는 특별히 관련이 없지만 잠재력이 있는 요인PIF에 영향을 줍니다. 

The fifth thematic category, external (non-patient) factors that impact PIF includes behaviors and attitudes of role models (usually preceptors), the impact of the longitudinal nature of patient care relationships, and certain attributes specific to primary care; factors which are not specifically related to the patients themselves but which potentially impact PIF.

예를 들어, 한 학생은 이렇게 썼다. "어떻게 하면 나를 더 신뢰할 수 있는 사람으로 만들 수 있을지 모르겠지만, 나는 내가 의대생이 아닌 실제 의사가 되는 미래에 그것이 문제가 되지 않기를 바란다. 시간과 반복적인 상호작용이 있어야만 어느 정도의 신뢰가 쌓일 수 있다고 생각하기 때문에 종적 치료를 할 수 있다면 더 좋을 것입니다. 이 학생은 의사-환자 치료 관계의 유형(예: 지속적 대 일시적)을 성찰하여 미래의 의사-환자 관계에서 서로 다른 치료 시스템이 수행할 수 있는 역할을 고려하고 있다. 이러한 요소들 또한 학생들의 직업적 성장에 중요한 기여를 할 수 있다.

For example, one student wrote, “I don’t know how to make myself come across as more of a trustworthy person, but I hope that won’t be as problematic in the future when I will be not just a medical student, but the actual doctor. It would be even better if I could provide longitudinal care, because I think certain levels of trust can only be established with time and repeated interactions.” This student, reflecting upon types of physician–patient care relationships (e.g. continuous versus episodic), is considering the role that different systems of care may play in future physician–patient relationships. These factors too, can be important contributors to students’ professional growth.

 

전체 모델
Overall model

우리는 학생들의 RW에서 [PIF 드러남 모델](그림 1)을 개발했다. 학생 자신의 배경과 이전의 의학 경험에서 얻은 내적 감정 및 인식은 외부(환자 및 비환자 모두) 요소와 결합되어 환자와 상호작용할 때 학생들에게 영향을 미치는 일련의 입력 정보를 생성합니다. 환자와 함께 검사실에 있는 동안, 추가적인 새로운 요소들이 작용하고, 학생들은 (방의 실제 물리적 공간뿐만 아니라 그들 자신의 "정신적" 공간에 있는) 감정, 인식, 그리고 외부 영향을 빠르게 처리하고 있다. RW는, 「공감/공감 부족, 격려/환멸, 책으로부터 배우는 것, 환자로부터 배우는 것, 그리고 한 학생이 쓴 것처럼, 「이상화된 비전과 살아 있는 현실과의 불일치」와 같은 양극화를 처리하는 것이 종종 수반된다고 밝히고 있습니다. 모델 내의 "긴급" 단계는 의사로서의 직업적 정체성의 출현과 관련이 있습니다.
We developed a model (Figure 1) of emerging PIF derived from students’ RWs. The students’ own backgrounds, as well as internal emotions and cognitions from previous experiences in medicine, merge with external (both patient and non-patient) factors to create a group of inputs impacting students as they interact with their patients. While in the examining room with patients, additional new factors come into play, and students (both in their own “mental” space as well as in the actual physical space of the room) are rapidly processing the emotions, cognitions, and external influences that coalesce within them. The RWs reveal that processing often involves polarities such as empathy/lack of empathy; encouragement/disillusionment; learning from books/learning from patients and as one student wrote, “dissonance between my idealized visions and the lived reality.” The “Emergence” phase within the model relates to the emergence of a professional identity as a physician.

논의
Discussion


PIF는 시간이 지남에 따라 진화하며 학습 상황에 영향을 받습니다. 일부는 임상적 만남 내에서 구조화됩니다. 경험에 대한 안내된 성찰guided reflection(예: IRW 사용)은 형성적, 능동적, 건설적인 PIF 과정을 지원할 수 있다. 3학년 사무직 학생들의 RW에 대한 연구 결과는 PIF의 새로운 모델의 4가지 구성 요소 각각에 대한 주제와 주제 카테고리를 포함한다. 내부 및 외부 요인, 처리 및 (프로패셔널 정체성의) 출현. PIF의 고유한 복잡성을 포착하고 PIF 프로세스에 대한 이해 수준을 높일 수 있는 방법으로 복잡한 정보를 정리하는 데 도움이 되는 PIF 신흥 모델(그림 1)을 제공합니다. 본 연구는 가정의학과 관련된 주제를 넘어 평생 프로세스 내에서 계속 진화하는 새로운 또는 "예상적인anticipatory" 직업 정체성의 모델을 지원하는 것으로 "RW의 파워 툴"의 범위를 넓힌다. "우리는 경험에서 배우는 것이 아니라, 경험을 성찰하면서 배우는 것"이라는 Dewey의 공식에 따라, 우리의 연구는 PIF 출현 내에서 변혁적 학습(Mezirow 1991)을 지원하기 위해 환자와의 만남에 도전하는 경험과 그 경험에 대한 구조화되고 안내된 성찰로서의 IRW 연습을 결합한다.

PIF evolves over time and is influenced by learning situations, some structured within clinical encounters. Guided reflection on experience (e.g. using IRW) may be formative and can support the active, constructive, developmental process of PIF (Wald 2015a). The outcomes of our study of third-year Clerkship students’ RWs include themes and thematic categories for each of the four components of an emergent model of PIF, i.e. Internal and External Factors, Processing, and Emergence (of professional identity). We offer the PIF emergent model supported by our findings (Figure 1) as helping to capture the inherent complexity of PIF and organize complex information in a way that can increase our level of understanding of the PIF process. Our study broadens the scope of the “power tool of RW” (Wald et al. 2015) beyond themes related to family medicine (Bradner et al. 2015) to those supporting a model of emerging or “anticipatory” professional identity (Mavor and McNeill 2015), which continues to evolve within a lifelong process. In line with Dewey’s formulation that “we do not learn from experience, we learn from reflecting on experience” (Dewey 1933), our study combines the experience of challenging patient encounters with an IRW exercise as structured, guided reflection on that experience to help support transformative learning (Mezirow 1991) within PIF emergence.

[도전적인 환자 조우]라는 주제에 관한 구조화된 글쓰기 프롬프트는 초기 전문직의 "혼란스러운 딜레마disorienting dilemmas"를 인식하고 해결할 수 있는 기회를 제공한다. 의사-환자 관계 내에서 다양한 감정을 포함한 영향에 대한 성찰은 PIF 내에서 의대생의 정서 발달과 복지에 기여할 수 있다. 의사가 되기 위한 정서적 과정(Wald 2011)이 있으며, 주제별 분석 결과 학습자의 정서적 스펙트럼(충돌, 양극성, 이중성 포함)이 조기에 발견되었으며, 이는 어려운 임상 경험입니다. 이중성은 이러한 이중성을 초월한 전문적 정체성의 '발현emergence'의 핵심인 '처리processing'에 기여한다. 그러나 이 시점에서 [전문직 정체성의 출현]이 감정적 양극성을 탐색/관리하며 발생하는 "창조적 긴장creative tension"의 불편함 또는 "방향을 잃게 하는disorienting" 경험을 반드시 "해결solve"해주는 것은 아닙니다.
A structured writing prompt on the topic of a challenging patient encounter provides an opportunity for recognizing and grappling with “disorienting dilemmas” of the emerging professional (Mezirow 1991). Reflection on affect including a spectrum of emotions within the physician–patient relationship can contribute to the emotional development and well-being of a medical student within PIF (Helmich et al. 2012; Lipsitt 2015). There is an emotional process to becoming a physician (Wald 2011) and our thematic analyses revealed an emotional spectrum (with conflicts and polarities or dualities) for learners within early, challenging clinical experiences. Such dualities as noted in Table 1 contribute to the “processing,” core to the “emergence” of a professional identity that transcends such dualities. The emergence of professional identity at this point, however, does not necessarily “solve” the uncomfortable or “disorienting” (Lipsitt 2015) experience of “creative tension” when navigating/managing affective polarities (Monrouxe 2010).

IRW 커리큘럼은 "취약성, 수치심, 탄력성, 자신감 및 불확실성에 대한 커리큘럼 대화"를 장려하는 수단으로서, 의학 교육에서 유용하게 제안된다. 또한 IRW 커리큘럼은 [정서적 자기 인식]을 함양하는 데 도움이 될 수 있다. 조사되지 않은 감정이 잠재적으로 스트레스를 발생시키고 의사의 피로와 잘못된 판단의 원인이 될 수 있기 때문에 환자 치료에 영향을 미칠 수 있는 감정을 식별하고 다루는 것을 포함하여 의사 교육이 필요합니다. 감정 인식/감각이 성찰 능력의 핵심 요소이기 때문에 IRW 강화 성찰은 감정 인식, 규제 및 관리의 보다 건강한 기술을 습득하는 데 도움이 될 수 있다. 감정 지능의 구성 요소인 프로토 전문가와 숙련된 임상의는 물론 감정 지능의 구성 요소이다. 커리큘럼 패러다임은 다음을 가능하게 한다. 

  • 내러티브를 발판으로 한 협력적인 동료 성찰, 
  • 교수진 촉진자(소규모 그룹 촉진자 교육을 받은 교육자)에 의해 안내되는 성찰 및 
  • 감정의식(및 검증)을 촉진할 수 있는 개별화된 피드백.

The IRW curriculum is a means of encouraging “curriculum conversation about vulnerability, shame, resilience, confidence, and uncertainty,” proposed as useful within medical education (Lipsitt 2015, p. 67) and may help cultivate emotional self-awareness. Physician training is needed to increase self-awareness including identifying and working with emotions that may affect patient care given that unexamined emotions are potentially stress-generating and can contribute to physician burnout and poor judgment (Meier et al. 2001). Given that emotional awareness/insight is a key element of reflective capacity (Wald et al. 2012), IRW-enhanced reflection may help facilitate the acquisition of healthier skills of emotional awareness, regulation, and management, components of emotional intelligence (Mayer and Salovey 2007) for proto-professionals as well as seasoned clinicians. The curriculum paradigm allows for

  • collaborative peer reflection with narrative as a springboard,
  • reflection guided by faculty facilitators (ideally trained in small group facilitation), and
  • individualized feedback which may promote emotional awareness (and validation) as well.



지적 요소와 정서적 요소를 모두 포함하는 성찰적 자기 인식은 공감을 촉진합니다. 임상 실무 내에서 감정 스펙트럼(극성 및 양면성을 포함할 수 있음)에 대한 RW-enhanced reflection은 이 과정을 지원하는 매개체 역할을 할 수 있다. 학생들이 복잡한 환자 치료 상호작용을 탐색할 때 감정의 극성polarity을 인식, 처리 및 관리하는 것이 PIF의 핵심 요소입니다. 임상실습 경험 중 환자와의 만남에 대한 학생들의 RW는 실무적 현실에서 [환자의 공감]과 [환자의 객관화] 사이에서 관찰된 상충하는 담론에 따라 공감의 미묘한 관점을 드러냈다(Allen et al. 2008). 우리의 RW 분석은 3학년 때 공감에 대한 대안적 렌즈를 제공한다. 우리가 아는 한, 문학에서는 설명되지 않았다. 즉, 학생들이 도전적인 만남에서 공감의 잠재적 상실을 고민하고 우려하는 것이다. 이러한 성찰적 과정과 보다 미묘한 관점은 현재의 공감의 양적 측정치 내에서 완전히 포착되지 않을 수 있다. 우리의 연구결과는 공감의 복잡성에 대처하기 위해 여러 가지 형태의 측정을 요구하는 것과 일치합니다.

Reflective self-awareness that includes both intellectual and affective components (Bryan and Babelay 2009) promotes empathy (Ahrweiler et al. 2014). RW-enhanced reflection on the emotional spectrum (which can include polarities and ambivalence) within a clinical practice may serve as a vehicle supporting this process. Recognizing, processing, and managing polarity of emotions as students navigate complicated patient care interactions is a key element of PIF (Helmich et al. 2014; Dornan et al. 2015). Our students’ RWs on challenging patient encounters during clerkship experience revealed a more nuanced view of empathy, in line with observed competing discourse between empathy and objectification of the patient in the realities of practice (Allen et al. 2008). Our RW analyses provide an alternative lens on empathy in the third year, one which to our knowledge has not been described in the literature, i.e. students grappling with and concerned about potential loss of empathy within challenging encounters. Such a reflective process and a more nuanced view may not be fully captured within current quantitative measures of empathy. Our findings are in line with the call for multiple forms of measurement to address the complexity of empathy (Smith et al. 2017).

 

PIF 프로세스를 지원하기 위한 안전한 반사 공간으로서의 IRW
IRW as a safe reflective space for supporting PIF process

우리의 결과는 또한 학생들이 "인지적 불균형"과 "감정적이고 도덕적인 고통" 또는 "감정적인 불균형"과 씨름하고 있다는 것을 보여주었습니다. 이상주의가 의사의 생생한 경험의 현실과 일치하기 때문입니다. [인지적 불균형]의 경험, 즉 낯설거나 새로운 생각, 가치관, 관점 또는 상황을 접하는 것은 [정체성과 역량 변화]의 잠재적 지표이다. 자기 세계관의 새로운 관점을 통합하면서, [정체성 구축과 새로운 학습]의 [지적, 감정적, 도덕적 발달의 임계threshold 순간]을 초래할 수 있기 때문이다.

Our results also indicated students grappling with “cognitive disequilibrium” as well as “empathic and moral distress” or “affective disequilibrium” (Kumagai 2008) within challenging patient encounters as idealism meets realities of the lived experience of doctoring. The experience of cognitive disequilibrium, i.e. encountering unfamiliar or new ideas, values, perspectives, or circumstances, is a potential marker of a shift in identity and competence as it may result in threshold moments of intellectual, emotional, and/or moral development within identity construction and new learning with an incorporation of new perspectives in one’s own worldview (Kumagai 2008; Jarvis-Selinger et al. 2012).

PI의 "새로운" 단계, 통찰력, 개념, 기술 또는 기타 참신한 측면은 학생의 안전 영역에 도전하여 전문 지식과 자기 효율성을 확장할 수 있는 기회를 만듭니다. 우리의 IRW 커리큘럼 내에서, 그리고 그 후 협력적으로 촉진되는 소규모 그룹 성찰 내에서 다양한 감정적 및 인지적 부조화에 대처할 수 있는 기회는 이 "성장 과정"을 이상적으로 지원할 수 있으며, 잠재적으로 불쾌감 및 관련 스트레스를 줄일 수 있다. 일반적으로 주제 분석과 emergent PIF 모델의 결과는 모델의 처리 구성요소(그림 1) 내의 RW 관련 메타 인지 및 메타 효과(Epstein 1999)가 새로운 PIF(의사의 비기술적 측면 포함)를 지원할 수 있음을 시사한다.

“New” steps, insights, concepts, skills or other novel aspects of PI challenge a student’s comfort zone, creating opportunities for expanding expertise and self-efficacy. The opportunity within our IRW curriculum to grapple with various emotional and cognitive dissonances within RW and subsequently within collaborative facilitated small group reflection can ideally support this “growth process,” potentially reducing discomfort and/or associated stress. In general, the results of our thematic analyses and emergent PIF model suggest that RW-associated meta-cognition and meta-effect (Epstein 1999) within the Processing component of our model (Figure 1) can support emerging PIF (including nontechnical aspects of physicians).

이 모델을 만들게 된 학생들의 RW 내에서, 긍정적인 쪽과 부정적인 쪽 모두에서, 우리는 학생들이 [그들의 지도교사로부터 다양한 주제와 카테고리에 대해 배우고 있는 정도]와 [역할 모델의 영향에 대한 그들의 생생한 묘사]에 감명을 받았다. 이전 보고서와 마찬가지로 임상 환경에서 예외적인 역할 모델과 부정적인 역할 모델 모두 학생들의 정서 발달에 영향을 미칠 수 있다는 것을 발견했습니다. 일반적으로, 의대생들에게 불확실성과 모호함을 견디도록 가르치는 것은 어렵다. 우리의 분석은 롤모델이 연습생과의 상호작용에서 언어 표현과 비언어 제스처 모두에 미치는 영향에 대한 자기 인식의 필요성을 강조한다.
Within the students’ RWs informing our formulation of this model, we were struck by the degree to which students were learning about the various emergent themes and categories from their preceptors and their vivid descriptions of the impact of role models, both positive and negative. In line with previous reports, we find both exceptional and negative role models in clinical settings potentially impacting students’ emotional development (Murinson et al. 2011; Clay et al. 2015). In general, teaching medical students to tolerate uncertainty and ambiguity (including recognizing one’s own limitations) is challenging (Campbell 2014). Our analyses highlight the need for role models’ self-awareness of the impact of both their verbalizations and nonverbal gestures within their interactions with trainees.

긍정적인 숨겨진 커리큘럼을 촉진하는 IRW 강화 반영
IRW-enhanced reflection facilitating a positive hidden curriculum

"잠재 교육과정" 개념은 "문화, 구조 및 제도가 PIF에 어떻게 영향을 미치는지"를 포함하여, 암묵적 학습의 효과를 가시화한다. 의학 교육을 공부할 때 맥락의 중요성을 받아들이는 것은 숨겨진 커리큘럼 정의 프레임워크 내에서 강조되어 왔다. 우리의 IRW-enhanced reflective "문화적 맥락"은 임상적 실천의 복잡성을 인식하고 대처하는 과정을 장려하고, 표준화하며, 명시하며, 우리는 이를 PIF를 서포트하는 "긍정적 숨겨진 커리큘럼"으로 개념화한다. 이러한 "긍정적인 숨겨진 커리큘럼"은 숨겨진 커리큘럼에서 "긍정적인 것을 기억하라"는 최근의 요구에 부합하며, 원하는 태도와 행동을 영속화할 수 있는 잠재력을 가지고 있다. 우리의 연구는 이 단계에서 학생들의 RW가 전문직 정체성 형성적 과정을 보여주는 창구 역할을 하는 은밀한 것을 이제 명백하게 한다. 우리는 [의료의 현실과 씨름하는 과정]을 커리큘럼 목표이자 "긍정적인 잠재 교육과정"으로 규정하고, 이것이 "의사의 도덕적 침식과 의료의 인도주의적 가치의 인식 훼손"을 포함한 부정적인 잠재 교육과정 효과의 일반적인 개념을 상쇄할 것이라 생각한다. 

The “hidden curriculum” concept makes the effects of tacit learning visible, “including how culture, structures, and institutions influence PIF” (Martimianakis et al. 2015). Embracing the importance of context when studying medical education has been highlighted within the hidden curriculum definitional framework (Hafferty et al. 2015). Our IRW-enhanced reflective “cultural context” (Fins and Rodríguez del Pozo 2011) encourages, normalizes, and makes explicit the process of recognizing and grappling with the complexities of clinical practice which we conceptualize as a “positive hidden curriculum” supporting PIF. Such a “positive hidden curriculum” answers the recent call to “remember the positive” within the hidden curriculum (Lawrence et al. 2017) and has the potential to perpetuate desired attitudes and behaviors (Holmes et al. 2015). Our study makes the covert now overt, with the students’ RWs serving as a window into the formative professional identity process at this stage. We frame the process of grappling with realities of medicine (supported by IRW pedagogy) as a curricular objective and “positive hidden curriculum” to potentially counterbalance the prevailing notion of negative hidden curriculum effects including “moral erosion of physicians and perceived undermining of humanistic values in health care” (Martimianakis et al. 2015).

내러티브를 통해 경험을 깊이 있는 개인 및 직업적 가치 및 새로운 가치에 연결하면 PIF를 형성할 수 있으며, 이는 , PIF 모델의 "Emergence" 구성요소인 "진행 중인 작업work in progress"과 일관된다. RW를 통한 의미 창출의 기회에는 감정적 양극성을 포함한 순간과의 "씨름"이 포함되어 있으며, "우리 안에 앉는 것에 대한 불편함을 허용"한다(보칸 1999). [양극화된polarized 공간에 유예suspended되어 있는 것]은 학생들을 편안한 영역에서 밀어내기 때문에 불안하게 만들지만, 그러한 경험은 잠재적으로 개인적이고 전문적인 성숙에 기여할 수 있습니다. 그 중에는 이전에 불안했던 상황에서의 침착함, 감정적인 양극성의 증가 및 통합이 포함됩니다. IRW 과제는 (감정과 관련된 작업 및 안내guided 피드백과 연계하여) 학생이 자신의 경험을 프로세싱 하도록 초대하며, PIF가 형성되는 과정에서 (기술 습득, 성능 범위 확장, 가치 명확화, 복원력을 잠재적으로 지원할 수 있는) 마음, 생각, 실천 습관을 개발하도록 장려합니다. 일반적으로, 우리의 분석은 반사적 자기 인식의 품질과 의료행위의 회복력과 연계되어 건강한 PIF의 과정을 잠재적으로 지원할 수 있는 정서 지능의 구성요소를 밝혀냈다.

Connecting experiences to deeply held personal and professional values and emerging values through narrative can help shape PIF (Rutberg and Gaufberg 2015), consistent with the “Emergence” component of our PIF model, a “work in progress.” The opportunity for meaning-making through RW includes “wrestling” with moments, including emotional polarities, “allowing the discomfort they generate to sit inside us” (Borkan 1999). Being suspended in polarized space may be unsettling as it can push students out of their comfort zone, yet such experience can potentially contribute to personal and professional maturation including equanimity within formerly unsettling situations (Helmich et al. 2014) and increased tolerance and integration of emotional polarities. The IRW assignment provides an invitation for processing their experience including working with the emotions (Shapiro et al. 2016) and in conjunction with guided feedback, encourages the development of new habits of mind, heart, and practice (Shulman 2005) that can potentially support skill acquisition, expansion of performance scope, values clarification, and resilience within emerging PIF (Wald 2015a). In general, our analyses revealed qualities of reflective self-awareness and components of emotional intelligence that have been linked to resilience in medical practice (Howe et al. 2009; Olson et al. 2015) and can thus potentially support the process of healthy PIF.

우리의 결과는 이 연구의 잠재적인 한계에 비추어 해석되어야 한다. 학생들의 RW는 교직원 및 잠재적으로 동료들과 공유되는 필수 과제였기 때문에, "사회적 바람직성"에 대한 문제가 제기될 수 있다. 그러나, 우리 기관에는 솔직함의 문화가 강하게 남아 있고, 임상 경험의 긍정적인 면과 부정적인 면을 모두 드러낸 글들이 있다. 이러한 우려는 RW가 학생들의 성적에 기여하지 않았다는 사실에 의해 더욱 완화된다. 게다가, 몇몇 연구자들이 그 과정의 일부였고, 잠재적인 편견의 원천이었다. 그러나 잠재적 편견을 투명하게 하고 분석의 신뢰성과 신뢰성에 대한 외부 감사원으로 연구원을 배치함으로써 그러한 가능성을 해결하고 최소화하기 위해 필요한 예방 조치를 취했다. 마지막으로, 본 연구의 결과는 1개의 기관과 1개의 임상실습(및 1개의 학년(3학년))을 나타냈기 때문에, 이러한 조사 결과를 다른 연수 사이트에 일반화하는 데 주의를 기울일 것을 제안한다. 이 연구의 범위를 확대하기 위한 미래 연구에는 일반화를 보장하기 위해 여러 기관 내에서 이 연구를 복제하고 다른 정량적 연구와의 결과를 삼각측량하는 것이 포함될 수 있다. 예를 들어, (IRW와 관련된) PIF의 성장을 증명하기 위해 학생 설문지를 관리하는 것은 IRW 교육학을 구현하지 않은 학교의 다른 학생 표본과 비교하는 것을 고려할 수 있다.

Our results should be interpreted in light of the potential limitations of this study. Since students’ RWs were a required assignment shared with faculty and potentially with peers, the question of “social desirability” may be raised. A culture of candor, however, remains strong at our institution and writings revealed both positive and negative aspects of clinical experiences. This concern is further mitigated by the fact that the RWs did not contribute to the students’ grades. In addition, several of the researchers were part of the course, a potential source of bias. However, necessary precautions were taken to address and minimize such potential by making potential biases transparent and having a researcher as an external auditor of trustworthiness and credibility of the analysis. Lastly, outcomes of this study represented one institution and one clerkship (as well as one training year, year 3), thus, we suggest caution with generalizing these findings to other training sites. Future research to expand the scope of this study could include replicating this study within multiple institutions to assure its generalizability and triangulating results with other quantitative research. Administering student questionnaires to demonstrate growth in PIF (as related to IRW) could be considered, for example, with a comparison to another student sample at an institution that has not implemented IRW pedagogy.

결론들
Conclusions

의대 3학년의 도전적인 환자와의 만남에 대한 RW에 대한 연구는 자신의 가치관, 태도, 감정(생각과 행동)에 대한 인식과 새로운 이해, 프로토프로로서의 역할, 환자, 동료 및 다른 사람과의 경험의 영향, 롤모델의 영향 등 PIF를 위한 수단으로서의 이 방법을 뒷받침한다.  3년째의 그러한 RW 연습은 1년차 및 2년차(초기 단계에서 형성적 피드백을 제공하는 훈련된 교직원과 함께)의 IRW 패러다임을 기반으로 하고 있으며, 학생들이 전문 사회화 내에서 새로운 존재, 관련성 및 수행 방법을 개발하는 발판을 마련하고 있다. 임상실습 학생들의 RW에 대한 주제 분석은 3년차에 [PIF의 잠재적 출현 모델emergent model]을 밝혀냈다. 

Our study of third-year medical students’ RWs about a challenging patient encounter supports this modality as a vehicle for PIF, including awareness and new understandings of one’s values, attitudes, and emotions (thoughts and actions), role as a proto-professional, impact of experiences with patients, colleagues, and others, and influence of role models. Such RW exercises within the third year build on the IRW paradigm within years 1 and 2 (with trained faculty providing formative feedback at early stages) and hopefully scaffold students’ developing new ways of being, relating, and doing within professional socialization. Thematic analyses of Clerkship students’ RWs revealed a potential emergent model of PIF in the third year.

이러한 'grappling"은, "새로운 파괴적 요소" 속에서 임상(및 기타) 경험을 처리, 분석, 평가하는 것이다. 이 과정에서 의미를 만들고, 이 의미는 변혁적 학습으로 이어져서 한 사람의 전문직 정체성을 (trans)formation시키고, 행동에 영향을 준다. 임상 업무의 '지저분함'는 전문직업적 전문성 핵심이다. 우리는 [휴머니즘적인 학습 환경 내에서의 복잡한 경험]에 대해 [학습자를 guided critical reflection에 참여시키는 것]이 [의료 관행의 불가피한 도전]에 "준비된" 마음과 생각을 가진, [성찰적이고 탄력적인 전문가]를 양성하여, 이상적으로는 의학에서의 휴머니즘을 보존할 귀중한 방법이라고 제안한다.

The “grappling,” the processing, the analysis, and evaluation of clinical (and other) experiences within a “novel disruptive element” (Kumagai 2010) is the meaning-making, leading to transformative learning about one’s “becoming,” one’s professional identity (trans)formation (Wald 2015a) which impacts behavior. The “messiness” of clinical practice is at the heart of professional expertise (Schön 1987). We propose engaging our learners in guided critical reflection about complex experiences within a humanistic learning climate (Gracey et al. 2005) as a valuable way to cultivate reflective and resilient professionals with “prepared” minds and hearts for the inevitable challenges of health care practice, ideally preserving humanism in medicine.


Med Teach. 2019 Feb;41(2):152-160.

 doi: 10.1080/0142159X.2018.1475727. Epub 2018 Jun 26.

Grappling with complexity: Medical students' reflective writings about challenging patient encounters as a window into professional identity formation

Affiliations collapse

Affiliations

1a Department of Family Medicine , Warren Alpert Medical School of Brown University , Providence , RI , USA.

2b Department of Medical Education , Hebrew University/Hadassah , Jerusalem , NY , USA.

3c Department of Family Medicine , Mayo Clinic Health System Franciscan Healthcare in La Crosse , La Crosse , WI , USA.

PMID: 29944035

DOI: 10.1080/0142159X.2018.1475727

Abstract

Aim: Clerkship-specific interactive reflective writing (IRW)-enhanced reflection may enhance professional identity formation (PIF), a fundamental goal of medical education. PIF process as revealed in students? reflective writing (RW) has been understudied.

Methods: The authors developed an IRW curriculum within a Family Medicine Clerkship (FMC) and analyzed students? reflections about challenging/difficult patient encounters using immersion-crystallization qualitative analysis.

Results: The qualitative analysis identified 26 unique emergent themes and five distinct thematic categories (1. Role of emotions, 2. Role of cognition, 3. Behaviorally responding to situational context, 4. Patient factors, and 5. External factors) as well as an emergent PIF model from a directed content analysis. The model describes students? backgrounds, emotions and previous experiences in medicine merging with external factors and processed during student?patient interactions. The RWs also revealed that processing often involves polarities (e.g. empathy/lack of empathy or encouragement/disillusionment) as well as dissonance between idealized visions and lived reality.

Conclusions: IRW facilitates and ideally supports grappling with the lived reality of medicine; uncovering a "positive hidden curriculum" within medical education. The authors propose engaging learners in guided critical reflection about complex experiences for meaning-making within a safe learning climate as a valuable way to cultivate reflective, resilient professionals with "prepared" minds and hearts for inevitable challenges of healthcare practice.

비판적 성찰과 비판적 반영의 발산과 수렴: 보건의료전문직교육에의 함의(Acad Med, 2019)
The Divergence and Convergence of Critical Reflection and Critical Reflexivity: Implications for Health Professions Education 
Stella L. Ng, PhD, Sarah R. Wright, PhD, and Ayelet Kuper, MD, DPhil


보건전문교육(HPE)은 사회과학 및 인문과학(SS&H)을 교과 내용, 디자인, 교육학에 활용해야 한다는 요구에 부응하기 시작했다. 보건 전문가는 역량 프레임워크에 의해 증명된 바와 같이 사회적, 인문학적 역할과 활동을 수행해야 한다. 따라서 SS&H는 HPE에 분명한 이점을 제공한다. 그러나 정보에 입각한 방법으로 HPE에 SS&H 방법을 적용하는 것은 어려울 수 있다. 한편으로 SS&H 접근방식은 HPE에서 의미 있고 효과적이려면 신중한 적응이 필요하다. 한편, SS&H의 내용과 방법을 보건 전문직 훈련 프로그램에 적용하려는 의도는 좋지만 정보에 입각하지 않은 많은 사례들이 있다. HPE에 SS&H의 도입이 두드러지고, SS&H와 관련된 목표, 역할, 환자 중심의 관리, 건강 옹호, 포트폴리오 코스 등의 활동의 인기가 높아짐에 따라 잘못된 적용은 더욱 확산될 위험이 있다. 잘못 적용하면 잠재적으로 유용한 개념이 배제되고 더 많은 정보를 가진 애플리케이션을 통해 실현될 수 있는 것보다 더 낮은 교육 결과가 초래될 수 있습니다.

Health professions education (HPE) has begun to answer calls to draw on the social sciences and humanities (SS&H) for curricular content, design, and pedagogy.1–8 Health professionals must—as evidenced by competency frameworks—perform social and humanistic roles and activities9,10; thus, SS&H offers clear benefits to HPE. However, applying SS&H methods in HPE in an informed manner can prove challenging.11 On the one hand, SS&H approaches often require thoughtful adaptation if they are to be meaningful and effective in HPE.11,12 On the other hand, many examples abound of well-intentioned yet ill-informed attempts at applying SS&H content and methods to health professions training programs.13–16 As incorporation of SS&H rises in prominence in HPE,17 and as the popularity of SS&H-related goals, roles, and activities such as patient-centered care, health advocacy, and portfolio courses surges, misapplication risks becoming even more widespread. Misapplication may result in dismissal of potentially useful concepts and in poorer educational outcomes than could be realized with more informed applications.

HPE에서 일반적으로 오해되고 잘못 적용된 SS&H 접근법 두 가지는 비판적 성찰과 비판적 성찰성이다. 겹치지만 다른 지적 전통에서 비롯된 이러한 개념은 유사점을 공유하지만 교육학 및 평가에 대해 뚜렷한 의미, 사용 및 시사점을 가지고 있습니다. 하지만, 우리는 그들이 공통적인 몇 가지 기본적인 생각을 가지고 있거나, 아마도 비슷하게 들리기 때문에, 종종 혼동되거나 서로 결합된다는 것을 알아차렸다. HPE에서 SS&H 지식과 접근법의 잠재력을 실현하기 위해서는 기초 지식과 방법의 견고한 기반이 필요하기 때문에 이러한 혼란은 교육자에게도 영향을 미칠 수 있다.


Two commonly misunderstood and misapplied SS&H approaches in HPE are critical reflection14,18,19 and critical reflexivity.20–23 Arising from overlapping yet different intellectual traditions, these concepts share similarities but have distinct meanings, uses, and implications for pedagogy and assessment. However, we have noticed that, perhaps because they have some foundational ideas in common, or perhaps because they sound similar, they are often confused and/or conflated with each other. This confusion should concern educators because a solid foundation in the underlying knowledge and methods is required to realize the potential of SS&H knowledge and approaches in HPE.


학자들은 (성찰의 감시로서 사용하는 것을 포함하여) 성찰과 성찰성의 서투른 적용으로 인한 부정적인 결과에 주목하고 있으며, 우리는 '성찰 피로reflection fatigue'를 초래할 정도로 성찰이 남용되는 것에 주목하고 있다. 이러한 결과는 자금과 자원의 감소와 함께 설명 책임과 복잡성이 증가하는 시기에 심각합니다. 우리는 교육 접근방식의 부실하거나 비효율적인 구현에 시간과 자원을 낭비하거나 낭비할 수 없습니다. 그러나 우리는 "아기를 목욕물과 함께 내던져서는 안 된다" 즉, 성찰적 접근의 실행 실패가 성찰과 성찰성의 실패로 오해되어서는 안 된다. 우리는 비판적 성찰과 성찰성의 세부사항을 이해하는 것이 그들의 더 미묘한, 따라서 효과적인 연구와 응용을 지원할 수 있다고 주장한다.

Scholars have noted negative consequences from clumsy applications of reflection and reflexivity in medical education, including the use of reflection as surveillance,24,25 and we have noticed its overuse to the point of driving “reflection fatigue.” These consequences are serious at a time of increased accountability and complexity alongside decreased funding and resources. We cannot spend or waste time and resources on poor or ineffective implementations of education approaches. Yet we should not “throw the baby out with the bathwater”; that is, the failings of implementations of reflective approaches should not be mistaken for the failings of reflection and reflexivity. We argue that understanding the details of both critical reflection and reflexivity can support their more nuanced and thus effective study and application.

이 기사에서는 HPE 분야의 비판적 성찰과 비판적 반사성을 위한 견고한 기반을 명확히 하기 시작한다. 우선 각 항목을 차례로 정의하는 것부터 시작합니다(정의의 개요는 표 1 참조). 우리는 독자들이 그들의 지향과 목표를 이해하도록 돕기 위해 각각의 지적 맥락 안에 위치를 정하고, 그들 사이의 유사점과 차이점을 명확히 한다. 그런 다음 비판적 성찰과 비판적 반사성에 적합한 교육 및 평가 방법의 유형을 설명합니다. 공간 제약으로 인해 기술자 "critical"에 포함된 개념을 상세하게 검토하지 않습니다(본 문서에서 사용되는 이 용어 및 기타 용어의 간단한 정의는 박스 1 참조). 
간단히 말해서, 성찰 또는 성찰성이라는 단어를 앞에서 한정하는qualifier "비판적critical"이라는 단어는 관련된 성찰적reflective 또는 성찰성적reflexive 활동이 특히 가정, 권력 관계, 구조, 시스템적 효과와 실천에 대한 제약에 도전/질문하는 것을 의미한다.

In this article, we begin to articulate a solid base for both critical reflection and critical reflexivity for the HPE field. We start with defining each in turn (see Table 1 for a summary of their definitions). We locate each in their intellectual contexts to help readers make sense of their orientations and goals, and we clarify the similarities and differences between them. We then delineate the types of teaching and assessment methods that fit with critical reflection versus critical reflexivity. Because of space constraints, we do not explore in depth the concepts embedded in the descriptor “critical” (see Box 1 for a brief definition of this and other terms used in this article); put simply, as a qualifier before reflection or reflexivity, “critical” means that the associated reflective or reflexive activities specifically challenge/question assumptions, power relations, and structural or systemic effects and constraints on practice.26–28

크리티컬 리플렉션/비판적 성찰
Critical Reflection

비판적 성찰은 [가정(즉, 개인 및 사회적 신념과 가치)과 권력 관계, 그리고 이러한 가정과 관계가 어떻게 실천을 형성하는지를 조사하는 프로세스]로 정의할 수 있다. 가정이 [유해한 실천]으로 이어질 경우, 비판적으로 성찰하는 실천자practitioner는 가정과 관행에 도전하고 변경하는 것을 목표로 합니다. 따라서 비판적 성찰의 목표는 프락시스이다: 사회 개선을 이끄는 [비판적 이론과 실천]의 균형잡힌 융합을 말한다. 

Critical reflection can be defined as a process of examining assumptions (i.e., individual and societal beliefs and values) and power relations, and how these assumptions and relations shape practice. When assumptions lead to harmful practices, the critically reflective practitioner aims to challenge and change assumptions and practices. The goal of critical reflection is thus praxis: a balanced fusion of critical theory and practice that leads to social improvement.29


[비판적 성찰]은 practitioner로 하여금 [유해한 가정이 갖는 물질적 영향(박스 1 참조)에 대해 의문을 갖고 이에 대해 행동]하도록 지시합니다. 예를 들어, 가정의사는 장애인이 지원이나 자원에 접근할 수 있도록 작성하는 서류 등 [실제로 사용되는 일부 물질material object]에 내장된 [유해한 효과]를 발견할 수 있습니다. 환자의 특정 지원을 받기 위해 환자의 장애 정도를 "평가"해야 하는 경우가 많습니다. [장애를 평가하는 과정]은 보통 지나치게 단순하고, 사람을 잘못 표현하기 쉬우며, 제대로 논의하지 않으면 환자의 자기 이미지와 환자와의 관계에 해를 끼칠 수 있다. 만약 주치의가 비판적 성찰을 통해 이러한 잠재적 위해를 인식한다면, 환자와의 관계에서 [자신이 수행하는 평가의 필요성과 한계]를 인식할 것이다. 비판적 성찰이 이끄는 행동을 함으로써, 이 가정의사는 Praxis를 보여주고 있다. 또한 시간이 지남에 따라 정책 및 프로토콜 형성 관행을 개선하기 위해 노력할 수도 있습니다. 그녀는 정규 교육 및/또는 연습과 개인적 경험을 통해 이러한 방식으로 연습하는 법을 배웠을 수 있습니다.
Critical reflection orients practitioners to question and act on the material (see Box 1) effects of harmful assumptions. For example, a family doctor may notice harmful effects built into some of the material objects used in practice, such as the paperwork she completes for persons with disabilities to access supports and resources.30 To garner access to certain supports for her patients, she is often required to “rate” their level of disability. The process of rating disability is usually overly simplistic and prone to misrepresenting the person31 and can be damaging to the self-image of patients and to her relationship with them if left undiscussed.31 Because she recognizes this potential harm—through critical reflection—the family doctor ensures that in the relationship she builds with her patients, they appreciate the necessity and limitations of the rating she has to conduct. By engaging in action informed by critical reflection, this family doctor is demonstrating praxis. She may also work to improve the policies and protocols shaping practice, over time. She may have learned to practice this way through formal education and/or learning in and through practice and personal experience.


박스 1
Box 1

이 문서에서 사용된 용어집(중요한 반사 및 반사성 관련 용어집)
Glossary of Terms Used in This Article as They Relate to Critical Reflection and Reflexivity

행위자성사회에 대한 행동 능력.사회 규범과 가치관이 사회의 구조에 의해 어떻게 형성되어 왔는지를 알 수 있는 능력을 필요로 한다. 
Agency:
 The capacity to act on the world, requiring the ability to see how social norms and values have come to be shaped by the structures of society.45

비판적: 성찰, 반사성 또는 이론보다 앞선 한정자 또는 형용사로서, '비판적'이란 의미는 가정, 이념, 시스템, 구조 및 권력 관계를 포함한 현재의 사회 규범에 대한 비판에 초점을 맞춘다는 것을 의미합니다. 
Critical:
 As a qualifier or adjective preceding reflection, reflexivity, or theory, critical means that there is a focus on a critique of current societal norms including assumptions, ideology, systems, structures, and power relations.28,34,62

담론(형용사: 담론적): 사회적 구성 및 영속적인 언어 기반 의미 체계로서, 이것은 어떤 생각, 말, 행동 방식이 (불)가능한지를 형성한다. 예:

  • [한 사람 내에 존재하는 기능 손상으로서의 장애]라는 지배적 담론은 사람들이 "기능"을 회복하도록 돕기 위해 재활을 생각하고 실천한다. 반면
  • [사회가 부과하는 한계로서의 장애]라는 대안적 담론은 변화에 대한 부담의 일부를 사회에 이전시키고, 우리가 세상을 기능하고 살 수 있는 다양한 방법에 대한 개념을 넓힐 것을 간청한다.  

Discourse (as an adjective: discursive): A socially-constructed and perpetuated, language-based system of meaning shaping (im)possible ways of thinking, speaking, and acting; e.g.

  • the dominant discourse of disability as impairment of function within an individual means we think about and practice rehabilitation to help people regain “typical” function.
  • An alternative discourse of disability as limitations imposed by society would move some of the burden of change to society, and implore us to broaden our conceptions of different ways of being able to function and live in the world.73–75

인식론: 우리가 알고 있는 것을 어떻게 알게 되는가에 대한 철학. (의견이 아니라) 지식을 개발하거나 습득하는 타당한 방법을 포함한다.
Epistemology:
 The philosophy of how we come to know what we know, including the methods considered to be valid ways of developing or gaining knowledge (as opposed to opinion).8,12,76–78

형평성Equity: 무엇이 정의롭고 공정한지에 대한 사고방식이며, 종종 평등equality과 대조된다.

  • [평등]은 모든 사람이 같거나 동등한 기회와 지원을 받을 수 있는 것을 말한다(예: 의대에 입학하는 모든 학생이 동일한 수업료를 지불한다)
  • [형평]은 누군가를 애초에 기회에서 배제시킬 수 있는 낮은 사회경제적 지위의 영향과 같은 장벽을 제거하는 것을 목표로 할 수 있다(예: 의대 진학에 필요한 학업기준에 부합하지만 등록금 재원이 부족한 학생에게 학비보조금을 제공한다.)

Equity: A way of thinking about what is just and fair, often contrasted with equality. Rather than

  • equality in which all people would be given the same, or equal, opportunities and supports (e.g., all students entering into medical school pay the same tuition fee), an
  • equitable approach might aim to remove barriers such as the effects of the lower socioeconomic status of a student that might preclude them from an opportunity (e.g., offering bursaries to students who meet the academic standards for entry to the medical school but lack the economic resources for tuition).79

물질: 사회와 문화가 구성하고, 사회와 문화를 구성하는 물리적 대상 및 측면과 관련된다. 예: 의료 차트, 증거 기반 진료 지침.
Material:
 Relating to the physical objects and aspects constituting and constituted by society and culture,80 e.g., medical charts, evidence-based practice guidelines.

교육학: 가르침의 이론과 실제.
Pedagogy: The theory and practice of teaching.

프락시스: 비판적으로 성찰하는 생각과 행동의 융합. 
Praxis:
 The fusion of critically reflective thought and action.29


교육에서 [성찰]은 일반적으로 "어떤 믿음이나 가정된 형태의 지식에 대한 적극적이고 지속적이며 신중한 고려이다. [믿음이나 가정을 뒷받침하는 근거]와 [그것이 궁극적으로 지향하는 결론]에 비추어 고려하는 것이다"로 정의된다. 종종 성찰에 [비판적 차원]을 추가하는 것으로 알려진 하버마스는, 여기에 [성찰 과정에 비판적 렌즈를 적용하지 않는 한, 지식은 지식이 창조된 사회적 조건에 의해 제약을 받는다]는 것을 추가했다.

  • 위의 예에서, 만약 가정의사가 장애 서류 작업을 하는 동안 성찰적인 태도를 보였다면, 그녀는 실제로 환자 자신의 희망에 대한 자신의 가정에 의문을 제기했을 수 있으며, 그녀가 인간 중심적이고 사려 깊은 방식으로 연습하고 있는지 확인할 수 있습니다.
  • 하지만, 그녀는 비판적인 성찰을 통해 드러난 서류 처리 과정의 잠재적인, 더 음흉한 피해를 인식하지 못했거나 완화하려고 노력하지 않았을 수 있습니다. 또한, (서류에 서명함으로써 궁극적으로 환자의 자원 접근을 허가 또는 불허하게 만드는) 자신의 위치와 더 큰 기관 복합체 내에서의 상대적인 위치에 대해 덜 의식했을 수도 있다. 

[비판적 성찰]은 (이 경우 의사의 관점을 변화시킴으로써) 기존의 관점과 권력 관계를 영속화하기보다는 변화를 목표로 하기 때문에, 따라서 [해방적 지식]을 생산할 수 있다. 
In education, reflection is commonly defined as “active, persistent, and careful consideration of any belief or supposed form of knowledge in the light of the grounds that support it and further conclusions to which it tends.”32(p6) Habermas,33 often credited with adding a critical dimension to reflection, added to this definition that knowledge remains constrained by the social conditions in which it was created, unless a critical lens is applied to the reflective process.

  • In the example above, if the family doctor was reflective while working on the disability paperwork, she may indeed have questioned her own assumptions about the patient’s wishes, to ensure that she was practicing in a person-centered and thoughtful manner.
  • However, she may not have recognized or tried to mitigate the potential, more insidious harms of the paperwork process, which were brought to light through critical reflection. She would also be less aware of the position she holds by virtue of being the signatory on this paperwork, which ultimately grants/denies the patient’s access to resources, and her position relative to the larger institutional complex.

Critical reflection can thus produce emancipatory knowledge, as it aims to transform rather than perpetuate existing perspectives and power relations (in this case, by transforming the perspective of the physician).33


비판적 성찰 이론을 발전시킨 현대 작가로는 브룩필드, 켐미스, 킨셀라, 그린 등이 있다. 의학 교육에서 비판적 성찰에 관한 이론을 도입한 학자는 프리레와 하버마스의 작품과 그 적용 방법에 특히 초점을 맞춘 쿠마가이이다. Kumagai와 Lypson은 이러한 지식에 대한 이해를 학생들을 문화적 역량 밖으로 이동시키기 위한 노력과 같은 교육 혁신에 적용했습니다. 그들은 학생들이 특정 환자와 상호작용하는 ["올바른" 또는 "최상의" 방법을 기억하는 체크리스트 접근법]에서 벗어나서, [권력 관계에 대한 더 넓은 인식과 사회적 불평등을 완화하려는 욕구]로 옮겨갈 필요성을 분명히 강조한다. 따라서, 이 접근방식에 따르면, 모든 환자에게 좋은 돌봄을 제공하기 위해서는 [바람직한 기술을 수행하는 특정 방법을 습득할 때 [존재의 방식에 대한 비판적 성찰]이 동반되어야 한다. [존재의 방식]이란 관점과 덕성virtue를 체화하고, 집행하고, 문화화하는 방식을 의미한다. 이렇듯, [
비판적 성찰]은 [사고 과정]이다. 비판적 성찰의 실천은 이 과정에 자주 또는 항상 관여engage하는 존재와 실천의 한 방법이다. 
Contemporary authors who advance theories of critical reflection include Brookfield, Kemmis, Kinsella, and Greene26–28,34–37 (see Table 1). In medical education, a scholar who has taken up theories related to critical reflection is Kumagai,4,38 who has focused particularly on the works of Freire and Habermas and how they can be applied in medical education. Kumagai and Lypson4 have applied these understandings of knowledge to educational innovations such as efforts to move students beyond cultural competence. They articulate a need to move from checklist approaches, wherein students memorize the “right” or “best” way to interact with a particular patient, toward a broader awareness of power relations and a desire to mitigate social inequity.4 This approach thus suggests that, to provide good care for all patients, acquiring particular ways of performing desired skills must be accompanied by critically reflective ways of being—by which we mean embodied, enacted, enculturated views and virtues. Critical reflection is a thought process; critically reflective practice is a way of being and practicing that engages this process often or always.26,39

(비판적) 성찰성
(Critical) Reflexivity

[성찰성]은 [[자기의 지식의 한계를 더 잘 이해]하고 [다른 사람들의 사회적 현실을 더 잘 인식]하기 위해, 세상world 내에서 자신의 위치position를 인식하는 것]으로 정의될 수 있다. 따라서 모든 성찰성은, 무엇보다 [권력관계]에 주의를 기울이는 것을 포함하기에, 정의상 비판적이다. 그러나 일부 저자들은 [권력에 대한 주의를 명시적으로 우선시]하고자, "비판적 성찰성critical reflexivity"이라는 더 긴 용어를 사용하기로 선택한다. [성찰성적reflexive 실천가]는 그녀의 인식론적 가정과 합법적인 지식, 사회적 규범, 그리고 가치의 개념에 영향을 미치는 [사회적, 담론적 요소]에 도전할 것입니다. [성찰성]과 [비판적 성찰]은 사회적 개선이라는 목표를 공유하지만, [성찰성]은 [담론적으로 이해contrued 사회적 세계가 누가, 어떻게, 어떤 지식과 사회적 규범의 구축에 어떻게 영향을 미치는지] 강조한다.36. 따라서 성찰성적 접근으로 제시된 해결책은 종종 [구조와 제도를 바꾸는 것]을 포함할 것이다. 예를 들어, 장애에 대한 성찰성적 접근법은 

  • 현재의 정의에 의문을 제기하다. (예: 장애를 개인 안의 것으로 보는 정의)
  • 정의에 따른 실천에서 누가 권력을 얻거나 유지할지(예: 현재 장애가 없는 자, 재활 전문가 등), 이 담론에 의해 권력적 약자가 되는 사람은 누구인지(예: 장애인 등)에 대한 인식을 높인다. 
  • 이러한 권력 불균형을 만들고 유지하는 구조와 프로세스의 변화를 모색한다.

Reflexivity can be defined as recognizing one’s own position in the world both to better understand the limitations of one’s own knowing and to better appreciate the social realities of others. All reflexivity is thus by definition critical, as it specifically involves paying heed to power relations; however, some authors choose to use the longer term “critical reflexivity,” which explicitly foregrounds their attentiveness to power. A reflexive practitioner would challenge her epistemological assumptions (how we know what we know) and the social and discursive factors that influence conceptions of legitimate knowledge, social norms, and values. Although reflexivity and critical reflection share goals of social improvement, reflexivity emphasizes how the discursively construed social world influences what, how, and by whom knowledge and social norms are constructed,36 and so the solutions put forward in a reflexive approach will often involve changing structures and institutions. For example, a reflexive approach to disability may

  • call into question its current definition (e.g., as an impairment within an individual),
  • raise awareness of who stands to gain or maintain power from the ensuing practices of this definition (e.g., people currently without disabilities, rehabilitation professionals) and who is rendered less powerful by this discourse (e.g., people with disabilities), and
  • seek to change the structures and processes that create and maintain this power imbalance.40

[자신의 사회적 지위를 인식하는 것]은 [다른 사람들의 경험에 대한 이해]를 넓힐 수 있다. 성찰성에 참여하려면, 먼저 이러한 믿음과 가정이 [우리가 자라나고 훈련받거나 현재 살고 일하는 사회문화 구조에 어떻게 내재되어 있는지]를 인식함으로써, [무엇이 진실되고 정상적인지에 대한 우리 자신의 믿음과 가정에 도전]해야 합니다. 예를 들어, 성찰성적 가정의사는 자신이 [장애인이 아닌 사람을 "정상"이라고 가정하는 건강 시스템] 내에서 기능하고 있다는 것을 알게 될 것이다. 
그렇게 함으로써 그 의사는 [장애에 대한 현재의 담론]을 문제 삼을 것이다. 왜냐하면 이 담론에서는 "문제"는 '장애를 가진 사람'에게 존재하는 것이지, 장애를 가진 사람이 적응하고자 노력하고 있는 '시스템'에 존재하는 것이 아니기 때문이다.

Recognizing one’s own social position may broaden one’s understanding of the experiences of others. Engaging in reflexivity requires challenging our own beliefs and assumptions about what is true and normal by first recognizing how these beliefs and assumptions are embedded in the social and cultural structures in which we were raised and trained and/or currently live and work. Continuing our example, a reflexive family doctor would, for example, notice that she was functioning within a health system that assumes that people who are not disabled are “normal”; in so doing she would problematize the current discourse of disability, in which the “problem” is located with the “disabled” patient rather than with the system to which they have to try to fit in.40 

이와 같은 (현재의) 문제적 담론은 [포용적인 환경을 만들려는 사회의 책임]을 회피하고, 대신 [인식된 규범에서 벗어난 사람들]에게 "적합해지기 위해 노력하라fit in"는 부담을 전가한다. [우리 모두가 억압적인 권력의 당사자]라는 성찰성의 내재적 의미는, 자신의 [특권적 지위]가 [지배적인 문화 또는 사회 집단]에 속함으로써 얻어지는 것임에 주의하게 만들기 때문에, 성찰성을 상당히 어렵게 만들 수 있다.  예를 들어, Rowland와 Kuper가 환자 경험을 하게 된 의료 전문가들을 대상으로 실시한 연구에서, 참가자들은 그들의 경험 중 [가장 고통스러웠던 부분] 중 하나는 환자의 입장에서 부정적으로 경험했던 [구조와 과정에 자기 자신이 (보건의료제공자로서) 어떻게 기여하고 있었는지에 대한 성찰적인 깨달음]이었다고 언급했다. 

This problematic discourse defers responsibility from society to create an environment that is inclusive, instead shifting the burden onto those who fall outside the perceived norm to “fit in.” An inherent implication of reflexivity—that we are all (as part of society) party to oppressive forces—can make reflexivity quite difficult, particularly when it calls attention to one’s own privileged position derived from belonging to a dominant cultural or social group.41 For example, in Rowland and Kuper’s42 study of health care professionals who have also been patients, participants noted that one of the most painful parts of their experience was their reflexive realization of the ways in which they themselves (as health care providers) had contributed to the structures and processes that they then experienced so negatively as patients.

머튼은 성찰성을 [옳든 그르든, 상황의 결과와 그 믿음을 실현하기 위해 개인이나 집단이 어떻게 행동하는지에 영향을 미치는 자기충족적 예언]으로 묘사했다. 논쟁의 여지가 있지만, 그와 다른 초기 이론가들은 성찰성을 문제가 있다고 생각했다. 즉, 사회적 세계에 영향을 받지 않는 어떠한 행동도 취할 수 없고, 이는 다시 사회적 세계에 영향을 준다. 하지만, 더 최근에는 이론가들은 성찰성을 구조(사회가 개인의 신념과 행동에 영향을 주는가?) 대 개인(개인의 신념과 행동과 행위가 사회에 영향을 주는가?) 이라는 오랜 인식론적 문제를 극복하는 해결책으로 제시한다. 
In one of the earliest uses of the term, Merton43 described reflexivity as a self-fulfilling prophecy, in which a belief or expectation, whether correct or incorrect, affects the outcome of the situation and how individuals or groups behave to make that belief come true. Arguably, he and other early theorists conceived of reflexivity as problematic: that no action can be taken that is not influenced by the social world, which in turn influences the social world. More recent theorists, however, present reflexivity as the solution to overcoming the long-standing epistemological problem of structure (does society influence individual beliefs and behaviors?) versus agency (do individual beliefs, behaviors, and actions influence society?).44

예를 들어,

  • Bourdieu는 사회과학은 본질적으로 우리의 선입견preconception에 의해 제약을 받는다고 주장했다; 이러한 한계를 극복하기 위해, 우리는 우리의 사회적, 문화적 기원, 현장에서의 우리의 위치, 그리고 우리의 지식 주장을 질문함으로써 우리 자신의 입장을 더 잘 이해하려고 노력해야 한다.
  • 비슷하게, Foucault46은 역사가 현재 지식을 구조화하고 체계화한다고 제안했다; 무엇을 생각할 수 있고 알 수 있는지는 우리가 사용하는 담론을 통해 형성되며, 담론이 우리의 사고를 어떻게 제약하는지를 고려하는 것이 반드시 필요하다.
  • Bourdieu, for example, argued that the social sciences are inherently constrained by our preconceptions; to overcome these limitations, we should seek to better understand our own positions by interrogating our social and cultural origins, our position in the field, and our knowledge claims.45 
  • Similarly, Foucault46 proposed that history structures and organizes knowledge in the present; what is thinkable and knowable is shaped through the discourses we use, making it imperative that we consider the ways in which this constrains our thinking.

부르디우와 푸코는 둘 다 보통 당연하게 여겨졌던 사회의 특성, 어떻게 그러한 특성을 갖게 되었고, 결과적으로 누가 이득을 보고 손해를 보는지에 대해 이의를 제기했다. 또, 다음과 같은 권력의 문제에 초점을 맞췄습니다. 푸코는 [담론]이 우리의 사고와 실천을 함정에 빠뜨린다고 보았고, 부르디우는 [사회 구조]가 사회적 불평등을 재현한다고 보았. [비판적 성찰성]은 이렇게 ["자연스러워" 보이는 힘forces]을 인식하는 것이다. 즉, 우리가 힘forces을 어떻게 생산하고 재생산하는지, 힘forces이 우리에게 어떻게 영향을 미치는지, 우리가 힘forces에 어떻게 영향을 미치는지를 인식하는 것이고, 이것이 변화하는 역동적인 과정이라는 것을 인식하는 것이다.

Bourdieu and Foucault both challenged the properties of society normally taken for granted, how they came to be, how they were naturalized, and who ends up benefiting and losing as a result. They also focused on issues of power: Foucault46 sees discourses as trapping our thinking and practice, and Bourdieu44 sees social structures as reproductive of social inequities. Critical reflexivity is about recognizing these “natural”-seeming forces, how we are implicated in producing and reproducing them, how they affect us, how we affect them, and that this is a dynamic process subject to change.

더 많은 현대 학자들이 (성별, 인종, 식민지 경험, 능력과 같은) 특정한 사회적 구조(및 이들의 교차점)와 관련하여 [비판적 성찰성]의 개념을 탐구해 왔다. 예를 들어,

  • 패트리샤 힐 콜린스는 아카데미에서 흑인 여성으로서의 그녀의 "외계인" 지위가 그녀가 정상적이고 자연스러워 보이는 "내부인"들에게 주목받지 못하는 현상을 알아차릴 수 있도록 하는 방법을 탐구했다.
  • 마찬가지로, 사이드는 유럽과 북미의 학자들이 아시아, 중동, 그리고 아프리카에서 온 사람들을 "미스터리한 다른 사람"으로 구성하면서 그들의 목소리와 힘을 식민지화의 더 큰 현상의 일부로서 감소시키는 방식을 문제화했다.
  • Crenshaw58은 이러한 다른 사회적 범주가 중복될 수 있는 방법의 복잡성과 권력과 지식에 미치는 영향을 강조하기 위해 "교차성"이라는 용어를 도입했습니다.

이 저자들은 각기 다른 사회 집단의 경험을 강조하고 있지만, 집합적으로 우리가 ["자연적"이고 "정상적"으로 보이지만 실제로 변화하기 쉬운 구조와 과정을 유지하는 우리의 역할]을 깨닫는 데 도움이 되며, 따라서 우리가 공유된 사회 세계를 개선하기 위해 행동하도록 영감을 준다.
More contemporary scholars have explored the notion of critical reflexivity in relation to specific social constructs such as gender,47–50 race,51,52 experience of colonization,53–55 and ability40,56,57 (among others), as well as to the intersections between them.

  • Patricia Hill Collins,52 for example, has explored the ways in which her “outsider” status as a black woman in the academy enables her to notice (and seek to address) phenomena that go unremarked to those “insiders” for whom they seem normal and natural.
  • Similarly, Said53 has problematized the ways in which European and North American academics constructed people from Asia, the Middle East, and Africa as a “mysterious other,” diminishing their voices and their power as part of the larger phenomenon of colonization.
  • Crenshaw58 introduced the term “intersectionality” to highlight the complexity of the ways in which these different social categories can overlap and the implications that has for power and knowledge.

Although the experiences of the social groups highlighted by these writers differ, collectively their work helps us to identify our roles in maintaining structures and processes that seem “natural” and “normal” but may actually be amenable to change, and thus inspires us to act to improve our shared social world.

교육 및 평가에 미치는 영향
Implications for Teaching and Assessment

교육적 접근 방식을 알려주는 학문적 전통을 사용하는 교육 및 평가 방법에 맞추는 것은 교육 노력의 질과 의미에 있어 중요합니다. 비판적 성찰과 비판적 성찰성은 특정한 약속을 공유한다. 둘 다 [사회 개선을 위해 노력]하고 [기존의 권력 구조에 도전]합니다. 따라서 우리는 차이점뿐만 아니라 비판적 성찰과 반사성을 교육, 평가 및 평가하기 위한 공통 과제와 전략도 탐구할 것이다.

Aligning the academic traditions informing an educational approach with the teaching and assessment methods used is key to the quality and meaning of the educational efforts being employed.59 Critical reflection and critical reflexivity share certain commitments; they both strive for social improvement and challenge existing power structures. We will thus explore not only the differences but also the common challenges and strategies for teaching, assessing, and evaluating critical reflection and reflexivity.

비판적 성찰에 대한 교육 및 평가
Teaching and assessing for critical reflection

HPE에서 비판적 성찰을 가르치는 사람들의 경우, 이론 문헌과 일치하는 전반적인 목표는 학생들이 임상 작업에 대해 일종의 [프락시스]로서 접근하는 것을 가르치는 것이다. 위의 장애 정책과 관련하여 일하는 가정의사의 예에서 언급한 바와 같이, Praxis는 [비판적 이론에 입각한 행동]이다. 그것은 [성찰]과 [행동], 특히 [비판적 성찰]과 [행동]의 융합이다.

  • 조직 차원에서는 [비판적으로 성찰하는 의대]라면, [이론적인 조사에 근거해, 불평등하다고 보여지는 척도를 제거하는 방향으로 입학 기준을 바꿀 수]도 있다.
  • [비판적으로 성찰하는 교수와 프로그램]은 학생들을 프락시스 지향의 문화(프락시스 지향의 입학은 좋은 시작이다)속에서 사회화하고, 학생들이 실천과 환자에 대해 자신이 가지고 있는 가정에 대해 지속적으로 의문을 던지도록 하는 것을 목표로 할 것이다.
  • [(비판적으로 성찰하는) 학생들]은 자신의 실천과 프로토콜에 포함된 가정과 유해한 관계에 적극적으로 도전함으로써 자신의 실천 컨텍스트에서 점진적으로 매일 개선을 도모하는 것을 목표로 할 것이다.

Baker 등, Halman 등, Kumagai 및 Lypson에 의해, 이러한 목표에 맞춘 교육 관행의 개요가 설명되고 있으며, 표 2에 몇 가지 예가 있다.

For those teaching critical reflection in HPE, the overall goal congruent with the theoretical literature would be to teach students to approach their clinical work as a form of praxis. As noted above in our example of the family doctor working in relation to disability policies, praxis is critical theory–informed action. It is a fusion of reflection and action, specifically critical reflection and action.29 

  • At the organizational level, a critically reflective medical school might change its admissions criteria by removing a measure shown to be inequitable, based on theory-informed investigation.
  • Critically reflective faculty and programs would aim to socialize students in a praxis-oriented culture (a praxis-oriented admissions process being a good start) and to orient them toward continually questioning their own assumptions about their practices and about their patients.
  • Students would also be oriented toward creating incremental everyday improvements in their own practice contexts by actively challenging the assumptions and harmful relations embedded in their practices and protocols.

Pedagogical practices aligned with these goals have been outlined by Baker et al,59 Halman et al,60 and Kumagai and Lypson,4 and we share some examples in Table 2.

 

비판적 성찰의 커리큘럼 목표는 [합의된 "콘텐츠" 지식 기반]을 구축하는 것이 아니라, [특정한(지속적으로 질문하는) 시각과 존재 방식]을 학생들에게 고취하는 데 초점을 맞추고 있습니다. 따라서 비판적 성찰의 핵심 개념(예: 확립된 권력관계를 인식하고 때로는 도전하는 것)은 단순히 특정 강의나 과목에서 가르치는 것이 아니라, 공식적이고 숨겨진 커리큘럼 전체에 통합될 필요가 있다. 마찬가지로 교수는 내용지식을 주로 전달하는 교사가 아니라, 학생들과 함께 배우고 도전하는 역할 모델 및 멘토 역할을 합니다. 구체적인 커리큘럼 내용은 사고와 존재 방식을 형성하는 수단이 될 것이다. 

Curricular objectives for critical reflection focus on imbuing students with a particular, constantly questioning, way of seeing and being, rather than on building an agreed-upon “content” knowledge base. As such, notions that are key to critical reflection (such as recognizing and, at times, challenging established power relations) would need to be integrated throughout the formal and hidden curricula rather than simply taught in a particular lecture or course.29 Similarly, faculty members would serve as role models and mentors who learn with and challenge students rather than as teachers who primarily transmit content knowledge; the specific curriculum content would be a vehicle for shaping ways of thinking and being.4,38,61

비판적 성찰의 평가는 또한 그것의 철학적, 이론적 기원과 일치해야 한다. 성찰 학자들은 성찰 활동을 평가하거나 의무화할 때 잠재적 위험에 주목했다. 일부에서는 성찰적 사고의 표현을 서면으로 의무적으로 제출하게 만들면, 성찰이 [일종의 감시]가 된다고 주장한다. 다른 이들은 성찰을 지나치게 환원주의적으로 평가하는 접근법은 [핵심point을 놓치고], 대신 [토큰주의적이거나 조작된 반성을 유도한다]고 주장한다. 이러한 크리틱은 일반적으로 (비판적 성찰이 아니라) 성찰에 대한 것이다. 성찰과 반사성에 대한 [비판성criticality]를 더할 때 [사회적 가정, 규범 및 가치가 강조된다는 점]을 고려할 때, 우리는 주의를 기울여야 할 이유를 더 확장할 수 있다.

Assessment of critical reflection must also align with its philosophical and theoretical origins. Scholars of reflection have noted potential dangers in assessing or mandating reflective activities. Some have argued that through mandated submission of written representations of reflective thought, reflection becomes a form of surveillance; others argue that overly reductionistic approaches to assessing reflection miss the point and instead drive tokenistic or fabricated reflection.14,24,62 These critiques have typically been levied at reflection (not critical reflection); given the emphasis on societal assumptions, norms, and values that adding criticality to reflection and reflexivity brings, we extend the cause for caution even further.

[모든 평가는 통제의 한 형태]라는 주장이 종종 제기되어 왔지만, [점수grading]을 통해 사회 세계를 바라보는 특정한 방식을 명시적으로 강요하는 것은 현대 교육자들 사이에서 불편함을 야기할 것임을 쉽게 상상할 수 있다. 그러나 윤리적으로 덜 까다로울 수 있는 다른 옵션이 적어도 두 가지가 있다.

  • 의료 분야에서는 실무 환경에서 직업의 일원으로 일하는 모든 실무자에게 요구되는 가치와 규범(종종 전문직 윤리강령으로 기술됨)이라는 오랜 역사가 있습니다. 그러한 가치의 현대적 예는 [동정심과 정직성]을 포함할 수 있습니다. 따라서 직장 내에서 이러한 직업별, 합의된 가치를 집행enact하거나 수행하는 학생들의 능력을 평가할 수 있다.
  • 또한 비판적 성찰이 [환자 치료를 개선할 것으로 기대되는 특정 가치]를 옹호하고 모델링하는 [기관적 전환shift]의 일부로 받아들여진다면, [그러한 가치들을 기관적 차원에서 집행enact하는 학교의 성공]과 [환자 치료에 대한 그러한 조치의 효과]를 둘 다 평가하는 것이 적절할 것이다. 그러나 이러한 영향은 비판적 성찰과 일치하는 방식으로 평가해야 한다.

Although it has often been argued that all assessment is a form of control,63 one could easily imagine that explicitly enforcing—through grading—particular ways of viewing the social world might cause discomfort amongst contemporary educators. However, there are at least two other options that might be less ethically fraught.

  • There is a long history in the health professions of identifying values and norms (often delineated in codes of professional ethics) required of all practitioners while working as a member of the profession in the practice setting; contemporary examples of such values might include compassion and honesty. One could, therefore, assess students’ abilities to enact or perform these profession-specific, agreed-upon values within the workplace.
  • In addition, if critical reflection is taken up as part of an institutional shift to espousing and modeling particular values that are thought to improve patient care, then it would be appropriate to evaluate both the success of the school in enacting those values at the institutional level and the effect of those actions on patient care. However, these effects would need to be assessed in ways aligned with critical reflection.

비판적 성찰과 연계된 평가는 주로 추가 연구의 영역으로 남아있지만, 관점과 가치의 변화를 측정하기 위한 [체크리스트 접근방식]은 비판적 성찰의 기본 원칙과 일치하지 않을 수 있다. 대신 시뮬레이션 디브리핑 중 대화 분석을 포함하여 개인의 시프트된 관점을 평가하기 위한 접근방식을 모색하기 시작했습니다. 학자들은 최근 성찰성에 대한 학습을 평가하기 위해 담론 분석 접근법을 사용했으며, 우리는 비판적 성찰에도 같은 것이 이루어질 수 있다고 제안한다. 

Although assessment aligned with critical reflection largely remains an area for further research,59 a checklist approach to measuring a shift in perspective and values would likely not be congruent with the underlying principles of critical reflection. Instead, we have begun to explore approaches to assessing a person’s shifted perspective, including, for example, analyzing conversations during simulation debriefings. Scholars have recently used discursive analysis approaches to assess learning about reflexivity, and we suggest that the same could be done for critical reflection.64

비판적 성찰성 교육 및 평가
Teaching and assessing for critical reflexivity

[비판적 성찰]을 가르치는 전반적인 목표가 [프락시스Praxis를 자극하는 것]이라면, [비판적 성찰성]을 가르치는 전반적인 목표는 [갱신된 행위자성renewed agency을 자극하는 것]이다. 행위자성은 [사회에 대해 행동할 수 있는 것]을 의미하며, 그것은 우리의 현재 행동 방식의 한계를 벗어나 더 나은, 더 윤리적 세상을 생각하는 것으로 시작해야 한다. [현재의 사고방식과 지식의 한계를 넘어 생각]할 수 있어야 하기 때문에, 진정한 에이전시를 갖기 위해서는 성찰성적이어야 한다. 위의 예를 계속하여, 만약 우리가 개인의 수준에서 [비판적 반성]을 평가하고 싶다면, 우리는 먼저 현재의 평가 정의를 재고하는 사람들을 반사적으로 생각하고 평가하는 방법을 제정할 필요가 있을 것이다. (즉, 평가의 다른 전제조건/이해에 의해 통지되는 새로운 평가 개념을 만드는 것). 여기서 우리는 [비판적 성찰과 비판적 성찰성 사이의 중첩]을 발견합니다. 즉, 평가를 완전히 다르게 상상함으로써 새로운 재료 평가 접근법을 만듭니다.

While the overall goal of teaching critical reflection is to stimulate praxis, the overall goal for teaching critical reflexivity in HPE is to stimulate renewed agency. Agency means being able to act on society, which must begin with thinking of a better, more ethical world, outside the confines of our current ways of doing things.44 One must be reflexive to have true agency as one must be able to think beyond the confines of current ways of thinking and knowing.44 Continuing with the example above, if we wanted to assess critical reflection at the individual level, we would need to first reflexively conceive of and enact a way of assessing people that rethinks current definitions of assessment (i.e., creating a new conception of assessment informed by different assumptions/understandings of assessment). Here we see a point of overlap between critical reflection and reflexivity—creating new material assessment approaches by imagining assessment completely differently.


[성찰성]을 가르치기 위해서는, 학생들에게 [자기 자신]뿐만 아니라, [자신의 위치나 존재 방식] 등에 대해서도 암묵적인 가정을 보다 폭넓게 질문하는 방법을 가르쳐야 합니다. 학생들은 [(일상적으로 정상으로 보이지만) 실제로는 역사와 우연의 산물인 사회적 현상을 "낯설게make strange" 만드는 방법]을 배울 필요가 있을 것이다.65 이러한 사고방식은 사회과학 전공에서 일상적으로 가르치고 있으며, HPE는 이러한 접근법에서 차용될 수 있다.8 예를 들어,

  • 학생들은 특정한 개념(즉, 형평성, 권력)을 정의하도록, 그리고 중요한 이론적 프레임워크를 선택해서 작업하도록 배울 필요가 있을 것이다.
  • 그들은 또한 식민주의, 동성애 혐오증, 인종차별, 또는 환자들이 직면할 수 있는 다른 유사한 형태의 차별과 같은 주제에 대해 교육받을 필요가 있을 것이다.
  • 교수들은 학생들이 이 지식을 습득할 수 있도록 하고 모든 지식 주장의 기초가 되는 가정에 대한 추가 질문의 기초로 사용할 수 있도록 해야 합니다.

To teach reflexivity, students would need to be shown how to question their tacit assumptions not only about themselves—their own position and ways of being—but also about societal norms more broadly. They would need to learn how to “make strange” social phenomena that are routinely seen as normal but are actually socially constructed products of history and happenstance (e.g., definitions of family, competence, or disability).65 These ways of thinking are routinely taught in social science faculties; HPE could borrow from these approaches.8 For example,

  • students would need to be taught to define specific concepts (i.e., equity, power) and work with a selection of important theoretical frameworks.
  • They would also need to be educated about such topics as colonialism, homophobia, racism, and/or other similar forms of discrimination that might be faced by their patients.
  • Faculty members would need to enable students both to acquire this knowledge and to use it as the basis for further questioning the assumptions underlying all knowledge claims.

이 사회과학 지식에 대한 평가는 학생들이 토론, 서면, 그리고 실제에서 어떻게 주요 개념을 적용하는지에 초점을 맞출 수 있다. 여기서 중요하지만 미묘한 차이점에 주목하십시오.

  • [비판적 성찰]은 프락시스 지향의 전통에서 비롯됩니다. 그것은 [보는 방법과 존재하는 방법ways of seeing and being]에 더 초점을 맞추고 있기 때문에, 학습과 성과를 평가하는 [전통적인 학문적 방식]에 덜 적합합니다. 따라서 비판적 반성은 평가에 대한 더 실무에 기초한 접근법practice-based에 도움이 될 수 있다.
  • 한편, [비판적 성찰성]은 학습자가 기억력, 이해력 및 적용 측면에서 시험할 수 있는 [사회과학 이론 세트]를 명확하게 포함하고 있다는 점에서, 약간 더 "전통적인" 것으로 생각될 수 있다. 즉, [비판적 성찰성적 이론의 이해]가 아니라, [비판적 반사성의 집행enact]에 대한 평가는 위에서 언급한 것처럼 [비판적 성찰]과 유사한 평가 접근법을 필요로 할 것이다.

비판적 성찰과 반사성의 궁극적인 목표는 겹치므로, 평가 접근법은 결국 관점과 관행이 어떻게 변화했는지를 결정하는 데 수렴될 수 있다. 

Assessment of this social scientific knowledge could focus on how students apply key concepts in discussion, in writing, and in practice. Note here a key, yet subtle, difference.

  • Critical reflection derives from praxis-oriented traditions; it is more focused on ways of seeing and being and thus fits less neatly into our traditional academic ways of assessing learning and performance. Critical reflection may therefore lend itself to more practice-based approaches to assessment.
  • Meanwhile, critical reflexivity could be conceived of as being slightly more “traditional” in that it contains clearly agreed-upon sets of social science theory that learners could be tested on in terms of memory, understanding, and application. This said, the enactment of critical reflexivity as opposed to the understanding of critically reflexive bodies of theory would require similar assessment approaches to critical reflection such as those mentioned above.

The ultimate goals of critical reflection and reflexivity overlap, so the assessment approaches might eventually converge around determining how perspectives and practices have shifted.59

비판성을 위한 공간 확보
Making Space for Criticality

비판적 성찰과 반사성을 가르치고, 평가하고, 평가하는 위의 어떤 제안도 생명과학에서 일반적인 것 이상의 것을 알 수 있는 철학적, 물리적 공간 없이는 가능하지 않습니다. 다른 학자들이 이를 탐구했고, 우리는 독자들에게 이 작품들을 살펴보라고 권한다. 
None of the above suggestions for teaching, assessing, and evaluating critical reflection and reflexivity are possible without a philosophical and physical space for ways of knowing beyond those common in bioscience. Other scholarship has explored this, and we direct readers to these works.38,61,66,67

이 기사에서는 비판적 성찰과 비판적 성찰성의 개념을 보다 정밀하고 뉘앙스로 도입하고, 사회과학이나 인문학의 개념을 HPE에 적용하는 이 접근방식을 채택할 기회를 제시한다. 그러나 우리는 비판적 성찰 및 비판적 성찰성을 (지속적으로 적용하는 과정에서 진화하지 않는) 완전하거나 정적인 개념으로 포지셔닝할 의도가 없다. 사실, 브룩필드는 우리가 궁극적으로 비판적 성찰의 과정을 그 자체로 되돌릴 것을 옹호한다. 우리는 비판적 성찰과 비판적 성찰성 자체를 문제화해야 한다고 주장한다. 이러한 개념이 더 대중화되면, 그것들은 또한 더 희석되어 의미가 "증발"되고, 궁극적으로 물화reified된다. 그렇게 되면, 이 개념은 [원래 그것이 기원한 맥락]을 훨씬 넘어, [담론의 수준]으로 올라감을 의미한다. 우리는 이미 비판적 성찰에서 피난evacuation의 징후를 볼 수 있다(비판적 성찰을 가르치고 육성한다고 주장하는 수많은 과제와 포트폴리오). 

This article sets forth an opportunity to engage the concepts of critical reflection and reflexivity with more precision and nuance, and to take this approach to applying any social science or humanities concept to HPE. However, we do not intend to position critical reflection and reflexivity as infallible or static concepts, unable to evolve as they are continually applied. In fact, Brookfield26 advocates that we ultimately turn the critically reflective process back on itself. We argue that we must problematize both critical reflection and reflexivity themselves. As these concepts become more popular, they also become more diluted, becoming “evacuated” of meaning (wherein the concepts mean everything and thus nothing) and ultimately reified, which means the concepts can become raised to a level of discourse well beyond their original contexts of origin. We can already see signs of evacuation of critical reflection (with countless assignments and portfolios claiming to teach and foster critical reflection but meaning vastly different things).

브룩필드는 또한 우리가 비판적 성찰을 홍보하는 것에 너무 빠져든 나머지, 그것을 [배제의 메커니즘]으로 사용하고, [권력을 얻기 위한 수단]으로 사용할 수 있다고 경고한다. 우리는 (마치 비판적 성찰을 위해 사용하고 가르치는 교육자들이 점점 더 나은 교육자가 되어 억압을 뿌리뽑을 수 있다는 것과 같은) "선형적인 진보"를 목격할 것이며, 또 그래야만 한다는 생각을 버려야 한다. 브룩필드는 "지배적 문화적 가치가 다수보다 소수의 이익에 기여하는 방식을 분석하는 데 적용한 것과 동일한 [합리적 회의론]을 우리 자신의 입장에 적용해야 한다"고 결론지었다. 또한, 우리 자신의 실천에 대해 비판적으로 성찰하는 입장은 [건강한 아이러니]이다. 이것은 우리가 좋은 관행에 대한 하나의 보편적인 진실을 포착했다는 믿음에 대한 필요한 대비책hedge이다. 또한 [비판적 성찰 프로토콜]을 [무비판적 개발하고 물화하는 것]을 방지하는 데에도 도움이 된다."라고 말하였다.  

Brookfield further cautions that we can get so caught up in our own promotion of critical reflection that we use it as a mechanism of exclusion and means to gain power. We also need to let go of the notion that we can and should see “linear progress,” as if educators using and teaching for critical reflection become increasingly better educators, eradicating oppression one day at a time. Brookfield concludes that we must “apply the same rational skepticism to our own position that we apply to analyzing how dominant cultural values serve the interests of the few over the many. A critically reflective stance towards our practice is healthily ironic, a necessary hedge against the belief that we have captured the one universal truth about good practice. It also works against uncritical development, and reification, of protocols of critical reflection.”26(p47) 

우리는 Brookfield의 현명한 말을 반복하고, 모든 과학적이고 SS&H의 개념과 방법은 원래 분야와 HPE 양쪽에서 지속적인 정밀 조사를 받아야 한다고 강조한다. 비판적 성찰과 비판적 성찰성의 경우, 지속적인 연구는 학습 방법, 학습 방법 및 학습 방법, 평가 방법 및 평가 방법, 결정적 성찰 또는 반사성의 교육 및 평가가 정렬되고 의미 있는 영향에 대해 어떻게 평가될 수 있는지에 초점을 맞출 필요가 있다. [비판적 성찰과 비판적 성찰성]의 목적은 (유일하고 고정적이며 올바른 존재, 시각, 사고방식으로 이어지는 것이 아니라), 자신의 존재, 시각, 사고방식의 기초가 되는 가정에 대한 지속적인 의문을 불러일으키는 것이다. 이러한 접근방식을 보다 신중하게 실장하는 방향으로 나아가면 평가 접근방식도 조정되고 적절해야 합니다. 이러한 지속적 질문과 일치된 평가는 HPE 분야의 지속적인 발전과 보건 전문가의 사고 및 실천의 핵심이다.

We echo Brookfield’s wise words, and stress that all scientific and SS&H concepts and methods be subject to continued scrutiny both from within their originating disciplines and in HPE. For critical reflection and reflexivity, continued research needs to focus on how they are learned, how they can and should be taught, how they can and should be assessed, and how the teaching and assessing of critical reflection or reflexivity might be evaluated for aligned and meaningful impacts. The purposes of critical reflection and reflexivity are not to lead to a singular, fixed, right way of being, seeing, and thinking but, rather, to inspire continual questioning of the assumptions underlying one’s ways of being, seeing, and thinking. As we move toward implementing these approaches more thoughtfully, evaluation approaches must also be aligned and appropriate. This continued questioning and aligned evaluation are core to both the ongoing development of the HPE field and that of health professionals’ thinking and practice.

 


 

Acad Med. 2019 Aug;94(8):1122-1128.

 doi: 10.1097/ACM.0000000000002724.

The Divergence and Convergence of Critical Reflection and Critical Reflexivity: Implications for Health Professions Education

Affiliations collapse

Affiliation

1S.L. Ng is director of research, Centre for Faculty Development, and Arrell Family Chair in Health Professions Teaching, St. Michael's Hospital, scientist, Centre for Ambulatory Care Education and the Wilson Centre, and assistant professor, Department of Speech-Language Pathology, University of Toronto, Toronto, Ontario, Canada. S.R. Wright is scientist, Michael Garron Hospital, Centre for Ambulatory Care Education and the Wilson Centre, and assistant professor, Department of Family and Community Medicine, University of Toronto, Toronto, Ontario, Canada. A. Kuper is associate professor of medicine and faculty co-lead in person-centred care, Department of Medicine, scientist and associate director, Wilson Centre for Research in Education, University Health Network, University of Toronto, and staff physician, Division of General Internal Medicine, Sunnybrook Health Sciences Centre, Toronto, Ontario, Canada.

PMID: 30920447

DOI: 10.1097/ACM.0000000000002724

Abstract

As a field, health professions education (HPE) has begun to answer calls to draw on social sciences and humanities (SS&H) knowledge and approaches for curricular content, design, and pedagogy. Two commonly used SS&H concepts in HPE are critical reflection and critical reflexivity. But these are often conflated, misunderstood, and misapplied. Improved clarity of these concepts may positively affect both the education and practice of health professionals. Thus, the authors seek to clarify the origins of each, identify the similarities and differences between them, and delineate the types of teaching and assessment methods that fit with critical reflection and/or critical reflexivity. Common to both concepts is an ultimate goal of social improvement. Key differences include the material emphasis of critical reflection and the discursive emphasis of critical reflexivity. These similarities and differences result in some different and some similar teaching and assessment approaches, which are highlighted through examples. The authors stress that all scientific and social scientific concepts and methods imported into HPE must be subject to continued scrutiny both from within their originating disciplines and in HPE. This continued questioning is core to the ongoing development of the HPE field and also to health professionals' thinking and practice.

HPE연구의 네러티브 분석의 잠재력: 다섯 개의 분석적 렌즈(Med Educ, 2021)
The potential of narrative analysis for HPE research: Highlighting five analytic lenses
Abigail Konopasky1,2 | Lara Varpio1 | Renée E. Stalmeijer3

 

1 소개
1 INTRODUCTION

현대 보건의료전문직교육(HPE) 연구자들은 [여러 가지 고약한wicked 문제]에 직면해 있다1. 몇 가지만 열거하더라도, 전문가간 협력, 의학 학습에서의 수치심 경험, 소수자 의사와 훈련생에게 인종차별이 어떤 영향을 미치는지 등등이다. 이러한 문제들을 고약하게 만드는 이유 중 일부는 그것들이 사회적 특성social nature을 가지기 때문이다; 이러한 도전들에 관련된 개개인의 특별한 경험, 믿음, 선택은 그들이 그들 자신의 주관적인 해석이 수반되기 때문에, [확정적인definitive 공식이나 설명을 거부한다]는 것을 의미한다. 이러한 사회적 뿌리를 고려할 때, 질적 연구 방법은 HPE의 고약한 문제를 이해하고, 부분적으로는 맥락을 고려한context-bound 해결책을 만드는 데 도움이 될 수 있다. 

Contemporary health professions education (HPE) researchers are faced with a number of wicked problems1: interprofessional collaboration, experiences of shame in medical learning and how racism affects minoritised physicians and trainees, to note a few.2-12 Part of what makes these problems wicked is their social nature; the particular experiences, beliefs and choices of individuals involved in these challenges mean that they defy definitive formulation or explanation since the multiple people involved all bring their own subjective interpretations. Given these social roots, qualitative research methods can be helpful in understanding HPE's wicked problems and constructing some partial, context-bound solutions.13 

이러한 문제를 다루는 질적 분석은 가치 있는 통찰력을 만들어냈지만, 다수는 [유사한 질적 방법과 방법론]에 의존해 왔다.

  • 전문가간 협력에 대한 연구는 일반적으로 관찰, 인터뷰 및 포커스 그룹 방법의 조합을 사용하여 전문가간 협업을 가능하게 하거나 방해하는 요소를 푸는 정성적 접근법을 사용해 왔다. 
  • 수치심 조사는 일대일 인터뷰를 통해 수집된 데이터로 현상학을 활용했다. 
  • 의사와 훈련생에게 미치는 인종차별의 영향에 대한 탐구는 종종 비판적 이론의 관점에서 데이터를 수집하기 위해 일대일 인터뷰를 이용했다. 

분석적 측면에서 살펴보면, 이러한 고약한 문제에 대한 접근법은 [지속적인 비교 및 주제적 내용 분석]을 포함한다. 

Qualitative analyses addressing these problems have generated valuable insights, but many of them have relied on a similar set of qualitative methods and methodologies:

  • studies of interprofessional collaboration have generally used qualitative approaches using a combination of observation, interview and focus group methods to unpack what enables or hinders interprofessional collaboration.41214-16 
  • Investigations of shame have harnessed phenomenology with data collected via one-on-one interviews.67 
  • Explorations of racism's effects on physicians and trainees have also used one-on-one interviews to collect data, often from a critical theory perspective.8-101718 

Analytically, approaches to these wicked problems have included constant comparative and thematic content analysis, among others.

추가적이고 보완적인 통찰력을 제공하는 데 도움이 될 수 있는 분석 접근법의 또 다른 세트는, 사람들이 자신의 세계를 이해하기 위해 사용하는 [핵심적 도구]에 의존한다. 바로 네러티브(서사)이다. 브루너는 이야기는 개인이 '삶의 바로 그 사건들을 목적적으로 만드는' 원칙적인 수단이라고 주장했다. 그는 [사람들이 그들의 경험에 대해 가지고 있는 이야기]가 [인간이 의미를 만드는 기본적 과정에 대한 통찰력]을 제공한다고 믿었다.

Another set of analytic approaches that may help provide additional, complementary insights relies on a central tool many individuals use to make sense of their world: narrative.1920 Bruner argued that stories are a principle means by which individuals ‘purpose-build the very events of a life’1915; he believed the stories people have of their experiences offer insight into humans' basic meaning-making processes.

[내러티브 분석 방법(NA)]은 HPE 연구원들이 임상의 교육자와 HPE 학습자가 자신의 삶을 이해할 수 있는 내러티브 방법을 활용하고자 하기 때문에 귀중한 자산이 될 수 있다. 이러한 자산을 활용하려면 다양한 [NA 렌즈]가 제공할 수 있는 가능성을 검토하는 것이 도움이 될 수 있습니다. 분석적 렌즈analytic lenses는 질적 연구를 하는 특별한 '스타일'이다. 이론과는 달리, 그것들은 우리가 보는 것을 규정하지 않지만, Blumer의 [민감 개념sensitising concept]처럼, '어떤 방향에서 볼지를 제안'함으로써 질문과 주장을 형성한다.22

Methods of narrative analysis (NA) can be valuable assets as HPE researchers seek to tap into the narrative ways of knowing19 by which clinician educators and HPE learners may understand their lives. To harness these assets, it may be helpful to review the possibilities different NA lenses can provide. Analytic lenses are particular ‘styles’ of doing qualitative research21; unlike theories, they do not prescribe what we see but, like Blumer's sensitising concepts, ‘suggest directions along which to look’, shaping the questions asked and the claims made.22

이 연구 접근 논문은 NA 방법이 연구자들에게 제공할 수 있는 다섯 가지 분석 렌즈(전체론, 위치론, 언어론, 대리인, 순차론)를 강조한다. 우리는 사회과학 연구의 '서사적 전환narrative turn'을 검토함으로써 이 설명을 시작합니다. 그런 다음 HPE에서의 사용(과거 및 잠재력)과 한계에 대해 논의하는 다섯 가지 렌즈(홀리스틱, 위치, 언어, 대리 및 순차)를 각각 설명한다. 또한 렌즈에 액세스하는 데 사용할 수 있는 특정 NA 방법을 이해하기 위한 두 가지 접근 방식을 논의한다. 우리는 우리의 렌즈와 경험을 되새기며 NA의 약속과 편파성을 탐구함으로써 결론을 내린다.
This Research Approaches article highlights five analytic lenses NA methods can offer researchers: holistic, situated, linguistic, agentive and sequential. We preface this description by reviewing the ‘narrative turn’ in social science research.23, 24 We then describe each of the five lenses—holistic, situated, linguistic, agentive and sequential—discussing their use (past and potential) in HPE and limitations. We also discuss two approaches to understanding specific NA methods that can be used to access the lenses. We conclude by exploring the both the promise and partiality of NA, reflecting on our own lenses and experiences.

 

2 배경: '서사적 전환'
2 BACKGROUND: THE ‘NARRATIVE TURN’


1980년대 중반 제롬 브루너와 다른 사람들이 내러티브 연구의 정당성을 확고히 확립한 사회과학 연구의 '사서적 전환'을 이루었다. 그렇게 함으로써, 그들은 실증주의에 도전했고 (패러다임이나 범주적 방식 대신) 내러티브 방식의 지식을 장려했다. 학자들은 [내러티브에 대한of 연구]뿐만 아니라, [실천과 사건을 내러티브로as 해석하는 연구를 포함하는 서사적 탐구narrative inquiry]를 통해 이러한 지식을 탐구했다. 이후 학자들은 여러 연구 패러다임, 학문 분야, 방법론에 걸쳐 서사적 탐구를 사용해오면서, 사고의 서사적 모드의 가치를 인정하고 이용해왔다. 연구참여자들이 자신의 경험담을 어떻게 구성하는지를 연구하거나, 연구자들의 스토리텔링으로부터 전개drawing를 통해 참가자들을 더 잘 이해하게 된 것이다.
The mid-1980s marked the ‘narrative turn’ in social science research, when Jerome Bruner and others firmly established the legitimacy of narrative inquiry.23, 24 In so doing, they challenged positivism and promoted narrative—versus paradigmatic or categorical—ways of knowing.19, 23, 25, 26 Scholars explored these ways of knowing through narrative inquiry, which encompasses any study of narrative (or collections of narratives) as well as studies interpreting practices and events as narratives.20, 26, 27 Scholars have used narrative inquiry across multiple research paradigms, academic disciplines and methodologies, but they all value and harness this narrative mode of thinking, either studying how participants construct the stories of their experiences or drawing on researchers' storytelling to better understand participants.28-31

학자들이 서사적 분석(NA)에 대한 접근 방식을 개발한 것은 바로 이러한 방향에서이며, 서사적 탐구를 해나갈 지향orientation을 의미한다. NA 방법은 광범위하고 유연하게 해석하고 적용할 수 있으므로, 우리가 도출하거나 가리키려고 하는 [NA 방법의 목록]이란 존재하지 않는다. 대신 아래는 NA 문헌과 우리의 경험을 바탕으로 NA가 HPE 연구자에게 제공할 수 있는 렌즈 5개를 제공합니다. 각 렌즈는 데이터와 연구 맥락의 일부 측면을 강조하는 동시에 다른 부분을 강조하므로 연구 설계자는 그 중에서 신중하게 선택해야 한다.

It is from within this orientation that scholars develop their approach to narrative analysis (NA), that is, orientations through which they carry out a narrative inquiry. NA methods are wide-ranging and can be flexibly interpreted and applied, so there is no single list of NA methods we draw from or point to. Instead, below, based on the NA literature and our own experiences,23, 25, 26, 32 we offer five lenses NA can offer HPE researchers. Each lens highlights some aspects of the data and research context while deemphasising others, so research designers must carefully select from among them.

3 과정: 5개의 렌즈 장착
3 PROCESS: FIVE LENSES ON NA

NA의 [전체론적 렌즈holistic lens] 는 이야기의 지위를 복잡하고 통합된 단위로서 보존한다. 이 렌즈는 데이터를 별도의 청크나 테마로 분류하기 보다는 [하나의 이야기, 하나의 사건, 심지어 하나의 이야기와 사건의 시리즈 내에서의 연결]에 초점을 맞춘다. 내러티브에 대한 이 조감도 렌즈는 연구자에게 [데이터를 하나의 (또는 소수의) 해석으로 합성]하도록 요청하며, 아마도 [전체적인 주제, 도덕 또는 스타일]을 생성할 것이다. 이것은 프라이스와 동료들이 그들의 직업 선택에 대한 밀레니얼 간호사들의 설명에 대해 연구한 것과 같이 이야기 간 비교를 가능하게 한다(표 1 참조). 전체론적 렌즈는 각 [참가자의 이야기를 복잡하고 일관되게 이해]할 수 있게 해주었고, 프라이스와 동료들이 말하는 '참가자 이야기의 전체성과의 연결'을 유지했습니다.34 이 렌즈는 참가자의 이야기를 일관성 있게coherent 설명할 수 있게 해준다. [하나의 사건이나 순간이 네레이터에게 어떻게 영향을 미쳤는지]를 조사할 뿐만 아니라, [이야기의 모든 사건과 순간들이 어떻게 의미를 창조하기 위해 함께 작용하는지]를 보여준다.

The holistic lens on NA preserves the status of a story as a complex and integrated unit.23 Rather than categorising data into separate chunks or themes, this lens focuses on connections within a story, an event or even a series of stories and events that build a systematic whole.33 This bird's eye lens on narrative asks the researcher to synthesise data into a single (or small number of) interpretation(s), perhaps generating an overall theme, moral or style. This allows comparison across stories, as Price and colleagues34 did in their study of millennial nurses' accounts of their career choice (see Table 1). The holistic lens provided an understanding of each participant's story that was both complex and coherent, maintaining what Price and colleagues call, ‘ongoing connection to the wholeness of the participants' stories’.34 This lens allows for a coherent account of participants' stories, examining not just how one event or moment may have affected the narrator but how all the events and moments of a story work together to create meaning.

NA의 전체론적 접근법을 사용하는 연구자들이 해결해야 할 근본적인 과제는 '전체' 단위, 즉 '전체' 이야기를 기술하는 것이다. 즉, 전체론적인 NA 렌즈를 사용하는 학자들은 [분석해야 할 '전체'가 어느 정도인지 결정]해야 한다. 이 결정은 [길고 다부진 인생 이야기]부터, [단 몇 구절의 '작은 이야기']까지 매우 다양할 수 있다. 그리고, 미슬러의 주장처럼, 무엇이 이야기이고 무엇이 이야기가 아닌지를 묘사하는 선line과, 그 이야기를 어떻게 표현하는지는 해석 과정의 일부이다. 게다가, [연구자의 전체론적 관점]은 [참가자들이 그들의 이야기 전체를 보는 방식]과 일치하지 않을 수 있다. 따라서 전체론적 렌즈를 사용하는 학자들은 자신의 해석의 잠재적 우위에 대해 인식하고 NA 과정에 참여자를 포함하기 위해 노력해야 한다.
A foundational challenge that researchers using NA's holistic approach must contend with is delineating what is a ‘whole’ unit, a ‘whole’ story. In other words, scholars using the holistic NA lens must decide how much of a person's story is the ‘whole’ to be analysed. This decision can be highly variable, ranging from a long and multi-part life story down to ‘small stories’ of just a few phrases or sentences.32, 38 And, as Mishler argued, the lines delineating what is and is not a story and how to represent that story are part of the interpretative process.39 Moreover, a holistic researcher perspective may not align with the ways participants see the whole of their stories. Scholars using the holistic lens, then, must be aware of the potential primacy of their interpretations and work to include participants in the NA process.

NA의 [상황적 렌즈situated lens]는 개인이 내러티브를 형성하는 [특정 문화적 맥락]을 전경foregrounds으로 한다. 이 렌즈는 청중, 서술의 목적 또는 기능, 그리고 해설자들이 끌어 들이는 문화적 자원을 고려하여, 이러한 맥락에서 무엇이 논쟁되고 정규화되거나 '표준화'되는지를 이해하고자 한다. 이러한 관점에서, 이야기는 [그 문화에서 이용할 수 있는 서사적 자원을 사용하여, 화자와 청자에 의해 공동 구성된 것]으로 볼 수 있다; 연구자들은 네러티브가 그것이 말해지거나 집행되는 맥락context어떻게 연결되는지 완전히 탐구한다.41 예를 들어, 연구자들은 언제 그리고 어떻게 청자가 긍정하고, 이의를 제기하고, 심지어 이야기를 이어받는지 보기 위해 [화자와 청자 사이의 상호작용]에 초점을 맞출 수 있다. 이러한 상호작용을 추적하면서 연구자들은 공동 창작자들이 이야기를 그리는 [사회적 구성](예: 성별, 인종 또는 민족 정체성)과 [문화적 구성](예: 과로한 레지던트, 보조 간호사, 영웅적 외과의)에 관심을 기울인다.

The situated lens on NA foregrounds the particular cultural context(s) in which individuals create narratives.23, 40 This lens seeks to understand what is contested and what is normalized or ‘typified’31 in these contexts, considering audience, the purpose(s) or function(s) of the narrative and the cultural resources narrators draw upon.23, 40 From this perspective, stories can be seen as co-constructed by the teller and hearer using the narrative resources available in the culture; researchers fully explore how the narrative connects with the context in which it is told or enacted.41 For instance, researchers might focus on the interactions between teller and hearers to see when and how hearers affirm, contest or even take over the story.41 As they trace these interactions, researchers attend to social constructs (e.g., gender, racial or ethnic identity) and cultural constructs (e.g., the overworked resident, the supportive nurse and the heroic surgeon) on which story co-creators draw.23, 42 

Sargeant 등에 의한 연구는 상황적 렌즈를 사용하여 모의 환자들이 그들의 일에 대한 서사에서 의대생과 비교해서 자신들을 어떻게 위치시키는지position 탐구했다(표 1 참조). 이 위치 렌즈는 사회적, 문화적 신념과 구조가 그들의 세계에 대한 화자의 이해를 형성하는 방법에 대한 연구자들의 통찰력을 뒷받침했다. 이 연구에서 모의 환자들은 [가족]이라는 문화적 개념을 활용하여 [자신을 의대생들의 부모상parental figures]으로 이해했다.

A study by Sargeant and colleagues35 used a situated lens to explore how simulated patients position themselves vis-a-vis medical learners in their narratives about their work (see Table 1). This situated lens supported researchers' insights into the ways social and cultural beliefs and structures shape a narrator's understanding of their world. In this35 study, simulated patients drew on the cultural notion of family (among others) to understand themselves as parental figures to the medical learners.

그러나, 상황적 렌즈situated lens를 사용하는 다른 학문과 마찬가지로, 연구자들은 궁극적으로 분석, 해석, 그리고 궁극적인 연구 네러티브에서 [어떤 지역적, 문화적 맥락의 요소들을 전경에 둘지foreground]를 선택한다. 연구자는 자신의 경험, 문화적 배경, 이론적, 개념적 프레임워크에 영향을 받아 특정 서술이 수행하는 작업에 대한 연구자의 해석은 맥락의 [일부 측면을 지나치게 강조하여 다른 측면을 모호하게] 할 수 있다. 미슐러가 지적했듯이, 내러티브 학자들은 연구참가자들처럼 스토리텔러이다: '우리가 이야기를 발견하는 것이 아니라 이야기를 만드는 것이 분명하다. 우리는 분석적인 재설명을 통해 응답자들의 설명을 다시 말한다. 우리도 역시 스토리텔러이다….25
As with any scholarship using a situated lens, however, researchers ultimately choose which elements of the local and cultural context to foreground in the analysis, interpretation and eventual research narrative. Influenced by their own experiences, cultural background and theoretical and conceptual frameworks, researchers' interpretation of the work a particular narrative is doing may overemphasise some aspects of the context and obscure others. As Mishler noted, narrative scholars are, like their participants, storytellers: ‘It is clear that we do not find stories; we make stories. We retell our respondents' accounts through our analytic redescriptions. We, too, are storytellers …’.25

NA의 [언어적 렌즈linguistic lens]는 내러티브의 형식과 구조, 내용 모두를 질문한다. 인간 언어는 스토리텔링을 위한 단어, 구, 융통성, 의미의 무한한 잠재적 조합을 제공하는 문법적 자원을 제공하며, 이 렌즈는 화자들이 그 자원들에 대해 하는 선택을 조사한다.

  • 예를 들어, 거의 틀림없이 같은 정신 상태를 서술하더라도, '모른다'(즉, 나는 당신의 질문에 대답하는 데 필요한 지식이 없다)는 '당신[일반]은 알 수 없다'는 말과 다른 함축적 의미를 갖는다. (즉, 누구도 미래를 예측할 수 있는 지식을 가지고 있지 않다.)


NA's linguistic lens interrogates both the form and structure of a narrative as well as its content.40, 42 Human languages offer grammatical resources that provide an infinite number of potential combinations of words, phrases, inflexions and meanings for storytelling,43 and this lens examines the choices narrators make about those resources.40, 42, 44, 45 

  • For instance, while narrating what is arguably the same mental state, ‘I don't know’ (i.e., I haven't the knowledge required to answer your question) has different connotations from the statement ‘you [generic] just can't know’ (i.e., nobody has the knowledge to predict the future).46 

이러한 차이는 NA의 [언어적 렌즈]에 초점을 맞춘다. 언어적 렌즈의 중심적인 이점은 전문적인 딜레마의 의대생 내러티브에 대한 리스, 몬루제, 맥도날드 47의 연구에서 증명된 바와 같이 서술자narrator의 정체성에 대해 드러낼 수 있는 것이다. 한 학생의 딜레마에 대한 한 줄 한 줄 분석에서, 연구원들은 그녀가 괴롭힘의 피해자임에도 불구하고, 자신을 '매우 강한 여성'으로 구성하기 위해 어떻게 언어를 사용했는지를 보여주었다.47 이 언어 렌즈는 참가자가 그녀의 부정적인 경험에 대한 '통제'를 얻고' 그녀를 의사 커리어를 지속하게 하는 [정체성 작업identity work]을 하는데 어떻게 내러티브를 사용했는지를 강조하였다. 

These differences are brought into focus with NA's linguistic lens. A central benefit of the linguistic lens is what it can reveal about narrator identity,32, 40, 42 as demonstrated in Rees, Monrouxe, and McDonald's47 study of medical student narratives of professional dilemmas (See Table 1). In a line-by-line analysis of one student's dilemma, the researchers showed how she used language to construct herself as a ‘VERY strong woman’, despite being a victim of bullying.47 This linguistic lens highlighted how this participant used narrative to do the identity work of ‘gain[ing] control over her negative experience’ and persisting in her medical career.47

모든 연구 방향과 마찬가지로 NA의 언어 렌즈에도 한계가 있다. 

  • 첫째, 단어에만 집중하는 것은 다른 방법, 즉 억양, 몸짓, 또는 신체 위치 결정과 같은 부언어적 단서들로 전달되는 중요한 메시지들을 놓칠 수 있다. 전사된 단어에 대한 분석적인 집중은 '말하는' 다른 것들을 모호하게 할 수 있다.
  • 둘째, 데이터를 이산적discrete 언어 범주(예: 언어적 망설임 표식)로 분할함으로써, 연구자들은 내러티브의 전체적인overall 목적을 상실할 수 있다. 예를 들어 [전체론적 렌즈]또는 [상황적 렌즈]가 제공하는 잠재력을 포기하게 되는 것이다. 스털리 교수는 언어 렌즈와 같은 분석적이고 패러다임적인 접근은 '이상화의 경향에 있으며, 연구자들이 이야기를 사전 설정된 범주로 강제하도록 장려하고… [특정한 사회적 사건]에서 [구체적인 서술]이 어떻게 작용work하는지를 놓치고 있다'고 주장했다.

Like all research orientations, NA's linguistic lens has limitations.

  • First, a focus on the words alone can miss the important messages communicated in other ways, i.e., paralinguistic cues like intonation, gesture or body positioning. An analytic focus on the transcribed word can obscure the other things being ‘said’.
  • Second, by fragmenting the data into discrete linguistic categories (e.g., linguistic markers of hesitation), researchers may lose the overall purpose of the narrative, abandoning the potential that, for instance, a holistic or situated lens offers. Bleakley argued that analytical, paradigmatic approaches like that of the linguistic lens, ‘tend to idealisation, encouraging researchers to force stories into preset categories … missing how specific narratives work for specific social occasions’.20

NA의 [행위자적 렌즈agentive lens]행위자성agency, 즉 제약 조건 속에서 행동을 선택하고 실행할 때 인간의 의도적인 활동을 강조한다. 많은 학자들은 이야기를 하는 것을 [행위자적 행위agentic act]로 간주한다: 내레이터는 청자를 위하여, 그리고 청자와 함께 경험을 해석하고 평가한다. 이 렌즈는 이야기의 목적을 이해하기 위해 화자의 선택에 부분적으로 주의를 기울인다: 지금 이 서사적 행위자(또는 에이전트 그룹)는 무엇을 달성하려고 하는가? 
An agentive lens on NA highlights agency—i.e., the intentional activity of humans as they choose and execute actions amidst constraints.48, 49 Many scholars position telling a story as an agentive act: narrators interpret and evaluate experiences for and with the listener.23, 28, 29, 50 This lens attends to the narrator's choices in part to understand the purposes of a story: what is this narrative agent (or group of agents) trying to accomplish?23, 42, 50 

예를 들어, Caps와 Ochs는 고소공포증을 가진 참가자에 대한 그들의 분석을 어떤 객관적인 진실과의 일치보다는 서술자로서 그녀가 했던 해석적 작업에 초점을 맞췄다. 이 행위자적 렌즈는 [서술자 자신의 의도와 행동]뿐만 아니라 [그들이 타인의 의도와 행동을 어떻게 보는지]에 대한 이해를 지원한다. 예를 들어, Warmington과 McColl의 의대생들이 환자 치료 경험을 설명하는 방법에 대한 연구는 '행위자agency'이라는 단어를 명시적으로 사용하지 않았지만, 학생들을 행위자적 스토리텔러로 만들어 환자와 강사에 대한 '위치positioning'를 지정했다(표 1 참조). Warmington과 McColl의 참가자들은 일부 동의 절차를 무시한 것을 정당화하기 위해, 조건부로 자신의 스토리를 사용했다. 이 렌즈는 나레이터들이 이야기를 통해 만드는 수사적인 움직임rhetorical moves 을 강조합니다.

For example, Capps and Ochs42 focused their analysis of the participant with agoraphobia on her ‘struggle to achieve coherence and continuity’, on the interpretative work she did as a narrative agent rather than on her story's alignment with some ‘objective truth’. This agentive lens supports understanding not only of narrators' own intentions and actions, but also of how they see the intentions and actions of others. For example, Warmington and McColl's49 study of the ways medical students narrate patient care experiences, while not using the word ‘agency’ explicitly, framed the students as agentive storytellers, ‘positioning’ themselves vis-a-vis patients and instructors (see Table 1). Warmington and McColl's49 participants used their stories to justify, with reservations, ignoring some consent procedures (e.g., getting full consent for a medical student to practice rather than just implying it is not a choice). This lens highlights the rhetorical moves narrators make with their stories.

[행위자적 렌즈]는 참가자들의 의도적인 활동에 대한 통찰력을 제공할 수 있지만, 이러한 전략들은 또한 화자가 [기존의 규범과 담론에 의해 어떻게 위치지어지는지positioned by]를 반영한다. 서술형 에이전트는 그들이 자신을 발견하는 [상황과 구조에 의해 제약]을 받으므로, [행위자적 렌즈]를 사용하는 사람들은 또한 이러한 제약을 설명해야 한다. 게다가, 연구 내러티브를 구성할 때, 연구자도 자신의 행위자성을 행사한다는 사실이, 행위자적 렌즈를 더욱 복잡하게 만든다. 참여자의 내러티브를 분석하든, 사건과 경험에서 내러티브를 생성하든, 연구자들은 자신의 이야기에서 일부 내러티브 에이전시를 [공동 선택co-opt]한다.

While the agentive lens can provide insights into participants' intentional activities, these strategies also reflect how the narrator is positioned by existing norms and discourses (recalling the situated lens above).41 Narrative agents are constrained by situations and structures in which they find themselves, so those using an agentive lens must also account for these constraints.48, 49 Moreover, in constructing research narratives, scholars exercise their own agency, further complicating an agentive lens. Whether analysing participant narratives or creating narratives from events and experiences, researchers co-opt some narrative agency in their own telling.

마지막 렌즈 NA는 [순차적sequential 렌즈]이다: 이야기 세계(즉, 이야기 세계)와 경험 세계(즉, 삶의 세계)에서 사건의 순서를 의미한다. Riessman은 내러티브의 기본 정의에 [스토리 세계]와 [삶의 세계]의 순서를 모두 포함시켰다

  • '일시적으로 순서가 매겨지고 일련의 사건들을 요약하는 대화의 경계지어진 세그먼트'와 
    NA의 구별되는 특징인 '행동 순서에 대한 주의'를 취하는 것

The final lens NA offers is sequential: the ordering of events in a story (i.e., the story world) and in experience (i.e., the life world).41 Riessman included both story world and life world ordering in her basic definition of narrative:

  • ‘a bounded segment of talk that is temporally ordered and recapitulates a sequence of events’23 and took ‘attention to sequences of action’ to be the distinguishing feature of NA.23 

행동의 순서는 많은 사람들이 그들의 [세계를 이해하는 한 가지 방법]이며, 종종 시간적 순서로부터 [인과관계를 귀속]시킨다이야기 세계나 삶의 세계에서 [사건의 시퀀스]에 집중하는 것은 다음의 이해를 뒷받침한다.

  • 참가자들이 그들의 삶에서 다양한 사건과 개인을 어떻게 이해하는지,
  • 그들이 서로 어떻게 상호작용하는지, 그리고
  • 그들이 다른 사람들을 야기시키는 어떤 사건과 행동을 어떻게 경험하는지 . 

Sequencing of actions is one way many people make sense of their world, often imputing causality from temporal ordering.31, 40 Attending to the sequence of events—either in the story world or the life world—supports an understanding of

  • how participants understand the different events and individuals in their lives,
  • how they interact with each other and
  • how they experience some events and actions causing others.3140 

예를 들어, 신경외과 의사들의 이야기에서 질병 위신에 대한 요한네센의 연구에서, 그는 이러한 이야기들 - 파단, 진단, 치료 그리고 정상으로의 복귀 - 의 일련의 사건들이 [서양 문화에서 강한 남성적 영웅과 함께 영웅적 스토리]를 미러링한다고 주장했다. 이 경우, [순차적 렌즈]는 어떻게 신경외과의사들이 그들의 행동과 결과에 대해 상상하는지, 그리고신경외과의사로서의 정체성을 구축하는지에 대한 통찰력을 제공하면서 [특정한 유형type]의 이야기 구조를 드러낸다.37

For example, in Johannessen's study of disease prestige in neurosurgeons' narratives, he argued that the sequence of events in these narratives—rupture, diagnostics, treatment and return to normality—mirrored heroic stories with a strong masculine hero in Western culture (see Table 1).37 In this case, the sequential lens revealed a particular type of story structure, offering insight into how those neurosurgeons conceived of their actions and consequences, building prestige for their identity as neurosurgeons.37

[언어적 렌즈]와 마찬가지로 [순차적 렌즈]는 단편화를 초래할 수 있고, 내러티브의 전체적인 목적을 보는 데 어려움을 초래할 수 있다. 또한, [행위자적 렌즈]와 마찬가지로, 이 렌즈는 순서 선택에 있어 서술자narrator의 행위자성을 지나치게 강조할 수 있다. 게다가, 철학자 게일런 스트로슨은 과거와 현재 그리고 미래를 가로지르는 사람으로서의 자아를 기본적으로 직교적으로 이해하는 것은 모든 사람에게 선천적인 것은 아니라고 주장했다. 어떤 이들은 그들의 시간적 자아를 삽화episodic로 생각하기 때문에, 자신의 삶을 내러티브로 인식하지 못한다. 그러한 개인에게 순차적 선택은 근본적인 인과적 이해나 감각 형성 방법을 반영하지 못할 가능성이 높다.
Like the linguistic lens, the sequential lens can lead to fragmentation and difficulty seeing the overall narrative purposes. Also, like the agentive lens, this lens can overemphasise the agency of the narrator in making sequencing choices. Moreover, the philosopher, Galen Strawson,51 argued that the basic diachronic understanding of the self as someone who stretches across past, present and future is not innate to everyone. Some conceive of their temporal selves as episodic and, therefore, have no sense of their lives as narratives.51 For such individuals, sequential choices are likely not reflective of underlying causal understandings or ways of sense-making.


위의 설명에서 알 수 있듯이, 우리가 논의하는 5개의 NA 렌즈는 HPE 연구원들이 얻을 수 있는 다양한 종류의 잠재력을 가지고 있다. 이러한 잠재력을 설명하기 위해 분석적 접근법이 이 다섯 개의 렌즈에 해당한다고 믿는 다섯 개의 HPE 논문으로부터 위의 예를 제공했다. 우리는 표 1에 이것들을 요약한다. 독자에게 NA에 대한 다양한 접근방식을 제공하기 위해 다양한 방법론과 방법을 사용하는 다양한 국가에서 왔다.

As the descriptions above illustrate, the five NA lenses we discuss hold different kinds of potential that HPE researchers can harvest. In order to illustrate this potential, we offered examples above from five HPE articles whose analytic approaches, we believe, correspond to these five lenses. We summarise these in Table 1. They are from a variety of countries, using a variety of methodologies and methods to give the reader a diversity of approaches to NA.

4 렌즈에서 방법으로: 내러티브 분석 유형
4 FROM LENSES TO METHODS: NARRATIVE ANALYSIS TYPOLOGIES

우리가 위에서 사용한 예에서 알 수 있듯이, 전체론적, 위치적, 언어적, 행위자적 및 순차적 렌즈는 각각 잠재적인 이점과 한계를 제공한다. 그러나 이 렌즈들은 그 자체로 방법methods이 아니다. 플롯 분석, 대화식 서술 분석, 내러티브 분석에 대한 브라운 교육 가이드(BEGAN) 그리고 아마도 가장 널리 사용되는 접근법인 라보프와 왈레츠키의 구조 분석 등, 연구자들은 다양한 연구 질문을 다루기 위해 다양한 방법을 사용해 왔다

As the examples we use above demonstrate, the holistic, situated, linguistic, agentive and sequential lenses each offer potential benefits and limitations. But these lenses are not, themselves, methods: researchers have used various methods to address their research questions like plot analysis,52 dialogic narrative analysis,36 the Brown Educational Guide to the Analysis of Narrative (BEGAN)53 and, perhaps, the most widely used approach, Labov and Waletzky's structural analysis.35, 47, 54-56 Scholars have described different typologies to try to make sense of this variety of methods.20, 25, 26, 32, 41 

학자들은 이러한 다양한 방법을 이해하기 위해 다양한 유형학을 설명해왔다. 한 가지 접근방식은 NA 방법이 다루는 [내러티브의 '수준level']에 따라 분류하는 것이다. 

  • 예를 들어, 밤버그는 이야기 자체의 실제 텍스트, 텔러와 청자 사이의 상호작용적 공동 구성, 텔러와 청자가 각각 어떻게 자기 자신에 대한 특정한 개념을 별도의 분석 수준으로 '설립하고 보여주는'지에 접근했다. 밤베리는 각 수준에서 내용과 맥락을 단계적으로 해석함으로써 내러티브를 이해하게 된다.
  • 예를 들어, Warmington과 McColl은 '대화적 서술 분석'을 사용하여 밤버그의 세 가지 수준을 모두 조사했으며, 이야기 자체, 내레이터와 인터뷰 진행자 간의 상호작용, 그리고 전문적 정체성 내레이터가 스스로 만들어 내는 것을 조사하였다.

One approach is to classify NA methods according to which ‘level’ of the narrative they attend to.25, 41 

  • For instance, Bamberg41 approached the actual text of the narrative itself, the interactional co-construction of the narrative between teller and hearer, and how teller and hearer ‘establish and display particular notions of selves’ each as separate levels of analysis. Bamberg comes to understand narratives through stepwise interpretation of the content and context at each level.
  • Warmington and McColl,36 for instance, used ‘dialogic narrative analysis’ to examine all three of Bamberg's levels, examining the stories themselves, the interactions between narrators and interviewers, and the professional identities narrators were creating for themselves.

약간 다른 접근법으로 폴킹혼과 스털리(Starlyley)는 각각 역할 서사극에 기초하여 NA를 비슷하게 입력했다.

  • 내러티브가 연구자들이 생각think about하는 [패러다임적 분석]의 대상인지 여부  (예: 범주 분석 및 기사 정리)
  • 내러티브가 연구자들이 생각think with하는 [합성적 분석]의 산물인지 여부 (즉, 스토리 분석 및 새로운 스토리 작성)

In a slightly different approach, Polkinghorne26 and Bleakley20 each typologised NA similarly, based on the role narrative plays:

  • whether narratives are the object of paradigmatic analysis (i.e., categorical analysis and chunking up stories) that researchers think about or, instead,
  • whether narratives are the product of synthetic analysis (i.e., narrative analysis and creating a new story) that researchers think with.

이 접근법에서 NA의 일부 방법은 이야기를 데이터로 가져다가 분해break down한다. 반면 다른 사람들은 경험과 사건의 데이터를 사용하여 스토리를 만들어create 더 잘 이해한다. 지금까지 HPE 학자들은 (위에서 논의한 5개의 HPE 연구와 마찬가지로) 참가자들의 이야기를 이해하기 위해 NA 방법을 사용할 때 주로 전자의 접근법을 취했다. [이야기를 가지고 생각하는 것Thinking with stories]은, 패러다임적 접근법과 달리, 이야기를 단순 데이터로 환원하지 않으면서, 내러티브의 잠재적인 '감정적 영향'을 희생시키기 때문에 잠재적으로 강력하지만 개발되지 않은 방법론적인 도구이다.20

Within this approach, some methods of NA take stories as data and break them down, while others use the data of experiences and events to create stories to better understand them. Thus far, HPE scholars have mainly taken the former approach, using NA methods to make sense of participants' stories,20 as with the five HPE studies we discussed above (see Table 1).34-37, 47 Thinking with stories is a potentially powerful, but untapped, methodological tool for tackling HPE's wicked problems because, unlike a paradigmatic approach, it does not threaten to reduce stories to mere data, sacrificing the potential ‘affective impact’ of narrative.20

5 진주: 서사의 약속과 편파성
5 PEARLS: THE PROMISE AND PARTIALITY OF NARRATIVE

NA 렌즈(그리고 각 렌즈에 따르는 잠재적인 이점 및 제한 사항)를 선택할 때, 연구자들은 다양한 분석 방법(즉, 분석 및 합성 대 패러다임 분석의 수준)이 해당 렌즈를 어떻게 형성하는지 고려해야 합니다.

  • 예를 들어, 연구자들은 밤베르크의 상호작용적 수준의 분석을 통해 [상황적 렌즈]의 잠재적인 통찰력, 즉 사회 문화적 맥락이 어떻게 세계에 대한 나레이터의 이해를 형성하는가에 접근할 수 있다.
  • 또는, 학자들은 밤베르크의 스키마의 한 단계 아래로 내려가 [순차적 렌즈]에 대한 잠재적인 통찰력을 얻을 수 있으며, 텍스트 자체에서 어떤 사건의 시퀀스가 원인과 결과의 내레이터 구성에 대해 드러내는지를 이해할 수 있다.
  • 대조적으로, 정체성에 초점을 맞춘 한 단계 '상위' 분석은 [행위자적 렌즈]와 참가자들이 자신과 타인의 의도와 행동을 표현하기 위해 하는 수사적 움직임을 뒷받침할 수 있다. 

In choosing an NA lens—as well as the potential benefits and limitations that come with it—researchers must consider how various analytic methods (i.e., the level of analysis and synthetic versus paradigmatic analysis) shape that lens.

  • For instance, researchers could access the potential insights of a situated lens—an understanding of how social and cultural contexts shape narrators' understandings of the world—through Bamberg's41 interactional level of analysis.
  • Alternatively, scholars could go one level ‘down’ in Bamberg's schema to the textual level to gain the potential insights of the sequential lens, understanding what particular sequences of events in the text itself reveal about narrators' constructions of cause and effect.41 
  • In contrast, an analysis one level ‘up’, with its focus on identity, could support the agentive lens and the rhetorical moves participants make to represent their own and others' intentions and actions.41

 

  • 폴킹혼의 분석적 유형론을 본다면, [전체론적 렌즈]를 가지고 전체 스토리에 대한 복잡하고 일관성 있는 이해를 추구하는 사람들은 [참가자들의 경험을 재-스토리restorying하는 합성적 접근법]을 사용할 수 있다.
  • 반대로, [언어적 렌즈]를 통해 서술자들이 그들 자신과 그들의 세계를 표현하는데 있어서 내리는 선택들을 더 잘 이해하고자 하는 연구자들은 [패러다임적 분석]을 사용할 수 있다.

분석적 접근의 범위와 NA 렌즈의 다양성은 HPE 학자들의 연구 실습을 풍부하게 할 가능성이 있다.

  • Working from Polkinghorne's26 analytic typology, those seeking a complex and coherent understanding of a full story through the holistic lens might use a synthetic approach, restorying participants' experiences.
  • In contrast, researchers who want to better understand the choices narrators make in representing themselves, and their world through the linguistic lens might use paradigmatic analysis.26 

The range of analytic approaches and the variety of NA lenses hold the promise to enrich the research practices of HPE scholars.

그러나 여기서 설명하는 5개의 렌즈 중 어떤 것도 어떤 분석적 접근법에도 완벽하게 매핑되지 않으며, HPE의 고약한 문제에 대한 '기성품' 솔루션을 제공하지도 않습니다. NA 렌즈는 개념적 프레임워크, 특정 연구 질문, 수집된 데이터 및 수집 방법 및 대상과 일치하는 연구 설계로 의도적으로 짜여져야 한다. 또한 선택된 NA 렌즈는 연구자가 해결하고자 하는 문제 또는 질문과 일치해야 하며, 연구자가 설명하고자 하는 청중에게 말해야 한다. NA를 하는 것은 연구 조건에 특정한 [특정한 노력particularistic endeavour]이다. 스토리는 일종의 [상식적인 현실]을 창조하는 힘을 가지고 있는데, 린드는 이를 '보편적 사실성의 문제로 위장한 도덕성의 문제'라고 불렀다.

Yet, none of the five lenses we outline here map perfectly onto any analytic approach, nor do they offer ‘off the shelf’ solutions to HPE's wicked problems. The NA lenses must be deliberately woven into a study design, concordant with the conceptual framework, the specific research questions, the data collected and how and by whom it is collected. Furthermore, the NA lens selected must be congruent with the problem or question the researcher is trying to address, speaking to the audience for whom she is trying to address it. Doing NA is a particularistic endeavour, specific to the conditions of research.13 Stories have the power to create a kind of commonsense reality, what Linde40 called ‘an issue of morality disguised as an issue of universal factuality’. 

우리는 NA 방법과 렌즈도 이러한 힘을 가질 수 있다고 주장합니다. 방법과 렌즈를 선택했으니, '등장'하는 진리가 유일한 진실the truth이라고 믿기 쉽다. 예를 들어, 인종 차별 치료에 대한 흑인 의사의 이야기에 대한 [순차적 렌즈]는 반복된 경험들이 서로에게 쌓이는 방식을 강조할 수 있지만, 이것은 [행위자적 렌즈]로 더 명확해질 수 있는 인종 차별적 권력 구조에 대한 저항을 가릴 수 있다. 게다가, 이 렌즈들 중 어느 것도 참가자들이 경험하는 것을 진실로 드러내지 않을 것이고, 애초에 이야기를 하는 그들의 행위자성을 잠재적으로 감소시킬 것이다. 즉, 각각의 NA 렌즈는 무언가를 가리면서, 무언가를 드러낸다. 리스만은 이렇게 모함했다. '이야기적 진실은 항상 편파적이다- 어딘가에 열성적이고, 불완전하다'

We maintain that NA methods and lenses can also have this power. Having chosen a method and a lens, it is easy to believe that the truth that ‘emerges’ is the truth. For instance, a sequential lens on a Black physician's stories of racist treatment might highlight the ways repeated experiences build on each other, but this may mask the resistance to racist power structures that might be clearer with an agentive lens. Moreover, neither of these lenses may reveal what participants experience as truth, potentially diminishing their agency in telling the story in the first place. In other words, each NA lens both obscures and reveals. Riessman23 framed it this way: ‘Narrative truths are always partial—committed and incomplete’.

이 편파성은 이 작품의 작가로서 우리 각자에게도 적용됩니다. 우리는 우리의 이론적이고 방법론적이며 개인적인 렌즈를 이 작업에 가져옵니다.

  • 아비게일은 언어학자이자 교육심리학자이며 질적, 혼합적 방법 연구자이다. 연구자, 교사, 학부모로서, 그녀는 자신의 이야기 전달 기관인 개인적이고 전문적인 것을 받아들이는 법을 배우고 있다.
  • 라라는 이론가이자 질적 방법론자로 HPE의 다양한 주제를 탐구해 왔으며, 대부분은 개인이 집단과 함께 참여하는 근본적인 전제에 초점을 맞추고 있다. 그녀는 이야기를 연구를 공유하고, 행동에 영향을 미치며, 가정에 도전하는 강력한 수단으로 본다.
  • 르네는 교육학자, 이론가, 질적 방법론자이다. 그녀는 직장 학습, 직장 지도, 그리고 직장 내에서의 직업 간 학습과 교육 역학에 대해 글을 쓴다. 그녀는 깊고 의미 있는 학습과 이해를 제공하기 위해 가르치고 연구하는 이야기의 힘을 믿습니다.

This partiality holds for each of us as authors of this piece as well. We bring to this work our own theoretical, methodological and personal lenses.

  • Abigail is a linguist, educational psychologist and qualitative and mixed methods researcher who writes about experiences of agency. As a researcher, teacher and parent who has moved across fields and across the country, she is learning to embrace the agency of her own storytelling—personal and professional.
  • Lara is a theorist and qualitative methodologist who has explored a range of topics in HPE, most of which focus on the foundational premises through which individuals engage with groups and vice versa. She sees stories as powerful means of sharing research, of impacting actions and challenging assumptions.
  • Renee is an educationist, a theorist and qualitative methodologist. She writes about workplace learning, workplace guidance and the interprofessional learning and teaching dynamic within the workplace. She believes in the power of stories in teaching and research to provide deep and meaningful learning and understanding.

이런 경험들을 볼 때, 우리는 모두에게 있지 않을 수도 있는 이야기들에 힘과 효용을 돌릴 수 있고, 다른 사람들과는 다르게 NA의 렌즈를 볼 수도 있다. 우리가 제시하는 5개의 NA 렌즈와 마찬가지로, 우리만의 렌즈는 어떤 부분은 비추고 어떤 부분은 가립니다. NA에 대한 우리의 이야기는 모든 이야기와 마찬가지로 '경험된 현실 속에서 승리를 거둔 구성자'이다. 우리는 NA 렌즈를 사용하는 다른 사람들의 구성을 기다리고 있는데, 그들이 우리의 연구 문제를 가지고 우리의 분야로 나아가는 데 도움을 줄 수 있기를 바란다.

Given these experiences, we may attribute power and utility to stories that may not be there for everyone, and we may see the lenses of NA differently than others would. Just like the five NA lenses we present, our own lenses illuminate some areas and conceal others. Our story about NA, like all stories, is ‘a triumphant configurer of experienced reality’.42 We await others' configurations using NA lenses, with the hope that they can help us move forward as a field with our research problems, wicked or otherwise.


Med Educ. 2021 Dec;55(12):1369-1375.

 doi: 10.1111/medu.14597. Epub 2021 Aug 29.

The potential of narrative analysis for HPE research: Highlighting five analytic lenses

Affiliations collapse

Affiliations

1Center for Health Professions Education, Uniformed Services University, Bethesda, Maryland, USA.

2Center for Health Professions Education, Henry M. Jackson Foundation for the Advancement of Military Medicine, Bethesda, Maryland, USA.

3School of Health Professions Education, Department for Educational Development & Research, Faculty of Health, Medicine and Life Sciences, Maastricht University, Maastricht, The Netherlands.

PMID: 34291492

DOI: 10.1111/medu.14597

Abstract

Context: Health professions education (HPE) has increasingly turned to qualitative methodology to address a number of the field's difficult research problems. While several different methodologies have been widely accepted and used in HPE research (e.g., Grounded Theory), others remain largely unknown. In this methodology paper, we discuss the value of narrative analysis (NA) as a set of analytic approaches that offer several lenses that can support HPE scholars' research.

Methods: After briefly discussing the 'narrative turn' in research, we highlight five NA lenses: holistic, situated, linguistic, agentive and sequential. We explore what each lens can offer HPE scholars-highlighting certain aspects of the data-and how each lens is limited-obscuring other aspects. To support these observations, we offer an example of each lens from contemporary HPE scholarship. The manuscript also describes methods that can be employed in NA research and offers two different typologies of NA methods that can be used to access these lenses.

Conclusions: We conclude with a discussion of how different analytic methods can be used to harness each of the lenses. We urge the deliberate selection and use of NA methods and point to the inherent partiality of any NA approach. Reflecting on our position as narrative scholars, we acknowledge how our own lenses illuminate some areas and conceal others as we tell the story of NA. In conclusion, we invite other researchers to benefit from the potential NA promises.

질적 내용분석: Trustwothiness에 초점을 두고(SAGE Open, 2014)
Qualitative Content Analysis: A Focus on Trustworthiness 
Satu Elo1, Maria Kääriäinen1,2, Outi Kanste3, Tarja Pölkki1, Kati Utriainen1, and Helvi Kyngäs1,2

 

질적 내용 분석은 간호과학 연구에서 일반적으로 사용되지만, 그 사용의 신뢰성은 아직 체계적으로 평가되지 않았다. 콘텐츠 분석 연구를 평가하기 위한 효과적이고 간단한 전략에 대한 지속적인 요구가 있다. 특히 질적 내용분석보다 정량적 내용분석의 타당성과 신뢰성에 대한 여러 논문이 발표된 만큼 질적 내용분석 결과의 질에 대한 보다 집중적인 논의도 필요하다. 정량적 내용분석을 수행하기 위해 표준화된 절차를 많이 이용할 수 있지만(Baxter, 2009) 질적 내용분석은 그렇지 않다.
Although qualitative content analysis is commonly used in nursing science research, the trustworthiness of its use has not yet been systematically evaluated. There is an ongoing demand for effective and straightforward strategies for evaluating content analysis studies. A more focused discussion about the quality of qualitative content analysis findings is also needed, particularly as several articles have been published on the validity and reliability of quantitative content analysis (Neuendorf, 2011; Potter & Levine-Donnerstein, 1999; Rourke & Anderson, 2004) than qualitative content analysis. Whereas many standardized procedures are available for performing quantitative content analysis (Baxter, 2009), this is not the case for qualitative content analysis.

질적 내용분석은 현재 데이터를 분석하고 의미를 해석하기 위해 사용할 수 있는 몇 가지 질적 방법 중 하나이다(Schreier, 2012). 연구 방법으로서, 그것은 현상을 설명하고 수량화하는 체계적이고 객관적인 수단을 나타낸다(Downe-Wamboldt, 1992; Schreier, 2012). 성공적인 내용분석을 위한 전제조건은 범주, 개념, 모델, 개념 시스템 또는 개념 맵을 만듦으로써 데이터가 연구 현상을 설명하는 개념으로 축소될 수 있다는 것이다(Elo & Kyngäs, 2008; Morgan, 1993; Weber, 1990). 연구 질문은 무엇을 분석하고 무엇을 만들 것인지를 명시한다. 질적 내용분석에서 추상화 과정은 개념이 생성되는 단계이다. 일반적으로 과정의 일부 측면은 쉽게 설명될 수 있지만, 부분적으로 연구자의 통찰력이나 직관적인 행동에 의존하며, 이는 다른 사람들에게 설명하기가 매우 어려울 수 있다(Elo & Kyngäs, 2008; Graneheim & Lundman, 2004). 타당성 관점에서 결과가 어떻게 만들어졌는지 보고하는 것이 중요하다. 독자는 분석과 결과적 결론을 명확하게 따를 수 있어야 한다(슈라이어, 2012). 
Qualitative content analysis is one of the several qualitative methods currently available for analyzing data and interpreting its meaning (Schreier, 2012). As a research method, it represents a systematic and objective means of describing and quantifying phenomena (Downe-Wamboldt, 1992; Schreier, 2012). A prerequisite for successful content analysis is that data can be reduced to concepts that describe the research phenomenon (Cavanagh, 1997; Elo & Kyngäs, 2008; Hsieh & Shannon, 2005) by creating categories, concepts, a model, conceptual system, or conceptual map (Elo & Kyngäs, 2008; Morgan, 1993; Weber, 1990). The research question specifies what to analyze and what to create (Elo & Kyngäs, 2008; Schreier, 2012). In qualitative content analysis, the abstraction process is the stage during which concepts are created. Usually, some aspects of the process can be readily described, but it also partially depends on the researcher’s insight or intuitive action, which may be very difficult to describe to others (Elo & Kyngäs, 2008; Graneheim & Lundman, 2004). From the perspective of validity, it is important to report how the results were created. Readers should be able to clearly follow the analysis and resulting conclusions (Schreier, 2012).

질적 내용분석은 귀납적 또는 연역적 방법으로 사용될 수 있습니다. 귀납적 및 연역적 내용분석 프로세스에는 세 가지 주요 단계가 포함됩니다: 결과의 준비, 구성, 보고

  • 준비 단계는 콘텐츠 분석에 적합한 데이터를 수집하고 데이터를 이해하며 분석 단위를 선택하는 것으로 구성된다. 
  • 귀납적 접근법에서 조직 단계는 개방형 코딩, 범주 생성, 추상화를 포함한다. 
  • 연역적 접근법에서 조직 단계범주 매트릭스 개발을 포함하며, 여기서 모든 데이터는 내용에 대해 검토되고 식별된 범주에 대한 대응 또는 예시를 위해 코딩된다(Political & Beck, 2012). 범주 매트릭스은 범주가 개념을 적절하게 표현하고, 타당성의 관점에서 범주화 행렬이 의도한 바를 정확하게 포착한다면 유효한 것으로 간주할 수 있다(Schreier, 2012). 
  • 보고 단계에서 결과는 선택된 접근법(연역적 또는 귀납적)을 사용하여 현상을 설명하는 범주의 내용에 의해 설명된다.

Qualitative content analysis can be used in either an inductive or a deductive way. Both inductive and deductive content analysis processes involve three main phases: preparation, organization, and reporting of results.

  • The preparation phase consists of collecting suitable data for content analysis, making sense of the data, and selecting the unit of analysis.
  • In the inductive approach, the organization phase includes open coding, creating categories, and abstraction (Elo & Kyngäs, 2008).
  • In deductive content analysis, the organization phase involves categorization matrix development, whereby all the data are reviewed for content and coded for correspondence to or exemplification of the identified categories (Polit & Beck, 2012). The categorization matrix can be regarded as valid if the categories adequately represent the concepts, and from the viewpoint of validity, the categorization matrix accurately captures what was intended (Schreier, 2012).
  • In the reporting phase, results are described by the content of the categories describing the phenomenon using a selected approach (either deductive or inductive).


질적 연구 타당성을 평가하기에 가장 적합한 용어(강성, 타당성, 신뢰성, 신뢰도)에 대해 많은 논쟁이 있었다(Koch & Harrington, 1998). 신뢰성과 타당성 기준은 신뢰도를 평가할 때 양적 연구와 질적 연구에서 모두 사용됩니다. 그러한 용어들은 주로 연구의 실증적 개념에 뿌리를 두고 있다. 슈라이어(2012)에 따르면 [질적 내용 분석]과 [양적 내용 분석] 사이에 명확한 구분선이 없고, 신뢰성과 타당성에 대한 유사한 용어와 기준이 자주 사용된다.

There has been much debate about the most appropriate terms (rigor, validity, reliability, trustworthiness) for assessing qualitative research validity (Koch & Harrington, 1998). Criteria for reliability and validity are used in both quantitative and qualitative studies when assessing the credibility (Emden & Sandelowski, 1999Koch & Harrington, 1998Ryan-Nicholls & Will, 2009). Such terms are mainly rooted in a positivist conception of research. According to Schreier (2012), there is no clear dividing line between qualitative and quantitative content analysis, and similar terms and criteria for reliability and validity are often used. 

연구자들은 내용분석에서 타당성 측면을 평가할 때 주로 질적 기준을 사용해 왔다(Kyngás 등, 2011). 질적 내용분석을 평가하기 위해 가장 널리 사용되는 기준은 링컨과 구바(1985)가 개발한 기준이다. 그들은 신뢰성trustworthiness라는 용어를 사용했다. 질적 조사에서 신뢰성trustworthiness의 목적은 조사의 발견이 "주의할 가치가 있다"는 주장을 뒷받침하는 것이다(Lincoln & Guba, 1985). 이론 기반 범주화 매트릭스 없이 원시 데이터에서 범주가 생성되기 때문에 귀납적 내용 분석을 사용할 때 특히 중요하다. 따라서, 우리는 데이터 수집, 분석, 콘텐츠 분석 결과의 발표의 신뢰성trustworthiness에 영향을 미치는 요소를 파악할 때 이러한 전통적인 질적 연구 용어를 사용하기로 결정했습니다.

Researchers have mainly used qualitative criteria when evaluating aspects of validity in content analysis (Kyngäs et al., 2011). The most widely used criteria for evaluating qualitative content analysis are those developed by Lincoln and Guba (1985). They used the term trustworthiness. The aim of trustworthiness in a qualitative inquiry is to support the argument that the inquiry’s findings are “worth paying attention to” (Lincoln & Guba, 1985). This is especially important when using inductive content analysis as categories are created from the raw data without a theory-based categorization matrix. Thus, we decided to use such traditional qualitative research terms when identifying factors affecting the trustworthiness of data collection, analysis, and presentation of the results of content analysis.


질적 연구를 위해 몇 가지 신뢰도 평가 기준이 제안되었다. 그러나 이러한 기준의 공통점은 내용분석 과정을 정확하게 보고함으로써 신뢰도를 지원하고자 한다는 것이다. 링컨과 구바는 credibility, dependability, conformability, and transferability라는 질적연구에서 trustworthiness 평가를 위한 네 가지 대안을 제안해 왔다. 1994년에서 저자들은 5기준에 진정성authenticity을 덧붙였다.

  • Credibility의 확립을 위한 관점에서, 연구원들은 연구에 참여하고 정확하게 묘사했다 확인되도록 해야 합니다.
  • Dependability 데이터의 시간과 다른 조건에 따라 안정성을 말한다.
  • Conformability 그것이 객관성을 말한다, 일치에 대한 데이터의 정확성, 타당성, 또는 의미에 대해 두 이상의 독립적인 사람들의 가능성.
  • Transferability 추정에 대한 가능성에 말한다. 그것은 논거는 발견이나 다른 설정 또는 그룹에 편입이 개괄될 수 있는에 의존하고 있다.
  • 마지막 기준, authenticity는, 연구자들 공정하고 충실히, 현실의 범위(링컨&Guba, 1985;Polit&벡, 2012년)을 보여 주는 정도로 말한다.

Several other trustworthiness evaluation criteria have been proposed for qualitative studies (Emden, Hancock, Schubert, & Darbyshire, 2001; Lincoln & Guba, 1985; Neuendorf, 2002; Polit & Beck, 2012; Schreier, 2012). However, a common feature of these criteria is that they aspire to support the trustworthiness by reporting the process of content analysis accurately. Lincoln and Guba (1985) have proposed four alternatives for assessing the trustworthiness of qualitative research, that is, credibility, dependability, conformability, and transferability. In 1994, the authors added a fifth criterion referred to as authenticity.

  • From the perspective of establishing credibility, researchers must ensure that those participating in research are identified and described accurately.
  • Dependability refers to the stability of data over time and under different conditions.
  • Conformability refers to the objectivity, that is, the potential for congruence between two or more independent people about the data’s accuracy, relevance, or meaning.
  • Transferability refers to the potential for extrapolation. It relies on the reasoning that findings can be generalized or transferred to other settings or groups.
  • The last criterion, authenticity, refers to the extent to which researchers, fairly and faithfully, show a range of realities (Lincoln & Guba, 1985Polit & Beck, 2012)

 

연구자들은 종종 질적 연구 결과의 신뢰도를 손상시키는 문제와 씨름한다. 본 기사에서 설명하는 연구의 목적은 주요 질적 콘텐츠 분석 단계를 기반으로 신뢰도를 설명하고 콘텐츠 분석 연구의 신뢰도를 평가하기 위한 체크리스트를 작성하는 것이었다. 가장 중요한 연구 질문은 "각 단계에서 콘텐츠 분석 연구의 신뢰도를 향상시키기 위해 노력하는 연구자들에게 필수적인 것은 무엇인가?" 제시된 지식은 초기 연구의 서술적 문헌 검토, 우리 자신의 경험, 방법론적 교과서를 통해 확인되었다. 다음과 같은 키워드를 사용하여 Medline(Ovid)과 CINAHL(EBSCO)의 복합 검색이 수행되었다. 신뢰성, 엄격함 또는 타당성, 질적 컨텐츠 분석.
Researchers often struggle with problems that compromise the trustworthiness of qualitative research findings (de Casterlé, Gastmans, Bryon, & Denier, 2012). The aim of the study described in this article was to describe trustworthiness based on the main qualitative content analysis phases, and to compile a checklist for evaluating trustworthiness of content analysis study. The primary research question was, “What is essential for researchers attempting to improve the trustworthiness of a content analysis study in each phase?” The knowledge presented was identified from a narrative literature review of earlier studies, our own experiences, and methodological textbooks. A combined search of Medline (Ovid) and CINAHL (EBSCO) was conducted, using the following key words: trustworthiness, rigor OR validity, AND qualitative content analysis.

다음은 포함 기준으로 사용되었다: 영어로 출판된 건강과학 분야의 질적 내용 분석에 초점을 맞춘 방법론적 논문이며 연도에 제한이 없다. 이 검색에서는 데이터베이스와 참조 목록 검사에서 12개의 방법론적 내용 분석 기사가 확인되었다. 선정된 논문의 참고목록도 확인했고, 검토 종합서 작성 시 질적 연구방법론 교재가 활용됐다. 이 글의 논의는 내용 분석을 유효하고 이해할 수 있는 방식으로 보고하는 방법을 명확히 하는 데 도움이 되며, 이는 과학 논문 검토자에게 특히 도움이 될 것으로 예상한다.

The following were used as inclusion criteria: methodological articles focused on qualitative content analysis in the area of health sciences published in English and with no restrictions on year. The search identified 12 methodological content analysis articles from databases and reference list checks (Cavanagh, 1997; Downe-Wamboldt, 1992; Elo & Kyngäs, 2008; Graneheim & Lundman, 2004; Guthrie, Yongvanich, & Ricceri, 2004; Harwood & Garry, 2003; Holdford, 2008; Hsieh & Shannon, 2005; Morgan, 1993; Potter & Levine-Donnerstein, 1999; Rourke & Anderson, 2004; Vaismoradi, Bondas, & Turunen, 2013). The reference list of selected papers was also checked, and qualitative research methodology textbooks were used when writing the synthesis of the review. The discussion in this article helps to clarify how content analysis should be reported in a valid and understandable manner, which, we expect, will be of particular benefit to reviewers of scientific articles.

콘텐츠 분석 연구 준비단계에서의 신뢰도
Trustworthiness in the Preparation Phase in Content Analysis Study

문헌 검색 결과를 바탕으로 작성 단계의 주요 신뢰도 이슈는 데이터 수집 방법의 신뢰도, 샘플링 전략, 적절한 분석 단위 선정으로 파악되었다. 연구 결과를 바탕으로 각 단계에서 콘텐츠 분석 연구의 신뢰도 향상을 시도하는 연구자를 위한 점검표를 작성했다(표 1).

Based on the results of the literature search, the main trustworthiness issues in the preparation phases were identified as trustworthiness of the data collection method, sampling strategy, and the selection of a suitable unit of analysis. Based on the findings, we have compiled a checklist for researchers attempting to improve the trustworthiness of a content analysis study in each phase (Table 1).

 

데이터 수집 방법
Data Collection Method

데이터 수집의 신뢰성trustworthiness에 대한 입증은 연구의 신뢰성에 관한 연구자의 궁극적인 주장을 뒷받침하는 한 측면이다(Rourke & Anderson, 2004). 내용분석의 신뢰성을 보장하기 위해서는 가장 적절한 데이터 수집 방법의 선택이 필수적이다(Graneheim & Lundman, 2004). 신뢰성credibility은 연구의 초점을 다루며 [데이터가 의도한 초점을 얼마나 잘 설명하는지address]에 대한 자신감를 의미한다(Political & Beck, 2012). 따라서 연구자는 내용분석에 가장 적합한 데이터를 수집하는 방법에 대해 많은 고민을 해야 합니다. 내용분석의 신뢰성을 보장하기 위한 전략은 관심 있는 연구 질문에 답할 수 있는 [최선의 데이터 수집 방법]을 선택하는 것에서부터 시작된다. 내용 분석이 사용되는 대부분의 연구에서 수집된 데이터는 비구조적이며, 인터뷰, 관찰, 일기, 기타 서면 문서 또는 다른 방법의 조합과 같은 방법으로 수집된다. 그러나 연구의 목적에 따라 수집된 데이터는 개방적이고 반구조적일 수 있다. 귀납적 내용분석을 사용하는 경우 데이터가 가능한 한 구조화되지 않은 것이 중요하다(Dey, 1993; Neuendorf, 2002).
Demonstration of the trustworthiness of data collection is one aspect that supports a researcher’s ultimate argument concerning the trustworthiness of a study (Rourke & Anderson, 2004). Selection of the most appropriate method of data collection is essential for ensuring the credibility of content analysis (Graneheim & Lundman, 2004). Credibility deals with the focus of the research and refers to the confidence in how well the data address the intended focus (Polit & Beck, 2012). Thus, the researcher should put a lot of thought into how to collect the most suitable data for content analysis. The strategy to ensure trustworthiness of content analysis starts by choosing the best data collection method to answer the research questions of interest. In most studies where content analysis is used, the collected data are unstructured (Elo & Kyngäs, 2008; Neuendorf, 2002; Sandelowski, 1995b), gathered by methods such as interviews, observations, diaries, other written documents, or a combination of different methods. However, depending on the aim of the study, the collected data may be open and semi-structured. If inductive content analysis is used, it is important that the data are as unstructured as possible (Dey, 1993; Neuendorf, 2002).


신뢰성trustworthiness의 관점에서 핵심 질문은 "사전 구성과 데이터 수집 방법의 관계는 무엇인가, 즉 연구자가 서술형 또는 반구조형 질문을 사용해야 하는가"이다. 오늘날 질적 내용분석은 면담 전사본과 같은 구두 데이터에 가장 자주 적용된다(Schreier, 2012). 서술적 데이터 수집을 하는 경우, 경험의 다양성을 통제하는 것이나, 면접관의 편향과 한 가지 유형의 정보 또는 분석적 관점의 특권을 방지하는 것은 종종 어려울 수 있다(Warr & Pyett, 1999). 예를 들어 "당신은 어떻게 자신을 돌볼 수 있는지 말씀해 주시겠습니까?"와 같은 서술형 질문을 사용할 때, 연구자는 데이터 수집의 목적을 고려하고 이를 위해 데이터를 추출하려고 노력해야 합니다. 다만 연구자가 반구조적 데이터 수집 방식을 선택할 경우 참여자의 답변을 지나치게 조종해 귀납적 데이터를 얻지 않도록 주의해야 한다. 면담 질문을 "비판적 참조 그룹critical reference group"과 연계하여 개발하는 것이 유용할 수 있다. 비판적 참조 그룹은 참여적 행동 연구에 사용되며 연구 및 평가가 주로 이익을 얻기 위한 그룹을 총칭하는 용어이다(Wadsworth, 1998). 면담질문을 이런 집단의 평가에 붙이는 것은 '올바른 방식으로 올바른 질문'을 함으로써 공부한 현상을 더 잘 이해할 수 있는 질문을 구성하는 데 도움이 될 수 있다.

From the perspective of trustworthiness, a key question is, “What is the relationship between prefiguration and the data collection method, that is, should the researcher use descriptive or semi-structured questions?” Nowadays, qualitative content analysis is most often applied to verbal data such as interview transcripts (Schreier, 2012). With descriptive data collection, it can often be challenging to control the diversity of experiences and prevent interviewer bias and the privileging of one type of information or analytical perspective (Warr & Pyett, 1999). For example, when using a descriptive question such as “Could you please tell me, how do you take care of yourself?” the researcher has to consider the aim of data collection and try to extract data for that purpose. However, if the researcher opts for a semi-structured data collection method, they should be careful not to steer the participant’s answers too much to obtain inductive data. It may be useful for the interview questions to be developed in association with a “critical reference group” (Pyett, 2003). Critical reference groups are used in participatory action research and is a generic term for those the research and evaluation is intended primarily to benefit (http://www.aral.com.au/ari/p-ywadsworth98.html" data-mce-href="https://journals.sagepub.com/doi/full/10.1177/2158244014522633#">Wadsworth, 1998). Subjecting the interview questions to evaluation by this kind of group may help to construct understandable questions that make better sense of the studied phenomenon by asking the “right questions in the right way.”

신뢰성credibility의 관점에서 연구자의 자기 인식은 필수적이다(Koch, 1994). 사전 면담은 면접 질문이 제안된 연구 질문에 답하는 풍부한 데이터를 얻는 데 적합한지 판단하는 데 도움이 될 수 있다. 예를 들어, "내가 참가자를 조작하거나 이끌었는가?", "너무 광범위하거나 구조적인 질문을 했는가?"와 같은 질문이 연구자 자신의 행동을 비판적으로 평가하기 위해 면밀하게 검토되어야 한다. 이러한 평가는 연구를 시작할 때 시작할 뿐만 아니라 콘텐츠 분석의 신뢰성을 보장하기 위해 지속적인 성찰이 뒷받침되어야 한다.
From the viewpoint of credibility, self-awareness of the researcher is essential (Koch, 1994). Pre-interviews may help to determine whether the interview questions are suitable for obtaining rich data that answer the proposed research questions. Interview tapes, videos, and transcribed text should be examined carefully to critically assess the researcher’s own actions For instance, questions should be asked such as “Did I manipulate or lead the participant?” and “Did I ask too broad or structured questions?” Such evaluation should not only begin at the start of the study but also be supported by continuous reflection to ensure the trustworthiness of content analysis.

데이터를 관리하기 위해서는 정량적 연구 못지않게 정성적 연구에서도 분석방법의 사전검사가 중요하다. 연역적 내용분석 접근 방식을 사용할 경우, 파일럿 단계에서 분류 매트릭스도 사전 테스트해야 한다(Schreier, 2012). 이것은 특히 두 명 이상의 연구원이 코딩에 관여할 때 필수적이다. 시험 코딩에서 연구자들은 독립적으로 새로 개발된 행렬의 코딩(Schreier, 2012)을 시도하고 행렬을 사용하는 데 있어 명백한 어려움과 그들이 다르게 해석한 코딩 단위를 논의한다(Schreier, 2012). 그들의 논의에 기초하여, 필요한 경우 분류 매트릭스가 수정된다.
To manage the data, pre-testing of the analysis method is as important in qualitative as in quantitative research. When using a deductive content analysis approach, the categorization matrix also needs to be pretested in a pilot phase (Schreier, 2012). This is essential, especially when two or more researchers are involved in the coding. In trial coding, researchers independently try out the coding of the newly developed matrix (Schreier, 2012) and then discuss any apparent difficulties in using the matrix (Kyngäs et. al., 2011) and the units of coding they have interpreted differently (Schreier, 2012). Based on their discussion, the categorization matrix is modified, if needed.

 

샘플링 전략
Sampling Strategy

표본 추출 전략의 관점에서 다음과 같은 질문을 하는 것이 필수적이다.

  • 내 연구를 위한 가장 좋은 표본 추출 방법은 무엇인가요?
  • 내 연구에 가장 적합한 정보원은 누구이며, 참가자를 선정할 때 어떤 기준을 사용해야 합니까?
  • 제 샘플이 적절한가요?
  • 내 데이터가 잘 포화되었습니까?

타당성 기준으로서의 철저성Thoroughness 은 [데이터의 적정성]을 나타내며, 건전한 샘플링과 포화에 의존하기도 한다(Whittemore, Chase, & Mandle, 2001). 정성 연구에 사용되는 샘플링 방법을 고려하는 것이 중요하다(Creswell, 2013). 우리의 연구에 따르면, 표본 추출 방법은 질적 내용 분석 연구에서 거의 언급되지 않는다. 질적 연구에서 표본 추출 전략은 보통 연구 결과의 일반화 필요성에 의해가 아니라 방법론과 주제에 기초하여 선택된다(Higginbottom, 2004). 질적 샘플링은 편의적, 목적적, 이론적, 선택적, 사례 내 및 눈덩이 샘플링을 포함한다. 그러나 표본은 적절해야 하며 연구 주제를 가장 잘 대표하거나 알고 있는 참가자로 구성되어야 한다.

From the viewpoint of sampling strategy, it is essential to ask questions such as the following:

  • What is the best sampling method for my study?
  • Who are the best informants for my study and what criteria to use for selecting the participants?
  • Is my sample appropriate?
  • Are my data well saturated?

Thoroughness as a criterion of validity refers to the adequacy of the data and also depends on sound sampling and saturation (Whittemore, Chase, & Mandle, 2001). It is important to consider the sampling method used in qualitative studies (Creswell, 2013). Based on our research, the sampling method is rarely mentioned in qualitative content analysis studies (Kyngäs et. al., 2011). In qualitative research, the sampling strategy is usually chosen based on the methodology and topic, and not by the need for generalizability of the findings (Higginbottom, 2004). Types of qualitative sampling include convenience, purposive, theoretical, selective, within-case and snowball sampling (Creswell, 2013; Higginbottom, 2004; Polit & Beck, 2012). However, the sample must be appropriate and comprise participants who best represent or have knowledge of the research topic.

내용분석 연구에서 가장 일반적으로 사용되는 방법은 목적적 샘플링이다. 의도적 샘플링은 연구자가 연구 주제에 관한 최고의 지식을 가진 정보 제공자에게 관심이 있는 질적 연구에 적합하다. 목적적 샘플링을 사용할 경우, 샘플링을 누가 또는 무엇이 샘플링되는지, 어떤 형태를 취해야 하는지, 그리고 얼마나 많은 사람이나 사이트를 샘플링해야 하는지에 대한 결정을 내려야 한다(Creswell, 2013). 그러나 목적적 표본 추출의 단점은 완전한 세부사항이 제공되지 않을 경우 독자가 표본 추출의 신뢰도를 판단하기 어려울 수 있다는 것이다. 연구자는 어떤 유형의 목적적 샘플링을 사용하는 것이 가장 적합한지 결정해야 하며(Creswell, 2013) 표본 추출 방법에 대한 간략한 설명이 제공되어야 한다.

The most commonly used method in content analysis studies is purposive sampling (Kyngäs, Elo, Pölkki, Kääriäinen, & Kanste, 2011): purposive sampling is suitable for qualitative studies where the researcher is interested in informants who have the best knowledge concerning the research topic. When using purposeful sampling, decisions need to be made about who or what is sampled, what form the sampling should take, and how many people or sites need to be sampled (Creswell, 2013). However, a disadvantage of purposive sampling is that it can be difficult for the reader to judge the trustworthiness of sampling if full details are not provided. The researcher needs to determine which type of purposeful sampling would be best to use (Creswell, 2013), and a brief description of the sampling method should be provided.



Dependability 데이터의 시간과 다른 조건에 따라 안정성을 말한다. 따라서 다른 맥락으로의 결과 전이가능성transferability을 평가할 수 있도록 [참가자를 선정할 때 사용하는 원칙과 기준을 명시]하고, [참가자의 주요 특성을 상세히 기술]하는 것이 중요하다. 곧, "동일하거나 유사한 참여자와 같은 맥락에서 조사 결과가 복제된다면 반복될 것인가"라는 것이 주된 질문이다. 신뢰성을 확립하기 위한 링컨과 구바의 1985년 기준에 따르면, 연구자들은 연구에 참여하는 사람들이 정확하게 식별되고 설명되도록 해야 한다. 신뢰할 수 있는 데이터를 수집하기 위해 다양한 연구에서 다른 샘플링 방법이 필요할 수 있다.
Dependability refers to the stability of data over time and under different conditions. Therefore, it is important to state the principles and criteria used to select participants and detail the participants’ main characteristics so that the transferability of the results to other contexts can be assessed (e.g., see Moretti et al., 2011). The main question is then, “Would the findings of an inquiry be repeated if it were replicated with the same or similar participants in the same context (Lincoln & Guba, 1985; Polit & Beck, 2012)?” According to Lincoln and Guba’s (1985) criteria for establishing credibility, researchers must ensure that those participating in research are identified and described accurately. To gather credible data, different sampling methods may be required in different studies.

내용물 분석 연구의 신뢰성credibility을 보장하기 위해 가장 [적절한 표본 크기]를 선택하는 것이 중요하다(Graneheim & Lundman, 2004). 표본이 적절한지 평가할 때 표본 크기에 대한 정보는 필수적이다. 최적의 표본은 연구의 목적, 연구 질문 및 데이터의 풍부함에 따라 달라지기 때문에 질적 연구에 일반적으로 허용되는 표본 크기는 없다. 질적 내용 분석에서는 연구 참가자의 동질성 또는 그룹 간에 예상되는 차이를 평가한다. 예를 들어, 주택 거주 노인의 웰빙과 부양적 신체환경 특성에 대한 연구는 상당히 이질적인 데이터를 생성할 가능성이 높으며 예를 들어 85세 이상의 노인이나 농촌에 거주하는 노인만 연구하는 것보다 더 많은 참여자가 필요할 수 있다.
Selection of the most appropriate sample size is important for ensuring the credibility of content analysis study (Graneheim & Lundman, 2004). Information on the sample size is essential when evaluating whether the sample is appropriate. There is no commonly accepted sample size for qualitative studies because the optimal sample depends on the purpose of the study, research questions, and richness of the data. In qualitative content analysis, the homogeneity of the study participants or differences expected between groups are evaluated (Burmeister, 2012; Sandelowski, 1995a). For example, a study on the well-being and the supportive physical environment characteristics of home-dwelling elderly is likely to generate fairly heterogeneous data and may need more participants than if restrictions are applied, for example, studying only elderly aged above 85 years or those living in rural areas.

데이터의 포화도가 최적의 표본 크기를 나타낼 수 있다고 제안되었다(Guthrie 등, 2004; Sandelowski, 1995a). 정의에 따라, 포화된 데이터는 범주 내 복제를 보장하며, 이는 다시 이해와 완전성을 검증하고 보장합니다. 데이터의 포화가 불완전하면 데이터 분석에 문제를 일으킬 수 있고 항목 간 연동을 방해할 수 있다(Cavanagh, 1997). 잘 포화된 데이터는 분류와 추상화를 용이하게 한다. 데이터가 최소한 사전 수집과 분석이 동시에 이뤄지면 포화 상태를 인지하기가 더 쉽다. 모든 데이터가 먼저 수집되고 나중에 분석되는 것이 일반적이다. 우리는 예를 들어 몇 번의 인터뷰 후에 예비 분석을 시작할 것을 권고한다. 포화도가 달성되지 않으면 데이터를 그룹화하고 개념을 만드는 것이 종종 어려워 완전한 분석을 방해하고 단순화된 결과를 생성한다(Harwood & Garry, 2003; Weber, 1990).

It has been suggested that saturation of data may indicate the optimal sample size (Guthrie et al., 2004; Sandelowski, 1995a). By definition, saturated data ensure replication in categories, which in turn verifies and ensures comprehension and completeness (Morse, Barrett, Mayan, Olson, & Spiers, 2002). If the saturation of data is incomplete, it may cause problems in data analysis and prevent items being linked together (Cavanagh, 1997). Well-saturated data facilitates its categorization and abstraction. It is easier to recognize when saturation is achieved if data are at least preliminarily collected and analyzed at the same time (Guthrie et al., 2004; Sandelowski, 1995a, 2001). It is common that all data are first collected and then analyzed later. We recommend that preliminary analysis should start, for example, after a few interviews. When saturation is not achieved, it is often difficult to group the data and create concepts (Elo & Kyngäs, 2008; Guthrie et al., 2004; Harwood & Garry, 2003), preventing a complete analysis and generating simplified results (Harwood & Garry, 2003; Weber, 1990).

 

적합한 분석 단위 선정
Selection of a Suitable Unit of Analysis

데이터 수집의 성공 여부는 [특정 연구 질문 및 연구 목적]과 관련하여 평가되어야 합니다. 준비 단계에는 [적절한 분석 단위 선정]도 수반되는데, 이는 내용분석의 신뢰성을 확보하는 데도 중요하다. 예를 들어, [의미 단위]는 글자, 단어, 페이지의 문장 부분 또는 단어가 될 수 있다(롭슨, 1993) 분석 단위가 너무 넓으면 관리가 어렵고 다양한 의미를 가질 수 있다. 의미 단위를 너무 좁히면 조각화될 수 있습니다. 가장 적합한 분석 단위는 [전체라고 보기에 충분히 크지만, 분석 과정 동안 관련 의미 단위가 될 수 있을 만큼 충분히 작은 것]이다. 분석 프로세스를 보고할 때 의미 단위를 충분히 기술하여 독자들이 분석의 신뢰도를 평가할 수 있도록 하는 것이 중요하다(Graaneheim & Lundman, 2004). 그러나 이전 과학 논문에서 분석 단위는 종종 부적절하게 설명되어 사용된 의미 단위가 얼마나 성공적이었는지 평가하기 어려웠다(Kyngás 등, 2011).
The success of data collection should be assessed in relation to the specific research questions and study aim. The preparation phase also involves the selection of a suitable unit of analysis, which is also important for ensuring the credibility of content analysis. The meaning unit can, for example, be a letter, word, sentence portion of pages, or words (Robson, 1993). Too broad a unit of analysis will be difficult to manage and may have various meanings. Too narrow a meaning unit may result in fragmentation. The most suitable unit of analysis will be sufficiently large to be considered as a whole but small enough to be a relevant meaning unit during the analysis process. It is important to fully describe the meaning unit when reporting the analysis process so that readers can evaluate the trustworthiness of the analysis (Graneheim & Lundman, 2004). However, in previous scientific articles, the unit of analysis has often been inadequately described, making it difficult to evaluate how successful was the meaning unit used (Kyngäs et al., 2011).

내용분석 연구에서의 조직 단계의 신뢰도
Trustworthiness of Organization Phase in Content Analysis Study


모레티 외 연구진(2011)에 따르면, 질적 연구의 장점은 수집된 데이터가 풍부하다는 것이며, 그러한 데이터는 타당하고 신뢰할 수 있는 방식으로 해석되고 코딩되어야 한다. 다음 섹션에서는 조직organization 단계와 관련된 신뢰도 문제에 대해 논의합니다. 이 단계에서는 범주가 잘 만들어졌는지, 해석 수준은 어느 정도인지, 분석의 신뢰도는 어떻게 점검할 것인지 등을 고려하는 것이 필수적이다.

According to Moretti et al. (2011), the advantage of qualitative research is the richness of the collected data and such data need to be interpreted and coded in a valid and reliable way. In the following sections, we discuss trustworthiness issues associated with the organization phase. In this phase, it is essential to consider whether the categories are well created, what the level of interpretation is, and how to check the trustworthiness of the analysis.

조직 단계의 일환으로 [개념이나 범주가 어떻게 만들어지는지]에 대한 설명이 제공되어 연구의 신뢰도를 나타내야 한다. 특히 연구자가 데이터를 추출하지 않았거나 너무 많은 유형의 항목이 함께 분류된 경우 개념과 개념의 생성 방법을 설명하는 것은 종종 어려울 수 있다. 또한 [지나치게 많은 수의 개념]은 일반적으로 연구자가 데이터를 그룹화하지 못했음을 의미한다. 즉, 추상화 과정이 불완전하고 범주도 겹칠 수 있다(Kyngäs 등, 2011). 이 경우, 연구자들은 범주 내에서의 유사성과 범주 간의 차이를 식별하기 위해 그룹화를 계속해야 합니다. 

As part of the organization phase, an explanation of how the concepts or categories are created should be provided to indicate the trustworthiness of study. Describing the concepts and how they have been created can often be challenging, which may hinder a complete analysis, particularly if the researcher has not abstracted the data, or too many different types of items have been grouped together (Dey, 1993; Hickey & Kipping, 1996). In addition, a large number of concepts usually indicates that the researcher has been unable to group the data, that is, the abstraction process is incomplete, and categories may also overlap (Kyngäs et al., 2011). In this case, the researcher must continue the grouping to identify any similarities within and differences between categories.

Graneheim과 Lundman(2004)에 따르면, 질적 내용 분석 결과의 신뢰성에 대해 논의할 때 필수적인 고려사항은 텍스트에 접근할 때 어느 정도의 해석이 항상 있다는 것이다. 모든 연구자는 조직 단계의 신뢰성credibility과 적합성Conformability을 확인하는 방법을 고려해야 합니다. 조사 결과의 적합성Conformability은 데이터가 참여자가 제공한 정보를 정확하게 나타내는 것이며, 연구자에 의해서 발명invented 된 것이 아님을 의미한다(Political & Beck, 2012). 이는 연구자가 명백한manifest 내용에 추가하여 잠재된latent 내용(침묵, 한숨, 웃음, 자세 등)을 분석하기로 결정한 경우 특히 중요하다(Elo & Kyngäs, 2008). 데이터의 포괄성을 높이고 건전한 해석을 제공하기 위해 한 명 이상이 분석을 수행하는 것이 좋습니다. 그러나 연역적 데이터 분석에 둘 이상의 코더가 관여하는 경우 높은 인터코더 신뢰성(ICR)이 필요하다. Burla, Knierim, Barth, Duetz 및 Abel(2008)은 질적 내용 분석에서 코드화를 개선하기 위해 ICR 평가를 사용하는 방법을 보여주었다. 이것은 분류 행렬이나 코딩 방식에 기반한 연역적 내용 분석을 사용할 때 유용합니다.

According to Graneheim and Lundman (2004), an essential consideration when discussing the trustworthiness of findings from a qualitative content analysis is that there is always some degree of interpretation when approaching a text. All researchers have to consider how to confirm the credibility and conformability of the organization phase. Conformability of findings means that the data accurately represent the information that the participants provided and the interpretations of those data are not invented by the inquirer (Polit & Beck, 2012). This is particularly important if the researcher decides to analyze the latent content (noticing silence, sighs, laughter, posture etc.) in addition to manifest content (Catanzaro, 1988; Robson, 1993) as it may result in over interpretation (Elo & Kyngäs, 2008). It is recommended that the analysis be performed by more than one person to increase the comprehensivity and provide sound interpretation of the data (Burla et al., 2008; Schreier, 2012). However, high intercoder reliability (ICR) is required when more than one coder is involved in deductive data analysis (Vaismoradi et al., 2013). Burla, Knierim, Barth, Duetz, and Abel (2008) have demonstrated how ICR assessment can be used to improve coding in qualitative content analysis. This is useful when using deductive content analysis, which is based on a categorization matrix or coding scheme.

다만 두 명 이상의 연구자가 [귀납적 내용 분석]을 할 경우 신뢰도를 어떻게 점검해야 하는지에 대한 권고안은 아직 발표되지 않았다. 우리는 한 명의 연구원이 분석을 담당하고 다른 연구원들이 전체 분석 과정과 분류를 세심하게 추적하는 것을 제안한다. 이후에 모든 연구자들이 모여 앞에서 언급한 시범 단계와 같이 분류와 관련된 다양한 의견을 논의해야 한다. 예를 들어, 우리의 연구에서는, 두 명의 연구원이 분석의 적절성을 확인하고 가능한 보완을 요청했다(Kyngás 등, 2011).
However, there are no published recommendations on how the trustworthiness should be checked if the inductive content analysis is conducted by two or more researcher. Our suggestion is that one researcher is responsible for the analysis and others carefully follow-up on the whole analysis process and categorization. All the researchers should subsequently get together and discuss any divergent opinions concerning the categorization, like in the pilot phase mentioned earlier. For example, in one of our studies, two research team members checked the adequacy of the analysis and asked for possible complements (Kyngäs et al., 2011).


한 연구(Kyngäs 등, 2011)는 특히 [귀납적 내용분석]을 사용할 때 가장 흔히 데이터가 한 명의 연구자에 의해 분석된다고 제안했다. 이 경우 데이터 전체의 대표성representativeness을 확인함으로써 분석의 신뢰성을 확인할 수 있다(Thomas & Magilvy, 2011). Pyett(2003)에 따르면, 우수한 질적 연구자는 해석이 데이터에 사실인지와 식별된 특징들이 다른 인터뷰를 통해 입증되는지 확인하기 위해 [계속해서 데이터로 돌아가게 되며], 이렇게 시간이 많이 걸리는 작업을 피할 수 없다. 안면 타당도는 연구의 신뢰도를 추정하는 데에도 사용되어 왔다. 이 경우, 결과는 연구 주제에 익숙한 사람들에게 제시되고, 그들은 그 결과가 현실과 일치하는지 평가한다. 연역적 접근법을 사용하는 경우, 이중 코딩은 종종 분류 매트릭스의 품질을 평가하는 데 도움이 된다. 슈라이어(2012)에 따르면, 코드 정의가 명확하고 하위 범주가 겹치지 않는 경우, 두 라운드의 독립성 코딩은 대략적으로 동일한 결과를 생성해야 한다.

One study (Kyngäs et al., 2011) has suggested that data are most often analyzed by one researcher, especially when using inductive content analysis. In such a case, the credibility of the analysis can be confirmed by checking for the representativeness of the data as a whole (Thomas & Magilvy, 2011). According to Pyett (2003), a good qualitative researcher cannot avoid the time-consuming work of returning again and again to the data, to check whether the interpretation is true to the data and the features identified are corroborated by other interviews. Face validity has also been used to estimate the trustworthiness of studies (Cavanagh, 1997; Downe-Wamboldt, 1992; Hickey & Kipping, 1996). In this case, the results are presented to people familiar with the research topic, who then evaluate whether the results match reality. If the deductive approach is used, double-coding often helps to assess the quality of categorization matrix. According to Schreier (2012), if the code definitions are clear and subcategories do not overlap, then two rounds of independence coding should produce approximately the same results.

공동 연구자들 사이의 대화의 가치는 종종 강조되어 왔으며, [참여자의 연구 결과]에 대한 인식은 신뢰도 또는 적합성credibility or conformability을 나타내는 데 사용될 수 있다고 제안되어 왔다. 그러나 이 작업은 주의하여 수행하도록 권고되었다(Ryan-Nicholls & Will, 2009). 일부 연구는 참가자들이 자신의 경험에 충실하기 위해 연구 결과를 확인하는 [멤버 체크]를 사용한다. 비록 링컨과 구바(1985)가 멤버 체크를 데이터 분석 동안 연속적인 과정으로 설명했지만(예: 참가자들에게 가상의 상황에 대해 질문함으로써), 연구자들은 대체로 멤버 체크를 참가자들과 전체적인 결과를 검증하기 위해 사용해 왔다. 결과를 원래 참석자에게 돌려 검증하는 것이 매력적으로 보일 수 있지만, 확립된 검증 전략은 아니다. 여러 방법론자들은 연구의 [독자, 참여자 또는 잠재적 사용자가 분석이 정확하다고 판단하는지의 여부에 기초하는 검증]을 하지 말라고 경고했다. 이것이 오히려 타당도 위협으로 작용하기 때문이다.(Morse 등, 2002). Pyett (2003)은 연구 참가자들이 자신의 행동과 동기를 항상 이해하는 것은 아니며, 연구자들은 논증에 비판적 이해를 적용해야 할 더 많은 역량과 학문적 의무가 있다고 주장했다.
The value of dialogue among co-researchers has often been highlighted and it has been suggested that the participant’s recognition of the findings can also be used to indicate the credibility or conformability (Graneheim & Lundman, 2004; Saldaña, 2011). However, it has been recommended that this be undertaken with caution (Ryan-Nicholls & Will, 2009). Some studies have used member checks, whereby participants check the research findings to make sure that they are true to their experiences (Holloway & Wheeler, 2010; Koch, 1994; Saldaña, 2011; Thomas & Magilvy, 2011). Although Lincoln and Guba (1985) have described member checks as a continuous process during data analysis (e.g., by asking participants about hypothetical situations), it has largely been interpreted and used by researchers for verification of the overall results with participants. Although it may seem attractive to return the results to the original participants for verification, it is not an established verification strategy. Several methodologists have warned against basing verification on whether readers, participants, or potential users of the research judge the analysis to be correct, stating that it is actually more often a threat to validity (Morse et al., 2002). Pyett (2003) has argued that the study participants do not always understand their own actions and motives, whereas researchers have more capacity and academic obligation to apply critical understanding to accounts.

내용분석 신뢰도 관점에서 보고 단계
Reporting Phase From the Viewpoint of Content Analysis Trustworthiness

글쓰기는 어떤 것을 사라지게 했다가 다시 단어에 나타나게 합니다. 이것은 간호과학에서와 같이 풍부한 데이터 집합에서 항상 달성하기 쉬운 것은 아니다. 글쓰기의 문제는 모든 표현을 벗어날 수 있는 현상을 정확하게 단어로 표현할 필요가 있다는 것이다(van Manen, 2006). Holdford(2008)에 따르면, 내용분석의 분석 및 보고 구성요소는 [의미 있고 유용한 방법으로 독자가 발견을 이해하도록 만드는 것]을 목표로 해야 한다. 그러나 정성 연구의 가장 중요한 요소인 보고서에 연구 결과를 제시하는 것에는 거의 주의를 기울이지 않았다(Sandelowski & Leeman, 2011). 다음 섹션에서는 보고 결과, 방법 및 분석 프로세스와 관련된 신뢰도 문제에 대해 논의한다.
Writing makes something disappear and then reappear in words. This is not always easy to achieve with rich data sets, as encountered in nursing science. The problem with writing is that phenomena that may escape all representation need to be accurately represented in words (van Manen, 2006) According to Holdford (2008), the analysis and reporting component of content analysis should aim to make sense of the findings for readers in a meaningful and useful way. However, little attention has been paid to the most important element of qualitative studies: the presentation of findings in the reports (Sandelowski & Leeman, 2011). In the next sections, we discuss trustworthiness issues associated with the reporting results, methods, and analysis process.

결과 보고
Reporting Results

내용분석 결과 보고는 특히 전이가능성, 적합성 및 신뢰성transferability, conformability, and credibility과 관련이 있습니다. 결과는 체계적이고 신중하게 보고되어야 하며, 데이터와 결과 사이의 연관성이 보고되는 방법에 특히 주의를 기울여야 한다. 그러나 결과를 체계적으로 보고하는 것은 종종 어려울 수 있다(Kyngäs 등, 2011). 보고 결과의 문제는 분석 실패의 결과일 수도 있고, 추상화 과정을 설명하는 데 어려움이 있을 수도 있있다. 왜냐하면, 추상화 과정이란 부분적으로 연구자의 통찰력이나 직관에 달려 있기 때문이다.
Reporting results of content analysis is particularly linked to transferability, conformability, and credibility. Results should be reported systematically and carefully, with particular attention paid to how connections between the data and results are reported. However, the reporting of results systematically can often be challenging (Kyngäs et al., 2011). Problems with reporting results can be a consequence of unsuccessful analysis (Dey, 1993; Elo & Kyngäs, 2008) or difficulties in describing the process of abstraction because it in part depends on the researcher’s insight or intuitive action, which may be difficult to describe to others (Elo & Kyngäs, 2008; Graneheim & Lundman, 2004).

내용분석에 의해 만들어진 개념의 내용과 구조는 명확하고 이해하기 쉬운 방식으로 제시되어야 한다. 전체 결과의 개요를 제공하기 위해 수치를 제공하는 것이 종종 유용합니다. 이 연구의 목적은 분석 과정을 통해 어떤 연구 현상들이 개념화되는지 지시한다. 그러나 개념conception은 목적이 다양할 수 있다.

  • 예를 들어, 이 연구의 목적은 단지 개념을 식별하는 것일 수 있다.
  • 반대로, 모델을 구성하는 것이 목표라면, 결과는 개념, 계층 구조 및 가능한 연결의 개요를 설명하는 모델로 제시되어야 한다.

내용 분석 그 자체에는 개념을 연결하는 기술이 포함되어 있지 않습니다. 결과의 구조가 동등하고 목표와 연구 질문에 답하도록 하는 것이 주요 고려사항이다.
The content and structure of concepts created by content analysis should be presented in a clear and understandable way. It is often useful to provide a figure to give an overview of the whole result. The aim of the study dictates what research phenomena are conceptualized through the analysis process. However, conception may have different objectives. For example, the aim of the study may be merely to identify concepts. In contrast, if the aim is to construct a model, the results should be presented as a model outlining the concepts, their hierarchy, and possible connections. Content analysis per se does not include a technique to connect concepts (Elo & Kyngäs, 2008; Harwood & Garry, 2003). The main consideration is to ensure that the structure of results is equivalent and answers the aim and research questions.

신뢰성trustworthiness의 관점에서, 주요 질문은 "독자가 결과의 전이가능성transferability을 어떻게 평가할 수 있는가?"이다. 전이가능성은 연구 결과가 다른 설정이나 그룹으로 전달될 수 있는 정도를 의미합니다. (코치, 1994; 폴리티 & 벡, 2012). 저자들은 전이가능성에 대한 제안을 할 수도 있지만, 보고된 결과가 다른 맥락으로 전달될 수 있는지 여부에 대해서는 궁극적으로 독자의 판단에 달려 있다(그래인하임 & 런드먼, 2004). 이는 고품질 결과를 보장하고 분석 프로세스를 보고하는 것의 중요성을 강조한다. 참가자들의 문화, 맥락, 선정, 특징 등을 명쾌하게 서술하는 것도 가치가 있다. 독자가 대체 해석을 찾을 수 있는 방식으로 결과가 제시되면 신뢰성이 높아진다(그래인하임 & 룬드먼, 2004). 우리는 질적 방법이 민감한 해석 능력과 연구자의 창의적인 재능을 필요로 한다는 반 마넨(2006)의 의견에 전적으로 동의한다. 따라서 과학적인 글쓰기는 다른 사람의 분석 결과를 쓰고 비교함으로써 향상되어야 하는 기술입니다.

From the perspective of trustworthiness, the main question is, “How can the reader evaluate the transferability of the results?” Transferability refers to the extent to which the findings can be transferred to other settings or groups. (Koch, 1994; Polit & Beck, 2012). Authors may offer suggestions about transferability, but it is ultimately down to the reader’s judgment as to whether or not the reported results are transferable to another context (Graneheim & Lundman, 2004). Again, this highlights the importance of ensuring high quality results and reporting of the analysis process. It is also valuable to give clear descriptions of the culture, context, selection, and characteristics of participants. Trustworthiness is increased if the results are presented in a way that allows the reader to look for alternative interpretations (Graneheim & Lundman, 2004). We fully agree with van Manen (2006) that qualitative methods require sensitive interpretive skills and creative talents from the researcher. Thus, scientific writing is a skill that needs to be enhanced by writing and comparing others’ analysis results.

결과의 신뢰도를 나타내기 위해 인용문의 사용이 필요하다는 주장이 제기됐다. 적합성Conformability 은 [객관성]을 가리키며, [참가자들이 제공한 정보와 그 데이터에 대한 해석이 질문자에 의해 발명된 것이 아니라는 것]을 의미한다연구 결과는 [연구자의 편견, 동기 또는 관점]이 아닌 [참여자의 목소리와 연구 조건]을 반영해야 한다. 저자들이 특히 데이터와 결과 사이의 연관성을 보여주기 위해 대표적인 인용구를 자주 제시하는 한 가지 이유가 바로 이것이다 (Graneheim & Lundman, 2004). 예를 들어, 각각의 주요 개념은 인용문에 의해 데이터에 연결되어야 합니다. 가능한 한 많은 참여자들이 인용한 예들은 데이터의 풍부함뿐만 아니라 결과와 데이터 사이의 연관성을 확인하는 데 도움이 된다. 다만 인용문의 체계적 사용은 세심한 주의가 필요하다. 이상적으로, 인용문은 최소한 모든 주요 개념과 연결되어 있고 표본의 광범위한 대표성을 갖는 것을 선택해야 한다. 다만 인용구가 과도하게 사용돼 분석을 약화시킬 위험이 있다. 예를 들어, 결과 섹션에서 따옴표가 너무 많이 사용된 경우 분석 결과가 불분명할 수 있습니다.
It has been argued that the use of quotations is necessary to indicate the trustworthiness of results (Polit & Beck, 2012; Sandelowski, 1995a). Conformability refers to objectivity and implies that the data accurately represent the information that the participants provided and interpretations of those data are not invented by the inquirer. The findings must reflect the participants’ voice and conditions of the inquiry, and not the researcher’s biases, motivations, or perspectives (Lincoln & Guba, 1985; Polit & Beck, 2012) This is one reason why authors often present representative quotations from transcribed text (Graneheim & Lundman, 2004), particularly to show a connection between the data and results. For example, each main concept should be linked to the data by a quotation. Examples of quotations from as many participants as possible help confirm the connection between the results and data as well as the richness of data. However, the systematic use of quotations needs careful attention. Ideally, quotations should be selected that are at least connected to all main concepts and widely representative of the sample. However, there is a risk that quotations may be overused, thus weakening the analysis (Downe-Wamboldt, 1992; Graneheim & Lundman, 2004, Kyngäs et. al., 2011). For example, if quotations are overused in the Results section, the results of the analysis may be unclear.

Sheh와 Shannon(2005)에 따르면, 중요한 문제는 [맥락을 완전히 이해하지 못해 주요 범주를 식별하는 데 실패하는 것]이다. 이러한 경우, findings은 데이터를 정확하게 나타내지 못한다. 신뢰성trustworthiness과 특히 결과의 신뢰성credibility을 보장하기 위해서는 [범주가 데이터를 얼마나 잘 다루는지] 평가하고, [범주 내 유사성과 차이점이 있는지 ]확인하는 것이 중요하다. 또한 분석 추상화 과정을 완료하지 못하는 것은 개념이 상호 배타적이지 않은 결과로 제시되어 지나치게 단순한 결론으로 이어진다는 것을 의미할 수 있다(Harwood & Garry, 2003; Weber, 1990). 불완전한 분석은 분석 결과를 보고하기보다는 일상적인 표현이나 응답자의 진술 및 그들의 의견의 반복을 포함할 수 있다(Kyngás et al., 2011).
According to Hsieh and Shannon (2005), an important problem is failure to develop a complete understanding of the context, resulting in failure to identify the key categories. In such a case, findings do not accurately represent the data. To ensure the trustworthiness and especially credibility of the results, it is important to evaluate how well categories cover the data and identify whether there are similarities within and differences between categories. In addition, failure to complete the analysis abstraction process may mean that concepts are presented as results that are not mutually exclusive, leading to oversimplistic conclusions (Harwood & Garry, 2003; Weber, 1990). An incomplete analysis may involve the use of everyday expressions or repetition of respondents’ statements and/or their opinions rather than reporting the results of the analysis (Kyngäs et al., 2011).

분석 프로세스 보고
Reporting the Analysis Process

[분석에 대한 완전한 설명]과 [개념의 논리적 사용에 대한 설명] 없이는 결과가 어떻게 생성되었는지와 그 신뢰도를 평가하는 것이 불가능하다(Guthrie 등, 2004). [분석에 대한 정확한 설명]과 [결과와 원본 데이터 간의 관계]를 통해 독자는 결과의 신뢰성에 관한 결론을 내릴 수 있다. 간호과학에서는 지난 10년 동안 책과 과학 기사에 게재된 내용 분석과 관련된 방법들이 상당히 증가했다. 이것은 내용 분석 과정에 대한 보고서의 품질을 향상시켰을 수 있다. 이제 연구의 분석, 결과 및 신뢰도를 평가하는 방법에 대한 설명에 더 많은 관심이 쏠리고 있다. 결과적으로, 이것은 독자들이 연구의 신뢰도를 더 쉽게 평가할 수 있게 한다.
Without a full description of the analysis and logical use of concepts, it is impossible to evaluate how the results have been created and their trustworthiness (Guthrie et al., 2004). An accurate description of the analysis and the relationship between the results and original data allow readers to draw their own conclusions regarding the trustworthiness of the results. In nursing science, the number of methods concerning content analysis published in books and scientific articles has increased considerably over the last decade (Elo & Kyngäs, 2008; Harwood & Garry, 2003; Hsieh & Shannon, 2005; Neuendorf, 2002; Schreier, 2012). This may have led to improvements in the quality of reports on the process of content analysis. More attention is now paid to descriptions of the analysis, results, and how to evaluate the trustworthiness of studies. Consequently, this makes it easier for readers to evaluate the trustworthiness of studies.

최초 연구자가 사용한 [의사결정 흔적을 다른 연구자가 쉽게 따라갈 수 있다면] 연구의 신뢰성dependability이 높다(Thomas & Magilvy, 2011). 휘트모어 외 연구진(2001)은 생생함vividness는 데이터에서 두드러진 주제를 강조하는 풍부하고, 생생하고, 충실하고, 기교적인 묘사의 제시를 수반한다고 주장했다. 분석 프로세스는 조사 결과를 제시하는 데 사용되는 방법에 관계없이, 적절한 방식으로 보고되어야 한다. 내용 분석의 신뢰성trustworthiness을 보장하기 위해 연구 보고서에 신뢰성credibility을 입증하는 조치를 취해야 한다. 모노그래프 연구 보고서는 분석 과정에 대한 상세한 설명과 분류 과정을 설명하기 위한 수치, 표 및 첨부의 사용을 용이하게 한다. 우리의 경험에 따르면, 분석 과정에 대한 설명이 불충분하기 때문에 독자로서 결과의 신뢰성에 대한 평가는 종종 어려울 수 있다. 저널 기사는 일반적으로 내용 분석 과정을 설명하기 보다는 결과에 초점을 맞춘다. 질적 내용분석의 활용은 방법론 부분에서 간략하게 언급될 뿐이어서 독자들이 그 과정을 평가하기가 쉽지 않은 경우가 많다. 중요한 질문은, "연구논문에서 신뢰성은 얼마나 자세히 제시되어야 하는가?"—특히 단어 제한이 적용되는 경우가 많습니다.

The dependability of a study is high if another researcher can readily follow the decision trail used by the initial researcher (Thomas & Magilvy, 2011). Whittemore et al. (2001) have argued that vividness involves the presentation of rich, vivid, faithful, and artful descriptions that highlight the salient themes in the data. The analysis process should be reported in an adequate manner regardless of the methods used to present the findings (see Moretti et al., 2011). Steps should be taken to demonstrate credibility in research reports to ensure the trustworthiness of the content analysis. Monograph research reports facilitate detailed descriptions of the analysis process and the use of figures, tables, and attachments to explain the categorization process. Based on our experiences, evaluation of the trustworthiness of results as a reader can often be difficult because of insufficient description of the analysis process (Kyngäs et. al., 2011). Journal articles generally focus on the results rather than describing the content analysis process. All too often, the use of qualitative content analysis is only briefly mentioned in the methodology section, making it hard for readers to evaluate the process. A key question is, “In what detail should trustworthiness be presented in scientific articles?”—particularly as word limits often apply.

내용분석 결과를 보고할 때 사진이 말보다 더 명확하게 결과를 전달할 수 있다는 점을 염두에 둬야 한다. 특히 개념 분석의 목적과 과정을 설명할 때, 콘텐츠 분석 결과를 보고할 때 수치를 사용하는 것이 매우 효과적일 수 있다. 예를 들어, [개념이나 범주의 계층 구조를 보여주는 다이어그램]은 분석 과정에 대한 통찰력을 제공할 수 있다. 결과를 보고한 후 분석의 신뢰성에 대한 논의를 제공해야 한다. 그것은 각 질적 내용 분석 단계에 대해 논리적으로 따르는 일련의 정의된 기준에 근거해야 합니다.

The fact that pictures may convey results more clearly than words should be borne in mind when reporting content analysis findings. The use of figures can be highly effective when reporting content analysis findings, especially when explaining the purpose and process of the analysis and structure of concepts. Very often, these aspects can be shown in the same figure, for example, a diagram that illustrates the hierarchy of concepts or categories may also give an insight into the analysis process (see, for example, Timlin, Riala, & Kyngäs, 2013). After reporting the results, a discussion of the trustworthiness of the analysis should be provided. It should be based on a defined set of criteria that are followed logically for each qualitative content analysis phase.

논의
Discussion

이 글의 주요 목적은 질적 콘텐츠 분석 연구의 신뢰도에 영향을 미치는 요소를 논의하고 강조하는 것이었다. 여기서 사용된 문헌평은 체계적인 평론이 아니어서 몇 가지 제약이 있다. 첫째, 우리는 이것이 신뢰성에 대한 완전한 설명이 아니며 일부 요점이 누락되었을 수 있다는 것을 인식한다. 예를 들어, 언어 제한이 연구 결과에 영향을 미쳤을 수 있습니다. 
다른 언어의 연구들은 우리의 설명에 새로운 정보를 더했을지도 모른다. 과학저널의 내용분석 보고를 체계적으로 평가하기 위해, 즉 연구자들이 질적 콘텐츠 분석 연구의 신뢰도를 보고할 때 강조했던 것과 신뢰도 기준이 이러한 연구에 의해 어떻게 해석되어 왔는지를 검토하기 위해 추가 연구가 필요하다. 이는 질적 내용분석에서 신뢰성에 대한 보다 완전한 설명을 개발하는 데 도움이 될 수 있다. 그러나 이번 방법론 논문은 내용분석법을 사용한 경험이 풍부한 여러 저자들이 작성한 것이다. 여기에 석박사 학생들의 연구자, 교사, 감독자로서의 저자들의 경험도 우리의 논의에 힘을 실어준다.

The main purpose of this article was to discuss and highlight factors affecting trustworthiness of qualitative content analysis studies. The literature review used here was not a systematic review, so there are some limitations. First, we recognize that this is not a full description of trustworthiness and some points may be missing. For example, the language restrictions may have influenced the findings; research studies in other languages might have added new information to our description. Further studies are needed to systematically evaluate the reporting of content analysis in scientific journals, that is, to examine what researchers have emphasized when reporting the trustworthiness of their qualitative content analysis study, and how criteria of trustworthiness have been interpreted by those studies. This may help to develop a more complete description of trustworthiness in qualitative content analysis. However, the present methodological article was written by several authors who have extensive experience in using the content analysis method. In addition, the authors’ experience as researchers, teachers, and supervisors of master’s and doctoral students lends weight to our discussion.

Holloway와 Wheeler(2010)는 연구자들이 종종 질적 연구의 신뢰도를 판단하는 방법에 대해 합의하는 데 어려움을 겪는다고 말했다. 이 글의 목적은 데이터 수집과 결과 보고의 관점에서 질적 내용분석 신뢰성에 영향을 미치는 요인을 파악하는 것이었다. 질적 연구자들은 연구의 신뢰도를 높이기 위해 체계적이고 잘 조직되어야 한다(Saldana, 2011). 슈라이어(2012)에 따르면, 내용 분석은 다음과 같아야 체계적이다.

  • 모든 관련 소재가 고려할 경우
  • 분석 과정에서 일련의 단계를 따를 경우
  • 연구자는 코딩의 일관성을 확인할 경우

본 논문에서 제시된 정보는 내용분석의 사용 및 개발에 대한 중요한 문제를 제기합니다. 프로세스의 모든 단계(준비, 조직, 보고)에 대해 철저히 문서화되면 신뢰도 기준의 모든 측면이 향상된다.

Holloway and Wheeler (2010) have stated that researchers often have difficulty in agreeing on how to judge the trustworthiness of their qualitative study. The aim of this article was to identify factors affecting qualitative content analysis trustworthiness from the viewpoint of data collection and reporting of results. Qualitative researchers are advised to be systematic and well organized to enhance the trustworthiness of their study (Saldaña, 2011). According to Schreier (2012), content analysis is systematic because

  • all relevant material is taken into account,
  • a sequence of steps is followed during the analysis, and
  • the researcher has to check the coding for consistency.

The information presented here raises important issues about the use and development of content analysis. If the method is thoroughly documented for all phases of the process (preparation, organization, and reporting), all aspects of the trustworthiness criteria are increased.

분석 방법을 선택하기에 앞서 연구자는 대상 연구 질문에 가장 적합한 방법을 선택하고, 내용분석을 활용하기에 [데이터 풍부성이 충분한지] 고려해야 한다. 그 방법을 사용하기 전에, 연구자는 질문을 해야 한다. "이 방법이 목표 연구 질문에 가장 잘 대답할 수 있는 방법입니까?" 어떤 분석 방법에도 단점이 없지만, 각각은 특정한 목적을 위해 좋을 수 있다. 강력한 분석 절차를 사용하면 연구의 신뢰성이 증가하기 때문에 데이터 분석을 시작하기 전에 내용 분석을 수행하기 위해 사용할 접근방식을 설명하는 것이 중요하다(Hsieh & Shannon, 2005).

Before choosing an analysis method, the researcher should select the most suitable method for answering the target research question and consider whether the data richness is sufficient for using content analysis. Prior to using the method, the researcher should ask the question, “Is this method the best available to answer the target research question?” No analysis method is without drawbacks, but each may be good for a certain purpose. It is essential for researchers to delineate the approach they are going to use to perform content analysis before beginning the data analysis because the use of a robust analytic procedure will increase the trustworthiness of the study (Hsieh & Shannon, 2005).

질적 내용 분석은 문서 자료를 분석하는 데 널리 사용되는 방법이다. 이것은 그 방법을 사용하여 광범위한 품질에 걸친 결과를 얻었음을 의미한다. 내용분석은 이를 이용하는 연구자들이 데이터의 신뢰성에 대한 강력한 근거를 만들어야 하는 방법론이다. 모든 finding은 가능한 한 신뢰할 수 있어야 하며, 연구는 소견을 생성하는 데 사용된 절차와 관련하여 평가되어야 한다(Graneheim & Lundman, 2004). 많은 연구에서 내용 분석은 [설문지의 개방형 질문에 대한 답변]을 분석하는 데 사용되어 왔다(Kyngäs 등, 2011). 그러나 이러한 답변은 종종 너무 간단하여 콘텐츠 분석을 효과적으로 사용하기 어렵다. 환원reduction, 그룹화, 추상화에는 풍부한 데이터가 필요하다. 또한 그동안 논문은 연구에서 얻은 질적 데이터보다는 정량적 데이터의 분석을 주로 보도하는 데 초점을 맞췄기 때문에 신뢰도를 평가하기 어려운 경우가 많았다. 이것이 결과의 신뢰성에 영향을 미치는지 여부는 추측만 할 수 있다. 다만 연구자가 내용 분석을 통해 개방형 질문에 대한 답을 분석할 경우 독자가 쉽게 신뢰도를 평가할 수 있도록 적절한 설명을 제공해야 한다. 내용 분석은 또한 개방형 질문에 대한 답을 분석하기 위해 정량적 연구에서 일반적으로 사용되어 왔다.

Qualitative content analysis is a popular method for analyzing written material. This means that results spanning a wide range of qualities have been obtained using the method. Content analysis is a methodology that requires researchers who use it to make a strong case for the trustworthiness of their data (Potter & Levine-Donnerstein, 1999; Sandelowski, 1995a). Every finding should be as trustworthy as possible, and the study must be evaluated in relation to the procedures used to generate the findings (Graneheim & Lundman, 2004). In many studies, content analysis has been used to analyze answers to open-ended questions in questionnaires (Kyngäs et al., 2011). However, such answers are often so brief that it is difficult to use content analysis effectively; reduction, grouping, and abstraction require rich data. In addition, trustworthiness has often been difficult to evaluate because articles have mainly focused on reporting the analysis of quantitative rather than qualitative data obtained in the study. Whether this affects the trustworthiness of the results can only be speculated upon. However, if researchers use content analysis to analyze answers to open-ended questions, they should provide an adequate description so that readers are able to readily evaluate its trustworthiness. Content analysis has also been commonly used in quantitative studies to analyze answers to open-ended questions.

질적 내용분석을 할 때 자기비판과 좋은 분석력이 필요하다. 질적 분석은 연구의 시작부터 [연구자의 지속적인 성찰과 자기 비판]을 포함해야 한다(Pyett, 2003; Thomas & Magilvy, 2011). 연구자의 개별적인 속성과 관점은 분석 과정에 중요한 영향을 미칠 수 있습니다. 분석 능력이 부족해도 어떤 방법을 사용해도 간단한 결과를 얻을 수 있다(Weber, 1990). Neuendorf(2002)에 따르면 내용분석 방법은 딱 연구자가 허용하는 만큼 한 쉬울 수도, 어려울 수도 있다. 많은 연구자들은 여전히 이것을 단순한 방법으로 인식하고 있으며, 따라서 널리 사용되고 있습니다. 그러나 경험이 부족한 연구자는 필요한 지식과 기술을 가지고 있지 않기 때문에 정확한 분석을 수행하지 못할 수도 있습니다. 이는 연구자들이 연구의 [진정성authenticity]에 영향을 미칠 것이며, 진정성이란 공정하고 충실하게 다양한 현실을 보여주는 정도를 가리킨. 연구자가 그 결과를 올바르게 사용하고 보고할 수 없는 경우에는 단순화된simplified 결과밖에 얻지 못할 것이다.

There is a need for a self-criticism and good analysis skills when conducting qualitative content analysis. Any qualitative analysis should include continuous reflection and self-criticism by the researcher (Pyett, 2003; Thomas & Magilvy, 2011) from the beginning of the study. The researcher’s individual attributes and perspectives can have an important influence on the analysis process (Whittemore et al., 2001). It is possible to obtain simplistic results using any method even when analysis skills are lacking (Weber, 1990). According to Neuendorf (2002), the content analysis method can be as easy or as difficult as the researcher allows. Many researchers still perceive it as a simple method, and hence, it is widely used. However, inexperienced researchers may be unable to perform an accurate analysis because they do not have the knowledge and skills required. This can affect the authenticity (Lincoln & Guba, 1985; Whittemore et al., 2001) of the study, which refers to the extent to which researchers fairly and faithfully show a range of realities. A simplified result may be obtained if the researcher is unable to use and report the results correctly.


또한, 내용 분석 프로세스의 보고는 분석의 각 단계에서의 자기 비판적 사고를 기반으로 해야 합니다. Whittemore 외 연구진(2001)은 해석이 타당하고 데이터에 근거한다는 것을 보장하려면, [지속적인 자기반성과 자기검열에 의해 무결성이 입증된다]고 주장했다. 데이터 검증에 도움이 되는 분석에 대한 충분한 설명이 제공되어야 할 뿐만 아니라, 연구자는 [연구의 한계]에 대해서도 공개적으로 논의해야 한다. 질적연구에서 validation은 [연구원과 참가자가 가장 잘 설명한 결과의 정확성을 평가하기 위한 시도]라는 Creswell(2013)의 의견에 동의한다. 이것은 모든 연구 보고서는 저자의 표상represenstaion이라는 것을 의미한다. 연구의 신뢰성에 대한 논의는 논리적으로 따르는 일련의 정의된 기준에 기초해야 한다. 질적 연구의 신뢰도를 평가하기 위해 많은 기준이 제안되었지만 거의 지켜지지 않았다. 예를 들어 신뢰성, 검증 및 진정성과 같은 많은 유형의 질적 validation 용어가 있으므로 저자들은 검증 용어를 명확하게 정의할 것을 권고한다(Creswell, 2013).
Furthermore, the reporting of the content analysis process should be based on self-critical thinking at each phase of the analysis. Whittemore et al. (2001) have argued that integrity is demonstrated by ongoing self-reflection and self-scrutiny to ensure that interpretations are valid and grounded in the data. Not only should a sufficient description of the analysis be provided to help validate the data, but the researcher should also openly discuss the limitations of the study. We agree with Creswell’s (2013) comment that validation in a qualitative study is an attempt to assess the accuracy of the findings, as best described by the researcher and the participants. This means that any report of research is a representation by the author. Discussion of the trustworthiness of a study should be based on a defined set of criteria that are followed logically. Although many criteria have been proposed to evaluate the trustworthiness of qualitative studies, they have rarely been followed. It is recommended that authors clearly define their validation terms (see example from Tucker, van Zandvoort, Burke, & Irwin, 2011) because there are many types of qualitative validation terms in use, for example, trustworthiness, verification, and authenticity (Creswell, 2013).

결론
Conclusion

내용분석 결과의 신뢰성은 풍부하고 적절하며 잘 포화된 데이터의 가용성에 따라 달라진다. 따라서 데이터 수집, 분석 및 결과 보고는 모두 서로 밀접하게 관련되어 있다. 콘텐츠 분석의 신뢰도 향상은 연구에 앞서 철저한 준비에서 시작되며 데이터 수집, 콘텐츠 분석, 신뢰도 토론, 결과 보고 등의 고급 기술이 필요하다. 데이터 수집의 신뢰성은 샘플링 방법과 참가자의 설명에 대한 정확한 세부사항을 제공함으로써 검증할 수 있다. 여기서는 내용 분석을 유효하고 이해할 수 있는 방식으로 보고할 수 있는 방법을 보여 주었는데, 이는 과학 기사의 작성자와 검토자 모두에게 도움이 될 것으로 예상한다. 중요한 질적 연구 결과가 모노그래프 보고서로 보도되는 경우가 많은 만큼, 콘텐츠 분석이 활용되는 출판된 기사를 분석하기 위한 추가 연구가 필요하다. 이것은 내용 분석 작성자들이 더 효과적인 방법으로 그들의 연구를 발표하는 데 도움이 되는 추가 정보를 생산할 수 있다.

The trustworthiness of content analysis results depends on the availability of rich, appropriate, and well-saturated data. Therefore, data collection, analysis, and result reporting go hand in hand. Improving the trustworthiness of content analysis begins with thorough preparation prior to the study and requires advanced skills in data gathering, content analysis, trustworthiness discussion, and result reporting. The trustworthiness of data collection can be verified by providing precise details of the sampling method and participants’ descriptions. Here, we showed how content analysis can be reported in a valid and understandable manner, which we anticipate will be of benefit to both writers and reviewers of scientific articles. As important qualitative research results are often reported as monograph reports, there is a need for further study to analyze published articles where content analysis is used. This may produce further information that helps content analysis writers present their studies in a more effective way.

 


Article Information

Volume: 4 issue: 1,

Article first published online: February 11, 2014; Issue published: January 1, 2014
This article is part of the following special collection(s): Behavioral Sciences , Data Processing and Interpretation , Reliability and Validity , Nursing
Satu Elo1, Maria Kääriäinen1, 2, Outi Kanste3, Tarja Pölkki1, Kati Utriainen1, Helvi Kyngäs1, 2
1University of Oulu, Finland
2Medical Research Center, Oulu University Hospital, Finland
3National Institute of Health and Welfare, Oulu, Finland

Corresponding Author:

Satu Elo, Senior University Lecturer, Institute of Health Sciences, Medical Research Center Oulu, Oulu University Hospital and University of Oulu, Box 5000, 90014, Finland. Email: satu.elo@oulu.fi

This article is distributed under the terms of the Creative Commons Attribution 3.0 License (http://www.creativecommons.org/licenses/by/3.0/) which permits any use, reproduction and distribution of the work without further permission provided the original work is attributed as specified on the SAGE and Open Access page (http://www.uk.sagepub.com/aboutus/openaccess.htm).

Abstract

Qualitative content analysis is commonly used for analyzing qualitative data. However, few articles have examined the trustworthiness of its use in nursing science studies. The trustworthiness of qualitative content analysis is often presented by using terms such as credibility, dependability, conformability, transferability, and authenticity. This article focuses on trustworthiness based on a review of previous studies, our own experiences, and methodological textbooks. Trustworthiness was described for the main qualitative content analysis phases from data collection to reporting of the results. We concluded that it is important to scrutinize the trustworthiness of every phase of the analysis process, including the preparation, organization, and reporting of results. Together, these phases should give a reader a clear indication of the overall trustworthiness of the study. Based on our findings, we compiled a checklist for researchers attempting to improve the trustworthiness of a content analysis study. The discussion in this article helps to clarify how content analysis should be reported in a valid and understandable manner, which would be of particular benefit to reviewers of scientific articles. Furthermore, we discuss that it is often difficult to evaluate the trustworthiness of qualitative content analysis studies because of defective data collection method description and/or analysis description.

피드백의 심리적 안전: 무엇이며, 교육자들은 어떻게 배우는가? (Med Educ, 2020)
Psychological safety in feedback: What does it look like and how can educators work with learners to foster it?
Christina E. Johnson1,2 | Jennifer L. Keating3 | Elizabeth K. Molloy2

 

 

1 소개
1 INTRODUCTION

피드백은 건강 직업 교육에서 직장 학습의 중심적인 역할을 합니다. 일반적으로 임상 실습에서 학습자의 성과에 대해 논의하는 상급 임상의(교육자)와 하급 임상의(학습자)를 포함한다. 이는 직장 기반 평가나 부착 종료 평가와 같은 공식적인 환경 또는 클리닉 후나 극장 내 상처 봉합 기간과 같은 내재된 비공식적 토론일 수 있다. 피드백의 목적은 학습자가 '퀄리티 있는 작업'이 어떤 모습인지, 자신의 작업이 이러한 기준과 어떻게 비교되는지 이해하고, 이 성과 정보를 활용하여 성과를 향상시키는 것입니다.  

Feedback plays a central role in workplace learning in health professions education.1-4 Commonly in clinical practice, this involves a senior clinician (educator) and a junior clinician (learner) discussing the learner's performance. This may be in formal settings, such as workplace-based assessments or end-of-attachment appraisals, or embedded informal discussions, such as after a clinic or during wound closure in theatre. The aim of feedback is to assist learners to understand what ‘quality work’ looks like and how their work compares with these standards, and to use this performance information to implement practical strategies to improve performance.5-9

이러한 목표를 달성하기 위해, 사회적 구성주의 입장으로 뒷받침되는 현대의 피드백 문헌에서는 학습자의 적극적인 참여가 필수적이라는 공감대가 형성되고 있다.10 [학습적 대화learning conversation]는 학습자가 이해를 개선하고 공동 구성된 아이디어를 형성하는 데 기여할 수 있는 기회를 제공한다. 예를 들어, 학습자는 자신의 성과를 원하는 성과와 비교하여 사려 깊은 자기 평가를 분명하게 표현할 수 있습니다. 이러한 성찰과 평가 판단 과정은 그 자체로 가치 있는 학습을 낳는다(학습에 대한 추가적인 길을 제공할 뿐만 아니라). 또한, 교육자와 학습자 간의 대화는 서로 다른 관점이 상호 작용함에 따라 촉매 반응을 통해 학습자를 돕기 위한 고유한 새로운 통찰력과 전략을 공동 생성할 수 있는 기회를 제공합니다. 이 모든 것은 학습자가 자신의 학습 요구를 솔직하게 밝히고 자신에게 효과가 있는 개선 전략의 설계를 협상할 것을 요구합니다.18 반면에, 학습자가 경험한 어려움을 드러내지 않거나 질문을 하거나, (부분적이거나 결함이 있더라도) 자신의 아이디어를 제안하거나, 아이디어를 두고 논쟁하지 않는 경우, 교육자의 조언은 학습자가 실행에 옮길 만큼 충분히 관련성이 없거나 유용하거나 수용할 수 없다. 
To achieve these aims, there is consensus in contemporary feedback literature, underpinned by a social constructivist stance, that learners’ active engagement is essential.10 Learning conversations offer opportunities for learners to refine their understanding and contribute to shaping co-constructed ideas.5, 11 For example, learners might articulate a thoughtful self-assessment by comparing their own performance with the desired performance. This process of reflection and evaluative judgement engenders valuable learning in itself (as well as offering further avenues for learning).9, 12, 13 In addition, dialogue between an educator and learner offers the opportunity for a catalytic reaction, as their different perspectives interact, to co-create new insights and strategies uniquely tailored to assist the learner.14-17 All this requires a learner to candidly reveal their learning needs and negotiate the design of an improvement strategy that will work for them.18 On the other hand, if a learner does not reveal the difficulties they have experienced, ask questions, propose their own ideas (even if partial or flawed) or contest an idea, then an educator's advice may not be sufficiently relevant, useful or acceptable for the learner to put into practice.17

그러나 피드백 결과를 최적화하는 데 학습자 참여의 중요성이 대두되고 있지만, 이는 일상적인 실천으로 전환되지 않은 것으로 보인다. 관찰 연구는 피드백이 일반적으로 교육자에 의해 지배되는 '일방향' 정보 제공으로 구성된다고 보고했다. 학습자는 종종 교육자의 코멘트가 구체적이거나 명확하지 않으며 이를 '이해성' 및 '활용'하기 위해 애쓴다고 보고합니다. 

However, despite the espoused importance of learner participation in optimising feedback outcomes, this does not appear to have been translated into routine practice. Observational studies have reported that feedback commonly comprises ‘one-way’ information provision, dominated by the educator.19-21 Learners often report that educators’ comments are not specific, clear or actionable and they struggle to ‘make sense’ and ‘make use’ of it.22-26

이러한 학습자 참여 부족에 대응하기 위해 문헌에서는 학습자 기여가 가능한 안전한 공간을 조성하는 데 있어 [교육자-학습자 관계의 가치]에 대한 관심이 높아지고 있다. 건강 직업 교육에서 엔데는 학습자와 교육자가 '동맹자allies'로서 일할 것을 요구했다. R2C2(관계, 리액션, 내용, 코칭) 피드백 모델은 '신뢰와 존중을 바탕으로 한 긍정적 관계 구축'을 목표로 '관계 구축'을 1단계로 포함하고 있다. '교육적 동맹'의 개념은 심리 치료에서의 '치료적 동맹'에서 파생된 개념으로 제안되었다. 강한 치료 동맹은 치료사가 그들에게 긍정적인 유대감, 그들을 향한 동일한 치료 목표와 전략을 공유한다고 믿을 때 존재한다고 말해진다. 슈퍼바이저와 강한 교육적 연대를 느낀 후배 의사들은 의견을 구하고, 토론할 때 솔직하며, 계획적인 전략을 실행했다고 보고했다. 고등교육에서 Carless는 대화 피드백에서 신뢰의 역할을 탐구했다. 그는 트샤넨-모란의 정의를 사용하여 [신뢰][다른 사람이 개방적이고, 믿을 수 있고, 정직하고, 자비롭고, 유능하다는 믿음의 투자에 기반하여 다른 사람에게 기꺼이 취약해지는 의지]라고 정의했다. Carless는 학습자가 위험을 감수하고 자신의 약점을 드러낼 수 있는 도전적인 학습 활동에 완전히 참여하기 위해서는 신뢰가 필수적이라고 주장했다.
To counter this lack of learner involvement, there has been increasing focus in the literature on the value of the educator-learner relationship in creating safe spaces to allow for learner contribution. In health professions education, Ende called for the learner and educator to work ‘as allies.’27 The R2C2 (relationship, reaction, content, coaching) feedback model includes ‘relationship building’ as the first phase, with the goal to ‘build a positive relationship based on trust and respect.’14, 28, 29 The concept of an ‘educational alliance’ has also been proposed, derived from the ‘therapeutic alliance’ in psychotherapy. A strong therapeutic alliance is said to exist when a client believes the therapist shares with them a positive bond, the same therapeutic goals and strategies for working towards them. Junior doctors, who felt a strong educational alliance with their supervisors, reported seeking feedback, being open and honest during discussions and implementing planned strategies.30, 31 In higher education, Carless explored the role of trust in dialogic feedback.32 He used a definition by Tschannen-Moran that trust is one's willingness to be vulnerable to another based on an investment of faith that the other is open, reliable, honest, benevolent, and competent.33 Carless asserted that trust was essential if learners were to take risks and fully engage in challenging learning activities that may reveal their weaknesses.


우리는 [심리적 안전]이 이러한 개념들을 함께 묶는 가장 중요한 구조(동맹으로 일하는 것, 교육자와 학습자 관계 및 신뢰)이며 참여와 학습에 강력한 영향을 미친다고 제안한다. 심리학 안에서 에드먼드슨의 연구를 바탕으로, [심리적 안전]은 다음과 같이 정의될 수 있다.

  • '교수자-학습자 관계가 대인관계적 위험을 감수하는 데 안전하다는 공통된 믿음'으로서, 상호 존중과 신뢰가 있기에, [교육자]가 [학습자를] 수치를 주거나, 거부하거나, 처벌하지 않을 것이라는 확신을 갖게 한다. 

We propose that psychological safety is an overarching construct that ties these concepts together (working as allies, the educator-learner relationship and trust), which has a powerful influence on engagement and learning. Drawing on Edmondson's work within psychology, psychological safety may be defined as

  • ‘a shared belief that the [educator-learner relationship] is safe for interpersonal risk taking,’ which creates ‘a sense of confidence that [the educator] will not embarrass, reject or punish [the learner] … due to mutual respect and trust.’34 

[대인관계 역학과 의료 성과]를 탐구한 에드먼드슨의 연구는, [높은 심리적 안전성]을 가진 간호 팀에서 질문을 하고, 실수를 논하고, 도움을 구하거나, 새로운 아이디어를 시험하는 것과 같은 생산적인 학습 행동이 흔히 관찰된다는 것을 발견했다. [심리적 안전이 높은 환경]은 다른 사람의 전문지식을 존중하고, 사람들이 좋은 의도를 가지고 있고 다른 사람의 성공에 투자되었다는 신뢰, 그리고 개인으로서 [사람들에 대한 관심, 수용, 보살핌]으로 특징지어진다.34 팀 리더들은 높은 기준을 가지고 있었고, 지속적으로 개선을 추구했다. 그러나 그들은 또한 도움을 주고, 팀을 지도하며, 계층 구조를 최소화하며, 도전을 받았을 때 방어적이지 않고, 학습 행동을 모델링했다. 

Edmondson's research exploring interpersonal dynamics and health care outcomes found that, in nursing teams with high psychological safety, productive learning behaviours were commonly seen, such as asking questions, discussing mistakes, seeking help or trialling new ideas. The environment was characterised by respect for others’ expertise; trust that people had good intentions and were invested in others’ success; and interest, acceptance and care for people as individuals.34 Team leaders held high standards and were continually seeking to improve. Yet they were also supportive, coached their team, minimised hierarchy, were not defensive when challenged, and role modelled learning behaviours.34

심리적 안전이 학습과 성과에 미치는 영향은 건강관리의 다른 영역에서도 입증되었다. [시뮬레이션 기반 교육]에서는 심리적 안전의 중요성이 특히 강조된다. 시작할 때부터 심리적 안전은 교육자 및 학습자 모두가 실제로 '실현'해야 할 목표로서 그라운드룰에 명시적으로 명명된다. [의사-환자 커뮤니케이션 영역]에서 심리적 안전은 더 큰 환자 참여와 의사와 환자 간의 자유로운 정보 흐름을 촉진하여 보다 정확한 평가, 의사 결정, 불확실성 해결, 계획 구현 및 임상 결과 개선을 가져온다.

The effect of psychological safety on learning and performance has been demonstrated in other areas of health care.35-38 In simulation-based education, the importance of psychological safety is particularly emphasised; it is explicitly labelled as a goal at the outset and both educators and learners commit to ground rules that ‘realise it’ in practice.39-41 In the area of doctor-patient communication, psychological safety promotes greater patient involvement and free flow of information between doctor and patient, which results in more accurate assessments, shared decision making, resolution of uncertainties, implementation of plans and improved clinical outcomes.42

이를 [피드백 상호작용]에 적용하면 심리적 안전이 학습자의 참여를 장려하거나 억제하는 핵심 중재자일 수 있습니다. 학습자가 생산적인 학습 행동을 사용할 경우 이전에 감지되지 않은 한계를 드러내고 교육자의 부정적인 반응을 유발할 수 있습니다. 예를 들어, 비하 발언, 낮은 점수 또는 '가장 선호하는 소수' 그룹에서 제외됩니다. 교육자가 (총괄 평가 또는 전문가 참고문헌에 대한 책임과 같이 학습자의 진급여부를 좌우할 능력을 가진) 시니어 전문직일 경우 잠재적 위협은 증폭된다. 특히 의학은 [강력한 위계질서]를 가지고 있다. 따라서 학습자는 조용히 있거나 최소한 노출을 규제하여 위험을 통제하기로 결정할 수 있다. 피드백 대화 중에 무엇을 자원해야 할지 고민하는 모든 학습자의 핵심 질문은 ['내가 존중, 수용, 도움을 받을 가능성이 얼마나 되느냐, 아니면 그 반대로 내가 굴욕, 질책, 미숙하다고 평가될 가능성이 있느냐?']이다. 
Applying this to feedback interactions, it may be that psychological safety is a key mediator encouraging or deterring learners’ participation. When learners use productive learning behaviours, they may reveal previously undetected limitations and trigger adverse responses from the educator, for example, a disparaging remark, lower grading or exclusion from a group of the ‘favoured few.’29, 34, 43 Potential threats are amplified when educators are senior health professionals with power over learners’ progress, such as having responsibilities for summative assessments or professional references.44, 45 Medicine, in particular, has a powerful hierarchy.46, 47 Hence, a learner may decide to keep quiet, or, at least, to control the risk by regulating their exposure. The key question for any learner contemplating what to volunteer during a feedback conversation is: ‘What is the likelihood that I will be respected, accepted and assisted or the opposite, that I will be humiliated, reprimanded or judged as inept?’29, 39, 46, 47

교육자들이 학습자들과 협력하여 심리적인 안전을 극대화할 수 있다면 피드백 대화가 바뀔 수 있습니다. 학습자는 자신의 성과를 정직하게 반성하고, 자신의 추론을 설명하고, 어려움을 드러내고, 질문을 하고, 개선을 위한 자신의 아이디어를 제안하거나 교육자의 의견에 이의를 제기할 수 있습니다. 이러한 학습자의 기여가 가치 있는 교육자의 입력과 상호 작용한다면, 그에 따른 지식의 공동 구성은 학습 성과를 실질적으로 향상시킬 수 있다. 이러한 심리적 안전의 구조는 다른 맥락에서 연구의 초점이 되어 왔지만, 직장 피드백 논의에서 심리적 안전의 표현은 과소 검토되었다. 따라서 우리의 연구 질문은 다음과 같다. 직장 피드백에서 심리적 안전은 어떤 모습이며, 교육자들은 이를 촉진하기 위해 학습자들과 어떻게 협력할 수 있는가? 피드백에 대한 우리의 정의와 이 연구의 [이론적 위치]는 지식 생성에서 사회적 과정의 상호 의존성을 인정하는 [사회적 구성주의] 안에 있다. 

If educators could work with learners to maximise psychological safety, feedback conversations might be transformed. Learners might honestly reflect on their performance, explain their reasoning, reveal their difficulties, ask questions, propose their own ideas for improvement or contest educators’ comments. If these learner contributions interacted with valuable educator inputs, the resulting co-construction of knowledge could substantially enhance learning outcomes. Though this construct of psychological safety has been the focus of research in other contexts, the manifestation of psychological safety in workplace feedback discussions has been under-examined. Hence, our research question was: What does psychological safety look like in workplace feedback and how can educators work with learners to foster it? Our definition of feedback, and the theoretical positioning of this research, sits within social constructivism with acknowledgement of the interdependence of social processes in knowledge generation.48

2 방법
2 METHODS

2.1 피드백 에피소드 동영상 모음
2.1 Collection of videos of feedback episodes

피드백 관행을 조사하는 광범위한 연구 프로그램의 일환으로, 우리는 일상적인 임상 실무에서 공식적인 대면 피드백 에피소드를 직접 녹화한 비디오를 수집했다. 참여자들은 호주의 주요 병원 네트워크 내에서 함께 일하고 있는 건강 전문 교육자-학습자 쌍이 참여했습니다.19 모집 기간 동안 건강 직업과 전문성, 성별, 감독 경험(교육자), 훈련 레벨(레벨)을 포함한 주요 요소를 고려하기 위하여 잠재적 참가자들에게 롤링 광고를 함으로써 다양성을 추구했습니다. 모든 참가자들은 서면 정보에 입각한 동의를 했다. 본 연구의 윤리 승인은 보건 서비스 및 대학 연구 윤리 위원회로부터 받았습니다(윤리 승인 참조).

As part of a broader programme of research investigating feedback practices, we collected self-recorded videos of formal face to face feedback episodes in routine clinical practice. Participants involved health professional educator-learner pairs who were working together, within a major Australian hospital network.19 During recruitment, diversity was sought by rolling advertising to potential participants, with consideration of key factors including health profession and specialty, gender and supervisor experience (educators) or training level (learners). All participants gave written informed consent. Ethics approval for this study was obtained from the health service and university human research ethics committees (see Ethical Approval).

비디오는 전문적으로 문자 그대로 옮겨졌고 한 연구원은 녹취록(CEJ)을 읽을 때 비디오를 보면서 정확성을 확인했다. 동영상을 볼 때 초기 인상과 관찰 내용을 메모로 기록하고 [피드백 품질 도구(FQI)]를 이용해 교육자의 실습을 분석했다. FQI는 사회적 구성주의 패러다임에 맞춰 교육자들이 고품질의 학습자 중심의 피드백을 촉진하도록 설계되었다. FQI 항목은 학습자의 참여, 동기 부여 및 개선을 가능하게 하는 것으로 간주되는 관찰 가능한 교육자의 행동을 설명한다. 항목은 교육자가 유익한 학습자 결과를 촉진할 수 있는 입증된 방법을 식별하기 위해 광범위한 문헌 검토를 포함하는 프로세스와 전문가 패널과 함께 델파이 프로세스를 통해 개발되었다. FQI의 추가 테스트 및 정제 동안, 심리적 안전에 대한 문헌의 격차가 (서론에서 설명한 바와 같이) 명백해졌고, 이것이 본 연구의 영감이 되었다. 우리는 피드백 상호작용을 조정할 수 있는 능력 때문에 교육자의 역할에 초점을 맞추기로 선택했습니다.

Videos were professionally transcribed verbatim and one researcher checked accuracy by watching the videos when reading transcripts (CEJ). When viewing videos, initial impressions and observations were recorded as memos, and educators’ practice was analysed using the feedback quality instrument (FQI). The FQI is designed to assist educators in facilitating high quality, learner-centred feedback, aligning with a social constructivist paradigm. The FQI items describe observable educator behaviours considered to engage, motivate and enable a learner to improve. Items were developed through a process involving an extensive literature review to identify information that substantiated ways educators could promote beneficial learner outcomes and a Delphi process with a panel of experts.19, 49 During further testing and refining of the FQI, the gap in the literature on psychological safety became apparent (as described in the Introduction), which was the inspiration for this study. We chose to focus on the educator's role because of their power to steer feedback interactions.

2.2 본 연구의 데이터 수집 및 분석
2.2 Data collection and analysis for this study

본 연구에서는 [심리적 안전의 징후]와 관련 교육자 접근 방법을 찾아봤는데, 이는 솔직한 학습자 기여가 가능한 조건을 달성하는 데 도움이 되는 것으로 보였다. 우리는 학습자의 '배움을 위한 위험'에 대한 성향이 학습자의 심리적 안전성을 나타내는 지표라고 판단했습니다. 따라서, 우리는 피드백 세션 동안 학습자가 생산적인 학습 행동을 반복적으로 수행하는 경우, 특히 학습자가 학습 요구에 대해 점진적으로 더 솔직해지는 경우를 조사했다. 이러한 학습 행동의 예로는 다음이 포함되었다.

  • 정보 공유,
  • 어려움 설명,
  • 자신의 표준 이하의 성과 확인,
  • 학습 요구 사항 명명,
  • 도움 요청,
  • 질문 또는 해결책 제안

In this study, we looked for signs of psychological safety and associated educator approaches, which seemed to help achieve the conditions that enabled candid learner contributions. We reasoned that learners’ propensity to be forthcoming and participate in ‘risks for the sake of learning’ were indicators of learner psychological safety. Hence, we searched for occasions during the feedback sessions when learners repeatedly undertook productive learning behaviours, particularly when learners became progressively more candid about their learning needs. Examples of these learning behaviours included

  • sharing information,
  • describing a difficulty,
  • identifying their own substandard performance,
  • naming a learning need,
  • asking for help,
  • asking a question or proposing a solution.34 

그런 다음 우리는 이러한 형태의 참여를 촉진하는 것으로 보이는 교육자의 행동을 찾아보았다. 또한 임상 및 시뮬레이션 기반 대화에서 심리적 안전을 증진하기 위해 이전에 제안된 교육자 행동을 살펴보았다. 
We then looked for corresponding educator behaviours that seemed to promote this form of engagement. We also looked for educator behaviours previously proposed to promote psychological safety in clinical and simulation-based conversations.34, 39, 40, 50

녹취록은 심리적 안전에 초점을 맞춘 연구 질문에 의해 유도적으로 코딩되었고, 사회 구성주의의 이론적 프레임워크에 의해 민감해졌다.51 FQI를 사용하여 가장 높게 평가된 총 10개의 비디오 사본(많은 수의 양질의 교육자 행동을 반영함)은 심리적으로 안전한 환경을 포함할 가능성이 가장 높아 보였기 때문에 코딩 프레임워크를 개발하기 위해 사용되었다. 먼저 각 연구자(CEJ, JLK, EKM)에 의해 4개의 사본이 독립적으로 코드화된 후 연구자들이 만나 초기 코드 세트를 논의하고 만들었다. 이후 추가로 6개의 녹취록이 독립적으로 부호화 된 후 쌍으로 논의되었다(CEJ와 EKM에 의해 3개). 
3 by CEJ and JLK), 초기 코딩 프레임워크를 사용하고 수정한다. 추가 팀 논의는 운영 정의와 유사한 속성을 가진 코드가 함께 그룹화된 최종 코딩 프레임워크에 대한 합의를 이끌어냈다. 학습자가 심리적으로 안전하다고 느낄 때와 그렇지 않을 때를 나타내는 표지를 포함하고 해당 교육자의 행동에 주목했다.

Transcripts were inductively coded according to principles of thematic analysis, guided by our research question focusing on psychological safety and sensitised by our theoretical framework of social constructivism.51 A total of 10 transcripts of videos rated most highly using the FQI (reflecting a greater number of quality educator behaviours observed) were used to develop a coding framework, as these seemed most likely to involve a psychologically safe environment. First, four transcripts were open coded independently by each researcher (CEJ, JLK and EKM), then researchers met to discuss and create an initial set of codes. Following this, a further six transcripts were coded independently then discussed in pairs (three by CEJ and EKM; three by CEJ and JLK), using and modifying the initial coding framework. Further team discussions led to consensus on a final coding framework with operational definitions and codes with similar properties grouped together. It included markers suggesting when learners felt psychologically safe and when they did not, noting corresponding educator behaviours.

수석 연구원(CEJ)은 각 비디오를 다시 보고 NVivo 버전 12.5.0(NVivo QRS International Pty Ltd, Vic, Australia)을 활용한 분석 프레임워크를 사용하여 모든 대본을 다시 인코딩했습니다. 설명적인 인용구가 있는 코드의 해석과 주제로의 동화는 세 번의 별도 연구팀 회의에서 이루어졌으며, 최종 핵심 주제는 합의에 의해 합의되었다. 각 회의에서, 연구자들 사이의 일관성과 코딩의 차이를 식별하기 위해 지속적인 비교 과정을 이용했다.52 녹취록과 코드화된 데이터를 반복적으로 검토함으로써 테마가 데이터에 기초할 가능성이 높아졌다.
The lead researcher (CEJ) then rewatched each video and recoded all transcripts using the analytical framework utilising NVivo Version 12.5.0 (NVivo QRS International Pty Ltd, Vic, Australia). Interpretation and assimilation of codes, with descriptive quotes, into themes occurred at three separate research team meetings, with the final key themes agreed by consensus. In each meeting, a constant comparison process was utilised to identify consistencies and differences in coding between researchers.52 Repeated examination of the transcripts and coded data increased the likelihood that themes were grounded in the data.

 

2.3 이론적 골조
2.3 Theoretical framing


[사회적 구성주의]는 생산적인 피드백 상호작용에 대한 우리의 해석을 뒷받침하는 이론적 프레임워크입니다. 사회적 구성주의에 따르면 지식은 사람들이 상호작용하는 과정, 특히 토론을 통해 만들어진다. 따라서 학습은 구체적이고, 본질적으로 관련된 맥락 및 사람들과 연결되어 있다. 효과적인 피드백은 학습자가 원하는 변화를 이행하는 데 달려 있기 때문에 학습자가 토론에 적극적으로 참여하고 이해하는 것이 중요합니다. 따라서 [심리적 안전 확립을 돕기 위한 교육자의 접근 방식]에 초점을 맞췄지만, 보다 면밀하게 검토하고자 하는 피드백 상호 작용 동안 [학습자의 행동]을 표지판에 표시했다. 관찰 방법을 이용한 심리적 안전 분석에서 개인이 '보유'하거나 '경험'하는 현상을 해석할 때의 위험성을 인지했다. 그러나 [학습자의 위험 감수] 및 [지식 공동 구성의 증거]를 심리적 안전에 의해 활성화(또는 제한)된 상호 작용의 지표로 보았다.

Social constructivism is the theoretical framework underpinning our interpretation of productive feedback interactions. According to social constructivism, knowledge is created during the process of people interacting, particularly through discussion; hence, the learning is specific and intrinsically linked to the context and people involved.53 As effective feedback depends on a learner implementing desired changes, it is crucial for the learner to play an active role in understanding and contributing to the discussion. Hence, although we focused on educators’ approaches to helping establish psychological safety, we used learners’ behaviours to signpost periods during the feedback interaction that we wanted to examine more closely. In our analysis of psychological safety using observational methods, we were aware of the risks of interpreting a phenomenon that is ‘held’ or ‘experienced’ by individuals. However, we viewed evidence of learner risk-taking and co-construction of knowledge as markers of an interaction that was enabled (or limited) by psychological safety.

2.4 반사율
2.4 Reflexivity

데이터 해석에 대한 연구자 자신의 관점, 신념 및 경험의 영향인 반사율은 명시적으로 인식되고 논의되었다. CEJ는 피드백에 특별한 관심을 가진 의사, 의료 교육자 및 연구자로 본 연구에 관련된 의료 서비스에서 일하고 있습니다. JLK와 EKM은 모두 의료 전문 교육자 및 연구자로서 피드백 및 직장 기반 평가 분야에서 광범위한 전문 지식을 보유한 물리치료사입니다. 그들의 고용은 대학에 기반을 두고 있으며 본 연구에서 보건 서비스와 연계되어 있지 않다.
Reflexivity, the influence of the researchers’ own perspectives, beliefs and experiences on the interpretation of the data, was explicitly recognised and discussed. CEJ is a physician, medical educator, and researcher with a special interest in feedback, who works at the health service involved in this study. JLK and EKM are both physiotherapists with extensive expertise as health professions educators and researchers in feedback and workplace-based assessment. Their employment is university-based and not linked with the health service in this study.

3 결과
3 RESULTS

총 36편의 피드백 세션 영상이 수집되었다. 참여 대상은 교육자 34명(전문 9개 분야 의료 26명, 간호 4명, 감독 경험 범위 물리치료 전문가 4명)으로 남성이 16명(47.1%)이었고 학습자(경력 범위 학생 및 임상의) 35명(34.3%)으로 남성이 12명(34.3%)이었다. 피드백은 25개(69.4%) 동영상의 특정 작업 및 11개(30.6%) 동영상의 첨부 파일 중간/종료 평가와 관련이 있었다. 이러한 피드백 사례의 대부분은 본질적으로 형성적이었지만, 일부는 종적 평가에 대한 총괄적 평가로 작용했다.

A total of 36 videos of feedback sessions were collected. Participants included: 34 educators (26 medical across nine specialties, four nursing and four physiotherapy professionals with a range of supervisory experience) where 16 (47.1%) were male, and 35 learners (students and clinicians with a range of experience) where 12 (34.3%) were male. Feedback was related to a specific task in 25 (69.4%) videos and a mid/end-of-attachment appraisal in 11 (30.6%) videos. Most of these feedback occasions were formative in nature but some served as summative contributions to longitudinal evaluations.


교육자들은 심리적 안전을 증진시키기 위해 다양한 접근법을 사용했다. 여기에는 교육자들이 솔직한 피드백 상호작용을 위한 상황을 마련하고, 학습자와 함께 협력자로 자리매김하며, 지속적인 개선에 초점을 맞추고, 대화식 대화를 장려하는 것이 포함되었으며, 이는 학습자들에게 정직한 기여가 기대되고 가치 있게 여겨진다는 신호였습니다. 네 가지 주요 테마는 예시적인 인용구와 함께 아래에 제시되어 있습니다.

Educators used a variety of approaches to promote psychological safety. This included educators’ setting the scene for a candid feedback interaction, positioning themselves as allies alongside the learner, focusing on continuing improvement and encouraging interactive dialogue, which signalled to learners that honest contributions were expected and valued. Four key themes are presented below with illustrative quotes.

 

3.1 주제 1: 대화와 솔직함의 장 마련
3.1 Theme 1: Setting the scene for dialogue and candour

피드백 세션이 시작되자 많은 교육자들이 간단하게 세션 주제를 발표했는데, 예를 들어 '그래서 오늘 수술에 대해 이야기하겠다.'(V4)고 한 뒤 신속하게 수행평가로 넘어갔다.
When feedback sessions began, many educators simply announced the topic for the session, for example: ‘So we're going to talk about the surgery today’ (V4) and then moved swiftly onto performance evaluation.

몇몇 교육자들은 상호작용을 위해 더 많은 일을 했다. 여기서 교육자는 세션의 목적과 학습자의 input의 중요성을 강조하고 있다.
A few educators did more to set up the interaction. Here, an educator highlighted the aim of the session and the importance of learners’ input:

 

교육자: 회전의 중간 단계이므로 기초를 잡고 현재 상황이 어떻게 진행되고 있는지 확인하고 모든 것이 정상 궤도에 오르게 할 수 있는 좋은 기회입니다. 그래서, 당신의 관점에서 볼 때, 회전이 지금까지 어떻게 진행되고 있다고 느끼시나요?
Educator: It's midway through the rotation, so it's a good opportunity to … touch base and see where things are at, see how you feel things are going, and … make sure things are on track. So, from your perspective, how do you feel the … rotation is going so far?

학습자: 저에게는 로테이션이 매우 놀라웠습니다. 정신의학은 의료 연수 기간 동안 항상 저의 취약 영역이었고, 그것이 제가 이곳에 와달라고 요청한 주요 이유 중 하나입니다. [I] 일반적으로 포괄적인 정신건강평가를 하지 않는다… 그래서 나는 그것이 꽤 어렵다는 것을 알게 되었다. 하지만 다른 한편으로는, 저는 정신 건강과 의학적 문제를 결합하는 것을 배우고 있습니다… 매우 보람을 느낍니다.
Learner: For me, the rotation has been very amazing. Psychiatry has always been my weakest area during my medical training, and that's one of the main reasons that I have requested to come here. [I] don't normally do a comprehensive psychiatric assessment … so I find that it is quite challenging. But, on the other side, I'm learning combining mental health along with the medical issues … I find that … very rewarding. (V19)

 

이 다음 예에서는 교육자가 세션 계획을 설명하여, 학습자가 무엇을 예상해야 하는지 알 수 있도록 하고 있다. 그러나 가장 뛰어난 기능은 교육자가 [자신의 의견에 이의를 제기하거나 질문을 하도록 명시적으로 초대]하여 생산적인 학습 행동을 장려했다는 것이다.
In this next example, the educator proposed their plan for the session, so the learner knew what to expect. Yet the most outstanding feature was the educator's explicit invitation for the learner to contest their comments or ask questions, thereby encouraging productive learning behaviours:

 

방금 임상 시나리오를 살펴보았습니다. 제가 말씀드리고 싶은 것은 귀하의 성과에 대해 몇 가지 측면에서 지속적으로 연구할 가치가 있는 훌륭한 기술을 수행했다는 것입니다. 향후 몇 년간 귀하의 성과를 개선하기 위해 작업할 수 있는 몇 가지 영역입니다. 언제든지 저를 중단해도 됩니다. 내가 동의하지 않거나 설명이 필요한 말을 하면 말이야. (V3)
We’ve just gone through a clinical scenario and what I’d like to do is talk about a couple of aspects of your performance where you’ve done some really good skills that are worth continuing with and identify … a couple of areas that you can work on, over the next little while, to improve your performance … feel free to stop me at any point in time if I say things that you don’t agree with or that you need clarification on. (V3)



그러나 교육자들은 다음을 통해서 퀄리티 피드백 상호작용의 장을 종합적으로 마련하지는 않았다. 

  • (학습자의 개선을 돕기 위해) 목적을 강조함
  • (수행을 분석하고 학습 계획을 개발하기 위해) 세션에 대한 계획을 제안함
  • 학습에 초점을 맞춘 대화형 대화에 대한 기대를 설정하고, 이용 가능한 시간을 명확히 함

교육자들이 이러한 구성 요소 중 일부를 포함한 상황에서조차, 아무도 [세션 구조]의 어떤 측면도 협상하기 위한 학습자의 의견을 구하지 않았습니다.

However, educators did not comprehensively set the scene for a quality feedback interaction by

  • highlighting the purpose (to help learners improve),
  • proposing a plan for the session (to analyse their performance and develop a learning plan),
  • setting expectations for an interactive dialogue focused on learning and clarifying the time available.

Even when educators did include some of these components, none sought learners’ input to negotiate any aspects of the session structure.

3.2 주제 2: 동맹으로서의 교육자
3.2 Theme 2: Educator as ally

교육자들은 일반적으로 학습자와 함께 일하면서 스스로를 동맹으로 포지셔닝합니다. 그들은 학습자 개발을 촉진하기 위해 지원과 지원을 제공했고 전력 격차를 줄이기 위해 적극적으로 노력했습니다.
Educators commonly positioned themselves as an ally, working alongside the learner. They offered support and assistance, to facilitate learner development and actively tried to reduce the power gap.

3.2.1 지원 및 지원 제공
3.2.1 Offering support and assistance

교육자들은 집단대명사 '우리'를 자주 사용해 학습자와의 연대를 제안했고, 학습자가 겪는 어려움을 공감했다.
Educators frequently used the collective pronoun ‘we,’ suggesting solidarity with the learner, and expressed empathy for the struggles that learners faced.

 

교육자: 그래서, 동맥 라인: 제가 전에 말했듯이, 그것들은 우리가 꽉 채우고, 가장 자주 실패하는 것들입니다. 그들은 어렵고, 그들은 안절부절못하고, 그리고 우리는 종종 그들을 얻기 위해 여러 시도를 합니다. 그렇게 말하면서, 여러분은 그것들을 더 잘하기 위해 무엇을 할 수 있을까요? [trade name] 키트를 사용해 보셨습니까?
Educator: So, arterial lines: like I said before, they're the things that we stuff up, that we fail at the most often … They're difficult, they're fiddly … and … often we … take multiple attempts to get [them in] … Saying that, what can you do to be better at them? Have you used the [trade name] kits?

학습자: 네, 전에도 써본 적이 있어요… 저는 그것이 환자의 혈관에 너무 클 것이라고 생각했어요. 왜냐하면 그녀는 꽤 앙증맞고, 그것들은 좀 더 뚱뚱해 보이기 때문이에요. 그리고 작은 혈관에 그것들을 넣으려고 애썼어요. 그래서 제가 처음에 그렇게 하지 않았던 것 같아요.
Learner: Yes, I have used them before … I thought … it would actually … be a bit too big for [the patient's blood] vessel because she was quite dainty, and … they seem a bit chunkier … and with smaller vessels, I've struggled to get them in. So that's why I didn't initially go for that.

교육자: 아니, 그럴 만도 한데… 디폴트가 뭐야? … [이러한 키트]의 장점은 [동맥에 들어간 후 혈액이 플래시백되는 즉시] 와이어를 삽입할 수 있다는 것입니다. 그러니 생각해 보십시오. 이 키트는 편리하지만 모두가 사용하는 것은 아닙니다. (V28)
Educator: No, fair enough … What’s your default? … The advantage of [these kits] is, as soon as you get a flashback [of blood once you’re in the artery] … you can just put the [guide] wire in … So … have a think about it … I think they're handy but obviously not everyone uses them. (V28)

교육자들이 학습자들의 향상을 돕기 위한 조언을 제공하는 것은 매우 흔한 일이었다. 종종 이것들은 유용한 연습 팁이었다 (위와 같이). 또한 일부 교육자들은 예를 들어 학습 기회를 최대한 활용하기 위한 전략을 제시함으로써 [메타인지 프로세스]를 다루었다.

It was very common for educators to offer advice to help learners improve. Often these were useful practice tips (as above). In addition, some educators addressed meta-cognitive processes, for example by suggesting strategies to make the most of learning opportunities:

 

손을 들고 '내가 가서 네가 하는 것을 봐도 될까?'라고 말하는 것을 두려워하지 마라. … 만약 너에게 필요한 배움의 기회라면… 힘들다는 것을 알아… 바쁠 때… 하지만 아마도 네가 그들을 대신해서 무언가를 해 주겠다고 제안할 수도 있을 것이다. (V36)
Don’t be afraid to put your hand up and say, ‘Can I come and watch you do that?’… if it’s … a learning opportunity that you need … I know that’s hard … when it’s busy … but it might be that you offer to do something on their behalf. (V36)

3.2.2 동력격차 감소
3.2.2 Reducing the power gap

문헌은 [의료전문직 내의 위계구조]가 자신의 한계를 드러내거나 아이디어를 경쟁할 경우 학습자의 부정적 결과에 대한 두려움을 어떻게 악화시킬 수 있는지를 설명한다. 교육자들은 겸손함을 보여주었고 권력 격차를 줄이려고 노력했습니다. 몇몇 교육자들은 실수를 했거나, 모든 것을 알지 못했거나, 아직도 배우고 있다는 것과 같은 [자신의 취약점을 드러냄]으로써 이러한 행동을 했다.


The literature describes how the hierarchy within the health professions may exacerbate a learner's fear of negative consequences if they expose their limitations or contest ideas. We found some educators demonstrated humility and tried to reduce the power gap. A few educators did this by revealing their own vulnerabilities, such as admitting they had made mistakes, did not know everything or were still learning:

 

그래서 항상 배울 것이 있고, 저는 여전히 배우고 있습니다. (V17)
So there's always things to learn, and I'm still learning (V17)

교육자들은 학습자의 의견을 존중하는 모습을 보이거나, [자신의 판단이나 조언이 논란의 여지가 없다고 생각하지 않는다] 등 적극적으로 권력을 나누었습니다. 여기에서 한 교육자는 제한된 관찰로 인해 평가가 학습자의 능력을 정확하게 반영하지 못할 수 있다는 인식을 나타냈다.

Educators actively shared power by showing respect for learners’ opinions or not assuming their own judgement or advice was indisputable. Here, an educator indicated awareness that their evaluations may not accurately reflect the learner's capability due to limited observations:

 

앞서 말씀드렸듯이 매일 여러분과 함께하지 않을 때는 '항상 시연'과 '대부분 시연'[평가 양식에서의 옵션 평가]를 구별하기가 어렵습니다. (V36)
Like I’ve said before, it's hard to differentiate between ‘always demonstrates’ and ‘mostly demonstrates’ [rating options on the assessment form] when I’m not working with you every day. (V36)

이와 유사하게, 교육자는 자신의 존재가 학습자의 성과에 어떤 영향을 미칠 수 있는지 구체적으로 탐색했습니다.
Similarly, an educator specifically explored how their presence may have affected the learner's performance:

 

교육자: 그래서 우리는 미니-CEX[미니 임상 검사] 과정을 거쳤습니다. 한 번도 안 해봤다고 하셨잖아요. 어땠어요?
Educator: So we've just gone through the mini-CEX [mini-clinical examination] process. You mentioned you haven't done one of those before. How did you find it?

학습자: 그게 좋았던 것 같았다. 누군가 그곳에 있다는 것은 다르다 … 학생으로서... 방에 누군가가 있는 경우가 많지만, 잠시 동안 일을 하고, 방에 누군가가 없으면... 처음에는 조금, 아, 위압적이지만 익숙해진다.
Learner: I thought it was good. It’s different having somebody there … As a student … you often have somebody in the room but … when you work for a while, and don’t have someone in the room … it’s a little bit, ah, daunting at first but you get used to it.

교육자: 내가 거기 서서 보고 있어서 다르게 행동한 것 같아?
Educator: Do you think you did things differently because I was standing there watching?

학습자: 평가를 받고 있었기 때문에, 평소에는 하지 않던 무언가를 놓친 것이 아닌가 하는 생각이 계속 떠올랐습니다. 메모하면서 다시 가서 환자한테 확인하곤 했어요
Learner: … because I was being assessed, it kept running through my mind whether I’d missed something, which I wouldn’t normally do. I’d do that as I was writing notes and then go back and check with the patient. (V9)

일부 교육자들은 아이디어를 제시할 때 '당신이 해야 한다', '당신이 해야 한다'가 아닌 ['제안한다', '추천하겠다' 등의 문구를 사용]하고 그 이유를 설명했다. 교육자들은 또한 학습자들의 평가나 추천에 대한 생각을 점검했습니다.
Some educators used phrases such as ‘I suggest’ or ‘I would recommend’ when they offered ideas, rather than ‘you need to’ or ‘you must,’ and explained their reasoning. Educators also checked learners’ thoughts about their judgements or recommendations:

 

교육자: 컨설턴트 병동 회진을 할 때 환자에게 일어난 일을 제시하는 방식이 마음에 드지만, 보다 많은 관리 계획도 필요합니다. 이러한 결정을 내리고 환자의 소유권을 가져가는 것... 여러분이 작업할 수 있는 몇 가지 사항만 있으면 훨씬 더 나아질 수 있습니다.

Educator: When we're doing consultant ward rounds, I like the way you present what's happened to the patient [and] the issues but I'd like more of a management plan as well … Making sure that you're making those decisions and … taking ownership of the patient … Just a few things that you can work on and become even better.

교육자: 공평하게 들리나요?
Educator: Does that sound fair?

학습자: 네, 잘됐네요… 제 생각에 당신이 등록관일 때는 '모든 환자를 고치러 온 컨설턴트구나' 하는 느낌이 들어요… 항상 제가 그동안 어떻게 지냈는지... 그저 그 문제들을 발표하려고요.
Learner: Yeah, that's good … I suppose, when you're a reg [registrar], I feel like, ‘Oh, [the consultant’s] here to fix all the patients’ … It's always … how I have been … just to present the issues.

교육자: 하지만 당신이 나설 수 있다고 생각해요 … 당신이 확실히 확신하지 못하는 것이 있다면, 당신은 말할 수 있어요, '음, 저는 잘 모르지만, 저는 이것이 제가 가야 할 길이라고 생각해요.' 그래서 당신이 100% 확신하지 않더라도, 당신은 무언가를 제안할 수 있습니다. 제 말은, 컨설턴트가 되면, 모든 정답을 알 수는 없겠지만, 그것은 모두 [합리적인] 결정을 내리는 것에 관한 것입니다.
Educator: But I think you … can step up … If there's anything that you're not quite sure about, you can say, ‘Hm, I'm not quite sure, but I think this is the way that I would go.’ … So even if you're not 100% sure, you suggest something. I mean, when you become a consultant, … you may not know all the right answers but it's all about making a [reasonable] decision.

학습자: 그래, 좋아, 좋아. 내가 해볼게
Learner: Yeah, all right, sounds good. I'll work on that. (V1)

 



요약하자면, 많은 교육자들이 [학습자들과 친구가 되고자 하는 그들의 바람을 전달]하기 위해 전략을 사용했습니다. 교육자들의 도움이 되고, 배려하고, 겸손하고, 공손한 반응은 신뢰를 쌓는 것처럼 보였다. 이는 [학습자가 자신의 관점을 더 많이 드러냄]으로써 이러한 안전 신호에 자주 응답하는 것으로 입증되었습니다. 학습자는 피드백 세션 내에서 교육자의 신호를 모니터링했으며, 이는 이후에 자신이 무엇을 기여하기로 선택했는지에 영향을 미치는 것으로 나타났습니다.

In summary, many educators used strategies to convey their desire to be allies with learners. Educators’ helpful, caring, humble and respectful responses (and the absence of punitive ones) seemed to build trust. This was evidenced by learners frequently responding to these safety signals by revealing more of their perspective, as demonstrated in the passages above. Learners were monitoring educator cues within the feedback session, which appeared to influence what they chose to contribute subsequently.

3.3 주제 3: 지속적인 개선 방향
3.3 Theme 3: A continuing improvement orientation

우리는 교육자들이 학습자의 미숙함, 실수, 기술 격차를 다룰 때 심리적으로 안전한 환경을 만들기 위해 시도하는 방법을 관찰했다. 이 접근법은 [지속적인 개선에 초점]을 맞춘 것이 특징이다.
We observed ways educators attempted to create a psychologically safe environment when dealing with learner's inexperience, mistakes and skill gaps. This approach was characterised by a focus on continuous improvement.

3.3.1 배울 때 공백과 실수는 언제나 생기는 것이므로 괜찮습니다.
3.3.1 It's okay, gaps and mistakes are expected when learning


일부 교육자들은 스킬 개발 과정에서 스킬 공백이나 오류가 발생할 것으로 예상된다고 표현했습니다.
Some educators expressed that skill gaps or errors were expected during skill development:

 

실수를 하고 비틀거리는 것은 괜찮다. 왜냐하면 너는 학생이고 중요한 것은 배우는 것이기 때문이다. (V10)
It's okay to make mistakes, and stumble, … because … you're a student and the point is to learn. (V10)

일반적인 전략은 교육자가 스킬을 배울 때 학습자의 [실수를 일반적이라고 말하거나 같은 실수를 인정함으로써 정상화]하는 것이었다. 여기서 외과의사는 몇 가지 기술적 조언을 한다.

A common strategy was for educators to normalise a learner's mistake, by saying it was common or admitting they had made the same mistake when learning the skill. Here a surgeon gives some technical advice:

바로 아래로 내려가야 하는데, 그것은 흔한 실수입니다. 처음 시작할 때 했는데 다들 그러더라고요. (V24)
You need to go … directly down, rather than into it, which is a common mistake. I did it when I first started and everyone does it. (V24)

교육자들은 수행 평가에서 학습자의 경험이나 훈련 수준을 자주 언급했습니다. 교육자들은 이에 따라 기대치를 조정하고, 초보 기술을 익히고, 학습 과정 초기에 부족한 점을 수용했음을 시사합니다.
Educators often mentioned the learner's experience or training level during performance evaluations. This suggested that educators aligned their expectations accordingly, commending fledgling skills and accepting deficiencies early in the learning journey:

 

당신이 들어왔을 때, 당신의 신경 평가 능력은 특별히 강하지 않았어요. 그러나 우리는 당신이 아직 [대학]에서 실제로 그것을 다루지 않았다는 사실을 고려할 필요가 있습니다.(V10)

When you came in, your neuro assessment skills … weren't particularly strong. But … we need to take into account the fact that you haven't actually covered that at [university] yet. (V10)

 

 

때때로 교육자는 학습자와 협력하여 [지나치게 높은 학습자의 기대치를 낮추기]도 합니다.
At times educators worked with learners to reduce excessively high learner expectations:

 

학습자: … 가끔은 너무 바빠집니다… 퇴원, 입원, 모든 것을 제때 관리하는 방법을 배우고 싶습니다… 간호사들은 때때로 정말 바빠지고 그들은 정말 정말 잘 해냅니다…
Learner: … sometimes it gets too busy … one discharge, one admission … [I would like] to learn how to manage all the things on time … The nurses … sometimes get really, really busy and they manage really, really well …


교육자: 2주 동안 왔다가 다시 떠나게 됩니다. 너무 스트레스를 많이 받지 마세요. 왜냐하면 병동에서 시간을 충분히 보내지 못하기 때문입니다. (V10)
Educator: … You guys come in for two weeks and then you're gone again … don't stress too much … because you just don't spend enough time in the ward to have really good time management. (V10)

 

3.3.2 교육자는 학습 전략에 집중할 것
3.3.2 Educator focuses on learning strategies

일부 교육자들은 학습자의 노력, 전략 및 진보를 칭찬하여 성과를 검증하는 것보다 [지속적인 개발]을 장려했습니다.
Some educators commended learners’ effort, strategies and progress thereby privileging ongoing development over validating performance:

 

교육자: 당신의 비판적 사고는 정말 좋은 것 같아요… 당신이 시작한 곳부터 현재 있는 곳까지, 멈춰서 생각하는 능력은, '좋아, 내가 하는 거야. 그래서 하는 거야.' 정말 좋은 거야… 그곳에 도달하기 위해 어떤 전략을 세우고 있니?
Educator: I think your critical thinking is really good … From where you started to where you are at now, that ability to stop and think, ‘Okay, I’m doing this; this is why I’m doing it,’ is really good … What sort of strategies have you put in place to get there … ?

제 생각엔 제가 익숙하지 않은 것 같아요. 누군가에게 가거나 집으로 돌아가거나 반성하고 공부일지를 정리하기 위해서요.
I think [after an experience] … which I’m not familiar with, going to someone or going back home and … reflecting and then going to … our study day notes, just to scrub up on things.

교육자: 여러분은 일하면서 분명히 볼 수 있습니다. 집에 가서 이것저것 찾아보고... 여러분은 매우 예리한 학습자이고, 이는 연습에 분명히 도움이 됩니다. (V36)
Educator: You can … definitely see that in your work; that you've gone home, looked things up … You're a very keen learner, which has obviously helped in your practice. (V36)




요약하자면, 일부 교육자들은 학생이 자신의 스킬을 발전시킬 수 있는 방법에 초점을 맞췄다. 이들은 학습자의 경험을 고려하여 해설을 제공했는데, 이는 [격차와 실수가 학습 과정의 필수적인 부분임]을 시사하며, 지속적인 개발에 도움이 될 수 있는 학습 전략을 최적화하는 데 집중했습니다.

In summary, some educators focused on how learners could progressively develop their skills. They took account of learners’ experience, provided commentary, which implied that gaps and errors were an integral part of the learning process and concentrated on optimising learning strategies that could assist with ongoing development.

 

3.4 주제 4: 대화형 대화 장려
3.4 Theme 4: Encouraging interactive dialogue

우리는 [두 가지 관점이 모두 목소리를 내고, 상대방의 의견과 관련이 있는 반응을 보이는 대화형 대화]가 맞춤형 개선 전략의 공동구성의 기초를 형성한다는 것을 발견했다. 이것은 각자 한번씩 이야기하는 것 이상이다; 새로운 정보가 고려될 때 교육자와 학습자 모두가 그들의 관점을 수정한다는 증거가 있었다.
We found that interactive dialogue, when both perspectives were voiced and responses were related to the other's comments, formed the basis for co-construction of tailored improvement strategies. This went beyond turn-taking; there was evidence of both educators and learners modifying their views, as new information was considered.

3.4.1 정보의 공유
3.4.1 Sharing information

먼저 정보가 어떻게 공유되는지 살펴보면서 각 당사자가 상대방의 관점을 듣고 배려할 수 있는 기회를 제공했습니다. 우리는 교육자들이 일상적으로 그들의 생각과 의견을 표현한다는 것을 발견했습니다. 이와는 대조적으로, 학습자들은 일반적으로 교육자들이 질문을 할 때만 말했고, 심지어 그들의 초기 대답은 짧고 피상적인 경향이 있었다.

First, we looked at how information was shared, offering the opportunity for each party to hear and consider the other's perspective. We found that educators routinely expressed their thoughts and opinions. In contrast, learners typically only spoke when educators asked them questions and even then, their initial answers tended to be brief and superficial.

 

교육자: 먼저 어떻게 지냈는지부터 말해보는 게 어때?
Educator: Why don't you start off by telling me how you went?

학습자: 나는 괜찮다고 생각했다… 크게 잘못된 것은 없었다. (V11)
Learner: I thought it was okay … nothing went terribly wrong. (V11)




몇몇 교육자들은 학습자의 관점을 더 철저히 탐구함으로써 더 큰 이해를 얻기 위해 추가적인 노력을 기울였습니다. 다음 발췌문은 학습자가 딸과 함께 응급실에 있는 노인에 대한 평가에 관한 것이다.

A few educators made additional efforts to gain a greater understanding of the learner's perspective by exploring it more thoroughly. The following excerpt concerned a learner's assessment of an elderly man, accompanied by his daughter, in the emergency department:

 

교육자: 만약 당신이 다시 당신의 시간을 가졌다면, 당신은 다르게 했을 것이 있나요?
Educator: If you had your time again, is there anything that you would have done differently?

학습자: 음… 내가 생각할 수 있는 것은… (오래 멈춤, 교육자에 의해 중단되지 않음)
Learner: Uhm … not that I can think of … [long pause, uninterrupted by the educator].

내 생각에, 아마도, 환자 스스로에 대해 몇 가지만 더 명확히 해 줄 수 있을 것 같아… 나는 딸에게 꽤 많은 이야기를 했어.
I think uugh … maybe, just clarify a few more things with the patient themselves … I spoke quite a lot to the daughter.

교육자: 음, 음.
Educator: Mhm, mhm.

학습자: 나는 환자로부터 약간의 정보를 얻었지만, 그는 어쨌든 과거를 위해 그의 딸을 언급하는 것 같았고, 그래서 나는 조금 더 많은 정보를 얻기 위해 그녀에게 의지했다.
Learner: I got a little bit of information out of the patient, but he … seemed to be referring to his daughter, anyway, for the history, which is why I turned to … her for a bit more information.

교육자: 네.
Educator: Yes.

학습자: 음, 그래서 아마도.. 환자부터 좀 더 시작하고, 그 다음에 딸에게 더 자세한 정보를 확인하려고요.
Learner: Uhm, so maybe … starting off with the patient a bit more … and then just checking in with the … daughter for further information.

교육자: 음.
Educator: Mm.

학습자: 네. [학습자는 그녀가 말을 끝냈다고 말한다.]]
Learner: Yeah. [Learner indicates she has finished talking.]

교육자: 병실에 더 많은 것을 알고 있는 가족이 있을 때는 항상 어렵습니다. 그들은 계속 끼어들기를 원하지만 여러분은 환자와 관계를 구축하려고 합니다. (V9)
Educator: It's always difficult when there's family in the room that know more; they keep wanting to interject but you're trying to build a relationship with the patient [first]. (V9)

 

여기서 교육자는 개방형 질문을 사용하고 [집중 경청]을 시연했습니다. 이러한 기술에는 다음이 포함된다.

  • 학습자가 잠시 멈췄을 때 침묵을 지키고 생각을 한 다음 대화를 계속할 수 있도록 하는 것, 
  • 격려하는 것('듣고 있다, 계속한다', '예'와 같은 소리), 
  • 요약 및 반향하기

학습자는 초기 변형이 있은 후, 사건을 반성하고 어려움을 드러내며 잠재적인 해결책(모든 가치 있는 학습 행동)을 제안합니다. 교육자의 발언은 비판이 아닌 [공감과 지지]라는 점이 특징으로써 심리적 안전을 도모했다.
Here, the educator used open-ended questions and demonstrated attentive listening. These skills include

  • remaining silent when the learner paused, to allow them to think and then continue talking;
  • encouraging (sounds that convey, ‘I’m listening, go on’ such as ‘hmm’ or ‘yes’);
  • summarising and echoing.

After an initial deflection, the learner reflected on events, revealed their difficulties and proposed a potential solution (all valuable learning behaviours). The educator's comments were characterised by empathy and assistance, not criticism, thereby promoting psychological safety.

특히, 학습자는 일반적으로 다음과 같은 특정한 질문을 받았을 때만 어려움을 드러냈습니다.
In particular, learners typically only revealed difficulties when they were specifically asked about them:



교육자: 병동에서 당신이 힘들어하는 것들은 무엇인가요?
Educator: What are some of the things that you're finding difficult … on the ward?

학습자: 저는 아직도 참을성이 많아서... 아직 그 위에 오르지 못한 것 같아요... 아직도 하고 싶은 일들이 있어요... 시간이 없어서요. (V1)
Learner: I still feel like, with the patient load, … that I haven't really … gotten on top of that yet … There's still things … that I'd like to do that I just haven't got the time to do. (V1)

 
그 대신에, 일부 교육자들은 특정한 상황에 대해서 학습자들에게 의견을 요청했습니다. 다음의 응급 부서 상호 작용에서 볼 수 있습니다.

Alternatively, some educators cited a specific instance and then asked learners for their comments. This example comes later in the emergency department interaction:

 

교육자: 방에 들어가면 딸에게 자신을 소개하는 방법에 대해 말해보세요.
Educator: When you entered the room, tell me about the way that you introduced yourself … to the daughter.

학습자: [내가] 실수를 했어 - 방에 있는 건 알았지만, 아니었어 - 처음에 누구냐고 물었어야 했는데 (V9)
Learner: [I] made the mistake of - I knew she was in the room, but I didn't - I should have initially … asked who she was (V9)

 

3.4.2 상대방의 의견에 대한 대응
3.4.2 Responding to the other's comments

다음으로, 우리는 참가자들이 [커뮤니케이션 루프를 완성하기 위하여 상대방의 의견에 어떻게 반응하는지] 탐색하였다. 여기서 한 학생이 편집증을 보이는 환자에 대한 평가에 대해 논의하고 있었다.

Next, we explored how participants responded to the other's comments, to complete communication loops. Here, a student was discussing their assessment of a patient presenting with paranoia:

 

교육자: 그 외에 더 개선할 수 있었던 것은 무엇이라고 생각하시나요?
Educator: What else do you think you could have improved on?

학습자: 아마도 그녀가 약간 화가 나거나, 아니면 완전히 문을 닫거나… 나는 그녀가 그 주제에 대해 ...그냥 모든 것을 멈추고 자동으로 '나중에 다시 얘기하자' 혹은 그냥 넘어갈 수 있을까?
Learner: Probably handling her getting a little bit upset or … completely shutting down … I had a feeling she might, regarding that topic … Do you automatically just stop everything and go, ‘Okay we’ll come back to it later,’ or can you get past that?



교육자: 그것은 여러분이 정말로 알고 싶어하는 중요한 정보입니다. 이제 여러분은 분명히 그것을 확대시키고 공격적으로 만들고 싶지 않을 것입니다. 민감한 주제인 상황에서는, 여러분은 가만히 앉아서 그들이 대화를 계속해 나갈지 지켜볼 수 있습니다.
Educator: That’s the key information that you really want to find out … Now obviously you don’t want to … make it escalate and get aggressive … In situations … where it is a touchy subject, you may sit back and, just for three or four seconds, wait and see whether they carry on with the conversation.

… 우리가 그녀의 진짜 프레젠테이션을 실제로 보기까지 시간이 좀 걸렸다는 걸 알고 있었니? 그래서 처음과 마찬가지로 10분 동안 그녀는 그 상황을 꽤 잘 맞춰나갔고, 그리고 나서 시작했다. 그녀는 화를 내고, 대화를 끝내고 싶어졌다.
… Did you realise how it took a little bit of time for us to actually see her real presentation? So, like in the first … 10 minutes, she kept it together pretty well … then it … started - she was getting irritable, she wanted to end the conversation …

학습자: 15분이었나? 그렇게 길게 느껴지진 않았어요.
Learner: Was it 15 minutes, really? It didn't feel that long.

교육자: 응… 그래서 대화를 더 오래 지속해야 해… 조금 더 길게...
Educator: Yeah … that's why you need to … keep the conversation going for a longer period of time … Tap in a little bit more …

학습자: 그것은 말이 된다. 왜냐하면 나는 우리가 하는 위험 평가를 발견했기 때문이다… 각각의 교대조들은 … 매우 갑작스러울 수 있다… 그 5분 동안, 모든 사람들이 충분히 열려있지 않다…
Learner: That makes sense because I found the risk assessments that we do … each shift … can be … very abrupt … In those five minutes, not everyone is open enough to …

교육자: 정답입니다.
Educator: Correct.

학습자: ...나중에 [나중에] 그들이 편집증적 생각이나 망상을 가지고 있다고 들었습니다만, 제가 그들에게 말을 걸었을 때는 실제로 그런 것을 보여주지 않았습니다. (V35)
Learner: … I hear later on [that] they've got paranoid thoughts or … delusions but they never actually showed that when I was … talking to them. (V35)


눈에 띄는 점은, 학습자가 교육자에게 직접 도움을 요청했다는 것이다. 이러한 과감한 움직임은 데이터 세트 내에서 독특했습니다. 일반적으로 학습자가 어려움을 언급할 때 이것이 충분한 힌트라고 생각하고 명시적으로 도움을 요청하지 않았습니다(일부 교육자는 응답했지만 다른 교육자는 그렇지 않았습니다).
Notably, the learner directly asked the educator for help; this bold move was unique within our data set. Generally when learners mentioned a difficulty, they appeared to assume this was a sufficient hint and did not explicitly ask for assistance (some educators responded but others did not).

서로 번갈아 가면서 말을 하는 과정에서, 각 참여자가 아이디어(또는 격차)를 명확히 하고 시험하고 발전시키는 공유 정신 구축 영역에 자주 기여할 수 있도록 했다. 교육자는 학습자의 딜레마를 승인하고 해결책을 제시한 후 다시 학습자에게 집중했습니다. 전체적으로 학습자는 담화에서 중심적인 역할을 맡았으며, 교육자는 학습자의 신호를 받아 그에 따라 코멘트를 조정했다.
As the speaker's role alternated, it allowed each participant to frequently contribute to the shared mental construction zone, in which ideas (or gaps) were clarified, tested and developed. The educator endorsed the learner's dilemma, offered a solution and then focused back on the learner. Throughout, the learner had a central role in the discourse, with the educator taking their cues from the learner and tailoring comments accordingly.

그러나 이러한 대화식 대화는 흔하지 않았다. 일반적으로 교육자들은 학습자의 의견을 무시하고 자신의 의제를 추구했습니다. 그들은 일반적으로 세션이 끝날 때 '질문이 있습니까?'라고만 물었다. 학습자는 습관적으로 교육자의 의견에 대해 '그렇다'고 답했지만, 그 이상의 의견은 거의 하지 않았고 교육자의 의견에 대한 답변을 구하는 일은 거의 없었다.
However, such interactive dialogue was not common. Commonly educators ignored learners’ comments and pursued their own agenda. They typically only asked, ‘Do you have any questions?’ at the conclusion of the session. Learners habitually acknowledged educators’ comments by saying ‘yes’ but little input beyond this and rarely sought a response from educators to their comments.

특히, 견해에 대해 논쟁을 하는 경우는 거의 없었다. 우리의 자료에서 교육자의 말에 공개적으로 반대하는 학습자는 없었다. 교육자들이 다른 의견을 표현했을 때, 대부분 그들의 우려와는 달리 그들의 작업이 만족스럽다고 학습자들을 안심시켰다. 이 독특한 사례에서 소아과 전문의는 주니어 의사의 견해에 반박한다.
In particular, views were scarcely contested. In our data, no learner overtly disagreed with an educator's remarks. When educators did express a different opinion, mostly they were reassuring learners that their work was satisfactory, contrary to their concerns. In this unique example, a paediatric specialist counters a junior doctor's view:



교육자: … 이 문제를 해결하는 방법을 제안하고 싶습니다. ...당신에게는 어린 아들과 부모가 있었습니다. 그들은 그들의 의견과 사물에 대한 그들의 소망이 매우 강했습니다. ... 당신의 경영 계획에 관해서: 당신은 무엇을 하고 싶은지 알고 있었지만, 부모님들의 반응이 어떨지 확신이 없었던 것 같아요.
Educator: … I would encourage you to … [propose] how … to settle this … You had a [young] boy and … parents, who were very strong in their opinions and their wishes on things … In terms of your management plan: I think you knew what you wanted to do but you felt unsure because … of [how the parents might react].

학습자: 내가 아이를 진찰하는 순간, 그리고 엄마는 그녀의 걱정을 강하게 표현했다… 나는 즉시 '부모에게 [필요한 절차]를 제안하기 전에 상담사를 불러야 할 것 같다.' 소아과에서, 당신은 부모가 그들의 목소리를 높일 때 한 걸음 물러서는 경향이 있다. 왜냐하면 당신이 걱정하기 때문이고, 그들이 옳을지도 모르기 때문이다.사이좋게 그들은 목소리를 높일 때 옳다.

Learner: The moment I was examining the child … and the mother … strongly voiced her concerns … I immediately … went, ‘Maybe I should have a consultant here before I even suggest [the required procedure] to the parents’ … In paediatrics, you tend to take a step back when a parent raises their voice because you’re worried, maybe they are right, because occasionally they are right when they raise their voice.

교육자: … 여러분 자신의 접근법에 대한 확신을 갖는 것과 부모들의 관심에 개방적인 것 사이의 어려운 균형은, 비록 그들이 반드시 옳거나 도움이 되지는 않더라도, 우리가 항상 귀담아들어야 하는 것입니다. 그것은 단지 팀의 어린 나이에 대한 경험이 아니라, 당신의 경력을 통해 얻을 수 있는 경험입니다 … 당신은 이것이 어떻게 관리되어야 하는지에 대한 그들 자신의 생각을 가지고 있는 부모들을 가질 것입니다. 그리고 당신은 그 과정에 그들을 참여시키는 방법과 보통 그 행동의 기초가 되는 두려움에 대한 기술을 개발하기 시작합니다.환자 관리의 우선순위가 여전히 준수되고 있는지 확인하면서 …
Educator: … It’s a difficult balance, isn’t it, between having conviction in your own approach and being open to the concerns of the parents, which we always need to listen to, even if they’re not necessarily right or helpful [for the child]? That’s not just an experience of being a little junior in the team, that’s an experience you get all the way through your career … You will have parents who have their own ideas about … how this needs to be managed, and you’re beginning to develop skills on how to engage them in that process and the fear that usually underlies that behaviour, as well as making sure that the priorities for the patient’s management are still followed …

학습자: 흠, 물론이지. 또 다른 것은 - 저는 3학년 때 여러분이 과신하고 있을 때, 여러분이 아는 것이 많지 않을 때, 여러분은 방에 들어가서 '예프, 이 상황을 감당할 수 있어요'라고 생각할 때, 하지만 지나친 자신감은 더 많은 해를 초래할 수 있다는 것입니다. '무엇을 넣거나 하기 전에 항상 도움을 구하라'는 등 항상 자신감이 떨어지는 쪽에 있었던 것 같지만, 그 이후에는 역추적이 항상 도움이 되는 것은 아니기 때문이다.


Learner: Hmm, definitely. The other thing … is – I’m worried that sometimes when, as a junior you’re overconfident, given you don’t know much, you go into a room thinking, ‘Yep, I can handle this situation’ but over-confidence … can lead to more harm. Though I think I’ve always been in the under-confident side, like, ‘Always seek help before you put something in or do something,’ because after that, back tracking won’t always help you.

교육자: 아니요, 당신이 전적으로 옳고 우리는 항상 안전에 대해 인식해야 합니다 … 당신은 대부분 임상적으로 어떤 일이 일어나야 하는지 꽤 명확하게 알고 있습니다 … 약간의 자신감을 가지고 있습니다. 그리고 이것이 제가 해야 할 일이라고 생각합니다만, 저는 제 상담가와 함께 가서 그것을 명확히 할 것입니다. 왜냐하면 [당신의 자녀]가 분명히 고통 받고 있기 때문입니다.'어떤 일이 일어나야 할지에 대한 강한 생각을 가지고 있다.' (V3)


Educator: No, you’re absolutely right and we always need to be cognisant of safety … You know most of the time quite clearly what needs to happen clinically … having a bit of confidence … and saying [to the parent], ‘Look, this is what I think I need to do but I will go and clarify that with my consultant because [your child’s] obviously in distress and you’ve got some strong ideas about what needs to happen.’ (V3)

 



여기서 교육자는 학습자가 겪는 곤경을 공감하고 정상화하면서도, 부모의 견해를 가장 중요하게 여겼다. 그 교육자는 이 도전에 대한 그들의 임상적 통찰력을 공유하며 계속했다. 이러한 대응은 학습자가 관리 계획을 시작하는 데 걸림돌이 된 점을 솔직하게 밝히면서 심리적 안전을 도모하는 것으로 보였다. 이를 통해 교육자는 학습자가 고심하고 있는 특정 문제를 해결하기 위해 자신의 조언을 더 정확하게 공략할 수 있는 기회를 얻게 되었다.

The educator clearly repositioned the parents’ views as paramount, when empathising and normalising the predicament this created for the learner. The educator continued by sharing their clinical insights into this challenge. This response seemed to promote psychological safety as the learner then candidly revealed what had held them back from initiating the management plan. This gave the educator the chance to more accurately target their advice to address the specific problem the learner was grappling with.

요약하자면, [학습자가 자신의 마음가짐을 터놓고 공유]하고, [참여자가 서로의 의견에 호응]하는 쌍방향 대화 사례를 파악했다. 다른 사람들의 생각을 기반으로 대화를 쌓아나가는 '쌍방향 교류'는 이것의 proxy로서 '번갈아가면서 말하기'와 구별되었다. 그러나 이 시나리오는 흔하지 않았다. 학습자들은 초대받을 때만 말하는 경향이 있었다. 따라서 학습자의 어려움, 추론, 질문, 의견, 아이디어 등은 대부분 목소리가 나오지 않아 답변을 할 수 없었다. 그러나, 몇몇 교육자들은 탐구적인 질문과 주의 깊은 청취를 사용했다; 이것은 교육자가 학습자의 의견에 관심을 가지고 가치를 두었다는 것을 말하고 전달하도록 학습자를 초대하는 것을 지속하는 것으로 보였다. 이러한 접근은 심리적 안전 구축에 기여하고 학습자들의 솔직함을 장려하는 것으로 보였다.
In summary, we identified examples of interactive dialogue in which learners openly shared their mindset and participants responded to each other's comments. This building on the thoughts of others was distinct from ‘turn-taking’ as a proxy for ‘two-way interaction.’ However, this scenario was uncommon. Learners tended to speak only when invited. Therefore, learners’ difficulties, reasoning, questions, opinions or ideas were mostly never voiced, and hence, could not be responded to. However, a few educators used exploratory questions and attentive listening; this seemed to sustain the invitation for the learner to speak and convey that the educator was interested in and valued the learner's input. This approach appeared to contribute to building psychological safety and encouraged candour from learners.


그러나 참여자들이 다른 참여자들의 기여에 응답하지 않을 때, 대부분 의사소통 루프는 '어딘가 매달려 남겨진 것처럼' 불완전하였다. 교육자들은 학습자들의 의견에 일상적으로 반응하지 않았습니다. 이는 학습자가 한 말에 대한 교육자의 의견에 대한 학습자 마음의 불확실성을 줄여 심리적 안전을 도모하거나 지원과 도움을 줄 수 있는 기회를 놓쳤다. 게다가 교수자나 학습자 모두 토론이나 의견 차이를 꺼리는 듯 보였다. 따라서 대화 중에 토론 포인트를 더 많이 알아내거나, 명확히 하거나, 이의를 제기하거나, 수정할 수 있는 대부분의 기회는 활용되지 않았다. 그럼에도 불구하고 두 참가자가 쌍방향 토론에 참여한 몇몇 상황에서, 우리는 양측의 사고방식이 진화하여 명시적으로 공유된 이해(공통적 근거)와 맞춤형 개선전략이 공동개발되는 것을 보았다. 교육자는 학습자가 하기 위해 고군분투하는 것을 정확하게 표현하도록 격려함으로써 그들의 조언을 맞춤화할 수 있었다.

However, mostly communication loops were ‘left hanging’ incomplete, when participants did not respond to the other's contributions. Educators did not routinely respond to learners’ comments. These were lost opportunities to promote psychological safety by reducing uncertainty in the learner's mind regarding the educator's opinion on what the learner had said, or to offer support and assistance. In addition, both parties appeared reluctant to debate or disagree. Hence, most chances to find out more, clarify, challenge or modify discussion points during the conversation were not utilised. Nevertheless, on the few occasions when both participants engaged in an interactive discussion, we saw an evolution in thinking on both sides resulting in explicitly shared understandings (common ground) and co-development of tailored improvement strategies. By encouraging the learner to articulate exactly what they were struggling to do, the educator was able to customise their advice.

심리적 안전이 어떻게 보일 수 있는지와 교육자가 이를 육성하기 위해 학습자와 협력하는 방법을 보여주는 확장된 발췌문은 부록 S1의 온라인 보충 자료를 참조한다.
See online supplementary material, in Appendix S1, for an extended excerpt showcasing what psychological safety could look like and how an educator might work with a learner to foster it.

 

3.5 네 가지 테마를 모두 보여주는 피드백 상호작용
3.5 Feedback interaction illustrating all four themes


심리적 안전이 어떻게 보일 수 있는지와 교육자가 이를 육성하기 위해 학습자와 협력하는 방법을 보여주는 확장된 발췌문은 부록 S1의 온라인 보충 자료를 참조한다.

See online supplementary material, in Appendix S1, for an extended excerpt showcasing what psychological safety could look like and how an educator might work with a learner to foster it.

4 논의
4 DISCUSSION

우리는 구두 피드백 세션에서 교육자들이 어떻게 학습자들과 함께 심리적 안전을 만들었는지 설명하는 네 가지 주제로 분석을 제시했습니다.
We have presented our analysis under four themes that describe how educators worked with learners to create psychological safety in verbal feedback sessions:

  • 대화와 솔직함의 장을 마련한다.
  • 동맹으로서의 교육자;
  • 지속적인 개선 방향, 그리고
  • 쌍방향 대화를 장려합니다.
  1. setting the scene for dialogue and candour;
  2. educator as ally;
  3. a continuing improvement orientation, and
  4. encouraging interactive dialogue.


효과적인 피드백을 위해서는 '신뢰', '관계 구축', '교육 제휴'와 같은 심리적 안전의 측면이 중요하다고 주장하는 문헌에도 불구하고, 직장 피드백 대화에서 이것이 어떻게 보이는지에 대한 경험적 증거는 거의 없다. 이는 교육자들이 공식적인 언어 피드백 세션에서 심리적 안전성을 함양하기 위해 학습자들과 함께 작업하는 방법을 설명하기 위해 경험적 연구를 통해 해결하려고 시도한 격차입니다. 그러나 여기에 제시된 접근법은 규범적이지도 않고 모든 것을 다 포함한 것도 아니다.
Despite the literature advocating that aspects of psychological safety such as ‘trust,’ ‘relationship building’ and ‘educational alliance’ are crucial for effective feedback, there is little empirical evidence of what this looks like in workplace feedback conversations.22, 28, 31, 32 This is the gap we have attempted to address, using empirical research, to describe ways that educators worked with learners to foster psychological safety in formal verbal feedback sessions. However, the approaches presented here are neither prescriptive nor exhaustive.

중요한 것은 학습자에 대한 undercurrent 또는 '메타 피드백 루프'의 징후로, [교육자의 반응]이 (교육적) 대화에서 [학습자의 개방성과 학습 참여를 촉진하거나 억제한다]는 것이다. 실제로, 이는 피드백 세션을 시작할 때 대화와 솔직함을 위한 현장을 설정하는 교육자의 가치를 강조한다(다만 이 명시적 초청은 교육자가 '무엇을 하는지'에 달려 있으며, 세션 내내 지속적인 지원을 필요로 한다). 학습자들은 심리적인 안전성과 무엇을 말해야 할지에 대한 위험요인 분석에 대해 매 순간적으로 평가를 하는 것처럼 보였다. 교육자가 지원과 지지를 제공할 때(비판이 아님) 학습자가 세부 사항 설명, 의견 제시, 교육자의 추천에 대한 단점 제기 또는 대안 제시와 같은 학습 활동에 보다 솔직하게 참여하는 것을 볼 수 있었습니다. 즉, 학습자들은 [교육자의 신호를 역동적으로 읽어내면서, 전진해야 할지 후퇴해야 할지 결정]하고 있었다. 학습자가 '발끝 담그기'를 하고, 이 때 반응이 심리적 안전을 키워주게 되면, 학습자는 과감하게 한 발 더 깊이 다가갔다. 그러나 이 연구의 많은 피드백 세션에서 교육자들이 대화를 주도했으며 학습자가 초기 의견을 말할 때 이는 무시되었다. 이는 의사-환자 소통에 대한 연구를 반영하는데, 의사의 반응이 환자들이 상담 중에 얼마나 많은 양을 공개했는지에 큰 영향을 미쳤다. 의사들은 종종 환자의 초기 힌트를 무시했고, 이것은 더 이상의 정교함과 협력을 억제했다.56

Importantly, there were indications of an undercurrent or a ‘meta feedback loop’ for the learner, in which educators’ reactions promoted or inhibited learners’ openness and engagement in learning within the conversation. Indeed, this highlights the value of an educator setting the scene for dialogue and candour at the start of a feedback session (although this explicit invitation requires ongoing support throughout the session by what the educator ‘does’). Learners appeared to be making moment-by-moment assessments about psychological safety and the risk-to-benefit analysis of what to say. When educators offered support and assistance (not criticism), we saw learners progressively engage more candidly in learning activities, like explaining details, offering their opinion, broaching drawbacks in educators’ recommendations or suggesting alternatives. In other words, learners were dynamically reading cues from the educator, to determine whether they should advance or retreat. When a learner ‘dipped their toe in,’ where the response fostered psychological safety, the learner boldly took a step deeper. However, it is important to note that in many of the feedback sessions in this study, educators dominated the conversation and when a learner made an initial comment, this was ignored. This closely mirrors research into doctor-patient communication, in which doctors’ responses strongly influenced how much patients disclosed during consultations.42, 54, 55 Frequently doctors ignored patients’ initial hints, which suppressed further elaboration and cooperation.56

이러한 패턴은 교육자가 [학습자 중심의 피드백 상호작용의 가치]를 이해할 수 있도록 지원하고, [학습자와 협력하여 임상 실습에서 이 구조를 운영하는 방법에 대한 실용적인 아이디어를 제공]하는 것의 중요성을 강화한다. 교육 진행에 대한 통제는 교육자의 역할에 일반적으로 내재되어 있기 때문에, 임상 교육자는 학습자(학생과 하급 의료진 모두)에 대해 높은 수준의 구조적 힘power을 보유하고 있다. 교육자들이 보이는 초대와 반응(마찬가지로 이것의 부재)이 [생산적인 지적 위험을 감수하는 학습자 성향에 미치는 영향]을 더 잘 인식하도록 한다면, 교육자들이 그들의 관행을 바꾸도록 동기를 부여할 수 있다. [다른 사람의 의제를 도출하고 대응하는 방법에 대한 언어적 예시]가 있다면 교육자가 변화를 집행enact하고, 임상 실습에서 피드백 의식에 긍정적인 영향을 미치도록 도울 수 있다.
This pattern reinforces the importance of assisting educators to understand the value of learner-centred feedback interactions, and offering practical ideas on how they could operationalise this construct in clinical practice in collaboration with learners. Clinical educators hold a high degree of structural power over learners (both students and junior clinical staff) as control over training progression is commonly embedded in educators’ roles.18, 57 Helping educators to be more conscious of the impact of their invitations and responses (or lack thereof) on learners’ propensity to take productive intellectual risks, may motivate educators to change their practice. Having linguistic examples of how to elicit and respond to another's agenda may assist educators to enact changes and have a positive impact on feedback rituals in clinical practice.

우리의 연구 결과는 전반적으로 고등 교육, 보건 직업 교육 및 커뮤니케이션 분야에 걸친 이전의 연구를 강화하는데, 이는 학습 행동이 [신뢰, 존중, 공감, 학습자의 관점 이해, 학습 중 실수를 피할 수 없는 것으로 받아들이는 태도]에 의해 촉진된다고 보고했다. 시뮬레이션 기반 교육에서는 문헌 검토와 팀의 전문 지식을 바탕으로 [안전한 학습 환경]을 조성하기 위한 일련의 '약속 실천promising practices'이 제안되었다. 여기에는 다음이 포함됩니다. 

  • 기대치를 명확히 하는 것,
  • 로지스틱의 세부 사항에 집중하는 것,
  • 참가자의 관점에 대한 존중과 호기심을 보여주는 것,
  • 도전적인 학습 환경에서 발생하는 실수를 이해하는 것
  • 학습자의 기술 향상을 돕는 것
  • 학습자에 대한 긍정적인 인식을 유지하는 것

Our findings overall reinforce previous research across the fields of higher education, health professions education and communication, which have reported that learning behaviours are fostered by trust, respect, empathy, seeking to understand the learners’ perspective and an attitude that accepts mistakes as inevitable during learning.29, 32, 50 In simulation-based education, a set of ‘promising practices’ have been proposed for creating a safe context for learning, derived from a literature review and the team's expertise.39, 40 These included

  • clarifying expectations;
  • attending to logistical details;
  • showing respect and curiosity regarding participants’ perspectives;
  • understanding that mistakes occur in challenging learning environments,
  • focusing on assisting learners to enhance their skills and
  • maintaining positive regard for them.

우리가 식별한 주제 중 일부는 시뮬레이션 기반 맥락에서 현상에 대한 이러한 전문가의 통찰력과 일치하지만, 우리의 실용적인 행동과 대화 사례는 심리적 안전을 구축하고자 하는 교육자들이 피드백 만남 동안 특정 상황에 맞게 조정할 수 있는 옵션을 제공한다.

Some of the themes we identified are consistent with these experts’ insights into the phenomenon in simulation-based contexts, but our examples of practical behaviours and dialogue offer options that educators, wanting to build psychological safety, could tailor for specific contexts during their own feedback encounters.

'대화와 솔직함의 장을 마련하라'는 주제는 교육자들이 어떻게 세션의 분위기를 미리 설정했는지 조사했다. 우리의 연구에서, 이것은 잘 수행되지 않았습니다. 교육자가 처음부터 학습자의 기여에 대한 가치를 강조하고, 지지assist할 의사를 밝힐 때, 이는 대화형 대화를 지지하며 학습자가 적극적으로 참여할 수 있도록 합니다. 교육자-학습자 쌍 중 일부는 서로를 잘 몰랐을 가능성이 크다. 이런 맥락에서, (일상이 확립되지 않은 만큼) 기대에 대해 명시하는 것이 훨씬 더 중요할 것 같다. [(기대를) 투명하게 만들고. 앞으로 일어날 일과 예상되는 일에 대한 어느 정도의 통제를 제공]한다면, 학습자들은 덜 불안할 것이다. 과도한 불안은 주의를 산만하게 하고 복잡한 생각을 방해하며 기억을 손상시키기 때문에 학습 성과에 중요하다. 이 주제는 시뮬레이션 기반 교육 및 의사-환자 커뮤니케이션 기술에 대한 지침과 밀접하게 일치하며, 이는 처음부터 협력적 파트너십의 분위기를 설정하는 것의 중요성을 개략적으로 보여준다. 

The theme ‘setting the scene for dialogue and candour’ examined how educators set the tone for the session upfront. In our study, this was not done well. When educators indicate their intention to assist and highlight the value of learners’ contributions from the outset, this endorses interactive dialogue and enables learners to better position themselves to actively participate. It is likely that some of the educator-learner pairs did not know each other well. In this context, being explicit about expectations is likely to be even more important as routines have not been established. By creating transparency and offering some degree of control about what is going to happen and what is expected, learners are likely to feel less anxious. This is important for learning outcomes as excessive anxiety distracts attention, interferes with complex thinking and impairs memory.7-25, 27-34, 59 This theme aligns closely with guidelines for simulation-based education and doctor-patient communication skills, which outline the importance of setting the tone for a collaborative partnership from the start.35-58


다음 주제인 '동맹으로서의 교육자'는 교육자들이 학습자들에게 어떻게 지원과 지원을 제공하고 권력 불균형을 의도적으로 줄이려고 하는지를 파악했다. 이러한 전략들은 '배움의 기회를 잡는 것'이 학습자들에게 이익을 가져다 줄 가능성을 높임으로써 심리적 안전을 도모하는 것으로 보인다. 베어먼과 몰로이는 '지적 스트리킹(알몸으로 달리기)'라는 문구를 사용하였는데, 이는 교육자들이 학습자들에게 자신의 한계를 '노출'하는 경우를 설명하는 것으로서, 이러한 상호적 취약성의 제스쳐를 통해, [신뢰를 구축]하고 [권력의 불균형을 줄일 수 있는 잠재력]을 가지고 있다. 후속 연구에서, 이 저자들은 ['취약성-신뢰성' 긴장]을 탐구했는데, 이는 교육자들이 [전문가로서의 지위를 유지하기 위해 노력]하면서, 동시에 [학습을 용이하게 하기 위해 복잡한 임상 문제에 관한 불확실성을 드러내는] 것을 뜻한다. 그들은 [완벽주의 추구하기]가 아니라 [오류를 인정하는 문화 구축]의 가치를 옹호했는데, 왜냐하면 error란 직무 전반에 걸쳐 학습의 중심이기 때문이다.

The next theme ‘educator as ally’ identified how educators offered support and assistance to learners and purposefully attempted to reduce the power imbalance. These strategies seem to foster psychological safety by increasing the likelihood that ‘taking a chance on learning’ would reap benefits for learners. Bearman and Molloy used the phrase ‘intellectual streaking’ to describe instances when educators ‘exposed’ their own limitations to learners, with the potential to build trust and reduce the power imbalance through this gesture of reciprocal vulnerability.60 In a subsequent article, the same authors explored the 'vulnerability-credibility' tension in which where educators revealing their uncertainties regarding complex clinical problems to facilitate learning, and when also trying also trying to maintain their standing as experts They advocated for the value of ‘building a culture that acknowledges fallibility’ - as errors are central to learning throughout life at work - ‘rather than honouring perfectionism.’18, 61

'지속적인 개선 방향'이라는 주제는 Dweck이 설명한 '성장 마인드'와 일치합니다. 이러한 사고방식은 지속적인 학습에 특권을 부여하고, 도전적인 과제를 찾고, 효과적인 전략, 노력 및 지속성을 적용하여 기술을 개발하는 데 초점을 맞춥니다. 실수와 지식의 격차는, 학습자가 은폐하거나 교육자가 비판할 대상이 아닌, 배움의 기회로 비쳐진다. 이를 통해 학습 시 실수나 격차가 예상된다는 이해와 함께 높은 전문적 기준을 결합할 수 있는 접근 방식을 제공한다.
The theme ‘a continuing improvement orientation’ aligns with a ‘growth mindset’, as described by Dweck.62 This mindset privileges ongoing learning and focuses on developing skills by seeking out challenging tasks and applying effective strategies, effort and persistence. Mistakes and knowledge gaps are seen as opportunities to learn, not cause for covering up by a learner or criticism from an educator. This offers an approach to combine high professional standards with an understanding that mistakes or gaps are expected when learning.


마지막 주제인 '상호작용 대화 장려'는 교육자들이 참여자들이 서로의 기여를 기반으로 하는 토론을 촉진하는 방법을 설명한다. 이를 통해 공통의 근거(명백히 공유된 이해)가 만들어졌고, 학습자의 어려움을 해소하기 위한 목표 개발전략의 공동구축이 이루어졌다. 이 핵심 발견은 상담 중에 환자와 의사의 관점을 동등하게 우선시하는 '역사 쌓기build a history'를 위한 권고사항과 일치한다. 이는 '두 명의 작가가 두 사람이 모두 만족할 때까지 원고를 협력적으로 쓰는 것'에 비유되어 왔다.'55 두 가지 고유한 기여를 통합하는 이러한 패러다임은 더 나은 환자 신뢰, 만족도 및 임상 결과를 초래하는 것으로 나타났으며, 아마도 협력적으로 개발된 계획에 대한 개선된 준수와 관련이 있을 것이다. 그러나, 우리의 연구와 피드백에 대한 다른 연구에서, 이것은 흔히 볼 수 없었다.

The final theme ‘encouraging interactive dialogue’ describes ways that educators facilitated discussions in which participants build on each other's contributions. This led to the creation of common ground (explicitly shared understandings), and the co-construction of development strategies targeted to address the learner's difficulty. This key finding aligns with recommendations to ‘build a history’ by equally prioritising the patient's and doctor's perspectives during a consultation.50, 54 This has been likened to ‘two writers collaborating on a manuscript … until both are satisfied.’55 This paradigm of integrating both unique contributions has been shown to result in better patient trust, satisfaction and clinical outcomes, probably related to improved adherence to plans developed collaboratively.55 However, in our study, and other studies of feedback,63 this was not commonly seen.

4.1 장단점
4.1 Strengths and weaknesses

본 연구는 전문성, 경험 및 성별에 걸쳐 다양한 건강 전문가 참가자들과 함께 일상적인 임상 실습 중 36개의 공식 구두 피드백 세션 비디오를 분석했다. 학습자가 심리적 안전의 지표로 점점 더 정보를 공개하고 학습 활동을 하는 맥락을 살펴봤다. 주제 분석은 안전한 학습 환경의 지표와 관련된 교육자 행동에 대한 엄격하고 식별된 새로운 통찰력이었다. 본 기사는 임상 교육자들이 학습자들을 진솔한 토론과 협업 계획으로 초대하려고 시도하면서 그들이 접근한 방식을 바탕으로 문헌을 추가한다.
Our study analysed 36 videos of authentic formal verbal feedback sessions during routine clinical practice with diversity of health professional participants across specialty, experience and gender. We examined the context in which learners increasingly disclosed information and engaged in learning activities, as a signpost for psychological safety. The thematic analysis was rigorous and identified novel insights into educator behaviours associated with indications of a safe learning environment. This article adds to the literature by drawing on the approaches of clinical educators as they attempted to invite learners into honest discussion and collaborative planning.

4.2 제한사항
4.2 Limitations

우리의 업무는 몇 가지 한계가 있습니다. 우리는 학습자의 입력이나 입력 부족에서 유추된 관련 교육자의 행동을 관찰하고 심리적 안전에 미치는 영향을 가정할 수 있을 뿐이다. 세션 내내 학습자가 솔직해지는 경우를 중심으로 이를 완화하고자 노력했지만, 불안감에도 불구하고 학습자가 자유롭게 자신을 표현했을 가능성이 있다. 우리의 명제를 시험하기 위해서는 더 많은 연구가 필요하다. 교육자-학습자 쌍이 얼마나 오랫동안 함께 일했는지 기록하지 않았다. 이전의 만남은 기록된 피드백 에피소드 내에서 심리적 안전에 영향을 미쳤을 것이다. 또한, 연구에 참여하고 세션을 영상화하는 것이 참가자의 행동에 영향을 미쳤을 수 있습니다. 모든 참가자들이 호주의 단일 대형 보건 서비스에서 근무했기 때문에 피드백이 문화와 맥락에 영향을 받기 때문에 일반성을 제한할 수 있다. 개인의 학습과 커뮤니케이션 선호, 지역 단위 및 관련 기관 등 심리적 안전에 영향을 미칠 수 있는 다른 요소들은 조사되지 않았다. 

Our work has some limitations. We could only observe associated educator behaviours and postulate effects on psychological safety, inferred from learners’ inputs or lack thereof. It is possible that learners freely expressed themselves despite feeling unsafe, although we attempted to mitigate this by focusing on occasions when learners became increasingly candid throughout the session. Further research is required to test our propositions. We did not record how long educator-learner pairs had worked together. Previous encounters would have likely influenced psychological safety within the recorded feedback episodes. In addition, participating in the study and videoing the session may have influenced participant behaviours. All participants worked at a single large health service in Australia and hence, this may limit generalisability as feedback is influenced by culture and context. Other factors that may effect psychological safety, such as the individual's preferences for learning and communication, the local unit and institution involved, were not investigated.63

5 결론
5 CONCLUSIONS

쌍방향 학습 대화로 특징지어지는 피드백이 학습자에게 더 나은 결과를 가져다 줄 수 있다는 증거가 증가하고 있습니다. 그러나 안전한 기후를 구축하고 피드백 대화에서 학습자가 생산적인 학습 위험을 감수하도록 장려하는 방법에 대해서는 문헌이 부족하다. 우리의 데이터는 학습자와 교육자의 관점을 공유하고, 고려하고, 응답할 때보다 새로운 공동구축된 아이디어가 형성된다는 것을 입증했다. 학습자가 '상황을 살피는testing the waters'징후가 나타났고, 교육자의 반응이 후속 학습자의 참여에 큰 영향을 미쳤다. 심리적 안전의 징후가 보였을 때, 대화는 양측의 의제를 통합한 '빌딩 온(building on)'의 성격으로 나아갔다. 참가자들이 피드백을 통한 학습 최적화에 목표를 둔다면 심리적으로 안전한 환경을 만들어 학습자가 위험을 감수하도록 유도하는 것이 중요하다.

There is increasing evidence to suggest that feedback, when characterised by an interactive learning dialogue, results in better outcomes for learners.8, 15, 32, 64 However, the literature is thin when it comes to explaining how a safe climate is built, to encourage learners to take productive learning risks within a feedback dialogue. Our data demonstrated than when learner and educator perspectives were shared, considered and responded to, new co-constructed ideas were fashioned. There were indications of learners ‘testing the waters,’ with educators’ responses strongly influencing subsequent learner involvement. When there were signs of psychological safety, conversations took on a ‘building on’ tenor, which incorporated the agendas of both parties. If participants set their sights on optimising learning through feedback, creating a psychologically safe environment, to encourage learners to take risks, becomes crucial.

이 심층 관찰 연구는 심리적으로 안전한 직장 피드백 대화가 어떤 모습일 수 있는지를 명확히 하고, 교육자들에게 '지시'가 아닌 '그들과 함께 만들어진' 피드백에 대한 학습자의 기여를 촉진할 수 있는 언어 전략을 제공한다.

This in-depth observational study clarifies what psychologically safe workplace feedback conversations could look like and offers educators linguistic strategies that may foster learners’ contributions to feedback ‘created with them,’ not ‘directed at them.’

 


 

 

Med Educ. 2020 Jun;54(6):559-570.

 

 doi: 10.1111/medu.14154.

 

Psychological safety in feedback: What does it look like and how can educators work with learners to foster it?

Affiliations collapse

Affiliations

1Monash Doctors Education, Monash Health, Clayton, Victoria, Australia.

2Department of Medical Education, Melbourne Medical School, University of Melbourne, Melbourne, Victoria, Australia.

3Department of Physiotherapy, School of Primary and Allied Health Care, Faculty of Medicine Nursing and Health Science, Monash University, Melbourne, Victoria, Australia.

PMID: 32170881

DOI: 10.1111/medu.14154

Abstract

Context: Feedback conversations play a central role in health professions workplace learning. However, learners face a dilemma: if they engage in productive learning behaviours (such as asking questions, raising difficulties, offering opinions or contesting ideas), they risk exposing their limitations or offending the educator. This highlights the importance of psychological safety in encouraging learners to candidly engage in interactive dialogue and the co-construction of knowledge. Previous research has recommended that building safety, trust or an educational alliance is key to productive feedback encounters. Yet it is unclear how to translate this into practice. Hence our research question was: What does psychological safety look like in workplace feedback and how can educators work with learners to foster it?

Methods: We analysed 36 videos of routine formal feedback episodes in clinical practice involving diverse health professionals. A psychologically safe learning environment was inferred when learners progressively disclosed information and engaged in productive learning behaviours during the conversation. We used thematic analysis to identify associated educator strategies, which seemed to promote psychological safety.

Results: Four themes were identified: (a) setting the scene for dialogue and candour; (b) educator as ally; (c) a continuing improvement orientation, and (d) encouraging interactive dialogue. Educators approaches captured within these themes, seemed to foster a psychologically safe environment by conveying a focus on learning, and demonstrating respect and support to learners.

Conclusions: This study builds on claims regarding the importance of psychological safety in feedback by clarifying what psychological safety in workplace feedback conversations might look like and identifying associated educator approaches. The results may offer educators practical ways they could work with learners to encourage candid dialogue focused on improving performance.

+ Recent posts