USMLE Step 2 CS 시험의 중단: 과거로부터 배워서 미래를 정의하기(Acad Med, 2021)
Discontinuation of the USMLE Step 2 Clinical Skills Examination: Studying the Past to Define the Future
Lisa D. Howley, PhD, and Deborah L. Engle, EdD, MS

2021년 1월 26일주 의료 위원회(FSMB)와 국가 의료 검사 위원회(National Board of Medical Examiners, NBME)는 미국 의료 면허 시험(USMLE) 2단계 임상 기술(CS)을 중단할 것이라고 발표했습니다.1 이 결정은 미국에서 임상 기술을 평가하는 데 있어 중요한 이정표를 세웠고 의대생, 교육자, 연구자 및 기타 사람들에게 역사적으로나 실질적인 중요성을 지닌 결정이었다. 면허시험에서 수행능력 시험을 중단하기로 한 결정에도 논란이 없는 것은 아니었으며, 이러한 사안에 대한 상세한 탐구는 이 논평의 범위를 벗어나지만, 이 중대한 결정의 역사적 맥락은 더 면밀히 살펴볼 필요가 있다고 본다. 결국 공자는 우리에게 "미래를 정의하고 싶다면, 과거를 공부하라"는 것을 일깨워주고, 역사의 몇 가지 핵심 교훈은 이 새로운 임상 성과 평가 시대에 앞으로 나아가는 우리의 길을 더 잘 알려줄 수 있을 것이다.
On January 26, 2021, the Federation of State Medical Boards (FSMB) and the National Board of Medical Examiners (NBME) announced the United States Medical Licensing Exam (USMLE) Step 2 Clinical Skills (CS) would be discontinued.1 This decision marked a significant milestone in the assessment of clinical skills in the United States and one that has historical as well as practical significance for medical students, educators, researchers, and others. The decision to suspend the licensing performance examination was not without controversy, and although a detailed exploration of these issues is beyond the scope of this commentary, we believe the historical context of this significant decision warrants a closer look. After all, Confucius reminds us to “study the past, if you would define the future,” and several key lessons from history may better inform our path forward in this new era of clinical performance assessment.


USMLE에는 3단계로 이뤄져있고, 최근까지 의사 면허를 얻기까지는 4가지 시험을 통과해야 했다. 이 시험들은 "건강과 질병에 중요하고 안전하고 효과적인 환자 진료의 기초를 이루는 지식, 개념 및 원칙을 적용하고 환자 중심의 기본적인 기술을 보여줄 수 있는 의사 역량 평가"를 목적으로 한다. 면허 취득을 위한 각 단계는 의사 교육에서 개발적으로 적절한 시기에 완료되며, 일반적으로 2단계(CK와 CS로 구성)는 의과대학 교육 3학년이 끝날 때 완료됩니다. 수십 년 동안 임상 성과 평가에 깊이 관여해온 의료 교육자로서, 우리는 포괄적이고 공정하며 학생 중심적이며 환자 중심의 임상 성과 평가를 위한 새로운 시대와 경로를 고려할 때 몇 가지 역사적 이정표와 교훈을 공유합니다.

The USMLE includes 3 steps and, until recently, 4 examinations toward medical licensure. It is intended to assess a physician's ability to “apply knowledge, concepts, and principles, and to demonstrate fundamental patient-centered skills, that are important in health and disease and that constitute the basis of safe and effective patient care.”2 Each Step toward licensure is completed at a developmentally appropriate time in a physician’s training, and Step 2—parts CK (Clinical Knowledge) and the former CS—is typically completed at the end of the third year of medical school training. As medical educators who have been deeply engaged in clinical performance assessment for decades, we share several historic milestones and lessons as we consider a new era and the path forward for comprehensive, equitable, student-focused, and patient-centered clinical performance assessment.

 

1960년대 ~ 1970년대: 기원시대
1960s
1970s: Era of Origination

현대의 수행 평가는 1963년 서던 캘리포니아 대학의 신경과 의사이자 교육자인 하워드 바로우 박사가 병상에서 직원들에게 임상 기술을 가르치면서 고군분투했던 때로 거슬러 올라간다. 이를 해결하기 위해 그는 환자처럼 행동하고 수많은 신체적 징후와 증상, 영향을 제시하는 사람을 모집하고 훈련시켰으며, 의대생들은 개별적으로 이 '프로그램된' 환자에 대한 이력 및 신체검사를 실시했다. 결국 표준화된 환자(SP)라고 불리는 것이 탄생했다. Barrows 박사는 "그렇지 않았다면 결코 찾을 수 없었을 학생들에 대한 것들을 배우고 있었다"고 학생들과 함께 SP를 사용한 경험에 대해 평했다. 처음에는 조롱과 웃음거리가 되었던 이 선구적인 작품(SP)은 북미 전역에 임상기술 교수와 평가의 새로운 시대를 열었고, 인간 시뮬레이션을 바탕으로 한 더 많은 포맷의 기반을 닦았다. SP 혁신은 유연성, 표준화, 안전성 등의 이점을 갖춘 의학 교육에서 가장 보편적인 교육 방법론 중 하나로 성장할 것입니다.

The modern-day performance assessment dates back to 1963 when Dr. Howard Barrows, a neurologist and educator at the University of Southern California, struggled while teaching his clerks clinical skills at the bedside. To solve this challenge, he recruited and trained a person to act like a patient and present numerous physical signs, symptoms, and affect while his medical students individually conducted a history and physical examination of this “programmed” patient. What would eventually be termed the standardized patient (SP) was born. “[I was] learning things about those students I would have never found otherwise,” Dr. Barrows commented about his experiences using SPs with students.3 This pioneering work, which was originally met with ridicule and laughter, launched a new era of clinical skills teaching and assessment across North America and paved the way for more formats based on human simulation. The SP innovation would grow to become one of the most pervasive teaching methodologies in medical education with benefits including flexibility, standardization, and safety.

1980~1990년대: 심리측정의 시대
1980s
1990s: Era of Psychometrics

그 후 20년 동안 [교육 프로그램을 지원하기 위해 개발되고 있는 SP 프로그램의 수가 증가하면서] [의과대학 전반의 임상기술 수행평가]에서 적응과 발전이 이뤄졌다. 관적 구조화 임상시험, 임상능력 평가 등을 포함한 형성적, 총괄적 성과 평가의 다양한 모델이 개발되었습니다. 이러한 시기적절한 검사는 의대생이 여러 SP와 상호 작용하면서 교수진 및 종종 훈련된 SP 자신으로부터 병력 청취, 신체 검사, 환자 교육, 커뮤니케이션, 임상 추론 등 다양한 임상 기술을 수행할 수 있는 능력에 대해 상세한 구술 및 서면 피드백을 받아야 했습니다.
The 2 decades that followed resulted in adaptations and advances in the performance assessment of clinical skills across medical schools with a growing number of SP programs being developed to support the educational program. Various models of formative and summative performance assessment were developed, including objective structured clinical exams, clinical skills assessments, and more. These timed examinations required medical students to interact with multiple SPs while receiving detailed oral and written feedback from faculty, and often the trained SPs themselves, on their ability to perform a variety of clinical skills, such as history taking, physical examination, patient education, communication, and clinical reasoning.

1980년대 후반, Josiah Macy Jr 재단의 지원과 AAMC의 승인을 받아, ECFMG(Educational Commission for Foreign Medical Greaders)와 NBME Southern Illinois University School of Medical School은 미국 전역의 의과대학에서 SP 기반 검사의 채택을 촉진하기 위한 [공동 보급 프로젝트]를 수행했다
1992년 AAMC는 임상기술 교수 및 평가에서 [표준화 환자 활용에 관한 컨센서스 컨퍼런스]를 개최하였고, [SP 기반 교수 및 평가]를 진전시키기 위해 AAMC의 교육 문제에 관한 동호단체affinity group의 특별 이익 집단special interest group을 구성하였다 (나중에 국제 표준화 환자 교육자 협회(International Association of Standardized Patient Educators)가 됨). 이러한 복잡한 표준 평가 방법의 심리학적 특성은 교육 연구자들의 중심 초점이 되었다. 1980년에서 2000년 사이에 13,000개 이상의 출판물을 만들어냈으며, 1990년대에는 Lisa D. Howley 의 박사 논문을 포함하여 87%가 출판되었다.

In the late 1980s, with the support of the Josiah Macy Jr. Foundation and endorsement by the AAMC, the Educational Commission on Foreign Medical Graduates (ECFMG), and the NBME, Southern Illinois University School of Medicine undertook a collaborative dissemination project to stimulate the adoption of SP-based examinations across medical schools throughout the United States. In 1992, the AAMC hosted the Consensus Conference on the Use of Standardized Patients in the Teaching and Evaluation of Clinical Skills, and a special interest group of the AAMC’s affinity group on educational affairs was formed to advance SP-based teaching and assessment (later becoming the independent international Association of Standardized Patient Educators). The psychometric properties of these complex standard assessment methods became a central focus of educational researchers and resulted in over 13,000 publications between 1980 and 2000, with 87% of those in the 1990s, including L.D.H.’s doctoral dissertation.5


이 기간 [국제연수 의과대학 졸업생의 미국 레지던트과정이나 펠로우십 프로그램 진학 준비성 평가]를 담당했던 ECFMG는 국제졸업생의 임상능력을 효과적으로 평가하기 위해 고군분투했다. 1998년, 성과 평가를 위한 SP의 사용에 대한 많은 교훈과 상당한 연구를 바탕으로, ECFMG는 영어로 환자 및 보건 전문가와 대화할 수 있는 졸업생의 능력을 평가하기 위한 [대규모 임상 기술 평가]를 성공적으로 시작했습니다. 업계 최초의 국가 임상 성과 검사가 수립되었다.

During this time, the ECFMG, which was responsible for assessing the readiness of internationally trained medical graduates to enter U.S. residency or fellowship programs, struggled to effectively assess the clinical skills of international graduates. In 1998, building from the many lessons and considerable research on the use of SPs for performance assessment, the ECFMG successfully launched a large-scale clinical skills assessment, intended to assess a graduate’s ability to communicate with patients and health professionals in English. The first national clinical performance examination in the profession was established.

2000년대 초반: 라이선스 시대
Early 2000s: Era of Licensure

[(그 당시까지의) [의사면허시험]은 모두 단일 형식의 객관식 문항으로 지식만을 테스트]하는 반면, [국제 졸업생(IMG)들은 미국 국내 졸업생들보다 광범위한 임상 성과 평가를 통과해야 한다]는 우려 때문에 FSMB와 NBME는 2004년에 USMLE 2단계 CS 시험을 테스트하고 시행했습니다. 이 새로운 자격증 시험은 학생들의 병력청취, 신체진찰수행, 결과 전달 능력을 평가했습니다. ECFMG 임상 기술 평가는 새로운 USMLE 2단계로 대체되었으며, 처음으로 [국제 졸업생]과 [미국에서 훈련된 의대생]이 모두 임상 기술 성과 평가를 완료하게 되었다. 
Due in part to concerns that all medical licensing examinations tested knowledge with a single format of multiple-choice questions and that international graduates were required to pass a broader assessment of clinical performance than U.S. graduates, the FSMB and the NBME tested and launched the USMLE Step 2 CS exam in 2004. This new licensing exam assessed students’ abilities to take a history, perform a physical exam, and communicate findings. The ECFMG clinical skills assessment was replaced by the new USMLE Step 2, and for the first time, all international graduates and U.S.-trained medical students would complete a clinical skills performance assessment.

현대 2단계 CS 시험은 이력 기록, 신체 검사, 기록 환자 메모의 3가지 요소로 구성되었습니다. 각 검사자는 12명의 표준화된 환자를 접하게 되었고, 각 환자의 기록을 15분 동안 기록하고, 필요한 경우 집중적인 신체 검사를 수행해야 했습니다. 각각의 encounter 후에 응시자들은 10분 동안 추가로 자신의 발견 내용과 계획에 대한 환자 메모를 작성하게 되었습니다.6

The modern Step 2 CS exam consisted of 3 components: history taking, physical examination, and a written patient note. Each examinee was required to encounter 12 standardized patients and had 15 minutes to take each patient’s history and, if relevant, perform a focused physical exam. Following each encounter, the examinees had 10 additional minutes to write a patient note about their findings and plan.6


미국에서 의사면허시험에 이와같은 평가 모델의 확대과정이 논란이 없이 나온 것이 아니다.

  • 12시간 동안 진행된 2단계 CS 검사는 미국 내 6개 테스트 센터 중 1곳에서 완료해야 했으며 의대생들이 완료하는 데 (시험을 보기 위한 이동 및 숙박 비용 외에도) 약 1,500달러가 소요되었습니다. 이는 다른 USMLE 자격증 시험보다 약 60% 더 높은 수치였습니다.
  • 합격-불합격 검사는 약 95%의 높은 합격률을 기록했으며 학생들에게 임상 기술에 대한 구체적인 성과 피드백을 제공하지 않았습니다.
  • 또한 사이트 전반에서 표준화의 필요성이 증가하고 SP 평가자에 대한 의존도가 높아짐에 따라 임상 encounter가 체크리스트와 환자 노트를 통해 문서화된 개별 관찰 가능한 행동으로 축소되었다.
  • 검사에 포함된 만남 또는 스테이션은 [단일 환자]의 [초기 방문]으로 제한되었고 임상 결정에 informing하는 다양한 자원에 대한 접근은 제한되었다.

 

This expanded assessment model for medical licensure in the United States did not come without controversy.

  • The 12-hour Step 2 CS examination had to be completed at 1 of 6 testing centers in the United States and cost medical students approximately $1500 to complete (in addition to the expenses associated with travel and time away from their training program), which was approximately 60% higher than the other USMLE licensing exams.
  • The pass–fail examination had a high pass rate of approximately 95% and did not provide specific performance feedback to students about their clinical skills.
  • In addition, due to the increased need for standardization across sites and its reliance on SP raters, the clinical encounter was reduced to discrete observable behaviors documented via a checklist and a patient note.
  • The encounters or stations included in the examination were limited to initial visits with single patients, and access to resources for informing clinical decisions was limited.

 

이에 대응하여, 임상 능력 평가를 위한 새로운 모델을 설계하고 연구하던 많은 지역 SP 프로그램들은 2단계 CS 모델에 보다 긴밀하게 맞추기 위해 접근 방식을 변경하였습니다.

In response, many local SP programs that had been designing and researching new models for clinical skills assessment changed their approach to more closely align with the Step 2 CS model.


이 새로운 자격증 시험은 또한 [지역local SP 기반 임상 성과 평가]의 개발을 증가시켰으며, 이는 부분적으로 2단계 CS를 위한 학생들을 준비시키기 위한 것이었다. 이러한 [지역적 방법]들은 그것들을 개발한 학교의 더 큰 평가 시스템의 일부가 되었다. 비록 이 짧은 논평의 범위를 벗어나지만, 교육 프로그램의 설계, 구현 및 평가와 학습자의 평가에 대한 결과 기반 접근 방식인 역량 기반 의료 교육(CBME)을 향한 광범위한 움직임도 언급하지 않을 수 없다. 의과대학은 CBME 접근방식을 채택하기 시작하면서 평가 시스템을 더욱 빈번한 준거-기반, 형성적, 직무현장-기반 방법을 포함하도록 확장했다. 또한, 이러한 변화는 훈련생에 대한 판단을 내리는 그룹 과정group process의 가치를 강조했습니다. CBME의 맥락 속에서는, 오로지 의대생들의 임상능력을 보다 [빈번하고 효과적으로 평가해야 할 필요성]이 높아질 뿐이었다.

This new licensure exam also resulted in the increased development of local SP-based clinical performance assessments, which were intended, in part, to prepare students for Step 2 CS. These local methods became part of the larger assessment system of the school that developed them. Although beyond the scope of this brief commentary, we would be remiss not to mention the broader movement toward competency-based medical education (CBME), which is an outcomes-based approach to the design, implementation, and evaluation of educational programs and the assessment of learners. As medical schools began to adopt a CBME approach, they also broadened their assessment systems to include more frequent criterion-based, formative, and workplace-based methods. Additionally, this shift underlined the value of group process in making judgments about trainees. The need to more frequently and effectively assess medical students’ clinical skills was only heightened within the context of CBME.

 

2020년대 이후: 창의적 협업의 시대
2020s and Beyond: Era of Creative Collaboration

2020년 5월, COVID-19 대유행으로 인해 FSMB와 NBME는 언젠가는 다시 시작할 것을 염두에 두고 2단계 CS를 12개월에서 18개월 동안 (일시) 중단했다. 그들은 "기존의 방식보다 눈에 띄게 더 나은 2단계 CS 시험을 다시 시작할 것"이라고 설명했지만, 2021년 1월에 그들은 Step 2를 (영구히) 중단할 것이라고 발표하며, "의학교육 및 주 의료 위원회에서 종사하는 동료들과 함께 작업하여 [임상기술을 평가하는 혁신적인 방법]을 결정하는 데 집중"할 수 있는 기회를 가질 것이라고 발표했다. 미래를 정의하기 시작하면서 임상 성과 평가의 역사와 진화에 대한 몇 가지 교훈을 제안합니다.
In May 2020, due to the COVID-19 pandemic, the FSMB and the NBME suspended Step 2 CS for 12 to 18 months with the intent of reinstating. They explained they would bring back “a modified Step 2 CS exam that was appreciably better than the prior assessment,” but in January 2021, they announced their decision to discontinue the Step and to take the opportunity to “focus on working with our colleagues in medical education and at the state medical boards to determine innovative ways to assess clinical skills.”1As we begin to define the future, we propose several lessons from the history and evolution of clinical performance assessment.


첫째, 우리가 역사를 통해 해왔던 것처럼 의학교육계는 임상 능력 평가 방법을 지속적으로 혁신하고 협력하며 개선해야 합니다. SP 기반 모달리티는 환자 중심 평가를 위한 강력한 방법인 동시에 학습자와 환자를 위험으로부터 보호합니다. 우리는 [다양한 환자, 가족, 팀 및 다양한 설정을 대표하는 임상 만남]을 [시뮬레이션]하는 [성과 기반의 형성적 및 종단적 방법]을 제공하기 위해 노력해야 한다. 2단계 CS의 중단으로 [의과대학의 창의성과 혁신성이 향상]되어 다양한 환자 및 팀과 소통하고 공정하고 안전한 직접적 및 가상적 관리를 제공하는 등 학생들의 복잡한 임상 기술을 측정하는 평가를 모색할 수 있을 것이다. 또한, 이러한 방법들은 [직장 기반 방법의 사용을 증가]시키는 것을 포함하여 [학교의 광범위한 평가 시스템과 맥락을 같이] 하여 검토되어야 한다. [서로 다른 설정]에 걸쳐 그리고 [수많은 평가자]에 의해 이루어진 [여러 평가 형식]은 학생들의 역량에 대한 [종단적] 평가에 더 많은 정보를 제공할 것입니다.
First, as we have done throughout history, the medical education community should continue to innovate, collaborate, and improve upon our methods of clinical skills assessment. SP-based modalities remain a powerful method for patient-centered assessment while also protecting our learners and patients from harm. We should work to provide performance-based formative and longitudinal methods that simulate clinical encounters that are representative of diverse patients, family members, teams, and varied settings. The discontinuation of Step 2 CS may allow for greater creativity and innovation at medical schools to explore assessments that measure the complex clinical skills of its students, including communicating with diverse patients and teams and providing in-person and virtual care that is equitable and safe. Furthermore, these methods should also be considered in context with the school’s broader assessment system, including the increasing use of workplace-based methods. Multiple assessment formats, across different settings and by numerous assessors, will better inform longitudinal evaluation of students’ competence.


둘째, 의학 교육자는 평가를 위해 보다 복잡하고 학생 중심적인 접근법으로 계속 전환해야 합니다. 우리는 [학생 주도student-driven 평가]를 [구조화되지 않은 환경을 제공]하고, [자연적 조건에 대해 현실적]이며, [학생들에게 선택 사항 목록을 제한하거나 특정 추론 경로를 따르도록 강요하지 않는 것]으로 정의한다.7 임상 기술의 복잡성을 [순수하게 분리된 행동 체크리스트로 축소]해서는 안 된다. 대신 우리는 학생들이 임상적 추론을 개발하고, 결정을 내리고, 오류를 범하고, 역량을 개발하는 방법에 대한 우리의 증가하는 이해를 평가 방법에 통합해야 합니다. 우리는 Dyad(학생-SP 쌍)에 대한 과도한 의존에서 벗어나서, 예를 들어, [다수 사람의 시뮬레이션multiple-person simulation]으로 나아가야 한다. 또한 지금과 같은 체크리스트 기반의 측정방법을 [고급 인지 능력]을 평가할 수 있는 것으로 바꿔나가야 한다. 궁극적으로, 이러한 [덜 환원주의적 접근법]은 임상 역량에 대한 보다 인지적으로 발전된 측정으로 이어질 수 있다.
Second, medical educators should continue to shift to more complex and student-driven approaches for assessment. We define student-driven assessments as those that provide an unstructured environment, are realistic with respect to the natural conditions, and do not limit students to lists of options or force them to take a certain path of reasoning.7The complexity of clinical skills should not be reduced to a purely discrete checklist of behaviors. We should instead integrate into our assessment methods our growing understanding of how students develop clinical reasoning, make decisions, make errors, and develop competency. We should shift from overreliance on dyad (student–SP) encounters, for example, to multiple-person simulations and modify the method of measurement from checklists to measures more capable of assessing advanced cognitive skills. Ultimately, these less reductionist approaches may lead to more cognitively advanced measures of clinical competence.


셋째, 의학 교육자는 계속해서 평가의 역할에 대해 재고하고, 부담stake의 정도나 평가의 유형에 관계없이 [모든 평가]가 학생들이 강점과 약점을 식별할 수 있는 [충분한 피드백을 제공하도록 해야] 합니다. 또한, 우리는 우리의 방법이 [공정]하고, 모든 학생들이 [접근]할 수 있으며, [편견이 없도록] 노력해야 합니다. 다시 말해, 우리는 [학습에 대한 평가]에서 [학습을 위한 평가]와 [형평성을 위한 평가]로 계속 전환해야 합니다. 마찬가지로, 가상 및 직접 검사를 위한 [다중 기관 및 지역 협업]을 포함하여, SP 기반 평가를 설계하고 관리할 때 효율성을 높이기 위해 노력해야 합니다. 의대, 협력기관, 인허가기관 등 의학교육계는 [임상기술이 적절하고 공정하며 균일하게 평가될 수 있도록] 해야 할 [공공public에 대한 의무]를 공유하고 있다. 임상 술기 평가는 국지적으로 계속 확장되어야 하며, 국가 의사면허 취득으로 가는 경로pathway 내에 있어야 한다. 궁극적으로 평가가 지역적이든, 국가적이든, 공동 설계 및 관리이든 간에, 우리의 광범위한 공동체는 협력적으로 일하고, 공유된 과거로부터 교훈을 얻으며, 임상 기술 평가의 새로운 미래를 설계해야 한다.
Third, medical educators should continue to rethink the role of assessment and ensure that all assessments, regardless of stakes or type, provide sufficient feedback for the student to identify areas of strength and weakness. In addition, we should work to ensure that our methods are equitable, accessible for all students, and free of bias. In other words, we should continue to shift from the assessment of learning toward the assessment for learning and equity. Similarly, we should work toward identifying greater efficiencies when designing and administering SP-based assessments, including multi-institutional and regional collaborations for virtual and in-person examinations. The medical education community, including medical schools, their affiliates, and licensing and accrediting bodies, have a shared obligation to the public to ensure clinical skills are appropriately, fairly, and uniformly assessed. Clinical skills assessment should continue to expand locally and should remain within the national licensing pathway. Ultimately whether the assessment is locally, nationally, or jointly designed and administered, our broad community should work collaboratively, take lessons from our shared past, and design our new future of clinical skills assessment.


지난 한 해는 COVID-19가 의료 교육의 거의 모든 관행에 지장을 주면서 변혁을 가져왔다. 미국 국가 면허 검사의 실질적인 변화는 의과대학 내부와 대학 전반에서 우리 학생들의 임상 능력을 평가하는 방법과 무엇을 발전시킬 수 있는 기회를 포함하여 많은 파급 효과를 가져올 것입니다. 미래가 어떻게 될지 알 수는 없지만 창의성과 협업을 강화함으로써 포괄적이고 공정하며 학생 중심적이고 환자 중심적인 임상 능력 평가를 포함하는 미래를 정의하게 될 것으로 전망합니다.

The past year has been transformative as COVID-19 has disrupted nearly all practices in medical education. Substantial changes to the U.S. national licensing examination will have many ripple effects, including opportunities for advancing what and how we assess the clinical skills of our students within and across our medical schools. Although we cannot know what the future will hold, we predict that through greater creativity and collaboration, we will have defined a future that includes comprehensive, equitable, student-focused, and patient-centered assessment of clinical skills.

 


Acad Med. 2021 Jun 22.

 doi: 10.1097/ACM.0000000000004217. Online ahead of print.

Discontinuation of the USMLE Step 2 Clinical Skills Examination: Studying the Past to Define the Future

Lisa D Howley 1Deborah L Engle

Affiliations collapse

Affiliation

  • 1L.D. Howley is senior director of strategic initiatives and partnership, Association of American Medical Colleges, Washington, DC, and adjunct associate professor, University of North Carolina School of Medicine, Chapel Hill, North Carolina. D.L. Engle is assistant dean of assessment and evaluation and associate professor, Duke University School of Medicine, Durham, North Carolina.
  • PMID: 34166236
  • DOI: 10.1097/ACM.0000000000004217Abstract
  • The United States Medical Licensing Examination (USMLE) Step 2 Clinical Skills (CS) was discontinued in January 2021, marking a significant milestone in assessment of clinical skills. In this commentary, the authors trace the history of the Step 2 CS exam-beginning with its early roots in the 1960s, to its establishment as a performance-based licensing exam in 2004, to 2021. In this new era, the medical education community is replete with opportunities for advancing methodology and content associated with clinical skills assessment. The authors propose 3 main lessons gleaned from this rich history and modern evolution, which are aimed at defining a future that includes creative collaboration toward development of comprehensive, equitable, student-focused, and patient-centered clinical performance assessment. First, as it has done throughout history, the medical education community should continue to innovate, collaborate, and improve upon methods of clinical skills assessment. Second, medical educators should continue to shift to more complex and student-driven approaches of assessment, that is, assessments that provide an unstructured environment, are realistic with respect to the natural conditions, and do not limit students to lists of options or force them to take a certain path of reasoning. Third, medical educators should continue to rethink the role of assessment and ensure that all assessments, regardless of stakes or type, provide sufficient feedback for the student to identify areas of strength and weakness.

+ Recent posts