의사소통 (스킬) 교육의 센스와 넌센스 (Patient Educ Couns.2021) The sense and nonsense of communication (skills) teaching - reflections from a parent and educator
Anne de la Croix1
병원의 소아과 병동. 저는 심각한 발달 지연을 겪고 있는 제 1살짜리 아들을 진찰해 줄 신경과 의사를 초조하게 기다리고 있습니다. 신경과 의사가 5~6명의 수련생을 옆에 두고 들어옵니다. 그는 나에게 작은 인사말을 건네고, 연습생들에게 자신의 연구 결과를 보고하며 내 아이에게 집중한다. 신체검사 후 신경과 의사가 아들의 이름을 불러달라고 합니다. 저는 방구석에서 순종적으로 그렇게 합니다. 아이가 제 목소리에 반응하지 않았다. 이럴 줄 알았어. 제 아들과 저 사이의 연락과 유대감이 부족해서 매우 화가 났습니다. 아직도 나를 등지고 있는 신경과 의사는 그의 훈련생들에게 말한다: '봐, 엄마의 목소리에 전혀 반응이 없어. 이거 적어놨어? 그는 나를 쳐다보지 않는다. 공감대도, 연결도, 소통도, 공감도 없다. 얼마 지나지 않아 그가 내게 작별인사를 건네자 수련 중인 젊은 의사단이 방을 떠난다. 그들 중 한 명이 동정 어린 눈빛으로 나를 바라본다. 나는 아들을 안고 슬퍼요. A pediatric ward of a hospital. I am nervously waiting for a neurologist who will examine my 1-year-old baby boy who has severe developmental delays. The neurologist walks in, with 5 or 6 trainees by his side. He nods a small greeting to me, and focuses on my child, reporting his findings to the group of trainees. The neurologist, after a physical examination, asks me to call out my son’s name. I obediently do so, from the corner of the room. My child does not respond to my voice. I knew this would happen. The lack of contact and bonding between my son and me has been extremely upsetting. The neurologist, still with his back towards me, says to his trainees: ‘See, no response to mother’s voice at all. Did you write this down?’. He does not look at me. There is no rapport, no connection, no communication, no empathy. Shortly after that, he gives me a nod goodbye and the troupe of young doctors in training leaves the room. One of them looks at me with sympathy. I pick up my son and feel sad.
이틀 뒤에. 의과대학 교습실. 저는 12명의 어린 의대생들에게 의사소통과 직업적 행동에 대해 가르치고 있습니다. 저는 이 중요한 주제들에 대해 그들과 대화해야 한다는 새로운 긴박감을 느낍니다. 그들은 관절염과 우울증을 모두 가진 환자를 연기하는 배우와 함께 역사를 연습한다. 공감, 환자의 관점, 연결고리에 대해 이야기하는 좋은 세션입니다.
수업이 끝날 때, 저는 이렇게 묻습니다: '이 세션을 마치기 전에 할 말이나 질문이 있나요?' '
몇 명이 손을 든다: 공감이 되는 문장을 다시 한 번 말씀해 주시겠어요, 검사에 유용할 것입니다.' '환자 자신의 생각과 인식에 대한 질문은 건너뛰어도 괜찮을까요? 그것은 너무 많은 시간이 걸리고, 우리는 시험에서 8분밖에 받지 못합니다.' 그들은
Two days later. A teaching room at a medical school. I am teaching twelve young medical students about communication and professional behavior. I feel a renewed sense of urgency to talk with them about these important topics. They practice history taking on an actor who portrays a patient with both arthritis and depression. It is a good session in which we talk about empathy, the patient’s perspective, and making a connection.
At the end of class, I ask: ‘Do you have anything to say or ask before we close this session?’
A few hands go up: ‘Could you repeat the sentence that shows empathy, it will be useful for the exam,’ ‘Is it ok to skip the question about the patient’s own ideas and perceptions? It takes so much time, and we only get 8 minutes in the exam.’
배우고 싶어하고 의사가 되기를 열망하지만, 무엇보다도, 학생은 다음 시험에 합격하기를 열망한다. 나는 세션을 닫고 슬픕니다.
They are eager to learn, eager to become doctors, but most of all: eager to pass their next exam. I close the session and feel sad.
이 두 가지 상호작용은 모두 8년 전에 일어났으며, 제 사생활과 직장 생활 사이의 불협화음의 시기를 나타냅니다. Both these interactions took place eight years ago and represent a period of dissonance between my private life and professional life.
엄마로서 신경과 의사와의 상호 작용에 대한 기억이 아직도 아픕니다. 그때 내가 원했던 것은 그들이 나를 경청하고 나를 바라봐주는 것이었다. 저는 올바른 진단과 치료를 찾는 의사의 팀메이트가 되고 싶었습니다. 저는 제 아들에 대한 생각과 관찰을 공유하고 싶었습니다. 그리고 의사가 내가 걱정하거나 겁먹거나 슬퍼해도 괜찮다고 말해주길 바랐어 위에서 만난 신경과 의사는 감정, 두려움, 걱정, 혹은 나와 함께 할 수 있는 파트너쉽에 대해 잊어버린 것 같았다. As a mother, the memory of the interaction with the neurologist still stings. What I wanted at the time was to be heard and seen. I wanted to be the physician’s team-mate in the search for the right diagnosis and care. I wanted to share my ideas and observations about my son. And I wanted the doctor to say it was okay for me to be worried, scared, or sad. The neurologist in the encounter above seemed to have forgotten about emotions, about fears and worries, or about a possible partnership with me.
전문직으로서, 저는 의과대학에서 젊고 의욕적인 학생들과 함께 일했습니다. 의대생들에게 의사소통 기술을 가르치는 교사가 되고 의료 분야에서 공감을 이끌어내는 것은 가치 있는 직업처럼 느껴졌습니다. 저는 학생들이 의사-환자 상호 작용의 핵심이 무엇인지 알게 되기를 바랐습니다: 인정, 접촉, 존중, 호기심, 이해, 동반자 관계. 하지만 나는 나의 의사소통 능력이 의대생들의 정서적 예민한 면을 발전시키는데 늘 기여하지는 못함을 것을 알게 되었습니다. As a professional, I worked at a medical school, with young and driven medical students. Being a communication skills teacher to medical students and encouraging empathy in healthcare felt like a valuable career. I hoped to make the students aware of what lies at the core of doctor-patient interaction: acknowledgment, contact, respect, curiosity, understanding, a sense of partnership. But I noticed that my communication skills teaching did not always manage to contribute to the development of the emotionally sensitive side of medical students.
위에서 설명한 사건들을 겪으면서, 저는 의사소통의 일반적인 방식에 대해 의구심을 품기 시작했습니다. 나는 내가 가르친 학생들에게 진급progress에 필요한 행동을 보여주는데 집중했고, 나는 종종 임상 실습의 인간적인 측면을 잊어버렸다. 마치 위에서 설명한 신경과 의사처럼 말이다. 나는 학생들이 시험에 합격하기 위해 '올바른 말'을 할 줄 안다는 것을 발견했다. 나는 '공감'이 다면적인 인간 경험에서 얕은 체크박스 운동으로 변화된 교육문화를 경험했다. 오해하지 마세요: 구체적인 행동을 배우는 것은 상담을 관리하는 데 매우 유용할 수 있습니다. 그러나 의사소통 교육이 근본적인 도덕성을 가지고 있지 않고 행동 대본의 범위로 '숙련'되면, 그것은 의미를 잃는다. 행동에 지나치게 집중하는 것은 근본적인 생각과 감정을 다루지 않고 '트릭'을 수행하는 것으로 이어진다. During the events described above, I started doubting the way communication is generally taught. Students I taught were focused on showing desired behavior in order to progress successfully, during which they sometimes forgot the humane side of clinical practice – much like the neurologist described above. I discovered that students knew how to say ‘the right things’ to pass the test. I experienced an educational culture in which ‘empathy’ was transformed from multifaceted meaningful human experience into a shallow tick-box exercise. Don’t get me wrong: learning specific behaviors can be very useful for managing a consultation. But when communication teaching has no underlying morality and is ‘skillified’ into a range of behavioral scripts, it loses its meaning. An overfocus on behavior leads to performing ‘tricks’ without addressing underlying thoughts and feelings.
제가 겪었던 또 다른 문제는 저의 가르침이 주로 임상 전 교육과정에, 교실 중심의 가르침으로 둘러싸인 매우 '학교 같은' 환경에서 이루어졌다는 것입니다. 그러나 학생들은 모두 진정한 배움이 시작되는 장소인 병원과 의사들을 학수고대하는 것 같았다. 학생들이 사무원이 되어 미래의 직장에서 배우고 있을 때, 나는 그들이 클리닉의 문화에 몰입하고 사회화되는 것을 보았다. 저는 그들이 직장에서 배운 교훈이 제가 학교 같은 환경에서 비임상사로서 가르치던 것보다 더 영향력이 있다는 것을 알게 되었습니다. 실습 의사인 그들의 선생님은 의사 소통에서 훌륭한 역할 모델이 될 수 있고 학생들이 소통하고 공감하는 의사가 되도록 이끌 수 있다. 반대로 롤모델이 위에서 설명한 신경과 의사와 유사하다면, 인간적 접촉은 부차적이라고 학생들에게 가르칠 수 있다.
Another issue I had was that my teaching mainly took place in the pre-clinical curriculum, in a very ‘school-like’ surrounding with classroom based teaching. But the students all seemed to look forward to the place where the real learning would start: in hospital, with doctors. Once students became clerks and were learning in their future workplace, I saw them being immersed and socialized in the culture of the clinic. I noticed that the lessons they learnt in the workplace were more impactful than those that I used to teach, as a non-clinician in a school-like environment. Their teachers, practicing physicians, could be excellent role models in communication and could steer students towards becoming communicative and empathic doctors. Alternatively, the role models could be similar to the neurologist described above and implictly teach students that human contact is of secondary importance.
한마디로, 나는 미래의 의료 전문인력 양성에 의미 있는 영향을 미치지 못하고 있다고 느꼈고, 그래서 의과대학 교육에서 벗어나기로 결심했다. In short: it felt as if I was unable to make a meaningful impact on the development of future health care professionals and decided to move away from teaching at medical school.
내 아들은 나이를 먹었다. 그는 희귀한 증후군이라는 진단을 받았다. 복잡한 보살핌을 필요로 하는 아이를 갖는 것에 수반되는 감정들을 처리했습니다. 나는 지지와 보살핌을 받았다. 둘째를 낳아 축복받았다 저는 '특별한 도움이 필요한 엄마'로서의 제 역할을 찾았고, 제 아들을 둘러싼 보호자들과 의료 전문가들의 증가하는 네트워크를 탐색하는 방법을 배웠습니다. 그리고 저는 교육연구가, 교사 트레이너, 교육과정 혁신 자문가라는 새로운 학문적 역할을 찾았습니다. 그러다가, 저는 전혀 원활하게 실행되지 않는 '소통 능력' 모듈을 개편해달라는 요청을 받았습니다. 학생들은 시험에 합격하는 데만 집중했는데, 이것은 그들이 '쓸모가 없다'고 여기는 성찰적인 논술이었다. 수업에서는 서로에 대한 의사소통 연습을 했는데, 이는 '무익하다'와 '지루하다'는 평가를 받았다. 그래서 저는 오래된 딜레마에 봉착했습니다. 의미있는 의사소통 교육을 어떻게 하면 학생들이 공감하고 소통하는 전문가로 성장하는데 영향을 미칠 수 있을까? My son grew older. He got a diagnosis – a rare syndrome. I processed the emotions that come with having a child with complex care needs. I received support and care. I was blessed with a second (healthy) child. I found my role as a ‘special needs mother’ and learnt how to navigate the growing network of carers and health care professionals around my son. And I found a new academic role as educational researcher, teacher trainer, and advisor for curriculum innovations. In this role, I was asked to revise a ‘Communication Skills’ module, which did not run smoothly at all, with problems that I remembered from my time as a teacher. Students were only focused on passing the test, which was a reflective essay they considered to be ‘useless’. In the classes, they practiced communication on each other, which was evaluated as ‘pointless’ and ‘boring’. So there I was, confronted with an old dilemma: how to create meaningful communication education, that has an impact on the students’ development into empathic and communicative professionals?
그때가 제가 저의 직업적인 역할과 저의 개인적인 역사를 결합하기로 결심한 때입니다. 복잡한 돌봄을 필요로하는 가족의 여정을 들을 수 있다면, 복잡한 돌봄 네트워크 관리에 수반되는 정서적 롤러코스터를 학생들이 느낄 수 있다면 얼마나 값질까. 복잡한 돌봄이 필요한 아이들의 부모들에게 다가가 보니 엄청난 추진력과 열정이 느껴졌다. 그 모듈은 큰 성공을 거두었고 현재 다른 커리큘럼에서 시행되고 있다. 저는 환자의 의료 교육 참여가 미래라고 믿게 되었습니다. 학생들이 실제의, 살아 있는 경험에 귀를 기울이게 하고, 환자와 유대감을 형성하고, 환자의 여정을 따르도록 하는 것입니다. 학생들에게 감정에 대해 가르치려고 할 때, 우리는 분명히 순수하게 인지적이고 기술에 기반을 둔 경험보다는 변화적이고 중요한 학습 경험을 제공할 필요가 있다. That is when I decided to combine my professional role and my personal history. How valuable would it be for students to listen to the journey of a family with complex care needs, to feel the emotional rollercoaster that comes with managing a complex network of care? I approached parents of children with complex care needs, and was met with an enormous drive and enthusiasm. The module was a great success and is currently being implemented in different curricula. I have come to believe that patient participation in medical education is the future: getting students to listen to real, lived experiences, to form bonds with patients, to follow the patient journey. When trying to teach students about emotions, surely we need to offer transformative and significant learning experiences rather than purely cognitive and skills-based ones.
사람들이 만나서 서로의 이야기를 진실로 들어줄 때 배움이 이루어진다는 것을 믿자. 의대생들에게 딱 붙어서 떨어지지 않으며, 젊은 의사로서의 모습을 갖추게 해줄 풍부한 학습 경험을 제공함으로써, 의대생들의 자연스러운 호기심을 키워주자. 다음 검사가 무엇인지보다 무엇이 옳은 일일지를 더 신경을 쓰는 젊은 의사 말이다. 신경과 과장과 달리, 구석에 있는 걱정스러운 부모에게 말을 걸 수 있는 젊은 의사들 말이다. Let us trust that learning will take place when people meet and truly listen to each other’s stories. Let us nourish the natural curiosity of medical students by offering them rich learning experiences that are likely to stick with them and shape them as they develop into young doctors. Young doctors who care less about what will be asked at the next test and more about doing the right thing. Young doctors who might talk to the worried parent in the corner when their neurologist supervisor does not.
8년 후. 큰 대학의 교무실. 저는 열두 명의 학생들에게 의사소통에 대해 가르치고 있습니다. 교실에 손님이 오셨습니다: 제 아들과 같은 탁아소에 다니는 심각한 특수 장애를 가진 아이의 부모입니다. 학생들은 실제 인물과 상호작용하는 것에 대해 긴장하고, 평가를 받지 않더라도 잘하고 싶어한다. 그들은 그들이 원하는 모든 것을 물어보고 임신과 출생, 진단으로의 여정, 아이의 발달, 형제자매에게 미치는 영향, 진단을 받아들이는 데 관련된 감정, 아이를 둘러싼 돌봄 네트워크, 다양한 치료 및 치료 등에 대해 질문하도록 초대되었다. 그들은 철저하고 호기심 있게 부모의 인생 세계를 탐험합니다. 한 학생이 학부모를 울리는 질문을 해 그룹 내에서 눈에 보이는 불편함을 유발한다. 저는 학생들이 왜 감정이 우리를 불편하게 만드는지 탐구하도록 초대합니다. 학생들은 부모들에게 감정적인 순간 후에 무엇을 말하거나 했어야 했는지 묻습니다. 우리는 공감이라고 부르지 않고 공감에 대해 토론하고, 우리 모두는 상호작용의 영향을 느낍니다. 나중에 모든 학생들이 부모님께 감사드리고, 부모님들도 감사 드려요. 나는 세션을 닫고 만족감을 느낀다.
Eight years later. A teaching room at a big university. I am teaching twelve students about communication. We have a guest in the classroom: the parent of a child with severe special needs who goes to the same day care center as my son. The students are nervous about interacting with a real person, and want to do well, even though they won’t be assessed. They were invited to ask anything they want and ask questions about pregnancy and birth, the journey towards diagnosis, the development of the child, the impact on the siblings, the emotions involved in accepting the diagnosis, the network of care around the child, the different types of therapy and treatment, etc. They thoroughly and curiously explore the lifeworld of the parent. One student asks a question that makes the parent tear up, causing visible discomfort in the group. I invite students to explore why emotion makes us uncomfortable. The students ask the parent what they should have said or done after the emotional moment. We discuss empathy without calling it empathy, and we all feel the impact of the interaction. All students thank the parent afterwards, and the parent thanks them. I close the session and feel fulfilled.
Patient Educ Couns. 2021 Dec 7;S0738-3991(21)00781-3.
doi: 10.1016/j.pec.2021.12.004.Online ahead of print.
The sense and nonsense of communication (skills) teaching - Reflections from a patient and educator
1Amsterdam UMC, Research in Education, Faculty of Medicine, Vrije Universiteit Amsterdam, The Netherlands. Electronic address: a.delacroix@amsterdamumc.nl.
Carle Illinois College of Medicine (Acad Med, 2020) Jennifer R. Amos, PhD, William J. Pluta, PhD, Sol Roberts-Lieb, EdD, Judith L. Rowen, MD, Lexi Shurilla, MS, Robert C. Wallon, and Heather Wright
의료 교육 프로그램의 주요 내용 Medical Education Program Highlights
공학 통합: 일리노이 대학교 어바나-샴페인(Urbana-Champaign)과 칼 재단(CIMED)의 공공-민간 파트너십인 칼 일리노이 의과대학(Carle Illlinois Medicine of Medicine)은 의사-혁신가 졸업하는 것을 목표로 한다. CIMED는 이 재설계된 의과대학의 중추로서 4년 3단계 교육과정의 모든 부분에 공학을 구축했다.
1시기 임상전 과정에서는 공학 개념이 주간 문제 기반 학습(PBL) 사례와 의료 엔지니어링 발견 및 혁신(MEDI) 실험실 세션을 통해 짜여진다.
2시기 임상실습은 "엔지니어링 파트너" 교직원이 매주 학생들과 회진하여 잠재적 엔지니어링/기술/설계 솔루션의 문제를 파악하고, 이를 혁신, 설계, 엔지니어링 및 분석(IDEA) 과정에서 개발하고 해결합니다.
Capstone 및 Data Science Project 과정은 3단계의 일부이다.
Engineering integration: Carle Illinois College of Medicine (CIMED), a public–private partnership between the University of Illinois at Urbana–Champaign and the Carle Foundation, aims to graduate physician–innovators. As the backbone of this reenvisioned medical school, CIMED built engineering into every part of its 4-year, 3-phase curriculum.
In Phase 1 preclinical courses, engineering concepts weave through weekly problem-based learning (PBL) cases and Medical Engineering Discovery and Innovation (MEDI) laboratory sessions.
In Phase 2 clinical clerkships, an “engineering partner” faculty member rounds with students weekly to identify problems with potential engineering/technology/design solutions, which students then develop and address in the Innovation, Design, Engineering and Analysis (IDEA) course.
Capstone and Data Science Project courses are part of Phase 3.
초기 임상노출: 학생들이 의과대학 1학년 동안 지역사회 기반 강사와 매주 세션에 참석함에 따라 임상노출이 즉시 시작됩니다. 종단적 가정의학 임상실습은 2학년을 시작하는 7월에 시작한다. 임상실습 기간 동안, 학생들은 저녁 진료소에서 교수진의 감독을 받는 주요 제공자이다. 학생들은 18개월 동안 매주 클리닉 세션을 진행하며 전화 앱을 통해 임상 기술을 직접 관찰함으로써 매주 피드백을 받는다. Early clinical exposure: Clinical exposure begins immediately as students attend weekly sessions with a community-based preceptor for the first year of medical school. A longitudinal family medicine clerkship begins in July to start year 2. During the clerkship, students are the primary providers with faculty oversight in an evening clinic. The students have clinic sessions weekly for 18 months and receive weekly feedback from direct observation of clinical skills via a phone app.
혁신적인 입학 절차: 양적 역량은 성적증명서나 직장 경험으로부터 분명해야 합니다. 입학을 위해 캠퍼스 내 면접은 필요하지 않습니다. 학생들은 CIMED의 "4C"를 반영한 포트폴리오를 만듭니다: 역량, 호기심, 동정심, 창의성.화상 인터뷰는 협업과 다양성을 포함한 다른 CIMED 가치를 조사합니다. 2018년 7월 칼리 일리노이 대학교 1학년에 입학했다. Innovative admissions process: Quantitative competencies must be evident from transcripts or workplace experiences. No on-campus interview is required for admission. Students produce a portfolio reflecting CIMED’s “4Cs”: competence, curiosity, compassion, and creativity. A video interview probes other CIMED values including collaboration and diversity. Carle Illinois’ first class matriculated in July 2018.
빈번하고 다양한 평가: CIMED의 의학 교육 프로그램은 빈번한 인출연습의 기회를 제공한다.
1시기 전반에 걸쳐 학생들은 매주 자신의 의학 지식을 평가하고 즉각적인 피드백을 받는 퀴즈를 치른다.
팀 기반 학습(TBL)은 개별 인출과 팀 토론의 기회를 제공하는 1단계 과정 전반에 걸쳐 사용된다.
또한 1시기 평가에는 42개의 OSCE 스테이션, 4개의 해부학 실습 및 간격을 둔 인출을 지원하도록 설계된 5개의 발달시험progress test가 포함됩니다.
2시기에서는 '위탁 가능한 전문 활동'과 연계된 학생의 역량을 평가하기 위한 진도 OSCE 프로그램이 사용된다.
Frequent and varied assessment: The medical education program at CIMED provides frequent opportunities for student retrieval practice.
Throughout Phase 1 of the curriculum, students take weekly quizzes that assess their medical knowledge and receive immediate feedback.
Team-based learning (TBL) is used in courses throughout Phase 1, which provides opportunities for individual retrieval and team discussion.
Phase 1 assessment also includes 42 OSCE stations, 4 anatomy lab practicals, and a series of 5 progress exams that are designed to support spaced retrieval.
In Phase 2 of the curriculum, a progress OSCE program is used to assess student competencies that are linked to Entrustable Professional Activities.
커리큘럼 Curriculum
커리큘럼 설명 Curriculum description
CIMED 커리큘럼은 4년 동안 3단계로 구성되어 있다: 18개월 전 임상 1상, 12개월 임상 사무직 2상, 캡스톤 및 데이터 과학 프로젝트, 임상 선택, 경력 개발 3상. The CIMED curriculum consists of 3 phases in 4 years: an 18-month preclinical Phase 1; a 12-month clinical clerkship Phase 2; and Capstone and Data Science Projects, clinical electives, and career development in Phase 3.
칼 일리노이는 의대생 교육을 위한 AAMC 학습 목표, ABET, Inc.의 세 가지 프레임워크를 결합한 목표를 채택하기로 결정했다. 학생 학습 결과 및 KEEN(Kern Entrepreneural Engineering Network) 교육 결과. 이 프레임워크는 대학의 미션과 핵심 역량에 부합하는 목표를 채택하기 위해 결합되었다. Carle Illinois chose to adopt objectives combining 3 different frameworks:
the AAMC Learning Objectives for Medical Student Education,
It combined these frameworks to adopt objectives that aligned with the college’s mission and core competencies.
특히, 이 대학은 의사-혁신자를 위한 공학 및 혁신 학습 목표를 반영하는 목표를 추가했다. ABET는 공학, 컴퓨팅, 기술 및 응용 과학 학위를 인가하는 인증 기관입니다. ABET 학생 성과는 모든 공학 학위 및 엔지니어로서의 전문 자격증 취득에 필요합니다. KEEN 교육 성과는 또한 엔지니어링 교육 프로그램에 널리 사용되며 ABET 목표에 도입된 엔지니어링 및 설계 기술의 적용을 강화하고 혁신을 촉진하는 데 도움이 된다. In particular, the college added objectives that reflected engineering and innovation learning goals for physician–innovators. ABET is an accreditation agency that accredits engineering, computing, technology, and applied science degrees. ABET student outcomes are required for all engineering degrees and professional licensure as an engineer. KEEN educational outcomes are also widely used in engineering educational programs and help reinforce application of engineering and design skills introduced in the ABET objectives, as well as foster innovation.
교육학 Pedagogy
PBL: Carle Illinois 학생들은 1단계 동안 일주일에 세 번의 2시간 PBL 세션에 참여합니다. 이 세션은 기초 과학, 임상 실습 및 엔지니어링 기술을 통합하는 사례에 초점을 맞춥니다. CIMED만의 독특한 점은 "혁신가" 역할의 추가이다; 한 학생은 사례에서 임상적으로 관련된 요구를 확인하고 가능한 새로운 해결책에 대한 토론을 이끈다. CIMED의 자랑거리는 PBL 세션을 촉진하고 1단계 전반에서 연속성을 제공하는 전임 교수진을 보유한 것입니다. PBL: Carle Illinois students participate in three 2-hour PBL sessions per week during Phase 1. These sessions focus on cases that integrate foundational science, clinical practice, and engineering skills. Unique to CIMED is the addition of an “innovator” role; one student identifies a clinically relevant need from the case and leads a discussion of possible novel solutions. A point of pride at CIMED is having full-time faculty who facilitate the PBL sessions, providing continuity across Phase 1.
TBL: CIMED의 주요 교육학은 PBL이지만, 컨텐츠와 기술 지식을 구축하고 굳히기 위해 추가적인 실습이 사용됩니다. 이러한 실습은 저널 클럽, TBL, 사례 검토, 강의의 형태를 취합니다. 첫 번째 과정에서는 TBL이 자주 사용되며 나머지 1단계에서는 과정당 평균 1~2 TBL 세션을 사용합니다. TBL: While the primary pedagogy at CIMED is PBL, additional practices are used to build and solidify content and skill knowledge. These practices take the form of journal clubs, TBL, case review, and lecture. TBL is used often in the first course and then averages 1 to 2 TBL sessions per course for the remainder of Phase 1.
실습: 학생들은 기존의 시신 기반 해부 실습 외에도, 의학적으로 관련된 환경에서 공학적 원칙의 적용을 입증하는 MEDI 실험실 세션을 경험한다. 예를 들어, 천식 생리를 복제하는 폐 모델의 설정에서 에어로졸 입자 크기와 분포 패턴을 검토했다. Laboratory: In addition to traditional cadaver-based anatomy laboratories, students experience MEDI laboratory sessions demonstrating the application of engineering principles in medically relevant settings. For example, aerosol particle size and distribution patterns were reviewed in the setting of a lung model replicating asthma physiology.
몰입형 프로젝트:
1단계의 후반부에서 MEDI 세션은 그룹 프로젝트를 포함한다.
2단계 IDEA 프로젝트 과정에서는 학생들이 환자 및 의료 시스템 문제를 파악하고 기술적 해결책을 제안합니다.
3단계에서는 IDEA 프로젝트 중 하나가 학생의 캡스톤 프로젝트로 선택되며, 개발의 프로토타이핑 단계를 통해 학제 간 팀이 이를 추구합니다. 학생들은 또한 3단계에서 대규모 데이터 세트를 분석하여 인간의 건강 문제에 적용할 수 있는 데이터 과학 프로젝트를 완료합니다.
Immersive projects:
In the latter portion of Phase 1, the MEDI sessions include group projects.
In the Phase 2 IDEA Projects course, students identify patient and health care system problems and propose technological solutions.
In Phase 3, one of the IDEA projects is selected as the student’s capstone project; this is pursued in an interdisciplinary team through the prototyping stage of development. The students also complete a data science project in Phase 3, analyzing large data sets for application to human health concerns.
시뮬레이션 및 가상 현실:
표준화된 환자, 작업 트레이너, 충실도가 높은 마네킹 및 가상/증강 현실 활동이 과정 작업에 엮여 있다. 초음파 훈련에는 공학적 원리에 대한 탐구뿐만 아니라 영상의 획득과 해석을 포함한다. 학생들은 초음파 및 기타 시술 기술에 대한 능력을 시험 받는다.
Simulation and virtual reality:
Standardized patients, task trainers, high-fidelity manikins, and virtual/augmented reality activities are woven into coursework. Ultrasound training includes exploration of the engineering principles as well as the acquisition and interpretation of images. Students are tested to competence in ultrasound and other procedural skills.
임상 경험 Clinical experiences
Carle Illinois 학생들은 대부분의 훈련을 지역사회 기반 돌봄 환경에서 한다. 학생들이 훈련하는 주요 병원은 433병상 1레벨 외상센터인 칼 파운데이션 병원이다. 칼병원과 연관된 22개의 외래 환자 시설 외에도 학생들은 210병상 규모의 개인 병원뿐만 아니라 지역 내과의사가 소유한 클리닉 시스템을 통해 돌아가며 진료한다. Carle Illinois students do most of their training in community-based care settings. The primary hospital where students train is Carle Foundation Hospital, a 433-bed, Level I Trauma Center. In addition to the 22 outpatient facilities that are associated with Carle Hospital, students rotate through a local physician-owned clinic system, as well as a 210-bed private hospital.
첫 해에 학생들은 임상 통합에 초점을 맞춘 1년 과정의 혜택을 받는다. 강의와 시뮬레이션을 통해 학생들은 임상 환경에 참여하는 데 필요한 기술을 점진적으로 개발한다. 학생들은 지역사회의 전담 교사를 찾아가 학습자의 주간 스킬 개발 정도를 평가한다. Carle Illinois 학생들은 직접적인 관찰과 시기적절하고 집중적인 피드백으로부터 이익을 얻는다. In the first year, students benefit from a yearlong course focused on clinical integration. Through didactics and simulation, students progressively develop the skills necessary to engage in the clinical environment. Students visit a dedicated preceptor in the community who assesses the learner’s development of their weekly skill. Carle Illinois students benefit from direct observation and timely, focused feedback.
필요한 종적 경험 Required longitudinal experiences
CIMED에서 종적 경험은 3개의 시기 중 2개에 짜여져 있다.
1단계 중 1단계에서는 임상 실습 입문 과정에 등록하며, 임상 기술을 개발하는 데 초점을 맞춘 1년 과정이다.
1단계 2학년부터 학생들은 6개월 간의 가정의학 임상실습을 시작한다. 이 사무직은 매주 학생 클리닉뿐만 아니라, 걸어다니는 가정의학과 로테이션를 포함한다.
학생 클리닉은 2단계 3학년까지 계속됩니다.
Longitudinal experiences are woven into 2 of the 3 curricular phases at CIMED.
In year 1 of Phase 1, students are enrolled in the Introduction to Clinical Practice course, a yearlong course that focuses on the development of clinical skills; the course includes weekly sessions in a community physician’s practice.
Starting in year 2 of Phase 1, students begin a 6-month family medicine clerkship. This clerkship includes ambulatory family medicine rotations, as well as a weekly student clinic.
The student clinic continues through year 3 of Phase 2.
커뮤니티 기반 필수 및 선택 순환 Required and elective community-based rotations
1단계는 "디스커버리"라는 제목의 6주 선택 기간을 포함하고 있으며, 학생들은 다양한 선택권을 가지고 있으며, 많은 글로벌 경험을 선택한다. 칼리 일리노이주 학생들은 가정의학과, 내과, 외과, 정신과, 신경과, 산부인과, 소아과 등 7개의 필수 임상실습을 가지고 있다. 가정의학은 지역사회에 기반을 두고 있으며, 정신의학, 내과, 산부인과 사무직은 칼 재단 병원 밖의 지역사회에서 발생할 수 있는 부분을 가지고 있다. 졸업을 위해서는 총 28주간의 선택elective 경험이 필요하다;대부분은 지역사회에 기반을 두거나 지역사회 현장에서 발생하는 부분을 가지고 있다. Phase 1 includes a 6-week elective period titled “Discovery,” where students have multiple options, with many selecting global experiences. Carle Illinois students have 7 required clerkships: family medicine, internal medicine, surgery, psychiatry, neurology, obstetrics–gynecology, and pediatrics. Family medicine is community based, and the psychiatry, internal medicine, and obstetrics–gynecology clerkships have portions that may occur in community locations outside of Carle Foundation Hospital. A total of 28 weeks of elective experience is required for graduation; many are community based or have portions that occur at community sites.
의대생 임상 경험을 설계하고 구현하는 데 있어 어려움 Challenges in designing and implementing clinical experiences for medical students
다른 새로운 의과대학들과 마찬가지로 CIMED는 임상경험의 발전에 있어서 몇 가지 장애물에 직면했다. 1년차 임상몰입 프로그램이 탄탄한데다 연중 운영되는 종적 학생클리닉까지 있어 새로운 임상교수를 모집하고 승선시키는 것은 쉽지 않은 과제였다. 또한 Urbana-Champaign은 2022년까지 일리노이 대학교 의과대학의 지역 캠퍼스이며, 두 기관의 학습자들의 요구가 균형을 이루어야 한다. Similar to other new medical schools, CIMED faced some hurdles in the development of its clinical experiences. With a robust clinical immersion program in the first year, as well as a longitudinal student clinic that runs year-round, recruiting and onboarding new clinical faculty was a challenge. Additionally, Urbana–Champaign is a regional campus for the University of Illinois College of Medicine through 2022 and the needs of learners from both institutions must be balanced.
커리큘럼 거버넌스 Curricular Governance
커리큘럼 거버넌스 위원회: 교육과정 감독위원회는 CIMED 미션에 충실하며, 공학도 3분의 1과 기초과학도 3분의 1 그리고 임상 경력이 있는 3분의 1이 있다. 위원회는 3단계에 걸쳐 모든 과정의 검토와 승인을 보고 참여한다. 위원회는 효율적인 심사가 가능하도록 사전심사분과위원회, 사무분과위원회, 엔지니어링분과위원회, 프로그램평가분과위원회 등 4개 분과위원회로 나뉜다. 각 소위원회는 제안서를 상세히 검토한 후 더 큰 위원회의 승인을 위해 검토서를 제출한다. 또한 대학 내 직원, 교수, 학생, 교직원이라면 누구나 위원회 의견을 위한 자료를 제출하거나 공개 회의에 참석할 수 있습니다. 이 과정을 통해 교수진이 행정처의 영향력 없이 교육과정을 통제하고 모든 이해관계자가 위원회에 동등한 접근 권한을 부여해 제안서를 제출할 수 있다. Curriculum governance committees: The Curriculum Oversight Committee is true to the CIMED mission with one-third of members from engineering; one-third of members from basic science; and one-third of members with clinical backgrounds, none of which hold an administrative title in the college. The committee sees and participates in review and approval of all courses throughout the 3 phases. To facilitate efficient review, the committee is split into 4 subcommittees: the Preclerkship Subcommittee, Clerkship Subcommittee, Engineering Subcommittee, and Program Evaluation Subcommittee. Each subcommittee does detailed review of proposals and then presents its review for endorsement of the larger committee. In addition, any administrator, faculty, student, or staff member in the college is welcome to submit materials for committee input or attend any of the public meetings. This process ensures that faculty control the curriculum without influence from the administration and that all stakeholders have equal access to the committee to submit proposals.
부서 주도 거버넌스: 공공-민간 파트너십으로서 CIMED는 독특한 교수 모델을 가지고 있다. 많은 학교와 마찬가지로, 임상 교수진들은 보건 시스템(칼 재단 또는 다른 지역사회 파트너)에 의해 고용되고 CIMED에 임명된다. 칼리 일리노이는 기초 이공계 교수들에게도 비슷한 제도를 따르고 있다. 이 대학은 일리노이 대학 캠퍼스의 풍부한 콘텐츠 전문 지식을 활용한다. CIMED에는 임상 과학, 생의학 및 중개과학 두 개의 학과가 있다. 각 학과는 임명, 승진 및 종신 재직권 위원회를 유지하며 대학 수준에서 공유 지원 서비스에 액세스합니다.
Department-led governance: As a public–private partnership, CIMED has a unique faculty model. As in many schools, the clinical faculty are employed by the health system (Carle Foundation or other community partners) and have appointments at CIMED; key personnel such as clerkship directors and course directors have designated FTE contributions to the school. Carle Illinois follows a similar system for its foundational science and engineering faculty; the faculty retain appointments in their home college, and course directors have designated effort in CIMED. The college draws on the wealth of content expertise on the University of Illinois campus. There are two departments within CIMED: Clinical Sciences, and Biomedical and Translational Sciences; the department chairs oversee faculty efforts dedicated to CIMED and report to the dean. Each of the departments maintains an Appointment, Promotions, and Tenure Committee and accesses shared support services at the college level.
교육 담당자 Education Staff
과정 설계: 모든 1단계 과정은 기초과학자, 임상의, 엔지니어 등 최소 3명의 교수진이 설계한다. 교육 담당 직원은 지원 소프트웨어 관리, 테스트 프로그램 및 과정 전달을 포함하여 커리큘럼 개발 및 전달의 모든 측면을 지원합니다. 각 과정 위원회에는 교수진 또는 직원이 임명됩니다. Course design: All Phase 1 courses are designed by a minimum of 3 faculty: a basic scientist, clinician, and engineer. Academic affairs staff support all facets of curriculum development and delivery, including management of the supporting software, testing programs, and course delivery. An academic affairs faculty or staff member is appointed to each course committee.
Academic staff의 역할: Carle Illinois는 교육과정을 완전히 지원하기 위한 다양한 역할을 합니다. 여기에는
의료 교육 촉진자(PBL);
교육과정, 교수진 개발 및 평가 및 품질 향상을 위한 디렉터;
학무 조정자,
의료 교육 조정자(임상, 기초 과학),
의료 사서,
시뮬레이션 센터 직원(관리자, 장비 기술자, 시뮬레이션 환자 조정자),
엔지니어링/IDEA/데이터 과학/캡스톤 조정자
임상실습 조정자
이 직원들은 CIMED의 가치와 사명에 따라 커리큘럼이 생성, 개발, 전달될 수 있도록 교수진과 협력합니다.
Roles of academic staff: Carle Illinois has various roles to fully support the curriculum. These include:
medical education facilitators (PBL);
directors for curriculum, faculty development, and assessment and quality improvement;
academic affairs coordinator;
medical education coordinators (clinical, basic science);
medical librarians;
simulation center staff (manager, equipment technician, simulated patient coordinator);
engineering/IDEA/data science/capstone coordinator; and
clerkship coordinators.
These staff work with the faculty to ensure the curriculum is created, developed, and delivered according to the values and mission of CIMED.
교육분야 교수진 육성 및 지원 Faculty Development and Support in Education
교육자로서 교수진을 위한 전문성 개발: CIMED에는 교수진의 전문성 개발을 위한 다양한 옵션이 있습니다. 진행자, 임상 강사, 엔지니어 및 관리 직원과 같은 모든 역할에 대한 특정 교육이 제공됩니다. "칼 일리노이 소개 - 무엇이 CIMED를 독특하게 만드는가.""라는 제목의 소개 프레젠테이션이 있습니다. 매년 열리는 교육과정 리트리트는 교육과정 업데이트, 새로운 기술 학습, 네트워크 구축에 초점을 맞춘다. 프레젠테이션, 활발한 학습 세션 및 워크샵이 혼합된 것이 특징이다. 또 다른 연례 행사인 PBL 워크숍에서는 모든 교직원이 학생이자 촉진자로서 PBL을 경험할 수 있습니다. 교수진은 학습목표 작성, 마이크로 강의 녹음, 활발한 학습활동 등과 같은 작업에 대한 도움을 받기 위해 일대일 세션을 요청할 수 있습니다. 또한 일리노이 대학교 어바나 샴페인에는 광범위한 교수개발 서비스가 있다. Professional development for faculty as educators: There are a variety of options at CIMED for faculty professional development. Specific training is available for all roles: facilitators, clinical instructors, engineers, and administrative staff. There is an introductory presentation titled “Introduction to Carle Illinois—What Makes CIMED Unique.” An annual curriculum retreat focuses on curricular updates, learning new skills, and network building. It features a mix of presentations, active learning sessions, and workshops. Another annual event, the Problem-Based Learning Workshop, allows all faculty and staff to experience PBL as both a student and facilitator. Faculty may request one-on-one sessions for assistance with tasks such as creating learning objectives, micro-lecture recordings, active learning activities, and so forth. Additionally, the University of Illinois at Urbana–Champaign has extensive faculty development offerings.
승진 및 테뉴어: 임상의와 캠퍼스 교직원 모두를 지원하기 위해, FTE 역할이 정의된 교수진 외에도 임명, 승진, 종신 재직에 대한 다양한 트랙이 있습니다. 여기에는 교육, 임상 및 재직권 기록이 포함됩니다. 이들 각 트랙에는 승진을 고려한 학생 평가와 장학금이 포함돼 있다. Promotion and tenure: To support both the clinicians and campus faculty, in addition to the faculty with defined FTE roles, there are various tracks for appointment, promotion, and tenure. These include teaching, clinical, and tenure tracks. In each of these tracks, student evaluation and scholarship are included in consideration for promotion.
Acad Med. 2020 Sep;95(9S A Snapshot of Medical Student Education in the United States and Canada: Reports From 145 Schools):S142-S145.
맥락 속의 자기조절학습: 자기-, 공동-, 사회적으로 공유된 학습의 조절(Med Educ, 2021) Putting self-regulated learning in context: Integrating self-, co-, and socially shared regulation of learning Derk Bransen1 | Marjan J. B. Govaerts2 | Ernesto Panadero3,4 | Dominique M. A. Sluijsmans5 | Erik W. Driessen2
1 소개 및 문제 설명 1 INTRODUCTION AND PROBLEM STATEMENT
양질의 의료 및 평생 학습과의 긍정적인 연관성 때문에 의료 전문가들이 학습을 조절regulate할 필요성이 널리 인정되고 있다. 예를 들어, 의료 분야에서 높은 표준을 보호하려면 의사가 지속적으로 빠르게 변화하는 의료 관행에서 이뤄지는 발전을 모니터링하고, 적절한 학습 기회를 개인 학습 요구 및 학습 목표에 맞춰야 합니다.3 따라서 의사는 역량을 개발하고 유지하기 위해 자기조절학습(SRL)에 참여해야 한다. 일반적으로, 자기 조절 학습자는 "자신의 학습에 메타인지적, 동기 부여적, 행동적으로 적극적인 참여자"로 간주된다. 목표를 추구하며 목표를 달성하기 위해 이러한 목표에 부합하는 전략을 설계 및 실행하고, 목표를 향한 진행을 모니터링하며, 성찰과 (해당되는 경우) 새로운 학습 목표를 수립합니다. The necessity for healthcare professionals to regulate their learning is widely acknowledged due to positive associations with high-quality healthcare and lifelong learning.1,2For example, safeguarding high standards in healthcare requires physicians to monitor relevant developments in continuously and rapidly changing healthcare practices and to align appropriate learning opportunities with personal learning needs and learning goals.3Hence, physicians have to engage in self-regulated learning (SRL) to develop and maintain competence.4Generally, self-regulated learners are considered to be “meta-cognitively, motivationally, and behaviourally active participants in their own learning”.5In pursuit of and committed to their goals, they design and implement strategies aligned with these goals, monitor progression towards these goals, followed by reflection and – when applicable – formulation of new learning goals.6,7
교육 및 실습과의 관련성 때문에, 그리고 SRL 기술은 가르치고 배울 수 있기 때문에, 보건의료전문직 커리큘럼은 학생들의 SRL 개발을 지원하고 촉진하기 위한 요소를 구축한다. 예를 들어 많은 커리큘럼이 진도를 성찰하거나 개인 학습 계획을 수립하도록 자극하거나 요구하는 포트폴리오 시스템을 구현하거나, 학생의 자기주도성을 자극하기 위해 문제 기반 학습 원리를 포함한다. 연구 결과는 꾸준히 개인의 학습과 전문성 개발을 조절하는 능력이 긍정적인 결과와 연관되어 있다는 것을 보여준다. 예를 들어, SRL은 의대생들의 임상 기술 성과, 그들의 전반적인 학업 성취도, 그리고 학생들의 안녕과 긍정적으로 연관되어 있다. 다만 보건직 교육·연구가 학생들을 적절히 실습준비를 시키고, 전문직 종사자들이 역량을 유지·개발할 수 있도록 돕기 위해 자신을 뛰어넘을 필요와 책임이 있다고 주장한다. Because of its relevance for education and practice, and as SRL skills can be learnt and therefore taught, health professions curricula build in elements to support and facilitate the development of students’ SRL.8-10For example, many curricula implement portfolio systems that stimulate or require students to reflect on progress and formulate personal learning plans,11or include problem-based learning principles to stimulate students’ self-directedness.12,13Research findings consistently show that the ability to regulate one's learning and professional development is associated with positive outcomes.14For example, SRL has been related positively to medical students’ clinical skill performance,15,16their overall academic achievement,17and student well-being.18However, we argue that there is a need and responsibility for health professions education and research to look beyond the self in order to adequately prepare students for practice, and to help professionals maintain and develop competence.
보건 직업 교육(및 보건의료 실습)은 전통적으로 [개인]에 초점을 맞추고 있다. 교육은 광범위한 개인 평가 후 개별적으로 자격을 부여하고, 개인 수준에서 학습 과정과 활동을 규제하도록 가르치는 [개인 학습자]에게 초점을 맞추고 있다. 보건직 교육은 교육과정과 평가 틀에 '협업'과 같은 역량 영역을 포함시킴으로써 개인을 뛰어넘는 것을 목표로 한다고 주장할 수 있다. 그러나 '협력자collaborator' 역할을 '최적의 환자 진료를 달성하기 위해 의료 팀 내에서 효과적으로 일하는 것'으로 설명하면서도, 그 숙련도는 (비록 협력 상황에서 평가되더라도) 여전히 개인의 성과에 기초한다. Health professions education (and healthcare practice, for that matter) has traditionally been characterised by a focus on the individual; education focuses on individual learners whom we licence individually after extensive individual assessment, and whom we teach to regulate their learning processes and activities on an individual level.19One might argue that health professions education aims to move beyond the individual by including competency domains such as “Collaboration” in curriculum and assessment frameworks.20However, while described as ‘effectively working within a healthcare team to achieve optimal patient care’, learners’ proficiency as collaborators is still primarily based on their individual performance, even when evaluated in collaborative situations.21
그러나 오늘날의 의료 서비스는 점점 더 팀 기반화되어 의료 팀에 의해 제공되고 있으며, 종종 전문 분야와 전문 분야를 넘나들며 협업하는 의료 전문가들로 구성됩니다. 보건 직업 교육의 주요 목적은 학생들이 이러한 협력적 실습을 할 수 있도록 준비하는 것이기 때문에, '학습의 조절'이라는 개념이 의료 팀에서 학습하고 일하는 조직의 요구와 일치하도록 하는 것이 필수적이다.
Notwithstanding, present-day healthcare is increasingly team-based, delivered by healthcare teams, often consisting of healthcare professionals collaborating across specialities and professions.22,23As the main purpose of health professions education is to prepare students for this collaborative practice, it is essential that conceptualisations of regulation of learning align with the organisation and demands of learning and working in healthcare teams.
양질의 의료 서비스를 제공하는 데 있어, [헬스케어 팀]에 대한 의존도가 높아짐에 따라, HPE 연구는 '집단 역량'의 개념을 탐구하기 시작했다. 집단적 역량의 본질은 [전체는 그 부분의 합보다 더 많을 수 있고(또는 덜할 수 있다)]는 것에 있다. 또한 집단적 역량이란 '역동적, 상황-의존적, 분산적 역량으로서, 특정한 한 명의 구성원의 기여를 역추적하기 어렵다'는 것과도 관련이 있다. 다시 말해, '팀원 한 명이 무능하더라도 팀은 유능할 수 있고, 유능한 개인을 모아서 무능한 팀을 구성할 수 있다'는 것이다. 개별 의사의 역량을 보장하는 것이 필수적이며 여전히 중요하지만, 고품질의 의료 서비스를 제공하기 위해서는 의료 팀의 [집단적 역량]에 대한 보장이 필요합니다. Geared to the growing reliance on healthcare teams for high-quality healthcare delivery, health professions education research has started to explore the concept of collective competence.22-24The essence of collective competence is that the whole can be more (or less, for that matter) than the sum of its parts, and relates to the ‘dynamic, context-dependent, distributed capacity of a team, which is difficult to trace back to any one individual team member’.25In other words, ‘teams can be competent when one team member is incompetent, and competent individuals can form an incompetent team’.19Although ensuring an individual physician's competence is and remains essential, providing high-quality healthcare thus requires assurance of the healthcare team's collective competence.
집단 역량을 유지하고 발전시키기 위해서는 의료 팀이 지속적인 [협력적 학습]에 참여할 수 있어야 합니다. [협력적 학습collaborative learning]은 [공동의 목표를 가진 팀원들이, 목표를 달성하기 위해, 그리고 일련의 통합된 실천을 발전시키기 위해, 공유된 과제의 특징에 대해 상호작용할 때 발생하는 학습]을 말한다. 이와 같이, 협력 학습은 개인을 넘어 팀 구성원들 간의 [상호 의존성]을 강조한다. 예를 들어, 협업 학습은 외상 팀의 의료 제공 평가 중, 외과 팀이 새로운 기술을 구현하기 시작할 때, 또는 학생이 학습 과제를 수행하는 데 협업할 때 발생할 수 있다. 협력적 학습이 필수적이라고 여겨질 때마다, 팀이 스스로 학습을 조절하는 능력도 마찬가지로 중요해진다. 양질의 돌봄이 의료팀의 협력적 학습에 달려 있음에 동의한다면, [집단적 역량을 개발하고 유지하는 데 효과적인 학습의 조절을 어떻게 촉진할 것인가]에도 초점을 맞춰야 한다는 얘기다.
To maintain and develop collective competence, it is essential that healthcare teams are able to engage in ongoing collaborative learning. Collaborative learning refers to learning that occurs when team members who have a collective goal interact about features of their shared tasks in order to attain their goals and by means of which they develop a set of integrated practices.26,27As such, collaborative learning stretches beyond the individual and emphasises the interdependence among team members.28Collaborative learning may, for example, occur during trauma teams’ evaluation of healthcare delivery, when surgical teams start implementing new technology, or when students collaborate in performing learning tasks. Whenever collaborative learning is considered essential, the team's ability to regulate their learning becomes of equal importance. In other words, if we agree that high-quality care hinges upon collaborative learning in healthcare teams, we should also focus on how to foster effective regulation of learning in order to develop and maintain collective competence.
2 학습조절의 개념화 2 CONCEPTUALISATIONS OF REGULATION OF LEARNING
2.1 자기조절학습: 개인에 집중하기 2.1 Self-regulated learning: Focus on the individual
연대순으로, 학습의 조절에 대한 이론에서 처음 등장한 개념은 자기 자신, 즉 개별 학생이나 전문가가 개인 학습을 어떻게 규제하는가에 초점을 맞췄다. 학습의 조절을 개념화하려는 초기 시도들 중 일부는 1980년대 후반 짐머만과 Boekaerts에 의해 이루어졌으며, 그 이후로 SRL 모델이 적용, 확장 및 추가 연구에 사용되었다. 첫 번째 SRL 모델은 (메타)인지적, 동기부여적, 감정적 측면을 강조하는 개인 내의 과정을 학습 규제의 운영양식modus operandi으로 분류했다. 결과적으로, 자기조절학습에 관심이 있는 연구자들은 [개인 내에서 일어나는 과정을 분석 단위로] 초점을 맞췄다. 마찬가지로, SRL에 대한 연구의 대부분은 (의료 교육의 맥락 내외 모두에서) 자가 보고 데이터 수집을 통해 수행된다. [개인에 초점]을 맞춘 의료(교육) 환경에서 학습조절에 대한 연구는 개별화된 학습 계획 및 성과 자체 모니터링과 같은 SRL의 하위 구성요소에 초점을 맞춘 연구에 반영된다. Chronologically, the first conceptualisations in the regulation of learning theory focussed on theself, that is, on how an individual student or professional regulates his or her individual learning. Some of the earliest attempts to conceptualise the regulation of learning were made in the late 1980s by Zimmerman5,29and by Boekaerts,30,31with their SRL models having been adapted, expanded, and used for further research ever since.10The first SRL models labelled processeswithinthe individual – varying in their emphasis on either (meta)cognitive, motivational, or emotional aspects – as modus operandi of regulation of learning. Consequently, researchers interested inself-regulation of learning focussed on processes within the individual as the unit of analysis.32Likewise, the majority of research (both within and outside the context of healthcare education) into SRL is conducted through collecting self-reported data.33Research on regulation of learning within healthcare (educational) settings with a strong focus on the individual is reflected in studies focussing on sub-components of SRL such as individualised learning plans,34-37and self-monitoring of performance.38-40
2.2 공동 조절 학습: 개인과 컨텍스트 간의 상호 작용에 초점을 맞춥니다. 2.2 Co-regulated learning: Focus on interaction between individual and context
학습 조절의 초기 개념화(즉, "자기"조절학습)는 개별 학습자 내에서의 과정을 강조했지만, 1990년대 말, 공동조절학습(CRL)이라는 용어가 [학습 조절에 대한 사회적, 맥락적 영향]을 포착하기 위해 만들어졌다. CRL의 개념은 학습자의 인식, 정서, 학습 동기가 환경에서 타인과의 사회적 상호작용을 통해 어떻게 매개되는지에 초점을 맞춘 사회문화학습이론에서 나왔다. 따라서 CRL은 [학습조절을 제대로 설명하려면, 개인 내부의 조절 과정을 넘어서야 한다는 개념]을 기반으로 하며, CRL의 분석 단위는 항상 개인과 (다른) 맥락 사이의 상호작용이다. 보다 구체적으로, CRL은 '공동조절자co-regulator'가 '피-공동조절자co-regulated'의 조절를 안내하는 조절과정과 활동에 대한 비호혜적non-reciprocal 참여를 의미한다. While early conceptualisations of regulation of learning (ieself-regulation of learning) emphasise processes within the individual learner, the term co-regulated learning (CRL) was coined in the late 1990s to capture the social and contextual influences on the regulation of learning.41-43The concept of CRL emerged from sociocultural learning theoriesthat focus on how learners’ cognitions, emotions, and motivation for learning are mediated through social interactions with others in the environment.41CRL thus builds on the notion that we need to go beyond regulatory processes within the individual in order to describe the regulation of learning satisfactorily, and the unit of analysis in CRL always is the interaction between the individual and (others in) the context.32More specifically, CRL refers to non-reciprocal engagement in regulatory processes and activities, with the ‘co-regulator’ guiding the regulation of the ‘co-regulated’.
따라서 개념적으로 CRL은 [한 명 또는 여러 명의 집단 구성원이 집단 내 다른 개인의 학습 활동을 조절]한다는 점에서['불균등하게 퍼져있는unevenly distributed' 형태의 사회적 조절]로 간주된다. CRL의 필수 요소는 학습자 또는 전문가 간의 사회적 상호 작용입니다. 이 상호작용은 (학습의 조절과 관련된 과정을 포함하여) 학습 프로세스를 매개한다. 즉, '공동조절자co-regulator'는 타인의 조절활동(목표 설정, 성과 모니터링, 성찰 등)에 관여함으로써 '피공동조절자co-regulated'의 메타인지 및 인지활동을 매개mediates(즉, 공동조절)하고, 그 결과 학습 프로세스의 조절에 영향을 미칩니다. 공동조절자가 CRL을 촉발하는 방법으로는, 요약을 해주거나, 정보를 요청하거나, 설명을 하거나, 패러프레이징을 하거나, 학습에 대한 판단을 요구하거나, 사고와 성찰에 대한 자극을 주는 것 등이 있다. 상자 1은 예를 제공합니다.
Conceptually, CRL is therefore considered an ‘unevenly distributed’ form of social regulation, in that a single or multiple group member(s) regulate(s) the learning activities of other individuals in the group.44Essential to CRL are social interactions between learners or professionals through which their learning processes, including processes relevant for the regulation of their learning, are mediated.45,46Thus, through engaging in others’ regulatory activities – such as goal setting, performance monitoring, and reflection – the ‘co-regulator’ mediates (ie co-regulates) the metacognitive and cognitive activities of the ‘co-regulated’, thereby influencing the regulation of his or her learning processes.41,45Students or professionals can trigger CRL by summarising, requesting information, or giving explanations,47 or through paraphrasing, requesting judgements of learning, giving prompts for thinking and reflection.41Box 1provides an example.
BOX 1. 수술 후 상처를 봉합하는 방법을 배우는 공동 조절 BOX 1. The co-regulation of learning how to close a wound after surgery
한 학생이 상처 봉합 기본 기술을 익히는 것을 목표로 하는 학습 목표를 설정했습니다. 지도 외과의는 학생이 상처를 봉합하는 절차를 시작할 수 있도록 함으로써 학생들에게 이 목표를 추구할 기회를 제공한다. 지도 외과의의 역할은 학생의 학습조절(공동조절)에 적극적으로 참여하는 것으로 구성된다. 학생이 시작하기 전에 외과의는 학생이 상처를 성공적으로 봉합하기 위해 취해야 할 조치(전략적 계획의 공동조절)에 대해 물을 수 있다. 마찬가지로, 학생이 적극적으로 상처를 닫을 때, 외과의는 학생이 지금까지 올바른 방향으로 가고 있는지 물어볼 수 있다(모니터링의 공동조절). 학생이 상처를 다 봉합한 후, 외과의는 학생이 겪었을 수 있는 잠재적인 어려움과 미래의 노력(성찰와 적응의 공동조절)에 대해 물어볼 수 있다. 지도자와 공동 조절적 상호작용을 한 후, 학생은 (여기서 배운) 학습조절에 관련된 기술을 [다른 감독되지 않은 학습 과제]로 전이transfer하고자 학습 활동에 적극적으로 참여하고 반영할 수 있다. 지도 외과의는 학생들의 학습규제에 참여함으로써 자율적 학습능력의 응용과 발전을 지원한다.
A student formulated a learning goal aimed at mastering basic techniques of wound closure. The supervising surgeon provides the student with the opportunity to pursue this goal by allowing the student to start the procedure of closing the wound. The role of the supervising surgeon consists of actively participating in the student's regulation of learning (ie co-regulation).
Before the student starts, the surgeon may ask about the steps the student intends to take to close the wound successfully (co-regulation of strategic planning).
Similarly, when the student is actively closing the wound, the surgeon may ask if the student is on the right track thus far (co-regulation of monitoring).
After the student finishes closing the wound, the surgeon may ask about potential difficulties the student may have experienced and how he or she may improve future efforts (co-regulation of reflection and adaptation).
After co-regulatory interactions with her supervisor, the student may then actively engage in and reflect on learning activities with the aim of transferring relevant skills for regulation of learning to other, unsupervised, learning tasks. Through engaging in the students’ regulation of learning, the supervising surgeon helps to support the application and development of self-regulatory learning skills.
중요한 점은, CRL은 학습 과제, 설정, 공동조절자와 학습자 사이의 관계에 따라 형태가 달라질 수 있다는 것이다. 예를 들어, 위계적 관계에서의 권력 역학 또는 전문 지식 수준의 (인식된) 차이는 CRL의 특성 및 잠재적으로 효과에 영향을 미칠 수 있다. 따라서 친구/동료에 의한 공동조절은, 목표 및 결과 측면에서 상급감독자와의 CRL과 상당히 다를 수 있다. 보건 직업 교육에서 학습의 공동 규제에 대한 새로운 연구는 CRL 참여의 다양한 징후와 초점에 대한 통찰력을 제공하고 있다. Importantly, CRL can take different forms, depending on the learning task, setting and/or relationships between co-regulator and learner. For example, power dynamics in hierarchical relationships or (perceived) differences in the level of expertise may influence the nature – and potentially effectiveness – of CRL. Co-regulation by peers may therefore differ substantially from supervisors’ CRL in terms of goals and outcomes. Within health professions education, emergent research on co-regulation of learning is providing insight into the different manifestations and foci of CRL engagement.
연구 결과에 따르면 의대생들은 다른 사람의 CRL에 참여하려는 목적뿐만 아니라 참여 대상도 다르다. 예를 들어, 초보 학생들은 학습 목표를 토론하기 위해 [동료를 선호]하는 반면, 경험이 많은 학생들은 전문적인 정체성 형성에 반영하기 위해 [경험이 많은 의료 전문가를 선호]하는 것으로 보인다.48 CRL에 대한 다른 연구는 소셜 네트워크 관점을 채택하고, 조절에서의 네트워크 구축의 특성을 검토했다. 그들의 학문. 특히 CRL에 참여하는 다른 사람들과의 상호작용 빈도는 학생들이 스스로 보고하는 학습능력 조절과 긍정적으로 관련이 있다는 사실이 연구결과 밝혀졌다.49
Research findings suggest that medical students differ in whom they engage as well as the purpose of engaging others’ CRL. For instance, novice students seem to favour peers to discuss their learning goals, whereas experienced students favour more experienced healthcare professionals to reflect on professional identity formation.48Other studies into CRL adopted a social network perspective, and examined characteristics of the networks students’ deploy when regulating their learning. Findings revealed that, in particular, the interaction frequency with which others are engaged in CRL positively relates to students’ self-reported regulation of learning proficiency.49
2.3 사회적으로 공유되는 학습 규정: 상황에 맞게 팀에 집중 2.3 Socially shared regulation of learning: Focus on the team within context
21세기 초에 협력 학습의 중요성과 필요성에 힘입어, 집단들이 어떻게 [집단적 학습과 성과를 분산적으로distributed 조절]하는지 탐구하기 시작했다. 사회적 공유 학습 조절(SSRL)라는 용어는 그러한 규제 조치를 설명하기 위해 만들어졌다. 일반적으로 SSRL은 팀이 협력적 학습을 조절하는 방법을 설명하고, 팀 구성원 간의 상호 의존성을 강조한다. SSRL은 팀원들이 [공동으로 구성된 목표를 추구하기 위하여 집단적 학습 활동의 조절을 공유하는 과정]에 초점을 맞추고 있다. CRL과 유사하게, SSRL은 [학습의 조절이 여러 개인 사이에서 공유되는 조절방식]을 반영한다. 그러나 주요 차이점은
CRL은 한 명 이상의 집단 구성원이 개별 학습자의 조절을 가이드guide하는 데 관여한다는 것이다('불평등한unevenly distributed' 형태의 사회적 조절로 만든다).
반면, SSRL은 그룹 구성원의 규제 활동 및 과정에 상호 관여reciprocal engagement하는 것이 특징이다. 따라서 SSRL은 '고르게 분포된evenly distributed' 형태의 사회적 조절로 간주되며, 이러한 조절은 집단 구성원 간의 상호작용을 통해 형성된다. 따라서 SSRL의 분석 단위는 집단, 시스템 및 시스템 내의 개인입니다.
At the start of the 21st century, fuelled by the increasing importance and need for collaborative learning, research started exploring how groups regulate their collective learning and performance in a distributed fashion. The term socially shared regulation of learning (SSRL) was coined to explain such regulatory actions. Generally, SSRL describes how teams regulate their collaborative learning and emphasises interdependency among members of a group or team. SSRL focuses on processes through which team members share the regulation of their collective learning activities, directed towards the pursuit of their jointly constructed goals.41,50Similar to CRL, SSRL reflects a mode of regulatory learning in which the regulation is shared between individuals. The main difference, however, is that
CRL involves one (or more) group members to guide the regulation of an individual learner (making it an ‘unevenly distributed’ form of social regulation), whereas
SSRL is characterised by group members’ reciprocal engagement in regulatory activities and processes. SSRL is therefore considered an ‘evenly distributed’ form of social regulation in which the regulation is shaped by and arises through the interactions between members of the group.44Therefore, the units of analysis in SSRL are the collective, the system, as well as the individual within the system.32, 51
의료 실무에서의 협력적 학습은 어려움을 겪을 수 있다. 예를 들어, 팀 구성원의 지속적으로 변동, 시간 제약, 의료 팀 내의 위계적 구조 등의 요인이 협력적 학습의 구현 정도에 영향을 미칠 수 있습니다. 이러한 학습에 대한 협력적 조절은 나중에 훨씬 더 어려울 수 있다. 해드윈, 예르벨레, 밀러는 SSRL 이론 모델을 최초로 기술하였다. 이들이 개념화한 [협력적 학습 조절collaborative regulation of learning]에는 SSRL의 작동 방식을 네 가지 단계로 설명한다. 특히, 이러한 단계는 Winne 및 Hadwin의 SRL 모델의 네 가지 단계에 대략 일치한다.
1단계: 팀이 당면한 (학습) 과제에 대한 공통된 이해 또는 인식의 공동 구성 및 협상에 참여합니다.
2단계: 팀들이 공동의 목표를 구성하여, 효과적으로 과제를 완료하고 공동으로 과제를 해결하는 방법을 계획합니다.
3단계: 팀은 목표를 향해 나아가는 과정을 감시한다. 이 때 협력은 전략적으로 잘 조정coordinated되어야 한다. 과제, 목표, 전략 또는 계획에 대한 인식과 이해는 목표 진행에 대한 집단 모니터링을 기반으로 조정될 수 있다.
4단계: 팀은 프로세스를 평가한다. 평가의 결과는 후속 조절, 학습, 수행을 적응adaptation하는 데 필요한 투입이 된다.
Collaborative learning in medical practice may be prone to challenges. For example, fluid healthcare teams in which team members reshuffle constantly, time constraints, or hierarchy within healthcare teams may influence the extent to which collaborative learning is actually taking place. Collaborative regulation of such learning may subsequently be even more difficult. Hadwin, Järvelä, and Miller52were among the first to describe a theoretical model SSRL. Their conceptualisation of collaborative regulation of learning includes four phases that jointly describe the modus operandi of SSRL.52Notably, these phases roughly correspond to the four phases in Winne and Hadwin's SRL model.53
In phase one, teams engage in the co-construction and negotiation of a shared understanding or perception of the (learning) task at hand.
In phase two, teams co-construct shared goals to effectively complete the task and design a plan for how to tackle the task collectively.
In phase three, the team monitors their progression towards the goal, to which collaboration is strategically coordinated. Perceptions and understanding of the task, their goal(s), strategies, or plans might be adjusted based on their collective monitoring of goal progression.
Lastly, in phase four, teams evaluate the process, which might provide input for adaptation of future regulation, learning and performance.
박스 2는 신기술 도입이 팀워크에 어떤 영향을 미치는지에 대한 Edmondson의 연구를 바탕으로 헬스케어 팀이 [사회적으로 공유되는 학습조절SSRL]에 어떻게 참여할 수 있는지를 보여주는 예를 제공합니다. 우리는 박스 2의 예제가 일상적인 실천을 반영하지 않을 수 있다는 것을 인정한다. 그러나, 이 예제가 기반으로 하는 연구는 SSRL이 임상 작업장에서 어떻게 발생할 수 있는지를 잘 설명해준다. SSRL은 어떤 의료 팀이 여태껏 해왔던 학습 노력의 방향을 전환하게 만드는 파괴적인 사건의 경우에 특히 중요하지만(박스 2의 예와 같이), 그러한 사건에만 필요한 것은 아니다. SSRL 또는 SSRL 구성 요소에 대한 팀들의 참여에 호소할 수 있는 건강 직업 교육 및 실습의 다른 예로는 기업 훈련 시스템의 평가, 실무 협력 커뮤니티 구축, 팀 성찰 또는 학습 과제에 대한 공유된 인식을 구축하는 데 의대생이 협력하는 것이 포함된다.
Drawing on Edmondson's work about how introducing new technology influences teamwork, Box 2provides an example of how healthcare teams may engage in socially shared regulation of learning.54We acknowledge that the example in Box 2may not reflect common, day-to-day practice. However, the research the example is based on, lends itself well to explain how SSRL may occur in clinical workplaces. Although SSRL may be particularly relevant in cases of disruptive events that force healthcare teams to re-direct their learning endeavours (such as in the example in Box 2), SSRL is not exclusive to such events. Other examples in health professions education and practice that may appeal to teams’ engagement in SSRL or components of SSRL include evaluation of corporate training systems, the building of collaborative communities of practice,55team reflection, or medical students’ collaborating in co-constructing a shared perception of their learning tasks.
SSRL을 딱 구별되는distinct 단계로 구분하는 것은 이론적으로 이상적인 상황이다. 하지만 실무에서, 특히 의료 서비스의 예측 불가능하고 역동적인 맥락에서, 의료팀은 위의 네 단계를 순서대로 단계를 거치지 않거나, 일부 단계를 병합할 수 있다(박스 2의 예). 하지만, 연구결과에 따르면, 이러한 단계를 거치는 팀들이 새로운 상황에서 배우고 적응하는데 더 성공적인 경향이 있다는 것을 시사한다. SSRL에 대한 의료 교육 연구는 팀 학습에 대한 연구(예: 팀 성찰성)에서 유사한 개념이 등장했지만 제한적이다. 의료 서비스의 질이 의료 팀의 학습 및 작업 품질과 관련이 있다는 점을 고려할 때 SSRL이라는 개념은 [조절 프로세스가 어떻게 협력적 학습을 서포트하는지]를 더 잘 이해할 수 있는 귀중한 렌즈를 제공합니다. It is important to note that describing SSRL in terms of distinct phases refers to a theoretically ideal situation. In practice – especially in the unpredictable and dynamic context of healthcare practice – teams might not go through the phases in the abovementioned order, or might merge phases (as in the example in Box 2). However, research suggests that teams that go through these phases tend to be more successful in learning in and adapting to new situations.54Healthcare education research into SSRL is limited, although seemingly similar concepts emerged from research on team learning (eg team reflexivity).56-58Given that healthcare quality is associated with the quality of learning and working in healthcare teams,19,59the conceptualisation of SSRL provides a valuable lens through which we might be better able to examine and understand how regulatory processes support collaborative learning.
BOX 2. 신기술 채택 시 SSRL BOX 2. SSRL when adopting new technologies
새로운 기술을 채택하는 것은 루틴에 지장을 줄 수 있기 때문에 의료 팀에 문제를 일으킬 수 있다. 새로운 기술을 채택하려면, 팀은 학습 과정을 거쳐야 한다. 여기에는 신기술을 사용하기 위한 [공유된 의지]뿐만 아니라(motivation), 신기술이 함의하는[공유된 정신 모델]까지를 포함한다. 공유된 정신모델은 이는 [새로운 지식과 기술], 그리고 잠재적으로 변화할 [팀 구성원의 업무와 책임] 측면까지도 포괄한다 (SSRL 1단계)
Adopting new technology may raise challenges to healthcare teams, as habitual routines may be disrupted. Teams then have to go through a learning process, which involves creating a shared willingness to start using the technology (motivation) as well as a shared mental model of what the new technology implies, not just in terms of new knowledge and skills but also in terms of potentially changing tasks and responsibilities of team members (SSRL phase 1). 최소 침습적 심장 수술 혁신의 구현에 관한 논문에서, 에드먼드슨은 수술 팀이 이 기술을 구현하는 법을 어떻게 배우는지에 대해 설명했다.
그녀의 연구 결과는 새로운 현실에 효과적으로 적응하는 팀들이 모든 팀원들을 (지적으로나 정서적으로) 팀 노력에 참여시키는 데 시간을 할애하고, 팀의 목표, 역할 및 책임에 대한 명확한 정의를 내리는 데 시간을 할애한다는 것을 보여주었다(1단계와 2단계).
그 후 성공적인 수술 팀은 시험 세션과 구현 프로세스의 지속적인 모니터링과 같은 학습을 위한 전략을 공동으로 개발하여 진행하였다. (SSRL 2단계 및 3단계)
그런 다음, 수술 팀은 학습하기 위해 새로운 행동을 시도하고 보고(반성 및 보고) 과정을 통해 진행 상황을 지속적으로 모니터링하고 성찰한다(SSRL 4단계).
In her paper about implementation of a minimally invasive cardiac surgery innovation, Edmondson described how surgical teams engaged in learning to implement this technology.
Her findings showed that teams who were effective in adapting to a new reality, spent time on engaging all team members in the team effort (both intellectually and emotionally) as well as creating a clear definition of the team's goals, roles, and responsibilities in the implementation process (SSRL phases 1 and 2).
Successful OR teams then proceeded by jointly developing strategies for learning such as trial sessions and ongoing monitoring of the implementation process (SSRL phases 2 and 3).
Then, OR teams continually engaged in monitoring of and reflection on their progress, through processes of attempting new behaviours and debriefing (reflection and debriefing) in order to learn (SSRL phase 4).
3 교육 및 의료 분야에서 학습에 대한 자체, 공동 및 사회적 공유 규제 통합 3 INTEGRATING SELF-, CO-, AND SOCIALLY SHARED REGULATION OF LEARNING IN EDUCATION AND HEALTHCARE
협업 학습 상황에서 팀과 팀 구성원은 학습에 대한 사회적으로 공유된 조절 뿐만 아니라 자기조절과 공동조절에 참여할 수 있다. [조절 프로세스 및 활동에 대한 협력 팀 내에서의 균형]은 개별 팀원의 특성, 팀 구성 및 팀 구성원 간의 관계, 사회적 연결성, 업무와 맥락의 특징에 따라, 개인 간에, 시간이 지남에 따라 바뀔 수 있다. 이러한 균형의 이동은 조절참여도가 팀 구성원 전체에 고르게 분포되어 있는지 또는 불균일하게 분포되어 있는지에 따라 SRL, CRL, SSRL의 수준을 변화시킬 수 있다. 예제는 상자 3을 참조하십시오. During collaborative learning situations, teams and team members may engage in self-, co-, as well as socially shared regulation of learning. The balance within collaborating teams regarding their engagement in regulatory processes and activities may shift across individuals and over time, based on characteristics of individual team members, the team composition and relationships between team members, social connectedness, as well as features of task and context. This shifting balance may subsequently result in varying levels of SRL, CRL or SSRL, depending on whether regulatory engagement is evenly (SSRL) or unevenly (CRL) distributed across team members. See Box 3for an example.
집단이 생산적으로 기능하려면, 개인 수준의 SRL이 집단적 목표를 지향하는 것이 중요하다. 팀이 협력적 학습에 engage할 때, 개별 팀원은 자신의 학습 과정과 활동을 스스로 조절합니다. 심지어 협력적 학습 중에도, 개별 팀 구성원은 개별적으로 전략을 활성화하고 개인의 노력을 모니터링하고 규제합니다.
팀 수준의 CRL은 협력적 학습 중에 나타날 수 있으며, [개개의 팀 구성원이 다른 구성원의 조절 과정이나 활동을 통제하거나 자극하는 경우]에 발생한다. 이와 같이 CRL은 [생산적인 자기 조절를 향한 매개적 또는 이행기적 역할]을 할 수 있다. 또한, 만약 CRL이 집단으로서의 팀의 조절(SSRL)에 맞춰져 있다면 shared regulation of learning을 생산적으로 만들 수도 있다. 예를 들어, 박스 3의 팀 구성원은 모든 집단 목표가 적절하게 평가되는지 여부에 대한 우려를 표하고 있다. 이런 우려는 학습조절의 agency가 집단을 지향하는 공동조절 메커니즘의 역할을 한다.
협력 중 SSRL은 [모든 팀 구성원이 목표나 과제 인식의 공동구축과 같은 학습 과정을 집단적으로 규제할 때] 나타날 수 있다. 팀이 SSRL에 참여할 때, 팀 구성원은 자신의 업무 완료 요건에 따라 행동, 인식 및 동기를 조정하여 팀의 업무를 메타인지적으로 통제한다.52
To function productively as a collective, individual SRL geared towards collective goals is crucial.52 When teams engage in collaborative learning, individual team members will therefore engage in self-regulating their own learning processes and activities; even during collaborative learning, individual team members will activate strategies individually and monitor and regulate their individual efforts.60
Team-level CRL may emerge during collaborative learning in cases when an individual team member takes control of or stimulates another team member's regulation processes or activities.60 As such, CRL can play a mediational or transitional role towards productive self-regulation, yet also shared regulation of learning, depending on whether co-regulation is geared towards an individual team member's regulation (SRL) or the regulation of team as a collective (SSRL).52 The team member in Box 3 who expresses concerns about whether all of their collective goals are adequately evaluated, for example, serves as a co-regulatory mechanism through which the agency of regulation of learning shifts towards the collective.
SSRL during collaboration may emerge when all team members regulate learning processes collectively, such as co-constructing goals or task perceptions. When teams engage in SSRL, team members collectively take metacognitive control of the team's tasks by means of adjusting behaviours, cognitions, and motivations, based on requirements for completion of their tasks.52
BOX 3. 학습에 대한 자체, 공동 및 사회적 공유 규제 통합 BOX 3. Integrating self-, co-, and socially shared regulation of learning
협업 학습 중 서로 다른 수준의 학습 규제 통합을 명확히 하기 위해서는 박스 2의 신기술 구현으로 돌아가는 것이 도움이 될 수 있다.
개별 팀원은 노력 조절, 과업 모니터링 및 성과(SRL)와 같은 개인별 조절프로세스를 활성화한다.
팀원들이협상과 토론을 통해팀으로서 과제에 대한 공유된 인식을 구축하고, 과제 달성을 위한 집단적 목표와 전략을 수립한다.
새로운 기술을 처음 사용한 후 평가하는 동안, 한 팀원은 다른 팀원이 필수 기술을 습득하지 못하고 있다는 것을 알아차리고 절차 내내 다른 학습 전략을 채택하고 성과를 더 잘 모니터링하도록 도울 수 있습니다.
마찬가지로, 한 팀원은 [팀이 집합적]으로 설정한 목표 중 하나를 평가하는 것을 간과하고 있다는 것을 알아차릴 수 있으며, 팀의 주의를 이 목표에 집중시킨다(CRL은 팀의 SSRL을 목표로 한다).
따라서, 팀은 SRL, CRL 및 SSRL에 대한 동시적concurrent 참여를 통해 협력 학습 노력을 조절할 수 있습니다.
To elucidate the integration of different levels of regulation of learning during collaborative learning, returning to the implementation of new technology in Box 2might be helpful.
Each individual team member of the surgical team activates individual regulatory processes such as effort regulation, individual monitoring of the task and his or her performance (SRL).
Through negotiations and discussions, the team members co-construct a shared perception of the task as a team, and collectively formulate goals and strategies to accomplish the task (SSRL).
During evaluation after the first attempts of using the new technology, one team member may notice that another team member is not picking up essential skills and helps him to adopt another learning strategy and to better monitor his performance throughout the procedure. (CRL aimed at other's SRL).
Similarly, one team member may notice that the team is overlooking evaluating one of their collectively set goals and draws the team's attention to this goal (CRL aimed at the team's SSRL).
As such, the team is able to regulate their collaborative learning efforts through concurrent engagement in SRL, CRL and SSRL.
협력 학습에서, 순간적인 CRL 상호작용은 SSRL과 SRL가 발생하는 순간에도 일어날 수 있다. 따라서 학습자는 동시에 다양한 형태의 조절에 참여할 수 있습니다. 따라서 세 가지 수준의 규제 학습(SRL, CRL, SSRL)은 협력 학습 상황에서 서로 내장된 것으로 가장 잘 간주될 수 있다. 협력 학습 중에 팀은 CRL 또는 SSRL(또는 SRL)에 항상 관여하지 않을 수 있습니다. 팀이 CRL 또는 SSRL(또는 둘 다)에 참여할지 여부는 상황에 따라 달라진다. 예를 들어, 팀 리더(박스 3)가 학습 조절을 완전히 가이드하는 매우 지시적인 사람이라면(즉, CRL), 학습은 SSRL 없이 조절될 가능성이 높다. 따라서 CRL이 다른 조절모드로 전환되는지 여부는, [학습 과제 요건]뿐만 아니라 [팀과 팀 리더십 내의 역학 관계]에 따라 달라진다. In any collaborative learning, engagement in momentary co-regulatory interactions may occur within episodes of both SSRL and SRL. Thus, learners may concurrently engage in different forms of regulation. The three levels of regulatory learning (SRL, CRL, and SSRL) may therefore best be considered as embedded in one another during collaborative learning situations.41,44During collaborative learning, teams may not always engage in either CRL or SSRL (or SRL for that matter). Whether a team will engage in either CRL or SSRL (or both) is context- and situation-specific. For example, if the team leader (Box 3) is highly directive, fully guiding the regulation of learning (ie CRL), learning will likely be regulated without engagement in SSRL. Therefore, whether CRL is transitional towards other modes of regulation depends on dynamics within the team and team leadership as well as requirements of the learning task.
4 나아갈 방향 4 A WAY FORWARD
4.1 연구에 미치는 영향 4.1 Implications for research
중요한 것은 이 글에서 개념화한 학습조절은 이상적이고 이론적인 상황을 의미하며, 실제 작업 환경과 다를 수 있다. 그러나 그러한 모델은 협력적 환경에서 학습의 조절이 어떻게 발생할 수 있는지를 분리하기 위한 향후 연구에 유용한 프레임워크를 제공할 수 있다. 건강 직업 교육 연구에서 다양한 수준의 조절적 학습regulatory learning이 점점 더 연구되고 있지만, [주로 개인 또는 개인 내의 과정]에 초점을 맞추고 있으며, 상대적으로 [팀 수준에서 어떻게 협력 학습을 조절하는가]는 덜 다룬다. 현재 의료 분야의 협력에 대한 요구를 고려할 때 규제 학습에 대한 우리의 시각을 넓히는 것이 중요하다. Importantly, conceptualisations of regulation of learning in the present article refer to an idealised and theoretical situation, which may differ from actual work settings. However, such models may provide useful frameworks for future research to disentangle how regulation of learning may occur in collaborative settings. While various levels of regulatory learning are increasingly explored in health professions education research,45,48,61-63studies predominantly focus on processes within the individual or the individual in interaction and less on how teams regulate their collaborative learning. Given the demands for collaboration in current healthcare, it is important to widen our views of regulatory learning.
이는 학습 조절에 관심이 있는 연구자라면, 현재 SRL이 지배하고 있는 방정식에 SSRL을 추가해야 한다는 것을 의미한다. 최근 HPE의 맥락에서,협력적 학습을 이해하기 위하여 사회적 조절에 집중해야 한다는 점이 강조되고 있다. Team reflexivity과 같은 관련 개념을 기반으로 하는 HPE 연구는 팀 차원 조절프로세스와 활동으로 관심을 전환할 수 있으며, (개별 팀 구성원뿐만 아니라) 팀 수준에서 집단적 목표에 따라 어떻게 학습을 조절하는지를 이해하는 것을 목표로 한다. 또한 후속 연구는, 협력적 학습 중 SRL, CRL 및 SSRL의 상호 관련성을 분해entangle하여 학습 조절에 대한 이해를 개선하는 것을 목표로 할 수 있다. 특히, 연구자들은 생산적인 SRL과 SSRL에 대한 [CRL의 매개 역할], 그리고 조절적 상호작용이 학습과 성과에 어떻게 영향을 미치는지 탐구하고자 할 수 있다. CRL은 다른 방식의 규제에 대한 부담과 제약을 제공할 수 있기 때문에, CRL이 어떻게 영향을 미치는지 그 메커니즘에 대한 철저한 이해가 필수적이다.
This first and foremost implies that researchers interested in the regulation of learning should add SSRL to the equation that is currently dominated by SRL, and to a lesser extent, by CRL. The importance of focussing on social regulation to understand collaborative learning has recently been underlined in the context of health professions education.64Building on related concepts, such as team reflexivity,57,58health professions education research could shift attention to team-level regulatory processes and activities, aiming to understand how teams – as well as individual team members – shape their regulation towards their collective goals. Furthermore, to improve our understanding of the regulation of learning, future studies could aim to disentangle the interrelatedness of SRL, CRL, and SSRL during collaborative learning. Specifically, researchers may want to explore the mediating role of CRL towards productive SRL and SSRL, and how regulatory interactions affect learning and performance. Because CRL can provide the affordances and constrains for other modes of regulation, a thorough understanding of the mechanisms by which it may exert its influence is essential.
HPE 연구의 SRL 데이터(및 CRL 데이터)는 대부분 주관적인 자기보고서를 통해 수집되며, 참여자의 [조절 활동에 대한 인식]을 탐구한다. 그러나 종종 이러한 인식은 실제 행동과 같지 않다. 이러한 한계를 극복하기 위해 최근의 경향은 기술 발전을 통한 [다중 모드 데이터 수집]을 가리키고 있다. 여기에는 서로 다른 데이터 채널(즉, 양식)에서 데이터(예: 객관적 생리학적 및 주관적 자가 보고 데이터)를 수집하여, 연구자들이 복잡한 협력적 학습 상황에서 조절학습의 특징과 단계를 검토할 수 있게 한다. 객관적 데이터 수집을 통해 SRL, CRL, SSRL의 에피소드 동안 일어나는 (노력 조절, 주의력 증가, 혼란과 같은) 보이지 않는 것들을 보이는 것으로 만들 수 있다.
Much of the SRL data in health professions education research (and CRL data for that matter) is collected through subjective self-reports,33exploring participants’ perceptions of their regulatory activities. However, these perceptions often differ from their actual behaviour.65To overcome these limitations, recent trends draw on technological advancements and point to collecting multimodal data.52,66This involves collecting data from different data channels (ie modalities),52for example objective physiological and subjective self-report data, allowing researchers to examine features and phases of regulatory learning in complex collaborative learning situations.67Through collecting objective data, we are able to make visible what otherwise remains invisible, such as effort regulation, increased attention, and confusion that may take place during episodes of SRL, CRL, and/or SSRL.
예를 들어, 최근의 연구는 360도 카메라와 전피 측정과 같은 데이터 소스를 사용하여 그룹 구성원의 협업 학습에 대한 공유 모니터링을 검사하거나, 협업 학습 상황에서 심박수 및 피부 전도 측정과 같은 생리학적 데이터(예: 감정 반응 측정)를 수집한다. 서로 다른 출처의 데이터(객관적 데이터와 주관적 데이터 모두)를 삼각측량하면 다양한 환경에서 학습 규제의 수준과 결과를 더 잘 설명하는 데 도움이 될 수 있다. 협업 중 학습 규제에 대한 이해를 높이기 위해 시뮬레이션 기반 연구를 할 수 있으며, 테크놀로지로 쉽게 통합할 수 있다. 따라서 시뮬레이션 기반 연구 환경은 규제 학습 과정과 같이 밝혀내기 어려운 복잡한 현상을 분석하고 분리하는 데 학자들이 매우 적합한 것으로 보인다.
For example, recent studies use data sources such as 360-degree cameras and electro-dermal measures to examine group members’ shared monitoring of collaborative learning,68or collect physiological data such as heart rate and skin conductance measures (eg to measure emotional reactions) during collaborative learning situations.66Triangulating data from different sources (both objective and subjective data), may help us to better describe levels and outcomes of regulation of learning in various settings. To improve our understanding of the regulation of learning during collaboration, we can draw on simulation-based research, in particular,69as this more easily allows incorporation of technology. Simulation-based research settings seem therefore eminently suitable for helping scholars analyse and disentangle complex phenomena that are difficult to uncover,70such as regulatory learning processes.
민족지학 연구는 규제 학습 과정에 대한 우리의 이해를 증진시킬 수 있는 독특하고 새로운 기회를 제공할 수 있다. 실제 환경이나 시뮬레이션 환경에서 의료팀을 직접 관찰하면, 실제 작업을 수행하는 동안 발생하는 조절행동과 서로 다른 조절형태가 어떻게 내재될 수 있는지에 대한 탐구를 가능하게 할 수 있다. 또한, 조절행동을 관찰하면 unevenly distributed CRL과 evenly distributedSSRL의 차이를 조사할 수 있다. Ethnographic research might offer unique and new opportunities to further our understanding of regulatory learning processes. Direct observation of healthcare teams, either in real-life settings or in simulation settings, may enable exploration of regulatory behaviour as it occurs during the performance of authentic tasks and how different regulatory forms may be embedded in one another. Additionally, observing regulatory behaviour allows for examination of the distinction of unevenly distributed CRL and evenly distributed SSRL.
4.2 보건직 교육에 대한 시사점 4.2 Implications for health professions education
의료 전문가들에게 [협력적 학습]이 중요하다면, [협력적 학습의 조절]은 마찬가지로 중요해진다. 따라서 [협력적 학습의 조절을 지원하고 자극하며 촉진하는 요소]가 HPE 커리큘럼에 스며들어야 한다. 무엇보다 다양한 조절수준에 대한 인식 제고가 필수다. 현재 대부분의 HPE 커리큘럼은 CRL과 SSRL보다 SRL에 더 관심을 갖는 것으로 보인다. 팀원들이 서로의 지식, 활동, 감정, 동기, 집단으로서의 기능에 대한 관점을 높이는 것은 CRL과 SSRL의 발전을 지원하기 위한 중요한 출발점이다. 예를 들어 시뮬레이션 기반 팀 훈련 세션의 보고 세션에서 팀 구성원의 자체 및 기타 규제 학습 프로세스에 대한 인식에 초점을 맞춘 논의를 촉진할 수 있다.
When collaborative learning is considered important for healthcare professionals, regulation of collaborative learning becomes equally important. Therefore, elements that support, stimulate, and facilitate the regulation of collaborative learning should permeate healthcare professions curricula. First and foremost, increasing awareness of different regulatory levels is vital. Currently, most healthcare professions curricula seem to pay more attention to SRL than to CRL and SSRL. Increasing team members’ awareness of each other's knowledge, activities, emotions, motivation, and views of the group's functioning as a collective is a crucial starting point to support development of CRL and SSRL.50To help make explicit what often remains implicit, discussions that focus on team members’ awareness of own and other regulatory learning processes could be stimulated during debriefing sessions of simulation-based team training sessions, for example.71,72
만약 HPE의 목표 중 하나가 [협력적 학습을 촉진하는 것]이라면, 커리큘럼은 [협력적 학습] 뿐만 아니라 [협력적 학습의 조절]을 요구하는 과제까지도 포함해야 한다. 이러한 학습 과제는 학생들에게 그러한 기술을 개발하는 것과 관련된 정보를 제공해야 한다. 그런 다음 특정 자체, 공동 및 공유 규제 학습 프로세스와 활동을 명시적으로 목표로 하는 피드백 제공에 주의를 기울여야 한다.
If one of the aims of healthcare professions education is to promote collaborative learning, curricula must include learning tasks that require collaborative learning as well as regulation of that learning. These learning tasks should provide students with information that is relevant for developing such skills. It is then crucial that attention is paid to the provision of feedback that is explicitly aimed at specific self-, co-, and shared regulatory learning processes and activities.73
5 결론 5 CONCLUSION
건강 직업 영역 내에서 학습(따라서 학습의 조절)은 서로 다른 수준의 학습과 함께 서로 다른 수준에서 이루어진다. 의료 전문가를 위한 협업 및 집단 역량의 중요성은 점점 더 인식되고 있지만, 의료 팀이 협업 학습을 규제하는 방법에 대한 관심은 아직 탄력을 받지 못하고 있다. 그러므로 우리는 [자기조절학습을 최적화하는 방법]에만 배타적으로 초점을 두는 것에서, [학습이 일어나는 수준에 맞춘 가장 효과적인 조절]이라는 더 넓은 관점으로 전환해야 한다. 따라서 의료 영역 내에서 학습의 규제를 진정으로 완화한다는 것은 학습의 자체, 공동 및 사회적으로 공유되는 규제 수준을 완화한다는 것을 의미한다. 그래야 미래의 의료 전문가들이 복잡하고 예측 불가능하며 협업적인 의료 제공 환경에서 생산적으로 작동하는 데 필요한 기술을 개발할 수 있습니다.
Learning – and therefore regulation of learning – within the health professions domain takes place at different levels, with different levels of regulation of learning being embedded in one another. While the importance of collaboration and collective competence for healthcare professionals is increasingly recognised, attention to how healthcare teams regulate their collaborative learning has yet to gain momentum. We, therefore, may want to shift from an exclusive focus on how to optimiseself-regulation of learning, to the broader perspective of how to most effectively regulate learning, depending on the level at which it takes place. Truly unravelling regulation of learning within the healthcare domain therefore means unravelling the levels of self-, co-, and socially shared regulation of learning. Only then are we able to help future healthcare professionals to develop the skills that are necessary to function productively within the complex, unpredictable, and collaborative context of healthcare delivery.
Med Educ. 2022 Jan;56(1):29-36.
doi: 10.1111/medu.14566.Epub 2021 Jun 7.
Putting self-regulated learning in context: Integrating self-, co-, and socially shared regulation of learning
Processes involved in the regulation of learning have been researched for decades, because of its impact on academic and workplace performance. In fact, self-regulated learning is the focus of countless studies in health professions education and higher education in general. While we will always need competent individuals who are able to regulate their own learning, developments in healthcare require a shift from a focus on the individual to the collective: collaboration within and between healthcare teams is at the heart of high-quality patient care. Concepts of collaborative learning and collective competence challenge commonly held conceptualisations of regulatory learning and call for a focus on the social embeddedness of regulatory learning and processes regulating the learning of the collective. Therefore, this article questions the alignment of current conceptualisations of regulation of learning with demands for collaboration in current healthcare. We explore different conceptualisations of regulation of learning (self-, co-, and socially shared regulation of learning), and elaborate on how the integration of these conceptualisations adds to our understanding of regulatory learning in healthcare settings. Building on these insights, we furthermore suggest ways forward for research and educational practice.
무엇을 생각하고 있었나요? 의과대학생의 자기조절학습에 대한 메타인지와 인식 (Teach Learn Med, 2021) What Were You Thinking? Medical Students’ Metacognition and Perceptions of Self-Regulated Learning Marjolein Versteega,b , Guusje Bressersc , Marjo Wijnen-Meijerd , Belinda W. C. Ommeringa , Arnout Jan de Beauforta , and Paul Steendijka,b
소개 Introduction
자기 조절 학습은 의료 전문가가 개발하는 데 필요한 기술입니다.1 그러나, 의대생들은 종종 자기 조절에 필요한 메타인지의 수준을 얻기 위해 고군분투한다.2,3 의대생들의 자기 조절 학습에 대한 충분한 문헌이 있지만, 어떤 메타인지 역량이 저개발되어 있는지를 확인하는 연구는 흔치 않다. 적절한 메타인지 능력을 보유하는 것은 임상 환경에 막 진입하려는 임상 전 마지막 학년의 학생들에게 특히 중요하다. Self-regulated learning is a necessary skill for healthcare professionals to develop.1However, medical students often struggle to acquire the level of metacognition required for self-regulation.2,3Although there is ample literature on self-regulated learning in medical education, studies identifying which metacognitive competencies are underdeveloped in medical students remain scarce. Possessing adequate metacognitive competencies is particularly valuable for final year pre-clinical students who are about to enter the clinical environment.
자기 조절 학습은 학습자가 과제 전에 자신의 활동을 계획하고, 과제 중에 이러한 활동을 모니터링하며, 과제 후에 결과를 평가하는 순환 과정이다.4 의료교육계에서는 자기조절이 효과적인 학습을 위한 중요한 전제조건으로 인식되고 있다. 그러나 이 기술이 암묵적으로 습득된다는 것은 잘못된 일반적인 가정이다.5 Self-regulated learning is a cyclical process during which a learner plans one’s activities prior to a task, monitors these activities during a task, and evaluates the outcome after a task.4Self-regulation is recognized by the medical education community as an important prerequisite for effective learning. It is a common incorrect assumption, however, that this skill is implicitly acquired.5
정교한 자기 조절 학습자는 자신의 성과를 성찰하고 미래의 시도를 위해 자신의 접근 방식을 수정할 수 있다.7.8 본질적으로 자기 조절 학습자는 자신의 학습의 주도자이다. 데이비드 새킷은 다음과 같이 충고했다. Sophisticated self-regulated learners are capable of reflecting on their own performance and modifying their approach for future attempts.7,8In essence, self-regulated learners are the captains of their own learning. David Sackett pleads for more captains by advising:
의과대학에서 배우게 될 내용 중 절반은 졸업 후 5년 이내에 완전히 잘못되었거나 시대에 뒤떨어진 것으로 나타날 것입니다. 문제는 어느 쪽이든 말할 수 없다는 것입니다. 따라서 가장 중요한 것은 스스로 배우는 방법입니다. (1431쪽)9 Half of what you’ll learn in medical school will be shown to be either dead wrong or out of date within five years of your graduation; the trouble is that nobody can tell you which half—so the most important thing to learn is how to learn on your own. (p. 1431)9
자기조절학습의 순환은 인지, 메타인지, 동기부여의 세 가지 상호관련 요소에 의해 유도된다.13 대부분의 의학교육 연구가 인지14와 동기부여에 초점을 맞추고 있는 반면 메타인지에 대한 15개 연구는 상대적으로 제한적이다. 사회인지과학에서 연구자들은 수십 년 동안 메타인지에 대해 연구해 왔다. 플라벨과 다른 사람들은 메타인지의 세 가지 주요 구성 요소를 설명했는데, 이는 교실에서 메타인지적 교육 관행을 용이하게 할 수 있다.16-19
첫째, 메타인지적 지식에 대해 학생들에게 명시적으로 가르칠 수 있다; 예를 들어, 교육자들은 학생들이 학습에 관한 그들의 강점과 약점, 그리고 그들이 알고 있는 것과 아직 모르는 것에 대해 인식하도록 도와야 한다.
둘째, 메타인지 기술을 분명히 가르칠 수 있다; 예를 들어, 교육자들은 학생들이 공부할 때 사용할 수 있도록 학습에 효과적인 전략을 제공해야 한다.
셋째, 메타인지적 경험에 대해 가르칠 수 있다. 예를 들어, 학생들이 학습 과제와 관련된 느낌, 즉 어리둥절함이나 아하 경험 등이다.
메타인지 경험은 종종 학습자가 학습에 대한 판단의 기초를 형성하는 휴리스틱 피상적 단서로 사용된다. 예를 들어, 2,20 의대생들은 이 진단이 떠오른 속도에 기초하여 올바른 진단을 내릴 가능성을 판단할 수 있다. 하지만, 빠른 사고가 반드시 학생의 대답이 옳다는 것을 의미하지는 않습니다. 오히려 인과적 추론에 의해 형성된 이해 기반 단서는 정확한 반응을 더 예측한다.21
The cycle of self-regulated learning is guided by three interrelated components: cognition, metacognition, and motivation.13While most medical education studies focus on cognition14and motivation,15research on metacognition is relatively limited. In the social-cognitive sciences, researchers have been studying metacognition for several decades. Flavell and others have described three major components of metacognition, which may facilitate metacognitive teaching practices in the classroom.16–19
Firstly, one may explicitly teach students about metacognitive knowledge; for example, educators should help students to become aware of their strengths and weaknesses regarding learning, and of what they know and do not yet know.
Secondly, one may explicitly teach metacognitive skills; for example, educators should provide students with effective strategies for learning so students can use them when studying.
Thirdly, one may explicitly teach students about metacognitive experiences; for example, students’ feelings related to the learning task such as a feeling of puzzlement or an aha-experience.
Metacognitive experiences are often used by learners as heuristic superficial cues which form the basis for their judgements of learning.2,20 For instance, medical students may judge their chances of making the right diagnosis based on the speed with which this diagnosis came to mind. However, fast thinking does not necessarily mean that the student’s response is correct. Rather, comprehension-based cues that are formed by causal reasoning are more predictive of correct responses.21
메타인지 역량의 개발은 의료 훈련의 시작에서 이미 중요한 역할을 해야 한다; 이러한 역량을 소유하는 것은 임상 전 학생들이 임상 학습으로 전환할 때 특히 가치 있을 수 있다. 학교에서 임상의학 전 학생에서 직장에서의 임상 학생으로의 전환은 꽤 까다롭고, 학생들은 더 자기 조절적인 학습 스타일에 적응해야 한다. The development of metacognitive competencies already should play an important role at the start of medical training; possessing these competencies can be particularly valuable when final year pre-clinical students transition to clinical learning. The transition from being a pre-clinical student in school to a clinical student in the workplace is quite demanding, and students must adapt to a more self-regulated learning style.22
본 연구에서는 최종 연도 임상 전 의대생의 과제별 메타인지 지식, 기술 및 경험을 조사하기 위해 정성적 접근법을 사용했다. 또한, 우리는 과제별 메타인지 역량에 대한 우리의 발견을 더 넓은 자기 조절 학습 맥락과 연관시키기 위해 학부 의료 커리큘럼에서 자기 조절 학습에 대한 학생들의 인식을 식별했다. 본 연구의 연구 질문은 다음과 같다.
In this study, we used a qualitative approach to investigate final year pre-clinical medical students’ task-specific metacognitive knowledge, skills, and experiences. Additionally, we identified students’ perceptions of self-regulated learning in the undergraduate medical curriculum to relate our findings on task-specific metacognitive competencies to the broader self-regulated learning context. The research question of this study was:
임상의학전 마지막 학년학생들은 어떤 메타인지적 역량을 보여주며, 커리큘럼 맥락에서 이러한 역량과 자기 조절 학습을 어떻게 인지하는가? What type of metacognitive competencies do final year pre-clinical medical students display, and how do they perceive these competencies and self-regulated learning in the curricular context?
방법들 Methods
컨텍스트 Context
이 연구는 네덜란드 레이던 대학 의료 센터에서 수행되었습니다. LUMC는 6년간의 의료 훈련 프로그램을 제공하고 있으며, 학부 1~3학년은 임상 전 과정이며 대학원 4~6학년은 임상실습으로 구성된다. 네덜란드 의대 학부 교육 프레임워크는 의대생이 건강관리 기준을 효과적으로 충족시키기 위해 훈련에서 달성해야 할 학습 성과를 설명한다. 학습 성과 중 하나는 학부생들이 높은 수준의 자율성을 다루는 데 필요한 메타인지 역량을 보유해야 한다는 것이다. 23 그러나 현재 LUMC 커리큘럼에서는 그러한 기술에 대한 공식적인 교육이 제한적이다. This study was conducted at Leiden University Medical Center (LUMC), the Netherlands. The LUMC offers a six-year medical training program; undergraduate Years 1–3 are pre-clinical and graduate Years 4–6 consist of clinical clerkships. The Framework for Undergraduate Medical Education in the Netherlands describes the learning outcomes that medical students should achieve in their training to effectively meet the standards of health care. One of the learning outcomes is that undergraduates should possess metacognitive competencies that are necessary to handle a high level of autonomy.23However, in the current LUMC curriculum, formal teaching of such skills is limited.
이 교육과정은 CanMEDS의 역량 모델을 기반으로 하며, 처음 3년 동안은 의학 전문가Medical expert에 중점을 둔다. 교육과정 내내 학생들은 사례별 과제를 수행하는 소그룹 학습 활동으로 보완된 대규모 그룹 강의에 참여한다. 연간 8회 그룹 세션과 2회 개별 세션을 아우르는 '교사-코치 대화'를 통해 자율학습 개발이 교육과정에 공식화된다. 이러한 대화를 하는 동안, 교사-코치는 CanMEDS 역량에 대한 공부 진행, 동기 부여 및 개인적 계발에 대해 논의, 지원 및 격려해야 한다. 의사소통, 직업적 행동, 신체검사 등 모든 역량은 등급이 매겨진다. 채점은 때때로 선생님의 서술적 피드백이 뒤따르지만, 반드시 교사-코치와 같은 선생님일 필요는 없다. 이 연구는 임상 전 단계의 3년 동안 수행되었습니다. 우리는 올해 이후 시작되는 임상실습을 잘 수행하기 위해서는 충분한 메타인지 능력을 갖춰야 하기 때문에, 이 기말고사 이전 학생들의 특정 모집단을 이용했다. The curriculum is based on the CanMEDS competency model, with an emphasis on the medical expert in the first three years. Throughout the curriculum, students participate in large-group lectures complemented by small-group learning activities in which they work on case-based assignments. Development of self-regulated learning is formalized in the curriculum through “teacher–coach conversations,” which encompass eight group sessions and two individual sessions per year. During these conversations, the teacher–coach is supposed to discuss, support, and stimulate study progress, motivation, and personal development for the CanMEDS competencies. All competencies are graded, including communication, professional behavior, and physical examination. Grading is occasionally followed by narrative feedback from a teacher, but this does not necessarily have to be the same teacher as the teacher–coach. This study was conducted during the third year of the pre-clinical phase. We used this specific population of final year pre-clinical students as they are expected to have sufficient metacognitive competencies in order to be successful in their clerkships that start after this year.
참가자 Participants
2019년 1월부터 4월까지 제1저자(MV)는 최종 학년 임상 전 학생들에게 이메일을 통해 접근했다. 이 학생들은 의대 1학년 때 동료 지도와 메타인지에 대한 이전 연구에 참여했었다. 24 참가자들은 정량적으로 평가된 1학년 때 메타인지 성과에 기초하여 의도적으로 표본 추출되었다.25 이 접근법을 노래하면 다양한 수준의 메타인지 능력을 가진 참가자들의 샘플을 얻을 수 있었다. 또한 네덜란드 의대생 인구(남성 30%, 여성 70%)의 성별 변동을 목표로 했다. 총 30명의 학생들이 이 연구에 참여하기 위해 접근했고, 결국 11명의 학생들이 참여했습니다. 불참 이유로는 시험기간 등으로 인한 시간 부족 등이 주로 포함됐다. 익명성을 유지하기 위해, 우리는 참가자들에 대한 더 잠재적으로 신원을 확인할 수 있는 정보를 포함할 수 없다. 학생들은 세션 전에 음성 녹음을 구두로 동의했고, 그 후에 사전 동의서에 서명했다. 그들은 그들의 노력에 대한 보상으로 7.50유로 상당의 무료 점심을 받았다. During January–April 2019, the first author (MV) approached final year pre-clinical students by e-mail. These students had participated in a previous study on peer instruction and metacognition in their first year of medical school.24Participants were purposively sampled based on their metacognitive performance in Year 1, which was assessed quantitatively.25Using this approach allowed us to obtain a sample of participants with varying levels of metacognitive competencies. Additionally, we aimed for gender variation representative of the medical student population in the Netherlands (30% male, 70% female). In total, 30 students were approached to participate in this study, and 11 students eventually participated. Reasons for not participating mainly included a lack of time for example due to exam periods. To preserve anonymity, we cannot include more potentially identifying information about the participants. Students gave verbal consent to audio-recording before the session and signed an informed consent form afterwards. They were given a free lunch worth €7.50 in compensation for their effort.
데이터 수집 Data collection
데이터는 두 가지 정성적 방법의 조합을 통해 수집되었습니다.
먼저, 우리는 학생들의 메타인지 능력과 메타인지 경험을 파악하기 위한 사고력 절차를 수행했다.
뒤이어 학부 의료 커리큘럼에서 학생들의 메타인지적 지식과 자기조절학습에 대한 인식을 통찰하기 위한 반구조적 면접이 이어졌다.
Data were collected through a combination of two qualitative methods.
First, we conducted a think-aloud procedure to identify students metacognitive skills and metacognitive experiences.
This procedure was followed by a semi-structured interview to gain insight in students’ metacognitive knowledge and perceptions of self-regulated learning in the undergraduate medical curriculum.
자기조절학습의 하위 구성요소인 메타인지역량에 대한 조사결과를 학생들의 자기조절학습에 대한 인식과 연결시키기 위해 면접 중 질문한 내용도 함께 알려줬다. 제1저자(MV)가 Think-Aloud 세션에 참석하여 이후 인터뷰를 진행했다.
The think-aloud session also informed the questions that were asked during the interview to connect the findings on metacognitive competencies, as a subcomponent of self-regulated learning, to students’ perceptions on self-regulated learning. The first author (MV) was present during the think-aloud sessions and conducted the interviews afterwards.
Think-aould 과제와 인터뷰는 제1저자(MV)가 음성녹음해 그대로 옮겨놓은 것으로 과제를 시작하며, 참가자들에게 의학 생리학에 관한 4가지 실습을 풀면서 큰 소리로 생각하도록 했다. 이 연습들은 전문 생리학자(PS)에 의해 고안되었으며 참가자들의 과학적 추론과 개념적 사고를 활성화하는 것을 목표로 했다. 문제는 2단계 객관식 형식으로 출제되었으며 혈류, 저항, 압력의 상호 관련 개념에 초점을 맞췄다(보충 자료의 부록 A 참조). 사실 지식은 정보 시트에 제시되었기 때문에 학생들은 주로 정보의 적용과 통합에 집중해야 했다. 각 연습이 끝난 후, 학생들은 제공된 답에 대해 얼마나 확신하는지 물어봄으로써 그들의 결론을 평가하도록 유도되었다. 참가자들이 3초 이상 침묵을 지키면 계속 큰 소리로 생각하도록 했다. 생리학 질문에 앞서 참가자들은 두 가지 질문을 받아 큰 소리로 생각하는 연습을 했다. The think-aloud assignment and interviews were audio-recorded and transcribed verbatim by the first author (MV). At the start of the assignment, participants were asked to think aloud while solving four exercises on medical physiology. These exercises were designed by an expert physiologist (PS) and aimed to activate participants’ scientific reasoning and conceptual thinking. The questions were posed in a two-tier multiple-choice format and focused on the interrelated concepts of blood flow, resistance, and pressure (see Appendix A inSupplementary Materialfor an example). Factual knowledge was presented on an information sheet, so students mainly had to focus on application and integration of the information. After each exercise, students were prompted to evaluate their conclusions by asking how sure they were of their provided answer. If participants were silent for more than three seconds, they were asked to continue to think aloud. Prior to the physiology questions, participants received two questions to practice thinking aloud.
이후 이어지는 반구조적 면접의 프롬프트에도 Think-Aloud 절차가 활용됐다. 예를 들어, 참가자들에게 학습 과제를 어떻게 경험했는지, 문제가 어려웠는지, 어떻게 풀려고 노력하는지 등을 물었다. 인터뷰 가이드는 MV, GB, MW 및 BO에 의해 개발되었다(보충 자료의 부록 B 참조). 인터뷰 가이드는 메타인지의 이론적 개념을 바탕으로 설계되고 구성되었다. 4,17-19,26
이 가이드에는 목표 설정, 학습 전략 및 성찰 활동에 대한 질문이 포함되어 있다.
다른 이슈들은 의료 커리큘럼에서의 자기 조절 학습에 대한 참가자들의 인식과 관련이 있었다.
이 질문들은 자신이 무엇을 알거나 모르는지를 아는 것의 가치와 학습 활동이 이를 어떻게 강화할 수 있는지에 초점을 맞췄다.
The think-aloud procedure was also used as a prompt for the subsequent semi-structured interview. For example, participants were asked how they had experienced the learning task, whether the questions were difficult, and how they would try to solve them. The interview guide was developed by MV, GB, MW, and BO (see Appendix B inSupplementary Material). The interview guide was designed and structured based on theoretical concepts of metacognition.4,17–19,26
This guide included questions about goal-setting, learning strategies, and reflective activities.
Other issues that were pursued during the interview concerned participants’ perceptions of self-regulated learning in the medical curriculum.
These questions focused on the value of knowing what one does (not) know and how learning activities could enhance this.
각 세션은 think-aloud 절차와 인터뷰로 구성되며 평균 45분 동안 진행되었다. 테마의 이론적 포화는 8번의 인터뷰 끝에 도달했으며, 이는 새로운 테마를 개발할 수 있는 추가 데이터가 발견되지 않았다는 것을 의미한다. 이후 질적 건강 연구의 일반적인 관행인 포화도를 확인하기 위해 마지막 세 번의 인터뷰를 실시했다.27
Each session, consisting of a think-aloud procedure and interview, lasted on average 45 minutes. Theoretical saturation of the themes was reached after eight interviews, meaning no additional data were found to develop new themes. Subsequently, we conducted three last interviews to check saturation, which is common practice in qualitative health research.27
데이터 분석 Data analysis
데이터 분석과 수집은 반복적인 방식으로 진행되었습니다. 데이터는 메타인지 이론에 기초한 템플릿 분석28을 사용하여 MV, GB 및 MW에 의해 코딩, 분석 및 해석되었다. 선험적 주제는
메타인지적 지식(즉, 자아, 과제, 전략의 지식),
메타인지적 기술(계획, 모니터링, 평가),
메타인지 경험이었다.
Data analysis and collection proceeded in an iterative fashion. The data were coded, analyzed, and interpreted by MV, GB, and MW using template analysis28based on metacognitive theory,19,26allowinga priorithemes to be used in developing the initial version of a coding template. Thesea priorithemes were:
metacognitive knowledge (i.e. of self, of task, of strategy),
metacognitive skills (i.e. planning, monitoring, and evaluating), and
metacognitive experiences.
MV와 GB는 각자 스크립트 1-3에 대해 독립적으로 예비 코딩을 수행하여 초기 템플릿을 만들었다. 코딩, 코드, 템플릿에 대한 연구자들 간의 합의가 이루어질 때까지 코드를 교차 점검했다. 인터뷰가 많아지자 우리는 코딩 템플릿을 계속 다듬었습니다. 코딩 템플릿은 데이터 수집 기간 동안 MV와 GB에 의해 비교되고 논의되었다. MV는 이 템플릿을 사용하여 스크립트 4-5를 코드화하고, 스크립트 6은 GB로 코드화하였다. 연구팀 간의 협업 분석을 통해 템플릿을 더욱 개선한 결과 템플릿에 대한 합의가 이루어졌습니다(보충 자료의 부록 C 참조). 이 마지막 템플릿은 MV가 나머지 대본(7–11)을 코드화하는 데 사용되었다.
MV and GB performed preliminary coding on Transcripts 1–3 independently to create an initial template. The codes were cross-checked until consensus was reached between the researchers about the coding, codes, and template. As the number of interviews grew, we kept refining the coding template. The coding template was compared and discussed by MV and GB throughout the data collection period. MV used the template to code Transcripts 4–5, and Transcript 6 was independently coded by GB. Further refinement of the template through collaborative analysis among the research team led to template consensus (see Appendix C inSupplementary Material). This final template was use by MV to code the remaining transcripts (7–11).
반사율 Reflexivity
팀은 질적 연구에 대한 다양한 배경과 전문 지식을 가진 연구원으로 구성되어 있어 다양한 관점을 사용하여 연구 결과를 쉽게 해석할 수 있었다. 제1저자(MV)는 신경생물학 관련 배경의 의학 교육 박사 학위를 보유하고 있으며 메타인지와 개념적 사고에 특히 관심이 많다. 다른 저자들은 모두 의학인류학·사회학(GB), 교육학(BO), 교육과학(MW), 의학(AdB), 물리학(PS) 등 각기 다른 배경을 갖고 있다. The team consisted of researchers with varied backgrounds and expertise in qualitative research to facilitate interpretation of our findings using multiple perspectives. The first author (MV) holds a doctorate degree in medical education with a background in neurobiology and has a particular interest in metacognition and conceptual thinking. All other authors are active in the field of medical education research and have different backgrounds, including medical anthropology and sociology (GB), pedagogical sciences (BO), educational sciences (MW), medicine (AdB), and physics (PS).
결과 Results
우리는 학생들이 문제 풀이 과정에서 보여준 메타인지 능력을 파악했다. 템플릿을 사용하여 메타인지 기술의 특정 하위 유형에서 어려움이 발생하는지 여부를 확인할 수 있었습니다. We identified the metacognitive skills that students displayed during problem-solving. With our template we were able to identify whether difficulties occurred for specific subtypes of metacognitive skills.
계획 Planning
계획 수립은 문제 해결 과정에 앞서 이루어지며 목표 설정, 적절한 전략 선택, 예측, 순서 전략 수립, 자원 할당 등이 포함된다.26 이 모든 테마는 본 연구에서 발견되었습니다. 사고력 과제 동안, 일부 학생들은 강조, 요약 또는 시각화를 통해 연습의 중요한 특성에 대한 개요를 만들어 계획적인 행동을 보여주었다. 인터뷰에서, 학생들은 종종 개요를 만드는 능력을 인정합니다.
Planning occurs prior to the problem-solving process and includes setting goals, selecting appropriate strategies, making predictions, sequencing strategies, and allocating resources.26All these themes were found in this study. During the think-aloud assignment, some students demonstrated planning behavior by creating an overview of the important characteristics of the exercise, either by highlighting, summarizing, or visualizing. In the interview, students would often recognize their ability to create overview.
글쎄요, 저는 개요를 잘 만드는 것 같아요. 개요를 만들기 전에는 문제 해결을 시작하지 않겠습니다. 저는 문제 해결을 시작하기 전에 모든 정보를 적고 중요한 정보를 강조하여 명확하게 합니다. (P9) Well, I think I am good at creating an overview. I will not start problem solving before creating an overview. Generally, I write down all the information and highlight the important information to clarify things before I start problem-solving. (P9).
또한, 일부 학생들은 다른 것을 하기 전에 먼저 문제를 파악하는 것이 전략이라고 명시했다. 그러나, 이것은 think-aloud 과제 동안 명시적으로 수행된 적이 거의 없다.
Further, some students specified that their strategy was to first identify the problem (i.e. setting the goal), before doing anything else. However, this was rarely done explicitly during the think-aloud assignment.
보통 질문을 먼저 읽고 그 다음부터는 본문을 다 읽기 전에 나에게서 진짜 질문을 받은 내용으로 넘어간다. 하지만 지금은 그렇게 하지 않았다. (P3) Usually, I read the questions first and quickly after that I move on to what is really been asked from me, before reading all the text. However, I did not really do it now [during the exercise]. (P3).
일반적으로 문제 해결에 앞서 계획을 세우는 데 거의 시간을 할애하지 않았다. 여러 학생이 문제를 파악하고 문제 해결에 필요한 자원을 배분하는 데 시간을 들였지만, 자신이 가지고 있는 정보를 정확하게 기록하지 않아 문제를 풀 수 있는 정보를 놓치는 학생들도 있었다.
Generally, little time was devoted to planning prior to problem-solving. Several students spent some time identifying the problem and allocating resources that were needed to solve the question, however there were also students who missed out on information to solve the question because they did not accurately record which information they had at their disposal.
모니터링 Monitoring
모니터링은 이해와 수행에 대한 온라인 인식online awareness이므로 실제 문제 해결 중에 발생합니다.26 학생들은 다양한 형태의 모니터링, 즉 전략을 think-aloud 과제에서 사용했습니다. 정기적으로 사용되는 전략에는 재독서, 목표 확인, 상황 시각화, 정답을 찾기 위한 답변 옵션 제거 등이 포함되었다. 학생들은 서로 다른 전략을 거의 바꾸지 않았다. 일반적으로 최초 결과가 답변옵션 중 하나와 일치하지 않는 경우에만 다른 접근법을 사용하기 시작하였다. 일부 학생들은 그들이 생각 과제 동안 특정한 메타인지 전략을 의식적으로 사용하지 않았다고 인정했다. 학생들의 전략 활용에 대한 인식도 매우 다양했다. Monitoring is the online awareness of comprehension and performance and thus takes place during actual problem-solving.26Students used various forms of monitoring, that is, strategies, during the think-aloud assignment. Regularly used strategies included rereading, goal-checking, visualizing the situation, and eliminating answer options to get to the correct solution. Students rarely switched between different strategies. Generally, they started to use a different approach only when their initial outcome did not align with one of the answer options. Some students admitted that they did not consciously use specific metacognitive strategies during the think-aloud assignment. A large variety in awareness of student’s strategy use was found.
나는 딱히 특별한 전략이 없어, 와, 이러고 저러고 해야겠다. 나는 가끔 그것을 다시 읽는 전략을 사용해요. 그리고 때때로 당신은 시험을 보는 동안 당신에게 도움이 될 수 있는 것들을 만나게 될 것입니다. 네, 기본적으로 그렇습니다. (P9) I do not really have specific strategies, that I think wow, I should do this or that. I use the strategy to sometimes just read it again. And sometimes you will encounter things during the test that may help you. So yes… basically like that. (P9). 저는 먼저 정보를 구조화하려고 노력합니다. 그래서, [이 과제를 위해] 저는 수치와 많은 문자를 받았습니다. 그리고 나서 글자를 사용해서 텍스트를 구성해요. 예를 들어, A 더하기 B는 C이다. (P7) I first try to structure the information. So, [for this assignment] I received a figure and a lot of text. Often, I then use letters to structure the text. For example, A plus B is C. (P7)
발췌문은 스펙트럼의 두 끝을 보여준다.첫 번째 발췌문은 구체적인 전략을 전혀 사용하지 않은 학생을 보여줍니다. 두 번째 발췌문은 문제를 해결하기 위해 특정한 전략을 사용한 학생을 보여준다. 이런 스펙트럼 가운데, 문제를 풀기 위해 특정 전략을 사용해야 한다는 것을 알면서도 과제 수행 중에 사용하지 않았다고 인정하는 학생들이 있었다.
The excerpts illustrate two ends of a spectrum. The first excerpt demonstrates a student who did not use any specific strategies at all. The second excerpt demonstrates a student who used a specific strategy to tackle the question. In the middle of this spectrum, there were students who admitted that, although they knew they should use certain strategies to solve the questions, they did not use them during the task.
대다수의 학생들은 분석적 사고, 즉 논리적으로 어려운 문제인 만큼 다소 어려운 문제라는 점을 인정했다.
The majority of students admitted that they found the questions rather difficult, as they found analytical thinking, that is, to reason, difficult.
저는 우리가 의과대학에서 사실 지식을 배우기 위해 훈련을 받고 있다고 생각합니다. 그리고 이것은 사실을 배우는 기술이나 사실을 연결하는 것과는 다른 기술입니다. 그래서 이것은 정말 다른 기술이기 때문에 항상 어렵지만, 꽤 많은 지능이 필요합니다. I think we are trained in medical school to learn factual knowledge, and this [exercise] is a different skill than learning facts, or connecting facts, so… this is really a different skill, so I think that is always difficult, but it requires quite some brainpower. (P2)
일반적으로 학생들은 분석적 추론이 의학 훈련 중에 활발하게 가르쳐지지 않는 역량이라고 느꼈다. In general, students felt that analytical reasoning was a competency not actively taught during medical training.
평가하기 Evaluation
평가란 문제 해결 후 결과와 조절 과정을 평가하는 것을 말한다. 예를 들어, 개인의 목표와 결론을 평가하는 것이 포함된다.26 생각하는 과제 동안 소수의 학생들이 정답 옵션 중 하나를 표시한 후 결론을 평가하였다. 우리는 학생들이 제공한 답을 얼마나 확신하는지 물어봄으로써 평가하도록 유도했다. 이 조언에도 불구하고, 학생들은 그들의 답을 평가하는 데 거의 시간을 할애하지 않았다. 대부분의 학생들은 자신감에 대한 명확한 설명이나 답안 확인 없이 '자신의 주어진 답이 맞다고 얼마나 확신하느냐'는 질문에 답할 것이다. 인터뷰에서 대부분의 학생들은 "논리적인 느낌"이 그들의 이해 수준을 결정할 것이라고 묘사했다. Evaluation refers to appraising the outcomes and regulatory processes after problem-solving. This includes, for example, evaluating one’s goals and conclusions.26During the think-aloud assignment, few students evaluated their conclusions after marking one of the answer options. We prompted the students to evaluate by asking how sure they were of their provided answer. Despite this prompt, students spent little time evaluating their answers. Most students would answer the question “How confident are you that your given answer is correct?” without explicitly elaborating on their feeling of confidence or without checking their answer. During the interviews, most students described that a “feeling of logic” would determine their level of comprehension.
네, 만약 제 감정이 [정답이] 맞지는 않지만 공식대로라면 맞다고 한다면, 저는 이것이 옳지 않다고 생각하기 때문에 의심하게 될 것입니다. 예를 들어, 서로 맞지 않을 때, 그리고 공식과 내 감정으로 풀지 못할 때, 나는 확신할 수 없다. (P6) Yes, if my feelings tell me that it [the answer] is not right but according to the formula it would be right, then I think, this is not right so I will doubt. Like, when it is not in accordance with each other, and if I cannot solve it with the formula and with my feelings, then I am not sure. (P6)
이해를 위한 다른 단서로는 과제에 소요되는 시간, 학습 자료에 대한 익숙함, 추론 용이성이 포함되었다.
Other cues for comprehension included; time spent on task, familiarity with the learning material, and the ease of reasoning.
생각할수록 의심이 많아진다는 걸 항상 알아차려요. (P1) I always notice that the longer I think about it, the more I start doubting. (P1)
네, 하지만 제가 이 [학습 자료]를 정말 알고 있다고 생각하시는군요. 나는 이것을 정말 공부해서 알고 있어. 그땐 내가 그걸 잘하는지 몰랐지만, 그래. (P2) Yes, but you also think I really have known this [learning material]. I have really studied this and known this. I didn’t know then if I was good at it, but yeah. (P2)
언제가 될지 확실합니다: 이렇게 추리하고 정답에 도달했습니다. 그러면 이것이 저에게 맞는 답인 것 같습니다. (P5) I am sure when: this is how I reasoned and then I get to the right answer, then this seems the right answer to me. (P5)
논리적이라는 느낌feeling of logic과 학습 자료에 대한 친숙함이 자주 언급됐다. 일반적으로 이러한 단서는 이해 수준에 대한 나쁜 예측 변수이다.221 오히려 추론의 용이성이 실제 이해 수준과 잘 연관되어 있지만, 이 단서는 훨씬 덜 언급되었다.
The feelings of logic and familiarity with the learning material were often mentioned. Generally, these cues are bad predictors for the level of comprehension.2,21Rather, the ease of reasoning is well associated with one’s actual level of comprehension, but this cue was mentioned to a much lesser extent.
의료 커리큘럼에서 자율 학습에 대한 인식 Perceptions of self-regulated learning in the medical curriculum
면접을 진행하는 동안 학생들에게 교과과정에서 '자신이 아는(모르는) 것을 아는' 역할을 되새겨보라고 해 think-aloud 데이터를 풍부하게 했다. 학생들은 자신의 지식과 실력을 정확하게 평가해 자신이 어떤 역량을 갖췄는지 알 수 있는 능력을 중시한다고 말했다. 대부분의 학생들은 이 능력을 외부 평가 도구에 아웃소싱했습니다. 예를 들어, 그들은 자신의 지식이나 기술 수준을 추정하기 위한 도구로 형성시험과 총괄시험, 학습 과제, 이러닝을 모두 언급했다.
During the interviews, the think-aloud data were enriched by asking students to reflect on the role of “knowing what you (do not) know” in the curriculum. Students said they valued the ability to accurately estimate their knowledge and skills so they know what they are (not yet) competent at. Most students outsourced this ability to external assessment tools. For example, they would mention both formative and summative exams, study assignments, and e-learnings as tools to estimate their level of knowledge or skills.
네, 당신은 대부분 공부 과제와 실기 시험을 치르는데, 물론 이미 어떤 지식을 가지고 있는지 진단할 수 있는 가치가 있습니다. (P8) Yes, you have mostly study assignments and practice exams of course which have a diagnostic value in terms of what knowledge you actually already possess. (P8)
몇몇 학생들은 자신의 지식을 정확하게 추정할 수 있는 능력을 자기 설명, 또래에게 설명, 교사나 다른 출처와의 컨설트와 같은 특정 전략에 의해 개발될 수 있는 내부적이고 개인적인 능력이라고 설명했다. '성찰reflection'이라는 단어는 거의 언급되지 않았고, 만약 그렇다면 학생들은 의료 훈련 중 이 역량에 대한 집중력이 부족하다고 지적했다.
A few students described the ability to accurately estimate one’s knowledge as an internal, personal ability that could be developed by specific strategies, such as self-explaining, explaining to a peer, and consulting a teacher or other sources. The word “reflection” was rarely mentioned, and if it was, students indicated that focus on this competency during their medical training was insufficient.
하지만 그런 메타 레벨은 아닌 것 같아. 우리가 무언가를 얼마나 잘 이해하는지 우리 자신을 돌아볼 수 있을까? 연습을 얼마나 잘 이해하고 있는가, 또는 지식 및 사물을 어떻게 처리해야 하는지를 얼마나 잘 이해하고 있는가. 저는 그것이 교육 프로그램, 특히 학업 교육의 필수적인 요소가 되어야 한다고 생각합니다. 그것에 대한 충분한 관심이 없는 것 같다. 성찰문을 써야 하는데 선생님은 어떻게 해도 괜찮다하니, 그냥 세 단어만 쓴다. 네, 그것은 주로 과제를 채우는 것일 뿐, 학생인 당신이 내가 더 잘할 수 있는 것이 무엇인가를 생각하며 자신을 돌아볼 것이라는 사실은 아닙니다. 그리고 좀 더 진지하게 받아들이신다면, 그 학생이 실제로 어떤 반응을 보이는지도 생각해보세요. 왜냐하면 그 피드백은 대부분 잊혀지고 있기 때문입니다. (P8) But at such a meta-level not really I think. That we really reflect on ourselves in terms of how well we understand something? How well do we understand exercises, or how well do we understand how we have to handle knowledge and things: I think that should be an essential component of an educational program, especially of an academic education. There is not enough attention paid to it [reflection] I think. We have to write reflection reports but you might as well just fill in three words, because the teacher is OK with it anyway. Yes, it is mainly just a fill in assignment, and not really that you, as a student, will take a look at yourself thinking what can I do better. And if you would take that maybe a little bit more seriously, also looking [as a teacher] what he [the student] actually does with it [the feedback], because that is being forgotten most of the time. (P8)
학생들은 역량의 상태에 대해 더 많은 통찰력을 가질 수 있으면 좋겠다고 언급하면서, "견고한 성과 척도"(즉, 숫자)을 찾고 있었다.
Students were in search of “hard outcome measures” (i.e. numbers) as they mentioned that they would appreciate having more insight into the status of their competences.
어... 역량 기반 교육, 실무 기반 교육으로 인해 저는 제 발전과 제 자신을 어떻게 발전시키는지 모니터링하기가 정말 어렵다는 것을 인정해야 할 것 같습니다. 물론 그것은 교사-코치 대화의 주제 중 하나이지만, 매우 구체적이지는 않다. 지난 3년 동안 얼마나 소통이 잘 되고, 팀플레이가 잘 됐나요? 나도 잘 모르겠고, 그걸 보여주는 숫자도 없다 (P7) Uh… with those competences, so competency-based education, really the practice-based education, I would have to admit that I find it really difficult to monitor my progress and how I have developed myself. That of course is one of the subjects during the teacher–coach conversations, but it is not very tangible. How good of a communicator, how good of a team player have I become during the last three years? I do not really have a clue, and I do not have any numbers either. (P7)
모든 학생들은 의학 교과 과정 동안 학습에 대한 통찰력을 높일 수 있는 방법에 대한 질문 중 하나에 대해 아이디어를 제시했습니다. 학생들은 대부분 현재 존재하는 평가 도구(예: 저부담시험, 공부 과제, 전자 학습)를 더 많이 보유하는 것이 지식 부족에 대한 더 많은 통찰력을 제공할 것이라고 언급했다.
All students offered ideas in response to one of the questions on how we could enhance one’s insight into one’s learning during the medical curriculum. Students mostly mentioned that having more of the currently existing assessment tools (e.g. low-stakes exams, study assignments, and e-learnings) would provide more insight in one’s knowledge deficiencies.
하지만, 예를 들어, 자율학습 과제나 e-러닝 과제가 시험과 같이 설계된다면, 아마도 여러분의 학습은 매우 시험 지향적일 것입니다. (P2) But maybe if, for example, the self-study assignments or e-learning assignment are designed like the exam, it would be… but, then your learning is very exam-oriented maybe. (P2)
몇몇 학생들은 개인의 지속적인 발전을 촉진하기 위해 피드백과 성찰을 강화함으로써 얻을 수 있는 이점에 대해 상세히 설명했습니다. A few students elaborated on the benefits of intensifying feedback and reflection to facilitate personal continuous development.
사실 어제 교육위원회에서 얘기했잖아요 종적 평가와 자기 자신을 향상시키는 것 등... 그것에 더 많은 관심을 기울여야 합니다. 그리고 학생들 스스로에게 물어보거나 그들이 스스로를 개선할 의지가 있는지 평가할 수도 있습니다. (P8) Well, actually we were talking about this yesterday in an educational committee. Longitudinal assessment and improving yourself and such… that more attention should be paid to that. And that you maybe can ask the students themselves or assess if… are they willing to improve themselves? (P8)
마지막으로, 몇몇 학생들은 지금의 의학 교육이 오로지 의학적인 사실을 배우는 것에만 있다고 언급했다.
Finally, some students mentioned that medical education is solely about learning medical facts.
저에게 있어서, 제가 배우는 것은 대부분 사실을 배우는 것이고, 그것이 정말로 평가된 것입니다. 저는 사실을 배우는 데 있어서 도움을 필요로 하는 것이 아닙니다. 왜냐하면 그것은 제가 알거나 모르거나 둘 중 하나기 때문이다. 저는 암기를 잘하는 것이 장점 중 하나이기 때문에 암기를 잘 할 수 있는 사람은 아무도 없다고 생각합니다. 그래서 저는 암기에 별로 도움이 필요하지 않고, 제가 교육받는 동안 [사실들을 배우는 것]이 제가 주로 시험을 위해 하는 것이라고 생각합니다. 그리고 그런 의미에서, 그 자료를 이해하는 정도는 덜 합니다. (7쪽) To me, what I am learning is mostly about learning facts, and that is what’s assessed really … I am not looking for any help [in learning facts], because it’s things that I know or do not know. I don’t think that anyone can help me to better learn things by heart, because I, that is one of my strengths, that I am good at learning things by heart. So, I don’t really need help with that and I think that during my education that [learning facts] is what I mainly do for an exam, and in that sense, to a lesser extent understanding the material. (P7)
이 발췌문에서 알 수 있듯이, 학생들은 사실을 배우는 것이 자기 조절적인 학습(예: 도움을 구하는 것)을 필요로 하지 않으며, 사실을 배우는 것이 의과대학의 임상 전 단계에서 성공하기에 충분하다고 느꼈다. As illustrated by this excerpt, students felt that learning facts does not require self-regulated learning (e.g. help-seeking) and that learning facts is sufficient to succeed in the pre-clinical phase of medical school.
고찰 Discussion
우리의 연구는 의대생들의 메타인지 능력, 지식, 경험에 대한 통찰력을 제공했다. 또한, 우리는 의료 커리큘럼에서 자율 학습에 대한 학생들의 인식을 얻었습니다. 메타인지 능력과 관련하여, 학생들은 문제를 푸는 동안 학습 과정을 모니터링하는 다양한 방법을 사용했다. 예를 들어, 그들은 문제를 덜 추상적으로 만들기 위해 상황을 시각화했다. 모니터링과 달리 기획과 평가에 드는 시간이 적었다. 임상 추론에서 메타인지 기술에 대한 이전의 연구도 학생들이 모니터링을 수행하지만, 계획은 훨씬 덜 발생한다. 계획과 평가는 학업성취도에 대한 강력한 예측 변수이다. 중요한 것은 이러한 기술은 고정된 특성보다는 수정 가능하고 가르칠 수 있다는 것이다.7 Tanner는 과제, 단일 수업 세션, 시험 또는 전체 과정의 레벨에서 학습자가 메타인지적 기술을 훈련할 때 물어볼 수 있는 자기 질문의 예를 제시했습니다. 이러한 질문은 학습자에게 도움이 될 뿐만 아니라 교실에서 메타인지 기술을 명시적으로 다루는 것을 목표로 하는 교육자들에게도 도구 역할을 합니다. Our study provided insight into medical students’ metacognitive skills, knowledge, and experiences. Additionally, we obtained students’ perceptions of self-regulated learning in the medical curriculum. Regarding metacognitive skills, students used various ways to monitor their learning process while problem-solving. For example, they visualized the situation to make the problem less abstract. Contrary to monitoring, less time was spent on planning and evaluating. Previous research on metacognitive skills in clinical reasoning has also shown that students perform monitoring, but that planning occurs to a much lesser extent.29Planning and evaluation are strong predictors of academic performance.30–32Importantly, these skills are modifiable and teachable, rather than fixed traits.7Tanner has provided examples of self-questions that learners may ask in training their metacognitive skills, either on the level of an assignment, a single class session, an exam, or a full course.33These questions are not only helpful for learners, but also serve as a tool for educators who aim to address metacognitive skills explicitly in their classrooms.
[메타인지 지식]과 관련하여, [학습 과정에 대한 인식의 다양성]이 발견되었다. 기술의 종류나 사용법에 대한 메타인지적 지식이 거의 없는 학생들에게는 이것을 명시적으로 가르칠 필요가 있다. 게다가, 교육자들은 새로운 정보를 가르치기 전에 어떤 과목에 대한 학생들의 사전 지식을 알아야 한다. 예를 들어, [사전 평가]는 학생들이 자신의 지식 수준을 조사하도록 장려하는 데 매우 가치 있는 도구일 수 있으며, 학생들의 이해에 대한 통찰력을 얻기 위한 진단 도구로서 교육자들에게는 매우 가치 있는 도구일 수 있다. 교육자들은 책임을 져야 하는데, 특히 우리는 문헌을 통해 학생 스스로가 그들의 실제 지식과 역량에 대해 [다소 형편없는 판단자poor judges]라는 것을 알고 있기 때문이다. Regarding metacognitive knowledge, a large variety in awareness about one’s learning process was found. For those students with little metacognitive knowledge about types of skills or how to use them, there is a need to teach this explicitly.17,33Moreover, educators should be aware of students’ prior knowledge about a subject before teaching them new information. For example, preassessments may be very valuable tools in encouraging students to examine their level of knowledge, and for educators as a diagnostic tool to gain insight in students’ understanding.34Educators should take responsibility, especially since we know from literature that students themselves are rather poor judges of their actual knowledge and competencies.34,35
[메타인지 경험]에 대해서는 대부분의 학생들이 논리적인 느낌이나 친근한 느낌을 바탕으로 자신의 성과를 평가했고, 추론의 용이성에 대해서는 덜 평가했다. 처음 두 가지는 자동 및 무의식적으로 작동하는 표면 관련 단서라고 할 수 있으며, 일반적으로 성능에 대한 예측 단서로 신뢰할 수 없다. 중요한 것은 학습자가 이해 기반 단서(예: 추론 용이성)와 같은 예측 단서를 효과적으로 사용하도록 훈련할 수 있다는 것이다. 사실지식을 배우는 경우 키워드나 요약을 생성하고, 개념지식의 경우 도표를 완성하는 등의 다양한 교육방법이 있다. 학생들이 교실에서 예측 신호를 인식하고 생성하도록 명시적으로 가르치는 것은 결국 교실 밖에서 자율적으로 학습하는 동안 예측 신호 사용을 강화하는 결과로 이어질 수 있다.2 Regarding metacognitive experiences, most students estimated their performance based on a feeling of logic or a feeling of familiarity, and to a lesser extent on the ease of reasoning. The first two can be referred to as surface-related cues that operate automatically and unconsciously, and which are generally unreliable as predictive cues for performance.20,21Importantly, learners can be trained to effectively use predictive cues such as comprehension-based cues (e.g. ease of reasoning).20,36Various examples of training methods include generating keywords or summaries in the case of learning factual knowledge, and completing diagrams in the case of conceptual knowledge.37,38Teaching students explicitly to recognize and generate predictive cues in the classroom may eventually lead to enhancing predictive cue use during self-regulated learning outside of the classroom.2
사실을 직시하며 Facing the facts
의료 훈련을 받는 동안 학생들은 계속해서 자신을 증명해야 하며, 결과적으로 그들의 학습은 평가에 의해 주도된다. 우리의 연구는 평가 결과에 할당한 가치에 대한 학생들의 설명에서 이를 확인한다. 그들은 평가가 성과에 대한 주요 지표라고 느꼈다. 특히 역량 기반 교육에 대해서는 어떤 수치에도 의존할 수 없었기에, 학생들은 자신의 역량 수준에 대한 통찰력이 없다고 느꼈다. 평가가 의대생들의 공부 동기에 미치는 영향은 심오하며, 종종 학습에 대한 표면적인 접근으로 이어진다. 표면적 접근은 예를 들어, 사실을 암기하려는 학생들의 목표로 특징지어진다. 특히 우리 학생들은 임상 전 의료훈련의 초점이 사실지식을 배우는 데 있다고 설명하면서 이 문장에 힘을 실었다. 그들은 학습에 대한 이러한 접근은 그들의 추론 능력을 희생하는 것이라고 느꼈다. 심지어 어떤 학생들은 임상적 "추론"은 단지 사실적 지식을 상기해야 하는 패턴 인식의 과정으로 묘사한다. During their medical training, students continuously have to prove themselves, resulting in their learning being driven by assessments.39,40Our research confirms this in students’ descriptions of the value they assigned to assessment outcomes. They felt that assessments were the main indicators for performance. Regarding competency-based education specifically, students felt they had no insight in their level of competency as they could not fall back on any numerical indicator of performance. The impact of assessments on medical students’ motivation to study is profound and often leads to a surface approach to learning.39,41,42This surface approach is characterized, for example, by students’ aim to memorize facts.43Notably, our students underlined this statement by describing that the focus in pre-clinical medical training is on learning factual knowledge. They felt that this approach to learning came at the cost of their reasoning abilities. Even clinical “reasoning” is described by some students as a process of pattern recognition during which one has to merely recall factual knowledge.
의학 교육계는 이미 딥러닝을 확립하기 위한 솔루션 중 하나가 기초 과학과 임상 학습의 더 많은 통합이며, 이는 의료 개념을 더 잘 이해하기 위한 개념적 지식을 원하는 학생들의 필요를 충족시킬 수 있다고 제안했다. 또한, 평가는 학습을 유도하기 때문에 교육자와 교수진은 평가에서 요구하는 것을 연습practie에 필요한 스킬셋에 맞게 조정해야 합니다. 메타인지와 자기 조절 학습이 정규 평가 일정의 일부이고 성적에 기여했다면, 모든 당사자들에 의해 학습의 중요한 측면에 더 큰 관심을 받을 수 있을 것이다. 메타인지 성과를 평가 일정에 통합하는 예는 성찰 저널의 사용을 소개하는 것입니다. The medical education community has already suggested that one of the solutions to establish deep-learning might entail more integration of basic science and clinical learning, which would meet the students’ needs for conceptual knowledge to better understand medical concepts.44Additionally, because assessment drives learning, educators and faculty should better align assessments with the skill sets required for practice. If assessment of metacognition and self-regulated learning were part of the regular assessment schedule and contributed to grades, one might well get greater attention placed on this important aspect of learning by all parties. An example of integrating metacognitive performance in the assessment schedule is to introduce the use of reflective journals.33
그러나 평가만이 학생들 사이에서 메타인지적 발전을 자극하는 유일한 해결책은 아니다. 다른 전략에는 학생들의 사전 지식을 명시적으로 활성화하고 새로운 학습 주제에 접근하는 방법에 대한 사려 깊은 계획 수립에 도움이 되는 자체 질문self-guestions의 사용이 포함된다.33 또한 우리의 연구 참여자들이 원하는 바와 같이, 보다 지속적인 평가를 용이하게 하는 통합 종적 평가 프로그램으로의 추세가 있다. 유능한 평생 학습자를 배출하는 것을 목표로 한다. 학생들이 자신의 역량을 평가할 수 있는 메타인지 성과지표를 정의해 의미 있는 평가를 통합하면 우리 학생들이 평생학습 건강전문가가 되는 데 도움이 될 것이다.
But assessments are not the only solution toward stimulating metacognitive development among students. Other strategies include the use of self-questions that explicitly activate students’ prior knowledge and help them in thoughtful planning of how to approach a new learning topic.33Further, as also desired by participants in our study, there is a trend toward integrated longitudinal assessment programs that facilitate a more continuous evaluation of student abilities, and which aim to produce competent lifelong learners. The integration of meaningful assessments by defining metacognitive performance indicators against which students can assess their competencies will help our students become lifelong learning health professionals.40,45
장점 및 한계 Strengths and limitations
우리 연구의 강점은 사고력 과제와 인터뷰 시간을 결합하는 데 있다. 이 접근법은 학생들의 메타인지적 수행의 세 가지 측면을 더 잘 파악할 수 있게 해주었다. 교육과정 수준의 자율학습에 대한 학생들의 생각을 촉진하는 역할도 톡톡히 했다. 그러나 몇 가지 제한 사항이 고려되어야 합니다.
첫째, 연구는 진위적이지 않은 환경에서 수행되었는데, 이는 학습 행동과 성과에 영향을 미칠 수 있는 실제 환경의 맥락적 요인이 제외되었다는 것을 의미한다. 그럼에도 불구하고, 학생들은 성적이 매우 좋은 경향이 있었고, 어떠한 채점도 수반되지 않았음에도 불구하고 매우 진지하게 학습 과제를 수행했다.
둘째, 메타인지 기술은 과제 중에 학생들에게 명시적으로 이러한 기술에 대해 묻지 않고 측정되었습니다. 이것은 다음과 같이 정의된 미세분석을 사용하는 것과 반대된다. "교육생들이 진정한authentic 활동을 할 때, [여러 주기적 단계 프로세스를 대상으로 상황별 질문]을 던지는 구조화된 인터뷰 접근 방식입니다."
A strength of our study lies in combining the think-aloud assignment with an interview session. This approach allowed us to better grasp all three facets of students’ metacognitive performance. It also functioned well as a prompt for students’ thoughts about self-regulated learning on the curriculum level. However, some limitations must be taken into consideration.
First, the study was conducted in a non-authentic setting, meaning that contextual factors from a real environment which may influence learning behavior and performance were excluded. Still, students were very inclined to perform well and worked on the learning task very seriously although there was not any grading involved.
Second, metacognitive skills were measured without explicitly asking our students about these skills during the task. This is contrary to the use of microanalyses, defined as “structured interview approaches that involve administering context-specific questions targeting multiple cyclical phase processes as trainees engage in authentic activities.”46
이러한 미세분석은 자기조절학습 과정을 측정하고 학생들이 문제 해결 동안 전략적인 단계에 집중하도록 유도하는 데 사용됩니다.29 그러나 이러한 질문은 학생들의 인식을 촉발하고 메타인지적 기술의 "인공적인artificial" 사용을 유도할 수 있습니다. 따라서 우리는 우리의 접근 방식이 메타인지적 기술을 사용하는 학생들의 더 정확한 이미지로 이어진다고 주장한다. 다만 학생들의 생각만 추정할 수 있을 뿐 메타인지 전략과 경험을 모두 발성할 수 있다고 장담할 수 없기 때문에, 'underestimation'의 가능성을 배제할 수 없다.
These microanalyses are often used to measure self-regulated learning processes and prompt students to focus on strategic steps during problem-solving.29However, such prompts may trigger students’ awareness and induce “artificial” use of metacognitive skills as they may not have used these skills in a non-prompted setting. We therefore argue that our approach leads to a more accurate image of students’ use of metacognitive skills. Yet, we cannot rule out the possibility of an “underestimation” due to this method because we can only approximate students’ thoughts and cannot guarantee that they vocalize all their metacognitive strategies and experiences.
본 연구는 네덜란드 대학의 최종 학년 임상의학과 학생들 사이에서 수행되었다. 질적 연구에서 항상 그렇듯이, 결과를 다른 맥락으로 옮길 때는 주의가 필요하다. 이 특정한 맥락에도 불구하고, 우리는 모든 네덜란드의 의료 프로그램이 네덜란드 대학 의료 센터 연맹에 의해 개발된 것과 같은 청사진에 기초하기 때문에 우리의 발견이 네덜란드의 교육적 맥락 안에서 이전될 수 있다고 주장한다.26 이 청사진은 임상 전 훈련을 위한 공식화된 목표가 매우 구체적이고 구체적이기 때문에 전이가능성transferability을 촉진한다. Our study was performed among final year pre-clinical medical students in a Dutch University. As always in qualitative research, caution is advised in transferring the results to other contexts. Despite this specific context, we argue that our findings are transferable within the Dutch educational context as all Dutch medical programs are based on the same blueprint as developed by the Dutch Federation of University Medical Centers.26This blueprint promotes transferability as the formulated objectives for pre-clinical training are very specific and concrete.
결론 Conclusion
이 연구는 의대생들이 자기조절학습을 용이하게 하기 위해 메타인지에 대한 명시적인 훈련과 평가가 필요하다는 것을 밝혀냈다. 또한, 연구 결과는 지원 교육 활동(예: 코치 대화, 성찰 에세이)을 포함한 CanMEDS 기반 커리큘럼이 align되어있지 않거나, 메타인지 능력의 개발을 촉발하지 않았다는 것을 보여주었다. 커리큘럼 설계가 변하지 않는다면 메타인지에 대한 명시적 교육의 구현은 여전히 원하는 효과를 얻을 수 없을 것이다. 교육자와 교직원은 메타인식을 강의실의 일상적인 담론에 통합하여 학생들이 자신의 인식과 학습을 토론하는 환경을 조성하는 것을 목표로 해야 한다. 여기에는 메타인지적 마음의 습관을 발달시키고 평생학습을 자극하기 위해 인지적 학습과 메타인지적 학습을 동시에 추진하는 새로운 평가전략의 사용이 포함된다.
This study revealed that medical students are in need of explicit training and assessment of metacognition to facilitate self-regulated learning. Moreover, findings showed that the CanMEDS-based curriculum, including supportive educational activities (e.g. coach conversations, reflective essays) were not aligned or did not trigger the development of metacognitive skills. If curriculum design remains unchanged, implementation of explicit teaching of metacognition could still not yield the desired effects. Educators and faculty should aim to integrate metacognition in the everyday discourse of the classroom to foster an environment in which students discuss their own cognition and learning. This includes the use of novel assessment strategies that drive both cognitive and metacognitive learning in order to develop metacognitive habits of mind and stimulate lifelong learning.
Teach Learn Med. Oct-Dec 2021;33(5):473-482.
doi: 10.1080/10401334.2021.1889559.Epub 2021 Mar 15.
What Were You Thinking? Medical Students' Metacognition and Perceptions of Self-Regulated Learning
Phenomenon:As a component of self-regulated learning, metacognition is gaining attention in the medical education research community. Metacognition, simply put, is thinking about one's thinking. Having a metacognitive habit of mind is essential for healthcare professionals. This study identified the metacognitive competencies of medical students as they completed a conceptual learning task, and provided insight into students' perceptions of self-regulated learning in their curriculum.Approach:Eleven third-year medical students from a Dutch University were purposively sampled to participate in this qualitative study. The study design included a think-aloud assignment followed by a semi-structured interview. During the assignment, participants were instructed to think aloud while solving questions about medical physiological concepts such as blood flow, pressure, and resistance. Think-aloud data were collected through audiotaping and used to identify participants' metacognitive competencies. The assignment also served as a prompt for an interview in which participants were questioned about metacognitive knowledge, monitoring, experiences, and perceptions of self-regulated learning in their curriculum. All data were transcribed verbatim and analyzed iteratively using a template analysis.Findings:Students differed in their use of metacognitive skills, with an overall focus on monitoring and, to a lesser extent, on planning and evaluation. Additionally, differences were found in students' metacognitive knowledge and metacognitive experiences. There was apparent use of inefficient, superficial predictive cues. Regarding perceptions of self-regulated learning skills, some students felt no need to develop such skills as they perceived medical education as an exercise in memorizing facts. Others emphasized the need for more insight into their actual level of knowledge and competence.Insights:Pre-clinical medical students require explicit teaching of metacognitive skills to facilitate self-regulated learning. Educators should aim to integrate metacognition in the everyday discourse of the classroom to foster an environment in which students discuss their own learning.
자기자신을 넘어: 의과대학생의 자기조절학습에서 공동조절의 역할 (Med Educ, 2020) Beyond the self: The role of co-regulation in medical students’ self-regulated learning Derk Bransen1 | Marjan J. B. Govaerts2 | Dominique M. A. Sluijsmans3 | Erik W. Driessen2
1 소개 1 INTRODUCTION
자기조절학습(SRL)은 의사의 핵심 역량이자 환자 진료 보호에 필수적인 역량으로 간주된다. 1, 2 따라서 많은 의료 커리큘럼은 SRL 기술을 개발하는 의대생들을 지원한다. 자기 조절 학습은 일반적으로 주기적인cyclic과정으로 설명되며, 종종 목표를 설정하고 그 목표를 향한 발전을 모니터하기 위한 전략의 후속적 채택에 의해 촉발되며, 성찰과 새로운 학습 목표의 공식화에 관여한다.2, 3 그러나 연구 결과에 따르면 학생들은 종종 임상 작업장 환경의 예측 불가능하고 역동적이며 지저분한 성격의 결과로 임상 학습 환경에서 학습을 규제하기 위해 고군분투한다.4, 5 Self-regulated learning (SRL) is considered a core competence of physicians and one that is essential to the safeguarding of patient care.1,2Many medical curricula therefore support medical students in developing SRL skills. Self-regulated learning is generally described as a cyclical process, often triggered by the formulating of goals and the subsequent employment of strategies to achieve and monitor advancement towards those goals, followed by engagement in reflection and the formulation of new learning goals.2,3Research findings, however, indicate that students often struggle to regulate their learning in clinical learning environments as a result of the unpredictable, dynamic and messy nature of clinical workplace settings.4,5
일찍이 1989년부터, SRL에 대한 환경 제약 및 지원의 중요성이 문서화되었다.6 그 이후로 의대생의 SRL이 상황에 따라 달라지고, 사회적으로 파생된다socially derived는 개념은 꾸준히 힘을 얻고 있다. [병원 부서의 학습 분위기, 이용 가능한 학습 기회, 다른 사람들과의 사회적 상호 작용]은 학생들의 SRL에 영향을 미친다. 또한 의료 교육생은 사회적 및 맥락적 요인에 따라 다양하게 SRL 전략을 사용한다. As early as 1989, the importance of environmental constraints and affordances to SRL was documented.6Since then, the notion that medical students’ SRL is context-dependent and socially derived has steadily gained momentum.7,8Learning climates of hospital departments, available learning opportunities and social interactions with others seem to influence students’ SRL,9and medical trainees variably use SRL strategies, depending on social and contextual factors.10
의대생의 SRL에 대한 사회적 상호작용의 잠재적 영향은 공동조절학습(CRL)의 개념으로 구체화된다.CRL에서 학습자는 환경에 있는 다른 개인들과 함께 자신의 인식, 동기, 행동을 조절한다.14 CRL에는 [네트워크 속 학생들과 다른 사람들 사이의 사회적 상호작용]이 필수적인데, 이를 통해서 SRL 개발과 같은 학습 과정이 매개 또는 분배되기 때문이다. CRL의 개념은 [사회문화적 학습이론]을 반영한다. 사회문화적 학습이론은 학습자가 환경에 의해서 지속적으로 영향을 받는다는 것을 강조하며, 동시에 맥락적 주변환경을 공동-생산하고 공동-창조함을 강조한다. The potential impact of social interactions on medical students’ SRL is embodied in the concept of co-regulated learning (CRL). In CRL, learners regulate their cognitions, motivation and behaviour together with other individuals in the environment.14Essential to CRL are social interactions between students and others in their networks, through which learning processes, such as SRL development, are mediated or distributed.15The concept of CRL reflects sociocultural learning theories that emphasise that learners are continuously influenced by their environment when simultaneously co-producing and co-creating the contextual surroundings in which they learn and work.16
학습 활동에 공동으로 참여함으로써, 의료 환경에서 학생과 동료는 서로의 메타인지 및 인지 활동을 중재하고, 개인의 독립적인 SRL 행동의 개발 및 표시를 촉진하거나 제한한다.17 최근 연구에서 밝혀진 바에 따르면 SRL에 대한 의대생의 참여는 시간이 지남에 따라 변화하며, 직장 환경에서 다른 학생들의 역할과 상호 작용에 대한 인식에 영향을 받는다. 이것은 CRL의 과정이 학생들의 자기조절 능력의 발달에 영향을 미칠 수 있다는 것을 보여준다.
By jointly engaging in learning activities, students and co-workers in health care settings mediate one another's metacognitive and cognitive activities, facilitating or constraining individuals’ development and display of independent SRL behaviours.17Findings from a recent study show that medical students’ engagement in SRL changes over time and is influenced by their perceptions of the roles of, and interactions with, others in the workplace setting.11This illustrates that processes of CRL may influence the development of students’ ability to self-regulate.
사회적 상호작용을 주요 요소로 하는 CRL이 직장 기반 학습 환경에서 SRL 발전에 어떻게 영향을 미치는지 조사하면 학생들이 임상 환경에서 SRL을 실제로 어떻게 개발하는지 더 깊이 이해하는 데 기여할 것이다. Examining how CRL, with social interactions as its main element, influences SRL development in workplace-based learning environments will contribute to a deeper understanding of how students actually develop SRL in clinical settings.
2 방법 2 METHODS
2.1 방법론 2.1 Methodology
우리는 임상실습의 CRL과 SRL 사이의 관계에 대한 의대생의 인식을 탐구하기 위해 정성적 접근법을 사용했다. 데이터 수집과 데이터 분석은 구성주의 근거이론의 원리에 의해 반복적으로 수행되었다.18, 19 구성주의 기반 이론을 사용하메 있어서, 우리는 연구진이 SRL과 CRL에 이론적, 그리고 실무적인 배경이 있음을 인정한다. 또한 자료 수집 및 분석은 SRL과 CRL의 주요 개념에 informed되었다. We used a qualitative approach to explore medical students’ perceptions of relationships between CRL and SRL in clinical clerkships. Data collection and data analysis were conducted iteratively, informed by principles of constructivist grounded theory.18,19Using constructivist grounded theory, we acknowledged the research team's theoretical (DB, EWD, DMAS, MJBG) and practical (DB, EWD, DMAS, MJBG) backgrounds in SRL and CRL, and data collection and data analysis were informed by key concepts in SRL and CRL.
2.2 설정 2.2 Setting
우리는 네덜란드 마스트리히트 대학의 의학 학부 프로그램(마스터 학위)에서 이 연구를 수행했다. 마스터스 프로그램은 학술 병원 및 부속 교육 병원의 다양한 병원 부서에서 12주에서 22주 사이의 임상 실습으로 3년 동안 이루어진다. Masters 프로그램은 역량 기반 의료 교육의 원칙에 따라 설계되었으며, 캐나다의 전문가를 위한 의료 교육 지침(CanMED)의 역할을 가장 중요한 프레임워크로 사용한다. 20 학생의 SRL은 프로그램 전체에 걸쳐 포트폴리오와 멘토에 의하여 supported된다. 일상직장감독관이 배치돼 다양한 직장 환경에서 학생들의 학습을 지원하고 지도한다. We conducted this study in the undergraduate programme (Masters degree) in medicine at Maastricht University, the Netherlands. The Masters programme comprises 3 years of clinical clerkships lasting between 12 and 22 weeks, in various hospital departments in an academic hospital and affiliated teaching hospitals. The Masters programme is designed according to the principles of competency-based medical education, using the roles of the Canadian Medical Education Directives for Specialists (CanMEDS) as its overarching framework.20Students’ SRL is supported throughout the programme by a portfolio and a mentor. Daily workplace supervisors are assigned to support and guide student learning in various workplace settings.
각 임상실습 시작 전에, 학생들은 그들의 개인적인 학습 목표를 설명하는 학습 계획을 세우고 그들의 멘토와 사무직에 배정된 지도자들과 이것에 대해 논의합니다. 각 임상실습의 마지막에 학생들은 멘토와 협업하여 자신의 경험과 포트폴리오에 업로드된 피드백을 되새기고 다음 단계의 훈련을 위한 새로운 학습 목표를 수립한다. 학습 계획은 학생의 포트폴리오에 포함되며, 이 외에도 포트폴리오에는 평가 데이터(예: 피드백 양식 및 테스트 결과), 경험에 대한 성찰, 학생이 자신의 개인적 및 전문적 개발을 모니터링하는 데 중요하다고 생각하는 모든 정보 등이 들어간다.
Before the start of each clerkship, students formulate a learning plan that describes their personal learning goals and discuss this with their mentor and the supervisors assigned for that clerkship. At the end of each clerkship, students collaborate with their mentors to reflect on their experiences and the feedback uploaded to the portfolio and formulate new learning goals for the next phase of training. Learning plans are included in students’ portfolios, as are assessment data (eg feedback forms and test results), reflections on experiences, and any information students deem valuable for monitoring their personal and professional development.21
2.3 참가자 및 샘플링 2.3 Participants and sampling
전체적으로 석사과정 학생의 79%가 여학생이다. 임상 훈련의 해와 성별의 다양성을 보장하기 위해 Masters 프로그램에 등록한 의대생들을 의도적으로 표본으로 추출했다(표 1). 학생들은 이메일을 통해 참여하도록 초대되었다. 최초 초대 후 2주 후에 리마인더가 발송되었습니다. 10번의 인터뷰 후, 우리는 데이터 포화도를 달성했고 구성된 주제와 그들의 관계에 대한 적절한 이해를 얻었다고 판단했다. 참가자들은 10유로의 상품권을 받았습니다. Overall, 79% of students in the Masters programme are female. We purposively sampled medical students enrolled in the Masters programme to ensure variety in year of clinical training and gender (Table 1). Students were invited to participate via e-mail. Reminders were sent 2 weeks after the initial invitation. After 10 interviews, we considered that we had achieved data saturation and had gained an adequate understanding of the constructed themes and their relationships. Participants received a gift voucher for €10.
2.4 데이터 수집 2.4 Data collection
2018년 2월과 6월 사이에, 제1저자(DB)는 50분에서 75분 사이의 반구조적 인터뷰를 실시했다. 연구팀은 목표수립과 전략설계원리, 모니터링, 자기성찰 과정, CRL(학생들이 참여하는 관련 사항, 상호작용의 성격) 등 SRL의 핵심 개념을 반영한 인터뷰 가이드를 개발했다. 사전 동의를 얻은 후, 제1저자(DB)는 학생들에게 SRL에 대한 설명을 제공했다. 인터뷰의
첫 번째 부분은 임상 환경에서 [SRL에 참여하는 방법에 대한 관점]을 얻는 것을 목표로 했고,
두 번째 부분은 [SRL 기술의 발달에 대한 사회적 상호작용의 영향]에 대한 학생의 인식에 초점을 맞췄다.
마지막 부분은 [SRL과 CRL의 개발 측면]에 초점을 맞췄다.
Between February and June 2018, the first author (DB) conducted semi-structured interviews that lasted between 50 and 75 minutes. The research team developed an interview guide informed by key concepts of SRL, such as goal formulation and strategy design principles, monitoring and self-reflection processes, as well as CRL (relevant others with whom students engaged, as well as the nature of their interactions). After obtaining informed consent, first author (DB) provided students with a description of SRL.
The first part of the interview then aimed to obtain the student's perspectives on how he or she engaged in SRL in the clinical setting;
the second part focused on the student's perceptions of the impact of social interactions on the development of SRL skills.
The final part of the interview focused on developmental aspects of SRL and CRL (Appendix S1).
인터뷰 동안, 인터뷰 진행자는 학생들이 묘사한 행동에 대한 상세한 예시와 설명을 제공하도록 유도했다. 인터뷰 가이드는 동시 데이터 분석을 통해 인터뷰 사이에 반복적으로 업데이트되었습니다. 모든 인터뷰는 테이프에 녹음되어 그대로 옮겨졌다.
During interviews, the interviewer prompted students to provide detailed examples and explanations of behaviours they described. The interview guide was updated iteratively between interviews, informed by concurrent data analysis. All interviews were tape-recorded and transcribed verbatim.
2.5 데이터 분석 2.5 Data analysis
데이터 수집과 분석은 반복적인 과정을 따랐고, 데이터 수집과 데이터 분석이 서로 정보를 제공할 수 있도록 했다. 제1저자(DB)와 연구보조자(CN)는 CRL 및 학생들의 SRL 발달과 관련된 개념을 포착하기 위해 독립적으로 1-3번 대본을 읽고 코드화했다. Data collection and analysis followed an iterative process, allowing data collection and data analysis to inform each other. The first author (DB) and a research assistant (CN) independently read and coded transcripts 1-3 line by line to capture concepts related to CRL and students’ development of SRL.
초기 코딩 스킴에서 코드는 학습 목표의 공식화, 피드백 및 피드백 수신 요청, 학생들이 CRL 과정에 참여하는 중요한 다른 사람들의 세부 사항과 같은 다양한 SRL 및 CRL 행동을 기술했다. 또한 임상 훈련 단계와 같은 SRL 개발과 관련된 요소들과 영향을 미치는 요소들도 포함되었다.
코딩 프레임워크는 합의에 도달할 때까지 비교되고 논의되었다.
DB는 4-11번 대본을 코딩하는 데 코딩 스킴을 활용, 연구팀과 지속적인 비교와 논의를 통해 코딩 프레임워크를 지속적으로 다듬었다.
연구팀은 이후 코드를 분류하고 축 코딩을 통해 주제 간 관계를 파악했다.
연구팀은 분석 마지막 단계에서 선택적 코딩을 활용해 [CRL이 학생들의 SRL 발달에 미치는 영향에 대한 이론]을 개발했다.
이 과정을 용이하게 하기 위해 DB는 주제, 하위 주제 및 관계를 제시하는 개념 맵을 만들었고, 연구팀 회의 때 이것을 이론 개발을 가이드하는 데 사용했다
또한 DB는 데이터 분석 전반에 걸쳐 메모에 성찰, 아이디어, 해석을 담았다.
데이터 분석은 질적 연구 소프트웨어 atlas.ti의 지원을 받았다.
In the initial coding scheme, codes described various SRL and CRL behaviours such as the formulation of learning goals, asking for feedback and feedback reception, and details of the significant others with whom students engaged in CRL processes. Also included were factors related to and influencing the development of SRL such as the phase of clinical training.
Coding frameworks were compared and discussed until consensus was reached.
DB used the coding scheme to code transcripts 4-11, continuously refining the coding framework through constant comparison and discussion of findings with the research team.
The research team subsequently categorised codes and identified relationships between themes through axial coding.
During the final stage of analysis, the research team used selective coding to develop theory about the influence of CRL on students’ SRL development.
To facilitate this process, DB constructed concept maps, presenting themes, sub-themes and their relationships, which were used during research team meetings to guide theory development.
DB furthermore captured reflections, ideas and interpretations in memos throughout the data analysis.
Data analysis was supported by the qualitative research software atlas.ti (ATLAS.ti Scientific Software Development GmbH, Berlin, Germany).
2.6 반사율 2.6 Reflexivity
우리의 방법론적 접근법에서 의미는 연구 참가자, 생성된 데이터 및 연구팀의 해석을 통해 구성된다. DB는 업무와 조직심리학을 전공한 학력이 있는 박사후보자다. MJBG와 EWD는 Maastricht 대학교에서 Masters 프로그램의 평가 측면 개발에 참여하는 의학 교육자 및 연구원이다. DMAS는 전문적인 평가, 커리큘럼 설계, 학생의 평가 실무 참여 등이 주요 분야인 교육 연구원이다. 마스트리히트 대학교는 협력적이고 자기주도적인 학습이 중추적인 역할을 하는 문제 기반 학습(PBL) 철학으로 특징지어진다. EWD와 MJBG는 상당한 시간 동안 이 설정 내에서 작동해 왔으며 DB는 PBL 원칙에 따라 공식적인 교육을 받았다. DB는 메모와 필드 노트를 사용하여 데이터 수집 및 분석 전반에 걸쳐 보기와 해석을 캡처했습니다. Within our methodological approach, meaning is constructed through interactions with research participants, the data generated, and their interpretation by the research team. DB is a PhD candidate with an educational background in work and organisational psychology. MJBG and EWD are medical educators and researchers involved in the development of the assessment aspect of the Masters programme at Maastricht University. DMAS is an education researcher whose main areas of expertise are professional assessment, curriculum design and student involvement in assessment practices. Maastricht University is characterised by its problem-based learning (PBL) philosophy, in which collaborative and self-directed learning play pivotal roles. EWD and MJBG have worked within this setting for substantial lengths of time and DB has had formal education according to PBL principles; these backgrounds may have influenced their views on CRL and SRL and how these may be related. DB used memos and field notes to capture views and interpretations throughout data collection and analysis.
3 결과 3 RESULTS
데이터로부터, 우리는 학생들의 SRL의 세 가지 주요 변화를 구성할 수 있었고, 이는 학생들이 사무직을 통해 진행됨에 따라 CRL에 대한 학생들의 참여에 동시에 영향을 미치고 영향을 미쳤다.
첫째, 학생들은 [CRL에 참여하는 사람]에 대한 변화를 표현하였다. 임상실습 [시작 시에는 동료]들에게 중요한 역할을 부여하고, 프로그램이 끝날 때 [임상의 롤 모델]에 대한 선호도를 높였다.
둘째, 초보 학생의 SRL은 주로 [외부적인 환경적 단서]에 의해 추동되는 반면, 경험이 쌓인 학생의 SRL은 [내재적 단서와 자기 동기 부여]에 의해 점점 더 추진되었다.
마지막으로, 조절행동은 [업무 지향적 접근법]에서 [전문적인 역량과 정체성 형성]에 초점을 맞춘 보다 [포괄적인 접근법]으로 전환되었다.
From the data, we were able to construct three major shifts in students’ SRL, which were simultaneously influenced by and exerted influence on students’ engagement in CRL as they progressed through clerkships.
Firstly, students expressed a shift with regard to whom they involved in CRL, bestowing an important role on peers at the start of clerkships and increasing their preferences for clinician role models towards the end of the programme.
Secondly, novice students’ SRL was mainly externally driven by cues in the environment, whereas experienced students’ SRL was increasingly driven by intrinsic cues and self-motivation.
Finally, regulatory behaviours shifted from a task-oriented approach towards a more comprehensive approach that focuses on professional competence and identity formation.
3.1 동료와의 상호 작용에서 임상의사의 역할 모델과의 상호 작용 3.1 From interacting with peers to interacting with clinician role models
학생들은 임상실습 과정 동안 누구와 함께 CRL에 engaged with 했는지에 대한 변화를 묘사했다. 프로그램을 시작할 때, [동료들과의 상호작용]은 여러 가지 목표를 달성하며 중요한 역할을 했다. 초보 학생들은 임상실습에서의 기대와 기회에 대해 확신이 없어서, 새로운 학습 환경에 대한 이해를 발전시키기 위해 서로 의지한다고 말했다. Students described a change with regard to whom they engaged with in CRL over the course of clerkships. At the start of the programme, interactions with peers played an important role, serving several goals. Novice students indicated being unsure of clerkship expectations and opportunities and thus relying on one another to develop an understanding of the new learning environment:
내가 또한 당신이 이곳에 처음 왔을 때 정말 좋아하는 것은 다른 인턴[동료 학생]들이 항상 당신을 데리고 다니며 길을 안내해주고, 또한 당신이 이 문제를 가장 잘 해결할 수 있는 방법을 알려준다는 것이다. What I also really like when you're new to a place is that other interns [fellow students] always take you along, show you the way, and also point out how you can best tackle this here. (Student 2, Year 2)
추가적으로, 초보 학생들은 학습 목표를 세우거나, 학습 전략과 학습 기회의 선택을 고려할 때 서로 의지하는 경향이 있었다.
Additionally, novice students tended to rely on one another to create a frame of reference in order to formulate learning goals, and to think about learning strategies and selection of learning opportunities:
당신은 어느 정도 기준점이 있습니다. 예를 들어, 여러분(동료 학생들)은 이렇게 한다는 것이다. 아니면 그것이 중요하다고 생각하거나, 여러분은 이미 알고 있습니다. 글쎄, 나도 그걸 알아야 할 것 같은데, 어떻게 하는 거야? You have a frame of reference, more or less. Like, you [fellow students] do it like this or think that is important or you already know it. Well, maybe I should know it too, so how do you do it? (Student 1, Year 2)
따라서 또래와의 상호작용은 학생들의 지식이나 기술 숙련도의 격차를 노출시켰고, 그들이 이러한 [격차를 해소]하기 위한 목표와 전략을 수립하는 데 도움을 주었다. Interactions with peers thus exposed gaps in students’ knowledge or skill proficiency, helping them to formulate goals and strategies to address these gaps.
비록 초보 학생들에게는 또래간의 상호작용이 새로운 학습 환경에서 길을 찾고 더 편안하게 느끼도록 도와주었지만, 학생들은 각각의 새로운 임상실습에서 새로운 환경에 적응하며 경험을 쌓았다. 시간이 지나면서, 그들은 의료업무에 점점 더 많이 참여했고, 이것은 그들이 무엇을 배우길 원하거나 배워야 할 필요가 있는지를 더 확고하게 이해하는 데 도움을 주었다. 경험이 쌓인 학생들은 학습의 조절을 위해 다른 source에 의존한다고 보고했고, 주치의나 레지던트 같은 임상의사 롤모델을 언급했다. 이러한 역할 모델은 피드백 제공을 통해 학생들의 SRL 행동에 영향을 주었지만, 특히 의사들과의 [상호 작용과 관찰에 기초한 자기 성찰]을 자극함으로써 영향을 미쳤다. Although peer interactions helped novice students to navigate and feel more comfortable in the new learning environment, students gained experience in adapting to new environments with each new clerkship. Over time, they participated increasingly in health care tasks, which helped them to develop a firmer grasp of what they wanted or needed to learn. Experienced students reported that they then relied on other sources to help regulate their learning, referring to clinician role models such as attending physicians and residents. These role models influenced students’ SRL behaviour through the provision of feedback, but especially through the stimulation of self-reflection based on interactions with and observations of these physicians:
원칙적으로 의사는 3년 동안 당신의 롤모델이다. 당신은 의사를 관찰하면서 내가 어떻게 그럴 수 있을까, 나는 이런 의사가 되고 싶은가, 아니면 다른 사람이 되고 싶은가 하는 생각을 하게 된다. 그리고 이 모든 다양한 전문가들을 만나면서 여러분은 자신만의 의사를 만들게 됩니다. 예를 들어, 여러분이 되고자 하는 의사들에 대한 아이디어를 말이죠. (9학년, 2학년) In principle, the physician is your role model for 3 years, so you observe him and think, how would I do that and do I want to be this kind of doctor or do I want to be another kind? And through meeting all these different specialists, you create your own, let's say, [idea of the] physician you want to become. (Student 9, Year 2)
3.2 외적 조절동인에서 내적 조절동인으로 3.2 From external regulatory drivers to internal regulatory drivers
프로그램을 시작할 때, 학생들의 SRL은 대부분 외부에서 추동되는 것처럼 보였다. 초보 학생들은 임상실습에 시작 시 학습 목표를 세울 때 [포트폴리오 지침]을 따르고 [다른 사람의 의견input]에 의존하는 것을 묘사했다. 그러나, 그들은 또한 이러한 학습 목표가 특정 환경에서 학습 가능성과 잘 맞지 않는다는 것을 발견했고, 이는 학습 계획으로부터 멀어지게 만들었다. 프로그램의 첫 임상실습 동안, 학생들은 그들이 반응적으로 학습 목표와 전략을 조정할 수 있도록 돕기 위해 [실제 직장 내의 다른 사람들]에게 의존했다. 예를 들어, [레지던트들과 의사]들은 학생들이 무엇을 중요한 학습 목표로 생각해야 하는지에 대해 명확한 방향을 제시함으로써 그들의 학습을 조절하는 것을 도왔다.
At the start of the programme, students’ SRL seemed to be largely externally driven. Novice students described complying with portfolio instructions and relying on input from others when formulating learning goals prior to a clerkship. Quite often, however, they also found that these learning goals were not well aligned with learning affordances in a specific setting, which led to feelings of detachment from their learning plans. During the first clerkships of the programme, students then depended on others in the actual workplace setting to help them reactively adjust learning goals and strategies. Residents and physicians, for example, helped students regulate their learning by providing clear and explicit directions on what they thought were important learning goals:
네, 물론 의사가 '야, 이거 재밌는거야'거나 '임상실습 끝날 때까지 할 수 있어야 해'라고 말한다면, 당연히 동의해야죠. (학생 11, 1학년)
Yes, of course if a doctor says, ‘Hey, this is fun to do’ or ‘You should be able to do this by the end of the clerkship,’ then of course, you go along with it. (Student 11, Year 1)
특히 작업장 관리자는 이러한 측면에서 중요한 역할을 하는 것으로 보입니다. Workplace supervisors in particular seemed to play important roles in this respect:
당신은 항상 직장 상사와 수다를 떨고, 그들은 다음과 같은 말을 합니다. "우리는 당신이 이것저것 배우고, 당신의 사무직에서 이것저것 벗어나기를 기대합니다." 이러한 [기대]를 미리 목표에 반영하지 않았다면, [이제부터라도] 고려해보겠다고 생각할 것입니다. (학생 10, 1학년) You always chat with your workplace supervisor, and they say things like: ‘We expect you to learn this and that, and get this and that out of your clerkship.’ If you haven't already factored these [expectations] into your goals beforehand, then you think, okay, I'll take them into account [now]. (Student 10, Year 1)
자기조절학습은 학생과 의사가 [공동활동에 협력하는 상황]에 기반을 둔 경우도 많았다. 학생들은 일부 의사들이 그 활동activity에 대해 지속적으로 질문을 던졌고, 이는 지식이나 기술 숙련도의 격차를 드러냈다고 보고했다. 이를 통해 학생들은 학습 활동과 프로세스의 방향을 설정하고, 격차를 해소할 수 있었습니다. Self-regulated learning was also often grounded in situations in which a student and a physician were cooperating in a joint activity. Students reported that some physicians consistently posed questions about the activity, which uncovered gaps in knowledge or skill proficiency. This helped students to direct their learning activities and processes and bridge the gaps:
수술실에 있을 때 [외과의가 해부학에 대해 여섯 가지 질문을 하는데 딱 한 가지 대답만 할 수 있다면] 집에서 해야 할 일이 있다는 것을 알게 될 것이다. When you're in the operating room, and the surgeon asks six questions on anatomy and you can only answer one, then you sure know you have something to do at home. (Student 9, Year 2)
따라서 초보 학생들의 SRL은 [학습 환경 속 다른 사람들]에 의해 주로 시작되는 것처럼 보였다. Novice students’ SRL thus seemed to be predominantly initiated by others in the learning environment.
시간이 지남에 따라 학생들이 자신에게 기대되는 것이 무엇인지 더 잘 이해하게 되면서, 그들은 점점 더 그들이 되고자 하는 의사 유형에 대해 생각하기 시작했고, 학습에 필요한 정보를 제공할 수 있는 다른 사람들을 찾고 선택하는 사회적 센서를 개발했다. 다양한 건강 관리 환경을 경험하고 그들이 발전하는 직업적 정체성에 대해 점점 더 인식하게 되면서, 경험이 많은 학생들은 CRL에 다른 사람들을 참여시키는 데 있어 더 이니셔티브를 가질 수 있는 것처럼 보였다. 학생들은 점점 더 조절 활동을 '책임질take charge' 의지와 능력이 있는 것처럼 보였다. 그들의 개인적인 학습 욕구를 인식하면서, 그들은 관련 있는 다른 사람들에게 그들의 학습을 조절하는 것을 도와달라고 적극적으로 요청하는 데 더 자신감이 있는 것처럼 보였다.
Over time, as students gained a better understanding of what was expected of them, they increasingly began to think about the type of physician they wanted to become and developed social sensors that helped them look for and select suitable others to provide input for their learning. Having experienced a variety of health care settings, and as they became increasingly aware of their developing professional identity, experienced students seemed better able to take the initiative in engaging others in CRL. They seemed increasingly willing and able to ‘take charge’ of regulatory activities. Appreciating their personal learning needs, they seemed more confident in actively asking relevant others to help them regulate their learning:
내과 실습 중, 어느 날은 진짜 이렇게 물어봤다. 어려운 대화가 있거나, 전할 나쁜 소식이 있다면, 알려주세요. 제 학습 목표거든요. (6학년, 3학년) Then once I really did ask, on [the clerkship in] internal medicine, if there is a difficult conversation, or there's bad news to deliver, please let me do it because it's my learning goal. (Student 6, Year 3)
학생들은 자신의 학습을 지원하기 위해 CRL에 참여할 수 있는 정도는, [목표 설정]과 [이러한 목표를 달성하기 위한 전략 수립과 같은 SRL 기술을 사용할 의지]와 [충분한 자신감]이 있는지 여부에 달려 있다고 보고했다. 즉, [배우고 싶은 것을 확실히 파악하여 학습을 통제]했을 때, 학습 기회를 선택하거나 만들기 위해 환경에서 다른 사람을 참여시키고 동원할 수 있는 용기를 더 쉽게 발견했다고 학생들은 설명했다.
Students reported that the extent to which they were able to engage in CRL to support their learning depended on whether they were willing and sufficiently confident to use SRL skills such as goal setting and the devising of strategies to achieve these goals. That is, students explained that when they took control of their learning based on a firm grasp of what they wanted to learn, they more readily found the courage to engage and mobilise others in the environment to select or create learning opportunities:
저는 제 자신의 학습을 많이 통제할 수 있다고 느낍니다. 이니셔티브를 가지고 배우고 싶다는 것을 보여주는 것이다. 그리고 또한 질문을 하고, 할 일을 요구하거나, 제안을 하는 용기를 갖는 것. I do feel that I can control it [my own learning] a lot. By taking the initiative and showing that you want to learn. And also having the courage … to ask questions and to ask for things to do, or to come up with suggestions. (Student 1, Year 2)
3.3 특정업무에서 전문역량 및 전문성 개발까지 3.3 From specific tasks to professional competence and professional development
학생들은 학습 조절의 초점이 임상실습을 하는 동안 달라졌다고 지적했다. 초보자들은 업무 지향적이라고 묘사했다. 즉, 목표 설정은 [높은 수준의 세분화]가 특징이며, 초보자는 [명확하게 구분된 학습 목표를 달성]하는 데 중점을 두었다. Students indicated that the focus of the regulation of learning shifted over the course of clerkships. Novices described being task-oriented. That is, goal setting was characterised by high levels of granularity; novices focused strongly on attaining clearly demarcated learning goals (and onformulatinglearning goals):
의사를 위한 프레임워크 계획[CanMEDs 프레임워크]을 살펴본다. 그것은 역량에 따라 세분화되며, 그 하위 역량은 특정한 요소로 나뉜다. I look at the framework plan for physicians [CanMEDS framework]. It's subdivided into competencies and those sub-competencies are divided into specific components. (Student 10, Year 1)
따라서 초보자의 경우 CRL은 [좁게 정의된 과제별 학습 목표를 수립하고 성찰]하는 것에 [다른 사람(동료 및 멘토)을 주로 참여]시켰다. 결과적으로, 자기 성찰은 대부분 [공식화된 학습 목표의 달성 여부에 대한 평가]로 구성되었다. For novices, CRL thus mainly entailed engaging others (peers and mentors) in formulating and reflecting on narrowly defined, task-specific learning goals. Consequently, self-reflection most often consisted of an evaluation of whether or not formulated learning goals were attained.
경험이 쌓인 학생들은 임상실습 통해 발전하면서 경험을 쌓으면서,[현실적이고 실현 가능한 학습 목표]를 수립할 수 있을 뿐만 아니라 [학습 목표의 초점을 보다 포괄적인 의료 전문성의 측면]으로 이동시켰다고 보고했다. 즉, 경험 많은 학생들은 초보자들이 적용한 [높은 수준의 세분성]을 뛰어넘는 학습 목표를 세우고,[목표 설정과 자기 성찰에 대한 더 넓은 접근법]을 채택했다. 따라서, 경험 많은 학생들의 학습 목표는[전문적인 발달과 정체성 형성의 수준]까지 올라갔다.
Experienced students reported that, as they gained experience by progressing through clerkships, they not only became more capable of formulating realistic and feasible learning goals, but they also shifted the focus of their learning goals on to more comprehensive aspects of medical expertise. That is, experienced students formulated learning goals that transcended the high level of granularity applied by their novice counterparts, and adopted a broader approach to goal setting and self-reflection. Thus, the learning goals of experienced students rose to the level of professional development and identity formation:
첫 임상실습에서는 구체적인 학습 목표, 상황을 개선하기 위해 더 신경을 쓰고, 마지막 임상실습에서는 어떻게 하면 전반적으로 좋은 의사가 될 수 있을까에 더 신경을 씁니다. 그러면 저는 더 이상 구체적인 사항들에 신경 쓰지 않습니다. 저는 제가 어떤 의사가 되고 싶은지, 어떤 전문 분야에서 일하고 싶은지, 그것을 이루기 위해 제 선택을 어떻게 direct할 수 있는지에 대해 더 신경을 씁니다. (6학년, 3학년) In your first clerkship, you are more concerned with specific learning goals, to improve things, and in your last clerkship you are more concerned with how do I become a good doctor in general. Then I'm no longer bothered by the specifics […] I'm more concerned with the kind of doctor I want to be, what specialism I want to work in, and how I can direct my choices to achieving that. (Student 6, Year 3)
4 논의 4 DISCUSSION
이 연구는 임상 작업 공간 환경에서 CRL에 대한 의대생의 인식을 탐색하고 학습 환경에서 다른 사람과의 상호작용이 학생의 SRL 발달에 어떤 영향을 미치는지 조사하는 것을 목표로 했다. 우리의 연구 결과는 시간이 지남에 따라 CRL과 SRL에 대한 학생들의 참여가 변화하고 학습 환경에 대한 인식과 경험의 변화와 직업적 정체성 개발에 영향을 받는다는 것을 보여준다. 우리의 연구 결과는 세 가지 주요 변화가 시간 경과에 따른 학생들의 발전에 핵심임을 시사한다.
(a) CRL 파트너 선정의 변화: 동료에서 임상의 롤모델로 이동
(b) SRL 행동의 변화: 초보 학생은 외부적으로 주도되나, 경험이 풍부한 학생은 내부적으로 주도되며 타인에게 신중하고 proactive하게 참여를 유도하는 경향이 있음
(c) 조절 초점의 변화: 학습자가 [잘 정의된 과제와 과제 요구 사항]에서 [전문직 정체성 발달과 관련된 전문 역량에 대한 광범위한 관점]으로 이동
This study aimed to explore medical students’ perceptions of CRL in clinical workplace settings and to investigate how interactions with others in the learning environment affect the development of students’ SRL. Our findings show that students’ engagement in CRL and SRL changes over time, and is influenced by changing perceptions and experiences of the learning environment and the development of a professional identity. Our findings suggest that three major shifts are key to students’ development over time:
(a) a shift in the selection of CRL partners, which moves from peers to clinician role models;
(b) a shift in SRL behaviours, which tend to be externally driven in novice students and become internally driven and involving of the deliberate, proactive engagement of others in more experienced students; and
(c) a shift in regulatory focus as learners move from well-defined tasks and task requirements to a broader view of professional competence in relation to the developing of a professional identity.
본 연구의 연구 결과는 이전 연구의 결과를 입증하고 의대생의 SRL 개발에는 임상 환경에서 사회적 상호 작용의 중요함을 강조한다. 이는 Berkhout와 동료들의 연구 결과와 일치하여, 현재의 연구 결과는 학생들의 SRL에 대한 다른 사람들의 영향이 초보 학생들과 경험 많은 학생들 사이에 다르다는 것을 시사한다.
초보 학생들이 주로 동료들에 의존하여 학습 환경을 탐색하는 데 도움이 되는 frame of reference을 공동-생성하는 반면,
경험이 많은 학생들은 통제력을 얻고, 경험이 많은 다른 임상의 롤 모델과 상호 작용하며, 점점 더 자신의 학습을 서포트하기 위한 목적의 공동 조절 활동에 이들을 참여시킨다.
The findings of our study corroborate those of previous research and stress the importance of social interactions in clinical settings for the development of medical students’ SRL. Aligned with findings from the study by Berkhout and colleagues,11the current findings suggest that the influence of others on students’ SRL differs between novice and experienced students.
Whereas novice students mainly rely on peers to co-create a frame of reference to help them navigate the learning environment,
experienced students learn to take control, to interact with clinician role models as more experienced others and to increasingly engage these in co-regulatory activities to support their own learning.
또한 참가자들은 자신이 배우고자 하는 것과 이러한 목표의 달성이 전문적인 역량 개발에 어떻게 기여할지에 대한 명확한 견해를 갖게 된다면 다른 사람들을 학습에 더 쉽게 참여시킬 수 있을 것이라고 보고했다. 이러한 결과는 SRL과 CRL 사이의 관계가 상호적이라는 것을 시사한다.
SRL 기술은 다른 사람과의 상호작용을 통해 개발되는 반면
SRL 기술의 숙달mastery은 학생들이 학습과 역량 개발을 위해 의미 있는 CRL에 능동적으로 참여할 수 있도록 한다.
Participants furthermore reported that they could more readily engage others in their learning if they had developed a clear view about what they wanted to learn and how the achievement of these goals would contribute to the development of professional competence. These findings suggest relationships between SRL and CRL are reciprocal:
SRL skills develop through interactions with others,
whereas the mastery of SRL skills increasingly enables students to proactively engage in meaningful CRL to enhance their learning and competence development.
[개인이 되고자 하는 의사 유형에 대한 성찰]뿐만 아니라, [의료 업무에 대한 적극적인 참여]는 학생들이 일과 학습 환경에서 다른 사람들과의 상호작용을 통해, [학습을 점점 더 잘 조절하고 기꺼이 조절하는 학습자]로 발전하는 데 영향을 미치는 중요한 촉진 요인으로 보인다.
Active participation in health care tasks, as well as reflection on the type of physician the individual wants to become, seem to be important facilitating factors, influencing students’ development into learners who are increasingly able and willing to regulate their learning through interactions with others in the work and learning environments.
본 연구의 참가자들은 [(학습과 일이 얽혀 있는 학습 환경으로서의) 임상 환경]에 대한 깊은 이해에 [자신의 학습을 조절할 수 있는 능력]이 달려있음을 분명히 나타냈다. 학생들은 임상실습 내에서 학습 기회에 대한 이해가 부족할 경우, 학습 목표를 설정해야 할 때 도전과 좌절이 반복된다고 보고했다. 그 결과, 학생들은 [실제 진행되는 학습과 업무 경험]뿐만 아니라 [레지던트, 의사, 동료들과의 관찰과 협상]을 바탕으로 [목표를 지속적으로 조정하고 다듬어야 한다]고 느꼈다. 이러한 발견은 [임상적 맥락에서 목표를 설정]할 때, 목표가 현실적이고 달성가능하려면, [학생과 감독자 사이의 협상과 감독자의 참여]를 필요로 한다는 이전 연구의 결과와 일치한다.22, 23 Participants in our study clearly indicated that the ability to regulate their own learning depended on their having a deep understanding of the clinical setting as a learning environment in which learning and work are intertwined. Students repeatedly reported being challenged as well as frustrated when tasked with setting learning goals if their understanding of the learning opportunities within clerkships was insufficient. In consequence, students felt they were then forced to continuously adjust and refine their goals based on observation of and negotiation with residents, physicians and peers, as well as on actual learning and work experiences. These findings are in line with those of previous studies which showed that goal setting in clinical contexts requires negotiation between students and supervisors and engagement from supervisors if goals are to be realistic and attainable.22,23
우리의 연구 결과는 또한 학생들이 임상실습 환경에서 [팀에 포함되는 정도와 속도]가 [피드백을 요청하거나 의료 업무에 대한 자신의 적극적인 참여를 협상함]으로써, 다른 사람들을 학습 조절에 능동적으로proactive하게 참여engage시키는 능력에 영향을 미친다는 것을 보여주었다. 이는 특정 업무 환경에서는 CRL 기회를 활용하기 위해 학생을 CoP(실천 공동체)에 장기간 포함하도록 촉진해야 함을 시사할 수 있다. Our findings also showed that the extent to which and the pace at which students are embedded in teams in clerkship environments influenced their ability to proactively engage others in the regulation of their learning through the solicitation of feedback or by negotiating their own active participation in health care tasks. This may suggest that we need to facilitate the prolonged inclusion of students into communities of practice (CoPs) to capitalise on the opportunities for CRL in specific work settings.24
CoP에서 개인은 일반적으로 목표를 공유하고, 이러한 목표를 달성할 수 있는 최선의 방법에 대한 대화를 함으로써, 서로로부터 배우고, 이에 따라 서로의 지식과 기술을 지속적으로 심화시킨다. CoP는 동료들과 더 경험이 많은 다른 사람들을 학습 조절에 참여시킬 수 있는 기회를 만들 뿐만 아니라, 직무과 의료의 질에 대한 토론에 참여할 수 있는 기회를 제공하고, 학생들이 의사가 되기 위해 무엇이 필요한지에 대한 성찰을 자극하여, 전문직 정체성 형성과 SRL의 발달을 지원한다.
In CoPs, individuals typically engage in learning from and with each other by sharing goals and having conversations about how best to achieve these goals, and thereby continuously deepening one another's knowledge and skills.25Not only do CoPs create opportunities to engage peers and more experienced others in the regulation of learning, but they also offer opportunities to engage in discussions about the quality of work and health care, stimulating students’ reflections on what it takes to be and become a medical doctor and thereby supporting their professional identity formation and subsequent development of SRL.
본 연구의 발견뿐만 아니라 이전 연구에 근거하자면, 동료들은 목표 설정에서 학생들을 지원하고 학습 환경의 기회와 기대에 익숙해질 수 있기 때문에, 초보 학생들의 SRL 개발에 중요한 역할을 수행하는 것으로 보인다. 동료 지원 학습(PAL)은 또한 학생들의 전문직 정체성 형성에 기여하는 것으로 나타났다. 따라서 우리는 예를 들어, [초보 학생과 더 경험이 많은 학생들 사이에 학습과 협력 관계를 형성]함으로써 CoP 내에서 PAL을 자극하는 데 더 많은 주의를 기울여야 할 수 있다. PAL에는 양방향의 서포트가 수반되기 때문에, CoP 내에서 PAL을 자극하면 학습자의 코칭과 교수 능력을 키우는 추가적인 이점이 있다.29
Based on the findings of our study, as well as findings from previous research,11peers seem to fulfil important roles in novice students’ development of SRL because they can support students in goal setting and familiarise newcomers to opportunities within and expectations of the learning environment. Peer-assisted learning (PAL) has furthermore been shown to contribute to students’ professional identity formation.26,27We therefore may need to pay more attention to stimulating PAL within CoPs, by, for example, forming learning and working partnerships between novice and more experienced students. As PAL entails bidirectional support,28stimulating PAL within CoPs will deliver the added benefit of developing learners’ coaching and teaching skills.29
전반적으로, 우리의 연구 결과는 SRL이 CRL에 내장되어 있다는 개념을 뒷받침하며, 이러한 생각은 탄력을 받고 있다. 현재 연구는 학생들의 SRL 발달에 있어 '자신을 넘어서beyond the self'를 바라볼 필요성을 강조한다. 우리의 발견은 SRL 개발을 포함한 직장 학습workplace learning이 항상 다른 사람과의 상호 작용에서 발생하며, 학생들의 SRL은 항상 CRL에 대한 참여를 수반한다는 것을 나타내는 [사회 문화 학습 이론] 내의 필수 개념을 반영한다. 학생들은 타인으로부터 '자율적으로' '독립적으로' 배우는 학생으로 발전한다기보다는, 자기 조절 학습자로의 변화하면서 [CRL에 참여하는 방식과 타인을 학습에 의도적이고 의미 있게 참여시키는 능력]이 증가하였다. Overall, our findings support the notion of SRL as being embedded in CRL, an idea gaining momentum.30The current study highlights the need to look ‘beyond the self’ when examining and facilitating students’ SRL development. Our findings reflect essential notions within sociocultural learning theories, indicating that workplace learning, including the development of SRL, always occurs in interactions with others, and that students’ SRL always involves engagement in CRL. Rather than developing into students who learn ‘autonomously’ and ‘independently’ from others, students’ transformation into self-regulated learners is reflected through significant changes in the way that they engage in CRL and their increasing ability to purposively and meaningfully engage others in their learning to support their development of competence.
능력 SRL이 상황에 따라 다르다는 것이 점점 더 인정되고 있지만, 종종 여전히 학습자의 독립성과 자율성을 강조하고 강조한다.31, 32 본 연구는 이러한 아이디어에 문제를 제기하며, SRL 발달뿐만 아니라, 임상 작업 공간 환경에서 사회적 상호작용에 내재된 SRL 발달을 고려할 것을 지지한다. 학생들의 [SRL 개발]을 [CoP에서 CRL에 참여하는 능력의 개발]로 개념화하는 것은 [임상실습을 조직하고 의대생들에게 학습을 조절하도록 교육하는 방법]에 중요한 함의를 갖는다. 예를 들어, 우리는 학생들이 여러 개의 짧은 블록식 로테이션을 통해 순환하는 현재의 의료 훈련 모델을 재고해야 할 수도 있다.
Although it is increasingly acknowledged that SRL is context-dependent, research often still emphasises and underscores learner independency and autonomy.31,32The present study challenges this idea and instead advocates for considering SRL, as well as SRL development, as being embedded in social interactions in clinical workplace settings. Conceptualising the development of students’ SRL as the development of students’ ability to engage in CRL in CoPs has important implications for how we organise clinical clerkships and how we educate medical students to regulate their learning. For instance, we may need to reconsider current models of medical training in which students rotate through multiple short-block rotations.
오히려, 우리는 학생들이 CoP의 중심으로 이동하고 CRL의 기회를 완전히 이용할 수 있도록 하기 위해 종단적 통합임상실습에서 건강 관리 팀 내에서, 안전하고 신뢰할 수 있는 종단적 관계의 개발을 촉진해야 한다. 나아가 학생들이 [직무환경에서 학습을 조절할 수 있는 학습자]로 발전할 수 있게 하려면, 목표 설정, 자기 평가, 성찰과 같은 스킬에 대한 훈련과 코칭뿐만 아니라, 무엇보다 [피드백 탐색 및 타인을 학습 대화에 관여시키는 것]과 같이 [CRL에 참여할 수 있는 스킬]에 주의를 기울여야 할 수 있다. 의학교육의 시작부터 SRL이 CRL에 내재되어 있다는 것을 인정하면, 학생들이 직무환경에서 학습을 최적화하도록 더 잘 준비하는 데 도움이 될 수 있으며 의료 교육 및 연구가 진정으로 'self'의 수준을 넘어설 수 있도록 도울 수 있습니다.
Rather, we should facilitate the development of safe and trusting longitudinal relationships within health care teams in longitudinal integrated clerkships,33for example33to allow students to move towards the centre of the CoP and to fully capitalise on opportunities for CRL. Furthermore, in order to help students develop into learners who are able to regulate their learning in workplace settings, we may not only need to offer training and coaching in skills such as goal setting, self-assessment and reflection, but first and foremost to pay attention to the skills that enable students to engage in CRL, such as feedback seeking and engaging others in learning conversations. Acknowledging from the outset of medical training that SRL is embedded in CRL may assist us in better preparing students to optimise their learning in workplace settings, and may help medical education and research to truly move beyond the self.
4.1 제한사항 4.1 Limitations
이 연구는 참가자 11명의 제한된 샘플로 수행되었습니다. 대부분의 학생(9명)은 임상 2년차 또는 마지막 해에 등록되었다. 이는 이러한 학생들이 임상 훈련을 시작할 때 자신의 행동과 생각을 소급적으로만 설명할 수 있었다는 것을 의미하며, 이는 그들을 기억 편향에 취약하게 만들었을 수 있다. 공동규제학습과 SRL은 추상적인 이론적 구성인데, 학생들이 실용적으로 이야기하기 어려웠을 수 있다. 면접 가이드를 구성하면서, 연구팀은 질문들을 최대한 구체적으로 공식화하려고 시도했다. CRL은 학생들이 깨닫는 것보다 더 널리 퍼져 있을 수 있으며, CRL의 많은 부분이 숨겨져 있거나 암시적일 수 있다. 예를 들어, 면접이 끝난 후 몇몇 학생들은 [보통은 면접에서 논의된 개념에 대해 그다지 많은 생각을 하지 않는다]고 언급했다. 비슷한 맥락에서 참가자들이 자발적으로 참여했기 때문에, 이는 자신의 학습에 대해 적극적으로 생각한 학생들만이 참가에 동의했다는 의미일 수 있다.
This study was conducted with a limited sample of 11 participants. Most (nine students) were enrolled in the second or final years of clinical training. This means that these students were able to describe their behaviour and thoughts at the start of clinical training only retrospectively, which may have made them susceptible to memory bias. Co-regulated learning and SRL are abstract theoretical constructs, which students may have found difficult to talk about in practical terms. In constructing the interview guide, the research team attempted to formulate the questions as concretely as possible. It may be that CRL is more prevalent than students realise, and much of CRL may be hidden or implicit. For example, some students indicated after the interview had finished that they did not usually give very much thought to the concepts discussed in the interview. In a similar vein, participants were self-selected volunteers, which may imply that only students who actively thought about their learning agreed to participate.
5 결론 5 CONCLUSIONS
본 연구는 SRL과 SRL 개발이 [임상 직무 공간 환경의 사회적 상호작용과 CRL]에 내재되어 있다는 아이디어를 강조한다. 우리는 CRL이 구조적으로 임상실습에 내장embed되어 있음을 인정하고, [자기조절능력]이 [학습 프로세스를 지원하기 위해 다른 사람들과 의미 있는 상호작용을 할 수 있는 능력]을 의미한다는 것을 인정할 때, 비로소 의대 학부생의 SRL 개발을 지원할 수 있을 것이다. 의대생들의 평생학습자 전환을 촉진하기 위해서는 학습자들의 CRL 참여를 지원하고 조직해야 합니다. 역량 기반 의료 교육의 경우, 초보 학생과 더 경험이 많은 학생과 의료 전문가 사이의 직장 파트너십을 장려하기 위해 의대생들을 CoP에 포함시키는 방법을 재고해야 한다는 것을 의미한다. 임상 환경에서 CRL의 기회를 활용함으로써, 우리는 학생들이 전문 경력 동안 급변하는 의료 시스템에서 학습을 최적화하고 고품질 관리를 제공할 수 있는 의료 전문가로 발전하는 데 필요한 학습 기술을 더 잘 준비할 수 있을 것이다.
Our study emphasises the idea that SRL and SRL development are embedded in social interactions and CRL in clinical workplace settings. We can support medical undergraduates’ development of SRL when CRL is structurally embedded in clerkships, acknowledging that the ability to self-regulate implies the ability to engage in meaningful interactions with others to support learning processes. In order to facilitate medical students’ transformation into lifelong learners, we therefore need to support and organise learners’ engagement in CRL. For competency-based medical education, this means that we should reconsider the ways by which we include medical students in CoPs in order to encourage workplace partnerships between novice students and more experienced students and health care professionals. By capitalising on the opportunities for CRL in clinical settings, we may be able to better equip students with the learning skills they need to develop into health care professionals who are able to optimise their learning and provide high-quality care in rapidly changing health care systems throughout their professional careers.
Med Educ. 2020 Mar;54(3):234-241.
doi: 10.1111/medu.14018.Epub 2019 Dec 1.
Beyond the self: The role of co-regulation in medical students' self-regulated learning
1School of Health Professions Education, Maastricht University, Maastricht, the Netherlands.
2Department of Educational Development and Research, Faculty of Health, Medicine and Life Sciences, Maastricht University, Maastricht, the Netherlands.
3Research Group Professional Assessment, Zuyd University of Applied Sciences, Heerlen, the Netherlands.
Context:Medical students are expected to self-regulate their learning within complex and unpredictable clinical learning environments. Research increasingly focuses on the effects of social interactions on the development of self-regulation in workplace settings, a notion embodied within the concept of co-regulated learning (CRL). Creating workplace learning environments that effectively foster lifelong self-regulated learning (SRL) requires a deeper understanding of the relationship between CRL and SRL. The aim of this study was therefore to explore medical students' perceptions of CRL in clinical clerkships and its perceived impact on the development of their SRL.
Methods:We conducted semi-structured interviews with 11 purposively sampled medical students enrolled in clinical clerkships at one undergraduate competency-based medical school. Data collection and analysis were conducted iteratively, informed by principles of constructivist grounded theory. Data analysis followed stages of open, axial and selective coding, which enabled us to conceptualise how co-regulation influences the development of students' self-regulation.
Results:Data revealed three interrelated shifts in CRL and SRL as students progressed through clerkships. First, students' CRL shifted from a focus on peers to co-regulation with clinician role models. Second, self-regulated behaviour shifted from being externally driven to being internally driven. Last, self-regulation shifted from a task-oriented approach towards a more comprehensive approach focusing on professional competence and identity formation. Students indicated that if they felt able to confidently and proactively self-regulate their learning, the threshold for engaging others in meaningful CRL seemed to be lowered, enhancing further development of SRL skills.
Conclusions:Findings from the current study emphasise the notion that SRL and its development are grounded in CRL in clinical settings. To optimally support the development of students' SRL, we need to focus on facilitating and organising learners' engagement in CRL from the start of the medical curriculum.
Keywords:clinical education; development; professional; qualitative research methods.
질적연구인터뷰 수행의 열두 가지 팁 (Med Teach, 2018) Twelve tips for conducting qualitative research interviews Cormac McGratha,b , Per J. Palmgrena and Matilda Liljedahla,c
소개 Introduction
의학 교육 연구에서 질적 연구 인터뷰는 실행 가능하고 활용도가 높은 데이터 수집 도구이다(DiCicco-Bloom and Crabtree 2006; Jamsheed 2014). 개인과 집단 모두를 대상으로 하는 다양한 면접 형식이 있으며, 의학 교육 연구에서 준구조적 면접이 점점 더 보편화되고 있다. 질적 인터뷰는 연구자들이 인터뷰 대상자의 경험에 고유한 문제를 심층적으로 탐구할 수 있는 기회를 제공하므로 다양한 관심 현상이 어떻게 경험되고 인식되는지 통찰할 수 있다. [참가자와 연구자 사이의 관계]를 고려하고, [인간 현상의 탐구에 대한 강조]를 고려할 때, 인터뷰는 전통적으로 질적 연구와 자연주의 패러다임과 연계된 데이터 수집 방법이었다(코테와 투르종 2005; 할콤과 데이비드슨 2006). In medical education research, the qualitative research interview is a viable and highly utilized data-collection tool (DiCicco-Bloom and Crabtree2006; Jamshed2014). There are a range of interview formats, conducted with both individuals and groups, where semi-structured interviews are becoming increasingly prevalent in medical education research. Qualitative interviews afford researchers opportunities to explore, in an in-depth manner, matters that are unique to the experiences of the interviewees, allowing insights into how different phenomena of interest are experienced and perceived. Considering the relationship between participants and researchers and the emphasis on the exploration of human phenomena, interviews have traditionally been a data-collection method linked with qualitative research and the naturalistic paradigm (Côté and Turgeon2005; Halcomb and Davidson2006).
브링크만과 크베일(2005)은 인터뷰를 진행할 때 어려운 점 중 하나는 [연구자가 대화와 토론을 통해 이해를 달성하고자 한다는 순진한 가정 아래 수행된다는 것]이라고 주장한다. 인터뷰는 인터뷰 대상자와의 비공식적인 잡담informal chat으로 간주되어서는 안 된다. 인터뷰는, 많은 연구 질문을 관통하는 데 사용될 수 있는 데이터 수집 도구이다. Brinkmann and Kvale (2005) argue that one of the challenges of conducting interviews is that they are carried out under the naïve assumption that the researcher wants to achieve understanding through dialog and discussion. Interviews should not be conceived as informal chats with interviewees; instead they are data-collection instruments which can be used to penetrate a number of research questions.
Tip 1
질적 연구 면접이 적절한 시기를 파악한다. Identify when qualitative research interviews are appropriate
질적 인터뷰는 다양한 방법론적 접근법에 유용한 데이터 수집 도구이며, 따라서 많은 연구 질문을 다루기 위해 적용될 수 있다. 그러나, 질적 연구 인터뷰는 연구자가 [큰 그룹의 사람들에 대한 일반화 가능한 이해]를 생성하는 것보다, [현상에 대한 인터뷰의 주관적인 관점을 이해]하고잘 할 때 선호된다. 예를 들어 질적 면담은 환자의 질병 경험이나 임상의가 직장에서 학습하는 개념을 탐구하는 데 도움이 될 수 있다. 따라서 질적 인터뷰를 적용하는 연구는 다른 곳에서는 들을 수 없는 사회의 소수자와 집단에 의견을 제시할 수 있는 잠재력을 가지고 있다(리브스 외 2015). 또한 인터뷰 대상자로부터 [시간을 빼앗는 윤리적 차원]을 고려해야 하며, 따라서 연구 프로젝트에 필요한 만큼만 참여하고, 문제의 현상에 대한 통찰력이나 경험을 가진 사람을 포함해야 한다. Qualitative interviewing is a data-collection tool that is useful in a range of methodological approaches and may therefore be applied to address a number of research questions. However, qualitative research interviews are preferable when the researcher strives to understand the interviewee’s subjective perspective of a phenomenon rather than generating generalizable understandings of large groups of people, for example, the qualitative interview may lend itself well to exploring a patient’s experience of illness, or a clinician’s conceptions of learning in the workplace. As such, a study applying qualitative interviews holds the potential to give voice to minorities and groups in society that may not be heard elsewhere (Reeves et al.2015). Moreover, one should consider the ethical dimensions of taking up time from interviewees and therefore only include as many participants as needed in the research project and who may have insights or experiences of the phenomenon in question.
Tip 2
면접관으로서 자신을 준비하라. Prepare yourself as an interviewer
면접관으로서 필요한 정확한 준비의 중요성을 과소평가해서는 안 된다. 여기에는 개념적 준비와 실용적 준비가 모두 포함된다(Brinkmann and Kvale 2005; Brinkmann 2014). 성공적인 인터뷰는 연구 질문의 초점과 범위를 고려하는 신중한 계획에서 시작됩니다. 탐구질문을 더욱 발전시키기 위해서는 대상분야에 대한 문헌의 배경지식, 정성면접 방법, 적용 하고자 하는 구체적인 과학적 방법 등이 필요하며, 추가로 면접안내서 작성을 용이하게 할 것이다.
The importance of accurate preparation on behalf of the interviewer should not be underestimated and includes conceptual and practical preparations (Brinkmann and Kvale2005; Brinkmann2014). Successful interviews start with careful planning that considers the focus and scope of the research question. Some background reading of the literature concerning the subject area as well as how to conduct qualitative interviews and the specific scientific method you are applying will be necessary in the further development of your research question(s) and it will additionally facilitate the construction of an interview guide.
정성 면접을 준비할 때는 사용할 데이터 기록 장비를 숙지하는 것이 중요하다. 데이터 수집에 영향을 미칠 수 있으므로 인터뷰 장소도 고려해야 합니다. 인터뷰는 잠재적인 방해와 잡음이 없는 편안한 환경에서 응답자가 편리한 시간과 장소에서 수행될 것을 권고한다. 대부분의 경우, 당신은 공식적인 윤리적 승인이 필요할 것입니다. 무엇보다 항상 인터뷰 대상자의 사전 동의가 필요합니다(Illing 2014). When preparing for qualitative interviewing it is important to be familiar with the data recording equipment being used. The venue of the interview should also be considered as it may affect the data collection. We recommend interviews be conducted at a time and place of the respondents’ convenience, in a comfortable setting, free from any potential disruptions and noise. In most cases, you will need formal ethical approval. However, you will always need your interviewees’ informed consent (Illing2014).
Tip 3
인터뷰 가이드를 구성하고 질문을 테스트합니다. Construct an interview guide and test your questions
질적 연구 면담을 실시하는 것은 어떤 경우에는 심지어 인생을 바꿀 수도 있는, 잠재적으로 그들에게 중요한 문제들에 대해 성찰할 것을 요청하고 있다는 것을 의미한다. 당신의 관심의 현상은 직업적으로 중요할 수도 있고, 또는 당신이 어떻게 그들이 질병이나 사랑하는 사람을 잃었는지에 대해 참가자들을 인터뷰하고 있을 수도 있다. 그러므로, 당신은 미리 면접 가이드를 개발하고 최소한 한 번의 시험 면접을 실시해야 합니다. 초보 연구원은 시험 면접을 실시함으로써 데이터 수집을 시작하기 전에 기술을 습득합니다. 이러한 시험 면접은 동료 또는 지원자와 함께 진행될 수 있습니다. 시험 면담을 통해서 연구자는 언어, 질문의 명확성, 능동적인 경청 등의 측면을 탐색해볼 수 있다. 인터뷰 스타일은 인터뷰 대상자들과 비침습적이고 개방적인 대화를 만드는 데 필수적이다(Krag Jacobsen 1993). 연구 면접 질문에서 [난해한 전문 용어를 사용하는 것을 피하고], 대신 가능하면 비전문가의 언어를 채택하세요. Conducting a qualitative research interview means that you may be asking your interviewees to reflect on matters that are potentially important to them, in some cases even life-changing. The phenomenon of your interest might be important professionally, or you may be interviewing participants on how they experience illness or the loss of a loved one. Therefore, you should develop your interview guide in advance and conduct at least one test interview. By conducting test interviews the novice researcher gains skills prior to embarking on data collection. These test interviews may be undertaken with peers or volunteers. They furnish the researcher with an opportunity to explore language, the clarity of the questions, and aspects of active listening. The style of the interview is essential for creating a noninvasive and open dialog with interviewees (Krag Jacobsen1993). Avoid using esoteric jargon in your research interview questions and instead adopt layman’s language when possible.
질적 면접은 다소 개방적이거나 구조화될 수 있다.
[비구조화 또는 반구조화 인터뷰 가이드]는 인터뷰 진행자가 인터뷰 대상자가 제기한 문제를 탐색할 수 있도록 미리 결정된 질문을 하나 또는 몇 개만 포함할 수 있습니다. 인터뷰 가이드가 방법론적 접근법과 일치하도록 하는 것이 중요하다(Laksov et al. 2017).
대조적으로, [구조화된 인터뷰 가이드]는 일반적으로 정확히 동일한 표현에 대한 응답을 이끌어내기 위해 모든 인터뷰 대상자에게 동일한 방식으로 제기되는 미리 결정된 질문을 포함한다.
Qualitative interviews may be more or less open or structured.
An unstructured or semi-structured interview guide may include only one or a few predetermined questions allowing the interviewer to explore issues brought forward by the interviewee. It is important that the interview guide aligns with the methodological approach (Laksov et al. 2017).
By contrast, a structured interview guide usually includes predetermined questions posed in the same way to all interviewees with the purpose of eliciting responses to the exact same phrasing.
의학 교육에서 종종 반구조화 면접이 사용되는데, 이 때 인터뷰 가이드에 미리 정해진 질문[(일반적으로 5~15개 질문)]이 다수 포함되어 있지만, 면접관이 후속 질문(Lingard and Kennedy 2010)을 통해 면접자의 답변을 더 깊이 탐구할 수 있다는 것을 의미한다. 보통 면접 대상자를 편안하게 하고 면접 주제를 숙지시키기 위해서는, 몇 가지 '쉬운' 질문으로 면접을 시작하는 것이 좋다. 몇 가지 예를 들자면,
"여기서 일한 지 얼마나 되었나요?",
"어떻게 처음 교직에 참여하게 되었나요?",
"왜 간호사가 되고 싶었나요?" 등이 있다.
In medical education, semi-structured interviews are often applied, meaning that the interview guide includes a number of predetermined questions (typically 5–15 questions) but the interviewer can probe, in order to dig deeper, into the interviewees’ responses through follow-up questions (Lingard and Kennedy2010). It is usually a good idea to open the interview with a few “easy” questions to make the interviewee comfortable and to familiarize him/her with the subject of the interview. A few examples are:
“Please tell me, how long have you been working here?”,
“How did you first become involved in teaching?” or
“Why did you want to become a nurse?”
인터뷰가 더 깊이 진행될수록, '무엇이 숙련된 교사를 의미한다고 보느냐' '현재 직장에서 업무량을 어떻게 경험했느냐' 등의 질문에 신중하게 considerately 답할 가능성이 높다. 그들이 인터뷰의 첫 번째 질문으로 제시되는 것과 달리 말이다. "더 추가하고 싶은 질문이 있습니까?"와 같은 질문이 적절한 마무리 질문이 될 수 있습니다.
Further into the interview, questions like “In your opinion, what signifies a skilled teacher?” or “How have you experienced the work load in your current workplace?” are more likely to be answered considerately as opposed to if they were posed as the first question of the interview. A question like “Is there anything more you would like to add?” can be a suitable closing question.
Tip 4
인터뷰 상황의 문화적 및 영향력 차원을 고려합니다. Consider cultural and power dimensions of the interview situation
인터뷰에 앞서, 권력 차원뿐만 아니라 문화적 차원에 대한 평가가 필요하다. 이러한 분석에는 면접 상황이 무엇을 가능하게 하고 어떤 장애물이 발생할 가능성이 있는지에 대한 고려가 수반될 수 있다. 사람들은 문화적 존재이며, 인터뷰 상황에 대한 기대가 다를 수 있다. 어떤 사람들은 인터뷰를 어렵거나 침습적인 상황으로 볼 수 있고, 어떤 인터뷰는 통역이나 문화적으로 인터뷰 받는 사람들의 상황에 민감한 사람으로 제3의 사람이 앉을 것을 요구할 수 있다. 위에 언급된 시버 인터뷰를 통해 그러한 문제들을 드러낼 수 있다. 학생들을 인터뷰하는 의학 교사들은 명시적이고 암묵적인 권력 관계를 모두 인식하고, 학생들이 올바른 응답을 제공할 것이라는 (인터뷰어의) 기대를 따르지 않을 수 있음을 의식할 필요가 있다. 마찬가지로, 교사들을 인터뷰하는 학생도 권력 관계를 반영하고 반영할 수 있으며, 사전에 신중한 고려가 필요할 것이다. An assessment of the cultural dimensions as well as power dimensions is necessary prior to the interview (Nimmon and Stenfors-Hayes2016). Such an analysis could entail a consideration of what the interview situation affords and what obstacles are likely to occur. People are cultural beings (Rogoff2003) and may have different expectations of the interview situation. Some people may view the interview as a difficult or invasive situation, and some interviews may require a third person to sit in, either as an interpreter or as someone who is culturally sensitive to the interviewees’ situation. The test interview outlined above may reveal such challenges. Medical teachers interviewing students need to be aware of both explicit and implicit power relationships and be conscious that students are not trying to comply with expectations of providing, what is perceived to be, a correct response. Similarly, a student interviewing teachers may involve and mirror a power relationship and would require careful consideration in advance.
Tip 5
응답자와의 관계 구축 Build rapport with your respondents
질적인 면접 상황에서 친밀감을 쌓고 편안한 상호작용을 구축하는 것이 매우 중요하며 면접 전뿐만 아니라 면접 그 자체에서도 좋은 결과를 얻는 것이 바람직하다. 인터뷰를 진행할 때 어려운 점은, 면접 상황에서 신뢰를 쌓을 시간이 거의 없을 수 있다는 점이다. 따라서 면접에서 어떤 내용이 거론될지, 왜 그것이 토론해야 할 중요한 주제인지 알려주는 방법으로, 비전문가의 용어로 작성된 연구 프로젝트의 간략한 요약본을 작성하여 인터뷰에 앞서 인터뷰 대상자에게 보내야 합니다.
Building rapport and establishing comfortable interactions in the qualitative interview situation is very important and is preferably done well in advance of the interview, but also during the interview itself. A challenge when conducting interviews is that there may be little time in the interview situation to build trust (DiCicco-Bloom and Crabtree2006). Therefore, you should draft a short summary of your research project, written in layman’s terms, to send to your interviewees prior to the interview as a way of informing them of what to expect will be talked about in the interview and why it is an important topic to discuss.
또한 응답자가 연구의 핵심인 경험에 대한 풍부하고 상세한 설명을 제공할 수 있도록 인터뷰 중에 공감대가 중요하다. 친밀감을 쌓는 열쇠는 근접감proximity입니다. 응답자를 이미 알고 있다면 관계를 형성하는 것이 더 쉬울 수 있습니다. 그렇지 않으면 이 과제가 더 어려워질 수 있습니다. 친밀감을 쌓는 한 가지 방법은 개방적이고 호기심 있는 태도로 인터뷰 대상자에게 접근하는 것인데, 구체적으로 왜 인터뷰 대상자의 특정 관점에 관심이 있는지 설명합니다(Krag Jacobsen 1993; Schoultz 등 2001; Bell 2014). "당신의 관심사에 대해 말씀해 주십시오…"와 같은 질문은 "당신은 언제 어떤 규칙과 규정을 따르나요?"보다 덜 위협적인 것으로 이해될 가능성이 높습니다. Rapport is also crucial during the interview enabling the respondent to provide a rich and detailed account of the experiences at the heart of the study. Key to building rapport is a sense of proximity. If you already know your respondents, then it may be easier to build rapport; otherwise, this task may be more difficult. One way of building rapport is to approach interviewees with an open and curious attitude, stating specifically why you are interested in their specific point of view (Krag Jacobsen1993; Schoultz et al.2001; Bell2014). A question like “Please tell me about your interest in…?” is likely to be understood as less threatening than “What rules and regulations do you follow when…”
Tip 6
사용자가 데이터의 공동 생성자임을 기억하십시오. Remember you are a co-creator of the data
질적 연구에서 연구자는 데이터 수집의 주요 도구이다. 따라서, 면접관은 성찰적이고, 의식적이며, 자신의 역할이 인터뷰어와 인터뷰이 사이의 대화에 어떻게 영향을 미칠 수 있는지에 대해 인식할 필요가 있다. 질적 연구 면접에서 우리는 면접관을 데이터를 오염시키거나 편향시키는 사람으로 볼 것이 아니라, 면접관의 이전 지식이 면접자의 맥락이나 경험을 이해하는 데 중요한 역할을 할 수 있는, [인터뷰이와 함께 데이터의 공동 생성자로 보아야 한다]고 주장한다.이렇듯 인터뷰어는 인터뷰에서 수동적인 선수가 아니라, 면접 상황에서 자신의 능력과 경험, 역량을 활용한 도구다. 예를 들어, 임상의이기도 한 면접관은 임상 환경에 대한 지식을 활용하고, 면접관이 임상 상황에 익숙하지 않은 경우보다 임상 문제를 더 심도 있게 논의하도록 인터뷰이를 초대할 수 있다. 그러므로, 인터뷰어는 사려 깊은 태도로, 그들의 배경을 활용할 것을 촉구한다. In qualitative research, the researcher is the prime instrument of data collection. Consequently, the interviewer needs to be reflexive, conscious, and aware about how his or her role might impact the conversation between the interviewer and interviewee. In the qualitative research interview, we argue that the interviewer should not be viewed as someone contaminating or biasing the data, but rather as a co-creator of data together with the interviewee, where the interviewer’s previous knowledge may play an important part in understanding of the context or the experiences of the interviewee. As such, the interviewer is not a passive player in the interview, but an instrument using his and her abilities, experiences and competencies in the interview situation (Lingard and Kennedy2010). For example, an interviewer who is also a clinician may use his or her knowledge about the clinical environment and invite the interviewee to discuss clinical issues more in-depth than if the interviewer was unfamiliar to the clinical context. Therefore, we urge interviewers to make use of their background, albeit, in a considerate way.
Tip 7
말을 줄이고 더 많이 들어라. Talk less and listen more
초보 인터뷰어로서 경험이 부족하면 인터뷰어가 대화에 지나치게 적극적일 수 있다. 이런 상황에서 긴장하거나 경험이 부족해 인터뷰어가 자각하지 못한 채 빈칸을 채우고, 대화를 일정한 방향으로 끌고 가는 결과를 초래할 수 있다. 면접관들은 대화를 줄이고 침묵이 대화를 진전시킬 촉매제 역할을 하도록 허용할 필요가 있을 것이다. 인터뷰 대상자의 말을 적극적으로 경청한다는 것은 [침묵을 존중]하고, [침묵의 순간을 지속적인 성찰의 기회]로 파악하는 것을 의미한다. 면접 주체에 대한 의미가 깊은 주제의 면접은 응답자를 대신하여 깊은 성찰을 유도할 수 있다. 따라서 열린 자세로 정직하게, 관심을 유지하고(Bowden and Walsh 2000; Seidman 2013), 더 많이 경청하되, 적극적으로 경청하십시오(Giger 2017). Inexperience as novice interviewers may result in the interviewer being overly active in the conversations. Due to nervousness in such situations, or a lack of experience, the interviewee may end up filling in blanks and driving the conversation in a certain direction without being aware of doing so. Interviewers may need to talk less and allow for silence to act as the catalyst that will drive the conversation forward. Actively listening to the interviewees means respecting silence and identifying such silent moments as an opportunity for ongoing reflection. Interviews on subjects that have profound meaning for interview subjects may prompt deep reflection on behalf of respondents. Thus, remain open and honest, maintain interest (Bowden and Walsh2000; Seidman2013), listen more, but also listen actively (Giger2017).
Tip 8
인터뷰 가이드를 직접 조정하십시오. Allow yourself to adjust the interview guide
초기 면접 후 질문을 조정하면 면접 과정에서 면접 가이드가 미세 조정될 수 있다. 일부 질문은 잘 못 이해될 수도 있고, 어떤 질문은 무관하거나 연구 질문의 범위를 벗어날 수 있습니다. 예를 들어, 우리의 한 연구에서 "여기 분위기를 어떻게 경험하는가?"라는 질문은 학생들이 물리적 환경과 공기의 질에 대한 질문으로 이해한 반면, 면접관의 의도는 클리닉의 사회 환경에 대한 통찰력을 얻는 것이었다(Liljedahl et al. 2015). 그러니 주의를 기울이고, 인터뷰 대상자들이 어떻게 반응하는지 경청하고, 당신의 질문들이 당신이 의도한 대로 이해되고 있는지 성찰하세요. 인터뷰 중에 후속 질문을 통해 질문이 어떻게 이해되는지 확인할 수 있습니다. 또한 다음 인터뷰 전에 용기를 내어 필요할 때 인터뷰 가이드에 변화를 주세요. Adjusting the questions after the initial interviews allows the interview guide to be fine-tuned during the interview process. Some questions might turn out to be misunderstood, others to be irrelevant or outside the scope of the research question. In one of our own studies, for example, the question “How do you experience the atmosphere here?” was understood by students as a question about the physical environment and the quality of the air, while the intention of the interviewer was to gain insight into the social environment in the clinic (Liljedahl et al.2015). So be attentive, listen to how your interviewees respond, and reflect on whether your questions are being understood in the way you intended. During an interview, follow-up questions can help probe how your questions are understood. Also, be courageous and make changes in the interview guide before the next interview when necessary.
Tip 9
예상치 못한 감정을 다룰 준비를 한다. Be prepared to handle unanticipated emotions
의학 교육 분야에서, 우리는 때때로 질병과 죽음 또는 면접 대상자 자신의 경험(예: 괴롭힘, 스트레스, 실패 또는 면접 대상자의 정신 질환 학생 경험)과 관련된 연구 주제에 관여한다. 어떤 주제들은 인터뷰이가 이전에 알지 못했을지도 모르는 불안한 감정을 불러일으킬 수 있다. 그러므로, 면접관은 특정 주제에 대한 경험을 공유할 때 면접자의 반응에 민감해야 합니다. 때로는 인터뷰 대상자 스스로 이러한 감정을 다룰 수 있을 것이지만, 때로는 인터뷰 대상자를 보호하기 위한 조치가 필요할 수도 있다. 이것은 인터뷰를 중단하고 인터뷰 대상자에게 적절한 도움을 받을 수 있도록 안내하는 것을 포함할 수 있습니다. 인터뷰 대상자를 초대해 자신에게 중요한 주제를 꺼내도록 하고, 인터뷰 대상자에게 인터뷰 주제와 관련해 덧붙이고 싶은 말이 있으면 항상 물어보는 것으로 인터뷰를 마무리한다. In the field of medical education, we sometimes engage with research topics involving illness and death or interviewees’ own experiences of e.g. harassment, stress, failure, or interviewee’s experiences of students with mental illness. These and many other topics may evoke uneasy emotions in the interviewee, which he or she previously might have been unaware of. Therefore, the interviewer must be sensitive to the interviewee’s reactions when sharing experiences on certain topics. Sometimes interviewees will be capable of handling these emotions themselves, but at other times you, as an interviewer, will need to take action to protect your interviewee (Varpio and McCarthy2018). This might involve interrupting the interview and guiding the interviewee to appropriate assistance. Invite the interviewee to bring up issues of the topic that are important to him or her, and always end the interview by asking the interviewee if there is anything they would like to add regarding the topic of interest in the interview.
Tip 10
인터뷰 내용을 적시에 받아 적습니다. Transcribe the interviews in good time
데이터가 수집되면 데이터 전사 프로세스가 시작됩니다. 좀처럼 명시적으로 정의되지 않지만, 전사는 인터뷰의 녹음된 데이터와 같은 구어를 재생산하고, 데이터를 분석할 수 있도록 필기 형태로 변환하는 과정으로 설명할 수 있다. 질적 면접에서 가장 흔한 전사 형태는 언어 데이터의 단어 대 단어 복제를 가리키는 [문자 그대로의 전사]이다(Poland 1995). 질적 면접에서 얻은 데이터를 전사하는 것은 시간이 많이 걸린다. 초보자의 경우 최초 전사는 기록된 데이터의 매 시간마다 4~8시간의 전사가 필요할 수 있다. 게다가, 이 공정은 방대한 양의 물질을 산출하는데, 데이터를 분석할 때 반복적으로 면밀히 조사하고 검토해야 한다. Once the data has been collected, the process of data transcription commences. Although rarely explicitly defined, transcription can be described as the process of reproducing spoken words, such as recorded data from an interview, and converting it into written form so the data can be analyzed. The most common form of transcription in qualitative interviews is verbatim transcription, which refers to the word-for-word reproduction of verbal data, where the written words are an exact replication of the audio-recorded words (Poland1995). Transcribing data from qualitative interviews is very time-consuming. For novices, initial transcription may require as much as four to eight hours of transcription for each hour of recorded data. Furthermore, the process yields vast amounts of material which must be iteratively scrutinized and waded through when analyzing the data.
전사는 구어를 문어로 직설적으로 변환하는 것이라고 생각하기 쉽다. 면접에서 중요한 사건의 지표로서, 인터뷰 대상자가 제시하는 일시정지, 킥킥거림, 기타 단서를 고려하는 것이 중요하다. 이러한 단서들은 전사 과정에서 인정될 필요가 있을 수 있다. 전사 과정에서 오류가 발생할 수 있으며 이는 다른 요인의 결과일 수 있다. 따라서 전사 품질을 확인하기 위한 조치를 취해야 합니다. 많은 조사자들은 질적 면접이 데이터를 알아가는 측면에서 큰 이점을 제공하기 때문에 시간이 많이 걸리고 힘들더라도 직접 기록하기로 선택한다. 만약 직접 전사를 한다면, 우리는 인터뷰 완료 후 가능한 한 빨리 인터뷰를 전사하는 것을 추천한다. 그렇게 함으로써 연구자는 분석적인 구조를 확인하기 시작할 수 있고 다른 인터뷰 대상자의 경험 사이의 유사점과 차이점을 찾을 수 있다.
It is easy to think that transcription is a somewhat straightforward conversion of the spoken word into written word. It is important to consider pauses, giggles, and other cues offered by the interviewee as markers for important events in the interview. These cues may need to be acknowledged in the transcription process. During the transcription process errors can creep in which can be the result of different factors. Consequently, steps need to be taken to check the quality of the transcription. Many investigators choose to transcribe the qualitative interviews themselves even though that is time-consuming and arduous, as it offers great benefits in terms of getting to know the data. When doing so, we recommend researchers transcribe the interview as soon as possible after completion. Doing so allows the researcher to start identifying analytical structures and find similarities and differences between different interviewees’ experiences.
Tip 11
데이터를 확인하세요. Check the data
질적 데이터 중심 탐색에서 신뢰성을 보장하기 위한 일환으로, [응답자 검증] 또는 [참가자 검증]이라고도 알려진 구성원 확인을 사용할 수 있다. Member checking은 동의를 위해 면담 녹취록을 보여주거나, 분석 결과를 참가자들과 함께 디브리핑하는 방법이다. 우리의 경험에 따르면 이 과정은 초보 연구자에게 데이터의 품질을 확인할 수 있는 좋은 기회를 제공한다. 따라서, Member checking은 특히 아이러니, 감정, 침묵 또는 기타 제스처와 같은 미묘한 부분을 포착할 때 응답자들의 보고된 응답을 이해했는지 확인하는 방법이자, sounding board 역할을 할 수 있다(Birt et al. 2016; McGrath et al. 2016). 그러나 일부 연구자들은 해석에 대한 상반된 견해와 같은 잠재적인 단점이 있을 수 있으므로 구성원 점검과 관련하여 주의를 권고한다(Angen 2000; Morse 등 2002; Varpio 등 2017). As part of ensuring trustworthiness in qualitative data-driven explorations, member checking, also known as respondent validation or participant validation, can be used. Member checking is a method of returning an interview transcript or debriefing the analytical results with participants for agreement (Lincoln and Guba1985; Creswell2013). Our experience suggests that this process offers novice researcher a good opportunity to check the quality of the data. As such, member checking may act as a sounding board and a way of checking that one has understood the reported responses of the respondents, especially when it comes to picking up subtleties such as irony, emotions, silences, or other gestures (Birt et al.2016; McGrath et al.2016). However, some researchers recommend caution with reference to member checking, as there may be some potential drawbacks such as conflicting views on interpretation (Angen2000; Morse et al.2002; Varpio et al.2017).
Tip 12
조기 분석 시작 Initiate analysis early
질적 연구의 주요 어려움 중 하나는 매우 빠르게 다루기 힘들 정도의 양의 데이터를 생성하며, 종종 수백 페이지의 텍스트를 필사하게 만든다는 것이다. 마일스(1979)는 질적 데이터를 "매력적인 성가신 존재"로 묘사했다. 질적 데이터는 풍부하기 때문에 매력이 있지만, 그 풍부함을 통한 분석 경로를 찾기 위한 노력이 필요하다. 따라서 모든 인터뷰를 수행하기 전에 데이터 분석을 고려해야 합니다. 조사 질문의 성격과 분석을 어떻게 진행하느냐에 따라 수행된 인터뷰의 깊이, 품질 및 풍부함이 결정됩니다. 따라서, 우리는 자료의 분석을 (모든 인터뷰 데이터가 기록될 때까지로) 미루지 말 것을 조언한다. 데이터 분석의 지연은 조사자에게 방대한 과제에 직면하는 인상을 줄 수 있다; 반대로, 곧바로 분석작업을 시작하는 것의 장점은 분석에 대한 초기의 생각이 조사자가 새롭게 부상하는 범주와 주제에 대해 더 잘 알 수 있게 해준다는 것이다. One of the main difficulties with qualitative research is that it very rapidly generates a large and cumbersome amount of data, often leading to hundreds of pages of transcribed text. Miles (1979) has depicted qualitative data as an “attractive nuisance”; it has attractiveness due to its richness, but effort is required to find analytical paths through that richness. Therefore, you will need to think about the analysis of data before conducting all the interviews. The nature of the research question(s) and how you go about the analysis will determine the depth, quality, and richness of the performed interviews. Hence, we advise that the analysis of the material is not left until all interview data has been transcribed. Procrastination of data analysis may give the investigator the impression of facing a monumental task; meanwhile, an advantage of starting the work soon is that early thoughts about the analysis allow the investigator to become more aware of emerging categories and themes.
요약 Summary
질적 연구 인터뷰는 의료 교육 기회의 연구자들이 의료 내에서 알려지지 않은 교육 및 실습 영역을 탐색할 수 있도록 하는 강력한 데이터 수집 도구이다. The qualitative research interview is a powerful data-collection tool which affords researchers in medical education opportunities to explore unknown areas of education and practice within medicine.
The qualitative research interview is an important data collection tool for a variety of methods used within the broad spectrum of medical education research. However, many medical teachers and life science researchers undergo a steep learning curve when they first encounter qualitative interviews, both in terms of new theory but also regarding new methods of inquiry and data collection. This article introduces the concept of qualitative research interviews for novice researchers within medical education, providing 12 tips for conducting qualitative research interviews.
포화라는 위장 뒤에 숨은 것: 질적 인터뷰 자료와 견고함 (J Grad Med Educ,2021) Beyond the Guise of Saturation: Rigor and Qualitative Interview Data Kori A. LaDonna, PhD . Anthony R. Artino Jr, PhD . Dorene F. Balmer, PhD
대학원 의학교육(GME)을 연구하는 이들을 포함한 보건직업 교육 연구자들이 교육 실천을 지도할 수 있는 근거 기반을 구축하고 있다. 지난 20년 동안 질적 연구자들은 수많은 경험적 발견을 해냈다. 그러나 좋은 질적 증거의 특징은 무엇인가? Health professions education researchers, including those who study graduate medical education (GME), are building an evidence base to guide educational practice. Over the last 2 decades, qualitative researchers have generated a plethora of empirical findings. However, what are the features of good qualitative evidence?
엄격함 및 포화도 Rigor and Saturation
보건 직업 교육에서 질적 연구자는 "어떻게 교수진이 저성취나 실패를 탐색하는가?"1 또는 "왜 일부 의대생은 소아과에서 직업적 관심을 유지하는가?"2 그러한 질문에 답하기 위해 질적 연구 과정은 적절히 견고해야 한다. 일반화가능한generalizable 것이 아닌 전이가능한transferable 연구 결과를 도출한다.3 이는 연구 상황을 넘어서는 상황에서 생각을 촉발하고, 문제를 제기하며, 정보를 제공하거나, 실천을 바꾼다는 것을 의미한다. 이를 위해, 연구 결과는 타당하거나 신뢰할 수 있거나 대표적일 필요는 없지만, 신뢰할 수 있고, 공명적resonant이며 풍부해야 한다.3-6 이러한 기준의 주관성을 고려할 때, 일대일 인터뷰 방법을 사용하는 정성적 연구의 엄격성을 어떻게 평가하고 있는가? In health professions education, qualitative researchers explorehowandwhyquestions, such as “How do faculty members navigate underperformance or failure?”1or “Why do some medical students maintain a career interest in pediatrics while others do not?”2To answer such questions, the qualitative research process must be appropriately robust to produce findings that are transferable rather than generalizable,3which means that they provoke thought, raise questions, and inform or change practice in settings beyond the research context. To do this, findings do not need to be valid, reliable, or representative, but they do need to be credible, resonant, and rich.3–6Given the subjectiveness of these criteria, how do we evaluate the rigor of qualitative research that uses one-on-one interview methods?
엄격함은 종종 주로 [포화] 상태에 달려있다고 가정되는데, 이는 일반적으로 면접이 더 이상 새로운 정보를 생성하지 않거나 연구자들이 "모든 것을 들었다"고 결정할 때 데이터 수집의 포인트로 이해된다. 포화라는 아이디어는 충분히 간단해 보이지만, 포화도가 의미하는 바에 대한 상당한 혼란은 언제 그것이 도달하는지(또는 도달하는지) 결정하는 것은 어게 한다. 실제로 정성적 인터뷰 기반 연구의 체계적인 분석은 저자들이 [포화]의 지표를 가변적이고 부적절하게 기술했으며, 검토자(그리고 아마도 그들 자신)에게 주장을 입증하기에 충분한 표본을 모집했다는 것을 확신시키기 위해 참가자 수에 종종 초점을 맞췄다는 것을 입증했다. 결과적으로, 많은 GME 연구자들은 그들의 연구에서 포화가 무엇을 의미하는지 설명하거나, 그들의 데이터가 실제로 포화되었다는 주장을 뒷받침하는 증거는 제공하지 않고, "우리는 아홉 번째 레지던트를 인터뷰한 후에 포화상태에 도달했다"와 같은 진술을 한다.
Rigor is often assumed to hinge largely onsaturation, which is typically understood as the point in data collection where interviews are either no longer generating new information or when researchers determine that they have “heard it all.”7While this idea seems simple enough, considerable confusion about what saturation means makes it difficult to determine when (or if) it is reached. Indeed, a systematic analysis of qualitative interview-based studies demonstrated that authors variably and inadequately described indices of saturation and often focused on participant numbers to try to convince reviewers (and perhaps themselves) that they have recruited a large enough sample to substantiate their claims.8Consequently, many GME researchers make statements like “we reached saturation after the ninth resident was interviewed” without either describing what saturation means for their study or providing evidence to support the claim that their data were actually saturated.8
포화상태에서 충분상태로 Shifting From Saturation to Sufficiency
질적 데이터 세트는 반복 주제 패턴을 식별할 수 있으면서(깊이), 동시에 모순되는 예를 설명할 수 있을 만큼(너비) 충분히 포괄적이어야 한다. 단순히 포화는 참여자 수보다 더 많은 것에 좌우된다는 얘기다. 우리는 리뷰어들에게 주로 표본 크기에 초점을 맞춰 퀄리티를 평가하는 것은, 실제로는 기준을 충족하지 못한 데이터를 위장할 수 있음을 경고합니다. 사실, 연구 윤리에 대한 최근의 국제 연구는 연구자의 11%가 포화 같은 용어를 부적절하게 알고 있다고 인정했다는 것을 발견했고, 이는 보건 직업 교육에서 가장 흔한 의문스러운 연구 관행 중 하나가 되었다.9 A qualitative dataset should be comprehensive enough (depth) to both identify recurrent thematic patterns and to account for discrepant examples (breadth).7In other words, saturation depends on more than the number of participants. We caution reviewers that appraisals of quality focused primarily on sample size may be a guise for data that do not meet these criteria. In fact, a recent international study of research ethics found that 11% of researchers admitted to knowingly using terms like saturation improperly, making it among the most common questionable research practices in health professions education.9
설상가상으로, 일부 질적 연구자들은 포화 상태에 도달하는 것이 가능한지에 대해 의문을 품기 시작했다.10-13 대신에, 많은 질적 연구자들은 충분성은 분석 과정의 엄격함(분석적 충분성)과 그것이 생성하는 데이터의 풍부함(데이터 충분성) 모두에 달려 있다는 것을 인식하면서 품질 발견을 충분하다고 설명하는 것으로 전환하였다. 데이터 세트를 [객관적인 포화점을 가진 스폰지]에 비유하는 포화상태와 달리, [충분성]의 개념은 (인간 경험의 고유성과 사회적으로 구성된 데이터의 특성을 모두 인정하는 연구 패러다임 내에서) 은유적으로연구자들이 지속적으로 데이터 세트를 짜낼 수wring out 있음을 시사한다. 인터뷰 가이드를 반복적으로 수정하고, 새로운 참가자를 샘플링하며, 여러 차례의 데이터 생성 및 분석에 참여함으로써 새로운 이해도를 얻을 수 있습니다. 하지만 연구는 영원히 계속될 수 없습니다. 의지할 수 있는 검정력 분석이나 표본 크기 계산 없이, 어떻게 연구자들이 그들이 "모든 것을 들었다"는 것이 아니라, 그들이 [충분히 들었다는 것]을 설득력 있게 증명할 수 있을까? To further complicate matters, some qualitative researchers have begun to question whether reaching saturation is even possible.10–13Instead, many qualitative researchers have shifted to describing quality findings assufficient,recognizing that sufficiency depends on both the rigor of the analytical process (analytical sufficiency) and the richness of the data it generates (data sufficiency). Unlike saturation, which likens a dataset to a sponge with an objective saturation point, the notion of sufficiency suggests that—within a research paradigm that acknowledges both the uniqueness of human experience and the socially constructed nature of data—researchers can metaphorically wring out their dataset, continuously dipping into a well of new understanding by iteratively revising interview guides, sampling new participants, and engaging in multiple rounds of data generation and analysis. But research studies cannot go on forever. Without power analyses or sample size calculations to rely on, how can researchers convincingly demonstrate not that they have “heard it all,”7but that they have heardenough?
정성적 발견의 충분성 평가 Evaluating the Sufficiency of Qualitative Findings
포화 개념의 한계를 고려할 때, [정보력information power]의 개념은 충분성 평가를 위한 더 나은 척도를 제공할 수 있다. 질적 발견이 충분한지를 결정하기 위해 정보력을 사용하는 것은 연구의 목적, 표본의 특수성, 이론의 사용, 분석 전략, 면접의 질에 따라 달라진다. Given the limitations of the saturation concept, the notion ofinformation power14may provide a better gauge for evaluating sufficiency. Using information power to determine whether qualitative findings are sufficient depends on examining them alongside the aims of the study, the specificity of the sample, the use of theory, the strategy for analysis, and the quality of the interviews.
질적 연구자들은 뚜렷한 유리한 관점에서 현상을 조사하기 위해 다양한 분석 전략을 이용하는 많은 방법론적 접근법을 사용한다. 어떤 방법론은 몇 개의 개별 accounts에 대한 심층 분석을 위해 설계된 반면, 어떤 방법론은 여러 관점에서 현상을 분석하기 위해 더 큰 샘플을 필요로 한다.14 또한 특정한 잠재적 참여자 그룹을 대상으로 하는 [협소한narrower 연구 목표]를 가지고 있다면, 더 희박한 샘플로 데이터 충분성을 달성할 수 있다. 예를 들어 [텍사스와 뉴멕시코의 아동학대 동료들이 어떻게 인간 밀수업자에 의한 강간 혐의의 첫 사례를 관리하는지를 탐구하는 연구]는 [훨씬 광범위한 목적을 가진 연구(예: 북미 전역의 소아과 동료들이 아동학대를 보고할 때 그들의 감정을 어떻게 관리하는지)]보다 적은 참가자를 필요로 할 수 있다. Qualitative researchers use a multitude of methodological approaches that draw on various analytical strategies to examine a phenomenon from a distinct vantage point. Some methodologies are designed to produce an in-depth analysis of a few individual accounts, whereas other methodologies require a larger sample to analyze a phenomenon from multiple points of view.14Moreover, a narrower study aim with a targeted group of potential participants may allow for data sufficiency to be achieved with a leaner sample size. To illustrate, consider that a study exploring how child abuse fellows in Texas and New Mexico manage their first case of suspected rape by human smugglers may need fewer participants than a study with the much broader aim of examining how pediatrics fellows across North America manage their emotions when reporting child abuse.
충분성에 대한 요구사항은 또한 연구자의 의도가 [현상을 기술]하는 것인지, 아니면 [이론을 생성]하는 것인지에 달려있다. 예를 들어, 가상 학습에 참여하는 1학년 레지던트들에 대한 서술적 질적 연구는 가상 학습에 대한 적응에 대한 구성주의 근거이론(CGT) 탐구보다 더 적은 인터뷰 샘플과 덜 집중적인 분석 작업을 요구할 가능성이 높다. CGT에서, 강력한 이론화는 종종 [20회 이상의 심층 인터뷰]와 점점 더 해석적인 코딩의 여러 라운드에 의존한다.16,17 실제로, 충분성의 도달이라는 측면에서 [이미 선험적으로 존재하는 이론을 사용하여, 특정 연구 렌즈를 통해 현상을 조사하는 연구]는 [귀납적으로 이론을 구축하려는 연구]는 출발점이 서로 다르다. 따라서, [데이터 생성과 분석을 프레임화하기 위해 자기결정 이론19를 사용하는 연구]는 [정규 커리큘럼 밖에서 학습에 참여하려는 전공의의 동기에 대한 이론 생성을 목표로 하는 연구]보다 더 적은 인터뷰와 덜 해석적인 노동으로 충분할 것이다. Requirements for sufficiency also depend on whether the researcher's intention is to describe a phenomenon or to generate theory. For example, a descriptive qualitative study15of first-year residents engaging with virtual learning will likely require both a smaller sample of interviews and less intensive analytical work than a constructivist grounded theory (CGT)16,17exploration of adaptations to virtual learning. In CGT, robust theorizing often relies on 20 or more in-depth interviews18and multiple rounds of increasingly interpretive coding.16,17Indeed, studies using theorya priorito examine a phenomenon through a specific research lens are at different starting points for reaching sufficiency than studies seeking to build theory inductively. Consequently, a study using self-determination theory19to frame data generation and analysis will likely reach sufficiency with fewer interviews and less interpretive labor than a study aimed at generating theory about residents' motivation to engage in learning outside the formal curriculum.
정보력 모델은 [더 큰 표본이 더 나은 데이터와 같다]는 통념을 버린다. 따라서 충분성을 평가할 때는 양보다 인터뷰의 질이 더 중요합니다. 풍부한 데이터를 생성하기 위해 인터뷰는 대화식이어야 하고, 연구 주제에 초점을 맞추어야 하며, 전략적인 후속 질문이 필요하고, illustrative examples을 위한 프롬프트가 필요하다. 면접관 실력이 무엇보다 중요합니다. 면접관은 참가자와 공감대를 형성하고, 사려 깊은 성찰을 유도하며, 참가자의 순간적 반응과 진화하는 분석에 따라 연구 질문이 확대되거나 방향이 전환될 수 있도록 면접 가이드를 수정해야 한다. 질적 엄격함을 정량화하기는 어렵겠지만, [인터뷰 길이]가 표본 크기보다 정보 파워의 더 유용한 지표일 수 있음을 제안한다. 이 지침은 완벽하지 않으며 규범적으로 따라서는 안 되지만, [개방형 질문으로1시간 이상 이어지는 6번의 심층 인터뷰를 한 경우]가 [표면 수준의 답변만 이끌어내는 10분짜리 인터뷰 20건]보다 풍부한 데이터를 산출할 가능성이 높다. 물론 면접 데이터가 풍부할 뿐만 아니라, [연구자의 개념, 실천, 문제에 대한 새로운 생각, 사고를 촉발하는 통찰력에 기여하는지]도 충분성이 진정으로 달성되었는지를 검증하는 방법이다. The information power model dispels the myth that bigger samples equal better data. Thus, when evaluating sufficiency, interview quality matters more than quantity. To generate rich data, interviews must be conversational, focused on the research topic, and peppered with strategic follow-up questions and prompts for illustrative examples. Interviewer skill is paramount. Interviewers need to develop rapport with participants, invite thoughtful reflection, and adapt the interview guide to allow for research questions to expand or shift direction depending on participants' in-the-moment responses and the evolving analysis. While we hesitate to quantify qualitative rigor, we suggest that interview length may be a more useful indicator of information power than sample size. While this guidance is not foolproof and should not be followed prescriptively, 6 in-depth interviews with open-ended questions lasting an hour or more will likely yield richer data than twenty 10-minute interviews that elicit only surface-level responses. Of course, the true test of sufficiency is whether interview data are not only rich but also contribute new or thought-provoking insights into a GME concept, practice, or problem.
명확한 증거 가치 전달 Clearly Conveying Evidentiary Value
우리는 연구자들에게 학술적 글쓰기가 비효율적인 경우, 가장 강력한 질적 발견조차도 설득력이 없어 보이게 할 수 있다고 경고한다. 정보력은 정성 표본의 충분성을 평가하거나 정당화하는 데 유용하지만, [정성적 발견의 증거적 가치evidentiary value]는 풍부한 데이터와 엄격한 분석 그 이상이다. 여기에는 반드시 좋은 글쓰기가 필요하다. 출판을 위한 연구의 초안을 작성할 때, 연구 절차와 의사결정 과정을 투명하고 설득력 있게 만드는 책임은 저자에게 있다.8,22 연구자들은 [데이터가 충분한 이유]뿐만 아니라, [데이터가 어떻게 해석]되고, [어떻게 GME에 기여하는지]도 명확하고 설득력 있게 전달해야 한다. 주제가 연결되어 새로운 이해를 창출하는 것을 보여주지 못하고, 그저 이질적인 주제만 단순히 열거하는 것은 리뷰어와 독자에게 연구 결과가 의미 있다는 것을 납득시키지 못할 가능성이 높다. 결국, 검토자와 독자는 엄격한 질적 연구의 뉘앙스를 포착하지 못하는 정량적 기준의 부적절한 적용으로 인해 강력한 원고가 시들해질 수 있다는 것을 유념해야 한다. We warn researchers that ineffective scholarly writing can make even the most powerful qualitative findings appear unconvincing. While information power is useful for appraising or justifying the sufficiency of a qualitative sample, the evidentiary value of qualitative findings depends on more than rich data and rigorous analysis. It requires good writing. When drafting research for publication, the onus is on the authors to make their research procedures and decision-making processes transparent and convincing.8,22Researchers need to clearly and compellingly convey not onlywhya dataset is sufficient, but alsohowdata were interpreted andwhatthey contribute to GME. Enumerating a list of disparate themes, rather than demonstrating how themes connect to generate new understanding, will likely fail to convince reviewers and readers that the findings are meaningful. In turn, reviewers and readers must be mindful that strong manuscripts may wilt under the inappropriate application of quantitative criteria that fail to capture the nuances of rigorous qualitative research.
GME에서 질적 증거 기반을 강화하는 것은 [충분성을 입증]하고, [충분성을 적절하게 평가하는 것]에 달려 있다. 이 표에서 우리는 정성적 면접 결과의 증거 가치를 평가하거나 보고할 때 고려해야 할 일련의 안내 질문을 제공한다. Boosting the qualitative evidence base in GME depends on both demonstrating sufficiency and evaluating it appropriately. In theTablewe provide a set of guiding questions to consider when evaluating or reporting the evidentiary value of qualitative interview findings.
요약 Summary
우리는 GME 연구자, 검토자 및 독자들이 인터뷰를 통해 얻은 정성적 발견을 평가할 때, [포화라는 미명을 벗어나야 한다]고 촉구한다. 이 사설에서는 질적 초보자가 질적 인터뷰 데이터의 증거적 가치에 대한 직감을 명확하게 표현하고 경우에 따라 확인할 수 있는 학문적 언어를 개발하는 데 도움이 되는 지침을 제공합니다. 그러나 질적 연구의 복잡성을 고려할 때 우리의 지침은 돌이 아닌 모래로 쓰여져 있다. 지도질문 목록(표)과 핵심참고문헌(박스)이 이러한 중요한 질적 이슈에 대한 보다 깊은 성찰과 학습을 촉진하기를 기대한다. GME 연구자, 검토자 및 독자들이 풍부함, 엄격함, 충분성, 정보력 등의 개념을 사려 깊게 사용하고 의심스러울 때는 질적 연구 전문가에게 조언을 구하도록 권장한다.
We urge GME researchers, reviewers, and readers to move beyond the guise of saturation when evaluating qualitative findings obtained from interviews. In this editorial, we provide guidance to help qualitative novices develop a scholarly language to articulate—and in some cases, check—their gut sense about the evidentiary value of qualitative interview data. However, given the complexities of qualitative research, our guidance is written in sand, not stone. We hope that the list of guiding questions (Table) and key references (Box) will promote deeper reflection and learning around these important qualitative issues. We encourage GME researchers, reviewers, and readers to thoughtfully use concepts like richness, rigor, sufficiency, and information power, and to seek advice from qualitative research experts when in doubt.
J Grad Med Educ. 2021 Oct;13(5):607-611.
doi: 10.4300/JGME-D-21-00752.1.Epub 2021 Oct 15.
Beyond the Guise of Saturation: Rigor and Qualitative Interview Data
1is Assistant Professor, Department of Innovation in Medical Education and Department of Medicine, University of Ottawa, Ottawa, Ontario, Canada.
2is Professor and Associate Dean for Evaluation and Educational Research, The George Washington University School of Medicine and Health Sciences, and Deputy Editor, Journal of Graduate Medical Education.
3is Associate Professor, Department of Pediatrics, Perelman School of Medicine, University of Pennsylvania.
효과적으로 질적연구 결과 섹션을 쓰는 세 가지 원칙 (Focus on Health Professional Education, 2021) Three principles for writing an effective qualitative results section S. Cristancho, C. J. Watling & L. A. Lingard
도입 Introduction
우리의 글쓰기와 학문적 글쓰기에 대한 가르침은 중요한 전제에 달려 있다. 괜찮은decent 연구 논문은 [연구study]를 보고하지만, 훌륭한great 연구 논문은 [이야기story]를 들려준다. 명확하게 하기 위해, 우리는 연구와 이야기가 더 두드러지는 연구 논문의 부분을 구분했습니다. 우리는 [이야기가 크게 도입/고찰]이고 [연구는 방법/결과]라고 말해왔다. 그러나 이러한 구분을 너무 엄격하게 적용하지 않는 것이 중요합니다. 좋은 결과 섹션은 결과를 보고할 뿐만 아니라 독자가 결과에 참여할 수 있도록 도와줍니다. 좋은 결과 섹션은 스토리와 공부의 요소가 모두 필요하고, 그것들을 공존시키는 것은 결과 섹션을 쓰기가 어려운 이유일 것이다. 본 논문에서, 우리는 질적 논문의 저자들이 결과 부분에서 연구/이야기 난제와 씨름하는 데 도움이 되는 세 가지 원칙인 과학적 스토리텔링, 진정성 및 주장을 논의한다. Our writing, and our teaching about academic writing, hinges on a key premise—a decent research paper reports a study, but a great research paper tells a story (Lingard & Watling, 2016). For the sake of clarity, we have distinguished the sections of a research paper where study and story are more prominent. We have said that story is largely introduction/discussion and study is methods/results. It’s important, however, not to apply this distinction too rigidly—a good results section not only reports findings but also helps the reader to engage with them. A good results section needs elements of both story and study, and making them coexist is, likely, why a results section is so difficult to write. In this paper, we discuss three principles—scientific storytelling, authenticity and argument—to help writers of qualitative papers grapple with the study/story conundrum in their results sections.
원칙들 The principles
1. 과학적 스토리텔링 1. Scientific storytelling
"이야기"라는 단어는 과학과 함께 놓이기 불편한 단어이다. 과학은 그 자체로 설득력이 있다는 믿음 때문에 불편함을 만듭니다. 따라서, 연구 보고를 윤색하는 것처럼 보이는 것은 무엇이든 잘못인 것처럼 느껴집니다. 우리가 "이야기"라는 단어를 사용하는 것은 과학의 장식을 선호하기 위한 것이 아니라, 독자들이 [연구의 결과를 설득력 있게 만드는 것]이 무엇인지 쉽게 인식하도록 하기 위함이다. 과학적 스토리텔링의 원리는 그러한 목표를 향한 몇 가지 지침을 제공할 수 있습니다. The word “story” sits uneasily alongside science (“Should scientists tell stories?,” 2013). It creates discomfort because of the belief that science is persuasive on its own. Therefore, anything that seems like embellishing the reporting of a study feels wrong. Our use of the word “story” is not to favor embellishment of science but, rather, to ensure that readers readily recognise what makes the results of a study compelling. The principle of scientific storytelling can offer some guidance towards such a goal.
많은 작가들이 직면하는 어려운 점은 [무엇이 당신의 결과를 구성하는지]를 결정하는 것이다. 만약 독자들이 여러분의 연구에 참여하도록 강요하는 것이 목표라면, 여러분의 결과 섹션은 여러분이 그 구성 요소의 목록보다 더 많이 연구하고 있는 문제에 대한 개념적인 이해를 그들에게 제공해야 합니다. 훌륭한 연구자들은 독자들에게 의미를 부여하기 위해 해석하고 맥락화하며, 그러한 맥락화는 과학적 스토리텔링의 기초가 된다. A struggle many writers face is deciding what constitutes your results. If the goal is to compel readers to engage with your study, then your results section should offer them a conceptual understanding of the issue that you’re studying more than an inventory of its components. Good researchers interpret and contextualise to make meaning for their readers, and such contextualisation is the basis of scientific storytelling.
일반적으로 좋은 이야기는 환기시키고evocative, 참신하며 기억에 남아야 한다(Simmons, 2019).
과학적 스토리텔링에서, 환기시킨다는 것은 글이 감정을 자극한다는 것을 의미하지 않는다; 대신, 그것은 마음을 사로잡고 울려 퍼지게 하는 결과를 의미한다.
마찬가지로, 새롭다는 것이 항상 획기적인 발견을 제시하는 것은 아니다. 그것은 또한 알려진 현상에 대해 다른 관점을 제공하는 것에 관한 것이다.
그리고 기억에 남는다는 것은 독자들이 신문의 모든 세부사항을 기억할 것이라는 것을 의미하는 것이 아니라, 오히려 중요한 발견이 그들을 돋보이게 할 것이라는 것을 의미한다.
As a general rule, a good story should be evocative, novel and memorable (Simmons, 2019).
- In scientific storytelling, evocativedoesn’t mean the writing stirs emotion (although it might); instead, it refers to results that captivate and resonate.
- Similarly, novelis not always about presenting a groundbreaking discovery. It is also about offering a different perspective on a known phenomenon.
- And memorabledoesn’t mean that your readers will remember every single detail of the paper but, rather, that the key findings will stand out for them. How do you organise your story with these features in mind?
여기서부터 시작하는 것은 시작 단락입니다. 대부분의 질적 연구가 주제를 식별하는 것을 포함하기 때문에, 흔히 다음과 같이 시작하는 단락을 쓰는 경향이 있을 것이다: "우리는 다섯 가지 주제를 발견했다: 테마 1, 테마 2, … 테마 5. 주제 1은 … 주제 5는 … 각 주제는 참가자들의 인용문을 사용하여 아래에 설명되어 있습니다." 이러한 유형의 문단은 결과에 대한 큰 그림 설명을 제공하는 것으로 생각할 수 있지만 그렇지 않습니다. 이것은 테마의 목록입니다. 그리고 틀린 것은 아니지만, 할 이야기가 있는 것 같지는 않다. 대신 수치 경험에 대한 바이넘 외 연구진(2021)의 논문의 이 첫 단락을 생각해 보자. A place to start is the opening paragraph. As most qualitative studies involve identifying themes, we might be inclined to write an opening paragraph that reads like: “We found five themes: theme 1, theme 2, … theme 5. Theme 1 refers to … theme 5 refers to … Each theme will be described below using quotes from participants”. You might think of this type of paragraph as providing a big picture description of the results, but it does not. That’s an inventory of themes. And while it is not wrong, it doesn’t feel like there is a story to be told. Consider instead this opening paragraph from Bynum et al.’s (2021) paper on experiences of shame.
참가자들이 묘사한 수치 경험은 개인과 그들의 환경 사이의 동시적이고 다층적인 상호작용으로 구성되었다. 이러한 상호작용의 의미를 모색하면서, 우리는 '불의 은유'를 통해 참가자들의 수치심을 이해하게 되었습니다. 불이 기질에 미치는 잠재적인 영향처럼, 수치심은 우리의 참가자들에게 깊은 영향을 미칠 수 있다: 대부분의 보고는 세계적으로 부정적인 자기 평가로 구성된 강렬하고, 음흉하고, 그리고/또는 매우 골치 아픈 수치 반응을 경험한다. 학생들은 스스로를 '좋지 않다'(P10), '전혀 가치가 없다'(P12), '부적절한 의대생'(P15), '작다'(P8, P11), '멍청하다'(P6)고 생각한다고 보고했다. "이름도 없는 이 부정적인 감정에 빠져드는 것 같았다"(P15)는 수치심의 감정적 경험이 종종 압도적이었다. 참가자가 겪어낸 수치심 경험의 기원에 대한 두 가지 광범위한 구조, 즉 수치심 유발자와 수치심 촉진자를 식별했다. (188쪽) The shame experiences described by participants consisted of simultaneous, multi-layered interactions between the individual and their environment. In seeking the meaning of these interactions, we came to understand participants’ shame experiences through the metaphor of fire. Like the potential impact of fire on a substrate, shame could profoundly affect our participants: most reported experiencing intense, insidious and/or deeply troublesome shame reactions that consisted of globally negative self-assessments. Students reported viewing themselves as “no good” (P10), “completely worthless” (P12), “an inadequate medical student” (P15), feeling “small” (P8, P11) and feeling “stupid” (P6). The emotional experience of shame was often overwhelming: “I felt like I was drowning in this negative emotion that I didn’t have a name for” (P15). We identified two broad structures of the origins of participants’ lived experiences of shame: shame triggers and shame promoters. (p. 188)
이 단락을 읽으면, 여러분은 결과 파트에서 [수치심을 유발하고 촉진하는 것]을 다룰 것이라는 느낌을 받게 됩니다. 하지만, 그것이 다가 아닙니다. 저자들은 이 단락에 이야기 풍미를 불어넣기 위해 [두 가지 추가 전략]을 사용했다. 주제 간 관계가 [메타포의 형태로 묘사될 것이라는 기대]를 독자들에게 준비시키고, [메타포를 엿볼 수 있는 짧은 인용구]를 주입하는 동시에 독자들의 시선을 사로잡았다. In reading this paragraph, you get a sense that the results will be about triggers and promoters of shame. However, that’s not all. The authors used two additional strategies to instill a story flavor in the paragraph. They prepared readers to expect that the relationships among themes will be described in the form of a metaphor, and they infused evocative short quotes to provide a glimpse of the metaphor, while at the same time, capturing readers’ attention.
문단을 여는 것만이 당신의 결과의 스토리를 묘사하는 유일한 방법은 아니다. [시각 지향적인 도표]를 사용하여 독자가 아이디어 간의 연결을 볼 수 있습니다. 다음은 예입니다. Opening paragraphs are not the only way to portray the story of your results. In the event that you are more visually oriented, you could also use diagrams to help readers see the connections between your ideas. Here is an example:
임상 학습 과정은 도표를 사용하여 표현되었다(Watling 등, 2012). 저자들은 모델의 각 핵심 요소를 입증하고자 했기 때문에 결과 섹션의 시작 부분에 도표를 포함하기로 명시했다. 그렇게 함으로써, 그 다이어그램은 독자들이 앞으로 다가올 것과 각각의 요소들이 어떻게 연결되어 있는지에 대한 방향을 제시하는데 도움을 주었다. The process of clinical learning was represented using a diagram (Watling et al., 2012). Since the authors intended to evidence each key element of the model, they made the explicit decision to include the diagram at the beginning of the results section. By doing so, the diagram helped orient readers to what was to come and to how each element was connected.
시작 문단 및 도표는 [이야기의 큰 그림]을 그리는데 도움이 된다. 결과 섹션의 나머지 부분에서는 의도한 스토리가 스터디와 어떤 관련이 있는지 설명합니다. 시작하기 전에, 모든 주제가 과학 이야기에서 동등하게 표현되어야 하는 것은 아니라는 것을 기억하라. 모든 주제 간의 관계를 설명할 수 있지만, 때때로 하나의 핵심 주제를 중심으로 이야기를 진행하기로 결정할 수도 있습니다. 이것은 임의적인 결정이 아닙니다. 테마가 이야기를 의미 있게 진전시키는지, 그리고 그것을 뒷받침할 충분한 자료가 있는지 여부에 달려 있다. 이는 전통적인 결과 표시가 아니므로, 작성자들은 이 사례에서 예시된 바와 같이 의사결정을 명시적으로 표현하는 것을 고려해야 한다. Opening paragraphs or diagrams help lay out the big picture of the story. The rest of the results section is about describing how your intended story relates to your study. To start, remember that not all themes must figure equally in a scientific story. While you could describe all the relationships among all your themes, sometimes you might decide to center your story around one key theme. This is not a random decision. It hinges on whether the theme(s) advances the story in a meaningful way and on whether you have enough data to support it. As this is not a traditional presentation of results, writers should consider explicitly articulating their decision making, as illustrated in this example.
우리는 두 가지 주요 발견을 확인했다. 첫 번째 범주는 아래에 설명된 원칙과 선호도의 한계인 핵심 범주입니다. 두 번째는 참가자들이 이러한 문턱에 직면했을 때 어떻게 반응했는지에 대한 이론적 프레임워크입니다. 연구 결과를 더 강력하게 표현해야 한다는 최근의 요구에 따라(26–28) 우리는 그 구축을 이끈 모든 범주와 코드를 요약하는 대신 [핵심적 이론 구조]를 환기하는 핵심 내러티브를 사용하기로 결정했다. (Apramian 등, 2015, 페이지 S71) We identified two key findings. The first is the core category—thresholds of principle and preference—as described below. The second is a grounded theoretical framework of how our participants responded to encountering these thresholds. Following recent calls to represent research findings more powerfully (26–28) we have elected to use core narratives that evoke the central theoretical constructs rather than outlining all categories and codes that led to their construction. (Apramian et al., 2015, p. S71)
저자들은 결과 이야기를 '문턱 원칙과 선호'라는 핵심 주제에 집중하기로 했을 뿐만 아니라 그 구성 요소를 짧은 인용구가 아닌 내러티브의 형태로 설명하기로 했다. 아래의 주장의 원칙이 이 전략에서 확장될 것입니다. Not only did the authors decide to focus the story of the results on the key theme of “thresholds of principle and preference”, but they also chose to illustrate its components in the form of narratives, not short quotes. The principle of argument, below, will expand on this strategy.
문단이나 도표를 여는 용도, 주제 간 관계를 어떻게 탐구할 것인지 등을 고려하는 것 외에도, [결과 부분을 어떻게 마무리할지]에 대해서도 어느 정도 고민해야 한다. 요약 단락, 기억할 만한 인용문 또는 간단한 전환 문장을 사용할 수 있습니다. 자신의 선호도와 단어 수 제한과 상관없이, 중요한 것은 가장 취약한 지점weakest point으로 끝나지 않는 것입니다. 첫 번째 초안 후에 이야기의 흐름을 다시 돌아보는 습관을 들이고 수사적인 목적을 위해 재정렬하세요. In addition to considering the use of opening paragraphs or diagrams and how you will explore the relationships among your themes, some thought should be given to the ending of the results section. You may use a summary paragraph, a memorable quote or simply a transition sentence. Regardless of your preference and word count limit, what’s important is that you don’t end with your weakest point. Make a habit of revisiting the flow of the story after your first draft, rearranging for rhetorical purposes.
과학적 스토리텔링의 원리를 이용하면서, 작가들이 마주치는 또 다른 어려움은 [결과와 토론 사이의 연결성]에 대해 결정하는 것이다. 저자는 잘못이 없다. 이런 어려움을 만드는 것은 질적 연구의 비선형성 때문이다. 질적 연구는 반복적이고 진화하는 것이다; 연구자들은 그들의 데이터를 읽고 해석하는 것 사이를 왔다 갔다 한다. 그리고 그것들을 작성하는 것도 마찬가지입니다. 이렇게 하면, 때때로 검토자로부터 해당 문장이 토론 섹션에 속하는지 궁금하거나 질문을 받을 수 있습니다. 보건전문교육(HPE) 논문의 전통적인 IMRD(서론, 방법, 결과, 토론) 구조에서 [결과 섹션]은 참가자들이 어떻게 경험했는가라는 질문에 답하고, [토론 섹션]은 참가자들의 경험을 알게 되었으니, 우리는 이 지식으로 무엇을 할 수 있는가라는 질문에 답한다. In using the principle of scientific storytelling, another struggle writers encounter is deciding about the connection between the results and the discussion. The writer is not at fault here. What creates this struggle is the non-linear nature of qualitative studies. Qualitative studies are iterative and evolving; researchers go back and forth between reading and interpreting their data. And the same applies to writing them up. In doing so, you might sometimes wonder or get asked by a reviewer whether a statement belongs to the discussion section. In the traditional IMRD (Introduction, Methods, Results, and Discussion) structure for health professional education (HPE) papers, while
a results section answers the question How did participants experience this?,
a discussion section answers the question Now that we know about their experiences, what can we do with this knowledge?
결과 중 한 조각이 토론에 속하는지를 빠르게 점검해보는 요령은 [문장의 시제]를 확인하는 것입니다. 우리는 참가자들의 관점을 설명할 때 과거형을 사용하고, 우리의 해석을 제공할 때 현재형을 사용하는 경향이 있습니다. 만약 그러한 해석이 [참가자들이 말한 것을 어떻게 해야 하는지에 대한 권고]로 넘어가게 된다면, 당신은 경계를 넘은 것이다. 예를 들어, 아래 첫 번째 문장은 참가자들이 조정된 치료 계획을 해결책으로 식별했음을 암시한다. 두 번째 문장은 현재 시제로 인해 권고와 혼동될 수 있다. A quick test to identify if a piece of the results belongs to the discussion is to check the tense of your sentences. We tend to use past tense when describing participants’ perspectives and present tense when providing our interpretation. If such interpretation slips into recommendations of what to do with what participants said, then you have crossed the boundary. For instance, the first sentence below implied that participants had identified the coordinated care plan as a solution. The second sentence, by virtue of its present tense, can be confused with a recommendation.
많은 참가자들이 환자의 의료 필요성의 반복적인 문제에 대한 "정밀한 해결책"으로서 조정된 진료 계획을 언급했다. 따라서 그러한 계획의 일상적인 채택은 전문가 간 의사소통을 개선하고 환자와 가족[작업의 시사점]의 관리에 있어 차질을 줄이기 위한 전략을 나타낼 수 있다. Many participants spoke of coordinated care planning as a “sophisticated solution” to the recurring problem of patients’ healthcare needs “falling through the cracks” [participants’ experiences]. The routine adoption of such plans may, thus, represent a strategy to improve interprofessional communication and reduce disruptions in care for patients and families [implications of the work].
마찬가지로, 레퍼런스가 필요할 수도 있다고 생각되는 문장이나, 독자들이 그들의 실천에서 (적용)할 수 있는 것과 관련된 진술은 아마도 결과 섹션에 속하지 않을 것이다. Similarly, if you write a statement that you think may need a reference, or a statement that has to do with what readers might do in their practice, those statements probably don’t belong in the results section.
이러한 빠른 테스트가 [결과 대 고찰]의 딜레마를 반드시 해결하는 것은 아니지만, 특히 결과와 토론이 관례적으로 혼합된 분야에서 온 경우 HPE 분야에서 글을 쓰는 연습에 자신을 적응시키는 데 도움이 될 것입니다.최소한, 이 테스트들은 발견에 대한 묘사가 추천이나 함축적인 향을 가지고 있는지 자신에게 물어보거나 피드백을 요청하도록 유도해야 한다. 그런 경우 데이터로 돌아가서 소견으로 확인하거나 토론으로 이동해야 합니다. While these quick tests will not necessarily solve the results versus discussion dilemma, it should help you orient yourself into the practices of writing in the HPE field, particularly if you come from a discipline where results and discussion are conventionally blended. At a minimum, these tests should prompt you to ask yourself or ask for feedback on whether a description of a finding has a recommendation or implication flavour. If so, then you should either go back to your data to confirm it as a finding or move it to the discussion.
2. 진실성—이야기에 가장 적합한 인용문 선택 2. Authenticity—selecting the best quotes for the story
연구에서 코딩하고 분석한 내용 중에서 가장 좋은 인용문을 선택하는 것은 보기보다 어렵습니다. 당신에게는 아마 선택지가 아주 많을 것이고, 그 중 일부는 당신이 꽤 좋아하는 것이다. [진실성의 원칙]은 각 인용문이 독자들에게 데이터의 지배적인 패턴에 대한 직접적인 접근을 제공하도록 당신의 선택을 안내할 수 있다. 진실성을 확보하려면 데이터에 대한 요점을 설명해주면서, 데이터 패턴을 나타내는 인용문을 선택하십시오. Selecting the best quotes from among all those you’ve coded and analysed in your study is harder than it looks. You likely have a wealth to choose from, some of which you’re quite fond of. The principle of authenticity can guide your selection to ensure that each quote offers readers firsthand access to dominant patterns in the data. To achieve authenticity, select quotes that are illustrative of the point you’re making about the data, reasonably succinct and representative of the patterns in data.
인용문이 설명이 되는가? Is the quote illustrative?
독자들은 여러분의 주장의 요점과 여러분이 증거로 제시한 인용문을 연결하기 위해 노력할 필요가 없습니다. 가장 좋은 인용구는 암묵적인 설명보다는 [명시적인 설명]입니다. 다음 예를 생각해 보십시오. Readers should not have to work to connect the point in your argument and the quote you’ve offered as evidence. The best quote is an explicit illustration rather than an implicit one. Consider the following examples:
훈련 프로그램을 마친 뒤 참가자들은 "내가 내린 결정 중 가장 어려운 결정이었고, 하고 나니 기분이 나아지지 않았다"며 깊은 혼란과 방향감각을 드러냈다. (P5) After leaving their training program, participants expressed profound confusion and disorientation: “It was the most difficult decision I’ d ever made, and I didn’t feel any better after making it”. (P5)
훈련 프로그램을 마친 뒤 참가자들은 자신들이 바라던 안도감이 바로 드러나지 않았다고 표현했다. "내가 내린 결정 중 가장 어려웠고, 하고 나니 기분이 나아지지 않았다." (P5) After leaving their training program, participants expressed that the relief they’ d hoped for wasn’t immediately apparent: “It was the most difficult decision I’ d ever made, and I didn’t feel any better after making it”. (P5)
첫 번째 예에서, 인용문은 "혼란과 방향 상실"의 요점을 명시적으로 증명하지 않는다. 두 번째 예시는 인용문과의 연결을 타이트하게 만들고 있다. In the first example, the quote doesn’t explicitly evidence the point of “confusion and disorientation”. The second example alters the lead up to the quote to tighten the connection.
때로는 작가로서 스스로가 할 수 없는 말을 인용구를 이용해 하고 싶을 때가 있다. 이 경우, 인용문은 당신의 주장을 입증하는 것이 아니라 당신을 대신해서 주장을 하는 것입니다. 다음 예를 들어 다음과 같습니다. Sometimes, you may also want to use a quotation to say something that you, as the writer, can’t say yourself. In this case, the quote isn’t so much evidencing your point, it’s making a point on your behalf. Consider this example:
워크숍과 초청 연사와 같은 형평성 및 다양성 이니셔티브는 소수 교수진에 의해 "립 서비스"(P7)로 간주되었으며, 특히 기관의 더 큰 구조가 변경되지 않은 경우 더욱 그러했다. Equity and diversity initiatives such as workshops and invited speakers were often viewed as “ lip service” (P7) by minority faculty, particularly if larger structures in the institution remained unchanged.
"립 서비스"라는 용어는 특히 소수 교수진 참가자의 입에서 나온 강력한 비판이다. 이것은 번역이 같은 영향을 미치지 않았을 때입니다. 독자들은 이러한 강한 입장이 참가자들로부터 직접 나온다는 것을 알아야 합니다. The term “lip service” is a powerful critique, particularly coming from the mouth of a minority faculty participant. This is a moment where paraphrasing would not have had the same impact—readers need to know that this strong position comes directly from participants.
그 인용문은 간결합니까? Is the quote succinct?
인터뷰 녹취록을 읽어본 사람이라면 그들이 구불구불하고 재귀적이며 타원과 갑작스러운 전환으로 가득 차 있다는 것을 안다. 이 때문에 요점을 설명하기 위한 짧은 인용문을 찾는 것이 어려울 수 있으며, 더 긴 인용문을 타이트하게 줄여야 합니다. 한 가지 조임tightening 기법은 주요 문구를 추출하여 인용문의 도입 문장에 통합하는 것이다. Anyone who has ever read an interview transcript knows that they are meandering and recursive, full of ellipses and abrupt transitions. Because of this, it can be difficult to find a short quote to illustrate a point, and you need to tighten up a longer one. One tightening technique is to extract key phrases and integrate them into your own introductory sentence to the quote.
훈련 프로그램을 떠난 참가자들은 "어려운 결정"이었다고 반성을 했고, 직후에는 "기분이 나아지지 않았다."고 밝혔다 (P5) Participants who had left their training program reflected that it was a “difficult decision”, immediately after which they “didn’t feel any better”. (P5)
또 다른 해결책은 줄임표를 사용하여 인용문의 일부를 오려냈다는 신호를 보내는 것입니다. Another solution is to use the ellipsis to signal that you have cut part of the quote out:
대학원 훈련 경로는 "컨베이어 벨트처럼 단단하고 자동적이다. … 뛰어내릴 수는 있지만, 그 후에 다시 타는 것은 정말 쉽지 않습니다." (P13) Postgraduate training pathways were described as “rigid and automatic, like … a conveyor belt. … You can jump off, but getting back on afterwards is really not easy”. (P13)
첫 번째 줄임표는 문장 중간에 무언가가 제거되었다는 신호입니다. 이 경우 이 누락된 자료는 내용을 추가하지 않았습니다. "그러니까, 알잖아요, 그 단어가, 내가 하려던 말은..."
두 번째 줄임표는 완전한 정지를 따르며, 따라서 적어도 한 문장이 제거되었거나 그 이상이 될 수 있다는 신호를 보낸다.
The first ellipsis signals that something mid-sentence has been removed. In this case, this missing material did not add content: “like, you know, um, what’s the word I’m looking for, like you’re on a”.
The second ellipsis follows a full stop, and therefore signals that at least one sentence has been removed and perhaps more.
줄임표를 사용할 때, 인용구의 의미에 중요한 뉘앙스를 가진 물질을 제거하지 않도록 주의하세요. 참가자가 원하는 바를 말할 때까지 단편적인 내용을 담아내는 것이 목적이 아니며, 목표는 전체 인용문의 요지에 충실한 표현입니다. When using an ellipsis, be careful not to remove material that importantly nuances the meaning of the quote. The goal is not to snip bits and pieces until participants say what you want them to; it is a representation that remains faithful to the gist of the full quote.
앞의 예에서 알 수 있듯이, 여러분은 간결함을 돕기 위해 구술을 정돈하기를 원할지도 모릅니다. 인용문의 문구를 바꾸는 것은 항상 진실성 원칙에 위배될 위험이 있기 때문에 신중해야 한다. 인터뷰 전사본은 언어학자들이 "필러" 또는 "후회 표시자"라고 부르는 것, 소리 및 단어, 예를 들어 "아/어/음/좋아요/당신이 알고 있는/맞아요"(Tottie, 2016)로 가득 차 있다. 만약 당신이 담론과 서술적 분석을 한다면, 당신은 반드시 그러한 [망설임의 표현]조차도 의미의 일부로 분석하게 될 것입니다. 그러나 다른 연구 방법론에서는 언어적 특성이 참가자를 식별할 수 있게 한다는 우려와 같은 가독성 또는 윤리적 이유로 일부 "라이트 정리"를 선택할 수 있습니다(Corden & Sainsbury, 2006). As the previous example shows, you may wish to tidy up oral speech to help with succinctness. Changing the wording of a quotation always risks violating the authenticity principle, so writers must do it thoughtfully. Interview transcripts are replete with what linguists refer to as “fillers” or “hesitation markers”, sounds and words such as “ah/uh/ um/like/you know/right” (Tottie, 2016). If you’re conducting discourse and narrative analysis, you will necessarily analyse such hesitations as part of the meaning. However, in other research methodologies, you may opt to do some “light tidying up” for readability or ethical reasons, such as the concern that linguistic features might make participants identifiable (Corden & Sainsbury, 2006).
마지막으로, 문장의 문법적 무결성을 유지하기 위해 인용구의 문구를 변경할 필요가 있을 수 있습니다. 작가들은 일반적으로 일관된 시제나, 동사와 주어 또는 대명사와 선행의 합치성을 위해 인용부호를 변경할 필요가 있다. 적절한 문법 흐름을 보장하기 위해 동사 시제를 과거에서 현재로 변경한 예에서와 같이 대괄호를 사용하여 이러한 변화를 나타냅니다. Finally, you may need to alter the wording of a quote to maintain the grammatical integrity of your sentence. Writers commonly need to alter quotes for consistent tense or for agreement of verb and subject or pronoun and antecedent. Use square brackets to signal such changes, as in this example in which verb tenses were changed from past to present to ensure appropriate grammatical flow:
임상 감독관들은 "직접 관찰이 항상 가능한 것은 아니다.", 특히 "우리는 훈련생과 함께 일하지 않는다"와 "선배가 학생들의 직접적인 감독 중 일부를 하고 있다." (P2) Clinical supervisors understood that “direct observation [isn’t]always feasible”, particularly in settings where “we [don’t] work side by side with the trainee” and “seniors [are doing]some of the direct supervision of the students. (P2)
간결함을 위한 또 다른 전략은 인용문을 표에 넣는 것이다. 질적 연구자들은 표 형식이 주는 제약(그리고 '표'라는 것의 실승주의적 뿌리)에 대해 불평할 수 있지만, 복잡한 결과를 한눈에 보여주기 위해 전략적으로 사용될 수 있다. 이 예에서 긴즈버그 외 연구진(2015)은 참가자가 교육 중 평가 보고서에 대한 의견을 해석할 때 고려한 요소를 정의하고 설명한다(그림 2 참조). Another strategy for succinctness is to put the quotes into a table. While qualitative researchers may chafe at the constraints (and positivist roots) of the table format, it can be used strategically to present complex results at a glance. In this example, Ginsburg et al. (2015) name, define and illustrate the factors their participants considered when interpreting comments on in-training evaluation reports (see Figure 2).
정성 분석의 주요 결과를 스냅샷하는 데 표를 사용할 수 있지만, 결과 본문에서 서술적 설명을 대체하거나 중복되어서는 안 됩니다. 이것은 의문을 제기한다: 어떤 인용구가 본문에 속하고 어떤 인용구가 표에 속할까? 결정하는 한 가지 방법은 "힘power"과 "증명proof" 인용구를 구별하는 것입니다.
파워 인용문은 가장 설득력 있는 인용문이며,
입증 인용문은 해당 인용문이 반복되었거나 다소 다면적이라는 추가 증거입니다(Pratt, 2008, 2009).
While tables can be used to snapshot the key findings from a qualitative analysis, they should not replace your narrative explanation in the body of the results, nor should they be duplicated. This begs the question: which quotes belong in the body and which belong in a table? One way to decide is to distinguish between “power” and “proof” quotes.
Power quotes are the most compelling ones, the quotes that most effectively illustrate your points, while
proof quotes are additional evidence that the point was recurrent or, perhaps, somewhat multifaceted (Pratt, 2008, 2009).
그 인용문이 대표적이니? Is the quote representative?
모든 질적 연구자들은 그들이 빨리 논문을 작성하고 싶은 환상적인 인용문을 찾아냈다. 그러나 초안을 수정하다 보면 데이터가 잘못 전달되어 삭제되어야 하는 경우가 있습니다. 선택한 인용문은 데이터의 강력한 패턴을 반영해야 합니다. 모순되는 예는 중요한 목적을 수행하지만, 그 사용은 전략적이고 명확해야 합니다. 또한, 인용문 선택은 한 두 명의 매우 명확한 참가자로부터 나와서는 안 됩니다. 경우에 따라 차선의 또는 차차선의 모범적 예시문을 사용하더라도 여러 참가자에게 분산시킴으로써 데이터 집합 전체를 더 잘 표현할 수 있습니다. Every qualitative researcher has identified a fantastic quote they just can’t wait to put into a paper. Sometimes, however, you discover as you revise the draft that it misrepresents the data, and it has to be removed. The quotes you choose should reflect strong patterns in the data. Discrepant examples serve an important purpose, but their use should be strategic and explicit. Furthermore, your quote selection shouldn’t come from the same one or two highly articulate participants. Distributing your choices across participants better represents the dataset as a whole, even if it means using the second- or third-best example in some instances.
주요 결과를 나타낼 인용문을 선택할 때 독자가 의미를 정확하게 추론할 수 있도록 충분한 맥락을 유지해야 합니다. 때때로 이것은 [참가자의 답변]뿐만 아니라, [면접관의 질문]도 포함한다는 것을 의미합니다. 그룹 토론에 중점을 두는 포커스 그룹 연구에서는 개별 의견을 추출하는 것보다 참가자 간의 교류를 인용하는 것이 필요할 수 있다. 다음의 공개된 예(Greenhalgh 등, 2004)는 이 기술을 설명한다. As you select quotes to represent main findings, be sure that you retain sufficient context so that readers can accurately infer their meaning. Sometimes this means including the interviewer’s question as well as the participant’s answer. In focus group research, where the emphasis is on the group discussion, it might be necessary to quote an exchange among participants rather than extracting individual comments. The following published example (Greenhalgh et al., 2004) illustrates this technique.
그러나 부유하지 못한 학생들 사이에서는 높은 사회 계층과 특권 교육이 입학 과정에 유리하다는 인식이 강했다. However, there was a strong perception among less affluent pupils that high social class and a privileged education would confer an advantage in the admissions process:
[왜 학생이 의대에 입학하는 것을 쉽게 느낄 수 있는지에 대한 질문에 대한 답변] [in response to a question about why a pupil might find it easy to get into medical school]
"그녀의 자기 자신과 성적은... ...잘하면 면접을 보는 것처럼요." “The way she carries herself and her grades . . . like at interview if she does well.”
"어떻게 스스로를 감당하겠어?" [facilitator] “How would she carry herself?”
"각각, 제대로 말하고, 적절한 옷을 입고, 자신감이 넘친다." “Respectively [sic], talking properly, and dressing appropriately, alot of confidence.”
"일반적인 억양이 아니라 제대로 말하세요." “Not saying it in a common accent, say it properly.”
말을 잘하면 더 교육받은 것처럼 보일 것이다.(B학교 남학생들) “If they speak well, then they’ ll look more well-educated.” (Boys from school B)
이 발췌문은 단일 참가자의 답변보다는 질문에 대한 그룹 참여를 효과적으로 나타냅니다. This excerpt effectively represents the group engagement with the question rather than a single participant response.
3. 논쟁 3. Argument
예를 들어, 가장 대표적인 인용문조차도 스스로 설명하지는 않습니다. 글쓴이는 문법적으로나 수사적으로나 [인용문을 자신의 텍스트에 포함]해야 합니다. 문법 통합의 경우 인용된 자료는 인용되지 않은 자료와 동일한 문법 및 구두점 규정을 적용한다는 것만 기억하면 됩니다. 이 예제를 큰 소리로 읽어보십시오. Even an illustrative, representative quote does not speak for itself—writers must incorporate the quote, both grammatically and rhetorically, into their own text. For grammatical incorporation, you need only remember that quoted material is subject to the same sentence-level conventions for grammar and punctuation as non-quoted material. Read this example aloud:
사무국장들은 "전문성 문제가 반복될 때 아마 그 역할에서 가장 어려운 부분일 것"이라며 비전문적인 행동을 바로잡기 위해 고군분투했다(P8) Clerkship directors struggled to remediate unprofessional behavior, “ it’s probably the most difficult part of the role, when you come across a recurring professionalism problem.” (P8)
쉼표를 사용하여 인용구를 작가의 문장에 결합하면 쉼표 스플라이스와 런온 문장이 생성되는데, 이는 눈이 즉시 인식하지 못하더라도 귀가 들을 가능성이 높다. 인용구를 삽입한 문장을 큰 소리로 읽어서 문법적 편입을 확인하세요. 간단한 수정은 [쉼표를 콜론으로] 바꾸는 것입니다. Using a comma to join the quote to the writer’s sentence creates a comma splice and a run-on sentence, which your ear likely hears even if your eye doesn’t instantly recognise it. Read aloud sentences where you’ve inserted a quote to check grammatical incorporation. A simple correction is to replace the comma with a colon.
사무국장들은 비전문적인 행동을 바로잡기 위해 고군분투했다. "전문성 문제가 반복되는 것이 그 역할에서 가장 어려운 부분일 것이다." (P8) Clerkship directors struggled to remediate unprofessional behavior: “ it’s probably the most difficult part of the role, when you come across a recurring professionalism problem.” (P8)
[콜론]은 인용된 물질을 통합하기 위한 기본 메커니즘입니다. 그리고 그것은 문법적으로 많은 시간을 충분합니다. 그러나, 그것이 항상 수사적으로 충분한 것은 아니다. 왜냐하면 독자에게 [연구자가 하려는 말]과 [인용된 말] 사이의 관계를 유추하게 남겨두기 때문이다. 인용문이 글쓴이의 논점을 완벽하게 전달할 때, 콜론은 충분할 뿐만 아니라 인용문을 산만하게 집중 조명한다. 하지만, 인용문은 당신의 논점을 완벽하게 만드는 경우는 거의 없다; (인용문을 이해하는 데에는) 보통 약간의 추론이 필요하며, 독자들은 작가가 의도하는 바를 추론하지 못할 수도 있다. 독자들이 자신만의 해석을 하도록 내버려둘 것이 아니라, 작가들은 그들의 해석을 분명하게 해야 한다. 이러한 맥락화는 모로(2005)가 해석과 인용의 "균형balance"이라고 부르는 것을 달성하기 위한 요건이다. The colon is a default mechanism for integrating quoted material. And it suffices grammatically much of the time. However, it doesn’t always suffice rhetorically, because it leaves the reader to infer the relationship between the point being made and the quoted illustration. When the quote perfectly makes the writer’s point, the colon not only suffices, it spotlights the quote without distraction. However, only rarely do quotes perfectly make your point; usually some inference is required, and readers might not infer what the writer intends. Instead of leaving readers to come to their own interpretations, writers should make explicit their interpretation. Such contextualising is a requirement for achieving what Morrow (2005) calls the “balance” of interpretation and quotation.
연구자들의 해석과 인용문 사이에 이러한 균형을 이루기 위한 많은 기술들이 있다. 다음 예에서 콜론 앞의 자료가 견적서에 대해 점진적으로 더 많은 맥락화를 제공하는 방법에 주목하십시오. There are many techniques for achieving this balance between researcher interpretations and supporting quotations. Note in the following examples how the material before the colon provides progressively more contextualisation for the quote:
한 주민은 "표준 훈련 경로에서 벗어날 수 있지만, 다시 타는 것은 보장되지 않습니다."라고 말했다. (P21) One resident said: “You can get off the standard training pathway, but getting back on isn’t guaranteed”. (P21)
한 주민은 "표준적인 훈련 경로에서 벗어날 수 있지만, 다시 승선하는 것은 보장되지 않는다."라고 단언했다. (P21) One resident asserted:“You can get off the standard training pathway, but getting back on isn’t guaranteed”. (P21)
포커스 그룹의 한 주민은 훈련 경로가 CBME[역량 기반 의료 교육]의 맥락에서 개별화되고 유연하다는 생각에 동의하지 않았다. "표준 훈련 경로에서 벗어날 수 있지만, 다시 복귀하는 것은 보장되지 않습니다." (P21) One resident in the focus group disagreed with the idea that training pathways were individualised and flexible in the context of CBME [competency-based medical education]: “You can get off the standard training pathway, but getting back on isn’t guaranteed”. (P21)
포커스 그룹 참가자들은 CBME의 맥락에서 훈련 경로의 유연성에 대해 토론했다. 일부는 훈련이 "더디게 갈 필요가 있거나 더 빨리 갈 수 있거나, 거주자의 길에서 조금 벗어나고 싶은 경우" (P19) 반면 다른 이들은 "표준 훈련 경로에서 벗어날 수 있다"고 주장했다. 하지만 다시 탈 수 있다는 보장은 없습니다." (21) Focus group participants debated the flexibility of training pathways in the context of CBME. Some anticipated that training “can be adjusted, for if you need to go slower or you’re able to go faster or you want to do something a bit off the beaten path of residency” (P19), while others contested that “you can get off the standard training pathway, but getting back on isn’t guaranteed”. (P21)
증가하는 문맥화는 중립적인 "말한said"을 사용하는 첫 번째 예와 참가자의 어조를 감지하기 위해 "주장된asserted"을 사용하는 두 번째 예 사이의 동사 변화에서 시작된다. 세 번째는 [포커스 그룹 토론의 맥락]에 그것을 배치함으로써 인용문의 의미를 더욱 해석한다. 네 번째 예시는 두 개의 인용구를 [문장의 서술 구조에 직접 통합]하여 참여자들 사이에서 일어나고 있는 토론을 보여준다. 그리고 콜론을 사용하지 않음으로써, 마지막 예는 작가가 인용문을 그들의 논증에 엮기 위해 더 열심히 일하도록 강요한다. 이러한 직조는 [인용문의 의미를 수사적으로 강하게 통제]한다. The increasing contextualisation begins with a shift in verb between the first example, which uses the neutral “said”, and the second example, which uses “asserted” to give a sense of the participant’s tone. The third interprets the meaning of the quote even more by situating it in the context of a focus group debate. The fourth example integrates two quotes directly into the narrative structure of the sentence to show the debate that was occurring among participants. And by not using a colon, the last example forces the writer to work harder to weave the quotes into their argument. Such weaving exerts strong rhetorical control over the quote’s meaning.
초안을 쓸 때는 때는 기본적으로 콜론을 사용하는 편이 낫다. 각각의 조각을 어떤 자리에 고정하는 데 이상적이다. 하지만 수정할 때는 더 다양하고 스타일을 지향하세요. 이렇게 하면 결과 섹션이 점-콜론-인용, 점-콜론-인용, 점-콜론-인용 등의 로봇적 운율을 넘어 향상되고 인용문이 여러분이 주장하는 요점을 뒷받침하고 발전시킬 수 있습니다. Use the default colon when you’re drafting—it’s perfect for just getting the pieces into place. But when you revise, aim for more variety and style. This will elevate your results sections beyond a robotic cadence of point-colon-quote, point-colon-quote, point-colon-… . And it will ensure that the quotes support and develop the points you’re making.
때때로 당신은 자신의 문장에 통합할 수 없는 더 긴 인용구를 포함하기를 원할 것이다. 이러한 인용문은 독자들에게 인터뷰의 분위기를 느낄 수 있게 하거나 아이디어들 사이의 복잡한 상호관계를 엿볼 수 있게 할 수 있으며, 당신은 이러한 차원을 잃어버릴 정도로 그것들을 자르고 싶어하지 않을 것이다. 하지만, 인용문이 길어질수록 독자의 관심이 당신이 의도한 것과는 다른 무언가에 걸릴 가능성이 더 커진다는 것을 명심하라. 결과 작성에 있어 이러한 모순을 방지하기 위해 인용 샌드위치 기법(인용문 앞의 문맥에 적용하고 그 뒤의 해석을 요약하는 것)을 고려하십시오. 다음 그림(Emerton-Coughlin et al., 2017)에서 비디오 발췌문 필사본은 3번 박스에서 설명되는 내용과 포인트에 대한 자세한 분석을 제공하는 요약 텍스트로 구성된다. Sometimes you will want to include a longer quote that cannot be integrated into your own sentence. Such quotes can offer readers a sense of the mood of the interview, or a glimpse of the complex interrelationship among ideas, and you don’t want to cut them back to the point that this dimension is lost. Keep in mind, though, that the longer the quote, the greater the chance that the reader’s attention will snag on something other than what you intend. To guard against this source of incoherence in your results writing, consider applying the “quotation sandwich” technique (Graff & Birkenstein, 2018) to contextualise before the quotation and summarise your interpretation after it. In the following illustration (Emmerton-Coughlin et al., 2017), the transcription of a video excerpt is set off in Box 3, sandwiched by introductory text that sets up what’s being illustrated and summary text that provides detailed analysis of the point:
다음 예는 통제 역학의 양방향 특성을 보여줍니다. 의사가 수술 기법을 수정하라는 지침을 시작합니다(상자 3 참조). The next example typifies the bidirectional nature of control dynamics. The surgeon initiates an instruction to modify the surgical technique (see Box 3).
외과의사의 지침을 올바르게 이행하려면 훈련생이 올바른 표현을 해석해야 합니다. "상단 부분"과 "하단 부분"이 있습니다. 훈련생은 다시 데히스를 사용하여 "이것이 바로 여기입니까?"라고 응답하고 주어진 지침에 대한 자신의 해석을 확인하기 위해 현지화 기동을 합니다. 외과의는 명령을 승인한 다음 추가 정보와 추가 지시로 자신의 신체적 제스처 동작을 추가하며 더 정교하게 다듬는다. 이는 핵심 구조물인 담관을 식별하고 보호하는 것과 관련된 고난도의 순간 동안 교육생이 강사에게 준 엄격한 수준의 통제를 강조합니다. Correct implementation of the surgeon’s instruction relies on the trainee’s correct interpretation of the deictic expressions: “the top part” and “the bottom part”. The trainee responds, again using deixis, “This right here?” and pairs with it a physical localising manoeuvre in order to confirm her interpretation of the instruction given. The surgeon ratifies and then goes on to further refine the instruction with additional information and additional deictic instruction, adding his own physical gesturing manoeuvre. This back and forth highlights a concession by the trainee of a tight degree of control to the instructor during this high-stakes moment involving the identification and protection of a key structure, the bile duct.
이 예제는 또한 인용문의 내용을 단순히 반복하지 않고 요약하는 방법을 보여줍니다. 독자는 이미 인용문을 읽었는데, 인용문은 지시적인 표현들을 강조하기 위해 주석을 달았다. 그 뒤의 텍스트는 이 교환의 "양방향성"에 대한 시작점을 예시하며, 예제의 진행 상황에 대한 설명에서 "대응", "확인", "뒤로"와 같은 용어를 사용한다. This example also demonstrates how to summarise the quote without simply repeating what it says. The reader has already read the quote, which is annotated to highlight the deictic expressions. The text after it exemplifies the opening point about “the bidirectional nature” of this exchange, by using terms such as “responds”, “confirms”, “ratifies” and “back and forth” in the explanation of what’s going on in the example.
한 요점을 뒷받침하기 위해 여러 개의 인용문을 사용하는 것은 피해야 합니다. 여러 인용구를 사용하는 편이 더 좋은 경우는 단 하나의 인용구만으로는 정당하지 않은 층위나 뉘앙스가 있을 때 뿐이다 Using multiple quotations to support a single point should be avoided. More is only better when there are layers or nuances that a single quote doesn’t do justice to.
웰니스(Wellness)는 참가자들에게는 미묘한 아이디어였습니다. Wellness was a nuanced idea for our participants:
"걸어다니는 좀비가 되지 않기 위해 규칙적으로 먹고, 잠을 자는 것." (P2) “Eating regularly, getting some sleep, so that you’re not a walking zombie.” (P2)
"건강하지 않을 때, 불안하거나 우울할 때, 인간관계가 고통받고 있을 때, 곁에 있을 수 없다는 것을 깨닫는다."(P11) “Recognising when you’re not well, you’re anxious or depressed, your relationships are suffering, you’re impossible to be around.” (P11)
"기본적인 행복이요, 제게 더 이상 기쁨이 없는 것처럼요? '나는 임상적으로 우울하다'가 아니라 '나는 내 작품에 더 이상 없을 뿐이다.' (P12) “Basic happiness, like is there any joy in this anymore for me? Not, ‘I’m clinically depressed’ but sort of, ‘I’m just not present in my work anymore.’” (P12)
"미묘한 아이디어"라는 표현이 독자에게 여러 인용문이 이러한 뉘앙스를 보여주기 위한 것임을 경고하지만, 이 예는 독자로 하여금 [인용문 사이의 (비어있는) 공간을 스케치를 하도록] 만든다. 다음과 같이 바꾸는 것이 수사적으로 더 효과적이다. While “nuanced idea” alerts the reader that the multiple quotes are intended to demonstrate this nuance, this example makes the reader do the work of sketching in the space between the quotes. The following revision is more rhetorically effective.
웰니스(Wellness)는 우리의 참가자들에게는 미묘한 아이디어였다. 많은 이들이 "걸어다니는 좀비가 되지 않기 위해 규칙적으로 먹고, 잠을 자는 것"의 중요성을 인정하는 가운데, 참가자들의 설명에서 신체 건강의 차원이 두드러졌다(P2). 정신건강도 특히 "건강이 좋지 않을 때, 불안하거나 우울할 때, 인간관계가 고통받고 있을 때, 곁에 있을 수 없을 때" (P11)에 대해 논의했습니다. 건강은 또한 신체적, 정신적 건강에 대한 전통적인 개념을 넘어 "기본적인 행복, 나에게 더 이상 기쁨이 없는가?"라는 질문으로까지 확장됩니다. '나는 임상적으로 우울하다'가 아니라 '나는 더 이상 내 일에 있지 않을 뿐이다' (P12). Wellness was a nuanced idea for our participants. Dimensions of physical health were prominent in participants’ explanations, with many acknowledging the importance of “eating regularly, getting some sleep, so that you’re not a walking zombie” (P2). Mental health was also discussed, in particular “recognising when you’re not well, you’re anxious or depressed, your relationships are suffering, you’re impossible to be around” (P11). And wellness was also understood to extend beyond the conventional notions of physical and mental health, into questions of “basic happiness, like is there any joy in this anymore for me? Not, ‘I’m clinically depressed’ but sort of, ‘I’m just not present in my work anymore’” (P12).
이 버전에서 작가는 독자를 위한 이 세 인용구 사이의 관계를 설정하면서 '물리적', '정신적', '그 너머'를 명시적으로 명명한다. In this version, the writer explicitly names “physical”, “mental” and “beyond” as they establish the relations between these three quotes for the reader.
우리가 논의할 마지막 예는 결과를 설명하기 위해 복합 내러티브를 사용하는 것입니다. 복합 서술은 여러 인터뷰나 관찰로부터 얻은 데이터를 사용하여 하나의 상세한 이야기를 들려준다.복합 내러티브는 인용구가 아니다; 그것들은 구성이고, 따라서 작가들에게 상당한 수준의 수사적 통제를 제공한다. 그것들을 효과적으로 사용하기 위해서, 작가들은 그 구성 요소들이 무엇을 나타내는지 그리고 발견을 설명하기 위해 어떻게 사용되는지를 설명하면서 독자들의 방향을 잡아야 한다. 다음 단락은 그러한 지향성이 어떻게 보일 수 있는지를 보여준다. The final example we will discuss is the use of composite narratives to illustrate your results. A composite narrative uses data from multiple interviews or observations to tell a single, elaborated story. Composite narratives are not quotations; they are constructions and, thus, offer writers a significant degree of rhetorical control. To use them effectively, writers must orient readers, explaining what the composites represent and how they are used to illustrate findings. The following paragraph illustrates how such orienting might look.
데이터 분석 결과를 바탕으로 3가지 복합 내러티브가 생성되었는데, 참가자들의 3가지 구분된 그룹 각각에 대해, GP 교육을 마친 직후 학문적 역할에 입문한 GP들이 전임 임상을 원하지 않는다고 결정한 경험의 복합체인 '내러티브 1, '알렉스'l post; 교육이나 연구에 관심을 가지고 학문적 역할에 입문한 GP의 경험을 종합한 서사 2, '로빈', 그리고 경력 중후반에 학계에 입문한 GP의 경험을 종합한 서사 3, '조'로, 임상 실습에 대한 대안을 모색하고 있다.무식한 일 경험이 스스로 식별된 성별 범주를 넘나들었다는 것을 반영하여, 이러한 서술에 성 중립적인 이름이 할당되었다. 연구 결과는 복합 서술에서 발췌한 것으로 설명된다. (McElhinney & Kennedy, 2021, 페이지 3) Based on the findings of the data analysis, three composite narratives were produced, one for each of the three distinct groups of participants identified: Narrative 1, ‘Alex’, a composite of the experiences of GPs who had entered an academic role immediately after completion of GP training, having decided that they did not want a full-time clinical post; Narrative 2, ‘Robin’, a synthesis of the experiences of GPs who entered an academic role mid-career, having been a GP partner, with an interest in education or research; and Narrative 3, ‘Jo’, synthesising the experiences of GPs who entered academia mid to late career, looking for an alternative to clinical practice to run in parallel to clinical work. Gender-neutral names were assigned to these narratives, reflecting that the experiences crossed self-identified gender categories. The findings are illustrated with excerpts from the composite narratives. (McElhinney & Kennedy, 2021, p. 3)
Willis (2019)에 따르면, 복합 내러티브은 세 가지 주요 이점을 제공한다:
원자적인 범주나 주제보다 복잡하고, 위치된 설명을 제공한다;
익명성을 보장한다;
효용성과 접근성을 극대화할 수 있다. 특히 학계 밖의 독자들을 위한 질적 연구 결과.
필자는 복합물이 주요 데이터의 톤과 내용에 충실하도록 보장해야 하며 복합 서사를 작성하기 위한 적절한 절차를 따라야 한다. 그들의 결과를 설명하기 위해 복합 사례를 시도하는 데 관심이 있는 저자들의 경우, 아파르미안 외 연구진(2015)과 팩 외 연구진(2020)은 이 접근방식을 사용하는 두 가지 다른 방법을 보여준다.
According to Willis (2019), composite narratives offer three main advantages:
they present complex, situated accounts rather than atomistic categories or themes;
they ensure anonymity; and
they may maximise the utility and accessibility of qualitative findings, particularly for readers outside academia.
Their main limitation relates to authenticity—the writer must ensure that the composite is faithful to the tone and content of the primary data and should follow appropriate procedures for creating their composite narrative. For writers interested in trying a composite case to illustrate their results, Apramian et al. (2015) and Pack et al. (2020) demonstrate two different ways of employing this approach.
복잡성의 인정 An acknowledgement of complexity
우리는 효과적인 질적 결과 섹션의 작성을 안내하는 데 도움이 되는 세 가지 원칙을 제시했습니다: 스토리텔링, 진실성 및 논쟁. 이러한 원칙들을 고정된 규칙으로 보아서는 안 된다. 많은 요인들이 이러한 요인들이 어떻게 적용될 수 있는지에 영향을 미칩니다. 연구 방법론은 중요하다. 예를 들어, 서술적 탐구, 구성주의 기반 이론 및 비판적 담론 분석은 각자 바람직한 방식이 다를 것이다. 저널도 중요합니다. 많은 경우 이러한 원칙을 성공적으로 적용하는 방법을 이해하려면 반드시 참조해야 할 저자 지침이 있습니다.
We have offered three principles to help guide the writing of an effective qualitative results section: storytelling, authenticity and argument. These principles should not be viewed as static rules. A number of factors influence how they might be applied. Research methodology matters; for example, narrative inquiry, constructivist grounded theory and critical discourse analysis will look—and sound—distinct. The journal also matters. Many have author guidelines you should consult to understand how to adapt these principles successfully.
마지막으로, 역사는 중요합니다. 질적 연구가 정당성을 얻으면서 우리 분야의 관습이 변화하고 있다. 방법론적 용어가 변화하고 있는 것처럼(Varpio 등, 2017) 결과를 제시하는 관례도 변화하고 있다. 이 원고를 작성하면서 우리의 논문을 되돌아보면서, 우리는 우리의 접근 방식의 변화를 깨달았다. 예를 들어, 우리는 각 주제 범주의 인스턴스 수를 열거하는 테이블을 더 이상 거의 사용하지 않는다(Lingard, 2004). 그러나 20년 전에는 데이터 코딩에 관련된 여러 연구자에 대한 평가자 간 신뢰도 계수를 포함시키는 것이 흔한 일이었다. 따라서 이러한 원칙을 지침으로 사용하고, 설득력 있는 질적 결과 섹션을 만들 때 수사적 상황에 주의를 기울이십시오.
Finally, history matters. Conventions in our field are changing over time as qualitative research gains legitimacy. Just as methodological terms are shifting (Varpio et al., 2017), so too are conventions for presenting results. Looking back at our papers in the writing of this manuscript, we realised shifts in our own approaches. For instance, we rarely use tables enumerating the number of instances of each thematic category (Lingard, 2004) anymore, but that was commonplace 20 years ago, as were inter-rater reliability coefficients for multiple researchers involved in coding data. So use these principles as a guide, and stay attentive to your rhetorical situation as you work to craft a compelling qualitative results section.
Abstract
Writing an effective qualitative results section can be a daunting task. How do you report the findings of the study and tell a compelling story? It is this delicate balance that we strive to navigate in this paper. We offer three principles—storytelling, authenticity and argument—to help writers envision the story they will tell, select the data as evidence for that story and integrate quotations to guide the reader’s interpretation. Practical advice and concrete illustrations make the principles easy to apply to your own writing. Finally, by reflecting on how historical, methodological and disciplinary elements shape their application, you will be able to use these principles to enhance the persuasiveness of your qualitative results section.
효과적인 문헌고찰 쓰기 파트2: 인용 테크닉(Perspect Med Educ, 2018) Writing an effective literature review Part II: Citation technique Lorelei Lingard1
이번 작가공예 편찬은 연구 원고의 문헌 검토 부분을 효과적으로 제시하기 위한 전략을 제공하는 2부작 시리즈 중 두 번째 작품이다. 이 글은 인용이 단순한 [기술적 실천]이 아니라 [수사적 실천]이라고 주장하며, 작가들에게 인용을 최대한 활용할 수 있는 [확장된 어휘]를 제공한다.
This Writer’s Craft instalment is the second in a two-part series that offers strategies for effectively presenting the literature review section of a research manuscript. This piece argues that citation is not just a technical practice but also a rhetorical one, and offers writers an expanded vocabulary for using citation to maximal effect.
많은 작가들은 인용을 표절을 피하고 다른 사람의 작품을 인정하기 위해 우리가 사용하는 공식적인 시스템으로 생각한다. 그러나 인용은 이것보다 훨씬 더 미묘한 관행이다. 인용은
지식의 원천을 대표할 뿐만 아니라
그 지식과 관련하여 우리 자신을 포지셔닝할 수 있게 해주고,
그 지식을 다른 지식과 연관시킬 수 있게 해줍니다.
Many writers think of citation as the formal system we use to avoid plagiarism and acknowledge others’ work. But citation is a much more nuanced practice than this. Not only does citation allow us
to represent the source of knowledge, but it also allows us
to position ourselves in relation to that knowledge, and
to place that knowledgein relation to other knowledge.
한마디로 인용은 연구를 프레이밍 하기 위해서, 문헌 검토 섹션을 작성할 때, 다음의 것을 예술적으로 이야기하는 방법이다.
이 분야에서 알려진 것이 무엇인지,
그 지식을 어떻게 알게 되었는지,
그것과 관련하여 우리가 어디에 서 있는지
In short, citation is how we artfully tell the story of
what the field knows,
how it came to that knowledge, and
where we stand in relation to it
as we write the literature review section to frame our own work.
이렇게 본다면, 인용은 한 영역의 문헌에 대한 심층적인 지식이 필요한 정교한 작업이다.
Seen this way, citation is a sophisticated task, requiring in-depth knowledge of the literature in a domain.
인용은 단순히 참고하는 것 그 이상이다. 그것은 우리가 한 분야에서 [지식의 사회적 구성]을 나타내는 방법이다. 인용 전략은 지식의 원천과 본질에 대한 텍스트의 표시이다. 모든 인용 전략이 이탤릭체로 표시된 다음 구절을 고려하십시오.
Citation is more than just referencing; it is how we represent the social construction of knowledge in a field. A citation strategy is any indication in the text about the source and nature of knowledge. Consider the following passage, in which all citation strategies are italicized:
긍정적인 직업 규범과 표준을 가르치고 시행하기 위한 수년간의 노력에도 불구하고, 의학 및 교육 문헌과 일반 언론에서 의학 전문직업성에 대한 도전에 대한 많은 보고가 계속 나오고 있다. 의료계에서는 직업적 실수의 예들이 도사리고 있다: 규제가 좌절되고, 기록이 위조되고, 환자들이 무시당하고, 동료들이 비난을 받는다. 의료계는 수많은 중요한 입장문에서 전문직업성이 무엇인지에 대한 감각을 분명히 밝혔다. 이러한 진술은 미국 내과 위원회(ABIM)의 프로젝트 프로페셔널리즘에 제시된 분류 체계와 같이 추상화된 원칙과 가치를 바탕으로 작성되는 경향이 있다. 중립성, 책임성, 우수성, 의무, 명예, 진실성 및 타인에 대한 존중.
(긴즈버그 외 연구진으로부터), 전문적 실수의 해부학적 구조 [1])
Despite years of effort to teach and enforce positive professional norms and standards, many reports of challenges to medical professionalism continue to appear, both in the medical and education literature and, often in reaction, in the lay press.1,2,3,4,5 Examples of professional lapses dot the health care landscape: regulations are thwarted, records are falsified, patients are ignored, colleagues are berated.2,4,6 The medical profession has articulated its sense of what professionalism is in a number of important position statements.7,8 These statements tend to be built upon abstracted principles and values, such as the taxonomy presented in the American Board of Internal Medicine’s (ABIM’s) Project Professionalism: altruism, accountability, excellence, duty, honour, integrity, and respect for others.7
(From Ginsburg et al., The anatomy of a professional lapse [1])
이 문장에서 참조 인용(밴쿠버 형식 위첨자 번호 형태)은 지식의 출처를 확인하기 위해 사용된다. 그러나 이 구절에는 단순한 언급 이상의 것이 있다. 인용 전략에는 다음의 것들을 특징짓는 기술 방식이 포함된다.
지식의 밀도('수많은 보고서')
시간적 패턴('계속해서 나타난다'),
다양한 기원('의료 및 교육 문헌 모두에서')
사회적 특성('종종 그 반응으로')
사회적 의미/중요성('중요한 입장 진술')
In this passage, citation as referencing (in the form of Vancouver format superscript numbers) is used to acknowledge the source of knowledge. There are more than just references in this passage, however. Citation strategies also include statements that characterize
the density of that knowledge (‘many reports’),
its temporal patterns (‘continue to appear’),
its diverse origins (‘both in the medical and education literature’),
its social nature (‘often in reaction’), and
its social import (‘important position statements’).
인용문은 당신이 읽은 어떤 것의 출처를 단순히 인정하는 것 이상이다. [인용]이란 [지식의 사회적 본성social nature]을 표현하는 방법이며, 여기에는 지식이 어디에서 왔고, 어떻게 토론되고 발전되어 왔으며, 세상에 어떠한 영향을 미치는지에 대한 것이 포함된다[2]. 만약 우리가 인용 전략을 모두 제거한다면, 이 구절은 [기껏해야 상식적으로 들리고, 최악의 경우 입증되지 않은 개인적인 의견]처럼 들린다. 다음처럼 말이다.
Citation does more than just acknowledge the source of something you’ve read. It is how you represent the social nature of knowledge as coming from somewhere, being debated and developed, and having impact on the world [2]. If we remove all these citation strategies, the passage sounds at best like common sense or, at worst, like unsubstantiated personal opinion:
긍정적인 직업 규범과 표준을 가르치고 시행하기 위한 수년간의 노력에도 불구하고, 의료 전문성에 대한 도전은 계속되고 있다. 의료계에서는 직업적 실수의 예들이 도사리고 있다: 규제가 좌절되고, 기록이 위조되고, 환자들이 무시당하고, 동료들이 비난을 받는다. 전문성은 원칙과 가치의 집합이다: 이타주의, 책임감, 탁월함, 의무, 명예, 진실성, 타인에 대한 존중. Despite years of effort to teach and enforce positive professional norms and standards, challenges to medical professionalism continue. Examples of professional lapses dot the health care landscape: regulations are thwarted, records are falsified, patients are ignored, colleagues are berated. Professionalism is a set of principles and values: altruism, accountability, excellence, duty, honour, integrity, and respect for others.
아마도 여러분은 문헌 검토가 '객관적'이어야 한다는 말을 들었을 것이다. 즉, 여러분은 그것에 대한 입장을 취하지 않고 알려진 것을 단순히 제시해야 한다. 두 가지 이유로, 이것은 대체로 사실이 아니다. But perhaps you’ve been told that your literature review should be ‘objective’—that you should simply present what is known without taking a stance on it. This is largely untrue, for two reasons.
첫 번째 이유는 요약과 비판적 요약이 구별되기 때문이다. [요약]은 자료에 대한 중립적인 설명이지만, 잘 된 문헌 검토에는 순수한 요약이 거의 포함되어 있지 않다. 문헌을 검토하며 우리는 우리가 제시할 지식 주장의 품질, 출처 및 신뢰성을 판단하기 때문이다[3]. 이 과정에서 기존 지식을 요약할 뿐만 아니라, 이에 대한 입장을 제시하는 비판적 요약을 하게 된다
The first involves the distinction between summary and critical summary. A summary is a neutral description of material, but a good literature review contains very little pure summary because, as we review, we must also judge the quality, source and reliability of the knowledge claims we are presenting [3]. To do this, we engage incriticalsummary, not only summarizing existing knowledge but offering a stance on it.
두 번째 이유는 우리가 단순한 요약을 목표로 할 때 조차, [지식 주장에 대해 완전한 중립적 보고neutral presentation]를 한다는 것은 매우 어렵기 때문이다. 우리는 스스로도 깨닫지 못한 상태로 특정 입장을 취한다. 각 문장에서 동사가 해당 분야의 지식 주장의 요약에 어떻게 입장의 풍미를 더하는지 생각해 보십시오. The second reason is that, even when we’re aiming for simple summary, a completely neutral presentation of knowledge claims is very difficult to achieve. We take a stance in ways we hardly even notice. Consider how theverbin each of these statements adds a flavour of stance to what is otherwise a summary of a knowledge claim in the field:
앤더슨은 응급실에서 사용하기 위해 평가가 얼마나 시간이 많이 걸리는지를 설명한다.
앤더슨은 그 평가가 응급실에서 사용하기에는 너무 시간이 많이 걸린다는 것을 발견했다.
앤더슨은 그 평가가 응급실에서 사용하기에는 지나치게 시간이 많이 든다고 주장한다.
Andersondescribeshow the assessment is overly time-consuming for use in the Emergency Department.
Andersondiscoveredthat the assessment was overly time-consuming for use in the Emergency Department.
Andersonclaimsthat the assessment is overly time-consuming for use in the Emergency Department.
첫 번째 동사 'describes'는 중립적이다: 앤더슨이 이 분야에 기여한 지식에 대한 작가의 입장을 확인할 수 없다.
두 번째 동사 'discovered'은 작가 내에서의 소속감이나 긍정적인 입장을 표현한다
세 번째 동사 'claims'에서 작가는 앤더슨의 저술과 거리를 둔다.
The first verb, ‘describes’, is neutral: it is not possible to ascertain the writer’s stance on the knowledge Anderson has contributed to the field.
The second verb, ‘discovered’, expresses an affiliation or positive stance in the writer, while
the third verb, ‘claims’, distances the writer from Anderson’s work.
이처럼, 이렇게 간단한 요약 문장에도 [비판적 요약]의 풍미가 담겨 있다. 이것은 흠이 아니다. 오히려, 연구자가 자신과 논문을 포지셔닝 하게끔 [기존의 지식을 대화로 그려내는portraying 중요한 방법]이다. 하지만 그것은 의식적이고 전략적으로 이루어져야 합니다. 표 1은 작가들이 자신의 문헌에서 검토한 동사들이 그 분야의 기존 지식과 관련하여 어떻게 위치를 잡을 수 있는지를 생각할 수 있도록 예시를 제시한다. 의미는 문맥에 따라 달라지기에, 이러한 예는 지침으로만 채택되어야 한다. 예를 들어, 'suggests'은 중립적인 것 또는 거리를 두는 것으로 사용될 수 있다.
Even these brief summary sentences contain a flavour of critical summary. This is not a flaw; in fact, it is an important method of portraying existing knowledge as a conversation in which the writer is positioning herself and her work. But it should be done consciously and strategically. Tab. 1offers examples to help writers think about how the verbs in their literature review position them in relation to existing knowledge in the field. Meaning is subject to context and these examples should only be taken as a guide: e. g., ‘suggests’ can be used to signal neutrality or distancing.
보통 글을 쓸 때, 우리는 거의 무의식적으로 기본적으로 사용하는 좋아하는 동사(보고, 주장, 서술, 연구, 설명, 주장)가 있다. 하지만 이 동사들이 모두 대등한 것은 아니다. 그들은 [저자의 입장]뿐만 아니라, 지식을 창조한 [연구자의 입장]을 포함하여 [지식에 대한 조금씩 다른 입장]을 새긴다inscribe. [비판적 요약]에서 [원 저자의 입장]을 바르게 이해하는 것이 중요하다. 다른 사람의 문헌검토에서 나의 입장이 잘못 표현된 것을 보는 것만큼 짜증나는 것은 없다. 예를 들어, 만약 내가 새로운 아이디어에 대한 잠정적인 성찰을 제공하는 단락을 썼다면, 나는 '링가드가 제안했다'나 '링가드가 탐구했다'라고 기술되길 바라지, '링거드가 언쟁했다argue'라고 쓰여지길 원하지 않는다. Most of us have favourite verbs that we default to almost unconsciously when we are writing—reports, argues, describes, studies, explains, asserts—but these verbs are not interchangeable. They each inscribe a slightly different stance towards the knowledge—not only the writer’s stance, but also the stance of the researcher who created the knowledge. It is critical to get the original stance right in your critical summary. Nothing irritates me more than seeing my stance mispresented in someone else’s literature review. For example, if I wrote a paragraph offering tentative reflections on a new idea, I don’t want to see that summarized in someone’s literature review as ‘Lingard argues’, when more accurate would be ‘Lingard suggests’ or ‘Lingard explored’.
작가들은 [인용동사 라이브러리]를 확장해 자신이 속한 분야의 저자들이 발표한 지식 주장을 정확하고 설득력 있게 포지셔닝할 수 있도록 해야 한다. 어휘를 확장하는 데 도움이 되는 많은 온라인 리소스를 찾을 수 있습니다. [4]의 온라인 출처에서 가져온 표 2는 몇 가지 제안을 제공합니다. 이와 같은 표는 규칙이 아닌 도구로 간주해야 하며, 단어가 문맥과 목적에 따라 유연한 의미를 갖는다는 것을 명심해야 한다.제안했다suggest이나 결론지었다conclude과 같은 단어가 하나 이상의 목록에 나타날 수 있는 이유다. Writers need to extend their library of citation verbs to allow themselves to accurately and persuasively position knowledge claims published by authors in their field. You can find many online resources to help extend your vocabulary: Tab. 2, adapted from one such online source [4], provides some suggestions. Tables like these should be thought of as tools, not rules—keep in mind that words have flexible meanings depending on context and purpose. This is why one word, such assuggestorconclude, can appear in more than one list.
지식은 사회적 구성이며, 연구자들이 서로의 기여에 대해 토론하고, 확장하고, 다듬으면서 축적된다. 문헌 검토가 [단절된 '사실'의 세탁물 목록]처럼 읽히는 것을 피하려면, 어떤 동사를 사용하는지가 중요하다. 표 3은 검토되고 있는 지식 분야의 저자들 사이의 다른 관계를 반영하기 위해 구성된 동사 선택을 제공한다. Knowledge is a social construction and it accumulates as researchers debate, extend and refine one another’s contributions. To avoid your literature review reading like a laundry list of disconnected ‘facts’, reporting verbs are an important resource. Tab. 3offers a selection of verbs organized to reflect different relationships among authors in the field of knowledge being reviewed.
마지막으로, 이 글에서 인용 동사에 초점을 맞췄지만, 부사(예: 유사하게, 결과적으로)와 전치사 구(예: 이와 대조적으로, 추가로)역시 지식 주장 및 저자들 사이의 유사/대조/대응 관계를 표현하는 데 중요하다. Finally, although we have focused on citation verbs in this article, adverbs (e. g., similarly, consequently) and prepositional phrases (e. g., by contrast, in addition) are also important for expressing similar, contrasting or responding relations among knowledge claims and their authors in the field being reviewed.
요약하자면, 효과적인 문헌 검토는 기존의 지식을 요약할 뿐만 아니라, 특정 연구 영역에서 [진화하는 대화와 이해]를 묘사하기 위한 지식을 [비판적으로 제시]한다. 우리가 언제 요약하고 언제 비판적으로 요약하고 있는지 알아야 할 작가로서, 요약만으로도 소화되지 않은 '세상의 사실들'의 세탁물 목록처럼 읽히는 문학 리뷰를 만들 수 있다. 마지막으로, 작가는 검토되는 지식과 관련하여 자신과 인용하고 있는 저자를 포지셔닝하기 위해 인용 동사의 미묘한 힘에 주의를 기울일 필요가 있다. 'go-to' 동사의 목록을 넓히는 것은 우리의 글쓰기에 활력을 주고 강화하는 중요한 단계이다.
In summary, an effective literature review not only summarizes existing knowledge, it also critically presents that knowledge to depict an evolving conversation and understanding in a particular domain of study. As writers we need to know when we are summarizing and when we are critically summarizing—summary alone makes for a literature review that reads like a laundry list of undigested ‘facts-in-the-world’. Finally, writers need to attend to the subtle power of citation verbs to position themselves and the authors they are citing in relation to the knowledge being reviewed. Broadening our catalogue of ‘go-to’ verbs is an important step in enlivening and strengthening our writing.
Perspect Med Educ. 2018 Apr;7(2):133-135.
doi: 10.1007/s40037-018-0407-z.
Writing an effective literature review : Part II: Citation technique
효과적인 문헌고찰 쓰기 파트1: 매핑 더 갭 (Perspect Med Educ, 2018) Writing an effective literature review Part I: Mapping the gap Lorelei Lingard1
간격 매핑 Mapping the gap
논문에서 [문헌 리뷰] 섹션의 목적은 당신의 주제에 대해 알려진 것을 보고하는 것이 아닙니다. 그 목적은 알려지지 않은 것(학술적 글쓰기 학자 Janet Giltrow가 '지식적자knowledge deficit'라고 불렀던 것)을 식별하는 것이고, 이로써 연구 연구의 필요성을 확립하기 위해서이다[1]. 이전 Writer's Craft 편에서 [문제-갭-훅 휴리스틱]은 당신의 연구가 해결하고자 하는 문제, 그 문제에 대한 우리의 현재 지식의 차이, 그리고 그 차이가 중요한 이유에 대한 명확한 진술과 함께 당신의 논문을 여는 방법으로 소개되었다[2]. 이 글에서는 논문의 문헌 검토 섹션을 사용하여 문제-갭-훅의 갭 주장gap claim을 구성하고 특성화하는 방법을 설명합니다. '갭 매핑'이라는 비유는 기존 문헌에 대한 리뷰를 어떻게 선정하고 배열하여 독자들이 왜 당신의 연구가 이뤄져야 하는지, 그리고 그 결과가 왜 그 주제에 대해 이미 알려진 것에 대한 의미 있는 진보를 구성하는지 생각하는 방법이다.
The purpose of the literature review section of a manuscript is not to report what is known about your topic. The purpose is to identify what remainsunknown—what academic writing scholar Janet Giltrow has called the ‘knowledge deficit’—thus establishing the need for your research study [1]. In an earlier Writer’s Craft instalment, the Problem-Gap-Hook heuristic was introduced as a way of opening your paper with a clear statement of the problem that your work grapples with, the gap in our current knowledge about that problem, and the reason the gap matters [2]. This article explains how to use the literature review section of your paper to build and characterize the Gap claim in your Problem-Gap-Hook. The metaphor of ‘mapping the gap’ is a way of thinking about how to select and arrange your review of the existing literature so that readers can recognize why your research needed to be done, and why its results constitute a meaningful advance on what was already known about the topic.
많은 작가들은 문학평론에서 알려진 것을 묘사해야 한다는 것을 배웠다. 이 접근법의 문제점은 [세상의 사실들에 대한 세탁물 목록laundry list]만 만들어내어, 독자들에게 [현재의 연구가 다음 단계로 필요하다는 것]을 설득하지 못하는 수 있다는 것이다. 대신, 여러분의 문학 리뷰를 여러분의 [연구 영역의 지도에 그리는 것]으로 생각하세요: 여러분이 기존의 지식을 검토할 때, 여러분은 [지도의 일부]를 그리고 있지만, 여러분의 목표는 전체 지도를 완전히 칠하는 것으로 끝나는 것이 아닙니다. 그 말은 우리가 이 주제에 대해 더 이상 알아야 할 것이 없다는 뜻이고, 그것은 당신의 연구를 위한 여지를 남기지 않는다는 것을 의미합니다. 여러분이 결국 원하는 것은, [중요하다고 알려진 것들로 둘러싸인 채색된 틈새에서 아직 채색되지 않은 하얀 공간]을 강조하는 지도입니다. 이러한 방식으로 문헌 리뷰를 개념화하면 [알려진 것을 제시]하고 [알려지지 않은 것을 지적]하는 이중 목표를 달성하는 것을 보장하는 데 도움이 됩니다. Many writers have learned that the literature review should describe what is known. The trouble with this approach is that it can produce a laundry list of facts-in-the-world that does not persuade the reader that the current study is a necessary next step. Instead, think of your literature review as painting in a map of your research domain: as you review existing knowledge, you are painting in sections of the map, but your goal is not to end with the whole map fully painted. That would mean there is nothing more we need to know about the topic, and that leaves no room for your research. What you want to end up with is a map in which painted sections surround and emphasize a white space, a gap in what is known that matters. Conceptualizing your literature review this way helps to ensure that it achieves its dual goal: of presenting what is known and pointing out what is not
초보 연구원이나 대학원생에게 이것은 직관에 반하는 것처럼 보일 수 있다. 당신이 현존하는 문헌을 읽는 데 상당한 시간을 투자하셨기를 바라며, 당신이 당신의 주제에 대해 출판된 모든 것을 읽었다는 것을 증명하기를 충분히 열망합니다! 그러나 문학 리뷰 섹션에서 당신이 읽은 모든 문헌을 토해내지regurgitate 않도록 주의하라. 우선, 그것은 끔찍한 독서를 만드는 사실의 세탁물 목록을 만든다. 그러나 이러한 접근법을 피하는 다른 세 가지 이유가 있습니다.
첫째, 당신은 공간이 없습니다. 출판된 의학교육연구논문에서는 문학평가가 몇 단락에서 몇 페이지까지 상당히 짧기 때문에 읽은 내용을 모두 요약할 수는 없다.
둘째, 그러한 작성은 이미 개종자한 사람에게 설교하는 것과 같다. [진행 중인 학술적 대화]에 대한 기여로 논문에 접근한다면, [2] 문학 리뷰는 대화에서 "당신의" 차례가 왔을 때 그 대화가 informed and relevant하게끔 배치하는 데 필요한 측면만을 요약해야 합니다.
셋째, [관련성relevance의 핵심은 알려진 것의 갭]을 지적하는 것입니다. 이렇게 하려면 알려지지 않은 것을 식별하기 위한 명확한 목적을 위해 알려진 것을 요약합니다. 이렇게 보면, 문학평론은 독자에게 중력을 가하여, 당신이 그들을 위해 그린 [지식의 지도 위의 하얀 공간]으로 독자를 거침없이 이끌어야 한다. 그 하얀 공간은 당신의 연구가 채워주는 공간입니다.
To a novice researcher or graduate student, this may seem counterintuitive. Hopefully you have invested significant time in reading the existing literature, and you are understandably keen to demonstrate that you’ve read everything ever published about your topic! Be careful, though, not to use the literature review section to regurgitate all of your reading in manuscript form. For one thing, it creates a laundry list of facts that makes for horrible reading. But there are three other reasons for avoiding this approach.
First, you don’t have the space. In published medical education research papers, the literature review is quite short, ranging from a few paragraphs to a few pages, so you can’t summarize everything you’ve read.
Second, you’re preaching to the converted. If you approach your paper as a contribution to an ongoing scholarly conversation,[2] then your literature review should summarize just the aspects of that conversation that are required to situate your conversational turn as informed and relevant.
Third, the key to relevance is to point to a gap in what is known. To do so, you summarize what is known for the express purpose of identifying what is not known. Seen this way, the literature review should exert a gravitational pull on the reader, leading them inexorably to the white space on the map of knowledge you’ve painted for them. That white space is the space that your research fills.
지식 주장 Knowledge claims
작가들이 세탁물 목록을 넘어서는 데 있어, '지식 주장knowledge claims'이라는 개념은 유용할 수 있다. 지식 주장은 당신이 연구한 분야를 탐구해 온 연구자 공동체에 대한 이해의 증대를 보여주는 방법이다. 이것들은 밝혀지지 않은 사실들이 아니라, 주제에 대한 그들의 다른 방법론적 접근법과 학문분야적 접근법에 따라, [그 분야의 어떤 사람들은 동의할 수 있고 , 다른 사람은 동의하지 않을 수도 있는] [증분적 통찰력incremental insights]이다. 문헌 리뷰를 그 분야의 연구자들에 의해 만들어진 [지식 주장]의 이야기로 취급하는 것은 문학 리뷰의 가장 정교한 측면 중 하나인 [검토한 지식의 위치 파악locating]에 도움이 될 수 있다. 그것은 어디서 온 것인가? 무엇이 논의되고 있는가? 다양한 방법론이 축적되는 지식에 어떤 영향을 미칩니까? 기타 등등. To help writers move beyond the laundry list, the notion of ‘knowledge claims’ can be useful. A knowledge claim is a way of presenting the growing understanding of the community of researchers who have been exploring your topic. These are not disembodied facts, but rather incremental insights that some in the field may agree with and some may not, depending on their different methodological and disciplinary approaches to the topic. Treating the literature review as a story of the knowledge claims being made by researchers in the field can help writers with one of the most sophisticated aspects of a literature review—locating the knowledge being reviewed. Where does it come from? What is debated? How do different methodologies influence the knowledge being accumulated? And so on.
분산된 의료 팀워크에 대한 연구 논문의 문헌 검토 섹션에 대한 지식 주장(KC), 격차 및 후크의 다음 예를 고려해 보십시오. Consider this example of the knowledge claims (KC), Gap and Hook for the literature review section of a research paper on distributed healthcare teamwork:
KC: 팀 커뮤니케이션이 원활하지 않으면 오류가 발생할 수 있다는 것을 알고 있습니다. KC: We know that poor team communication can cause errors.
KC: 팀 훈련이 팀 커뮤니케이션 향상에 효과적일 수 있다는 것도 알고 있습니다. KC: And we know that team training can be effective in improving team communication.
KC: 이러한 지식은 건강 직업 교육 커리큘럼에 팀워크 훈련 원칙을 포함하려는 노력을 촉발시켰습니다. KC: This knowledge has prompted a push to incorporate teamwork training principles into health professions education curricula.
KC: 하지만 팀 트레이닝 연구에 대해 우리가 알고 있는 것은 대부분 같은 장소의colocated 팀 간의 연구를 통해 얻은 것입니다. 즉, 멤버들이 동일한 시공간에서 일하는 팀들. KC: However, most of what we know about team training research has come from research with co-located teams—i. e., teams whose members work together in time and space.
격차: 팀워크 훈련 원칙이 [구성원들이 비동기적으로 일하고 다른 장소에 분산되어 있는 팀]들에게 어떻게 적용되는지에 대해서는 거의 알려져 있지 않다. Gap: Little is known about how teamwork training principles would apply in distributed teams, whose members work asynchronously and are spread across different locations.
후크: 많은 보건의료 팀워크가 같은 장소에 존재co-located하기 보다는, 분산되어 있다는 것을 고려할 때, 우리가 [분산된 업무 상황]뿐만 아니라, [분산된 팀워크 훈련 원칙]을 만들기 전까지는 우리의 커리큘럼은 심각하게 부족할 것입니다. Hook: Given that much healthcare teamwork is distributed rather than co-located, our curricula will be severely lacking until we create refined teamwork training principles that reflect distributed as well as co-located work contexts.
이 예에서 설명하는 ['우리는 알고 있다…' 구조]는 초안 작성과 정리를 돕기 위한 템플릿입니다. 최종 버전에서, 당신의 지식 주장은 더 정교하게 표현될 것입니다. 예를 들어, '우리는 팀 커뮤니케이션 부실이 오류를 일으킬 수 있다는 것을 알고 있다'는 것은 '10년 이상의 환자 안전 연구를 통해 팀 커뮤니케이션 부실이 의료 오류의 지배적인 원인임을 입증했다'와 같은 것이 될 것이다. 그러나 이 간단한 지식 주장 템플릿은 문헌 검토의 단락에 대한 개요를 제공하며, 각 단락은 지식 주장을 설명하기 위한 자세한 증거를 제공합니다. 이 접근법을 사용하면, 문헌 검토의 단락 순서가 전략적이고 설득력이 있어, 독자를 본 연구의 관련성을 포지셔닝하는 [갭 주장gap claim]으로 이끌 수 있다. 이러한 지식 주장을 만들고 논리적으로 연결하며 그 속에 자신을 배치하기 위해 Graff와 Birkenstein의 '템플릿'에 대한 작은 핸드북을 적극 추천한다[3]. The ‘We know that …’ structure illustrated in this example is a template for helping you draft and organize. In your final version, your knowledge claims will be expressed with more sophistication. For instance, ‘We know that poor team communication can cause errors’ will become something like ‘Over a decade of patient safety research has demonstrated that poor team communication is the dominant cause of medical errors.’ This simple template of knowledge claims, though, provides an outline for the paragraphs in your literature review, each of which will provide detailed evidence to illustrate a knowledge claim. Using this approach, the order of the paragraphs in the literature review is strategic and persuasive, leading the reader to the gap claim that positions the relevance of the current study. To expand your vocabulary for creating such knowledge claims, linking them logically and positioning yourself amid them, I highly recommend Graff and Birkenstein’s little handbook of ‘templates’ [3].
여러분의 지식 주장을 정리하면서, 여러분은 또한 [잘 연구된 분야]의 격차를 지도화하려는 것인지, 아니면 상대적으로 [덜 연구된 분야]의 격차를 지도화하려는 것인지도 고려하고 싶을 것입니다. 수사적 도전은 각각의 경우에 다르다. 의학교육의 전문직업성처럼 연구가 잘 된 분야에서는, 갭의 존재를 보여주는 강력하고 명시적인 사례를 만들어야 한다. 독자들은 이 주제에 대해 듣는 것을 지겨워하고, 이 주제에 대해서는 더 많은 지식이 필요할 수 없다고 생각하고 싶은 유혹을 느낄지도 모른다. 지식 클레임을 나열하면 가장 효과적으로 정리하고 연구가 채우려는 빈 공간을 매핑하는 데 불필요한 지식 조각을 결정하는 데 도움이 됩니다. 이것은 당신이 관련 정보를 생략하는 것을 의미하지 않는다: 당신의 문헌 리뷰는 여전히 정확해야 한다. 그러나 모든 것을 포함할 수 없기 때문에, [가능한 지식 주장 중에서 신중하게 선택하는 것]은 일관성 있고 논증이 잘 된 문학 리뷰를 만들기 위해 필수적이다. As you organize your knowledge claims, you will also want to consider whether you are trying to map the gap in a well-studied field, or a relatively understudied one. The rhetorical challenge is different in each case. In a well-studied field, like professionalism in medical education, you must make a strong, explicit case for the existence of a gap. Readers may come to your paper tired of hearing about this topic and tempted to think we can’t possibly need more knowledge about it. Listing the knowledge claims can help you organize them most effectively and determine which pieces of knowledge may be unnecessary to map the white space your research attempts to fill. This does not mean that you leave out relevant information: your literature review must still be accurate. But, since you will not be able to include everything, selecting carefully among the possible knowledge claims is essential to producing a coherent, well-argued literature review.
격차 특징짓기 Characterizing the gap
당신이 그 차이를 확인했으면, 당신의 문학 리뷰는 그것을 특징지어야 한다. 어떤 갭을 발견하셨나요? 갭의 특성을 드러내는 방법은 여러 가지가 있지만, 그 중 일부는 다음과 같다. Once you’ve identified the gap, your literature review must characterize it. Whatkindof gap have you found? There are many ways to characterize a gap, but some of the more common include:
완전한 지식의 결여: '종적 통합 사무직과 의대생 학대 사이의 관계를 살펴본 사람은 아무도 없다'
학술적 취약 지점(종종 철학적 또는 방법론적 경향에 따른): '연구자들은 인지주의적 관점에서 x를 해석했지만, 인본주의적 관점은 무시했다' 또는 '우리는 전공의에 의해 자행되는 의학적 오류의 빈도를 조사했지만, 우리는 그러한 오류에 대한 그들의 주관적인 경험을 탐구하지 않았다.'
논란: '의학의 전문직업성에 대한 정의에 대해 의견이 일치하지 않는다…'
널리 퍼져있지만, 증명되지 않은 가정: '기술 영웅주의-기술이 팀워크를 일으키는 것을 해결할 것이다' - 는 문학에서 어디에나 존재하지만, 그 믿음은 무엇에 기반을 두고 있는가?'
a pure knowledge deficit—‘no one has looked at the relationship between longitudinal integrated clerkships and medical student abuse’
a shortcoming in the scholarship, often due to philosophical or methodological tendencies and oversights—‘scholars have interpreted x from a cognitivist perspective, but ignored the humanist perspective’ or ‘to date, we have surveyed the frequency of medical errors committed by residents, but we have not explored their subjective experience of such errors’
a controversy—‘scholars disagree on the definition of professionalism in medicine …’
a pervasive and unproven assumption—‘the theme of technological heroism—technology will solve what ails teamwork—is ubiquitous in the literature, but what is that belief based on?’
이러한 격차를 특징짓기 위해서는 문헌을 철저히 알아야 한다. 이는 각 논문을 개별적으로 이해하는 것 이상의 의미를 갖습니다. 각 논문을 다른 문서와 비교하여 배치하면서 읽어야. 이것은 당신이 논문을 읽는 동안 노트 필기 기술을 바꿀 것을 요구할 수 있다; 각 논문이 지식에 기여하는 것뿐만 아니라 [당신이 읽은 다른 논문]들과 어떻게 연관되는지, 그리고 어떤 종류의 갭을 시사하는지도 메모하라.
To characterize the kind of gap, you need to know the literature thoroughly. That means more than understanding each paper individually; you also need to be placing each paper in relation to others. This may require changing your note-taking technique while you’re reading; take notes on what each paper contributes to knowledge, but also on how it relates to other papers you’ve read, and what it suggests about the kind of gap that is emerging.
요약하자면, 당신의 문헌 리뷰는 단순히 알려진 것을 요약하기 보다는 격차를 지도화하는 것이라고 생각하세요. 그리고 여러분이 지도에 [그린 격차의 종류를 특징짓는 것]에 주의를 기울이세요. 이 전략은 당신의 문헌 검토를 사실의 목록이 아닌 설득력 있는 주장으로 만드는데 도움을 줄 수 있다. 그것은 독자가 더 이상 알아야 할 절박한 필요가 없다는 의식을 남길 정도로 알려진 것을 충분히 묘사하는 것의 위험성을 상기시켜 줄 수 있다. 그리고 그것은 여러분이 식별한 간격의 종류와 그것을 채우기 위해 사용할 연구 방법론 사이의 일관성을 확립하는 데 도움을 줄 수 있습니다.
In summary, think of your literature review as mapping the gap rather than simply summarizing the known. And pay attention to characterizing the kind of gap you’ve mapped. This strategy can help to make your literature review into a compelling argument rather than a list of facts. It can remind you of the danger of describing so fully what is known that the reader is left with the sense that there is no pressing need to know more. And it can help you to establish a coherence between the kind of gap you’ve identified and the study methodology you will use to fill it.
Perspect Med Educ. 2018 Feb;7(1):47-49.
doi: 10.1007/s40037-017-0401-x.
Writing an effective literature review : Part I: Mapping the gap
시스템 기반 의료 다시 생각하기: 졸업후교육의 구조적 역량, 건강 형평성, 사회적 책임(Acad Med, 2020) Reconsidering Systems-Based Practice: Advancing Structural Competency, Health Equity, and Social Responsibility in Graduate Medical Education Enrico G. Castillo, MD, MSHPM, Jessica Isom, MD, MPH, Katrina L. DeBonis, MD, Ayana Jordan, MD, PhD, Joel T. Braslow, MD, PhD, and Robert Rohrbaugh, MD
대학원 의학교육인증협의회(ACGME) 핵심역량 6개 중 불평등, 정의, 공동체, 소외, 취약, 소수라는 용어가 단 한 차례도 등장하지 않은 점은 충격적이다. 그럼에도 불구하고, [건강에 대한 사회적, 구조적 결정 요인(인종, 성별, 문화, 소득, 교육, 이민, 이웃 환경, 집단 효능, 제도적 관행, 경제력 및 공공 정책을 포함하되 이에 국한되지 않음)]은 모든 보건 서비스보다도 총체적으로 건강과 복지에 더 많이 기여한다.2-8 따라서 ACGME 역량은 이러한 사회적, 구조적 결정 요인을 이해하고, [인종, 계층, 성별, 기타 소외된 특성]에 따른 [체계적 불평등systemic inequalities]에 뿌리를 둔 건강 불평등을 근절하기 위해 지역사회 및 비건강관리 부문과 협력하는 의사의 교육에 우선순위를 두어야 한다. It is striking that among the 6 Accreditation Council for Graduate Medical Education (ACGME) core competencies, the terms disparities, inequities, justice, community, underserved, vulnerable, and minority do not appear once.1 Nevertheless, social and structural determinants of health—including but not limited to race, gender, culture, income, education, immigration, neighborhood environment, collective efficacy, institutional practices, economic forces, and public policies—collectively contribute more to health and well-being than the totality of health care services.2–8 Thus, the ACGME competencies should prioritize the training of physicians to understand these social and structural determinants and to work with communities and non-health care sectors to eradicate health inequities, which have their roots in systemic inequalities by race, class, gender, sexuality, and other marginalized characteristics.
시스템 기반 관행(SBP)은 ACGME 핵심 역량으로, 복잡한 시스템과 그 안에서 의사의 역할에 초점을 맞춘다. 우리는 다른 사람들과 마찬가지로 SBP 역량이 건강 불평등에 가장 많이 기여하는 근본적인 시스템 요소를 다루지 못한다고 주장한다.9 ACGME는 SBP를 "건강의 사회적 결정요인 및 최적의 건강관리를 제공하기 위해 다른 자원을 효과적으로 호출할 수 있는 능력을 포함한 더 큰 맥락과 의료 시스템에 대한 인식과 대응"으로 정의한다. 1 SBP는 환자 안전, 비용 억제, 생애 종료 목표, 기타 여러 주요 주제를 포함한다.10 그러나 [불평등한 미국 의료 환경에 대해서는 침묵]하고, 의사가 (이러한 환경을) 적극적으로 재구성하기 보다는, 이러한 환경 내에서 작동하게끔 준비시킨다. 따라서 SBP는 [자원이 부족하고 취약한 환자]보다는, [의료 시스템의 이익을 위해 일할 새로운 세대의 의사]를 준비할 위험이 있다. Systems-based practice (SBP) is the ACGME core competency that focuses on complex systems and physicians’ roles within them (see Table 1). We contend, as have others, that the SBP competency falls short of addressing the fundamental systemic factors that most contribute to health inequities.9 The ACGME defines SBP as “an awareness of and responsiveness to the larger context and system of health care, including the social determinants of health, as well as the ability to call effectively on other resources to provide optimal health care.”1 SBP encompasses multiple other major topics—patient safety, cost containment, end-of-life goals, and health care quality and quality improvement.10 However, it is silent regarding the inequitable U.S. health care landscape and prepares physicians to operate within this landscape rather than to actively reshape it. As a competency, then, SBP risks preparing a new generation of physicians to work for the benefit of health care systems rather than for underresourced and vulnerable patients.
ACGME가 마일스톤 2.0을 향해 작동함에 따라, 지금이 우리 직업에서 이러한 교육 체계를 재방문하고 의사가 의료 형평성을 개선하기 위해 계몽된 주체가 되도록 더 잘 훈련할 수 있는 방법을 고려할 수 있는 적절한 시기입니다. 이 관점에서는 ACGME SBP 역량의 역사와 오늘날의 사회 및 의료 현실에서의 단점을 설명하고, 구조적인 역량, 건강 형평성 및 사회적 책임으로 대학원 의료 교육 시스템을 재편할 수 있는 새로운 역량을 제안한다. As the ACGME works toward Milestones 2.0, this is an opportune time for our profession to revisit this educational rubric and consider how a new competency can better train physicians to be enlightened actors to improve health equity. In this Perspective, we describe the history of the ACGME SBP competency and its shortcomings in today’s social and health care realities, and we propose a new competency to reorient our graduate medical education system toward structural competency, health equity, and social responsibility.
SBP의 역사 A History of SBP
[1997-98년에 ACGME 성과 프로젝트]는 졸업후의학교육을 위한 6가지 핵심 교육 역량을 창출했다. In 1997–1998, the ACGME Outcomes Project generated 6 core educational competencies for graduate medical education:
문헌 검토는 일련의 구조화된 인터뷰, 포커스 그룹 및 의료 교육자(예: 프로그램 책임자, ACGME 위원회, 자문 그룹)와의 심의를 통해 13개의 초기 교육 영역을 개발하였고, 최종적으로는 6가지 역량으로 좁혀졌다. 이렇게 만들어진 역량은 1999년에 ACGME에 의해 채택되었다. Literature reviews informed the development of 13 initial educational domains, which were narrowed to these 6 competencies through a series of structured interviews, focus groups, and deliberations with medical educators (e.g., program directors, ACGME committees, advisory groups).11The resulting competencies were adopted by the ACGME in 1999.
이러한 핵심 역량은 전문적 발달의 중요한 시점에 전공의를 위한 훈련을 정의하여, 장기간 지속되는 기술과 의료행위의 패턴에 informing한다. Swing은 "일반 역량General Competencies은 의사 역량 및 훈련에서 의사의 교육을 위한 조직 원칙을 정의하기 위한 [공통 언어]가 되었다."라고 썼다. 이 핵심역량 작업을 주도한 Batalden and Leach는 더 나아가서 [SBP는 가치와 이데올로기를 형성하는 것]이라고 주장했다.
These core competencies define training for residents at a critical point in their professional development, informing long-lasting skills and practice patterns. Swing wrote, “The General Competencies have become the common language for defining physician competence and the organizing principles for [the] education of physicians in training.”11Batalden and Leach, leaders in shaping these core competencies, went further in describing SBP as creating values or ideology:
[공유된 가정]은 다양하고 느슨하게 결합된 문화를 하나로 묶어주는 [접착제]이다. 즉, 공동체가 스스로를 정의하고, 가치를 채택하고, 그것에 충실할 수 있게 한다. [시스템 언어]는 우리가 익숙한 가정 중 일부의 한계에 대해 새로운 대화와 주의를 환기시킨다.12 Shared assumptions are the glue that holds a diverse and loosely coupled culture together; they enable communities to define themselves, to adopt values, and to become faithful to them.… Systems language invites new conversations and attention to some of the limits of some of our familiar assumptions.12
SBP의 하위 역량은 크게 3가지로 나뉜다. Within SBP, subcompetencies fall into 3 major themes:
(1) 다학제적 건강 관리 팀 및 시스템 내에서 작업해야 한다.
(2) 의료 시스템 개선을 지지한다.
(3) 비용, 지불, 가치 고려사항을 환자 치료에 반영한다(표 1 참조).
(1) to work within multidisciplinary health care teams and systems;
(2) to advocate for health care system improvements; and
(3) to incorporate cost, payment, and value considerations into patient care (see Table 1).
ACGME는 [단독 진료의solo practitioner]라는 의료전문직에 대한 오래 된 이미지에서 벗어나, [점점 더 복잡해지는 시스템의 관리자steward라는 이미지]로 전환하고자 SBP를 역량으로 포함시켰다. 목표는 의사들이 다분야 의료 시스템을 이끌 수 있도록 "시스템의 언어"를 제공하는 것이었다. ACGME는 다음을 예상하였다. "미래의 전공의들은 그들이 환자를 대하는 것처럼, [시스템을 진단하고 치료]하며, 그들이 환자를 돌보는 시스템에 대처하고 싸우기 보다는, [시스템을 숙달하고 설계할 수 있도록] 사회화될 것입니다." 우리가 보기에, 이러한 "시스템 언어"와 SBP의 정의는 의사를 기존의 불평등 의료 환경으로 사회화시켰으며, 반대로 다른 대화는 소외시켰다. 그리고 소외된 주제로는 [건강 형평성]과 [의사의 사회적 책임]에 관한 것들이 있다. The ACGME included SBP as a competency explicitly to push the profession away from its long-held image of the solo practitioner toward that of a steward of the increasingly complex systems in which physicians were working.12The goal was to endow physicians with the “language of systems” to help them lead multidisciplinary health care systems.12The ACGME envisioned that: “residents of the future will diagnose and treat systems as they do patients and will be socialized to master and design rather than cope with and fight the systems in which they care for patients.”12This “language of systems” and the definition of SBP, we contend, socialize physicians into an existing inequitable health care landscape and marginalize other conversations—like those about health equity and physicians’ social responsibility.
의료 시스템의 경우, 의료 시스템별 For Health Care Systems, By Health Care Systems
SBP 역량이 답을 주지 않는 질문들이 있다(표 1 참조). 예를 들어
"양질의 환자 진료와 최적의 환자 진료 시스템"1의 목표가 상충될 경우 의사는 어떻게 해야 하는가?
"최적의 의료 시스템"1을 옹호하는 것이 건강 불평등을 악화시킨다면 어떻게 될까요?
"가치, 비용 인식, 제공 및 지불에 대한 고려사항"1이 취약한 인구에게 피해를 입힐 경우 어떻게 해야 합니까?
의료 분야 외부의 시스템 행위자로서 의사의 역할은 무엇입니까?
우리는 어떤 목적으로 그리고 누구의 이익을 위하여 의료 시스템을 최적화하고, 의사를 그들의 책임자로 세우는가?
The SBP competency invites questions that it does not answer (seeTable 1). For example,
what should physicians do if the goals of “quality patient care and optimal patient care systems”1 are in conflict?
What if advocacy for “optimal health care systems”1 worsens health inequities?
What if “considerations of value, cost awareness, delivery and payment”1 harm vulnerable populations?
What are physicians’ roles as systems actors outside the health care sector?
For what purpose and in whose interests are we in medicine optimizing systems and installing physicians as their stewards?
전공의와 전임의 단계의 SBP 커리큘럼은 [이러한 질문에 암묵적으로만 대답하는 방식으로] 구축되었으며, 이를 "윈-윈 상황"이라고 불렀다. 출판된 SBP 커리큘럼의 예시로는 다음과 같은 것이 있다.
병원 비용 절감을 위해 의사를 훈련시키고,
레지던트에게 환자에 대한 체크인, 코딩, 청구 작업 과제를 주고
비용절감에 대한 고려사항을 이환율 및 사망률 회의에 포함시킨다.16
Implicitly answering these questions, residencies and fellowships have created SBP curricula that generate financial gains for the health care systems in which they are embedded, termed a “win-win situation.”13Examples from published SBP curricula
task residents with checking in patients, coding, and billing for patient encounters15; and
incorporate cost cutting considerations into morbidity and mortality conferences.16
SBP 역량 내의 "비용 억제"라는 주제를 고려할 때, 일부에서는 의사가 환자의 재정적 고통을 유발할 수 있는 검사, 절차, 약물을 보류함으로써 "해치지 않아야 한다do no harm"고 옹호한다.17,18 현재의 SBP 커리큘럼은 의사에게 "최적의 의료 시스템"이란 [비용 절감] 및 [청구 가능한 단위의 생성]과 동의어라고 가르친다.
Considering the cost containment theme within the SBP competency, some advocate that physicians should “do no harm” by withholding tests, procedures, and medications that could cause patients financial distress.17,18These SBP curricula teach physicians that “optimal health care systems”1are synonymous with cost cutting and the generation of billable units.
지금과 같은 SBP 커리큘럼은 병원 시스템에 대한 [비용 억제]를 고려하지 않으며, [병원 시스템의 재정적 이득financial win]이 취약한 사람에게(그리고 심지어 그렇게 취약하지 않은 집단에게조차), 그리고 보험에 가입하지 못했거나 보험 수준이 낮은 집단에게 [돌봄에 대한 구조적 장벽]을 세울 수 있다는 것을 고려하지 않는다. 뿐만 아니라, 지금과 같은 SBP 커리큘럼은 환자의 재정적인 고통에 대한 [보다 실질적인 구조적 원인]들을 회피한다. 여기에는 불공정한 처방 의약품 가격 책정, 보편적 의료 서비스의 부재, 사회 서비스에 대한 불균형한 국가 지출, 보험 계획 및 지역에 따른 현금 부족 비용의 차이, 미국 시스템의 가격 투명성 결여로 인한 의료 경제의 계층적 복잡성 등이 있다.
Such curricula fail to consider that cost containment and financial wins for hospital systems can erect structural barriers to care for vulnerable (and even not so vulnerable) populations and for those who are uninsured or underinsured. Such lessons also avoid the more substantial structural causes of patients’ financial distress, like unfair prescription drug pricing, the absence of universal health care, disproportionate national expenditures on health care relative to social services, variations in out-of-pocket costs depending on insurance plans and geography, and the layered complexities of health care economics due to the absence of price transparency in the U.S. system.
캐나다, 영국 및 호주의 교육 역량과 달리, 미국의 SBP 커리큘럼은 건강 불평등의 근본적인 원인을 해결하기 위하여 [환자 및 정책 수준 advocacy에 관한 의사의 역할]을 다루지 않는다. Stammen과 동료들은 [비용을 민감하게 고려하는 진료cost-conscious care]에 대한 의사 교육 문헌을 체계적으로 검토하면서 다음과 같이 진술했다. "진료가치를 측정하는 것은 매우 복잡하지만, 진료의 양이나 비용에만 초점을 맞춘 결과 측정은 [저렴한 것이 더 좋은 것이다]라는 잘못된 가정을 조장할 수 있다." 의사들을 [건강과 보건의료에 영향을 미치는 사회적, 구조적 맥락]에 대하여 교육하지 않은 채로 [자원 관리인]이 되도록 훈련시킴으로써, 취약한 인구의 돌봄에 관한 제도적 장벽을 당연한 것으로 만들고, 의도치 않게 불평등을 악화시킬 가능성이 있다. Unlike educational competencies in Canada, the United Kingdom, and Australia, SBP curricula in the United States do not address physicians’ roles in patient- and policy-level advocacy to address these fundamental root causes of health inequities.19,20In their systematic review of the literature on physician trainings on cost-conscious care, Stammen and colleagues state that: “Although measuring the value of care is extremely complex, outcome measures that focus solely on volume or costs might promote the incorrect assumption that cheaper is better.”21By training physicians to be resource stewards without educating them in the social and structural contexts affecting health and health care, there is the potential for normalizing institutional barriers to care for vulnerable populations and inadvertently worsening inequities.
SBP에 관하여, 일부 전공과 또는 프로그램 및 교육자들은 취약계층에 초점을 맞추고 있다. 그러나 [비용 억제]와 [의료 중심 옹호healthcare centric advocacy]라는 하위 주제는 [소수자와 취약계층의 요구]와 상충할 수 있다. 의사들에게는 이러한 [자원의 한계에 도전]하고, [사회적 방치의 영향을 상쇄]할 수 있도록 의사들에게 옹호 기술advocacy skills을 가르칠 필요가 있다. Braveman은 건강 형평성을 추구하는 문제에 대해 썼다. 그는 "더 뿌리깊고 중차대한 과제는 윤리적 가치와 인권에 대한 냉소주의 및 이를 존중하지 않는 태도"라고 강조했다. 그녀는 계속해서 이렇게 말한다. Some specialties, programs, and educators have integrated a focus on vulnerable populations within SBP.22,23However, the subthemes of cost containment and health care–centric advocacy may be at odds with the needs of minority and vulnerable populations. Using the example of a program’s financial constraints affecting its ability to deliver services for underresourced populations, there is the need to teach physicians advocacy skills so they can challenge these resource limitations and counteract the effects of societal neglect. Braveman writes about the challenges of pursuing health equity, highlighting that “a more deeply rooted and daunting challenge is cynicism and lack of respect for ethical values and for human rights.”24She goes on to say that:
학문적 의학은 [건강 형평성]을 추구하는 데 중요한 역할을 할 수 있다. 그것은 규범을 설정하고 출판물이 널리 퍼질 수 있는 의대생, 그들의 담당의사, 연구 교수진의 가치와 태도를 형성하는 데 강력한 힘이다.24 Academic medicine can play an important role in pursuing health equity. It is a powerful force in setting norms and shaping the values and attitudes of medical students, their attending physicians, and research faculty whose publications may reach far and wide.24
현재는 의료 교육에서 우리에게 건강 형평성, 사회적 책임, 그리고 구조적 역량을 중심으로 역량을 키울 수 있는 기회를 제공합니다. The present affords us in medical education an opportunity to build competencies around health equity, social responsibility, and structural competency.
새로운 역량을 향하여: 구조적 역량, 건강 형평성 및 사회적 책임 Toward a New Competency: Structural Competency, Health Equity, and Social Responsibility
여기서는 구조적 역량(지식), 구조적 행동(기술), 사회적 책임(태도)의 세 가지 하위 주제로 대학원 의료 교육에 대한 새로운 역량을 제시한다(표 2 참조). [정책 구조]와 [의료 시스템]은 [공정한equitable 의료]를 제공하는 의사의 능력을 제한할 수 있다. 건강 형평성의 과정과 목표에 대한 헌신은 [건강 악화의 가장 큰 위험에 처한 사람들의 요구]를 우선하는 것을 수반한다.25 이러한 역량은 의사에게 [지역사회와 협력하고, 건강 및 사회적 불평등을 유발하는 제도 구조를 변화시키는 데 필요한 창의성]의 훈련을 장려할 것이다. 이러한 창의성은 다음 하위 역량에 기초할 것이다.
건강과 사회적 불평등,
지역사회 참여,
건강의 사회적 결정 요인, 그리고
건강에 영향을 미치는 경제, 정책 및 제도 구조
Here, we present a new competency for graduate medical education with 3 subthemes: structural competency (knowledge), structural action (skills), and social responsibility (attitudes) (seeTable 2). Policy structures and health care systems can limit physicians’ abilities to provide equitable care. A commitment to a process and goal of health equity entails prioritizing the needs of those at greatest risk of poor health.25This competency would encourage creativity in training physicians to partner with communities and to change institutional structures that drive health and social inequities. This creativity would be grounded in subcompetencies on the topics of
health and social inequities;
community engagement;
social determinants of health; and
the economic, policy, and institutional structures that influence health.
제안된 새로운 역량은 우리 전문직을 위하여 [건강 형평성]의 언어를 우선시한다.25 이것의 내용에 필요한 정보는 기존의 혁신적인 학부 및 대학원 의료 교육 교육학 및 공공 보건, 보건 서비스 연구 및 사회 의학 프레임워크로부터 얻어졌다. 하위 역량은 전공의가 직면하는 [일상적 과제]와 유사성을 가지고 있으며(Box 1), 프로그램 책임자가 이러한 새로운 역량을 커리큘럼에 통합하는 데 도움이 되도록, 최근 등장하는 교육적 이니셔티브 및 교육자원이 될 수 있는 문헌에 토대를 두고 있다. Our proposed new competency prioritizes the language of health equity for our profession.25Its content is informed by existing, innovative undergraduate and graduate medical education pedagogy and public health, health services research, and social medicine frameworks.4,19,26–48The subcompetencies have real-life analogues to the daily challenges that residents face (see Box 1) and are grounded in emerging educational initiatives (seeTable 2), a growing literature that could serve as a resource to help program directors incorporate this new competency into their curricula.4,19,26–48
Box 1
현재 6개의 ACGME 핵심역량 목록에 새로운 역량이 추가되면 이미 복잡해진 졸업후의학교육을 더 복잡하게 만들 것이 분명하다. 따라서 우리는 이 새로운 역량이 [확장된 SBP 역량]으로 실질적으로 통합될 수 있는지를 고려했습니다. SBP는 팀 기반 진료, 환자 안전, 비용 억제, 생애 종료 목표, 의료 품질 및 품질 개선과 같은 중요한 교육 주제를 포함한다. 현재의 SBP에다가 [구조적 역량]과 [건강 형평성]의 목표를 포함하도록 확장하면, 종종 자신과 상충되는 구조가 생성되어 ,효율화하기 보다는 혼란을 야기할 수 있다. 새로운 역량을 생성하는 것이 [SBP 역량의 기존 목표]와 구별되는 동시에, 필요한 균형을 제공하는 목표에 집중할 수 있게 한다. To be sure, adding a new competency to the current list of 6 ACGME core competencies would increase the already complex landscape of graduate medical education. We have considered whether this new competency could feasibly be incorporated into an expanded SBP competency. SBP encompasses important educational topics, such as team-based care, patient safety, cost containment, end-of-life goals, and health care quality and quality improvement. Expanding it to include the goals of structural competency and health equity would create a construct that would, at times, be at odds with itself, potentially causing confusion rather than streamlining efforts. Creating a new competency allows for a focus on the goals that are both distinct from and provide necessary balance to the existing goals of the SBP competency.
다양하고 포괄적인 인력의 채용과 유지를 강조하는 새로운 [ACGME 프로그램 공통 요구 사항]을 고려할 때, 지금이 이러한 새로운 역량을 만들 적기입니다.1 [다양성, 건강 격차, 건강 형평성, 사회 정의]라는 주제에 대한 전공의-주도 교육은 [전통적인 커리큘럼 내에서 충족되지 않아온 요구unmet need]를 드러낸다. 우리의 새로운 역량은 레지던트들과 동료들이 다양한 환자들과 지역사회에 더 잘 봉사할 수 있도록 준비시키는 것 외에도, 지금까지 역사적으로 의학계에서 과소대표되어온 소수 집단 훈련생들의 채용과 업무 만족도를 높일 수 있는 잠재력을 가지고 있다. 그리고 이는 암묵적 편견, 인종차별, 개인 이력, 특권과 같은 주제를 보다 비판적으로 반영하는 교육 환경을 조성함으로써 이룰 수 있다. Given the new ACGME Common Program Requirements emphasizing the recruitment and retention of a diverse and inclusive workforce, the time is right for this new competency.1Resident-led education on topics of diversity, health disparities, health equity, and social justice reveal an unmet need within traditional curricula. In addition to preparing residents and fellows to better serve diverse patients and communities, our new competency has the potential to enhance the recruitment and work satisfaction of trainees from minority groups historically underrepresented in medicine by creating educational environments that are more critically reflective of topics like implicit bias, racism, personal histories, and privilege, among others.49,50
현대 의료 서비스의 복잡성이 증가한다는 것을 인식하면서, SBP 역량을 개발한 초기 의도는 의사를 [단독 의사]의 사고방식에서 벗어나, [시스템이라는 공유된 언어]로 이동시키는 것이었다. 그러나, 우리의 의료 시스템이 사회와의 관계를 계산하고, 의사들은 건강과 사회적 불평등의 곡선을 구부리는 것bending the curves을 잘 해내지 못했으며, 우리는 우리의 교육 우선순위를 다시 전환해야 한다. 이 관점에서는, 우리의 대학원 의료 교육 시스템을 건강 형평성 쪽으로 재편하기 위한 중요한 구조적 변화를 나타내는 새로운 역량을 제안했다.
Recognizing the increasing complexity of modern health care, the original intention of the SBP competency was to move physicians away from the mentality of the solo practitioner and toward a shared language of systems. Now, however, as our health care system reckons with its relationship to society and physicians grapple with their roles in bending the curves of health and social inequities, we must shift our educational priorities again. In this Perspective, we proposed a new competency that would represent a critical structural change to realign our graduate medical education system toward health equity.
Acad Med. 2020 Dec;95(12):1817-1822.
doi: 10.1097/ACM.0000000000003559.
Reconsidering Systems-Based Practice: Advancing Structural Competency, Health Equity, and Social Responsibility in Graduate Medical Education
1E.G. Castillo is a psychiatrist, Los Angeles County Department of Mental Health, and assistant professor, Jane and Terry Semel Institute for Neuroscience and Human Behavior at UCLA, Center for Social Medicine and Humanities, Department of Psychiatry and Biobehavioral Sciences, David Geffen School of Medicine, University of California, Los Angeles, Los Angeles, California; ORCID: https://orcid.org/0000-0002-3807-1125.
2J. Isom is a community psychiatrist, Codman Square Health Center, Dorchester, Massachusetts.
3K.L. DeBonis is assistant professor, Jane and Terry Semel Institute for Neuroscience and Human Behavior at UCLA, Department of Psychiatry and Biobehavioral Sciences, David Geffen School of Medicine, University of California, Los Angeles, Los Angeles, California.
4A. Jordan is assistant professor, Department of Psychiatry, Yale School of Medicine, New Haven, Connecticut, and addiction psychiatrist, Community Mental Health Center, New Haven, Connecticut; ORCID: https://orcid.org/0000-0002-7850-8096.
5J.T. Braslow is professor, Jane and Terry Semel Institute for Neuroscience and Human Behavior at UCLA, Center for Social Medicine and Humanities, Department of Psychiatry and Biobehavioral Sciences, David Geffen School of Medicine, University of California, Los Angeles, Los Angeles, California.
Health inequities stem from systematic, pervasive social and structural forces. These forces marginalize populations and create the circumstances that disadvantage these groups, as reflected in differences in outcomes like life expectancy and infant mortality and in inequitable access to and delivery of health care resources. To help eradicate these inequities, physicians must understand racism, sexism, oppression, historical marginalization, power, privilege, and other sociopolitical and economic forces that sustain and create inequities. A new educational paradigm emphasizing the knowledge, skills, and attitudes to achieve health equity is needed.Systems-based practice is the graduate medical education core competency that focuses on complex systems and physicians' roles within them; it includes topics like multidisciplinary team-based care, patient safety, cost containment, end-of-life goals, and quality improvement. This competency, however, is largely health care centric and does not train physicians to engage with the complexities of the social and structural determinants of health or to partner with systems and communities that are outside health care.The authors propose a new core competency centered on health equity, social responsibility, and structural competency to address this gap in graduate medical education. For the development of this new competency, the authors draw on existing, innovative undergraduate and graduate medical pedagogy and public health, health services research, and social medicine frameworks. They describe how this new competency would inform graduate medical education and clinical care and encourage future physicians to engage in the work of health equity.
의학교육에서 학술연구경험에 대한 실재주의적 리뷰 (Med Educ, 2020) A realist review of scholarly experiences in medical education Marian Cornett1 | Claire Palermo1 | Megan J. Wallace2,3 | Basia Diug4 | Bernadette Ward5
1 소개 1 INTRODUCTION
지난 10년 동안 의과대학은 핵심 교육의 일부로 [연구 방법]과 [증거 기반 의학]을 점점 더 많이 통합해 왔다.1 수업을 통해 연구 방법을 가르치는 것 외에도, 수많은 기관들이 [학문적 경험]을 수용하고embrace 있다. 세계적으로, 학문적 경험은 기관마다 다르며 종종 학문적 위치, 학문적 프로젝트, 학문적 집중 또는 학문적 집중이라고 불린다. 우리는 '학술 경험scholarly experience'이라는 용어를 여러 의과대학에서 사용하는 다양한 용어를 포괄하기 위해 매우 중요한 용어로 사용해 왔다. 이러한 경험은 [독립적인 학습]을 육성하고, [핵심 연구 스킬을 개발하는 것]을 목표로 한다.1 연구 방법 훈련은 증거 기반 의학의 평생 실습을 가능하게 하고 학문적 또는 연구 활동적 임상의의 비율을 증가시키기 위한 의료진의 준비에 매우 중요한 것으로 인식되어 왔다. Over the last decade, medical schools have been increasingly incorporating research methods and evidence-based medicine as part of their core teaching.1In addition to teaching research methods via coursework, numerous institutions have embraced scholarly experiences.1,2Globally, scholarly experiences differ between institutions and are often termed, scholarly placements, scholarly projects, scholarly intensives or scholarly concentrations.1We have used the term ‘scholarly experiences’, as an over-arching term to encompass the various terminologies used by different medical schools. These experiences aim to foster independent learning and develop key research skills.1Research methods training has been recognised as critical for the preparation of the medical workforce to enable the lifelong practice of evidence-based medicine and to increase the proportion of scholarly or research-active clinicians.1,3
[학문 활동Scholarly activity]은 [특정 주제에 대한 상세하고 사려 깊은 조사]로 정의된다. [학문적 경험]은 학생들이 학문적 기술을 개발할 수 있도록 지원하는 광범위한 단기 및 장기 경험이다. 예를 들어, 여기에 포함되는 기술에는 한 분야에서 더 깊은 지식을 얻고, 새로운 지식을 창조하며, 학습 평가를 하고, 자기 주도 학습과 구술 및 문서 커뮤니케이션 기술을 습득 등이 있다.
Scholarly activity is defined as a detailed and a thoughtful examination of a subject.4Scholarly experiences describe a range of short- and long-term experiences that support students to develop scholarly skills, for example, gaining a greater depth of knowledge in a field, creating new knowledge, learning evaluation and, self-directed learning and oral and written communication skills.5
[학문적 경험]대한 접근법은 단일하지 않다.이들은 내용 및 학습 성과와 감독 상호작용이 다양하며 기간(몇 주에서 몇 년)을 포함한 다양한 특성을 가지고 있다.
일부 경험은 선택적 또는 자발적 경험에 비해 커리큘럼에 전념하는 시간이 필수적입니다.1 이러한 특성은 필요한 인프라 수준, 경험의 내용과 집중, 감독 준비 및 책임뿐만 아니라 커리큘럼 내의 위치에도 영향을 미칩니다. 예를 들어,
어떤 학생들은 그들의 학문적 경험을 위해 주제를 선택하고, 개별적으로 또는 그룹의 일부로서 경험에 참여한다.
일부 학문적 경험은 연구 (실험실 또는 임상)에만 초점을 맞춘다;
반면 어떤 학문적 경험의 범위는 더 넓어서, 공공 보건, 의료 교육, 문헌 검토, 커뮤니티 프로그램 등에 초점을 맞춘 경험을 포함한다.
Supervision arrangement에는 학술 연구 스텝, 멘토 또는 임상 감독관이 포함되며, 학생 지도감독에 대한 시간은 할당되기도 하고, 그렇지 않기도 한다.
There is no one singular approach to these experiences. They have varying characteristics, including duration (from a few weeks to several years),6,7with varying content and learning outcomes and supervisory interactions.8,9
Some experiences are compulsory with dedicated time in the curriculum versus elective or voluntary experiences.1 These characteristics affect the level of infrastructure required, the content and focus of the experience, supervision arrangements and responsibility, as well as the position within the curriculum. For example,
some students can choose the topic for their scholarly experience8, 9 and work individually or as part of a group.10
Some scholarly experiences remain solely focused on research (laboratory or clinical);
however, others have a broader scope and include experiences focussed on quality improvement, public health and medical education, literature reviews and community programmes.11
Supervision arrangements include academic research staff, mentors or clinical supervisors.12-14 with time allocated (or not) for student supervision.15, 16
의학에 대한 학문적 경험이 광범위한 활동을 포함하는 것으로 인정되지만, 현재까지 의대생 학문적 경험에 대한 연구는 주로 다음에 초점을 두고 있다.
연구 성과물(예: 동료 검토 출판물, 포스터, 컨퍼런스 프레젠테이션),
연구에 대한 관심/참여(예: 박사 등록)
학생들의 학술적 경험에 대한 만족감
While scholarly experiences in medicine are acknowledged as encompassing a broad range of activities,5to date, the research about medical student scholarly experiences has largely focused on
research outputs (eg peer-reviewed publications, posters, conference presentations),
subsequent interest/participation in research (eg PhD enrolments) or
student satisfaction with their scholarly experience.
2017년 학술적 경험에 대한 체계적인 검토는 내부 프로젝트 보고서를 완료하거나 공동저자/첫 번째 저자의 동료 검토 출판물, 교수진 및 국가 또는 국제 컨퍼런스에서 포스터 및 구두 프레젠테이션을 수행한 학생의 비율 측면에서 결과를 보고했다.1 학문적 경험이 [어떻게 학문적 기술을 쌓는지]에 대한 복잡성을 탐구하는 연구는 없었고, 학문적 경험이 어떻게 다양한 결과를 가져오고, 어떤 상황에서 어떤 결과로 이어지는지를 탐구하는 어떠한 증거도 없었다.
A 2017 systematic review of scholarly experiences reported outcomes in terms of the proportion of students who completed internal project reports or had co-authored/first-authored peer-reviewed publications, undertaken poster and oral presentations to faculty and at national or international conferences.1There has been no research exploring the complexities of how the scholarly experiences build scholarly skills nor has there been any evidence syntheses that explores how scholarly experiences lead to a range of outcomes and under what circumstances.
교육은 평가하기가 어렵기로 악명높다. [학문적 경험] 역시 그것이 구현되는 [다양한 설정과 구조와 결합되며, 시간의 경과에 따라 지속적으로 변화]하기 때문에, 본질적으로 [학습 목표 및 관련 학술적 성과물 달성과 관련된 특성]을 식별하기 어렵게 만들었다. Havnaer 등에 의해 개발된 로직 모델에 따르면
입력(시간, 돈, 시설, 장비 및 기술)이
활동(학생 학술 작업, 감독, 학사 감독, 관리자 지원)과 연관되어
산출물(학생 수, 시간 및 직원 시간)을 내고, 궁극적으로는
결과물(연구 지식, 기술, 태도, 행동과 학술적 결과물)을 만들어낸다.
Education is notoriously difficult to evaluate, and combined with the diverse settings and structures in which scholarly experiences are implemented, changes over time17have made it inherently difficult to rigorously identify the characteristics that are associated with achieving learning objectives and associated scholarly outputs. The logic model, developed by Havnaer et al,1suggests
inputs (time, money, facilities, equipment and technology) are associated with
outputs (student numbers, hours and staff time) and ultimately
outcomes (research knowledge, skills, attitudes, behaviours and scholarly outputs).
[학문적 경험]이 어떻게 [학문적 산출물]로 이어지는지를 설명하는 다른 문헌과 결합한다면, 이 로직 모델은 [학문적 경험의 평가에 정보를 제공하고, 이러한 요소들이 경험에서 어떻게 운영되는지, 그리고 학문적 경험 결과 달성에 미치는 영향을 탐구하기 위한] 예비 이론preliminary theory 이다. 중요한 다음 단계는, 로직 모델을 하나의 이론으로 검증하는 것이다.
Combined with other literature that describes scholarly experiences leading to scholarly outputs,2,5,18this logic model is a preliminary theory to inform evaluations of scholarly experiences, explore how these factors are operationalised across experiences and their influence on achieving scholarly experience outcomes. Testing the logic model as a theory is an important next step.
이 리뷰는 의대생들의 학문적 경험이 어떻게, 왜, 어떤 상황에서 결과를 도출하는지 이해하기 위해 현실주의 접근법을 사용하여 기존 문헌을 종합하는 것을 목표로 한다. 보다 구체적으로, 다음과 같은 질문에 답하고자 하였다.
의대생들의 학문적 경험은 왜, 어떻게, 어떤 상황에서 다양한 결과를 낳는가?
This review aims to synthesise existing literature using a realist approach to understand how, why and in what circumstances medical student scholarly experiences produce outcomes. More specifically, the review sought to answer the question:
‘Why, how and under which circumstances do medical student scholarly experiences produce a range of different outcomes?’
2 방법 2 METHODS
2.1 연구 설계 2.1 Study design
현실주의 검토인 연구 설계는 Pawson's five stages of realist review를 따랐다.
(a) 범위 명확화(개념 마이닝 및 이론 개발),
(b) 증거 검색,
(c) 연구 선택,
(d) 데이터 추출,
(e) 데이터 합성
보고는 RAMESES를 따랐다. The study design, a realist review, was guided by Pawson's five stages of realist review:
(a) clarifying scope (concept mining and theory development);
(b) searching for evidence;
(c) study selection;
(d) data extraction; and
(e) data synthesis,
19, 20 and was reported following the Realist and Meta-narrative Evidence Synthesis: Evolving Standards (RAMESES) for realist syntheses.21
검토에 대한 현실주의 접근법은 [복잡한 개입이 왜 작동하고 왜 작동하지 않는지 이해]하기 위해 문헌을 검토하는 체계적인 접근 방식을 취한다. 19 현실주의 접근법은 이론 주도적theory-driven이어서, 이론의 개발이 이 과정을 시작부분부터 가이드한다.
개입Intervention은 [메커니즘의 작용을 통해 결과를 이끌어내기 위해 제안된 프로그램 또는 실험]이며, 현실주의 접근 이론은 이러한 기본 메커니즘을 식별하고 설명하는 것을 목표로 한다. 개입과 기본 메커니즘 사이의 관계와 개입의 결과는 복잡하고 미묘한데 맥락적 변화에 민감하다.19
맥락Contexts은 물질적 자원과 사회적 구조 또는 특정 환경 내의 요소일 수 있다. 맥락은 또한 개입, 이해관계자 상호 관계, 제도적 준비 또는 더 넓은 문화적, 경제적 및 사회적 환경에 참여하는 개인을 지칭할 수 있다.
메커니즘Mechanism은 일반적으로 숨어있으며, 맥락적 변화에 민감하며, 특정 결과를 산출한다.22 성과와의 관계에 있어서 메커니즘은 성과를 일으킬 수도 있고, 그렇지 않을 수도 있다.
Realist approaches to reviews take a systematic approach to reviewing the literature to unpack and understand why complex interventions do or do not work.19 Realist approaches are theory-driven with theory development guiding the process from the outset, with data extraction and synthesis key aspects of theory refinement.
Interventions are the programme or experiment proposed to lead to outcomes through the action of mechanisms and theory of realist approaches aims to identify and explain these underlying mechanisms. The relationship between interventions and the underlying mechanisms and the outcomes of the intervention are complex, nuanced and sensitive to contextual variations.19
Contexts may be material resources and social structures or the elements within a particular setting.22 Context can also refer to individuals participating in an intervention, stakeholder interrelationships, institutional arrangements or wider cultural, economic and/or societal settings.23
Mechanisms are typically hidden, sensitive to contextual variations and produce certain outcomes.22 In their relationship to outcomes, mechanisms can either cause, or not, the outcome.24
결국, 현실주의 검토자들이 일차적으로 관심을 갖는 것은 [상황 (C), 메커니즘 (M), 결과 (O) 구성으로 알려진 개입, 맥락, 메커니즘 및 결과 사이의 관계]이다. 19 현실주의 합성은 이론을 다듬기 위해 CMO 구성 전반에 걸쳐 [데미-규칙성]이라고 불리는 패턴을 식별하는 것을 목표로 한다.
In the end, it is the relationships between interventions, context, mechanism and outcomes, otherwise known as Context (C), Mechanism (M), Outcome (O) configuration, that is of primary interest to realist reviewers.19 Realist syntheses aim to identify patterns, termed demi-regularities, across CMO configurations to refine the theory.
2.2 범위 명확화 2.2 Clarifying scope
인턴(1학년) 의사로 이어지는 의무compulsory 의대생 학구적 경험에 초점을 맞춘 연구만 포함됐다. [비필수Optional 연구 프로그램](예: 명예, 석사 또는 박사) MBBS/PhD, MBChB/PhD, MD/PhD 또는 대학원 의료교육(전공 수련 과정)은 자발적 프로젝트(의과대학 교육과정 바깥에서 진행되는 것)과 마찬가지로 제외되었다. [비필수이고 자발적인 학문적 기회에 참여하기로 선택한 학생]들은 의대생 전체 코호트와 다른 특성을 가질 가능성이 높으며, 이는 우리의 현실주의적 합성으로부터 결과를 편향시키거나 결과의 일반성을 제한할 수 있다. 학부(학교가 직접 운영)와 의학전문대학원(학사 학위 이후)의 연구가 포함되었다.
Only studies focusing on compulsory medical student scholarly experiences that lead to an internship (1st year) doctor were included. Optional research programmes (eg Honours, Masters or PhD (eg. MBBS/PhD, MBChB/PhD, MD/PhD) or post-graduate medical education (ie medical speciality training) were excluded, as were voluntary projects (outside of the medical curriculum). Students who select to participate in optional and voluntary scholarly opportunities are likely to have different characteristics from the entire cohort of medical students, which could bias the outcomes, or limit the generalisability of the outcomes, from our realist synthesis. Studies of both undergraduate (direct from school) and graduate (after initial degree) entry medical schools were included.
현실주의 접근법의 중심인 것처럼, 우리는 합성을 테스트하기 위해 문헌의 예비 분석에 기초한 초기 프로그램 이론initial programme theory을 개발했다. 이 이론은 Havnaer 등에 의해 개발된 논리 모델을 기반으로 개발되었으며 학문적 경험의 효과에 대한 다른 기존 리뷰에 의해 칭찬받았다. 이러한 리뷰를 바탕으로, 우리의 [초기 프로그램 이론]은
성과: 경험의 결과로 달성된 학문적/연구적 지식, 기술, 태도, 행동 및 프로젝트 성과물(포스터, 출판물, 프리젠테이션)의 개발로 정의했다.
이러한 검토를 바탕으로, 우리의 [초기 프로그램 이론]은 성과는 다음의 경우에 달성된다는 것이다.
맥락: 시간, 돈, 시설, 장비 및 기술 측면에서 연구 지원이 제공되고,
메카니즘: 학생들이 학술 활동에 참여하고, 양질의 감독, 교육 관리oversight, 관리자 지원 등이 있을 때,
As is central to realist approaches, we developed an initial programme theory based on preliminary analysis of the literature to test our synthesis. This theory was developed based on the logic model developed by Havnaer et al1and complimented by the other existing reviews of the effectiveness of scholarly experiences .2,18Based on these reviews, our initial programme theory defined
outcomes as the development of scholarly/research knowledge, skills, attitudes, behaviours and project outputs (eg posters, publications, presentations) that were achieved as a result of the experience.
Based on these reviews, our initial programme theory was that these outcomes were achieved
when research support is provided in terms of time, money, facilities, equipment and technology, proposed as contexts,
through students engaging in scholarly work, with quality supervision, academic oversight, administrator support, proposed as mechanisms.
2.3 증거검색 2.3 Searching for evidence
2.4 스터디 선택 2.4 Study selection
2.5 데이터 추출 2.5 Data extraction
세 명의 저자가 데이터 추출에 참여했다. 데이터 추출 표를 만들었고, 여기에는 다음을 포함하였다.
연구 특성(예: 저자, 출판 연도, 연구 방법론),
맥락,
학문적 경험 또는 개입의 세부 사항: 이론, 메커니즘, 결과 및 CMO 구성을 포함한
Three authors were involved in data extraction. A data extraction table whereby
study characteristics (eg author, publication year, study methodology),
contexts,
details of scholarly experiences or intervention including any theory, mechanisms, outcomes and any CMO configurations
처음에는 데이터가 풍부한 5개 연구에서 데이터를 추출하여 이 추출 표를 시험해 본 후 경미한 수정이 이루어졌고 나머지 연구가 완료되었다. 그런 다음 나머지 연구의 데이터를 이 표를 사용하여 중복 추출했다.
...was created. Initially, data from five data-rich studies were extracted to trial this extraction table after which minor modifications were made and the remaining studies completed. Data from the remaining studies were then extracted in duplicate using this table.
2.6 데이터 합성 2.6 Data synthesis
28개 연구와 22개 학문적 경험의 데이터는 36개의 CMO 구성뿐만 아니라 C, M, O에 걸친 패턴에 대해 조사되었다. 우리는 더 빈번한 패턴을 식별하기 위해 CMO 구성에 걸쳐 C-M과 M-O의 일관성을 찾았다. 또한 초기 프로그램 이론과 구성이 어떻게 관련되는지도 고려했습니다. 흔하게 사용되지 않는 CMO 구성은 수정된 프로그램 이론의 개발을 지원하기 위해 사용되지 않았다. [CMO 구성 패턴]을 식별하고 초안을 작성하였다. 이러한 구성 패턴은 [초기 프로그램 이론]과 비교하였고, 차이가 무엇인지 검토하였고(예: 상황 또는 메커니즘으로서의 돈), 현실주의 방법에 기반한 토론을 하여, [최종 CMO 구성 패턴]으로 합의되었다. 수정된 프로그램 이론에 inform하기 위하여, 학문적 경험에 대해 설명하거나 발견을 설명하는 데 사용되는 모든 이론(중간 범위 이론)을 식별하였다. The data from all 28 studies and 22 scholarly experiences were then examined for patterns across C, M and O as well as the 36 CMO configurations. We looked for consistency of C-M and M-O across the CMO configurations with the aim of identifying more frequent patterns. We also considered how the configurations related to our initial programme theory. CMO configurations that were not common were not used to support the development of the modified programme theory. The identified CMO configuration patterns were drafted. These configuration patterns were then compared to the initial programme theory, differences noted (eg money as context or mechanism), debated based on realist methods, and final CMO configurations patterns agreed. Any theories used to inform the scholarly experience or explain the findings (mid-range theories) were identified for potential use to inform the modified programme theory.
3 결과 3 RESULTS
총 6294개의 레코드가 4개의 데이터베이스에 걸쳐 검색되었으며 중복이 제거되면 4590개의 레코드가 다운로드되었다. 참조 목록이나 Google Scholar 검색에서 식별된 추가 스터디는 없습니다. 초기 심사 후 75개 레코드의 전체 텍스트 검토가 완료되었고 47개 추가 논문이 제외되었다(그림 1). A total of 6294 records were retrieved across four databases, and once duplicates were removed, 4590 records were downloaded. No additional studies were identified from reference lists or from the Google Scholar search. After initial screening, full-text review of 75 records was completed and 47 additional papers excluded (Figure 1).
28개 연구의 22개 학문적 경험이 현실주의 검토에 포함되었다(표 S2). 10개(12개 논문)가 미국에서 왔고, 호주와 터키에서 각각 2개, 사우디 아라비아, 인도, 캐나다, 일본, 남아프리카, 스웨덴, 수단12, 네덜란드에서 각각 1개 논문이었다. 나머지 6개 연구는 혼합 방법, 감사, 35 사전 사후, 예비 코호트 또는 정성 설계를 포함한 다양한 접근방식을 적용했다.
Twenty-two scholarly experiences from 28 studies were included in the realist review (Table S2). Ten (12 articles) were from the USA,7,30two from each of Australia31,32and Turkey6,13and one from each of Saudi Arabia,15India,10,33Canada,9,34Japan,35South Africa,36Sweden,37-40Sudan12and the Netherlands.41Sixteen programmes (20 studies) used a cross-sectional study design.7,9-12,29-31,33,34,36-41The other six studies applied a variety of approaches including mixed methods,6,13audit,35pre-post,32prospective cohort14or qualitative35designs.
코호트 규모는 오클랜드 대학교 윌리엄 보몬트 의과대학의 47명에서 마스트리히트 대학교의 320명까지 다양하였으며, 학문적 경험의 역사는 1년에서 40년 이상이었다. 모든 학문적 경험은 학문적 경험의 이전이나 도중에 학문적 경험 내에서 가르치는 연구 방법을 통합했고, 모든 것은 학문적 경험으로서 연구 프로젝트를 포함했다. Cohort sizes ranging from 47 at Oakland University William Beaumont School of Medicine27to 320 at Maastricht University,41and the history of scholarly experiences ranged from 1 to 40+ years. All scholarly experiences integrated research methods teaching within the scholarly experiences, either before or during the scholarly experiences, and all involved a research project as the scholarly experience.
학문적 경험의 구성요소에 대한 만족도는 설문조사, 성찰적 비평, 인터뷰로 측정되었다.35 연구 지식과 기술의 발전은 자기 보고서 조사, 인터뷰, 성찰 또는 시험을 통해 측정되었다.10 데이터의 초점은 (감독관이나 의과대학이 아닌) 학생 경험에 있었다. 경험적 학습, 40 사회문화적 학습37, 38, 위치적 학습을 포함한 세 가지 학문적 경험만이 이론을 기술했다.32 Satisfaction with components of the scholarly experiences was measured by survey6,41and reflective critique8,40or interview.35The development of research knowledge and skills was measured by self-report survey, interviews, reflections7,9,17,27,32-35or by tests.10The focus of data was on student experiences, not supervisors or the medical school. Only three scholarly experiences described theories including experiential learning,40socio-cultural learning37,38and situated learning.32
합성을 통해 확인된 5가지 주요 구성 패턴이 있는 36개의 개별 CMO 구성(표 S2)은 다음과 같습니다.
Thirty-six individual CMO configurations (Table S2) with five main configuration patterns identified through the synthesis, as follows:
연구문화(맥락)가 잘 갖춰진 의과대학에서, 관련성이 있고 가치(메커니즘)가 있는 학문적 경험을 할 때, 이는 학생들이 다양한 연구능력에 대한 능력과 자신감을 키우는(결과)로 이어진다.
의과대학이 기관과 직원 모두에게 많은 배려regarded를 받는 학문적 경험(컨텍스트)을 가지고 있을 때, 잘 뒷받침되고 구조화된 학문적 경험(메커니즘)은 학생들에게 폭넓은 연구능력에 대한 능력과 자신감을 길러준다(결과물).
학생과 감독자 모두가 학문적 경험에 참여할 수 있는 충분한 시간(컨텍스트)이 주어지면, 양질의 감독(메커니즘)은 학생들이 프로젝트를 완료하고 학문적 산출물을 생산할 수 있는 능력(성과)을 향상시킨다.
학생과 감독자 모두가 학문적 경험에 참여할 수 있는 충분한 시간(컨텍스트)이 주어지면, 학생들이 연구 프로젝트를 완수할 수 있는 능력에 대해 지지와 자신감(자기효능감)을 느낄 때(메커니즘), 이는 학문적 산출물과 출판(성과)으로 이어진다.
의대생들이 자율성을 가지고, 흥미롭고 관련 있는 프로젝트를 선택할 수 있는 능력이 있을 때(맥락), 학문적 경험은 관련이 있고 가치 있는 것으로 여겨지며(메커니즘), 이는 연구에 대한 더 많은 관심과 추구(결과)로 이어진다.
When a medical school with a well-established research culture (context) has a scholarly experience that is seen as relevant and of value (mechanism), this leads to students developing ability and confidence in a wide range of research skills (outcome).
When a medical school has a scholarly experience that is highly regarded by both the institution and staff (context), a well-supported and structured scholarly experience (mechanism) leads to students developing ability and confidence in a wide range of research skills (outcome).
When adequate time is available for both students and supervisors to engage in scholarly experiences (context), quality supervision (mechanism) leads to students having enhanced ability to complete projects and produce scholarly outputs (outcome).
When adequate time is available for both students and supervisors to engage in scholarly experiences (context) and students feel supported and more confident in their capacity to complete research projects (self-efficacy) (mechanism), this leads to scholarly outputs and publications (outcome).
When medical students have the ability to choose projects that are interesting and relevant with autonomy (context), the scholarly experience is seen as relevant and of value (mechanism) and this leads to an interest in and pursuit of further research (outcome).
학술적 경험의 주요 성과는 다음으로 일관되게 보고되었다.
학술적 성과물(학술지에 원고를 출판하거나 컨퍼런스에서 발표)
미래 진로로서 연구에 대한 흥미
지식 및 기술 향상
어떤 연구도 학생 경험과 관련된 시스템 변화, 환자 또는 커뮤니티 결과를 보고하지 않았다. 핵심 메커니즘은 지원, 구조 및 감독에 대한 '자원resources'과 자기 효능감 및 연구를 관련있고 가치있게 여기는 '추론reasoning'이었다.
The key outcomes of the scholarly experiences were consistently reported as
scholarly outputs (publishing manuscripts in journals, or presenting at conferences),6, 38
interest in pursuing research in their future career8, 13, 14, 16, 17, 25-27, 29 and
increased research knowledge and skills.6, 32-34, 36, 39, 40
No studies reported any system change, patient or community outcomes linked to the student experience. The key mechanisms were ‘resources’ of support, structure and supervision and ‘reasoning’ being self-efficacy and seeing research as relevant and of value.
[맥락-기계 관계C-M relationship]에서, 세 가지 주요 특징은 지속적으로 긍정적인 결과로 이어졌다. 여기에는
보호된 시간,
양질의 슈퍼비전
학술경험 수행을 어떻게 할지에 대한 자율성 정도.
Across the range of contexts-mechanism relationships, three key features consistently led to positive outcomes. These included
the degree of autonomy in how the experience was carried out.9, 13, 15-17, 27, 31, 32, 34
양질의 슈퍼비전에는 독립적인 작업을 지도하고 감독하며 진행 상황을 모니터링하고 품질 피드백을 제공하는 똑똑한 지도교수knowledgeable supervisors가 포함되어 있다. 학생들이 다른 학위로부터의 연구 경험을 가지고 있거나 프로젝트를 수행하기에 시간이 충분하지 않아 연구 기술을 얻지 못하는 부정적인 결과를 가져온 연구는 단 한 가지뿐이었다.9
Quality supervision included having knowledgeable supervisors who guided and oversaw independent work, monitored progress and provided quality feedback. Only one study resulted negative outcomes where students did not gain research skills due to having previous experience in research from another degree or inadequate time to undertake the project.9
초기 프로그램 이론을 바탕으로, 우리는 다음과 같은 수정된 프로그램 이론을 우리의 발견을 종합하여 제안한다(그림 2). Building on our initial programme theory, we propose the following modified programme theory as a synthesis of our findings (Figure 2).
4 논의 4 DISCUSSION
이 연구는 의대생들의 학문적 경험이 다양한 결과를 낳는 이유, 방법, 상황에 대한 수정된 이론을 설명한다. 우리의 연구 결과는 학문적 경험이 연구별 기술, 연구 산출물 및 미래 연구 경력 관심사를 개발하는 수단으로 작용할 수 있다는 이전의 리뷰의 보고서와 일치한다. 이번 현실주의 검토는 [결과를 달성하기 위한 메커니즘]으로, 학생들이 [연구의 가치를 깨달아야 하며], [연구 자기효능감을 구축해야 할 필요성]을 강조하였고, 이는 학문적 경험이 효과적인 이유에 대한 [초기 프로그램 이론]에 추가되었다. 연구 문화를 조성하고, 학문적 경험을 중시하며, 학생들이 경험을 통해 어느 정도의 선택권을 행사할 수 있는 조직의 맥락에서 성과를 달성했다. 학문적 경험이 어떻게 작용하는지에 대한 이 수정된 이론은 의대생들을 위한 학문적 경험을 디자인하기를 원하는 사람들에게 중요한 학습을 제공한다.
This study describes a modified theory as to why, how and under which circumstances medical student scholarly experiences produce a range of different outcomes. Our finding are consistent with reports from earlier reviews1,2,18that scholarly experiences can act as a means to develop research-specific skills, research outputs and future research career interests. This realist review adds to our initial programme theory of why scholarly experiences are effective by highlighting the need for students to see the value of research and build research self-efficacy as mechanisms for achieving outcomes. Outcomes were achieved in contexts of organisations that foster a research culture, that value the scholarly experience and where students were able to exert some choice over the experience. This revised theory of how scholarly experiences work provides important learnings for those wishing to design scholarly experiences for medical students.
이러한 학문적 경험의 목표 범위를 고려할 때, '올바른' 커리큘럼 모델은 없는 것이 분명하다. 다양한 규모와 역사를 가진 국제 의과대학에 걸친 이러한 문헌을 종합하면, 학술적 경험은 [시간을 들여야]하며, 동시에 [학문적 경험과 양질의 지도감독을 위한 적절한 지원]이 필요함을 시사한다. 학생들의 일과 통합 학습 경험의 리뷰에서도 [시간]이 학습 성공의 핵심 요소인 것으로 나타났다.42 Given the range of objectives of these scholarly experiences, it is clear there is no ‘right’ curriculum model. This synthesis of literature across international medical schools of varied size and history1,2,18has shown that experiences must dedicate time together with adequate support for the scholarly experience and quality supervision. Time has also been shown to be a key factor in learning success in reviews of student work-integrated learning experiences.42
[양질의 지도감독quality supervision]이 연구 성공의 열쇠로 인정되지만, 우리의 연구 결과는 이전에 연구 감독에 대한 열쇠로 식별된 '문화화enculturation'와 '해방emancipation'의 역할을 강조한다.44 다른 맥락에서 양질의 지도감독자의 속성이 식별되었다.45 그러나, 성과를 더욱 향상시키기 위해서, 학문경험의 지도교수자들이 이 메커니즘을 어떻게 촉진할 수 있는가에 대한 추가 연구가 필요하다
While quality supervision is acknowledged as key to research success,43our findings highlight the role of ‘enculturation’ and ‘emancipation’ previously identified as key to research supervision.44The attributes of quality supervisors in other contexts have been identified.45However, how supervisors of scholarly experience curricula can foster these mechanisms to further enhance outcomes warrants further exploration.
현재까지 이 분야의 많은 연구는 [연구 출판물]과 [학생 만족도]를 포함한 학문적 경험의 결과에 초점을 맞추고 있다. 실제로, 이 합성에 포함된 대부분의 학술적 경험은 출판물과 같은 [전통적인 연구 성과]에 초점을 맞췄다. 출판물은 보조금을 신청하고 국제적인 인정을 받기 위해, 그리고 대학들이 국제 대학 순위를 높이기 위해 필요로 하는 높은 가치의 산출물이며, 이는 결국 양질의 직원과 학생들을 끌어들인다. 그러나 의료진의 관점에서는 [비판적, 분석적, 그리고 학문적 기술을 전문직업적 실천professional skill으로 번역translate할 수 있는 졸업생]을 양성하는 것 또한 중요하다.
To date, much of the research in this area has focused on the outcomes of scholarly experiences including research publications and student satisfaction. Indeed, most of the scholarly experiences included in this synthesis focussed on traditional research outputs such as publications. Publications are highly valued outputs required by researchers applying for grants and to gain international recognition and by universities to increase their international university rankings, which in turn attracts high-quality staff and students. However, from a medical workforce perspective, it is also important to develop graduates who can translate critical, analytical and scholarly skills into professional practice.46
전 세계적으로 [학문적 경험]을 포함하는 의과대학이 늘어나고 있고, 이는 의과대학생들이 의학 연구 환경에 노출될 기회를 제공한다. 이를 통해서 학생들의 연구 기술 능력과 자신감을 향상시키고, 연구에 대한 관심이 높아지며, 궁극적으로는 의사-과학자의 부족을 해결할 수 있는 잠재력을 가지고 있다. 다만, 이미 과밀화된 의과대학 커리큘럼에서 무엇을 우선순위에 둘 것인지를 놓고 긴장이 존재한다. 학문적 경험을 이수하는 것이 임상 술기 연습과 같은 다른 콘텐츠에 전념할 수 있는 능력을 축소시키기 때문이다. 개념-기반 커리큘럼은 나아가야 할 방법이 될 수 있다.47
The inclusion of scholarly experiences globally provides the opportunity for medical students to have exposure to the medical research environment, to increase students ability and confidence in research skills and interest in research, which in turn, has the potential to address the shortage of clinician-scientists.1,2Tensions exist for priorities in already overcrowded medical school curricula regarding completing a scholarly experience as it reduces the ability to devote to other content such as practicing clinical skills. A concept-based curriculum approach may be a way forward.47
이 합성에서 검토된 모든 학문적 경험 프로그램은 [연구research]에 초점을 맞췄다.
두 개의 경험은 지역사회 건강 요구에 기반한 연구 관련 프로젝트였지만 여전히 연구에 초점을 맞추고 있었다.
이러한 지역사회 기반 경험의 성과는 연구 기술과 컨퍼런스 프레젠테이션 또는 간행물 개발에 초점이 맞춰져 있었지만, 정책 및 관행의 변화와 같은 임상적으로 중요한 다른 결과도 도출할 수 있었다. 그러나 이들은 보고되지 않았다.
All the scholarly experience programmes reviewed in this synthesis were focussed on research.
Two experiences11, 32 were research-related projects based on community health needs but still had a research focus. While the focus of outcomes of these community-based experiences was on developing research skills and conference presentations or publications, they could have also resulted in other clinically important outcomes such as changes to policy and practice; however, these were not reported.
많은 의료 전문분야에서, [지속적인 등록]은 의료인이 [자신의 의료행위 및 근무중인 시스템]의 [질 보증 및 질 개선 활동]을 수행하는 것에 달려 있다. 따라서 의료 훈련의 관점에서, 학생들을 [임상적 실천의 개선으로 이어지는 질 보증이나 질 개선 방법론에 대해 훈련]시키고, [교육 개선으로 이어지는 활동]을 다루는 [학술적 경험]은 전통적인 연구 결과만큼 높게 평가되어야 한다. 이러한 종류의 경험에 참여하는 것이 연구 경험이 미래 연구에 대한 참여 욕구를 증가시키는 것과 유사한 방식으로 질 향상/교육 활동에 참여하고 싶은 욕구를 증가시켰는지도 명확하지 않다. 우리는 학문적 경험에 대한 향후 평가가 그러한 활동의 결과에 대한 별도의 분석을 포함할 것을 권고한다. 우리의 리뷰에서 주목할 만한 또 다른 gap은, 학생들이 이러한 경험을 수행하는 과정에서 발생하는 [부정적인 결과] 및 [감독관, 의과대학, 보건의료서비스 관점에서의 성과 측정]이 부족하다는 점이었다. 의대생 학문적 경험이 [다른 이해관계자들에게 미치는 영향]과 [어떤 메커니즘이 부정적인 결과를 유발하는지]를 탐구하기 위해 추가 연구가 필요하다.
In many medical specialties, continuing registration is dependent upon the clinician undertaking quality assurance and improvement activities of their own practice and of the system within which they work.48From a medical training perspective therefore, scholarly experiences that train students in quality assurance or improvement methodologies and lead to improvements in clinical practice, or activities that lead to educational improvements, should be valued just as highly as traditional research outputs. It was also not clear whether participation in those sorts of experiences created an increased desire to be involved in quality improvement/educational activities in a similar way that the research experiences increased the desire for engagement in future research. We recommend that future evaluations of scholarly experiences include a separate analysis of the outcomes from those activities. The other notable gap in the literature that would have been valuable in our review was a lack of negative outcomes and measurement of outcomes for supervisors, medical schools and the health services where the students are undertaking these experiences. Further research is needed to explore the impact of medical student scholarly experiences on these other stakeholders and what mechanism trigger negative outcomes.
이 연구의 강점은 체계적인 문헌 탐색입니다. 포함된 연구는 대부분 단면적이고, 편의성 샘플링을 사용하고, 결과를 자체 보고했으며, 맥락과 메커니즘에 대한 제한된 설명 깊이를 포함하고, 중간 범위 이론이 부족하여 잠재적으로 학문적 결과를 산출하기 위한 인과 경로에 대한 더 깊은 이해를 방해했다. 중간 범위 이론(예: 경험 학습 이론 또는 변혁 학습 이론)의 사용은 이러한 [초기 프로그램 이론]을 강화하고, 합성을 더욱 뒷받침했을 수 있다. 학문적 경험과 관련된 부정적인 결과에 대한 데이터가 제한적이거나 없는 연구에서 긍정적인 결과에 초점을 맞추는 것도 한계이다. 이 검토에서 개발된 프로그램 이론을 테스트하기 위해서는 [의대생 학문적 경험에 대한 현실주의적 평가]가 필요하다. The strengths of this study include the systematic literature search. The included studies were mostly cross-sectional, used convenience sampling, self-reported outcomes, contained limited depth of description about the contexts and mechanisms, and lacked mid-range theory, potentially preventing a more in-depth understanding of the causal pathways to produce scholarly outcomes. The use of mid-range theory (for example, experiential learning theory or transformative learning theory) may have strengthened this initial programme theory and supported the synthesis further. The focus on positive outcomes in the studies, with limited or no data on negative outcomes associated with scholarly experiences, is also a limitation. A realist evaluation of medical student scholarly experiences is needed to test the programme theory developed in this review.
5 결론 5 CONCLUSIONS
의대생들을 위한 학문적 경험이 깊이 있는 지식과 연구능력을 키우고, 연구성과를 내고, 향후 연구진로에 대한 관심을 지원하는 수단으로 작용할 수 있다. 학생들이 경험을 중시하는 연구 문화를 가진 조직 내에서 경험에 참여할 자율성과 보호된 시간을 가질 때, 이러한 결과는 실현된다. 학생들이 연구를 관련성 있고 가치 있는 것으로 간주하고 학생의 자기 효능을 기르는 양질의 감독, 구조 및 지원에 대한 접근은 이러한 결과의 성취를 창출한다. 학문적 경험의 성과를 평가하는 향후 연구는 부정적인 성과와 긍정적인 성과에 대해 보고해야 하며, 비전통적인 연구 경험의 성과(예: 그것이 제공되는 품질 개선 경험)와 임상적 실천과 교육에 미치는 영향을 평가해야 한다. 감독관, 의과대학 및 보건 서비스 기관에 대한 성과도 평가되어야 합니다. 이것이 실현된다면, 학문적 경험에 의해 달성되는 결과에 대한 훨씬 더 전체적인 이해가 이루어질 것입니다.
Scholarly experiences for medical students can act as a means to develop in-depth knowledge and research skills, research outputs and support future research career interests. When students have autonomy and protected time to engage in the experience within an organisation with research culture that values the experience, these outcomes are realised. Access to quality supervision, structure and support where students see research as relevant and valuable and build student's self-efficacy generate achievement of these outcomes. Future research evaluating the outcomes of scholarly experiences should report on negative and positive outcomes, evaluate the outcomes from non-traditional research experiences (like quality improvement experiences, where they are offered) and the impact on clinical practice and education. The outcomes for supervisors, medical schools and health services should also be evaluated. If this is realised, a much more holistic understanding of the outcomes that are achieved by scholarly experiences will be achieved.
Med Educ. 2021 Feb;55(2):159-166.
doi: 10.1111/medu.14362.Epub 2020 Sep 22.
A realist review of scholarly experiences in medical education
Context:Scholarly experiences have been increasingly employed to support the development of scholarly skills for medical students. How the characteristics of the various scholarly experiences contributes to scholarly outcomes or the complexities of how the experiences build skills warrants further exploration.
Objectives:To identify how medical students' scholarly experiences lead to scholarly outcomes under what circumstances.
Methods:A realist review was conducted with a search of Ovid MEDLINE, CINAHL, Scopus and ERIC databases using the terms "medical student" and "scholarly experience" and related synonyms. Studies involving the engagement of medical students in a range of compulsory scholarly experiences including quality improvement projects, literature reviews and research projects were included. Key data were extracted from studies, and realist analysis was used to identify how contexts and mechanisms led to different outcomes.
Results:From an initial 4590 titles, 28 studies of 22 scholarly experiences were identified. All were primarily focused on research-related scholarly experiences. Organisational research culture that valued research, dedicated time, autonomy and choice of experience were found to be key contexts. Adequately supported and structured experiences where students can see the value of research and quality supervision that builds student's self-efficacy were identified as mechanisms leading to outcomes. Outcomes included increased research skills and attitudes, scholarly outputs (eg publications) and future interest in research or other scholarly endeavours.
Conclusions:The design of scholarly experiences for medical students needs to ensure protected time, adequate supervision and autonomy, to achieve scholarly outcomes. Much of the focus is on research and traditional outcomes with little known about the role or outcomes associated with other scholarly work.
WBA 시스템을 위한 타당도 지도 만들기: Messick과 Kane의 상호교차 (Acad Med, 2021) Constructing a Validity Map for a Workplace-Based Assessment System: Cross-Walking Messick and Kane Benjamin Kinnear, MD, MEd, Matthew Kelleher, MD, MEd, Brian May, MD, MEd, Dana Sall, MD, MEd, Daniel P. Schauer, MD, MSc, Daniel J. Schumacher, MD, PhD, MEd, and Eric J. Warm, MD
보건 직업 교육은 [의료 제공자를 훈련시키는 데 사용되는 프로세스]가 [복무할 인구의 요구]에 따라 추진되는 접근 방식인 [역량 기반 패러다임]으로 전환되었다. 역량 측정의 필요성으로 인해 평가는 역량 기반 의료 교육(CBME) 구현에서 특히 중요하지만 어려운 측면이 되었다. 직장 기반 평가(WBA)는 실제 임상 과제를 수행하는 학습자 평가의 이점을 제공하는 평가 프로그램에 필수 요소가 되었다. 그러나 WBA는 상대적으로 낮은 심리측정적 성능으로 인해 총괄적 목적을 위한 타당성 증거가 부족하다는 비판을 종종 받는다.우리는 타당성이 심리측정학 그 이상을 포함해야 한다고 믿는다.
Health professions education has shifted to a competency-based paradigm,1–4an approach in which the processes used to train health care providers are driven by the needs of the populations they serve.5–7The need for competency measurement has made assessment a particularly crucial, yet challenging, aspect of competency-based medical education (CBME) implementation.8–11Workplace-based assessment (WBA) has become integral to programs of assessment,8carrying the advantage of assessing learners performing real-world clinical tasks. However, WBAs are often criticized for lacking validity evidence for summative purposes due to relatively poor psychometric performance.12We believe validity should include more than psychometrics alone.
타당도는 good assessment의 필수불가결한 요소이므로 CBME 프로그램의 핵심입니다. 타당도에 대한 여러 가지 설명이 존재하지만, 현대의 프레임워크는 타당도를 [데이터를 미리 정의된 해석이나 사용에 대해 지지하는 해석적 주장interpretive argument]으로 개념화한다. 두 개의 현대적 프레임워크는 비록 강조점이 다르지만 타당성 증거를 구성하기 위해 일반적으로 사용된다(표 1). 메식(Messick)의 프레임워크는 타당성 [증거의 출처]를 강조하고, 케인의 프레임워크는 [증거 사슬의 추론]에 초점을 맞춘다. 이러한 프레임워크가 상호 배타적이지는 않지만, 종종 증거를 구성하기 위해 둘 중 하나가 사용된다. 그러나 우리는 그것들이 상호 보완적이라고 믿는다. Validity is thesine qua nonof good assessment,13and therefore is central to CBME programs. While multiple descriptions of validity exist,14modern frameworks conceptualize it as an interpretive argument that supports a predefined interpretation or use of data.15Two contemporary frameworks are commonly used to organize validity evidence, though they differ in emphasis (Table 1). Messick’s framework stressessourcesof validity evidence,16and Kane’s focuses oninferencesin an evidentiary chain.17While these frameworks are not mutually exclusive, often one or the other is used to organize evidence. However, we believe they are complementary.
접근 Approach
신시내티 대학(UC) 내과 레지던트 프로그램은 UC 메디컬 센터, 보훈 의료 센터 및 여러 외래 클리닉에서 돌아가며 약 89명의 레지던트들로 구성되어 있다. 2012년에는 대학원 의학교육 하위역량 인증협의회를 통합한 위탁기반 WBA 제도를 시행하였으며, 이후 이 데이터를 레지던트 역량 판단에 활용하기 위한 타당성 근거를 수집하고 있습니다.
The University of Cincinnati (UC) Internal Medicine (IM) residency program, based in an urban, tertiary referral medical center, consists of approximately 89 categorical residents who rotate at UC Medical Center, Veterans Affairs Medical Center, and multiple ambulatory clinics. In 2012, we implemented an entrustment-based WBA system that integrated the Accreditation Council for Graduate Medical Education subcompetencies, and we have been collecting validity evidence for using these data for determination of resident competence since that time.18,19
우리는 다음 4단계를 포함한 수사적 주장을 반영하는 다단계 프로세스를 사용하여 타당도 맵을 구성했다.
(1) 명시된 해석과 사용에 대한 비판적인 질문을 할 때,
(2) 그에 대한 대응으로 타당성 증거를 찾고,
(3) 증거 분류, 그리고
(4) 증거를 시각화
We constructed our validity map using a multistep process that mirrored a rhetorical argument including the following 4 steps:
(1) Asking critical questions about the stated interpretation and use,
(2) Seeking validity evidence as a response,
(3) Categorizing evidence, and
(4) Visualizing evidence.
1. 서술된 해석과 사용에 대한 중요한 질문 1. Asking critical questions about the stated interpretation and use
우리 팀은 먼저 우리만의 WBA 시스템에 [비판적인 대화자 역할]을 하는 방식을 택했습니다. 우리는 개별적으로 WBA 데이터를 사용하여 내린 결정이 역량 평가에 타당한지 여부에 이의를 제기할 수 있는 질문을 작성했다. 예제는 다음과 같습니다.
"위임entrustment은 왜 일선 평가를 위한 구성물로 사용되는가?"
"위임 평정entrustment rating의 신뢰도는 어느 정도인가?" 및
"위임entrustment 점수는 임상 치료 품질 척도와 관련이 있는가?"
이 질문들은 우리가 찾는 타당성 증거에 대한 가이드 역할을 했습니다.
Our team first took the approach of acting as an interlocutor who is critical of our own WBA system. We individually wrote questions that might challenge whether decisions made using the WBA data were valid for assessment of competence. Example questions included,
“Why is entrustment used as a construct for frontline assessment?”,
“What is the reliability of entrustment ratings?”, and
“Do entrustment scores correlate with measures of clinical care quality?”.
These questions then served as a guide for the validity evidence we sought.
2. 대응책으로서 타당성 입증 모색 2. Seeking validity evidence as a response
우리는 각각의 질문에 답변하고 뒷받침되는 증거를 제공하려고 시도했습니다. 우리는 먼저 우리의 대응을 지지하거나 반박할 수 있는 증거를 위해 기존 문헌을 검토했다. 증거가 없다면, 이전 작업을 통해 생성한 증거를 사용했습니다. We attempted to respond to each question and provide supportive evidence. We first reviewed existing literature for evidence that would support or refute our response. Other times we used evidence that we had generated through previous work.
이 작업은 마이크로소프트 엑셀(마이크로소프트, 워싱턴 레드몬드) 스프레드시트를 사용하여 구성되었으며 열 제목은 다음과 같습니다. 질문, 응답, 근거, 인용문, 격차. This work was organized using a Microsoft Excel (Microsoft Corporation, Redmond, Washington) spreadsheet with the following column headings:Question, Response, Supporting Evidence, Citations, Gaps.
3. 증거 분류 3. Categorizing evidence
우리는 우리의 주장에서 추론(Kane)을 뒷받침하는 증거 출처(메식)를 기준으로 증거를 구성했다(그림 1). 이 프로세스는 토론을 통해 범주 분류에 대한 그룹 합의를 형성했습니다. 예를 들어,
일선 WBA 기기에 대한 위탁 프레임워크의 사용은 점수 추론(Kane)을 뒷받침하기 위한 응답 프로세스 증거(Messick)로 고려되었다.
일반화 가능성 연구는 일반화 추론(Kane)을 뒷받침하는 내부 구조 증거(Messick)로 간주되었다.
We organized our evidence by thesourceof evidence (Messick) supporting aninference(Kane) in our argument (Figure 1). This process was done using discussion to form group consensus around categorizations. For example,
the use of an entrustment framework for frontline WBA instruments was considered response process evidence (Messick) to support the scoring inference (Kane).
The generalizability study was deemed internal structure evidence (Messick) to support the generalization inference (Kane).
4. 증거 시각화: 지도 작성 4. Visualizing evidence: Map building
엑셀은 증거를 분류하는 기능적인 수단이었지만, 우리는 두 가지 이유로 좀 더 시각적인 형식을 원했습니다.
첫째, 우리는 우리의 논쟁에 남아 있는 차이를 식별하기 위해 수집된 증거에 대해 이해할 수 있는 높은 수준의 검토를 추구했다. 이 시각 자료는 증거에 대한 심층 분석에 사용되는 Excel 문서와 함께 빠른 참조를 위한 타당도의 "맵" 역할을 할 수 있다.
둘째, 지도는 우리가 이미 수집한 증거, 진행 중인 검증 작업, 향후 연구로 정리할 수 있게 해주었습니다.
Excel was a functional means of cataloguing evidence, but we wanted a more visual format for 2 reasons.
First, we sought an understandable, high-level review of collected evidence to identify remaining gaps in our argument. This visual could serve as a validity “map” for quick reference, with the Excel document used for deeper dives into the evidence.
Second, the map allowed us to organize evidence into that which was already collected, ongoing validation work, and future studies.
We used Microsoft Visio (Microsoft Corporation, Redmond, Washington) to create the map and organize the information using spatial orientation and color/shading (Figure 2). Inferences from Kane’s framework were placed in 4 rows that crossed 3 columns labeled “Evidence obtained,” “Work in progress,” and “Gaps/future studies.” Each critical question from the Excel sheet was placed in a box that represented the corresponding response/evidence. Boxes were color coded based on which source of evidence they represented from Messick’s framework and placed in the appropriate row and column on the map.
성과 Outcomes
우리의 타당도 맵의 첫 번째 초안은 메식(Messick)이 상세히 설명한 5가지 근거 출처를 모두 포함하고 케인이 설명한 4가지 추론 모두에 걸쳐 확산된 25개의 증거 상자를 생성했다(그림 2a). 우리 팀은 지도 제작 과정과 지도 자체에서 가치를 발견했어요. 수사적 질문-응답 과정을 통해 WBA 시스템을 신중하게 비판적으로 평가할 수 있었다.
The first draft of our validity map produced 25 boxes of evidence that included all 5 sources of evidence detailed by Messick and spread across all 4 inferences described by Kane (Figure 2a). Our team found value in both the process of map construction and in the map itself. The rhetorical question–response process allowed us to critically appraise our WBA system in a deliberate fashion.
우리는 메식 프레임워크와 케인의 프레임워크를 모두 지도에 통합하는 것이 유익하다는 것을 알았다. 케인의 틀은 증거 사슬에서 "가장 약한 고리"를 식별할 수 있다는 장점을 가지고 있어, 우리의 작업의 우선순위를 정하는 데 도움을 준다. 15 앞서 언급했듯이, 지도에는 외삽 추론을 뒷받침할 증거가 부족함을 보여주었다. 따라서, 우리는 우리의 WBA 데이터가 성과에 대한 다른 측정 또는 임상 치료 결과와 관련이 있는지를 연구하여 증거를 구축하는 데 최근의 노력을 집중해 왔다. 메식(Messick)의 프레임워크는 주어진 추론을 뒷받침할 수 있는 증거의 출처를 통해 우리가 체계적으로 생각하도록 도왔다.
We found it beneficial to integrate both Messick’s and Kane’s frameworks into our map. Kane’s framework carries the advantage of allowing for the identification of the “weakest link” in the evidentiary chain, helping us to prioritize our work.15As previously mentioned, the map showed our argument was lacking in evidence to support theextrapolationinference. Thus, we have focused our recent efforts on building evidence by researching if our WBA data are associated with other measures of performance or with clinical care outcomes. Messick’s framework has helped us think systematically through sources of evidence that might be sought to support a given inference.
우리의 타당도 맵은 역동적이며, 새로운 질문이 발생하고 새로운 증거가 수집됨에 따라 변화한다. 전자 형식을 사용하면 시간이 지남에 따라 지도를 쉽게 편집, 업데이트 및 공유할 수 있습니다. 그림 2b는 타당성 연구가 완료되거나 증거가 발견됨에 따라 박스가 오른쪽(미래 작업)에서 왼쪽(증거 누적)으로 이동하는 방법을 보여주는 업데이트된 지도이다.
Our validity map is dynamic, and changes as new questions arise and new evidence is collected. Using an electronic format allows us to easily edit, update, and share the map over time.Figure 2bis an updated map, showing how boxes move from right (future work) to left (accrued evidence) as validity studies are completed or evidence is discovered.
다음 단계 Next Steps
현재 타당도 맵의 한계는 각 상자의 질문을 뒷받침하는 증거를 쉽게 심층 분석할 수 없다는 것이다. 위에서 언급한 바와 같이 증거의 초기 분류에 Excel을 사용했으며, 이 스프레드시트에는 관련 증거에 대한 보다 심층적인 설명과 인용이 포함되어 있습니다. 향후 반복 작업에는 대화형 플랫폼과 심층 다이빙을 허용하는 플랫폼을 기반으로 타당도 맵을 구축하는 것이 포함될 것이다. A limitation of our current validity map is that it does not allow for an easy deep dive into the evidence undergirding each box’s question. As noted above, we used Excel for the initial categorization of evidence, and these spreadsheets contain more in-depth explanations and citations for relevant evidence. Future iterations will involve building our validity map on a platform that is interactive and allows for deep dives.
우리는 WBA 시스템에 대한 타당성 증거를 수집, 분류 및 구성하는 데 가치를 발견했지만, 가장 높은 가치는 평가 시스템의 이해관계자와 이 작업을 공유하는 데 있다. 우리는 우리의 과정과 제공된 증거의 수용 가능성에 대한 피드백을 얻기 위해 의학 교육계의 다른 사람들과 우리의 타당성 맵을 예비적으로 공유했습니다. 26 다음 단계에는 타당성 맵이 프로그램의 타당성 주장을 평가하는 데 가치를 추가하는지 이해하기 위해 이해관계자(예: 인가자, 기관 지도자, 학습자, 환자)의 의견을 수집하는 것이 포함된다. 이해관계자들은 증거의 우선순위를 다르게 정하거나 우리에게 처음에 분명하지 않은 새로운 gap을 강조할 수 있다. We found value in collating, categorizing, and organizing validity evidence for our WBA system, but the highest value lies in sharing this work with the stakeholders of our assessment system. We have preliminarily shared our validity map with others in the medical education community to obtain feedback on our process and the acceptability of the evidence provided.26Next steps include collecting stakeholders’ (e.g., accreditors, institutional leaders, learners, patients) input to understand if our validity map adds value for evaluating our program’s validity argument. Stakeholders may prioritize evidence differently or highlight new gaps not initially evident to us.
결론 Conclusion
WBA 시스템에 대한 타당도 맵을 구축하는 것이 증거 격차를 식별하고 향후 연구 및 프로그램 개선 노력을 계획하는 데 도움이 된다는 것을 발견했습니다. 다른 프로그램도 WBA 시스템의 의도된 사용을 정의하고, 중요한 질문을 생성하고 관련 증거를 수집하기 위한 수사적 질의응답 접근법을 사용하며, 증거를 구성하고 중요한 차이를 식별하기 위해 Messick과 Kane의 프레임워크를 사용하여 유사한 접근방식을 취할 수 있다.
We found that constructing a validity map for our WBA system helped identify evidentiary gaps and plan future research and program improvement efforts. Other programs could take a similar approach by defining the intended use of their WBA system, using a rhetorical question–answer approach to generate critical questions and collect relevant evidence, and using the frameworks from Messick and Kane to organize evidence and identify critical gaps.
Acad Med. 2021 Jul 1;96(7S):S64-S69.
doi: 10.1097/ACM.0000000000004112.
Constructing a Validity Map for a Workplace-Based Assessment System: Cross-Walking Messick and Kane
1B. Kinnear is associate professor of internal medicine and pediatrics, Department of Pediatrics, University of Cincinnati College of Medicine, Cincinnati, Ohio; ORCID: https://orcid.org/0000-0003-0052-4130.
2M. Kelleher is assistant professor of internal medicine and pediatrics, Department of Pediatrics, University of Cincinnati College of Medicine, Cincinnati, Ohio.
3B. May is assistant professor of internal medicine and pediatrics, Department of Internal Medicine, University of Alabama Birmingham School of Medicine, Birmingham, Alabama.
4D. Sall is program director, HonorHealth Internal Medicine Residency Program, Scottsdale, Arizona, and assistant professor of internal medicine, University of Arizona College of Medicine, Phoenix, Arizona.
5D.P. Schauer is associate professor of internal medicine and associate program director, Department of Internal Medicine, University of Cincinnati College of Medicine, Cincinnati, Ohio; ORCID: https://orcid.org/0000-0003-3264-8154.
6D.J. Schumacher is associate professor of pediatrics at Cincinnati Children's Hospital Medical Center/University of Cincinnati College of Medicine, Cincinnati, Ohio; ORCID: https://orcid.org/0000-0001-5507-8452.
7E.J. Warm is professor of internal medicine and program director, Department of Internal Medicine, University of Cincinnati College of Medicine, Cincinnati, Ohio; ORCID: https://orcid.org/0000-0002-6088-2434.
의학교육의 프로그램적 평가가 헬스케어에서 배울 수 있는 것(Perspect Med Educ, 2017) What programmatic assessment in medical education can learn from healthcare L. Schuwirth1,2 · C. van der Vleuten2 · S. J. Durning1,3
배경 Background
의학 교육에서 평가에 대한 새로운 접근 방식인 프로그램 평가라고 불리는 것이 등장하고 있다. [프로그램적 평가]는 학습자의 역량과 진도에 대한 일상적인 정보를 지속적으로 수집하고 분석하며, 필요한 경우 학습자와 멘토에게 최대한의 정보를 제공하고, 훈련 종료 단계에서 고부담 의사 결정을 허용하기 위해 의도적으로 수집된 추가 평가 정보로 보완하는 접근법이다. 이를 위해 다양한 평가 도구가 일반적으로 사용됩니다 [1–3]. A new approach to assessment is emerging in medical education, called programmatic assessment. Programmatic assessment is an approach in which routine information about the learner’s competence and progress is continually collected, analyzed and, where needed, complemented with purposively collected additional assessment information, with the intent to both maximally inform the learner and their mentor and allow for high-stakes decisions at the end of a training phase. For this, a variety of assessment instruments are usually used [1–3].
프로그램적 평가는 거의 전적으로 [학습의 평가AoL]에 초점을 맞춘 전형적인 '모듈 테스트module-test' 구성 요소를 사용하는 [기존의 평가 프로그램과]는 상당히 다르다. 우리는 프로그래밍 방식의 평가가 실제로 다양한 관점에서 더 타당하다고 생각하며 왜 그렇게 생각하는지 설명하기 위해 임상 의학과의 유사성을 사용하고자 합니다.
Programmatic assessment is quite different from more traditional assessment programs with the typical ‘module-test’ building blocks focussing almost entirely on assessmentoflearning. We think that programmatic assessment actually makes more sense from various perspectives and we want to use analogies with clinical medicine to explain why we think so.
프로그래램적 평가 접근법에서, 각 평가는 학습자에게 [의미 있는 피드백]을 제공합니다. 이러한 피드백은 양적, 질적 또는 둘 다일 수 있다. 각 개별 평가는 처음에는 '고부담 판단'을 위한 것이 아니라, 학습자가 자신의 성과를 분석하고 구체적인 학습 목표를 수립하고 입증할 수 있도록 달성하기 위해 사용해야 한다. 개별 평가는 (예를 들어 포트폴리오에서) 수집될 구성요소로 사용되며, 그런 다음 교수진이나 위원회가 이를 분석하여 방어 가능한 고부담 결정을 내릴 수 있는 [풍부한 진단적 그림rich diagnostic picture]을 만듭니다. 일반적으로 모든 정보는 내용에 의해 의미 있는 방식으로 다양한 출처의 정보를 결합하여, 총괄적 결정을 위해 주기적으로 평가 위원회에 의해 검토된다[1, 2, 7]. 이 검토를 바탕으로 재교육remediation 계획이 제공된다. 학습자와 전담 교원(기관에 따라 멘토, 감독 또는 코치라고 함) 간의 지속적인 대화는 피드백, 역량 개발 분석, 교정 및 개인 개발에 초점을 맞춘다. [고부담 객관식 시험을 치른 후 합격-불합격 결정을 내리는 것과 같은 기존의 평가]가 아니라, 프로그램적 평가는 달성된 역량 수준과 그 발달 과정을 모두 다룬다. In the programmatic assessment approach, each assessment produces meaningful feedback to the learner. This feedback may be quantitative, qualitative or both. Each individual assessment is not initially meant for ‘high-stakes’ decision-making, but has to be used by the learner to analyze their own performance, formulate concrete learning goals and demonstrably attain them. Individual assessments are used as components that are to be collected, for example in a portfolio, and then analyzed by a faculty member or committee into a rich diagnostic picture that will allow defensible high-stakes decisions. Typically, all information is periodically reviewed by an assessment committee for summative decisions, combining information from various sources in a way that is meaningful by content [1,2,7]. So, for example, results on parts of a multiple-choice examination may be combined with parts of a mini-CEX or OSCE examination to draw conclusions as to the examinee’s progress in a domain of performance. Based on this review, remediation plans are provided. A continuous dialogue between the learner and a dedicated staff member (called either mentor, supervisor or coach in different institutes) further scaffolds the focus on feedback, analysis of competence development, remediation and personal development. Instead of a conventional assessment such as taking a high-stakes multiple-choice examination followed by a pass-fail decision, programmatic assessment addresses both the attained competence levels and their developmental processes.
유사성 Analogies
유사 1: '건강' 개념과 마찬가지로 역량competence의 개념은 정의하기 어려울 수 있지만 평가, 홍보 및 개선될 수 있습니다. Analogy 1: Like the concept ‘health’, the concept of competence may be difficult to define but it can be evaluated, promoted and improved
세계보건기구(WHO)의 건강 정의는 '완전한 신체적, 정신적, 사회적 안녕 상태이며, 단순히 질병이나 질병이 없는 것만이 아니다'이다[8]. [역량]에 대한 일반적인 정의는 '(의사가) 복무할 개인 및 공동체의 이익을 위해 의사소통, 지식, 기술 기술, 임상 추론, 감정, 가치, 성찰을 일상 실무에서 습관적이고 현명하게 사용하는 것'이다[9]. 두 정의 모두 이해를 전달하지만 실제 실행에는 도움이 되지 않습니다. 건강의 정의는 특정 환자를 진단하고 치료하는 데 도움이 되지 않으며 역량의 정의는 특정 학습자의 평가와 교육에 도움이 되지 않는다(학생, 레지던트 또는 실제 의사). 그러나 이들의 공통점은 '건강'과 '역량' 둘 다 정의하기가 거의 불가능하다는 사실에도 불구하고 여전히 평가되고 향상될 수 있다는 것이다. 의사는 '건강하지 않음'을 진단할 수 있으며, 마찬가지로 전문 평가자도 '무능력'을 진단할 수 있다[10]. The WHO definition of health is: ‘a state of complete physical, mental, and social well-being and not merely the absence of disease or infirmity’ [8]. A popular definition of competence is ‘the habitual and judicious use of communication, knowledge, technical skills, clinical reasoning, emotions, values, and reflection in daily practice for the benefit of the individual and the community being served’ [9]. Both definitions convey an understanding, but do not really help in actual practice. The definition of health does not help in diagnosing and treating specific patients and the definition of competence is not helpful for the assessment and education of specific learners at any level (students, residents, or physicians in practice). What they have in common, though, is that despite the fact that both ‘health’ and ‘competence’ are almost impossible to define, they can still be evaluated and improved. Doctors are able to diagnose ‘ill-health’, and likewise it is possible for expert assessors to diagnose ‘dyscompetence’ [10].
물론 대부분의 건강관리 영역(그러나 정신건강에서는 덜 그렇다)에서 질병은 직접적으로 관찰 가능한 임상적 특징을 가질 수 있는 반면, 역량은 항상 우리가 관찰할 수 있는 것에서 추론되어야 한다. 그러나 다른 한편으로, 완전한 범위에서 질병을 진단할 수 있는 단일 도구가 없는 것처럼, 모든 '역량'을 평가할 단일 도구가 없다는 점으로 유추가 확장될 수 있다. 의료 진단은 병력, 신체 검사, 실험실 테스트, 병리학 또는 방사선 연구와 같은 다양한 출처로부터 정보를 신중하게 수집하고 수집하는 것을 포함한다. 마찬가지로, 프로그램적 평가는 수험자의 역량을 진단할 뿐만 아니라 역량을 증진하고 향상시키기 위해 다양한 출처로부터 정보를 신중하게 수집하고 수집하는 것이다.
Of course there are also differences in that in most domains of healthcare (but less so in mental health) the illness may have directly observable clinical features whereas competence always has to be inferred from what we can observe. But, on the other hand, the analogy can be extended in that much like there is no single instrument that will diagnose any illness in its full scope, there is no single instrument that will assess ‘competence’ in its entirety. Diagnosing in healthcare involves the careful collection and collation of information from various sources such as the history, physical examination, lab tests, pathology or radiographic studies. Likewise, programmatic assessment is the careful collection and collation of information from various sources not only to diagnose the examinee’s competence but also to promote and improve their competence.
유사 2: 평가에서 구조화되고 표준화된 테스트만 사용하는 것은 환자를 실험실 가치만으로 진단하는 것과 같습니다. Analogy 2: Merely using structured and standardized testing in assessment is like diagnosing a patient on lab-values alone
전통적인 평가 모델에서 일반적으로 논의되는 주제는 양적 또는 질적 중 어떤 정보를 가장 잘 사용할 수 있는지와 관련이 있다. 정량적 접근법은 심리측정적 특성으로 인해 고부담 평가일수록 우선된다. 그러나 프로그램 평가에서 논쟁은 양적 정보가 질적 정보보다 나은지(또는 그 반대인지)가 아니라, 개별 학습자에게 그 [두 가지 정보를 어떻게 결합하는 것이 가장 좋은지]에 대한 것이다. 순수하게 실험실 테스트에 기반한 의료 시스템은 이상적이지 않으며, 반대로 실험실 테스트에 액세스할 수 없는 시스템도 마찬가지입니다. 평가에서 질적 정보를 포함하는 것은 종종 [비구조화된(질적) 평가는 심리측정적으로 품질을 보장할 수 없기 때문에 표준화된 테스트만큼 엄격하지 않다]는 우려를 제기한다. 그러나 다시 한 번, 의료행위와 강력한 유사성이 있다. A commonly debated topic in traditional assessment models relates to which information best to use: quantitative or qualitative; with quantitative approaches being given priority for higher stakes assessments due to their psychometric properties. The debate in programmatic assessment, however, is not whether quantitative information is better than qualitative or vice versa, but how best to combine them for each individual learner. A healthcare system that is based purely on lab testing would not be optimal but neither would a system that has no access to lab testing. In assessment, the inclusion of qualitative information often raises concerns that unstructured assessments are not of the same rigour as the standardized tests, because the latter can be quality assured with psychometrics and the former cannot [11]. But, again, the analogy with healthcare practice is powerful.
환자의 헤모글로빈 수준을 검사할 때, 일반적으로 헤모글로빈 수준에 대한 실험실 분석가의 의견에는 관심이 없지만 수치 값(예: 12.2 g/dl(7.57 mmol/l)만 알고자 합니다. 측정의 신뢰성(및 타당성)은 실험실 장비의 품질, 모집단 데이터 및 95% 신뢰 구간과 같은 특성에 의해 결정됩니다. 반면에, 우리가 조직병리학 보고서를 요청할 때에는, 병리학자의 전문가의 의견을 원하는 것이지 숫자를 원하는 것이 아니다.그 결과의 신뢰성(및 타당성)은 임상 질문에 관한 보고서의 설득력cogency, 병리학자의 교육에 대한 신뢰trust, 결론의 개연성plausibility, 신중한 문서화에 의해 결정된다. 수치 측정에 관한 품질기준을 병리 보고서에 적용하거나, credibility criteria를 실험실 수치에 적용하는 것은 말도 안 된다. 마찬가지로, 프로그램적 평가 프로그램에서 [평가의 품질 보증]은 전적으로 심리측정에만 기초할 수 없으며, 신중한 문서화, 근거의 설득력, 평가 전문성 개발을 통합해야 한다[12].
When we order a haemoglobin level for a patient we are generally not interested in the lab analyst’s opinion about the haemoglobin level but merely want to know the numerical value, for example 12.2 g/dl (7.57 mmol/l). The reliability (and validity) of the measurement are determined by characteristics such as the quality of the lab equipment, population data and 95% confidence intervals. When, on the other hand, we order a histopathology report we are not interested in receiving a number but we want the pathologist’s expert opinion. The reliability (and validity) of that outcome is determined by the cogency of the report with respect to the clinical questions, the trust in the education of the pathologist, the plausibility of his/her conclusions and their careful documentation. It is nonsensical to apply the measurement-type quality criteria to this report or the credibility criteria to the lab value. In a programmatic assessment program quality assurance of the assessments likewise cannot be purely based on psychometrics and will have to incorporate careful documentation, cogent underpinnings of decisions and assessment expertise development [12].
국가 차원에서도 이러한 비유는 유효하다. 프로그래밍 방식의 평가는 결코 국가단위 시험에 반대하는 주장이 아니다. 국가단위 의료 시스템은 (적절한 진단 후속 조치가 있는 경우) 국가단위 스크리닝 프로그램의 혜택을 받는 경우가 많다. 따라서, [국가단위 시험에서 성적이 저조한 수험생]에 대하여 동등한 '진단적' 후속 조치가 있거나, 다음과 같은 질문에 답할 수 있다면, 국가 시험에 결과를 포함시킴으로써 프로그램 평가의 이점이 있을 것이다.
'역량부족dyscompetence'의 유병률은 어느 정도인가?
'스크리닝 도구가 충분히 민감하거나 특이합니까?'
'스크리닝을 했을 때의 결과가 그렇지 않은 경우보다 나은가?' 그리고
'치료/해치에 필요한 숫자는 무엇인가?'가 제시되어 있다.
At the national level the analogy also holds. Programmatic assessment is by no means an argument against national testing. National healthcare systems often benefit from national screening programs provided there is suitable diagnostic follow-up. So would a programmatic assessment benefit from including the results on national testing, provided there is an equivalent suitable ‘diagnostic’ follow-up of those examinees who underperform at this level, and questions like:
‘What is the prevalence of the disease ’dyscompetence‘?’,
‘Is the screening tool sensitive/specific enough?’,
‘Is the outcome of the disease with screening better than without?’ and
‘What is the number needed to treat/harm?’ are addressed.
유사 3: 진단만으로는 환자를 치료하기에 충분하지 않은 것처럼, 시험만으로는 효과적으로 학습자의 역량 수준을 높이기에 충분하지 않습니다. Analogy 3: Testing alone is not enough to effectively lead to higher competence levels of learners like merely making a diagnosis is not enough to cure a patient
이 개념을 표현하는 대표적인 금언은 '환자의 체온을 재는 것만으로는 치료할 수 없다'는 것이다. 순수하게 환자를 진단하는 것 자체가 충분하지 않다; 그것은 치료 활동과 결합되어야 한다. The typical aphorism to express this concept is the statement that ‘merely taking a patient’s temperature is not enough to cure them’. Purely diagnosing a patient, in itself, is not enough; it has to be combined with therapeutic actions.
평가 또한 '치료적'이어야 한다. 건강관리에서의 진단 절차가 단지 '건강/건강하지 않은' 결정으로 귀결된다면, 임상의는 치료 계획을 결정하기 위해 행동할 것이 거의 없을 것이다. 이것이 의료에서 진단적-워크업이 일반적으로 정확히 무엇이 잘못되었는지, 얼마나 심각한지, 그리고 최선의 행동 방침이 무엇인지 진단하기 위해 의도적으로 계획되는 이유이다. 임상의가 아무런 치료도 하지 않고서, 단순히 모든 검사를 몇 주 후에 다시 실행하여 수치가 정상화되었는지 확인할 가능성은 거의 없습니다. 그러나 전통적인 시험에서 이것은 종종 원래 테스트의 반복적인 측정일 뿐인 재시험에서 종종 발생합니다. 또한, 이러한 테스트는 문제의 잠재적인 근본적인 원인에 대한 정보를 제대로 제공하지 못하며, 교정적 전략 제공도 제한적이다. 물론 시험이 학습에 미치는 영향, 특히 시험 강화 학습 효과[13, 14]를 무시할 수는 없지만, 목적한 정보targeted information가 없이 시험-강화 학습의 효과에만 의존하는 것은, "의도적인 연습"이라 불리는 피드백과 표적 실습targeted practice의 역할의 중요성을 고려한다면, 저조한 효과만을 보일 것이다.
Assessment also needs to be ‘therapeutic’. If diagnostic procedures in healthcare were to just result in a ‘healthy/not healthy’ decision, the clinician would have very little to act on to determine his/her therapeutic plan. This is why in healthcare, diagnostic work-ups are typically purposefully planned to diagnose exactly what is wrong, how severe the condition is, and what the best course of action is. It is unlikely that a clinician would simply run all the tests again a couple weeks later to see whether they have normalized without any therapy. Yet in traditional testing this is often what happens with re-examinations which are often merely a repeated measurement of the original test. Further, these tests are not optimally informative as to potential underlying causes of the problem – they offer limited strategies for remediation in and of themselves. Of course, one cannot ignore the effects of tests on learning – in particular the test-enhanced learning effect [13,14] – but the reliance on these effects without targeted information is likely to make the whole process less effective as the importance of the role of feedback and targeted practice – deliberate practice – is generally accepted [15].
프로그램적 평가에서 학습자와 교수진에게 [어떤 특정한 재교육 활동이 필요한지]에 대한 정보를 제공하기 위해, [의도적으로 서로 다른 유형의 정보의 조합]을 사용한다. 예를 들어, [복부 해부학에서 객관식 질문]에 대한 결과는 [복부 검사의 OSCE 스테이션] 및 [복부 통증이 있는 환자에 대한 미니 CEX]의 결과와 결합하여 학습자가 다음 중 어떤 문제를 가지고 있는지를 결정할 수 있다.
기술 부족(따라서 더 많은 연습이 필요함),
해부학적 지식 부족(따라서 해당 도메인 교정 필요) 또는
불충분한 환자 상담 기술
In programmatic assessment, the combination of different types of information is deliberately used to inform the learner and faculty alike about what specific remedial activity would be needed. For example, the results on multiple choice questions (from a larger test) on abdominal anatomy can be combined with those on an OSCE station on abdominal examination and a mini-CEX with a patient with abdominal pain to determine whether the learner has
insufficient technique (and therefore just requires more practice),
insufficient anatomical knowledge (and therefore requires remediation in that domain) or
insufficient patient consultation skills.
이러한 방식이 ['무릎 검사'에 대한 OSCE 스테이션 성적]으로 [복부 검사에 대한 OSCE 스테이션 성적]을 보완하는 것보다 훨씬 말이 된다. 다시 말하지만, 이러한 정보 결합 방식은 의료 서비스의 표준입니다. 임상의는 환자에게 불행하게도 그들의 HB 수치가 너무 낮지만, 다행히도 그들의 포도당이 너무 높아서 평균적으로 그들의 실험실 수치는 괜찮다고 절대 말하지 않을 것이다. 임상의는 단순히 수학적으로 평균을 내기보다는, [피로, 다혈증, 다뇨증에 대한 불만과 포도당 수준]을 결합하고, [상처 치유력이 떨어지는 동맥 맥박의 부재]를 결합하여 정보를 이해할 것이다(진단이든 치료든).
This makes much more sense than compensating poor performance on an OSCE station on, for instance, abdominal examination with good performance on an OSCE station on ‘knee examination’. Again, this way of combining information is the norm in healthcare; a clinician would never tell a patient that unfortunately their Hb level is too low but fortunately their glucose is too high and so, on average, their lab values are ok. The clinician would combine the glucose level with complaints about fatigue, polydipsia and polyuria and absent arterial pulses with poor wound healing to make sense of the information (both diagnosis and treatment of a specific problem) rather than to merely mathematically average it.
유사 4: 질병을 진단하는 것이 단순히 체크박스 작업이 아닌 것처럼, 체크박스 작업을 가지고 역량부족dyscompetence를 진단하는 것도 효과가 없습니다. Analogy 4: Like diagnosing a disease is not merely a tick box exercise ‘diagnosing’ dyscompetence using a tick box exercise does not work either
현재, 다양한 교육 및 라이선스 기관들이 '역할roles' 또는 '역량competencies'의 관점에서 결과를 발표했다. 이들은 항상 이러한 역량을 더 상세한 하위 역량 또는 더 깊은 수준의 세부 역량('하위 역량')으로 구분해 왔다. 평가의 관점에서 이것은 종종 두 가지 이유로 인해 문제가 있다고 여겨진다. Currently, various educational and licencing organizations have published outcomes in terms of ‘roles’ or ‘competencies’. Invariably they have divided these competencies further into more detailed sub-competencies or at even deeper levels of detail (‘sub-sub-competencies’). From an assessment point of view, this is often seen as problematic because of two reasons.
첫째, 그것은 결코 충분하지 않다는 일반적인 느낌이 있습니다. 의학은 거의 무한한 영역이며, [언제나 하위역량 목록에는 추가될 수 있는 다른 항목들이 존재한다. 이는 종종 무엇을 포함시키고 무엇을 빠뜨릴지에 대한 광범위한 토론으로 이어진다. 이는 면허기관뿐만 아니라 의과대학이 교육과정의 내용을 결정하는 데 있어서도 해당된다. First, there is a general feeling that it is never enough. Medicine seems to be an almost infinite domain and there are always other items that can be added to the list of sub-competencies, often leading to extensive discussions about what to include and what to leave out. This is not only true for licencing bodies but also for medical schools in determining the content of their curriculum.
둘째, '전체'는 '부분'의 합보다 커야 합니다. 그러므로, 역량이 분리된 상세한 항목들의 목록으로 해부될 때, 역량을 평가하기 위해 그것들을 재조합하는 적절한 방법을 찾는 것은 정말 어려운 일입니다. 대부분의 경우에서 [역량 있는 학습자]라면 [방대한 목록의 모든 항목에 체크를 받으리라고 예상하는 체크리스트 접근법]은 작동하지 않을 것이 분명하다.
Second, the ‘whole’ has to be more than the sum of the ‘parts’. So, when dyscompetence is dissected into lists of separate detailed items, finding a proper way to recombine them – to glue them back together again – in order to assess ‘dyscompetence’ is a real challenge. It is clear that a checklist approach, expecting the competent candidate to tick all the items on the extensive lists will not work in most cases.
여기서도 의료와 유사한 점이 도움이 될 수 있습니다. 보건의료에서 모든 진단은 징후와 증상으로 기술될 수 있으며, 교과서는 종종 각각의 진단에 대한 징후와 증상의 긴 목록을 제공한다. 그러나, 환자가 특정 질병으로 진단받기 위해 그것들을 모두 가지고 있을 필요는 없다; 즉, 체크리스트의 모든 항목에 '체크'될 필요는 없다. 대부분의 경우 전문 임상의는 통합된 '게스탈트' 기반으로 진단을 내리고, 그 징후와 증상, 그리고 그/그녀의 평가를 구두로 설명하여 하향식 처리 활동으로서 근거를 설명할 수 있다[16]. 이러한 [게슈탈트 진단 능력gestalt diagnosis]이 없다면, 임상의는 미분 진단에서 각각의 진단에 대해, 모든 징후와 증상에 대한 정확한 PPV와 NPV를 알고, 완전한 상향식 처리를 통해서, 가장 가능성이 높은 진단을 생성하기 위해, 머리속으로 매우 복잡한 수학을 처리해야 할 것이다. 그러나 임상의는 수년간의 훈련을 통해, [휴리스틱과 가이드라인]을 통해 안내된 경험과, [점진적인 탈비계화gradual descaffolding]를 거치며 전문지식을 개발할 수 있는 기회를 가졌다. 평가자들에게도 같은 것이 적용되어야 할 것이다. 이상적으로는 [평가 문해력assessment literacy] 개발에 유사한 접근방식이 평가자에게 적용될 것이다[17].
Here too, an analogy with healthcare can be helpful. In healthcare, every diagnosis can be described in signs and symptoms, and textbooks often provide long lists of signs and symptoms for each diagnosis. But, a patient does not have to have them all to be diagnosed with a certain illness; there is no need to ‘tick all the items’. In most cases the expert clinician makes an integral ‘gestalt’ diagnosis, and is able to verbalize the signs and symptoms and his/her evaluation to explain their rationale, as a top-down processing activity [16]. Without this ability for gestalt diagnosis, the clinician would have to know all the exact positive and negative predictive values of all signs and symptoms for each diagnosis in the differential diagnosis, and do the complex mathematics mentally to produce the most likely diagnosis as a complete bottom-up processing. Yet, the clinician has had the opportunity to develop this expertise through years of training, with the use of heuristics and guidelines, with guided experience and a gradual descaffolding. The same would have to apply to assessors. Ideally a similar approach to the development of assessment literacy would be applied to assessors [17].
그러나 게슈탈트 타입의 하향식 프로세싱을 하더라도, 개별적인 징후와 증상들은 매우 유용하다; 그것들은 환자의 건강 상태를 묘사하고 평가하고 실제로 개선하는데 필요하다. 우리의 '질병'과 '역량부족' 사이의 첫 번째 유사점에 따라, 역량, 하위 역량, 심지어 하위 역량의 긴 목록은 사소한 것이 아니라, 증상 및 findings과 동등한 것으로 사용되어야 한다. 즉, 학습자의 역량을 설명, 평가 및 개선하기 위한 신호인 것이다. 학습자는 모든 하위 역량이 충족되지 않거나, 심지어 평가받지 않아도 매우 competent할 수 있다. 이는 환자가 모든 증상과 소견이 발견되지 않는 상태에서도 특정 진단을 받을 수 있는 것과 매우 비슷하다. 따라서 역량 프레임워크를 체크리스트로 사용하는 대신 평가자의 전문가 판단을 설명하고 지원하는 데 더 잘 사용될 수 있다.
But even with the gestalt-type, top-down processing, individual signs and symptoms are very useful; they are needed to describe, evaluate and actually help improve the patient’s health status. In line with our first analogy between ‘illness’ and ‘dyscompetence’, the long lists of competencies, sub-competencies and even sub-sub-competencies are not trivial, but they are to be used as the equivalent of signs, symptoms and findings to describe, evaluate and improve the learner’s dyscompetence. Of course, a learner can be highly competent despite not all sub-competencies being met or even assessed, much like a patient can have a certain diagnosis without all the symptoms and findings being present or being diagnosed. So instead of using competency frameworks as checklists they are probably better used to explain and support the assessors’ expert gestalt judgements.
유사 5: 의료 및 평가 시스템은 모두 [전문가]에게 의존하며, 이들은 개발과 육성이 필요하다. Analogy 5: Healthcare and assessment systems both rely on expert practitioners that must be developed and nurtured
어떤 의료 조직도 의료진의 전문성expertise 없이는 작동하지 못한다는 것은 명백합니다. 조직 내 절차의 표준화 및 구조화가 의료의 품질에 매우 유익하지만(예를 들어 증거 기반 의학은 의료 의사결정에 더 많은 정보를 제공하는 데 있어 중요한 역할을 해왔다) 전문성expertise을 대체하지는 못합니다. 환자 차트의 포맷이 우수하다면, 임상의가 상담을 원활히 수행하도록 지원해준다는 점에서 유용하지만, 형식 자체가 의사의 전문성을 대체하지는 못한다. 더욱이, Hb 예와 같이, 데이터 수집은 객관적으로 이루어질 수 있지만, 데이터 해석은 결코 그렇지 않다. 동일한 Hb 수치는 한 환자에서 우려의 원인이 될 수 있고 다른 환자에서 낙관론의 이유가 될 수 있다. It is clear that no medical organization can function without the expertise of its healthcare staff. Although standardization and structuring in procedures in the organization has been very beneficial to the quality of healthcare – evidence-based medicine for example has been instrumental in ensuring that medical decisions are more evidence informed – they do not provide a substitute for expertise. A good format for a patient chart is helpful when it supports the clinician in doing a consultation but the form in itself does not replace the physician’s expertise. Moreover, as with the Hb example, data collection can be done objectively, but data interpretation never is. The same Hb level can be cause for concern in one patient and reason for optimism in another.
평가에 대해서도 마찬가지다. 전통적인 평가에 대한 미신 중 하나는 평가가 객관적이어야 한다는 것이나, 평가는 결코 객관적이지 않다. 가장 구조화된 객관식 시험조차도 수많은 인간 판단의 결과이다: 어떤 주제를 다루어야 하는지, 시험 사이의 주제 구분 - 청사진 - 포함시킬 실제 항목, 항목의 문구 등. 객관화된 것은 오직 마지막 부분인 데이터 수집일 뿐이다. 그저 [전문가의 주관적인 판단이 모조리 시험지 제작에 사용되었기 때문에], 양식의 배포, 답안지를 수거, 심지어 점수 계산까지 어린이도 할 수 있을 뿐이다. [직장 중심의 평가WBA]는 정반대이기 때문에, [관찰]에 전문성이 필요하다. 평가 양식의 구체적 디자인은 상대적으로 덜 중요하고, 전문 심사관이 업무를 수행하는 데 도움이 되는지가 더 중요하다. 분명히 우리는 어린이가 WBA를 수행하거나, 심지어 전무성 없는 성인이 WBA를 수행하는 것은 꿈조차 꾸지 않을 것이다. The same applies to assessment; a common myth with the traditional approach is that assessment should be objective, but assessment actually never is. Even the most structured multiple choice examination is the result of numerous human judgements: what topics to cover, the division of topics among the test – the blueprinting –, the actual items to include, the wording of the items, etc. It is only the final part, the data collection, which is objectified. Young children would be able to hand out the forms, take in the answer sheets and even calculate the scores, simply because all the subjective expert judgments have been used in the production of the test paper. With workplace-based assessment it is exactly the other way around, the expertise is needed when the observation is made. The specific design of the form is relatively unimportant as long as it facilitates the expert examiner in their task. Clearly we would not dream of having our young children perform a workplace-based assessment, or even an adult with no specific expertise.
결론은, 모든 유형의 평가에서, [(다양한 보건 전문가 영역에서) 전문성을 가진 인간의 판단이 필요]하며, 이 판단은 [충분한 내용 전문성]과 [평가 전문성]을 기반으로 하는 경우에만 타당하고 신뢰할 수 있다는 것이다[12, 18]. 전문가를 효과적이고 효율적으로 지원하고 촉진하며 신중성과 투명성, 문서화, 대학간 협의가 이뤄질 수 있는 절차를 갖춘 조직의 지원을 받아야 한다. 따라서 이러한 조직은 [교수 개발]과 [평가 전문성 개발]에 자원을 투입해야 합니다. 이것의 궁극적인 결과는, 평가가 단순한 [측정 문제]가 아니라 [교육 설계와 직원 개발 문제]라는 것이다. The bottom line is that in every type of assessment expert human judgement – from various health professional domains – is needed and this judgement is only valid and reliable if it is based on sufficient content and assessment expertise [12,18]. It must be supported by an organization that will effectively and efficiently support and facilitate the expert and that has procedures in place to ensure carefulness, transparency, documentation, and inter-collegial consultations. Therefore, such an organization will need to devote resources to staff development and development of assessment expertise. The ultimate corollary of this is that assessment is not merely a measurement problem, but an educational design and staff development issue.
결론 Conclusion
이러한 유사성을 통해 우리는 평가에서 현재의 발전 이면에 있는 사고와 의료 사고방식에 의해 실제로 어떻게 높은 정보를 얻을 수 있는지를 설명하려고 노력했습니다. 우리가 길게 다루지 않은 유사점 중 하나는 [돌봄care의 연속성]에 대한 것이다. 건강health과 마찬가지로, 최적의 역량competence 개발을 위해서는 [지속성longitudinality]이 중요하며, 여러 기관 간 인수인계가 필수적입니다. 충분한 정보가 기록된 문서가 없다면, 인계는 거의 불가능하며, 여러 교육 단계 간의 '인계'도 마찬가지입니다. 학부부터 대학원, 그리고 지속적인 의학 교육에 이르기까지, 프로그래밍 방식의 평가는 역량 개발을 모니터링하고 최적화하는 통로가 될 것입니다.
With these analogies we have tried to illustrate the thinking behind current developments in assessment and how it is actually highly informed by the thinking in healthcare. One of the analogies we have not discussed in length is the one with continuity of care. For optimal development of competence, as with health, longitudinality is important and hand-overs for example between echelons are essential. Hand-over without an informative document is nearly impossible and so would be the ‘hand-over’ between stages of training. From undergraduate to postgraduate to continuing medical education, programmatic assessment would be the conduit through which competence development is monitored and optimized.
그러나, 솔직히 말하면, 교육 개념으로서의 프로그램적 평가가 [현실적 맥락]과 맞닿아야 하는 부분이 여기에 있다. 전세계적으로 성공적인 프로그램적 평가 구현의 사례가 있지만, 이는 중요한 의제로 다뤄져야 한다. [5, 7] 이에 대한 이유는 정확히 프로그램 평가와 건강관리 사이의 유사성이 실패하는 측면에 있다. 가장 중요한 차이점은 다른 문화이다;
[환자들은 일반적으로 의사를 그들의 지지자supporter]로 보지만, [평가를 받는 학습자들은 종종 평가자를 그들의 상대opponent]로 본다.
[환자들은 진단과 치료 과정으로서 건강관리의 실천에 익숙]하며, 그것은 그들이 의사와 상담할 때 기대하는 것입니다. 반면 교육생, 학습자, 교사들의 교육 경험은 프로그램 평가와는 상당히 달라왔기에, PAL을 시행하기 전에, 무엇이 [정상 평가normal assessment]를 구성하는지에 대한 교수자와 학습자의 생각이 바뀌어야 할 것이다.
But, to be frank, here is where programmatic assessment as an educational concept has to come to grips with the practical context. Despite the successful implementations of programmatic assessment around the world, this is the aspect that should be put high on the agenda [5,7]. The reason for this lies precisely in the aspects in which the analogy between programmatic assessment and healthcare fails. The most important difference is the different cultures;
in healthcare, patients generally see their doctor as their supporter but in assessment learners often see their examiner as their opponent.
Also, patients are used to the practice of healthcare as a diagnostic and therapeutic process and it is what they expect when they consult a doctor. The experiences with education of trainees, learners and teachers on the other hand, have been quite different from programmatic assessment and therefore their ideas about what constitutes normal assessment will need to change before PAL can be implemented.
비록 제한적이더라도, 우리가 [프로그램적 평가]와 [건강관리] 사이의 유사성이 평가 개발자와 감독자/학생/훈련자 사이의 보다 공통적인 언어를 개발하는 데 도움이 될 수 있기를 바라는 이유이다. 우리는 [공유된 의사 결정을 통해 환자를 건강관리에 참여시키는 것]처럼, 이러한 [공유된 언어]가 평가 과정에 교수자와 학습자의 참여를 더욱 자극하기를 바란다.
This is why we hope that these analogies between programmatic assessment and healthcare, limited as they may be, can help in developing a more common language between assessment developers and supervisors/students/trainees. We hope further that such a shared language would stimulate their involvement in the assessment process, much like involving patients in management through shared decision making.
Perspect Med Educ. 2017 Aug;6(4):211-215.
doi: 10.1007/s40037-017-0345-1.
What programmatic assessment in medical education can learn from healthcare
1Prideaux Centre for Research in Health Professions Education, School of Medicine, Flinders University, Adelaide, South Australia, Australia. l.schuwirth@maastrichtuniversity.nl.
2Department of Educational Development and Research, Maastricht University, Maastricht, The Netherlands. l.schuwirth@maastrichtuniversity.nl.
3Department of Educational Development and Research, Maastricht University, Maastricht, The Netherlands.
4Prideaux Centre for Research in Health Professions Education, School of Medicine, Flinders University, Adelaide, South Australia, Australia.
5Department of Medicine and Pathology, F. Edward Hébert School of Medicine, Uniformed Services University, Bethesda, USA.
CBME에서 프로그램적 평가와 프로그램 평가의 관계 탐색(Med Teach, 2020) Exploring the connections between programmatic assessment and program evaluation within competency-based medical education programs Katherine A. Moreaua,b
프로그램적 평가와 프로그램 평가는 역량 기반 의료 교육(CBME) 프로그램에서 필수적인 개념이다.
프로그램적 평가는,
[평가에 대한 하나의 접근방식으로서, 훈련기간 전체에 걸쳐 학습자의 진행률과 역량을 평가하기 위한 정보의 지속적인 수집, 분석, 집계 및 삼각측량]을 포함한다.
프로그램적 평가에서 측정의 대상은 [개별 학습자]입니다.
여러 출처의, 다양한 평가 도구를 사용하는 것에 의존하여, 학습자의 성과와 개선 영역에 대해 학습자와 멘토에게 정보를 제공한다.
반대로, 프로그램 평가는
'프로그램에 대한 판단을 내리고, 프로그램 효율성을 개선하며, 미래 프로그래밍에 대한 결정을 알리기 위한 프로그램의 활동, 특성 및 결과에 대한 체계적인 정보 수집'이다(23 페이지).
프로그램 평가에서 측정의 대상은 [프로그램 자체]이다.
프로그램 평가는 올바르게 수행될 경우 필요한 프로그램의 유형, 프로그램의 구현, 프로그램 개선을 위한 영역 및 프로그램 결과의 달성(또는 부족)에 대한 중요한 정보를 제공한다(Cook 2010).
Programmatic assessment and program evaluation are essential concepts within competency-based medical education (CBME) programs.
Programmatic assessment,
an approach to assessment, involves the continuous collection, analyses, aggregation, and triangulation of information to assess a learner’s progress and competence throughout his/her training (Schuwirth et al. 2017; Schuwirth and Van der Vleuten 2019).
The object of measurement in programmatic assessment is the individual learner.
It relies on the use of various assessment tools, from multiple sources, to inform the learner and mentor(s) about the learner’s achievements and areas for improvement (Schuwirth and Van der Vleuten 2019).
Conversely, as Patton (1997) notes, program evaluation is ‘the systematic collection of information about the activities, characteristics, and outcomes of programs to make judgments about a program, improve program effectiveness, and/or inform decisions about future programming’ (p. 23). The object of measurement in program evaluation is the program itself. Program evaluation, when done correctly, provides vital information about the types of programs needed, the implementation of programs, areas for program improvement, and the attainment (or lack thereof) of program outcomes (Cook 2010).
프로그램 평가와 프로그램 평가를 구별하고 두 개념 사이의 연결을 강조하기 위해 더 많은 연구가 필요하다. 그러한 탐구는 CBME 프로그램 내에서 프로그램 평가와 프로그램 평가의 사용 및 편익을 극대화하는 데 도움이 될 것이다.
need further exploration in order to distinguish between programmatic assessment and program evaluation as well as highlight the connections between the two concepts.
프로그램적 평가의 평가 Evaluating programmatic assessment
[프로그램적 평가]는 목표, 투입, 활동, 산출 및 성과가 있다는 점에서 (교육)프로그램과 유사하다. 따라서 확립된 프로그램 평가 모델 또는 접근방식을 사용하여 프로그램 평가를 평가할 수 있다(Gandomkar et al. 2015). 예를 들어, 연구자들은 새로운 커크패트릭 모델(Moreau 2017) 또는 기여 분석(Moreau and Eady 2015; Van Melle 등 2017)이 CBME 프로그램의 평가와 프로그램 평가의 확장에 효과적일 것임을 강조했다.
Programmatic assessment resembles a program in that it has objectives, inputs, activities, outputs, and outcomes. Therefore, it is feasible to evaluate programmatic assessment using established program evaluation models or approaches (Gandomkar et al. 2015). Researchers have highlighted, for example, that the New World Kirkpatrick Model (Moreau 2017) or contribution analysis (Moreau and Eady 2015; Van Melle et al. 2017) would work well for the evaluation of CBME programs and by extension for the evaluation of programmatic assessment.
[새로운 커크패트릭 모델]은 교육 프로그램과 관련하여 참가자의 반응, 학습 및 행동뿐만 아니라 프로그램으로 인해 결과(즉, 특정 결과)가 발생하는 정도를 평가한다. 이 모델을 프로그램적 평가의 평가에 사용한다면, 예를 들어 다음을 평가하는 데 초점을 맞출 것입니다.
학습자가 프로그래밍 평가가 유익하고 훈련에 적합하다고 생각하는 정도,
프로그래밍 평가가 학습자의 지식, 기술 및 주어진 영역에 대한 자신감에 영향을 미치는 정도
학습자가 훈련과정에서 프로그램적 평가에서 수집한 정보를 활용하는 정도
프로그램적 평가가 학습자가 목표한 교육 성과를 달성하는 데 도움이 되는 정도.
The New World Kirkpatrick Model evaluates participants’ reactions, learning, and behaviours in relation to a training program as well as degree to which results (i.e. specific outcomes) occur because of a program (Kirkpatrick and Kirkpatrick 2016; Moreau 2017). When using it to evaluate programmatic assessment, the focus would be on evaluating, for instance,
the degree to which learners think the programmatic assessment is beneficial and relevant to their training,
the extent to which the programmatic assessment influences learners’ acquisition of knowledge, skills, and confidence in given areas,
the level to which learners use information collected in the programmatic assessment in their training, and
the degree to which the programmatic assessment helps learners achieve their targeted educational outcomes (Kirkpatrick and Kirkpatrick 2016).
대안적으로, 이론 기반 평가 접근법인[기여 분석]은, 프로그램을 특정 결과에 변화를 가져오기 위해 다른 변수와 함께 작동하는 [인과 패키지]의 일부로 본다.
프로그램적 평가의 평가에 기여 분석을 사용한다면, [관찰된 학습자 성과에 대한 프로그램적 평가의 기여도를 평가]하는 데 초점을 맞출 것이다.
이 접근법으로, 프로그램 평가가 학습자 성과의 변화를 가져오는 데 있어서, 다른 요인 및 CBME 프로그램(예: 멘토링 등)의 개입과 함께 작동하는 [인과적 패키지의 필수적인 부분임을 보여주는 증거 수집]에 중점을 둘 것이다(Mayne 2012; Moreau and Eady 2015).
Alternatively, contribution analysis, a theory-based evaluation approach, views programs as parts of causal packages that work together with other variables to bring about changes in specific outcomes (Mayne 2012; Moreau and Eady 2015).
When using contribution analysis, to evaluate programmatic assessment the focus would be on evaluating the contribution that the programmatic assessment has made to the observed learner outcomes.
With this approach, the emphasis would be on collecting evidence to show that the programmatic assessment is an essential part of a causal package that works together with other factors and interventions in the CBME program (e.g. mentorship, academic half days) to bring about changes in learner outcomes (Mayne 2012; Moreau and Eady 2015).
선택된 평가 모델 또는 접근방식이 프로그램 평가에서 제기되는 주요 질문에 영향을 미치겠지만, Schwirth와 Van der Vleuten(2019)은 프로그램 평가에서 질문된 평가 질문에 정보를 제공할 수 있는 프로그램 평가의 네 가지 원칙을 기술하는 것도 주목할 가치가 있다. 평가 이러한 원칙은 프로그래밍 방식의 평가가 다음을 포함해야 함을 시사한다. While the selected evaluation model or approach will influence the major questions posed in the evaluation of programmatic assessment, it is worthwhile to also note that Schuwirth and Van der Vleuten (2019) describe four principles of programmatic assessment that, in turn, can inform the evaluation questions asked in the evaluation of programmatic assessment. These principles suggest that programmatic assessment should involve:
(1) 평가 정보의 삼각측량을 가능하게 하기 위한 복수의 평가 도구 사용
(2) 학습자의 종단적 평가
(3) 신뢰할 수 있는 정성 및 정량 평가 데이터를 생성하기 위한 다중 및 품질 평가 전략
(4) 학습자와 멘토가 사용할 수 있는 의미 있는 피드백(슈워스 및 반 데르 블뢰텐 2019).
(1) the use of multiple assessment instruments in order to enable the triangulation of assessment information;
(2) longitudinal assessments of a learner;
(3) multiple and quality assessment strategies in order to produce qualitative and quantitative assessment data that is credible; and
(4) meaningful feedback for a learner and his/her mentor(s) that they can use (Schuwirth and Van der Vleuten 2019).
이러한 원칙을 고려할 때, [프로그램적 평가의 평가]를 위한 질문은 다음을 포함할 수 있다.
(1) 프로그래밍식 평가는 여러 평가 도구를 어느 정도 사용하는가?
(2) 프로그래밍식 평가는 각 학습자에 대한 종방향 평가를 수집합니까?
(3) 프로그래밍 방식 평가는 신뢰할 수 있는 정성 및 정량 평가 데이터를 수집하고 사용하고 있는가? 그리고
(4) 프로그래밍 방식의 평가는 학습자와 멘토에게 어느 정도 의미 있고 유용한 피드백을 제공하는가?
Given these principles, relevant questions for the evaluation of programmatic assessment could include:
(1) To what extent does the programmatic assessment use multiple assessment instruments?
(2) Does the programmatic assessment collect longitudinal assessment for each learner?
(3) Does the programmatic assessment collect and use both credible qualitative and quantitative assessment data? and
(4) To what extent does the programmatic assessment generate meaningful and useful feedback for the learner and his/her mentor(s)?
CBME 프로그램 평가를 위한 프로그램적 평가 사용 Using programmatic assessment for the evaluation of CBME programs
프로그램적 평가에서, [각 학습자에 대한 개별 평가]는 [학습자의 훈련 필요성 또는 성취에 대한 결정]을 내리기 위해, [각 학습자의 진행 상황과 역량에 대한 전체적인 설명]을 제공하는 [포트폴리오 또는 문서집dossier]의 일부가 된다(Schuwirth, et al. 2017; Schuwirth 및 Van der Vleuten 2019). [학습자가 평가를 분석하고 응답할 수 있도록 도와주는 코치 또는 멘토의 관찰] 외에, [포트폴리오 또는 문서집] 역시 [교육자가 CBME 프로그램의 평가에 사용할 수 있는 공식 및 비공식 정보의 저장소]를 제공합니다. In programmatic assessment, individual assessments of each learner become part of, for example, a portfolio or dossier that provides educators with a holistic depiction of each learner’s progress and competencies in order to make decisions about his/her training needs or accomplishments (Schuwirth, et al.2017; Schuwirth and Van der Vleuten2019). These portfolios or dossiers, in addition to the observations of coaches or mentors who help the learner analyze and respond to the assessments, provide a repository of formal and informal information that educators can then use for the evaluation of CBME programs.
[프로그램적 평가를 통하여 여러 학습자에 대하여 수집된 정보의 모음]은 CBME 프로그램 내의 커리큘럼과 학습 환경의 품질에 대한 통찰력을 제공할 수 있다(Van der Vleuten et al. 2015). CBME 프로그램의 성공과 단점을 강조할 뿐만 아니라 교육 효과의 귀중한 지표가 될 수 있다(미국 교육 연구 협회 외 2014). 예를 들어,프로그램 평가에서 수집된 정보가
대다수의 학습자가 특정 분야에 대한 지식, 기술 및 자신감을 습득하기 위해 고군분투하고 있다는 것을 보여준다면, CBME 프로그램 내의 교육자들은 변화가 필요한지 확인하기 위해 교육 및 평가 실습을 검토하기를 원할 수 있다.
특정 학습자 그룹 간에 일관되게 관찰된 차이(예: 성별, 인종, 언어 능력 등)를 보인다면, CBME 프로그램은 이러한 차이를 최소화하기 위해 변경이 필요한지 확인하기 위해 다시 한번 교육 및 평가 관행을 검토하고자 할 것이다.
The aggregation of information collected in programmatic assessment across learners can provide insight on the quality of curricula and learning environments within CBME programs (Van der Vleuten et al.2015). It can be a valuable indicator of educational effectiveness as well as highlight the successes and shortcomings of CBME programs (American Educational Research Association et al.2014). For instance,
if the information collected in programmatic assessment illustrates that the majority of learners are struggling to acquire knowledge, skills, and confidence in a specific area, educators within a CBME program may want to examine their teaching and assessment practices to see if changes are needed.
Furthermore, if the information collected in programmatic assessment shows consistently observed differences among specific groups of learners (e.g. classified by gender, race, language proficiency) then a CBME program would again want to examine their teaching and assessment practices to see if changes are necessary to minimize such differences (American Educational Research Association et al. 2014).
CBME 프로그램을 평가할 때, 특히 프로그램 평가를 위한 자원이 제한된 경우, [오로지 프로그램 평가를 목적으로 새로운 정보나 데이터를 수집]하기보다는, 기존 프로그램 정보(즉, 일상적인 프로그램 운영에서 수집된 정보)의 사용을 극대화하는 것이 필수적이다. 대부분의 CBME 프로그램에서는 프로그램적 평가가 필수이고, 이 평가가 프로그램 내 학습자에 대한 다양한 정보를 포함하고 있다는 점을 고려할 때, CBME 프로그램 평가에서 이를 핵심 정보 출처로 활용하는 것은 논리적이며 재정적으로 책임있는 접근이다. 이 기존 정보를 활용하면 데이터 수집 피로감뿐만 아니라 프로그램 평가 부담을 최소화할 수 있다. 또한 평가 정보를 쉽게 이용할 수 있고 프로그램의 일상적인 운영에서 지속적으로 수집 및 업데이트되기 때문에 CBME 프로그램의 평가 능력을 향상시키고 프로그램 평가를 더 자주 수행할 수 있다. 그러나 프로그램에 대한 포괄적인 이해를 얻기 위해서는, CBME 프로그램을 평가할 때는 [프로그램적 평가에서 수집된 정보]를 [기존의 다른 출처의 정보와 결합]하는 것이 중요하다. When evaluating CBME programs, especially those with limited resources for program evaluation, it is essential to maximize the use of existing program information (i.e., information collected in the day-to-day program operations) rather than collecting new information or data for the sole purpose of program evaluation. Given that programmatic assessment is a staple within most CBME programs, and that it includes a plentiful array of information on learners within a program, it is logical and financially responsible to use it as a key information source within the evaluation of CBME programs. The usage of this existing information can minimize the burden of program evaluation as well as data collection fatigue. It can also enhance the evaluation capacities of CBME programs and enable them to do program evaluations more frequently because the evaluation information is readily available and continuously collected and updated in the day-to-day operations of the programs. However, when evaluating CBME programs, it is important to combine the information collected in programmatic assessment with other existing sources of information in order to obtain a comprehensive understanding of the programs.
전체적으로 CBME 내에서 [프로그램적 평가]와 [프로그램 평가]는 중요한 역할을 하고 있으며, CBME가 의도한 대로 운영되고 있는지 확인하고 개선점을 판단하기 위해서는 [프로그램적 평가를 평가하는 것]이 중요합니다. 또한 프로그램적 평가에서 수집된 정보를 사용하는 것이 필수적인데, 그래야 CBME 프로그램에 대한 판단에 필요한 정보를 얻을 수 있으며, CBME 프로그램을 개선할 수 있고, CBME 프로그램의 향후 방향을 가이드할 수 있기 때문이다. [프로그램적 평가]와 [프로그램 평가]는 별개의 개념이며, 각각이 CBME 프로그램 내에서 특정 기능을 수행하지만, 적절히 도입된다면 서로를 보완하고 CBME 프로그램의 전반적인 효과에 기여할 수 있다.
Overall, programmatic assessment and program evaluation have important roles within CBME. It is important to evaluate programmatic assessment in order to ensure that it is operating as intended and to determine needed improvements in it. Moreover, it is imperative to use the information collected in programmatic assessment to inform judgments about CBME programs, improve CBME programs, and guide future directions for CBME programs. While programmatic assessment and program evaluation are distinct concepts and serve specific functions within CBME programs, they, when employed appropriately, can complement each other and contribute to the overall effectiveness of CBME programs.
Med Teach. 2021 Mar;43(3):250-252.
doi: 10.1080/0142159X.2020.1841128.Epub 2020 Nov 2.
Exploring the connections between programmatic assessment and program evaluation within competency-based medical education programs
Programmatic assessment and program evaluation are both important within competency-based medical education (CBME) programs. Given this importance, there is value in evaluating programmatic assessment as well as using the information collected in programmatic assessment for the evaluation of CBME programs. In order to help facilitate these two activities, this paper distinguishes between programmatic assessment and program evaluation as well as highlights the connections between them. In doing so, it shows that programmatic assessment and program evaluation, when employed appropriately, can complement each other and contribute to the overall effectiveness of CBME programs.
CBME에서 프로그램적 평가의 계획과 설계(Med Teach, 2021) Key considerations in planning and designing programmatic assessment in competency-based medical education Shelley Rossa,b , Karen E. Hauerc , Keith Wycliffe-Jonesd , Andrew K. Halle,f , Laura Molgaardg , Denyse Richardsonf,h , Anna Oswaldf,i , and Farhan Bhanjif,j ; On behalf of the ICBME Collaborators
소개 Introduction
역량 기반 의료 교육(CBME) 맥락에서 평가에 대한 효과적인 접근방식을 설계하고 구현하는 것은 어려운 노력이다(Lurie 2012). 2017년 해리스 외 연구진(2017)은 평가 프로그램(프로그래밍 평가)의 설계를 고려해야 한다고 결론내리며, 그 이유를 어떤 하나의 평가도 모든 역량에 대한 타당한 평가를 할 수 없기 때문이라고 설명했다. 오히려, [바람직한 성과]와 [평가]를 연결하는 프로세스를 가진 명확한 프레임워크 내에서, [목적에 적합한 여러 관찰과 도구의 의도적인 결합] 또는 [프로그래밍적 평가]가 아마도 앞으로의 방법일 것이다(Iobst and Holmboe 2020; Lockyer et al. 2017). Designing and implementing an effective approach to assessment in competency-based medical education (CBME) contexts is a challenging endeavour (Lurie2012). In 2017, Harris et al. (2017) concluded that designing a program of assessment (programmatic assessment) warrants consideration, because no one tool or single assessment will result in valid assessment of all competencies. Rather, programmatic assessment, or the intentional combining of multiple observations and tools fit for purpose, within a clear framework with processes to link assessments to desired outcomes, is probably the way forward (Iobst and Holmboe2020; Lockyer et al.2017).
Van Der Vleuten과 Schwirth(2005)에 의한 건강 전문직 교육의 맥락에서 프로그램 평가에 대한 첫 번째 설명은 [다수의 평가 사례에 걸친 표본 추출 증가의 필요성]과 [통합적 평가 프로그램의 필요성]에 대한 이전의 제안을 바탕으로 작성되었다(Van Der Vleuten 1996). 2011년에 CBME의 글로벌 도입은
학습자 중심의 접근방식을 활용하고
역량에 초점을 맞추고
학습의 평가와 학습을 위한 평가 모두를 고려하고,
역량을 평가하고 학습자의 진행 궤적을 결정하기 위해 복수의 평가자가 완료한 여러 도구를 통합하는
...평가 프레임워크를 요구했다.
The first description of programmatic assessment in the context of health professions education by van der Vleuten and Schuwirth (2005) built on earlier proposals about the need for increased sampling across multiple assessment occasions (Van Der Vleuten1996) and the need for an integrated assessment program (Baartman et al.2007). In 2011, the global introduction of CBME called for assessment frameworks that
utilize a learner-centred approach,
focus on competencies,
consider assessment both for learning and of learning, and
incorporate multiple tools completed by multiple assessors to assess competence and determine a trajectory of progress for the learner (Ross et al. 2011, 2012; McEwen et al. 2015).
기존 관행과 크게 다른 새로운 아이디어 또는 보건 직업의 접근방식을 채택하면 위험과 이점이 모두 존재한다. 이론이나 증거에서 적용으로의 이동은 종종 도전과 장애로 가득 찰 수 있다. With any adoption of new ideas or approaches in health professions education that differ significantly from existing practices there are both risks and benefits. The move from theory or evidence to application can often be fraught with challenges and obstacles.
임상 교육에서 개념으로서의 프로그램 평가는 여전히 새로운 개념이며, [프로그래밍 평가에 대해 발표하는 학계]와 [이론을 실행에 옮기는 책임을 지는 일선 임상 교육자]들 사이에 단절이 있을 수 있다(Bok 등 2013; Bate 등 2020). 따라서, 필수적인 시작은 모든 사람이 그러한 새로운 아이디어나 혁신적인 관행과 이를 뒷받침하는 원칙에 대한 통일된 이해를 공유하도록 하는 것이다. Programmatic assessment as a concept is still novel for many in clinical education, and there may be a disconnect between the academics who publish about programmatic assessment and the front-line clinical educators charged with putting theory into practice (Bok et al.2013; Bate et al.2020). Therefore, an essential beginning is to ensure that everyone shares a unified understanding of such new ideas or innovative practices and the principles that underpin them.
프로그래밍식 평가란 무엇인가? What is programmatic assessment?
[프로그램 평가]는 '합목적성을 최적화하기 위해 계획된 평가 방법의 배열'이다(van der Vleuten et al. 2012, 페이지 205). [개별 평가 방법을 개별 과정이나 임상로테이션이나 역량을 위해 별도로 고려하는 기존 접근법]보다 [교육 설계에 더 가까운 접근법]으로서, [세 가지 필수 평가 기준(신뢰성, 타당성, 학습에 미치는 영향)]을 충족하는 다른 평가 방법과 도구의 의도적인 결합이다. 또한, 평가도구는 [도구를 통해 수집된 증거의 조합이, 정의된 성과의 집합에 걸쳐, 학습자의 역량에 대한 방어가능한 평가를 수행하도록 보장]하는 동시에, [학습을 위한 평가를 극대화]하기 위하여 선택된다. 평가 시스템은 학습자의 [역량 향상의 진전에 대한 정보를 수집]하고, [학습을 지원]하는 [이중적인 목적]을 갖는데, 이는 보건 직업 교육과 평가에 대한 생각의 시프트를 나타낸다. 따라서 학습자의 성장과 발전은 프로그램 평가 설계 시 필수적인 고려사항이다. Programmatic assessment is ‘an arrangement of assessment methods planned to optimize its fitness for purpose’ (van der Vleuten et al.2012, p. 205). It is the intentional combining of different assessment methods and tools that meet three essential assessment criteria (reliability, validity, impact on learning) in an approach that is closer to instructional design than to traditional approaches that consider individual assessment methods in isolation for separate courses, clinical rotations, or competencies (van der Vleuten and Schuwirth2005). Further, the choice of tools is intended to maximize assessment for learning, while ensuring that the combination of evidence collected through the tools will result in a defensible assessment of the competence of a learner across a defined set of outcomes (Dijkstra et al.2010). This dual purpose of the assessment system–to both support learning and capture information about the progress of learners toward competence–represents a shift in thinking about health professions education and assessment (van der Vleuten et al.2012; Schuwirth and van der Vleuten2019). The growth and development of learners thus constitutes an integral consideration in designing programmatic assessment (Schuwirth and Van der Vleuten2011; Heeneman et al.2015; Van Der Vleuten et al.2015; Swan Sein et al.2020).
[프로그램 평가의 설계]에는 [특정 도구를 선택하고, 그 도구를 선택한 이유를 포함해야 하며, 선택된 도구에 의해 산출된 데이터를 사용하는 '의사결정 프로세스'의 구체적이고 상세한 설명]을 포함해야 한다. '의사결정 프로세스'는
복수의 관찰에서 나온 평가 데이터를 결합하는 방법뿐만 아니라
어떻게해당 데이터를 해석(그리고 누구에 의해 해석)하며
그 결과 어떻게 역량에 대한 진전 또는 입증에 대한 의사결정에 도달하는 지로 구성된다.
표 1은 프로그램 평가가 무엇인지와 아닌지에 대한 그림을 형성하기 위한 프로그램 평가의 필수 요소를 보여줍니다. Programmatic assessment design includes both the selection of tools, including the rationale for the selection, and a specific detailed description of the decision-making process that uses the data yielded by the selected tools. The decision-making process consists of
the way assessment data from multiple observations will be combined, as well as
how that data will be interpreted (and by whom),
to arrive at a decision about progress toward, or demonstration of, competence (Tweed and Wilkinson 2019; Zoanetti and Pearce 2020).
Table 1lists the essential elements of programmatic assessment to form a picture of what programmatic assessment is–and what it is not.
표 1. 프로그램 평가의 필수 요소. Table 1. Essential elements of programmatic assessment.
프로그래밍 방식 평가는 이런 것이다. - 여러 평가 도구를 사용하여 여러 데이터 지점을 기반으로 의사 결정 - 여러 가지 평가 방법 - 데이터 점의 수가 결정의 이해 관계와 비례적으로 관련된 의사결정 - 학습자가 자신의 성과에 대한 데이터를 사용하여 학습 코치의 도움을 받아 자신의 학습을 반성하고 지도하도록 유도 - 여러 관찰자로부터 수집된 증거에 대한 전문적인 판단(전문가 그룹 또는 위원회에 의한)에 기초한 진행 결정
Programmatic assessment IS - Decision-making based on multiple data points using multiple assessment tools - Multiple methods of assessment - Decision-making in which the number of data points is proportionally related to the stakes of a decision - Encouraging learners to use data about their performance to self-reflect and direct their own learning with the support of learning coaches - Progression decisions based on professional judgment (by a group of experts or committee) of the compiled evidence from multiple observers
프로그래밍 방식 평가는 이런 것이 아니다. - 한 번의 검사 - '모든 것'을 검사하는 경우에도 마찬가지입니다. - 단일 도구로 모든 데이터 수집 (예: 시험만 또는 EPA만 또는 OSCE만) - 그저 긍정적이고 고무적인 피드백의 모음 Programmatic assessment is NOT A single examination–even if the examination covers ‘everything’ A single tool for all data collection (e.g. only examinations or only Entrustable Professional Activities or only Objective Structured Clinical Examinations) A collection of only positive and encouraging feedback
Dijkstra et al. 2010; Eva et al. 2016; Schuwirth and van der Vleuten 2019; Tweed and Wilkinson 2019; van der Vleuten et al. 2012; Van Der Vleuten 1996; van der Vleuten and Schuwirth 2005; Zoanetti and Pearce 2020.
프로그램 평가 설계를 위한 제안된 지침 Suggested guidelines for the design of programmatic assessment
Norcini 등(2018)이 설명한 좋은 평가를 위한 프레임워크를 기반으로 하는 CARVE 원칙(Bhanji 등. 2020)은 설계자가 평가 도구를 선택하고 도구가 이행되는 목적을 고려할 때 수행해야 하는 초기, 가장 중요한 심의를 알려준다. 특정 평가의 목적에 따라 평가 프로그램을 설계할 때 CARVE가 기술한 다섯 가지 서로 다른 개념과 개별 개념의 목적적합성과 가중치가 달라질 수 있다. 평가 프로그램이 작동되면 CARVE 원칙은 프로그램의 지속적인 품질 개선에도 활용될 수 있습니다.
The CARVE principle (Bhanji et al.2020), which is based on the framework for good assessment described by Norcini et al. (2018), informs the initial, overarching deliberations that planners must undertake as they select assessment tools and consider the purpose the tools are fulfilling. Depending on the purpose of the particular assessment, the relevance and weighting of each of the five different and separate concepts described by CARVE may vary when designing an assessment program. Once the assessment program is functioning, the CARVE principle can also be utilized in the continuous quality improvement of the program.
C = 비용 효과성. 실제 평가 비용, 인적 비용 또는 '적합성' 비용, 실용성 및/또는 실현 가능성을 포함한 비용 효과. 또한, C는 평가 프로그램의 포괄적이고 응집력 있는 성격을 나타낼 수 있습니다.
A = 수용성. 학습자, 교수진, 전문 분야 및 사회 전반에 대한 수용성.
R = 신뢰성. 평가 결정의 일관성으로 가장 잘 개념화할 수 있습니다.
V = 타당성 또는 평가 프로그램의 의도된 구성 측정.
E = 교육적 영향
개인 레벨: 도구 또는 평가 전략이 학습 및/또는 학습자에게 피드백을 얼마나 잘 제공하는지
시스템 레벨: 교육과정 설계자에게 정보를 제공하여 품질 개선을 통해 촉매적 효과를 얻을 수 있음
C = cost-effectiveness, including actual dollar costs of the assessment, the human or ‘opportunity’ cost, the practicality and/or feasibility. Additionally, C can represent the comprehensive and cohesive nature of the assessment program.
A = acceptability to the learners, the faculty, the specialty/discipline, and importantly society at large.
R = reliability, which can best be conceptualized as the consistency in the decisions of the assessment.
V = validity, or measuring the intended construct(s), of the program of assessment.
E = educational impact, both at the
individual level (how well the tool or assessment strategy would drive learning and/or feedback to the learner) and
systems level (providing information to curriculum designers, which can have a catalytic effect through quality improvement).
평가 프로그램 설계에는 여러 가지 추가 요소가 고려되어야 합니다.
Multiple additional factors must be considered in designing programs of assessment.
Van Der Vleuten과 Schwirth(2005)가 언급한 바와 같이,
프로그래밍 방식 평가는 '일관적이고 신뢰할 수 있는 방식으로 교육 훈련 프로그램을 개발하기 위해 채택되는 체계적인 프로세스'인 [교수설계instructional design]와 같은 방식으로 접근해야 합니다.
프로그램 평가는 [결과를 염두에 두고 구축]되어야 한다. 이는 [교육과정 설계]가 [사전에 결정된 역량의 학습과 개발을 지원하기 위해 경험과 콘텐츠를 선택하기 위해 계획되어야 하는 것]과 같은 방식이다. (Torre et al. 2020).
프로그램 평가에서, 선택된 도구와 프로세스는
목적에 적합해야 하며(즉, 진척도나 역량을 결정하는 데 필요한 특정 정보를 수집하는 데 적합해야 함),
커리큘럼 전체에 통합되어야 하며,
방어 가능하고, 타당하며, 신뢰할 수 있는 정보를 제공하기 위해 의도적으로 선택되어야 한다.
그럼으로써 훈련의 진행과 완료에 관한 고부담의 결정에 대한 적절한 서포트를 제공할 수 있다.
As stated by van der Vleuten and Schuwirth (2005),
programmatic assessment should be approached in the same way as instructional design, which is ‘a systematic process that is employed to develop education and training programs in a consistent and reliable fashion’ (Reiser and Dempsey 2012, p.11).
Programmatic assessment should be built with outcomes in mind in the same way that curricular design should be planned around selecting experiences and content to support learning and development of predetermined competencies (Torre et al. 2020).
With programmatic assessment, the tools and processes that are chosen should be
fit for purpose (i.e. well suited to collecting the specific information needed to determine progress or competence),
integrated across the curriculum, and
deliberately selected to give defensible, valid, and reliable information
that will provide adequate support for high-stakes decisions around progress and completion of training (van der Vleuten et al. 2012, 2015).
종종 간과되는 프로그래밍 평가의 중요한 출발점은 [맥락의 중요성]이다(Bates and Ellaway 2016; Berkhout et al. 2018). 프로그래밍식 평가를 위한 'one size fits all' 설계는 없다. 고도로 집중된 전문 분야에 가장 적합한 도구와 프로세스는 보다 일반적인 실무에는 적합하지 않을 수 있습니다. 마지막으로, 프로그래밍 평가 설계는 임상 전 훈련과 임상 훈련 사이에 차이가 있을 것이다. A crucial starting point for programmatic assessment that is often overlooked is the importance of context (Bates and Ellaway2016; Berkhout et al.2018). There is no ‘one size fits all’ design for programmatic assessment; the tools and processes that are best suited to a highly focused specialty may well not be as suitable for a more generalist practice. Finally, programmatic assessment design will differ between preclinical and clinical training.
1단계: 목적 설명 Step 1: Articulate the purpose
프로그래밍 평가 설계에서 [첫 번째이자 가장 어려운 단계]는 모든 이해당사자를 식별하고 평가 프로그램의 목적에 동의하는지 확인하는 것이다.
학습과 교육적 영향(CARVE 원칙의 E)에 초점을 맞추고 있는가?
또는 평가의 주요 관심사는 (대학원 교육 과정에서의 선행과 마찬가지로) 의사결정의 타당성과 방어 가능성입니까?
The first, and arguably most difficult, step in designing programmatic assessment is to identify all stakeholders and ensure they agree on the purpose of the program of assessment.
Is the focus on learning and the educational impact (the E of the CARVE principle)?
Or is the primary concern of the assessment the validity and defensibility of the decisions (as in advancement to postgraduate training)?
이 첫 번째 단계의 과제는 목적의 모든 측면이 고려되고 논의되고 분명하게 표현되도록 하는 것입니다. 이 단계에서는 다음 사항에 대한 논의와 합의가 필요합니다. The challenge with this first step is ensuring that all aspects of the purpose are considered, discussed, and articulated. This step requires discussion and agreement on:
(1) 평가 시스템의 전반적인 초점 또는 의도
(2) '기준 설정'(시스템 내 학습자의 최종 목표) 및
(3) 발생해야 하는 평가 유형.
(1) the overall focus or intention of the assessment system;
(2) ‘setting the bar’ (the end goal for learners within the system); and
(3) the types of assessment that should occur.
전통적으로, 의학 교육의 평가 접근법은 훈련 프로그램에서 학습자의 순위를 매기거나 분류하는 것, 또는 학습 능력이 떨어지는 학습자를 식별하는 것에 초점을 맞추었다. CBME(Van der Vleuten and Schwirth 2005; Dijkstra et al. 2010)에 대해 프로그램 평가가 기술되고 정의되었듯이, [평가 프로그램의 목적]은 [역량의 학습과 개발을 촉진하는 방식으로 평가와 교육 및 교육 설계를 통합하는 것]이어야 한다. 문헌에서 이러한 프로그램 평가의 프레임(즉, 성과의 우열을 식별하기 보다는, 모든 학습자의 역량 개발을 목적으로 함)은 일관되지만, 프로그램 평가 설계자와 프로그램 평가가 구현될 커리큘럼 내에서 이 초점을 분명히 표현할 필요가 있다. Cronbach alpha와 같은 신뢰성에 대한 전통적인 접근법(CARVE원칙의 R)은 학습자 간의 점수 분포에 의존하므로 역량 기반 모델에 사용하기에 적합하지 않을 수 있다. Traditionally, assessment approaches in medical education have focused on ranking or classifying learners in training programs, or on identifying learners who are underperforming. As programmatic assessment has been described and defined for CBME (van der Vleuten and Schuwirth2005; Dijkstra et al.2010), the purpose of the program of assessment should be to integrate assessments with curricular and instructional design in a way that facilitates learning and development of competence (Schuwirth and Ash2013). Although this framing of programmatic assessment is consistent in the literature, this focus–on development of competence for all learners rather than on identifying superior or inferior performance–does need to be articulated among programmatic assessment designers and within the curriculum where programmatic assessment will be implemented. Traditional approaches to reliability (the R of the CARVE principle), such as the Cronbach alpha, rely on a spread of scores among learners, and therefore may not be suitable for use in competency-based models.
또한, [평가 프로그램의 최종 목표]에 대한 결정이 필요합니다. 이러한 목표는 상황에 따라 달라질 수 있습니다.
임상 전 훈련의 경우 학습자가 특정 지식 및 기술의 숙달도를 입증하는 것이 목표일 수 있습니다.
임상훈련의 경우 학부 의학교육(UME)과 졸업후의학교육(PGME)에 따라 기준이 다를 것이다.
UME에서 바는 학습자가 정의된 역량에 대해 특정 수준의 역량을 입증하는 것이고,
PGME의 경우 학습자가 특정 전문 분야에 대한 감독되지 않은 실습에 대한 역량을 입증하는 것입니다.
In addition, decisions need to be made about the end goal for the program of assessment. This goal will differ depending on context:
for preclinical training, the goal may be for learners to demonstrate mastery of a specific set of knowledge and skills.
For clinical training, setting the bar will be different between undergraduate medical education (UME) and postgraduate medical education (PGME).
In UME, the bar will be for learners to demonstrate a specific level of competence for a defined set of competencies;
for PGME, the bar will be for learners to demonstrate competence for unsupervised practice in a particular specialty.
평가 프로그램의 목적에 대한 최종 고려사항은, 특히 CBME에서, [평가가 학습과 통합되고 지원되는 방식으로 프로그램이 전체적으로 설계되도록 하는 것]이다. 잘 설계된 평가 프로그램은 다음과 같은 세 가지 주요 유형의 평가를 모두 통합한다. 학습의 평가, 학습을 위한 평가, 학습으로서 평가(Box 1)가 그것이다. The final consideration of the purpose of the program of assessment is to ensure that the program overall is designed in such a way that assessment is integrated with and supports learning (Van Der Vleuten1996; Schuwirth and Ash2013), especially in CBME. A well-designed program of assessment will incorporate all three major types of assessment: assessmentoflearning (Black and Wiliam1998), assessmentforlearning (Black and Wiliam1998; Schuwirth and Van der Vleuten2011), and assessmentaslearning (Torrance2007) (Box 1).
프로그램 평가를 설계할 때 평가 도구의 [이중 활용]을 고려할 때 주의해야 합니다. 학습에 대한 여러 평가의 집계가 전반적인 학습 평가와 관련된 결정을 뒷받침하는 증거의 일부로 방어적으로 사용될 수 있지만, 학습자가 모든 평가가 고부담 평가라고 받아들이며, 피드백, 코칭, 성장을 위해서 반드시 필요한 [약점의 노출]을 하지 않으려고 할 상당한 위험이 있다. 따라서 평가의 목적이 모든 관련자에게 명확하고 투명하며, 모든 이해 당사자가 평가 환경과 프로세스를 안전하다고 인식하고 학습자가 완전히 참여하도록 하는 것이 중요하다(Watling and Ginsburg 2019).
In designing programmatic assessment, it is important to be cautious when considering the dual-purposing of assessment tools. Although the aggregations of multiple assessmentsforlearning can be defensibly used as part of the evidence to support a decision associated with an overall assessmentoflearning, there is substantial risk that learners may assume all assessments are high stakes and may not engage in the exposure of deficiencies or struggles necessary for effective feedback, coaching, and growth. It is, therefore, crucial that the purpose of assessment be clear and transparent to all involved, to ensure that all stakeholders perceive the assessment environment and process to be safe and that learners fully engage with it (Watling and Ginsburg2019).
박스 1 평가의 세 가지 주요 유형. Box 1The three main types of assessment.
학습의 평가 = 학습자가 개념 또는 기술을 익혔는지에 대한 엔드포인트 측정
Assessment of learning = an end-point measure of whether a learner has mastered a concept or skill
학습을 위한 평가 = 학습자의 [역량 수준에 대한 저부담 수준의 정보]를 제공하여, 학습자에게는 무엇을 잘 했고 어떻게 개선할지에 대해, 교수자에게는 학습경험을 조정하고 각 학습자에게 줄 피드백에 대해 정보를 제공한다.
Assessment for learning = low-stakes information about a learner’s level of competence that gives the learner information about what went well and how to improve, and informs teachers to enable them to adjust learning experiences and feedback to each learner
학습으로서 평가 = 학습자가 자신의 학습을 모니터링하고 반영할 수 있는 기회를 제공하는 도구 또는 프로세스
Assessmentaslearning = tools or processes that give the learner opportunities to monitor and reflect on their own learning
2단계: 평가 대상 결정 Step 2: Determine what must be assessed
계획자들은 평가 대상을 결정할 때 여러 가지 고려를 할 필요가 있다. 여기에는 다음이 포함된다.
전반적인 성과와 평가 대상 및 주제의 정렬,
맥락에 대한 고려,
평가 기회를 우선함으로써 방어 가능한 진급 결정을 지원하기 위해 역량에 대한 올바른 증거가 수집되도록 함
Planners need to take a number of considerations into account when determining what must be assessed. These include
the alignment of assessment targets and topics with overall outcomes,
consideration of the context, and
prioritizing assessment opportunities to ensure the right evidence of competence is collected to support defensible progress decisions.
1단계에서, 기획자들은 프로그래밍 방식의 [평가의 최종 목표나 성과]를 결정합니다. 2단계에서, 그들은 그 결과를 더 작은 수준에서 고려한다. 용어는 참조된 문헌에 따라 다를 수 있지만, '활성화 역량Enabling competencies'라는 개념을 사용할 것입니다. 이는 ACGME가 프로그램 평가 설계의 이러한 측면을 논의할 때 사용하는 용어인 '하위 역량subcompetencies'과 비교된다.
활성화 역량Enabling competencies은 학습자가 자신의 교육 프로그램에 의해 설정된 기준 레벨에서 유능하다고 간주되기 위해 입증해야 하는 기술, 행동 및 지식입니다.
활성화 역량Enabling competencies은 거시적 수준의 역량의 전체를 구성하는 부분으로 볼 수 있으며, 훈련 프로그램이 설정한 거시적 수준의 역량에 따라 일부 중복되는 부분이 있다.
In Step 1, planners determine the end goal or outcome of the programmatic assessment. In Step 2, they consider that outcome at a more micro level. While the terminology may differ depending on the literature consulted, we will use the concept of ‘enabling competencies’ (Redwood-Campbell et al.2011; Lacasse et al.2014); it is comparable to ‘subcompetencies,’ the term used by the Accreditation Council for Graduate Medical Education (Edgar et al.2020) in discussing this aspect of designing programmatic assessment.
Enabling competencies are those skills, behaviours, and knowledge that learners must demonstrate to be considered competent at the level of the bar set by their training program.
Enabling competencies can be considered as the parts that make up a whole of a macro-level competency, and some of them overlap under the macro-level competencies set by a training program.
프로그래밍 방식 평가를 설계할 때, 반드시 [평가되어야 하는 역량들을 명확하게 표현]하는 것뿐만 아니라, 그러한 [역량들이 평가되어야 하는 맥락들을 명확히 하는 것]이 필수적이다. 예를 들어,
학습자가 유능한 성인 환자와 함께 일하는 데 필요한 의사소통 기술과
아이들과 함께 일하는 데 필요한 의사소통 기술은 다를 것입니다.
프로그래밍 방식의 평가 도구와 프로세스는 맥락의 차이를 허용해야 한다. 그래야 학습자가 자신의 전문 분야에 필요한 기술, 행동 및 지식을 적절하게 평가받기 위해 최소한의 역량을 입증해야 하는 맥락의 대표적인 표본에 걸쳐 평가받을 수 있을 것이다.
In designing programmatic assessment, it is essential to articulate the enabling competencies that must be assessed, as well as to clarify in which contexts those competencies must be assessed. For example,
the communication skills learners need to work with competent adult patients will be different from
the communication skills they need to work with children.
The programmatic assessment tools and processes should allow for differences in context to ensure that learners are adequately assessed in the necessary skills, behaviours, and knowledge of their specialty, across at least a representative sampling of the contexts in which competence must be demonstrated.
또한, 프로그램 평가 설계는 [평가될 모든 역량에 평가 기회를 분배]해야 한다. 이것은 전문분야의 요구되는 모든 역량에 대해 동일한 수의 평가가 수행되어야 한다는 것을 의미하지는 않습니다. 오히려 평가자에게 [무엇을 평가해야 하는지]와 [무엇이 역량의 충분한 증거를 구성하지는에 대한 기대]가 명확한 가이드라인으로 있어야 한다는 의미이다.
예를 들어, 학습자는 [전원요청서]나 [차트]를 평가할 때 필요한 횟수와 [임상 추론]이나 [환자 관리management]를 평가할때 필요한 횟수가 다를 것이다.
전자의 경우, 대부분의 학습자가 제한된 수의 관찰에서 역량을 입증할 수 있습니다. 일단 학습자가 몇 번의 관찰을 통해 적절한 전원요청서를 작성하거나 차트 항목을 작성할 수 있다는 것을 보여주면 학습자가 계속해서 역량 있는 행동과 기술을 입증할 수 있다는 것을 신뢰할 수 있습니다.
그러나 임상추론 역량에 대해서는, 충분한 증거가 축적되기 위해서는 다양한 임상표현에 걸친 임상적 추론의 다중 평가가 필요하다.
Further, design of programmatic assessment should distribute assessment opportunities across all competencies to be assessed. This does not mean that equal numbers of assessments need to occur for every required competency of a specialty. Rather, there should be clear guidelines for assessors about what should be assessed and about expectations regarding what constitutes sufficient evidence of competence.
For example, a learner would not need the same number of assessments of referral letters or charts as they would of examples of clinical reasoning or management.
In the former case, most learners could demonstrate competence in a limited number of observations–once a learner shows that they can write a good referral letter or chart entries appropriately over a few observations, that learner can probably be trusted to continue to demonstrate that competent behaviour and skill.
However, multiple assessments of clinical reasoning will be needed across a variety of presentations in order for sufficient evidence of competence to be accumulated.
계획하는 프로그램 평가는 [모든 역량이 충분히 평가]될 것을 기대하는지에 대해 명확해야 한다. 의료교육은 [임상지식이나 전공 특이적 술기]를 우선시하고, 전문직업성, 환자중심 진료, 의사소통 능력 등 다른 역량에 중점을 두지 않는 경향이 있다(Poulton and Rose 2015). 그러나 후자의 역량은 환자 안전 관점 또는 환자 만족도 관점에서 안전한 의료 실행에 필수적이다. 데이스 등은 'adverse outcome이나 near-miss outcome에 기여하는 가장 일반적인 요인은 의사소통 장애와 부적절한 관리 조정이었다'고 언급했다. 잘 설계된 프로그램 평가는 [모든 역량에 대한 평가의 필요성]을 분명히 해야 하며, 핵심 이해관계자를 구성하는 환자와 공공에 대한 수용성(CARVE 원칙의 A)의 중요성에 부합해야 한다.
Those planning programmatic assessment should be clear about whether it is expected that all competencies will be sufficiently assessed. There is a tendency in medical education to prioritize clinical knowledge or specialty-specific skills and to place less emphasis on other competencies such as those related to professionalism, patient-centred care, and communication skills (Poulton and Rose2015). However, the latter competencies are essential to the safe practice of medicine, whether from a patient safety perspective (Levinson et al.1997; Ambady et al.2002) or a patient satisfaction perspective (Montini et al.2008; Lee et al.2010). Deis et al. (2008) noted that ‘the most common factors contributing to adverse or ‘near-miss’ outcomes … were communication failures and inadequate coordination of care.’ Well-designed programmatic assessment should make explicit the need for assessment of all competencies and aligns with the importance of acceptability (the A of the CARVE principle) to patients and the public, who constitute a key stakeholder group.
3단계: 용도에 맞는 도구 선택 Step 3: Choose tools fit for purpose
Iobst와 Holmboe(2020)가 언급한 바와 같이, '정확하고 효과적으로 수행된다면, 프로그램적 평가는 학습을 최적화하고, 원하는 결과를 향한 학습자 진급에 관한 의사결정을 용이하게 하며, 프로그램의 품질 개선 활동에 정보를 제공해준다'. 이러한 목표를 달성하려면, [복수의 평가 도구]가 필요하며, 이 도구들은 [특정 도메인과 맥락에서 학습자 역량에 관한 정보를 수집하기에 가장 적합한 것]으로 의도적으로 선택해야 한다.
As stated by Iobst and Holmboe (2020), ‘done accurately and effectively, effective programmatic assessment optimizes learning, facilitates decision-making regarding learner progression toward desired outcomes, and informs quality improvement activities of the program.’ To achieve these aims, multiple assessment tools are needed, intentionally chosen to ensure that each tool is the most appropriate one to collect information about learner competence in a specific domain and context.
위탁 가능한 전문 활동(EPA) 및 현장 노트와 같이, 일부 도구는 매우 다용도적이어서 다수의 역량multiple competencies을 평가할 수 있다. 그러나 특정 도구가 얼마나 유혹적이고 편리하게 보일지 몰라도, 모든 역량을 동등하고 효과적으로 평가할 수 있는 완벽한 도구는 없다. 프로그래밍 방식 평가는 감당할 수 없을 정도로 많은 평가 도구를 보유하는 것을 의미하지 않는다. [제한된 수의 서로 다른 도구]라도 적절하게 선택되면, 여러 역량에 걸쳐 강력한 평가를 할 수 있으며, 비용 효율적일 수 있습니다(CARVE 원칙의 C).
Some tools, such as assessments of entrustable professional activities (EPAs) (Ten Cate2005) and field notes (Donoff1990,2009), are highly versatile in assessing multiple competencies; however, there is no one perfect tool that will equally and effectively allow for assessment of every competency, despite how tempting and convenient that prospect might be. Programmatic assessment does not mean having an unwieldy number of assessment tools; even a limited number of different tools, appropriately selected, will often allow for robust assessment across competencies and will be cost-effective (the C of the CARVE principle).
프로그램 평가 설계에 포함할 도구를 결정할 때, 계획자는 [모든 역량을 학습 활동 및 평가 도구에 매핑]해야 한다. 이 매핑은 각 활동에 가장 적합한 도구의 선택을 안내합니다.
임상 지식(학습자가 아는 것)은 필기 시험을 통해 가장 잘 평가된다.
임상 지식의 적용(학습자가 보유한 지식을 사용하는 방법)은 객관적 구조 임상 검사(OSCE), 직장 기반 평가 또는 미니 임상 검사(Mini-CEX)와 같은 다른 도구를 통해 더 잘 평가된다.
환자 중심의 관리 및 의사소통 기술과 같은 일부 역량은 학습자가 실습하는 임상 환경에서 학습자를 직접 또는 간접적으로 관찰함으로써 가장 잘 평가된다.
전문직업성은 단순히 좋은 전문직업성이 어떤 모습이어야 하는지에 대한 학습자 리포트가 아니라, 실제 행동을 포착하는 평가 방법이 필요하다.
In determining which tools to include in programmatic assessment design, planners must map all of the competencies to learning activities and assessment tools. This mapping guides selection of the most appropriate tool for each activity.
Clinical knowledge (what a learner knows) is often best assessed with written examinations.
Application of clinical knowledge (how a learner uses the knowledge that they possess), however, is better assessed through different tools, such as objective structured clinical examinations (OSCEs), workplace-based assessments, or Mini Clinical Examinations (Mini-CEX).
Some competencies, like patient-centred care and communication skills, are best assessed through direct or indirect observation of a learner in the clinical environment in which they practise.
Professionalism, in particular, requires assessment methods that capture actual behaviour, and not just a learner’s report of what good professionalism should look like.
4단계: 평가의 이해관계를 고려합니다. Step 4: Consider the stakes of assessment
학습을 최적화하고 의사결정을 용이하게 하기 위한 프로그래밍 평가의 목표를 유지하기 위해 잘 설계된 프로그래밍 평가에는 아래의 두 가지가 모두 포함되어야 한다.
저부담 평가(학습을 위한 평가, 학습으로서 평가)
고부담 평가(학습의 평가, 학습으로서 평가)
In keeping with the goal of programmatic assessment to both optimize learning and to facilitate decision-making, well-designed programmatic assessment must include both
low-stakes assessment (assessment for learning; some assessment as learning) and
high-stakes assessment (assessment of learning; some assessment as learning).
저부담 평가는 학습자의 발달 궤적을 추적하는 데 유용하며, 안전하고 지지적인 학습 환경에서 실수를 할 수 있는 기회를 제공하며, 이를 통해 환자 안전을 위험에 처하게 만들지 않으면서도 교육 프로그램을 통해 전반적인 진척을 이룰 수 있다. 따라서 저부담 평가는 다음과 같은 역할을 할 수 있다.
학습을 위한 평가(학습자는 자신의 강점과 격차가 어디에 있는지 알고, 교수자에게 학습자의 진척도와 gap에 대한 정보를 준다)
학습으로서 평가(학습자가 자신의 역량에 대한 판단을 돌아보고, 해당 정보를 사용하여 학습을 계속 집중할 수 있음).
Low-stakes assessments are useful for tracking the developmental trajectory of learners and offer an opportunity for learners to make mistakes in a safe and supportive learning environment, from which they can learn without jeopardizing their overall progress through a training program and without putting patient safety at risk. Low-stakes assessments can thus serve
as assessment for learning (letting a learner know where their strengths and gaps might be and informing teachers about learners’ progress and gaps)
as well as assessment as learning (allowing learners to reflect on judgments made about their competence and use that information to focus their learning going forward).
고부담 평가도 필요하다. 고부담 평가는 교육 프로그램 동안 학습자와 교육 프로그램 모두에게 진척도에 대한 중요한 정보를 제공하며, 공식적인 교육 과정에서의 성적표 또는 직장에서의 성과 보고서와 같은 진행 상황 또는 부족 상황을 보여주는 최종 의사결정 포인트로 작용한다. 고위험 평가는 학습에 강력한 동기 부여 요인으로 작용할 수 있으므로, 교육적 효과에 매우 결정적이다(트로터 2006).
High-stakes assessments are also necessary during a training program to provide important information to both a learner and a training program about progress and act as definitive decision points that chart progress or lack thereof–like report cards in formal schooling, or performance reports in the workplace. High-stakes assessments may also serve as powerful motivators for learning and are therefore critical for their educational effects (Trotter2006).
저부담 평가와 고부담 평가의 필요성에 대한 사례가 쉽게 만들어지지만, 둘 사이의 균형을 결정하는 것은 간단하지 않다. 프로그램 평가의 이러한 측면을 설계할 때, 계획자는 여러 가지 이슈를 고려해야 한다.
얼마나 많은 저부담 평가가 필요한가? 얼마나 자주 그리고 얼마나 정기적으로 이뤄져야 하는가?
어떤 교육자 및 관찰자가 저부담 평가에 기여해야 하는가? 환자? 동료들? 아니면 그냥 교관들?
While the case is easily made for the need for both low- and high-stakes assessment, determining the balance of the two is less straightforward. In designing this aspect of programmatic assessment, planners must weigh multiple issues:
How many low-stakes assessments should be expected? How often and how regularly should they occur?
Which educators and/or observers should be contributing low-stakes assessments? Patients? Peers? Or just preceptors?
마지막으로, 학습자와 임상 교육자에게 개별 수준에서의 저부담 평가(low-staks assessment)가 오로지 형성적formative인 것인지 명확히 해야 한다(Watling and Ginsburg 2019). 그러나 학습자 역량에 대한 의사결정에 있어 모든 저부담 평가를 배제하기는 거의 불가능하다. 저부담 평가는 그것을 전체적으로 합하여aggregate 개별 학습자의 역량에 대한 발전(또는 그 결여)의 누적 기록으로 작용한다. 프로그램 리더는 이러한 (저부담) 평가가 어떻게 사용될 것인지에 대해 학습자와 교수진에게 투명해야 합니다. Finally, it must be made clear to learners and to clinical educators whether low-stakes assessments at an individual level are intended to be solely formative (Watling and Ginsburg2019). However, it is nearly impossible to exclude all low-stakes assessments in making decisions about learner competence–in aggregate, low-stakes assessments act as a cumulative record of progress (or lack thereof) toward competence for an individual learner. Program leaders need to be transparent with learners and faculty about how these assessments will be used.
5단계: 평가 데이터 해석 프로세스 정의 Step 5: Define the process for interpreting assessment data
프로그램 평가의 중요한 구성요소는 [학습자의 역량 향상 및 달성에 대한 의사결정]에 있어 [수집된 평가 데이터가 고려되거나 해석되는 과정을 결정하고 명확하게 설명하는 것]이다. 프로세스를 구축하면 프로그램이 많은 평가 증거를 수집한 다음 이를 이해하는 방법을 고민하는 잠재적 문제를 피할 수 있다. 더 많은 프로그램이 임상 역량 위원회를 포함하는 CBME 모델로 이동함에 따라 이 문제는 덜 만연해졌다(Friedman 등 2016; Kinnear 등 2018). 프로그램 평가 계획 및 설계의 good practice는 [의사결정 프로세스의 명확성]을 포함해야 한다(Van der Vleuten 및 Schwirth 2005). A crucial component of programmatic assessment is to determine, and clearly describe, the process by which the assessment data collected will be considered and/or interpreted in making decisions about learner progress toward, and attainment of, competence. Establishing a process avoids the potential problem where programs collect a great deal of assessment evidence and then struggle with how to make sense of it. This problem has become less prevalent as more programs shift toward CBME models that include clinical competence committees (Friedman et al.2016; Kinnear et al.2018). Good practice in planning and designing programmatic assessment must include clarity of the decision-making process (van der Vleuten and Schuwirth2005).
[투명한 의사결정 프로세스]는 [모든 학습자의 형평성]에 기여할 뿐만 아니라, 평가 시스템에 기여하는 [관찰자 간의 이해와 준수uptake and compliance]를 촉진할 수 있다(Rich et al. 2020). 학습자가 자신의 학습에 통제감을 갖는 환경을 구축하기 위해서는, 평가 순간(예: 직장 기반 평가를 통한 단일 관찰)과 의사결정 사건(예: 임상 역량 위원회)의 차이를 명확하게 구분하는 것을 포함하여, [수집된 모든 평가 요소가 어떻게 사용될 것인지에 대한 명확한 지침]을 설정하는 것이 필수적이다. Transparency about decision-making processes not only contributes to equity for all learners, it can also facilitate uptake and compliance among observers who contribute to the assessment system (Rich et al.2020). Setting clear guidelines about how all assessment elements collected will be used, including articulating the distinctions between assessment moments (such as single observations with a workplace-based assessment) and decision events (such as a clinical competence committee meeting), is essential to establish a learning environment where learners have a sense of control over their own learning (Schut et al.2018).
결론 Conclusion
본 문서에서는 CMBE 교육 프로그램이 프로그램 평가를 설계 또는 재설계하는 데 도움이 되는 일반적인 템플릿을 간략히 설명했습니다. 우리는 프로그램 평가에 대한 다양한 권고 사항을 단순화하려고 시도했고, 프로그램 평가에 대한 몇 가지 신화를 불식시키기를 희망합니다. 특히, 우리는 프로그램 평가가 'one size fits all'가 아니라는 개념을 계속 지지한다. 오히려 프로그램 평가의 공통 원칙이 공유되어 있지만, 개별 프로그램은 특정 맥락에 맞는 자신만의 맞춤형 프로그램 평가 모델을 계획하고 설계해야 한다. 이를 통해 CBME 훈련 프로그램에서 확립된 프로그램 평가 접근방식을 검토하여 지침을 찾고 학습한 교훈으로부터 이익을 얻는 것이 유용할 수 있다(Ross et al. 2011; McEwen et al. 2015; Rich et al. 2020).
In this paper, we have outlined a general template to help CMBE training programs as they look to design–or redesign–programmatic assessment. We have attempted to simplify the various recommendations about programmatic assessment, and we hope to have dispelled some myths about programmatic assessment. In particular, we continue to support the notion that programmatic assessment is not ‘one size fits all’; rather, while there are shared common principles of programmatic assessment, individual programs need to plan and design their own bespoke model of programmatic assessment that aligns with their particular context. In doing this, it can be useful to look at established programmatic assessment approaches in CBME training programs to seek guidance and to benefit from the lessons they learned (Ross et al.2011; McEwen et al.2015; Rich et al.2020).
Med Teach. 2021 Jul;43(7):758-764.
doi: 10.1080/0142159X.2021.1925099.Epub 2021 Jun 1.
Key considerations in planning and designing programmatic assessment in competency-based medical education
Programmatic assessment as a concept is still novel for many in clinical education, and there may be a disconnect between the academics who publish about programmatic assessment and the front-line clinical educators who must put theory into practice. In this paper, we clearly define programmatic assessment and present high-level guidelines about its implementation in competency-based medical education (CBME) programs. The guidelines are informed by literature and by lessons learned from established programmatic assessment approaches. We articulate five steps to consider when implementing programmatic assessment in CBME contexts: articulate the purpose of the program of assessment, determine what must be assessed, choose tools fit for purpose, consider the stakes of assessments, and define processes for interpreting assessment data. In the process, we seek to offer a helpful guide or template for front-line clinical educators. We dispel some myths about programmatic assessment to help training programs as they look to design-or redesign-programs of assessment. In particular, we highlight the notion that programmatic assessment is not 'one size fits all'; rather, it is a system of assessment that results when shared common principles are considered and applied by individual programs as they plan and design their own bespoke model of programmatic assessment for CBME in their unique context.
신뢰와 통제 사이: 프로그램적 평가에서 교수의 평가에 대한 개념화(Med Educ, 2020) Between trust and control: Teachers' assessment conceptualisations within programmatic assessment Suzanne Schut1 | Sylvia Heeneman1,2 | Beth Bierer3 | Erik Driessen1 | Jan van Tartwijk4 | Cees van der Vleuten1
1. 소개 1. INTRODUCTION
의학교육에서 평가를 학습에 활용하는 것에 대한 관심이 높아지고 있으며 그 혜택에 대한 기대도 높다. 프로그램 평가는 [연속적인 평가 부담continuum of assessment stakes]을 제안함으로써 [형성적 또는 총괄적 평가 목적의 전통적인 이분법을 극복]하려고 시도한다. 이러한 일련의 평가 부담은 다양하다.
저부담 평가 (정보와 피드백을 통해 교사와 학습자를 유익하게 하고 지원하기 위한 빈번한 평가)
고부담 평가 (평가 데이터의 집계에 기초한 진행 결정)
Interest in using assessment for learning is increasing in medical education and expectations of its benefits are high.1Programmatic assessment attempts to overcome the traditional dichotomy of assessment purposes as either formative or summative by proposing a continuum of assessment stakes.2,3This continuum of assessment stakes ranges from
low (frequent assessments to benefit and support teachers and learners with information and feedback) to
high (progress decisions based on the aggregation of assessment data).
저부담 평가의 주요 목표는 학습자의 진도를 지원하는 것입니다. 따라서 한 번의 낮은 평가 결과가 학습자에게 제한적이어야 합니다. 그러나 여러 평가 결과가 집계되면 학습자에게 상당한 영향을 미치는 높은 평가 수행 결정을 알리는 데 사용할 수 있습니다. 실제로 학습자는 학습에 도움이 되는 저부담 평가의 가치를 인식하지 못하는 경우가 많습니다. 대신, 그들은 저위험 평가의 잠재적인 종합 결과에 초점을 맞추는 경향이 있다. 이러한 이유로, 학습을 지원하기 위해 프로그래밍 방식의 평가를 사용하는 것은 여전히 어려운 일입니다.
The primary goal of low‐stake assessment is to support learners' progress. Thus, one low‐stake assessment should have limited consequences for learners. When multiple low‐stake assessments are aggregated, however, they can be used to inform high‐stake performance decisions that have substantial consequences for learners.4In practice, learners often do not appreciate the value of low‐stake assessments to guide their learning. Instead, they tend to focus on the potential summative consequences of low‐stake assessments.5,6For this reason, using programmatic assessment to support learning remains challenging in practice.1,7,8
교사들은 (특히 프로그램 평가의 학습 잠재력을 충족시키거나 약화시키는 데 있어) 강력한 역할을 하는 것으로 보인다. 프로그램 평가의 많은 기본 원칙이 새로운 것은 아닐 수 있지만, [평가에 대한 체계적인 접근법]과 [두 가지 목적을 가진 평가 부담의 연속성]은 [전통적인 총괄평가 접근법]과 근본적으로 다르다.9 교사가 평가의 의미와 목적을 완전히 이해하지 못하거나 평가의 기본 철학에 동의하지 않는 경우, 저부담 평가와 저부담 평가의 잠재적 학습 이익은 사소해질 가능성이 높다.4 저부담 평가에서와 같이 평가 목적이 복잡하고 중첩된 상호 작용을 하는 경우, 평가 프로세스는 더욱 복잡해진다. Teachers appear to play a particularly powerful role in fulfilling or undermining the learning potential of programmatic assessment.7Although many of the underlying principles of programmatic assessment may not be novel, the systematic approach to assessment and the continuum of assessment stakes with dual purposes fundamentally differ from traditional, summative approaches to assessment.9If teachers do not fully understand the meaning and purpose of assessment or do not agree with its underlying philosophy, low‐stake assessments and their potential learning benefits are likely to become trivialised.4The complex and overlapping interplay of assessment purposes, such as in low‐stake assessments, adds to the already complicated assessment processes.10,11
학부 교육의 맥락에서, 사무엘로비츠와 베인은 교사들이 근본적인 이유로 '변혁적' 평가방법에 저항할 수 있으며, 교육적 신념과 가치관을 바꿀 때까지 평가의 혁신을 수용하지 않을 수 있다고 경고한다. In the context of undergraduate teaching, Samuelowicz and Bain13warn that teachers may resist ‘transformative’ assessment methods for fundamental reasons and may not embrace innovation in assessment until they also shift their educational beliefs and values.14
더 나아가, 교사가 평가를 어떻게 개념화하는지는 [교육 이론이나 기관의 평가 정책]보다는, [교사 개인의 평가 경험]에 더 영향을 받는다. 이러한 신념과 실천 사이의 차이은 특히 교사가 [프로그램 평가에 사용되는 저부담 평가와 같은 이중 목적 평가]에 직면할 때 나타날 가능성이 높다. 예를 들어, 교사는 아래의 두 가지 역할 사이에서 중요한 딜레마를 경험할 수 있다.
학습자의 개발 및 촉진에 대한 지지자 역할
학습자의 성과와 성취도에 대한 평가자로서 판단의 책임.
Furthermore, teachers' assessment conceptualisations are often informed by their personal assessment experiences rather than by educational theory or the institution's assessment policies.10,12These differences between beliefs and practices are especially likely to emerge when teachers encounter dual‐purpose assessments,15such as the low‐stake assessments used in programmatic assessment. For instance, teachers may experience significant dilemmas when navigating between
their supportive roles as they monitor and facilitate learners' development and
their judgemental responsibilities as assessors of learners' performance and achievement.1, 10, 16, 17
2. 방법 2. METHODS
우리는 교사들의 평가 개념화와 프로그램 평가 내의 평가 관계를 탐구하기 위해 구성주의자 근거이론 접근법을 사용했다. We used a constructivist grounded theory approach19,20to explore teachers' assessment conceptualisations and assessment relationships within programmatic assessment.
2.1. 샘플 2.1. Sample
프로그램 평가에 대한 중요한 통찰력을 제공하는 것으로 알려진 고유한 연구 설정을 선택하기 위해 극단적인 사례 샘플링 전략을 채택했다.21 우리는 평가의 목적이 저부담과 고부담 모두인 상황에서, 교사가 저부담 평가를 사용해야 하는 연구 설정을 선택했다. 이러한 구현을 위한 포함 기준은 다음과 같다.
(a) 학습 정보를 제공하기 위한 저부담 평가의 사용
(b) 낮은 평가의 집계를 바탕으로 학습자의 진행 상황에 대한 높은 의사 결정을 내린다.
(c) 최소 5년의 장기 프로그램 평가 시행
An extreme case sampling strategy was employed to select unique research settings known to provide significant insights about programmatic assessment.21We selected research settings that required teachers to use low‐stake assessment in contexts in which assessments have both low‐ and high‐stake purposes. The inclusion criteria for these implementations were:
(a) the use of low‐stake assessment to provide information for learning;
(b) the making of high‐stake decisions on learners' progress based on the aggregation of those low‐stake assessments, and
(c) a long‐term programmatic assessment implementation of at least 5 years.
해당 분야 전문가들의 이전 연구와 제안을 바탕으로 두 개의 의학전문대학원을 선정했다. Based on previous research and suggestions by experts within the field, we selected two medical schools with graduate‐entry medical programmes:
the Physician‐Clinical Investigator Programme at Maastricht University, the Netherlands (Setting A) and
the Physician‐Investigator Programme at the Cleveland Clinic Lerner College of Medicine at Case Western Reserve University, Cleveland, Ohio, USA (Setting B).
이러한 의사-연구자 프로그램은 생물의학 연구와 임상 실습의 발전에 중요한 자기 주도 학습 기술을 주입하는 것을 목표로 한다. 두 프로그램 모두 역량 기반 학생(<50명의 학습자)의 소규모 코호트이며, 학습을 육성하기 위해 프로그램 평가 접근 방식을 사용한다. 두 프로그램의 구조와 특성은 표 1과 같다. 추가적으로, 두 프로그램 모두 다른 곳에 자세히 설명되어 있습니다.
These physician‐investigator programmes aim to instil self‐directed learning skills critical for the advancement of both biomedical research and clinical practice. Both programmes are competency‐based, enrol small cohorts of students (<50 learners), and use programmatic assessment approaches to foster learning. The structure and characteristics of both programmes are shown in Table 1. Additionally, both programmes are described in detail elsewhere.5,22,23
우리는 기준과 최대 변동 샘플링 전략을 사용하여 의도적으로 참가자를 샘플링했다. 선정된 연구현장에 등록된 학습자 또는 주요 책임이 높은 평가로 학생을 안내하는 피드백 제공에 관련된 학습자를 대상으로 공식적인 책임을 지고 있는 교사를 초빙하였습니다.
We purposefully sampled participants using criterion and maximum variation sampling strategies. We invited
teachers with formal responsibilities as assessors of low‐stake assessment tasks for learners enrolled in the selected research sites or
those whose main responsibilities involved providing feedback to guide students towards high‐stake evaluation.
최대 변동은 다음을 기준으로 구되었다.
(a) 프로그램에서 공식적인 역할(예: 튜터, 코치, 의사 고문/교수, 강사, 조정자, 강사/강사)
(b) 저학점 평가 유형(예: 표준화된 강의 과정 시험, 논술, [학점] 과제, 직접 관찰),
(c) 학습자와의 관계의 다양한 길이(짧은 만남에서 종적 관계에 이르기까지)
Maximum variation was sought based on:
(a) formal role in the programme (eg, tutor, coach, physician advisor/mentor, lecturer, coordinator, preceptor/supervisor);
(b) type of low‐stake assessment (eg, standardised in‐course tests, essays, [research] assignments, direct observations), and
(c) variable lengths of relationships with learners (ranging from brief encounters to longitudinal relationships).
2.2. 데이터 수집 및 분석 2.2. Data collection and analysis
수석 조사관(SS)은 선별된 모든 참가자들에게 연구를 설명하고 현장에서 반구조적인 개별 인터뷰에 자발적으로 참여하도록 초대하는 이메일을 배포했다. 연구팀은 프로그램 평가와 교사 평가 개념화에 대한 이론적 토대를 바탕으로 개방형 질문으로 구성된 인터뷰 가이드를 설계했다. 이 인터뷰 가이드에는 참가자들에게 다음과 같은 질문이 포함되어 있습니다.
(a) 프로그래밍된 평가 시스템 내에서 저수준 평가의 개념을 설명하고 반영한다.
(b) 프로그래밍 평가에서 교사와 학습자의 역할과 책임을 논의한다.
(c) 프로그램 평가의 맥락에서 학습자와의 상호 작용을 반영한다.
(d) 평가와 학습에 대한 그들의 가치와 신념을 분명하게 표현한다.
The lead investigator (SS) distributed an email to all selected participants describing the study and inviting them to participate voluntarily in semi‐structured individual interviews on site. The research team designed an interview guide consisting of open‐ended questions based on theoretical underpinnings of programmatic assessment and teachers' assessment conceptualisations. This interview guide included questions that asked participants to:
(a) describe and reflect upon the concept of low‐stake assessment within a programmatic assessment system;
(b) discuss the roles and responsibilities of the teacher and learner in programmatic assessment;
(c) reflect upon their interactions with learners in the context of programmatic assessment, and
(d) articulate their values and beliefs about assessment and learning.
부록 S1은 초기 인터뷰 지침을 제공합니다. 면접은 프로그램 평가 시행 내 평가와 평가 부담에 초점을 맞췄지만, 참가자는 연구팀이 교사의 평가 개념화와 경험을 완전히 이해할 수 있도록 [과거 평가 경험을 되새기도록reflect upon] 장려했다. 모든 인터뷰는 직접적인 식별자 없이 녹음되고 문자 그대로 옮겨졌다.
AppendixS1provides the initial interview guide. Although interviews focused upon assessment and assessment stakes within the implementation of programmatic assessment, participants were encouraged to reflect upon previous assessment experiences in order to help the research team fully understand teachers' assessment conceptualisations and experiences. All interviews were recorded and transcribed verbatim without direct identifiers.
데이터 수집과 분석은 반복적으로 수행되어 인터뷰 질문 및 후속 인터뷰에 대한 샘플링 전략의 수정에 필요한 적응을 가능하게 했다.
처음 네 번의 인터뷰는 초기 코드 개발을 목적으로 오픈 코딩 전략을 사용하여 SS와 SH에 의해 독립적으로 분석되었다. 각 인터뷰에 이어 SS와 SH는 코드와 코드 간의 관계에 대해 논의했습니다.
이러한 논의를 바탕으로, 초기 코드는 주요 개념 주제와 하위 테마 중심으로 구성되었다. 데이터를 조사하고 재조사함으로써 주요 범주 간의 관계를 탐구했다.
초기 코드는 예시와 반례가 있는 개념 코드로 진화했다. 연구팀(SS SH, BB, ED, JvT 및 CVDV)은 개념 코드를 논의하였다.
예비 분석을 자세히 설명하기 위해, 우리는 이론적 샘플링을 계속 사용하여 프로그램 평가에서 저부담 평가에 대한 추가 관점을 수집했다. 구체적으로는 교사들의 프로그램 평가 경험과 교사 배경(기초과학 배경을 가진 교사 대 임상의)을 바탕으로 표본을 확대했다.
이론적 충분성theoretical sufficiency에 도달할 때까지 데이터 수집과 분석은 계속되었는데, 이는 분석이 프로그래밍 평가의 맥락에서 교사의 평가 개념화를 이해할 수 있는 충분한 통찰력을 제공할 때까지 이러한 데이터 수집 과정을 계속했다는 것을 의미한다.
총 23명의 교사가 참여해 수석조사관(SS)과의 일대일 대면면접에 참여했으며, 표2는 이들 참가자의 특징을 요약한 것이다.
Data collection and analyses were performed iteratively, allowing for necessary adaptations to interview questions and modifications of the sampling strategy for subsequent interviews.20,24
The first four interviews were independently analysed by SS and SH using an open coding strategy with the aim of developing initial codes. Following each interview, SS and SH discussed the codes and relationships between codes.
Based on these discussions, the initial codes were organised around key conceptual themes and sub‐themes. Relationships amongst major categories were explored by examining and re‐examining data.
Initial codes evolved into conceptual codes, with examples and counter‐examples. The research team (SS SH, BB, ED, JvT and CvdV) discussed the conceptual codes.
To elaborate upon our preliminary analysis, we continued the use of theoretical sampling to gather additional perspectives about low‐stake assessments in programmatic assessment. Specifically, we expanded our sample based on the teachers' experience in programmatic assessment and on teachers' backgrounds (teachers with basic science backgrounds versus clinicians).
Data collection and analysis continued until theoretical sufficiency25 was reached, meaning that we continued this data collection process until the analysis provided enough insight to understand teachers' assessment conceptualisations in the context of programmatic assessment.
In total, 23 teachers participated in one‐to‐one, in‐person interviews with the lead investigator (SS). Table 2 summarises the characteristics of these participants.
SS는 데이터 수집과 분석 과정에서 분석 메모와 도표를 만들어 과정이 논리적이고 체계적이 되도록 했다. 이 메모와 도표들은 연구팀 내에서 논의되었다. 데이터는 2018년 12월부터 2019년 5월 사이에 수집 및 분석되었다. 네덜란드 의학 교육 윤리 검토 위원회(NVMOmoERB 참조 2018.7.4)와 클리블랜드 클리닉 기관 검토 위원회(IRB 참조 18 ref1516)에서 윤리 승인을 받았다. During data collection and analysis, SS created analytic memos and diagrams to ensure the process was logical and systematic. These memos and diagrams were discussed within the research team. Data were collected and analysed between December 2018 and May 2019. Ethical approval was obtained from the Dutch Association for Medical Education Ethical Review Board (NVMO‐ERB ref. 2018.7.4) and the Cleveland Clinic's Institutional Review Board (IRB ref. 18‐1516).
2.3. 성찰성 2.3. Reflexivity
우리는 연구자로서 이러한 데이터를 수집, 분석 및 해석하는 데 있어 우리가 한 역할을 인정한다. 편견을 완화하기 위해 다학제 연구팀으로 일했습니다. SS는 수석 연구원으로 활동했습니다. SS는 교육과학에 경험이 있고, 연구지 중 한 곳에서 교직원으로 일하며, 선정된 프로그램에 직접적으로 관여하지 않았다. ED와 CVDV는 의료 교육 및 평가 분야의 전문가입니다. 또한 CVDV는 의학 교육에서 프로그램 평가의 이론적 모델의 창시자 중 하나로 간주된다. SH는 보건 과학에 대한 공식적인 훈련과 경험을 가지고 있고, BB는 교수와 연구 방법에 대해 동등한 배경을 가지고 있다. SS와 BB는 모두 선정된 프로그램의 설계와 구현에 프로그램 디렉터로 참여하였으며, CVDV는 전문가로 참여하였다. SH와 BB는 데이터를 수집하는 동안 참가자들과 직접 접촉하지 않았다. JvT는 사회학자로 훈련을 받았으며 교사 교육 전문가입니다. JvT는 터널 비전과 확인 편향을 좌절시키는 데 도움이 되는 외부 관점을 제공하고 사례와 반례를 검토했으며 코드 구축과 데이터 해석 과정을 지원했다.
We acknowledge the roles that we, as researchers, played in collecting, analysing and interpreting these data. To help mitigate bias, we worked as a multidisciplinary research team. SS functioned as the lead researcher. SS has a background in educational sciences, works as a faculty member at one of the study sites, and had no direct involvement in the selected programme. ED and CvdV are experts in the field of medical education and assessment. Furthermore, CvdV is considered as one of the founding fathers of the theoretical model of programmatic assessment in medical education. SH has formal training and experience in the health sciences and BB has an equivalent background in teaching and research methods. Both SS and BB were involved as programme directors in the design and implementation of the selected programmes, as was CvdV as an expert. SH and BB had no direct contact with the participants during data collection. JvT is trained as a sociologist and is an expert in teacher education. JvT provided an outsider perspective to help thwart tunnel vision and confirmation bias, reviewed examples and counter‐examples, and supported the process of code construction and data interpretation.
3. 결과 3. RESULTS
그 결과, 교사들은 세 가지 다른, 그러나 관련성이 있는 방식으로 [평가의 목적]을 개념화하는 것으로 나타났다.
(a) 학습을 자극하고 촉진하게 하기 위해,
(b) 학습자를 다음 단계로 준비시키기 위해, 그리고
(c) 교사 자신의 효과를 측정하기 위한 피드백으로 사용하기 위해,
The results showed that teachers conceptualise the purpose of low‐stake assessment in three different, yet related ways:
(a) to stimulate and facilitate learning;
(b) to prepare learners for the next step, and
(c) to use as feedback to gauge the teacher's own effectiveness.
결과적으로 이러한 관점은 평가를 제공하거나 토론할 때 학습자에 대한 관여에 영향을 미쳤다. Consequently, these views influenced their engagement with learners when providing or discussing assessments.
3.1. 저부담 평가의 개념화 3.1. Conceptualisations of low‐stake assessments
3.1.1. 학습 자극 및 촉진 3.1.1. Stimulating and facilitating learning
교사의 공식적인 위치(예: 튜터, 코치, 의사 조언자 또는 멘토, 과정 감독, 평가자, 교육자)의 차이에도 불구하고, 우리는 저부담 평가의 목적에 대해 [일차적으로 공유된 개념]은 [학습을 촉진하고 용이하게 하는 것]으로 식별했다. 이 개념은 [저부담 평가의 결과가 minimal하다는 점]에 영향을 받았다. '학습자는 이 평가로 fail을 받지 않는다', '등급이 매겨지지 않는다', '저부담 평가는 주로 성과 향상에 관한 것이다'와 같은 문장은 낮은 평가 개념을 반영할 때 참가자 모두가 내렸다. Grades의 사용은 고부담 평가와 밀접한 관련이 있었고, 대부분의 참가자들은 성적 배정이 학습learning에 이롭다고는 생각하지 않았다. 대신, Grades은 순위를 매기고 학습자를 비교하는 평가 목적과 연관되었다. 학습자가 [저부담 평가를 학습의 목적]으로 사용하게 하려면, 교수자는 학습 자극을 주고, 개선을 촉진하기 위해 학습자에게 서술적 피드백을 제공하는 것이 중요하다고 강조했습니다. Despite the differences in teachers' formal positions (eg, tutor, coach, physician advisor or mentor, course director, assessor, preceptor), we identified a shared primary conceptualisation of the purpose of low‐stake assessments as being to stimulate and facilitate learning. This conception was influenced by the perceived minimal consequences of low‐stake assessment. Statements like: ‘learners can't fail them,' ‘they are not graded’ and ‘low‐stake assessments are primarily about improving performance’ were given by all participants when reflecting on the concept of low‐stake assessments. The use of grades was strongly associated with high‐stake assessments, and most participants did not regard assigning grades beneficial for student learning. Instead, grades were associated with the assessment purposes of ranking and comparing learners. To enable learners to use low‐stake assessments for learning, teachers highlighted the importance of providing learners with narrative feedback in order to stimulate learning and facilitate improvement:
학생들의 석차는 나에게 별로 의미가 없다. 이런 환경에서 [학점을 사용하지 않는 프로그래밍식 평가]가 잘못될 염려가 별로 없으며, [학습자] 그들은 이 시스템으로 석차 등급을 받기 위해 영리하게 보이려고 노력하지 않는다고 생각합니다. (B5, 임상의) The rank ordering of students is not that meaningful to me. […] In this environment [programmatic assessment without the use of grades] there is not a fear of being incorrect as much, I think, and they [learners] are not trying to look smart in order to get rank order grades with this system.(B5, clinician)
프로그램 수준에서 [성과나 개선에 대한 증거를 수집할 수 있는 기회의 수]는 교사의 평가 개념화와 학습 기회에 영향을 미쳤다. At a programme level, the number of opportunities for collecting evidence on performance or improvement influenced teachers' assessment conceptualisations and opportunities for learning:
이 프로그램에는 단 한 번의 기회만 주어지기 때문에 진급 위원회는 학습자들이 포트폴리오에 이 평가 결과를 사용할 것으로 예상할 것이다. There's only one chance in the programme, and so the progress committee will expect them [learners] to use it [the result of this assessment] in their portfolios, so that raises the stakes tremendously.(B7, basic scientist)
프로그램이 다수의 저부담 평가를 촉진하여야, 교사들은 자신들의 책임을 [학습자가 스스로 평가 근거의 경향이나 패턴을 발견하도록 지원하는 것, 성찰을 자극하는 것, 학습 목표와 잠재력에 도달하기 위한 학습자의 개선 계획을 가능하게 하는 것]으로 개념화할 수 있었다. 또한, 다수의 저부담 평가에 따른 결과는 제한적이라고 인식했기 때문에, 교사들이 학습자에게 정직하고 건설적인 피드백을 제공할 수 있는 더 나은 기회를 만들었다. When the programme facilitated multiple low‐stake assessments, teachers conceptualised their responsibility as being to support learners in discovering trends or patterns in assessment evidence, to stimulate reflection, and to enable learners' improvement plans for reaching learning goals and perceived potential. Furthermore, multiple low‐stake assessments created better opportunities for teachers to provide learners with honest and constructive feedback because they perceived limited consequences:
왜냐하면 누군가 처벌받지 않고도 향상될 수 있다는 것을 안다면, 문제가 되는 것에 대한 정보를 주지 않을 이유가 없다. 반면 다른 환경에서는 '누구도 곤경에 빠뜨리고 싶지 않은 마음'때문에, 학습자가 잘하고 있는 것만 부각시키고, 잘 하지 못하는 것에 대해서는 침묵하는 습관이 생긴다고 생각한다. I think it's liberating in a lot of ways, because if you know that somebody can improve without being punished, there is no reason to not give them the information about something that is problematic. Whereas I think that in other settings, it feels like people get into the habit of highlighting things that learners are doing well and just being quiet about things that are problematic because ‘I don't want anybody to get in trouble.'(B8, clinician)
3.1.2. 학습자 다음 단계 준비 3.1.2. Preparing learners for the next step
학습learning에 더하여, 교사들은 저부담 평가를 [학습자가 고부담 평가나 향후 실습을 대비할 수 있는 방법]으로 생각했다. 이러한 평가 개념화는 교사들이 학습을 촉진하는 방식에 큰 영향을 미쳤다. 교사들은 학습자들이 '적절한 준비를 하고 있는지' 확인하기 위해서는 보다 [직접적인 접근]이 필요하다고 생각했다. 중요한 것으로 여겨지는 것은 기초 과학자와 임상의 사이에 차이가 있었다. In addition to learning, teachers also thought of low‐stake assessments as a way to prepare learners for high‐stake assessments or for future practice. This assessment conceptualisation strongly influenced how teachers facilitated learning: teachers thought a more directive approach was required to ensure learners were ‘properly prepared.' What was considered important differed between basic scientists and clinicians.
교육과정에서 [기초과학 관련 교육]를 담당하는 대부분의 교사는 지식평가를 강조했다. 그들은 지식을 역량에 필수적인 것으로 여겼고, 대부분의 학습자는 지식 테스트를 통과할 수 있어야 한다고 믿었다. Most teachers with teaching tasks related to the basic sciences within the curriculum emphasised assessment of knowledge. They regarded knowledge as fundamental for competence, and most believed learners should be able to pass a knowledge test:
내가 보기에 이것들은 그들이 특정한 시점에서 취해야 할 중요한 장애물들이다. […] 만약 당신이 그 기준을 충족시킬 능력이 없다면, 당신은 충분한 지식과 통찰력을 가지고 있고, 이것은 결과를 가져올 필요가 있다. (A1, 기초과학명언) In my view these are important hurdles which they [learners] have to take at certain points. […] If you are not capable of meeting those standards, you have insufficient knowledge and insights, which needs to have consequences.(A1, basic scientist)
그러나 [임상의]들은 [전반적인 임상 역량]에 초점을 맞추는 경향이 있었다. 지식 테스트는 중요하고 종종 근본적인 것으로 여겨졌지만, [지식의 차이는 학습자가 쉽게 고칠 수 있는 것]으로 인식되었다. 인터뷰한 많은 임상의에 따르면, 이러한 테스트는 학습자가 '실제' 임상 실습을 준비하는 데 덜 중요한 것으로 간주되었다. Clinicians who participated in this study, however, tended to focus on overall clinical competence. Although knowledge testing was considered important and often fundamental, gaps in knowledge were perceived as being easy for learners to remediate. According to many of the clinicians interviewed, these tests were considered as less important for preparing learners for ‘real’ clinical practice:
나는 [지식 시험]은 [의사가 되는 것이 무엇을 의미하는지]를 반영하지는 못한다고 생각한다. I don't think they [knowledge tests] reflect what it means to be a physician.(B4, clinician)
임상의는 주로 학습자를 향후 실습에 대비시키기 위해 저부담 평가(low-stake assessment)를 사용했다. Clinicians used low‐stake assessment mainly to prepare learners for future practice:
저는 저부담평가가 평가를 준비하는 과정에서 학생들이 기술을 향상시키는 방법들 중 하나라고 생각합니다. 그렇게 함으로써 clinical years에 맞게 최적화하게 한다. (A3, 임상명언) I think that is one of the ways that they improve their skills [by] preparing them and making sure they are optimised for [the] clinical years.(A3, clinician)
[외부의 고부담 지식 평가]가 포함된 경우에서는 예외가 발견되었습니다. 모든 교사는 학습자가 졸업 또는 면허 요건을 충족시키기 위해 높은 평가를 통과해야 한다는 것을 이해했으며, 평가의 의미가 있는지 여부에 관계없이 이러한 평가에 대한 준비를 중요하게 여겼습니다.
Exceptions were found when external, high‐stake knowledge assessments were involved. All teachers understood that learners must pass high‐stake assessments to meet either graduation or licensure requirements and considered preparing learners for such assessments an important responsibility, whether they considered the assessment meaningful or not:
3.1.3. 교사에 대한 피드백으로서 낮은 평가 3.1.3. Low‐stake assessments as feedback for teachers
저부담 평가가 teaching practice과 teacher themselves에 가지는 가치가 있었다. 교사들은 저부담 평가를 학습 목표 달성에 있어 학습자의 진행 상황을 진단하고, 교정 조치가 필요하다고 생각되는 학습자를 식별하며, 학습자의 수행 기준 달성을 모니터링할 수 있는 기회로 개념화했다. 일부 교사들은 평가가 개인적, 전문적 발전에 미칠 수 있는 상호적 이익을 높이 평가했으며, 이는 성찰적인 태도를 자극했다.
Low‐stake assessment also carried value for teaching practices and teachers themselves. Teachers conceptualised low‐stake assessments as representing opportunities to diagnose learners' progress in acquiring learning objectives, to identify learners they thought required remediation, and to monitor learners' achievement of performance standards. Some teachers appreciated the reciprocal benefits low‐stake assessment may have upon their personal and professional development, which stimulated a reflective attitude:
학생에게는 배움의 기회이지만, 저에게는 배움의 기회이기도 합니다. 그것은 또한 내가 무엇을 하고 있는지, 무엇을 개선할 수 있는지에 대해 생각하게 한다. It's a learning opportunity for the student, but, really, it's also a learning opportunity for me. It forces me to be reflective too, and think about what I'm doing, and what could be improved.(B4, clinician)
선생님들은 자신의 교육적 효과성에 대한 정보를 얻기 위해 저부담 평가들에 의존했다. 교사는 저부담 평가에서 학습자의 성과를 자신의 성과를 명시적이고 직접적인 지표로 인식하여 다음과 같이 평가하였다. Teachers relied on low‐stake assessments to inform them about their effectiveness. Teachers perceived learners' performances on low‐stake assessments as explicit and direct indicators of their own performance, thereby making these assessments of higher stakes for teachers:
저에게는 [표준화된 지식 테스트]가 매우 중요한 순간이며, 학생들이 시험을 잘 볼 때 마음이 놓이고 매우 행복합니다. 내가 잘했다는 뜻이다. For me it's [standardised knowledge test] a high‐stake moment, and I'm relieved and very happy when students perform well on the test. It means I did a good job.(A1, basic scientist)
이러한 관찰은 교사가 임상실습이나 로테이션 중에 개별 학습자를 감독할 때와 같은 임상적 맥락에도 적용된다. This observation also applied to clinical contexts, such as when teachers supervised individual learners during a clerkship or rotation:
그래서 이 학생이 저와 함께 일해왔다는 사실이, 이 학생이 바로 여기 있다는 것이 나에 대한 어떤 반영reflection인 것 같다. 그래서 마치 부담이 더 크게 느껴지기도 한다. 우리는 이 학생을 다음 preceptor에게, 그리고 결국 현실 세계로 내보내기 때문이다. (B8, 임상의) And so this idea that this person has worked with me and this is where they are, I feel like it is a certain reflection of me and so then it feels like the stakes are higher as part of it, we are sending them out to the next preceptor and in the end, into the real world.(B8, clinician)
3.2. 평가 관계에서 학습자와의 교사 참여 3.2. Teachers' engagement with learners in assessment relationships
3.2.1. 안전하지만 생산적인 관계 만들기 3.2.1. Creating safe but productive relationships
교사의 평가 개념화가 학습에 대한 평가 사용에 초점을 맞출 때, 교사들은 안전한 교사-학습자 관계를 만들어야 할 강한 필요성을 나타내며, 교사들은 이를 '돌봄', '따뜻함', '접근 가능', '동반자 관계'와 같은 단어를 사용하여 설명하였다. 교사들은 학습자들이 평가에 대한 인식이 다른 경우가 많다는 것을 알고 있었고, 교사들은 학습자들을 평가 시스템의 근본적인 철학에 대한 방향을 잡아야 할 책임이 있었다. 교사들은 학습자가 실패하거나 실수할 수 있는 '저부담' 학습 환경을 조성하고, 저부담 평가를 활용해 수행능력을 높이는 것이 자신들의 책임이라고 봤다. 교사들은 학습자와의 파트너십을 통해 기쁨을 얻었고, 프로그램 평가의 기본 철학이 (기존의 평가 방식보다) 실세계의 practice와 더 잘 부합한다고 여겼으며, 따라서 학습자와의 assessment practice는 더욱 의미 있고 관련성이 있었다. When teachers' assessment conceptualisations focused on the use of assessment for learning, teachers indicated a strong need to create safe teacher‐learner relationships, which they described using words such as ‘care,' ‘warmth,' ‘accessible’ and ‘partnership.' Teachers were aware that learners often had different perceptions of assessment, and teachers took responsibility for orienting learners to the underlying philosophy of the assessment system. Teachers believed it was their responsibility to create a ‘low‐stake’ learning environment in which learners could fail or make mistakes, and to use low‐stake assessment to improve their performance. Teachers gained joy from partnering with learners and viewed the underlying philosophy of programmatic assessment as better aligned with real‐life practice than traditional assessment approaches, thereby making their assessment practices with learners more meaningful and relevant:
제가 하는 일은, 더 이상 수문장이 되거나 학생들이 졸업하지 못하게 하는 것이 아니라, 학생들이 성공할 수 있도록 돕는 것입니다.이제 제 일은 '더 좋아지고 있나요?' 입니다. '넌 끝났어' 라고 말하는 것보다 그 역할에 대해 훨씬 더 기분이 좋다.
My job is not to be a gatekeeper anymore or keep students from graduating, but to help students be successful. My job now is: ‘Are you getting better?’ I feel much better about that role than [about] saying: ‘You are done.’(B11, clinician)
그럼에도 불구하고, 교사들은 안전한 학습 환경을 유지하고 학습자와의 생산적인 작업 및 평가 관계를 유지하는 것 사이에서 올바른 균형을 이루는 데 초점을 맞췄다. 이것은 [교사-학습자 관계에서 일정 거리]를 요구하는 것으로 나타났다. 교사들은 이 관계가 전문적일 필요가 있다고 생각했다. Nevertheless, teachers focused on striking the right balance between maintaining safe learning environments and preserving productive working and assessment relationships with learners. This appeared to require a certain distance in the teacher‐learner relationship. Teachers thought the relationship needed to be professional:
그들은 내 친구나 뭐 그런 사람들이 아니다. 나는 내가 접근하기 쉬운 것이 중요하다고 생각하지만, 일정한 경계선이 있다; 그것은 전문적인 관계를 유지해야 한다. They [learners] are not my friends or anything. I think it's important that I'm approachable, but there are certain boundaries; it needs to stay a professional relationship. (A19, clinician)
모든 교사들은 평가의 맥락에서 학습자들에게 너무 가까이 가거나 지나치게 친숙해지지 않는 것에 대해 명백했다. All teachers were explicit about not getting too close to or overly familiar with learners in the context of assessment; teachers wanted to minimise undue influences of their personal biases.
3.2.2. 통제력 확보 대 독립성 허용 3.2.2. Taking control versus allowing independence
학습자가 학습에 대한 책임을 질 수 있도록 하겠다는 의도를 교사들이 분명히 밝혔지만, 거의 모든 교사들은 [결국 평가 과정을 통제해야 한다]고 믿었다. 교사들은 이것이 그들의 공식적인 위계적 위치와 그들의 경험과 전문지식이 학습자들의 것과 비교한 자연스러운 결과라고 지적했습니다. 이러한 통제의 필요성은 [의도된 학습 목표]와 임상적 맥락에서 [환자 안전]에 관한 교사의 고부담 책임으로 더욱 강화되었다. Although teachers were explicit about their intention to allow learners to take responsibility for learning, almost all teachers believed that, in the end, they should control the assessment process. Teachers indicated that this was a natural consequence of their formal hierarchal position and their level of experience and expertise compared with those of learners. This need for control was further augmented by teachers' high‐stake responsibility concerning intended learning objectives and, in a clinical context, patient safety:
하지만 내가 통제하고 있다. 내 말은, 그들이 배우고 있는지 확인하는 게 내 책임이라는 것이다[…] 해야 할 일과 배워야 할 일이 있습니다. 내가 그들에게 맡긴다면… 누가 알겠어요? 그래서, 나는 정말로 그것을 통제할 수 있어야 합니다. […] 누군가가 무언가를 할 수 있도록 허락하기 전에 그 일을 할 수 있는 기술을 갖추고 있는지 확인해야 한다. (B4, 임상의명언) But I am in control. I mean, I am, you know it is my responsibility to make sure they are learning. […] There are things that need to be done and that they have to learn. If I left it to them… who knows? So, I really need to be able to control it. […] You have to make sure that someone is skilled in doing something before you allow them to do it.(B4, clinician)
프로그램 평가에서 [초보 교사]들은 경험이 많은 교사들보다 [평가 과정에 대한 더 많은 통제]를 원했다. 프로그램 평가 경험이 제한적인 이들은 자신의 지식과 프로그램 요구 숙련도, 평가 시스템 전체의 효율성에 대해 불확실성의 목소리를 높였다. 그 결과, 그들은 지침과 지원의 질에 대한 높은 압력을 인식하였고, 학습자가 프로그래밍 방식의 평가에 대한 경험이 부족하기 때문에 불이익을 받을 수 있다고 우려하였다. [학습자의 자율성을 명시적으로 중시하는] 경험이 풍부한 교사일수록, 학습자가 평가 과정을 추가로 통제할 수 있도록 하는 데 더 편안해 보였다. 이는 [학습자의 능력과 역량에 대한 교사들의 신념]에 크게 영향을 받았다. Novice teachers in programmatic assessment desired more control of assessment processes than experienced teachers. Those with limited experience with programmatic assessment voiced uncertainties about their knowledge and proficiency with programme demands and the effectiveness of the assessment system as a whole. As a result, they perceived a high level of pressure on the quality of their guidance and support and feared that learners might be penalised as a result of their lack of experience with programmatic assessment. More experienced teachers, who explicitly valued learners' autonomy, seemed more comfortable with allowing learners to take additional control over assessment processes. This was strongly influenced by teachers' beliefs in learners' abilities and competencies:
나는 학생 개개인의 필요에 적응하는 것이 중요하다고 생각한다. 독립에 대한 필요성은 시간이 지남에 따라 증가한다. I think it's important to adapt to individual student needs […], the need for independence grows over time. (A21, basic scientist)
3.2.3. 평가관계의 충돌 3.2.3. Conflicts in assessment relationships
교사들이 교사-학습자 평가 관계에서 인지할 수 있는 [잠재적 갈등]은, 교사들이 [문제가 있거나 저조한 학습자들]과 상호작용할 때 발생할 가능성이 가장 높은 것으로 보인다. 교사들은 학습자에게 건설적이거나 비판적인 피드백을 제공하는 것에 대해 불편함을 토로하였으며, 관계를 지속하는 것에 대해 우려했다. The potential conflicts teachers were able to perceive in teacher‐learner assessment relationships seemed most likely to occur when teachers interacted with problematic or underperforming learners. Teachers voiced discomfort about providing learners with constructive or critical feedback and worried about preserving relationships:
'내가 [그들이 해야 할 일을 하지 않았다는 것]을 밝혀야 할 사람이다'라는 불편함이 내가 의학 교육자가 되기로 선택한 이유는 아니라고 생각한다. I think that discomfort with ‘I'm the one that is going to have to identify that they haven't done what they're supposed to do,' is not why I chose to be a medical educator. (B8, clinician)
게다가, 교사들은 그들의 불편함을 느끼는 이유는, 어려움을 겪고 있는 학습자들을 위해 [추가적인 미팅과 더 광범위한 피드백]과 같은 더 많은 슈퍼비전을 제공할 필요가 있다는 필요성을 느끼기 때문이라고 말했다. 이로 인해 학습자 성과에 대한 최종 고부담 의사 결정에서 실제로 평가되는 것이 무엇인지에 대한 우려가 제기되었다. 즉, 교사의 멘토링과 피드백 기술인가? 아니면 학습자의 성과와 진전인가? Furthermore, teachers attributed their discomfort to the perceived need to provide more supervision for struggling learners, such as additional meetings and more extensive feedback. This raised concerns about what would actually be assessed in the final high‐stake decision on learner performance: the teacher's mentoring and feedback skills or the learner's performance and progress?
[진급 위원회가 고부담 성과 결정에 대한 책임을 지고, 교사-학습자 평가 관계의 외부 당사자 역할을 할 때] 어려움을 겪고 있는 학습자와의 생산적인 작업 관계는 유지하기가 더 쉬웠다. 더욱이 교사들은 프로그램적 접근법에서 평가 결정을 공유된 책임shared responsibility으로 개념화하였는데, 이는 대부분 이전의 평가 경험에서 긍정적인 변화를 나타내는 것으로 인식되었다. A productive working relationship with struggling learners was easier to maintain when progress committees assumed responsibility for high‐stake performance decisions and functioned as external parties to teacher‐learner assessment relationships. Moreover, teachers conceptualised assessment decisions within a programmatic approach as a shared responsibility, which most perceived as representing a positive change from their previous assessment experiences:
사람이 더 필요하다. 우리는 서로의 관점을 고쳐주고, 서로에게 도움이 되는 것을 제공한다. 그것은 또한 학생들을 위해 그것을 더 안전하게 만든다. […] 다수의 지혜가 소수의 지혜보다 낫다. (B11, 임상명언) You need more people. We kind of correct each other's perspectives on things and offer things that are helpful. That also makes it safer for the student. […] The wisdom of several is better than the wisdom of some.(B11, clinician)
4. 토론 4. DISCUSSION
프로그램 평가 내의 평가 연속체는 이론적으로 하나의 극단('평가에 대한 학습적learning 개념')에서 반대 극단('평가에 대한 결산적accounting 개념')으로 흐르지만, 각각의 단일 저부담 평가는 이중의 목적을 가지고 있다. 대부분의 교사들은 저부담 평가의 [학습적 개념]에 초점을 맞췄다. 그러나 '학습'이 학습자의 고부담 평가 준비로 인식되고, 교사가 교사의 책무성을 강조하는 상황에서, 교사들은 [결산적 개념]으로 평가를 개념화하는 쪽으로 이동했고, 보다 지시적이고 통제적인 어조를 띠었다. [고부담 평가]로 평가를 개념화하게 되면 teaching to the test의 위험을 가지고 있었으며, (그 시험이 의미가 있건 없건) 특히 외부 고부담 평가가 결부된 상황에서 그러했다.
The assessment continuum within programmatic assessment theoretically flows from one extreme (the ‘learning conception of assessment’) to the opposite extreme (the ‘accounting conception of assessment’) yet holds a dual purpose in each single low‐stake assessment.2,3Most teachers focused on a learning conception of low‐stake assessment. However, when ‘learning’ was conceived as preparing learners for high‐stake assessment and when teachers emphasised teachers' accountability, teachers' assessment conceptualisations actually moved towards the accounting end of the continuum and carried a more directing and controlling tone. Such conceptualisations risk teaching to the test, whether it is considered meaningful or not, especially when external high‐stake assessments are involved.
Stiggins는 외부평가의 이러한 부정적인 영향을 설명하였는데, Stiggins는 [책무성accountability에 목적을 둔 중앙집중식 평가]가 개별 교사들의 교육정보 요구를 충족할 수 없으며, assessment practice을 경시trivialising할 위험이 있다고 언급하였다. 비록 본 연구 결과에 따르면, 프로그램 평가를 도입함으로써 교사의 초점을 [학습자가 시험을 통과하는데 필요한 지식과 기술의 수용성]에서 [지속적인 전문적 발전과 임상 역량]으로 전환시킬 수 있다는 것을 보여주었지만, 고부담 시험, 특히 표준화된 시험은 이 변화shift의 발생을 가로막을 수 있다.
This adverse impact of external assessment has been described by Stiggins,26who notes that centralised assessment for accountability purposes cannot meet the instructional information needs of individual teachers and may run the risk of trivialising their assessment practices. Although the results showed that the implementation of programmatic assessment could enable a shift in teachers' focus on the acquiral of the knowledge and skills necessary for learners to pass a test to a focus on continuous professional development and clinical competence, high‐stake and especially standardised examinations could impede the occurrence of this shift.
이 연구의 결과는 또한 교사들이 [학습자의 수행과 진도를 바탕으로 자신의 교육 효과성을 측정]할 때, 저부담 평가의 이해관계가 교사들에게도 중요해진다는 것을 보여주었다. 이것은 왜 그렇게 많은 교사들이 양질의 학습자 성과와 수행 표준의 달성을 보장하기 위해 평가 과정을 통제하고자 하는지 설명할 수 있다. 본 연구의 교사들은 [학습자가 갖는 의존적인 입장]을 알고 있었으며, [교사-학습자 평가 관계를 설명할 때 역설을 표현]했다. 교사-학습자 파트너십, 학습자 독립성 및 학습자 자기 조절 능력에 대한 평가는 교사가 평가 과정의 통제를 줄이기에 충분하지 않은 것으로 보였다. 교사들은 [학습자의 수행능력이나 역량]이 ['좋은' 실천에 대한 교사의 인식이나 확립된 기준]과 일치해야만, [평가 과정을 통제할 수 있는 더 많은 권한을 학습자에게 부여empower했다]고 인정했다. The results of this study further showed that the stakes of low‐stake assessment are just as much involved for teachers when teachers gauge their effectiveness based on learners' performance and progression. This may explain why so many teachers desire to control assessment processes to ensure high‐quality learner performance and achievement of performance standards. Teachers in our study were aware of the learner's position of dependency and expressed a paradox when describing teacher‐learner assessment relationships. The valuing of teacher‐learner partnerships, learner independence and learner self‐regulation abilities did not appear to be sufficient for teachers to lessen their control of assessment processes. Teachers admitted that they empowered learners to take more control over assessment processes only when the learner's performance or competence aligned with the teacher's perceptions of ‘good’ practice or established criteria.
이렇게 [교사들이 [무엇이 good practice을 구성하는지]를 일방적으로 결정하는 것]은 [자기조절이라는 목표]와는 상충되는 것으로 보이며, 평가가 학습을 위해for 사용될 경우 역효과적으로 작용할 수 있다. 게다가, [교사가 통제에 대한 필요성을 느끼는 것]은 [학습자들이 종종 저부담 평가를 저부담으로 인지하지 못하는 이유]를 설명할 수 있다. 많은 학자들이 [학습과 평가 환경 내에서 행동하고, 통제하며, 선택을 할 수 있는 학습자의 능력]으로 정의되는 [학습자 행위자성agency]의 중요성을 강조하고 있다. 또한 학습자 스스로도 [학습을 위해 평가를 사용할 수 있는 행위자성agency의 중요성]을 제기하고 있다. 여기에도 [신뢰와 통제 사이의 긴장]이 여전하다. [학습을 위한 평가AoL를 촉진하게 하기 위해, 학습자가 안전한 저부담 환경을 누릴 수 있도록] 하려면, 교사들을 위한 [지지적 저부담 환경 조성]에도 집중해야 한다. 교사와 학습자 모두에게 이해관계가 걸려있으며, 단일 평가의 낮은 consequence만큼 간단하지 않다.
This unilateral determination by teachers of what constitutes good practice seems at odds with the objective of self‐regulation27,28,29and could work counterproductively when assessment is intended to be used for learning. Furthermore, this need for control on the part of the teacher may explain why learners so often fail to perceive low‐stake assessments as being truly of low stakes and beneficial for their learning.5,6,7,30The importance of learner agency, defined as the learner's ability to act, control and make choices within the learning and assessment environment, is voiced by many scholars.1,31,32Moreover, learners themselves have voiced the importance of agency to enable the potential of using assessment for their learning.7Here too lingers the tension between trust and control. If we want learners to enjoy a safe low‐stake environment in order to facilitate assessment for learning, then we should focus on creating supportive low‐stake environments for teachers as well. Stakes are involved for both teachers and learners, and they are clearly not as straightforward as the low consequence of a single assessment.
교사들이 학습에 저부담 평가를 사용하도록 서포트하는 것으로 보이는 [두 가지 중요한 프로그램 평가 설계 특]징을 식별했다.
(a) 다수의 저부담 평가를 사용하는 것. 특히 Grades를 사용하지 않는 것.
(b) 독립적인 제3자를 평가 관계에 도입하는 진행 위원회의 실행.
The results also identified two important programmatic assessment design features that seemed to support teachers' use of low‐stake assessment for learning:
(a) the use of multiple low‐stake assessments, especially those without the use of grades, and
(b) the implementation of progress committees, which introduces an independent third party into the assessment relationship.
첫째, 다수의 저부담 평가와 다수의 평가자를 사용하는 원칙은 교사가 학습자에게 보다 정직하고 비판적인 피드백을 제공할 수 있게 해주었고, 의학교육의 '실패실패 failure to fail'에 비추어 볼 때 프로그래밍 평가 접근법의 유망한 설계 특징이다. 이전 연구에서는 [평가 증거가 서로 다른 맥락과 출처에서 근원했을originate 때], 진급 위원회와 학습자 모두 낮은 평가 증거의 품질을 더 높게 평가하는 것으로 나타났다. 따라서 [프로그램에서 제공되는 평가 증거 수집 기회의 숫자]는 복수의 이해관계자가 관여된 상황에서 [평가의 부담과 학습적 가치에 대한 인식]에 큰 영향을 미친다. 또한, 성적의 사용과 달리 [서술적 피드백의 강조]는 비교, 순위 및 경쟁이 아닌 숙달과 진보를 강조하기 때문에 학습 평가를 가능하게 하는 핵심 설계 요소로 인식되었다. 성적의 사용과 관련된 위험과 학습을 촉진하기 위한 서술적 피드백의 중요성은 다른 많은 사람들에 의해 강조되어 왔다.
First, the principle of using multiple low‐stake assessments and assessors enabled teachers to provide more honest and critical feedback to learners, which, in light of medical education's ‘failure to fail’33is a promising design feature of the programmatic assessment approach. Previous research has shown that both progress committees and learners rate the quality of low‐stake assessment evidence more highly when assessment evidence originates from different contexts and sources.34Thus, the number of opportunities for collecting assessment evidence provided by the programme strongly influences the perceptions of assessment stakes and learning value for the multiple stakeholders involved.7,34Furthermore, the emphasis on narrative feedback, as opposed to the use of grades, was perceived as a key design factor to enable assessment for learning because such feedback emphasises mastery and progress instead of comparison, ranking and competition. The risks associated with the use of grades and the importance of narrative feedback to promote learning have been highlighted by many others.1,30,35,36,37
둘째, 교사들은 평가의 맥락에서 학습자들과의 파트너십을 즐기고, 학습자들과 생산적인 업무 관계에 참여하기 위해 투자했습니다. 비록 일부 교사들에게 저부담 평가의 이중 목적이 불편한 결혼 생활unhappy marriage을 계속해서 나타낼 수 있지만, 우리의 결과는 역할 갈등이 꼭 필요한 것은 아님을 보여주었다. 프로그램 평가에서 다자 역할 멘토링에 대한 연구에서도 유사한 발견이 나타났습니다. 본 연구에서는, [어려움을 겪고 학습능력이 떨어지는 학습자]에 대해서만 갈등이 보고되었다. (임상 역량 위원회로도 사용되고 있는) [독립적인 진급 위원회의 운영]은 교사들이 평가 맥락에서 생산적인 교사-학습자 관계를 보존하면서, 이러한 갈등을 보다 쉽게 처리할 수 있는 기회를 만들었다. Second, teachers enjoyed partnering with learners in the context of assessment and invested in engaging in productive working relationships with learners. Although for some teachers the dual purpose of low‐stake assessment may continue to represent an unhappy marriage, our results showed that a role conflict is not necessary. Similar findings emerged in a study on multiple‐role mentoring in programmatic assessment.38Conflicts in our study were reported only in relation to struggling and underperforming learners. The implementation of independent progress committees, also in use as clinical competency committees,39created opportunities for teachers to deal with this conflict more easily when preserving a productive teacher‐learner relationship in an assessment context.
우리의 연구 결과는 프로그래밍 방식의 평가의 다른 구현에 도움이 될 수 있다. 선생님들은 평가로 학습자에게 불이익이 가는 것에 대해 걱정합니다. 진급 위원회는 잘 조직되면 서포트, 전문지식, 그리고 무엇보다 프로그램 평가에 참여하는 [교사들을 위한 안전망]을 제공한다. 학생의 실패는 [집단적인 책임]이 되고, 학습자의 커리어는 [개인의 결정이나 제한된 스냅사진]에 의존하지 않는다. 이것은 교사들로부터의 압력의 일부를 제거해주는 것으로 보이며, 그들이 더 솔직한 건설적인 피드백을 제공할 수 있게 해주고, 장기간 참여prolonged engagement의 이점을 유지하면서도, 우려를 제기할 수 있게 한다. 나아가, 진급 위원회에 참여하는 것은 [평가 목표에 대한 교사들의 공통된 이해]에 기여하고, 프로그램 평가에서 평가자로서의 역할에 대한 교사들의 전문적인 발전에 도움이 되는 것으로 보인다. Our findings may benefit other implementations of programmatic assessment. Teachers worry about disadvantaging learners with assessment. A progress committee, when organised well, provides support, expertise and, more importantly, a safety net for teachers involved in programmatic assessment. Failure of a student becomes a collective responsibility and learners' careers do not rest on decisions made by individuals or on limited snapshots. This seems to take some of the pressure from teachers and allows them to provide more honest constructive feedback or to raise concerns when preserving the benefits of prolonged engagement.4Furthermore, participating in progress committees seems to contribute to teachers' shared understanding concerning assessment objectives and benefits teachers' professional development in their roles as assessors in programmatic assessment.
저부담 평가에 대해서 교사마다 서로 다르게 개념화한다면, 평가에 대해 다양한 믿음을 가질 가능성이 있다. 그리고 그 중 적어도 일부는 PA의 근본적인 평가 철학에 반할 수 있다. 학생들이 의료연수 중 많은 다양한 교사를 만나다 보니 프로그램에 사용되는 의도나 평가방법과 맞지 않는 평가에 대한 가치관이나 신념이 다른 교사를 만나게 될 가능성이 높다. 이는 학습자가 [양립할 수 없는 평가 목표나 메시지를 경험]하고, 냉소적으로 '그냥 해달라는 대로 해줘' 접근방식을 따르도록 유도할 가능성이 있으며, 이는 [학습을 위한 평가]의 의미 있는 활용을 방해할 수 있다. 더욱이, 교사들은 프로그램 평가와 같은 [복잡한 이중 목적 시스템]이 [그들의 근본적인 신념과 일치하지 않을 경우 거부하거나 무시]할 수 있다. 교수개발은 프로그램 평가의 기본 원칙과 교사의 평가 개념화에 초점을 맞춰야 한다. 이러한 원칙이 학습자와 평가 관계에 참여할 때 평가 실무에 영향을 미칠 수 있기 때문이다. The different conceptualisations of low‐stake assessment indicate that teachers are likely to hold varying beliefs about assessment, at least some of which may be contrary to the underlying assessment philosophy advocated by its developers. As students encounter many different teachers during medical training, it is likely that they will encounter teachers with different values or beliefs about assessment that do not align with the intentions and assessment methods used in a programme. This risks the possibility that learners will have experiences of irreconcilable assessment objectives or messages and lead them to follow a cynical ‘give them what they want’ approach,13which would hinder a meaningful uptake of assessment for learning. Moreover, teachers may resist or dismiss innovative assessment methods and complex dual‐purpose systems, like programmatic assessment, if these methods and approaches do not align with their fundamental beliefs about education and teaching.13Faculty development should focus on the underlying principles of programmatic assessment and teachers' assessment conceptualisations as these may affect their assessment practices when engaging with learners in assessment relationships.
4.1. 제한사항 4.1. Limitations
우리의 연구결과는 여러 가지 한계점에 비추어 고려되어야 한다.
첫째, 이 연구는 두 가지 고유한 프로그램 평가 구현(즉, 동기 부여가 높은 학습자와 교사 모두를 선택한 기준을 사용한 작은 코호트 크기)을 포함했다. 우리는 미래의 연구와 실습을 안내하는 교훈이 될 수 있는 메커니즘에 대한 통찰력을 제공하는 능력을 고려하여 소위 극단적인 경우를 의도적으로 조사했다.
둘째, 평가는 학습자, 과제, 교사 및 상황 특성의 복잡한 상호 작용으로 다른 맥락으로의 일반화는 쉬운 일이 아니다. 교사의 역할과 책임은 프로그램, 기관, 문화적 맥락에 따라 다를 수 있다. 공식적인 역할과 평가 책임의 최대 변화를 의도적으로 추구함으로써, 우리는 프로그램 평가에서 교수와 평가의 근본적인 개념화에 초점을 맞췄다.
셋째, 이 연구는 교사들의 현실에 대한 인식을 탐구했습니다. 교사들이 믿고 실천했다고 보고한 것과 실제로 믿고 실천하는 것 사이에는 차이가 있을 수 있다.
마지막으로, 우리는 직접 요청 이메일에 대한 응답으로 참여를 자원한 교사들을 모집했기 때문에, 선택 편향을 도입했을 수 있습니다.
Our findings should be considered in the light of a number of limitations.
First, this study included two unique implementations of programmatic assessment (ie, a small cohort size, using criteria that selected both highly motivated learners and teachers). We purposefully investigated these so‐called extreme cases in view of their ability to provide insight into the mechanisms underlying implementations, which can serve as lessons to guide future research and practice.19
Second, assessment is a complex interaction of learner, task, teacher and context characteristics,40 which makes generalisations to other contexts challenging.41 Teachers' roles and responsibilities can vary amongst programmes, institutions and cultural contexts. By purposefully seeking maximum variation in formal roles and assessment responsibilities, we focused on the underlying conceptualisation of teaching and assessment in programmatic assessment.
Third, this study explored teachers' perceptions of their reality. There may be differences between what teachers report they believe and intend to do versus what they actually believe and do.
Finally, we may have introduced selection bias as we recruited teachers who volunteered to participate in response to a direct solicitation email.
5. 결론 5. CONCLUSIONS
교사들의 저부담 평가 개념화는 학습에만 초점을 맞추지 않는다. [교육 효과를 모니터링하기 위한 평가의 사용]은 교사의 [평가 행위]과 교사-학습자 [평가 관계]에 긴장을 조성할 수 있다. 평가 개념화에서 교사의 관점을 이해하는 것은 학습 실무에 대한 평가와 일치하도록 그러한 개념화에 영향을 미치거나 변경하기 위한 단계를 나타낸다. [다양한 평가법 및 평가자에 걸친 표본 추출]과 [진급 위원회 도입]은 장기 참여의 편익을 보존할 때 교사들이 학습에 이익을 주는 평가를 사용할 수 있도록 지원하는 프로그래밍 방식의 평가의 중요한 설계 특징으로 식별되었다.
However, teachers' conceptualisations of low‐stake assessments are not focused solely on learning. The use of assessment to monitor teaching effectiveness may create tension in teachers' assessment practices and the teacher‐learner assessment relationship. Understanding the position of teachers' assessments conceptualisations represents a step towards influencing and perhaps changing those conceptualisations to align with assessment for learning practices. Sampling across different assessments and assessors and the introduction of progress committees were identified as important design features of programmatic assessment that support teachers in using assessment to benefit learning, when preserving the benefits of prolonged engagement.
Med Educ. 2020 Jun;54(6):528-537.
doi: 10.1111/medu.14075.Epub 2020 Apr 6.
Between trust and control: Teachers' assessment conceptualisations within programmatic assessment
1Department of Educational Development and Research, Faculty of Health, Medicine and Life Sciences, School of Health Professions Education, Maastricht University, Maastricht, the Netherlands.
2Department of Pathology, Cardiovascular Research Institute Maastricht, Faculty of Health, Medicine and Life Sciences, Maastricht University, Maastricht, the Netherlands.
3Education Institute, Cleveland Clinic, Lerner College of Medicine, Case Western Reserve University, Cleveland, Ohio, USA.
4Department of Education, Utrecht University, Utrecht, the Netherlands.
Objectives:Programmatic assessment attempts to facilitate learning through individual assessments designed to be of low-stakes and used only for high-stake decisions when aggregated. In practice, low-stake assessments have yet to reach their potential as catalysts for learning. We explored how teachers conceptualise assessments within programmatic assessment and how they engage with learners in assessment relationships.
Methods:We used a constructivist grounded theory approach to explore teachers' assessment conceptualisations and assessment relationships in the context of programmatic assessment. We conducted 23 semi-structured interviews at two different graduate-entry medical training programmes following a purposeful sampling approach. Data collection and analysis were conducted iteratively until we reached theoretical sufficiency. We identified themes using a process of constant comparison.
Results:Results showed that teachers conceptualise low-stake assessments in three different ways: to stimulate and facilitate learning; to prepare learners for the next step, and to use as feedback to gauge the teacher's own effectiveness. Teachers intended to engage in and preserve safe, yet professional and productive working relationships with learners to enable assessment for learning when securing high-quality performance and achievement of standards. When teachers' assessment conceptualisations were more focused on accounting conceptions, this risked creating tension in the teacher-learner assessment relationship. Teachers struggled between taking control and allowing learners' independence.
Conclusions:Teachers believe programmatic assessment can have a positive impact on both teaching and student learning. However, teachers' conceptualisations of low-stake assessments are not focused solely on learning and also involve stakes for teachers. Sampling across different assessments and the introduction of progress committees were identified as important design features to support teachers and preserve the benefits of prolonged engagement in assessment relationships. These insights contribute to the design of effective implementations of programmatic assessment within the medical education context.
프로그램적 평가를 위한 오타와 2020 합의문 - 2. 도입과 실천(Med Teach, 2021) Ottawa 2020 consensus statements for programmatic assessment - 2. Implementation and practice Dario Torrea , Neil E. Riceb , Anna Ryanc, Harold Bokd, Luke J. Dawsone, Beth Biererf , Tim J. Wilkinsong , Glendon R. Taith, Tom Laughlini, Kiran Veerapenj, Sylvia Heenemank, Adrian Freemanb and Cees van der Vleutenk
도입 Introduction
2020년 오타와 회의에서 프로그램 평가의 12가지 이론적 원칙에 대한 합의가 이루어졌다(Heeneman et al. 2021). 합의 그룹은 이행의 과제를 인식하고(Norcini 2007 및 Burch 2007; Norcini 외 2018) 프로그램 평가와 그 원칙이 교육적 이점을 발휘하기 위해서는, 이러한 원칙이 다양한 맥락과 규제 상황에 걸쳐 어떻게 구현되는지에 대한 공통의 이해를 공유하는 것이 중요하다는 것을 확인했다. 따라서 Ottawa 2020 합의문에 따라, 가능자와 장벽을 식별하고 다른 것보다 더 쉽게 구현된 측면에 대한 통찰력을 얻기 위해 프로그램 평가의 구현에 대한 설명을 수집하기로 합의했다. At the 2020 Ottawa conference, consensus was reached on twelve theoretical principles of programmatic assessment (Heeneman et al.2021). The consensus group, recognising the challenges of implementation (Norcini and Burch2007; Norcini et al.2018), identified that, in order for programmatic assessment and its principles to exert their educational benefits, it is important to share a common understanding of how these principles are implemented across different contexts and regulatory settings. As a follow up to the Ottawa 2020 consensus statement, it was therefore agreed to collect descriptions of implementations of programmatic assessment in order to identify enablers and barriers and to gain insight into those aspects that have been more readily implemented than others.
[프로그램적 평가]는 [학습자에게 피드백을 제공하고, 신뢰할 수 있는 평가 결정에 정보를 제공하기 위해, 혼합된 평가 방법을 사용하여, 평가의 학습적 기능을 육성하고 활용하는, 종단적이고 발달적인 접근법]이다(Schuwirth 및 Van Der Vleuten 2011; Van Der Bleuten et al. 2012). 프로그래밍 방식의 평가 시스템이 진정한 교육 진보와 성과를 파악하는 데 더 효과적이고 유효할 수 있다는 의견이 제시되었다(Cook et al. 2015). 프로그래밍 평가의 타당성은 이전에 케인의 타당성 이론의 중요한 구조를 프로그래밍 평가의 구성 요소와 교리에 매핑함으로써 평가되었다. 또한 프로그램적 평가의 교육적 유익성과 이론적 tenets에 대한 증거가 증가하고 있다.
Programmatic assessment is a longitudinal, developmental approach that fosters and harnesses the learning function of assessment, using a mix of assessment methods for the purpose of providing feedback to learners and informing credible assessment decisions (Schuwirth and Van der Vleuten2011; Van Der Vleuten et al.2012). It has been suggested that a programmatic assessment system may be more effective and valid for discerning true educational progress and performance (Cook et al.2015). The validity of programmatic assessment has previously been appraised by mapping the overarching structure of Kane’s validity theory to the components and tenets of programmatic assessment (Schuwirth and van der Vleuten2012). Furthermore, there is an increasing body of evidence about the educational benefits and theoretical tenets of programmatic assessment (Van Der Vleuten and Schuwirth2005; Bierer et al.2015; Heeneman et al.2015; Schut et al.2021).
보건 전문직 교육 프로그램은 궁극적으로 구현에 영향을 미치는 여러 상호작용 요소를 포함하는 복잡하고 역동적인 다층적 시스템을 포함한다. 다양한 교육 환경에서 프로그램 평가가 어떻게 구현되고 통합되었는지 배우는 것은, 구현implementation 프로세스에 영향을 미칠 수 있는 잠재적 enabler와 barrier를 식별하면서, 명시된 원칙이 교육 관행으로 어떻게 변환되었는지에 대한 통찰력을 얻는 데 필수적이다. 이러한 통찰력은 현재 프로그램 평가를 사용하는 교육자 및 기관 및 이를 구현할 계획 중인 교육자에게 유용할 수 있습니다. Health Professions Education programmes involve complex, dynamic, multilevel systems incorporating a number of interacting factors that ultimately affect implementation. Learning how programmatic assessment has been implemented and incorporated in different educational contexts is essential to gain insight on how the stated principles have been translated into educational practices, whilst identifying potential enablers and barriers that may impact implementation processes. These insights can be valuable for educators and institutions that currently use programmatic assessment and for those who are planning to implement it.
본 논문에서 우리는 프로그램 평가의 구현에 대한 설명과 서로 다른 설명이 합의문에 확립된 원칙과 어떻게 일치하고 이를 준수하는지에 대해 보고한다. 이 논문의 목적은 두 가지이다:
첫째, 1단계에서 식별된 12가지 원칙 각각과 관련된 구현 구성 요소를 설명하고, 다른 기관과 교육 환경에 걸쳐 구현 전략의 잠재적 가변성을 포착하는 것.
둘째, 다음과 관련된 가능 요소와 장벽에 대한 통찰력을 얻는 것이다. 프로그램 평가의 시행
In this paper we report on descriptions of implementation of programmatic assessment and how different descriptions align with and adhere to the principles established in the consensus statement. The purpose of this paper is twofold:
first to provide descriptions of the implementation components associated with each of the 12 principles identified in phase 1, capturing the potential variability of implementation strategies across different institutions and educational settings;
second, to gain insight into enablers and barriers related to the implementation of programmatic assessment.
방법들 Methods
참가자 및 데이터 수집 Participants and data collection
프로그램 평가의 측면을 구현한 헬스케어 프로페셔널스 교육(Healthcare Professional Education)의 15개 프로그램 샘플은 저자들 중 두 명(CVD, AF)에 의해 확인되었다. 표본에는 3개 대륙에 걸쳐 6개국의 학부 및 대학원 프로그램이 포함되었다. 오타와 2020 컨퍼런스에 이어, 프로그램 평가의 12가지 원칙(Heeneman et al. 2021)과 추가 프로그램 1개에 대한 합의를 이룬 그룹의 참가자들은 프로그램 평가 구현에 대한 16개 항목의 질문지를 작성하도록 초청되었다. A sample of 15 programmes from Healthcare Professions Education that had implemented aspects of programmatic assessment was identified by two of the authors (CVD, AF). The sample included undergraduate and postgraduate programmes from six different countries across three continents. Following the Ottawa 2020 conference, the participants in the group who achieved consensus on the 12 principles of programmatic assessment (Heeneman et al.2021), plus one additional programme, were invited to complete a 16-item questionnaire about implementation of programmatic assessment.
데이터 분석 Data analysis
설문 응답은 연역적 주제 분석을 사용하여 분석되었다(Boyatzis 1998; Braun and Clarke 2006). 프로그래밍 평가의 12가지 원칙이 유사한 이론적 토대를 공유하고(Heeneman et al. 2015; Torre et al. 2020) 높은 수준의 상호 연관성을 가진다고 가정할 때, 프로그래밍 평가 원칙은 주제 분석을 위한 프레임워크(또는 민감화 개념)로 사용되었다(Brooks et al. 2015). 반복적인 협업 주제 분석 프로세스를 사용하여, 저자 중 두 명(DT, NR)이 새로운 테마를 찾기 위해 데이터를 읽고, 이들을 만나 개발된 테마를 논의한 다음, 데이터에 대한 공통 이해를 구축하고 테마 내부 및 테마 간의 관계를 식별하기 위해 이들을 더욱 개선했다. 궁극적으로 데이터는 세 개의 전체적으로 의미 있는 클러스터로 구성되었다(그림 1). Survey responses were analysed using a deductive thematic analysis (Boyatzis1998; Braun and Clarke2006). Given that the twelve principles of programmatic assessment share similar theoretical underpinnings (Heeneman et al.2015; Torre et al.2020) and have a high degree of interrelatedness, the programmatic assessment principles were used as a framework (or sensitizing concepts) for the thematic analysis (Brooks et al.2015). Using an iterative collaborative thematic analysis process, two of the authors (DT, NR) read through the data looking for emergent new themes, met to discuss the themes developed, and then further refined them to build a common understanding of the data and identify relationships within and across themes. Ultimately, data were organised into three overall meaningful clusters (Figure 1).
결과 Results
Implementation data는 15개 프로그램(학부 의학 교육 8개, 졸업후 의학 교육 3개, 학부 치과 교육 1개, 학부 수의학 프로그램 2개)에서 수집되었다(표 1). 합의문 조사에 참여한 프로그램 중 하나를 제외한 모든 프로그램도 이행 조사에 참여했다. Implementation data were collected from 15 programmes (eight undergraduate (primary degree) medical education, three postgraduate (residency or vocational) medical education, one undergraduate dentistry and two undergraduate veterinary programmes) (Table 1). All but one of the programmes involved in the consensus statement survey, also took part in the implementation survey.
우리는 연구 결과를 두 부분으로 나누어 발표한다.
첫째, 우리는 프로그램 전반에 걸쳐 공통적인(응답자 중 50% 이상이 언급한) 구현 구성요소에 대해 보고하는 여러 기관에 걸친 프로그램 평가 원칙의 이행을 설명하고 원칙이 교육 관행으로 어떻게 번역되었는지에 대한 예를 제공한다(1부).
둘째, 우리는 활성화 요소, 장벽, 학습된 교훈 및 프로그램 평가 구현의 의도하지 않은 결과에 대한 연구 결과를 제시한다(2부).
We present our findings in two parts.
Firstly, we describe the implementation of programmatic assessment principles across different institutions reporting on implementation components that were common across programmes (mentioned by more than 50% of respondents) and provide examples of how the principles were translated into educational practices (Part 1).
Secondly, we present findings on enablers, barriers, lessons learned, and unintended consequences of the implementation of programmatic assessment (Part 2).
1부 – 프로그램 평가 원칙의 이행 Part 1 – implementation of programmatic assessment principles
프로그램 평가의 12가지 원칙의 실행은 세 가지 주제로 그룹화되었다.
(1) 성장과 발전을 위한 학습자와의 대화를 촉진하기 위한 지속적이고 의미 있는 피드백
(2) 이해 관계의 연속체라는 맥락 내에서 혼합된 평가 방법
(3) 비례성 및 삼각측량 원칙을 포함한 공정하고 신뢰할 수 있는 의사결정 프로세스 수립.
The implementation of the 12 principles of programmatic assessment were grouped under three themes:
(1) Continuous and meaningful feedback to promote a dialogue with the learner for the purpose of growth and development;
(2) Mixed methods of assessment across and within the context of a continuum of stakes; and
(3) Establishing equitable and credible decision-making processes including principles of proportionality and triangulation.
주제 1: 성장과 발전을 위한 학습자와의 대화를 촉진하기 위한 지속적이고 의미 있는 피드백: Theme 1: Continuous and meaningful feedback to promote a dialogue with the learner for the purpose of growthand development:
이 주제 아래 원칙 1, 2, 10, 11 및 12에 맞춰 9개의 실행 구성요소(표 2)가 있었다. There were nine implementation components (Table 2) aligned with principles 1, 2, 10, 11 and 12 under this theme.
대부분의 프로그램은 (실시간으로 진행되든, 일정 간격으로 진행되든)모든 평가가 피드백에 최적화된 단일 데이터 포인트에 기여하는 구현을 보고하였다. 여러 평가에서 집계된 데이터를 사용한 서술적 피드백 전달이 자주 언급되었다. 피드백은 성찰과 향후 학습을 지원하기 위해 구두 또는 서면 형태로 학습자에게 전달되었습니다. 대다수의 프로그램은 피드백 품질을 높이고 의미 있는 성찰과 목표 설정 과정을 육성하기 위해서는 [슈퍼바이저와 학습자 간의 관계 개발]이 중요하다고 강조했다. Most programmes reported an implementation in which every assessment contributed a single data-point optimised for feedback, whether that was occurring in real time or at specific intervals. The delivery of narrative feedback using aggregated data from multiple assessments was often mentioned. Feedback was delivered to learners in verbal and/or written form, with the intent of providing support for reflection and to guide future learning. The majority of programmes highlighted the importance of developing a relationship between supervisor and learner to enhance feedback quality and foster a process of meaningful reflection and goal setting.
모든 프로그램은 학습자가 자신의 진도와 성취도를 지원하기 위해 [코치나 지도교수를 배정받는 시스템]의 시행을 보고했습니다. 대부분의 프로그램은 코치가 학습자들과 [분기별 또는 2년에 한 번꼴로 정기적으로 미팅]을 갖는 것으로 나타났지만, 어떤 경우에는 학습 성적 부진이나 우려에 대응하여 임시적으로 회의를 하기도 했습니다. 대부분의 프로그램은 교수-학습자 거래를 용이하게 하기 위해 평가 데이터를 수집, 저장 및 쉽게 액세스하기 위해 특정 유형의 [전자 포트폴리오]를 사용했다. [중간 검토]는 진행 상황 평가, 학습자의 종방향 학습 궤적에 대한 성찰 촉진, 학습 계획 수립 및/또는 필요한 경우 추가 교정 조치를 목적으로 수행되었다. All programmes reported the implementation of a system in which learners were assigned a coach or advisor to support their progress and achievement. The majority of programmes indicated that coaches had recurrent meetings with learners (quarterly or biannually); however, in some instances, meetings were more ad hoc in response to poor academic performance or concerns being flagged. Most programmes used some type of electronic portfolio to gather, store, and readily access assessment data to facilitate faculty-learner transactions. Intermediate reviews were performed for the purpose of assessing progression, promoting learners’ reflection about their longitudinal learning trajectory, formulating learning plans and and/or additional remediation if needed.
대부분의 프로그램은 프로그램에 들어온 순간부터 [평가 과정에 대한 학습자의 engagement와participation]을 보고했습니다. 어떤 경우에는 프로그램은 학습자가 자기 성찰에 중점을 두고 피드백에 반응하고 개별 학습 계획을 개발하도록 요구했습니다. 일부 프로그램에서는 개인별 학습 우선순위에 맞춰 가르치는 한편 학습자가 자기 계발을 위해 주도하도록 장려하기도 했다. 그러나 일반적으로 이 원칙은 많은 학습자를 위한 개별 학습의 병참적, 조직적 어려움으로 인해 부분적으로만 시행되었다.
Most programmes reported learners’ engagement and participation in the assessment process upon entering the program. In some cases, programmes required learners to respond to feedback and develop individual learning plans, with an emphasis on self-reflection. In some programmes, teaching was tailored to meet individual learning priorities whilst encouraging learners to take agency for their own development. Generally, however, this principle was only partially implemented due to the logistical and organisational challenges of individualising learning for a high number of learners.
주제 2: 연속적인 이해 관계의 맥락에서 혼합된 평가 방법: Theme 2: Mixed methods of assessment across and within the context of a continuum of stakes:
이 주제 아래 원칙 4, 5, 6과 일치하는 네 가지 공통 구현 구성 요소(표 3)가 있었다. There were four common implementation components (Table 3) aligned with principles 4, 5 and 6 under this theme.
모든 프로그램은 단일 유형의 평가가 모든 역량을 포착할 수 없으며, 구현에는 여러 평가 방법과 도구의 사용이 수반된다고 지적했다. All programmes indicated that no single type of assessment can capture all competencies and that implementations involved the use of multiple assessment methods and tools.
구현된 다양한 평가는 [학습자에게 풍부하고 의미 있는 피드백을 제공하는 데 사용될 수 있는 수치 및 서술 데이터를 수집]할 수 있도록 했다. 거의 모든 프로그램에서 평가의 혼합이 역량 프레임워크에 맞추어 설계designed against되었다고 언급했으며, 많은 프로그램에서는 Miller의 피라미드를 사용하여 설계된 평가 프로그램과 건설적인 정렬을 고수하고 있음을 나타냈다. 대부분의 프로그램은 [다수의 저부담 사업장 기반 평가]가 실제 상황 역량 평가에 특히 중요한 것으로 나타났으며, 대부분의 프로그램은 지식 영역에서 시뮬레이션 평가(예: OSCE)와 서면 평가(진도 테스트 포함)의 사용을 보고했다. The variety of assessments implemented allowed for the gathering of both numerical and narrative data that could be used to provide rich and meaningful feedback to learners. Nearly all programmes mentioned that the mix of assessments was designed against a competency framework, and many indicated adherence to constructive alignment and a programme of assessments designed using Miller’s pyramid. Most programmes indicated multiple low-stakes workplace-based assessments as particularly important for assessing real-world situational competence, and most reported the use of simulated assessments (e.g. OSCEs) and written assessments (including progress testing) in the knowledge domain.
대부분의 프로그램들은 아래의 두 가지를 조합하여 [연속적인 이해 관계의 구현]을 보고하였다.
피드백의 빈번한 전달이 수반되는 다수의 저부담 평가의 사용 (예: 직접 관찰 작업장 기반 평가 또는 순차적 미니 OSCE)
커리큘럼의 주요 발달적 이행 시점에서 수행되는 고부담 평가와의 연계 (예: 임상 순환, 최종 필기 시험 및 OSCE 또는 국가 면허 시험에 들어가기 전 진행 시험).
Most programmes reported the implementation of a continuum of stakes by
the use of multiple low- stakes assessments with frequent delivery of feedback (e.g. direct observation workplace-based assessments or sequential mini-OSCEs)
interwoven with high-stakes assessments performed at key developmental transition points in the curriculum (e.g. progression exams before entering clinical rotations, final written exams and OSCEs or national licensing exams).
이 원칙은 저부담 평가와 고부담 평가의 타이밍 및 점진적 조합과 관련하여 광범위한 형태의 시행 방식을 보였다. 더욱이 [학생들에게 평가의 이해stakes 관계에 대한 정보를 제공하고, 그러한 이해 관계의 연속체가 어떻게 운영될 것인지를 설명하는 것]은 대부분의 프로그램에서 빈번한 실행 전략이었다.
This principle had a wide range of implementations, related to timing and progressive combination of low- and high-stakes assessment. Furthermore, providing students with information about the stakes of assessment and explaining how such a continuum of stakes was going to be operationalised was a frequent implementation strategy in the majority of programmes.
많은 프로그램은 [이해관계자들이 평가를 통과/실패가 아닌 [일련의 부담stakes]에 있다고 생각하도록 권장하기 위한 정보와 지침을 제공하는 것]의 중요성을 강조하였다. 고부담 평가에 앞서 [피드백이 수반되는 다수의 저부담 평가를 구현하는 것]은 프로그램이 총괄평가 접근법이 지배하는 문화에서, stakes의 연속체 속에서 이뤄지는 ['학습을 위한 평가'라는 언어와 문화]로 전환하기 시작할 수 있도록 했다.
Many programmes highlighted the importance of providing information and guidance to encourage stakeholders to think of assessments as being on a continuum of stakes rather than pass/fail. The implementation of multiple low-stakes assessments with feedback prior to high-stakes assessments allowed programmes to begin shifting from a predominant summative assessment approach to a language and culture of assessment for learning through a continuum of stakes.
주제 3: 비례성 및 삼각측량 원칙을 포함한 공정하고 신뢰할 수 있는 의사결정 프로세스 수립: Theme 3: Establishing equitable and credible decision-making processes including principles of proportionality and triangulation:
이 주제 아래 원칙 3, 7, 8 및 9와 일치하는 10개의 공통 구현 구성 요소(표 4)가 있었다. There were ten common implementation components (Table 4) aligned with principles 3, 7, 8 and 9 under this theme.
대부분의 프로그램의 경우, 시간이 지남에 따라 수집된 여러 평가 데이터 포인트의 검토 및 집계를 기반으로 위원회가 고부담 의사결정(예: 다음 연수로의 진행 결정)을 내렸다. 고부담 결정의 시기는 프로그램에 따라 다양하며, 일부는 연 2회 또는 분기별로 발생하기도 한다. 저부담 의사 결정(예: 임상 기술에 대한 직접 관찰의 수행에 대한 결정)은 학습자의 성장과 개발을 촉진하기 위한 피드백을 제공하기 위해 시행되며, 하나 또는 소수의 평가 데이터 포인트를 기반으로 했다. 그러나 대다수의 프로그램은 [비례성 원칙]에 따라 저위험 평가가 고위험 의사결정에 기여한 데이터 포인트 중 하나가 될 것이라고 지적하였다.
For most programmes, high-stakes decisions (e.g. decisions to progress to the next year of training) were made by a committee based on the review and aggregation of multiple assessment data points collected over time. The timing of high-stakes decisions varied by programmme, with some occurring yearly and others biannually or quarterly. Low-stakes decisions (e.g. a decision on a performance of a direct observation of clinical skills) were based on a single or few assessment data points for the purpose of providing feedback to promote learners’ growth and development. However, the majority of programmes indicated that when implementing the principle of proportionality, low-stakes assessments would be one of the data points that contributed to a high-stakes decision.
대부분의 프로그램은 [고부담 의사 결정을 구현하기 위하여 어떤 형태든 위원회를 포함한다]고 보고했으며, 종종 2개 이상의 단계로 진행되는 위원회 의사 결정 프로세스를 기술하기도 했다
진행 위원회는 모든 평가 데이터를 검토한 후 학습자의 성과에 대한 첫 번째 결정을 내립니다. 그리고 나서 시험 위원회는 최종 결정에 도달합니다.
Most programmes reported that implementation of high-stakes decisions involved some form of a committee and described some version of a two (or more) stage committee decision-making process
(e.g. a progress committee makes a first determination about a learner’s performance after reviewing all assessment data, and then an examiner committee reaches a final decision).
기술된 위원회는 일반적으로 [학습자의 평가 데이터를 검토한 후, 최종 결정에 도달하기 위해, 데이터 중심 심의에 참여하는 독립적인 훈련된 시험관trained examiner 그룹]으로 구성되었다. 대부분의 프로그램은 의사결정을 지도하고 투명성과 신뢰성을 보장하기 위해서는, [학습자가 공유된 의사결정 과정에 직접 engagement and participation]하기 위해 [잘 전달되고 사전 결정된 절차, 규칙 또는 루브릭이 필요함]을 강조하였다.
The typically described committee consisted of a group of independent, trained examiners who review learners’ assessment data, often collected in an e-portfolio, and then engage in a data-driven deliberation to reach a final decision. Most programmes highlighted the need for well communicated, pre-determined procedures, rules or rubrics to guide decision-making and to ensure transparency and credibility, often with direct learners’ engagement and participation in a shared decision-making process.
삼각측량은 대부분의 프로그램에서 고부담 의사결정 과정에서 중요한 것으로 보고되었으며, 일반적으로 이전에 가장 중요한 역량 기반 프레임워크에 매핑된 여러 평가 양식의 데이터를 종합하여 구현되었다.
Triangulation was reported by most programmes as important in the high-stakes decision-making process and was generally implemented by synthesizing data from multiple assessment modalities that had been previously mapped to an overarching competency-based framework.
모든 프로그램이 모든 학습자의 종적 성과에 대한 모니터링을 포함하는 의사결정 과정을 설명했지만, 대다수는 대부분의 의사결정이 명확하고 많은 논의를 필요로 하지 않으며, 그 결과가 교수진이나 학습자에게 '깜짝surprises'으로 다가오지 않는다고 보고했다. 대다수의 프로그램은 심층적인 위원회 논의가 성과 기준 충족에 대한 우려가 있는 상대적으로 적은 수의 학습자에게 초점이 맞춰진다고 보고했다. Whilst all programmes described decision-making processes that included the monitoring of longitudinal performance of all learners, the majority reported that most decisions were clear-cut and did not require much, if any, discussion, with outcomes not coming as ‘surprises’ for faculty or learners. The majority of programmes reported that in depth committee discussions usually focused on a relatively small number of learners for whom there were concerns over meeting performance standards.
2부 - 학습자, 장벽 및 교훈 Part 2 -enablers, barriers, and lessons learned
프로그램 평가 구현의 가장 강력한 원동력은 [헌신적인 교수진이 뒷받침하는 명확한 비전을 가진 강력한 리더십]이라는 데 의견이 일치했다. 대다수의 프로그램들은 [명확하게 소통하고 접근하기 쉬운 목표와 이행 계획]이 필수적인 원동력이라고 언급하였다. 몇몇 프로그램에서는 설계와 구현 계획의 개발에 투자하는 것이 구현의 성공에 필수적이라고 언급하였다.
There was agreement that the strongest enabler for programmatic assessment implementation is strong leadership with a clear vision supported by committed faculty. The majority of programmes mentioned that having clearly communicated, accessible goals and delivery plans was an essential enabler. Several programmes mentioned that investing in the development of a design and implementation plan was fundamental to the success of the implementation.
['중앙 집중식 감독'을 '프로그램 평가의 철학을 홍보하고 모든 이해당사자를 참여시키고 소통하는 평가 워킹 그룹의 창설'과 결합하는 것]이 구현 과정의 핵심 가능자였다.
평가시스템에 대한 명확한 비전
평가과정 학습자 참여
평가목표 수립
방어 가능한 절차 및 절차 이행
...등이 모두 성공적인 시행을 위해 필요한 단계로 언급됐다. A centralised oversight coupled with the creation of an assessment working group who would promote the philosophy of programmatic assessment and engage and communicate with all stakeholders were key enablers in the implementation process.
Having a clear vision of the assessment system,
involving learners in the assessment process,
establishing assessment goals, and
implementing defensible processes and procedures
...were all mentioned as necessary steps to enable successful implementation.
또 다른 공통 요소(및 장벽)는 구현 프로세스의 설계, 개발 및 제공에 대한 모든 이해 관계자의 참여 수준입니다. 성공의 기본은
교수진과 학습자를 대상으로 프로그램 평가의 운영 및 원칙 교육을 위한 지속적인 자원 투입
피드백 전달, 학습자의 행위자성 및 의사결정을 위한 삼각측량 절차를 지원하기 위한 소프트웨어(e-Portfolios)에 대한 투자였다.
Another common enabler (and barrier) was the level of buy-in and engagement of all stakeholders in the design, development and delivery of the implementation process. Fundamental to the success was
an ongoing commitment of resources to train faculty and learners on the principles, operationalisation of programmatic assessment,
coupled in the longer term, with a commitment to invest in software (e-Portfolios) to support feedback delivery, learners’ agency, and triangulation procedures for decision-making.
구현의 일환으로 [지속적인 교수진 개발 프로그램]을 만든 것이 중요한 원동력이었다. 교수개발 프로그램은 평가 문해력에 초점을 두었고, 이는 [사용되고 있는 역량 프레임워크에 대한 적절한 수준의 지식] 및 [학습을 위한 피드백을 제공하는 것] 등을 의미한다. 그러한 노력에는 자원과 리더십 지원이 분명히 포함되어 있었다. 학습자의 진도와 성취도를 평가하고 지원하기 위한 강력한 코칭 시스템 개발에 자원을 투자하는 것도 언급되었다.
The creation of an ongoing faculty development programme as part of the implementation, focusing on assessment literacy, a good knowledge of the competency framework in use and providing feedback for learning, was a critical enabler. Such effort clearly involved the leveraging of resources and leadership support. Investing resource into developing a strong coaching system to evaluate and support learners’ progress and achievement was also mentioned.
프로그램이 [새로운 프로그램]이나 [전체 커리큘럼 개편]과 연계하여 프로그램 평가를 구연하는 것이, 이미 자리잡은 시스템 내에서 통합을 시도하는 프로그램보다 분명히 더 원활한 프로세스였다. 세부 커리큘럼 매핑과 함께 [세심한 건설적 정렬은 신규 시행new implementation이 더 쉽다는 점]이 지적됐다.
Where programmes had implemented programmatic assessment in new programmes or in conjunction with a full curriculum review, it was evidently a smoother process than in programmes which were attempting to integrate within established systems. Careful constructive alignment with detailed curriculum mapping was noted as being easier in new implementations.
일반적으로 언급되는 구현의 장애요인barriers은 실행 가능요인enabler을 상당 부분 미러링했다. 변화에 대한 조직의 의지 수준, 교수 시간의 요구, 자원의 가용성은 모든 응답자들에 의해 장벽으로 언급되었지만 반드시 극복할 수는 없었다. 성공적인 구현을 위한 가장 큰 장벽은 [변화에 대한 일반적인 저항]이었으며, 대부분의 프로그램은 교수진, 교육자 및 학습자의 [내재된 교육 및 평가 문화, 기대 및 태도를 변화시키는 데 어려움]을 언급하고 있었다. 교수진의 전문적인 성장을 위한 계획 및 자원 제공의 부족과 마찬가지로 [학습자들의 평가 사고방식과 문화의 변화]가 중요한 장벽으로 확인되었다. 시스템 수준의 변화를 위해 헌신하는 [강력한 리더십의 부재]는 많은 기관들에 의해 구현에 중대한 장애물로 인식되었다.
The commonly mentioned barriers to implementation to a large extent mirrored the enablers. The level of organisational commitment to change, demands on faculty time, and availability of resources were cited by all responders as barriers, but not necessarily insurmountable ones. The biggest barrier to successful implementation was a general resistance to change, with most programmes mentioning the difficulty in changing embedded educational and assessment cultures, expectations and attitudes – of faculty, educators and learners. A shift in the mindset and culture of assessment among learners was identified as a significant a barrier, as was a lack of planning and provision of resources for faculty professional growth. The lack of strong leadership committed to making changes at the system level was recognised as a significant obstacle to implementation by many institutions.
기관 정책과 인가 및 규제 기관의 요구사항이 잠재적 장벽으로 보고되었다. 예를 들어, 교육 중 어느 시점에 높은 점수를 받는 국가 면허 시험에 합격해야 한다는 요구 사항은 이론적 원리에 반하는 것이며, 프로그래밍 방식의 평가에 대한 학습자의 참여 가능성과 참여를 방해하는 요인으로 간주되었다. 그러나 대부분의 프로그램은 대학 정책 및 국가 인증 기관이 정한 경계와 규정 내에서 변화를 이루거나, 프로그램 평가를 구현하는 것이 가능했다. Institutional policies and requirements from accreditation and regulatory bodies were reported as potential barriers. For example, the requirement on learners to pass a high-stakes national licensing exam at some point in their training was seen as counter-intuitive to the theoretical principles and as a hindering factor to the acceptability of and learners’ buy-in to programmatic assessment. However, most programmes were able to make changes and implement programmatic assessment within the boundaries and regulations set by university policies and national accreditation bodies.
프로그램 평가의 시행은 학습자, 교수진, 그리고 그들의 교육 시스템과 관련된 많은 교훈을 배울 수 있는 기회를 프로그램에 제공한다. 프로그램은 학습자를 프로그램 평가 혁신에 참여시키는 것이 교수진의 참여만큼이나 중요하다는 것을 배웠습니다. 대부분의 프로그램은 프로그램 평가 구현이 평가의 학습 기능을 활용하는 데 도움이 되고, [어려움을 겪고 있는 학습자를 조기에 식별할 수 있는 기회]를 더 많이 제공하므로 개선은 물론, [표적화된 강력한 개입]에 더 많은 시간을 할애할 수 있다고 설명했다. 또한 [학습자는 능동적으로 피드백을 구하고 자신의 학습에 대한 소유권을 가질 가능성]이 높은 반면, 교수진은 학습자의 진도와 성과에 대한 평가, 토론 및 의사결정을 보다 쉽게 할 수 있습니다. The implementation of programmatic assessment afforded programmes the opportunity to learn a number of lessons related to learners, faculty, and their educational system. Programmes learnt that involving learners in programmatic assessment innovation is just as important as buy-in from faculty members. Most programmes described that implementing programmatic assessment helped leverage the learning function of assessment and provided more opportunity to identify struggling learners early on, thereby allowing more time for improvement and for targeted and robust interventions. Furthermore, learners were more likely to seek feedback proactively and take ownership of their own learning while faculty were more comfortable with assessing, discussing, and making decisions about learners’ progress and performance.
많은 프로그램들은 공유된 비전을 유지하기 위해 이해관계자들과 정기적으로 참여하는 것의 중요성을 배웠고, 왜, 무엇을, 어떻게 변화가 일어날 것인지를 자주 전달했다고 설명하였다. 대부분의 응답자들은 프로그램 평가의 교육적 이득을 구현하고 인식하기 위해서는 끈기, 강력한 리더십, 그리고 제도적 헌신이 필요하다고 보고했다. 또한 몇몇 의견제출자들은 변화의 과정을 실행시키기enact 위해서는 기관의 맥락적 요인과 문화적 지형을 이해하는 것이 필수적이라는 것을 인식하였다. 한 특정 맥락에서 발생하는 변화가 다른 상황에서는 실현 가능하지 않거나, 성공적이지 않을 수도 있다. 많은 프로그램들은 [프로그램 평가가 전통적인 평가를 근본적으로 파괴시키는 것]이며, [주요한 패러다임의 변화를 요구한다]고 지적하였다. Many programmes described having learnt the importance of engaging regularly with stakeholders to maintain a shared vision, frequently communicating the why, what, and how change is going to occur. Most respondents reported that it took perseverance, strong leadership, and institutional commitment to implement and recognise the educational gains of programmatic assessment. Several respondents also recognised that understanding the contextual factors and the cultural landscape of the institution was vital to enact a process of change. Changes occurring in one particular context may not be feasible or as successful in another. Many programmes indicated that programmatic assessment is a fundamental disruption from traditional assessment and requires a major paradigm shift; therefore, creating a context supportive of change is imperative for success.
의견제출자들은 프로그램 평가의 시행이 의도하지 않은 몇 가지 결과를 나타내었다. 일부 프로그램의 경우, 프로그램 평가의 시행은 커리큘럼에 대한 새로운 통찰력을 제공하고 개선해야 할 영역을 식별할 수 있게 했다. 프로그래밍 방식의 평가로의 변화는 피드백 리터러시를 향상시켰고, 학생들이 교수들로부터 받은 피드백을 가장 잘 활용하는 방법을 이해하는 데 도움이 되었다. Respondents indicated several unintended consequences of the implementation of programmatic assessment. For some programmes, implementing programmatic assessment provided a new insight into the curriculum and allowed identification of areas for improvement. The change to programmatic assessment enhanced feedback literacy and helped students understand how to best utilise the feedback they received from faculty.
한 프로그램은 ['프로그램적 평가'와 '학습을 위한 평가라는 원칙']에 따라 복수의 데이터 포인트가 있고 결정 지점이 거의 없는 것이 아니라, 어떤 이유에서인지 [의사결정 지점의 수가 증가]하여 [학생들이 지속적인 총괄평가 환경의 일부가 된다는 인식]을 갖게 되었다고 보고했다. One programme reported that instead of having multiple data points and few decision points in accordance with programmatic assessment and assessment for learning principles, for some reason, there was an increase in the number of decision points, resulting in students’ perception of being part of an environment of constant summative assessment.
일부 프로그램은 특히 프로그램 평가 시행 초기에 교수 시간과 업무량이 증가했다고 보고했지만, 교수진(코치)과 학습자 사이의 더 나은 의사소통과 대화 측면에서 장기적인 이익이 시간 자원의 초기 투자보다 더 크다고 언급했다. Some programmes reported an increase in faculty time and workload, particularly at the inception of programmatic assessment implementation, but noted that the longer-term benefits in terms of the better communication and dialogue between faculty (coaches) and learners outweighed the initial investment of time resource.
몇몇 프로그램들은 프로그램 평가의 시행이 [테크놀로지 강화 평가technology enhanced assessment]의 예상치 못한 증가와 일치한다고 지적하였다. 경험을 수집하기 위하여 [e-포트폴리오와 휴대용 테크놀로지]를 추가하여, 학습자들이 자신의 작업을 공유하고 성찰을 촉진하고 교수진과 상호 작용할 수 있는 안전한 환경을 만들 수 있도록 하였다.
Several programmes indicated that their implementation of programmatic assessment coincided with an unexpected increase in the use of technology enhanced assessment; the use of an e-portfolio and the addition of portable technology to collect experiences allowed learners to share their work, promoting reflection and creating a safe environment to interact with faculty.
서로 다른 프로그램에 걸쳐 광범위한 구현 설명이 있었지만, 전반적인 구현 요소, 가능 요소 및 장벽은 학부와 대학원 프로그램에 걸쳐 유사했다. 12가지 프로그램 평가 원칙의 실제 실행은 대부분 원래의 선언enunciation과 논리에 충실했다. 예를 들어, 대부분의 프로그램에는 [고부담 의사결정을 위한 평가 위원회]라는 형식이 있었지만, 위원회의 명칭, 데이터 분석에 사용된 절차 또는 위원회의 회의 빈도는 프로그램 전반에 걸쳐 다양한 구현 범위를 가지고 있는 것으로 밝혀졌다.
고부담 결정을 위한 검토 위원회 사용,
혼합된 평가 방법의 활용
모든 평가를 피드백에 최적화된 데이터 포인트로서 구현,
부담의 연속체 개발
...이런 것들은 다양한 프로그램과 교육적 맥락에 걸친 실행 범위 내에서 실행으로 전환된 원칙들 중 일부에 불과했습니다.
There were a wide range of implementation descriptions across different programmes, yet overall components of implementation, enablers and barriers were similar across disciplines and undergraduate and postgraduate programmes. The actual implementation of the 12 programmatic assessment principles remained, for the most part, faithful to the original enunciation and rationale. For example, most programmes had some form of assessment committee for high-stakes decisions; however, what the committee was named, what procedure was used to analyse data, or how often the committee met was found to have a range of implementations across programmes.
The use of review committees for high-stakes decisions,
the utilisation of mixed methods of assessments,
the implementation of every assessment as a data point optimised for feedback, and
the development of a continuum of stakes
...were just some of the principles translated into practice within a range of implementations across different programmes and educational contexts.
프로그램 평가에서 구현의 중요한 역할이 논의되었으며, 구현의 품질이 프로그램 평가의 성공을 정의한다고 제안되었다. 주요 구현 요소는 다음과 같습니다.
원칙과 참여에 기반한 설계
평가를 통합하기 위한 포트폴리오의 역할
고부담 의사 결정에서 위원회의 역할
평가에 대한 학생들의 인식
학습자와 교수진 사이의 관계
커리큘럼과 프로그램 평가의 병행 시행
The critical role of implementation in programmatic assessment has been discussed (Bok et al.2013), and it has been suggested that the quality of implementation defines the success of programmatic assessment (Van Der Vleuten et al.2019). Key implementation elements include
design based on principles and participation (Jamieson et al. 2017; Schuwirth et al. 2017),
the role of a portfolio to integrate assessments (Dannefer and Henson 2007),
the role of a committee in high-stakes decision-making (Van Der Vleuten et al. 2015),
students’ perception of the assessment (Heeneman et al. 2015; Schut et al. 2018),
the relationship between learners and faculty (Schut et al. 2021), and the parallel implementation of curriculum and programmatic assessment (Freeman and Ricketts 2010; Ricketts and Bligh 2011).
보다 최근에 Jamieson 등(2021)은 성공적인 프로그램 평가의 구현은 [감독자의 역할과 평가 관행에 대한 관점을 변화]시키는 동시에, [감독자-학습자 관계를 개선한다]는 것을 발견했다. 프로그램 평가의 적절한 구현은 역량중심의학교육의 성과에 대한 데이터를 제공한다는 점에서도 중요하다
More recently, Jamieson et al. (2021) found that a successful implementation of programmatic assessment transformed the supervisors’ role and their views of assessment practices, whilst enhancing the supervisor-learner relationship . Adequate implementation of programmatic assessment is also critical to provide data to inform outcomes of competency based medical education (Hauer et al.2018; Iobst and Holmboe2020; Misra et al.2021).
구현은 고립된 이벤트가 아니다. 대부분의 프로그램은 프로그램 평가의 시행 과정에 시간(몇 달이 아니라 몇 년)이 걸리고, 전략적으로 잘 설계되고, 예산이 잘 책정된 계획이 필요하며, 강력한 리더십과 지원이 필요하며, 변화에 대한 공동의 비전과 교육 기업 전체의 문화 이동이 요구된다고 보고했다. 또한 지속적인 진행 상황 모니터링과 당면 과제 해결 지원과 함께 지속적인 교수진 개발 및 코칭 프로그램이 필요하다. 프로그램 평가의 실행은 핵심 구성요소의 무결성을 유지하기 위한 자원의 지속적인 헌신과 지속적인 주의를 필요로 한다. Implementation is a process not an isolated event (Hall and Hord 2015). Most programmes reported that the implementation process of programmatic assessment
takes time (years not months),
needs a strategic well-designed and well budgeted plan,
requires strong leadership and support, and
demands a shared vision of change and a culture shift across the entire educational enterprise.
Further, it
involves an ongoing programme of faculty development and coaching with continuous monitoring of progress and assistance to face and resolve challenges.
Implementation of programmatic assessment
requires sustained commitment of resources and ongoing vigilance to maintain the integrity of its key components.
계획 설계, 리더십 지원 확보, 유연성 및 조정 기회 허용, 이해관계자 간의 관련성과 가치에 대한 공통된 믿음은 모두 변화 관리 문헌에 보고된 중요한 요소들이다(Gale and Grant 1997; Schneider 2014). 프로그램 평가의 구현에 대한 설명은 이러한 요인들 중 몇 가지와 일치하지만, 맥락과 그 복잡성에 대한 적응은 프로그램 전반에 걸친 프로그램 평가 원칙의 성공적인 구현을 위한 필수 요소로 부상하는 것으로 보인다. Designing a plan, securing leadership support, allowing opportunities for flexibility and adjustments, a shared belief of relevance and value among stakeholders are all important factors reported in the managing change literature (Gale and Grant1997; Schneider2014). The descriptions of implementations of programmatic assessment are aligned with several of these factors, yet adaptation to context and its complexities seems to emerge as an essential ingredient for a successful implementation of the principles of programmatic assessment across programmes.
이해 관계의 연속체로서의 평가(원칙 6)는 특히 그 구현 방식이 광범위했다. 많은 프로그램들이 시행되고 시행되어 어떻게 운영될지 등 이 원칙의 의미에 대해 설명하고 교육할 계획이며, 성장과 개선의 문화를 조성하여 성적과 석차가 없어지는 경우도 있었다. 이러한 접근 방식은 평가 과정 속에서 학습자의 행위자성를 육성할 수 있는 기회를 만들었습니다. 이는 학습자가 이해 관계의 연속성을 복잡한 것으로 인식하고 평가 과정을 통제하고 수행할 수 있다는 인식과 밀접한 관련이 있음을 시사하는 이전의 증거와 일치했다(Bok et al. 2013; Schut et al. 2018). Assessment as a continuum of stakes (principle 6) had a particularly wide range of implementations. Many programmes implemented and executed plans to explain and educate learners about the meaning of this principle, including how it was going to be operationalised, promoting a culture of growth and improvement that, in some cases, led to the elimination of grades and class ranks. This approach created opportunities to foster learners' agency with the assessment process. This was aligned with previous evidence suggesting that a continuum of stakes is perceived by learners as complex and is strongly related to their perception of being able to control and take agency of the assessment process (Bok et al.2013; Schut et al.2018).
[학습자의 행위자성learner's agency]은 복잡한 과정이다. 여기에는 [기존의 사회적 규범과 문화적 신념의 압력]에 [대응하기 위한 노력 및 멘토십과 서포트]가 필요하다(Watling et al. 2021) [교사-학습자 관계]는 학습자의 평가 인식에 중요한 역할을 한다.
[평가 관계에서 덜 지배적인 접근 방식을 보이는 교사]는 학습자의 에이전시를 가능하게 하여 학습 평가에 대한 긍정적인 학습자 인식을 촉진한다(Schut et al. 2020a).
[교사가 저부담 평가 과정에 대한 통제를 행사]하면 평가의 학습 기능을 방해하고 교사-학습자 관계에 긴장을 발생시킬 수 있다(Schut et al. 2020b).
이러한 긴장은 중요한 평가 결정이 한 개인의 결정보다는 집단적인 책임을 지는 진보 위원회나 임상 역량 위원회를 사용함으로써 완화될 수 있다. 진급progress 위원회 또는 역량competency 위원회의 사용은 프로그램 평가의 구현에 대한 거의 모든 설명에서 핵심 요소였다. Learners’ agency is a complicated process; it takes effort and requires mentorship and support to counteract the pressure of established social norms and cultural beliefs (Watling et al.2021). Teacher-learner relationships play a critical role in learners’ assessment perceptions;
teachers who show a less dominant approach in the assessment relationship enable learners’ agency, promoting a positive learner perception of assessment for learning (Schut et al. 2020a).
If teachers exert control over the low-stakes assessment process it can hinder the learning function of assessment and generate tensions in the teacher-learner relationship (Schut et al. 2020b).
Such tensions can be relieved in the use of progress committees or clinical competency committees, where important assessment decisions have a collective responsibility rather than that of a single individual. The use of a progress or competency committee was a key component in almost all descriptions of the implementations of programmatic assessment.
프로그래밍 평가를 도입함으로써, 학습자는 [성과 목표 지향(긍정적인 판단을 얻고 자신의 능력을 인정받거나 부정적인 피드백을 피하는 데 초점을 맞춤)]이 아닌 [학습 목표 지향(성장과 개선에 초점을 맞춤)]을 둔 피드백을 탐색 행동을 촉진하게 된다면, 학습자의 프로그램적 평가에 대한 수용을 촉진하고, 평가를 '부담의 연속체'로 인식하게끔 영향을 미칠 수 있으며, 궁극적으로 이 원칙의 이행을 촉진할 수 있다. 또한 성찰은 학습자의 자기 평가와 동떨어진 피드백을 수용하는 경로라는 의견도 제시되었다(상사 등 2008). In the implementation of programmatic assessment, fostering a feedback seeking behaviour with a learning goal orientation (focused on growth and improvement) rather than a performance goal orientation (focused on gaining a positive judgement and garnering recognition of their own ability or on avoiding negative feedback) (Bok et al.2013; Teunissen and Bok2013) may promote learners’ acceptance and affect their perceptions of assessment as a continuum of stakes, ultimately facilitating the implementation of this principle. It has also been suggested that reflection is the path to acceptance of feedback that is out of line with learners’ self-assessment (Sargeant et al.2008).
원칙 중 하나(원칙 12, 개별 학습자에 맞춘 평가)는 특히 학습자가 많은 프로그램에서 완전히 구현하기가 어려운 것으로 입증되었다. 그러나 다른 원칙의 이행은 적어도 프로그램 규모가 크기 때문에 원칙이 전혀 이행될 수 없는 정도까지는 프로그램의 크기에 크게 영향을 받지 않는 것으로 보였다. One of the principles, (principle 12, assessment tailored to the individual learner), proved to be challenging to fully implement, particularly in programmes with a large number of learners. However, the implementation of the other principles did not seem to be significantly affected by the size of a programme, at least to the extent that a principle could not be at all implemented because of a large programme size.
널리 알려진 구현 장벽 중 하나는 리더, 학습자 및 교육자들 사이에서 조직 내 평가 문화의 패러다임 전환이 필요하다는 것이었다. 오랫동안 확립된 프로그램들은 더 많은 성공을 보고한 반면, 새로운 프로그램들은 여전히 이러한 문화적 변화를 경험하고 있으며, 맥락에 따라 그 정도에서 현저한 차이가 있었다. 프로그램의 조직적, 문화적 맥락을 이해하는 것은 모든 이해당사자들이 공유 환경의 필수적인 부분이기 때문에 개입이나 변화의 실행과 지속가능성을 위해 필수적이다. 컨텍스트는 특정 구현을 둘러싼[수많은 상호작용 변수와 상황의 집합]으로 구성됩니다. 시스템의 맥락을 형성하는 모든 부분이 정당화되고legitimised 관여될involved 필요가 있다. One of the widely recognised barriers to implementation was the need for a paradigm shift in assessment culture within the organisation, amongst leaders, learners and educators. Programmes which have longer-standing established implementations reported more success whereas newer implementations are still experiencing this cultural shift, and there were noticeable differences in the extent of this across contexts. Understanding the organisational and cultural context of programmes is essential for the implementation and sustainability of any intervention or change because all stakeholders are an integral part of a shared environment (Damschroder et al.2009; Marks et al.2010). Context consists of a number of interacting variables and set of circumstances that surround a specific implementation. All parts which shape the context of a system need to be legitimised and involved.
변화하는 문화에 대한 이해관계자의 태도에 대해서, 사회적 인지 모델을 기반으로 등장한 드웩의 [자기이론] 개념을 연결지어 볼 수 있다. 외부 속성(이러한 맥락적 교육 요소)은 이해관계자의 마음가짐에 따라 '고정적(entity theory)' 또는 '적응적(incremental theory)'으로 간주될 수 있다.
이해당사자들이 incremental theoriest라면 개선을 모색하고 외부 속성이 더 좋게 변할 수 있다고 믿음으로써 변화를 긍정적으로 받아들일 가능성이 높다.
반대로, 이해당사자들이 실체 이론가entity theorist라면, 그들은 변화에 참여하거나 변화를 시작하는데 더 저항할 것이다.
The emerging concepts of self-theories which impact personal motivation and growth mindset, built on the social cognitive model proposed by Dweck (Dweck and Leggett1988) can be considered in relation to stakeholders’ attitudes to changing culture. External attributes (such contextual education factors) may be considered as ‘fixed’ (entity theory) or ‘adaptable’ (incremental theory) depending on the mindset of the stakeholder.
If stakeholders are incremental theorists, they are more likely to positively embrace change by seeking improvement and believing that external attributes can change for the better.
Conversely, if stakeholders are entity theorists, they will be more resistant to engage with or initiate change.
성장 사고방식 문화를 지지하고 채택하는 프로그램은 학습자와 교육자가 더 많은 도전을 하고 변화를 시작하고, 이해 당사자들이 '실패'를 학습 기회로 보고 혁신에 대한 자신감을 고취하도록 동기를 부여할 것이다(Dweck 2019; Canning et al. 2020). 개별 학습자, 교사, 조직적 수준에서 incremental theory 접근법과 learning goal orientation을 육성하는 것은 프로그램 평가의 실행에 도움이 될 것이다. Programmes that endorse and adopt a growth mindset culture will motivate learners and educators to take on more challenges and initiate change, encourage stakeholders to view ‘failures’ as learning opportunities and inspire confidence in innovation (Dweck2019; Canning et al.2020). Fostering an incremental theory approach and a learning goal orientation within individual learners and teachers, and at the organisational level would be beneficial for the implementation of programmatic assessment.
결론 Conclusions
프로그램 평가의 시행은 시간이 걸리고, 강력한 리더십 헌신과 지원이 필요하며, 개인과 조직 차원의 지속적인 노력이 필요하다. [전통적인 평가 접근 방식]에서 교수진과 학생들에 의한 [프로그램식 평가 문화]로의 패러다임 전환은 대학 정책과 절차에 의해 야기되는 제약과 결합되어 중요하면서도 시행의 장벽을 넘을 수 없었다. 프로그램 평가 구현은 커리큘럼에 대한 새로운 통찰력을 제공하여, 프로그램이 개선해야 할 영역을 식별할 수 있도록 했다. 또한 학생과 교직원의 피드백 리터러시를 개선하고, 피드백 품질을 향상시키며, 어려움을 겪고 있는 학습자를 조기에 식별하고 지원할 수 있도록 했다. 프로그래밍 평가 원칙(평가 방법희 혼합, 삼각 측량, 종단성 및 비례성)을 성공적으로 구현하면 의사결정 프로세스에 사용할 수 있는 데이터가 개선되는 동시에 데이터 및 문서의 양이 관리 가능하고 의미 있게 유지된다.
Implementation of programmatic assessment takes time, needs strong leadership commitment and support, and involves a continuous effort at the individual and organisational level. A paradigm shift from the mindset of a traditional assessment approach to that of a programmatic assessment culture by faculty, and students, coupled with the constraints posed by university policies and procedures, were significant yet not insurmountable barriers to implementation. Programmatic assessment implementation provided a new insight into the curriculum, allowing programmes to identify areas for improvement. It also enhanced feedback literacy among students and faculty, improved feedback quality, and allowed early identification and support of struggling learners. Successful implementations of the principles of programmatic assessment (mix of methods of assessment, triangulation, longitudinality, and proportionality) improve the data available for decision making processes, whilst keeping the amount of data and documentation manageable and meaningful.
향후 작업에 대한 권장 사항 Recommendations for future work
향후 연구를 위한 여러 가지 권고사항이 있다. There are a number of recommendations for future research.
첫째, 특정 원칙의 구현을 강화하기 위해 특정 원칙의 구현에 영향을 미칠 수 있는 중요한 요소를 추가로 조사합니다. 특정 원칙의 이행에 대해 외부 규제 기관(면허, 자격 시험)이 실시하는 필수 고부담 평가의 역할을 추가로 결정하고 탐구할 필요가 있다.
First, investigate further the critical factors that may influence the implementation of specific principles in order to enhance their implementation. The role of required high-stakes assessments conducted by external regulatory bodies (licensure, qualification exams) on the implementation of specific principles needs to be further determined and explored.
둘째, 프로그램 평가의 주요 측면에 대해 구현 품질을 향상시킬 수 있는 효과적인 교수개발 프로그램의 개발에 대해 탐구한다(특히 피드백 전달 및 프로그램 평가 리터러시 등). 또한, 학생의 프로그램 평가 실습에 대한 이해, 채택 및 활용을 촉진하는 방법이 모색되어야 한다. 여기에는 예를 들어 레지던트 매치의 성공과 같은 전문 훈련 프로그램의 높은 결과에 대한 현실과 같이 학습자의 인지 부조화를 유발할 수 있는 명시적이고 숨겨진 커리큘럼 메시지에 대한 검토가 포함될 수 있다. Second, inquire about the development of effective faculty development programmes that may enhance the quality of implementation, particularly about key aspects of programmatic assessment such as feedback delivery and programmatic assessment literacy. Further, ways to promote students’ understanding, adoption, and utilisation of programmatic assessment practices should be sought. This could include examination of explicit and hidden curriculum messages that might cause learners cognitive dissonance, for example the reality of high-stakes consequences of professional training programmes, such as success in residency matches.
셋째, 구현에 영향을 미치는 주요 상황적, 문화적 요인 및 그러한 요인이 전 세계 여러 기관에 걸쳐 구현에 어떤 영향을 미치는지에 대한 추가 조사를 수행해야 한다. Third, additional inquiries should be conducted about key contextual and cultural factors that affect implementation and how such factors influence implementation across different institutions worldwide.
마지막으로, 프로그램 평가, 학습자 역량 및 웰빙의 완전하고 효과적인 구현의 영향과 이 접근법이 궁극적으로 환자와 시스템 수준에서 의료 결과에 영향을 미치는 정도를 평가하기 위해 더 많은 연구가 필요하다.
Finally, more research is needed to evaluate the impact of a complete and effective implementation of programmatic assessment, learner competency and wellness, and the extent to which this approach ultimately impacts health care outcomes at the patient and system level.
Introduction:Programmatic assessment is a longitudinal, developmental approach that fosters and harnesses the learning function of assessment. Yet the implementation, a critical step to translate theory into practice, can be challenging. As part of the Ottawa 2020 consensus statement on programmatic assessment, we sought to provide descriptions of the implementation of the 12 principles of programmatic assessment and to gain insight into enablers and barriers across different institutions and contexts.
Methods:After the 2020 Ottawa conference, we surveyed 15 Health Profession Education programmes from six different countries about the implementation of the 12 principles of programmatic assessment. Survey responses were analysed using a deductive thematic analysis.
Results and discussion:A wide range of implementations were reported although the principles remained, for the most part, faithful to the original enunciation and rationale. Enablers included strong leadership support, ongoing faculty development, providing students with clear expectations about assessment, simultaneous curriculum renewal and organisational commitment to change. Most barriers were related to the need for a paradigm shift in the culture of assessment. Descriptions of implementations in relation to the theoretical principles, across multiple educational contexts, coupled with explanations of enablers and barriers, provided new insights and a clearer understanding of the strategic and operational considerations in the implementation of programmatic assessment. Future research is needed to further explore how contextual and cultural factors affect implementation.
평가프로그램에 대한 오타와 2020 합의문 - 1. 원칙에 대한 합의 (Med Teach, 2021) Ottawa 2020 consensus statement for programmatic assessment – 1. Agreement on the principles Sylvia Heenemana, Lubberta H. de Jongb, Luke J. Dawsonc, Tim J. Wilkinsond , Anna Ryane, Glendon R. Taitf, Neil Riceg , Dario Torreh , Adrian Freemang and Cees P. M. van der Vleuteni
배경 Background
2010년, 오타와 회의는 좋은 평가를 위한 일련의 합의된 기준을 만들었다(Norcini et al. 2011). 단일 평가를 넘어 후속적으로 특정 목적을 위한 증거를 제공하기 위해 통합된 일련의 개별 측정(예: 졸업 또는 다음 연도의 승진 결정)을 체계적으로 결합하는 [평가 시스템]에도 유사한 기준 세트가 필요하다는 것이 인식되었다. 따라서 오타와 2018 합의 프레임워크에서는 [평가 시스템]에 적용되는 별도의 프레임워크가 제시되었다(Norcini 등 2018). 오타와 2018 합의에서 설명한 바와 같이, 평가 시스템은 다양한 형식을 가질 수 있다. 평가 시스템은 선발 및 면허 시스템과 같은 다층적 결정을 용이하게 하기 위해 다른 정보와 결합된 일련의 평가로 구성될 수 있다. 다른 평가 시스템은 진도 시험 및 프로그램 평가와 같은 교육 및 교육 설계 접근방식을 우선시한다(Norcini et al. 2018).
In 2010, the Ottawa conference produced a set of consensus criteria for good assessment (Norcini et al.2011). It was recognised that a similar set of criteria would be needed for systems of assessment, which goes beyond single assessments, and systematically combines a series of individual measures that are subsequently integrated to provide evidence for a certain purpose, e.g. a decision for graduation or promotion to a subsequent year. Therefore, in the Ottawa 2018 consensus framework, a separate framework applying to systems of assessment was presented (Norcini et al.2018). As described in the Ottawa 2018 consensus, systems of assessment can have various formats. A system can consist of a series of assessments, combined with other information, to facilitate a multi-layered decision, e.g. admission and licensure systems. Other systems of assessment prioritise educational and instructional design approaches, such as progress testing and programmatic assessment (Norcini et al.2018).
[프로그램 평가]는 개별 평가만 (합격-불합격) 결정에 사용할 경우, 모든 개별 평가 방법 또는 도구가 각자의 한계를 가지고 있기에, 타협점을 필요로한다는 원칙에 기초한다. 그러나, 흔히 사용되는 평가 접근법은 종종 모듈식이며, 기간 종료/모듈/과정 평가를 통해 등급 및 관련 합격/불합격 결정을 이끌어낸다. 평가의 [전통적인 총괄접근법]은 바람직하지 않은 학습 접근법을 추진하고, 외적 동기를 촉진하고, 주어진 피드백을 무시하는 것과 같은 여러 의도하지 않은 결과를 초래한다(van der Vleuten and Schwirth 2005). Programmatic assessment was introduced by van der Vleuten and Schuwirth (van der Vleuten et al.2012; van der Vleuten and Schuwirth2005) and is based on the principle that every individual assessment method or tool has limitations and compromises are needed if just individual assessments are used for (pass–fail) decisions. In contrast, common assessment approaches are often modular, with an end of period/module/course assessment, that leads to a grade and an associated pass–fail decision. This traditional summative approach to assessment has multiple unintended consequences, such as driving undesirable learning approaches, promoting extrinsic motivation, and ignoring any feedback that is given (van der Vleuten and Schuwirth2005).
프로그램 평가 모델은 위에 언급된 문제들에 대한 잠재적인 해결책입니다. 프로그램 평가 모델은 [평가가 가지고 있는 학습과 의사결정 기능을 최적화하기 위하여 평가와 교육을 설계하는 특정한 접근방식]으로 정의되었다. 다양한 평가 형식의 여러 데이터 지점에서 비롯된 평가 정보와 피드백은 학습자와 스태프가 취합하여, 학습을 위한 목적으로 사용할 수도 있고, 진급 또는 인증과 같은 고부담 의사 결정에 사용될 수 있다.
The programmatic assessment model as proposed by van der Vleuten and Schuwirth, is a potential solution to the abovementioned problems. The programmatic assessment model has been defined as a specific approach to the design of assessment and education aimed at optimising the learning and decision function of assessment. Assessment information and feedback, originating from multiple data points in a variety of assessment formats, is aggregated by the learner and staff and is used for learning and for high-stakes decisions such as promotion to the next year or certification (Schuwirth and van der Vleuten2011; van der Vleuten et al.2015).
프로그램 평가는 다양한 핵심 논문(표 1)에 요약된 바와 같이 여러 가지 핵심 원칙에 기초한다. 그러나 프로그램 평가는 교육적 설계 접근법이며, [프로그램 평가의 수용가능성은 교육 프로그램의 가치와 제도적 요건에 의해 부과된 한계와 같은 다양한 요소에 의해 강하게 영향을 받는다]는 것을 인식해야 한다. 프로그래밍식 평가는 평가 개념이지 레시피가 아니라는 점을 유념하는 것이 중요하다. 통과가 필요한 일련의 모듈 또는 과정이 있는 전통적인 교사 중심의 커리큘럼의 맥락에서, 프로그래밍식 평가 접근법은 가치가 낮다. 교육에 대한 구성주의적 관점을 가진 학습자 중심의 커리큘럼에서, 종단적 스킬 발달을 사용하며, 평생 학습과 자기주도적 학습에 중점을 둔 경우에 프로그래밍 평가가 적합하다. Programmatic assessment is built on a number of key principles, as outlined in various key papers (Table 1). It is however important to realise that programmatic assessment is an instructional design approach (van der Vleuten and Schuwirth2005) and its acceptability is strongly influenced by a variety of factors such as the values of the educational programme and limitations imposed by institutional requirements. It is critical to note that programmatic assessment is an assessment concept and not a recipe. In the context of a conventional teacher-centred curriculum with a set of modules or courses that need be passed, a programmatic assessment approach has less value. In a learner-centred curriculum with a constructivist view on education, using longitudinal skill development and with an emphasis on life-long learning and self-directed learning, programmatic assessment is a natural fit.
현재 문헌에 기술된 원칙(표 1)은 중요하지만 다양한 형태로 실현될 수 있다. The principles as delineated in current literature (Table 1) are important, yet can be realised in many different manifestations.
현행 문헌에 기술된 핵심 원칙(표 1)은 평가 및 교육 접근방식을 ['평가의 프로그램']이 아니라, [프로그램적 평가]로 특징짓는지 여부를 정의하는 데 중요하다. 모든 학교에는 평가 프로그램이 있지만 모든 학교가 프로그램화된 것은 아니다. '프로그램적'이 되기 위해서는, 이론적 원칙이 교육 및 평가 프로그램의 설계에 통합되어야 하며, 학습 기능(즉, 원칙 1/2/3/11/12)과 평가의 의사결정 기능(즉, 원칙 7/8/9/10) 모두에 관련된 원칙이 존재해야 한다. 이 Ottawa 2020 합의서의 목적은 실무와 연구의 통찰력을 사용하여 표 2에 제시된 프로그램 평가 원칙에 대한 합의를 정의하는 것이다. The key principles as delineated in current literature (Table 1) are important for defining whether the assessment and education approach should be characterised as programmatic assessment rather than ‘programmes of assessment’. All schools have a programme of assessment, but not all are programmatic. To be programmatic, the theoretical principles should be integrated into the design of the teaching and the assessment programme, and principles pertaining to both the learning function (i.e. principle 1/2/3/11/12) and the decision function of assessment (i.e. principle 7/8/9/10) should be present. The aim of this Ottawa 2020 consensus paper is to use insights from practice and research to define agreement on the principles for programmatic assessment, which are presented inTable 2.
프로그램 평가의 이론적 원리에 대한 합의 Consensus on the theoretical principles of programmatic assessment
판 데르 블뢰텐과 슈비르트가 제안한 프로그램 평가 이론과 모델은 파트 1이 프로그램 평가의 원칙에 대한 합의에 도달하기 위한 출발점이었다.
The theory and model of programmatic assessment as proposed by van der Vleuten and Schuwirth was the starting point for part 1 to reach a consensus on the principles of programmatic assessment.
첫 번째 단계는 프로그램에 프로그램 평가를 도입했거나 사용하고 있는 프로그램 리더나 평가 책임자와 같은 실무 경험이 있거나 학자와 교육학자 등 이론과 연구에 대한 경험이 있는 다수의 전문가를 모으는 것이었다. The first step was to assemble a number of experts that have experience with either the practice, such as programme leaders or directors of assessment that introduced or are using programmatic assessment in their programmes, or experience with theory and research, such as scholars and educationalists, or both.
두 번째 단계는 인지된 구성요소, 근거 및 프로그램 평가 설계의 중요성에 대한 목록을 만드는 것이었다. 전문가 그룹은 표 1과 같이 원칙에 관한 질문을 가지고 설문조사를 완료하도록 초청되었다. The second step was to make an inventory for the perceived components, rationale, and importance of the programmatic assessment design. The group of experts were invited to complete a survey with questions regarding the principles as shown inTable 1:
여러분은 이 원칙에 동의하나요?
이 원칙의 구성 요소는 무엇이라고 생각하십니까?
이 원칙은 프로그램 평가에서 얼마나 중요한가?
이 원칙은 지키기가 쉬운가요?
이 원칙을 프로그램에 구현한 적이 있습니까? 그렇다면 어떻게 구현합니까?
Do you agree with this principle?
What do you think are components within this principle?
How important is this principle in programmatic assessment?
Is this principle easy to adhere to?
Have you implemented this principle in your programme and if yes, how?
전문가 그룹에 설문 조사와 함께 초청장을 보내기 전에 시범적으로 하위 그룹(SH, LdJ, LD, TW)이 먼저 조사를 완료했으며 토론 후 원칙 1-3, 원칙 4, 5 및 원칙 6과 7에 대한 응답을 결합하기로 결정했다. 이 조사는 3개 대륙에 걸쳐 6개국의 15개 프로그램을 대표하는 전문가들에 의해 완료되었다. 이 15개 프로그램의 특징은 표 3에 나와 있습니다. In a pilot prior to sending the invitation with the survey to the expert group, a subgroup (SH, LdJ, LD, TW) first completed the survey and after discussion decided to combine the responses for principles 1–3, principles 4 and 5, and principles 6 and 7, given that these share similar theoretical tenets of the programmatic assessment model. The survey was completed by experts representing 15 programmes from six countries across three continents. The characteristics of these 15 programmes are shown inTable 3.
사전 컨퍼런스 토론에 참석한 전문가 그룹 구성원들과 공감대 초안을 분석하고 논의한 결과, [언어와 공식화]가 중요함을 알 수 있었다. 언어와 수사학의 영향은 환자 의사소통의 교육이나 '역량'이라는 단어의 해석과 같은 다른 교육 관행에서 나타났다(Lingard 2007, 2009). 원칙 9와 12의 표현은 특정한 오해를 불러일으켰고 더 명확히 하고 개선할 필요가 있었다. 그 결과, 9번과 12번 원칙은 재검토되었고, 다섯 가지 질문에 대한 전문가들의 답변은 컨퍼런스 워크숍에 앞서 다시 정리되고 분석되었다. 이 요청에 전문가 15명 중 13명이 응했다. The analysis and discussion of the draft consensus with the members of the expert group present at the pre-conference discussion showed that language and formulation were important. The impact of language and rhetoric has been shown in other educational practices, such as the teaching of patient communication or the interpretation of the word ‘competence’ (Lingard2007,2009). The phrasing of principles 9 and 12 led to certain misunderstandings and needed further clarification and refinement. Consequently, principles 9 and 12 were rephrased and experts’ responses to the five questions were then recollected and reanalysed, prior to the workshop at the conference. Thirteen of the 15 experts responded to this request.
합의, 중요도, 준수 및 이행의 분류를 위한 데이터는 표 4에 요약되어 있다.
The data for the categorisation of agreement, importance, adherence, and implementation are summarised inTable 4.
원칙 8에서는 삼각측량 및 집계에 사용되는 프레임워크가 반드시 역량 기반 프레임워크가 아니므로 '적절한' 프레임워크로 변경되었다(원칙 8: 평가 정보는 데이터 포인트 전체에서 적절한 프레임워크로 삼각측량됨).
For principle 8, it was discussed that the framework used for triangulation and aggregation is not necessarily a competency-based framework, therefore this was changed to an ‘appropriate’ framework (principle 8: Assessment information is triangulated across data-points towards an appropriate framework).
원칙 10에서는 수행자료 검토에서 학습자의 중심 역할과 중간 검토 목적을 논의했고, 표현 변경으로 이어졌다(원칙 10: 학습자와 진행에 대해 논의하고 결정하는 중간 검토).
For principle 10, the central role of the learner in the review of his/her performance data and the purpose of the intermediate review was discussed, and led to a change in the phrasing (principle 10: Intermediate review is made with to discuss and decide with the learner on their progression).
원칙 11에서 멘토라는 단어는 코치라는 단어로 보충되었다.
For principle 11, the word mentor was supplemented by the word coach.
원칙 5와 7의 경우, 변경사항은 주로 문법과 구문과 관련이 있다. 내러티브에 대한 주제 분석과 회의 중 피드백과 함께, 이것은 원칙에 대한 다음과 같은 합의를 이끌어냈다.
For principles 5 and 7, the changes mainly concerned grammar and syntax. Together with the thematic analysis of the narratives and the feedback during the conference, this led to the following agreement on the principles:
원리 1/2/3:
모든 (일부) 평가는 데이터 포인트일 뿐이다/
모든 데이터 포인트는 학습자에게 의미 있는 피드백을 제공함으로써 학습에 최적화된다/
합격/실패 결정은 단일 데이터 포인트에서 내려지지 않는다. Principle 1/2/3:
- every (part of an) assessment is but a data-point/
- every data-point is optimised for learning by giving meaningful feedback to the learner/
- pass/fail decisions are not given on a single data-point
이러한 원칙의 근거는 ['평가가 학습 행동을 주도한다']는 관찰에서 비롯되며, 따라서 학습 접근법에 대한 긍정적인 영향이 가장 중요해야 한다. 일반적인 모듈식 종합 평가 시스템에서 더 많은 부정적인 교육 영향이 나타난다(알 카드리 외). 2009). 평가가 학습을 어떻게 주도하는지drive는 복잡한 문제이다. 그러나 (평가) 과제와 평가 시스템 설계는 모두 [영향에 대한 학습자의 판단, 인식된 행위자성agency, 대인관계 요인]와 같은 [학습자 요인]에 의해 매개되는 중요한 메커니즘임이 분명해지고 있다(실리어 외 2012a, 2012b; Schut 외 2018). 또한 일부 전통적인 평가 시스템에서는 피드백이 무시될 수 있는 것으로 밝혀졌다(Harrison et al. 2013, 2015). 이러한 연구 결과는 평가가 의미 있는 학습을 주도하고 바람직한 학습 접근법을 육성하기 위해 프로그래밍 평가의 목표를 강화하는 데 가장 중요했다. 평가 프로그램은 의미 있는 (종종 서술적인) 피드백을 생성함으로써 평가의 학습 기능을 최적화하도록 설계되었다. 또한 단일 평가를통과-실패 결정에 사용하지 않는다. The rationale for these principles derives from the observation that ‘assessment drives learning behaviour’ and therefore a positive impact on learning approaches must be paramount. More adverse educational impacts are seen in typical modular, summative assessment systems (Al Kadri et al.2009). How assessment drives learning is complex; however, it is becoming clear that both the (assessment) task and the assessment system design are important mechanisms, which are mediated by learner factors, such as the learner’s appraisal of the impact, perceived agency, and interpersonal factors (Cilliers et al.2012a,2012b; Schut et al.2018). In addition, it has been found that feedback can be ignored in some traditional assessment systems (Harrison et al.2013,2015). These findings were paramount in reinforcing the objective of programmatic assessment to have assessment drive learning in a meaningful way and foster desirable learning approaches. The assessment programme is designed to optimise the learning function of assessment by the generation of meaningful, often narrative feedback and single assessments not being used for pass–fail decisions.
전반적인 합의가 이루어졌으며 목록을 완성한 15개 프로그램 중 대다수가 이러한 원칙을 이행하였다(표 4). 학습자에게 의미 있는 피드백을 제공해야 할 필요성이 중요한 요소로 인식되었습니다. 복잡한 스킬에 대한 피드백은 내러티브 정보(Govaerts 및 Van der Bleuten 2013)를 통해 향상되었습니다. 서술적 피드백은 또한 표준화된 평가에 의미를 더할 수 있다(Tekian et al. 2017). 또한 피드 포워드를 가능하게 하고 학습을 위한 종단적 모니터링과 가이드를 지원하기 위해 [학습 및 평가 커리큘럼 구조의 종단적 구성]이 언급되었다. 이는 또한 이러한 종단적 평가 커리큘럼 구조의 설계를 의식하는 것의 중요성을 강조했다. 이를 위해, 평가의 매핑 또는 청사진도 또한 4/5 원칙과 연결되는 중요한 구성 요소로 제시되었다. 사고방식과 평가문화에 변화가 필요하다는 지적도 나왔다. 실제로 학습을 자극하기 위한 저부담 설계와 학습자에 대한 종합적인 인식을 위한 고부담 설계 사이의 불일치가나타났다(Bok et al. 2013; Heeneman et al. 2015). 학습자의 행위자성agency을 위한 기회와 함께 의도적인deliberate 설계, 학습자를 위한 지지적 평가 및 피드백 리터러시 프로그램은 프로그램 평가의 학습 기능을 실현하는 데 도움이 될 수 있다(Price et al. 2012; Schut et al., 2020; Sutton 2012). There was overall agreement and the majority of the 15 programmes that completed the inventory implemented these principles (Table 4). The need to generate meaningful feedback for learners was recognised as an important component. Feedback for complex skills is enhanced by narrative information (Govaerts and van der Vleuten2013). Narrative feedback can also add meaning to standardised assessment (Tekian et al.2017). In addition, the longitudinal organisation of learning and assessment curricular structures was mentioned both to enable feed-forward and to support longitudinal monitoring and guidance for learning. This also highlighted the importance of being conscious of the design of these longitudinal assessment curricular structures. For this, mapping or blueprinting of assessment was also indicated as an important component, which links to principle 4/5. It was also indicated that a change in mindset and assessment culture is needed. Indeed a discrepancy between a low-stakes design to stimulate learning and a high-stakes, summative perception of learners has been shown (Bok et al.2013; Heeneman et al.2015). A deliberate design, with opportunities for the learners’ agency, a supportive assessment and/or feedback literacy programme for learners may help actualise the learning function of programmatic assessment (Price et al.2012; Schut et al.2018,2020; Sutton2012).
원칙 4/5:
평가 방법은 혼합될 수 있다.
방법 선택은 해당 방법을 사용하기 위한 교육적 정당성에 달려 있다.
Principle 4/5:
- there is a mix of methods of assessment
- the choice of method depends on the educational justification for using that method
이러한 원칙에 대한 중요한 근거는 모든 평가 방법이 타당성과 신뢰성 측면에서 한계가 있으며, 밀러 피라미드에서 하나의 수준에만 사용될 수 있다는 것이다(van der Vleuten et al. 2010). 따라서, 피라미드 전체를 커버하고 신뢰성과 타당성의 적절한 조합을 보장하기 위해 정교하고 목적적인 방법의 혼합이 필요하다. 또한 평가 형식의 선택은 의도된 학습 결과 및 교육 활동에 대한 [건설적 정렬constructive alignment]에 기초해야 한다(Biggs 1996).
An important rationale for these principles is that any assessment method has its limitations in terms of validity and reliability, and can be used for only one level of Miller’s pyramid (van der Vleuten et al.2010). Therefore, an elaborate and purposeful mix of methods needs to be used to cover the whole pyramid and to ensure an appropriate mix of reliability and validity. In addition, the choice of any assessment format needs to be based on constructive alignment with the intended learning outcome and the teaching activities (Biggs1996).
이러한 원칙에 전반적으로 동의하였고 목록을 완성한 15개 프로그램 중 대다수가 어느 정도 이를 구현하였다(표 4). 일부 전문가들은 이 원칙이 프로그램 평가뿐만 아니라 모든 교육 및 평가 설계에서 필요하기 때문에 '부분적' 중요성을 나타냈다. 이러한 원칙을 적용하는 데 필요한 구성요소는 청사진에 부합하는 건설적 정렬의 원칙에 따라 신중하게 평가 방법을 선택하는 것입니다. 과정의 블루프린팅에 대한 가이드라인이 설명된 바 있으나, 프로그램 평가에서 이러한 청사진들은 [프로그램의 전체적인 평가 설계]를 포함해야 하며, 고위 지도부와 경영진의 거버넌스와 지원은 필수적이다. 또한 효용 모델은 이러한 원칙의 중요한 기본 개념으로 제시되었다(Van der Bleuten 1996). 이 모델은 (신뢰성, 타당성 및 교육적 영향과 같이) 평가 방법이나 도구를 판단할 수 있는 여러 요소를 개념적으로 곱하여평가 효용성utility을 특징짓는다. 개념적 곱셈 모델은 어떤 요소가 0이면 효용이 0이라는 것을 강조한다. 전문가들은 프로그램 평가에서 모든 평가 방법이 사용될 수 있고 효용성에 가치가 있지만, 이는 전체 평가 프로그램의 맥락에서 볼 때에만 판단할 수 있다고 지적했다.
There was overall agreement with these principles and the majority of the 15 programmes that completed the inventory implemented them to some degree (Table 4). Some experts indicated a ‘partial’ importance, as this principle would be necessary in any educational and assessment design, not just in programmatic assessment. The components needed to apply these principles would be a deliberate choice of assessment methods guided by the principles of constructive alignment adhering to a blueprint. Guidelines of the blueprinting of courses have been described (Mookherjee et al.2013; Villarroel et al.2018), however in programmatic assessment, these blueprints need to cover the whole assessment design of the programme (Wilkinson and Tweed2018), and governance and support by senior leadership and management is indispensable. In addition, the utility model was indicated as an important underlying concept of these principles (van der Vleuten1996). This model characterises assessment utility by conceptually multiplying a number of elements on which assessment methods or instruments can be judged, such as reliability, validity, and educational impact. This conceptual multiplication model emphasises that if any element is zero, then the utility is zero. The experts indicated that in programmatic assessment, any assessment method can be used and be of value for the utility, but this can only be judged when seen within the context of the entire assessment programme.
원칙 6/7:
총괄평가와 형성평가의 것의 구별은 학습자 진전에 대한 일련의 이해관계로 대체된다.
학습자 진척에 대한 의사결정은 부담에 비례한다.
Principle 6/7:
- the distinction between summative and formative is replaced by a continuum of stakes/
- decision-making on learner progress is proportionally related to the stakes
프로그램 평가에서 평가의 부담은 낮은 평가에서 높은 평가까지의 연속체로 개념화된다. 이것은 형성 평가와 총괄 평가의 전통적인 이분법과 대조된다. 저부담 평가의 결과는 합격 또는 불합격 측면에서 학습자에게 전혀 consequences가 없거나 매우 제한적으로만 consequences를 초래하며, 대신 이 데이터 포인트는 원칙 1/2/3에서 예시된 것처럼 학습에 최적화된다. 고부담 평가나 고부담 결정은 졸업이나 승진과 같은 중요한 결과로 이어진다. 많은 저부담 평가의 정보는 고부담 의사결정에 기여하며, 고부담 결정일수록 의사결정에 더 많은 데이터 포인트가 필요하다(van der Vleuten et al. 2012). In programmatic assessment, the stakes of the assessment are conceptualised as a continuum from low- to high-stakes. This contrasts with the more traditional and binary dichotomy of formative versus summative assessment. In a low-stakes assessment, the results have no or limited consequences for the learner in terms of passing or failing, this datapoint instead is optimised for learning, as exemplified in principle 1/2/3. The high-stakes assessment or high-stakes decision, has important consequences, such as graduation or promotion. The information from many low-stakes assessments contributes to the high-stakes decision, and the higher the stakes, proportionally more data points are needed for the decision (van der Vleuten et al.2012).
이 원칙들에 대한 전반적인 동의가 있었다. 그러나 목록을 완성한 15개 프로그램 중 여러 프로그램은 중요도의 정도와 이를 준수하기 쉬운지에 대해 엇갈린 합의를 나타냈다(표 4). 저부담 평가는 여전히 학습자들의 불안감을 유발하고, 1/2/3 원칙에서도 알 수 있듯이, 교사들이 형성-총괄이라는 이분법적 패러다임에서 저부담-고부담 연속체로 전환하기가 쉽지 않을 수 있다고 언급했다. 교사들의 인식과 관련하여, 연구는 또한 프로그램 평가의 사용이 교사들의 관행과 평가 신념을 긍정적으로 변화시킬 수 있다는 것을 보여주었다. 원칙 6/7에 따르면, 교사는 의사결정 결과가 아닌 평가의 학습 결과(원칙 1/2)에 집중할 수 있다(원칙 9 참조). 이렇게 초점이 달라지만, [교사들의 통제권]와 [학습자들의 독립 허용] 사이의 긴장은 고려해야겠지만, 역할 갈등role conflict을 줄이는 것으로 나타났다. There was overall agreement with these principles. However, several of the 15 programmes that completed the inventory indicated a mixed agreement about the degree of importance and whether it was easy to adhere to (Table 4). It was mentioned that a low-stakes assessment would still cause anxiety among learners, and it may not be easy for teachers to shift from a formative-summative paradigm to a low-high stakes continuum, as also indicated for principle 1/2/3. Regarding the perceptions of teachers, research has also shown that the use of programmatic assessment can positively transform teachers practices and assessment beliefs. Given principle 6/7, teachers can focus on the learning outcome of assessment (principle 1/2/3) and not the decision making outcome (see principle 9). This shift in teachers’ focus was shown to reduce role conflicts, although the tension between teachers taking control and allowing learners' independence still needs careful navigation (Jamieson et al.2021; Schut et al.2020).
거의 모든 프로그램은 다양한 형식을 사용하여 교육 및 평가 프로그램에서 원칙 6/7을 구현하였다. 예를 들어,
위임 가능한 전문 활동
포괄적인 연말 포트폴리오 평가에 기초한 고부담 결정
ITER에 기초한 학습 계획 평가와 이를 위한 역량위원회의 설치
Almost all programmes implemented principles 6/7 in their education and assessment program, using various formats, e.g.
entrustable professional activities (ten Cate 2005; ten Cate and Scheele 2007),
a high-stakes decision based on a comprehensive end of year portfolio assessment (Friedman Ben David et al. 2001; Tochel et al. 2009; van Tartwijk and Driessen 2009), and
assessment of learning plans based on in-training assessment reports (Dawson et al. 2015; Laughlin et al. 2012), for which ‘competence committees’ were installed (see principle 9).
워크숍 이전과 워크숍 기간 동안 전문가 및 오타와 참석자들과의 토론에서 이러한 원칙의 사용에 대한 몇 가지 주의사항이 제기되었다.
한 가지는 [고부담 결정을 위한 데이터 포화 필요성]에 관한 것이다. [의사결정자들 사이의 합의]는 [필요한 최소치를 초과한 데이터 포인트의 숫자]와는 무관하다는 증거가 있으며, 이는 데이터 포화에 필요한 최소한의 숫자를 정하고, 주어진 맥락에서 얻어질 수 있음을 시사한다(de Jong 등 2019).
[Teaching and Working 환경에서의 심리적 안전]의 필요성도 제기됐다. 프로그램 평가가 시행되는 환경에서 심리적 안전에 대한 연구는 아직 거의 없다. 학습자는 낮은 점수를 높은 점수로 인식하고 불안감을 느낄 수 있습니다. Tsuei 외 연구진(2019)은 [학습자가 심리적으로나 교육적으로 안전하다고 느끼는 많은 특징들]이 프로그램적 평가의 원칙으로도 인정될 수 있음을 제안했다. 여기에는 동료와 멘토와의 협력적인 관계를 맺는 것, Consequences를 걱정하지 않고 학습에 집중하는 것 등이 있다. 그럼에도 불구하고, 관계적 구성relational construct로서의 [교육적 안전감]은 어떤 교육 설계에서도 주의와 인식이 필요하다.
마지막으로, 프로그램적 평가의 고부담 의사결정 기능의 맥락에서도, [학습자 개발에 초점을 맞추고 성찰이 가능하도록 해야 할 필요성]이 표명되었다. 성찰과 자기 모니터링은 전문적인 발전과 성과를 위해 중요한 것으로 인식되어 왔지만, 명백한 도구적이고 의무적인 접근 방식은 학습자에게 무의미한 활동으로 이어질 수 있습니다(Murdoch-Eaton 및 Sandars 2014). 포트폴리오를 작성할 때, 역량개발에 대해 학습자가 어떤 것을 문서화하는지는 학습과 평가 사이의 긴장, 포트폴리오의 목적에 대한 학습자의 인식 등에 영향을 받을 수 있는 것으로 나타났다. 그러나 학습자는 프로그래밍 평가(원리 1/2/3)의 학습 기능 및 코치의 지침(원리 11)에 성찰 또는 자기 평가가 포함되면 학습에 도움이 된다는 것도 인지한다(Heeneman et al. 2015).
In the discussion with experts and Ottawa attendees prior to, and during the workshop, several points of attention were raised for the use of these principles.
One point concerned the need for data saturation for high-stakes decisions. There is some evidence that consensus amongst decision makers is independent of the number of datapoints exceeding the required minimum, suggesting that data saturation can be obtained in a given context, with a defined minimum of datapoints (de Jong et al. 2019).
Another point was raised on the need for psychological safety in teaching and working environments. There is little research yet on psychological safety in a setting where programmatic assessment is implemented. Learners can perceive low-stakes assessment as high-stakes and feel anxious. Tsuei et al. (2019) suggested that a number of features that learners would perceive as beneficial for feeling psychologically or educationally safe, are recognisable in the principles of programmatic assessment, such as having supportive relationships with peers and mentors and a focus on learning without considering consequences. Nevertheless, educational safety as a relational construct needs attention and awareness in any education design.
Finally, the need was expressed to keep a focus on learner development and enable reflection, in the context of the high-stakes decision function of programmatic assessment. Reflection and self-monitoring have been recognised as important for professional development and performance, yet an overt instrumental and mandatory approach can lead to meaningless activities for the learners (Murdoch-Eaton and Sandars 2014). It has been shown that what learners document on competency development in a portfolio can be influenced by tensions between learning and assessment, and the learners’ perceptions about the purpose of the portfolio (Oudkerk Pool et al. 2020). However, learners also perceive the embedding of reflection or self-assessment in the learning function of programmatic assessment (principle 1/2/3) and the guidance from a coach (principle 11) are helpful for their learning (Heeneman et al. 2015).
원칙 8: 적절한 프레임워크에 대한 데이터 포인트에 걸친 평가 정보 삼각 측량 Principle 8: assessment information triangulation across data-points, towards an appropriate framework
삼각측량의 원칙은 도메인 특이성에 기초한다. 역량과 같은 구조는 컨텐츠 도메인이 동일할 때 평가 형식보다 잘 일반화된다. 이것은 또한 [시험 형식]이 아닌 [(학습자의) 속성attribuate]에 따라 증거에 기반한 결정을 내릴 수 있는 가능성을 열어준다. 예를 들어 한 학생이 [OSCE의 구성 요소 중 병력청취 점수]를 활용하여 병력청취에 대해 요구되는 표준에 도달했는지 판단할 때, 여기에 [미니-CEX의 병력청취 구성 요소], 그리고 [환자 의견 조사에서 병력청취 구성 요소]까지도 함께 사용하는 것이다. The principle of triangulation is based on domain-specificity; constructs such as competencies generalise well over assessment formats when the content domain is the same. This also opens up the possibility of making evidence-based decisions by attribute rather than by test format – for example determining if a learner has reached the required standard on history taking might draw on the history taking components of an OSCE, alongside the history taking components of a mini-CEX, and alongside the history taking components of a patient opinion survey.
정보 결정에서 이러한 데이터 삼각측량은 강력한 의사결정의 중요한 구성 요소이다(Norman 등 1996년; Schwirth 및 Van Der Vleuten 2019년). 따라서, 프로그램 평가에서, 동일한 내용에 관련된 평가 정보는 지식, 기술, 태도 또는 역량과 같은 구조에 삼각측량 된다. 적절한 프레임워크로 간주되는 설계와 프로그램의 국가 또는 입법 경계에 따라 달라집니다. 의학 교육에서 역량은 종종 사용된다(Frank et al. 2010).
We see this triangulation of data in informing decisions as an important component to robust decision making (Norman et al.1996; Schuwirth and Van Der Vleuten2019). Thus, in programmatic assessment, assessment information that pertains to the same content is triangulated, to constructs such as knowledge, skills, and attitude or competencies. It will depend on the design, and national or legislative boundaries of the programme what is considered as an appropriate framework. In medical education, competencies are often used (Frank et al.2010).
목록을 완성한 15개 프로그램 중 일부(표 4)는 의도적인 설계, 데이터 관리를 위한 일부 기술, 교수진과 프로그램의 이해 및 지원으로 인해 준수하기가 덜 쉽다는 것을 나타냈지만, 원칙에는 전반적으로 동의하였다. 삼각측량의 개념은 종종 수치 데이터와 서술 데이터의 조합을 요구하기 때문에 교육 실습으로 변환하기가 어려울 수 있다. 최종 결과는 계산이 아니라 [학습자에 대한, 학습자를 위한 풍부한 정보가 담긴 내러티브]입니다. 이를 위해서는 교육 및 평가 설계, 정렬, 교수진 개발, 필요한 수준의 직원 평가 소양 및 전문 지식, 데이터의 전체적인 관점을 취하는 효과적인 그룹 의사결정 프로세스의 확립이 필요하다(나중에 참조). There was overall agreement with the principle, although some of the 15 programmes that completed the inventory (Table 4) indicated that it was less easy to adhere to, due to the need for a deliberate design, some form of technology to manage the data, and an understanding and support of this concept by faculty and the programme. The concept of triangulation can be difficult to translate into educational practice, as it often asks for a combination of numerical and narrative data. The end result is not a calculation but an informative narrative about and for the learner. This requires central governance of the educational and assessment design, alignment, faculty development, a necessary level of staff assessment literacy and expertise (Prentice et al.2020; Schuwirth and Van Der Vleuten2019), and establishment of effective group decision making processes which take a holistic view of the data (see later).
15개 프로그램(표 4)의 목록은 대부분의 프로그램이 다음의 구성요소를 통해 이 원칙을 구현했다: 적절한 방식으로 고품질 데이터를 수집할 뿐만 아니라, 교육 활동, 평가 및 평가 도구를 신중하게 설계한다. 이를 위해서는 모든 평가와 피드백 정보를 수집하는 강력한 시스템이 필수적이다. 전자 포트폴리오와 같은 기술 지원 접근방식이 자주 사용되며, 프로그램 평가에 필요한 목적을 제공할 수 있다.
(1) 모든 정보의 보관소(서식, 평가 결과, 회의록),
(2) 평가 프로그램의 관리적administrative 목적 촉진(예: 멀티소스 피드백 도구, 다중 플랫폼을 통한 평가 및 피드백 양식 로딩, 액세스 관리)
(3) (적절한) 프레임워크를 사용하여 집계된 데이터 포인트의 개요를 생성하여 삼각 측량 함수를 지원한다.
(4) 학습자의 자기 평가 및 행위자성agency를 지원한다(Tillema 2001; van Tartwijk and Driessen 2009).
The inventory amongst the 15 programmes (Table 4) showed that most have implemented this principle with the components being: a careful design of educational activities, assessments, and assessment instruments, as well as high quality data aggregation in an appropriate manner. A robust system to collect all assessment and feedback information is essential (van der Vleuten et al.2015). A technology supported approach, e.g. an electronic portfolio, is often used and could serve the purposes needed for programmatic assessment,
(1) as a depository for all information (feedback forms, assessment results, minutes),
(2) to facilitate administrative purposes of the programme of assessment (e.g. direct online completion of forms, such as multisource feedback tools, loading of assessment and feedback forms via multiple platforms, managing access),
(3) to support the triangulation function by generating overviews of aggregated datapoints using the (appropriate) framework, and
(4) to support learners’ self-assessment and agency (Tillema 2001; van Tartwijk and Driessen 2009).
평가와 피드백 정보를 수집하기 위해 선택한 테크놀로지 접근법은, 코치(원리 11)가 더해져서, 학습 기능(원리 1/2/3), 프로그래밍 평가의 의사결정 기능(원리 9)을 지원할 수 있다.
The technology approach chosen to collect the assessment and feedback information can, together with a coach (principle 11), support the learning function (principle 1/2/3), and the decision function of programmatic assessment (principle 9).
원칙 9: 전체론적 접근 방식을 사용하여 신뢰할 수 있고 투명한 방식으로 내린 고위험 의사 결정 Principle 9: high-stakes decisions made in a credible and transparent manner, using a holistic approach
원칙 6/7에 내재된 바와 같이, 프로그래밍 평가에서 고부담 결정은 광범위한 샘플링, 맥락, 평가 방법 및 다양한 평가자에서 비롯된 풍부한 정보에 기반한 많은 데이터포인트에 기초한다(van der Vluten et al. 2012, 2015). 고부담이라는 특성과 그에 따르는 중대한 consequences를 고려할 때, 절차는 신뢰할 수 있고 신뢰할 수 있어야 한다. 절차적 척도procedural measures에는 다음이 포함된다.
서술적 표준, 루브릭 또는 이정표를 사용할 수 있도록 교육을 받은 전문가로 구성된 평가위원회의 구성
결정에 대한 정당성 제공
코치나 멘토, 학습자의 멤버체킹 절차
항소appeal 절차서 사용
As embedded in principle 6/7, the high-stakes decision in programmatic assessment is based on many datapoints, on rich information originating from a broad sampling, across contexts, assessment methods, and diverse assessors (van der Vleuten et al.2012,2015). Given the high-stakes and prominent consequences, the procedures need to be trustworthy and credible. Procedural measures could include:
appointment of an assessment committee of experts that are trained and can use narrative standards, rubrics or milestones;
the provision of a justification for the decision;
member-checking procedures, of the coach/mentor and the learner;
instatement of appeal procedures.
판 데르 블뢰텐 등은 다음과 같이 표현했다. '절차적으로 합당한 프로세스를 이루는 요인이나, 전문적인 판단의 전문성에 기여하는 요인과 같기, [어떤 척도가 법정에서도 효력이 있을지를 생각해 보는 것]이 도움이 된다. 이러한 결정은 일반적으로 신뢰성이 있고 신뢰할 수 있는 강력한 결정으로 이어진다'(p. 643)(van der Vleuten et al. 2015).
As expressed by van der Vleuten et al.: ‘it is helpful to think of any measure that would stand up in court, such as factors that provide due process in procedures and expertise of the professional judgement. These usually lead to robust decisions that have credibility and can be trusted’ (p. 643) (van der Vleuten et al.2015).
이 원칙에 대한 일반적인 합의가 있었고 목록을 완성한 15개 프로그램(표 4) 중 대다수가 이를 이행했지만, 일부에서는 이를 준수하기가 쉽지 않다고 인식하기도 했다. 준수하기 쉽지 않은 이유는 다음과 같았다.
평가 절차 및 위원회에 필요한 자원 (부재)
전문가 그룹 또는 위원회의 결정을 수용하기 위해 필요한 리더십 (부재)
이러한 평가 절차의 집행을 가능하게 하는 기관 정책의 권한 (부재)
Although there was general agreement on this principle and majority of the 15 programmes that completed the inventory (Table 4) have implemented it as such, it was also perceived by some as not easy to adhere to, due to
the resources needed for these assessment procedures and/or committees,
required leadership for acceptance of decisions by an expert group or committee and
a mandate from institutional policies to enable enactment of these assessment procedures.
많은 프로그램에서 임상 역량 위원회 또는 독립 포트폴리오 위원회와 같은 전문가 그룹을 사용하고, 멤버체킹을 위해 멘토와 학습자의 관점을 반영하여 고위험 결정을 내렸다. 이 때 [그룹 의사결정의 원칙]이 강조되었다(Hauer 등 2016).
전체론적holistic 의사결정을 위해 aggregated data를 사용한다.
정신 모델을 공유하는 것이 중요하다
적절한 정보 공유 방법이 필요하다.
Many programmes used a group of experts to make the high-stakes decisions, e.g. clinical competency committees (Duitsman et al.2019; Kinnear et al.2018) or independent portfolio committees taking the view of mentor and learner into account with a member checking procedure (Driessen et al.2012). The principles of group-decision making were emphasised, including
the use of aggregated data to make an holistic decision,
the importance of having a shared mental model and
a proper method for sharing information (Hauer et al. 2016).
또한 패널은 그룹 의사결정에서 발생할 수 있는 편향에도 주의를 기울여야 한다(Tweed and Wilkinson 2019). 위원회가 피드백 및 성과 데이터 축적에 대한 overview를 관리하고 유지하는 것을 지원하고, 의사결정에 필요한 정보제공을 지원하기 위해, [수행능력 데이터의 모자이크]를 사용하고 [베이지안 네트워크]를 사용하는 접근법이 제안되었다. 신뢰성과 투명성의 필요성은 프로그램 평가에만 국한된 것이 아니며, 모든 평가 절차와 형식은 이를 필요로 한다. 그러나 프로그래밍 방식 평가에서, [전통적인 grading rules이나 심리측정학이 의사결정 과정에 적용할 가능성이 낮다는 것]을 의미하는, [다양한 형식으로 제시된 집계 데이터를 기반으로 전체론적 의사결정이 이루어진다는 것]을 깨닫는 것이 중요하다.
In addition, the panel needs to be attuned to possible sources of bias associated with group decision making (Tweed and Wilkinson2019). Approaches using mosaics of performance data and use of Bayesian networks have been proposed to support the committees in managing and maintaining overview of accumulating feedback and performance data, and informing the decision making (Pearce et al.2021; Zoanetti and Pearce2021). The need for credibility and transparency is not unique to programmatic assessment, all assessment procedures and formats need this. It is however important to realise that in programmatic assessment a holistic decision is made, based on aggregated data that is presented in a variety of formats, meaning traditional grading rules or psychometrics are unlikely to be as applicable in the decision process.
원칙 10: 학습자와 진행 상황을 논의하고 결정하기 위해 중간 검토가 이루어집니다. Principle 10: intermediate review is made to discuss and decide with the learner on their progress
기간, 연도 또는 프로그램의 말기에 고부담 결정이 상당한 결과를 가져온다는 점을 감안할 때, (결과가) 학습자에게 예상치 못한 일로 다가오지 않아야 한다(van der Vleuten et al. 2015). 따라서 학습자는 잠재적 결정에 대한 중간 피드백을 받아야 하며, 필요한 경우 개선하도록 행동할 수 있어야 합니다. 또한 이 [중간 검토intermediate review]는 고부담 의사결정의 신뢰성을 보장하기 위한 중요한 절차적 조치로 볼 수 있다(원칙 9 참조). (van der Vleuten et al. 2015) [중간 검토]는 더 적은 데이터 포인트(비례성, 원리 6/7 참조)를 기반으로 하며, 학습자가 어떻게 하고 무엇을 할 수 있는지 '진단' 메시지를 제공하도록 설계되었습니다. [중간 검토]를 위해 학습자가 코치/멘토(원칙 11)의 지도를 받고 피드백 대화가 마련되어 있는지 확인하는 것이 중요하다. 피드백은 대화를 포함하는 순환 과정인 '루프'일 때 가장 효과적이라는 것은 잘 알려져 있다(Boud and Molloy 2012; Carless et al. 2011). 토론과 대화를 강조하고 학습자가 행동할 수 있는 능력을 강조한 것도 오타와 컨퍼런스에서 워크숍이 끝난 후 이 원칙을 되새겨야 하는 이유였다. Given that the high-stakes decision at the end of a period, year or programme has substantial consequences, this must not come as a surprise for the learner (van der Vleuten et al.2015). Therefore, it is imperative that the learner receives intermediate feedback on the potential decision and can act to improve if needed. This intermediate review can also be seen as an important procedural measure for ensuring the credibility of the high-stakes decision (see principle 9) (van der Vleuten et al.2015). The intermediate review is based on fewer datapoints (proportionality, see principle 6/7) and is designed to give a ‘diagnostic’ message, how is the learner doing and what can be done. For this intermediate review, it is important that the learner is guided by a coach/mentor (principle 11), and that a feedback dialogue is in place. It is well known that feedback is most effective, when it is a ‘loop’, a cyclical process, involving a dialogue (Boud and Molloy2012; Carless et al.2011). The emphasis on the discussion and dialogue and the ability of the learner to act were also the rationales for the rephrasing of this principle after the workshop at the Ottawa conference.
합의가 이루어졌고 목록을 완성한 15개 프로그램(표 4) 대부분이 구현되었지만, 일부 프로그램의 경우 필수 자원과 커리큘럼 설계에 중간 순간을 명시적으로 통합해야 할 필요성 때문에 준수하기가 쉽지 않았다. 종종 중간 순간의 순간은 일정 기간이나 한 해의 중간 정도의 공식적인 순간으로 구현되거나 멘토 미팅의 과정의 일부로 통합되거나 감독자에 의해 수행된다. 중간 검토의 존재는 학습 촉진에 있어 프로그램이 학습자를 돌본다는 것을 의미하기도 했다. 피드백을 활용하는 학습자 스스로의 역할과 피드백의 후속 조치가 매우 중요하다고 보았다. Although there was agreement and most of the 15 programmes that completed the inventory (Table 4) have implemented, for some it was less easy to adhere to, because of the necessary resources and the need to explicitly incorporate an intermediate moment in the design of the curriculum. Often the intermediate moment was implemented as a formal moment in time halfway through a period or year, integrated as part of the process of mentor meetings, or done by the supervisors. It was also indicated that the presence of an intermediate review signified that the programme takes care of the learner, in facilitating the learning. The role of the learners themselves in using the feedback, and follow-up of feedback was seen as very important.
원칙 11: 학습자는 모든 평가 데이터의 자체 분석을 사용하여 멘토/코치와 반복적인 학습 미팅을 갖습니다. Principle 11: learners have recurrent learning meetings with (faculty) mentors/coaches using a self-analysis of all assessment data
위에서 설명한 것처럼(원칙 1/2/3 및 10), 피드백은 학습 및 전문성 개발을 위해 필수적입니다. 학습자에 의한 피드백의 사용은 종종 자기 분석이나 성찰에 있어 중요한 역할을 한다. 학습자는 성찰 활동을 체크박스 실습 이상으로 인식하지 않습니다. 하지만, 학습자들은 성찰의 가치를 멘토와의 대화에서 찾는다. 자기 주도성과 성찰에는 멘토나 코치의 디렉션과 가이드가 필요하다는 것은 잘 알려진 사실이다. 따라서 멘토에 의한 이 지침은 프로그램 평가에서 중요한 원칙이다(van der Vleuten et al. 2012, 2015).
As indicated above (principles 1/2/3 and 10), feedback is essential for learning and professional development. The use of that feedback by the learners is often scaffolded in self-analysis or reflection (Sargeant et al.2009). Learners do not appreciate reflective activities as more than tick-box exercises (de la Croix and Veen2018); however, they do see the value of reflection as part of a dialogue with a mentor (Driessen et al.2012; Heeneman et al.2015). It is well known that self-direction and reflection require direction and guidance by a mentor or coach (Knowles1975; Pilling-Cormick1997). Therefore, this guidance by a mentor is an important principle in programmatic assessment (van der Vleuten et al.2012,2015).
전반적인 합의가 이루어졌으며 목록을 완성한 15개 프로그램(표 4) 중 대다수는 이 원칙을 구현하였다. 리소스 부족과 (훈련된) 직원 부족이 이 원칙을 고수하기 쉽지 않은 요인이었습니다. 대부분의 프로그램은 전담 스태프 멘토/코치를 사용하거나 대학원 교육에서 프로그램 책임자가 참여했습니다. 프로그램의 규모도 중요했다. 학생의 규모는 큰데, 자원이 제한적일 경우, 멘토링 시스템이 없거나 연중 연락 횟수가 제한적일 수 있다. There was overall agreement and the majority of the 15 programmes that completed the inventory (Table 4) implemented this principle. Lack of resources and lack of (trained) staff were factors that made this principle less easy to adhere to. Most programmes used dedicated staff mentors/coaches, or in post-graduate training the programme director was involved. It was clear that the size of the programme also mattered; if many learners were present, and resources limited, the choice could be made to have no mentoring system or a limited number of contacts throughout the year.
원칙 12: 프로그램 평가는 개별 학습 우선순위를 지원하도록 맞춤화된 학습을 통해 학습자의 자기 학습에 대한 행위자성과 책임감을 점진적으로 증가시키는 것을 추구한다. Principle 12: programmatic assessment seeks to gradually increase the learner’s agency and accountability for their own learning through the learning being tailored to support individual learning priorities
평가의 학습적 기능(원리 1/2/3)을 위해 평가와 피드백이 저부담으로 설계되고, 지속적인 정보 흐름이 자기조절 학습을 촉진한다. 자기 결정 이론과 자기 조절 학습과 같은 프레임워크는 학습자의 학습 동기와 기관의 중요성을 뒷받침한다. Schut 등은 프로그램 평가의 맥락에서, 스스로 통제하고 있다는 느낌이나 행위자성agency을 갖는 것이 평가 이해 관계에 대한 학습자의 인식에 필수적이라는 것을 확인했다(Shut 등 2018). 프로그램의 몇몇 feature는 학습자가 평가를 통제하고 저부담 평가로 인식할 수 있는지에 중요했다. 즉, 프로그램에서 학습자가 [스스로 평가를 시작하거나 진행 상황에 대한 증거를 선택할 수 있도록 허용할 때], sense of agency가 장려되었다. For the learning function of assessment (principle 1/2/3), assessment and feedback are designed as low-stakes, and the continuous flow of information fosters self-regulated learning. Frameworks such as the self-determination theory and self-regulated learning indeed support the importance of learners’ motivation and agency for learning (Panadero2017; Zimmerman1989). Schut et al. identified that, in the context of programmatic assessment, the feeling of being in control, or agency, was essential for the learners’ perception of assessment stakes (Schut et al.2018). Programme features were an important factor in whether learners were able to take control over the assessment and perceive it as low-stakes, i.e. a sense of agency was encouraged when the programme allowed the learner to initiate their own assessment or select the evidence for their progress (Schut et al.2018).
이것은 가장 복잡한 원칙으로 인식되었고 메시지와 함축된 의미를 전달하기 위해 리퍼레이싱이 필요했다. 재정비 후, 원칙과 전반적인 합의가 이루어졌는데, 이를 준수하기가 쉽지 않았고, 재고를 완료한 일부 프로그램(표 4)에서 이행이 일부 이루어졌다. 잘하는 학습자와 어려움을 겪는 학습자 모두에게 agency과 accountability가 중요함이 강조되었다. 이는 어려움을 겪는 학습자에게 특히 더 힘든데, 왜냐하면 그러한 학생일수록 코치나 스텝이 개입하여 조치를 취할 가능성이 더 높고, 재교육 조치를 스텝이 통제하고 규제하기 때문이다. 그러나 프로그램 평가에서 학습에 초점을 맞춘 것은 [이미 잘 하고 있는 사람들]이 훨씬 더 잘 할 수 있도록 지원하고 격려하며, 궁극적으로 모든 의료 종사자들에게 평생 학습의 중요성을 강화한다. This was perceived as the most complex principle and rephrasing was needed to convey the message and implications. After rephrasing there was overall agreement with the principle, although it was not easy to adhere to, and implementation was partial in some of the programmes that completed the inventory (Table 4). It was indicated that agency and accountability are important for all learners, both for those that do well and those that struggle. This is challenging as for the learners that struggle, coaches and staff are more likely to step in and take action (Heeneman and de Grave2017), and remediation is controlled and regulated by staff (Ellaway et al.2018). Yet the focus on learning in programmatic assessment suggests those already doing well are supported and encouraged to do even better, reinforcing the importance of lifelong learning for all health care practitioners.
표 2는 프로그램 평가의 최종 Ottawa 2020 합의 원칙을 제시한다. 표 2의 원칙은 평가 프로그램을 프로그래밍 방식으로 호출하기 위해 이행해야 하는 체크리스트의 항목으로 간주되지 않는다. 앞서 언급한 바와 같이, 원칙은 교육, 평가 및 조정에 대한 개념적 관점을 나타낸다. 프로그램 평가는 레시피가 아니며 다양한 표현을 할 수 있다. 그럼에도 불구하고 이러한 표현은 프로그램 평가가 교육 설계를 주도하고 그러한 맥락에서 평가의 학습과 의사결정 기능을 극대화하는 프로그램으로 간주될 수 있다.
Table 2presents the final Ottawa 2020 consensus principles of programmatic assessment. The principles inTable 2are not be considered as items of a checklist that need to be fulfilled in order to call the programme of assessment, programmatic. As indicated earlier, the principles represent a conceptual view on education, assessment and its alignment. Programmatic assessment is not a recipe and may have many different manifestations. These manifestations may nevertheless be considered as programmes in which programmatic assessment is leading the educational design and maximises the learning and decision function of assessment in that context.
향후 작업에 대한 권장 사항 Recommendations for future work
프로그래밍 평가 원칙에 대한 이 오타와 2020 합의문(파트 1)의 작업과 진행은 여러 가지 중요한 통찰력을 제공한다.
The work and proceedings for this Ottawa 2020 consensus statement (part 1) on the principles of programmatic assessment let to a number of important insights.
첫째, 프로그래밍 평가 모델에서 중요한 측면은 원칙의 연계이다. 예를 들어 중간 진척도 회의(원칙 10)를 위해서는, 멘토의 지도가 필요하다(원칙 11). [원칙이 서로 의존한다는 사실]은 커리큘럼의 평가와 교육 설계의 중심으로서 프로그램 평가를 선택할 때 고려해야 할 중요한 사항이다. 중요한 질문은 일정한 원칙이 있는지, 또는 평가의 학습과 의사결정 기능에 원하는 영향을 미치기 위해 설계에 필요한 구체적인 원칙이 있는지 여부이다. 다시 말해, 어떤 원칙의 부재가 시스템을 프로그래밍 방식이라고 부를 수 없게 만드는가? 프로그래밍 방식이 실현되기 전에 적용해야 할 특정 수의 원칙이 있는가?
First, a significant aspect in the programmatic assessment model is the interlinking of certain principles, e.g. for the intermediate progress meeting (principle 10), guidance by a mentor is needed (principle 11). The finding that the principles depend on each other in practice, is important to take into account in the choice for programmatic assessment as central to the assessment and educational design of a curriculum. An important question is whether there are a certain number of principles, or whether there are specific principles that are needed in the design to lead to the desired impact on the learning and decision function of assessment. In other words, are there principles without which a system could not be called programmatic and/or are there a certain number of principles that need to be applied, before a programmatic approach is realised?
여기서 여러 맥락에 걸친 다른 교육 형식의 구현과 비교하는 것은 유용할 수 있다(예: 문제 기반 학습(PBL)). PBL은 원래 의도한 모델에 대한 타협으로 인해 많은 표현 또는 하이브리드 접근법을 가질 수 있다. 연구에 따르면 PBL의 성과에 대해서는 혼재hybrid 되어있다. 마찬가지로 프로그램적 평가에서 특정 원칙을 부분적으로만 구현하면 원치 않는 부작용을 초래할 수 있다. 예를 들어, 학습자가 저부담 평가를 인식하지 못하는 것이다. 중요한 질문은 최적의 구현을 하지 못해서 결과가 하이브리드였는지, 아니면 특정 원칙이 부분적으로만 구현되었는지 여부이다.
Here, the comparison to the implementation of other educational formats across contexts may be useful, e.g. problem-based learning (PBL). PBL can have many manifestations or hybrid approaches, as a result of compromises on the original intended model. Studies have shown that the outcome of PBL may then give a ‘hybrid’ success (Frambach et al.2012), and also in programmatic assessment, the partial implementation of certain principles may give unwanted side effects, e.g. low-stakes assessment that is not perceived as such by the learners (Bok et al.2013; Heeneman et al.2015; Schut et al.2018). An important question is whether the implementation itself was not optimal and therefore led to a hybrid outcome, or was a certain principle only partially implemented, e.g. a number of assessments are present that yield individual summative decisions, and that led to the hybrid outcome.
그러나 프로그램 평가가 커리큘럼의 평가와 교육 설계에 중심인 경우, [학습 기능(즉, 원칙 1/2/3/11/12)]과 [평가의 의사결정 기능(즉, 원칙 7/8/9/10)] 모두에 관련된 원칙이 존재해야 한다는 것이 프로그래밍 평가의 핵심 특징으로 강조되고 고려된다. 이 합의문에 기여한 전문가들이 속한 프로그램마다 실무에서는 프로그래밍 평가가 서로 다른 방식으로 구현되었으며, 혁신이 다양성에서 발생할 수 있음을 고려하면, 더 장려되어야 한다.
It is however emphasised and considered as a key feature of programmatic assessment that principles pertaining to both the learning function (i.e. principle 1/2/3/11/12) and the decision function of assessment (i.e. principle 7/8/9/10) should be present if programmatic assessment is central to the assessment and educational design of a curriculum. Different manifestations of programmatic assessment were seen in the actual practices of the experts’ programmes that contributed to this consensus statement, and this should be encouraged as innovation can arise from diversity.
둘째, 부담의 연속체 원칙(원리 6/7)과 학습자 행위자성(원리 12)은 중요성과 고수성adherence 측면에서 가장 다양한 응답이 얻어졌다(표 4). 실제로 [부담의 연속체]는 프로그램적 평가 모델의 중요한 이론적 토대이지만, 이와 같은 연속체라는 차원을 파악하고 고수하는 것은 어렵다고 여겨졌다. 예:
저부담 평가는 언제 '진정한' 저부담 평가인가?
의도된 학습 성과 수준에서 의미 있고 신뢰할 수 있는 고부담 결정을 어떻게 내려야 하는가?
(부담의) 전체 연속체를 어떻게 도입할 수 있을까?
Second, the principles on the continuum of stakes (principle 6/7) and learner agency (principle 12) gave the most varied responses in terms of importance and adherence (Table 4). Indeed the continuum of stakes is an important theoretical foundation of the programmatic assessment model, but the dimensions of this continuum were considered difficult to grasp and adhere to. For example:
When is a low-stakes assessment ‘truly’ low-stakes?
How should we come to a meaningful and reliable high-stakes decision at the level of the intended learning outcomes?
And how can the full continuum be employed?
원칙 12와 관련하여, 학습자의 행위자성은 중요하지만 달성하기 어려운 것으로 인식되었다. 이를 위해서는 커리큘럼과 평가 설계의 변경이 필요하며, 정렬이 더욱 중요할 것임이 분명했다(Kulasegaram et al. 2018). 와틀링 등이 보여주듯 '행위자성은 (힘든) 일'이라는 점에서, 학습자는 사회적·전문적 기대에 저항해야 할 수 있으며, 지원/코칭은 성과가 있고 필요한 것으로 판단되었다(원칙 11).
[기관 수준에서의 정책]과 [인증 기관]이 긴장을 유발할 수도 있다. 왜냐하면 [프로그램의 의도된 학습 성과를 달성하고 보호해야 할 필요성]과 [([학습의 자기 조절와 자기 결정의 극대화]를 위한) 학습자가 원하는 자율성 또는 행위자성] 중 어느 한 쪽이 강조되기 때문이다.
게다가, 선생님들의 역할이 중요한 것으로 나타났다: 교사들이 accounting와 control에 더 집중하는 것도 긴장을 유발할 수 있다. 교사는 학습자를 통제하는 것과 학습자의 행위자성을 허가하는 것 사이에서 어려움을 겪을 수 있다(Shut et al. 2020).
Regarding principle 12, leaner agency was perceived as important but also difficult to achieve. It was clear that this would need a change in both the curriculum and assessment design and even more important the alignment (Kulasegaram et al.2018). As shown by Watling et al., ‘agency is (hard) work’, learners may need to resist social and professional expectations, and support/coaching was deemed as fruitful and needed (principle 11) (Watling et al.2021).
Institutional policies and accreditation bodies can create tensions by emphasising the need to attain and safeguard the intended learning outcomes of a programme versus the desired autonomy or agency of the learner to maximise self-regulation and self-determination of learning.
In addition, the teachers’ role was shown to be important: when teachers are more focused on the conception of accounting and control, this could lead to tensions. Teachers may struggle between being in control and permitting learner agency (Schut et al. 2020).
셋째, 맥락이 프로그램 평가의 구현과 잠재적 결과에 매우 중요한 영향을 미친다는 것은 분명하다. 이 합의문의 전문가들은 유럽, 북미, 오스트랄라시아 지역에 근거지를 두고 있었다는 점을 주목해야 한다. 문화적 측면이 평가 신념과 제도에 영향을 미친다는 것은 잘 알려져 있다. 다른 지역의 평가 관행을 바꿔야 한다는 요구(Khan 2018)가 있으며, 다른 지역이나 문화에서의 프로그램 평가에 대한 더 많은 연구가 적극 권장된다.
Third, it is clear that the context is a very significant influence on the implementation and the potential outcomes of programmatic assessment. It is important to note that the experts of this consensus statement were based in European, North-American, and Australasia regions. It is well known that cultural aspects influence assessment beliefs and systems (Wong2011). Calls for a change of assessment practices in other regions are made (Khan2018) and more studies on programmatic assessment in other regions or cultures are highly recommended.
결론들 Conclusions
전문가들과 그들의 프로그램들 사이의 목록은 비록 다양한 접근법과 엄격함에도 불구하고 이러한 원칙들이 사용되고 구현되었음을 보여주었고, 이는 프로그램 평가가 구현 가능한 현실적인 평가 모델임을 시사한다. Variability는 프로그램 규모, 제도 장벽, 법률 제한, 가용 자원, 평가 문해 수준 및 변화에 대한 기본 태도와 같은 다양한 맥락적 요소와 관련이 있었다. 다양한 맥락에서 프로그램 평가가 어떻게 운영되고 있는지에 대한 지식을 공유하면 교육자가 프로그램에서 프로그램 평가의 구현 여정에 대한 현재 또는 미래의 계획을 나타내는 데 도움이 될 수 있다.
An inventory amongst experts and their programmes showed that these principles were used and implemented, albeit with a range of approaches and rigor, suggesting that programmatic assessment is a realistic assessment model that can be implemented. The variability was related to various context factors such as programme size, institutional barriers, legislation restrictions, available resources, level of assessment literacy and underlying attitudes to change. Sharing knowledge of how programmatic assessment is being operationalised in different contexts may help educators in signifying their current or future plans for the implementation journey of programmatic assessment in their programmes.
Med Teach. 2021 Oct;43(10):1139-1148.
doi: 10.1080/0142159X.2021.1957088.Epub 2021 Aug 3.
Ottawa 2020 consensus statement for programmatic assessment - 1. Agreement on the principles
Introduction:In the Ottawa 2018 Consensus framework for good assessment, a set of criteria was presented for systems of assessment. Currently, programmatic assessment is being established in an increasing number of programmes. In this Ottawa 2020 consensus statement for programmatic assessment insights from practice and research are used to define the principles of programmatic assessment.
Methods:For fifteen programmes in health professions education affiliated with members of an expert group (n= 20), an inventory was completed for the perceived components, rationale, and importance of a programmatic assessment design. Input from attendees of a programmatic assessment workshop and symposium at the 2020 Ottawa conference was included. The outcome is discussed in concurrence with current theory and research.
Results and discussion:Twelve principles are presented that are considered as important and recognisable facets of programmatic assessment. Overall these principles were used in the curriculum and assessment design, albeit with a range of approaches and rigor, suggesting that programmatic assessment is an achievable education and assessment model, embedded both in practice and research. Knowledge on and sharing how programmatic assessment is being operationalized may help support educators charting their own implementation journey of programmatic assessment in their respective programmes.
미국 3년제 의과대학의 종합적 역사: 한 학기의 리뷰(Med Educ Online, 2018) Comprehensive history of 3-year and accelerated US medical school programs: a century in review Christine C. Schwartz, Aparna S. Ajjarapu, Chris D. Stamy and Debra A. Schwinn
소개 및 목적 Introduction and purpose
지난 10년간 미국의 의대 교육 지도자들이 혁신적인 교육과정 개혁에 나섰다. 4년 연속 임상 및 생물의학 교육을 통합하고 능동적 학습을 추가하는 것 외에도, 일부 의과대학은 보다 포괄적인 기간, 특히 3년 내에 의학 교육을 제공하는 실험을 시작했다. 이 운동은 특히 미국 역사상 다양한 맥락에서 두 번 시도되고 포기된 적이 있기 때문에 약간의 논란을 불러일으켰다. 그러나 미국의 가속화된 의학 교육에 대한 배경 정보를 연구할 때, 기사는 일반적으로 특정 학교 및/또는 특정 기간에 초점을 맞추고 있기 때문에 3년제 MD 학교에 대한 포괄적인 역사적 검토는 없는 것으로 보인다. 과거로부터 배울 수 있다는 점을 감안하여, 우리 연구단은 지난 세기 동안 미국의 가속화된 allopathic MD 교육 프로그램에 대해 출판된 원고에 대한 철저한 역사적 검토에 착수했다. 우리의 목적은 의과대학이 시간이 지남에 따라 3년제 의학교육을 선택한 후 이를 포기한 이유를 조사하는 것이다.
Over the last decade, US medical school education leaders have embarked on innovative curriculum reform. In addition to integrating clinical and biomedical science teaching over a 4-year continuum and adding active learning, some medical schools have begun experimenting with delivering medical education in a more comprehensive period, specifically 3 years. This movement has created some controversy, particularly since it has been tried and abandoned twice before in US history in various contexts. Yet in researching background information on accelerated medical education in the United States, there appears to be no comprehensive historical review of 3-year MD schools, since articles generally focus on specific schools and/or specific time periods. Given that we can learn from the past, our research group embarked on an exhaustive historical review of manuscripts published about accelerated allopathic MD education programs in the United States over the last century. Our purpose is to examine reasons medical schools had for choosing, and then abandoning, accelerated 3-year medical education over time.
상세 내역 Detailed history
초기 의료 커리큘럼 표준화: 1800년대-1930년대 Initial medical curriculum standardization: 1800s–1930s
1800년대에 미국의 의과대학 대부분은 소규모의 영리for-profit 비-대학 소속이었으며, 고아범위하며 표준화되지 않은 교육과정과 교육목표를 가지고 있었다. 1847년에 미국 의학 협회(AMA)가 설립되었고 후에 AMA 의학 교육 위원회(CME)가 시작되어 1904년에 [표준화된 의과 대학 교육과정]을 제공하였다. 이 새로운 교육과정의 창시자는 1890년대에 [의대생들을 위한 엄격한rigorous 임상 실습]을 도입한 캐나다의 의사인 윌리엄 오슬러 경이었다. 1900년대 초에 아브라함 플렉스너는 카네기 재단으로부터 미국의 의학 교육을 검토하라는 의뢰를 받았다[2]. 오스러가 이끄는 존 홉킨스에서의 교육에 감명받은 플렉스너는 오슬러가 이야기한 집중 임상훈련에 앞서 2년의 과학 교육이 선행돼야 한다고 강조했고, 이는 총 4년의 교육과정으로 이어졌다. During the 1800s the majority of medical schools in the United States were small, for-profit, non-university affiliated, and had wide-ranging non-standardized curricula and educational goals. In 1847, the American Medical Association (AMA) was established and later the AMA Council of Medical Education (CME) was initiated, ultimately providing a standardized medical school curriculum in 1904 [1]. A founding father of this new curriculum was the Canadian physician, Sir William Osler, who introduced rigorous clinical clerkships for medical students in the 1890s. In the early 1900s, Abraham Flexner was commissioned by the Carnegie Foundation to review medical education in the United States [2]. Impressed by the education at John Hopkins, headed by Osler, Flexner emphasized that 2 years of science education should precede Osler’s intensive clinical training, comprising a total of 4 years of medical school .
1910년의 플렉스너 보고서(PDF 원본 문서는 카네기 재단 기록 보관소를 통해 온라인으로 제공됨)는 의학 교육에 대한 결정적 프레임워크를 제공했다는 점에서 혁명적이었으며, 본질적으로는 [통합된consolidated 대학 부속 의과대학]의 물결 속에 [표준화된 모델]을 낳았다. 1934년까지 38개의 의학전문대학원 중 8개를 제외한 모든 대학원이 대학 의과대학과 관련이 있었다. 제1차 세계 대전(1918년) 이후 의료 기술과 역량의 급속한 확장이 일어나 의과대학에 이어 곧바로 의사-교육자에 의해서 감독받는 진료(인턴십)로 이어졌다. 1930년, 의예과 요구사항도 명확해졌는데, 일반 화학, 물리학, 생물학이 각각 2학기씩, 유기 화학이 1학기씩이었다.
The Flexner report of 1910 (pdf of the original document is available online through the Carnegie Foundation archives) was revolutionary in providing a critical framework for medical education, essentially resulting in a model that became standardized in a wave of consolidated university affiliated medical schools. ‘By 1934 all but eight of the 38 approved graduate schools of medicine were related to university medical schools’ [3]. Post WWI (1918), rapid expansion of medical techniques and capabilities occurred, leading to physician-teacher supervised patient care immediately following medical school (internship) [2]. By 1930, premedical science requirements had also become clearly established, including two semesters each of general chemistry, physics, and biology, and one semester of organic chemistry.
3년제 가속 의료 커리큘럼 도입: 1930년대-1940년대 Introduction of the 3-year accelerated medical curriculum: 1930s–1940s
제2차 세계 대전(1939-1945) 동안, 미국은 국내외에서 의사 부족에 직면했고, 그래서 3년제 가속 의과대학 프로그램은 의사들을 더 빨리 교육하기 위한 제안 해결책으로 도입되었다[4]. 버지니아 의과대학은 제2차 세계 대전 동안 3년제 가속 의학 프로그램을 가진 최초의 학교들 중 하나였다. 의사 부족 문제를 해결하라는 압박을 받은 미국 연방정부는 대학과 의과대학에 3년제 가속 의료 프로그램을 더 폭넓게 도입할 것을 촉구했다.
실제로 FSMB은 3년 뒤 졸업하는 학생들이 합법적으로 의료행위를 할 수 있도록 면허를 관리하는 법령을 개정했다.
이러한 새로운 3년 커리큘럼을 적절히 개발하는 데 시간이 거의 주어지지 않았기 때문에, AMA 이사회는 어려움을 극복하는 데 도움을 주기 위해 연락 위원회liaison committee를 구성했다.
또한, AMA의 의료 교육 및 병원 위원회는 가속화된 의료 프로그램의 품질 저하 우려로 인해 높은 의료 교육 수준을 유지하기 위한 검사를 감독할 책임이 있다[6].
During World War II (1939–1945), the nation faced physician shortages at home and abroad, so 3-year accelerated medical school programs were introduced as a proposed solution to educate physicians faster [4]. The Medical College of Virginia was one of the first schools to have a 3-year accelerated MD program during World War II [5]. Pressured with solving physician shortages, the US federal government urged universities and medical colleges to adopt 3-year accelerated medical programs more broadly.
Indeed, the Federation of State Medical Boards revised laws and regulations governing licensure so students graduating in 3 years could legally practice medicine.
Because very little (if any) time was given to appropriately develop these new 3-year curricula, the AMA Board of Trustees organized a liaison committee to aid in overcoming difficulties encountered.
In addition, the AMA’s Council on Medical Education and Hospitals took responsibility to oversee inspections to maintain high standards of medical education due to concerns of deterioration of quality with accelerated medical programs [6].
흥미롭게도, 군의관들이 민간인 신분으로 제대하자, 많은 사람들이 그들의 제한된 지식을 인정하여 '리프레셔' 강좌가 인기를 얻었다. 군에 있는 많은 수의 의사들에게 보낸 설문조사에서 거의 60%(12,534/21,029명)가 긴 재교육 과정(6개월 이상)을 수강하기를 원했고, 이는 졸업후 의학교육(GME) 프로그램을 더 개발하라는 압력으로 이어졌다. 1955-1956년까지 85개의 인가 또는 개발 중인 의과대학 중 63개가 어느 정도 PGME 프로그램에 참여하고 있었다. 1940년대 말에 이르러서는 GME는 더 공식적으로 구체화되었고 병원 기반 전공의 수련는 전문화의 경로가 되었다[7]. 국립보건원(NIH)의 영향력은 정부 지원 연구비를 통해 의사 과학자들의 초기 발전에 도움을 주었다.
Interestingly, once military physicians were discharged into civilian status, many recognized their limited knowledge so ‘refresher’ courses gained attraction. In a survey sent to a large sample of physicians in the military, nearly 60% (12,534/21,029) wanted to take long refresher courses (6-months or more) and this led to pressure to develop more post graduate medical education (GME) programs. ‘By the academic year 1955–1956, 63 of the 85 approved or developing medical schools were engaged to some degree in post-graduate medical education programs’ [3]. By the end of the 1940s, GME materialized more formally and hospital based residencies became the path to specialization [7]. The influence of the National Institutes of Health (NIH), with its government-funded research grants, aided early development of physician scientists.
연방 법률 변경 및 대체 가속 경로 도입: 1950-1971 Federal legislation changes and introduction of alternative accelerated pathways: 1950–1971
1950년에서 1960년 사이에는 이전 10년에 비해 새로운 3년제 프로그램의 확대나 개발이 거의 없었다. 의사 부족에 대한 우려는 1960년대에 계속되었고, 이러한 우려에 대응하여 보건 전문 학교의 확장을 지원하기 위한 연방 법안이 통과되었다. 1963년에는 [보건전문직 교육 지원 프로그램HPEAP]이 시행되어 보건전문직의 지원을 제공하였다. 이 지원에는 보건 전문학교(알로패스 및 골병리 의학, 치의학, 수의학, 검안법, 약학, 족부학, 공중보건 및 간호학)의 신설construction 지원뿐만 아니라 치과, 알로패스 MD 및 골병리 DO 의학과 학생들에게 대출을 제공했다[8]. Between 1950 and 1960, there was little expansion or development of new 3-year programs compared to the previous decade. Mounting concern regarding physician shortages plagued the 1960s and, in response to these concerns, federal legislation was passed to support expansion of health profession schools. In 1963, the Health Professions Education Assistance Program was implemented to provide support for the health professions. This support included construction aid for health profession schools (allopathic and osteopathic medicine, dentistry, veterinary, optometry, pharmacy, podiatry, public health, and nursing) as well as providing loans to students of dentistry, allopathic MD and osteopathic DO medicine [8].
1965년, 이 법률에 대한 새로운 개정이 이루어졌다. 여기에는 다음이 포함되었다. New amendments to this legislation were made in 1965, which included
기본 및 특별 개선 보조금
건설 자금에 대한 새로운 요건(예: 기존의 요구사항보다 더 오랜 기간을 교육용으로 건물을 사용해야 함)
학생 장학금 프로그램에 대한 자금 지원 확대 및 최대 대출액 증가(학생당 연간 최대 장학금 2,500달러 및 학생당 연간 최대 2,500달러),
대출 탕감 프로그램을 만드는 것.
basic and special improvement grants,
new requirements for construction funding (e.g., requiring buildings be used for education for a longer period of time than previously required),
increasing funding for student scholarship programs and increased maximum loan amount ($2,500 maximum scholarship per student/year and $2,500 maximum annual loan per student), and
creating loan forgiveness programs.
[기본 보조금]은 학생 1인당 추가 비용 외에 승인된 각 학교에 일시금을 제공하여 보건전문직 학교의 등록enrollment을 확대하는 것을 목표로 했다[9]. [특별 보조금]은 인가를 촉진하고 특별 프로그램을 수립하였다[8,9].
Basic grants aimed to expand enrollment in health professions schools by providing a lump sum to each approved school in addition to extra money per student [9]. Special grants stimulated accreditation and established special programs [8,9].
보건 전문직 교육 지원 프로그램HPEAP은 [국가 보건 서비스단NHSC]과 같은 프로그램에 대한 자금 지원의 인가를 증가시켰는데, 이는 각 학교에게 자금 지원을 받으려면 부속 병원의 1년차 전공의 중 일차의료 수련을 받는 비율을 높일 것을 요구하였다. 1976년 개정된 보건 전문직 교육 지원법은 소외 지역의 보건 전문가를 위한 임상 훈련 프로그램을 제공한 기존 [지역 보건 교육 센터AHEC]의 capacity을 증가시키기 위한 자금 지원을 승인했다[10]. 이러한 보조금은 성공적으로 학생 등록과 졸업을 증가시켰다[8].
The Health Professions Education Assistance Program increased authorization of funding to programs such as the National Health Service Corps, which required schools to ensure that an increasing percentage of first-year residencies in affiliated hospitals were reserved for primary care training in order to receive capitation support. The 1976 version of the Health Professions Education Assistance Act authorized funding to increase the capacity of existing Area Health Education Centers, which provided clinical training programs for health professionals in underserved areas [10]. These grants successfully increased student enrollment and graduation [8].
[의료 종사자 부족에 대한 우려]로 인해, 1966년과 1971년 사이에 연합 건강 직업 인력 훈련법, 1970년 건강 훈련 개선법, 1971년 간호사 훈련법, 1971년 종합 보건 인력 훈련법 등 많은 다른 연방 법률이 통과되었다[8]. 포괄적 의료 인력 훈련법CHMTA은 의료 종사자 교육에 대한 연방 정부의 헌신을 높이고, 가정의학 의사 수련에 긴급성을 더했으며, 의료 전문직 중 소수자 수를 늘리고, 소외 지역의 부족을 완화한 것으로 유명하다. 이 법률은 1970년대에 3년제 의료 프로그램을 확장하는 데 중요한 역할을 했다[8]. Due to the concern about healthcare worker shortages, a flurry of other additional federal legislations were passed between 1965 and 1971, including the Allied Health Professions Personnel Training Act in 1966, Health Training Improvement Act in 1970, Nurse Training Act in 1971, and Comprehensive Health Manpower Training Act in 1971 [8]. The Comprehensive Health Manpower Training Act was notable for elevating federal commitment to training healthcare workers, giving new urgency to training family practitioners, increasing numbers of minorities in health professions, and alleviating shortages in underserved areas. This piece of legislation was crucial to the expansion of 3-year medical programs in the 1970s [8].
특히 1950년대와 1960년대에 MD 학위를 위한 다른 혁신적인 대안 경로가 도입되었다. 이들 프로그램은 의사 양성에 필요한 전체 시간을 단축하기 위해 마련됐으며, 학부 과정 3년과 의대 3년(BA-MD 프로그램)을 결합한 3+3 프로그램이 포함됐다. 1960년대에는 전국적으로 60명의 학생들이 BA-MD 프로그램에 입학했다. 이 숫자는 1976년까지 매년 약 400명으로 증가했다. 1950년대와 1960년대에 개발된 개선된 고등학교 및 학부 과정 덕분에 의대생들은 과거보다 더 높은 수준의 의과대학 과정을 시작할 수 있었고, 이는 2차 세계대전 당시보다 3년제 의과대학 프로그램의 성취가능성achieable을 더 높여주었다. 실제로 1967년까지 의대 지원자의 40% 이상이 생화학을 일부라도 배우고 왔다. Of note, during the 1950s and 1960s, other innovative alternative pathways to an MD degree were introduced. These programs were designed to shorten the overall time needed to train a physician and included 3 + 3 programs that combined 3 years of undergraduate courses with 3 years of medical school (BA-MD programs). In the 1960s, 60 students were admitted into BA-MD programs nationally. That number grew to around 400 students per year by 1976 [11]. Due to improved high school and undergraduate collegiate programs developed during the 1950s and 1960s, medical students were able to start at a more advanced level than had been possible in the past, which enabled 3-year medical school programs to be more achievable than they had been during the WWII era. Indeed, by 1967 over 40% of medical school applicants had some exposure to biochemistry [12].
BA-MD 프로그램의 학생들은 일반적으로 학업적으로 성공했다. 예를 들어, 보스턴 대학교의 BA-MD 프로그램에 입학한 학생 중 50%는 우등으로 학사 학위를 받았고, 10%는 우등으로 MD 학위를 받았다[13]. 1966년부터 1996년까지 통합 BA-MD 프로그램에서 학생들의 성과 결과 데이터를 검토한 결과, 표준화된 의료 위원회 시험 점수와 임상 성과에 따라 결정되는 역량이 기존의 의대 학생들과 차이가 없었다. 이러한 결과는 학생들이 성공적인 의사가 될 학생을 고등학교에서 바로 선발할 수 있음을 보여주었다[14]. 1960년대는 또한 의과대학 학급 규모가 커지는 추세를 보였다. 예를 들어, 1960년과 1970년 사이에 미네소타 의과대학은 신입생 반을 164명에서 227명으로 늘렸다[15명].
Students in BA-MD programs generally succeeded academically. For example, 50% of students who entered Boston University’s BA-MD program received their BA degree with honors and ≥10% received their MD degree with honors [13]. A review of performance outcome data of students in combined BA-MD programs from 1966 to 1996 showed no difference in competency from traditional medical school students as determined by scores on standardized medical board exams and clinical performance. These results demonstrated that students could be selected from high school to become successful physicians [14]. The 1960s also saw a trend toward larger medical school class sizes. For example, between 1960 and 1970, the University of Minnesota Medical School increased its freshman class from 164 to 227 students [15].
3년제 가속 의과대학 프로그램의 급증: 1970년대와 1980년대 A spike in the number of 3-year accelerated medical school programs: 1970s–1980s
베트남 전쟁 (1955~1975) 기간 동안 의사 부족 문제를 해결하는 것 외에도, 1970년대는 3년 과정의 급속한 개발로 이어진 추가적인 요소가 있었다: 바로 학생 부채를 줄이는 것이다. 이러한 목적은 성공하였으며, 1970년대에 돈을 벌기 위해 일하는 의대생들이 줄어든 것에서 드러난다. 1963년에는 의대 4학년의 45%가 주당 평균 16시간을 일했고, 1971년에는 더 적은 수의 4학년(34%)이 주당 평균 14시간을 일했으며, 1974년에는 4학년 중 26%만이 주당 평균 10시간을 일했다. [16] [학생 부채 감소, 의사 부족 문제 해결, 정부 재정적 인센티브에 관한 국가적 논의]는 1970년부터 1973년까지 3년제 프로그램에 등록하는 학생 수 증가에 주된 기여요인으로 보고되었다. 실제로, 이 기간 동안 3년제 가속 의학 프로그램에 등록하는 학생은 1970-1971학년의 671명에서 1973-1974년 2,597명으로 387% 증가했다. 3년제 의료진 등록이 가장 크게 증가한 것은 1971년 종합보건인력양성법CHMTA의 시행 이후였으며, 1972-1973년에 1080명이던 의과대학 입학이 다음 해에는 2,273명으로 증가했다. 1971년 포괄적 보건 인력 훈련법에 따라 연방 역량 기금은 3년 내에 졸업하는 학생 1인당 2,000달러의 보너스를 제공했다[19]. 이러한 상황 속에, 1973년에 이르자 모든 미국 의과대학의 약 1/3(n = 33)이 졸업에 3년짜리 MD 경로를 제공했다[9,20]. In addition to addressing physician shortages during the Vietnam War era (1955–1975), much like during WWII, the 1970s had an additional factor that led to the rapid development of 3-year programs: the desire to reduce student debt. A successful push to reduce student debt may be revealed in decreased numbers of medical students working for pay in the 1970s. ‘In 1963, 45% of medical school seniors worked an average of 16 hours a week; in 1971, fewer (34%) of seniors worked an average of 14 hours a week; and, by 1974, only 26% of seniors worked an average of 10 hours per week’ [16]. National discussion regarding reducing student debt, the need to address physician shortages, and government financial incentives were reported as major contributors to increased enrollment in 3-year programs from 1970 to 1973 [17]. Indeed, during this time, enrollment in 3-year accelerated MD programs increased 387%, from 671 students in the 1970–1971 academic year to 2,597 in 1973–1974 [8] (out of a total of 15,000 medical graduates per year [18]). The greatest increase in 3-year MD enrollment was seen after implementation of the 1971 Comprehensive Health Manpower Training Act, with first year medical school enrollment increasing from 1,080 in 1972–1973 to 2,273 during the subsequent academic year [8]. Under the Comprehensive Health Manpower Training Act of 1971, federal capitation funding provided a bonus of $2000 per student graduating in 3 years [19]. Given this context, by 1973 approximately one-third (n = 33) of all US medical schools offered a 3-year MD path to graduation [9,20].
1970년대 가속 의료 프로그램 개발에 대한 긍정적인 태도와 관심은 3년 프로그램을 포함한 전반적인 의과 대학 등록의 증가로 이어졌고, 다른 가속 경로를 제공하는 다수의 학교가 확장되었다. 가속화된 프로그램의 확장을 촉진하는 학생들에게도 장점이 있었다. 이에 유의해야 할 점은 1970년부터 1975년까지 의과대학 입학 경쟁률이 높아졌다는 사실이다,
1970년에는 11,350명 모집에 25,000명이 지원했다
1975년에는 15,000명 모집에 43,000명이 지원했으며, 이로 인해 대학 입학률은 45%에서 35%로 떨어졌다[11].
Positive attitudes and interest in developing accelerated medical programs during the 1970s resulted in increased overall medical school enrollment, including 3-year programs, and expansion in a number of schools offering other accelerated pathways. There were advantages for students that facilitated expansion of accelerated programs as well. In this regard, it should be noted that rising competition for admission into medical school occurred from 1970 to 1975;
in 1970, there were 25,000 applications for 11,350 openings.
By 1975, there were 43,000 applications for 15,000 places, which caused the percent of matriculates to fall from 45% to 35% (1970 to 1975, respectively) [11].
학생들은 가속화된 MD 프로그램에 대한 조기 입학이 광범위한 일반 입학 풀 내에서 경쟁을 피하기 위한 방법일 수 있다고 판단했을 수 있다[11]. 우수한 지원자들이 새로운 3년제 MD 프로그램에 지원하였고, 이러한 학생들은 전체 기관의 명성에 중요한 요소인, [peers와 비교한 입학 지표와 성과를 향상]시켰기 때문에 의과대학에도 도움이 되었다[11]. 흥미롭게도 3년제 MD 프로그램에 대한 교수진의 태도는 전문 분야에 따라 다양했습니다. 오하이오 주립 의과대학이 1970년에 4년제 프로그램에서 3년제 MD 프로그램으로 전환했을 때, 교수 태도에 대한 연구는 가정의학과 예방의학과 교수진이 3년제 MD 프로그램에 대해 가장 긍정적인 것으로 결정했다[20].
Students may have reasoned that early admission to accelerated MD programs might be a way of avoiding increasing competition within the broader general admission pool [11]. This was also beneficial for medical schools since outstanding candidates were attracted into new 3-year MD programs, and these students in turn boosted admission metrics and performance of their peers, an important component of overall institutional prestige [11]. Faculty attitudes toward 3-year MD programs varied, interestingly, by specialty. When Ohio State University School of Medicine transitioned from a 4-year program to a 3-year MD program in 1970, a study of faculty attitudes determined that family medicine and preventive medicine faculty were most positive toward 3-year MD programs [20].
3년 가속 MD 프로그램 중단: 1970년대 후반-80년대 Discontinuation of 3-year accelerated MD programs: late 1970s–1980s
1970년대에 도입되어 개발된 3년제 가속 의과대학 프로그램 중 다수는 그렇게 오래 유지되지 못했다. 학업 스트레스가 높았고 가속 MD 프로그램을 수강하는 학생의 약 25%가 자발적으로 교육을 1~2년 연장했다[9]. 또한, 학생과 교직원은 자료의 압축에 대한 압박을 언급했다. 프로그램을 마친 학생들은 '지쳤다'고 말했으며, 교직원들은 끊임없이 확장되는 의학 지식을 더 짧은 기간 안에 가르쳐야 한다는 것에 불만을 느꼈다[9]. 그 밖에 3년제 교육과정에선 가정의학과 농촌의학과 노인학 순환학 등의 과소대표underrepresentation, 심화윤리 및 약물남용 교육 부족 등이 지적됐다. 또한 최종적으로 레지던트 추천서를 준비할 교수진에게 제한적으로 노출되었고, 학생들이 레지던트 프로그램을 인터뷰할 시간이 거의 없었으며, 방학 시간도 최소화되었다[17]. 아마도 가장 중요한 것은 가속화된 MD 프로그램이 순 의사 양성net physician output을 증가시키지 않았다는 것이다. 이는 3년제 프로그램을 시작하는 주요 목표 중 하나였다[9]. 학급 규모의 증가 없이, 3년제 의료 프로그램은 3년제 첫 번째 학급이 4년제 학생들과 함께 졸업할 때 의사들의 무리를 만들었다. 그 후, 졸업하는 학생들의 순수는 더 이상 증가하지 않고 평형 상태로 유지되었다.
Many of the 3-year accelerated medical school programs introduced and developed in the 1970s did not stay open long-term. Academic stress was high and about 25% of students in accelerated MD programs voluntarily extended their education by 1 or 2 years [9]. Additionally, students and faculty cited feeling pressured by compression of the material; students completing programs stated that they felt ‘exhausted,’ and faculty felt dissatisfied with trying to teach ever-expanding medical knowledge into a shortened timeframe [9]. Other issues cited with 3-year curricula included under-representation of family medicine, rural medicine, and gerontology rotations, as well as lack of in-depth ethics and substance abuse training. In addition, there was limited exposure to faculty members who would ultimately prepare residency recommendation letters, little time for students to interview with residency programs, and minimal vacation time [17]. Perhaps most importantly, accelerated MD programs did not increase net physician output, which was one of the main goals of starting such programs [9]. Without an increase in class size, 3-year medical programs created a bolus of physicians when the first class of 3-year students graduated along with fourth year students. Thereafter, the net number of students graduating remained stable (reached steady state), without further increase.
주의할 점은 3년제 MD 교육과정의 페다고지는 distinct하며, 따라서 단순한 4년제 교육과정의 압축을 넘어서야 한다는 것이다. 이것은 때때로 1970년대에 어렵게 배워졌다. 예를 들어, 애리조나 대학교는 1972년에 4년제에서 3년제 MD 프로그램으로 전환되었다가 1977년에 다시 4년제 프로그램으로 전환되었다. 애리조나는 처음에는 72주의 기초과학(임상 전) 자료를 56주로 압축한 뒤 2교시 및 3년 MD 커리큘럼에서 64주로 늘렸다. 애리조나 의대생들은 필요하다면 4년 또는 그 이상으로 그들의 교육을 연장할 수 있는 선택권이 있었다. 애리조나에서 처음 3개 반의 학생 중 1/3은 재학기간을 3년 이상으로 연장했으며, 이 옵션을 선택한 학생은 [의학 전공분야를 탐구]하는 데 더 많은 시간을 선택하는 대신, 대부분의 추가 시간을 [기초 과학 학습 속도를 늦추는 데] 사용했다[17]. 안타깝게도 원래 예정된 3년 기간에 끝마치지 못한 학생들은 종종 '약하거나 부족하다'는 오명을 쓰게 되었고, 그렇게 교수들에게 인식되었다[9,18].
It is important to note that pedagogy for a 3-year MD curriculum is distinct and therefore should go beyond compression of a school’s 4-year curriculum. This was sometimes learned the hard way in the 1970s. As an example, the University of Arizona went from a 4-year to a 3-year MD program in 1972, and then converted back to a 4-year program in 1977. Arizona had compressed 72 weeks of basic science (pre-clinical) material into 56 weeks initially, and then increased it to 64 weeks in the second class and subsequent classes in their 3-year MD curricula. Medical students at Arizona had the option to extend their schooling to four or more years if needed. One-third of students in the first three classes at Arizona extended their time beyond 3 years, and students who took this option used the majority of additional time to slow down the pace of basic science learning rather than choosing more time to explore medical specialties [17]. Unfortunately, students who extended their time beyond the originally committed 3 years were often stigmatized and perceived by faculty as ‘weak or deficient’ [9,18].
다른 학교들도 MD 커리큘럼이 압축된 것에 부담을 느꼈다. 오하이오 주립 대학교에서는 3년제 교육과정에 참여하는 교수진의 평균 만족도 점수가 100점 만점에 60.5점(34~93점)이었으며, 교수진의 50%가 4년제 MD 프로그램으로 복귀하는 것을 선호했다[20점]. USMLE 점수와 레지던트 일치 결과에 따르면 3년제와 4년제 학생들 간의 성과에 큰 차이가 없다는 연구 결과가 나왔지만, 1970년대 말까지 대부분의 3년제 MD 프로그램은 4년제 커리큘럼을 선호하여 중단되었다. 실제로 1973-1974 학년 이후, 이러한 프로그램에 대한 등록이 지속적으로 감소하였고, 1974-1975년에는 2,434명이던 3년제 MD 학생이 1978-1979년에는 1,455명으로 감소했다[23]. 3년 MD 프로그램을 종료하게 된 전반적인 이유에는 [재정적 인센티브를 제거한 연방 기금 중단, 의사 부족의 감소, 가속화된 기간에 대한 전반적인 불만족] 등이 포함되었다[22]. Other schools felt pressure from their compressed MD curriculum as well. At Ohio State, the mean satisfaction score of faculty participating in the 3-year curriculum was 60.5 out of 100 (range of 34–93), with 50% of faculty favored returning to a 4-year MD program [20]. Although studies showed no major difference in performance between 3-year and 4-year students, as measured by USMLE scores and residency match results, by the end of the 1970s most 3-year MD programs were discontinued in favor of 4-year curricula [13,17,21,22]. Indeed, after the 1973–1974 academic year, a persistent decline in enrollment in these programs occurred, with 2,434 3-year MD students in 1974–1975 declining to 1,455 in 1978–1979 [23]. Overall reasons given for ending 3-year MD programs included discontinuation of federal funding that eliminated financial incentives, declining physician shortages, and overall dissatisfaction with the accelerated time frame [22].
3 + 3 MD 잔류 프로그램의 성장과 함께 의사 훈련 기간 해결: 1980년대-2000년대 Addressing the length of physician training with growth of 3 + 3 MD-residency programs: 1980s–2000s
1970년대 말까지 대부분의 3년 MD 프로그램이 해체되었지만, 이후 수십 년 동안 MD-전공의 통합 프로그램은 의사의 전반적인 훈련 기간을 줄이기 위한 시도로 이루어졌다. 1975년부터 2000년까지 미국 전공의의 수는 37,140명에서 98,806명으로 두 배 이상 증가했다. 4년제 커리큘럼이 있는 일부 의과대학은 학생들이 로테이션 인턴십을 이수하면 4학년을 대체한 것으로 갈음하는 것waive the fourth year을 허용하기 시작했다[17]. 1980년대와 1990년대에 25개의 미국 의과대학은 내과 3 + 3에 있는 여러 프로그램 외에도 가정의학과 3 + 3 (MD 잔류) 프로그램을 가지고 있었다[21]. 흥미로운 점은 가정의학과 3+3 졸업생이 기존(4+3) 졸업자보다 치프 레지던트로 선택될 확률이 높았다. 그러나 이러한 3+3 프로그램 대부분은 주로 GME 인증 문제로 인해 종료되었다[22]. Although there was dissolution of most 3-year MD programs by the end of the 1970s, over the next few decades, growth occurred in combined MD-residency programs in an attempt to reduce the overall length of training of a physician. From 1975 to 2000, the number of residents in the United States had more than doubled, from 37,140 to 98,806 [18]. Some medical schools with 4-year curricula began allowing students to waive the fourth year if they completed a rotating internship [17]. In the 1980s and 1990s, 25 US medical schools had family medicine 3 + 3 (MD-residency) programs in addition to several in internal medicine 3 + 3 [21]. Interestingly, family medicine 3 + 3 graduates were more likely to be chosen as chief residents than traditional (4 + 3) graduates. Most of these 3 + 3 programs ended, however, primarily due to GME accreditation issues [22].
3년제 가속 의대 프로그램 현황: 2010-2017 Current state of 3-year accelerated medical school programs: 2010–2017
세기의 전환과 함께 의과대학 교과과정에서는 거대한 개혁이 일어났다. 2005년 이후 미국 의과대학의 75%가 능동적 학습과 임상 및 생물의학 과학의 통합 강화를 포함한 혁신적인 교육학을 시작했다[2]. 이는 21세기에 의사가 성공하기 위해서는 성인 학습을 최적화하고 업데이트된 의료 지식을 통합하는 개정된 커리큘럼이 필요하다는 일반적인 인식을 보여준다. 교육 개혁의 일환으로 2010년 이후, 3년제 MD 프로그램이 9개의 allopathic 의과대학에서 다시 등장했으며, 이들 학교의 80%는 3년제 학생들의 1차 진료에 초점을 맞추고 있다[21]. 레지던트 면접을 위해 여행하는 데 사용할 수 있는 3년 MD 커리큘럼의 제한된 시간을 고려할 때, 거의 모든 프로그램은 학생들에게 보장된 지역 레지던트 자리를 제공한다[21,24,25]. With the turn of the century, vast reforms have occurred in medical school curricula. Since 2005, 75% of US medical schools have initiated innovative pedagogy, including active learning and enhanced integration of clinical and biomedical sciences [2]. This shows general recognition that revised curricula that optimize adult learning and incorporate updated medical knowledge are needed for physicians to succeed in the twenty-first century. As part of curricular reform, since 2010, 3-year MD programs have re-emerged in nine allopathic medical schools, with 80% of these schools focusing on primary care for their 3-year students [21]. Given the limited time available in 3-year MD curricula to travel for residency interviews, almost all of these programs offer their students guaranteed local residency positions [21,24,25].
과거 추세에 대한 요약 Summary of historical trends
그림 1은 지난 세기 동안 미국에서 3년 MD 프로그램의 생성 및 해체에 영향을 미친 역사적 사건을 요약한 것입니다. 그림 2는 1930년부터 2017년까지의 총 의대생의 증가를 3년 커리큘럼으로 인가된 알로패스 의대 비율과 병치하여 보여준다[9,12,20,22–38]. 그림 2에서 볼 수 있듯이, 3년제 의과대학 중 가장 많은 비율이 2차 세계대전(90%)에 발생했고, 그 다음이 1970년대(40%)였다. 가장 최근에 3년제 교육과정을 갖춘 의과대학이 부활한 것은 1940년대와 1970년대에 급증했던 것에 비하면 훨씬 덜 두드러진다.
Figure 1summarizes historical events impacting creation and dissolution of 3-year MD programs in the United States over the last century.Figure 2documents the rise in total medical students from 1930 to 2017 juxtaposed against percentages of accredited allopathic medical schools with 3-year curriculum over the same period [9,12,20,22–38]. As can be seen inFigure 2, the greatest percentage of medical schools with a 3-year program occurred in the WWII era (≈90%) followed by the 1970s (≈40%). The most recent resurgence of medical schools with 3-year curricula is far less pronounced compared to spikes in the 1940s and 1970s.
시간에 따른 새로운 테마 Emerging themes across time
가속 3년 의료 교육을 검토할 때 지난 세기에 걸쳐 두 가지 주요 주제(학습 교훈)가 나타난다.
첫 번째 주제는 3년제 의료 교육의 재정적 이익(예: 학생 부채 감소 및 의료 교육비 절감)이 현실에서 원래 생각했던 것만큼 간단하지 않고 기관의 더 넓은 맥락에 의존한다는 것이다.
두 번째(교육학적) 주제는 4년제 의료 교육에 대한 접근법과 구별되는 3년제 의료 교육을 위한 새롭고, 통합적이며, 능률적인 커리큘럼 개발의 중요성이다.
Two major themes (learning lessons) emerge across the last century when examining accelerated 3-year medical education.
The first theme is that financial benefit of 3-year medical education (e.g., decreased student debt and lower medical education costs) is an ideal that is not as straightforward in reality as originally conceived and depends on broader context of institutions.
A second (pedagogical) theme is the importance of developing new, integrated, and streamlined curricula for 3-year medical education, distinct from the approach to 4-year medical education.
가속/3년제 의과대학의 재정적 이점 및 비용 Financial advantages and costs of accelerated/3-year medical schools
의대생 부채(학부와 의전원을 합친 것)는 여전히 미국에서 중요한 문제로 남아 있다. 1990년부터 2003년까지 의과대학 학비와 등록금은 83%에서 167%까지 인상되었다[35]. 다만 상황이 복잡하기 때문에 3년제 MD프로그램이 단순히 1년치 등록금만 없앤다고 해서 의대 부채를 줄인다고 보는 것은 잘못됐다는 점에 유의해야 한다. 실제로 일부 3년제 의과대학은 4년제 학교와 동일한 등록금을 부과하고 있다[28,36]. 이는 현재 미국 LCME가 MD 학위를 취득하기 위해서는 130주가 필요하기 때문인데, 이는 여름 동안 수업을 추가하고 방학 및 레지던트 면접 시간을 모두 줄임으로써 3년 프로그램에서 달성된다[22,37]. 제도적 관점에서, 그러한 구조조정은 종종 새로운 교사와 다른 비용을 필요로 한다. 그러나 현재 많은 3년제 프로그램이 레지던트 자리를 보장하기 때문에 일부 혜택이 생깁니다. 이를 통해 학생들은 4학년 때 들어가는 면접 비용을 $1000–$5,000 절감할 수 있습니다[39]. Medical student debt (combined undergraduate and medical school) remains an important problem in the United States. From 1990 to 2003, medical school tuition and fees grew between 83% and 167% [35]. It should be noted, however, that it is erroneous to assume that 3-year MD programs decrease medical school debt by simply eliminating 1 year of tuition since the situation is more complex. In fact, some 3-year medical schools charge the same tuition as 4-year schools [28,36]. This is because currently the US LCME requires 130 weeks for a MD degree, which is achieved in 3-year programs by adding classes during summers and by decreasing both vacation time and residency interview time [22,37]. From an institutional perspective, such restructuring often requires a new set of teachers and other expenses. Some benefits do accrue, however, since many current 3-year programs today guarantee residency positions; this can lead to immediate $1000–$5000 savings to students in eliminating senior year interview expense [39].
3년제 MD 프로그램 수료자는 기존 의대생에 비해 1년 일찍 취업해 경제적 혜택을 받는다. 이 추가 연도는 추가적인 1년의 실습과 그에 따른 임상 수입을 허용하여 학자금 대출 상환을 용이하게 할 수 있다. 오늘날 노동력에서 얻은 1년의 재정적 혜택은 일반 내과 전문의의 경우 16만 달러, 내과 하위 전문의의 경우 23만 달러인 것으로 보고되었다[35]. 이런 현실은 의학교육의 큰 경제적 부담을 줄이는 가장 효과적인 재정수단이 의학교육비 자체를 줄이는 데 있지 않고, 인력진입을 앞당겨 대출금을 더 빨리 갚을 수 있도록 하는 데 있을 수 있다는 지적이다. 가속도가 학부, 의과대학, 레지던트 단계에서 일어나든 마찬가지일 것이다. Graduates of 3-year MD programsdoacquire financial benefit by entering the workforce 1 year early compared to traditional medical students. This extra year allows an additional year of practice and resultant clinical income that could facilitate repayment of student loans. Financial benefit of 1 year gained in the workforce today has been reported to be $160,000 for general internists and $230,000 for internal medicine subspecialists [35]. This reality points out that the most effective financial means for decreasing the large financial burden of medical education may not lie in reducing the price of medical educationper se, but rather by allowing earlier entry into the workforce so loans can be paid back sooner. This would be true whether acceleration occurs at the undergraduate, medical school, or residency level.
독특한 교육학으로서의 3년제 의과대학 3-year medical school as a distinct pedagogy
이렇게 많은 세부 자료를 강의/학습하기가 어렵기 때문에, 표준 4년제 교육과정을 3년으로 압축하면서 교직원과 학생 불만이 크게 발생하는 것도 시간이 흐르면서 나타나는 주제다. 이는 가속화된 의학교육 프로그램의 성공을 달성하기 위해 새롭고 능률적이며 통합된 커리큘럼을 만드는 것이 중요함을 시사한다. 현재 미국의 의학 교육 커리큘럼 개혁 노력과 성인 학습에 대한 효과적인 접근법에 대한 새로운 이해를 고려할 때, 이와 관련하여 선제적 개입이 처음으로 가능하다. 이것은 3년 MD 프로그램으로의 전환을 고려하는 리더들에게 중요한 교육학 수업이자 (필요한 투자로 인한) 현실 점검이다. Another theme present over time is that strong faculty and student dissatisfaction occurs with compression of a standard 4-year curriculum into 3 years since it is difficult to teach/learn such a large body of detailed material. This suggests that creating new, streamlined, and integrated curricula will be important for achieving success in accelerated medical education programs. Given current medical education curriculum reform efforts in the United States, and new understanding of effective approaches to adult learning, for the first timeproactiveintervention is possible in this regard. This is an important pedagogy lesson, and reality check (due to investments required), for leaders considering moving toward 3-year MD programs.
하나의 미래관 One view of the future
앞으로 가속화된 3년 MD 프로그램의 주요(실현되지 않은) 이점은 학생마다 개별화된 훈련을 제공할 기회를 제공함으로써 현재 4년 커리큘럼 내에서 유연성을 제공하는 데 있을 수 있다. 모든 형태의 교육을 뒷받침하는 기술의 폭발로 인해, 동기식 및 비동기식 학습이 가능해졌으며, 이것은 이러한 프로그램에서 학생과 교수진 모두에게 향상된 만족과 유연성을 가져올 수 있다. 실제로, 3년에 걸쳐 기초 과학 및 임상 훈련을 이수하면 학생들은 더 오래된 (2 + 2) 4년 커리큘럼 내에서 불가능했던 연구, 이중 학위, 리더십 훈련 및 팀 기반 종적 경험과 같은 학술 의료 센터에서 이용할 수 있는 다른 풍부한 기회를 활용할 수 있다. 임상의학에만 집중하는 것을 선호하는 학생들에게는 1년 일찍 취업할 수 있다는 것이 대출 상환에 도움이 되고 따라서 중요한 경제적 이익을 얻을 수 있기 때문에 잠재적인 장점이다. Moving forward, a major (unrealized) advantage of accelerated 3-year MD programs may be in providing flexibility within current 4-year curricula by offering an opportunity to individualize training for a given student. With an explosion of technology undergirding all forms of education, synchronous and non-synchronous learning is now possible and this may result in enhanced satisfaction and flexibility for both students and faculty in these programs. Indeed, completing basic science and clinical training over 3 years may enable students to take advantage of other rich opportunities available in academic medical centers such as research, dual degrees, leadership training, and longitudinal team-based experiences otherwise not possible within older, more traditional (2 + 2) 4-year curricula. For students who prefer to focus solely on clinical medicine, ability to enter the work force 1 year early is a potential advantage since it helps with loan repayment and therefore can have important financial benefit.
의료 교육을 개별화할 때의 단점(예: 주어진 의과대학 내에서 두 개의 병렬 3년 및 4년 MD 커리큘럼이 나란히 있는 경우)은 주로 추가 비용에 따라 발생한다. 이는 특히 소규모 그룹 학습에 이미 훨씬 더 많은 교수진의 참여가 필요한 시대에 순추가 등록금 없이 필요한 교수 자원이 증가했기 때문이다. 과거에 이러한 경로를 시행했을 때처럼 정부 보조금이 없다면, 이러한 미래관은 오늘날 재정적으로 점점 더 제한된 환경에서 지속되기 어려울 수 있다. 하지만, 교육학적인 관점에서, 진정으로 개인화된 교육을 상상하는 것은 매력적입니다.
Disadvantages in individualizing medical education (e.g., having two parallel 3-year and 4-year MD curricula in tandem within a given medical school), revolves predominantly around added cost. This is due to increased faculty resources needed without net added tuition, particularly in an era where modern innovations in medical school curricula already require significantly more faculty involvement for small group learning. In the absence of government subsidies, as occurred in the past when this pathway was implemented, such a view of the future may be difficult to sustain in today’s increasingly fiscally limited environment. However, from a pedagogical perspective, it is enticing to envision truly individualized education.
결론 Conclusion
미국의 의학 교육 역사를 통틀어 3년제 MD 프로그램(제2차 세계 대전, 1970년대, 현재)의 시행과 관심의 물결이 세 차례 있었다. 성장기마다 나타나는 공통적인 요인에는 [의사 부족 문제를 해결]에 대한 우려가 포함된다. 역사적으로, 의사 부족을 진정으로 해결하기 위해서는, 3년제 또는 4년제 의과대학의 [학년 당 학급 규모를 늘려야 한다]는 사실이 재발하고 있다. 가속화된 MD 커리큘럼의 성장에 박차를 가하는 다른 영향으로는 정부 자금과 1970년대 이후 의료 교육 비용 절감에 대한 관심이 있다. 위에서 언급한 바와 같이, 가속화된 의료 프로그램의 재정적 인센티브는 주로 학생들이 1년 일찍 직장에 들어갈 수 있는 능력에 있으며, 이는 여러 다른 교육 시점을 단축함으로써 효과적으로 달성될 수 있다. 3년 MD 프로그램 중단의 이유는 [의사 부족에 대한 우려가 감소하게 되면] 외부(정부/주) 자금 지원이 줄어드는 것과 가속화된 프로그램에 참여하는 [의대생과 교수진이 표출한 불만]이었다. 이러한 우려에도 불구하고 3년제 MD교육 수료생은 4년제 졸업생과 동등한 국가고시 성적을 거두고 있다.
Throughout the history of medical education in the United States, there have been three waves of interest and implementation of 3-year MD programs (WWII era, 1970s, and current). Common factors driving every period of growth include concern over addressing physician shortages. Historically, a reoccurring finding is that to truly address physician shortages, increasing class size of 3-year or 4-year medical school is needed. Other influences spurring growth of accelerated MD curricula have been governmental funding and, since the 1970s, an interest in reducing the cost of medical education. As stated above, financial incentive from accelerated medical programs lies predominantly in the ability of students to enter the workforce 1 year early, which can be effectively achieved by shortening several different educational time points. Reasons given for discontinuation of 3-year MD programs were elimination of external (government/state) funding, which waned in periods of declining concern over physician shortages, and dissatisfaction expressed by medical students and faculty participating in accelerated programs. In spite of these concerns, 3-year MD education graduates perform comparably with 4-year graduates on national examination scores.
강의에 사용되는 기술의 확장과 의과대학 수준의 수업들이 점차적으로 대학 학부 과정으로 이전되는 것을 고려하면, 과거에 비해 짧은 기간의 의사 양성이 오늘날 더 실현 가능할지도 모른다. 연구 등 대안적인 과정을 이수하고 싶은 학생들에게는 3년제 MD 프로그램이 기존 4년제 커리큘럼에서는 접할 수 없는 개별화를 위한 틀도 제공할 수 있다. 하지만, 지난 날을 살펴보면 이 또한 주의를 필요로 한다. 3년제 교육과정의 표준화가 어렵고 장기적인 지속 가능한 모델을 추구한다면 이러한 교육학을 조직하는 데 집중된 시간과 노력이 할당되어야 한다. 과거 3년 MD 프로그램에서 접한 맥락과 이슈를 검토함으로써 앞으로 새로운 프로그램이 가장 사려 깊고 성공적으로 설계될 수 있기를 바라는 것이 저자의 바람이다.
Given expansion of technology used in teaching, and gradual transfer of medical school level classes to university undergraduate coursework, training physicians in a shortened duration may be more feasible nowadays compared to the past. For students who would like to complete alternative coursework such as research, 3-year MD programs can also provide a framework for individualization not accessible in traditional 4-year curricula. However, history also suggests caution. Standardizing 3-year curriculum is difficult and focused time and effort must be allotted to organizing such pedagogy if a long-term sustainable model is sought. By reviewing the context and issues encountered with 3-year MD programs in the past, it is the author’s hope that new programs can be designed in the most thoughtful and successful manner possible going forward.
Med Educ Online. 2018 Dec;23(1):1530557.
doi: 10.1080/10872981.2018.1530557.
Comprehensive history of 3-year and accelerated US medical school programs: a century in review
Within the context of major medical education curricular reform ongoing in the United States, a subset of schools has re-initiated accelerated (3-year) medical education. It would be helpful for education leaders to pause and consider historical reasons such accelerated medical schools were started, and then abandoned, over the last century to proactively address important issues. As no comprehensive historical review of 3-year medical education exists, we examined all articles published on this topic since 1900. In general, US medical educational curricula began standardizing into 4-year programs in the early 1900s through contributions from William Osler, Abraham Flexner, and establishment of the American Medical Association (AMA) Council of Medical Education (CME). During WWII (1939-1945), accelerated 3-year medical school programs were initiated as a novel approach to address physician shortages; government incentives were used to boost the number of 3-year medical schools along with changed laws aiding licensure for graduates. However, this quick solution generated questions regarding physician competency, resulting in rallying cries for oversight of 3-year programs. Expansion of 3-year MD programs slowed from 1950s to 1960s until federal legislation was passed between the 1960s and the 1970s to support training healthcare workers. With renewed government financial incentives and stated desire to increase physician numbers and reduce student debt, a second rapid expansion of 3-year medical programs occurred in the 1970s. Later that decade, a second decline occurred in these programs, reportedly due to discontinuation of government funding, declining physician shortage, and dissatisfaction expressed by students and faculty. The current wave of 3-year MD programs, beginning in 2010, represents a 'third wave' for these programs. In this article, we identify common societal and pedagogical themes from historical experiences with accelerated medical education. These findings should provide today's medical education leaders a historical context from which to design and optimize accelerated medical education curricula.
Keywords:3-year medical school; Review; US; accelerated; curriculum.
질적연구의 일반화가능성: 오해, 기회, 권고(Qualitative Research in Sport, Exercise and Health, 2018) Generalizability in qualitative research: misunderstandings, opportunities and recommendations for the sport and exercise sciences Brett Smith
일반화는 일반적으로 정량적 연구와 관련하여 논의되는 용어이다. 일반화 가능성은 또한 양적 연구를 긍정적인 방식으로 정의하기 위해 종종 사용된다. 정량적 방법을 적절히 적용하면 더 넓은 모집단이나 다른 맥락에 적용할 수 있는 대표적인 참여자 표본으로부터 신뢰할 수 있는 결과를 얻을 수 있다고 한다. 그런 점에서 좋은 정량적 연구의 결과는 유용하고 유익하다고 볼 수 있다. 예를 들어, 보건 정책 입안자들은 정량적 연구의 결과를 일반 대중들에게 자신 있게 적용하여 희망적으로 많은 대중들이 혜택을 볼 수 있다. Generalisation is a term ordinarily discussed in relation to quantitative research. Generalizability is also often used to define quantitative research in positive ways. It is said that when properly applied quantitative methods can produce reliable results from a representative sample of participants that can be applied to a wider population or different contexts. Given that, the results from good quantitative research can be viewed as useful and beneficial. For instance, health policy-makers can confidently apply results from quantitative studies to the general population so that hopefully numerous publics can benefit.
일부 연구자들은 생산적으로 질적 연구의 일반화 가능성에 더 많은 주의를 요구한다(예: Darnell et al. 2017). 때때로 문헌 저자들은 질적 연구가 일반화될 수 있는 방법에 대해서도 주목한다(예: Black and Holt 2009, Allen-Collinson and Hockey 2010, Hayhurst 2016, Horrocks et al. 2016, Hurley et al. 2016, Shirazipour et al. 2017, Sparkes 및 Brighton 2017). some researchers productively call for more attention to generalizability in qualitative research (e.g. Darnellet al.2017). Occasionally in the literature authors also note how their qualitative study might be generalizable (e.g. Black and Holt2009, Allen-Collinson and Hockey2010, Hayhurst2016, Horrockset al.2016, Kuklicket al.2016, Hurleyet al.2017, Shirazipouret al.2017, Sparkes and Brighton2017).
일반화 가능성을 간략하게 언급한 다양한 저널 기사에도 불구하고 스포츠 및 운동 과학 저널의 질적 연구와 관련하여 일반화와 그 의미 및 사용에 대한 자세한 논의가 부족한 것으로 남아 있다. 따라서 이 글의 목적은 질적 연구와 관련하여 일반화에 대해 자세히 논의함으로써 그 차이를 메우기 위함입니다. Notwithstanding the various journal articles that mention generalizability briefly, it remains that there is a lack of detailed discussion on generalisation and its meaning and use in relation to qualitative research in sport and exercise science journals. The purpose of this article therefore is to fill that gap by discussing generalisation in detail in relation to qualitative research.
오해 Misunderstandings
문헌을 면밀히 살펴보면 질적 기사의 저자들이 다양한 방식으로 일반화 가능성에 관여한다는 것을 알 수 있을 것이다. 언급한 바와 같이, 많은 기사들은 일반화에 대해 전혀 언급하지 않는 반면, 다른 기사들은 질적 연구가 일반화될 수 있다고 간략히 언급하고 있다. 그러한 연구자들은 일반화 가능성을 질적 연구의 한계로 명명하는 것이 옳다고 생각할 수 있다. 하지만 이것이 정말 한계일까요? 질적 연구가 항상 일반화 가능성이 부족하다는 것과 기사에서 그것을 제안하는 것이 오해라는 것은 근거 없는 믿음인가요? A close inspection of the literature will reveal that authors of qualitative articles engage with generalizability in different ways. As noted, many articles do not mention generalisation at all, whilst others briefly note that their qualitative study might be generalizable. Such researchers might assume it is correct to name generalizability as a limitation of their qualitative research. But is it really a limitation? Is it a myth that qualitative research always lacks generalizability and a misunderstanding to suggest that in an article?
질적 연구는 한 가지 특정 유형의 일반화 가능성, 즉 통계적 확률론적 일반화 가능성을 통해서만 이해될 경우 일반화 가능성이 부족하다. '통계적 일반화 모델(statistical generalizationability model)'은 일반적으로 통계 샘플링 절차를 통해 추구되며 다음과 같은 두 가지 기능을 갖는다.
(1) 그것은 연구자가 그들의 샘플의 대표성에 대해 확신을 가질 수 있게 한다.
(2) 그러한 대표성은 연구자가 더 넓은 추론을 할 수 있게 한다.
Qualitative research does lack generalizabilitywhenit is understoodonlythrough one particular type of generalizability, that is,statistical-probabilistic generalizability. Whilst the ‘statistical generalizability model is almost never fully realised, even though the research community usually acts as though it is’ (Polit and Beck2010, p. 1457), that type of generalisation is normally sought through statistical sampling procedures and has two functions:
(1) it allows the researcher to feel confident about the representativeness of their sample, and
(2) such representativeness allows the researcher to make broader inferences.
이러한 이유로 통계적 확률론적 일반화 가능성은 정량적 연구에 합리적이고 일반적으로 적용된다.
For such reasons, statistical-probabilistic generalizability is sensibly and commonly applied toquantitative research.
그러나 통계적 확률론적 일반화 가능성을 정성 연구에 적용하는 것은 문제가 있다.첫째, 질적 연구에 많은 정보를 제공하는 [존재론적 및 인식론적 가정]은 양적 이후의 연구를 뒷받침하는 가정과 다르다. 종종 질적 연구자는 현실은 다중적이며, 사람에 달려있다고 믿는다(연구자, 참여자, 그리고 다양한 사람들). 그들은 또한 지식이 연구자들과 독립적으로 발견되고 객관적인 방법으로 발견되기 보다는, 지식은 구성되고 주관적이라고 종종 믿는다(Lincoln et al. 2017). 무엇이 질적연구이고 무엇이 질적연구가 아닌가에 대한 이러한 이해를 고려할 때, 통계적 확률론적 일반화 가능성은 많은 질적 연구의 존재론적 및 인식론적 가정과 맞지 않는다. 따라서 질적 작업에 통계적 확률론적 일반화 가능성을 적용하는 것은 의미가 없다.
Yet, to apply statistical-probabilistic generalizability toqualitative researchis problematic. Firstly, the ontological and epistemological assumptions that inform much qualitative research are different from the assumptions that underpin post-positivist quantitative research. Often the qualitative researcher believes that reality is multiple and dependent on them (i.e. the researcher, participants and various people). They frequently as well believe that knowledge is constructed and subjective, rather than discovered independently from researchers and found in an objective way (Lincolnet al.2017). Given these understandings about what ‘is’ and ‘is not’ qualitative research, statistical-probabilistic generalizability does not fit with the ontological and epistemological assumptions of much qualitative research. Thus, the application of statistical-probabilistic generalizability to qualitative work makes little sense.
둘째, 통계적 확률 일반화 가능성을 통해 질적 연구를 이해한다면, 그러한 유형의 일반화가 모든 형태의 연구의 목표가 되는 것과 같다. 그러나 통계적 확률론적 일반화 가능성은 정성적 연구에 의미 있는 목표가 아니다. 질적 연구는 사람들의 삶을 풍부하게 상세하게 조사하는 것이고, 그 목표를 달성하기 위해 소수의 사람들은 종종 목적적 또는 목적적 샘플링 전략(예: 최대 변동 및/또는 기준 기반 목적적 샘플링)을 통해 선택된다(Braun and Clarke 2013, Sparkes and Smith 2014). 따라서 의도적으로 선택한 풍부한 지식과 작은 샘플은 약점이 아니라 질적 연구의 고유한 장점입니다. 루이스 외 연구진(2014)은 다음과 같이 평했다.
Secondly, when qualitative research is understood through statistical-probability generalizability it is as if that type of generalisation has been overgeneralized, as it were, to be the goal of all forms of research. Yet, statistical-probabilistic generalizability is not a meaningful goal for qualitative research. Qualitative research is about examining people’s lives in rich detail, and to achieve that goal, small numbers of people are often chosen through purposive or purposeful sampling strategies (e.g. maximum variation and/or criterion-based purposeful sampling) (Braun and Clarke2013, Sparkes and Smith2014). Rich knowledge and small samples purposefully chosen are thus uniquestrengthsof qualitative research,not weaknesses. As Lewiset al. (2014)commented:
질적 연구는 통계적으로 일반화될 수 없다. 즉, 특정 관점이나 경험의 확산이 아니라, 표본의 일부 내에서의 위치 정도가 아니라 추론을 도출할 수 있다. 물론 이것이 질적 연구의 목적도 아니다. 오히려, 질적 연구의 가치는 연구 대상 현상의 폭과 성격을 밝히는 데 있다. (351쪽) Qualitative research cannot be generalised on a statistical basis – it is not the prevalence of particular views or experiences, not the extent of their location within parts of the sample, about which inferences can be drawn. Nor, of course, is this the objective of qualitative research. Rather, the value of qualitative research is in revealing the breadth and nature of the phenomena under study. (p. 351)
따라서 한 연구자가 질적 연구의 약점이 일반화 가능성 부족이며, 이는 통계적 확률 일반화만을 의미한다고 한다면, 그들은 옳을 것이다. 그러나 그들은 질적인 연구 또한 오해하고 있다. 강조된 이유로 통계적 확률 일반화는 질적 연구에도 적용할 수 없을 뿐만 아니라, 질적 연구의 목표조차 아니다. 연구자들은 질적 연구에 통계적 확률의 일반화 가능성을 적용하고 그러한 유형의 일반화를 통해 이를 판단하는 것을 피해야 한다. Accordingly, if a researcher states that a weakness of their qualitative research is a lack of generalizability, and by which theyonlymean statistical-probability generalisation, they would be correct! But they have also misunderstood qualitative research. For reasons highlighted, statistical-probability generalisation is neither applicable to qualitative research nor a goal of it. Researchers should then avoid applying statistical-probability generalizability to qualitative research and making judgements about it through that type of generalisation.
다양한 학자들에 따르면, 일반화는 질적 연구자들의 정당한 관심사여야 한다. 다시 말해, Wolcott (1995)의 표현처럼, '우리는 일반화에 대한 끈질긴 질문을 피할 수 없다' (132쪽) 그러나 일반화 가능성에 대해 우려하는 것은 인간, 사회 생활 및 물질성에 대한 상세하고 풍부한 이해를 희생할 필요가 없다. 일반화를 사용한다고 반드시 사후 실증주의를 채택해야 하는 것은 아니며, 일반화가 (잠정적이고 주관적이며 맥락과 분리되기보다는) 최종적이고 객관적이라고 믿어야만 하는 것도 아니다. 또한 그 작품에서 추출된 무작위 샘플의 종류를 모방하려고 시도함으로써 정량적 연구 방법을 채택하거나 심지어 병행해야 한다는 것을 의미하지도 않는다. 질적 연구자들은 일반화를 다루고 전달하는 방법을 포함하여 질적 연구의 과정과 산출물을 안내하기 위해 약속하는 인식론(예: 구성론)과 존재론(예: 상대론)을 여전히 보장해야 한다. 이러한 점들을 염두에 두고, 왜 질적 연구자가 일반화 가능성에 관심을 가져야 하는가?
According to various scholars (e.g. Sandelowski1997, Yardley2008, Green and Thorogood2009, Lewiset al.2014, Sparkes and Smith2014, Hayhurst2016, Kuklicket al.2016, Shaw and Hoeber2016, Darnellet al.2017), generalisation should be a legitimate concern for qualitative researchers. In other words, as Wolcott (1995) put it, ‘we cannot escape the nagging question of generalisation’ (p. 132). Being concerned about generalizability does not however require sacrificing detailed and rich understandings of human beings, social life and materiality. Using generalisation doesn’t either necessitate that one must adopt post-positivism, and believe that generalisations are final, objective and divorced from context rather than provisional, subjective and contextual. Nor does it mean that one should adapt, or even parallel, the methods of quantitative research by attempting to imitate the kinds of random samples drawn on in that work. Qualitative researchers must still ensure that the epistemologies (e.g. constructionism) and ontologies (e.g. relativism) they commit to guide the process and product of qualitative research, including how generalisation is dealt with and communicated. With these points in mind, why might a qualitative researcher be concerned with generalizability?
일반화 가능성을 고려해야 하는 한 가지 이유는 우리가 일반화를 무시할 때 질적 연구에 많은 것이 걸려 있기at stake 때문이다. 예를 들어, 일반화를 무시하면 질적 연구자들이 일반화에 신경 쓸 필요가 없다는 인상을 줄 수 있다. 하지만 우리는 신경써야 한다. 아니면 적어도 일반화 가능성에 대한 입장을 가져야 한다. 그것은 [지배적인 형태의 진실]이 때때로 (질적인 연구에 의해 만들어진 지식과 같은) 특정한 형태의 지식을 폐쇄하거나 경찰하는 방식으로 우리의 분야disciplines을 형성shape하기 때문이다.
One reason to consider generalizability is that much is at stake for qualitative research when we ignore generalisation. For instance, ignoring generalisation can give the impression that qualitative researchers don’t need to care about generalising. But we do need to care, or at least have a position on generalizability. That is because dominant forms of truth shape our disciplines in ways that at times shut down and/or police particular forms of knowledge, such as that produced by qualitative research.
일반화 가능성에 engage하는 것이 중요한 또 다른 이유는, 연구자, 저널 편집자 및 리뷰어는 질적 연구의 한계가 일반화 능력의 부족이라고 믿고 질적 연구를 비판, 비하 또는 거부하기 위한 근거로서 사용할 수 있기 때문이다. 우리는 또한 정부, 스포츠 코치 및 스포츠 단체의 정책 입안자들이 때때로 질적 연구의 발견을 심각하게 받아들이지 못할 수 있다는 것을 알고 있다. 그 실패에 기여하는 중요한 요인은 그 결과가 일반화될 수 없다는 자주 인용되지만 잘못된 주장이다. It is likewise important to engage with generalizability because, as Shaw and Hoeber (2016) suggested, researchers, journal editors and reviewers may (continue to) believe that a limitation of qualitative research is a lack of generalizability and then use that as a rationale to critique, demean or reject qualitative research (see also Greenhalgh et al. 2016). We also know that policy-makers in government, sport coaches and sporting organisations can, at times, fail to take the findings of qualitative studies seriously. An important factor contributing to that failure is the often cited but false charge that the results are not generalizable (Green and Thorogood 2009).
따라서 연구자, 단체, 정부 등이 질적 연구에 대해 적절하고 공정한 판단을 내리고 그들이 우리의 연구를 활용하기를 원한다면, 우리는 일반화 가능성에 관여할 필요가 있다. 이러한 참여를 달성하는 한 가지 방법은 연구 논문, 대화 등에서 질적 연구의 약점이나 한계가 항상 일반화 가능성이 부족하다는 신화를 제거하는 것이다. 질적 연구자들이 참여할 수 있는 또 다른 방법은 적절한 수준에 상관없이 그들의 결과가 유용하다고 주장하는 것이다(Kay 2016).
Thus, if we want researchers, organisations, government and so on to make appropriate and fair judgements about qualitative research, and want them to use our work, we need to be engaged with generalizability. One way to accomplish such engagement is to dispel any myth in research articles, conversations and so forth that a weakness or limitation of qualitative research is that it always lacks generalizability. Another way for qualitative researchers to engage is to make claims to their results being useful, at whatever level, when appropriate (Kay2016).
둘째로, 질적 연구는 때때로 일반화될 수 있고 일반화될 수 있기 때문에 일반화 가능성은 합법적인 관심사이다. [일반화의 가능성]이라는 점을 고려한다면, 일반적으로 고려되지 않는 연구자들에게 기회가 열려 있다. 예를 들어, 우리는 일반화 가능성이 특정 연구에 적합한지를 생산적으로 고려하고, 질적 연구가 일반화될 수 있는 방법을 반영하며, 일반화가 어떻게 가능한지를 입증하기 위해 청중과 참여하는 방법을 숙고할 수 있다. 질적 연구 결과가 통계적 확률 유형을 넘어 [다양한 유형의 일반화 가능성]과 어떤 관계를 가질 수 있는지 생각해 보는 데 도움이 될 수 있다(Green and Thorogood 2009). 콜링리지와 갠트(2008)가 언급했듯이, 일반화 가능성은 확률 표본 추출 이론에 국한되지 않는다. 일반화를 이해하는 방법은 다양하다'(392쪽). 따라서, 단순히 일반화 가능성이 질적 연구에서 문제가 아니라고 말하거나, 또는 그것이 한계라고 주장하기 보다는, 연구자들은 연구 결과가 [다른 유형의 일반화]와 가질 수 있는 가능한 종류의 관계에 흥미를 가질 수 있다. Secondly, generalizability is a legitimate concern because qualitative researchcan beandisat times generalizable. Given that possibility of generalising, opportunities are opened for researchers not typically considered. For example, we can productively consider if generalizability is appropriate for a particular study, reflect on how qualitative research might be generalizable, and deliberate on ways to engage with audiences to demonstrate how generalisation is possible. To help with all that it can be useful to think through whatkind of relationshipthe qualitative research findings might have to themultipleanddifferent types of generalizabilitythat can be drawn on beyond the statistical-probability type (Green and Thorogood2009). As Collingridge and Gantt (2008) comment, ‘generalizability is not limited to probability sampling theory. There are different ways of understanding generalisation’ (p. 392). Thus, rather than simply stating that generalizability is not an issue in qualitative research, or claiming it is a limitation, researchers can be intrigued with the possible kind of relationship the study results may have to different types of generalisation.
일반화 기회: '일반화 가능성'에서 '일반화 가능성들'까지 Opportunities to generalise: from generalizability to generalizabilities
질적 연구 결과가 일반화 가능성과 어떤 관계를 가질 수 있는지 생각하는 연구자들에게 고려할 수 있는 일반화 가능성의 유형은 다양하다. 고려해야 할 일반화 유형 중 하나는 [자연주의적 일반화 가능성naturalistic generalizability ]이다(Stake 1978, 1995). [대표적 일반화representational generalisation]라고도 하는 그러한 유형의 일반화에서, 일반화 가능성은 독자가 익숙한 결과와의 유사성과 차이점에 대한 인식을 기반으로 달성된다. 즉, 자연주의적 일반화 가능성은 연구가 독자의 삶의 일에 대한 개인적인 참여나 종종 암묵적인 경험에 공명할 때 발생한다.
There are different types of generalizability available to consider for researchers who choose to think about what kind of relationship their qualitative study results may have to generalizability. One type of generalisation for consideration isnaturalistic generalizability(Stake1978, 1995). In that type of generalisation, which is sometimes also referred to as representational generalisation (Lewiset al.2014), generalizability is reached on the basis of recognition of similarities and differences to the results with which the reader is familiar. That is, naturalistic generalizability happens when the research resonates with the reader’s personal engagement in life’s affairs or vicarious, often tacit, experiences.
자연주의 일반화를 가능하게 하기 위해, 연구자들은 적절한 '증거'(예: 인터뷰 인용문, 관찰 필드 노트 및/또는 시각적 자료), 충분한 상황별 세부 사항 및 풍부한 층의 현실의 이론적 표현을 통해 참가자의 삶에 대한 충분한 세부 정보를 청중에게 제공해야 한다. 그럼으로써 독자들이 이것들을 성찰하고 자신의 삶과 연결하도록 돕는다.
To enable naturalistic generalizability the researcher is required to provide audiences with enough detail of the participant’s lives through adequate ‘evidence’ (e.g. interview quotations, observation field notes and/or visual material), enough contextual details, and richly layered theoretical expressions of a reality to help readers reflect upon these and make connections to their own lives.
질적 연구자가 추구할 수 있는 또 다른 유형의 일반화는 전이성transferability(Tracy 2010)으로, 추론적 일반화inferential generalisation(Lewis et al. 2014) 또는 사례 간 일반화case-to-case generalisation (Chenail 2010)라고도 한다.
정의를 제시하기 전에, 여기서 전이성은 링컨과 구바(1985)가 전이성을 의미하는 것이 아니라는 것을 유념해야 한다. 링컨과 구바의 이전가능성에 대한 생각은 신뢰할 수 없는 현실의 해석으로부터 신뢰할 수 있는 것을 구분하기 위한 절차나 방법의 형태의 인식론적 기초주의에 의해 뒷받침되었다. 그 후, 전이성은 '적합성fittingness'에 관한 것으로, '전송과 수신 상황 사이의 일치성 정도'로 정의되었다 (124쪽).
Another type of generalisation that a qualitative researcher might seek istransferability(Tracy2010), which is sometimes also referred to as inferential generalisation (Lewiset al.2014) or case-to-case generalisation (Chenail2010).
Before offering a definition, it is important to note that what is meant by transferability here is not what Lincoln and Guba (1985) meant by transferability. Lincoln and Guba’s idea of transferability was underpinned by epistemological foundationalism in the form of procedures or method to sort out trustworthy from untrustworthy interpretations of reality. Following that, transferability was about ‘fittingness’, ‘defined as the degree of congruence between sending and receiving contexts’ (p. 124).
링컨과 구바(1985)가 정의한 것과는 대조적으로, 여기서 전이가능성의 개념은, 지식은 구성되고 주관적이며, 현실은 다중이며 창조되고 정신에 의존적이며, 방법은 [이론과 무관한 지식]을 제공할 수 없다는 인식론적 가정에 의해 뒷받침된다. 전달성은 한 환경에서 사람이나 집단이 연구가 식별한 다른 환경에서 채택하는 것을 고려할 때마다 발생하는 것으로 정의된다는 점에서 여기서도 다르다. 그렇다면 문제는 '텍스트 A와 컨텍스트 B가 일치하고 적합한가'가 아니라 '이러한 결과가 어느 정도까지 다른 설정으로 전달될 수 있는가'이다. 예를 들어, 체육 교육자, 스포츠 공동체 지도자, 또는 건강 정책 입안자가 활동적인 생활 방식을 장려하는 방법에 대한 질적 보고서를 읽는 것은 알고 싶을지도 모른다: '이것은 나의 체육 수업, 지역 공동체 그룹, 또는 국가에 활동적인 생활 방식을 장려하기 위해 적용할 수 있는 것인가?' 독자들이 [연구가 자신의 상황과 겹친다]고 믿거나, 직관적으로 연구 결과를 자신의 행동으로 옮길 수 있다고 생각할 때, 연구는 전달 가능성을 통해 일반화된다고 말할 수 있다. In contrast to how Lincoln and Guba (1985) defined it, the idea of transferability here is underpinned by the epistemological assumption that knowledge is constructed and subjective, reality is multiple, created and mind-dependent, and methods cannot provide theory-free knowledge. Transferability is also different here in that it is defined as occurring whenever a person or group in one setting considers adopting something from another that the research has identified. The question then is not ‘If Context A and Context B are congruent and fit’, but rather ‘To what extent are these results transferable to other settings?’ For example, a physical educator, sport community leader, or health policy-maker reading a qualitative report on how to promote active lifestyles might want to know: ‘Is this something I can apply to my physical education class, local community group, or country to encourage active lifestyles’? When readers feel as though this can be the case – when they believe that research overlaps with their own situation and/or they can intuitively transfer the findings to their own action –, then the research can be said to generalise through transferability.
Tracy (2010)에 따르면, 그러한 유형의 일반화 가능성을 촉진하기 위해, 자연주의 일반화 가능성 연구자들처럼, '직접 증언을 수집하고 풍부한 설명을 제공하며 접근 가능하고 초대적으로 작성함으로써 전이가능성을 유발하는 보고서'를 작성한다(페이지 845). 그녀는 또한 전달성이 evocative storytelling과 관련될 수 있다고 언급했다. 이야기는 다른 분야에서도 같은 일을 겪었다는 생각을 독자들에게 심어주는 힘이 있기 때문이다(Papathomas 2016). To facilitate that type of generalizability, according to Tracy (2010), like naturalistic generalizability researchers ‘create reports that invite transferability by gathering direct testimony, providing rich description and writing accessibly and invitationally’ (p. 845). She notes that transferability can also relate to evocative storytelling. That is because stories have the power to create in readers the idea that they have experienced the same thing in another arena (Papathomas2016).
질적 연구 결과가 일반화 가능성과 어떤 관계를 가질 수 있는지 생각하고자 하는 연구자들을 위해, 이들이 추구할 수 있는 추가적인 유형의 일반화는 광범위하게 분석적 일반화analytical generalization라고 할 수 있다(Chenail 2010, Polit and Beck 2010, Lewis et al. 2014, Simons 2014). 때로는 수직적 일반화vertical generalizability (Stephens Generalization, 1982년)과 관용적 일반화idiographic generalizability (Sandelowski 2004년)으로도 알려져 있으며, 분석 일반화는 개념 일반화concept generalization와 이론적 일반화theoretical generalization를 통해 다양한 방식으로 발생할 수 있다. For those researchers who wish to think about what kind of relationship their qualitative study results may have to generalizability, a further type of generalisation they might seek can be broadly termedanalytical generalization(Chenail2010, Polit and Beck2010, Lewiset al.2014, Simons2014). Sometimes also known as vertical generalizability (Stephens1982) and idiographic generalizability (Sandelowski2004), analytical generalisation can occur in differing ways, that is, throughconcept generalizationandtheoretical generalization.
예를 들어, [분석적 일반화]는 연구자가 특정한 결과의 집합을 [확립된 개념이나 이론으로 일반화]함으로써 연구 개념에 일반화 가능성 또는 이론적 일반화 가능성을 표시할 때 발생할 수 있다. 연구는 또한 맥락이나 모집단이 다르더라도 나중에 타당하고 다른 연구에서 의미를 갖는 [새로운 개념이나 새로운 이론이 구성]될 때 분석적 일반화 가능성을 생산할 수 있다. 아니면, 연구자는 다른 방법론을 통해 연구에서 확립된 개념과 이론을 재검토하여, [주제에 대한 새로운 개념과 이론적 이해를 도출]할 수도 있다. 연구자나 다른 연구자가 다른 연구에서 그러한 개념이나 이론의 가치를 보여줄 때, 다시 말해 그 작업은 분석적 일반화의 형태를 만들어 낸다고 할 수 있다.
For example, analytical generalisation can happen when the researcher generalises a particular set of results to an established concept or theory, thereby displaying in their research concept generalizability or theoretical generalizability. Research might also produce analytical generalizability when a new concept or new theory is constructed that later makes sense and has significance in other research, even if the contexts or populations are different. Or, the researcher might re-examine established concepts and theories in a study through a different methodology and, in turn, produce new conceptual and theoretical understandings of a topic. When that occurs, and the researcher or other researchers show the value of such concepts or theories in other research, then again it can be said that the work generates a form of analytical generalisation.
따라서 [분석적 일반화]에서 일반화할 수 있는 것은 (특정 맥락이나 모집단이 아니라) [개념이나 이론]이다. 더욱이 개념적 또는 이론적 일반화는 고정적이거나 불변하거나 절대적으로 확실하게 주장될 수 있는 것으로 보지 않는다. 오히려 분석적 일반화는 세상과 사람들의 삶을 이해하기 위한 [유동적인 아이디어]로 더 잘 이해될 수 있다. 또한 중요한 것은 다넬 외 연구진(2017)이 제안한 바와 같이 질적 데이터는 종종 [개념 구성과 이론화]를 주도한다.
Thus, in analytical generalisation it is the concepts or theories that are generalizable, not the specific context or populations. Moreover, conceptual or theoretical generalisations are not viewed as fixed, immutable, or to be asserted with absolute certainty. Rather, analytical generalisations are perhaps better understood as fluid ideas (Atkinson2017) for making sense of the world and people’s lives. Importantly too, as Darnellet al. (2017)suggested, qualitative data often drive conceptual construction and theorisation.
또 다른 유형의 일반화 가능성은 Fine, Tuck 및 Zeller-Berkman(2008)이 교차 일반화intersectional generalizability을 정의했던 것이다. 그들은 교차 일반화를 역사적으로 억압받거나 식민화된 민족/공동체의 세부사항과 그들의 저항의 사회적 움직임을 기록하기 위해 시간이 지남에 따라 공동체를 깊고 존중하게 파고드는 작업으로 정의했다. 이러한 유형의 일반화 가능성은 또한 '국가, 공동체, 가정 및 신체에 걸친 패턴을 추적하여 억압과 식민주의의 동맥arteries을 이론화하는 작업'을 산출하는 것이다(Fine et al. 2008, 페이지 174). 이러한 방식으로 교차 일반화 가능성은 커뮤니티 기반 연구(싱키와 블로젯 2016 참조), 페미니즘(쿠키 2016 참조) 및 토착 연구(노먼과 하트 2016 참조)와 연결된다. Another type of generalizability is what Fine, Tuck and Zeller-Berkman (2008) termedintersectional generalizability. They defined intersectional generalisation as work that digs deep and respectfully with a community over time to record the particulars of historically oppressed and/or colonised peoples/communities and their social movements of resistance. That type of generalizability is also about producing ‘work that tracks patterns across nations, communities, homes, and bodies to theorize the arteries of oppression and colonialism’ (Fineet al.2008, p. 174). In such ways, then, intersectional generalizability connects with community-based research (see Schinke and Blodgett2016), feminism (see Cooky2016) and indigenous research (see Norman and Hart2016).
그것은 또한 자극적 일반화provocative generalizability이라고 불리는 것뿐만 아니라 이론적 일반화 가능성과 연결되고 인식된다. 예를 들어, 이론적 일반화의 관점에서 연구팀은 사회적 억압과 한 맥락에서 다른 맥락으로 이동하는 저항의 형태에 대한 이론적 교훈을 얻을 수 있다. Fine 등에 따르면, 아마도 생성성generativity과 비슷하게, [자극적 일반화]는 독자와 청중으로 하여금 '가능성'을 재고하도록 자극하고, 연구자들에게 '아직 상상하지도, 실제로도, 아직 가시권에 있지 않은 것을 향해 연구 결과를 이동시킬 것'을 요청한다(페이지 169).
It also connects with and recognises theoretical generalizability as well as what is termedprovocative generalizability. For example, in terms of theoretical generalisation the research team can glean theoretical lessons about social oppression and forms of resistance moving from one context to another. For Fineet al., provocative generalizability, perhaps not unlike generativity (Barone and Eisner2012), provokes readers and audiences to rethink ‘the possible’, and asks researchers to ‘move their findings toward that which is not yet imagined, not yet in practice, not yet in sight’ (p. 169).
일반화 기회: 몇 가지 과제 및 실제 전략 Opportunities to generalise: some challenges and practical strategies
질적 연구가 통계학적 또는 확률론적 증거에 의존하지 않고 일반화할 수 있지만, 일반화가 질적 연구의 의미 있는 목표가 될 수 있다고 믿는 연구자들에게는 여전히 과제가 있다. 한 가지 과제는 '독자 일반화 reader generalizability'과 관련이 있다.
확률론적-통계적 일반화 가능성의 경우, [연구자]가 일반화 가능성을 확립하는 것이 기대되지만,
여러 유형의 질적 일반화에서는 [독자]가 종종 일반화에 적극적으로 참여해야 한다.
예를 들어, 자연주의적 일반화 또는 전이성을 촉진하기 위해서는 독자들이 자신의 상황과 유사하고 다른 것이 무엇인지 식별할 수 있도록 연구에 대한 두꺼운 설명과 풍부한 해석이 필요하다(Chenail 2010, Sparkes and Smith 2014). Even though qualitative research can generalise without having to rely on statistical or probabilistic evidence, there are still challenges for researchers who believe that generalizability can be a meaningful goal for qualitative research. One challenge relates to ‘reader generalizability’.
Whereas in cases of probabilistic-statistical generalizability the expectation is for the researcher to be responsible for establishing generalizability,
the reader in qualitative types of generalizability is often called on to be actively involved in making generalisations.
For example, to facilitate naturalistic generalizability or transferability thick descriptions and rich interpretations of the research are needed so that the readers themselves can discern what is similar and different to their own situations (Chenail2010, Sparkes and Smith2014).
이러한 관점에서, 일반화는 의미 있는 주제에 대한 연구를 심층적으로 제시하고 해석적 풍부함을 가진 [연구자의 능력]에 의존한다. 그러나 그들이 잘 조작된 질적 보고서를 통해 특정 일반화를 촉진하려고 할 수 있지만, 또한 [청중]이 보고서에 관여한 다음, 그들이 일반화할 수 있는 결과를 지지하거나 거부할 책임이 있다. 따라서 이러한 관점에서, [연구자와 독자]는 모두 '원래 연구의 맥락과 세부사항을 넘어서는 일련의 질적 연구 결과의 가치를 평가하는 것에 대한 책임을 공유한다.'(Chenail 2010, 페이지 6). 일반화할 수 있는 연구를 생산하는 책임이 연구원뿐만 아니라 적절한 독자에게도 주어지면서, 연구자들은 [연구가 일반화될 수 있는지에 관한 어떤 확신도 가지지 못하며, 예측할 수 없는 상황]에 놓이게 된다. Generalisation then relies on the ability of the researcher to render studies on meaningful topics, presented in depth, and with interpretive richness. But whilst they might seek to facilitate certain generalisations through a well crafted qualitative report, the onus is also placed on the audience to engage with the report, and then either support or reject the results as generalizable to them. From this perspective, therefore, researchers and readers ‘both share a responsibility when it comes to assessing the value of a particular set of qualitative research findings beyond the context and particulars of the original study’ (Chenail2010, p. 6). With that responsibility for producing generalizable research placed on not simply the researcher but also on appropriate readers, researchers are left in a situation where they cannot predict with any certainty if research is generalizable.
따라서, 어떻게 연구자들은 (절대적인 방법론적인 확실성이 보장되는) 더 이상 완벽한God's의 관점이 없다는 것을 인식한 상태에서, 일반화의 문제를 실질적으로 진행할 수 있는가? 이러한 상황에서는,
그 누구도 특정 연구의 일반화 가능성에 대한 최종적인 의견을 가지고 있지 않고,
지식은 우발적인contingent 것
연구자는 역사적으로 그리고 지역적으로 연구되고 있는 바로 그 과정 안에 위치한다
Accordingly, how might researchers practically proceed with the issue of generalizability whilst recognising there is no longer a God’s eye view that guarantees absolute methodological certainty, that no one person has the final word on a particular study’s generalizability, that knowledge is contingent, and that the researcher is historically and locally situated within the very processes being studied?
고려해야 할 한 가지 전략은 최종 보고서에서 특정 프로젝트에 대한 일반화 가능성에 대한 주장이나 참조를 하지 않는 것이다. 연구자는 글을 쓸 때 그들의 연구를 일반화할 자신이 없기 때문에 그렇게 하는 것일 수도 있다. 그러나 그러한 솔직함은, 예를 들어, 나중에 독자들이 그 결과가 그들에게 반향을 불러일으켰다고 말하거나, 그들의 직장으로 옮겨질 수 있다는 것을 배제하지는 않는다. 그러나 이러한 전략의 위험성은 일반화에 대한 언급이 전혀 없을 때 그 연구가 '낮은 가치'와 '부실'로 간주된다는 것이다. 왜냐하면 점점 더 연구와 평가에서 엄격함에 대한 강조가 증가하고 있으며, 질적 특성이 일반화 가능성이 결여되어 제한적이라는 여전히 너무 일반적인 믿음이 존재하기 때문이다. 하지만 그렇다고 해서 연구자가 그러한 지적을 회피하고, 잠재적 리뷰어를 만족시키기 위해 과도하게 부풀려진 주장을 하도록 해서는 안 된다. 연구는 일반화될 수 없지만 여전히 큰 장점이 될 수 있으며, 많은 분야에서 출판될 수 있다.
One strategy to consider is to make no claim or reference to generalizability for a specific project in the final report. A researcher might do that because they are not confident generalising from their study at the time of writing. That candour does not though preclude that later readers might say the results resonated with them or can be transferred to their workplace, for example. However, with an increasing emphasis on rigour in research and assessment exercises, and the still too common belief that qualitative is limited because its lacks generalizability, the risk – insomespaces – of this strategy is that the research is deemed of ‘low value’ and ‘poor’ when there is no mention at all of generalizability. That risk should not drive a researcher to making over inflated claims in order to evade such judgements and satisfy possible reviewers. Research can still be of great merit without being generalizable, and is publishable in many spaces.
특정 목적을 위해 일반화 가능성을 고려하는 경우 채택해야 할 또 다른 전략은 [일반화와 관련하여 명확하면서도 위험회피적인 방식hedging style을 사용하는 것]이다(Chenail 2010). 그러한 위험회피전략은 연구자가 보고서에서 독자에게 제안된 연구가 특정 방법(예: 양도가능성)으로 일반화될 가능성might, potential이 있다는 점을 명시적으로 강조하는 것을 포함한다. 독자에게 이 연구가 일반화될 수 있다고 제안하기 위해, 연구자는 [연구 결과에 대해 신중하게 말로 된 성찰을 제공할 수] 있다. 또한, 연구자는
연구자가 선택한 일반화 유형을 명명하고,
특정 유형의 일반화 가능성이 연구에 적합한 이유를 정당화하고,
품질 판단 기준의 과정과 결과를 설명하고,
결과의 잠재적 일반화 가능성에 대한 신뢰 수준을 측정할 수 있다.
If considering generalizability for certain purposes, another strategy to adopt is to use a clear yet hedging style of prose in relation to generalisation (Chenail2010). That hedging strategy involves the researcher explicitly highlighting to the reader in the report that the research offeredmight, that is it has thepotential, to be generalizable in certain ways (e.g. transferability). To suggest to the reader that the work might be generalizable, the researcher can offer carefully worded reflections about their research results. They also can
name the type of generalisation selected,
justify why that particular types of generalizability is appropriate for the research,
describe the process and outcome of the criteria for judging quality, and
gauge their level of confidence on the results’ potential generalizability.
이 예술적artful이고, 정보에 입각한 방법으로, 연구자는 독자에게 그들의 질적 연구가 맥락적 한계를 넘어서는 잠재적 가치를 가지고 있다고 제안한다(Chenail 2010). 그 전략의 한 가지 이점은 독자들이 그 연구가 일반화에 대한 최종 단어를 제공하지 않는다는 것을 상기시킨다는 것이다. 동시에, 이 전략은 독자들이 [결과에 대해서만 생각]하는 것이 아니라, [결과를 가지고 생각]하도록 자극하는 이점을 가질 수 있다. 그렇게 함으로써, 독자들은 그 연구가 얼마나 일반화 가능한지 혹은 그렇지 않은지를 성찰할 수 있을 것이다.
In this artful and informed way, the researcher suggests to audiences that their qualitative study has potential value beyond its contextual confines, or in a phrase, to be generalizable in a certain way(s) (Chenail2010). One benefit of that strategy is that readers are reminded that the research does not offer the final word on generalisation. At the same time, the strategy could have the benefit of provoking the reader to think with the results, not just about them. In so doing, readers might reflect on how generalizable the research is or isn’t.
물론 위험회피전략hedging style에서는 '증거'를 제시하지 않고 '잠재적'이라고 주장하는 것에 대한 비판에 자신을 노출시킬 위험이 있다. 이런 비판에 대해 '연구가 일반화 될 수 있는가, 없는가'라는 문제는 경험적 질문이 아닌 개념적 문제라는 식으로 대응할 수 있다. 더욱이 '증거란 무엇인가'에 문제를 제기하고 '증거'가 논쟁적contested 용어임을 정확하게 지적함으로써 정당하게 대응할 수 있다. 이러한 이슈는 연구실 외부로 나와서, 연구자, 정책 입안자, 스포츠 조직 등의 다른 그룹과 함께할 때, 일반화 가능성에 대한 대화는 종종 곧잘 '증거'에 대한 실증적 질문으로 되돌아가버리곤 한다. 다양한 학자들이 상기시키듯 자신의 작품이 유용하고 변화를 일으키기를 원할 때 그 도전은 무시하기 어렵다.
Of course, with a hedging strategy there is the danger of leaving oneself open to critiques about claiming ‘potential’ without providing ‘the evidence’. One could respond to such a critique by arguing that the issue of ‘can a study be generalizable or can’t it’ is a conceptual not an empirical question. Moreover, one can respond legitimately by problematizing ‘what is evidence’ and accurately pointing out that ‘evidence’ is a contested term (see Denzin2009). Such issues recognised, when we move outside our offices and engage with different groups of researchers, policy-makers, sport organisations and so on, conversations about the potential of generalisation can often return quickly back to an empirical question about evidence. That challenge is difficult to ignore when, as various scholars remind us (Wolcott1995, Yardley2008, Green and Thorogood2009, Lewiset al.2014, Kay2016, Darnellet al.2017), one wants their work to be useful and make a difference.
따라서 '잠재적' 문제에 대한 대응을 고려하는 또 다른 방법은, (앞서) 연구가 발표된 후에 다른 사람들이 결과에 어떻게 반응했는지를 '증거'하고, 나중에 이 '증거'를 보여주는 것이다. 물론 그 '증거'가 연구의 일반화 가능성을 뒷받침할 것이라고 가정할 수는 없다. 또한 일반화 가능성이 '증거'된다면 '증거'는 공표 후 일정 기간 동안 생성될 것이라는 점을 인식해야 한다. 그러한 '증거'는 일부 청중을 납득시키기 위해 향후 작업에서 포착될 필요가 있을 수 있다.
Thus, another way to consider responding to the ‘potential’ issue is to ‘evidence’ after the research has been published how others have responded to the results and later show the ‘evidence’. Of course, one cannot assume that the ‘evidence’ will support research generalizability. Further, it must be recognised that if generalizability is ‘evidenced’ that ‘evidence’ would be produced some time after publication. That ‘evidence’ might need to be captured in future work to convince some audiences.
세 번째 전략은 출판을 모색하기 전에 작업이 일반화 가능하다는 '증거'를 수집한 뒤, 최종 보고서에서 연구가 특정 유형의 일반화를 입증했음을 강조하는 것이다. 그것은 연구원이 주장을 과장하거나 절대 확실성을 가지고 일반화 가능성을 제안해야 한다는 것을 의미하는 것이 아니다; 우리는 일반화 주장에 대해 신중해야 한다. 다만, 연구자들은 '증거'를 바탕으로 특정 유형의 표시 일반화 가능성을 독자들에게 강조할 수 있다. A third strategy is to gather the ‘evidence’ that the work is generalizablebeforeseeking publication and to highlight in the final report that the research has demonstrated a certain type(s) of generalisation. That does not mean the researcher should exaggerate claims or suggest generalizability with absolute certainty; we should be cautious over claims to generalise. That noted, and guided through the whole research by an aligned epistemology and ontology (Onwuegbuzie and Poth2016, Levittet al.2017), a researcher can highlight to readers that based on the ‘evidence’ gathered the results of the study display a certain type(s) generalizability.
위의 전략을 사용함으로써, 어떤 질적 연구들은 '증거'를 통해 일반화 가능성을 보여준다는 이점이 있지만, 한 가지 단점은 연구가 전통적인 사례보다 훨씬 늦게 저널에 발표될 가능성이 높다는 것이다. 초기 연구보고서에 대한 답변을 받는 데에 시간이 걸릴 수 있기 때문이다. 예를 들어, Smith와 Caddick(2015)은 일반화 가능성을 얻기 위해 보고서를 펑더에 전달하고 그에 대한 응답을 수집한 지 거의 1년 만에 동료 검토를 위해 논문을 저널에 제출했다. 저널 출판 시간 지연 외에도 연구자들은 연구가 일부 또는 모든 독자에게 일반화되지 않을 수 있다는 것을 알아야 한다. 연구자가 연구의 일반화 가능성을 검토하기 위해 나섰을 때, 그들은 그것이 사람들과 어떤 식으로 일반화되지 않는다는 것을 알게 되면, 그것을 연구에 보고해야 하는 윤리적 책임이 있습니다. 그렇게 정직한 댓가가 연구에는 손해로 다가올 수 있다. 예를 들어, 일부 독자는 일반화의 가능성이 제한적이거나 부족한 것을 '부실'한 연구의 결과로 해석하여 그 가치에 의문을 제기할 수 있다. 대안적으로, 사람들이 연구에 동의하지 않거나 그것이 일반화되지 않는다고 느낄 때, 연구원들은 이러한 통찰을 주제에 대한 추가적인 이해의 원천으로 볼 수 있다. 그들은 연구에 대한 사람들의 관점을 모순, 차이점, 지식의 차이, 대안적 경험을 인정하거나 탐구할 수 있는 실용적인 기회로 사용할 수 있다. Whilst there are benefits of suggesting that a certain piece of qualitative work displays generalizability via ‘evidence’, one challenge or drawback is that the research is likely to be published in a journal much later than traditionally the case. That is because inviting responses to an initial research report can take time. For instance, Smith and Caddick (2015) submitted their article for peer-review to a journal nearly one year after delivering the report to the funder and collecting responses to it in order to gain a sense of generalizability. In addition to journal publication time delay, researchers need to be aware that the research might not end up being generalizable to some or even all readers. When the researcher sets out to examine the generalizability of the research, and they learn it doesn’t generalise in a certain way with people, there is an ethical responsibility to report that in the research. That honesty can come at a cost to the research. For instance, some readers might interpret the limited or lack of generalizability as the result of ‘poor’ research, thereby questioning the value of it. Alternatively, when people disagree with the research or feel it doesn’t generalise, the researcher might view these insights as an additional source of understanding about a topic. They might use people’s views of the research as a practical opportunity to acknowledge and/or explore with them contradictions, differences, gaps in knowledge, and alternative experiences.
이 섹션에서 제공된 전략은 고정적이거나 최종적인 것으로 간주되어서는 안 되며, 각 전략은 수정될 수 있습니다. 이러한 전략은 연구자들이 질적 연구를 출판하거나 이미 발표된 연구에 대해 다시 반영하고자 할 때 실용적으로 일반화 가능성을 고려하는 방법에 대한 옵션과 출발점이다. 공유된 세 가지 전략 또한 연구자가 사용할 수 있는 유일한 전략은 아니다(Goodman 2008, Chenail 2010, Lewis et al. 2014 참조). The strategies offered within this section for thinking about generalisation should not of course be considered inflexible or final; each can be adapted. The strategies are options and starting points for how researchers might consider generalizability in a practical manner when seeking to publish qualitative research or re-reflect on already published work. The three strategies shared are also not the only ones that a researcher might use (see also Goodman2008, Chenail2010, Lewiset al.2014).
마지막으로, 이 전략을 프로젝트 중간에 고려하거나, 마지막에 바꿔버려서는 안 됩니다. '연구자들이 연구를 시작할 때 일반화 과정에 대해 생각하기 시작하는 것이 중요하다.'(6페이지) 처음부터 전략을 확정하거나 확정해야 한다는 뜻은 아니다. 그러나 프로젝트를 시작할 때 일반화 가능성에 대해 생각하기 위해서는, 연구자들은 [일반화 가능성에 대한 확장된 비전]을 가지고 있어야 한다. 여기에는 다양한 유형의 일반화 가능성, 일반화에 접근하기 위한 가능한 전략, 각 전략에 수반되는 과제 또는 리스크가 포함된다. 그들은 또한 일반화의 문제에 대한 연구 전반에 걸쳐 성찰적이어야 하며 일반화를 하나의 과정으로 보아야 한다. Finally, the strategies offered should not ideally be considered half way through a project or bolted on at the end. As Chenail (2010) advised, it is ‘important for researchers to start thinking about the generalisation process at the beginning of their research’ (p. 6). This doesn’t mean that one has to finalise or settle on a strategy at the very beginning. Thinking about generalizability at the very start of a project does however require that researchers have an expanded vision of generalizability. That involves the researcher being familiar with different types of generalizability, the possible strategies to approach generalisation, and the challenges or risks that go with each strategy. They also need to be reflexive throughout the research on the issue of generalisation and view generalising as a process.
결론 및 권고사항 Conclusions and recommendations
우리가 일반화 가능성에 대한 논쟁을 피하거나 일반화 가능성에 대한 신화를 문제 삼지 않을 때 많은 것이 위태로워진다. 또한 질적 조사는 일반화할 수 있는 작업을 생산할 수 있기 때문에 일반화 가능성에 관심을 가져야 한다고 강조되었다. 통계적 유형의 일반화 가능성을 사용하는 대신, 질적 연구자들이 추구할 수 있는 것은 다른 유형의 일반화 가능성이라고 제안했다. 여기에는 자연주의적, 전이적, 분석적, 교차적 일반화성의 조합이 하나 이상 포함될 수 있다. 연구자가 선택할 수 있는 다른 유형의 일반화에는 유연한 일반화 가능성(Goodman 2008 참조)과 프로세스 일반화 가능성(Simons 2014 참조)이 포함된다. 마지막으로, 이 논문은 질적 연구를 출판하려고 할 때 연구자가 실질적으로 일반화 가능성에 관여하는 방법에 대한 세 가지 전략을 제공했다. 이 모든 점들을 상세히 설명함으로써, 이 논문이 '일반화 가능성에 대한 확장된 비전'을 제시하기를 바란다. As was suggested, much is at stake when we avoid engaging with debates on generalizability or letting myths about generalizability go unchallenged. It was moreover highlighted that we should be intrigued with generalizability since qualitative inquiry can produce work that can be generalised. Rather than use a statistical type of generalizability, it was suggested that what qualitative researchers might seek are other types of generalizability. These could include one or more of a combination of naturalistic, transferable, analytical and/or intersectional generalizability. Other types of generalizability that a researcher might choose include flexible generalizability (see Goodman2008) and process generalizability (see Simons2014). Finally, the paper offered three strategies for how a researcher might practically engage with generalizability when seeking to publish qualitative research. By detailing all these points, it is hoped that the paper offers an ‘expanded vision of generalizability.’
일반화에 대한 확대된 비전expanded vision of generalisation을 추구함에 있어, 모든 질적 연구자들이 일반화 가능성을 추구하거나 확립해야 한다고 제안하고 싶지는 않다. 그들이 생산하는 연구는 일반화를 넘어서거나 특정 유형의 일반화 가능성을 통해 포착할 수 없는 이익을 제공할 수 있다. 따라서 모든 정성적 연구가 일반화할 수 있는 결과를 달성하거나 고품질 일반화를 위해 동일한 유형의 일반화 가능성을 추구해야 하는 것은 아니다. 그러나 동시에, 루딘 (2006)이 질적 연구와 관련하여 언급했듯이, "너는 어리석음을 일반화할 수 있어!" (797쪽) 이를 언급하면서, 요점은 일반화는 질적 조사로부터 만들어질 수 있으며, 이것들은 정량적 연구에서 열망하는 것과는 다르다는 것이다(Ruddin 2006). 질적 연구 결과는 일반화될 수 있지만 정량적 결과와 동일한 방식으로 일반화되는 것은 아니다(Braun and Clarke 2013). In seeking an expanded vision of generalisation, I do not wish to suggest that all qualitative researchers must seek or establish generalizability. The research they produce could offer benefits that that go beyond generalisation or which cannot be captured through a certain type of generalizability. Accordingly, not every qualitative study must achieve generalizable results or seek the same type of generalizability to be of high quality. But at the same time, as Ruddin (2006) states in relation to qualitative research, ‘You can generalise stupid!’ (p. 797). In saying this, the point is that generalisations can be made from qualitative inquiry and these are different from those aspired to in quantitative research (Ruddin2006). Qualitative research results can be generalizable, but just not in the same way as quantitative results are (Braun and Clarke2013).
게다가, 나는 이 논문이 스포츠와 운동 과학자들에게 일반화와 같은 다른 맥락에서 우리가 할 수 있는 대화를 자극하는 데 도움이 되는 유용한 자료가 되기를 바란다. 대화 분석가, 분열 분석가, 서술 분석가가 모두 강조하듯이, 대화는 우리의 현실을 구성하고 일을 하는데 도움을 준다. 대화가 구성적이고 행동 지향적이라는 점을 고려할 때, 질적 연구자가 일반화 가능성이 결여된 자신의 작업에 대해 사과하고 싶은 마음이 든다면, [전체 연구를 가이드하는 인식론적 및 존재론적 가정]이 [일반화 가능성에 대해 말하는 방식과 어떻게 일치하는지]만 성찰해서는 안 된다.
Furthermore, I hope this paper is a useful resource for sport and exercise scientists to help stimulate conversations we could have in different contexts about issues like generalizability. As conversational analysts (see LeCouteur and Cosh2016), discursive analysts (see McGannonet al.2017), and narrative analysts (see Papathomas2016) all highlight, conversations help constitute our realities and do things. Given that conversations are constitutive and action-orientated, if a qualitative researcher feels inclined to apologise for their work lacking (statistical-probability) generalizability, they should not only reflect on how their epistemological and ontological assumptions that guide their whole research are aligned with how they talk about generalizability.
연구자들은 특히 감사audit의 문화의 틀에서 짜여진 현재의 사회적, 정치적 풍토 속에, 사과apology를 할 때 생길 수 있는 현실과 행동을 재고할 필요가 있다. 예를 들어, 만약 연구자가 일반화 가능성이 결여된 연구에 대해 사과해야 한다고 느낀다면, 그들은 (광고적으로) 다른 사람들이 질적 조사를 거부하거나 촉진 위원회 검토와 같은 맥락에서 그것을 비하할 수 있는 근거를 제공할 수 있다. 사과함으로써 그들은 질적 연구가 양적 연구보다 열등하다는 입장을 갖게 될 수 있다. 그렇게 함으로써, 연구자는 무심코 방법의 위계를 강화하며, 권력 관계 내에서, 편집자나 검토자가 질적 연구가 표준 미달, 이류 과학, 낮은 우선순위 및 저널에 포함시킬 가치가 없다고 말하는 것에 수긍하게 된다.
They also need to reconsider the possible realities being created and actions when they offer an apology, especially within the current social and political climate framed within an audit culture (see Sparkes2013, Giardina2017). For example, if a researcher feels compelled to apologise for their research lacking generalizability they might (inadvertently) provide a justification for others to reject qualitative inquiry or to demean it in contexts like a promotion committee review. By apologising they could likewise position qualitative research as inferior to quantitative research. In so doing, the researcher might inadvertently reinforce a hierarchy of methods and, within power relations, any understanding an editor or reviewer might hold about qualitative research being sub-standard, a second-class science, a low priority, and/or not worthy of inclusion in journals.
그렇다면, 사과하거나, 비극적이거나, 방어적인 담론을 채택하기 보다는, 대안적 대화를 통해 질적 연구의 독특한 강점에 초점을 맞출 수 있을 것이다.
예를 들어, 연구자는 질적 연구의 강점은 자연주의적이고 이전가능하며 이론적이거나 교차적인 일반화를 도출할 수 있는 방법이라는 점을 지적할 수 있다. 만약 적절하다면, 그들은 또한 그 연구가 어떻게 영향을 미치고 사회에 차이를 만들었는지 강조할 수 있다.
더욱이, 대화, 담론, 서술 분석가는 대화가 (자신 및 다른 사람들과의) 매일 대화와 상호작용의 형태에 내재되어 있을 뿐만 아니라 특정한 제도적 환경과 실천에 자리 잡고 있음을 상기시킨다.
질적 연구자들은 우리끼리만 대화를 하거나, 단순히 같은 생각을 가진 사람들과만 대화를 할 수 없다. 우리는 가르칠 때 스포츠와 운동 과학을 넘나드는 학생들과 연결할 필요가 있습니다. 몇 개의 단체만 언급하자면, 우리는 또한 다른 분야의 비평가, 의심하는 사람들, 그리고 지지자들과 함께 참여해야 할 필요가 있다.
Rather than apologising then, or even adopting a tragic or defensive discourse, an alternative conversation could focus on the unique strengths of qualitative research.
For instance, when appropriate a researcher could point out that a distinctive strength of qualitative research is how it can produce naturalistic, transferable, theoretical and/or intersectional generalisations. If appropriate, they might also highlight how that research achieved impact and made a difference in society (Kay 2016).
Furthermore, a conversational, discursive and narrative analyst would remind us that conversations are embedded in every day forms of talk and interaction (with oneself and others), as well as situated in certain institutional settings and practices (McGannon and Smith 2015, LeCouteur and Cosh 2016).
Given the interactional, occasioned, constitutive and action orientated nature of talk and discourse, qualitative researchers cannot then only have conversations amongst ourselves or simply speak with like-minded people. We need to connect with students from across the sport and exercise sciences when teaching (see Knight 2016). To name just a few groups, we need to also engage with our critics, doubters and supporters from other disciplines.
마찬가지로, 약간의 영향력을 획득하고, 좋은 질적 연구를 긍정적으로 촉진하려면, 우리의 대화는 전통적으로 양적으로 더 지향적인 사람들에 의해 지배되어 왔던 맥락으로 확장될 필요가 있다.
예를 들어, 대학의 질적 연구자는 테마 연구 그룹을 적극적으로 이끌거나, 연구 팀장 또는 학교/교회의 장/학장이거나, 보조금 패널, 추진 위원회 또는 윤리 위원회에서 봉사하는 자원봉사를 할 수 있다.
또한, 외부 영향력 조직과의 양해각서를 개발하고, 정책 입안자를 연구 테이블에 초대하고, 지역 커뮤니티에 참여하고, 자연 과학자와 사회 과학자를 멘토링하고, 학제 간 연구 프로젝트를 시작하고 운영할 수 있습니다.
그러한 일을 할 때, 사무실의 경계에 머물거나 '너무 바쁘다'고 반복해서 말하기 보다는, 일반화 가능성 등에 대한 대화를 시작하고 질적 연구가 번창할 수 있도록 도울 수 있는 방식으로 지시할 수 있다.
오해하지 마십시오. 이 중 어느 것도 쉽거나 간단하거나 항상 실현 가능한 것은 없습니다(Bochner 2014 참조). 하지만 최근 몇 년 동안 다양한 질적 연구자들이 긍정적인 영향을 미치며 그런 일을 하는 것을 봐왔습니다.
Likewise, to achieve some influence and positively promote good qualitative research, our conversations need to extend into contexts that traditionally have been dominated by those who are more quantitatively orientated.
For instance, university qualitative researchers might seek to actively lead a themed research group, be a Head of Research or Head/Dean of a School/Faculty, or volunteer to serve on grant panels, promotion committees, or ethical boards.
Further, and is being done, we might develop memorandum of understandings with external organisations of influence, invite policy-makers to our research table, engage with local communities, mentor natural and social scientists, and/or initiate and run an interdisciplinary research project.
When doing such things, rather than remaining in the confines of our office or repeatedly saying we are ‘too busy’, conversations about generalizability (and so on) can be initiated and directed in ways that can help enable qualitative research to flourish.
Make no mistake – none of that is easy, straightforward, or always feasible (see Bochner 2014). I have, though, over recent years witnessed various qualitative researchers doing such things, with positive affects.
질 높은 질적 연구를 적극적으로 추진하고 일반화 가능성을 논의하려는 질적 연구자들은, 지지적인 자연과학자와 더 정량적으로 지향하는 사회과학자들의 도움을 받을 수 있다고도 할 수 있다. 사람들이 기꺼이 경청하고, 지적으로 호기심이 많고, 경찰 분야에 필요성을 느끼지 않고, 변화를 만들기 위해 최선의 연구를 하고 싶을 때 특히 그렇다. It must equally be said that qualitative researchers seeking to actively promote high quality qualitative research, and discuss generalizability, can be helped by supportive natural scientists and more quantitatively orientated social scientists. That is especially so when people are willing to listen, are intellectually curious, feel no need to police fields and want to do the best research to make a difference.
왜 질적 연구에 약간의 저항이 있다고 생각하느냐고 물었을 때, 모든 사람들은 이런 용어로 대답했다: '질적 연구를 받지 않거나 거의 가치를 보지 못하는 사람들은 대체로 평범한 연구자들이다. 최고의 과학자들은 좋은 질적 연구의 가치를 높이 평가하며, 질문을 고려할 때 적절할 때 더 많은 질적 연구를 원한다'.
When asked why they thought there was some resistance to qualitative research, all responded in these terms: ‘It is largely mediocre researchers who don’t get qualitative research or see little value in it. The best scientists appreciate the value of good qualitative research and want more of it when appropriate given the questions asked’.
질적 연구를 수행하기 위한 다음과 같은 요약과 권고사항이 일반화와 관련하여 제공된다. the following summaries and recommendations for doing qualitative research are offered in relation to generalizability:
(1) 정량적 연구에 정보를 제공하는 통계적 유형의 일반화 가능성은 질적 연구에 사용하고 그 가치를 판단하는 데 적용할 수 없다. 질적 연구는 양적 연구와 다른 인식론적, 존재론적 가정, 논리학 및 목표에 의해 informed by하기 때문이다. 연구자들은 일반화 가능성을 다룰 때 연구에 inform하는 인식론, 온톨로지, 목표, 접근법, 방법론 및 방법의 차이를 인식하고 존중해야 한다. (1) Statistical types of generalizability that inform quantitative research are not applicable to use for qualitative research and to judge the value of it. That is because qualitative research is informed by different epistemological and ontological assumptions, logics and goals to quantitative research. Researchers need to be aware and respectful of the differences in underlying epistemologies, ontologies, goals, approaches, methodologies and methods that inform research when dealing with generalizability.
(2) 질적 연구는 양적 연구와 같은 방식으로 일반화될 수 없다. (2) Qualitative research can be generalizable, just not in the same way as quantitative research.
(3) 질적 연구가 일반화 될 수 있고, 좋은 질적 연구가 항상 일반화 가능성을 표시할 필요는 없기 때문에, 학술지 논문에 질적 작업의 약점이나 한계가 일반화 가능성 부족이라고 쓴 것은 잘못이다. (3) Because qualitative research can be generalizable, and good qualitative research need not always display generalizability, it is a mistake to write in a journal article that a weakness or limitation of qualitative work is its lack of generalizability.
(4) 우리는 한 가지 특정 유형의 일반화 가능성(통계적 확률)에만 제한해서는 안 되며, 모든 연구에 그러한 유형을 부과해야 한다. 질적 연구에 유익한 방법으로 사용될 수 있는 다양한 유형의 일반화 가능성이 있다. 이러한 유형에는 자연주의 일반화, 전이성, 분석 일반화 및 교차 일반화성이 포함된다. 이러한 각 유형의 일반화는 정량적 연구의 일반화가 제공할 수 있는 것과 매우 다르지만 매우 유용하며, 따라서 우리의 지식과 연구 능력에 독특하게 추가된다. (4) We should not restrict ourselves to just one particular type of generalizability – namely, statistical-probability – and impose that type onto all research. There are various types of generalizability that might be used in qualitative research in beneficial ways. These types include naturalistic generalizability, transferability, analytical generalizability and intersectional generalizability. Each of these types of generalisation offers something very different – but highly useful – to what generalizability in quantitative research can provide, thereby uniquely adding to our knowledge and research abilities.
(5) 연구자들은 통계적 확률의 일반화 가능성이 결여된 질적 연구에 대해 사과하거나 친구에게 우리가 오해하고 있다고 한탄하기보다는, 질적 연구의 가치를 보여주고 일반화 가능성에 대한 이슈를 토론함으로써 다양한 그룹과 참여하는 것을 고려할 수 있다. 분명 쉽지 않거나 항상 적용가능하지는 않지만, 우리는 용기를 가지고 리더십의 자리를 차지할 수 있고, 기관들을 넘나들며 우리와 다른 학자들을 참여시키고, 교육하고 권력자들에게 진실을 말할 수 있는 시간을 가질 수 있다.
(5) Rather than apologising for qualitative research lacking statistical-probability generalizability or bemoaning to friends that we are misunderstood, researchers can consider engaging with different groups by showing them the value of qualitative research and debating issues around generalizability. Whilst certainly not easy or always applicable, we can have the courage and take the time to take leadership positions, engage with scholars who are different to us across our institutions, take the time to educate and speak truth to those in power.
(6) 저널 검토자, 편집자 및 정책 입안자는 일반화를 이유로 질적 연구를 무시해서는 안 된다. 그들은 일반화 가능성이 통계적 확률 표본 추출 이론에만 국한되지 않는다는 수많은 학자들의 견해를 이해할 필요가 있다. 일반화에는 다른 유형이 있으며, 따라서 일반화를 위한 또 다른 방법들이 있다. 어떤 유형도 모두 본질적으로 다른 유형보다 좋거나 나쁘지는 않다; 각각은 다른 목적과 다른 결과를 가지고 있으며, 이는 채택된 기본 가정과 방법론에 연결되어 있다.
(6) Journal reviewers, editors and policy-makers should not dismiss qualitative research on grounds of generalizability. They need to appreciate the view held by numerous scholars that generalizability is not limited to statistical-probability sampling theory. There are different types of generalisation, and therefore different ways to generalise. Neither type is inherently better or worse than another; each has different purposes and differing outcomes, which are tied to the underlying assumptions and methodology employed.
(7) 과장하지 않으면서, 또한 연구를 안내하는 존재론적 및 인식론적 가정 내에서 정렬을 지키면서, 연구자는 일반화 가능성을 추구하기 위하여, 독자들에게 [일반화가 가능하다]거나, [일반화의 유형을 뒷받침하기 위해 '증거를 수집'할 수 있음]을 제안하는 것을 고려할 수 있다. 질적 연구자만이 항상 일반화 가능성을 추구할 의무가 있는 것은 아니다. 생성된 연구는 일반화되지 않아도 여전히 큰 이점을 제공할 수 있다.
(7) Without overstating things, and working in alignment within the ontological and epistemological assumptions that guide ones work, when a researcher seeks generalizability they could consider suggesting to readers that their research might be generalizable or ‘gather the evidence’ to support a type(s) of generalizability. Qualitative researchers should not though be obliged to always seek generalizability. The research produced can still offer great benefits without it being generalizable.
Abstract
Generalisation in relation to qualitative research has rarely been discussed in-depth in sport and exercise psychology, the sociology of sport, sport coaching, or sport management journals. Often there is no mention of generalizability in qualitative studies. When generalizability is mentioned in sport and exercise science journals it is often talked about briefly or highlighted as a limitation/weakness of qualitative research. The purpose of this paper is to provide a detailed discussion of generalisation in order to dispel any misunderstandings or myths about generalizability in qualitative research and offer guidance about how researchers might consider generalisation. It is emphasised that it is a misunderstanding to claim that qualitative research lacks generalizability. It is highlighted that statistical types of generalizability that inform quantitative research are not applicable to judge the value of qualitative research or claim that it lacks generalizability. Reasons as to why researchers might consider generalizability in qualitative research are then offered. It is emphasised that generalisations can be made from qualitative research, but just not in the same way as quantitative results are. To help guide how generalisation might be considered, four different types of generalizability are presented: naturalistic generalisation, transferability, analytical generalizability and intersectional generalizability. Practical strategies are also offered for considering generalizability when seeking to publish qualitative research or reflect on already published work. The paper concludes with a set of recommendations to support high quality and rigorous qualitative research for scholars – including journal editors and reviewers – in relation to generalizability.
질적연구에서 포화: 개념과 조작화 탐색(Qual Quant, 2018) Saturation in qualitative research: exploring its conceptualization and operationalization Benjamin Saunders1 • Julius Sim1 • Tom Kingstone1 • Shula Baker1 • Jackie Waterfield2 • Bernadette Bartlam1 • Heather Burroughs1 • Clare Jinks
도입 Introduction
넓은 의미에서, 포화는 질적 연구에서 데이터 수집 및/또는 분석을 중단하는 기준으로 사용된다. 그것의 기원은 근거이론(글레이저와 스트라우스 1967)에 있지만, 현재 질적 연구에 대한 다양한 접근법에 걸쳐 어떤 형태로든 받아들여지고 있다. 실제로, 포화는 종종 그러한 작업 내에서 필수적인 방법론적 요소로 제안된다. Fusch와 Ness (2015: 페이지 1408)는 '포화에 도달하는 데 실패하는 것은 수행된 연구의 질에 영향을 미친다'고 단정적으로 주장한다. Morse (2015: 페이지 587)는 포화도가 '저자들이 제공하는 질적 엄격성의 가장 빈번하게 주장하는 보증'이라고 언급한다. Guest 등은 포화를 '건강 과학 연구에서 목적적 표본 크기가 결정되는 황금률'가 되었다고 언급한다. 많은 저자들이 질적 연구의 포화를 '규칙'(Denny 2009; Sparkes et al. 2011) 또는 '칙령'(Morse 1995)으로 언급하고 있으며, 질적 방법에 대한 여러 가지 일반적인 퀄리티 기준에 등장한다.
In broad terms, saturation is used in qualitative research as a criterion for discontinuing data collection and/or analysis.Footnote1Its origins lie in grounded theory (Glaser and Strauss1967), but in one form or another it now commands acceptance across a range of approaches to qualitative research. Indeed, saturation is often proposed as an essential methodological element within such work. Fusch and Ness (2015: p. 1408) claim categorically that ‘failure to reach saturation has an impact on the quality of the research conducted’;Footnote2Morse (2015: p. 587) notes that saturation is ‘the most frequently touted guarantee of qualitative rigor offered by authors’; and Guest et al. (2006: p. 60) refer to it as having become ‘the gold standard by which purposive sample sizes are determined in health science research.’ A number of authors refer to saturation as a ‘rule’ (Denny2009; Sparkes et al.2011), or an ‘edict’ (Morse1995), of qualitative research, and it features in a number of generic quality criteria for qualitative methods (Leininger1994; Morse et al.2002).
1.일차 연구에 주로 사용되었지만, 포화 원칙은 정성적 합성에도 적용되었다. 그러나 여기서 우리의 초점은 1차 연구에서 사용하는 것에 있다. 1.Although primarily employed in primary research, principles of saturation have also been applied to qualitative synthesis (Garrett et al.2012; Lipworth et al.2013). However, our focus here is on its use in primary studies.
2.이 저자들은 포화가 '양적, 질적 또는 혼합된 방법에 관계없이 모든 연구에서 중요하다'는 보다 극단적인 주장을 펼친다(Fusch and Ness 2015: 페이지 1411). 2.These authors proceed to make the more extreme claim that saturation ‘is important in any study, whether quantitative, qualitative, or mixed methods’ (Fusch and Ness2015: p. 1411).
그러나, 명백하게 정통성의 지위에 도달했음에도 불구하고, 포화상태는 문헌 내에서 다양한 방식으로 정의되거나 때로는 정의되지 않으며, 여러 가지 개념적, 방법론적 문제를 제기한다(Dey 1999; Bowen 2008; O'Reilly and Parker 2013) 본 논문은 문헌의 여러 예를 바탕으로 세 가지 핵심 질문과 관련하여 이러한 문제 중 일부를 탐구하고자 한다. However, despite having apparently attained something of the status of orthodoxy, saturation is defined within the literature in varying ways—or is sometimes undefined—and raises a number of problematic conceptual and methodological issues (Dey1999; Bowen2008; O’Reilly and Parker2013). Drawing on a number of examples in the literature, this paper seeks to explore some of these issues in relation to three core questions:
"포화는 무엇인가?"—포화는 어떤 방식으로 정의되는 거죠?
'어디서 왜?'—어떤 유형의 질적 연구, 그리고 어떤 목적을 위해 포화를 추구해야 하는가?
'언제 어떻게?—연구의 어떤 단계에서 포화를 추구하며, 그것이 달성되었는지 어떻게 평가할 수 있는가?
‘What?’—in what way(s) is saturation defined?
‘Where and why?’—in what types of qualitative research, and for what purpose, should saturation be sought?
‘When and how?’—at what stage in the research is saturation sought, and how can we assess if it has been achieved?
"포화란 무엇인가?"—포화는 어떤 방식으로 정의되는 거죠? ‘What?’—in what way(s) is saturation defined?
글레이저와 슈트라우스는 그들의 근거이론에 대한 최초의 논문에서 포화를 다음과 같이 정의했다. In their original treatise on grounded theory, Glaser and Strauss (1967: p. 61) defined saturation in these terms:
[특정 범주와 관련하여 또 다른 그룹의 표본수집을 중단해야 하는 시기를 판단하는 기준]은 범주의 이론적 포화도이다. 포화상태는 사회학자가 범주의 속성을 개발할 수 있는 추가 데이터가 발견되지 않음을 의미한다. 유사한 사례를 반복해서 보면서, 연구자들은 한 범주가 포화 상태라는 것을 경험적으로 확신하게 된다. 연구자는 가능한 한 다양한 데이터를 확장시켜줄 수 있는 그룹을 찾기 위해 노력합니다. 이러한 노력을 통해 '포화'는 해당 범주에서 가능한 가장 광범위한 데이터를 기반으로 한다는 것을 확실하게 해준다. The criterion for judging when to stop sampling the different groups pertinent to a category is the category’stheoretical saturation.Saturationmeans that no additional data are being found whereby the sociologist can develop properties of the category. As he sees similar instances over and over again, the researcher becomes empirically confident that a category is saturated. He goes out of his way to look for groups that stretch diversity of data as far as possible, just to make certain that saturation is based on the widest possible range of data on the category.
여기서, [의사결정은 '추가 표본 추출을 할 것인지']와 관련이 있으며, 적절한 표본 추출의 결정 요인은 분석 과정에서 이론적 범주theoretical category의 개발 정도와 관련이 있다. 따라서 포화는 [이론적 표본 추출]의 개념과 밀접한 관련이 있다. 이는 표본 추출이 '새롭게 등장하는emerging 이론에 필요한 유사점 및 대비점'에 의해 유도된다는 생각이다. 포화는 연구자가 '샘플링, 데이터 수집, 데이터 분석을 (선형적으로 이뤄지는 별도의 단계로 취급하기보다는) 결합하게끔' 한다.
Here, the decision to be made relates to further sampling, and the determinant of adequate sampling has to do with the degree of development of a theoretical category in the process of analysis. Saturation is therefore closely related to the notion of theoretical sampling—the idea that sampling is guided by ‘the necessary similarities and contrasts required by the emerging theory’ (Dey1999: p. 30)—and causes the researcher to ‘combine sampling, data collection and data analysis, rather than treating them as separate stages in a linear process’ (Bryman2012: p. 18).
Urquhart(2013: 페이지 194)는 근거이론의 관점에서 포화를 다음과 같이 정의한다. '데이터에서 새로운 코드가 발생하지 않는 것을 발견하는 지점을 말한다. 같은 코드를 가진 인스턴스가 있지만 새로운 코드는 없는 것이다' Given은 은 포화 상태를 '추가 데이터가 새로운 Emergent themes를 초래하지 않는' 지점이라고 이야기했다. 다른 사람들도 새로운 코드나 테마의 출현에 대해 비슷한 입장을 취했다. 이러한 정의는 강조의 변화를 보여주며, [두 번째 포화 모델]을 제안합니다. 초점은 [분석 수준]에 머물러 있지만, 결정은 (이미 확인된 코드의 개발 정도보다는) [새로운 코드나 테마의 출현]과 관련이 있는 것으로 보인다. 또한 Urqhart(2013)와 Birks and Mills(2015)는 포화 상태를 [새로운 데이터 수집보다는 분석의 종료]와 주로 연관시킨다.
Also writing from a grounded theory standpoint, Urquhart (2013: p. 194) defines saturation as: ‘the point in coding when you find that no new codes occur in the data. There are mounting instances of the same codes, but no new ones’, whilst Given (2016: p. 135) considers saturation as the point at which ‘additional data do not lead to any new emergent themes’. A similar position regarding the (non)emergence of new codes or themes has been taken by others (e.g. Birks and Mills2015; Olshansky2015).Footnote3These definitions show a change of emphasis, and suggest a second model of saturation. Whilst the focus remains at the level of analysis, the decision to be made appears to relate to the emergence ofnewcodes or themes, rather than the degree of development of those already identified. Moreover, Urqhart (2013) and Birks and Mills (2015) relate saturation primarily to the termination of analysis, rather than to the collection of new data.
3.Birks and Mills (2015)는 또한 이론적 포화의 일부로서 '범주는 명확하게 정의되고 차원화된 특성으로 명확하게 표현된다'고 언급하고 있으며, 이는 새로운 테마의 (비) 출현의 사실보다는 포화에 대한 다소 광범위한 관점을 시사한다는 점에 주목해야 한다. 3.It should be noted that Birks and Mills (2015) also state that, as part of theoretical saturation, ‘Categories are clearly articulated with sharply defined and dimensionalized properties’, suggesting a somewhat broader view of saturation, in which the nature of emerging themes is important, rather than just the fact of their (non)emergence.
그러나 Starks and Trinidad (2007: p. 1375)에 따르면, 이론적인 포화는 '이론을 구성하는 전체 범위의 구조가 데이터로 완전히 표현될 때' 발생한다. 완전히 명시적이지는 않지만, 이 정의는 [다른 논리의 방향성을 가진 세 번째 포화 모델]을 제안한다: '데이터를 고려할 때, 우리는 분석적 또는 이론적 적절성을 가지고 있는가?'가 아니라, '이론을 고려할 때, 우리는 그것을 설명하기에 충분한 데이터를 가지고 있는가?'인 것이다. According to Starks and Trinidad (2007: p. 1375), however, theoretical saturation occurs ‘when the complete range of constructs that make up the theory is fully represented by the data’. Whilst not wholly explicit, this definition suggests a third model of saturation with a different directional logic: not ‘given the data, do we have analytical or theoretical adequacy?’, but ‘given the theory, do we have sufficient data to illustrate it?’Footnote4
4.이것은 슈트라우스의 표본 추출에 대한 접근에 대한 글레이저의 비판을 불러일으킨다. 그는 그것을 이론적인 표본 추출이라기 보다는 관습적인 표본 추출로 간주한다. 슈트라우스에게 발견은 귀납induction와 출현emergence을 의미하는 것이 아니라, 그의 이론을 시험할 수 있도록 데이터에서 찾는 것finding을 의미한다.' (Glaser 1992: 페이지 103). 4.This evokes Glaser’s criticism of Strauss’s approach to sampling, which he regards as conventional, rather than theoretical, sampling: ‘In conventional sampling the analyst questions, guesses and uses experience to go where he thinks he will have the data to test his hypotheses and find the theory that he has preconceived. Discovery to Strauss does not mean induction and emergence, it means finding his theory in data so that it can be tested’ (Glaser1992: p. 103).
근거이론 문헌 밖으로 이동하면, [네 번째 관점은 이론적 포화theoretical saturation보다는 데이터 포화data saturation를 참조하는 것]이 명백해진다(예: Fusch 및 Ness 2015). 이러한 포화 관점은 새로운 것이 드러나지 않을 때까지 [얼마나 많은 데이터(보통 인터뷰 횟수)가 필요]한가, 또는 Sandelowski(2008: 페이지 875)가 '정보 중복성'(예: 프랜시스 외 2010; Guest et al. 2006)이라고 부르는 것에 초점을 맞춘 것으로 보인다. Grady(1998: 페이지 26)는 [데이터 포화]에 대한 유사한 설명을 제공한다: If we move outside the grounded theory literature,Footnote5a fourth perspective becomes apparent in which there are references todatasaturation, rather thantheoreticalsaturation (e.g. Fusch and Ness2015).Footnote6This view of saturation seems to centre on the question of how much data (usually number of interviews) is needed until nothing new is apparent, or what Sandelowski (2008: p. 875) calls ‘informational redundancy’ (e.g. Francis et al.2010; Guest et al.2006). Grady (1998: p. 26) provides a similar description of data saturation as the point at which:
새로운 데이터는 이미 수집된 데이터를 중복하는 경향이 있습니다. 인터뷰에서 연구원이 동일한 의견을 계속해서 듣기 시작하면 데이터 포화 상태에 도달하게 됩니다. 이제 정보 수집을 중단하고 수집된 정보를 분석하기 시작해야 할 때입니다. New data tend to be redundant of data already collected. In interviews, when the researcher begins to hear the same comments again and again, data saturation is being reached… It is then time to stop collecting information and to start analysing what has been collected.
5.Charmaz(2008, 2014)는 근거이론의 맥락을 넘어선 포화 개념의 확장에 비판적이다. 특히 데이터 포화라고 부르는 것으로의 확장에 대해 그렇다. 5.Charmaz (2008,2014) is critical of the extension of the notion of saturation beyond the context of grounded theory, and in particular of its extension into what we here refer to as data saturation.
6.데이터 포화와 이론적 포화를 명시적으로 구분하는 저자는 거의 없다. 6.Few authors draw an explicit distinction between data and theoretical saturation—among the exceptions are Bowen (2008), Sandelowski (2008), O’Reilly and Parker (2013), and Hennink et al. (2017).
다른 몇몇 연구진도 유사한 방식으로 데이터 포화도를 정의한 반면, 레가드 등은 [데이터 포화에 관하여조금 더 협소하고 개인 지향적인 관점]을 채택하는 것으로 보인다. 즉, 포화는 데이터 세트 전체 수준이 아니라 [개별 참가자가 제공한 데이터]와 관련하여 작동한다. 즉, 포화는 [특정 인터뷰 내의 특정 지점]에서 달성된다. Whilst several others have defined data saturation in a similar way (e.g. Hill et al.2014: p. 2; Middlemiss et al.2015; Jackson et al.2015), Legard et al. (2003) seem to adopt a narrower, more individual-oriented perspective on data saturation, whereby saturation operates not at the level of the dataset as a whole, but in relation to the data provided by an individual participant; i.e. it is achieved at a particular point within a specific interview:
연구자가 참가자의 관점을 완전히 이해한 포화 상태에 도달했다고 느낄 때까지 조사를 계속할 필요가 있다(Legard 등 2003: 페이지 152). Probing needs to continue until the researcher feels they have reached saturation, a full understanding of the participant’s perspective (Legard et al.2003: p. 152).
이러한 관점에서, 데이터에 대한 연구자의 대응(새로운 '정보'의 생성 여부에 대한 의사결정)이 반드시 분석 자체의 일부로 인식되지는 않는다. 따라서 이 모델에서 포화 과정은 [주로 데이터 수집 수준에 위치]하며, 데이터 분석의 전체 프로세스, 즉 이론과 분리된다. From this perspective, the researcher’s response to the data—through which decisions are made about whether or not any new ‘information’ is being generated—is not necessarily perceived as forming part of the analysis itself. Thus, in this model, the process of saturation is located principally at the level of data collection and is thereby separated from a fuller process of data analysis, and hence from theory.
따라서 네 가지 다른 포화 모델이 존재하는 것으로 보인다(표 1).
1. 첫 번째는 전통적인 근거이론에 뿌리를 두고 있으며, [이론적 표본 추출]의 개념에 따라서, [분석 과정에서의 범주 개발과 새롭게 만들어지는 이론Emerging theory]을 [추가 데이터 수집의 기준]으로 사용한다. 일반적으로 사용되는 용어를 사용하지만, 더 구체적인 정의에 초점을 둔다면, 이 모델은 [이론적인 포화theoretical saturation]로 분류될 수 있다.
2. 두 번째 모델은 유사한 접근방식을 취하지만, 포화도는 [새로운 코드나 테마의 식별]에 초점을 맞추고 있으며, 기존의 [이론적 범주의 완전성]보다는, 그러한 [코드나 테마의 수]를 기반으로 한다. 이것은 [귀납적 주제 포화inductive thematic saturation]이라고 할 수 있다. 이 모델에서 포화도는 [분석 수준에 국한된 것]으로 보이며, 데이터 수집에 대한 의미는 기껏해야 함축적이다.
3. 세 번째 모델에서는 앞선 논리가 반전되는데, 여기서 데이터는 (이론을 발전시키거나 정제refine하기보다는), [낮은 단계의 코드나 테마 수준에서 이론을 예시exemplify]하기 위해 수집된다. 이 모델은 사전 결정된 이론적 범주의 개념을 가리키고 근거 이론의 '귀납적 논리'라는 특성으로부터 우리를 멀어지게 하기 때문에, [선험적 주제 포화a priori thematic saturation]라고 불릴 수 있다.
4. 네 번째 모델은 포화도를 [데이터에서 중복성을 식별하는 문제]로 간주하며, 이러한 데이터에 연결된 이론을 참조할 필요가 없다. 이러한 포화를 일반적으로 사용되고 있는 용어에 맞추어 [데이터 포화data saturation]라고 합니다. 네 번째 모델에서 포화는 공식적인 [데이터 분석과는 구별되는 것]으로 보입니다. Four different models of saturation seem therefore to exist (Table 1).
The first of these, rooted in traditional grounded theory, uses the development of categories and the emerging theory in the analysis process as the criterion for additional data collection, driven by the notion of theoretical sampling; using a term in common use, but with a more specific definitional focus, this model could thus be labelled astheoretical saturation.
The second model takes a similar approach, but saturation focuses on the identification of new codes or themes, and is based on the number of such codes or themes rather than the completeness of existing theoretical categories. This can be termedinductive thematic saturation. In this model, saturation appears confined to the level of analysis; its implication for data collection is at best implicit.
In the third model, a reversal of the preceding logic is suggested, whereby data is collected so as toexemplifytheory, at the level of lower-order codes or themes, rather than todeveloporrefinetheory. This model can be termeda priori thematic saturation, as it points to the idea of pre-determined theoretical categories and leads us away from the inductive logic characteristic of grounded theory.
Finally, the fourth model—which, again aligning with the term already in common use, we will refer to asdata saturation—sees saturation as a matter of identifying redundancy in the data, with no necessary reference to the theory linked to these data; saturation appears to be distinct from formal data analysis.
'하이브리드' 형태의 포화 ‘Hybrid’ forms of saturation
일부 저자들은 위에서 정의한 [두 개 이상의 모델을 결합]하여 개념화를 덜 구별되게 하는 포화 해석을 지지하는 것으로 보인다. 예를 들어, Goulding(2005)은 데이터와 이론 모두 근거이론 내에서 포화되어야 한다고 제안했고, Drisko(1997: 페이지 192)는 포화를를 '데이터 수집과 분석의 포괄성' 측면에서 정의했다. 비슷하게, 모스의 포화에 대한 관점은 [이론적인 요소와 데이터 포화 요소 모두를 구체화한 것]으로 보인다. 그녀는 데이터 포화 과정을 제안하는 방식으로 포화 상태를 복제 개념과 연결한다. Some authors appear to espouse interpretations of saturation that combine two or more of the models defined above, making its conceptualization less distinct. For example, Goulding (2005) suggests that both data and theory should be saturated within grounded theory, and Drisko (1997: p. 192) defines saturation in terms of ‘the comprehensiveness of both the data collection and analysis’. Similarly, Morse’s view of saturation seems to embody elements of both theoretical and data saturation. She links saturation with the idea of replication, in a way that suggests a process of data saturation:
그러나 도메인이 완전히 샘플링되면(모든 데이터가 수집되면) 데이터의 복제가 발생하고 이 복제를 통해 포화 신호가 발생합니다(Morse 1995: 페이지 148).
However, when the domain has been fully sampled – when all data have been collected – then replication of data occurs and, with this replication… the signal of saturation (Morse1995: p. 148).
모스는 자신의 학생들이 '언제 포화 상태에 이르렀는지를 알 수 있다. 바로 더 일반적인 용어로 데이터에 대해 이야기하기 시작하는 때, 그리고 질문을 받았을 때 예시를 쉽게 제공할 수 있는 때이다. 학생들이 자신의 데이터를 '알고' 있는 것이다.' (모스 2015: 페이지 588) 이 역시 [데이터 포화 형태]를 시사한다. 그러나 모스는 또한 '개념의 특성을 파악하고 이론을 발전시키기에는 각 범주에 예시가 너무 적을 때'는 포화가 결여되었다고 제안한다. 이러한 관점은 [데이터 수준]과 [데이터가 이론을 예시하는 방식]에 큰 중점을 두고 있으므로 데이터와 이론적 포화 상태를 모두 환기시키는 것처럼 보이지만, 이론 개발의 개념에 확고히 자리 잡고 있는 것으로 보인다.
Morse notes elsewhere that she is able to tell when her students have achieved saturation, as they begin to talk about the data in more generalized terms and ‘can readily supply examples when asked. These studentsknowtheir data’ (Morse2015: p. 588). This too suggests a form of data saturation. However, Morse also proposes that saturation is lacking when ‘there are too few examples in each category to identify the characteristics of concepts, and to develop theory’ (Morse2015: p. 588). This perspective seems to be located firmly in the idea of theory development (as other parts of the quoted papers by Morse make clear), though a heavy emphasis is placed at the level of the data and the way in which the data exemplify theory, thereby seeming to evoke both data and theoretical saturation.
Hennink 등(2017)은 더 나아가 네 가지 포화 모델의 요소를 모두 결합한 것으로 보인다. 그들은 먼저 '코드 포화'를 식별한다. 이는 [귀납적 주제 포화 요소]와 [데이터 포화] 요소를 결합한 것으로 보인다. 즉, '추가 문제가 식별되지 않고 코드북이 안정화되기 시작하는 지점'이다. 그러나, 이 접근법 내에서 포화는 귀납적으로 개발된 코드뿐만 아니라 세 번째 모델인 [선험적 주제적 포화]를 반영하는 [선험적 코드]와도 관련이 있는 것으로 논의된다. 그들은 또한 '코드 포화'와 '의미 포화'를 구별한다. '의미 포화'에서 분석가는 '[구체적 코드]로부터 [개념적 코드나 개념적 차원]을 완전히 이해하려고 한다'. 코드의 차원을 포화시키는 것에 대한 이러한 초점은 이론적 포화와 더 유사한 것처럼 보인다. 그러나 그들의 분석은 이러한 [코드에서 개발된 이론적 범주]보다는 [코드 수준]에 머무르며, Hennink 등은 그들의 접근방식을 명시적으로근거이론 방법의 외부에 배치한다. Hennink et al. (2017) go further, appearing to combine elements of all four models of saturation. They firstly identify ‘code saturation’, the point at which ‘no additional issues are identified and the codebook begins to stabilize’ (2017: p. 4), which seems to combine elements of both inductive thematic saturation and data saturation. However, within this approach saturation is discussed as relating not only to codes developed inductively, but also to a priori codes, which echoes the third model: a priori thematic saturation. They go on to distinguish ‘code saturation’ from ‘meaning saturation’; in the latter, the analyst attempts to ‘fully understand conceptual codes or the conceptual dimensions of… concrete codes’ (2017: p. 14). This focus on saturating the dimensions of codes seems more akin to theoretical saturation; however, their analysis remains at the level of codes, rather than theoretical categories developed from these codes, and Hennink et al. explicitly position their approach outside grounded theory methods.
'어디서 왜?'—어떤 유형의 질적 연구, 그리고 어떤 목적을 위해 포화를 추구해야 하는가? ‘Where and why?’—in what types of qualitative research, and for what purpose, should saturation be sought?
모스(2015: 페이지 587)는 포화가 모든 질적 연구에서 '존재'하고 있으며, 질적 연구에서 표본 크기를 결정하기 위한 '황금률'로 간주되며, 질적 연구의 다른 유형 간 차이는 거의 없다. 우리는 이 관점에 의문을 제기한다. 대신 이전 절에서 고려된 다른 포화 모델에서 제안된 바와 같이, [포화는 이론의 역할에 따라 다른 관련성과 다른 의미]를 가지며, 이러한 관점은 질적 연구방법의 여러 스펙트럼에 걸쳐 그것의 적용에 의문을 제기했던 다른 연구자들도 어느 정도 지지하고 있다. (Walker 2012; O'Reilly and Parker 2013; van Manen et al. 2016) Morse (2015: p. 587) takes the view that saturation is ‘present in all qualitative research’ and as previously noted, it is commonly considered as the ‘gold standard’ for determining sample size in qualitative research, with little distinction between different types of qualitative research. We question this perspective, and would instead argue—as is suggested by the different models of saturation considered in the previous section—that saturation has differing relevance, and a different meaning, depending on the role of theory, a viewpoint somewhat supported by other commentators who have questioned its application across the spectrum of qualitative methods (Walker2012; O’Reilly and Parker2013; van Manen et al.2016).
연역적 접근법(즉, 데이터에 사전 식별된 코드, 테마 또는 기타 분석 범주를 귀납적으로 나타내기 보다는 전체적으로 또는 주로 적용하는 접근법)에서 포화는 [사전 결정된 코드 또는 테마가 데이터에 적절하게 표현되는 정도]를 나타낼 수 있다. 위에 요약된 [선행 주제 포화 모델]에서 제안된 바와 같이, 범주가 데이터의 인스턴스(instance)로 충분히 채워지는 것을 의미한다. 따라서 포화도에 대한 적절한 표본 크기를 설정하려는 시도에서, 프랜시스 등은 [포화]를 [내용 타당도 개념]과 연결하였다. 대조적으로, 귀납적 접근법(예: 위에서 설명한 귀납적 주제 포화 모델 및 이론적 포화 모델)에서, 포화도는 데이터 내에서 '새로운' 코드나 테마가 식별되는 정도 및 이 과정을 통해 데이터에서 새로운 이론적 통찰력을 얻는 정도를 제시한다. In a largely deductive approach (i.e. one that relies wholly or predominantly on applying pre-identified codes, themes or other analytical categories to the data, rather than allowing these to emerge inductively) saturation may refer to the extent to which pre-determined codes or themes are adequately represented in the data—rather like the idea of the categories being sufficiently replete with instances, or ‘examples’, of data, as suggested in the a priori thematic saturation model outlined above. Thus, in their attempt to establish an adequate sample size for saturation, Francis et al. (2010) refer explicitly to research in which conceptual categories have been pre-established through existing theory, and it is significant in this respect that they link saturation with the notion of content validity. In contrast, within a more inductive approach (e.g. the inductive thematic saturation and theoretical saturation models outlined above), saturation suggests the extent to which ‘new’ codes or themes are identified within the data, and/or the extent to which new theoretical insights are gained from the data via this process.
연역적 접근법과 귀납적 접근법 모두에서, 분석에 대한 근본적인 접근법은 본질적으로 주제적이며, 대개 다수의 정보 제공자를 포함하는 인터뷰 또는 포커스 그룹 연구의 맥락에서 발생하기 때문에, 각각의 경우에 따라 포화의 역할을 이해할 수 있다. 분석에 대한 전기적 또는 서술적 접근법에 기초하거나 보다 일반적으로 개별 정보 제공자의 설명에 대한 특정 초점을 포함하는 질적 접근법에서 포화 역할을 식별하는 것은 덜 간단하다(예: 해석적 현상학적 분석. 이러한 연구에서 분석은 분석적 주제themes보다는 개별 accounts의 가닥strand에 더 집중하는 경향이 있다. 가닥은 본질적으로 연속적인 반면, 테마는 본질적으로 반복적이다.
In both the deductive and the inductive approach, we can make sense of the role of saturation, however much it differs in each case, because the underlying approach to analysis is essentially thematic, and usually occurs in the context of interview or focus group studies involving a number of informants. It is less straightforward to identify a role for saturation in qualitative approaches that are based on a biographical or narrative approach to analysis, or that, more generally, include a specific focus on accounts ofindividualinformants (e.g. interpretative phenomenological analysis). In such studies, analysis tends to focus more onstrandswithin individual accounts rather than on analyticalthemes; these strands are essentially continuous, whereas themes are essentially recurrent.
포화가 목적을 명확히 하는 데 도움이 될 수 있는 다양한 유형의 연구를 고려한다.
연역적 접근법에서 사용될 때, 포화는 데이터가 이전에 결정된 개념 범주를 instantiate하는 정도를 입증하는 역할을 한다.
반면, 귀납적 접근법, 특히 근거이론에서 포화는 이론 개발과 관련하여 표본 추출의 적절성에 대해 무언가를 알려준다.(비록 이것이 얼마나 구체적으로 달성되어야 하는지에 대한 서로 다른 설명들이 있다는 것을 알긴 하지만.)
Considering the various types of research in which saturation might feature helps to clarify the purposes it is intended to fulfil.
When used in a deductive approach to analysis, saturation serves to demonstrate the extent to which the data instantiate previously determined conceptual categories,
whereas in more inductive approaches, and grounded theory in particular, it says something about the adequacy of sampling in relation to theory development (although we have seen that there are differing accounts of how specifically this should be achieved).
내러티브 연구에서, 포화를 위한 역할은 구별하기가 더 어렵다. 이론의 충분한 발전이라기보다는 전기적인 서술의 '완전성'을 나타내는 것으로 보일 수 있다. 그러나 참가자의 이야기가 '완전'으로 해석되는 지점(연구의 초점과 관련이 있어 보이는 모든 것을 전달한 때)이 사실 포화 개념에 의해 유용하게 묘사되는 것인지 의문을 가질 수 있다. 이것은 더 나아가 잠재적인 개념화와 용도가 너무 광범위하게 확장되면, [포화의 일관성과 효용성을 잃을 위험이 있는지]에 대한 의문을 갖게 만들 수도 있다.
In narrative research, a role for saturation is harder to discern. Rather than the sufficient development of theory, it might be seen to indicate the ‘completeness’ of a biographical account. However, one could question whether the point at which a participant’s story is interpreted as being ‘complete’—having presumably conveyed everything seen to be relevant to the focus of the study—is, in fact, usefully described by the concept of saturation, given the distance that this moves us away from the operationalization of saturation in broadly thematic approaches. This might, furthermore, lead us to ask whether there is the risk of saturation losing its coherence and utility if its potential conceptualization and uses are stretched too widely.
동일한 이슈가 [포화를 위해 제안된 여러 가지 목적]과도 관련이 있다. 예를 들어 코딩의 신뢰성을 입증한다고 되었지만, 포화는 [코딩 결정의 직접적이고 자동적인 결과]이기 때문에, 어떻게 그것이 품질의 독립적인 척도가 될 수 있는지는 명확하지 않다. Dubé 등은 포화 상태가 (결정적이지는 않더라도) 발견을 추론하는 능력에 대해 무언가를 말해준다고 제안한다. Boddy는 '포화에 도달하면, 그 결과는 어느 정도 일반화될 수 있어야 한다'고 주장한다. Boddy의 주장은 우리를 [분석의 이론적 적절성의 개념과 이론의 설명적 범위]에서 훨씬 더 [경험적인 일반화 가능성]의 감각으로 이동시키는 것처럼 보인다. 이러한 두 가지 경우에 포화도를 사용하면 앞에서 설명한 다른 포화 모델을 고려하더라도 포화의 의미와 목적에 대한 일부 연구에서 혼란의 정도를 나타낼 수 있다. 따라서, 우리는 포화가 개념적으로 의미 있고 실질적으로 유용하기 위해서는 포화가 적용될 수 있는 목적에 어느 정도 제한이 있어야 한다고 제안한다. The same issue is relevant with regard to a number of other, less obvious, purposes that have been proposed for saturation. For example, it has been claimed to demonstrate the trustworthiness of coding (Damschroder et al.2007)—but as saturation will be a direct and automatic consequence of one’s coding decisions, it is not clear how it can be an independent measure of their quality. Dubé et al. (2016) suggest that saturation says something about (though not conclusively) the ability to extrapolate findings, and Boddy (2016: p. 428) claims that ‘once saturation is reached, the results must be capable of some degree of generalisation’; this seems to move us away from the notion of the theoretical adequacy of an analysis, and the explanatory scope of a theory, toward a much more empirical sense of generalizability. The use of saturation in these two cases could perhaps indicate a degree of confusion in some studies about the meaning of saturation and its purpose, even when taking into account the differing models of saturation outlined earlier. Therefore, we would suggest that for saturation to be conceptually meaningful and practically useful there should be some limit to the purposes to which it can be applied.
'언제 어떻게?—연구의 어떤 단계에서 포화를 추구하며, 그것이 달성되었는지 어떻게 평가할 수 있는가? ‘When and how?’—at what stage in the research is saturation sought, and how can we assess if it has been achieved?
포화에 대한 관점 Perspectives taken on saturation
주어진 연구 내에서 포화가 의미하는 바를 어떻게 바라보느냐에 따라, 언제 포화를 추구할지가 달라질 것이다. 앞에서 식별된 [네 번째 포화 모델](정보 중복성의 개념에 기초한 데이터 포화 접근방식)을 취하면, 이러한 관점에서 포화는 종종 [공식적인 분석으로부터 분리]되고, [공식적인 분석 이전 단계의 무엇]으로 간주되기 때문에, 프로세스의 초기 단계에서 식별될 수 있는 것이 분명하다. [추가 데이터 수집이 불필요한 시기에 대한 결정]은 일반적으로 인터뷰 내에서 듣고 있는 것에 대한 연구자의 감각에 기초하며, 따라서 이 결정은 코딩과 범주 개발 전에 내려질 수 있다.
The perspective taken on what is meant by saturation within a given study will have implications for when it will be sought. Taking the fourth model of saturation identified earlier—the data saturation approach, as based on the notion of informational redundancy—it is clear that saturation can be identified at an early stage in the process, as from this perspective saturation is often seen as separate from, and preceding, formal analysis. Decisions about when further data collection is unnecessary are commonly based on the researcher’s sense of what they are hearing within interviews, and this decision can therefore be made prior to coding and category development.
그러나 이 단계에서 [무엇이 주제theme를 구성할 수 있는지에 대한 해석]은, 심지어 식별된 주제가 포화 상태인지에 대해 고려하기도 전에 이뤄지는 것으로, 기껏해야 피상적일 것이다. 게다가, 이 단계에서 도달한 결론은 후속 이론 개발과 관련하여 특별히 유익하지 않을 수 있다. 처음 고려되었을 때 매우 유사한 것으로 보이는 데이터 조각이 상세한 분석후에 서로 다른 이론적 구성의 예시로 발견될 수 있고, 반대로, 경험적으로 서로 다른 데이터가 이론적으로 많이 일치하는 것으로 판명될 수 있다. 이 단계의 판단은 [이론적으로 미숙하며, 상당한 수정이 필요할 수 있는] 주제와 범주의 프레임과 관련되어있을 것이다. 예를 들어, 근거이론에서 개방코딩, 선택코딩, 이론코딩의 연속적인 단계 동안 변화들이 발생할 수 있다.
However, interpretations at this stage regarding what might constitute a theme, before even beginning to consider whether identified themes are saturated, will be superficial at best. Moreover, conclusions reached at this stage may not be particularly informative as regards subsequent theory development—pieces of data that appear to be very similar when first considered may be found to exemplify different theoretical constructs on detailed analysis, and correspondingly, data that are empirically dissimilar may turn out to have much in common theoretically. Judgments at this stage will also relate to a framework of themes and categories that is theoretically immature, and that may be subject to considerable modification; for example, the changes that may occur during the successive stages of open, selective and theoretical coding in grounded theory (Glaser1978).
[두 번째 모델]인 [귀납적 주제 포화]에 관하여, 포화를 판단할 때 분석 수준(즉, 코드 또는 테마가 출현하거나 출현하지 않는 것과 관련)에 더 명시적으로 초점을 맞춘다는 사실은, 포화가 (데이터 포화 접근방식보다) 더 후기 단계에서 달성될 것임을 암시할 수 있다(많은 정성적 접근방식에서 데이터 수집과 분석의 동시적에 진행되긴 하지만). 그렇긴 하지만, [이론적 개발]보다 [코드의 출현]에 초점을 맞추게 되면, 여전히 비교적 이른 단계에서 포화에 달성되게 한다.
With regard to the second model identified, inductive thematic saturation, the fact that the focus is more explicitly on reaching saturation at the level of analysis—i.e. in relation to the (non-)emergence of new codes or themes—might suggest it will be achieved at a later stage than in data saturation approaches (notwithstanding the concurrent nature of data-collection and analysis in many qualitative approaches). However, focusing on the emergence or otherwise of codes rather than on their theoretical development still points us towards saturation being achieved at a relatively early stage.
Hennink 등은 [코드의 포화]가 [코드와 관련된 '차원, 뉘앙스 또는 통찰력'의 포화]보다 더 이른 시점에 달성되었음을 발견했다. 헤닝크 등은 코드의 수에만 의존하는 포화 접근방식은 이러한 코드의 '의미'에 대한 이해 부족으로 인해 '포화 지점을 놓친다'고 주장한다. Hennink et al. (2017) highlight this in a study on patient retention in HIV care, in which they found that saturation of codes was achieved at an earlier point than saturation of the ‘dimensions, nuances, or insights’ related to codes. Hennink et al. argue that an approach to saturation relying only on the number of codes ‘misses the point of saturation’ (2017: p. 15) owing to a lack of understanding of the ‘meaning’ of these codes.
[데이터 포화(네 번째) 및 [귀납적 주제 포화(두 번째)와는 달리, [첫 번째 포화 모델]인 [이론적 포화]는 분석 과정이 [더 발전된 단계와 더 높은 수준의 이론적 일반성]에 있음을 나타낸다. 첫 번째 모델은 [이론적 범주의 특성이 적절하게 개발된 시점이 언제인가]를 결정하는 근거이론에 기반을 두고 있다. 따라서, 자오와 데이비(2015: 페이지 1178)는 '이론적 완전성'에 의해 결정되는 포화의 형태를 가리키며 '근거 이론의 각 범주의 차원과 간극이 설명되었을 때' 샘플링을 중단했다.
In contrast to data saturation and inductive thematic saturation, the first model of saturation considered, theoretical saturation—as based on the grounded theory notion of determining when the properties of theoretical categories are adequately developed—indicates that the process of analysis is at a more advanced stage and at a higher level of theoretical generality. Accordingly, Zhao and Davey (2015: p. 1178) refer to a form of saturation determined by ‘theoretical completeness’ and ceased sampling ‘when dimensions and gaps of each category of the grounded theory had been explicated,’ .
사건 또는 프로세스로서의 포화 Saturation as event or process
포화를 식별하는 데 기초가 되는 핵심 이슈는 [사건이나 과정으로 보는 범위가 어디까지인가]이다. 일반적으로 포화는 '점point'이라고 부르며, 이는 분석가가 인지할 수 있는 이산적 사건으로 간주해야 함을 시사한다. 그러나
Strauss와 Corbin은 [포화상태에 대해 '정도의 문제']로서 언급하며, '새로운 것'이 항상 나타날 가능성이 있다고 주장한다. 그들은 포화 상태가 추가적인 데이터 수집이 '반생산적'이 되는지 여부를 고려해야 하며, '반생산적'이란 '새로운 것'이 전체 이야기나 이론에 어떤 것도 추가하지 않는 지점에 도달하는 것이다.
Mason(2010)은 [추가 데이터 수집으로 인한 '수익성의 저하diminishing returns'가 발생하는 지점]에 대해 유사한 주장을 하며, 많은 연구자들은 포화에 대해 이러한 점진적 접근법을 취하는 것으로 보인다.
넬슨(2016)은 Dey (1999)의 초기 관점을 반영하며, '포화'라는 용어는 문제가 있는데, 왜냐하면 직관적으로 고정된 지점과 '완전성completeness'의 관점에서 사고하게끔 만들기 때문이다. 따라서 그는 적어도 근거이론의 관점에서는, '개념의 깊이conceptual depth'가 더 적절한 용어일 수 있다고 주장한다. 이러한 관점에서 포화를 판단할 때 연구자는 [새로운 이론적 범주와 관련하여 충분한 이해 깊이가 달성되었는지 여부]를 고려한다.
A key issue underlying the identification of saturation is the extent to which it is viewed as an event or a process. Commonly, saturation is referred to as a ‘point’ (e.g. Otmar et al.2011; Jassim and Whitford2014; Kazley et al.2015), suggesting that it should be thought of as a discrete event that can be recognized as such by the analyst.
Strauss and Corbin (1998: p. 136), however, talk about saturation as a ‘matter of degree’, arguing that there will always be the potential for ‘the “new” to emerge’. They suggest that saturation should be more concerned with reaching the point where further data collection becomes ‘counter-productive’, and where the ‘new’ does not necessarily add anything to the overall story or theory.
Mason (2010) makes a similar argument, talking of the point at which there are ‘diminishing returns’ from further data-collection, and a number of researchers seem to take this more incremental approach to saturation.
Nelson (2016), echoing Dey’s (1999) earlier view, argues that the term ‘saturation’ is itself problematic, as it intuitively lends itself to thinking in terms of a fixed point and a sense of ‘completeness’. He thus argues that ‘conceptual depth’ may be a more appropriate term—at least from a grounded theory perspective—whereby the researcher considers whether sufficient depth of understanding has been achieved in relation to emergent theoretical categories.
포화에 대한 이러한 점증적 읽기에서, 분석결과는 한 번의 추가 인터뷰 후에 [어느 순간 갑자기 '풍부rich'해지거나 '통찰적insightful'이 되는 것]이 아니라, 아마도 [점진적으로 더 풍부해지거나richer 더 통찰력more insightful이 있게] 된다. 그렇다면 질문은 '포화가 얼마나 일어났는가'가 아니라 ['지금의 포화가 얼마나 충분한가']가 될 것이다. 이것은 덜 간단한 질문이지만, 이것이 분석가의 결정의 문제일 수 있다는 사실을 더 잘 강조하는 질문이다. 즉, 포화상태는 특정 시점에서 정확히 지적할 수 있는 것이 아니라, [진행 중인 누적적 판단]이며 아마도 결코 완료되지 않을 것이다.
On this incremental reading of saturation, the analysis does not suddenly become ‘rich’ or ‘insightful’ after that one additional interview, but presumably becomes richerormoreinsightful. The question will then be ‘how much saturation is enough?’, rather than ‘has saturation occurred?’Footnote7This is a less straightforward question, but one that much better highlights the fact that this can only be a matter of the analyst’s decision—saturation is an ongoing, cumulative judgment that one makes, and perhaps never completes,Footnote8rather than something that can be pinpointed at a specific juncture.
7.따라서 Dey(1999: 페이지 117)는 '포화' 대신에 '충족'이라는 용어를 제안한다. 7.Hence, Dey (1999: p. 117) suggests the term ‘sufficiency’ in preference to ‘saturation’.
8.이것은 이론 생성에 대한 글레이저와 스트라우스의 관점을 반영한다: '누군가는 그의 이론을 변화시키고 발전시키는 데 도움이 될 새로운 관점에 지속적으로 주의를 기울인다. 이러한 관점은 연구 마지막 날이나 심지어 원고를 페이지 교정본으로 검토할 때에도 쉽게 나타날 수 있기 때문에 출판된 단어는 최종적인 것이 아니라 이론 생성 과정의 끝없는 중단일 뿐이다.' 8.This reflects Glaser and Strauss’s (1967: p. 40) view of theory generation: ‘one is constantly alert to emergent perspectives that will change and help develop his theory. These perspectives can easily occur even on the final day of study or even when the manuscript is reviewed in page proof; so the published word is not the final one, but only a pause in the never-ending process of generating theory’.
불확실성과 애매모호 Uncertainty and equivocation
포화가 달성되는 특정 시점을 식별하려는 욕구는 종종 불확실성이나 애매모호함을 야기하는 것으로 보인다. 많은 연구에서 포화에 달성했다고 언급하지만, 추가적인 데이터 수집은 이러한 주장을 'confirm' 또는 '유효성 확인validate'하기 위한 명백한 시도로 이루어진다. A desire to identify a specific point in time at which saturation is achieved seems often to give rise to a degree of uncertainty or equivocation. In a number of studies, saturation is claimed, but further data collection takes place in an apparent attempt to ‘confirm’ (Jassim and Whitford2014: p. 191; Forsberg et al.2000: p. 328) or ‘validate’ (Vandecasteele et al.2015: p. 2789) this claim; for example:
10차 면접이 끝난 후, 면접을 통해 창출된 새로운 테마는 없었다. 따라서, 데이터 수집이 포화 상태에 도달했다고 간주되었다. 새로운 테마가 등장하지 않음을 확인하고 확인하기 위해 두 번의 인터뷰를 위해 데이터 수집을 계속했습니다. After the 10th interview, there were no new themes generated from the interviews. Therefore, it was deemed that the data collection had reached a saturation point. We continued data collection for two more interviews to ensure and confirm that there are no new themes emerging (Jassim and Whitford (2014: pp. 190–191).
또한, 포화 증거에 대한 의존을 꺼리는 것은, 포화가 기껏해야 불분명하거나, 최악의 경우 일관성이 없는 방식으로 사용되고 있음을 나타낸다. 예를 들어, Hill 등(2014: 페이지 2)은 포화 원리를 지지하면서도 이를 완전히 신뢰하지는 않는 것으로 보인다. Furthermore, a reluctance to rely on evidence of saturation sometimes indicates that saturation is being used in at best an unclear, or at worst an inconsistent or incoherent, fashion. For example, Hill et al. (2014: p. 2), whilst espousing the principle of saturation, seem not fully to trust it:
포화는 채용 기간 내내 지속적으로 모니터링되었습니다. 완성도를 위해 테마를 놓칠 가능성을 줄이기 위해 모든 참가자 그룹 전체 모집을 선택했습니다. Saturation was monitored continuously throughout recruitment. For completeness we chose to fully recruit to all participant groups to reduce the chance of missed themes.
잭슨 외 연구진도 비슷합니다. (2000: 페이지 1406)는 포화가 확립되었다고 주장하지만, 그리고나서는 다소 후퇴하는 것으로 보인다. Similarly, Jackson et al. (2000: p. 1406) claim that saturation had been established, but then appear to retreat somewhat from this conclusion:
8개 데이터 세트를 분석한 후 데이터 포화도를 설정했지만 데이터 포화도를 확보하기 위해 2명의 추가 참가자를 모집했다. Following analysis of eight sets of data, data saturation was established… however, two additional participants were recruited to ensure data saturation was achieved.
콘스탄티누 외 연구진(2017)은 포화 지점에 대한 불확실성의 가능성을 고려할 때, 이것이 발생한 지점에 대한 우려보다는, [포화 지점에 도달했다는 증거를 제공]하는 데 더 집중해야 한다고 제안한다. 따라서 그들은 '최초 표본 추출의 모든 인터뷰를 포함해도 나쁠 것이 없다'고 제안한다. 그러나 이러한 관점은 본질적으로 문제가 있다. 왜냐하면 포화도가 [지속적인 샘플링 결정을 안내하는 것]이 아니라 [데이터 수집의 완료 후의 후향적 결정]이라는 것을 의미하기 때문이다. 하지만, 모든 데이터가 추가 통찰력에 기여하는지 또는 개념 이해에 추가하는지 여부에 관계없이, [(무조건) 모든 데이터가 포함]된다면, 포화가 관련성relevance을 잃게 된다고 주장할 수도 있다. 이 접근방식은 [표본의 적절성을 판단하는 데 포화가 도움이 되는지]보다는, 충분한 데이터를 가지고 포화의 증거를 보여주는 것(즉, 너무 적은 인터뷰는 안 됨)에 대한 선입견을 나타내는 듯 하다.
Constantinou et al. (2017) propose that, given the potential for uncertainty about the point at which saturation is reached, attention should focus more on providing evidence that saturation has been reached, than on concerns about the point at which this occurred. Thus, rather curiously, they propose that it ‘does not hurt to include all interviews from the initial sampling’ (2017: p. 13). This view is inherently problematic, however, as not only does it imply that saturation is a retrospective consideration following the completion of data collection, rather than as guiding ongoing sampling decisions, but one could also argue that saturation loses its relevance if all data are included regardless of whether or not they contribute further insights or add to conceptual understanding. This approach appears to indicate a preoccupation with having enough data to show evidence of saturation, i.e. not too few interviews, rather than saturation aiding decisions about the adequacy of the sample.
위의 내용은 [포화가 달성된 지점]의 평가에 양면성이 있음을 시사하는 반면, 다른 보고서에서는 의도적으로 포화 상태를 넘어 샘플링을 계속하기로 결정을 내렸다. 이는 표본 추출 결정을 강화하기 위한 추가적인 객관적 증거를 찾는 것으로 보인다. 그러한 시도를 한 연구자들은, 정확히 무엇인지에 대해 명확히 설명하지는 않지만, [포화에 의해 포착되지 않는 이론적으로 중요한 어떤 것이 있다]는 견해를 시사한다. Whilst the above suggests ambivalence towards assessing the point at which saturation is achieved, others report having made the conscious decision to continue sampling beyond saturation, appearing to seek additional objective evidence to bolster their sampling decisions. These examples suggest a view that there is something of theoretical importance that is not captured by saturation, though it is unclear from the explanations given as to exactly what this is.Footnote9
9.때때로, 포화를 넘어서는 이유는 방법론적인 것이라기보다는 윤리적인 것으로 보인다. 포화상태에 이르렀음에도 불구하고, 프랑스 등은. (2008: 페이지 22)에 따르면 '연구에 참여하고자 하는 모든 여성에 대한 헌신과 존중'으로 인해, 데이터 수집은 모든 사람이 인터뷰를 마칠 때까지 끝나지 않았다. 비슷하게, 케네디 외 연구진(2012: 페이지 858)은 이것이 '재면접을 위해 의도적으로 개인을 선택하는 것보다, 또는 포화될 때까지 인터뷰만 하는 것보다 더 윤리적인' 것처럼 보였기 때문에 포화도를 초과했다고 보고했다. 9.On occasions, a reason for going beyond saturation appears to be ethical rather than methodological. Despite reaching saturation, France et al. (2008: p. 22) note that owing to their ‘commitment to and respect for all the women who wanted to participate in the study, data collection did not end until all had been interviewed.’ Similarly, Kennedy et al. (2012: p. 858) report that they exceeded saturation as this appeared to be ‘more ethical than purposefully choosing individuals to re-interview, or only interviewing until saturation’.
포화에 대한 양면적인 관점의 또 다른 징후는 인터뷰에 기초한 연구에서 표본 크기가 일반적으로 10의 배수라는 메이슨의 관찰(2010)에 의해 제안된다. 이는 실제로 포화도와 같은 적응적 접근법에 우선하여 경험칙이나 다른 선험적 지침이 일반적으로 사용된다는 것을 시사한다. 꽤 자주, 포화라는 기준을 채택하는 연구는, 선행 연구에서 제안된 표본 크기를 동시에 언급한다. 니콜라이 등은 분석 중 포화를 추구하면서, 또한 다음과 같이 진술했다.
Another indication of an ambivalent view taken on saturation is suggested by Mason’s (2010) observation that sample sizes in studies based on interviews are commonly multiples of ten. This suggests that, in practice, rules of thumb or other a priori guidelines are commonly used in preference to an adaptive approach such as saturation. Quite frequently, studies that adopt the criterion of saturation propose at the same time a prior sample size (e.g. McNulty et al.2015; Long-Sutehall et al.2011). In a similar way, Niccolai et al. (2016) sought saturation during their analysis, but also state (p. 843) that:
이러한 성격의 정성적 연구에 대한 권장 사항과 연구 질문에 대한 예상 복잡성 및 원하는 깊이 수준을 바탕으로 30 - 40의 선험 표본 크기를 선택했다. An a priori sample size of 30 to 40 was selected based on recommendations for qualitative studies of this nature… and the anticipated complexity and desired level of depth for our research questions.
Fush와 Ness는 (연구자가 '데이터 포화도에 도달할 수 있는 최고의 기회'를 가진 표본 크기를 선택해야 한다고 주장할 때) 다소 일관되지 않은 이 접근법을 지지하는 것으로 보인다. Fusch and Ness (2015: p. 1409) appear to endorse this somewhat inconsistent approach when advocating that the researcher should choose a sample size that has ‘the best opportunity for the researcher to reach data saturation’.Footnote10
10.Bloor and Wood (2006: 페이지 165)는 이러한 경향은 연구자들이 방법론적 신뢰성을 유지하기 위해 포화 상태에 대한 주장을 하면서 이전에 자금 지원 기관이나 윤리 위원회에 공표된 표본 크기를 준수해야 한다고 느끼는 것에서 기인할 수 있다고 시사한다. 일부 작성자—예: 게스트 등. (2006년), 프랜시스 외(2010년), 헤닝크 외(2017년)—포화 달성에 필요한 특정 참여자 수가 사전에 계산되는 절차를 공식화하려고 시도했다. 10.Bloor and Wood (2006: p. 165) suggest that this tendency may stem from researchers feeling obliged to abide by sample sizes previously declared to funding bodies or ethics committees, whilst making claims to saturation in order to retain a sense of methodological credibility. Some authors—e.g. Guest et al. (2006), Francis et al. (2010), Hennink et al. (2017)—have attempted for formulate procedures whereby the specific number of participants required to achieve saturation is calculated in advance.
이러한 포화 상태에 대한 잠정적이고 모호한 약속을 하는 모습은, 현실적으로 연구를 시작하기 전에 [표본 크기에 대한 명확한 진술을 요구하는 연구비 지원 기관과 윤리 위원회의 요구] 때문일 수 있다. 즉, 현실적으로 방법론적 고려사항보다 따라야 하는 의무로 부과되는 것이다. 그러나 (포화에 대한 모호한 모습은) 포화의 기반이 되는 [구체적이지만 다소 불확실한 논리] 때문에 발생할 수도 있다. [지금까지 수집된 데이터로부터 내린 결론에 기초하여 추가적인 데이터 수집이나 분석이 불필요하다고 판단하는 것]은 본질적으로 [관측한 것(지금까지 수행된 데이터 수집 및/또는 분석)]에 기반해서 [관측되지 않은 것(데이터 수집 및/또는 분석 프로세스가 진행되었더라면 발생했을 것)]에 대한 판단이다. 게다가, 만약 포화가 근거이론에서와 같이 [부정적 사례 분석(즉, 새로운 이론의 측면에 의문을 제기하거나 disconfirm하는 자료)]과 관련하여 사용된다면, (포화의) 논리는 더 빈약해진다.
This tentative and equivocal commitment to saturation may reflect a practical response to the demands of funding bodies and ethics committees for a clear statement of sample size prior to starting a study (O’Reilly and Parker2013)—perceived obligations that, in practice, may be given priority over methodological considerations. However, it may also arise from the specific but somewhat uncertain logic that underlies saturation. Determining that further data collection or analysis is unnecessary on the basis of what has been concluded from data gathered hitherto is essentially a statement about the unobserved (what would have happened if the process of data collection and/or analysis had proceeded) based on the observed (the data collection and/or analysis that has taken place hitherto). Furthermore, if saturation is used in relation to negative case analysis in grounded theory (i.e. sources of data that may question or disconfirm aspects of the emergent theory) the logic becomes more tenuous—a statement about the unobserved based on the unobserved.Footnote11
11.첫 번째 논리는 반직관적이다. 데이터, 코드 또는 이론적 통찰력의 미래의 미발생이 이전의 발생에 기초하여 가정된다. 그러나 부정적인 사례 분석과 관련하여, 논리는 귀납적이 되며, 미래의 비발생은 이전의 비발생에 기초하여 가정된다. 11.The first logic is counter-inductive—future non-occurrences of data, codes or theoretical insights are posited on the basis of prior occurrences. In relation to negative case analysis, however, the logic becomes inductive—future non-occurrences are posited on the basis of prior non-occurrences.
어떤 경우이든, [아직 수집되지 않은 데이터의 성격]에 대한 [불확실한 예측적 주장]이며, 더 나아가 데이터 수집 중단 결정이 뒤집힐 경우(즉, 데이터를 수집하기로 할 경우)에만 검증될 수 있는 주장이다. 또한, 기본적인 추론은 분석이 이론을 생성하는 방법에 대한 구체적인 가정을 하며, 이론 개발 과정에서 이러한 가정이 일찍 발생할수록 그러한 가정은 덜 정당화될 수 있다. 따라서 연구를 시작할 때 포화를 샘플링 기준으로 자신 있게 제안하는 연구자들은, 연구가 진행되면 어떻게 운영되어야 하는지에 대해 덜 확신하게 되어, 결과적으로 최초의 샘플링 기준을 준수하기를 꺼릴 수 있다.
In either case, an uncertain predictive claim is made about the nature of data yet to be collected, and furthermore a claim that could only be tested if the decision to halt data collection were to be overturned. Additionally, the underlying reasoning makes specific assumptions about the way in which the analysis will generate theory, and the earlier in the process of theory development that this occurs the less warranted such assumptions may be. Accordingly, researchers who confidently propose saturation as a criterion for sampling at the outset of a study may become less certain as to how it should be operationalized once the study is in progress, and may therefore be reluctant to abide by it.
결론 Conclusion
질적 연구의 퀄리티를 평가할 때 '황금률'로서의 사용되어온 포화의 명백한 위치와 거의 보편적인 적용에 대한 의문은 이전에도 제기되었다. 마찬가지로, 데이터 수집 및 분석이나 또는 이론 개발의 적절성을 판단하는 유일한 기준으로 흔하게 채택되는 것에 대해서도 의구심이 제기되어왔다. '우아함, 정확성, 일관성 및 명확성은 이론을 평가하는 전통적인 기준이나, 포화를 은유적으로 강조하면서 다소 침수되어 왔다.' (Dey) 2007: 페이지 186). Saturation’s apparent position as a ‘gold standard’ in assessing quality and its near universal application in qualitative research have been previously questioned (Guest et al.2006; O’Reilly and Parker2013; Malterud et al.2016). Similarly, doubts have been raised regarding its common adoption as asolecriterion of the adequacy of data collection and analysis (Charmaz2005), or of the adequacy of theory development: ‘Elegance, precision, coherence, and clarity are traditional criteria for evaluating theory, somewhat swamped by the metaphorical emphasis on saturation’ (Dey2007: p. 186).
포화 상태가 의심할 여지 없이 제공되어서는 안 된다는 주장에 동의하지만, 적용 가능 vs 적용 불가능의 양극화로 보는 것은 너무 단순한 것이다. 대신, 우리는 포화가 이론의 역할, 채택된 분석적 접근법 등에 따라 다른 관련성과 다른 의미를 가진다고 주장한다. 따라서 연구자에 의해 명확하게 표현될 필요가 있는 각 유형의 연구에 맞춰서, 각각의 목적에 따라 유용하게 사용될 수 있다고 제안한다.
Whilst we concur with the argument that saturation should not be afforded unquestioned status, polarization of saturation as either applicable or non-applicable to different approaches, as has been suggested (Walker2012), may be too simplistic. Instead we propose that saturation has differing relevance, and a different meaning, depending on the role of theory, the analytic approach adopted, and so forth, and thus may usefully serve different purposes for different types of research—purposes that need to be clearly articulated by the researcher.
포화의 목적과 사용 측면에서 유연성이 있어야 한다고 주장하면서, 동시에 우리는 이러한 [(포화를 사용하는) 목적의 범위]에는 어느 정도 [제한이 있어야 한다]고 제안한다. 포화 상태가 운영화된 방법 중 일부는 너무 광범위하게 포괄될 정도로 의미를 확장하거나 희석시킬 위험이 있어 일관성과 효용성을 훼손할 수 있다고 제안할 수 있다. Whilst arguing for flexibility in terms of the purpose and use of saturation, we also suggest that there must be some limit to this range of purposes. Some of the ways in which saturation has been operationalized, we would suggest, risk stretching or diluting its meaning to the point where it becomes too widely encompassing, thereby undermining its coherence and utility.
언제 그리고 어떻게 포화 상태에 도달했다고 판단될 수 있는지는, 연구 유형뿐만 아니라 그것이 [뚜렷한distinct 사건인지] 또는 [진행 중인 과정을 나타내는지]에 대한 가정에 따라서도 달라진다. 포화를 사건으로 보는 관점은 다른 사람들에 의해 문제화되었다. 우리가 보기에 포화는 부분적으로 [개념 자체의 불확실한 논리]에 의해 추진되는 것으로 보인다고 주장했다. 즉, 포화는 [관찰된 것을 바탕으로 관찰되지 않은 것에 대한 설명]을 하는 것이다. 이러한 불확실성은 그것의 사용에 있어서 비일관성과 모순을 야기하는 것으로 보이며, 우리는 포화를 단순히 달성되거나 달성되지 않은 것으로 간주하기 보다는, 최소한 부분적으로라도 정도의 문제로 간주한다면 해결될 수 있다고 주장한다. 그러나 '점진적'이라는 측면에서 포화를 고려하는 것은, 포화를 주장하는 연구자들의 자신감을 높일 수 있지만, 우리는 연구자가 포화를 사용하는 구체적인 목적이 무엇인지, 포화시키기를 바라는 것이 무엇인지를 적절히 고려해야만 개념을 둘러싼 불확실성을 해결할 수 있다고 제안한다. When and how saturation may be judged to have been reached will differ depending on the type of study, as well as assumptions about whether it represents a distinct event or an ongoing process. The view of saturation as an event has been problematized by others (Strauss and Corbin1998; Dey1999; Nelson2016), and we have explored the implications of conceptualizing saturation in this way, arguing that it appears to give rise to a degree of uncertainty and equivocation, in part driven by the uncertain logic of the concept itself—as a statement about the unobserved based on the observed. This uncertainty appears to give rise to inconsistencies and contradictions in its use, which we would argue could be resolved, at least in part, if saturation were to be considered as a matter of degree, rather than simply as something either attained or unattained. However, whilst considering saturation in incremental terms may increase researchers’ confidence in making claims to it, we suggest it is only through due consideration of the specific purpose for which saturation is being used, and what one is hoping to saturate, that the uncertainty around the concept can be resolved
Qual Quant. 2018;52(4):1893-1907.
doi: 10.1007/s11135-017-0574-8.Epub 2017 Sep 14.
Saturation in qualitative research: exploring its conceptualization and operationalization
Saturation has attained widespread acceptance as a methodological principle in qualitative research. It is commonly taken to indicate that, on the basis of the data that have been collected or analysed hitherto, further data collection and/or analysis are unnecessary. However, there appears to be uncertainty as to how saturation should be conceptualized, and inconsistencies in its use. In this paper, we look to clarify the nature, purposes and uses of saturation, and in doing so add to theoretical debate on the role of saturation across different methodologies. We identify four distinct approaches to saturation, which differ in terms of the extent to which an inductive or a deductive logic is adopted, and the relative emphasis on data collection, data analysis, and theorizing. We explore the purposes saturation might serve in relation to these different approaches, and the implications for how and when saturation will be sought. In examining these issues, we highlight the uncertain logic underlying saturation-as essentially a predictive statement about the unobserved based on the observed, a judgement that, we argue, results in equivocation, and may in part explain the confusion surrounding its use. We conclude that saturation should be operationalized in a way that is consistent with the research question(s), and the theoretical position and analytic framework adopted, but also that there should be some limit to its scope, so as not to risk saturation losing its coherence and potency if its conceptualization and uses are stretched too widely.
Keywords:Data analysis; Data collection; Grounded theory; Qualitative research; Saturation.
의료전문직 학술활동: 그것의 등장, 현재상태, 미래(FASEB Bioadv. 2021) Health professions education scholarship: The emergence, current status, and future of a discipline in its own right Olle ten Cate
1 의학교육의 역사적 연구 1 THE HISTORICAL OUVERTURE OF SCHOLARSHIP IN MEDICAL EDUCATION
교육 또는 의학 학문에 관여하는 대부분의 생물 의학 과학자는 물론 대부분의 교육 과학자는 현재 "보건 전문직 교육"이라는 더 넓은 용어로 포괄되는 의학 교육 학술활동이라는 교차 영역의 풍부함을 깨닫지 못할 수 있다. Most educational scientists, as well as most biomedical scientist, involved in educational or medical scholarship, may not realize the richness of the intersecting field of medical education scholarship, currently subsumed under the broader term of “health professions education.”
[인구 건강]과 [인구 교육]은 번영하는 사회의 두 가지 기본 요소이다. 이 둘의 교차점에는 의사 및 보건 전문직이 인구의 건강을 위해 복무하도록 교육하는 기술art가 있다. 의학 교육은 항상 [의사와 교육자]의 헌신적인 관심을 누려왔다. 아폴로와 코로니스의 아들인 최초의 저명한 의대생이자 교육자인 아스클레피오스가 켄타우루스 키론에게 의술을 배웠고, 마법의 막대기와 함께 자신의 회사가 된 뱀으로부터 치유와 부활에 대해 배웠다는 것이 신화의 교훈이다(그림 1). 전 세계 의료협회의 수많은 로고에서 볼 수 있듯이, 막대기와 뱀은 오늘날까지 가장 중요한 의학 상징이 되었고 지금도 남아 있다. 키론과 아스클레피오스가 의학적 지식뿐만 아니라 [교육적 능력]으로도 유명했다는 것을 인정해야 한다. The intersection of two fundamental pillars of a thriving society—population health and population education—is the art of educating doctors and other health professionals to serve the health of populations. Medical education has always enjoyed the dedicated interest of physicians and educators. Mythology teaches us that the first renown medical student and educator, Asclepius, son of Apollo and Coronis, had been educated himself in the art of medicine by centaur Chiron, and had learned about healing and resurrection from a snake who became his company along with a magical rod (Figure 1). Rod and snake became and remained the most important symbols of medicine throughout the ages until today, as witnessed by the many logos of medical associations around the world. It should be acknowledged that Chiron and Asclepius were not only famous for their medical knowledge, but also known for their educational skill.
21세기에 의학과 생의학은 전문 병원, 실험실, 대학 및 상업 기업을 통해 주요 산업이 되었다. 교육은 여러 세기에 걸쳐서 청소년들을 위한 초등교육과 handcraft에 초점을 맞추었지만, 대부분의 중등교육과 중요한 과학적 토대를 가진 많은 시민들을 위한 3차교육과 함께 지난 세기 동안 산업화된 사회에서 발전해왔다. 교육과학은 20세기에 강하게 발전했다. In the 21st century, medical and biomedical sciences have become a major industry through specialized hospitals, laboratories, universities, and commercial enterprises. Education, while for many ages focused on primary schooling and handicraft for the youth, has developed in the past century in industrialized societies with secondary education for most and tertiary education for many citizens with important scientific foundations. The science of education has developed strongly in the 20th century.
어느 시대든, 의학 교육 자체는 존경받는 기술respected art이었다. 시대를 통한 유명한 의학 학자들과 교육자들은 히포크라테스, 셀수스, 갤런, 안드레아스 비살리우스, 허먼 보어하브, 윌리엄 오슬러, 그리고 윌리엄 할스테드를 20세기 초까지 주요한 예로 포함한다. 국내적이든 국제적으로든 더 많은 의학 교육자들이 따랐고, 대부분의 의과대학들은 과거에 있었던 교수들에 대하여 초상화 갤러리와 강의실에서 그들의 이름과 얼굴을 기리는 형태로 자부심을 드러낸다. Medical education itself has been a respected art through the ages. Famous medical scholars and educators through the ages include Hippocrates, Celsus, Galen, Andreas Vesalius, Herman Boerhaave, William Osler, and William Halsted as prime examples until the early 20th century.1-4Many more medical educators followed, nationally or internationally famous, and most medical schools take pride in some of their own professors of the past, honoring their names and faces in portrait galleries and lecture halls.
오랜 세월 동안 dissection을 통한 [인체 해부학]은 임상 전 교육의 중심이었다. 그림 2는 암스테르담의 와그 해부학 극장에서 공공 해부 강의를 하는 니콜라이스 툴프 교수 (1593–1674)를 보여준다. For many ages, the anatomy of the human body through dissection was central to preclinical education. Figure 2shows professor Nicolaes Tulp (1593–1674), delivering a public dissection lecture at the Waag Anatomical Theater in Amsterdam.
2 학문적 연구의 영역으로서 의학 교육의 탄생 2 THE BIRTH OF MEDICAL EDUCATION AS A DOMAIN OF SCHOLARLY STUDY
[의학을 가르치는 기술Art of teaching medicine]이 수 세기에 걸쳐 널리 인정받았지만, 개별 교육자와는 별개로 의학 교육의 방법과 효과에 초점을 맞춘 의학교육 연구는 최근에야 연구의 초점이 되었다. 그 출현은 주로 [20세기 중반]부터 시작된 것으로 간주될 수 있으며, 새로운 방법, 목표 및 내용과 함께 의학 커리큘럼에 대한 새로운 접근법의 개발과 연결된다. 세계적으로 의과대학이 1953년 566개에서 2018년 2881개로 급증하면서 의과대학 학술활동, 이후 보건전문교육에 대한 관심이 눈에 띄게 발전했다. While the art of teaching medicine became widely acknowledged over the centuries, the study of medical education, with its focus on methods and effectiveness of medical education, independent of individual educators, became a focused domain of study only recently. Its emergence can be considered to have started primarily from mid-20th century, linked to development of new approaches to the medical curriculum, with new methods, objectives, and content. With the rapid increase of medical schools around the world, from 566 in the year 1953 to 2881 in the year 20185the interest in scholarship of medical and, later, health professional education has developed remarkably.
학문으로서 의학교육 학술활동의 출발점을 어디로 볼 것인가를 논란의 여지없이 정확히 집어내기는 어렵다. 보통 많은 요소들이 함께, 우연히 작동하여, 그러한 출현을 가능하게 한다.
의학교육사학자 Ludmerer는 1920년 전후를 미국의 현대 의학 교육의 시작이라고 본다. (비록 유럽에서는 영향력이 작았지만) 이 시기는 미국 학교들을 폐쇄하거나 현대화하도록 강요한 유명하지만 비판적인 1910년 카네기 보고서(플렉스너 보고서) 직후이다.
Journal of Medical Education 의 첫 호는 1920년에 나왔지만, 솔직히, 학문적 노력으로서 의학 교육 발전과 연구의 시작은 [Western Reserve 대학교가 그들의 의학 교육과정을 현대화하기 위해 위원회를 설립한 1950년 즈음]이라고 보는 것이 더 나을지도 모른다. 이후 콜로라도대학이 이를 따랐고, 이 두 대학의 노력은 철저히 기록되었기에, 그 변화의 움직임의 시작을 정확히 짚어낼 수 있다.
조지 밀러, 스티븐 에이브러햄슨, 힐리어드 제이슨, 크리스틴 맥과이어, 그리고 하워드 베로우스 같은 연구자들이 뉴욕, 미시간, 일리노이, 캘리포니아의 여러 대학에서 등장하면서, 대표적인 1세대 의학 교육 학자가 등장했다고 볼 수 있다. 이렇게 약 70년 전에 새로운 학문을 구성하였고, 이 당시 최초로 뚜렷한 교육 연구 유닛들이 의과대학에 설립되었습니다.
동시에 1950년대에 의학 교육은 사회과학자들의 연구 대상이 되었다. 그들은 의사가 되는 것이 어떤 의미인지를 연구한 후 영향력 있는 심리학적, 사회학적 보고서를 작성하였다. 미국만이 의학교육을 위한 단위units을 설립한 것은 아니다. 캐나다의 맥마스터 대학, 스코틀랜드의 던디 대학, 네덜란드의 마스트리흐트 대학이 다른 나라에서 의학교육을 위한 학술활동을 가진 최초의 기관이다.
It is difficult to pinpoint an undisputed moment in time that can be qualified as the starting point of medical education scholarship as a discipline. Usually many factors together, operating coincidentally, enable such an emergence.
Medical education historian Ludmerer rightly qualifies the years around 1920 as the start of modern medical education in the United States,6 shortly after Flexner's famous but critical 1910 Carnegie Report that forced U.S. schools to either close or modernize7—while less influential in Europe.8
The first issue of the Journal of Medical Education appeared in 1920, but, frankly, the start of medical education development and research as a scholarly endeavor may be better located around 1950, the year that Western Reserve University established a committee to modernize their medical curriculum, followed by the University of Colorado a few years later, two endeavors that were extensively documented,9, 10 and therefore, enabling to pinpoint the start of a movement.
With George Miller, Stephen Abrahamson, Hilliard Jason, Christine McGuire, and Howard Barrows at universities in New York, Michigan, Illinois, and California, prominent examples of a first generation of medical education scholars emerged, together constituting a new discipline about 70 years ago, when the first distinct units of education research were established in medical schools.11, 12
In parallel, in the 1950s, medical education became an external object of study by social scientists, who produced influential psychological and sociological reports after studying what it means to become a doctor.13-15 Not only the United States established units for the study of medical education. McMaster University in Canada, University of Dundee in Scotland, and Maastricht University in the Netherlands are among the first institutions with units for scholarship in medical education in other countries.
몇몇 개인, 교사, 연구원, 또는 과학적 추구의 특정 영역에 특정한 관심을 가진 센터들은 아직 그 분야를 인정받을 수 있는 학문 영역으로 만들지 못할 수 있다. 그래서 질문은 이것이다. 누군가를 의료 또는 보건 전문직 교육의 학자scholar라고 부르고, 그러한 개인들의 공동체를 "학술적scholarly"이라고 부르려면 무엇이 필요할까? 아자위와 동료들은 연구자 정체성 형성과 협력관계, 연구에 대한 보호시간을 조성하는 환경이 보건직 학술활동을 번창하게 할 수 있다는 것을 발견했다. 학술 공동체는 어니스트 보이어의 널리 인용된 네 가지 기준을 사용하여 정의될 수 있다: 발견, 통합, 응용, 그리고 가르침.17 A few individuals, teachers, researchers, or even centers with a specific interest in a particular domain of scientific pursuit may not yet make the field a recognizable scholarly domain. So the questions is: what would be needed to call someone a medical or health professions education (HPE) scholar1and to call a community of such individualsscholarly? Ajjawi and colleagues found that an environment fostering researcher identity formation, collaborative relationships, and protected time for research is likely to make health professions education scholarship thrive.16To create that identity, the scholar should belong to a community with specific characteristics. Scholarly communities may be defined using Ernest Boyer's widely cited four criteria that, together, should determine scholarship: discovery, integration, application, and teaching.17
[디스커버리]란 과학적 호기심을 충족시키기 위해서만 알 가치가 있는 새로운 아이디어와 통찰력의 생산이다. 상당수의 학자들이 적극적인 HPE 연구에 참여하고 영역을 발전시키는 연구 결과를 산출하고 있다는 사실은, 이 준거를 중요하게 만든다. Discoveryis the production of new ideas and insights, things that are worth knowing, if only to satisfy scientific curiosity. A significant number of scholars should engage in active HPE research and yield research findings that advance the domain, to give this criterion weight.
[통합]은 고립된 사실에 의미를 부여하고 새로운 발견과 이미 알려진 것을 연결하는 것이다. 학술활동은 응집력coherence를 갖추어야 하고, 그러기 위해서는 [사회 및 기타 과학과 관련을 짓거나, 다양한 연구 합성 노력]을 해야 한다. 이렇게 해야만 "바퀴의 재발명"을 피할 수 있다. [수용될 지식체body of accepted knowledge]는 통합을 통해 구축된다. Integrationis giving meaning to isolated facts and connecting new findings with what is already known, within and across disciplines. Coherence must be established, by relating to or involving social and other sciences and by various research synthesis efforts, if only to avoid wheels being reinvented. A body of accepted knowledge is to be built through integration.
[응용]은 문제를 해결하기 위한 발견의 유용성과 관련이 있습니다. 학술활동은 "그 자체로서가 아니라, 사회에 대한 복무를 통하여 가치를 입증해야 한다."(보이어, 23페이지) 실무적으로 개선된 의료 및 보건직 교육 커리큘럼을 통해, 졸업생들의 역량 향상을 통해, 궁극적으로는 더 나은 의료 서비스를 통해 보여야 한다. Applicationrelates to the usefulness of findings to solve problems. Scholarship must "prove its worth not on its own terms but by service [to society]"(Boyer, page 23). It should be visible through improved medical and health professions education curricula in practice, through improved competence of graduates and, ultimately, through better health care.
[가르치는 것]은 "가장 높은 형태의 이해"이다. 여기에는 [과학적 의사소통]과 [미래 학자를 위한 교육]을 포함한다. 보이어는 학생과 개인의 상호작용을 염두에 두고 있었지만, 강의는 회의, 책, 논문, 현대 미디어를 통해서도 이루어질 수 있다. 더 넓은 의미에서 Teaching이란 [차세대 학자들의 충분하고 지속적인 훈련]과 [충분한 출판물, 회의, 협회]로 특징지어지며, 이는 [진정한 상호작용적 학문 공동체의 존재]를 의미한다. Teaching, as "the highest form of understanding" (Boyer, page 23), involves scientific communications and the education of future scholars. While Boyer had students and individual interactions in mind, teaching can also be done through conferences, publication of books, papers, and modern media. Teaching in its broader sense, would be characterized by the sufficient and sustained training of next generation scholars and sufficient publications, conferences, associations that would characterize the existence of a true interactive scholarly community.
글래식18과 오브라이언 외 19는 보이어의 기준을 건강 직업 교육 학술활동 단위의 개별 학자들뿐만 아니라 더 자세히 설명했다. Glassick18and O'Brien et al19have elaborated Boyer's criteria not only for individual scholars in health professions education scholarship units.
보건 전문직 교육HPE은 학술적 영역이나 학문으로서 적합한가? 3 DOES HEALTH PROFESSIONS EDUCATION QUALIFY AS A SCHOLARLY DOMAIN OR DISCIPLINE?
학문 분야와 하위학문 분야가 명확하게 정의된 것은 아니다. 그것들은 보통 대학들에 의해 인정되고, 때로는 과학 학회에 의해, 때로는 법에 의해, 면허와 특권이 제한될 때, 교수진, 학과, 학술 과정에 분류된다. 그러나 공식적인 제도적 진술을 넘어, [학문적 공동체나 학문이 무엇인지를 결정하는 것]은 [학문적 개인들 간의 상호작용과 활동]이다. [사회 정체성 이론Social Identity Theory] 은 개인에게 정체성을 제공하는 집단에 속하는 것이 중요하다고 가정한다. 사회적 정체성은 자존감과 집단 행동을 서포트하는데, 이는 사람들이 자신의 존재를 알고 자부심을 느끼고, 다른 사람들에게 그것을 설명하고, (명함이나 문구처럼) 쓸모 없어 보이는 목적을 위해 사용할 수 있고, 또한 마음이 비슷한 다른 사람들과 연결되기 위해서이다. 학문적 공동체에서 정의된 정체성은 [조직 내에서의 승진]과 심지어 [연구 자금]에도 영향을 미칠 수 있다. 분야를 정의하는 것은 사소하지 않다.
Academic disciplines and subdisciplines are not unequivocally defined. They are usually acknowledged by universities and categorized in faculties, departments, and academic courses, sometimes by scientific societies and sometimes by law, when licensing and privileging is restricted. But beyond formal, institutional statements, it is the dynamics among scholarly individuals, with their interactions and activities, that determines what a scholarly community or discipline is. Social Identity Theory posits that for individuals it is important to belong to a group that provides them with identity.20Social identification supports self-esteem and group behavior,21as people like to know and take pride in what they are, be able to explain that to others, use it for purposes as seemingly futile as business cards and stationary, and also to connect with likeminded others. A defined identity in a scholarly community can also affect promotions in an organization, and even funding of research. Defining a discipline is not trivial.
3.1 검색 3.1 Discovery
(학문분야로서) Discovery 기준을 충족시키려면 현재 발견자 역할을 하는 충분한 연구자가 있어야 한다. 2021년에 세계적으로 얼마나 많은 HPE 연구원들이 활동하고 있는지 정확히 알 수 없다. 그러나 1950년 이후 그 수가 증가했다는 몇 가지 대리 지표가 있다. 만약 활동적인 연구원이 10년이라는 기간 동안 매년 적어도 한 편의 저널 기사를 발표하는 사람이고, 발견이 건강 직업 교육의 지식의 본체에 사실이나 통찰력의 추가라고 정의된다면, 시간에 따라 발표된 논문의 수와 저자들을 볼 가치가 있다. To meet theDiscoverycriterion, there must be sufficient researchers who are active discoverers. We do not know how many HPE researchers exactly are active worldwide, in 2021. However, there are some proxy indicators of growth in volume since 1950. If an active researcher would be someone who publishes at least one journal article per year over a sustained period of time, say 10 years, and discovery would be defined as the addition of a fact or insight to the body of knowledge of health professions education, it is worth looking at number of published papers and their authors at different moments in time.
1980년에는 의학 교육 저널(현재의 학술 의학 저널), 영국 의학 교육 저널(현재의 의학 교육 저널), 그리고 의학 교사(Medical Teacher)의 세 개의 의학 교육 전문 저널이 있었다. 가장 오래된 것(의학교육저널)에는 1980년 한 해 동안(12호)에 걸쳐 450여 명의 저자가 등장했는데, 여기에는 비연구자뿐 아니라 두 번 이상 출판한 작가도 포함됐다. 2020년에, 이 저널의 12개 호에 기고하는 추정 저자의 수는 약 3배가 되었다. 2018년에 제이슨이 제시한 그래프와 비교할 수 있는 다른 성장 대용치가 그림 3에 나와 있다. 저널 기사 제목에 있는 "의료"와 "교육"이라는 단어의 조합은 50년 이내에 10배 증가를 보여준다. 게다가, 그 40년 동안, 국제 의학교육 저널의 수는 (해부학, 생리학, 생화학, 수술, 시뮬레이션, 그리고 많은 국가에서 의학 교육을 위한 국가 협회의 저널과 같은 전문 분야의 전용 교육 저널을 제외하고도) 3개에서 약 35개로 꾸준히 증가하였다 In 1980, there were three dedicated medical education journals:
the Journal of Medical Education (now called Academic Medicine),
The British Journal of Medical Education (now called Medical Education), and
Medical Teacher.
The oldest one (the Journal of Medical Education) featured about 450 authors across the year of 1980 (12 issues), including non-researchers, but also some authors who published more than once. In 2020, the estimated number of authors contributing to the 12 issues of this same journal has about tripled. A different proxy of growth is shown in Figure 3, comparable to graphs presented by Jason in 2018.22The combined words "medical" and "education" in journal article titles shows a 10-fold increase in less than 50 year (data from Google Scholar; and note that such titles only cover a small minority of articles in the domain). In addition, in those 40 years the number of international peer reviewed medical education journals has steadily grown from three to about 35, excluding dedicated education journals in specialty areas such as anatomy, physiology, biochemistry, surgery, simulation, and journals of national associations for medical education in many countries, not counting education journals in other health professions than medicine.
HPE에 관한 학술지의 총 목록은 주로 약 90개에 달한다. 만약 이들 각각이 연간 100명의 저자를 배출하고 모든 학자가 매년 하나의 학술 논문을 낸다면(둘 다 매우 보수적인 추정치이다), 이 영역은 거의 100,000명의 저자를 보유하게 될 것이다. 로건스는 2010년 최근 12년간 가장 많이 발간된 6개 의학교육전문지에 1만건의 기사가 실렸다고 추산했다. 논문 한 편당 평균 3명의 저자를 취해서 현재 양질의 학술지 수가 늘어난 것에 대해 3을 곱하면 비슷한 수치로 이어진다. 수많은 의학 교육 저널 기사의 질은 학문적 기준을 모두 충족시키지 못할 수도 있지만, 만약 20%만이 진정으로 학문적scholarly인 것으로 잡더라도, (보수적으로 추정해도) 연구와 개발에 적극적으로 참여하는 HPE 학자들은 최소한 20,000명에 이르는 구성된 공동체를 구성한다. 공동체의 기준으로서의 [임계질량]은, 논쟁의 여지 없이 충분히 충족된 것으로 보인다.
The total list of journals predominantly publishing on health professional education approaches about ninety2. If these each would feature only 100 authors per year and every scholar would produce one scholarly paper per year (both are very conservative estimates), the domain would have close to 100,000 authors. Rotgans estimated in 2010 that 10,000 articles had appeared in the six most common medical education journals in the past 12 years.23Taking an average number of three authors per paper and multiplying by three for the increased number of current quality journals leads to a similar figure. The quality of the numerous medical education journal articles may not all meet scholarly standards,24but if only 20% would be regarded as truly scholarly, the combined authors would establish a community of at least 20,000 true health professions education scholars, educators actively involved in research and development, which again is probably a conservative estimate. The critical mass for a scholarly community as criterion seems, arguably, amply met.
다음으로, 일반적으로 인정된 도메인의 발전은 발견을 지원해야 합니다. 의학교육이 70년 전보다 '더 나아지지' 않는다면 보이어의 발견 기준은 아마도 충족되지 않을 것이다. 그래서 문제는, 우리가 이 개선을 확인할 수 있을까 하는 것입니다. 이 기준은 측정하거나 추정하기가 훨씬 더 어렵다. [2020년 의대 졸업자]들이 [1950년 졸업자]보다 의료행위에 더 적합한지 여부를 확인할 수 있는 측정 수단이 전혀 없다. Next, generally acknowledged advances in the domain should support discovery. If medical education would not be “better” than 70 years ago, then, the Boyer's discovery criterion would probably not be met. So the question is, can we confirm this improvement? This criterion is much more difficult to measure or estimate. There is simply no measurement instrument to establish whether the 2020 medical graduates are better equipped for clinical practice than in 1950.
교육 연구의 진보와 발견은 종종 [근거 기반의 교육적 진보]가 아닌 [새로운 이론과 연구 방법]에 초점을 맞추는데, 이는 단계적이고 부정할 수 없이 더 나은 교육 결과를 보여준다. 물리, 화학, 의학 등의 분야에서 이론과 실천에 기반을 두고 새로운 사실들이 만들어 질 수 있지만, 이는 교육 연구에서 드물다. 소이어는 "교육에 대한 과학적 접근의 역사는 유망하지 않다"고 주장하며, [교육이 과학인지 예술인지에 대한 계속되는 논쟁]을 인용한다. 그러나 다른 이들은 학습과 지도에 대한 증거 기반 원칙을 확립했다. 새로운 절차나 치료법이 적절히 적용될 때마다 '작동할 것work'을 기대할 수 있는 생물의학이나 공학의 발전과는 달리, 교육원리의 효과는 예측 가능성이 낮다. 종종 통제할 수 없는 많은 변수들이 교육의 결과를 방해할 뿐만 아니라, "교육 시스템" 자체가 복잡하고 적응적이다.
Advances and discoveries in educational research often focus on new theories and research methods, rather than evidence-based education advances, that stepwise and undeniably show better and better education outcomes. New, undisputed facts on which theories and practice can build, such as in physics, chemistry, and medicine, are rare in educational research.25, 26Sawyer contends that "the history of scientific approaches to [general] education is not promising" and cites the ongoing debate about whether education is a science or an art.27Others, however, have established evidence-based principles of learning and instruction.28-30Different from biomedical or engineering advances that may be expected to “work” every time new procedures or therapies are applied appropriately, the effects of educational principles are less predictable. Not only do many variables, often not controllable, interfere with outcomes of education, the "system of education" itself is complex and adaptive.
[복잡한 적응 시스템]은 변수가 바뀌면 자신의 방식대로 반응한다. 새롭고 "증명된" 교육 방법은, 그것이 적용되었을 때, 학생들의 감정적, 동기적, 지적 반응을 불러일으킬 것이다. 의사가 되고자 고도로 동기부여를 받은 학생들은 어떤 교육적 방법과 요구 사항이 적용되든지 간에 목표에 도달하기 위해 그들이 필요하다고 느끼는 모든 것을 할 것이다. 학생은 블랙박스나, [조작이 가능한 수동적인 대상]이 아니라, 어느 정도 학습 경로를 스스로 형성하려는 자유의지가 있다. 예를 들어, 우수한 강의는 자기주도적인 학습 성향을 감소시킬 수 있으며, 시험에서는 이러한 우수한 교사 수행에 참석하지 않은 학생들보다 더 나쁜 성적을 낼 수 있고, 내용물의 복잡성을 스스로 알아내야 한다고 느꼈을 수도 있다.
Complex adaptive systems react in their own way when variables change. A new, "proven" teaching method will, when applied, evoke emotions, motivations, and intelligent responses by students. Students, highly motivated to become doctors, will simply do whatever they feel is needed to reach their target, no matter which curricular methods and demands apply. They are not a black box, or a passive object that can be manipulated, but have a free will to shape their learning pathway to some extent.31, 32
For instance, excellent lectures may decrease the students' inclination to self-directed study, to the point that on tests they may perform worse than students who did not attend these superb teacher performances, and who may have felt forced to figure out the complexities of the content matter themselves.33
교육 연구를 더욱 복잡하게 만드는 것은 교육 개입의 결과 척도를 결정하기 어렵다는 것이다. 시험에서 증명된 지식과 기술이 그러한 결과로 간주될 수 있지만, 의학에서와 같은 교육의 진정한 목적은 실습에서의 효과적인 성과와 개선된 임상 결과이며, 이는 종종 우수한 개인 기술에 의해서만 결정되는 것이 아니라 생물 의학 및 기술 발전, 맥락 및 팀워크에 의해 결정된다.
What further complicates educational research is that outcome measures of educational interventions are difficult to determine. While knowledge and skills demonstrated at exams may be considered such outcomes, the true purpose of education, such as in medicine, is effective performance in practice and improved clinical outcomes, which are often determined by biomedical and technical advances, context and teamwork, not only by superior individual skills.34, 35
그러나 이러한 어려움에도 불구하고, 현재 HPE의 학자들은 많은 발전이 분명히 이루어졌고, 이러한 발전이 교육 관행으로 확립되어왔다는 것에 동의할 가능성이 높다. 의학 교육에서 "발견"은 [일반화된 이론적 진리를 뒷받침하는 발견]보다는 [새로운 교육 또는 평가 방법]인 경우가 더 많다. 성공이 보장된 교육 혁신에 대한 논란의 여지가 없는 증거는 확립하기 어렵지만, 신뢰할 수 있는 이론에 기초한 의학의 몇 가지 변화는 지난 50년 동안 의료 커리큘럼에 깊은 영향을 미쳤으며 현재 권장 접근법으로 간주되고 있다. [이론의 여지가 없는 증거 기반]이라기보다는, 엄격한 최선의 근거에 기반한 의학교육 BEME 문헌 리뷰가 의료 교육자들에게 인기 있는 자료였다. 지난 20년 동안 60개 이상의 BEME 리뷰가 출판되었으며, 건강 직업 교육에서 많은 다른 지식 합성도 이루어졌다. Despite these difficulties, however, current scholars in HPE would likely agree that many advances have certainly been made and turned into established educational practices in the health care domain. "Discoveries" in medical education are more often new educational or assessment methods, rather than findings supporting generalized theoretical truths. While undisputable evidence of educational innovations with guaranteed success is hard to establish,36several changes in medical education, based on credible theory, have had profound influence on medical curricula in the past 50 years and would now be viewed as recommended approaches. Rather than suggesting to be unequivocally evidence based, rigorousbest-evidencemedical education (BEME) literature reviews have been popular resources for medical educators.37Over 60 BEME reviews have been published in the past 20 years, in addition to many other knowledge syntheses in health professions education.
표 1은 50년 동안 의학에 대한 발견과 교육 발전의 예를 보여주는데, 이는 보건 직업 교육 분야의 학자들 덕분이라고 할 수 있다. 표의 한계는 단일 식별 가능한 개념, 발견 또는 혁신과 관련되지 않은 많은 의학 교육자들의 중요한 학문적 작업을 공정하게 수행하지 못한다는 것이다. 아래의 모두든 것들이 어느 정도 의료 훈련을 개선했다. 한편 다른 학자들은 (혁신을 제시하거나 시도하기보다는), 의학교육에 대한 [신화를 폭로]하거나 [의학교육의 강점과 약점에 대한 주요 개요를 제공]하고, [개혁을 촉구]함으로써 이 분야를 더 예리하게 하는 데 도움을 주었다. Table 1shows examples across a 50-year period of findings and educational advances in medicine, “discoveries” if you will, that can be attributed to scholars in the field of health professions education. A limitation of the table is that does not do justice to the important scholarly work of many medical educators not associated with single identifiable concepts, findings, or innovations.
Applying advanced skills training and advanced assessment techniques,
deliberate practice,
mastery learning,
clinical reasoning tests,
instruments to measure clinical learning environments,
physical space for education,
studies to correlate lapses in professional behavior with later adverse practice events,
studies on theories of workplace learning,
motivation,
cognitive load in medical education,
conditions for interprofessional education,
studies on burn-out and depression, and
many other findings or innovations that were tried on smaller scale
all have improved medical training to some extent.
Still other scholars, rather than presenting or trying an innovation, have helped sharpen the mind by
provided major overviews of strengths and weaknesses in medical education, and urged for reform.42, 43
의학 교육, 그리고 어느 정도 다른 건강 직업 교육은 오늘날 우리가 알고 있는 바와 같이 이러한 진보가 없었다면 분명히 달라졌을 것이다. Medical education, and to some extent other health professions education, as we know it today would be definitely different without these advances.
3.2 통합 3.2 Integration
[통합]은 [분야 내부에서의 통합] 및 [분야 간 새로운 발견의 통합]과 관련이 있습니다. 표 1에 나타난 모범적인 발전은 특히 보건 직업 교육을 위해 개발되었으며, 많은 것들이 문제 기반 학습과 같은 의료 교육이나 보건 직업보다 더 넓은 지역사회에서 상당한 영향을 미쳤다. 일부 발전은 연구가 불충분한 것으로 밝혀진 후 포기되고 새로운 방법으로 대체되었다. 예를 들면 임상 추론 기술(크리스틴 맥과이어와 동료들에 의한) 평가를 위한 환자 관리 문제의PMP 도입이 그러하다. 그러나 PMP의 후계자라고 할 수 있는 Key-Feature 항목은 선구적인 근거가 없었더라면 결코 도입되지 않았을 것이다. 이러한 통합consolidation의 예는 의학 교육이 스스로 발전하는 학문적 전통으로 자리잡아간다는 증거이다. Integrationpertains to the consolidation of new findings within and across disciplines. The exemplary advances shown in Table 1have specifically been developed for health professions education, and many had significant impact in a wider community than only medical education or the health professions, such as problem-based learning.44Some advances, such as the introduction of Patient Management Problems for the assessment of clinical reasoning skill (by Christine McGuire and colleagues) were abandoned45and replaced by newer methods after research had revealed inadequacies. But Key-Feature items (more or less their successor)46would have never been introduced without its precursory grounding. This example of consolidation is a testimony of a self-developing scholarly tradition in medical education.
통합은, 연구의 전통을 구축하는, HPE를 전담하는 학술활동 단위가 꾸준히 확산되는 것으로 해석되었다. 1980년대 북미와 유럽에서는 이런 유닛이 적었지만 2000년 북미에는 61개가 생겼고, 2020년에는 전 세계 여러 나라에 셀 수 없이 많은 유닛이 있다. 의학교육연구회에는 현재 78명의 회원이 등록되어 있으며, 많은 이사들은 SDRME 회원이 아니다. 이 부서들은 일반적으로 연구, 교수 개발(교육) 및 봉사에 관여하는 과학자, 학술 교육자 및 행정 지도자를 고용한다. Consolidation has translated in the establishment of a steady proliferation of dedicated health professions education scholarship units that build a tradition of research.47In the 1980s, such units were just few in North America and Europe, but in 2000 North America had 61 units48and 2020 there are countless units in several countries worldwide. The Society of Directors of Medical Education Research currently lists 78 members directing such units, and many directors are not SDRME members. These units typically employ scientists, scholarly educators, and administrative leaders, involved in research, faculty development (teaching), and service.49,50
통합은 또한 [다양한 과학 영역의 이종교배cross-fertilization]를 의미한다. 보건직 학술활동은 사회과학의 혜택을 많이 받았다. 노먼은 심리학, 사회학자, 심리학자, 심리학자 등 건강 직업 분야에서 비의료적 배경을 가진 학자들의 공헌을 인정하였다. 1980년대와 1990년대에는 사회과학 학자들이 HPE분야에 자신들의 기술을 적응시키는 물결이 거세었다. 이들 중 소수만이 외부 관찰자로 남아 인류학자가 하듯이 HPE를 연구 주제로서 연구하였다. 오히려, 많은 사회과학자들은 의과대학에 고용되어,의학 및 생물의학 전문가들과 긴밀히 협력하여, 교육의 질적인 발전을 지원하면서, 의학교육 학술공동체에 통합되었다. 이는 보건 직업 교육의 발전과 실천에 학습, 교육, 심리학 이론의 통합을 상당히 자극했다. Integration also speaks to the cross-fertilization of different domains of sciences. Health professions scholarship has hugely benefited from the social sciences. Norman has qualified the contributions made by scholars with a nonmedical background as made by “immigrants” in the health professions domain: psychologists, sociologists, and psychometricians. He saw a strong wave of these scholars in the 1980 s and 1990s,45adapting their skills to serve HPE. Only few of these remained outside observers, studying HPE as a topic of research, as would an anthropologist do, without becoming part of it. Rather, PhD level social scientists were hired by medical schools, and integrated in their communities, to support the quality development of their education, in close collaboration with medical and biomedical experts. This has significantly stimulated the integration of theories of learning, education, and psychology in the development and practice of health professions education.
"의료", "교육", "이론"을 결합한 저널 기사 제목은 1960년 이후 60년 동안 기하급수적으로 증가했다. 이 통합은 Norman이 "3세대" 학자라고 부른 이들을 향해 한 걸음 더 나아갔다. 이들은 이민자가 아니라 의학적으로 훈련받은 사람으로서, HPE 석사와 박사과정 고유의 전통 속에서 HPE학술활동을 훈련받으며 보완해나간 사람들이다. 3세대 학자들은 장점(상아탑 스탠스 없이 고도로 전문화된)과 단점(다른 학문분야에서 경험과 배경지식의 깊이가 얕은)이 있었다. 또 다른 중요한 영향은 연구의 방법론에 관한 것이다. HPE 연구는 통제된 실험의 한계에 대한 인식을 반영하듯, [질적 연구]의 상당한 증가를 보였다.
The number of journal article titles combining "medical," "education," and "theory" has exponentially grown across the six decades since 1960 (from 3, via 7, 11, 31, 96, to 195 in 2020) (Google Scholar). The integration made a further step in what Norman called “third generation” scholars, not immigrants but medically trained, and supplemented with HPE scholarship training in an own tradition of dedicated HPE Masters and PhD education, with its pros (being highly specialized without an ivory tower stance) and cons (with less depth of experience and background in other disciplines).45Another important influence regards the methodology of research. HPE research has seen a significant increase of qualitative studies,51,52reflecting the awareness of the limitations of controlled experiments.36,53
HPE분야의 학술활동은, 보이어가 이야기한 통합이라는 용어에 비추어볼 때 한계가 있는가? 전문 영역으로 성숙되어갈 때 나타나는 특징 중 하나는, 전문 학술지가 만들어지며, 역설적으로 다른 학문과 통합하는 것을 주저하는 모습니다. 사회과학 저널에 게재된 HPE 연구의 양은 비교적 적다. 그것은 HPE 학자들이 어떻게 이러한 저널을 읽고 출판하는 것을 덜 선호하는지, 그리고 이러한 저널의 독자들이 HPE에 대한 관심을 덜 가질 수 있는지를 보여준다. 가장 큰 교육 학자 집단은 거의 틀림없이 미국 교육 연구 협회(AERA)이며, 매년 10,000~15,000명의 학자들이 모인다. HPE 학자들은 AERA에 속하지만, HPE 학자들이 지배하는 "The Profession"의 한 분과 내에서 주로 교류한다. 대조적으로, 일부 주제는 다른 교육 문헌보다 HPE 문헌에서 단순히 더 잘 표현될 수 있다. 예를 들어, Van Dijk 등은 대학교에서의 Teaching task의 프레임워크를 검색한 결과, 광범위한 문헌 리뷰에서 46개를 확인했는데, 그 중 18개는 의학 교수진, 6개는 간호, 치과, 약국 및 조산사를 포함한 다른 보건 직종에 관한 것이었다. Are there limitations of Boyer's sense of integration with regards to health professions education scholarship? One hallmark of maturation of a professional domain, the establishment of specialized journals, paradoxically shows a hesitation to integrate with other disciplines. Comparatively very little about health professions education is published in journals of the social sciences. It shows how HPE scholars may be less inclined to read and publish in these journals, and how readers of these journal may be less interested in HPE. The largest community of educational scholars is arguably the American Educational Research Association (AERA), with an annual meeting that brings together 10,000–15,000 scholars. HPE scholars are represented in AERA, but interact largely within one division of it, that of “The Professions”, dominated by HPE scholars. In contrast, some topics may simply be better represented in the HPE literature than in other educational literature. As an example, Van Dijk et al., searching for frameworks of university teaching tasks identified 46 in an extensive literature review, 18 of which pertained to medical faculty and 6 more to other health professions including nursing, dentistry, pharmacy, and midwifery.54
결론적으로, 통합은 혁신과 발견의 통합을 통해 [내부적]으로 이루어졌지만, 다른 분야와의 통합(외부적)은 제한적이었다. To conclude, integration has happened internally, through consolidation of innovations and findings, but integration with other disciplines has been limited.
3.3 적용 3.3 Application
HPE학술활동에서는 연구와 개발이 함께 진행된다. 응용은 이 분야의 핵심적 특성이다. HPE 연구에 관여하는 대부분의 학자들은 임상의, 교사, 또는 둘 다, 교육 과정이나 프로그램 책임자, 부학장과 같은 행정 담당자로서 교육에 대한 역할을 한다. 대학 사회과학부의 교육과학자들이 초중고교 교사가 아니었을 수도 있고 상아탑과학에 대해 비판받을 수도 있는 반면, 매우 많은 경우, HPE 연구자들은 활동적인 교사들, 활동적인 교수 개발자들, 활동적인 교육과정 및 과목 개발자로서, 임상 또는 생의학 연구경험을 가지고 있다. 많은 학구적인 HP 교육자들은 초기에 환자 진료 또는 기초 과학 분야에서 경력을 쌓았고, 이후 단계에서 [두 번째 직업]으로 학문 교육자로 발전했다.
In health professions education scholarship, research and development go hand-in-hand.Applicationis a core characteristic. The vast majority of scholars involved in HPE research have roles in education, either as clinicians, as teachers, or both; as course or program directors or as administrative officers, such as associate deans. While educational scientists in university faculties of social science, may never have been primary or secondary school teachers (even if that is their domain of study) and may be criticized for ivory tower science, HPE researchers are very often active teachers, active faculty developers, active curriculum and course developers with clinical or biomedical research experience. Many scholarly HP educators have initially built a career in patient care or the basic sciences and developed as scholarly educators only at a later stage, as a second career.
HPE의 학술활동 적용 기준이 다른 고등교육 영역보다 더 강력한 이유는 [양질의 의료 서비스에 대한 명확한 사회적 욕구] 때문이다. 의료는 모든 사람에게 영향을 미치며, [사회적 신뢰]를 필요로 하는데, 이는 주로 [의료 제공자와 그들이 제공할 것으로 추정되는 교육]에 초점을 맞춘 신뢰이다. 수십 년에 걸친 의학 훈련의 개선을 옹호하는 많은 보고서들은 크리스타키스가 1995년에 그들 모두가 다음과 같은 결론을 내리고 있다고 정리했다.
"놀랄 정도로 일관되게, [의료 전문직의 특정한 사회적 비전]을 제시하고 있으며, 여기에서 의과대학은 다음을 달성하기 위하여 사회에 복무하는 것으로 여겨진다.
[공공의 이익]에 더 잘 봉사하기 위해
[의료 인력 수요]를 해결하기 위해
[급성장하는 의학 지식에 대처]하기 위해
[일반주의를 강조]하기 위해
다음의 권고사항은 1910년 이후로 거의 지속적으로 등장해 왔다
일반의 교육을 늘린다.
외래 진료 노출을 증가시킨다.
사회과학 강좌를 제공한다.
평생 및 자기 학습 기술을 가르친다.
교육활동에 보상한다,
학교 사명을 명확히 하고
교육 과정을 중앙 집중식으로 관리하다
The reason why the application criterion of scholarship in HPE may be stronger than in other higher education domains is a clear societal desire for high-quality health care. Health care affects everyone, and requires societal trust to operate, a trust that primarily focuses on care providers and their presumed education. The many reports, across several decades, advocating for improvement of medical training led Christakis to conclude in 1995 that they all
"articulate a specifically social vision of the medical profession, in which medical schools are seen as serving society [..] with a remarkable consistency, [..]
이러한 결론은 1995년 이래로, 의학 교육 개혁에 대한 후속 요구로 쉽게 확장된다. conclusions that easily extend to subsequent calls for medical education reforms after 1995.42,43,56
보건직업 교육학술활동은 응용과학의 전형이며, 응용에 지속적으로 치중하기 때문에 순수과학으로 볼 수 없다. 현재 주요 HPE 저널에 게재된 모든 간행물 중 대다수는 연구 보고서가 아니라 관점의 기사, 지침, 리뷰이다. 그것들은 교육을 발전시키고 매우 유용하며, 응용이 HPE 학문 영역의 중심이라는 것을 보여준다. Health professions education scholarship is an exemplar of an applied science and cannot be viewed as a pure science, because of its continuous focus on application. Of all current publications in the major HPE journals, the majority are not research reports, but perspective articles, guidelines, and reviews. They serve to advance education and are highly useful, and show that application is central to the HPE scholarly domain.
3.4 교육 및 학술 커뮤니케이션 3.4 Teaching and scholarly communication
네 번째 기준은 Teaching이며, 더 넓게 해석하자면 지식, 통찰력, 발견을 커뮤니케이션함으로써 공동체와 후배 학자들에게 가르치는 것이다. 1970년 이전에는 사실상 존재하지 않았던 의학 교육에 대한 지역, 국가 및 국제 회의는 수와 규모가 급격히 증가했다(표 2) Boyer's fourth criterion of scholarship isTeaching, or, interpreted more broadly, the communication of knowledge, insight, and discovery, to the community at large and to junior generations of scholars. Not only the number of journals and publications increased significantly; local, national, and international conferences in medical education––virtually nonexistent before 1970, increased rapidly in number and size (Table 2).
회원들과 회의 참석자들에 의해 가장 큰 국제 HPE 협회는 유럽 의학교육협회이다. 1973년 창설된 이래 매년 열리는 이 회의는 유럽 밖에서 온 대다수의 참석자들이 참석하는 글로벌 회의로 성장했다. AMEE는 의료 및 보건 직업 교육의 질을 높이기 위한 다양한 다른 서비스(여행, 웨비나, 자격증 과정, 지침 및 리뷰를 포함한 자원, 상, 상금, 소액 보조금, 펠로우 멤버 옵션)를 제공합니다. 그들의 웹사이트에는 의료 또는 보건 직업 교육을 위한 37개의 소규모 활동적인 국내 및 국제 사회와 협회가 나열되어 있다. 이들 중 다수는 매년 국가 또는 지역 컨퍼런스를 개최하기도 하며, 일부 국가 HPE 컨퍼런스는 국제 컨퍼런스를 능가한다. 미국 의과대학협회는 2019년 연례 회의에서 4490명의 참가자를 받아들였지만, 교육 연구는 AAMC 회의에서 덜 강조되었다. 네덜란드 연례 HPE 컨퍼런스는 지난 10년 동안 매년 900~1000명의 참가자를 안정적으로 받고 있다. The largest international HPE society by members and conference attendees is the Association of Medical Education in Europe (AMEE). Its annual conference has grown since its inception in 1973 into a global conference with a majority of attendees from outside Europe.57AMEE offers a variety of other services to foster the quality of medical and health professions education (journals, webinars, certificate courses, resources including guidelines and reviews, awards, prizes, and small grants, fellowship member options). Their website lists 37 smaller active national and international societies and associations for medical or health professions education (www.AMEE.org). Many of these also hold annual national or regional conferences. Some national HPE conferences exceed international conferences. The Association of American Medical Colleges received 4490 participants at their 2019 annual meeting, but educational research has less emphasis at AAMC meetings; the Dutch annual 2-day HPE conference has received a stable number of 900–1000 participants annually across the past decade.
Teaching이란, 좀 더 구체적으로 말하면, 특정 영역에서 [미래 세대를 교육하는 것]이다. 교육학술활동의 목적은 가르치는 것을 포함하지만, [새로운 세대의 학자들을 가르치는 것]은 뭔가 다르다. 그래서 문제는 HPE 공동체가 HPE 학술활동의 내용과 방법을 가르치는데 어느 정도 투자를 했는가 하는 것입니다. [의학적 배경을 가진 1세대 HPE 학자들]은 교육학과 또는 사회과학 분야에서 석박사 학위를 취득하기 위해 교육 방법을 스스로 훈련하거나 시간을 보냈다. 이러한 모습은 1990년대에 HPE 학술활동 단위에서 [자체적인 HPE 석박사 프로그램]이 제공되기 시작하고, 의과대학에서 teacher career에 대한 진지한 관심이 등장하면서 바뀌었다.58 HPE에서
[전담dedicated 교수] 및 [부교수associated 직책]의 설립,
[임상 및 비임상 교수진]을 위한 대안적 커리어 기회 제공,
의과대학 내 교육 커뮤니티로서 [아카데미Academies의 설립]
...은 이러한 흐름을 더 촉진하였다. Teaching, more specifically, involves educating future generations in a specific domain. While the object of educational scholarship includes teaching, teaching new generations of scholars is something different. So the question is: to what extent has the HPE community invested in teaching the content and methods of HPE scholarship? The first generations of HPE scholars with a medical background have trained themselves in educational methods or spent time to obtain an advanced degree in schools of educational or social sciences. This has shifted in the 1990s, when advanced academic degree programs began to be offered by units of health professions education scholarship, and serious attention for teacher careers in medical schools emerged.58
The establishment of dedicated professor and associate professor positions in health professions education,
providing an alternative career opportunity for clinical and nonclinical faculty members,59 and
the establishment of Academies as educational communities within medical schools for early career or distinguished educators60
has further fostered this.
석사와 박사 프로그램은 이러한 지속적인 학문의 전문적 발전을 가능하게 하였다. HPE의 석사급 프로그램은 1996년 7개에서 2012년 76개, 2020년 139개로 증가했으며, 구조화된 박사급 프로그램은 2014년 24개, 2020년 26개로 집계됐다. 여기서 훈련받은 학생 수도 크게 늘었다. 일례로 마스트리히트대 보건전문대학원(School of Health Professional Education)에서 활동 중인 박사과정 학생의 수가 지난 10년간 25명에서 100명으로 증가했다. 확장된 국제 협력은 프로그램이 한 곳에 점점 덜 제한됨에 따라 그러한 증가를 촉진한다. 몇몇 국가들은 이 운동에서 지도력이 뛰어났다. 1960년 이후 영국, 캐나다, 미국에 이어 네덜란드, 호주까지 건강 직업 교육에서 학술활동을 장려해 왔다. 의과대학별 생산성으로 측정했을 때, 즉, 지난 10년 반 동안 캐나다와 네덜란드는 가장 높은 상대적 HPE 연구 생산성을 보여주었으며, 학술지 기사에 대한 선임 저자 자격을 종종 제공했으며(표 4), 국제 연구 멘토십의 표시로 해석된다
Masters and PhD programs enable this continued professional development in scholarship. The number of masters level programs in HPE increased from 7 in the year 1996 to 76 in the year 201261and 139 in the year 2020 (www.faimer.org) and the number of structured doctoral programs was calculated to be 24 in the year 201462and 26 in the year 2020 (www.faimer.org). The numbers of students trained in these units also expanded significantly. As an example, the number of active PhD students in Maastricht University's School of Health Professions Education increased in the past decade from 25 to 100.63Expanded international collaborations foster such increases as programs become less and less confined to one location.64A few countries have excelled in leadership in this movement. Since 1960 the United Kingdom, Canada, and the USA, followed by the Netherlands and Australia have promoted scholarship in health professions education. Measured by productivity per medical school, that is, considering the size of the country, Canada and the Netherlands have shown the highest relative HPE research productivity across the past decade and a half, and often provided senior authorships on journal articles (Table4), to be interpreted as a sign of international research mentorship (Table3).
[네덜란드]와 같은 일부 국가에서는 교수직은 박사과정 학생들을 개별적으로 또는 구조화된 프로그램에서 감독할 수 있는 공식적인 권리와 기대를 포함한다. 보건직 교육에서 이러한 의자의 증가는 HPE 박사과정 학생 수의 증가로 인한 촉매 효과를 가져왔다. 박사 학위 졸업에 기초한 대학 연구의 정부 자금과 결합하면, 이것은 네덜란드에서 건강 직업 교육 연구의 다작 생산을 설명할 수 있을 것이다. In some countries, such as the Netherlands, professor positions include the formal right and expectation to supervise doctoral students in their domain of expertise, individually or in structured programs. In health professions education, the increase of such chairs has had the catalytic effect of increased numbers of PhD students in HPE which. Combined with government funding of university research based on PhD graduations, this may explain the prolific production of health professions education research in the Netherlands.65
의심할 여지 없이, 보이어의 Teaching 기준은 개별 국가 수준 뿐만 아니라, 국제적인 수준에서도 충족되었다. Boyer'steachingcriterion, no doubt, has been met, not only locally, but also at the international level.
4 결론 및 전망 4 CONCLUSION AND OUTLOOK
HPE 학술활동의 발전과 현황을 분석해보았을 때, 보이어의 성숙한 학문 규율 기준을 모두 충족한다는 것을 부인할 수 없다. HPE 학문 단위는 학문적 단위가 될 수 있으며, 따라서 이어져야 하는 질문은 그러한 학과 또는 단위가 대학에서 어디에 속하느냐이다. 지금까지는 사회과학이나 교육과학의 학부나 학과보다는, 보건전문직 대학들이 이러한 단위를 설립하고 주최해왔으며, 이를 유치해야 했다. (사회과학의 통찰력과 결합하여) [보건의료행위가 이뤄지는 곳과 근접하게 자리하는 것]이 이러한 단위가 번창하기 위한 중요한 조건이었던 것으로 보인다. 66 HPE 연구는 의사, 간호사 또는 다른 건강 전문가처럼 생각하고 행동하고 느끼는 것이 무엇인지 이해하는 사고방식을 가진 학자들에 의해 가장 잘 수행되어야 한다. 즉, 의료 분야에서 [전문지업적 정체성]을 소유하거나, 적어도 공감하기 위한 것이다. The analysis of the development and current status of health professional education scholarship would undeniably qualify it as meeting all of Ernest Boyer's criteria of mature scholarly discipline. HPE scholarly units can become academic departments and a relevant question is then where in universities such departments or units belong.50Rather than in faculties or departments of social or educational sciences, schools in the health professions have established and hosted such units and should host them. Situated in close vicinity to the practice of health care seems to have been a critical condition for these units to flourish, combined with the insights of the social sciences.66HPE research should be best conducted by scholars with a mindset to understand what it is tothink, act, and feellike a physician, nurse, or other health professional, in other words to possess, or at least sympathize, with professional identities in health care.67
20세기 중반 이후 HPE 학술활동 활동에 대한 관심의 성장은 다른 고등 교육 분야에서도 유사한 발전을 앞질렀다. 잘 준비된 의료 전문가를 위한 최적의 의료 서비스에 대한 추구는 사회적 영향, 전문적인 존중, 직업의 명확성과 70년 전에는 부족했던 교육 이론 및 연구 방법론의 통찰력을 결합한 명확한 교육적 집중으로부터 이익을 얻었을 수 있다. The growth of health professions education scholarship activities and interest since mid-20th century (journals, publications, conferences, HPE research, and development centers, scholars) has out-paced similar developments in other higher education domains. The quest for optimal health care, and consequently, for well-prepared health care professionals may have benefited from a clear educational focus that combines societal impact, professional esteem, and clarity of occupations with insights from educational theory and research methodology that lacked 70 years ago.
초기 수십 년 동안 몇몇 계몽된 사람들이 HPE 학술활동의 성장과 방향에 큰 영향을 미쳤지만, 현재 학자들의 숫자는 오랫동안 지속 가능한 영역을 유지하는데 중심적인 임계 질량을 넘어섰다. While during the early decades a few enlightened individuals had a major impact on the growth and direction of HPE scholarship, the number of scholars now has likely passed the pivotal critical mass to keep the domain sustainable for a long time.
스털리 외 연구진(222-225페이지)은 의료 교육의 미래에 대한 분석에서 의료 교육 연구의 개선을 위한 5가지 주요 의제를 상세히 설명한다. In their analysis of the future of medical education,77Bleakley et al. (page 222–225) elaborate a five-point agenda for improvement of medical education research (slightly amended):
(1) [개념적 질문 및 명확화]에 초점을 맞추고, 증거로서 무엇이 중요한지 결정한다. (1) a focus on conceptual questions and clarifications and deciding on what counts as evidence,
(2) 기회주의적 연구보다는 [체계적인 연구]의 프로그램 구축 (2) building programs of systematic research rather than conducting just opportunistic studies,
(3) 보다 엄격한 [성과-기반 연구], (3) more rigorous outcome-based research,
(4) 질적 및 정량적 (혼합된 방법) 연구에 대한 더 나은 전문지식을 구축하고, (4) building better expertise in combined qualitative and quantitative (mixed methods) research, and
(5) 학술계와 임상계 사이에 생산적인 대화를 창출한다. (5) creating a productive dialog between the academic and clinical communities.77
아스클레피오스는 히포크라테스의 선서에 포함된 건강 전문가들의 고유 임무인 뱀과 막대기에 대한 자신의 상징이 어떻게 수천 년 후에 활발한 학문 교육자 공동체로 이어졌는지 알면 놀랄 것이다. 그때나 지금이나, 최고의 자격을 갖춘 의료 전문가를 양성한다는 일반적인 목적은 변하지 않았습니다. 연구자와 학자들은 [유능한 의료 인력이라는 궁극적인 목표]가 달성가능하며, [이 목표가 의료 교육의 지속적인 혁신에 기름을 부을 것]이라는 비전을 만들지만, 학술활동을 특징짓는 것은 달성 가능한 종점이 아니라 거기에 이르는 과정pathway일 수 있다. 최적의 교육을 통해 만들어진 '역량있는 전문직'은 마치 성배Holy Grail처럼 보일지 모르지만, 이를 달성하려면 보이어의 기준에 따른 학술활동이 필요하다. 이 과정에는 부침이 있으며, [역량있는 의료인력]에 대한 [학교, 병원 및 규제 기관의 관심]은 [자금 조달, 효율성, 법적인 제약]이라는 "의도하지 않은 결과"로 이어졌다. 이러한 결과를 분별하고 이를 극복할 수 있는 방법을 제시하는 학자들이 필요하다. 이러한 역학의 혼합은 미래의 학자들이 학습자, 임상의, 환자 및 사회를 위해 건강 직업 교육의 지속적인 혁신을 만들고 시험하도록 계속 도전하게 될 것이다.
Asclepius would be surprised to know how his symbols of snake and rod as well as the obligation to teach—an inherent task of health professionals, incorporated in Hippocrates' oath—have led to a lively community of scholarly educators several millennia later. The common pursuit, then and now, for the best qualified health professionals has not changed. While researchers and scholars develop visions that suggest that the ultimate goal of a competent health care workforce may be attainable and fuel the continued innovation in medical education, it may be thepathwayrather than an attainable endpoint that characterizes scholarship. While "the competent health professional," molded by optimal education, may seem a Holy Grail, the quest for it is served by scholarship according to Boyer's criteria. The pathway shows ups and downs,78and the interest of schools, hospitals, and regulatory bodies in this competent workforce, has led, in the words of Woolliscroft, to "unintended consequences" of financing, efficiency, and legal constraints.69Scholars are needed to discern these consequences and recommend routes to overcome them. This amalgam of dynamics is bound to keep challenging future scholars to create and test ongoing innovations in health professions education, to the benefit of learners, clinicians, patients, and society.
FASEB Bioadv. 2021 Mar 29;3(7):510-522.
doi: 10.1096/fba.2021-00011.eCollection 2021 Jul.
Health professions education scholarship: The emergence, current status, and future of a discipline in its own right
Medical education, as a domain of scholarly pursuit, has enjoyed a remarkably rapid development in the past 70 years and is now more commonly known as health professions education (HPE) scholarship. Evidenced by a solid increase of publications, numbers of specialized journals, professional associations, national and international conferences, academies for medical educators, masters and doctoral courses, and the establishment of many units of HPE scholarship, the domain of HPE education scholarship has matured into a scholarly discipline in its own right. In this contribution, the author reviews the developments of the field from Boyer's four criteria that determine scholarship: discovery, integration, application, and teaching. Born mid-20th century, and in the first decades developed in the predominant area of physician education, HPE scholarship has matured, with increasing breadth, depth, and volume of scholars, publications, conferences, and dedicated centers for research and development. The author concludes that, given the infrastructure that has emerged, HPE can arguably be considered a discipline in its own right. This academic question may not matter hugely for practices of scholarly work in this domain, and any stance in this academic debate inevitably reflects a personal view, but the author would support the view of health professions scholarship as being a unique niche, with inherent dependence on both medical and other health professional sciences, on the one hand, and social sciences, including educational sciences, on the other hand.
Keywords:History; conferences; health professions education; medical education; publications; scholarship.
평가 프로그램의 철학적 역사: 변화해온 윤곽의 추적(Adv Health Sci Educ Theory Pract.2021) A philosophical history of programmatic assessment: tracing shifting configurations J. Pearce1 · W. Tavares2
소개: 왜 철학적 역사인가? Introduction: why a philosophical history?
HPE에서는 프로그램 평가가 보편화되었다. 이 주제에 대한 학술 문헌이 풍부하고 의과대학과 전문 훈련대학은 점점 더 프로그래밍식 평가를 전면적으로 시행하거나 접근법의 측면을 평가 프레임워크에 통합하고 있다. 프로그래밍 접근방식은 [평가 증거를 결합하여 프로그램 수준에서 평가를 최적화]한다. 개별 평가에서 합격/불합격 결정을 제거하고(데이터포인트로 처리), 학습자가 다양한 방법으로 평가(및 지속적인 피드백 제공)를 받을 수 있도록 보장하며, 축적된 증거를 검토하는 즉시 전문 심사위원이 역량에 대한 높은 결정을 내려야 한다. 그러나, 분명해지겠지만, 이것은 상황을 설정하기 위한 프로그램 평가의 작업 정의일 뿐입니다. 우리는 프로그램 평가가 유동적인 개념이며, 프로그램 평가를 구성하는 것이 시간이 지남에 따라 변화했다고 주장한다. Programmatic assessment has become ubiquitous in health professions education. The academic literature on the topic is abundant, and medical schools and specialist training colleges are increasingly implementing programmatic assessment in full, or incorporating aspects of the approach into their assessment frameworks. A programmatic approach in health professions education optimises assessment at a programme level by combining assessment evidence. It removes pass/fail decisions from individual assessments (treated as datapoints), ensures that learners are assessed (and given constant feedback) with a variety of methods over time, and requires high-stakes decisions regarding competence to be made by expert judges upon reviewing accumulated evidence. However, as will become clear, this is merely a working definition of programmatic assessment in order to set the scene. We argue that programmatic assessment is a fluid concept, and what constitutes programmatic assessment has changed over time.
지지자들은 초기 형태의 심리 측정 테스트에서 나온 프로그램 평가의 출현에 대한 서술적 이야기를 되짚고, 그것이 해결한 문제와 긴장을 개략적으로 설명한다(슈비르트 & 반 데르 블뢰텐, 2019). 의학 교육 교과서에는 이제 프로그래밍 평가에 관한 장이 수록되어 있다(Van der Vluten 등, 2017, 2020). 2020년 오타와 회의는 이 주제에 대한 첫 번째 '합의문'을 준비했다. 간단히 말해서, 우리는 [거의 의심받지 않는 프로그램적 접근법]으로 구성된 의학 교육의 평가의 시대로 들어섰다. 프로그램적이지 않은 평가에 대한 접근은 어떤 의미에서는 가식적이 되었다. 프로그래밍식 평가는 확고히 자리잡은 발상이 되었고, 이제는 평가 관행을 규제하고 있다. 이를 통해 그것이 언제 처음 나타났는지, 어떻게 우리가 오늘날 알고 있는 형태로 진화했는지 성찰할 수 있다. Proponents recount narrative stories about the emergence of programmatic assessment from earlier forms of psychometric testing, and outline problems and tensions it has solved (Schuwirth & van der Vleuten,2019). Medical education textbooks now feature chapters on programmatic assessment (Van der Vleuten et al.,2017,2020). The 2020 Ottawa Conference prepared its first ‘consensus statement’ on the topic. In short, we have entered an era of assessment in medical education constituted by an almost unquestioned programmatic approach. Approaches to assessment that are not programmatic have become, in a sense, tendentious. Programmatic assessment has become an entrenched idea, now regulating assessment practice. This allows us to reflectively ask when it first emerged and how it evolved into the form we know today.
연구의 목적 및 구조 Purpose and structure of the study
본 논문은 이러한 문제가 다른 곳에서 다루어지기 때문에 프로그램 원칙이나 운영 접근법에 관여하는 것에서 한 발 물러섰다(Van der Vleuten et al., 2015, 2017; Wilkinson & Tweed, 2018). 대신, 우리는 메타 철학 및 역사학적 관점에서 프로그램 평가를 검토하기로 선택한다. 우리는 프로그램 평가 역사에서 상대적으로 구별되는 세 가지 단계를 식별하였다.
출현
진화
고착
This paper takes a step back from engaging with programmatic principles or operational approaches, as these issues are dealt with elsewhere (Van der Vleuten et al.,2015,2017; Wilkinson & Tweed,2018). Instead, we choose to review programmatic assessment from a meta-philosophical and historiographical perspective. We identify three relatively distinctive phases in the history of the programmatic assessment:
emergence,
evolution and
entrenchment.
우리는 시기phase 사이에 일어나는 것처럼 보이는 철학적 변화를 끌어내고 궤도의 변화를 이끄는 것처럼 보이는 순간에 철학적 이슈를 검토한다. 여기서, 우리는 아이디어 자체의 [비-목적론적non-teleological 변화], 즉 어떻게 그것이 필요한 엔드포인트나 목표 없이 유기적으로 진화했는지를 언급할 것이다. We draw out the philosophical shifts that seem to be occurring between phases, and also examine philosophical issues at moments that appear to be driving shifts in the trajectory. Here, we are referring to non-teleological changes in the idea itself—how it evolved organically without a necessary endpoint or goal.
연구의 관련성 Relevance of the study
평가에 대한 방법론적 접근법이 문헌에서 일상적으로 논의되고 있지만, 평가를 형성하는 철학적 가정과 책임에는 덜 주의를 기울였다. [철학적 입장이 암묵적일 때], 뒤따르는 토론은 방법론적인 것에 집중된다. [철학적 위치]가 단순히 [데이터를 생성하는 데 사용되는 방법]을 넘어서, [평가에 대한 이해를 형성]하는 데 갖는 역할을 고려할 때(Tavares 등, 2019) 프로그램 평가와 그 내역에 대한 철학적 조사는 시기적절하다. 프로그램 평가의 역사적 궤적을 추적하면서, 우리는 그 안에서 변화하는 암묵적인 철학적 위치를 끌어낼 것이다.
Although methodological approaches to assessment are routinely discussed in the literature, less attention has been given to the philosophical assumptions and commitments that shape assessments. When philosophical positions remain implicit, methodologically focused debates ensue. Given the role philosophical positions have in shaping an understanding of assessment beyond what methods are used to generate data (Tavares et al.,2019), a philosophical probing of programmatic assessment and its history is timely. In tracing the historical trajectory of programmatic assessment, we draw out the shifting, implicit philosophical positions within it.
접근법의 기초 및 정당성 Basis and justification of the approach
다양한 관점(예: 지적, 사회, 문화, 경제, 정치)의 프로그래밍 평가의 완전하고 세분화된 역사는 가치가 있지만, 우리는 다른 역사적 관점에서 진행하기를 바란다. 라스무센은 과학의 역사에서 [전통적인 접근법]이 전형적으로 [이론의 발전]을 추적해왔다고 지적한다. 즉, (발명과 발견과 같은) 진보적인 해결책과 (이론과 모델과 같은) 학문 내의 질문에 대한 답에 초점을 맞추고 있다고 언급했다.
Although a complete and fine-grained history of programmatic assessment from multiple perspectives (e.g., intellectual, social, cultural, economic, political) would be valuable, we wish to proceed from a different historiographical perspective. Rasmussen notes that traditional approaches in the history of science have typically traced the development of theories, focussing on progressive solutions (such as inventions and discoveries) and answers (such as theories and models) to questions within a discipline (Rasmussen,1997).
자딘(Jardine)은 과학 분야의 역사에 접근하는 [대안적인 방법론]을 제시한다. 즉, [변화하는 질문, 문제, 실천 및 전제를 추적]하는 것에 초점을 맞추는 것이다(Jardine, 2000). 자딘의 질문의 목적은 변화하는 '조사의 장'이다.
연구자들은 어떤 질문을 하고 있는가?
그들이 걱정하는 문제들은 무엇인가?
이러한 문제를 해결하기 위해 그들은 어떤 관행, 방법, 기술을 사용하는가?
어떤 근본적인 철학적 전제가 조사를 인도하는가?
Jardine offers an alternative methodology for approaching the history of scientific disciplines, which instead focuses on tracing the shifting questions, problems, practices and presuppositions of inquirers (Jardine,2000). Jardine’s object of interrogation is the shifting ‘scene of inquiry’—
what questions are being asked by inquirers?
What are the problems that concern them?
What practices, methods and techniques do they draw upon to solve these problems?
What underlying philosophical presuppositions guide inquiry?
이러한 미묘함은 시간이 지남에 따라 사라지거나, 잘못 해석되거나 의도하지 않은 방식으로 옮겨질 수 있습니다. 그럼에도 불구하고 이러한 미묘함들은 정확히 우리가 이 프로그램 평가의 역사에서 분석하게 될 것이다.
These subtleties can get lost over time, misinterpreted or taken up in unintended ways. And yet these subtleties are precisely what we will be analysing in this history of programmatic assessment.
자딘의 방법론에 따라, 우리는 메타 철학 렌즈를 통한 프로그램 평가에 대한 역사적 연구를 수행하는 과정에서, 연구자inquirer의 질문, 문제, 실천 및 철학적 전제에 초점을 맞춘다. 이 방법론적 접근은 [역사적 인식론]이라는 지적인 전통 정신을 이용한다. [역사적 인식론]은 "사물이 지식의 대상으로 만들어지는 역사적 조건과 수단"에 대한 연구이다. 근본적으로 역사적 인식론은 과학이 철학적으로 무엇인지 이해하기 위해서는 우선 비판적인 관점에서 그것의 역사를 연구해야 한다고 가정한다. 여기에는 역사적 궤적에서 철학적 조건과 자극을 이해하는 것이 포함된다(Tavares 등, 2019).
Following the methodology of Jardine, we conduct a historiographical study of programmatic assessment through a meta-philosophical lens, focussing on questions, problems, practices and philosophical presuppositions of inquirers. This methodological approach draws on the spirit of the intellectual tradition of historical epistemology. Historical epistemology is an investigation into “the historical conditions under which, and the means with which, things are made into objects of knowledge”(Rheinberger,2010, p. 2). Fundamentally, historical epistemology posits that in order to understand what science is philosophically, we must first study its history from a critical perspective. This includes understanding the philosophical conditions and stimuli in a historical trajectory (Tavares et al.,2019).
이 접근법은, 관점주의perspectivism에 기반을 두고 있으며, [불변하거나, 시대를 초월하거나, 객관적이거나, 절대적인 형태의 합리성]을 갖춘 주장은 없다고 주장한다.과학(그리고 과학적 탐구)은 역사적 우발성historical contingencies으로 인해 시간이 지남에 따라 단편화된다. 과학적 실천의 규범과 지식의 내용은 [특정한 철학적 우선순위]로 인해 발생하는 길고 때로는 꼬여있는 역사에 의존한다. 우리는 이러한 개념을 평가와 관련하여 유동적이고 문화적인 탐구 관행을 강조하면서 프로그램적 평가에 활용합니다.
Such an approach, grounded in perspectivism (Pearce,2013), argues that there is no claim to unchanging, timeless, objective or absolute forms of rationality. The sciences (and scientific inquiry) become fragmented over time due to historical contingencies. The norms of scientific practice and the content of knowledge are dependent on long and sometimes convoluted histories, which arise due to specific philosophical priorities. We utilise these conceptions for programmatic assessment, underscoring the fluid, cultural practice of inquiry in relation to assessment.
현대 우주론(J. 피어스, 2017), 유기화학(Klein, 2003), 전자현미경(Rasmussen, 1997), 확률(Hacking, 1975)을 포함한 과학적 연구의 많은 측면들이 이러한 관점에서 연구되어 왔다. 간단한 예로, 암흑물질의 개념의 출현은 현재 확고하게 자리 잡고 있는 물리학 현상으로, 복잡한 궤적을 가지고 있다. 1930년대에 은하 회전곡선의 질량 불일치 문제를 해결하기 위해 제안되었지만, 1970년대까지만 해도 이 '누락missing 물질' 문제는 더 넓은 물리학계에서 문제가 되지 않았다(de Swart 등, 2017). 우주론 연구의 연구, 입자물리학과 우주론의 융합, 그리고 심지어 천문학에 대한 투자 증가와 같은 사회적, 경제적 요인에 의해 이 아이디어가 더욱 확고해졌다. Many aspects of the history of scientific inquiry have been probed from this perspective, including modern cosmology (J. Pearce,2017), organic chemistry (Klein,2003), the electron microscope (Rasmussen,1997) and probability (Hacking,1975). By way of a brief example, the emergence of the concept of dark matter, now a firmly entrenched physics phenomenon, took a convoluted trajectory. It was proposed in the 1930s to solve a mass discrepancy problem in galaxy rotation curves, but this ‘missing matter’ problem was not seen as problematic by the wider physics community until the 1970s (de Swart et al.,2017). The entrenchment of the idea was driven more by lines of inquiry in cosmological research, the fusion of particle physics and cosmology, and even social and economic factors such as increased investment in astronomy.
우리는 [메타 철학적 렌즈]를 통해 역사를 면밀히 조사하는 과정에서, [우리 자신의 관점]에서 프로그래밍 평가의 역사에 관여engage한다. 우리는 이 논문에서 [처방적prescriptive]이 아니라, 전적으로 [서술적descriptive]이고자 함을 강조한다. 그리고 어떤 경우에는, 철학적 입장이 항상 명시적이지 않기 때문에, 우리는 우리 자신의 추론에 의존해야 합니다. 그러므로 우리는 이 철학사에서 '왜'가 아닌 '무엇'과 '어떻게'만 다루고 있다. We engage with the history of programmatic assessment from our own perspective, carefully investigating the history through a meta-philosophical lens. We must stress that we are being entirely descriptive in this paper, not prescriptive. And in some cases, we must rely on our own inferences, as philosophical positions are not always explicit. Thus, we are only dealing with the ‘what’ and the ‘how’ in this philosophical history, rather than the ‘why’.
우리의 설명은 완전한 역사이거나 객관적인 서술recount를 의미하지 않는다. 둘 다 역사적 인식론의 정신에 반할 것이다. 우리는 또한 특정 검색 프로토콜로 체계적인 검토를 수행하지 않는다. 주로 평가 문헌이 철학적으로 구성되어 있지 않고, 조사 장면에서 변화하는 구성을 도출하는 데 프로그래밍 평가와 관련된 모든 문헌이 관련이 없기 때문이다. 대신, 우리는 다양한 출처에서 정보를 제공하는 서술적 접근법을 사용했다.
our account is neither meant to be a complete history, nor an objective recount; both of which would go against the spirit of historical epistemology. We are also not conducting a systematic review with specific search protocols—mainly because assessment literature is not philosophically organized, nor is all literature related to programmatic assessment relevant in drawing out shifting configurations in the scene of inquiry. Instead, we used a narrative approach informed by a variety of sources.
Lingard의 말에 따르면, 우리는 "프로그램적 평가를 뒷받침하는 동기"를 발굴할 필요가 있습니다(Lingard, 2009, 페이지 627). 우리는 역사 속 핵심 주체들이 쓰고, 말하고, 행동하는 것에 집중함으로써 이것을 한다.
우리의 주요 출처는 의학 교육 저널의 일차 문헌이 될 것이다. 이러한 출처는 평가 학자와 실무자가 만든 질문의 종류, 문제 및 제안된 해결책을 상세히 기술하는 조사 현장의 중요한 기록이다(Jardine, 2000).
2차 자료(접근법의 지지자들에 의한 성찰적 작업 등) 또한 그들의 전제, 동기 요소, 그리고 그들이 일하고 있던 문화적 맥락을 강조하는 데 도움이 될 것이다.
관련성이 있는 경우, 우리는 또한 평가에 대한 새롭고 새로운 접근법에 대한 중요한 기록을 제공하기 때문에 컨퍼런스 프레젠테이션과 진행의 예를 도출할 것이다.
마찬가지로, 우리는 때때로 교과서와 교육 자원을 언급할 것이다. 이러한 객체들이 반복적으로 학문을 만들고 그 후에 분야를 통합할 것이다(Badino & Navarro, 2013; Kragh, 2013).
마지막으로, 웹사이트나 온라인 강의와 같은 더 인기 있는 자료들은 장면의 구성에 대한 중요한 지표이기 때문에 언급될 것이다.
In the words of Lingard, we need to excavate “the motivations that underpin” programmatic assessment (Lingard,2009, p. 627). We do this by focussing on what key players in the history write, say, and do.
Our main sources will be primary literature in medical education journals. These sources are important records of a scene of inquiry (Jardine, 2000) as they detail the kinds of questions, problems and proposed solutions made by assessment scholars and practitioners.
Secondary sources, such as reflective works by proponents of the approach, will also be helpful in highlighting their presuppositions, motivational factors, and the cultural contexts in which they were working.
Where relevant, we will also draw on examples of conference presentations and proceedings as these provide an important record of new and emergent approaches to assessment.
Similarly, we will at times mention textbooks and educational resources as these objects iteratively create and subsequently consolidate a discipline (Badino & Navarro, 2013; Kragh, 2013).
Finally, more popular material, such as websites and online lectures will also be mentioned as they are an important indicator of the configurations of a scene.
출현: 후기 실증주의적 관점으로 전환하여 실증주의적 '터모일' 극복(2005년 이전) Emergence: overcoming positivist ‘turmoil’ by shifting to a post-positivist perspective (pre-2005)
씬(scene) 구성 Configurations of the scene
이 이야기의 선구자는 측정 접근법에 관한 개념적 프레임워크에서 평가에 이르는 20세기 중반으로 거슬러 올라갈 수 있지만, 우리는 이 역사에 대한 질문을 거의 틀림없이 프로그램 평가 아이디어의 첫 출현으로 제한하기로 결정했다. 2016년, 씨스 판 데르 블뢰텐은 1996년 그의 논문이 프로그램적 사고의 첫 출현이라고 밝혔다. 그러나 이러한 아이디어 중 일부는 두 개의 이전 논문에서 선행되었다는 점에 주목한다(Norman 등, 1991년; Van der Blouten 등, 1991년). 1996년, 그는 조사 현장의 현주소를 다음과 같이 기술하며 시작한다. Although the precursors to this story can be traced back to the mid-20thCentury—stemming from conceptual frameworks concerning measurement approaches to assessment—we choose to limit our interrogation of this history to what is arguably the first emergence of the idea of programmatic assessment. In 2016, Cees van der Vleuten identifies his 1996 paper as the first emergence of programmatic thinking (Van der Vleuten,2016). However, we note that some of these ideas were foreshadowed in two earlier papers (Norman et al.,1991; Van der Vleuten et al.,1991). In 1996, he begins by describing the current state of the scene of inquiry:
교육 성취도 시험은 보건과학에서 혼란스러운 분야이다. 시험은 많은 교사, 교육과정 설계자, 교육자들에게 지속적인 문제의 원천이다. 학생 성취도에 대한 평가는 교육 회의, 회의, 워크숍에서 지속적으로 논의되고 있다. 전통과 개인적 가치관, 경험이 토론을 좌우하는 영역이다. 반면에 지난 10년 동안 평가 대상 과학 출판물의 수는 폭발적으로 증가했다. 제안된 도구의 수는, 각각 흥미로운 두문자어를 사용하는 것을 선호하며, 셀 수 없이 많다. (Van der Bluten, 1996, 페이지 41) Educational achievement testing is an area of turmoil in the health sciences. Examinations are a constant source of problems for many teachers, curriculum designers and educationalists. The evaluation of student achievement is continually debated at educational meetings, conferences and workshops. It is an area in which tradition, personal values, and experiences tend to dominate discussions. On the other hand, the number of scientific publications on assessment over the last decade has exploded. The number of proposed instruments, each preferably using an intriguing acronym, is countless. (Van der Vleuten,1996, p. 41)
위 논문에서는 평가를 [최적화 문제]로 제시한다. 평가 방법마다 장단점이 있다. 효용 공식이 제시(그리고 종종 인용)되는데, 여기서 모든 평가 방법의 효용은 신뢰성, 유효성, 교육적 영향, 수용성 및 비용의 산물이다. 주된 주장은 단일 평가 방법이 모든 품질 기준에서 완벽할 수는 없다는 것이다. 각 평가 순간에는 타협compromise이 필요합니다. 트레이드오프는 불가피하며, 결정은 상황별 요인에 의해 영향을 받습니다. The paper goes on to present assessment as an optimisation problem. Each assessment method has its own strengths and weaknesses. A utility formula is presented (and often cited), whereby the utility of any assessment method is a product of its reliability, validity, educational impact, acceptability and costs. The main argument is that no one single assessment method will be perfect on all quality criteria. Each assessment moment requires a compromise—trade-offs are inevitable, and decisions will be influenced by contextual factors.
"turmoil"이라는 단어의 사용은 실무자들과 이론가들 사이의 혼란스러운 장면을 스케치합니다. 의료 교육자들은 [타당성validity과 실제성authenticity을 희생하지 않고] [신뢰성reliability을 높일 수 있는 최상의 평가 방법]을 찾기 위해 고군분투하고 있었다. 끊임없이 확대되는 [평가 툴킷]을 기반으로 하는 [테스트의 시대]였다. 이 시대에는 다양한 문제들이 있었다.
맥락 특이성,
객관성에 대한 도전,
일부 형태의 평가에서 제한된 데이터에 대한 우려
가짜 데이터(예: 시험 점수의 위양성) 및
[임상 역량의 복잡성]과 [특성의 조합] 사이의 긴장에 관한 우려
The use of the word “turmoil” sketches a scene of confusion amongst practitioners and theorists alike. Medical educators were struggling to find the best assessment methods that would enhance reliability without sacrificing validity and authenticity. It was an era of testing, based in an ever-expanding toolkit of assessments. There were problems such as
context specificity,
challenges to objectivity,
concerns about limited data from some forms of assessment,
spurious data (such as false-positives in test scores), and
concerns relating to the combination of traits in tension with the complex nature of clinical competence.
이러한 문제들은 심리학자들의 문제였고, 과학적 연구의 언어로, 이 문제들은 실증주의적 원리에 기초했다. 그러나 이러한 문제들을 해결하지 못하자 새로운 접근을 위한 준비로 떠들썩한 탐구 장면이 연출되었다.
These problems were those of psychometricians, and in the language of scientific inquiry, these problems were based on positivist principles. But the failure to solve these problems resulted in a tumultuous scene of inquiry that was primed for a novel approach.
우리는 Cees van der Vleuten과 Lambert Schwirth의 2005년 논문 '전문적 역량 평가: 방법에서 프로그램까지'를 프로그래밍 평가의 출현의 결정적 순간으로 식별한다(Van der Vleuten & Schwirth, 2005). 우리가 글을 쓸 당시, 그 논문은 1237번 인용되었다. 2016년 판 데르 블뢰텐은 이 논문이 그의 평가에 대한 생각에서 획기적인 사건이라고 언급했다(Van der Blouten, 2016). 저자들의 목표는 [평가를 "측정 문제"로 취급하는 것]으로 보는 초점을 바꾸는 것이다. 그들은 "프로그램적 교육 설계"에 대해 이야기하며 "평가는 프로그램적 접근이 필요한 교육적 설계 문제"라고 주장한다. 1996년 논문에서 확인된 평가의 다양한 측면을 논의하는 효용 모델로 시작한다. 그런 다음 그들은 "개별 방법을 평가하는 것이 아니라 전체적으로 평가 프로그램의 유용성에 대한 증거를 제공해야 한다"는 설득력 있는 제안을 제시한다(Van der Bluten & Schwirth, 2005, 페이지 309).
We identify Cees van der Vleuten and Lambert Schuwirth’s 2005 paper ‘Assessing professional competence: from methods to programmes’ as a signature moment in the emergence of programmatic assessment (Van der Vleuten & Schuwirth,2005). At our time of writing, the paper has been cited 1237 times. In 2016, van der Vleuten noted that the paper represented a landmark in his thinking around assessment (Van der Vleuten,2016). The authors explicitly aim is to shift the focus away from treating assessment as a “measurement problem”. They talk about “programmatic instructional design” and argue that “assessment is an educational design problem that needs a programmatic approach”. They begin with the utility model, discussing the different aspects of assessment identified in the 1996 paper. They then present a compelling proposition, that “we should not evaluate individual methods, but provide evidence of the utility of the assessment programme as whole” (Van der Vleuten & Schuwirth,2005, p. 309).
철학적 전제 Philosophical presuppositions
이 단계 동안 우리는 [평가에 관한 근본적인 철학적 입장]에 있어서의 명시적인 변화는 없는 상태에서, [심리 측정과 방법을 중심에 두는 주장과 변화]를 관찰하였다. 즉, 프로그래밍 방식의 평가는 이러한 변화의 기회가 나타나기 시작한 것은 사실이나, [새로운 온톨로지나 인식론]을 제공하기 보다는, [주로 역량을 완전히 "측정"하기 위한 다양한 방법]과 연관된다. 예를 들어, 2004년의 프로그램 평가는 [평가 방법의 타당성과 신뢰성 및 역량 측정에 대한 관심]에 의해 지배되는 개념적 공간에 분명히 위치해 있다. 비록 '프로그램적'이라는 용어는 사용되지 않았지만, 그들은 "모든 좋은 평가 프로그램은 [다양한 방법]으로 구성된다"는 개념을 밀어붙였다(Schuwirth & van der Vleuten, 2004, 페이지 975).
During this phase we observe arguments and shifts that place psychometrics and methods at the core, without necessarily making explicit shifts in underlying philosophical positions concerning assessment. That is, programmatic assessment becomes associated with a diversity of methods mainly in order to “measure” competence fully, rather than providing any new ontologies or epistemologies, even though the opportunity for these shifts start to present themselves. For instance, in 2004 programmatic assessment is clearly situated in a conceptual space dominated by concerns of the validity and reliability of assessment methods and the measurement of competence. Although the term ‘programmatic’ was not used, they pushed the notion that “any good assessment programme consists of a variety of methods” (Schuwirth & van der Vleuten,2004, p. 975).
저자들이 새로운 접근법으로 심리측정학 문제를 극복하는 것을 명시적으로 목표로 했더라도, 2005년의 주장들 중 다수는 [심리측정학 및 측정 기반 사고에 근거]하고 있다. 예를 들면 신뢰성 추정치가 서로 다른 평가 형식에 걸쳐 시험기간에 따라 증가한다는 것을 보여주기 위해 [8개 연구에서 얻은 경험적 증거를 취합하여 신뢰성이 사실상 표본 추출 문제라고 주장]한다. 이들이 도출한 결론 중 하나는 [덜 구조화되었거나 덜 표준화된 평가]라도 "[더 구조화되고 객관적인 측정과 온전히 혹은 거의 신뢰도가 높을 수 있다]"는 것이다(Van der Bluten & Schwirth, 2005, 312쪽, 원래 강조). 신뢰할 수 있는 역량 측정을 달성하기 위해 [샘플링이 가장 중요한 원칙]으로 선정됩니다. 이것은 프로그래밍 평가에 대한 도입 발표를 지배하게 된 [픽셀 은유]가 확산된 기초이다.
Many of the 2005 arguments remain grounded in psychometric and measurement-based thinking, even if the authors explicitly aim to overcome psychometric problems with novel approaches. For example, they argue that reliability is effectively a sampling problem—they collate empirical evidence from eight different studies to demonstrate that reliability estimates all increase with testing time across different assessment formats. One conclusion they draw is that less-structured or standardised assessments “canbe entirely or almost as reliable as other more structured and objective measures” (Van der Vleuten & Schuwirth,2005, p. 312, emphasis in original). Sampling is singled out as the overarching principle to achieve a reliable measure of competence. This is the basis for the proliferation of the pixel metaphor which has come to dominate introductory presentations to programmatic assessment.
타당성 문제에 대해 제시된 논쟁은 후기실증주의, 후기-심리측정적 관점을 취한다. 즉, 역량에 대한 환원주의적 관점을 비판한 것이다. 역량이란 것은 [하위 역량의 분리된 패킷으로 분해될 수 없는] [기술과 능력의 복잡한 통합]에 기초한 [다면적인 현상]이라고 주장하였다. 따라서 좋은 품질 평가는 여러 출처와 다양한 방법의 정보와 "이 출처들에 걸친 정보를 삼각측량하여" 전체적인 판단을 구성하는 것이 필요하다고 주장한다(Van der Bluten & Schwirth, 2005, 페이지 313). 그들은 미래의 평가 개발자의 과제는 이 프로세스를 "가능한 한 엄격하게" 만드는 동시에, 의사결정에 있어 질적(정성적) 정보 출처와 전문적인 판단에 의존하는 것이라고 언급했다.
The argument presented on the issue of validity takes a post-positivist, post-psychometric perspective, criticizing the tendency towards reductionism in assessment—that competence is a multifaceted phenomenon based on a complex integration of skills and abilities which cannot be broken down into discrete packets of sub-competencies. They argue that good quality assessment requires information from multiple sources and from a variety of methods, and the constructing of overall judgments “by triangulating information across these sources” (Van der Vleuten & Schuwirth,2005, p. 313). They note that one challenge for assessment developers of the future will be relying on qualitative sources of information and professional judgment in decision-making, while making this process “as rigorous as possible”.
반 데르 블뢰텐과 슈워스는 [의학 교육 평가의 실무자들이 심리 측정 접근법을 넘어설 필요가 있다]고 명시적으로 주장한다. 그들은 당시의 평가 문헌이 지나치게 방법에 치우쳐 있었고 "심리측정학 문제에만 몰두했다"고 지적했다(Van der Bluten & Schwirth, 2005, 페이지 315). 대신, 그들은 프로그램적 설계에서는 "단순한" 심리측정 평가로는 충분하지 않을 것이라고 언급하면서, [평가에 대한 관점의 확대]를 주장한다(Van der Bluten & Schwirth, 2005, 페이지 315). 그들이 문제해결에 있어서 [새로운 특정한 관행이나 기술로 문제를 해결]하기 보다는, [(기존의) 관점을 전환하여 문제를 극복하거나 회피하는 것]을 포함했다. 그럼에도 불구하고 흥미롭게도, [심리측정학적 접근방식을 극복]하기 위한 그들의 가장 강력한 주장은, [신뢰성과 더 큰 표본 추출의 문제]인, 심리측정학적 사고에 입각해있다. 비록 그들은 밀접하게 정렬되어 있지만, 이 둘 사이에는 미묘한 특이성이 있다. 궁극적으로, 반 데르 블뢰텐과 슈워스는 환원주의적 측정-기반 경향성을 극복하기 위해 [심리측정에 근거한 주장]을 사용한다. Van der Vleuten and Schuwirth explicitly argue that practitioners in medical education assessment need to move beyond psychometric approaches. They note that the assessment literature of the time was overly geared towards methods and “too preoccupied with exclusively psychometric issues” (Van der Vleuten & Schuwirth,2005, p. 315). Instead, they argue for a broadening of perspectives on assessment, noting that for the programmatic instructional design approach to work, “‘simple’ psychometric evaluation will not suffice” (Van der Vleuten & Schuwirth,2005, p. 315). Their problem-solving move involved overcoming or circumventing problems through shifting perspectives rather than solving them with new specific practices or techniques. And yet, interestingly, their most powerful argument for overcoming psychometric approaches is one predicated on psychometric thinking—the issue of reliability and greater sampling. Although they are closely aligned, there are nuanced specificities between these two. Ultimately, van der Vleuten and Schuwirth employ an argument grounded in the psychometric in order to overcome reductionist measurement-based tendencies.
이 시기 프로그램 평가에서 [실용주의pragmatism]와 관련된 깊은 철학적 이슈도 있다. 전체적으로 평가 프로그램의 유용성을 강조함으로써 실용주의적 함의가 나타났다. 그러나 효용성utility의 전구체로서 목적을 벗어난 견해를 형성할 수 있는 기본적인 가정에 대해서는 명시적인 고려가 이루어지지 않는다. 타당성과 관련하여 효용성utility을 다루는 방법은 미개발적이며, 현재도 고려되고 있다. 평가에서 타당성이 갖던 우위는 경시된 것downplayed으로 보인다. 효용utility 모델을 구성하는 요소를 언급하면서, 저자들은 어떤 기준에 가중치를 두는지는 "특정 상황의 특정 사용자"에 따라 달라질 수 있다는 점에 주목한다(Van der Vleuten & Schwirth, 2005, 페이지 309). 그러나 가치로 작용하는 것이 어떻게 달라질 수 있고 잠재적으로 어떤 경우에는 외부 요인에 의해 암묵적으로 영향을 받을 수 있는지에 대한 설명은 없다. 정치적, 개념적, 심지어 경제적 요소도 효용 기준에 따른 가치에 영향을 미칠 수 있다.
There is also a deep philosophical issue relating to pragmatism in programmatic assessment at this time. By underscoring the utility of assessment programmes as a whole, pragmatist undertones emerge. Yet no explicit consideration is given to underlying assumptions that may shape views beyond purpose as a precursor to utility. The way that utility is treated in relation to validity is underdeveloped, and scantly considered. The primacy of validity in assessment appears to be downplayed. Referring to elements in the utility model, the authors note that the weighting of criteria would depend on “a specific user in a specific situation” (Van der Vleuten & Schuwirth,2005, p. 309). However, there is no treatment of how what serves as valued can vary and be potentially and, in some cases, insidiously influenced by external factors. Political, conceptual, even economic factors can influence the value placed on utility criteria.
게다가, 이들은 "개별적인 방법"에서 "프로그램"으로의 전환을 지지하면서도, 단지 다르게 포장된 방법들을 강조하는 것처럼 보인다. 그들은 평가에서 보다 [질적인 판단을 지지]하여 측정 기반 접근법에서 벗어날 수 있도록 한다. 그러나 이것은 완전히 사실이 아니다. 이러한 초기 논문에는 역량의 본질에 대한 몇 가지 실증주의적 존재론적 입장이 남아 있다. 예를 들어, 우리가 잠재된 구조를 통해 역량의 본질을 알 수 있는 방법에 대한 근본적인 가정이 있지만, 이제 와서야 어떤 방법이든, [단 한 가지 방법으로는 내재된 심리측정적 한계]가 있기 때문에, [프로그램(방법들의 집합)을 통해 이를 더 잘 포착할 수 있다]는 주장이 제기된다. Further, while advocating for a shift from “individual methods to programs” the founders still seem to emphasize methods, just packaged differently. They advocate for more qualitative judgment in assessment, facilitating a departure from measurement-based approaches. But this is not entirely the case. There remains in these early papers some positivist ontological positions on the nature of competence. For instance, there are underlying assumptions about how we can know the nature of competence through a latent structure, only now the argument is that we can better capture this through a program (a collection of methods) because of the inherent psychometric limitations with any one method.
질적 데이터를 사용하고 객관성을 강조하지 않는 것, 그리고 "엄격한 판단"의 필요성이 (굳이 예를 들자면) 필연적으로[잠재 변수 구인latent variable construct]이라는 입장으로 포기하는 것은 아니다.정보의 여러 출처를 삼각측량하여 전체적인 판단을 구성하지만, 이는 샘플링을 통한 신뢰성과 같은 [심리측정학적 필수사항imperative]에 복무하는 것이다.이것은 프로그램 평가의 역사에서 나중에 강조되는 구성주의적 철학적 존재론과는 상당히 다르다.
Even the use of qualitative data and de-emphasizing objectivity, and the need for “rigorous judgment”, is not necessarily abandoning (as an example) a latent variable construct position. Multiple sources of information are triangulated to construct an overall judgment, but this occurs in the service of psychometric imperatives, such as reliability through sampling. This is substantially different to the constructivist philosophical ontology that is highlighted later in the history of programmatic assessment.
요약하자면, 이 단계의 프로그램 평가에는 (과거의) 철학적 전제들 중 많은 것들이 함축적으로 남아 있다. 예를 들어,
[판단에 대한 강조]를 하였지만, 이것은 [평가에서 존재론적 또는 인식론적 위치의 변화]가 있었는지, [평가 문헌의 이전 가정이 유지되고 있는지]에 대해서는 아무런 언급도 하지 않는다.
"(포화에 도달하고 신뢰할 수 있고 변론할 수 있는 결정이 될 때까지 정보를 계속 축적하는) 질적 접근법"을 채택하는 것도 마찬가지로 그러한 판단이나 주장이 무엇에 관한 것인지에 대한 직접적인 주장이 아니다(Van der Bluten & Schwirth, 2005, 페이지 315).
In summary, many of these philosophical presuppositions remain implicit in this phase of programmatic assessment.
The emphasis on judgment, for example, says nothing about shifts in ontological or epistemological positions in assessment, nor whether earlier assumptions from the assessment literature were being upheld.
Adopting a “qualitative approach that continues to accumulate information until saturation is reached and a decision becomes trustworthy and defensible” is not a direct claim on the nature of what those judgments or claims are about (Van der Vleuten & Schuwirth, 2005, p. 315).
(통계적 심리측정학에 대한 강조를 포기하거나, 최소화하는 대신) 전문적인 판단을 강조하는 것은 [방법론적 선택 및 정당화를 위한 전략]으로 봐야지, 여기에 [평가가 무엇인지에 대한 명시적인 철학적 관점]이 반드시 필요한 것은 아니다. 이것은 나중에 그것들이 존재론적 및 인식론적 쌍과 어떻게 일치하는지 인식하지 못한 채 프로그램적 방법의 실용적인 채택 사이에 긴장이 나타난 이유를 설명할 수 있다. '평가의 효용성'으로의 이동이 [실용적인 고려]인지 아니면 [실질적인 철학적 실용주의에 기반을 둔 것인지] 또한 현재로서는 불분명하다. Abandoning or at least minimizing the emphasis on statistical psychometrics in place of professional judgment is also a methodological choice and/or justification strategy, not necessarily an explicit philosophical view of what assessment is when interrogated from different views. This may explain why tensions later emerged between the practical adoption of programmatic methods without appreciating how these align with ontological and epistemological pairings. It is also unclear at this time whether the move to ‘utility of the assessment’ is a pragmatic consideration or one built on substantive philosophical pragmatism.
업샷 Upshots
이것은 우리가 프로그램 평가의 역사에서 볼 수 있는 철학적 전제에서 중요한 전환점을 제공하는 기회를 제공했다. 여전히 방법의 고려, 신뢰성을 위한 표본 추출, 그리고 철학적 입장에 대한 명시적인 취급의 부족에 중점을 두고 있다는 점에서, 아직은 [장면scene이 완전히 바뀌지 않았음]을 암시한다. 그러나 2005년 이후, '프로그래마틱'이라는 단어가 문헌에 점점 더 많이 등장하였다. 2005년 논문은 평가와 교육 설계에 대한 다양한 접근 방식을 깔끔하게 패키징했다. 우리는 2005년 논문에는 [후기 실증주의적 사고방식 외에도, 더 많은 뉘앙스나 혼합된 철학적인 어조가 나타난다는 것]을 알게 되었다. 예를 들어, 학습 및 교육 설계 요소에 대한 영향이 여기에 제시된다. 그럼에도 불구하고, 그 논문의 핵심main driver는 [샘플링을 기반으로 한 직관적인 주장]이라고 볼 수 있다. This provided the opportunity for a major turning-point in the philosophical presuppositions we see in the history of programmatic assessment. The emphasis still being placed on considerations of methods, sampling for reliability, and the lack of explicit treatment of philosophical positions, implies that the scene had not entirely shifted. Yet after 2005, the word ‘programmatic’ increasingly appeared in the literature. The 2005 paper neatly packaged a range of approaches to assessment and thinking around instructional design. We acknowledge that, aside from the post-positivist mindset, there are more nuanced or blended philosophical tones appearing in the 2005 paper. For instance, impacts on learning and instructional design elements are presented there. Nevertheless, we contend that it is the intuitive argument based on sampling that was the main driver of the piece.
이 주장은 종종 인용되는 '픽셀 은유'에서 가장 큰 영향을 끼쳤다. 즉, 평가 데이터의 축적에 기초한 후보 "진정한" 역량의 '이미지 해상도'에 대한 강력한 입증이다. 그 이후 수많은 컨퍼런스 프레젠테이션에서 픽셀 은유를 사용하여 평가 정보의 샘플링 이점을 입증했다(예: 온라인 참조(Van der Vluten, 2015). 일련의 프레임에서, 하나의 픽셀은 다중 픽셀이 되고, 발견될 "진정한" 이미지의 출현을 나타내는 모나리자의 유명한 그림으로 점차 분해된다. 은유적인 주장은 매우 직관적이고, 의학 교육자들에게 빠르게 반향을 일으켰다. 여기서의 메시지는 더 많은 데이터가 더 나은 그림을 의미한다는 것입니다. 비록 이 은유에서 [역량의 본질]에 대한 명확한 표현은 없었지만, 어떤 의미에서 [타당성의 대용품]이 된 것이다. 픽셀 은유에 반하여, 사이코메트릭 사고에 기초한 관행은 시대에 뒤떨어진 것으로 간주되었다. (크로슬리, 2006; 호지스, 2013). This argument also brought with it the greatest impact, appearing time and again in the oft-quoted ‘pixel metaphor’; a powerful demonstration of the ‘image resolution’ of candidate “true” competence based on the accumulation of assessment data. Countless conference presentations since have used a pixel metaphor to demonstrate the benefits of sampling assessment information (for an example online, see (Van der Vleuten,2015)). In a series of frames, a single pixel becomes multiple pixels, and gradually resolves into the famous painting of the Mona Lisa—representing the emerging of a “true” image to be discovered (consistent with positivist assumptions). The metaphorical argument is highly intuitive, and one it quickly resonated with medical educators. The message here is that more data equates to a better picture. This in a sense becomes a surrogate for validity, although there is no clear articulation of the nature of competence in this metaphor. Placed against the pixel metaphor, practises based on psychometric-thinking became to be seen as outdated (Crossley,2006; Hodges,2013).
2005년은 프로그램 평가의 역사에서 가장 중요한 순간이지만, 등장 이후 아이디어는 빠르게 변형되었고, 새로운 양상을 띠었으며, 다른 요소들이 강조되었다. 이제 2단계에서 조사 현장의 구성을 설명하는 것으로 전환하고 2005년 논문(및 그 업쇼트)이 의료 교육 평가 환경을 어떻게 빠르게 변화시켰는지를 강조하고자 한다. Although 2005 represents a signature moment in the history of programmatic assessment, after its emergence the idea quickly morphed, took on new facets, and had different elements emphasised. We now shift to describing the configuration of the scene of inquiry in phase two, and highlight how the 2005 paper (and its upshots) rapidly changed the landscape of medical education assessment.
진화: 다양성과 학습이 강조되고, 구성주의/해석주의 진보 (약 2005-2013) Evolution: diversity and learning underscored, constructivism/interpretivism advances (approx. 2005–2013)
씬(scene) 구성 Configurations of the scene
이 기간의 씬은 [프로그램 평가의 진화궤적에 영향을 미친 다양한 평가 아이디어]로 특징지어진다. 실무자들이 해결하려고 시도했던 한 가지 주요 문제는 인간의 판단의 역할뿐만 아니라 [다양한 유형의 평가 정보를 결합하는 방법]이었다. 평가 프로그램에는 깔끔하게 축적되거나 함께 합산될 수 없는 역량 평가에 대한 다양한 접근 방식이 포함되어 있습니다. 이는 특히 저부담 평가를 다루는 방법의 다양성에 의해 강조되었다. 예를 들어, 2005년 말에 제출되어 2006년 10월에 수락된 한 논문은 임상 성과 평가에 대한 더 넓은 관점을 추구한다(Govaerts et al. 저자들은 '프로그래밍'이라는 용어를 사용하지 않지만, 2005년 논문을 인용하며 "결과 기반 및 역량 기반 교육에 대한 강조는 관련 역량을 통합하는 평가 방법을 선호하는 것 같다."(Govaerts et al. 2007, 페이지 240)고 언급했다. This period in the scene of inquiry is characterised by a range of assessment ideas that influenced the evolving trajectory of programmatic assessment. One main problem that practitioners were attempting to solve was how to combine different types of assessment information, as well as the role of human judgment. A program of assessment contains varied approaches to assessing competencies that could not be neatly accumulated or added together. This was particularly emphasised by more diversity in the way that low-stakes assessments were being treated. For example, one paper submitted in late 2005 and accepted in October 2006 pushes for broader perspectives on clinical performance assessment (Govaerts et al.2007). Although the authors do not use the term ‘programmatic’, they cite the 2005 paper and note “the increasing emphasis on outcome-based and competency-based education is likely to favour assessment methods that integrate relevant competencies” (Govaerts et al.2007, p. 240).
평가에서 후기-환원주의적 관행은 점점 더 옹호되고 있었다. [평가 판단을 등급, 점수, 등급 및 숫자로 변환하는 일반적인 관행]은 [프로그램 프레임워크에서 의사결정에 필요한 정보의 풍부함을 유지하는 것]과 반대되는 것으로 간주되었다(Schuwirth & van der Vleuten, 2011). 각 평가를 '해치워야ticked-off' 할 장애물로 보기보다는, 많은 주관적 판단이 확실한 그림을 제공한다는 개념이 있었다. 이는 서로 다른 출처에서 추출한 다수의 표본 추출과 서로 다르더라도 의미가 있다는 주장에 의존했다. 정보의 '삼각측량' 개념(질적 연구에서 차용)과 평가 데이터를 패턴과 별자리(전반적인 방법이지만 역량 내에서)로 취급하는 개념이 여기에 연결됐다. 인간의 판단은 "평가 프로세스의 중심central in the assessment process"으로 강조되었다.이는 객관성과 순수한 측정에서 벗어나 좀 더 주관적이고 구성적이며 해석되는 것으로의 전환을 의미했다. 정성적 접근법의 증가는 평가자 인지에 대한 연구와 같이 다른 곳에서 옹호되고 있는 평가에 대한 접근법과 일치하는 것으로 나타났다(Gingerich 등, 2011; Govaerts 등, 2011). Post-reductionist practices in assessment were increasingly being advocated (Kim et al.,2006; Ma et al.,2012; Regehr et al.,2007). Common practices of converting assessment judgments to ratings, led scores, grades and numbers to be seen as antithetical to maintaining the richness of information required to make decisions in a programmatic framework (Schuwirth & van der Vleuten,2011). Rather than seeing each assessment as a hurdle to be ‘ticked-off’, there was a notion that many subjective judgments provide a robust picture. This relied on a multitude of sampling from disparate sources and claims that each were meaningful even if different. Notions of ‘triangulation’ of information (borrowed from qualitative research), and treating assessment data as patterns and constellations (across methods but within competencies) were connected to this. Human judgment was underscored as “central in the assessment process” (Schuwirth & van der Vleuten,2011, p. 481). This further signalled the shift away from the dominance of objectivity and pure measurement, to something more subjective, constructed and interpreted. The rise of qualitative approaches appeared to coincide with approaches to assessment that were being advocated elsewhere, such as research on rater cognition (Gingerich et al.,2011; Govaerts et al.,2011).
이 단계의 프로그램 평가에서 보여준 주요한 혁신은 [학습에 중점을 둔 것]이었다. 2011년, 슈비르스와 판 데르 블뢰텐은 "프로그램적 평가: 학습 평가에서 학습 평가까지"를 출판했다. 이 논문은 의학교육 외에서 확립된 평가 문헌을 활용했다. 그들은 assessment for learning를 "평가 과정이 교육 과정에 불가분하게 내재되어 있고, 정보가 풍부하며, 각 개별 학생의 학습을 최대 수준으로 조정하고 육성하는 접근법"으로 제시한다. 이것은 프로그램 평가의 개념이 어떻게 발전하고 있었는지를 보여주는 분명한 지표이다. A major innovation in this phase of the evolution of programmatic assessment, was the strong emphasis placed on learning. In 2011, Schuwirth and van der Vleuten published: “Programmatic assessment: From assessment of learning to assessment for learning”. This paper drew on established assessment literature from outside of medical education. They present assessment for learning as “an approach in which the assessment process is inextricably embedded within the education process, which is maximally information-rich, and which serves to steer and foster the learning of each individual student to the maximum of his/her ability” (Schuwirth & van der Vleuten,2011, p. 478). This is a clear indication of how the notion of programmatic assessment was evolving.
프로그램 평가의 개념이 처음 등장했을 때 살짝 드러났던 '학습'이라는 요소는 비로소 성장하여 강조되었다. 과거에는 학생에 대한 효과적인 피드백이 충분하지 않았다. 하지만 평가 프로그램은 "학생 개개인의 필요에 따라 특별히 조정되어야 한다.". 학생의 학습과 진행을 둘러싼 '맞춤형 조언', '치료', '멘토', '치료적 결정', '프로그노스틱 결정' 등의 문구가 등장한다. 이 ['배움을 위한'] 이라는 요소는 "다양한 출처에서 정보를 수집 및 결합하여, 학생 개개인의 강점과 약점에 대상 정보를 주고, 학습을 최적화하기 위한 목적으로 사용하는, 정보가 풍부한 접근법"이며, 프로그래밍 평가와 명시적으로 연결된다.
The learning element of programmatic assessment, which appeared in the original emergence of the notion, was nourished and underscored here. Effective feedback to students was not enough—assessment programmes needed to be “tailored specifically to the individual needs of each student” (Schuwirth & van der Vleuten,2011, p. 481). Phrases such as “tailored advice”, “remediation”, “mentors”, “therapeutic decisions”, and “prognostic decisions” around student learning and progression appear. This ‘for learning’ element is linked explicitly to programmatic assessment, as “an information-rich approach in which a programme of assessment is used to collect and combine information from various sources to inform about the strengths and weaknesses of each individual student, with the purpose to optimise their learning.” (Schuwirth & van der Vleuten,2011, p. 482).
Van der Vleuten 등의 2012년 논문은 "프로그래밍 평가의 실천을 위한 모델"을 제시한다(Van der Vleuten 등, 2012). 이 논문은 2011년의 학습 강조를 통합하여, 실제로 프로그램 평가가 어떻게 보일 수 있는지에 대한 가장 완전한 그림을 제시한다. 저자들은 "학습자의 성취, 선발, 진급에 대한 견고한 의사 결정과 더불어 "학습을 위한 평가"라는 목적"을 가진 모델을 제시한다. 그들은 학습자 성찰과 계획, 성찰 주변의 사회적 상호작용, 학습 과제가 평가 과제이고 마스터 과제에 대한 인증 데이터 포인트의 구성요소에 의해 연결된 다양한 훈련, 평가 및 지원 활동을 제시한다. 이들은 이 모델이 [가장 합목적적이고, 학습을 최적화하며, 데이터의 의미에 손상을 주지 않으며, 신뢰할 수 있고, 견고한 고부담 의사결정을 할 수 있다]고 주장한다(Van der Vleuten et al., 2012, 페이지 211). A 2012 paper by van der Vleuten et al. presents “a model for programmatic assessment in action” (Van der Vleuten et al.,2012). This paper incorporates the learning emphasis from 2011 and presents the most complete picture of what programmatic assessment might look like in practice. The authors present a model that has the explicit “purpose of assessment for learning, with robust decision making on learners’ achievements, selection and promotion” (Van der Vleuten et al.2012, p. 209). They present a range of different training, assessment and supporting activities, that are linked by components of learner reflection and planning, social interactions around reflection, learning tasks being assessment tasks, and certification data-points for mastery tasks. They argue that their model is optimally fit for purpose, optimises learning, makes no compromises on the meaningfulness of the data, and allows for credible and robust high-stakes decision-making (Van der Vleuten et al.,2012, p. 211).
이는 프로그래밍 방식의 평가가 [샘플링을 통한 더 나은 신뢰성에 관한 것]을 넘어서는 무언가로 전환되었음을 의미하며, 심지어 이전의 우선순위priorities를 강조하지도 않는다. 모든 것을 아우르는 이러한 주장들(즉, 프로그래밍 평가가 이중적인 목적일 수 있음)은 직관적으로 매력적인 개념적 주장이었고 널리 받아들여진 것으로 보인다. 그러나 이러한 주장을 더 자세히 탐구한 후속 연구에서 증명되었듯이 경험적 주장은 여전히 제한적이었다(Heenman 등, 2015). 2012년, Van der Vleuten 등은 [비용과 자원, 관료주의, 소소화와 환원주의, 법적 제한 및 미지의 문제 등] 프로그래밍 평가가 직면할 몇 가지 과제를 예상한다(Van der Vleuten et al. 2012, 페이지 211–212). 그러나 그들은 또한 연구 현장에서 열린 "여러가지manifold" 기회와 "무한한의 연구 가능성"에 분명히 흥분하고 있었다. This signalled the shift of programmatic assessment from being about better reliability through sampling to something more, even de-emphasizing those earlier priorities. These claims of being all encompassing (i.e., programmatic assessment could be dual purposed) were intuitively appealing conceptual arguments and, it seems, widely taken up. However, empirical arguments were still limited, as evidenced by subsequent research that has explored these claims in more detail (Heeneman et al.,2015). In 2012, van der Vleuten et al. anticipate several challenges that programmatic assessment will be confronted with, such as costs and resources, bureaucracy, trivialisation and reductionism, legal restrictions, and the unknown (Van der Vleuten et al.2012, pp. 211–212). But they also are clearly excited by the “manifold” opportunities and “infinite number of research possibilities” that have opened up in the scene of inquiry (Van der Vleuten et al.,2012, p. 212).
철학적 전제 Philosophical presuppositions
이 단계에서는 [질적 연구에서 informed된, 구성주의와 해석주의에 강하게 기초한] 사고가 분명하게 출현하였다. 비록 프로그램 평가의 초창기 도입시에도 이러한 개념들이존재했더라도, 이 단계에서 이러한 요소들이 발전하고 강화되어 프로그램 평가의 구성주의 온톨로지의 기둥이 되었다. 이것이 단지 지엽적으로 교육 연구에서 일어나고 있는 일 때문인지 아니면 아마도 후기 실증주의 움직임에 대한 반응이었는지는 불분명하다. 예를 들어, 2007년에, 고바르트 외 연구진은 "인지, 동기 부여, 의사결정 이론의 요소들을 현장 기반 평가에 통합하는" "구성주의, 사회심리학적 관점"을 명시적으로 요구한다(Govaerts 외 2007, 페이지 252).
In this phase there was a clear emergence of thinking informed by qualitative research, strongly grounded in and informed by constructivism and interpretivism. Even if these notions were nascent in the original introduction of programmatic assessment, these elements advance and were strengthened here, becoming pillars of programmatic assessment’s constructivist ontology. It is unclear whether this was solely due to what was happening in education research peripherally, or whether it was perhaps in reaction to the post-positivist moves prior. For example, in 2007, Govaerts et al. explicitly call for “constructivist, social-psychological perspective” that “integrates elements of theories of cognition, motivation and decision making” into work-place based assessments (Govaerts et al.2007, p. 252).
고바에르츠(Govaerts)와 판 데르 블뢰텐(Van der Bleuten, 2013)은 나중에 이를 "구성주의-해석주의 평가 프레임워크"로 제시한다. 본질적으로, 이 견해는 평가를 [사회적으로 구성되고 가치판단적인value-laden 것]으로 본다. 평가자는 평가 과정에 [자신의 신념과 가치]를가져옵니다. 이것을 사소한 것으로 취급할 수 없으며, 평가 판단은 이런 의미에서 결코 '객관적'일 수 없다. 인간의 판단은 특이하다고 인식되었지만, 틀릴 수 있다. 따라서, 프로그램 평가에서의 의사결정은 [평가의 특정 순간]으로부터 상쇄될offset 필요가 있었다. 위원회는 이러한 검토 과정을 보다 신뢰할 수 있고 신뢰할 수 있게 만드는 데 도움이 되었다. 하지만 [역량이 무엇인지에 대한 개념]은 (존재론적으로) 덜 강조되어, 여전히 인식론적 쌍과 존재론적 쌍 사이에 어느 정도 모호함을 남겼다. 예를 들어, 삼각측량과 주관적 판단을 활용하는 것은 역량이 사회적으로 구성된 것으로 보였는가, 아니면 진정한 역량의 더 가까운 근사치로 보였는가? 그러한 질문들은 직접적으로 다루어지지 않았다.
Govaerts and van der Vleuten later present this as a “constructivist-interpretivist assessment framework” (Govaerts & van der Vleuten,2013). Essentially, this view sees assessment as socially constructed and value laden. Assessors bring their own beliefs and values to the assessment process. This process cannot be neglected, and assessment judgments can never, in this sense, be ‘objective’. Human judgment was recognised as idiosyncratic, but fallible. Thus, decision-making in programmatic assessment needed to be offset from specific moments of assessment. Committees one-step removed from assessments helped to make this process of review more credible and trustworthy (Driessen et al.,2005; Schuwirth & van der Vleuten,2011, p. 481). Notions of what competence is—ontologically—were less emphasized leaving some degree of blurring between epistemological and ontological pairings. For example, did leveraging triangulation and subjective judgements mean competence was viewed as socially constructed, or closer approximations of true competence? Such questions were not directly addressed.
이에 대한 다른 측면으로는 [능동적인 참여의 과정]으로서 학습을 강조하는 [사회문화적 학습 요소]가 있다. 평가와 학습 사이의 경계는 의도적으로 모호해졌다. 학습은 평가 활동에 내재되어 있었다. 학습자들은 "멘토/코치 같은 조연 배우"에게 의존하게 되었습니다. 이것은 프로그램 문헌에서 "코치"라는 용어가 "멘토"와 동시에 사용되는 것을 처음으로 알 수 있었습니다. 2011년 논문은 "[교육적 프로세스의 성과 지표로서 학습]과 [역량에 대한 새로운 사회 구성주의 이론의 출현]"을 언급하고 있다(Schuwirth & van der Blouten, 2011). 그들은 문헌에서 나타나는 "평가를 세팅하고 사용하는 방식의 급격한 변화"를 언급하면서, 이것은 "전통적인 접근법에 대한 반대를 절실히 필요로하는 운동"이라고 강조한다(슈비르트 & 반 데르 블뢰텐, 2011, 페이지 478). The other side to this was the socio-cultural learning element, that emphasises learning as a process of active participation. The boundary between assessment and learning was deliberately blurred—learning was embedded into assessment activities. Learners came to rely on “supporting actors, such as mentors/coaches”. This was the first time we could note the term “coach” being used at the same time as “mentor” in the programmatic literature (Van der Vleuten et al.,2012, p. 211). The 2011 Schuwirth and van der Vleuten paper makes reference to the “emergence of new—social constructivist—theories on learning and the notion of competencies as outcome indicators of the educational process” (Schuwirth & van der Vleuten,2011, p. 478). They echo the “radical changes in the way we set up and use assessment” from the literature and stress that this is a “highly needed antithetic movement against the traditional approaches” (Schuwirth & Van der Vleuten,2011, p. 478).
['진짜 점수', '오류' 등의 개념] 및 [이 개념과 관련된 평가 방법을 버리는 것]이 보여주듯, 구성주의/해석주의의 렌즈를 통한 프로그램적 평가의 입지가 강화되었다. 이것은 흥미로운데, 그 당시 더 광범위한 평가 커뮤니티가 이를 따르지 않았기 때문이다. 현재 프로그램화된 평가 문헌 중 일부에는 후기-심리측정적 사고의 요소가 있다. 판 데르 블뢰텐 외 연구진 그들은 "심리측정학 담론이 불완전하다"고 보았기 때문에 "개인, 평가 도구들의 배타적인 심리측정학적인 담론을 넘어서기를" 희망했다(Van der Bleuten et al., 2012, 페이지 212). 고바어츠와 판 데르 블뢰텐은 2013년에 발간된 영향력 있는 논문에서 이러한 주제를 계속 이어가며 "숫자 등급과 표준화된 평가는 역량 평가의 프로그램적 접근에 있어 가치 있는 요소"라는 주장을 유지했지만, 그들은 "평가 프로그램에서 양적 및 질적 접근법의 신중한 균형을 목표로 해야 한다"고 제안한다(Govaerts & van der Bleuten, 2013, 페이지 1172). There was a strong positioning of programmatic assessment through the lens of constructivism/interpretivism, such as abandoning concepts of ‘true scores’, ‘error’ and the assessment methods associated with them. This is interesting, as the broader assessment community had not, at this time, followed suit. There are elements of post-psychometric thinking in some of the programmatic assessment literature at this time. Van der Vleuten et al. hoped to “move beyond the exclusively psychometrically driven discourse of individual, assessment instruments”–because as they saw it, “psychometric discourse is incomplete” (Van der Vleuten et al.,2012, p. 212). Govaerts and van der Vleuten continued these themes in an influential paper published in 2013, maintaining that “numerical ratings as well as standardised assessments are valuable elements in programmatic approaches to competence assessment” (Govaerts & van der Vleuten,2013). However, they propound that “we should aim for careful balancing of quantitative and qualitative approaches in our assessment programmes” (Govaerts & van der Vleuten,2013, p. 1172).
이 단계 동안의 학술 논문은 [방법에 대한 논의]에서 [(방법론적 주장을 뒷받침하는) 보다 명확한 철학적 토대]로 전환되는 것으로 보인다. 이것은 다소 암묵적이지만, 상충하는competing 철학적 입장을 소개하기도 했다. 타당성 고려는 때때로 이러한 변화의 초석이었다.역량에 대한 개념은 이론적이고 철학적인 관점에서 더 잘 설명되었고 평가 활동을 주도하는 근본적인 가정과 일치했다. 그러나 타당성은 분명히 그 논의의 일부가 아니었다. 실제로 타당성은 매우 중요한 개념이라기보다는 효용utility 모델에서 하나의 변수일 뿐이었고, Programmatic assessment에서 급진적으로 탈-강조된de-emphasized 변수였다. 프로그램 평가의 이 진화 단계에서는 [실용주의적 개념]이 더 중요한 것처럼 보인다. 예를 들어, 구성주의/해석주의에 대한 주장을 하면서도, '뭐든 다 된다anything goes'는 접근에 반대하며, "진실Truth"이 아니라 "주장"의 정당성과 방어 가능성을 지지하는 것과 같은 [실용주의라는 함의]가 있다.
The academic papers during this phase appear to shift from discussions of methods to more explicit philosophical underpinnings that support methodological arguments. This also introduced, although somewhat implicitly, competing philosophical positions. Validity considerations were at times the cornerstone to these shifts. Notions of competence were becoming better elucidated from a theoretical and philosophical perspective and they were matched to the underlying assumptions driving assessment activities. And yet validity was not explicitly part of that discussion. Indeed, validity was only one parameter in the utility model rather than an overarching concept, and a parameter that programmatic assessment radically de-emphasized. Pragmatist notions seem to matter more in this evolutionary phase of programmatic assessment. While there is a claim toward constructivism/interpretivism, there are undertones of pragmatism, for example arguing against an ‘anything goes’ approach and instead arguing for the justifications and defensibility of claims, not of Truths.
업샷 Upshots
이 시기의 흥미로운 결과 중 하나는 [프로그램 평가의 시행 경험]을 제시한 최초의 논문이었다. 2013년 한 논문은 프로그램 평가가 "실행하기 쉽지 않은 것으로 입증되었다"고 언급했다(Bok 등, 2013). 실제로 프로그램 평가의 문화적 요소가 가장 어려워 보였다. 예를 들어, 학생들을 위한 교수진 개발과 훈련에 대한 관심이 부족했습니다. 학생들은 점수가 낮은 평가조차도 총괄적이라고 느낀다는 것을 발견했습니다. 프로그래밍 평가의 학습 요소는 모든 이해관계자의 새로운 사고 방식을 필요로 하며, 프로그래밍 평가를 구현하는 것은 어려울 것이라는 것이 분명했다. One interesting upshot from this period was the first papers that presented experiences from implementing programmatic assessment. A 2013 paper noted that programmatic assessment “proved not easy to implement” (Bok et al.,2013). Indeed, the cultural elements of programmatic assessment seemed to be the most challenging. For instance, insufficient attention was placed on faculty development and training for students. Students found that even the low-stakes assessments felt summative. It was clear that the learning elements of programmatic assessment would require a new way of thinking from all stakeholders, and that implementing programmatic assessment would be challenging.
[프로그램 평가]를 위한 실증적 타당성 주장이 매우 많이 진행되고 있었다. 이 전까지는 프로그래밍 평가를 지지하는 많은 주장은 개념적이고 이론적이었다(슈비르트 & 반 데르 블뢰텐, 2012). 맥락적 증거보다는 프로그램적 평가의 특징이 근거를 대신하고 되었다. [학습]을 강조하면서, [학습]을 향해 전환되었고, 교수설계는 [타당도 주장]은 탈-강조화하였다. 그리하여 실제로 이 두 가지가 충돌할 경우, 언제 어디에 중점을 두어야 하는지에 대한 약간의 불확실성이 남았다(방어성defensibility을 지지하는 활동은 학습learning을 지원하는 활동과 반대contrasted될 수 있다.) Empirical validity arguments for programmatic assessment were very much in progress. Many of the arguments in support of programmatic assessment had been conceptual and theoretical (Schuwirth & van der Vleuten,2012). Features of programmatic assessment rather than contextual evidence had come to serve as surrogates. The emphasis on and transition to learning, de-emphasized validity arguments in place of instructional designs. This left some uncertainty about where, in practice, to place emphasis if and when the two were in conflict (activities supporting defensibility contrasted with activities supporting learning).
의과대학이 이미 학생 학습의 비계, 수준 높은 피드백 제공, 멘토링에 집중하고 있었음에도 불구하고, 이 기간은 이러한 고려 사항을 평가 고려의 최전선에 올려놓았다. 확실히, 평가 프로그램을 보는 관점은 [부분의 합]보다는 [전체whole 측면]에 가까웠다. 많은 사람들에게 평가는 더 이상 [측정의 문제]라거나 [[합격 점수]에 대해서 순위를 매기려는 시도]가 아니었다. 평가는 이제 [학습을 더 넓은 관점에서 보는 복잡한 구성 요소]였고, [여러 형식과 맥락에 걸쳐 분포된 것]이었다. 또한 교수진에서 요구되는 평가의 양, 학습에 대한 평가의 극단적 강조와 관련된 실질적인 문제, 비용 관련 등과 같은 [평가에서 긴장감]이 나타났다. 그러나, 프로그래밍 방식의 평가는 여전히 많은 사람들에게 새로운 아이디어였다. 프로그램 평가의 다음 단계는 그것이 오늘날 의학 교육에서 평가 이론과 실습을 점점 더 규제하는 확고한 개념이 되는 것을 보았다. Even if medical schools were already focusing on scaffolding student learning, providing high-quality feedback, and mentoring, this period brought these considerations to the forefront of assessment considerations. Certainly, assessment programs were being viewed more in terms of their whole, rather than in terms of the sum of their parts. For many, assessment was no longer a measurement problem, or an endeavour used rank candidates against cut scores. Assessment was now an intricate component of a broader perspective on student learning, and something that was distributed across multiple formats and contexts. There also emerged tensions in assessment, for example with the volume of assessment required in faculties, practical issues regarding the extreme emphasis on assessment for learning, cost implications, and so on. However, programmatic assessment was still, to many, a new idea. The next phase of programmatic assessment’s trajectory saw it become an entrenched notion that increasingly regulates assessment theory and practice in medical education today.
굳게 자리잡기: 풍부한 서술, 학문적 통합, 그리고 철학적 전제의 모호함(약 2013-2020) Entrenchment: rich narratives, disciplinary consolidation and the blurring of philosophical presuppositions (approx. 2013–2020)
씬(scene) 구성 Configurations of the scene
프로그램 평가의 궤적에서 가장 최근의 단계는 [학문적 통합displinary consolidateion]의 단계로 절정에 이른다. 그러나 이에 앞서 먼저 ['정보의 풍부함']을 2013년 이후 고착화된 하나의 실질적인 요소로 파악할 수 있다. 이전 단계에서 [정보다양성diversity]과 [삼각측량triangulation]이라는 개념이 등장했지만, 이후 [풍부함richness]과 [의미meaningfulness]에 대한 강조가 나타난 것으로 보인다.
2013년, Govaerts & van der Blouten은 "성과에 대한 풍부하고 서술적인 평가"를 "학습 극대화를 위해 평가 시스템의 형성 기능을 강화"하고, "신뢰할 수 있는 의사 결정"을 보장하기 위한 "필수적인" 평가 데이터로 요구하였다(Govaerts & van der Bluten, 2013, 페이지 1171–1172).
그들은 이 개념을 "숫자에서 단어로의 변화"라고 포장한다(Govaerts & van der Blouten, 2013, 페이지 1172).
This most recent phase in the trajectory of programmatic assessment culminates in what we term disciplinary consolidation. But before this, first we identify ‘information richness’ as one substantive element that became entrenched after 2013. Although the notions of information diversity and triangulation appeared in the previous phase, it seems that the emphasis on richness and meaningfulness emerged later.
In 2013, Govaerts and van der Vleuten call for “rich, narrative evaluations of performance” to “enhance the formative function of the assessment system to maximise learning” and as “indispensable” assessment data to ensure “trustworthy decision making” (Govaerts & van der Vleuten, 2013, pp. 1171–1172).
They package this notion as “a shift from numbers to words” (Govaerts & van der Vleuten, 2013, p. 1172).
흥미롭게도, 이러한 추진은 더 넓은 의학 교육 문헌과 병행되었고, 2013년 Hodges의 기념비적 논문 제목에서 '포스트 사이코메트리 시대'라는 용어를 사용한 첫 번째 사례였다(Hodges, 2013). 이후 수많은 저자들은 우리가 지금 주관적이고 질적인 데이터가 점점 더 중시되는 시대에 살고 있다고 주장했다. 반구조적 인터뷰 및 기타 접근법에서 '부유한' 및 '두꺼운' 데이터를 도출하는 것과 같은 질적 연구 방법론의 개념은 새로운 통찰력을 창출했다(Bearman, 2019; Schultze & Avital, 2011). 그럼에도 불구하고, 우리와 다른 사람들이 이전에 주목했듯이, 반-심리측정적anti-psychometric 개념이 문헌을 포화시키기 시작했다(Pearce, 2020; Schoenherr & Hamstra, 2016).
Interestingly, this push was paralleled in the wider medical education literature, and 2013 was the first time the term ‘post-psychometric era’ was used in the title of Hodges’ seminal paper (Hodges,2013). Since then, numerous authors have claimed that we are now living in an era where subjective and qualitative data are increasingly valued. Notions from qualitative research methodologies, such as eliciting ‘rich’ and ‘thick’ data from semi-structured interviews and other approaches have generated new insights (Bearman,2019; Schultze & Avital,2011). And yet, as we and others have previously noted, anti-psychometric conceptions have begun to saturate the literature (Pearce,2020; Schoenherr & Hamstra,2016).
일부에서는 이제 [숫자와 등급]이 [서술자와 서술어]에 비해 의미가 없다는 믿음이 강하다(Cook 등 2016년; Ginsburg 등 2017년; Hanson 등 2013년). 프로그램적 관점에서 본다면, 평가는 풍부하고 의미있는 평가 데이터를 요구한다. 그리고 이를 위해서는 점점 더 서술적인 정보가 필요하다. 이러한 움직임의 동인은 평가자의 독특한 번역 과정뿐만 아니라 프로그램 평가의 결정이 신뢰할 수 있고 신뢰할 수 있는지 확인하는 방법과 관련된 문제와 관련이 있는 것으로 보인다. 진보진영이나 역량위원회가 발표에서 [풍부하지 않거나 의미가 없는 자료]를 바탕으로 고부담 결정을 내리기는 어렵다는 주장이다. 그러나, 이것이 [데이터가 오로지 질적이어야 한다]는 뜻으로 여기는 것은 잘못되었을 수 있다(Pearce, 2020). 정성적 설계이든, 정량적 설계이든, 데이터의 수집, 축적, 집계 및 제시 방법과 관계없이, [유의성meaningfulness]이란 별도의 측면facet이며, 철학적 지향의 함수이다. 프로그래밍 방식의 평가가 발전해온 궤적 속에서 풍부한 서술적 질적 데이터(관련 방법을 통해 생성됨)가 가장 고평가된 것은 역사의 흥미로운 변덕이다. 아이러니하게도, 방법은 의미보다 우선시 되어왔다. There is now a strong belief in some circles that numbers and grades are meaningless compared with descriptors and narratives (Cook et al.2016; Ginsburg et al.2017; Hanson et al.2013). Assessment, when considered from a programmatic mindset, requires the assessment data to be rich and meaningful. And this, increasingly, requires narrative information. The driver of this move appears to be connected with the problem of how to make sure that decisions in programmatic assessment are credible and trustworthy as well as the idiosyncratic translational processes of assessors. The argument being that it is difficult for a progression or competence committee to make a high-stakes decision based on data that are not rich or meaningful in their presentation. However, it may have been misguided to assume that this necessitates that the data be solely qualitative (Pearce,2020). Irrespective of how data is collected, accumulated, aggregated, and presented, meaningfulness is a separate facet—regardless of whether it is qualitative or quantitative in its design and is a function of philosophical orientations. It is an interesting vagary of history that due to the trajectory taken by programmatic assessment, rich narrative qualitative data (generated through associated methods) has become most highly valued. Ironically, methods have been prioritized over meaning.
이 단계에서 문헌을 포화시켜나간 또 다른 주요 이슈는 [실무자가 어떻게 프로그래밍 평가를 구현해야 하는지]에 대한 것이다. 복 연구원의 경험 이후 추진과제가 조사 현장의 초미의 관심사로 떠올랐다. 프로그래밍 평가에 관한 기념비즉 '12가지 팁' 논문은 2015년에 발표되었다(Van der Vluten et al. 2015). 본 논문은 2012년 논문에 따라 '학습을 위한assessment for 프로그래밍 평가'로 프로그램 평가를 제시하였다. 이 논문은 2015년 이후 프로그램 평가가 표현된 방식으로 많은 진화를 통합하는데 기여했으며, [학습자 중심의 교육적 요소, 의미 있는 피드백 및 멘토링, 그리고 중요한 프로세스 관련 고려사항과 구현 과제]를 강조한다. The other main issue that saturates the literature in this phase is how practitioners should go about implementing programmatic assessment. After the experience of Bok et al., the challenges of implementation came to be a pressing concern in the scene of inquiry. A seminal ‘Twelve Tips’ paper on programmatic assessment was published in 2015 (Van der Vleuten et al.2015). This paper presented programmatic assessment in line with the 2012 paper as ‘programmatic assessment-for-learning’. The paper serves to consolidate many of the evolutions in the way programmatic assessment had been expressed since 2015, underscoring the learner-centred pedagogy elements, the meaningful feedback and mentoring aspects, and importantly the process related considerations and implementation challenges.
본 논문과 함께, 2017년에 출판된 중요한 책 챕터는 프로그램 평가를 이 분야에서 확고한 하나의 하위 분야로 통합하는 데 중요한 역할을 했다. 역사학자들은 [교과서와 교육 자원]은 scene of inquiry의 중요한 참조점이 되기 때문에, 반복적으로 학문을 생성하며, 학문 분야의 통합이 뒤따른다고 주장해왔다(Badino & Navarro, 2013; Kragh, 2013). 하든 앤 헌트의 A Practical Guide for Medical Teachers 의 한 챕터에서는 더욱 설득력있게 설명한다. 즉, '전통적 접근법'과 비교했을 때, 프로그램적 평가를 혁신적이고 대안적인 접근법으로 전략적으로 배치하여 제시한 것이다. 이 챕터는 의학 교육을 종합적으로 다룬 교과서 속에 [프로그램 평가]의 위치를 공고히crystalize하였다. 더 많은 교과서 챕터가 지금 등장하고 있습니다. 예를 들어, 2020년에 출판된 Assessment in Health Professions Education에는 프로그램 평가에 관한 장이 수록되어 있다(Van der Bluten 등, 2020). Along with this paper, an important book chapter published in 2017 (Van der Vleuten et al.,2017) played a crucial role in consolidating programmatic assessment as its own sub-discipline. Historians have argued that textbooks and educational resources iteratively create and subsequently consolidate a discipline, as they become an important reference point for a scene of inquiry (Badino & Navarro,2013; Kragh,2013). The book chapter in Harden and Hunt’sA Practical Guide for Medical Teachersrecounts a compelling narrative—programmatic assessment is presented as an innovative and alternative approach in medical education assessment, strategically positioned against ‘traditional approaches’ to assessment. This chapter crystalizes programmatic assessment in a comprehensive textbook on medical education. Further textbook chapters are now appearing. For instance,Assessment in Health Professions Educationpublished in 2020 features a chapter on programmatic assessment (Van der Vleuten et al.,2020).
최근 몇 년간 [진부하고 문제가 많으며 전통적인 평가 방식]을 극복한 [학습과 혁신의 승리로서 프로그램 평가]의 이야기를 되짚어보는 내러티브가 이어지고 있다.
'시험'이 어떻게 '배움을 위한 프로그래밍식 평가'가 되었는지에 대한 선구자들의 논문이 발표되었다(슈워스 & 반 데르 블뢰텐, 2019).
또 다른 반 데르 블뢰텐은 2005년 논문을 재방문하여 프로그램적 사고가 의학 교육 평가라는 scene of inquiry에 어떤 영향을 미쳤는지 설명한다(Van der Bluten, 2016).
반 데르 블뢰텐의 여러 컨퍼런스 기조연설은 의료 교육에서의 평가에 대한 이야기부터, 실무자들이 직면한 문제들, 최선의 방법을 찾기 위한 고군분투, 그리고 이러한 문제들을 극복하기 위한 프로그래밍 방식으로의 사고로의 전환까지를 다시 다루었다.
이러한 강연의 비디오는 유튜브와 같은 동영상 플랫폼과 반 데르 블뢰텐의 개인 웹사이트(Van der Blouten n.d.)에서 쉽게 이용할 수 있다.
In recent years, a narrative that recounts the story of programmatic assessment as a victory for learning and innovation overcoming tired, problematic and traditional approaches to assessment has continued.
A paper by the pioneers on how ‘testing’ has become ‘programmatic assessment for learning’ was published (Schuwirth & van der Vleuten, 2019).
Another by van der Vleuten revisits the 2005 paper to recount how programmatic thinking has affected the scene of inquiry in medical education assessment (Van der Vleuten, 2016).
Multiple conference keynotes by van der Vleuten have retold the story of assessment in medical education, from the problems practitioners faced, the struggle to find the best methods, to the shift to thinking programmatically to overcome these problems.
Videos to these lectures are readily available online on video platforms such as YouTube and links provided on van der Vleuten’s personal website (Van der Vleuten n.d.).
우리는 이러한 자원의 가치나 질에 대해 어떠한 판단을 하려는 것이 아님을 강조하고자 한다. 우리는 단지 이러한 자원들이 어떠한 프로그래밍적 평가를 하위-학문분야로서 공고히 하는지를 보여주기 위해 기술하는 것이다. 현재까지는 프로그램적 평가에서 [철학적 영향이나 의미]를함축적이고 불확실하게남겨두고 있으며, [철학적 입장] 뿐만 아니라 [교수설계 및 타당도]에 대한 관점이 어떻게 흡수되고 있는지에 대해서 불완전하다.
We should stress that we are making no judgments on the value or quality of these resources. We are simply being descriptive to highlight how these resources all add to the entrenchment of programmatic assessment as its own sub-discipline in a way that may be incomplete by leaving philosophical influences or implications implicit and uncertain, and by blending (in some cases blurring) those philosophical positions as well as perspectives on instructional design and validity, in how these are taken up.
마지막으로, 프로그래밍 평가의 '학제적 통합'의 또 다른 대표적인 모습으로써, 의학 교육 컨퍼런스에서 프로그램 평가를 다루는 일련의 흐름을 보면 짐작할 수 있다. 유럽 의료 교육 협회(AMEE) 회의, 유럽 의료 평가 위원회(EBMA) 회의, 오타와 의학 및 의료 전문가 역량 평가에 관한 회의와 같은 주요 회의들이 현재 모두 프로그램 평가에만 배정된 스트림(세션)을 운영하고 있다. 2020년 오타와 컨퍼런스는 프로그램 평가가 '합의문' 과제 중 하나로 선정된 첫 번째 사례이기도 하다. 현재 scene inf inquiry에는 프로그래밍 방식의 평가가 굳게 자리를 잡았다. Finally, another exemplar of the ‘disciplinary consolidation’ of programmatic assessment is the emergence of entire streams on programmatic assessment at medical education conferences worldwide. Major conferences such as the Association for Medical Education in Europe (AMEE) conference, the European Board of Medical Assessors (EBMA) conference, and Ottawa Conferences on the Assessment of Competence in Medicine and the Healthcare Professions, now all run streams dedicated to programmatic assessment. The 2020 Ottawa Conference was also the first time that programmatic assessment was selected as one of its ‘consensus statement’ undertakings. Programmatic assessment is now entrenched in the scene of inquiry.
철학적 전제 Philosophical presuppositions
이전에 나타난 구성주의/해석주의 철학적 존재론은 이제 확고히 자리잡은entrenched 철학적 전제가 되었다. 이것은 판 데르 블뢰텐 등에 의해 [명시적으로 주장]되었다. "학습에 대한 구성주의적 개념을 기본으로 한다면, 학습에 대한 프로그램적 평가를 훈련 연속체의 모든 부분에 적용할 수 있다." (Van der Vleuten et al., 2015, 페이지 641) 그러나 이전 단계에서 존재했던 [초기의 철학적 실용주의]가 가장 최근 시기에 강조된 것으로 보인다. 이 단계에서는 실용성utility에 대한 강조가 실용적인pragmatic 고려사항에 기초한다. 2017년 교과서 챕터의 요약은 [평가를 최적화 문제]로 설명하고 있으며, 이는 평가계의 많은 사상가들의 생각이기도 하다. (Van der Bluten et al., 2017, 페이지 302). 이러한 표현은 1996년 논문과 그 논문에 나온 효용 공식utility formula으로 거슬러 올라가는데, 다만 공식의 변수parameter만 암묵적으로 다를 뿐이다. 풍부한 정보 수집과 마찬가지로 학습과 피드백이 강조된다. 실무자는 프로그램적 접근방식을 실행하는 데 실용적일 필요가 있다. 이러한 실용성은 [교육생/학습자의 진급]에 대해 [방어가능하고 정당화가능한 결정을 내릴 수 있는 능력]을 inquirer에게 제공할 [필수적이고 합리적인 양의 다양한 평가 데이터]에 의해 informed될 것이다. The constructivist/interpretivist philosophical ontology that previously emerged became an entrenched philosophical presupposition. This is explicitly propounded by van der Vleuten et al.: “Programmatic assessment-for-learning can be applied to any part of the training continuum, provided that the underlying learning conception is constructivist” (Van der Vleuten et al.,2015, p. 641). However, it appears that the nascent philosophical pragmatism that was present in the previous phase is emphasised in this most recent period. In this phase, the emphasis on utility is built on pragmatic considerations. The summary of the 2017 textbook chapter explicates assessment as an optimization problem, in line with many thinkers in assessment circles. (Van der Vleuten et al.,2017, p. 302). This language harks back to the 1996 paper and its utility formula, only now the formula parameters are implicitly different. Learning and feedback is emphasised, as is the gathering of rich information. It is clearly articulated that practitioners need to be pragmatic in executing a programmatic approach, and these considerations will be informed by the requisite and reasonable volumes of varied assessment data that will afford inquirers the capacity to make defensible and justified decisions about trainee/learner progress.
여기서 강조된 [철학적 실용주의]는 새로운 평가 은유와 유추의 확산에 의해 문헌에서 잘 뒷받침된다. 대표적인 은유로는 교육자와 실무자를 위한 [사고 도구] 또는 [휴리스틱]입니다. [상식]과 ['실용적이 되는 것being pragmatic']의 개념에 호소하는 진술에 대하여 논쟁을 걸기는 어렵다. 예를 들어,
Schuwirth 등은 [의료와 프로그램 평가 사이에 5가지 특정 유사점]을 도출하여 현재 의료에 대한 사고가 평가 시스템에서 실제로 제정될 수 있음을 시사한다(Schuwirth 등, 2017).
Uijtdehaage와 Schwirth는 프로그램적 평가를 [보컬 코치의 역할]처럼 생각할 수 있다고 제안한다: "가수가 (자주 피드백을 제공함으로써) 최대한의 잠재력을 달성하도록 돕지만, 결국 "가수가 합창단에 합류할 수 있는지 또는 솔리스트가 될 수 있는지"를 종합적으로 결정하는 것.
트위드와 윌킨슨은 [강력하고 방어 가능한 진행 결정을 내리기 위해 정보를 종합하는 방법]에 대한 탐구를 통해, [임상 의사결정]과 [배심원 의사결정]이 모두 [프로그램 평가의 의사결정]과 유사점이 있음을 보여준다(Tweed & Wilkinson, 2019).
같은 연구자들은 또한 프로그램 평가를 '임상 4상에 들어가는 약“about to enter Phase IV trials”'에 비유한다. 즉, 이제는 프로그램적 평가가 어떻게 더 광범위하고 다양한 맥락에서 적용될 수 있는지를 볼 때임을 시사한다. '전부 아니면 전무' 접근법에 의해 제약을 받기보다는, 프로그램 평가의 여러 요소들이 어떤 곳에서 도입될 수 있는지를 보아야 한다는 것이다.
이러한 움직임은 '프로그래밍적 사고programmatic thinking'를 말하는 피어스와 프라이도(Pearce & Pridaux, 2019)에 의해 더욱 반영된다.
The philosophical pragmatism underscored here is well buttressed in the literature by a proliferation of new assessment metaphors and analogies. These metaphors are thinking tools or heuristics for interested educators and assessment practitioners. It is hard to argue with such statements that appeal to common sense and notions of ‘being pragmatic’. For example,
Schuwirth et al. draw five specific analogies between healthcare and programmatic assessment, suggesting that currently thinking in healthcare can actually be enacted in assessment systems (Schuwirth et al., 2017).
Uijtdehaage and Schuwirth suggest that the process of programmatic assessment can be thought of in terms of the role of a vocal coach: helping “a singer achieve his or her utmost potential (by giving frequent feedback) but eventually” making “a summative decision whether the singer can join the choir or can be the soloist” (Uijtdehaage & Schuwirth, 2018, p. 350).
Tweed and Wilkinson draw parallels in clinical decision-making and jury decision-making with decision-making in programmatic assessment, exploring ways to aggregate information to make progression decisions that are robust and defensible (Tweed & Wilkinson, 2019).
They also compare programmatic assessment to a drug “about to enter Phase IV trials” (Wilkinson & Tweed, 2018, p. 191), suggesting that it is time to see how programmatic assessment can be applied more widely and in varied contexts, noting that elements of programmatic assessment can be implemented where feasible, rather than practitioners being constrained by an ‘all-or-nothing’ approach.
This move is further echoed by Pearce and Prideaux who speak of “programmatic thinking” and how it can be applied in post-graduate medical education (Pearce & Prideaux, 2019).
업샷 Upshots
프로그램 평가는 [그 자체로 하나의 철학적 접근법]이 되었다. 그것은, 어떤 의미에서는, 그것만의 패러다임이고, 그것은 그것만의 역사적 서사를 말해준다. 프로그램 평가의 제자disciple가 되기 위해서는, 의학 교육에서 평가의 역사 – 장애물, 문제, 함정 및 해결책 – 에 대해 배울 수 있다. 우리는 이 경건한 용어를 경멸적인 의미로 사용한 것이 아니며, 단지 서술적인 의미로 쓴 것이다. 전향자convert가 되기 위해서는 우선 그것의 역사적 서사를 감상하고 그것의 철학적 토대에 따라야 한다. 프로그래밍 방식의 평가는 교육자들에게 반향을 불러일으킨다. 배치된 은유들은 신뢰와 헌신을 용이하게 합니다. 그러나 프로그래밍 방식의 평가를 운영하는 것은 여전히 사람과 문화에 크게 의존하고 있다. 이해당사자들은 그것이 잘 작동하기 위해서는 그것을 믿어야 하고, 따라서 참여와 바이-인(buy-in)에 대한 중요한 요구입니다. Programmatic assessment has become its own philosophical approach. It is, in a sense, its own paradigm and it tells its own historical narrative. In order to become a disciple of programmatic assessment, one can learn about the history of assessment in medical education—its obstacles, problems, pitfalls, and solutions. We don’t use this pious terminology in a pejorative sense, just in a descriptive sense. In order to become a convert, one must first appreciate its historical narrative and subscribe to its philosophical underpinnings. Programmatic assessment resonates with educators. The metaphors deployed facilitate trust and devotion. But operationalizing programmatic assessment remains heavily dependent on people and culture. Stakeholders need to believe it for it to work well, hence the crucial calls for engagement and buy-in.
프로그램적 평가라는 아이디어는 이제 완전히 자리를 잡았고, 은유와 '논쟁이 어려운 주장'들이 scene of inquiry에 스며들었다. 링가드는 건강 직업 교육에서 "갓-텀"에 대해 저술했으며(Lingard, 2009), 프로그래밍 평가가 이 지위에 도달한 것으로 보인다. 그러나 배심원단은 이러한 아이디어와 관련 주장이 경험적으로 버틸 수 있는지에 대해 여전히 의견이 분분하다.
더 많은 평가 데이터, 풍부한 정보, 의사결정 위원회 및 프로그래밍 프로세스를 통해 타당성이 향상되는가?
프로그래밍 방식의 평가는 그것이 처음 등장한 네덜란드에서 떨어진 문화적 맥락에서 효과가 있는가?
Programmatic assessment ideas have become entrenched, and metaphors and ‘hard to argue statements’ have permeated the scene of inquiry. Lingard has written about “god terms” in health professions education (Lingard,2009), and it seems that programmatic assessment has reached this status. However, the jury (to borrow one metaphor) is still out on whether these ideas and associated claims bear out empirically.
Is validity enhanced through more assessment data, rich information, decision-making committees and programmatic processes?
Does programmatic assessment work in cultural contexts away from the Netherlands, where it first emerged?
변화 관리 및 실행 전략과 관련된 이슈가 문의자들에게 긴급한 질문이 되고 있습니다. [다양한 데이터 수집]이라는 프로그램 평가(및 주요 메시지)의 특징은 [타당성을 입증하는 더 전통적인 접근법]을 배제하고도 [타당성에 대한 증거]로 취급되고 있다. 다른 의과대학들은 프로그램적 사고의 구현과 그에 맞는 효과를 보는 방법을 모색하고 있다(Pearce et al., 연구자들은 프로그래밍 평가가 학생 학습에 미치는 영향(Heeneman 등, 2015)과 그것이 교사와 학습자를 위해 개념적으로 어떻게 인스턴스화되는지에 대한 실증 연구를 수행하고 있다(Shut 등, 2018, 2020). 연구자들은 다양한 기회에 여전히 흥분해 있다.
Issues around change management and implementations strategies are becoming pressing questions to inquirers. Features of programmatic assessment (and key messages) such as the collection of diverse data are being treated as evidence for or evidence of validity without more traditional or recommended approaches to demonstrating validity. Different medical schools are exploring ways of implementing aspects of programmatic thinking and seeing what works for them (Pearce et al.,2021). Researchers are conducting empirical research into the impact of programmatic assessment on student learning (Heeneman et al.,2015), and how it is conceptually instantiated for teachers and learners (Schut et al.2018,2020). Researchers remain excited by manifold opportunities.
성찰을 마무리하며 Concluding reflections
[역사적 인식론]이라는 지적 전통을 바탕으로, 우리는 의료 교육에서 [프로그램 평가]의 변화하는 구성을 비판적으로 추적하여 평가와 관련된 유동적이고 문화적 탐구 관행을 강조하였다. 우리는 독자들에게 우리가 '왜'가 아닌 이 역사의 '무엇'과 '어떻게'에 집중하고 있었음을 다시 한번 강조하고자 한다.
우리는 다른 사람들이 우리의 설명이 정확한지 판단하기 위해 비슷한 방식으로 문헌에 관여할 것을 적극적으로 권한다.
우리는 궤적이 다른 가능한 경로에서 특정 경로를 택한 이유에 대해 몇 가지 제안을 했지만, 다른 사람들은 다른 비판적 메타 철학 관점에서 프로그래밍 방식 평가(그리고 실제로 더 광범위하게 평가)를 신중하게 조사하기를 바란다.
Drawing upon the intellectual tradition of historical epistemology, we have attempted to critically trace the shifting configurations of programmatic assessment in medical education, underscoring the fluid, cultural practice of inquiry in relation to assessment. We remind the reader that we were focusing on the ‘what’ and the ‘how’ of this history, rather than the ‘why’.
We actively encourage others to engage with the literature in a similar way to determine whether our account is accurate.
Although we have made some suggestions throughout as to why the trajectory took a certain path over other possible paths, we hope others carefully investigate programmatic assessment (and indeed, assessment more broadly) from different critical meta-philosophical perspectives.
우리는 철학적 조사를 통해 현재의 평가 관행을 새롭게 조명할 수 있다고 주장한다. Scene of inquiry - 즉, 변화하는 질문, 문제, 관행 및 추정의 변화- 에 초점을 맞춤으로써, 프로그래밍 평가의 역사에 접근함에 있어 아이디어의 역사적, 철학적 뿌리를 명확히 설명하였다. 이것은 왜 특정한 긴장이 실제로 나타나는지를 설명해주며, 적어도 그 이유를 드러내어준다. 바라건대, 우리가 프로그램 평가를 뒷받침하는 동기motivation를 발굴하는 데 성공하여, "적응적이고 유연한 담론을 위한 공간"을 열었기를 바란다(Lingard, 2009, 페이지 627). 부록 1은 이러한 철학적 역사를 요약한 것이다. 우리는 역사적 조사로부터 밝혀질 중요한 요점이라고 보는 것에 대한 성찰로 결론을 내리고, 마지막으로 이러한 노력에 비추어 프로그램적 평가를 위한 '다음은 무엇인가'를 제안한다.
We argued that new light would be shed on current assessment practices by interrogating them philosophically. In approaching the history of programmatic assessment by focusing on the scene of inquiry—the shifting questions, problems, practices and presuppositions of inquirers (Jardine,2000) —historical and philosophical roots of the idea have been elucidated. This may resolve, or at least, reveal why certain tensions emerge in practice. Hopefully we have succeeded in “excavating the motivations that underpin” programmatic assessment and opened “a space for an adaptive and flexible discourse” (Lingard,2009, p. 627). Supplementary figure 1 summarizes this philosophical history. We conclude by offering some reflections on what we see as important points to emerge from our historical probing, and finally suggest ‘what next’ for programmatic assessment in light of this endeavour.
관점적 의미 Perspectival implications
우리는 철학적 궤적을 추적하여 프로그램 평가의 궤적을 형성하는 전환되고 암묵적인 주장을 끌어내려고 시도했다. 우리는 개념적이고 방법론적인 주장을 주로 생각하고 입증하는 방법으로서 철학적 가정이 어떻게 변화해 왔는지를 강조해 왔다. 이는 프로그램 평가의 특정한 긴장, 모순, 취약점뿐만 아니라 [인지된 이익]이 프로그램 평가에서 나타날 수 있는 이유를 밝힌다. 이러한 문제들 중 몇 가지는 [어떤 존재론적, 인식론적 우위를 취하느냐]에 따라 발생한다. 간단히 말해서, 이 관점주의perpectivist 렌즈(Pearce, 2013)는 [다른 철학적 입장이 다른 해석으로 이어질 수 있고], 또 [다른 해석을 이끌어 낼 수 있다]는 것을 의미한다. 이에 대한 세 가지 예를 제시합니다. We have attempted to draw out the shifting, implicit arguments shaping the trajectory of programmatic assessment by tracing its philosophical trajectory. We have highlighted how philosophical assumptions have shifted mainly as a way of thinking about and substantiating conceptual and methodological arguments. This illuminates why perceived benefits, as well as certain tensions, contradictions and vulnerabilities may appear in programmatic assessment. Several of these issues arise depending on which ontological and epistemological vantage point is taken. In short, this perspectivist lens (Pearce,2013) means that different philosophical positions may and will lead to different interpretations. We offer three examples of this:
일부는 프로그램 평가에서 의사결정에 편향 경향이 있다고 생각할 수 있다. 픽셀 은유는 강력하지만 정보의 포화에 도달하면 픽셀이 고정되는 경향이 있다. 일단 평가자들이 그 이미지가 모나리자(또는 고군분투하는 학생)라는 것을 알 수 있다면, 이 단일하고 고정된 그림은 이 학생과 관련된 미래의 결정에 영향을 미칠 것이다. 이러한 종류의 [편견과 평가의 공정성 문제]는 정확히 심리측정학적 접근법이 다루려고 했던 것이다. 이것은 평가에서 철학적 전제가 진화함에 따라, 만약 이전 위치의 강점에 주의를 기울이지 않는다면 이전 개념의 특징은 사라질 수 있다는 것을 예시한다. Some may consider that there is a propensity for bias in decision-making in programmatic assessment. Although the pixel metaphor is powerful, pixels have a tendency to become fixed when saturation of information is reached. Once assessors can see that the image is the Mona Lisa (or a struggling student), this unitary and fixed picture will influence future decisions regarding this student. These kinds of biases and issues of fairness in assessment are precisely what psychometric approaches were meant to deal with. This exemplifies that as philosophical presuppositions evolve in assessment, features of previous conceptions may become lost if care is not taken to build upon the strengths of earlier positions.
평가 데이터 포인트의 시간적 구성요소로 인해 발생하는 어려움이 있다. 학습은 시간에 따라 변화하고 지식, 기술, 역량의 개발은 일관적이지도 선형적이지도 않다. 이것은 당신의 철학적 관점에 따라 프로그래밍 방식의 접근에서 또 다른 긴장입니다. 일부는 측정 및 후기 실증주의적 사고방식으로 문제에 접근하는 경우 이질적인 형태의 데이터 집계를 방어 가능성으로 볼 수 있는 반면, 다른 일부는 구성주의/인터프리즘의 위치에서 작업하는 경우 삼각측량 과정을 접근법의 강점으로 볼 수 있다. 이는 평가가 그 자체로 관점 프로세스이며, 이는 다른 문제를 야기한다는 것을 강조합니다. There are challenges made by the temporal component of assessment datapoints. Learning changes with time, and the development of knowledge, skills and competencies are neither consistent nor linear. This is another tension in a programmatic approach, depending on your philosophical outlook. Some may see the aggregation of disparate forms of data as an ersatz defensibility if they approach the problem with a measurement and/or post-positivist mindset, while others will see this process of triangulation as a strength of the approach if they are working from the position of constructivism/interpretivism. Again, this highlights that assessment is itself a perspectival process, which brings other challenges.
심리측정적 렌즈를 통해 볼 때, 프로그램 평가는 [구인의 표현] 및 [구인의 무관련성]과 같은 문제와 관련하여 많은 함정을 가지고 있으며, 이는 교육 측정 분야에서 계속 논의되고 있다(Newton, 2020). 그러나 프로그램 평가의 제자들은 이것이 의학 교육에서 평가에 대한 잘못된 접근이라고 주장하며, 그러한 심리학적 정보에 근거한 입장을 폐쇄하기 위해 구성주의적 은유적 전략을 사용할 것이다. 우리가 여기서 설명하려는 것은 다양한 철학적 전제가 공동체를 위한 긴장을 조성하고 있다는 것이다. When viewed through a psychometric lens, programmatic assessment has many pitfalls in relation to issues such as construct representation and construct irrelevance, which continue to dominate discussions in educational measurement circles (Newton,2020). But disciples of programmatic assessment will utilise constructivist metaphorical strategies to shut down such psychometrically informed positions, arguing that this is a misguided approach to assessment in medical education. What we are attempting to elucidate here is that divergent philosophical presuppositions are creation tensions for the community.
우리는 위의 주장들 중 어느 것도 지지하거나 어느 한쪽 편을 드는 것이 아닙니다. 우리는 단지 철학적 전제가 왜 그렇게 중요한지를 강조하려고 시도하고 있을 뿐이다. 탐구 현장에서 함축된 의미와 실무자들이 내리는 결정은 역사적, 지역적 맥락에 위치한 철학적 전제에 의해 주도되는 관점일 것이다. 다른 이들은 [평가에서 발생하는 긴장에 대응하는 방법]이 [평가 정책과 실천의 운명을 결정한다]고 언급했다(Govaerts et al. 2019). 우리는 대화와 비판적 성찰을 통해 정보에 입각한 철학적 결정과 행동이 이루어질 수 있다는 희망에서 어떤 입장을 구독하기 전에 철학적 전제가 단순히 명시된다는 것을 비슷하게 지지한다. We are not advocating any of the above arguments or taking any sides. We are merely attempting to highlight why philosophical presuppositions are so important. The implications in the scene of inquiry, and decisions that practitioners take, will be perspectival—driven by philosophical presuppositions, situated in historical and local contexts. Others have noted that the way we respond to tensions in assessment determines the fate of assessment policy and practice (Govaerts et al.2019). We similarly advocate that philosophical presuppositions are simply made explicit before subscribing to a position in the hope that through dialogue and critical reflection, informed philosophical decisions and actions can be made.
효용과 실용주의 기반에 대한 재고 Rethinking utility and its pragmatist foundations
[효용utility]의 개념은 (비록 그것의 정확한 표현이 시간이 지남에 따라 변화하는 것처럼 보이긴 하나) 프로그래밍적 사고를 관통하는 핵심 실타래이다. 프로그램 평가는 [평가의 실용성]이라는 개념에 기초했으며, 이는 실제 실행 중인 실용주의의 예시화인 것으로 보인다. 이러한 맥락에서 실용주의가 의미하는 바는 명확하게 표현되지 않았다. 이 외에도 [효용성]은 방법론적인 초점이 되었다. 평가 철학을 접근함에 있어서 [평가에서 목적을 명확하게 표현]하고, [평가 행위의 실질적인 정당성을 요구]하는 것이다. The notion of utility is a key thread that runs through programmatic thinking, although its precise manifestation appears to shift over time. Programmatic assessment was founded on the notion of utility in assessment, which appears to be an instantiation of pragmatism in action. Although what pragmatism means in this context has not been clearly articulated. More than this, utility has become a methodological focus; a way of approaching assessment philosophically by requiring the clear articulation of purpose in assessment and a substantive justification of assessment practice (Pearce,2020; Tavares et al.2019).
우리는 [철학적 관점]에 관한 일부 논쟁이, 특히 방법론적 선택의 질문 및 정당화와 관련해서는, 프로그램적 담론으로 들어갔다는 것을 인정한다. 예를 들어, 진행 또는 역량 위원회 심의에 정보를 제공하기 위해 더 다양한 평가 데이터를 수집하고 수집해야 하는 요건과 같은 것이다. 그러나 이는 해석주의나 구성주의 원칙에 대한 명시적인 논의에 앞서 제안되었다. 근본적인 가정과 철학적 헌신에 대한 논의는 연구원들이 거의 없거나 우선순위로 다루지 않았다.
We accept that some debate regarding philosophical outlooks has entered programmatic discourse, especially in relation to the interrogation and justification of methodological choices. For example, with the requirement to collect and collate more diverse assessment data to inform progression or competence committee deliberations. However, this was suggested prior to any explicit discussion of interpretivist or constructivist principles. Discussions about underlying assumptions and philosophical commitments have been almost absent or not taken up by researchers as a priority.
철학적 전제를 주의 깊게 설명할 필요성 The need to carefully elucidate philosophical presuppositions
HPE에서 프로그램 평가를 채택하는 경우, 우리는 철학적 고려가 없는 채택을 경고한다. 실무자는 어떤 가정과 기본적인 약속이 작용하는지 정확히 알지 못하더라도(또는 알 필요조차 없을지도 모른다) 프로그래밍 방식의 평가의 효용을 활용할 수 있다. 그러나 이는 실무에서 철학적 입장을 흐리게 할 수 있고, 진보 위원회가 탐색해야 할 복잡한 예시로 이어질 수 있다. 앞으로 나아가야 하는 방향은, [프로그램 평가의 채택자]들이 그들이 가지고 있는 [철학적 전제를 신중하게 설명]하고 [평가 상황에 대한 그러한 관점을 정당화하는 것]이다. 전반적으로, 우리는 프로그램 평가 이론과 실천의 철학적 동인에 더 많은 관심을 요구하고, 그것들이 명시되어야 할 필요성을 강조한다. In cases where programmatic assessment is being adopted in health professions education, we caution against its adoption devoid of philosophical considerations. Practitioners are able to leverage the utility of programmatic assessment without knowing (or even needing to know) exactly what assumptions and underlying commitments are at play. But this can lead to a blurring of philosophical positions in practice, and convoluted instantiations for progression committees to navigate. The way forward would be for adopters of programmatic assessment to carefully elucidate the philosophical presuppositions they hold and to justify such perspectives for the assessment context. Overall, we call for more attention to the philosophical drivers of programmatic assessment theory and practice, and stress the need for them to be made explicit.
평가 경계의 모호함 The blurring of assessment boundaries
프로그램 평가의 창립자founders들이 [교수 설계와 평가를 혼합한 것]은 현명한 조치였다. 평가의 영향을 고려하지 않고 교육이 부드럽게 흘러갈flow 수 있다고 제안하는 것은 어리석은 일일 것이며, 실제로 가능한 한 개별화된 평가를 할 수 있는 강력한 사례가 있다. 그러나, 특히 이것이 문제가 될 수 있음을 시사하는 인접 연구를 고려할 때, 이러한 [이중적 목적dual purpose]은 [프로그래밍 평가의 가시thorn]가 될 수 있다(Duitsman 등, 2019; Heenman 등, 2015; Tavares 등, 2020). 그럼에도 불구하고, 프로그래밍 방식의 평가는 전통적인 평가 경계를 명확하게 모호하게 하고 연구자와 교육자들이 평가가 이루어지는 더 넓은 맥락을 고려하도록 강요했다. The blending of instructional design and assessment by the founders of programmatic assessment was a smart move. It would be foolish to suggest that education can flow without considering the impact of assessment, and in practice there is a strong case to be made for individualizing assessment where possible. However, it may be that this dual purposing is a thorn in the side for programmatic assessment, especially given adjacent research that suggests this may be problematic (Duitsman et al.,2019; Heeneman et al.,2015; Tavares et al.,2020). Regardless, programmatic assessment has clearly blurred traditional assessment boundaries and forced researchers and educationalists to consider the wider context in which assessment takes place.
다음은 프로그램 평가를 위해 어디로 가야 하나요? Where to next for programmatic assessment?
우리는 잠재적으로 생산적인 미래 연구 방법 및 프로그램 평가를 위한 개발 기회에 대한 몇 가지 제안으로 마무리하기를 원하지만, 프로그램 평가를 위한 미래 궤적에 대해 추측하고 싶지 않다. 다음은 다음과 같습니다.
We don’t wish to speculate as to what the future trajectory holds for programmatic assessment, although we would like to finish by making some suggestions regarding some potentially productive future research avenues and development opportunities for programmatic assessment. These are:
(i)프로그래밍 평가 및 실제로 일반적인 평가에서 근본적인 철학적 입장에 대한 더 많은 조사를 장려한다. (i)to encourage more probing of underlying philosophical positions in programmatic assessment, and indeed, in assessment in general;
(ii)프로그래밍 평가를 제정할 때 실무자가 가정 및 약속을 보다 명확하게 하도록 권장한다. (ii)to encourage practitioners to make assumptions and commitments more explicit when enacting programmatic assessment;
(iii)위에 언급된 이중 목적 때문에 발생하는 잠재적 긴장을 해결한다. (iii)to resolve the potential tension that has arisen due to the dual purposing noted above; and
(iv)세심하게 고려되고 강력하게 표현된 철학적 실용주의가 보건 직업 교육의 프로그램적 평가를 위한 최선의 방법일 수 있음을 시사한다. (iv)to suggest that a carefully considered and robustly articulated philosophical pragmatism may be the best way forward for programmatic assessment in health professions education.
Adv Health Sci Educ Theory Pract. 2021 Oct;26(4):1291-1310.
doi: 10.1007/s10459-021-10050-1.Epub 2021 Apr 24.
A philosophical history of programmatic assessment: tracing shifting configurations
1Tertiary Education (Assessment), Australian Council for Educational Research, 19 Prospect Hill Road, Camberwell, VIC, 3124, Australia. jacob.pearce@acer.org.
2The Wilson Centre and Post-MD Education. University Health Network and University of Toronto, Toronto, ON, Canada.
Programmatic assessment is now well entrenched in medical education, allowing us to reflect on when it first emerged and how it evolved into the form we know today. Drawing upon the intellectual tradition of historical epistemology, we provide a philosophically-oriented historiographical study of programmatic assessment. Our goal is to trace its relatively short historical trajectory by describing shifting configurations in its scene of inquiry-focusing on questions, practices, and philosophical presuppositions. We identify three historical phases: emergence, evolution and entrenchment. For each, we describe the configurations of the scene; examine underlying philosophical presuppositions driving changes; and detail upshots in assessment practice. We find that programmatic assessment emerged in response to positivist 'turmoil' prior to 2005, driven by utility considerations and implicit pragmatist undertones. Once introduced, it evolved with notions of diversity and learning being underscored, and a constructivist ontology developing at its core. More recently, programmatic assessment has become entrenched as its own sub-discipline. Rich narratives have been emphasised, but philosophical underpinnings have been blurred. We hope to shed new light on current assessment practices in the medical education community by interrogating the history of programmatic assessment from this philosophical vantage point. Making philosophical presuppositions explicit highlights the perspectival nature of aspects of programmatic assessment, and suggest reasons for perceived benefits as well as potential tensions, contradictions and vulnerabilities in the approach today. We conclude by offering some reflections on important points to emerge from our historical study, and suggest 'what next' for programmatic assessment in light of this endeavour.
Keywords:Assessment; Historical epistemology; History of assessment; Philosophical positions; Programmatic assessment.
자기주도적 의과대학생 교육과정(JAMA, 2021) The Self-directed Medical Student Curriculum
Joseph H.Wu, PhD, PhilipA. Gruppuso, MD, Eli Y.Adashi,MD,MS
최근 몇 년 동안 의대생들은 전임상실습preclerkship 교육에 대한 통제control를 강화해오고 있다.
미국 의대생 13명이 참여한 설문조사에 따르면 2018~2020년 의대 2학년생 중 '거의 강의에 참석하지 않는다'고 답한 비율이 26.3%에서 37.0%로 지속적으로 증가했다.
라이브 강의가 아닌 녹음된 강의에 대한 의존도 증가와는 별개로, 자율학습independent learning에 할당된 커리큘럼 이벤트는 2013년과 2020년 사이에 약 3.35%에서 6.38%로 두 배 가까이 증가했다.
현재 의대생들은 대부분의 학습을 교실 밖에서 수행하는데, 이는 COVID-19 대유행의 적응으로 굳어진 관행이다.
In recent years, medical students have been assuming increasing control over their preclerkship education.
According to a survey involving 13 099 US medical students, the percentage of second-year medical students who reported “almost never” attending lectures in person continued to increase, from 26.3% to 37.0% between 2018 and 2020.1 Concurrently, medical school curricula evolved to promote learner autonomy.
Apart and distinct from increased reliance on recorded rather than live lectures, the curricular events allocated to independent learning nearly doubled between 2013 and 2020, from an estimated 3.35% to 6.38%.2
These trends are unlikely to abate anytime soon. Current medical students accomplish the bulk of their learning outside the classroom, a practice likely solidified by adaptations to the COVID-19 pandemic.
이미 지적된 바와 같이, 의학 교육의 전임상 구성요소preclerkship component의 재구성은 거의 불가피하다.이 관점에서, 우리는 자신의 교육을 형성하는 데 있어 의대생의 증가하는 역할을 강조하고 의대생 직접 학습의 증가가 의료 분야의 교육 목표와 일치하도록 보장하는 데 필요한 조치를 개략적으로 설명한다.
As others have noted, the reconfiguration of the preclerkship component of medical education is all but inevitable.3In this Viewpoint, we highlight the growing role of medical students in shaping their own education and outline the measures required to ensure that the increase of medical student–directed learning remains aligned with the educational aims of the medical discipline.
의과대학은 의대연락위원회(LCME) 인증기준 6.3이 나온 이후 강의와 사례중심 교육을 보완하는 [자기주도학습]이 강조되고 있다. 해당 LCME 표준은 "의대생들이 평생학습의 기술을 개발할 수 있도록" 수업이 배정되지 않은unscheduled 시간과 자율 학습independent learning 구성요소를 포함하도록 요구한다. 4 자기주도학습에 대한 강조는 교육 경험에서 의대생들의 보다 적극적인 역할을 적절히 장려한다. 이러한 변화에다가, USMLE Step 1에서 높은 점수를 받아야 한다는 압박이 더해져서, [USMLE를 위한 학습에 맞춰진 (학습) 자원]이 대부분을 구성하는 [병행적이고 의대생-주도적 커리큘럼의 출현]으로 이어졌다.5 현대 의대생들은 이제 [각 의과대학-특이적 자료는 그저 여러 학습자료 중 하나에 불과한] didactic resource의 방대한 바다를 항해한다. USMLE 1단계가 합격/불합격으로 전환된 것은 이 시험을 잘 봐야한다는 압박을 완화시키는 데 기여했을지 몰라도, 여전히병렬 커리큘럼을 구성하는 수많은 리소스는 사라지지 않을 것으로 보인다. Since the advent of Accreditation Standard 6.3 of the Liaison Committee on Medical Education (LCME), medical schools have taken to emphasizing self-directed learning to complement lecture and case-based instruction. The LCME standard in question requires the inclusion of unscheduled time and independent learning components “to allow medical students to develop the skills of lifelong learning.”4The emphasis on self-directed learning aptly encourages a more active role for medical students in the educational experience. These changes, along with the pressures imposed by the numeric score reporting of the United States Medical Licensing Examination (USMLE) Step 1, led to the emergence of a parallel, medical student–directed curriculum that is dominated by resources geared toward studying for the USMLE.5Contemporary medical students now navigate a vast sea of didactic resources wherein institution-specific materials constitute but one of many sources. While the transition to pass/fail for USMLE Step 1 may have contributed to the alleviation of the examination performance pressure, the numerous resources that comprise the parallel curriculum are unlikely to fade away.
[평행적, 의대생 주도 교육과정]이 전임상실습 학습 환경에 미치는 영향은 처음에 생각했던 것보다 훨씬 클 수 있다. 2023년 브라운 대학교 워렌 앨퍼트 의대 졸업 예정인 학생 147명의 온라인 과정 평가 플랫폼으로부터 얻은 정보는 장기 시스템 기반 교육 과정에서 다양한 학습 자원을 사용하는 것을 보여주었다. 여기서 보고된 교육 자원과 비율은 다음과 같다.
제도권 의대 강의(84%),
보드 및 비욘드 강의(84%),
안키 플래시카드(65%),
스케치 영상(55%),
패토마 강의(36%),
응급처치(74%),
USML Rx 물음은행(72%)
The influence of the parallel, medical student–driven curriculum on the preclerkship learning environment may be far greater than initially suspected. Information from an online course evaluation platform from 147 medical students in the Warren Alpert Medical School of Brown University class of 2023 revealed the use of a variety of learning resources during the organ system–based portion of the preclerkship curriculum. The didactic resources and percentages of students who reported usage included
institutional medical school lectures (84%),
Boards and Beyond lectures (84%),
Anki flashcards (65%),
Sketchy videos (55%),
Pathoma lectures (36%),
First Aid (74%), and
the USMLE Rx Question Bank (72%).
이러한 관측은 [의과대학-특이적 강의를 보충하거나 대체하기 위해 의대생들이 외부 학습 자원에 의존하는 정도가 상당하다는 것]을 보여준다.
2학년 초부터는 교수진이 진행하는 강의보다 Boards & Beyond 또는 Pathoma와 같은 상업적인 비디오 강의에 의존하는 의대생이 더 많았다. 교수가 진행한 수업을 사용하는 비율은 2학년 과정 종료 시점에서 62%로 감소했다.
미생물학 및 약학과 같은 주제를 위한 시공간 학습 플랫폼인 Sketchy도 마찬가지로 장기 시스템 기반 커리큘럼에서 많이 사용되어 1학년 미생물 블록 동안 86%로 정점을 찍었다.
말해둘 것은, 의과대학은 모든 전임상과정 학생들에게 Boards & Beyond와 USMLE Rx 문제은행에 대한 구독을 제공한다는 점이다.
These observations indicate that the reliance of medical students on external study resources to supplement or replace institution-specific lectures is substantial.
From the beginning of the second year, more medical students reported relying on commercial video lectures, such as Boards & Beyond or Pathoma, than on faculty-delivered lectures. Usage of the latter declined to 62% of the class by the conclusion of the second-year curriculum.
Sketchy, a visual-spatial learning platform for topics such as microbiology and pharmacology, was likewise heavily used throughout the organ system–based curriculum, peaking at 86% during the first-year microbiology blocks.
Of note, the medical school provides all preclerkship students with a subscription to Boards & Beyond and to the USMLE Rx Question Bank.
지난 몇 년간 의대생이 만든 학습 자료의 크라우드소싱이 눈에 띄게 증가했고, 특히 눈에 띄는 것은 [안키 플래시카드 데크]이다. 147명의 의대생 중 약 65%가 장기기반의 블록에서 Anki를 꾸준히 사용했다고 보고했다. [크라우드소싱 플래시카드]가 의대생들의 전임상실습 교육을 형성하고 있다는 것은 쉽게 드러난다. 그러나 특히, 이러한 널리 사용되는 자원은 의과대학 시설에서 품질이나 양에 대한 평가를 받지 않는다. 오히려 의대생들이 이러한 학습 도구의 개발과 유지관리를 주도하고 있다. 따라서 [플래시카드 덱의 품질 보장]은 온라인으로 협력하여 오류를 식별하고 관련 내용을 지속적으로 업데이트하는 [의대생 커뮤니티가 담당]하고 있다. The last several years have also seen a remarkable increase in crowdsourcing of study materials by medical students, most notably, Anki flashcard decks. Approximately 65% of 147 preclerkship medical students reported that they consistently used Anki throughout the organ system–based blocks. It is readily apparent that crowdsourced flashcards are shaping the preclerkship education of medical students. Notably, however, these widely used resources are not vetted for either quality or content by the medical school establishment. Rather, medical students are driving the development and maintenance of these learning tools. Accordingly, the assurance of the quality of the flashcard decks is assumed by a community of medical students who collaborate online to identify errors and update the relevant content on an ongoing basis.
따라서 의대생들은 [강의 기반 학습]을 실질적으로 아웃소싱하고 있을 뿐만 아니라, 온라인에서 교육자료을 개발하고 [크라우드 소싱]함으로써 그들 자신의 교육을 주도directing하고 있는 듯 보인다. 이건 문제일까? 한 가지 관점은 의대생들이 필요한 이해와 관련 역량을 성취하는 한 모든 것이 좋다는 것일 수 있다. 의대생들은 (교과서에서 논문에 이르기까지) 자신의 학습을 위해 이미 오랜 시간 동안 정규 커리큘럼 이상의 학습자원을 탐색해왔다. 현재의 상황은 '자율 학습의 정점'이라고 합리화될 수 있다. 즉 의과대학생들은 기관 특이적 승인과 무관하게 교육 자원을 사용할 수 있는 특권을 가정하고 있는 것이다. LCME는 "의과대학 외부의 상업적 기관"에서 파생된 교육 자료의 사용을 허용한다.6 그러나 LCME는 또한 기관이 "사용되는 교육 자료의 출처가 무엇이든, 전체 의료 교육 프로그램의 수행과 [품질에 대한 책임]이 있다."고 명시한다. LCME 인증 표준을 유의미하게 적용하기 위해서는, 의과대학은 [학생 중심 병행 커리큘럼]을 구성하는 학습자원에 대한 철저한 평가를 수행해야 한다.
It would thus appear that medical students are not only substantially outsourcing their lecture-based learning, but they are also directing their own education by developing and crowdsourcing didactic resources online. Is this a problem? One viewpoint might be that so long as medical students are achieving the requisite understanding and relevant competencies, then all is well. Medical students have long sought out resources beyond the formal curriculum to advance their own learning, from textbooks to peer-reviewed articles. The current situation could be rationalized as the pinnacle of independent learning, that is, medical students assuming the prerogative of using educational resources irrespective of institution-specific endorsement. The LCME, for its part, permits the use of instructional materials that derive from “commercial entities outside of the medical school.”6However, the LCME also states that institutions are “responsible for the conduct and quality of the entire medical education program, regardless of…the sources of instructional materials that are used.”6It follows that a meaningful application of the LCME accreditation standards will require medical schools to undertake a thorough evaluation of the resources comprising the parallel, student-driven curriculum.
현상태가 바뀌고 있음을 직면했다면, 의과대학은 학생이 주도하고 있는 의학교육 진화를 따라잡아야만 한다. 의대 교육자들은 의대생들이 [추가적 학습 자료]로 학업을 보완한다는 것을 오랫동안 알고 있었지만, 현재 수준으로 [전임상실습 과정의 학습이 공식적인 의대 커리큘럼과 무관한 방식으로 운영되고 있는 것]은 지탱할 수 없고, 지속 불가능한 평형상태이다.
충분한 품질을 갖춘 학습 자원에 대해서 나아가야 할 최적의 경로는, 이것을 [공식 커리큘럼과 통합]하는 것이다. 즉, [학생들이 주도하는 병행 커리큘럼]을 [공식 커리큘럼]과 정렬aligning하는 것이 필요하다. 이렇게 하지 않는다면, 의대생들은 이중 커리큘럼을 계속 탐색할 것이며, 이는 [기관-특이적 수업을 불필요한 것으로 만드는 행위]가 될 것이다.
접근의 형평성을 보장하기 위해 의과대학은 또한 [의대생들이 일반적으로 사용하는 교육자원에 대한 구독을 제공]하도록 해야 한다.
의대생들이 최대한 효율적으로 학습할 수 있도록 커리큘럼을 구성하려면, [의대생들이 학습시간을 어떻게 배분하는가]를 이해해서 그 정보를 커리큘럼 결정에 사용해야 한다.
예를 들어 강의에 해당하는 플래시카드를 추천하거나,
슬라이드나 유인물이 아닌 플래시카드 형태의 커리큘럼 콘텐츠를 더 많이 설계하거나,
심지어는 교수진이 제공하는 강의 수를 줄이겠다는 의미가 될 수도 있다.
Faced with a changing status quo, medical schools must catch up with the student-driven evolution of medical education. Although medical educators have long known that medical students complement their studies with additional resources, the extent to which preclerkship learning is presently operating in a manner that is independent of formal medical school curricula constitutes an untenable and unsustainable equilibrium.
For those learning resources that are of sufficient quality, the optimal path forward should involve their incorporation into the official curriculum—in essence, aligning the parallel student-driven curriculum with the formal curriculum. Absent such, medical students will continue to navigate dual curricula, a practice that threatens to render institution-specific pedagogy redundant.
To ensure equity of access, medical schools should also ensure that medical students are provided with subscriptions to commonly used educational resources.
Insofar as curricula are to be structured so that medical students can learn as efficiently as possible, insights as to how medical students apportion their study time should inform curricular decisions. This might mean, for example,
recommending flashcards that correspond to lectures,
designing more curricular content in the form of flashcards as opposed to slides and handouts, or
even decreasing the number of faculty-delivered lectures.
현대 의학 교육이 직면하고 있는 주요 질문은 다음과 같습니다: 누가 의학교육을 통제하고 있는가? 이에 대한 정답은 점점 더 '의대생'이 되고 있다. 의과대학 커리큘럼이 자기주도학습을 촉진하는 방향으로 진화하면서 외부 교육자원의 자유시장도 발전했다. 의대생들은 그들의 입장에서 학습을 최적화하는 새로운 방법을 개발했는데, 크라우드소싱 플래시카드 덱의 보급이 대표적인 예이다. LCME와 의과대학은 [많은 면에서, 학생들이 주도하는 병행 커리큘럼]이 의대생들을 설득시켜버린 현실을 더 이상 무시해서는 안 된다. 이제 의대생이 일반적으로 사용하는 학습자원을 검토하고, 커리큘럼 중복을 제거하고, 검토된 새로운 학습자원을 교실 학습의 진화하는 구조에 통합하는 방법을 고려하는 여러 단계를 수행해야 한다.
A key question facing contemporary medical education is this: who controls medical education?5Increasingly, the answer is medical students. As medical school curricula evolved to promote self-directed learning, so did the free market of external educational resources. Medical students, for their part, developed novel ways to optimize their learning, the dissemination of crowdsourced flashcard decks being a prime example. It is time for the LCME and the medical education establishment to reckon with the reality that, in many respects, the parallel, student-driven curriculum has won medical students over. Several steps must now be taken to vet the resources commonly used by medical students, eliminate curricular redundancies, and consider how to incorporate vetted novel resources into the evolving construct of classroom learning.
일단 의대생들이 임상 로테이션을 시작하면, 소위 쉘프 검사와 USMLE 2단계를 준비하기 위하여, [임상 환경 밖에서 진행 중인 교육은 거의 전적으로 자기 주도적이라는 점]이다. 의학 교육이 발전함에 따라, 의사이자 평생 학습자로의 전환 과정에서, 교육자들은 언제 학생 주도 학습이 지배적인 교육 방법이 되어야 하는지에 대해 상당한 생각을 해왔다. 많은 학생들에게는 이 전환점이 예상보다 훨씬 일찍 도래한 것으로 보일 것이다.
It is noteworthy that once medical students embark on their clinical rotations, their ongoing education outside the clinical setting is almost entirely self-directed as they prepare for the so-called shelf examinations and for USMLE Step 2. As medical education evolved, educators have given considerable thought to when, in the transition to becoming a physician and a lifelong learner, student-directed learning should become the predominant instructional method. For many students, it would appear that this transition point may have arrived far earlier than anticipated.
Hafferty FW, O’Brien BC, Tilburt JC. Beyond high-stakes testing: learner trust, educational commodification, and the loss of medical school professionalism. Acad Med. 2020;95(6):833-837 XXX
JAMA. 2021 Nov 1.
doi: 10.1001/jama.2021.16312.Online ahead of print.
의학교육 수련생 선발을 위한 추첨 활용의 논리적 근거: 수십년의 네덜란드 경험(J Grad Med Educ.2021) Rationales for a Lottery Among the Qualified to Select Medical Trainees: Decades of Dutch Experience Olle ten Cate, PhD
많은 수의 한정된 자리를 두고, 후보 중 '최고의' 지원자를 뽑아야 한다는 대학원 의학교육의 강박관념은 답답하고 시간이 많이 걸리는 채용 과정을 만들어냈다. 이 과정에서 많은 지원자나 프로그램이 실망할 수밖에 없어 보인다. 의과대학과 레지던트 프로그램 또한 엄청난 시간과 노력을 들인다. 대체로 동등한 후보들 사이에서 타당하고 합리적인 선택을 할 수 없을 때, 무작위 선택인 추첨이 나타납니다. USMLE(U.S. Medical Licensing Examination) 1단계 점수가 2022년부터 통과/실패로만 보고됨으로써 미국 레지던트 프로그램 선발이 더 이상 여기에 의존할 수 없는 상황에서, 추첨 시스템의 논리는 고려해볼 가치가 있을 것이다.
Graduate medical education's obsession with choosing the “best” applicants, among many candidates for a finite number of positions, has produced a frustrating and time-consuming recruitment process. That many applicants or programs may be disappointed by this process seems unavoidable. Medical schools and residency programs expend enormous amounts of time and effort as well. When no valid, rational choice among roughly equal candidates can be made, a random choice—a lottery—emerges. At a time when the selection for US residency programs can no longer rely on United States Medical Licensing Examination (USMLE) Step 1 scores as a filter—from 2022 they will only be reported pass/fail1–4—it may be worth considering the rationales for a lottery system.
메트릭과 메리트의 폭압 Tyrannies of Metrics and Merit
첫째, Jerry Z. Muller의 The Tyranny of Metrics와 마이클 샌델의 The Tyranny of Merit를 읽은 교육자라면 의대생과 레지던트 선발 과정에 대해 다시 생각해 볼 수도 있다.5.6
역사학자 뮬러(Muller)는 성과 측정이 [중요한 것]에서 [측정 가능한 것]으로의 전환되는 것이 어떠한 방식으로 "메트릭 고정matrix fixation"으로 이어지는지를 설명한다.
하버드대 철학자 샌델은 능력merit에 대한 보편적인 집착fixation이 인생의 성공과 실패는 모두 자신의 노력과 재능, 또는 그 실패에 기인할 수 있다는 환상을 어떻게 먹여 살리는지를 자세히 설명한다. 이러한 장점 집착은 기회, 행운, 그리고 집안 배경이 어떻게 성공을 형성하는지 무시한다. 성공하지 못한 자들이 굴욕감과 원망감을 갖고, 사회적 파장을 초래하는 잘못된 행태다.
First, educators who readThe Tyranny of Metricsby Jerry Z. Muller andThe Tyranny of Meritby Michael J. Sandel may rethink medical student and resident selection processes.5,6
Historian Muller explains how the measurement of performance frequently leads to “metric fixation,” a shift from what is important to what is measurable, with the unintended consequence of metrics-based rewards that no longer serve the intended purpose of the performance.
Harvard philosopher Sandel elaborates on how the universal fixation on merit feeds the illusion that success and failure in life can all be attributed to one's own efforts and talents, or failures thereof. This merit fixation disregards how opportunities, luck, and family background also shape success. It wrongly leaves those who do not succeed with a sense of humiliation and resentment, with far-reaching societal consequences.
두 저자는 이러한 고정관념이 [의료와 교육을 포함한 전문적이고 사회적인 구조]에 얼만큼의 파괴적 영향을 갖는지 예를 논의한다. 두 저자들은 개인과 기관이 고등교육에 들어가고 완성하기 위해 절차와 기준을 어떻게 "게임"하는지를 [개인의 능력]이나 [우월한 제도 메트릭스]를 통해 보여준다. 이 때문에 샌델은 하버드, 스탠퍼드 등 명문대 선발절차로 [자격을 갖춘 사람 중 추첨]을 제안하게 됐다.
Both authors discuss examples of the disruptive effects of these fixations on professional and societal structures, including medicine and education. Both authors show how individuals and institutions tend to “game” procedures and standards in order to enter and complete higher education, through pretended individual merit or superior institutional metrics when these may not be warranted. This leads Sandel to propose a lottery among the qualified as a selection procedure for prestigious universities such as Harvard and Stanford.7
네덜란드 의대 선정 복권 The Dutch Lottery for Medical School Selection
의과대학이나 레지던트에 입학할 사람을 결정하는 방법으로서 추첨은 많은 사람들에게 터무니없는 제안으로 들릴 수 있다. 추첨은 동기부여를 떨어뜨리고, 높은 노력과 재능을 무시하며, 직업 선택의 자유를 무작위로 차단하는 것으로 보인다. 그러나, 네덜란드는 이 방법에 대한 수십 년의 경험을 가지고 있다. 네덜란드 정부는 1972년에 모든 의과대학에 입학하기 위해 전국적으로 추첨제를 적용했다. 이 제도는 지난 2017년 상고심 끝에 폐기됐으나 2023년 학생 선발을 위한 적법한 절차로 재설치될 예정이다. A lottery, as a method to determine who will be admitted to medical school or residency, may sound an absurd proposition to many. A lottery appears to devalue motivation, disregard high effort and talent, and randomly block freedom of career choice. However, The Netherlands has decades of experience with this method. The Dutch government applied a lottery system nationally for admission to all medical schools in 1972. This system was abandoned in 2017 after an appeal but will now be reinstalled in 2023 as a legitimate procedure for the selection of students.
1972년까지, 선행 학사학위를 필요로 하지 않는 [6년 과정의 네덜란드 의과대학 입학]은 적절한 중등교육(네덜란드 정부가 대부분의 의학교육비를 부담함)을 받은 지원자라면 자유롭게 접근할 수 있었다. 지원자의 수가 증가하고 비용이 상당해지자, 네덜란드 정부는 고정 정원numerus fixus를 도입하였다. 이 정원은 미래의 의사들의 필요성에 대한 예측을 바탕으로 얼만큼의 입학생 자리를 둘 것인가를 제한하였다.
Until 1972, the admission to Dutch medical schools, which have a 6-year program not preceded by baccalaureate education, was freely accessible for applicants with the proper secondary schooling (note that the Dutch government pays for most of medical education). When applicants increased in number and their costs became substantial, the Dutch government introduced anumerus fixus, a restricted total number of positions, derived from predictions of future physician need.
수년간의 논쟁 끝에 정치인들은 입학을 위한 "가중추첨" 제도를 결정했다. 국가 최종 2차 시험의 평균 점수가 가중치를 결정했다. 뛰어난 점수를 받은 학생들은 합격선 수준의 점수를 받은 학생들에 비해 세 배의 기회를 얻게 될 것이다. 추첨에서 탈락한 지원자는 이후 2년간 추첨에 재지원할 수 있다.
수십 년 동안 학교와 대중은 일반적으로 네덜란드 의과대학에 자리가 있는 모든 지원자의 3분의 1을 이 절차로 결정하는 것에 만족했다. 추첨 절차는 1996년까지 정부 기관에 의해 순조롭게 진행되었다.
그러나 1996년, 어느 한 뛰어난 고등학교 졸업생이 3번이나 추첨에서 떨어졌고 그 결정에 항소했다. 정치적, 사회적 분노가 일었고, 처음에는 [지역적 질적 선발 과정]을 [전국 가중 추첨]과 병행하면서 추첨은 점차적으로 대체되었다.
20년 만에 국가 추첨 제도는 완전히 폐지되었고, 2017년 현재 의과대학은 추첨 사용을 금지하고 있다.
놀랍게도, 2020년에 의회 과반수가 학교의 추첨 시스템 사용을 허용하기로 투표했고, 그래서 합법적인 선발 방법으로 추첨 절차를 재설치했다. 이 법은 2023.8년부터 시행됩니다.
After years of debate, politicians settled on a “weighted lottery” system for admissions. The average score on a national final secondary examination determined the weighting. Students with an outstanding score would triple their chances compared to those with a just-pass score. Declined candidates could reenter the lottery for 2 subsequent years.
For decades schools and the public were generally satisfied with this procedure to determine the one-third of all applicants (on average across decades) for whom there was space at a Dutch medical school. The lottery procedure was smoothly conducted by a government agency, until 1996.
That year an outstanding high school graduate was turned down 3 times and appealed the decision. Political and societal anger arose and led to a gradual replacement of the lottery, initially with a local qualitative selection process in parallel with a national weighted lottery.
In 2 decades, the national lottery system was abandoned altogether; legislation prohibited medical schools from using a lottery as of 2017.
Surprisingly, in 2020, a parliamentary majority voted to allow schools to use a lottery system, and thus reinstalled lottery processes as a legitimate method of selection. The law is effective in 2023.8
추첨 제도의 Rationale Rationales for Lottery Systems
1996년 네덜란드에서의 논쟁은 학생, 학부모, 정치인, 기관들 사이에서 [의대 입학에서 추첨을 사용하는 것에 대한 혐오]를 보여주었다. 이것은 개인화의 역사적, 문화적, 사회적 발전을 반영할 수 있다: 높은 동기 부여와 적절한 능력을 가진 사람이라면 누구나 진로가 가능해야 한다.
The 1996 Dutch debate demonstrated an aversion among students, parents, politicians, and institutions against a lottery for medical school admission. This may reflect a historical, cultural, and societal development ofindividualization: any career path should be possible for anyone with high motivation and adequate abilities.
대조적으로, 존경 받는 네덜란드의 심리학자이자 선택 전문가인, 왕립 네덜란드 예술 과학 아카데미와 모든 유럽 아카데미의 전 회장인 피터르 렌스는 정기적으로 보다 합리적인 주장을 했다. 즉, 정량적인 이유만으로 선발이 필요할 때, 그리고 대부분의 또는 모든 지원자들이 요구되는 기준을 충족한다고 했을 때, 추첨은 진지하게 선발방식으로 남아있어야 한다. 공정하게 측정하고 적용하기 어려운 질적 기준의 단점에 대응하기 위해 추첨 선발이 필요하다. 실제로, 추첨 시스템을 선호하는 몇 가지 주장들이 있으며, 다섯 가지 조건들은 다음과 같다.
In contrast, a respected Dutch psychometrician and selection expert, Pieter Drenth, former president of the Royal Netherlands Academy of Arts and Sciences and of All European Academies, regularly voiced the more rational argument that, when selection is needed only because of quantitative reasons, and most or all applicants meet the required criteria, a lottery must remain a serious option. The lottery option is needed to counter the disadvantages of qualitative criteria,9,10which are both difficult to measure and apply in an unbiased manner. Indeed, there are several arguments that favor a lottery system,11and 5 conditions may shape how we consider these arguments.
1. 지원자 간의 차이가 겉으로만 그럴듯할 때 1. When Differences Between Applicants Are Spurious
지원자 집단이 모두 고도로 선별적인 사전 교육에서 높은 성취도를 보인 경우, 지원자 내에서 신뢰할 수 있고 정당화된 구별을 하는 것은, 전혀 불가능하다. 이것은 대부분의 네덜란드 의대 지원자들에게 적용된다. 길고 어려운 교육 궤적을 모두 이수한 의대 졸업생이 대거 레지던트 프로그램에 지원할 경우 이들을 차별화할 수 있는 프로그램의 역량도 제한된다. 학생들 사이의 차이는 종종 의심스럽거나 관련이 없다. 그렇다면 선발 프로세스에서 [이 프로그램에 가장 적합한 학생]과 [기준을 충족시키지 못하는 학생]을 서로 비교해서 결정할 수 있다는 것은 윤리적으로도 의심스러울 수 있다. 정해진 개수의 공간을 채워야 하는 경우 [지원자의 퀄리티]가 아니라 [선발할 숫자와 지원자의 숫자]에 따라 입학에 사용되는 기준이 결정됩니다. Making reliable and justified distinctions within a pool of applicants who have all been successful in highly selective prior education is hardly, if at all, possible. This holds true for most Dutch medical school applicants. When medical graduates, all of whom have completed a long and difficult educational trajectory, apply in massive numbers to residency programs, the ability of programs to differentiate among them is also limited. Differences among students are often spurious or irrelevant. Then suggesting that selection processes can determine which students are most suitable for the program vs those who fail to meet standards may even be ethically questionable. When a fixed number of spaces must be filled, thenumberrather than thequalityof applicants determines the criterion used for admission.
역량 기반 의료 교육의 시대에, [모든 의대 졸업생들이 높은 수준을 달성하게끔 만들려는 노력]이 [졸업생들 사이의 차이를 강조하는 것]보다 더 유익할 것이다. 12 시간 가변적이고 개인화된 커리큘럼은 높은 퀄리티의 졸업생과 높은 퀄리티의 보건의료를 서포트하려는 목적이 있다. 네덜란드의 의료인력은 시간 변동성이 높은 커리큘럼에서 가중 추첨을 통해 의과대학에 입학했다. 다른 입학선발 절차가 더 나은 의료인력으로 이어질 수 있었는지는 알 수 없지만, 네덜란드 의료는 국제 비교에서 미국보다 높은 점수를 받는다.15,16 In an era of competency-based medical education, efforts to bring all medical school graduates to meet high standards may prove more beneficial than highlighting differences among graduates.12A time-variable, individualized curriculum might support high quality of graduates and health care more than an institutionalized “failure to fail” students who do not meet highest standards.13,14The current Dutch medical workforce has nearly all been admitted to medical school through a weighted lottery in a more time-variable curricula. While we cannot know whether a different admission procedure would have led to a better workforce, Dutch health care scores highly, including higher than the United States, in international comparisons.15,16
2. 신청자 간의 형평성이 우선시되는 경우 2. When Equity Among Applicants Is a Priority
선발 위원회는 보통 모든 지원자들에게 공평하고 동등한 기회를 제공하는 것을 목표로 하지만, 모든 절차는 특정 기준을 사용하는 한 특정 집단이 다른 집단보다 이익을 보게 되며, 흔히 불이익을 받는 집단은 underrepresented group이다. 선발기준에 시험성적과 같이 준비에 영향을 받을 수 있는 영역(예: 고가의 과외, 부유층의 부담)이 포함되어 있다면, 일부 지원자들은 다른 지원자들보다 더 많은 혜택을 받게 된다. 네덜란드 정부는 고등교육을 받은 학생들 사이에 다양성의 부족에 대한 우려 때문에 추첨을 다시 설치하는 것을 정당화했다. While selection committees usually aim to provide fair and equal chances for all candidates, any procedure that uses specific criteria benefits some groups over others and often disadvantages underrepresented groups. If selection criteria include areas, such as test scores, that may be affected by preparation (eg, expensive tutoring, more affordable by the wealthy), some candidates benefit more than others. The Dutch government justified reinstalling a lottery because of concerns over a lack of diversity among admitted higher education students.
3. 다양한 인력이 중요한 경우 3. When a Diverse Workforce Is a Priority
의료인력의 구성이 [사회의 성별과 민족 구성을 반영하지 못한다]는 '지원자에 대한 공정성'보다 '추첨'의 손을 들어주는 또 다른 이유이다. 게다가, 의료 인력 자체는 동질적이지 않다. 사회는 가정 의사, 소아과 의사, 방사선 전문의, 마취과 의사, 신경외과 의사, 바이러스학자가 필요하다. 획일적인 기준으로 의대를 선발하는 것은 사회가 매우 다양한 의사가 아닌 단지 한 종의 의사만을 필요로 한다는 것을 시사한다. 일부 졸업생은 일반 전공으로 남아있을 수 있고, 다른 졸업생들은 하위 전공 훈련을 계속할 수 있으며, 다른 졸업생들은 다양한 규모의 지역사회에서 실습할 것이다. Concerns that the medical workforce does not reflect society's gender and ethnic composition adds to the fairness-for-applicants argument in favor of a lottery. In addition, the medical workforce itself is not homogeneous. Society needs family doctors, pediatricians, radiologists, anesthesiologists, neurosurgeons, and virologists, to name a few. Selection for medical school based on uniform criteria suggests that society needs just one species of doctors, rather than a wide variety. A need for variety is no different within medical specialties: some graduates may remain in a general specialty while others continue to subspecialty training, and some will practice in academic environments while others practice in communities of varying sizes.
4. 공공연한 협업 메시지가 숨겨진 경쟁 문화와 충돌할 때 4. When the Overt Message of Collaboration Collides With a Hidden Culture of Competition
[수월성을 위해 노력하는 것]은 학생들과 교수진들 사이에서 바람직한 것으로 여겨지지만, 종종 [미리 정해진 측정 기준에서 다른 학생들을 능가하기 위한 경쟁]으로 해석된다. 이러한 경쟁적 성취는 CV와 지원서에 사용됩니다. 한편, 협업을 위한 태도와 기술은 의료 및 레지던트 커리큘럼 전체에 걸쳐 학습 목표에서 두드러지게 나타난다. 경쟁 지표에 집착하는 동시에 숨겨진 문화는 경쟁과 협업의 혼합된 메시지를 전달합니다. 의대생과 레지던트들 사이에 스트레스와 과열이 만연해 있고, [전문직업적 발달이 저해될 수 있는 심각한 위험을 안고 있는 것]은 [협업을 희생]하는 댓가로 다른 사람보다의 비교우위를 추구하게끔 순위ranking와 CV 구축에 지속적으로 초점을 맞추고 있기 때문일 수 있다.17 Striving for excellence is regarded as desirable among students and faculty, but it is often translated into competing to outperform other students on prespecified metrics. These competitive achievements are then used in curriculum vitae (CVs) and application letters. Meanwhile, attitudes and skills to collaborate feature prominently in learning objectives throughout medical and residency curricula. A simultaneous hidden culture of fixation on competitive metrics sends mixed messages of competition versus collaboration. The high prevalence of stress and burnout among medical students and residents, with serious risks of hampered professional development, may well be caused by a continuous focus on rankings and CV building to excel in comparison with others, at the cost of collaboration.17
5. 질적 요인에 대한 선정을 뒷받침할 수 있는 설득력 있는 증거가 없는 경우 5. When There Is No Convincing Evidence to Support Selection on Qualitative Factors
네덜란드 학자들은 다양한 의과대학 선발 절차를 가중복권과 비교했다. 2016년부터 2020년까지 완성된 5편의 박사학위 논문(대부분 정부 보조 연구)과 수많은 출판물이 엇갈린 결과를 보이고 있다. 비록 선발 기준을 통해 입학하기로 선택한 학생들이 추첨을 통해 입학한 학생들보다 의과대학에서 조금 더 우수한 성적을 거두었다는 증거가 있지만, 그 결과는 일반적인 결론에 이르지 못한다inconclusive. 의과대학 졸업 후 학생들 간의 차이는 보고되지 않았다. Dutch scholars have compared various medical school selection procedures with a weighted lottery. Five doctoral dissertations completed from 2016 to 2020 (most by government-subsidized researchers) and numerous publications show mixed results.18–22Although there is some indication that students who chose to be admitted through selection criteria performed somewhat better in medical school than those admitted through a lottery, the results are generally inconclusive. No differences among students after graduation from medical school have been reported.
마무리 생각 Concluding Thoughts
의과대학과 레지던트 지원자들은 일반적으로 추첨제보다 선발 기준을 선호하며, 자신이 통제할 수 없다고 느끼는 불합격은 받아들이기 어렵다. 다만 '정말로 원한다면 의대에 진학할 수 있다'는 건 선발인원보다 지원자가 많은 상황에서 현실을 부정하는 것이다. 예를 들어, 네덜란드는 지난 35년 동안 1:3의 경쟁률을 보였다. 추첨을 통해 입학한 대다수의 네덜란드 학생들이 고품질의 보건의료를 제공하는 의사가 된 것처럼, 많은 불합격 신청자들은 의심할 여지 없이 훌륭한 의사였을 것이다. 정교한 선택 절차를 적용하는 국가들이 더 나은 의료 시스템을 구축했다는 징후는 없다. Applicants for medical school and residency generally prefer selection criteria over a lottery system and find rejections that feel beyond their control difficult to accept. However, the suggestion that “if you really want to, you can get into medical school” denies reality, when there are more applicants than positions. For example, the Netherlands has had a 1:3 acceptance ratio over 35 years of admissions. Many rejected applicants would have undoubtedly been excellent physicians, just as the vast majority of Dutch students admitted through a lottery have become doctors providing high-quality health care. There is no indication that countries applying elaborate selection procedures have built better health care systems.
모든 지원자가 증명된 역량을 통해 자격을 얻었을 때, 자격을 갖춘 사람들 중 샌델의 복권은 방어할 수 있습니다. 추첨을 통해 입학하든, 주민선발위원회나 수행평가에서 선발되든, 선발되지 못한 것은 여전히 고통스러운 일이다. 그러나 학생들은 또한 모든 기회가 항상 이용 가능한 것은 아니며, 삶의 방향 전환은 경쟁자들과의 지속적인 싸움보다 더 많은 즐거움과 만족감을 가져다 줄 수 있다는 것을 받아들여야 한다. When all applicants qualify through demonstrated competence, Sandel's lottery among the qualified is defensible. Whether admitted through lottery or chosen by a residency selection committee or performance test, not being selected remains painful. But students must also accept that not all opportunities are always available, and a redirection of life may bring more joy and satisfaction than a continuous battle against competitors.
본 사설은 학습자 간의 차이를 최소화하거나 개인의 고유한 장점을 무시하라는 간청이 아닙니다. 반대로, 모든 학습자들은 개개인이 독특한 방법으로 뛰어나도록 자극을 받아야 합니다. 진짜로 문제가 되는 것은 [개인들이 의료의 질이나 환자에게 진정으로 중요한 역량과는 정작 별 상관관계가 없는 제한된 기준에 순응하고, 이 기준에 맞춰 다른 사람과 경쟁해야 한다]는 사실이다.
This editorial is not a plea to minimize differences among learners or to disregard unique strengths of individuals. On the contrary, every learner should be stimulated to excel in unique ways. What is problematic is when individuals are forced to conform and compete with others on limited criteria that do not correlate well with the competencies that really matter, to health care quality and to patients.
J Grad Med Educ. 2021 Oct;13(5):612-615.
doi: 10.4300/JGME-D-21-00789.1.Epub 2021 Oct 15.
Rationales for a Lottery Among the Qualified to Select Medical Trainees: Decades of Dutch Experience
1is Professor of Medical Education and Senior Scientist, Utrecht Center for Research and Development of Health Professions Education, University Medical Center Utrecht, Utrecht, the Netherlands.
기본에서 돌아오기: 교육에서 통합의 과학과 실천(Med Educ, 2017) Back from basics: integration of science and practice in medical education Glen Bandiera,1 Ayelet Kuper,2,3 Maria Mylopoulos,3,4 Cynthia Whitehead,3,5,6 Mariela Ruetalo,1 Kulamakan Kulasegaram3,5 & Nicole N. Woods3,5
소개 Introduction
다양한 훈련 맥락에서 [기초와 임상 과학의 교육을 통합]하는 의과대학 커리큘럼은 의학의 실천에 직면한 많은 도전에 대한 [극도로 칭찬받는much-vaunted 잠재적 해결책]으로 남아 있다. 아브라함 플렉스너는 처음 기본 및 응용 콘텐츠의 상호보완적 역할을 인식하여, Basic이 뒤따르는 Applied의 교육에서의 기반이 되어야 하는 모델을 옹호했다. 1, 2 Flexner의 특징 보고서 이후 거의 80년이 지난 1988년 세계 의학 교육 총회WCME of WFME에서 교육자들이 소집되었다. 이 회의에서 나온 ['에딘버러 선언']은 ['의학교육의 목적은 모든 사람들의 건강을 증진시킬 의사를 배출하는 것이다']라고 주장했다. 결정적인 영역에서 의학이 이러한 의무를 충분히 다하지 못하고 있다는 견해를 인식함으로써, 에든버러 선언은 의학교육의 커뮤니티가 ['의학교육의 특성을 변화시켜, [의학교육이 위치한situated 사회]가 [정의한 요구defined needs]를 충족시키기 위한 [조직적이고 지속적인 프로그램]'에 동참할 것]을 촉구했다.3
Medical school curricula that integrate the teaching of basic and clinical sciences across diverse training contexts remain a much-vaunted potential solution to many of the challenges facing the practice of medicine. Abraham Flexner first recognised the complementary roles of basic and applied content, championing a model in which the former was regarded as a necessary foundation upon which subsequent education in the latter should be based.1,2Almost 80 years after Flexner's hallmark report,2educators convened at the 1988 World Conference on Medical Education of the World Federation for Medical Education. The ‘Edinburgh Declaration’ that arose from the conference asserted that: ‘the aim of medical education is to produce doctors who will promote the health of all people’.3In recognition of the view that medicine was falling short on this mandate in critical areas, the Edinburgh Declaration challenged the international medical education community to join ‘an organised and sustained programme to alter the character of medical education so that it truly meets the defined needs of the society in which it is situated’.3
선언문은 의과대학 내에서 다뤄질 수 있는 [8가지 권고사항]과 더 넓은 참여가 필요한 [4가지 권고안]을 개괄적으로 제시했다. 전자의 권고안 7은 '과학 교육과 실무 교육의 통합을 추진하고 임상 및 지역사회 환경에서의 문제 해결을 학습의 기초로 활용한다'고 명시하고 있다. 3 그렇다면, 30년이 지난 지금 우리는 이 권고안을 잘 이행하고 있는가?
The Declaration outlined eight recommendations that could be addressed within medical schools and a further four that were felt to require broader engagement. Of the former, Recommendation 7 states: ‘Pursue integration of education in science and education in practice, also using problem solving in clinical and community settings as a base for learning.’3So, 30 years later, have we made good on this recommendation?
지속적인 통합 추구 The ongoing pursuit of integration
의학에 관련된 기초과학이 개념화되고 임상실천에서 그 역할이 어떻게 이루어지는지에 대한 여러 가지 핵심적인 변화가 발생했지만, 1988년 세계 의학 교육 회의 이후 [기초과학과 임상과학의 통합]이라는 이상ideal은 계속해서 중심적인 이슈가 되었다. 이후 등장한 몇 가지 주요 이니셔티브는 통합을 추구할 필요성을 강조해 왔다. 예를 들어, 예를 들어, 미국 의과 대학 협회와 하워드 휴즈 의학 연구소(AAMC-HMI)는 2009년에 다음을 강조한 문서를 발표했다.
'의학에서의 과학적 지식의 적용은 [개인으로서의 환자]와 [사회적 맥락에서의 환자] 모두에 대한 주의를 요구한다' 및
'개별 환자의 생물학은 복잡하고 가변적이며 유전적, 사회적, 환경적 요인의 영향을 받는다.'
'의과대학 커리큘럼은 여러 학문에 걸쳐 통합되어야 하며, 의학에 기본이 되는 과학의 중요성과 관련성을 반복적으로 강조해야 한다'고 명시하였다.
Although a number of key changes have arisen in how the basic sciences pertinent to medicine are conceptualised and their role in clinical practice, the ideal of the integration of the basic and clinical sciences has continued to be a central issue in the years since the 1988 World Conference on Medical Education. Several interim high-profile initiatives have emphasised the need to pursue integration. For example, the Association of American Medical Colleges and the Howard Hughes Medical Institute (AAMC–HHMI) released a document in 2009 acknowledging
that the ‘application of scientific knowledge in medicine requires attention both to the patient as an individual and in a social context’ and
that ‘the biology of individual patients is complex and variable and is influenced by genetic, social and environmental factors’, and
further specifying that ‘the medical school curriculum should be integrated across disciplines and repeatedly emphasise the importance and relevance of the sciences basic to medicine’.4
에든버러 선언과 AAMC-HHMI 문서는 모두 졸업생들이 보다 광범위한 사회 보건 의무사항을 충족시킬 수 있는 가능성을 높여주는 통합과 관련이 있다.
Both the Edinburgh Declaration and the AAMC–HHMI documents link integration with an increased likelihood of graduates meeting broader societal health mandates.
2009년 캐나다 의과대학협회는 '캐나다 의학의 미래: MD 교육을 위한 집합적 비전'이라는 보고서를 발표했다. 의학의 과학적 근거에 대한 권고안에는 다음과 같은 세부 사항이 나타난다.
'…md 교육 경험 전반에 걸쳐 관련되고 즉각적인 임상 맥락에서 인간과 생물학적 과학을 모두 학습해야 한다.'
학생들이 기초과학을 배울 때 임상 응용에 대해 생각하고, 그리고 임상 기술을 배울 때 과학적 원리에 대해 생각할 수 있도록 두 개의 보완 영역이 점점 더 통합되어야 한다.5
In 2009, the Association of Faculties of Medicine of Canada released a report entitled ‘The Future of Medical Education in Canada: A Collective Vision formdEducation’.5Embedded within the recommendation to ‘[b]uild on the scientific basis of medicine’, the following detail emerges:
‘…both human and biological sciences must be learned in relevant and immediate clinical contexts throughout the md education experience’,
along with ‘[t]hese two complementary domains must be increasingly integrated so that students think about clinical applications as they learn basic sciences and about scientific principles as they learn clinical skills’.5
이 보고서는 (에든버러 선언의 [임상 및 지역사회 환경]에 대한 언급과 관련해서)학습자가 '다양화된 교육 컨텍스트'를 경험하도록 보장해야 한다는 범주형 권고도 포함하고 있다.5 In relation to the Edinburgh Declaration's reference to clinical and community settings, the report also includes a categorical recommendation to ensure learners experience ‘diversified training contexts’.5
2010년 랭싯 위원회의 보고서 '새로운 세기를 위한 건강 전문가들'은 다음과 같이 권고하고 있다.
'구체적인 테크니컬 스킬과 더불어, 전문가간 교육은 분석 능력, 리더십 및 관리 능력, 커뮤니케이션 능력과 같은 일반적 역량을 교차편집cross-cutting하는 데 집중해야 합니다.'.
The 2010 Lancet Commission report ‘Health Professionals for a New Century’ further recommends:
‘Alongside specific technical skills, interprofessional education should focus on cross-cutting generic competencies, such as analytical abilities… leadership and management capabilities… and communication skills.’6[
[인증]은 또한 이러한 방향으로의 변화를 유도하기 위한 지렛대로 사용되어 왔다.
예를 들어, 미국의 의료 교육 연락 위원회는 커리큘럼이 '일관성', '조정성' 및 '통합성'이어야 한다고 요구한다.7
호주 의료 위원회는 통합에 다음을 포함하도록 규정하고 있다. : '…관련 과목의 수평적(프로그램 부문 또는 연도 내)과 수직적(연속 프로그램 부문 또는 연도 내) 통합…과 [통합 과정에서] 학생들이 과학적 지식과 임상 경험이 어떻게 결합되어 좋은 의료 행위로 이어지는지 알게끔 한다.'
영국 일반 의료 위원회는 학교들에게 다음과 같은 것을 제공하도록 의무화한다. '기초과학과 임상과학을 통합하여 이론과 실습을 연결할 수 있는 학습 기회'
Accreditation has also been used as a lever for change in this direction.
As examples, the Liaison Committee on Medical Education in the USA requires curricula to be ‘coherent’, ‘coordinated’ and ‘integrated’.7
The Australian Medical Council mandates that integration include: ‘…both horizontal (within a programme segment or year) and vertical (across successive programme segments or years) integration of related subject matter… [in a] process of integration [that] allows students to see how scientific knowledge and clinical experience are combined to support good medical practice.’8
The UK General Medical Council mandates that schools provide ‘learning opportunities that integrate basic and clinical science, enabling them to link theory and practice’.9
이처럼 다양한 전문 보고서와 여러 국가의 인증기준에서의 강조점을 보면, 통합을 강력히 서포트하는 것으로 보인다. 우리는 [통합과 다각화된 학습 맥락의 추구]의 안면 타당성이 아주 잘 살아있다는 것을 추론할 수 있다. 그러나 이러한 결정적 권고사항에 내포된 자신감에도 불구하고, 최근 연구는, 의료 교육계가 이러한 수용된 접근법이 정확히 달성하고자 하는 바를 다시 살펴보도록 해야 하는, 통합의 성격과 전망nature and promise을 밝히기 시작했다.
Such expert documents and accreditation emphasis from multiple jurisdictions imply strong support for integration. We can infer that the face validity of pursuing integration and diversified learning contexts is alive and well. Despite the confidence implied in these decisive recommendations, however, recent research has started to shed some light on the nature and promise of integration that should cause the medical education community to revisit what, exactly, these accepted approaches are meant to accomplish.
통합의 현재 개념 Current conceptions of integration
에든버러 선언은 [다양한 학습 환경에 위치한 통합 모델의 사용]이 인간 건강의 개선을 위해 지식을 적용하는 능력의 증가와 보존을 통해 학습을 개선할 수 있는 가능성을 강하게 시사했다. 통합 모델은 학습자가 훈련 초기에 필요한 응용 기술을 배울 수 있는 기회를 제공할 뿐만 아니라 기초과학의 관련 측면에 대한 학습을 공고히 하는 임상 환경을 만나는 것으로 구상되었다. 선언 당시, [기초과학훈련이 임상역량에 긍정적으로 영향을 미친다는 가정]은 대체로 액면 그대로 받아들여졌다. The Edinburgh Declaration strongly implied that the use of integrated models situated in various learning environments held promise to improve learning through both increased retention and increased ability to apply knowledge for the betterment of human health. A model of integration was envisioned in which learners would encounter early in their training a clinical environment that would provide opportunities not only to learn the applied skills required, but also to solidify learning around relevant aspects of basic sciences. At the time of the Declaration, the assumption that basic science training positively influences clinical competence was largely taken at face value.
그 이후로 기초과학의 역할과 통합의 효과에 대한 실증적 입증은 규정하기 힘든elusive 목표가 되었다. 의료연수 초기에 다룬 기초과학 내용이 후기 임상내용 습득과 이용에 영향을 미치는지 체계적으로 연구하려는 시도가 다수 있었다.
Donnon과 Violato10에 의해 채택된 구조 방정식 모델링은 [기초 과학 지식]과 [임상 지식]이 [서로 독립적]으로 의과 대학의 [임상 역량 평가 성과]에 기여한다는 것을 발견했다. 이는 단일 의료 커리큘럼 내에서 훈련 첫 2년 동안 습득한 기초 과학과 임상 내용이 [이후의 임상 추론에는 (각각) 별도로 영향을 미칠 수 있다]는 이론적 관점을 뒷받침하는 것으로 자리 잡았다.10
반면, 다른 연구에서는 의대생과 진료의사의 임상추론 능력을 조사하면서, 두 가지 형태의 지식이 실제로 통합될 수 있으며, [진단 추론에 대한 기초과학 지식의 기여]가 [임상적 지식과의 관계]에 의해 매개되는 [캡슐화 모델]을 지지한다고 제안했다.11-13
Since then, empirical demonstration of the role of basic science and the effectiveness of integration has been an elusive goal. There have been a number of attempts to systemically study whether the basic science content covered in the early years of medical training has any impact on the acquisition and use of clinical content in later years.
Structural equation modelling employed by Donnon and Violato10 found that basic science knowledge and clinical knowledge independently contribute to performance on clinical competency assessments in medical school. This was positioned as support for the theoretical perspective that basic science and clinical content acquired in the first 2 years of training within a single medical curriculum can separately influence later clinical reasoning.10
By contrast, other studies examining the clinical reasoning of both medical students and practising physicians have suggested the two forms of knowledge can in fact be integrated, supporting an encapsulation model in which the contribution of basic science knowledge to diagnostic reasoning is mediated by its relationship to clinical knowledge.11-13
2010년에 실시된 캐나다 의학 교육의 현재 상태에 대한 철저한 분석에서, 본 논문(GB, AK)의 두 저자와 다른 사람들이 기초 과학의 역할을 탐구했다.14 문헌 검토, 주요 정보원 인터뷰 및 여러 패널 심포지엄에서 발생하는 데이터 합성을 통해 [적절한 통합 정도] 또는 [기초 과학 대 응용 과학의 상대적 균형]에 대한 균일한 합의가 이루어지지 않는다는 것이 명확해졌다. 게다가 [기초과학(자체)의 중요성]에 대한 논쟁은 [기초과학 분야professional field의 사람들]에게 국한되어 있었다. 기초과학 분야 밖의 사람들에게는, [임상의료행위에서의 기초 과학]의 중요성이 가장 중요하다. In a thorough analysis of the current state of Canadian medical education conducted in 2010, two authors of this paper (GB, AK) and others explored the role of basic sciences.14 Through the synthesis of data arising from a literature review, key informant interviews and several panel symposia, it became clear that there is not uniform agreement on the proper degree of integration or on the relative balance of basic versus applied sciences. Moreover, debate regarding the importance of basic sciences is largely limited to those within the professional field; to those outside the field, the importance of basic sciences in clinical practice is paramount.
두 개의 진영 사이에 균열이 뚜렷했다.
한 캠프에서는 [기초과학이 임상 의학에서 더 많은 훈련을 위해 필요한 기초이며, 이러한 기초 지식이 사실상 의료 종사자를 정의내리는 특성]이라고 느꼈습니다.
다른 캠프에서는 [기초과학의 역할이 효과적인 실행을 보장하는 데 필요한 최소로 제한되어야 하며, 의료인의 역할은 주로 광범위한 콘텐츠 영역에서 습득한 일련의 기술을 사용하여 문제를 해결하는 것]이라고 느꼈다.
Within the field, there was a clear rift between
the camp that felt that basic sciences is a necessary foundation for further training in clinical medicine and that this foundational knowledge is in fact a defining characteristic of the medical practitioner, and
another camp that felt the role of basic sciences should be limited to the minimum required to ensure effective practice and that the role of the medical practitioner is primarily to solve problems using an array of skills acquired from a broad swathe of content areas.
실제로, 캐나다 의학교육 분석에서 확인되었고, 보다 최근의 리뷰에서 브라우어와 퍼거슨에 의해 강화되었듯이, [임상경험의 조기 도입]은 [기초과학 지식의 평가절하]와 [교과과정 핵심내용의 대체displacement]로 이어질 수 있다는 많은 우려가 남아 있다.
Indeed, as identified in the analysis of Canadian medical education and reinforced by Brauer and Ferguson in a more recent review, there remains a great deal of concern that early introduction of clinical experiences may result in a devaluing of basic science knowledge and in the displacement of key content from the curriculum.14,15
의료 교육 커리큘럼 내에 통합에 대한 [상충적 개념competing conceptions]이 있다는 것을 주목하는 것이 중요하다.16
많은 사람들이 통합을 종종 [의료 훈련 초기에 더 넓은 임상 콘텐츠를 소개하고 상황별 학습의 기초를 확립하는 방법]으로 여기곤 하나,
다른 한편으로는 [더 오랜 기간과 커리큘럼 전체에 걸쳐, 훨씬 더 정교한 방식으로 기초과학을 지속적으로 포함하는 방식] 또한 통합에 대한 개념으로 보여질 수 있다는 것을 잊어서는 안 된다.
It is important to note that there are multiple competing conceptions of integration within medical education curricula.16
Although integration is often seen as a way to introduce broader clinical content earlier in medical training and to establish the basis for contextual learning,
it should not be forgotten that integration can also be seen as a way to continue the inclusion of basic sciences over time, in an ever more sophisticated manner, throughout the curriculum.
통합에 관한 후자의 측면은 문헌에서 덜 관심을 덜 받았고, 이는 기초 과학 콘텐츠의 취약성에 대해 지속적으로 우려하는 하나의 이유일 수 있다. 그러나 training 내내 기초과학의 존재감presence을 유지하는 것의 여러 이론적 어려움이 제기되었으며, 그 중 핵심 장벽으로는 다음이 언급되었다.
지식을 새로운 맥락으로 번역하는 어려움,
고급 문제 해결을 향한 학생의 인지적 집중의 전환,
임상 훈련 기간 동안 시간 제약이 포함된다.17
This latter aspect of integrative models has received less focus in the literature, which may be a reason for the lingering concern about the vulnerability of basic science content. Still, some theoretical challenges to retaining a basic sciences presence throughout training have been raised, among which the key barriers include
the difficulty of translating knowledge to new contexts,
the transition of students' cognitive focus towards advanced problem solving, and
time constraints during the period of clinical training.17
통합을 이해하는 데 또 다른 관점을 추가하기 위해, 본 논문의 여러 저자는 [교육과정 통합]과 [인지 통합(즉, 개별 학습자의 마음 안에서 기초 및 임상 과학의 통합적 이해의 형성)]이 융합되는 것conflation에 대한 우려를 제기했다. 통합 모델을 유망하게 여기는 이유는 사실 무엇보다 [인지 통합]을 성취한다는 것에 달려있을 것이다. 우즈와 다른 사람들은 후속 진단과 우선순위 결정에 긍정적인 영향을 미치는 [인지 통합의 이점]을 입증했다.18-20 에든버러 선언을 포함하여, 통합에 대한 많은 요구가 내포하는 의미는 [교육적 통합에 초점을 맞추면, 인지적 통합이 뒤따를 것]이 보장된다는 가정이다. 하지만 이 연결고리는 그렇게 견고하지 않을 수 있습니다.
To add another perspective to understanding integration, several authors of this paper (NNW, MM, CW, KK) have raised concerns about the conflation ofcurricular integrationwithcognitive integration(i.e. the creation of integrated understanding of basic and clinical sciences within the mind of the individual learner).18, 19The promise of integrated models may in fact be contingent upon the achievement of cognitive integration specifically. Woods and others have demonstrated the benefits of cognitive integration in positively influencing subsequent diagnosis and prioritisation.18-20Implicit in many calls for integration, including the Edinburgh Declaration, is the assumption that a focus on curricular integration guarantees that cognitive integration will follow. This link may not be so solid.
Kulasegaram 등은 기초과학의 통합을 검토하면서 [통합의 진정한 척도]는 [개별 학습자가 지식의 인지적 통합을 달성하는 정도]여야 한다고 경고하면서, 통합의 연결 고리로 [(프로그램 설계보다는) 학습자-중심성learner-centricity]의 개념을도입한다. 그들은 '단순히 "통합된" 커리큘럼을 만드는 것이 자동적으로 [인지 통합]을 만들지 않을 것'이라고 주장한다.17 Bauer와 Ferguson15 또한 통합 강좌와 임상실습 모델의 출현을 논의하면서 이 문제를 다룬다. 지식의 인지적 통합을 달성하기 위해서는 [교육과정 설계, 개별 교육행위, 학습자의 준비] 측면에 대해서 각각의 상대적 역할에 대한 추가 작업이 필요하다.
Kulasegaram et al.17, in their review of the integration of basic sciences, introduce the concept of learner-centricity rather than programmatic design as a nexus for integration, cautioning that the real measure of integration should be the degree to which individual learners achieve cognitive integration of knowledge. They argue that ‘simply creating “integrated” curricula will not automatically create cognitive integration’.17Brauer and Ferguson15also address this issue in discussing the advent of integrated courses and clerkship models. Further work on the relative roles of curricular design, individual teaching practice and the preparation of learners for achieving cognitive integration of knowledge is required.
통합 관행의 최근 동향 Recent trends in integration practice
최근 통합 이론의 발전과 이와 관련된 우려에도 불구하고, [교육과정 통합 열차]는 역을 떠난 것으로 보인다.
최근 10년간 통합 커리큘럼 관련 출판물이 눈에 띄게 증가했다. 여기에는 comprehensive review도 몇몇이 포함된다. 2015년 가이드에서, Bauer와 Ferguson15는 통합을 위한 전통적인 근거와 현재 모범 사례를 개략적으로 설명한다. 시간과 주제 모두에 걸쳐 나선형 통합에 특히 중점을 둔다.
통합 접근 방식을 수용한 초기 프로그램 중 하나는 맥마스터 대학교의 교육과정이다. 여기서는 신체 시스템을 중심으로, 문제 기반 모델을 사용하여 기초 및 응용 과학을 아우르며 학습한다.
몇 안 되는 성과-기반 프로그램 평가 중 하나에서, Shin 외 연구진은 맥마스터 프로그램 졸업생들이 졸업 후 현재 지침을 더 잘 알고 있으며 환자의 행동 변화를 개선하는 기술을 더 완전하게 수용한다는 것을 보여줄 수 있었다. 이것은 성과의 측면에서 통합 교육과정으로 운영하면서 기대하는 바(환자 중심과 환자 행동에 영향을 미칠 수 있는 능력)를 반영하는 몇 안 되는 연구 중 하나이다.
Despite recent advances in the theory of integration and concerns related thereto, it appears that the curricular integration train has left the station.
There has been a marked increase in the number of publications related to integrated curricula in the last 10 years, which have included several comprehensive review articles.
In their 2015 guide, Brauer and Ferguson15 outline the traditional rationale and current best practices for integration. Particular emphasis is placed on spiral integration (across both time and subject matter).
One of the early programmes to embrace an integrated approach, wherein learning was carried out within body systems and across basic and applied sciences using a problem-based model, was that of McMaster University.
In one of the few outcomes-based programme evaluations, Shin et al.21 were able to show that graduates from the McMaster programme were more likely to be aware of current guidelines post-graduation and to more fully embrace techniques to enhance behaviour change in patients. This is one of the few studies to link curriculum design to an outcome that reflects the hopes placed in integrated curricula (those of greater patient-centricity and ability to influence patient behaviour).
이 설계의 한 가지 책임은 여전히 [개별 학생들이 접하는 임상 경험의 변동성에 따라 임상 전 환경에서 주제 물질을 한 번 탐구한 다음 임상 단계에서 다시 잠재적으로 다시 탐구하는] 순차적sequential 모델을 채택한다는 것이다. 따라서 이 모델은 통합을 지원하는 것으로 간주되는 반복적 또는 '나선형spiral' 모델이 잠재적으로 제공하는 편익을 활용하지 않는다. 문제 기반 커리큘럼의 후속 분석에 따르면, 문제-기반 교육과정은 전통적인 커리큘럼과 비교햇을 때 학습자 만족도가 높으면서도, 결과의 상당히 동등하다. One liability of this design is that it still employs a sequential model whereby topic matter is explored once in a pre-clinical environment and then potentially again in the clinical phase, subject to the variability of clinical experiences encountered by individual students. Thus this model does not take advantage of the potential benefits of a repetitive or ‘spiral’ model, which is seen as supporting integration. Subsequent analyses of problem-based curricula demonstrate substantial equivalency of outcome compared with traditional curricula, albeit with higher learner satisfaction.22,23
[완전 통합 교육과정]을 조기에 채택한 예로는 던디 대학교가 있다. 던디 대학은 [나선형 모델]을 사용하여 한 개념에 대해 반복적으로, 점차 복잡한 내용에 노출되게 짜여져 있다. 1995년에 새로운 던디 커리큘럼을 채택한 이후 몇 년 동안 해당 국가의 통합 교육과정의 보급률은 약 50%에서 90%까지 다양했다.
An example of the early adoption of a fully integrated programme is that of the University of Dundee, where a spiral model is used to ensure programmed repeat exposure to concepts and increasing levels of sophistication.24In the years since the adoption of the new Dundee curriculum in 1995, estimates of the prevalences of integrated curricula within jurisdictions have ranged from 50% to almost 90%.25
[통합(교육과정)]이 현재 환자 치료 또는 미래 의료행위의 패턴에 benefit이 있는지를 확실히 입증하는 연구는 거의 없다. 전 세계적으로 프로그램 설계의 variation이 너무 많아서, best practice를 식별할 수 있는 기회도 많지만, 동시에 교란 변수도 너무 많아 프로그램 간의 직접적인 비교가 어렵다.
1996년 연구에서 Schmidt 등은 [통합 커리큘럼]에 노출된 학생들이, 표준화 환자에 대한 감별진단 목록 개발의 정확도로 측정했을 때, 임상 이전 및 임상 연수를 포함하여 훈련 내내 문제 해결이 더 빨리 진행된다는 것을 발견했다.
이 연구에서 [문제 기반 훈련 모델]에 노출된 학생들은 결국 [통합 커리큘럼]에 노출된 학생들의 성과와 유사한 수준의 성과를 보여주었고, 이 두 모델 모두에서 학생들은 전통적인 모델보다 학생들의 수행능력이 높았다.
At present, few studies definitively demonstrate the benefits of integration to patient care or future practice patterns. The variation in programme design worldwide creates both an opportunity to identify best practices and a large number of confounding variables, which makes direct comparisons between programmes difficult.17
In a 1996 study, Schmidt et al.26 found that students exposed to an integrated curriculum progress faster in problem solving throughout their training, including in both the pre-clinical and clinical years, as measured by their accuracy in developing differential diagnosis lists for a standardised group of scripted patient presentations.
In this study, students exposed to a problem-based training model did eventually demonstrate a level of performance similar to that of students in the integrated curriculum, and students in both of these models performed better than those in a traditional model.26
[개별 성과]에 대해서 아주 많은 연구가 있었으며, 연구마다 퀄리티는 제각각이었다. 그리고 최근에는 새로운 통합 모델의 교육 결과에 대한 여러 메타 분석과 체계적인 검토가 있었다. 그러나 기존 연구 중 확정적인 것은 없으며 학습자 만족도와 같은 낮은 수준의 성과를 보는 경우가 많다. 통합의 benefit이 [지식의 습득과 보유]에만 관련되는지, 임상 실습 중 [문제 해결]까지 개선되는지 여부도 여전히 불분명하다. 노먼과 슈미트는 2000년에 커리큘럼 중심의 접근법의 한계를 지적하고 통합 커리큘럼의 영향을 더 탐구하기 위한 연구 기회에 대한 현재 상태 분석을 제공했다. 기존 문헌을 합성synthesis한 결과, 통합 커리큘럼이 지식의 기본적인 보존과 적용 측면에서 이점을 제공할 수 있다는 개념을 부분적으로 지지했지만, 효과적인 통합 커리큘럼의 행동 결과 및 특정 설계 특징과 관련하여 많은 의문점을 남겼다. 더 높은 수준의 학습 성과를 조사하고 통합이 일상적인 임상 활동에 미치는 영향을 탐구하는 경험적 연구는 여전히 모호하다.
There have been a number of individual outcome studies of variable quality and, more recently, several meta-analyses and systematic reviews of educational outcomes of new integrated models. However, none of the existing studies are definitive and many look at low-level outcomes such as learner satisfaction. It also remains unclear whether the benefits of integration relate only to the acquisition and retention of knowledge, or whether problem solving during clinical practice is also improved. Norman and Schmidt, in 2000, pointed out the limitations of curriculum-centred approaches and provided a current state analysis of research opportunities to further explore the impact of integrated curricula.27As a result, the synthesised literature lends some support to the notion that integrated curricula can provide benefits in terms of the basic retention and application of knowledge, but leaves many questions unanswered with respect to behavioural outcomes and specific design features of effective integrated curricula.17,26,28Empirical studies investigating higher-level learning outcomes and exploring the impact of integration on everyday clinical activity remain elusive.
[통합에 대한 다른 시도]는 종종 [기초과학 통합과 무관한 다른 목표]의 추구가 동시에 발생했다는 점에 주목해야 한다. 예를 들어, 종단적 통합 임상실습(LIC)는 관리의 연속성을 개선하고, 시스템을 탐색하는 환자의 경험에 대한 학습자의 인식을 증가시키며, 전통적인 모델에서 보이는 공감과 보살핌의 감소를 감소시키는 것을 추구한다.29 그러한 통합의 예는 실제로 의도된 영역에서 긍정적인 결과를 산출할 수 있지만, [인지적 통합]이라는 목표 달성을 위한 교육적 요소의 완전한 통합을 보여준다고 여겨져서는 안 된다. It should be noted that other attempts at integration have occurred in parallel, often in the pursuit of other goals unrelated to basic science integration. Longitudinal integrated clerkships, for example, seek to improve on continuity of care, increase the learner's appreciation for the patient experience in navigating the system, and reduce the attrition of empathy and caring seen in traditional models.29Such examples of integration may indeed yield positive results in the intended areas, but they should not be seen as representing the full integration of curricular elements for the purposes of achieving cognitive integration.
[인지적 통합]은 학생들이 [여러 임상적 맥락에서 학습하도록 요구]하거나, [기초과학과 임상 내용을 병렬적으로 제시]한다고 달성할 수 있는 것이 아니다. 몇몇 연구는 학생들이 [기초과학 지식을 다양한 맥락으로 '가져올bring' 때 인지적 통합이 자발적으로 일어날 것이라는 기대는 효과적이지 않을 수 있음]을 시사한다. 비록 에든버러 선언이 학습의 기초로서 [임상 및 공동체 환경에서을 문제 해결]을 권고했을지라도, 단순한 [이분법]보다는 보다 [포괄적인 접근법]이 요구된다는 것이 분명해지고 있다. 그리고 이 '포괄적인 접근법'이란 광범위한 맥락에 걸친 교육 및 학습 전략으로서, 인지 통합에 대한 신중한 집중을 요구요구한다.
Cognitive integration is not something that can be achieved by requiring that students learn in multiple clinical contexts or by presenting them with basic science and clinical content in parallel settings. Several studies suggest that expecting cognitive integration to occur spontaneously as students ‘bring’ their basic science to various contexts may not be effective.17,30Although the Edinburgh Declaration may have encouraged problem solving in clinical and community settings as a basis for learning, it is becoming clear that a more comprehensive approach that requires deliberate focus on cognitive integration as a teaching and learning strategy across a breadth of contexts, rather than a simple dichotomy, is probably required.
더 중요한 교훈은 [기초 과학 메커니즘]을 [임상적 징후]와 [명시적으로 통합하는 교육]을 강조해야 한다는 것이다. 다양한 임상·공동체 환경에서 배우는 것이 가치가 없다는 것은 아니다. 예를 들어 훈련생에게 다양한 실습 환경을 경험할 기회를 제공하면 [다양한 의료 시스템에 대한 노출, 다양한 환자 모집단에 대한 이해, 더 넓은 공동체의 요구에 대해 더 잘 배울 수 있는 기회]를 제공할 수 있다. 중요한 기회이지만, 에든버러 선언에서 기술한 '다양한 맥락에서의 학습'이 추구하는 목표는 이런 것이 아니다. 노먼과 슈미트는 [인지적 통합을 위한 의도적 교육]은 하지 않으면서, [대규모 커리큘럼 설계]에만 의존하는 것의 무의미함을 개략적으로 설명한다.
A more important lesson for educators may refer to the emphasis of instruction that explicitly integrates basic science mechanisms with clinical manifestations, including knowledge about the ways in which contexts might impact understanding. This is not to say that learning in diverse clinical and community settings has no value. For example, offering trainees opportunities to experience various practice settings may provide them with exposure to a variety of health systems, an understanding of diverse patient populations and opportunities to better learn about the needs of the broader community.31However, these are not the goals of learning in multiple contexts as described in the Edinburgh Declaration. Norman and Schmidt outline the futility of relying solely on large-scale curriculum design at the expense of deliberately teaching towards cognitive integration.27
'기초과학'이란 무엇인가? What are ‘basic sciences’?
(커뮤니케이션과 건강권 어드보카시 처럼) 의사 역량이 광범위한 영역에 걸쳐 중요하다는 것을 인식하게 된 것은 '기초과학 대 임상과학' 이분법의 특별한 중요성에 의문을 불러 일으켰다. 대신, 이러한 [더 넓은 범위의 역량]을 설명하기 위해서는, [더 넓은 지식 기반]을 통합하는 과학의 더 미묘한 개념화가 필요하다. 최근 출판된 프레임워크 중, 다양한 임상역량을 뒷받침하는 '비생물과학 지식non-bioscientific knowledge'에 대한 프레임워크는 이 점을 강조한다.
예를 들어, 원주민 공동체 및 이와 구조적으로 유사한 소외된 집단과 [문화적으로 안전한 방식으로 상호 작용]하려면 몇 가지 [기본적인 사회적 구조에 대한 이해]와 [기초적인 이론적 기초에 대한 개요]가 필요하다.
미국 IOM이 권고한 것처럼, 이러한 내용 영역도 '과학'으로 보고 의료 커리큘럼에 통합해야 한다는 공식화된 요구가 이러한 개념을 뒷받침한다.
The emergence of an appreciation for the importance of a broad range of physician competencies such as communication and health advocacy has called into question the singular importance of the ‘basic science versus clinical science’ dichotomy. Instead, there is a need for a more nuanced conceptualisation of science that incorporates a broader knowledge base to account for these broader competencies.14,15A recently published framework of the ‘non-bioscientific knowledge’ that underpins a range of clinical competencies highlights this point.32
For example, interacting in a culturally safe manner33 with indigenous communities and similarly structurally marginalised groups requires an understanding of several fundamental social constructs and an overview of their underlying theoretical bases.
Formalised calls to view these content areas as ‘science’ and to integrate them into medical curricula, such as that of the Institute of Medicine in the USA, support this notion.34
임상 의학의 다른 분야와 마찬가지로 기초 과학 없이는 임상 내용을 가르치는 것이 충분하지 않을 수 있다. 예를 들어, 비건은 [(건강) 결정요인의 본질에 대한 기초적인 교육]을 제공하지 않으면서, 학생들을 [건강의 사회적 결정요인의 존재에 노출시키는 것]만으로는 태도와 인식의 향상을 초래하지 않는다는 것을 발견했다. 이러한 변화는 사회과학 콘텐츠를 더 많이 포함하기 위한 의대 입학 시험(MCAT)의 최근 변화에서 나타나듯이 의대 커리큘럼과 의대 입학에서도 실제로 일어나고 있다.37-40
As in other areas of clinical medicine, it may not be sufficient to teach the clinical content without the underlying basic science. For example, Beagan found that merely exposing students to the existence of social determinants of health without providing foundational teaching about the nature of such determinants did not result in any improvement in attitudes and awareness.35,36This shift is indeed taking place in medical school curricula and even in medical school admissions, as manifested in recent changes to the Medical College Admission Test (MCAT) to include more social science content.37-40
또한 커리큘럼 통합에서 인지 통합으로의 전환의 맥락에서 의료 전문가 지식과 관련된 기초 과학의 정의는 임상 지식과 경험에 대한 의미 있고 개념적인 이해를 확립하는 데 사용될 수 있는 모든 형태의 지식을 허용하기 위해 더욱 확장된다. [통합]은 학습자나 [의학 지식의 일관된 정신적 표현을 개발]할 때 달성되며, 여기에 포함되는 의학 지식에는 [질병의 징후와 증상, 기초적인 생물학적, 심리적, 사회학적 메커니즘 사이의 명시적 연결]이 포함된다. 이러한 통합적인 이해를 통해 학습자는 임상 문제를 보다 효과적으로 해결할 수 있으며, 새로운 지식을 쌓을 수 있는 기반이 된다. Lucy에 의해 제안된 ['새로운' 기초 및 임상 과학 모델]은 [통합에 대한 새로운 개념]과 일치한다. 이 '새로운' 모델에서는 [심리학, 인류학, 인적 요인 공학 및 경제학에 대한 지식]을 [미래의 의학 전문지식의 기초과학]으로 포함한다. 이 새로운 모델은 1988년에는 상상하지 못했던 지식 통합에 대한 새로운 표준을 설정할 것이다.
Moreover, in the context of a shift from curricular integration to cognitive integration, the definition of basic sciences relevant to medical expert knowledge is further expanded to allow for any form of knowledge that can be used to establish meaningful, conceptual understanding of clinical knowledge and experiences.30,35,36Integration is achieved when the learner or practitioner develops a coherent mental representation of medical knowledge, including explicit connections between the signs and symptoms of disease and underlying biological, psychological and sociological mechanisms. This integrated understanding allows learners to more effectively solve clinical problems and serves as a foundation upon which new knowledge can be built.41The model of ‘new’ basic and clinical sciences proposed by Lucey, which includes knowledge of psychology, anthropology, human factors engineering and economics as basic sciences fundamental to medical expertise in the future, is consistent with this new conception of integration and sets a whole new standard for knowledge integration that could not have been imagined in 1988.42
앞으로 나아가기: 의료 교육에 대한 시사점 Moving forward: implications for medical education
[에든버러 선언]이 통합 커리큘럼을 요구한 이후, 30년 동안 [통합의 기본 전제]에 대한 지속적인 서포트는 있었지만, 교육과정 통합을 위한 [증거 기반 전략]이나 [영향impact의 입증] 측면에서는 거의 진전이 없었다. 기초과학에 대한 새롭고 광범위한 정의가 등장하였고, [교육과정의 통합] 뿐만 아니라 [인지적 통합]에도 초점을 맞추면서, (과거의) 통합의 목적을 재고하고, 의도된 비전을 달성하기 위한 노력을 새롭게 할 수 있는 기회가 오고 있다.
In the 30 years since the Edinburgh Declaration called for integrated curricula, there has been ongoing support for the basic premise of integration, but little progress in terms of either evidence-based strategies for curricular integration or demonstration of impact. With the emergence of a new and broader definition of basic science and a focus on cognitive as well as curricular integration comes an opportunity to reconsider the purpose of integration and to renew efforts to achieve the intended vision.
통합에 대한 현재의 개념은 통합이 [더 나은 지식 습득과 유지]를 서포트하는 것 이상의 가치를 가지고 있음을 시사한다. 기초 및 임상 과학에 대한 통합된 이해는 [미래의 임상의가 지식을 생산적으로 사용하여 새로운 지식을 습득]하고, [복잡한 시스템에서 의료행위를 실천]하며, [건강 격차를 인식하고 바로잡는 역할]을 하게끔 준비시킬 수 있다. [많은 형태의 과학]을 [인지적으로 통합하는 것]에 대해 앞으로 진행될 연구는 [지식 습득과 임상 활동]에 대한 통합의 영향에 초점을 맞추어야 하며, 그래야 우리의 이론적 이해를 최상으로 발전시키고 교육 및 커리큘럼 설계를 위한 가이드 역할을 할 수 있을 것이다.이러한 이론적, 경험적 진보를 통해 통합에 대한 우리의 생각을 진전시키면 마침내 에든버러 선언에서 제기되는 도전을 성공시킬 수 있을 것이다.
The current conception of integration suggests that it has more value that extends beyond supporting better acquisition and retention of knowledge. An integrated understanding of the basic and clinical sciences can prepare future clinicians to use their knowledge productively to acquire new knowledge, perform in a complex system and work to recognise and rectify health disparities.39, 41, 44Future research on the cognitive integration of many forms of science should focus on the impact of integration on knowledge acquisition and clinical activity in order to best advance our theoretical understanding and serve as a guide for instructional and curricular design. Moving our thinking forward on integration through these theoretical and empirical advances can allow us to finally make good on the challenge raised in the Edinburgh Declaration.
Med Educ. 2018 Jan;52(1):78-85.
doi: 10.1111/medu.13386.Epub 2017 Oct 10.
Back from basics: integration of science and practice in medical education
Context:In 1988, the Edinburgh Declaration challenged medical teachers, curriculum designers and leaders to make an organised effort to change medical education for the better. Among a series of recommendations was a call to integrate training in science and clinical practice across a breadth of clinical contexts. The aim was to create physicians who could serve the needs of all people and provide care in a multitude of contexts. In the years since, in the numerous efforts towards integration, new models of curricula have been proposed and implemented with varying levels of success.
Scope of review:In this paper, we examine the evolution of curricular integration since the Edinburgh Declaration, and discuss theoretical advances and practical solutions. In doing so, we draw on recent consensus reports on the state of medical education, emblematic initiatives reported in the literature, and developments in education theory pertinent to the role of integrated curricula.
Conclusions:Interest in integration persists despite 30 years of efforts to respond to the Edinburgh Declaration. We argue, however, that a critical shift has taken place with respect to the conception of integration, whereby empirical models support a view of integration as pertaining to both cognitive activity and curricular structure. In addition, we describe a broader definition of 'basic science' relevant to clinical practice that encompasses social and behavioural sciences, as well as knowledge derived from biomedical science.
교육의 패러다임을 다시 그리기: 인식, 정렬, 다원성을 향하여 (Adv Health Sci Educ Theory Pract,2021) Re‑envisioning paradigms of education: towards awareness, alignment, and pluralism Lindsay R. Baker1,2 · Shanon Phelan3 · Nicole N. Woods4,5 · Victoria A. Boyd5,6 · Paula Rowland5,7 · Stella L. Ng2,5,8
HPE의 학술연구는 다양한 분야와 관점에서 이끌어낸다. 사회 과학 및 인문학에서 점점 더 많은 학문적 방법과 관행이 차용되거나 수입되지만, 원래 학문이나 교육의 "패러다임"을 주의하지 않고 사용되는 경우가 많다. 쿤은 [패러다임]을 [과학자들에 의해 공유된 믿음의 집합] 또는 [어떻게 문제가 이해되어야 하는지에 대한 합의의 집합]으로 정의한다. 패러다임이라는 용어의 사용은 비록 영감을 받았으나 쿤의 정의를 엄격히 고수하지는 않는다. 본 논문에서 우리는 [교육의 패러다임]을 다소 구어적으로 [교육 원칙과 실천에 대한 사고 체계]를 의미할 것이다. 원칙과 관행이 보건 과학 이외의 여러 분야에서 도출될 수 있지만, 그러한 외부 분야의 학자들은 보건 전문가 교육 저널에 그들의 연구를 거의 발표하지 않으며, 반드시 이론의 보건 전문가 교육 번역에 참여하지도 않는다(Martimanakis). et. al., 2009). Scholarship in health professions education draws from a range of disciplines and perspectives. Increasingly, these borrowed or imported scholarly methods and practices derive from the social sciences and humanities (Brosnan & Turner, 2009; Ousager & Johannessen, 2010), yet are often deployed without clear attention to their originating disciplines or “paradigms” of education. Kuhn defines a paradigm as a collection of beliefs shared by scientists, or a set of agreements about how problems are to be understood (Kuhn, 1962). Our use of the term paradigm, though inspired by, does not strictly adhere to, Kuhn’s definition. We use paradigms of education somewhat colloquially to mean a system of thought about educational principles and practices. Although principles and practices might be drawn from an array of disciplines outside of the health sciences, scholars from those external disciplines rarely publish their research in health professons education journals (Norman, 2011) nor do they necessarily participate in the translation of theory into health professions education (Martimianakis et al., 2009).
또한, 보건전문직 분야의 교육자들은 종종 교육 이론이나 실무에 대한 공식적인 훈련을 받지 않은 채로 학문적 리더십 역할을 맡는다(MacDougall & Drummond, 2005; Srinivasan 등, 2011). 이러한 현실은 보건직업 교육의 설계와 전달에 가장 책임이 있는 사람들이 교육, 심리학, 사회학 및 유머의 관련 내용에 각자 다른variable 배경을 갖는 역설적인 시스템을 만든다. 그 결과, 교육 및 평가의 혁신은 의도된 목적 또는 이론적 기원에 맞지 않아 의심스러운 효과와 상당한 저항을 가지고 광범위하게 채택될 수 있다.
Moreover, educators in the health professions often assume academic leadership roles without formal training in education theory or practice (MacDougall & Drummond, 2005; Srinivasan et al., 2011). This reality creates a paradoxical system in which those most responsible for the design and delivery of health professions education (HPE) have variable background in relevant content from education, psychology, sociology and the humanties. As a result, innovations in teaching and assessment can be launched and widely-adopted with questionable effectiveness and significant resistence due to misalignment with intended purpose or theoretical origins.
교육에 대한 사고 방식: 개요 Ways of thinking about education: an overview
역사를 통틀어, 여러 분야의 학자들은 [교육의 근본적인 가정]에 대해 생각할 수 있는 다양한 방법들을 도입해 왔다. 예를 들어,
철학자들은 종종 교육의 전반적인 목적과 목표, 교육 기관이 무엇을 가르쳐야 하는가에 대한 신념, 교육 실천을 통해 드러난 가치와 규범에 초점을 맞춘다
역사학자들은 어떻게 사회적, 정치적, 문화적 영향이 역사의 다양한 시점에서 가치 있고 커리큘럼에 포함된 것을 형성했는지에 관심이 있다
심리학자들은 인간과 아동 발달 연구의 지식 기반 변화를 중심으로 정리한다
사회학자들은 교육을 사람들의 삶에서의 역할, 그 기반이 되는 사회/경제적 기반, 그리고 학교가 달성하여야 하는 공공의 목표에 따라 분석한다.
Throughout history, scholars across disciplines have introduced a variety of ways to think about the underlying assumptions of education. For example,
philosophers often focus on the overall purpose and goals of education, beliefs about what education institutions should teach, and the values and norms revealed through educational practice (Eisner, 1970; Noddings, 2018; Ornstein & Hunkins, 2017; Schiro, 2013).
Historians are interested in how social, political and cultural influences have shaped what is valued and included in the curriculum throughout various points in history (Kliebard, 2004; Ornstein & Hunkins, 2017).
Psychologists organize around shifts in knowledge bases in the study of human and child development (McInerney, 2013; Ornstein & Hunkins, 2017).
And sociologists analyze education according to its role in people’s lives, the social/economic foundations on which it is based and the public goals schools should aim to achieve (Ballantine & Hammack, 2009; Clabaugh & Rozycki, 1990; Ornstein & Hunkins, 2017).
다른 사람들은 교육과정, 교육 및 학습과 관련된 실무 수준에서 [어떻게 기초적인 가정과 믿음이 집행되는지]에 기초하여 교육을 논의한다. 예를 들어,
커리큘럼 이론가들은 커리큘럼 구성에 대한 다양한 개념화 또는 사고 방식을 설명한다. (스미스, 2000)
교육 심리학자는사람들이 배우는 방법에 대한 유사한 접근법에 기초하여 서로 다른 학습 이론을 그룹화한다. (McInerney, 2013; Ornstein & Hunkins, 2017)
교육 이론가들은 다양한 교육 접근법 또는 관점에 따라 분류한다(밀러 & 셀러, 1990; 프랫, 2002).
Others discuss education based on how underlying assumptions and beliefs are enacted on a practice level related to curriculum, teaching and learning. For example,
curriculum theorists describe different conceptualizations or ways of thinking about what makes up curriculum (Smith, 2000),
education psychologists group different learning theories together based on similar approaches to how people learn (McInerney, 2013; Ornstein & Hunkins, 2017), and
education theorists categorize according to different teaching approaches or perspectives (Miller & Seller, 1990; Pratt, 2002).
이렇게 몇 가지만 살펴보더라도, 교육을 분류하는 여러 방법들은, 교육의 목적, 실천, 그리고 가치에 대해 이야기하고 생각하는 방법의 다양성과 복잡성을 보여준다. 이와 같은 가정은 교육적 학술활동과 실무에 내포되어 있다. 원래 이론가들은 그들 자신의 분야에서 계속 일하는 경향이 있기 때문에, 차용된 사고 방식과 실천 방법에 대한 근본적인 가정은 다른 분야로 흡수된 후에 당연하게 여겨질 수 있다.
These different ways of categorizing education, while we have only scratched the surface, illustrate the diversity and complexity of ways of talking about and thinking about the purpose, practice and value of education. Assumptions such as these become implicit in education scholarship and practice. Because the original theorists tend to remain working in their own disciplines, the underlying assumptions of borrowed ways of thinking and practicing can be taken for granted after uptake into another field.
HPE에서, 심리학적 관점이나 심리학 이론의 용어들이 교육적 결정과 일상적인 교육 관행을 구성하기 위해 일반적으로 사용된다. 그러나 심리학적 관점은 HPE에서 직장에서 교육적 접근법의 범위를 완전히 대표하지는 않는다. 논쟁의 여지 없이, 어떤 분야가 어떤 한 분야의 프레임에 우선권을 갖고 있을 때, 다른 철학적 가정, 인식론적 기원, 그리고 이러한 관점과 이론과 관련된 역사적, 정치적, 사회 문화적 영향을 고려하기 위해 뒤로 물러서는 것이 도움이 될 수 있다. 이 단계를 취하는 것은 지식의 진보를 제약하지 않도록 관점을 넓히고 가정을 점검하는 데 도움이 될 수 있다. In HPE, the language of psychological perspectives and theories are commonly drawn upon to frame curricular decisions and day-to-day educational practices. Yet psychological perspectives do not fully represent the spectrum of educational approaches at work in HPE. Arguably, when a field gives primacy to any one discipline’s framing it can be helpful to step back to consider other philosophical assumptions, epistemological origins and historical, political and sociocultural influences associated with these perspectives and theories. Taking this step can help broaden perspectives and check assumptions, lest they constrain the progression of knowledge.
보건직종을 위한 교육의 패러다임: 새로운 종합 Paradigms of education for the health professions: a novel synthesis
우리는 HPE와 관련된 교육의 6가지 주요 패러다임을 소개한다. 이러한 패러다임은 위의 많은 교육 이념과 분류의 종합을 나타냅니다. 각각에 대해, 우리는 철학이 무엇을 창조할 수 있는지에 대한 종합적인 설명과 심리학 기원을 연결한다. 이 패러다임들은 중첩되는 부분이 있으나, [세상에 무엇이 존재하는가(존재론)]와 [우리가 존재하는 것에 대해 어떻게 알게 되었는지(인식론)]에 대한 그들의 철학적 가정과 관련한 유의미한 차이를 갖는다.
We introduce six major paradigms of education that are relevant to HPE. These paradigms represent our synthesis of many of the educational ideologies and categorizations above. For each, we link a philosophy with origins in psychology with a synthesized description of what that philosophy could create (Ballantine & Hammack,2009; Clabaugh & Rozycki,1990; Eisner,1970; Kliebard,2004; Miller & Seller,1990; Ornstein & Hunkins,2017; Pratt,2002; Schiro,2013; Schuh & Barab,2007; Smith,2000).The paradigms overlap, but differ meaningfully with respect to their philosophical assumptions about what exists in the world (ontology) and how we come to know about what exists (epistemology).
순차적으로 설명할 각 패러다임을 개별 개체로 제시하지만, 시간적 중복도 있고 뒤쪽에 제시된 패러다임이 앞쪽의 패러다임을 무효화하지도 않는다. 우리의 "철학 목표"의 명명 관례는 첫 번째 단어는 철학을 설명하고, 두 번째 단어는 정렬된 목표에 대한 우리의 해석을 설명합니다.
While we present each paradigm as a separate entity in a sequence, there is also temporal overlap and each subsequent paradigm does not render the previous invalid. Our naming convention of "philosophy-goal" means the first word describes the philosophy, and the second word describes our interpretation of aligned goals.
행동주의-시민권 Behaviourism-citizenship
행동주의-시민권 패러다임에서 교육의 전반적인 목적은 [학습자가 사회의 가치 있는 구성원으로 행동할 준비를 하도록 [바람직한 행동을 형성하는 것이다. 이 패러다임에서는,
하나의 외부 현실이 있고 개인에 의해 획득될 수 있는 유일한 진리에 대한 지식이 있다.
학습자는 빈칸으로 간주되고 학습은 세상에 대한 올바른 정보를 얻는 것을 포함한다.
학습 또는 지식 습득은 다른 자연 현상과 마찬가지로 인과적 과정으로 간주되며, 학습의 바람직한 결과는 관찰 가능한 행동의 형태 또는 빈도 변화이다(사람의 말 또는 행동). (왓슨, 1913)
주제에 정통한 교사들은 체계적인 조건화와 강화를 사용하여 학습자에게 지식을 전달함으로써 관찰 가능한 행동을 형성합니다.
강화는 행동 직후에 자극을 전달하거나 제거함으로써 미래에 특정 행동이 더 자주 발생할 가능성을 증가시킨다.
따라서 원하는 행동은 시간이 지남에 따라, 사용에 의해 강화되고 연마되면서 습관, 특성 또는 기질이 된다.
평가는 외부 표준(예: 위탁 가능한 전문 활동)과 비교하여 측정되는 이러한 바람직한 행동을 입증하는 학습자에 초점을 맞춘다(Ten Kate 등, 2015).
The overall purpose of education in the Behaviourism-Citizenship paradigm is to shape desirable behaviours toward preparing learners to behave as valuable members of society. Within this paradigm
there is one external reality and knowledge of singular truths are able to be acquired by individuals. Learners are considered blank slates, and learning involves acquiring correct information about the world.
Learning or knowledge acquisition is viewed as a causal process, just like any other natural phenomenon, and the desired outcome of learning is a change in form or frequency of observable behaviour (what people say or do) (Watson, 1913).
Teachers, who have mastery of subject matter, shape this observable behaviour by transmitting knowledge to learners, using systematic conditioning and reinforcement (McSweeney & Murphy, 2014; Pavlov & Anrep, 2003).
Reinforcement increases the likelihood that a specific behaviour will occur more frequently in the future by delivering or removing a stimulus immediately after a behaviour.
Desired behaviours thus become habits, traits or dispositions as they are reinforced and honed by use over time.
Assessment and evaluation focus on learners demonstrating these desired behaviours, measured against external standards (for example, entrustable professional activities) (Ten Cate et al., 2015).
보건직업에서는 적절한 성과를 기록하기 위한 행동주의자의 접근이 가장 효과적일 수 있는 많은 사례가 있다. 예를 들어, 감염 예방 및 통제와 개인 보호 장비 착용/제거에 있어 명확한 프로토콜 주도적이고 엄격하게 규제되는 절차가 필요하고 필요합니다. 시민 정체성의 창조는 이 과정의 암기적이고 표준적인 수행이 더 큰 이익을 위해 필요하다는 것을 의미한다. 행동주의자-시민권 패러다임은 통제, 규제 및 감시의 형태가 된다는 비판에 직면해 있고, 이는 [사회적 발전과 개인 성장이라는 교육과 학습의 이상ideal]에 반하기 때문이다(Hodges, 2015).
There are many instances in health professions where a behaviourist approach to inscribing proper performance may be most effective. For example, in managing infection prevention and control and donning / doffing personal protective equipment, we need and want clear protocol-driven, heavily regulated procedures. The creation of a citizen identity means that the performance of this process in a rote and standard manner is necessary to the greater good. The Behaviorist-Citizenship paradigm faces critiques of becoming a form of control, regulation, and surveillance which is counter to the ideals of education and learning as avenues for societal advancement and forms of personal growth (Hodges,2015).
인지주의-전문가 Cognitivism-Expertise
인지주의-전문가 패러다임은 행동주의 패러다임을 [무엇을 해야 하는지 아는 것] 이상으로 [왜 그리고 언제 행동이 적절하지 않을 수 있는지를 이해하는 것]으로 확장한다. 따라서 이러한 변화는 순응할 수 있는 '좋은 시민'이 아닌, [더 유연하게 대응할 수 있는 전문가]들을 개발한다. 인지주의-전문가 패러다임에서,
지식은 여전히 학습자의 외부 내용 또는 정보로 구성되지만, 여기서의 초점은 어떻게 이 정보가 기억 속에 저장되는가에 있다.
관찰 가능한 행동에 초점을 맞추기 보다는, [학습자가 알고 있는 것을 정의하고 새로운 지식을 습득하는 방법을 체계화]하는, 관찰할 수 없는 정신 구조와 과정의 발달과 관련이 있다.
학습을 정의할 때, [선생님에 의한 감각, 경험 또는 공식적인 가르침]을 통한 [지식의 획득]을 포함한다.
학습자는 정보 처리자로 간주되며, 교사는 정보가 어떻게 구성되고, 구성되고, 검색되며, 새로운 상황으로 전달되는지에 대한 집중적인 관심을 통해 이러한 처리를 용이하게 합니다.
예를 들어, 통합 교수 연구는 임상 또는 절차적 지식과 관련된 개념적 지식을 가르치는 것이 더 정확한/전문가 실습으로 귀결된다는 것을 입증했다(Bandiera 등, 2018; Mylopolos 등, 2017).
이 패러다임 내의 평가는 학습의 유지와 근거리 전이near transfer(학습자가 지식이나 기술을 습득한 조건과 새로운 상황 사이에 많은 요소가 중복되는 경우)에 초점을 맞춘다(Castillo 등, 2018).
인식주의적 패러다임은 [마음 속의 정신적 표현]에 너무 편협하게 초점을 맞추고 있다는 비판에 직면하고 있으며, 그 댓가로 [어떻게 지식이 사회적으로 구성되고, 공유되고, 협상되는지]를 희생시키고 있다고 여겨진다.
The Cognitivism-Expertise paradigm extends the behaviourist paradigm beyond knowing what to do, toward understanding why and when the behaviours may or may not be appropriate. This shift thus develops experts who can respond more flexibly, as opposed to ‘good citizens’ who can conform.
Knowledge is still framed as content or information external to the learner, however the focus here is on how this information is stored in memory.
Rather than focusing on observable behaviours, the cognitivism-expertise paradigm is concerned with development of the unobservable mental structures and processes within the mind, which define what learners know and frames how they come to acquire new knowledge.
Learning is considered by definition to involve the acquisition of knowledge through senses, experiences or formal instruction by teachers.
Learners are viewed as information processors and teachers facilitate this processing through focused attention on how information is structured, organized and retrieved, and transferred to new situations.
For example, studies of integrated instruction have demonstrated that teaching the conceptual knowledge associated with clinical or procedural knowledge results in more accurate/expert practice (Bandiera et al., 2018; Mylopoulos et al., 2017).
Assessment and evaluation within this paradigm focus on retention and near transfer of learning (when many elements overlap between the conditions in which the learner obtained the knowledge or skill and the new situation) (Castillo et al., 2018).
The cognitivist paradigm faces critiques for being too narrowly focused on mental representations in the mind, at the expense of how knowledge is socially constructed, shared, and negotiated.
구성주의-전문가 Constructivism-Expertise
구성주의-전문주의는 [지식의 본질에 대한 존재론적, 인식론적 변화]를 나타낸다. 지식은 학습자가 습득하는 외부적인 것이 아니다; 지식은 학습자가 자신의 경험을 의미할 때 적극적으로 "구성"하는 것이다. 이 패러다임에서,
초점은 학습자가 새로운 지식을 구축하도록 지원하기 위한 정신적 표현을 이해하는 것이다.
지식은 역동적인 것으로써, 새로운 문제를 해결하기 위해, 학습자의 사전 지식으로 새로운 지식이 구성된다.
교육의 목표는 전문가를 양성하는 것이며, [적응형 전문성adaptive expertise]은 전문가 실무 제정에 필요한 지식의 동적 특성을 예시한다.
학습자는 [지식의 발견을 촉진하기 위해 고안된 활동]에 참여하며, 교사의 역할은 인지 발달의 각 단계에 적절한 자원과 지원을 제공하는 것이다.
구성주의 교과 과정은 [특정 내용]보다는 [지식 구축 과정]에 더 초점을 맞춘다. 효과적인 교육과 교육 계획 수립에서 학습자의 사전 지식이 핵심 고려 사항이다.
평가는 새로운 맥락에 대한 지식의 적용 또는 이전과 미래 학습을 위한 준비에 초점을 맞춘다(Mylopolos 등, 2016; Schwartz & Martin, 2004).
이 패러다임은 (사회에서의 학습자의 광범위한 상호작용보다는) 학습자와 정규 교육을 강조한다.
The Constructivism-Expertise marks an ontological and epistemological shift about the nature of knowledge. Knowledge isn’t something external to learners, which they acquire; knowledge is something learners actively “construct” as they make meaning of their experiences (Piaget,1953). Within this paradigm,
the focus is on understanding mental representations to support learners in constructing new knowledge.
Knowledge is seen as dynamic, with new knowledge being constructed by learners upon prior knowledge, in order to solve novel problems (Dewey, 1938).
The goal of education in this paradigm remains creating experts, and adaptive expertise exemplifies the dynamic nature of knowledge required to enact expert practice (Mylopoulos & Regehr, 2011; Mylopoulos et al., 2018).
Learners engage in activities designed to promote discovery of knowledge and the teacher’s role is to provide appropriate resources and support for each stage of cognitive development.
A constructivist curriculum focuses less on specific content, and more on the process of knowledge construction. Learners’ previous knowledge is a key consideration in effective teaching and curricular planning.
Assessment focuses on application or transfer of knowledge to novel contexts and preparation for future learning (Mylopoulos et al., 2016; Schwartz & Martin, 2004).
This paradigm emphasizes the learner and formal education, as opposed to learners’ broader interactions in society.
구성주의-대화 Constructivism-Interlocution
[구성주의-대화]로의 전환은 [교육의 사회적 초점]의 시작을 뜻한다. [구성주의-대화]는 지식이 만들어지는 것은 지식이 형성되는 사회적 환경과 분리할 수 없다고 가정한다.
[구성주의-전문가]가 정신적 표현을 이해하는 데 초점을 맞추는 반면
[구성주의-대화]는 사회문화적 영향과 상호작용을 통해 지식이 구성되는 방식에 초점을 맞추고 있다(Vygotsky, 1980).
The turn toward Constructivism-Interlocution begins the social focus of education. Constructivism-Interlocution posits that the creation of knowledge cannot be separated from the social environment in which it is formed.
Whereas constructivsm-expertise focuses on understanding mental representations,
constructivsm-interlocution is focused on the ways in which knowledge is constructed through sociocultural influences and interaction (Vygotsky, 1980).
학습은 [정체성 형성]과 [지식의 공동 창조]로 이해된다. 이는 [사회적 맥락에 대한 참여 및 문화화enculturation]로부터 발생한다고 여겨진다. 즉, 새로운 사회 집단의 전문용어, 행동 및 규범을 선택하고, 그 신념 체계를 채택하여, 문화의 구성원이 되는 것이다.실제로, 교육의 기능은 학습자를 공동체의 적극적 참여자로 만들기 위한 수단으로 여겨진다. 학습자는 능동적인 참여자이고 교사의 역할은 사회적 상호작용과 협력적인 작업을 촉진하는 것이다. [구성주의-대화] 패러다임은 직장 기반 학습과 평가를 설명하며, 실천 공동체 같은 학습에 대한 보다 비공식적인 접근을 제시한다(Lave, 2004; Wenger, 1998).
Learning is understood as identity formation and the co-creation of knowledge. This is thought to happen through participation in social contexts and enculturation—picking up the jargon, behaviour, and norms of a new social group, and adopting its belief systems to become a member of the culture (Brown et al.,1989). Indeed, the function of education is seen as a means to socialize learners to be active participants in communities. Learners are active participants and the role of the teacher is to facilitate social interactions and collaborative work. The constructivism-interlocution paradigm accounts for workplace-based learning and assessment, and brings forward more informal approaches to learning like communities of practice (Lave,2004; Wenger,1998).
그러나 [구성주의-대화]까지는교육 목표는여전히[공식 기관 내에서확립된 체계적 기대에 따라 구성 및 구조화]된다.다음의 패러다임(인본주의적 자기실현화 및 변형적 변화 주체)에서, 자신을 위한 학습은 특정 권한에 대한 학습과는 반대로 더 많은 초점을 필요로 하며,시스템과 구조 자체가 도전받는다.
However, eductional goals are still constructed and structured within formal institutions according to established systemic expectations. In the following paradigms (humanist-self-acualization and transformative-change agency), learning for oneself takes more of a focus as opposed to learning for a particular mandate, and systems and structures themselves are challenged.
인문주의-자기실현주의 Humanism-self-actualization
[휴머니즘-자기실현 패러다임]은 학습자가 [자신의 완전한 잠재력과 자율성의 실현(자아실현)]을 향해 나아갈 수 있도록 준비시키는 것을 목표로 한다. (매슬로, 1943년) 이 패러다임은 인지 영역과 정서 영역을 포함하여 학습자 전체를 참여시키는 데 초점을 맞추고 있습니다.
교육의 목표는 학습자를 [한 명의 사람]으로 고려하며, 정서적, 신체적 행복과 관련된 학습에 참여합니다.
이러한 목표를 달성하기 위해, 학교는 학습자 중심이고 배움은 개인의 목표의 성취로 여겨진다.
교사들이 학습 과정을 촉진하고 nurturing하는 것이고, 교육에 대한 학습자의 선택과 통제가 강조되고 있다.
교육과정의 기능은 각 개별 학습자에게 [개인적으로 만족스러운 경험을 제공하는 것]이다.
이러한 맥락에서, 자기 평가는 이 패러다임 내에서 유일한 의미 있는 평가이다.
외부 등급은 irrelevant한 것으로 간주되고, 학생들이 개인적인 만족을 위해서가 아니라 점수를 위해 공부하게끔 만드는 것이다.
The humanism-self-actualization paradigm aims to prepare learners to progress towards the realization or fulfillment of one's full potential and autonomy (self-actualization) (Maslow,1943). This paradigm is focused on engaging the learner as a whole, including both cognitive and affective domains.
The goals of education take into consideration the learner as a person, attending to learning in relation to emotional and physical wellbeing.
To achieve these goals, schooling is learner-driven and learning is viewed as the achievement of one’s personal goals.
Learners’ choice and control over education are emphasized, with teachers facilitating and nurturing the learning process.
This paradigm views the function of the curriculum as providing personally satisfying experiences for each individual learner.
As such, self-evaluation is the only meaningful assessment within this paradigm—
external grading is viewed as irrelevant and is thought to encourage students to work for a grade and not for personal satisfaction.
[휴머니스트-자기실현] 패러다임은 개인에 너무 초점을 맞추고 있다는 비판을 받는다. 이것이 특히 문제가 되는 것은, 근거에 따르면 일반적으로 사람들은 자기 평가를 정확하게 할 수 없기 때문이다. 즉, 자기실현과 관련하여 자기평가를 하는 경우에, 자기평가 목표는 지식 이득의 수준과 정확성을 결정하는 것이 아닐 수 있다. 오히려, 자기평가는 개인이 미리 [정해진 목표를 향한 자신의 여정에 만족감을 느끼는지]를 결정하기 위한 것일 수도 있다. 이러한 자기 평가 대상의 변화는 우리가 자기 평가에 서툴다는 주장을 복잡하게 만든다. 개인적인 의미와 동기는 학습에서 너무 자주 간과되고 있으며, 휴머니스트 패러다임은 교육에 대한 참여를 촉진하는 데 중요한 시각을 제공할 수 있다. 이러한 패러다임적 포인트를 감안할 때, 목표와 목표를 향한 여정을 기록하기 위해 의학 교육에 흔히 사용되는 [성찰적 포트폴리오]가 교육의 인문주의-자기실현 패러다임 내에 가장 적합할 것이다.
The humanist-self-actualization paradigm arguably focuses too much on the individual, a critique that is compounded by evidence that generally, individuals are not able to accurately self-assess (Eva & Regehr,2008).That said, when channeling self-assessment in relation to self-actualization, the goal of self-assessment may not be to determine the level and accuracy of knowledge gains. Rather, it may be to determine whether an individual feels satisfied with their journey toward their own pre-determined goals. This shift in object of self-asessment complicates the mantra that we are poor at self-assessment. Indeed personal meaning and motivation are overlooked aspects of learning and humanist paradigms may offer an important angle into promoting engagement in education (Kusurkar & Croiset,2015). Given these paradigmatic points, the reflective portfolios so commonly used in medical education to document goals and journeys toward them would likely best be situated within the humanism-self-actualization paradigm of education (Driessen et al.,2007).
변혁-변화주체 Transformation-change agency
마지막으로, [변혁-변화주체] 패러다임의 목적은 [학습자가 지속적으로 더 윤리적 관점을 통해 사회 세계를 볼 수 있도록 권한을 부여하는 것]이며, 그 결과로 학습자는 [보다 정의로운 사회를 향한 변화의 주체]로서 [현재 상태에 도전하고, 현재 상태를 변화시킬 것]이다(Freire, 1993; Hooks, 1994).
이 패러다임은 지식을 [사회적 구성social construction]이라고 본다.
학습은 [비판적 성찰이라는 존재의 방식으로 관점을 전환하는 것]이다. 이는 윤리, 정의, 권력을 경계하며, 개인과 사회적 가정과 관행에 지속적으로 도전challenge하는 것을 의미한다.
반대로, [기존의 전통적인 교육 접근법]은 현상을 강화시켜 사회의 불평등을 지속시키고 학습자 스스로에 대한 억압에 기여하는 것으로 본다.
[변혁-변화 주체] 패러다임에서는, 학습자-교사 구분이 최소화된다.
[사회 개혁과 사회의 미래에 대한 책임감]은 [지배적인 권력 관계와 구조에 대한 학습자 자신의 인식을 높이는 것]에서부터 출발한다.
평가는 [관점의 변화]에 초점을 맞춘다. 디브리핑과 대화에서의 대화의 초점이나 내용 또는 시스템 수준 시나리오에 대한 대응 등
Finally, the aim of the transformation-change agency paradigm is to empower learners to see the social world through a continually more ethical lens, so that they will challenge and change the status quo as agents of change toward a more just society (Freire,1993; Hooks,1994).
This paradigm views knowledge as a social construction.
Learning is viewed as a shift in perspective toward a critically reflective way of being, which continually challenges individual and societal assumptions and practices, with attention to ethics, justice, and power.
Traditional approaches to education are seen to reinforce the status quo, perpetuating inequalities in society and contributing to the oppression of learners themselves (Freire, 1993; Hooks, 1994).
Within the transformation-change agency paradigm, the learner-teacher distinction is minimized.
Social reform and responsibility to the future of society are central, beginning by raising the learners’ own awareness of dominant power relations and structures.
Assessment focuses on shifts in perspective—conversation foci/content during debriefs and dialogue or responses to systems level scenarios.
[변혁-변화 주체] 패러다임은 필수적인 지식과 기술을 얼버무리고 넘어간다는 비판에 직면했다. 게다가, 혁신적이 되는 것은 본질적으로 [반문화적인 것counter-culture]이다. 그러므로 [변혁적 교육]은 [주체(성)agency]를 전제하고 있는데, 일부 학습자들이 이것이 없을 수도 있다. 동시에, [변혁-변화 주체] 패러다임의 장점은 그것이 [개인을 넘어서는 교육]을 목표로 한다는 것이다. 기존 교육적 접근법이 목표를 완전히 달성하지 못한 경우, 변혁적 접근법은 앞으로 나아갈 길을 제공할 수 있다.
예를 들어, IPE만으로는 IPP(interprofessional practice)의 위계적, 직장 기반 측면을 다룰 수 없다는 것을 알게 되었다(Baker 등 2011; Paradis & Whitehead, 2015).
변혁적-비판적 교육 노력을 통해서 [지식 업무의 사회적 위치성]과 [어떻게 시스템이 다양한 전문직 간 경쟁을 유발하는지]을 이해하는 데 도움이 될 수 있다.
이러한 이해는 도움이 되지 않는 위계를 파괴하고 진정한 협업으로 나아가려는 노력을 뒷받침할 수 있습니다. 대화식 교육은 [안전하고 생산적인 방식으로 권력 관계를 다루기 위한 하나의 혁신적인 교육 접근방식]을 나타낸다(Bakhtin, 1981; Kumagai & Naidu, 2015).
The transformative-change agency paradigm has faced critique for glossing over requisite knowledge and skill. Additionally, to be transformative is inherently counter-culture; thus transformative education presumes agency that some learners may genuinely lack. At the same time, the advantage of the transformative-change agency paradigm is that it targets education beyond the individual. In instances where existing educational approaches have not fully realized their goals, transformative approaches may offer a way forward.
For example, we have seen that interprofessional education alone cannot address some of the hierarchical, workplace-based aspects of interprofessional practice (Baker et al. 2011; Paradis & Whitehead, 2015).
Transformative and critical education efforts may be warranted to help different professionals understand the socially-situated nature of knowledge work and how systems can drive competition between professions.
This understanding can then underpin efforts to disrupt unhelpful hierarchies and move toward genuine collaboration. Dialogic education represents one transformative education approach to addressing power relations in a safe and productive manner (Bakhtin,1981; Kumagai & Naidu,2015).
이러한 간단한 통합은 여러 분야의 교육적 접근 방식을 적용하기 위한 [필수 지식]이라고 주장하는 것에 대한 소개로 작용한다. 패러다임의 불일치 또는 불일치는 분산적이고 물질적인 결과를 초래할 수 있습니다. 우리는 HPE에서 흔히 볼 수 있는 이러한 정렬 불일치의 세 가지 예를 제공합니다.
These brief syntheses serve as introductions to what we argue is prerequisite knowledge for applying educational approaches from multiple disciplines. Paradigmatic misalignment or incongruence can have discursive and material consequences; we offer three such examples of misalignment common in HPE.
성찰의 많은 비판들을 고려하라. 일부에서는 이것이 학습을 위한 의미 있는 접근 방식 대신 감시를 위한 메커니즘이 되었으며, 따라서 [진실되지 않고 부담스러운 보여주기]라고 주장한다(Hodges, 2015; Nelson & Purkis, 2004). 다른 사람들은 학습과 평가에 대한 지배적인 사고방식에 따른 성찰을 평가하라는 압력이 처음에는 전문 실무에 대한 지배적이고 기술적인 접근법의 균형을 맞추려는 시도였던 교육 개념의 이러한 도구적 사용에 책임이 있다고 주장하기 위해 이 주장을 확장했다(Ng 외, 201).5. 이 예는 [인본주의-자기실현] 또는 [변혁-변화주체] 패러다임에서 파생된 교육적 접근법이, 이러한 패러다임과 일치하지 않는 관행에 의해 지배되는 상황에서, [패러다임에 대한 인식 없이 적용될 때 발생하는 의도하지 않은 부정적인 결과]를 보여준다(예: 루브릭 기반 평가).
Consider the many critiques of reflection. Some have argued it has become a mechanism for surveillance and thus an inauthentic, burdensome demonstration, instead of a meaningful approach for learning (Hodges,2015; Nelson & Purkis, 2004). Others have expanded on this argument to suggest that the pressure to assess reflection according to dominant ways of thinking about learning and assessment are to blame for these instrumental uses of an educational concept that was initially an attempt to balance the dominant, technical-rational approaches to professional practice (Ng et al., 2015). This example demonstrates unintended negative consequences when an educational approach, deriving from a humanism-self actualization or transformation-change agency paradigm, is applied without paradigmatic awareness in contexts that are dominated by practices incongruent with these paradigms (e.g. rubric-based assessment).
시뮬레이션 기반 교육과 관련하여 학습자의 인식론적 신념을 조사한 최근 연구에서, Ng 외 연구진(2019)은 [학습을 위한 안전한 공간]이라는 시뮬레이션에 대한 널리 알려진 믿음과, [항상 확실성과 확신을 가지고 수행해야 한다는 학습자의 감각] 사이의 불일치를 확인했다. 이 예는 인식론적 문화나 풍토가 패러다임을 실천과 일치시키는 능력에도 영향을 미친다는 것을 보여준다.
In a recent study examining learners’ epistemological beliefs in relation to simulation-based education, Ng et al. (2019) identified incongruence between the widely held beliefs about simulation as a safe space for learning and learners’ sense that they needed to perform with certainty and confidence at all times. This example shows that the epistemological culture or climate also impact the ability to align paradigms with practices.
마지막으로 사회과학 및 인문학적 접근 방식을 HPE에 적용하려는 시도를 고려하십시오. 의료인문학의 실질적인 목적이 아니라, [그저 충분한 "양dose"의 인문학적 교육과정]을 추가하는 데 초점을 맞추면, 의미 있는 적용을 제한할 뿐만 아니라, 이득은 없이 커리큘럼을 그저 "과밀overstuff"하게 만들 것이다. 겸손, 권력, 학습자 안전에 주의를 기울이지 않으면서, 그저 "Dose"에만 초점을 맞추는 것]은 실제로 보건의료전문직에서 인문학 교육에 도움이 되지 않을 수 있다. 이러한 강령의 목표를 완전히 실현하기 위해서는 [휴머니즘-자기실현] 또는 [변혁-변화 주체] 패러다임이 필요할 수 있다. 패러다임에 주의를 기울이면 콘텐츠의 잠재적 이점이 손실되는 동안 다른 콘텐츠 영역을 추가하는 것을 방지할 수 있습니다.
And finally, consider the attempts to apply social sciences and humanities approaches to HPE. A focus upon adding a sufficient “dose” of humanities content into curricula rather than the actual purposes of health humanities can limit meaningful application (Bishop, 2008; Tsevat et al., 2015) as well as “overstuff” the curriculum without commensurate benefit (Whitehead & Kuper, 2012). Focusing on dose while failing to attend to humility, power, and learner safety can actually make the teaching of humanities unhelpful within health professions programs. A humanism-self-actualization or transformation-change agency paradigm may be required to fully realize the goals of these intiatives. Attention to paradigms can prevent simply adding another content area while potential benefits of the content are lost.
패러다임의 인식과 조정을 위해 Toward paradigmatic awareness and alignment
패러다임이 실제에서 어떻게 다르게 보이는지에 대한 인식을 촉진하고 패러다임적 가치와 가정을 가진 교육, 학습 및 평가 관행 간의 정렬의 중요성을 설명하기 위해 두 가지 사례를 제시한다. 우리는 두 가지 다른 교육 패러다임에 의해 알려졌을 때, [보건 직업의 윤리 교육]이 어떻게 보일 수 있는지 살펴볼 것이다(표 1 참조).
To foster awareness of how different paradigms look in practice and to illustrate the importance of alignment between the teaching, learning and assessment practices with paradigmatic values and assumptions, we present two case examples. We will walk through what an instance of ethics education in the health professions might look like, when informed by two different education paradigms (see Table1).
사례들은 동일한 목표, 즉 실무자들이 윤리적으로 실천할 수 있도록 준비하는 것이 패러다임에 따라 다른 출발 틀, 즉 윤리적 의사결정을 지원하는 추론 교육 대 윤리적 실천의 기초와 지지를 받는 도덕적인 지향의 틀을 취한다는 것을 보여준다. 이러한 프레임은 교수와 평가가 어떻게 펼쳐지는지 뿐만 아니라 정확히 교수와 평가의 일부로 간주되는 것을 위한 발판을 마련합니다.
The cases illustrate that the same goal—preparing practitioners to be able to practice ethically—takes a different starting frame depending on paradigm: teaching reasoning that supports ethical decision-making versus inspiring a virtuous orientation that underlies and supports ethical practice. These frames set the stage for how teaching and assessment unfold, as well as for what exactly is considered a part of teaching and assessment.
[인지주의-전문가] 사례에서는 시험을 더 강조하며, [변혁-변화 주체] 사례에서 톤 설정에 더 중점을 둡니다. 그렇다고 인식주의 전문 교육자가 논조를 정하지 않거나 변화 기관 교육자가 배움을 평가하지 않는 것은 아니다. 그러나 어떤 패러다임에서 강하게 영향을 받았는지에 따라, 결과와 우선 순위를 매기는 방법이 다르게 보인다.
Notice the greater emphasis on testing in the cognitivism-expertise example and the greater emphasis on tone-setting for the transformation-change agency example.This is not to say a cognitivism-expertise educator would not set the tone or a transformation-change agency educator would not assess learning; however, outcomes and how they are prioritized look different for those more strongly influenced by one paradigm over another.
이러한 영향을 인지하는 것이 중요한 이유는, 이것이 결여되었을 때 비생산적인 패러다임의 불일치를 초래할 수 있기 때문이다. 예를 들어, 강사가 학습자에게 연습으로 인한 윤리적 긴장에 대한 개인적인 이야기를 공유하도록 요청한 후 인지적 테스트 접근 방식을 사용했을 경우 발생할 수 있는 부조화를 상상해 보십시오! 우리의 두 사례 사례는 정렬alignment에 집중된 관심이 교육 설계에서 교육 결과까지의 연결을 강화하는 데 얼마나 도움이 되는지 보여준다.
Awareness of these influences matters because a lack thereof could result in uninformed and unproductive paradigmatic misalignment. For example, imagine the incongruence that would result if an instructor used cognitivist testing approaches after asking learners to share personal stories of ethical tensions from practice! Our two case examples demonstrate how focused attention on alignment can help strengthen the connection from educational design to educational outcomes.
교실 맥락을 넘어서, 더 넓은 제도적 수준에서, 패러다임들 사이의 긴장은 [고등교육의 목적]이 역사적으로 어떻게 이해되어 왔는지를 볼 때 명백해진다. 예를 들어,
20세기까지 대학에 다닌 사람은 거의 없었다. 재정적인 미래가 보장된 학생들만이 "언젠가 그들이 형성될 사회에 시민 참여의 미덕에 대한 이해를 강화하기 위해" 교양 교육을 받으려고 했다. (Raelin, 2007, 페이지 58)
20세기 중반이 되어서야 고등교육이 전문교육과 관련되게 되었다. 이 연관성은 중요한 변화였다. 더 이상 엘리트를 위한 시민 참여에 국한되지 않았고, 컬리지와 대학들은 고용 가능한 졸업생들을 만드는 사업에 뛰어들었다.
학생들을 유치하기 위한 경쟁이 치열해짐에 따라, 이 대학들은 문과대학으로서의 성공을 활기차게 하는 전략을 계속 시행함으로써 그들의 명성과 지위를 확립하려고 노력했다.
이러한 전략들은 명문 학자들을 고용하고, 연구에 대한 강한 강조를 장려하고, 학문 지식을 개발하는 것을 포함했다. 이러한 전략은 (문과대학과 대학의 경우 성공적이기는 했지만) 실제 실무 세계와는 너무 동떨어져 교육 기관과 교육 기관의 가능한 기여도를 평가절하하는 역설적인 효과를 가져왔다.
Beyond the classroom context, at the broader institutional level, the tensions between paradigms become apparent when looking at how the purpose of higher education has been historically understood. For example,
up until the twentieth century, few people attended college. With their financial futures secure, students sought to receive a liberal arts education in order to “refine their comprehension of the virtues of civic participation in a society that they would one day come to shape” (Raelin, 2007, p. 58).
It was not until the middle of the twentieth century that higher education became associated with professional education. This association was a significant shift. No longer just about civic participation for the elite, colleges and universities were in the business of creating employable graduates.
In the presence of increased competition for attracting students, these colleges and universities attempted to establish their reputation and standing by continuing to implement strategies that had animated their success as liberal arts colleges.
These strategies included hiring prestigious academics, encouraging a strong emphasis on research, and developing disciplinary knowledge. These strategies—while successful for liberal arts colleges and universities—became too far removed from the real world of practice and had the paradoxical effect of devaluing the educational institutions and their possible contribution.
고등교육의 목적에 대한 이러한 역사적 긴장감은 [왜 제도적 차원에서 패러다임의식이 중요한지]를 보여준다. (상호 배타적인 이유는 아니지만)고등교육의 목적이 [시민을 준비시키는 것]인지 또는 [고용 가능한 졸업생을 만드는 것]인지에 대한 신념 시스템이 고등교육 기관을 형성합니다. Raelin(2007)은 [교양 교육]에서 [(기술과 역량에 대한 강조가 수반된) 전문 교육]으로의 꾸준한 전환은 북미 고등교육에서 가장 인정받지 못하는 경향 중 하나였다고 제안한다. 제도적, 사회적 수준에서 이러한 추세에 주목하면서 일부 사회학자들은 의문을 품게 되었다:
만약 우리의 교육 시스템이 계속해서 교양과목에서 멀어진다면, 우리 사회는 우리가 창조하고 있는 기술적 진보와 함께 살아가는 데 필요한 사회적, 정치적 읽고 쓸 수 있는 능력을 갖게 될까?
This historical tension about the purpose of higher education demonstrates why paradigmatic awareness matters at the institutional level. Belief systems about whether the purpose of higher education is about preparing citizens or creating employable graduates—while not mutually exclusive rationales—do shape higher education institutions. Raelin (2007) proposes the steady shift away from liberal arts towards professional education, with its associated emphasis on skills and competencies, has been one of the most underrecognized trends in higher education in North America. Attending to these trends on an institutional and societal level has led some concerned sociologists to question:
if our education systems continue to tilt away from the liberal arts, will our societies have the social and political literacy that we need to live with the technological advances we are creating (Benjamin, 2013)?
우리는 질문을 추가하고자 한다:
점점 더 세계적인 보건 직업 교육 환경에서 확인되지 않은 패러다임적 가정이 의미하는 바는 무엇인가? (Martimianakis & Hafferty, 2013)
교육에 대한 사회 문화 및 사회 정치적 영향을 고려할 때, 교육의 패러다임이 국제적 협력과 지식 동원 노력에 어떻게 영향을 미칠 수 있을까?
[교육의 일상적인 관행에 나타나는 패러다임들 사이의 긴장]은 또한 [교육 제도의 형성]에도 분명히 나타나므로, 모든 교육자들은 이러한 (비)정렬에 대해 신중히 인식해야 한다.
We add to this question:
what are the implications of unchecked paradigmatic assumptions in an increasingly global health professions education context? (Martimianakis & Hafferty, 2013).
Given the socio-cultural and socio-political influences on education, how might unearthing paradigms of education impact international collaborations and knowledge mobilization efforts?
All this to say, the tensions between paradigms that show up in the everyday practices of education also manifest in shaping the institutions of education and thus awareness of (mis)alignment is prudent for all educators.
다원적 접근으로 Toward a pluralistic approach
패러다임의 합성이 보여주듯이, [많은 다양한 이해관계]가 교육을 가이드하며, HPE 이니셔티브는 [복잡한 맥락]에서 작동된다. 이러한 복잡한 맥락은 학술 병원, 지역사회 환경 및 대규모 고등 교육 기관(대학 및 대학)에 내장되어 있다. 이러한 복잡성은 학습자에게 [상충하는 요구]로 인식되어졌고, 교육 이니셔티브 자체의 영향에 영향을 미칠 수 있다. 심지어 최상의 교육 계획조차 "무효화 작전countervailing force"에 취약하다(롤랜드 외 2019). As our synthesis of paradigms demonstrates, many different interests guide education, and HPE initiatives operate in complex contexts, embedded within academic hospitals, community settings, and large higher education organizations (universities and colleges). This complexity has led to a sense of competing demands on learners, and potentially influenced the effects of the education initiatives themselves: even the best laid education plans are subject to “countervailing forces” upon them (Rowland et al.2019).
실제로, 우리는 패러다임의 순수성을 주장하는 것이 아니다. 대신교육 접근방식에 있어[패러다임의 인식, 정렬, (필요시의) 합목적적 불일치]로 특징지어지는 [패러다임적 다원주의]를요구한다. 이 접근법의 기초는 교육 목표와 폭력이 이해관계자 간에 다를 수 있다는 이해이다. 따라서 이전의 효과적인 접근법과 이론을 버리지 않고 새로운 관심 결과를 주목하고 평가해야 한다. 그리고 교육의 패러다임에 대한 이해와 관심은 다원주의의 전제조건입니다. 우리가 제안하듯이, 깊이 이해하지 못하는 것을 최적으로 혼합할 수 없습니다.
Indeed we are not arguing for paradigmatic purity. Instead we are calling for aparadigmatic pluralism,i.e. an approach to education characterized by paradigmatic awareness, alignment and—when appropriate, purposeful misalignment. Foundational to this approach is the understanding that educational goals and foci may differ between stakeholders, expand, or change; and thus new outcomes of interest must be attended to and assessed, without discarding prior effective approaches and theories. And understanding of and attention to paradigms of education is a prerequisite to pluralism, as we would suggest one cannot optimally mix what one does not deeply understand.
다원주의는 패러다임의 고려가 [교육과정의 모든 수준과 교육의 전체 범위에 걸쳐 일어나야 한다]는 점에서 훨씬 더 중요하다. 커리큘럼은 [프로그램], [과정], [세션] 수준에서 운영된다(Goldman & Schroth, 2012).
보건 직업 훈련 [프로그램]은 주로 한 두 가지 교육 패러다임 내에서 운영될 수 있지만,
[과정]이나 [세션] 수준에서는 또 다른 패러다임들이 허우적거리거나 번성할 수도 있다.
Pluralism is even more important given the consideration of paradigms needs to happen at all levels of the curriculum and across the full spectrum of education. Curricula operate at the level of program, course and session (Goldman & Schroth,2012).
And while a health professions training program may operate primarily within one or two paradigms of education,
other paradigms may be present at the course or session level where they may flounder or flourish.
우리가 제안하는 것은 [패러다임, 내부 정렬, 의미 있는 혼합에 대한 고려]이지만, 우리는 또한 [여러 교육 패러다임에서 다양한 관행을 의도적으로 적용하는 것이 어렵다는 것]을 인정한다. 다중 패러다임을 고려하려면 증거 기반 및 이론에 근거한 교육의 개념에 주의를 기울여야 한다(펜윅, 2016; 그린할 등, 2003; 트리샤 그린할, 2010; 호슬리 & 레게어, 2018; 반 데르 블뢰텐 외, 2000). 서로 다른 인식론적 전통에서 파생되거나 생성된 데이터와 이론에서 도출할 때, 무엇이 "최고"이고, 무엇이 높은 품질이며, 무엇이 유효한지에 대한 여러 정의가 존재한다.
[인지주의자와 구성주의자의 접근법]이 HPE가 가장 잘 받아들여질 수 있는데, 생물의학과 심리사회적 접근법]이 의학을 지배하기 때문이다. 이러한 접근법은 [인식론이 서로 비슷]하기 때문에 서로 잘 맞는다. 모두 과학적 방법과 이 방법이 만들어낼 수 있는 지식의 개념에 대해 지배적으로 합의된 것을 이용한다.
[인문주의적 접근법]은, 인식론적으로 볼 때 훨씬 더 개인적인 것에 관심을 둔다는 차이가 있다. 따라서, 일반적인 증거 기반 접근법에 따라 입증하기가 더 어렵다.
[변혁적 접근법]은 본질적으로 지배적인 접근법에 도전한다. 즉, 과학적 주장의 측면보다는 이러한 주장의 사회정치적 효과 측면에서, 이러한 특정 윤리 체계 또는 전문성 또는 장애/질병으로부터 누가 이익을 얻는가? 누가 그것 때문에 피해를 입었는가?
While consideration of paradigms, their internal alignment, and their meaningful mixing are what we propose, we also acknowledge that purposefully applying a range of practices from multiple paradigms of education will not come without challenges. The consideration of multiple paradigms also requires attention to the notion of evidence-based and theory-informed education (Fenwick,2016; Greenhalgh et al.,2003; Trisha Greenhalgh,2010; Horsley & Regehr,2018; Regehr,2010; Van Der Vleuten et al.,2000). When drawing from data and theories derived or generated from different epistemological traditions, multiple definitions exist for what is “best,” what is high quality, what is valid.
Biomedical and psychosocial approaches dominate medicine; cognitivist- and constructivist approaches are thus most amenable to HPE. These approaches fit well together because they have similar epistemologies. All draw upon a dominantly agreed upon scientific method and the conceptions of knowledge this method can produce.
Humanistic approaches differ, epistemologically, in that their concern is far more personal and thus outcomes are more challenging to demonstrate according to prevailing evidence-based approaches.
Transformative approaches inherently challenge dominant approaches—not in terms of their scientific claims, but in terms of the sociopolitical effects of these claims, by asking questions like who benefits from this particular framing of ethics, or professionalism, or disability/disease? Who is harmed by it?
실제로 교사 및 학습자를 지식 창조 또는 발견에서 파트너로 더 많이 위치시키는 교육의 패러다임 또한 전통적인 계층 구조에 도전한다. 교육자로서 [변혁적이 된다는 것]은 [현상에 도전하는 것]이다. 그렇다고 해서, 우리는 기존의 보건 직업 교육 시스템을 완전히 전복시켜야 한다고 제안하지는 않는다. 우리는 각각의 패러다임이 보건 직업 교육의 특정한 측면에 장점이 있다고 믿는다. 예를 들어, [행동주의-시민권 패러다임]은 가장 오래된 패러다임이지만, 감염관리 교육에서는 유용한 실천요강을 제공할 수 있다. 그러나 그것을 다른 패러다임과 연결시키는 것이 더 도움이 될 수 있기 때문에 다원주의에 대한 우리의 주장은 더 도움이 될 수 있다. Indeed paradigms of education that position the teacher and learner more as partners in knowledge creation or discovery thus also challenge traditional hierarchies. To be transformative as an educator is to challenge the status quo. That said, we do not propose that one must completely overthrow established health professions education systems. We believe that each paradigm has merits for certain aspects of health professions education. For example, when teaching infection control, a behaviourism-citizenship paradigm, though the most dated of all the paradigms, may offer useful practices.
결론 Conclusion
교육에 대한 다원주의적 접근법을 실천하려면 [교육자들이 교육의 여러 패러다임에 대해 잘 알아야 하며, 패러다임 조정에 능숙]해야 한다. 교육자들이 서로 다른 패러다임이 어떻게 작용하고 서로 상충되는지를 주의 깊게 고려할 수 있어야 적절하게 평가되는 명확하고 정렬된 교육 관행을 보장할 수 있을 것이다. 이러한 조정은 특히 광범위한 교육 개혁 노력이 있는 시기에 중요하다. 보건 직업 훈련 프로그램에서 [성과 중심 결과 측정]이 Academic 건강 과학 시스템을 지배하기 때문이다. 교육자가 인식이 부족하고 조정에 실패하면 차선의 교육을 촉진할 뿐만 아니라 교육 노력을 적절히 평가하거나 교육 노력이 존재하는 곳에 의미 있는 영향을 입증하지 못할 수 있다. 이와 함께, 필연적인 다원적 교육의 패러다임이 잘 맞물려 보건직업 교육의 질을 높일 수 있습니다. 정보에 입각한 다원주의는 보건 분야의 교육에 대한 독단적이거나 사려 깊지 않은 접근법에 빠지는 것을 막아줄 것이다.
A pluralistic approach to education would see educators knowledgeable about multiple paradigms of education, and adept at paradigmatic alignment. Educators would be able to carefully consider how the different paradigms work together and where they conflict, so they can help ensure clear, aligned educational practices that are evaluated appropriately. This alignment matters particularly during a time of widespread curricular reform efforts within health professions training programs, wherein performance-driven outcome measurement rules academic health science systems. If educators lack awareness and fail to align, they may not only promote sub-optimal education, but may also be unable to appropriately evaluate educational efforts or demonstrate meaningful impacts where they exist. With alignment, the inevitable pluralism of paradigms of education can be engaged well, increasing our ability to drive quality in health professions education. Informed pluralism could offer a hedge against slipping into dogmatic or unthoughtful approaches to education in the health professions.
Adv Health Sci Educ Theory Pract. 2021 Aug;26(3):1045-1058.
doi: 10.1007/s10459-021-10036-z.Epub 2021 Mar 19.
Re-envisioning paradigms of education: towards awareness, alignment, and pluralism
1Department of Psychiatry, Faculty of Medicine, University of Toronto, Toronto, Canada. lindsay.baker@unityhealth.to.
2Centre for Faculty Development, Faculty of Medicine, University of Toronto At St. Michael's Hospital, 30 Bond Street, Toronto, ON, M5B 2W8, Canada. lindsay.baker@unityhealth.to.
3School of Occupational Therapy, Faculty of Health, Dalhousie University, Halifax, Canada.
4Department of Family and Community Medicine, University of Toronto, Toronto, Canada.
5The Wilson Centre, Unviersity of Toronto At University Health Network, Toronto, Canada.
6Institute of Health Policy, Management and Evaluation, University of Toronto, Toronto, Canada.
7Department of Occupational Science and Occupational Therapy, Faculty of Medicine, Toronto, Canada.
8Centre for Faculty Development, Faculty of Medicine, University of Toronto At St. Michael's Hospital, 30 Bond Street, Toronto, ON, M5B 2W8, Canada.
9Department of Speech-Language Pathology, Faculty of Medicine, University of Toronto, Toronto, Canada.
In this article we introduce a synthesis of education "paradigms," adapted from a multi-disciplinary body of literature and tailored to health professions education (HPE). Each paradigm involves a particular perspective on the purpose of education, the nature of knowledge, what knowledge is valued and included in the curriculum, what it means to learn and how learning is assessed, and the roles of teachers and learners in the learning process. We aim to foster awareness of how these different paradigms look in practice and to illustrate the importance of alignment between teaching, learning and assessment practices with paradigmatic values and assumptions. Finally, we advocate for a pluralistic approach that purposefully and meaningfully integrates paradigms of education, enhancing our ability to drive quality in HPE.
인지 아키텍처와 교수 설계: 20년의 역사(Educational Psychology Review, 2019) Cognitive Architecture and Instructional Design: 20 Years Later John Sweller1 & Jeroen J. G. van Merriënboer2 & Fred Paas3,4
서론 Introduction
[인지 부하 이론]은 학습 과제에 의해 유도된 [정보 처리 부하]가 어떻게 학생들의 [새로운 정보 처리 능력]과 [장기 기억의 지식 구성]에 영향을 미칠 수 있는지를 설명하는 것을 목표로 한다. 그것의 기본적인 전제는 인간의 인지 처리가 (한 번에 제한된 수의 정보 요소만 처리할 수 있는 한정된) [작업 기억력에 의해 심하게 제한]된다는 것이다. 인지 부하는 인지 시스템에 불필요한 요구가 부과될 때 증가한다. 인지 부하가 너무 높아지면 학습과 전달을 방해한다. 그러한 요구에는 환경의 불필요한 방해뿐만 아니라 주제에 대해 학생들을 교육하기 위한 부적절한 교육 방법이 포함된다. 인지 부하는 본질적으로 복잡한 과목 정보를 강조하는 교육 방법과 같이 학습과 밀접한 과정에 의해 증가할 수 있다. 학습과 전달을 촉진하려면, 인지 부하를 잘 관리하는 것이 중요하다. 이는사용 가능한 인지 능력의 한계 내에서[학습과 무관한 인지 처리는 최소화]되고, [학습과 밀접한 인지 처리는 최적화]하는 것이다. (van Merrienboer et al. 2006). Cognitive load theory aims to explain how the information processing load induced by learning tasks can affect students’ ability to process new information and to construct knowledge in long-term memory. Its basic premise is that human cognitive processing is heavily constrained by our limited working memory which can only process a limited number of information elements at a time. Cognitive load is increased when unnecessary demands are imposed on the cognitive system. If cognitive load becomes too high, it hampers learning and transfer. Such demands include inadequate instructional methods to educate students about a subject as well as unnecessary distractions of the environment. Cognitive load may also be increased by processes that are germane to learning, such as instructional methods that emphasise subject information that is intrinsically complex. In order to promote learning and transfer, cognitive load is best managed in such a way that cognitive processing irrelevant to learning is minimised and cognitive processing germane to learning is optimised, always within the limits of available cognitive capacity (van Merriënboer et al.2006).
인지 부하 이론의 뿌리는 1982년으로 거슬러 올라갈 수 있지만,
이 이론에 대한 첫 번째 완전한 설명은 1988년 "문제 해결 중 인지 부하: 학습에 미치는 영향"이라는 기사에서 제시되었다. 이후 10년 동안 호주의 뉴사우스웨일스 대학과 네덜란드의 트벤터 대학에 위치한 소규모 연구진에 의해 많은 인지 부하 영향과 관련 교육 방법이 조사되었다.
이러한 긴밀한 협력은 1998년 Cognitive Architecture and Instructional Design(Sweller et al. 1998) 논문에 게재된 인지 부하 이론의 업데이트된 설명으로 이어졌다.
1998년 이후, 인지 부하 이론은 빠르게 교육 심리학 및 교육 설계 분야에서 가장 인기 있는 이론 중 하나가 되었고, 전 세계의 연구원들이 추가 개발에 기여했습니다.
1998년 기사는 현재 구글 스콜라에서 5000개 이상의 인용을 받아 교육 분야에서 가장 많이 인용된 기사 중 하나가 되었다.
The roots of cognitive load theory can be traced back to 1982 (Sweller and Levine1982), but a first full description of the theory was given in the 1988 articleCognitive Load During Problem Solving: Effects on Learning(Sweller1988). In the next decade, many cognitive load effects and associated instructional methods were investigated by a small group of researchers located at the University of New South Wales, Australia, and the University of Twente, the Netherlands. This close collaboration led to an updated description of cognitive load theory that was published in the 1998 articleCognitive Architecture and Instructional Design(Sweller et al.1998). After 1998, cognitive load theory quickly became one of the most popular theories in the field of educational psychology and instructional design, with researchers from across the globe contributing to its further development. The 1998 article became one of the most cited articles in the educational field with currently over 5000 citations in Google Scholar.
이 후속 기사의 주요 목적은 1998년 기사를 출발점으로 삼고 미래 방향에 대한 설명을 종점으로 삼으면서 지난 20년 동안의 인지 부하 이론의 진화를 되돌아보는 것이다. The main aim of this follow-up article is to reflect on the evolution of cognitive load theory over the past 20 years, taking the 1998 article as a starting point and a description of future directions as the end point.
인지부하 이론의 짧은 역사 Short History of Cognitive Load Theory
1998년 Cognitive Architecture and Instructional Design 논문는 인지 부하 이론의 개요와 그 일반 원리, 이론에 의해 생성된 7가지 인지 부하 효과의 설명과 인지 부하 측정과 관련된 이슈를 포함한 인간의 인지 구조에 대해 논의하였다. 아래에서는 1998년 기사에서 설명한 인간의 인지 구조와 원래의 인지 부하 영향을 간략히 재검토할 것이다. The 1998 articleCognitive Architecture and Instructional Designdiscussed human cognitive architecture including an outline of cognitive load theory and its general principles, a description of seven cognitive load effects generated by the theory and issues associated with measuring cognitive load. Below, we will briefly revisit the human cognitive architecture and the original cognitive load effects described in the 1998 article;
1998년에 사용된 인지구조 Human Cognitive Architecture Used in 1998
1998년에 사용된 인지 구조는 그 당시 인간의 인식에 대한 우리의 지식을 반영했다. 그 아키텍처의 기본 구성 요소들, 작업 기억, 장기 기억 그리고 그들 사이의 관계는 잘 알려져 있었다. 비록 작업 기억과 장기 기억 사이의 복잡하고 비판적인 관계가 적어도 일부 독자들에게는 새로운 것처럼 보였지만, 작업 기억이 [정보의 출처가 외부 환경인지 장기 메모리인지 여부]에 따라 다르게 기능한다는 것을 의심하는 독자들에게는 새로운 것이었다. 또한, 인지 아키텍처에서 파생된 지시적 의미는 대부분 알려지지 않았다. The cognitive architecture used in 1998 reflected our knowledge of human cognition at that time. The basic components of that architecture, working memory, long-term memory and the relations between them were well-known, although the intricate, critical relations between working and long-term memory seemed novel to at least some readers who doubted that working memory functioned differently depending on whether the source of the information was the external environment or long-term memory. In addition, the instructional implications derived from that cognitive architecture were largely unknown.
[작업 기억]의 용량과 지속 시간 한계는 밀러(1956년)와 피터슨 및 피터슨(1959년) 이후로 알려져 왔지만, 이러한 한계는 친숙한 정보가 아닌 [새로운 정보에만 효과적으로 적용]되었다는 사실은 대부분의 치료treatment에서 암시적으로 보였다. 새로운 정보를 다룰 때 작업 기억력의 한계는 대부분의 교육 권고사항에는 없었다. 이러한 권고안은, 특히 지시적 문제 해결의 사용과 관련하여, 마치 작업 기억의 특성이 무관한 고려사항인 것처럼 진행되었다. 실제로 대부분의 교육 권고사항에서는 작업 메모리에 대해 언급하지 않았습니다. The capacity and duration limits of working memory have been known at least since Miller (1956) and Peterson and Peterson (1959), although the fact that these limits effectively applied only to novel, not familiar information, seemed more implicit rather than explicit in most treatments. The limitations of working memory when dealing with novel information were absent in most instructional recommendations. These recommendations, especially with regard to the use of instructional problem solving, proceeded as though the characteristics of working memory were an irrelevant consideration. Indeed, most instructional recommendations made no mention of working memory.
물론, [장기 기억]도 잘 알려져 있었다. 그럼에도 불구하고, 그것은 아마도 암기 학습과 관련이 있을 수 있기 때문에 교육 권고사항에서 거의 역할을 하지 않았다. 암기적 학습은 분명히 장기 기억에 정보를 저장해야 하는 반면, 장기 기억이 이해력을 가진 학습에 최소한의 역할을 하거나 전혀 역할을 하지 않는다는 가정이 있는 것처럼 보였다. 우리가 [학습할 때 장기 기억이 (이해와 일반적인 기술 형성을 통해) 중심적 역할을 한다고 강조한 것]은 인지 부하 이론의 특이한 측면이었다. 그 강조점은 1946년에 [체스 전문지식]에 대한 원래 연구가 출판된 드 그루트의 비평적인 작품에서 비롯되었다. 체스 기술은 기억되는 체스 보드 구성으로 완전히 설명될 수 있다는 그의 발견과 각각의 구성에 대한 최고의 움직임은 문제 해결 기술의 핵심 요소로 장기 기억을 지울 수 없는 것으로 배치했다. 지금까지 이 자리에 거의 없었다. 그러나 여전히, 이 연구결과가 교육설계에 가지칠 수 있음에도 불구하고, 교육적 권고사항이 장기기억의 역할에 중점을 둔 경우는 거의 없다. Long-term memory was, of course, equally well-known in the literature. Nevertheless, it played almost no role in instructional recommendations perhaps because it may have been associated with rote learning. While rote learning obviously required the storage of information in long-term memory, there seemed to be an assumption that long-term memory played a minimal or no role in learning with understanding. Our emphasis on the central role of long-term memory when learning with understanding and in general skill formation was an unusual aspect of cognitive load theory. That emphasis derived from the critical work of De Groot (1965) whose original work on chess expertise was published in 1946. His finding that chess skill could be entirely explained by remembered chessboard configurations and the best moves for each configuration placed long-term memory indelibly as the central factor in problem-solving skill. This presence had heretofore been largely absent. Again, despite the ramifications of this finding for instructional design, few if any instructional recommendations placed any emphasis on the role of long-term memory.
[작업 기억]과 [장기 기억] 각각에 대해서는 잘 알려져 있지만, 그들 사이의 중요한 관계는 훨씬 덜 강조되었다. 작업기억은 새로운 정보를 다룰 때 용량과 지속시간이 제한되었지만 작업기억이 장기 기억에서 전송된 정보를 다룰 때 이러한 제한은 사실상 사라졌다. 장기 기억에서 많은 양의 조직화된 정보를 즉시 사용할 수 있게 되면 그러한 정보를 처리할 때 효과적으로 작업 메모리가 제한되지 않게 된다. 에릭슨과 킨치는 장기 작동 기억 이론에서 이 점을 반영했다. [(장기 기억에 저장된 정보에 의존하는) 전문지식]은 개인과 사회에 대한 교육의 변화적 결과를 반영하여 작업 기억에서 정보를 처리하는 능력을 변화시키고 우리를 변화시킨다. 학습자가 중요한 정보를 장기기억에 축적할 수 있도록 하는 것이 교육의 주요 기능이라는 것이다. 새롭기 때문에, 새로운 정보는 작업 기억의 한계를 고려하는 방식으로 제시되어야 한다. 이러한 과정들은 1998년에 인지 부하 이론의 교육적 영향을 초래한 인지 구조를 제공했다. While working and long-term memory were well-known, the important relations between them were much less emphasised. Working memory was limited in capacity and duration when dealing with novel information but these limitations effectively disappeared when working memory dealt with information transferred from long-term memory. A ready availability of large amounts of organised information from long-term memory results in working memory effectively having no known limits when dealing with such information. Ericsson and Kintsch (1995) in their theory of long-term working memory, reflected this point. Expertise, reliant on information held in long-term memory, transforms our ability to process information in working memory and transforms us, reflecting the transformational consequences of education on individuals and societies. It follows that the major function of instruction is to allow learners to accumulate critical information in long-term memory. Because it is novel, that information must be presented in a manner that takes into account the limitations of working memory when dealing with novel information. These processes provided the cognitive architecture that led to the instructional implications of cognitive load theory in 1998.
인지부하의 범주 Categories of Cognitive Load
1998년에, 우리는 인지 부하의 세 가지 범주에 대해 논의했다: 내재적, 외부적, 그리고 본유적.
In 1998, we discussed three categories of cognitive load: intrinsic, extraneous and germane.
[내재적 인지 부하]는 [처리 중인 정보의 복잡성]을 의미하며, 요소 간 상호작용의 개념과 관련이 있다. 위에서 설명한 인간 인지 구조의 특성 때문에, 인간에 의해 처리되는 정보의 복잡성을 결정하는 것은 어렵다. 정보의 복잡성에 대한 대부분의 척도는 순전히 정보의 특성에 관한 것이다. 위에서 논의한 작업 기억과 장기 기억 사이의 관계 때문에 인간에 의해 처리되고 있는 정보를 언급할 때 그러한 조치들은 부적절하다. 장기 기억에 조직되고 저장된 정보는 저장되기 전의 동일한 정보와는 매우 다른 특성을 가지고 있다.
Intrinsic cognitive load referred to the complexity of the information being processed and was related to the concept of element interactivity. Because of the characteristics of human cognitive architecture described above, determining the complexity of information processed by humans is difficult. Most measures of informational complexity refer purely to the characteristics of the information. Such measures are inadequate when referring to information being processed by humans because of the relations between working and long-term memory discussed above. Information that has been organised and stored in long-term memory has very different characteristics for humans than the same information prior to it being stored.
이 논문의 독자들에게 영어 단어 'characteristics'과 그 로마자는 장기 기억에서 회수된 하나의 요소로 쉽고 무의식적으로 처리된다. 반면, 영어 읽기를 배우는 누군가에게 쓰여진 단어는 아직 장기 기억에 단일 요소로 저장되지 않았기 때문에 여러 개의 상호작용하는 요소로 작업 기억에서 처리되어야 한다. [복잡성 또는 요소 상호작용성]은 [정보의 성격과 정보를 처리하는 사람의 지식의 조합]에 좌우된다.
영어 읽기를 배우는 누군가에게, 'characteristics'이라는 단어를 구성하는 여러 개의 꼬불꼬불한 말을 해석하는 것은 작업 기억을 압도하는 매우 높은 요소 상호작용성 작업이 될 수 있다.
전문가에게, 동일한 구불구불한 선squiggles은 최소 요소 상호작용으로 인해 최소한의 인지 부하를 부과하는 단일 요소만 구성할 수 있다.
For readers of this paper, the English word ‘characteristics’ and its Roman letters are processed easily and unconsciously as a single element retrieved from long-term memory. For someone learning to read English, the written word must be processed in working memory as multiple, interacting elements because the written word has not yet been stored as a single element in long-term memory. Complexity or element interactivity depends on a combination of both the nature of the information and the knowledge of the person processing the information.
For someone learning to read English, interpreting the multiple squiggles that constitute the word ‘characteristics’ may constitute a very high element interactivity task that overwhelms working memory.
For an expert, the same squiggles may constitute only a single element that imposes a minimal cognitive load due to minimal element interactivity.
따라서, 내재적 인지 부하는 정보의 복잡성과 정보를 처리하는 사람의 지식에 의해 결정된다.인간 인지 시스템의 이러한 특징들을 고려할 때, (제시된 정보의) 복잡성을 결정할 때 [(기존) 지식을 무시하는 측정]은 대부분 소용이 없다. 이 분석에 기초하여, 내재적 인지 부하는 학습해야 할 것을 변경하거나 학습자의 전문지식을 바꿈으로써만 바뀔 수 있다.
Accordingly, intrinsic cognitive load is determined by both the complexity of the information and the knowledge of the person processing that information. Given these characteristics of the human cognitive system, measures that ignore knowledge when determining complexity are largely useless. Based on this analysis, intrinsic cognitive load only can be changed by changing what needs to be learned or changing the expertise of the learner.
[외재적 인지 부하]는 정보의 본질적 복잡성에 의해 결정되는 것이 아니라, 정보가 어떻게 제시되고 학습자가 지시 절차에 의해 무엇을 해야 하는가에 의해 결정된다. 내재 인지 부하와 달리, 교육 절차instructional procedures를 변경하여 바꿀 수 있다. 1998년에는 요소 상호작용만이 내재 인지 부하와 관련이 있다고 가정했다. 그 결과, 외부 인지 부하(Sweller 2010)를 동일하게 결정한다는 것이 명백해졌다.
효과적인 교육 절차는 요소의 상호작용성을 감소시키는 반면
비효율적인 절차는 요소의 상호작용성을 증가시킨다.
Extraneous cognitive load is not determined by the intrinsic complexity of the information but rather, how the information is presented and what the learner is required to do by the instructional procedure. Unlike intrinsic cognitive load, it can be changed by changing instructional procedures. In 1998, it was assumed that element interactivity only was relevant to intrinsic cognitive load. Subsequently, it became apparent that it equally determines extraneous cognitive load (Sweller2010).
Effective instructional procedures reduce element interactivity while
ineffective ones increase element interactivity.
[본유적 인지부하]는 학습에 필요한 인지부하으로 정의되었으며, 이는 (외재적 인지 부하가 아니라) 내재적 인지 부하를 다루는 데 사용되어야 하는 작업기억 자원을 가리킨다. 외부 인지 부하를 처리하는 데 더 많은 자원을 할애할수록 내재 인지 부하를 처리하는 데 더 적은 가용성이 제공되므로 학습량이 줄어들 것이다. 그런 점에서 [내재적 인지적 부하]와 [본유적 인지 부하]는 밀접하게 얽혀 있다. Germane cognitive load was defined as the cognitive load required to learn, which refers to the working memory resources that are devoted to dealing with intrinsic cognitive load rather than extraneous cognitive load. The more resources that must be devoted to dealing with extraneous cognitive load the less will be available for dealing with intrinsic cognitive load and so less will be learned. In that sense, intrinsic and germane cognitive load are closely intertwined.
[본유적 인지 부하]의 이러한 특성은 1998년 논문에서 벗어난 것이다. 본 논문에서 우리는 본유적 인지 하중이 외부 하중을 대체하여 총 인지 하중에 기여한다고 가정했다. 현재, 우리는 [본유적 인지 부하]가 총 부하에 기여하기 보다는, 학습 과제의 본질적인instrinsic 정보를 처리하여, 외부 활동에서 학습과 직접 관련이 있는 활동으로 작업 기억 자원을 재배포한다고 가정한다. 이러한 변경의 필요성은 외부 하중이 감소되었을 때 게르마인 인지 하중이 단순히 외부 하중을 대체했다면 외부 하중의 감소에 따른 총 하중의 변화가 없어야 한다는 문제에서 비롯되었다. 수많은 경험적 연구에 따르면 외부 부하 감소에 따른 부하 감소가 나타났다. 현재 공식은 [본유적 인지 부하]가 그 자체로 부하를 부과하기 보다는, 직무의 외부적 측면에서 본질적 측면으로 [(부하의) 재분배 기능]을 가지고 있다고 가정함으로써 이 문제를 제거한다. This characterisation of germane cognitive load is a departure from the 1998 paper. In that paper we assumed that germane cognitive load contributed to total cognitive load by substituting for extraneous load. Currently, we assume that rather than contributing to the total load, germane cognitive load redistributes working memory resources from extraneous activities to activities directly relevant to learning by dealing with information intrinsic to the learning task. The need for this alteration arose from the issue that if germane cognitive load simply replaced extraneous load when extraneous load was reduced, then there should be no change in total load following a reduction in extraneous load. Numerous empirical studies indicated a reduction in load following a reduction in extraneous load. The current formulation eliminates this problem by assuming that germane cognitive load has a redistributive function from extraneous to intrinsic aspects of the task rather than imposing a load in its own right.
1998년 보고한 지시효과 Instructional Effects Reported in 1998
1998년 기사에서는 7가지 인지 부하 효과가 보고되었다(표 1의 상단 참조). [변동성 효과]를 제외한 이 모든 효과는 외부 인지 부하 감소와 관련된 요소 상호작용성의 감소에 기인한다. [변동성 효과]는 내재 인지 부하의 변화로 인한 것이다. 이러한 효과는 전 세계 여러 연구 센터에서 수행된 여러 번의 중복 실험과 다양한 재료 및 모집단을 사용한 실험에 기초했다. 그러나, 이러한 실험들 중 다수는 비교 인지 부하를 직접 측정하려고 시도하지 않았다. 오히려, 인지 부하 이론은 교육 기법을 생성하는데 사용되었고 이러한 기술이 학습 결과에 대한 기대 효과를 생성한다면 이론을 강화하는 것으로 가정되었다. In the 1998 article, seven cognitive load effects were reported (see the upper part of Table1). All of these effects with the exception of the variability effect were due to a reduction in element interactivity associated with a decrease in extraneous cognitive load. The variability effect is due to alterations in intrinsic cognitive load. These effects were based on multiple, overlapping experiments carried out in several research centres around the globe and using a variety of materials and a variety of populations. Yet, many of these experiments did not attempt to directly measure comparative cognitive load; rather, cognitive load theory was used to generate instructional techniques and if these techniques produced the expected effects on learning outcomes they were assumed to strengthen the theory.
표 1 1998년 이전과 이후의 주요 인지부하 영향의 연표 Table 1 Timeline of major cognitive load effects before and after 1998
목표 부재 효과 Goal-Free Effect
[목표 부재 효과]를 [목표-특이성 감소 효과] 또는 [목표 없음 효과]라고도 합니다. 그것은 기존의 문제들이 일반적으로 [수단-목표means-ends 분석]에 의해 해결된다는 관찰로부터 시작되었는데, 이런 문제해결 방식은 작업 메모리 용량에 유난히 "비싼" 프로세스이다. 왜냐하면 학습자는 작업 기억, 현재 문제 상태, 목표 상태, 그들 사이의 관계, 차이를 줄일 수 있는 문제 해결 연산자 및 하위 문제를 유지하고 처리해야 하기 때문이다. (예: 차량은 1분 동안 정지 상태에서 균일하게 가속됩니다. 그것의 최종 속도는 2km/min이다. 얼마나 멀리 이동했습니까?)
The goal-free effect is also called the reduced goal specificity effect or no goal effect. It is the oldest effect studied in the context of cognitive load theory (Sweller and Levine1982). It started from the observation that conventional problems (e.g.A car is uniformly accelerated from rest for 1 min. Its final velocity is 2 km/min. How far has it travelled?) are typically solved by means-ends analysis, a process that is exceptionally expensive of working memory capacity because the learner must hold and process in working memory, the current problem state, the goal state, relations between them, problem-solving operators that could reduce differences and any sub-goals.
기존의 문제가 목표가 없는 문제로 대체될 때(예: 차량은 1분 동안 정지 상태에서 균일하게 가속됩니다. 그것의 최종 속도는 2km/min이다. 가능한 한 많은 변수의 값을 계산해보세요), 학습자는 단지 목표 상태가 제공되지 않는다는 이유만으로 현재 문제 상태와 목표 상태 간의 차이를 추출할 수 없다. 이제 그들은 마주치는 각 문제 상태를 고려하여, 적용할 수 있는 문제 해결 연산자라면 무엇이든 다 찾을 수 있다. 일단 연산자가 적용되면, 새로운 문제 상태가 생성되고 프로세스가 반복될 수 있습니다.
When conventional problems are replaced by goal-free problems (e.g.A car is uniformly accelerated from rest for 1 min. Its final velocity is 2 km/min. Calculate the value of as many variables as you can), learners are no longer able to extract differences between a current problem state and a goal state simply because no goal state is provided. They will now consider each problem state encountered and find any problem-solving operator that can be applied; once an operator has been applied, a new problem state has been generated and the process can be repeated.
[수단-목표 분석]은 지식 구성 프로세스와 거의 관련이 없는 반면, [목표가 없는 문제 해결]은 인지 부하를 크게 감소시키고 낮은 부하와 지식 구성에 필요한 해결책의 정확한 조합을 제공한다.
Whereas means-ends analysis bears little relation to knowledge construction processes, goal-free problem solving greatly reduces cognitive load and provides precisely the combination of low load and focus on solutions that is required for knowledge construction.
작업 예제 효과 Worked Example Effect
[작업된 예제]는 기존의 문제로 인한 인지 부하를 줄이고 지식 구성을 용이하게 하는 것을 목표로 한다. 작업 예제는 학습자가 주의 깊게 공부해야 하는 전체 문제 해결 방법을 제공합니다. 작업된 예제 효과는 대수학 영역에서 스웰러와 쿠퍼(1985)에 의해 처음 보고되었다. 기존의 문제와 대조적으로, [풀이된 예제]는 학습자의 주의를 문제 상태 및 관련 운영자(즉, 솔루션 단계)에 집중시켜 일반화된 솔루션을 유도할 수 있도록 한다. 따라서, 풀이된 예제를 공부하는 것은 실제로 동등한 문제를 해결하는 것보다 지식 구축과 전이라는 학습성과를 더 촉진할 수 있습니다. Like goal-free problems, worked examples aim to reduce the cognitive load caused by conventional problems and to facilitate knowledge construction. Worked examples provide a full problem solution that learners must carefully study. The worked example effect was first reported by Sweller and Cooper (1985) in the domain of algebra. In contrast to conventional problems, worked examples focus the learners’ attention on problem states and associated operators (i.e. solution steps), enabling them to induce generalised solutions. Thus, studying worked examples may facilitate knowledge construction and transfer performance more than actually solving the equivalent problems.
작업된 예제 효과에 대한 매우 강력한 경험적 증거가 있지만, 중요한 제약 조건도 있다. 고전문가의 학습자에게 작업 예제는덜 효과적이고 좋은 작업 예제의 설계는 어렵다. 예를 들어, 학습자가 다른 정보 소스를 정신적으로 통합하거나(아래의 [분산되 주의 효과] 참조) 중복 정보를 결합하도록 요구해서는 안 되기 때문이다 (아래의 [중복 효과] 참조). 예제를 통한 학습에 대한 연구 리뷰는 Renkl(2013)에 의해 제공된다. Although there is very strong empirical evidence for the worked example effect, there are also important constraints: Worked examples are less effective for high-expertise learners and the design of good worked examples is difficult, for example, because they should not require the learner to mentally integrate different sources of information (see the split-attention effect below) or combine redundant information (see the redundancy effect below). A review of studies on learning from examples is provided by Renkl (2013).
부분완성 문제 효과 Completion Problem Effect
[풀이된 예제]의 잠재적인 단점은 학습자가 주의 깊게 학습하도록 강요하지 않는다는 것입니다. 따라서 Van Merrienboer와 Krammer(1987)는 컴퓨터 프로그래밍 입문 분야에서 [부분완성 문제]를 사용할 것을 제안했다. 그러한 문제들은 주어진 상태, 목표 상태, 학습자에 의해 완성되어야 하는 [부분적인 해결책]을 제공한다. 컴퓨터 프로그래밍 분야에서, 이것은 학습자들이 완성되어야 할 불완전한 컴퓨터 프로그램을 받는 것을 의미한다. [완전히 풀이된 예제]는 명시적으로 학습하도록 유도하지는 않는 반면, 학습자는 [부분완성 문제]에서 제공되는 [부분적으로 풀이된 예제]를 주의 깊게 공부하고 이해해야 한다. 그렇지 않으면 솔루션을 올바르게 완료할 수 없기 때문입니다. A potential disadvantage of worked examples is that they do not force learners to carefully study them. Therefore, van Merriënboer and Krammer (1987) suggested the use of completion problems in the field of introductory computer programming. Such problems provide a given state, a goal state, and apartialsolution that must be completed by the learners. In the field of computer programming, this means that the learners receive incomplete computer programs that need to be finished. Although fully worked examples do not explicitly induced learners to study them, learners must carefully study and understand the partial worked examples provided in completion problems because they otherwise will not be able to complete the solution correctly.
[부분완성 문제]는 [풀이된 예제]와 [전통적 문제] 사이의 가교로도 볼 수 있습니다. [풀이된 예제]는 완전한 솔루션의 완료 문제이고, [전통적 문제]는 부분적인 솔루션이 제시된 [부분완성 문제]입니다. 코스를 설계할 때, 이러한 서로 다른 솔루션 레벨은 거의 완전한 솔루션을 제공하는 완료 문제로 시작할 수 있도록 하며, 점진적으로 전체 또는 대부분의 솔루션이 학습자에 의해 생성되어야 하는 완료 문제로 작용할 수 있도록 합니다. 이 전략은 '완료 전략completion strategy'(1990년 반 메린보어 및 크라머)으로 알려졌으며 아래에서 설명될 guidance-fading effect의 선구자로 볼 수 있다.
Completion problems may also be seen as a bridge between worked examples and conventional problems: worked examples are completion problems with a complete solution and conventional problems are completion problems with a partial solution. When designing a course, these differing solution levels allow commencement with completion problems that provide almost complete solutions and gradually work to completion problems for which all or most of the solution must be generated by the learners. This strategy became known as the ‘completion strategy’ (van Merriënboer and Krammer1990) and can be seen as a forerunner of the guidance-fading effect that will be described below.
주의 분할 효과 Split-Attention Effect
[주의분할 효과]는 [풀이된 예제]에 대한 연구에서 비롯되어, Tarmizi와 Sweller(1988)에 의해 처음 보고되었다. 예를 들어, 지오메트리 영역의 [풀이된 예제]는 [다이어그램]과 이에 대한 [풀이법 설명 문장]으로 구성될 수 있습니다.
[다이어그램]만으로는 문제에 대한 해결책에 대해 아무것도 드러내지 않으며,
[풀이 문장]은 다이어그램과 통합되기 전까지는 학습자가 이해할 수 없습니다.
학습자들은 해결책을 이해하기 위해 두 가지 정보의 원천을 정신적으로 통합해야 하는데, 이 과정은 높은 인지 부하를 산출하고 학습을 방해하는 과정이다. The split-attention effect stems from research on worked examples and was first reported by Tarmizi and Sweller (1988). For instance, a worked example in the domain of geometry might consist of a diagram and its associated solution statements.
The diagram alone reveals nothing about the solution to the problem and
the statements, in turn, are unintelligible for the learners until they have been integrated with the diagram.
Learners must mentally integrate the two sources of information in order to understand the solution, a process that yields a high cognitive load and hampers learning.
이러한 [주의 분할 효과]는 [다이어그램과 솔루션 문구를 물리적으로 통합]하여 정신적 통합을 불필요하게 만들고 작업 예제의 긍정적인 효과를 복원함으로써 예방할 수 있다. 주의 분할효과는 정보 출처의 [공간적 조직]뿐만 아니라 [시간적 조직]과도 관련이 있다. 메이어와 앤더슨(1992)은 인지 부하를 줄이고 학습을 용이하게 하기 위해 애니메이션과 관련 내레이션이 일시적으로 조정되어야 한다는 것을 발견했다. 분할 주의 효과에 대한 최근 리뷰는 Ayres와 Sweller(2014)에 의해 제공되었습니다.
This split-attention effect can be prevented by physically integrating the diagram and the solution statements, making mental integration superfluous and reinstating the positive effects of worked examples. The split-attention effect not only relates to the spatial organisation of information sources but also to their temporal organisation. Mayer and Anderson (1992) found that animation and associated narration need to be temporally coordinated in order to decrease cognitive load and facilitate learning. A recent review of the split-attention effect is provided by Ayres and Sweller (2014).
중복 효과 Redundancy Effect
[주의 분할 효과]는 [풀이된 예제 효과]에서 나온 반면, [중복 효과]는 [주의 분할 효과]에서 나온 것입니다. 학습자가 독자적으로는 도움이 안 되지만, 통합된다면 이해에 도움이 되는 [두 가지 상호 보완적인 정보원]에 직면할 때 주의가 분산됩니다. 하지만 두 정보의 원천이 [서로에 대한 참조 없이] 스스로 포함되고 이해될 수 있다면 어떻게 될까? Chandler와 Sweller(1991)는 텍스트로 혈액의 흐름을 설명한 진술과 함께 심장, 폐 및 신체의 나머지 부분의 혈액 흐름을 보여주는 다이어그램을 사용했다. 따라서, 다이어그램과 문장은 동일한 정보를 포함하고 있으며 완전히 중복되었습니다. 이 경우 [다이어그램만를 제시]하는 것이, [두 개의 정보 출처를 함께 표시하는 것]보다 우월한 것으로 밝혀졌다.
While the split-attention effect grew out of the worked example effect, the redundancy effect, in turn, grew out of the split-attention effect. Split attention occurs when learners are confronted with two complementary sources of information, which cannot stand on their own but must be integrated before they can be understood. But what happens when the two sources of information are self-contained and can be understood without reference to each other? Chandler and Sweller (1991) used a diagram demonstrating the flow of blood in the heart, lungs and rest of the body together with statements that described this flow of blood in text. Thus, the diagram and the statements contained the same information and were fully redundant. It was found that only presenting the diagram was superior to presenting both sources of information together.
중복 효과가 발생하는 이유는, [학습자가 두 출처의 정보가 동일하다는 것을 발견하기 위해 노력을 들여 처리해야 하기 때문]입니다. 동일한 정보를 두 번 제공하는 것이 해를 끼치거나 심지어 이롭다는 가정 하에, 이 발견은 중요하지만, 직관적이지 않다. 문헌의 조사 결과, 중복 효과는 수십 년 동안 발견되고, 잊혀지고, 재발견되어 왔다. 1937년 초에, 밀러는 명사를 읽는 법을 배우는 어린 아이들이 단어들이 비슷한 그림과 함께 제시되기 보다는 혼자 제시된다면 더 많은 발전을 이루었다고 보고했습니다.
This redundancy effect is due to the fact that effortful processing is required from the learners to eventually discover that the information from the two sources is identical. This finding is important and counter-intuitive based on the assumption that providing the same information twice can do no harm or is even beneficial. Inspection of the literature shows that the redundancy effect has been discovered, forgotten and rediscovered over many decades: As early as1937, Miller reported that young children learning to read nouns made more progress if the words were presented alone rather than in conjunction with similar pictures.
제시방식 효과 Modality Effect
1998년 기사에서 논의된 모든 인지 부하 효과는 [다룰 수 있는 요소의 수가 변경할 수 없다는 점]에서, [한 개인에 대해 작업 기억 용량이 고정되어 있다]고 가정했다. 하지만 유일한 예외는 [제시방식 효과]이다. 제시방식효과는 작업 기억이 부분적으로 독립적인 프로세서로 세분화될 수 있다는 가정에 기초하며, 하나는 청각 작업 기억에 기초한 언어 자료와 다른 하나는 시각 작업 기억에 기초한 도표/그림 정보를 다룬다(예: Baddley 1992). 따라서 어느 한 프로세서만 사용하는 것이 아니라, [시각 및 청각]이라는 두 가지의 [작업 기억] 모두를 사용했을 때, 효과적으로 작업 기억 용량을 증가시킬 수 있다. All cognitive load effects discussed in the 1998 article assumed that working memory capacity is fixed for a given individual in the sense that the number of elements that could be dealt with was unalterable, with the modality effect as an exception. The modality effect is based on the assumption that working memory can be subdivided into partially independent processors, one dealing with verbal materials based on an auditory working memory and one dealing with diagrammatic/pictorial information based on a visual working memory (e.g. Baddeley1992). Consequently, effective working memory capacity can be increased by using both visual and auditory working memory rather than either processor alone.
무사비 외 연구진(1995)은 기하학 학습에서 제시방식 효과를 최초로 시험한 사람이었다. 그들은 다이어그램을 통합된 필기 텍스트(즉, 시각적)와 제시하거나, 구어 텍스트(즉, 시각적)와 함께 제시했고, [제시방식 효과]로 인해 음성 텍스트와의 조합이 가장 효과적일 것이라고 가정했다. 그들은 실제로 그 이후로 많은 다른 실험에서 제시방식 효과가 재현되는 것을 발견했다. [제시방식 효과]는 [주의 분할효과]를 처리하는 방법에 중요한 영향을 미친다. [주의 분할]이 발생하는 경우, [글자 정보]를 [청각 모드]로 표시하는 것이, [도표에 물리적으로 통합하는 것]보다 동등하거나 훨씬 더 효과적일 수 있다. 긴스(2005a)는 여전히 읽을 가치가 있는 양식 효과의 메타 분석을 제공했다.
Mousavi et al. (1995) were the first to test the modality effect in geometry learning; they presented a diagram either with integrated written text (i.e. visual) or with auditory, spoken text and they hypothesised that the combination with spoken text would be most effective due to the modality effect. They indeed found the modality effect that has since been replicated in many other experiments. The modality effect has important implications for how to deal with split-attention effects: if split attention occurs, presenting the written information in an auditory mode may be equally or even more effective than physically integrating it in the diagram. Ginns (2005a) provided a meta-analysis of the modality effect that is still worth reading.
변동성 효과 Variability Effect
문제 상황에 대한 [가변성]은, 유사한 특징을 식별할 수 있게 해주고, 관련성이 높은 특징을 관련성이 없는 특징과 구별할 수 있는 확률을 증가시키기 때문에, 학습자가 더 일반화된 지식을 구축하도록 유도할 것으로 예측할 수 있다. 즉, 가변성의 증가는 내재 인지 부하를 증가시켜 증가를 처리하기에 충분한 작업 기억 자원이 있는 경우 더 많은 것을 배울 수 있게 한다. 몇몇 연구는 [가변성]이 [연습 중 인지 부하]를 증가시킬 뿐만 아니라, [학습의 전이transfer]도 증가한다는 것을 보여주었다. 처음에 변동성 효과는 (이전에 보고된 모든 인지 부하 효과와) 모순되는 것으로 보였다. 왜냐하면 그것은 [인지 부하의 감소]가 아니라, [인지부하의 증가]와 '높은 학습성과'를 결합시켰기 때문이다. Variability over problem situations is generally expected to encourage learners to construct more general knowledge, because it increases the probability that similar features can be identified and that relevant features can be distinguished from irrelevant ones. In other words, increases in variability increase intrinsic cognitive load allowing more to be learned provided there is sufficient working memory resources to handle the increase. Several studies showed that variability not only increased cognitive load during practice but also increased transfer of learning. Initially, the variability effect seemed to contradict all earlier reported cognitive load effects, because it combines an increase rather than a decrease of cognitive load with higher learning outcomes.
기하학 문제 해결 분야에서 파스와 판 메린보어(1994a)는 인지 부하 이론의 맥락에서 가변성 효과를 최초로 기술했다.
그들은 [높은 변동성]이 [인지 부하가 낮은 상황(즉, 완성된 예제를 통한 학습)]에서 학습과 전이에 긍정적인 영향을 미칠 것이라고 가정했다. 왜냐하면 그러한 상황에서는 변동성이 내재 인지 부하를 증가시켰다는 사실에 관계없이 총 인지 부하가 한계 내에 머물 것이기 때문이다.
대조적으로, 그들은 [높은 변동성]은 [인지 부하가 이미 높은 상황]에서 학습과 전이에 부정적인 영향을 미칠 것이라고 예측했다. 왜냐하면 총 인지 부하가 학습자의 작업 기억력에 과도한 부담을 주기 때문이다.
In the domain of geometrical problem solving, Paas and van Merriënboer (1994a) were the first to describe the variability effect in the context of cognitive load theory: They hypothesised that high variability would have a positive effect on learning and transfer in situations in which cognitive load was low (i.e. learning from worked examples), because in such situations the total cognitive load would stay within limits, irrespective of the fact that variability increased intrinsic cognitive load. In contrast, they predicted that high variability would have a negative effect on learning and transfer in situations in which cognitive load was already high (i.e. learning by solving conventional problems), because the total cognitive load would then overburden learners’ working memory.
실제로, 문제 형식(풀이된 예제, 전통적 문제)과 변동성(낮음, 높음) 사이의 기대했던 상호작용이 발견되었다. 이와 유사한 발견에 기초하여 학습에 생산적이지 않은 '외부적' 과정과 학습에 생산적인 '본유적' 프로세스에 의해 야기되는 부하 사이에 구별이 도입되었다. 수업instruction을 설계할 때 먼저 외부 인지 부하를 감소시켜야 하는 것은 유효하다. 하지만, 새로운 함의는, 총 인지 부하가 한계 내에 있다면, 외부 인지 부하의 감소는 본유적 인지부하의 증가가 동반되었을 때 훨씬 더 효과적일 수 있다.
Indeed, the expected interaction between problem format (worked examples, conventional problems) and variability (low, high) was found. Based on this and similar findings, a distinction was introduced between load that is caused by ‘extraneous’ processes not productive for learning and load that is caused by ‘germane’ processes and productive for learning. When instruction is designed, it should first decrease extraneous cognitive load, but as a new implication, instructional designs that are effective in decreasing extraneous cognitive load may become even more effective if they increase germane cognitive load, provided that total cognitive load stays within limits.
'인지 부하 이론의 발전 1998–2018' 섹션에서 설명될 것처럼, 이는 다양한 유형의 인지 부하를 측정하고 저마다의 처리를 증가시키는 것을 목표로 하는 새로운 효과를 식별하는 길을 열었다.
As will be described in the ‘Developments in Cognitive Load Theory 1998–2018’ section, this opened up the way for measuring different types of cognitive load and identifying new effects that explicitly aimed at increasing germane processing.
인지부하 이론의 발전 Developments in Cognitive Load Theory 1998–2018
지난 20년 동안 인지 부하 이론에서 주요한 발전이 있었다.
첫째, 진화 심리학에서 인간의 인지 구조를 위한 강력한 기초를 마련함으로써 그것의 이론적 기반이 강화되었다.
둘째, 4개 요소 교육 설계(4C/ID)는 더 긴 기간의 교육 프로그램 설계(강좌 또는 전체 커리큘럼)에 초점을 맞춘 쌍둥이 이론으로 개발되었다.
셋째, 연구는 소위 복합 효과, 즉 다른 단순한 인지 부하 효과의 특성을 바꾸는 효과를 포함한 일련의 새로운 인지 부하 효과를 산출했다.
네 번째이자 마지막으로, 다양한 유형의 인지 부하를 측정하기 위한 새로운 기기가 개발되었습니다. 우리는 진화 심리학에 기초한 이론적 발전을 고려하는 것으로 시작할 것이다.
There have been major developments in cognitive load theory over the last 20 years.
First, its theoretical basis has been strengthened by laying a strong foundation for human cognitive architecture in evolutionary psychology.
Second, four-component instructional design (4C/ID) has been developed as a twin theory focussing on the design of educational programs of longer duration (courses or whole curricula).
Third, research yielded a series of new cognitive load effects, including the so-called compound effects, that is, effects that alter the characteristics of other, simple cognitive load effects.
Fourth and finally, new instruments have been developed to measure different types of cognitive load. We will begin by considering theoretical developments based on evolutionary psychology.
진화심리학의 프리즘을 통해 본 인간의 인지구조 Human Cognitive Architecture Seen Through the Prism of Evolutionary Psychology
작업 기억과 장기 기억 사이의 복잡한 관계에 중점을 둔 1998년 버전의 인간 인지 구조는 우리가 어떻게 문제를 배우고, 생각하고, 해결하는지에 대한 중요한 측면을 제공했지만, 인간 인식에 대한 우리의 지식에 있어서 지속적인 진보는 초창기에 갖고 있던 개념이 확장될 필요성을 시사했다. 그 팽창의 대부분은 진화심리를 중심으로 돌아갔는데, 이것은 그 작업에 자극을 주었다. While our 1998 version of human cognitive architecture, with its emphasis on the intricate relations between working memory and long-term memory, provided a critical aspect of how we learn, think and solve problems, the continual advances in our knowledge of human cognition indicated a need to expand that earlier conceptualisation. Much of that expansion revolved around evolutionary psychology which provided an impetus for that work.
생물학적으로 초등 지식과 중등 지식 사이의 Geary의 구별에 기초하여, [진화적 교육 심리학]은 우리가 이제 인지 부하 이론의 중심인 교육적으로 의미 있는 방식으로 정보를 분류할 수 있게 해준다. 생물학적으로 가장 중요한 지식은 우리가 [수없이 많은 세대를 거쳐 습득하도록 진화해 온 지식]이다. 이러한 지식의 범주는 인간에게 결정적으로 중요한 것을 제공해왔다.
예를 들어, 우리가 듣고 말하고, 얼굴을 인식하고, 기본적인 사회적 기능에 관여하고, 낯선 문제를 해결하고, 이전에 습득한 지식을 새로운 상황으로 이전하고, 일어날 수도 있고 일어나지 않을 수도 있는 미래 사건에 대한 계획을 세우거나, 우리의 현재 환경에 대응하도록 우리의 사고 과정을 규제할 수 있는 지식이다.
Based on Geary’s distinction between biologically primary and secondary knowledge (Geary2008,2012; Geary and Berch2016), evolutionary educational psychology allows us to categorise information in instructionally meaningful ways that now are central to cognitive load theory (Sweller2016a). Biologically primary knowledge is knowledge that we have evolved to acquire over countless generations. That category of knowledge tends to be critically important to humans providing,
as examples, knowledge that allows us to listen and speak, recognise faces, engage in basic social functions, solve unfamiliar problems, transfer previously acquired knowledge to novel situations, make plans for future events that may or may not happen, or regulate our thought processes to correspond to our current environment.
인간은 이러한 매우 복잡한 인지 활동에 참여하는 것을 배워야 하지만, 그들의 중요성 때문에,우리는 필요한 기술을 쉽고 [자동으로 습득하도록 진화]해 왔다. 결과적으로, 그것들은 대부분의 사람들에게 가르쳐질 수 없다.
Humans must learn to engage in these very complex cognitive activities but because of their importance, we have evolved to acquire the necessary skills effortlessly and automatically. Consequently, they cannot be taught to most people.
생물학적으로 [원초적primary 지식]은 [모듈식]이기에, 한 기술과 다른 기술과 관련된 인지 과정 사이에 거의 관계가 없다. 각각의 기술은 매우 다른 인지 과정을 요구하는 서로 다른 진화 시대에서 진화했을 것이다.
우리의 현재 환경에 대응하도록 우리의 사고 과정을 조절하는 우리의 능력은 의사소통을 위해 제스처를 사용하는 우리의 경향처럼 우리가 현대 인간이 되기 전에 진화했을 가능성이 있는 반면,
우리의 입술, 혀, 숨, 그리고 목소리를 말하기 위해 조직하는 우리의 능력은 훨씬 더 최근에 진화했을 가능성이 있다.
Biologically primary knowledge is modular with little relation between the cognitive processes associated with one skill and another (Geary2008,2012). Each skill is likely to have evolved in different evolutionary epochs requiring very different cognitive processes.
Our ability to regulate our thought processes to correspond to our current environment is likely to have evolved before we became modern humans as did our tendency to use gestures to communicate, while
our ability to organise our lips, tongue, breath and voice to speak is likely to have evolved far more recently.
생물학적으로 매우 많은 주요 기술들은 [일반적인 문제 해결 기술] 또는 심지어 [지식을 구성하는 우리의 능력]처럼 본질적으로 [일반적인 인지generic-cognitive 능력]이다. (Sweller 2015, 2016b; Tricot and Sweller 2014)
[일반적인 인지 기술]은 우리가 본능적으로 습득하도록 진화한 기본적인 인지 기술입니다. 왜냐하면 그것은 매우 광범위한 인지 기능에 필수적이기 때문입니다.
[일반적인 인식 기술]은 [특정한 주제 자체]보다는, 우리가 문제를 배우고, 생각하고, 해결하는 방법에 더 관심을 가지는 경향이 있다.
A very large number of biologically primary skills are generic-cognitive in nature such as general problem-solving skills or even our ability to construct knowledge (Sweller2015,2016b; Tricot and Sweller2014).
A generic-cognitive skill is a basic cognitive skill that we have evolved to acquire instinctively because it is indispensable to a very wide range of cognitive functions.
Generic-cognitive skills tend to be more concerned with how we learn, think and solve problems rather than the specific subject matter itself.
지난 수십 년 동안, 그러한 기술의 중요성을 정확히 깨닫고 있는 많은 교육학자들은 [그것들을 가르쳐야 한다]고 주장해왔다. 그러한 캠페인은 실패하는 경향이 있는데, 그 이유는 기술이 중요하지 않기 때문이 아니라 인간에게 매우 중요하기 때문이다. 그래서 우리는 [교육 없이 자동적으로 그것들을 습득]하도록 진화해 왔다. 지난 세기에 일반적인 문제 스킬을 가르치는 데 엄청난 역점을 두었던 것이 한 예를 제공한다. [일반적인 인지 기술]에 대한 교육효과의 증거를 얻기 위해서는 [원거리 전이 시험]를 사용하여 무작위적이고 통제된 시험을 해야 한다. 일반적인 인식 기술의 근거는 광범위한 영역에서 성과를 향상시킬 것이며, 물론 [어떤 수행능력의 향상도 영역별 지식 때문이 아님을 확인하는 것]이 필수적이기 때문에 원거리 전이far transfer가 필요하다.
Over the last few decades, many educationalists, correctly realising the importance of such skills, have advocated that they be taught. Such campaigns tend to fail, not because the skills are unimportant but because they are of such importance to humans that we have evolved to acquire them automatically without instruction. The enormous emphasis on teaching general problem-skills last century provides an example. Evidence for the effectiveness of teaching generic-cognitive skills requires randomised, controlled trials using far transfer tests. Far transfer is required because the rationale of generic-cognitive skills is that they will enhance performance over a wide range of areas and, of course, it is essential to ensure that any performance improvement is not due to domain-specific knowledge.
생물학적인 [원초적primary 기술]의 습득은 [명시적인 교육 없이도, 자동적으로 무의식적]으로 일어나는 경향이 있지만, [기술의 사용]까지 [모든 맥락에서 무의식적으로 발생하는 것은 아니라는 점]에 유의해야 한다.
예를 들어, 우리는 명확한 노력 없이 무의식적으로 모국어를 말하는 것을 배우지만, 어떤 주어진 상황에서 적절한 의미를 가진 적절한 단어를 찾기 위해 상당한 노력을 필요로 할 수 있다.
우리는 생물학적으로 일차적인 지식을 특정 영역에서 사용하는 방법을 배울 필요가 있습니다. 이는 [생물학적 이차 지식biologically secondary knowledge]으로 이어집니다.
It should be noted that while the acquisition of biologically primary skills tends to occur automatically and unconsciously without explicit teaching, it does not follow that use of the skills occurs unconsciously in every context.
For example, we learn to speak our native language unconsciously without explicit effort but may require considerable effort to find appropriate words with appropriate meanings in any given situation.
We need to learn how to use biologically primary knowledge in specific domains, which leads to biologically secondary knowledge.
[생물학적 이차 지식]은 [우리의 문화가 그것이 중요하다고 결정했기 때문에 우리에게 필요한 지식]이다. 생물학적 이차 정보의 예는 교육과 훈련 맥락에서 가르치는 [거의 모든 주제]에서 찾을 수 있다. 교육 기관들은 생물학적으로 2차적인 정보에 대한 지식을 습득하기 위한 사람들의 필요성 때문에 발명되었다. Biologically secondary knowledge is knowledge we need because our culture has determined that it is important. Examples of biologically secondary information can be found in almost all topics taught in education and training contexts. Educational institutions were invented because of our need for people to acquire knowledge of biologically secondary information.
우리는 [2차 지식]을 습득하도록 진화해 왔지만, 그것은 [1차 지식]과는 매우 다르게 습득된다. 1차 지식과 관련된 경우를 제외하고, 보조 지식은 [모듈식]이 아니라, [단일한, 통일된single, unified 시스템]의 일부입니다. 통합된 시스템이기 때문에, 어떤 영역이든 관계없이 [생물학적 2차 지식의 획득]에는 상당한 유사점이 있다. 모든 2차 지식은 학습자의 의식적인 노력과 강사의 분명한 가르침을 필요로 하는 경향이 있다. (2차 지식이) 자동으로 획득되는 경우는 거의 없습니다. We have evolved to acquire secondary knowledge but it is acquired very differently to primary knowledge. Except insofar as it is related to primary knowledge, secondary knowledge is not modular but rather, is part of a single, unified system. Because it is a unified system, there are considerable similarities in acquiring biologically secondary knowledge irrespective of the domain under consideration. All secondary knowledge tends to require conscious effort on the part of the learner and explicit instruction on the part of an instructor. It is rarely acquired automatically.
[일차 지식의 습득]과 [이차 지식의 습득] 사이의 차이는 [듣는 것]과 [읽는 것] 사이의 구별에 의해 예시될 수 있다.
위에서 말한 바와 같이, 우리는 수업료 없이 자동적으로 듣는 법을 배운다.
반면, 대부분의 사람들은 자동으로 읽는 법을 배우지 않는다. 수천 년 전에 읽기와 쓰기가 발명되었음에도 불구하고, 현대 교육이 출현하기 전까지 읽고 쓰는 법을 배운 사람은 거의 없었다.
The distinction between the two processes can be exemplified by the distinction between learning to listen and learning to read.
As indicated above, we learn to listen automatically, without tuition.
Most people do not learn to read automatically. Despite reading and writing having been invented thousands of years ago, few people learned to read and write until the advent of modern education very recently.
대부분의 [생물학적 일차 지식]과 관련된 [일반적 인지 기술]과는 달리, [생물학적 2차 지식]은 도메인별로 상당히 다르다(2015, 2016b; Tricot and Sweller 2014). 우리는 [일반적 인지 기술]을 사용하여 다양한 문제를 해결하는 방법을 배우도록 진화해 왔다. 하지만 우리는 특정한 단어를 영어나 중국어로 읽고 쓰는 방법이라든가, '(a + b)/c = d에서 a를 구하라'와 같은 문제를 풀 때 가장 좋은 첫 번째 움직임은 양쪽에 분모를 곱하는 것이라는 요령을 자동으로 배우게끔 진화하지 않았다.이러한 영역별, 생물학적 2차 기술은 명시적으로 가르쳐야 하며, 적극적으로 학습해야 한다. In contrast to the generic-cognitive skills associated with most biologically primary knowledge, biologically secondary knowledge is heavily domain-specific (Sweller2015,2016b; Tricot and Sweller2014). We have evolved to learn how to solve a variety of problems using generic-cognitive skills. We have not specifically evolved to learn how to read and write a particular word in English or Chinese, or that the best first move when solving a problem such as (a + b)/c = d, solve fora, is to multiply both sides by the denominator on the left side. These domain-specific, biologically secondary skills need to be explicitly taught (Kirschner et al.2006; Sweller et al.2007) and actively learned.
대부분의 교육학자들은 직관적으로 [일반적 인지 기술]이 [영역-특이적 기술]보다 인간의 기능에 훨씬 더 중요하다는 것을 포착했으며, 이는 [일반적 인지 기술]을 상당히 강조하는 결과를 가져왔다. 그럼에도 불구하고, [영역-특이적 기술]은 상당히 가르칠 수 있는 것과 달리, 순수하게 [일반적 인지 기술]은 가르칠 수 없고, 그것들을 가르치려는 시도는 막다른 골목에 이르게 한다는 인식이 증가하고 있다. Most educationists intuitively understand that generic-cognitive skills are far more important to human functioning than domain-specific skills and this understanding has led to a substantial emphasis on generic-cognitive skills. Nevertheless, there is an increasing recognition that while domain-specific skills are eminently teachable, purely generic-cognitive skills are not teachable and attempts to teach them lead to dead-ends (Sala and Gobet2017).
과거에 [일반적 인지 기술]을 강조한 이유는, 생물학적으로 일차적인 지식과 이차적인 지식의 차이를 깨닫지 못했기 때문이다. [일반적 인지 기술]의 교육에 대한 강조는, 물론, 1998년에 [일반적인 문제 해결 기술]에 대한 교육이 인기를 얻으면서 함께 존재했습니다. 1998년 논문은 부분적으로 그 억양에 대한 반응이었다. 그 단계는 지났지만 다른 일반적인 인식 기술은 살라와 고베에서 알 수 있듯, 더 큰 성공을 거두지 못했다.
The previous emphasis on generic-cognitive skills is due to a failure to realise the distinction between biologically primary and secondary knowledge (Tricot and Sweller2014). An accent on teaching generic-cognitive skills was, of course, present in 1998 with the popularity of teaching generic problem-solving skills. The 1998 paper was partially a reaction to that accent. That phase has passed but other generic-cognitive skills have replaced that emphasis with, as indicated by Sala and Gobet, no greater success.
게다가,약 1세기 동안의 노력에도 불구하고,원거리 전이 연구far transfer study에서 [영역 특이적 기술]을 초월하는 [일반적 인지 기술]을 가르칠 수 있다는 증거는 거의 나오지 않았다.생물학적 [1차적, 일반적 인지 기술]을 습득하는 데에 '자연'스러운 것이었던 [최소한의 가이드]는, [쉽게, 무의식적, 자동적으로 습득되지 않는] 생물학적으로 [2차적, 영역-특이적 기술]의 습득에는 부적절했다.
Furthermore, despite about a century of effort, there is little evidence from far transfer studies, that generic-cognitive skills which transcend domain-specific areas can be taught. The ‘natural’, minimal guidance procedures used to acquire biologically primary, generic-cognitive skills are inappropriate for the acquisition of biologically secondary, domain-specific skills that tend not to be acquired easily, unconsciously and automatically.
우리는 위의 주장에서 [생물학적 1차 지식]과 [일반적 인지 능력]이 교육적인 문제와 무관하다고 결론내리지 말아야 한다. 생물학적으로 일차적이고 일반적인 인지 기술을 가르치려는 시도가 성공할지는 의심스럽지만, [생물학적 2차적 영역 특이적 기술]을 가르치는 데 도움을 주기 위해 사용될 수 있다(Paas and Sweller 2012)
예를 들어, 학생들은 문제해결 절차에 대한 지도를 받지 않고도 [무작위로문제 해결 방법을 생성하는 방법]을 알 수 있지만, 어떤 방법이 어떤 영역에서 효과적일 것인가는 알지 못할 수 있다. [문제의 특정 클래스]에 [특정한 일반적 인지 기술]을 사용해야 한다고 학생들에게 지적하는 것은 교육적으로 효과적일 수 있다(유세프-샬랄라 외. 2014).
We should not conclude from the above argument that biologically primary knowledge and generic-cognitive skills are irrelevant to instructional issues. While we doubt that attempts to teach biologically primary, generic-cognitive skills will be successful, they can be used to assist in teaching biologically secondary, domain-specific skills (Paas and Sweller2012).
For example, students may know how to randomly generate problem solution moves without being instructed in the procedures to do so, but may not be aware of the domain-specific conditions where the technique might be effective. Pointing out to students that a generic-cognitive skill should be used on a particular class of specific problems can be instructionally effective (Youssef-Shalala et al. 2014).
게다가, 무엇이든 [가르치는 것]은 [1차 기술과 2차 기술의 조합]을 포함하며, 이 중에서 [2차 기술]만이 학습되는 유일한 부분이라는 것을 주목하는 것이 중요하다.
예를 들어, 의사들은 SBAR 방법을 사용하여 항상 상황, 배경, 평가 및 권고사항에 대해 보고함으로써 응급 팀에서 효과적으로 의사소통하는 방법을 배운다. 분명히, 의사들은 서로 말할 수 있기 때문에 SSAR 방법은 가르쳐질 수 있다. 하지만, 말하는 것이 [1차 지식]이기 때문에 의사들에게 일반적인 의미에서 서로 말하는 법을 가르치는 것은 말이 안 되지만, 특정한 SSAR 방법을 가르치는 것은 [2차 지식]이고 응급 상황에서 팀 의사소통에 매우 긍정적인 영향을 미칠 수 있다.
Furthermore, it is important to note that teaching anything involves a combination of primary and secondary skills with the secondary skill being the only part that is learned.
For example, medical doctors are taught how to effectively communicate in an emergency team using the SBAR method, always reporting on the situation, background, assessment and recommendations (Beckett and Kipnis 2009). Obviously, the SBAR method can be taught because doctors are able to speak with each other. But, although it makes no sense to teach doctors how to speak with each other in a generic sense because this is primary knowledge, teaching them the specific SBAR method is secondary knowledge and might have a very positive effect on team communication in emergency situations.
인지 구조는 [생물학적 이차적 정보]를 처리하는 데 필요하며, 인지 구조는 (인지 부하 이론의 기초를 제공하는) [생물학적 일차적인 과정]으로 구성되어 있다. 이 프로세스는 모두 생물학적 진화의 정보 처리 절차(Sweller and Sweller 2006)를 모방하며, 자연 정보 처리 시스템을 구성하는 것으로 설명할 수 있습니다. 그것들은 생물학적으로 [5가지 기본 원리]로 설명될 수 있다. 이러한 원칙들은 인지 부하 이론의 지시 절차에 기초하는 인지 구조를 제공한다. The cognitive architecture required to process biologically secondary information consists of biologically primary processes that provide a base for cognitive load theory. Together, the processes mimic the information processing procedures of biological evolution (Sweller and Sweller2006) and can be described as constituting a natural information processing system. They can be described by five basic, biologically primary principles. These principles provide the cognitive architecture that underlies the instructional procedures of cognitive load theory.
정보 저장 원칙 The Information Store Principle
인간의 인식과 같은 [자연 정보 처리 시스템]은 우리의 복잡한 자연 세계에서 기능하기 위해 많은 양의 정보를 필요로 한다. [장기 기억]은 인간의 인식에 그런 구조를 제공한다. 우리는 생물학적으로 주요한 기능을 나타내는 정보를 장기 기억에 저장하거나 정리하는 방법을 사람들에게 가르칠 필요가 없다. 장기 기억은 1998년 논문에서 명확하게 표현되었다. Natural information processing systems such as human cognition require a large store of information in order to function in our complex natural world. Long-term memory provides that structure in human cognition. We do not need to teach people how to store or organise information in long-term memory indicating its biologically primary function. Long-term memory was explicitly articulated in the 1998 paper.
차용 및 재조직 원칙 The Borrowing and Reorganising Principle
장기 기억에 저장된 방대한 양의 정보는 다른 사람들로부터 온다. 인간은 매우 사회적인데, 특히 [다른 사람들로부터 정보를 얻고, 다른 사람들에게 정보를 제공하는 절차] 츠면에서 강력하게 진화하였다는 점에서 그렇다. 그것은 생물학적으로 가장 중요한 기술이기 때문에, 우리는 자동적으로 우리가 우리의 삶 동안 다른 사람들로부터 정보를 제공하고 받을 것이라고 가정한다. 이 원칙은 명시적으로 언급되지는 않았지만 1998년 논문에서 어느 정도 가정되었다. 명확한 지시에 중점을 둔 인지 부하 이론은 이 원리를 중요시한다. The vast bulk of information stored in long-term memory comes from other people. Humans are intensely social with powerfully evolved procedures for obtaining information from others and for providing information to others. Because it is a biologically primary skill, we automatically assume that we will provide and receive information from others during our lives. This principle was to some extent assumed in the 1998 paper, although it was not explicitly stated. Cognitive load theory with its emphasis on explicit instruction places prominence on this principle.
생성의 임의성 원리 The Randomness as Genesis Principle
장기 기억에 저장된 정보의 대부분은 다른 사람들로부터 얻지만, 만약 그 정보를 빌릴 수 있는 사람이 없다면, 그것은 생성될 필요가 있을 것이다. 새로운 정보는 문제 해결 중에 [무작위 생성 및 테스트 절차]를 사용하여 생성된다. [무작위 생성 및 테스트 절차]는 자신의 또는 다른 사람의 장기 기억에서 정보를 사용할 수 없는 경우에만 사용됩니다. 문제 해결사가 주어진 지점에서 어떤 동작을 수행해야 하는지를 나타내는 정보를 가지고 있지 않을 경우, 무작위로 동작을 생성하고 효과적인 동작을 유지하고 효과적인 동작을 포기한 상태에서 효과성을 시험하는 것 외에는 선택의 여지가 없다. 다시 말하지만, 이 절차는 생물학적으로 일차적이기 때문에 교육instruction이 필요하지 않습니다. While most of the information stored in long-term memory is obtained from others, if no one is available from whom to borrow the information, it will need to be generated. Novel information is generated using a random generate and test procedure during problem solving. The procedure only is used when information is unavailable from one’s own or someone else’s long-term memory. When problem solvers do not have information indicating which moves should be made at a given point, they have no choice other than to randomly generate a move and test it for effectiveness with effective moves retained and ineffective ones jettisoned. Again, this procedure does not require instruction because it is biologically primary.
협소한 변화원칙 The Narrow Limits of Change Principle
인간의 인식을 다룰 때, 이 원리는 새로운 정보를 처리할 때 작업 기억력의 심각한 한계를 다룬다. 이 원리는 항상 인지 부하 이론의 중심이었고 1998년에 명확하게 설명되었습니다. 원리의 기본적인 가정은, 한 개인에 대해 일반적인 [작업 기억 용량]이 고정되어 있다는 것이다. 작업 기억력 고갈이 인지 노력 후에 발생하고 휴식 후에 회복된다는 최근의 증거와 함께(Chen et al. 2018) 그러한 용량 변화를 허용하도록 가정을 수정해야 한다. (이 문제는 '미래 방향' 섹션에서 자세히 설명합니다.) When dealing with human cognition, this principle refers to the severe limitations of working memory when processing novel information. This principle has always been central to cognitive load theory and was clearly articulated as such in 1998. A basic assumption of the principle has been that for any given individual, general working memory capacity is fixed. With recent evidence that working memory depletion occurs after cognitive effort and recovers after rest (Chen et al.2018), that assumption must be modified to allow such capacity variations. (This issue is discussed further in the ‘Future Directions’ section.)
환경정리 및 연계원칙 The Environmental Organising and Linking Principle
[작업 기억]은 새로운 정보를 처리하는 경우에는 제한이 생기지만, 익숙하고 조직된 정보가 장기 기억에서 처리될 때는 알려진 한계가 없다. 정보가 장기 기억에 저장되면 [환경적 단서]를 사용하여 해당 환경에 적합한 작업을 생성할 수 있습니다. 이러한 방식으로, 이 원칙은 [(특정) 환경에 적합한 행동을 관장하기 위해 사용될 지식]을 [장기 기억]으로 구성하는데 사용될 수 있다. 이미 조직되고 저장된 정보를 이러한 방식으로 사용하기 위한 추진력은 생물학적으로 가장 중요하며 교육비용tuition이 필요하지 않습니다. 이 원리는 인지 부하 이론의 1998년 버전에서 크게 강조되었다.
While working memory is limited when processing novel information, there are no known limits when familiar, organised information from long-term memory is processed. Once information is stored in long-term memory, environmental cues can be used to generate actions appropriate to that environment. In this manner, the previous principles can be used to construct knowledge in long-term memory that can be used to govern action that is appropriate to the environment. The impetus to use previously organised and stored information in this fashion is biologically primary and does not require tuition. This principle was heavily emphasised in the 1998 version of cognitive load theory.
이 인지 아키텍처는 (대부분의 교육 프로그램에서 다루는) [생물학적 2차, 영역-특이적 내용]을 다룰 때 [명시적 교육explicit instruction]의 중요성을 강조하는 [인지 부하 이론]의 기초를 제공한다. 또한 새로운 교육instructional 절차를 생성의 성공에 대한 설명을 제공한다. 교육은 명시적이어야 한다. 왜냐하면
우리는 [차용과 재조직의 원리]를 통해 다른 사람들로부터 직접 배우도록 진화해왔기 때문이다.
[협소한 변경 원리]에 따라, 작업 메모리 로드는 주로 새로운 도메인별 정보를 처리할 때 발생하기 때문에 작업 메모리 로드를 줄이는 방식으로 구성될 필요가 있다.
[차용과 재조직 원리]를 사용하여 다른 사람들로부터 정보를 얻는 것은, [창조의 임의성 원리]를 사용하여 정보를 직접 생성하는 방식에 비해 작업 기억 부하를 감소시킨다.
[정보 저장 원리]를 통해 정보를 입수하여 장기 메모리에 저장하면 작업 메모리의 한계가 사라진다.
[환경 구성 및 연결 원리]를 이용하여 작업 기억으로 정보를 다시 전송한다면, 적절한 작업을 수행할 수 있습니다.
This cognitive architecture, with its emphasis on the importance of explicit instruction when dealing with the biologically secondary, domain-specific content that is characteristic of most educational programs, provides a base for cognitive load theory and an explanation for its success in generating novel instructional procedures. Instruction should be explicit
because we have evolved to learn directly from other people via the borrowing and reorganising principle.
In line with the narrow limits of change principle, it needs to be organised in a manner that reduces working memory load because working memory load primarily occurs when processing novel, domain-specific information.
Obtaining information from others using the borrowing and reorganising principle reduces working memory load compared to generating information ourselves using the randomness as genesis principle.
Once information has been obtained and stored in long-term memory via the information store principle, the limitations of working memory disappear and
the information can be transferred back to working memory using the environmental organising and linking principle to generate appropriate action.
4C/ID 및 인지 부하 4C/ID and Cognitive Load
인지 부하 이론은 근거에 입각한 원칙을 제공한다. 이 원칙은 레슨, 텍스트와 그림으로 구성된 서면 자료, 교육용 멀티미디어(교육용 애니메이션, 비디오, 시뮬레이션, 게임)와 같이 [교육용 메시지] 또는 [비교적 짧은 교육 단위 설계]에 적용할 수 있다. 학습 및 교육 설계(예: Wickens 2008)보다는 작업장 성과에 초점을 맞춘 정신적 작업 부하 모델 및 멀티미디어 자료 설계에 배타적으로 초점을 맞춘 멀티미디어 학습 인지 이론(CTML; Mayer 2014)과 몇 가지 원칙을 공유한다. 인지 부하 이론과 정확히 동일한 인지 구조에 기초하고 완전히 병렬로 개발된 밀접하게 관련된 모델은 4개 요소 지시 설계(4C/ID)이다. 4C/ID 모델은 [더 긴 기간의 교육 프로그램 설계(예: 과정 또는 전체 커리큘럼)에 초점]을 맞추기 때문에 인지 부하 이론으로 중요한 확장을 제공한다. Cognitive load theory provides evidence-informed principles that can be applied to the design of instructional messages or relatively short instructional units, such as lessons, written materials consisting of text and pictures, and educational multimedia (instructional animations, videos, simulations, games). It shares several of its principles with mental workload models, which focus on workplace performance rather than learning and instructional design (e.g. Wickens2008), and with the cognitive theory of multimedia learning, which has an exclusive focus on the design of multimedia materials (CTML; Mayer2014). A closely related model that is based on precisely the same cognitive architecture as cognitive load theory and that has been developed fully in parallel is four-component instructional design (4C/ID). The 4C/ID model provides an important extension to cognitive load theory because it focuses on the design of educational programs of longer duration (e.g. courses or whole curricula).
4C/ID에 대한 최초의 설명은 1992년(van Merrienboer et al. 1992)과 4C/ID 모델에 대한 최초의 완전한 설명을 제공하는 복합 인지능력 훈련(Training Complex Cognitive Skills)이라는 책이 1998년 인지부하 논문(van Merrienboer 1997)과 같은 시기에 등장했다. 4C/ID 모델은 복잡한 기술이나 전문 역량 개발을 목표로 하는 학습 과정에서 높은 요소 상호작용성으로 특징지어지는 복잡한 학습을 독점적으로 다룬다.
[4C/ID의 첫 번째 기본 가정]은 복잡한 기술에는 업무와 상황에 대해 일관되고 일상적으로 개발될 수 있는 'recurrent' 기술뿐만 아니라 문제 해결, 추론 및 의사결정에 의존적인 'non-recurrent' 기술이 포함된다는 것이다(반 메리언보어 2013).
[두 번째 기본 가정]은 복잡한 기술 개발을 목표로 하는 과정이나 프로그램은 항상 네 가지 구성 요소로 구성될 수 있다는 것이다(그림 1 참조).
(1) 학습 과제,
(2) 지원 정보,
(3) 절차 정보
(4) 파트 과제 연습
The first description of 4C/ID appeared in 1992 (van Merriënboer et al.1992) and the bookTraining Complex Cognitive Skills, which provided the first complete description of the 4C/ID model, appeared in the same period as the 1998 cognitive load article (van Merriënboer1997). The 4C/ID model exclusively deals with complex learning, which is characterised by high element interactivity in a learning process that is often aimed at the development of complex skills or professional competencies.
A first basic assumption of 4C/ID is that complex skills include ‘recurrent’ constituent skills, which are consistent over tasks and situations and can be developed into routines, as well as ‘non-recurrent’ constituent skills, which rely on problem solving, reasoning and decision-making (van Merriënboer 2013).
A second basic assumption is that courses or programs aimed at the development of complex skills can always be built from four components:
학습 과제(그림 1의 빅 서클에 표시)는 가급적이면 실생활 과제를 기반으로 하며, 이러한 과제를 수행함으로써 학습자는 비반복 및 반복 구성 기술을 모두 습득하고 이를 조정하는 법을 배운다.
첫째, [내재적 인지 부하]를 관리하기 위해, 학습 과제는 복잡성 증가 수준에 따라 먼저 조직된다(그림 1의 일련의 학습 과제 주위에 점선 상자로 표시).
따라서 학습자는 간단한 학습 과제에서 일하기 시작하지만 전문 지식을 습득할수록 더 복잡한 과제(즉, 나선형 커리큘럼)를 수행한다.
둘째, [외재적 인지 부하]를 관리하기 위해 각 복잡성 수준에서 학습자 지원 및 지침이 점진적으로 감소한다(그림 1의 각 복잡성 수준에서 원의 채우기 감소로 나타남).
따라서 학습자는 처음에는 많은 지원과 지도를 받지만, 지원/지도를 받지 않고 특정 수준의 복잡성으로 학습 과제를 수행할 수 있을 때까지, 지원/지도를 점차적으로 감소하게 된다. 그 다음에야 학습자는 처음에 많은 지원/지도를 받는 더 복잡한 학습 과제를 계속 수행하게 된다. 이 모든 과정이 반복된다.
4C/ID 모델은 fading-guidance에 대한 몇 가지 접근방식을 설명하지만, [worked example] => [completion task] => [conventional task]로 이어지는 완수 전략이 특히 중요하다.
셋째, [본유적 처리]를 자극하기 위해, 과정이나 프로그램의 모든 학습 과제는 연습의 높은 가변성(각 학습 과제마다 위치가 다른 삼각형으로 표시)을 통해 학습자가 과제를 서로 비교하고 대조하도록 자극한다.
Learning tasks (indicated by the big circles in Fig.1) are preferably based on real-life tasks and by performing these tasks learners acquire both non-recurrent and recurrent constituent skills and learn to coordinate them.
In order to manageintrinsiccognitive load, learning tasks are first organised according to levels of increasing complexity (indicated by dotted boxes around series of learning tasks in Fig.1);
thus, learners start to work on simple learning tasks but the more expertise they acquire the more complex the tasks they work on (i.e. a spiral curriculum).
Second, in order to manageextraneouscognitive load, learner support and guidance gradually decrease at each level of complexity (indicated by the diminishing filling of the circles at each level of complexity in Fig.1);
thus, learners first receive a lot of support and guidance but support/guidance gradually decreases until learners can perform the learning tasks at a particular level of complexity without support/guidance—only then, they continue to work on more complex learning tasks for which they initially receive a lot of support/guidance again, after which the whole process repeats itself.
The 4C/ID model describes several approaches to fading-guidance but the completion strategy,
from studying worked examples
via completion tasks
to conventional tasks, is a particularly important one.
Third, in order to stimulategermaneprocessing, all learning tasks in a course or program show high variability of practice (indicated by the triangles at different positions in the learning tasks), stimulating learners to compare and contrast tasks with each other.
[지원 정보supportive information (그림 1의 L자 형태로 표시)]는 학습자가 학습 과제의 [비반복적 측면(예: 문제 해결, 추론, 의사결정)]의 수행을 배우는 데 도움이 된다. 그것은 영역이 어떻게 조직되고 (흔히 '이론'이라고 불린다) 도메인 내 과제들이 체계적으로 접근될 수 있는지를 설명한다; 그것은 [복잡성 수준]과 연결된다. 왜냐하면 더 복잡한 과제를 수행하기 위해서, 학습자들은 더 많은 또는 더 정교한 지원 정보를 필요로 하기 때문이다. 학습자가 이미 알고 있는 것과 학습 과제를 성공적으로 수행하기 위해 알아야 할 것 사이의 다리를 제공합니다. [학습 과제를 하는 것]과 [지원 정보를 공부하는 것]은 모두 지식 구축을 목표로 한다(순서, 귀납적 학습과 정교화를 통해). Supportive information (indicated by the L-shapes in Fig.1) helps learners learn to perform the non-recurrent aspects of learning tasks (i.e. problem-solving, reasoning, decision-making). It explains how the domain is organised (often called ‘the theory’) and how tasks in the domain can be systematically approached; it is connected to levels of complexity because for performing more complex tasks, learners need more, or more elaborated, supportive information. It provides a bridge between what learners already know and what they need to know to successfully carry out the learning tasks. Both the work on the learning tasks and the study of supportive information aim at knowledge construction (through, in order, inductive learning and elaboration).
[지원 정보supportive information ]는 일반적으로 [높은 상호작용 요소]를 가지기 때문에, 학습자가 학습 과제를 수행하는 동안에는 제공하지 않는 것이 바람직합니다. 학습과제를 수행하면서 동시에 지원 정보를 공부하는 것은 거의 확실히 인지 과부하를 일으킬 것이다. 그보다는, 학습자가 [학습 과제에 착수하기 전] 또는 적어도 [학습 과제에 대한 작업과는 별개]로 지원 정보를 제공하는 것이 가장 좋습니다. 이러한 방식으로 학습자는 작업 기억에서 나중에 활성화될 수 있는 장기 기억에서 지식 구조를 구성할 수 있으며 과제 수행 중에 추가로 재구성되고 조정될 수 있다. 이미 구성된 인지 구조를 검색하는 것은 작업 수행 중에 작업 기억에서 외부에 제시된 복잡한 정보를 활성화하는 것보다 인지적으로 덜 요구될 것으로 예상된다.
Because supportive information typically has high element interactivity, it is preferable not to present it to learners while they are working on the learning tasks. Simultaneously performing a task and studying the supportive information would almost certainly cause cognitive overload. Instead, supportive information is best presented before learners start working on a learning task, or, at least apart from working on a learning task. In this way, learners can construct knowledge structures in long-term memory that can subsequently be activated in working memory and be further restructured and tuned during task performance. Retrieving the already constructed cognitive structures is expected to be less cognitively demanding than activating the externally presented complex information in working memory during task performance.
[절차적 정보(위쪽 방향 화살표가 있는 검은색 빔으로 표시)]와 [부분 작업 연습(작은 원 시리즈로 표시)]은 학습자가 지식 자동화를 목표로 하는 학습 과제의 [반복적인 측면recurrent aspects]을 학습하는 데 도움이 된다.
절차 정보는 'how-to instruction'과 수정 피드백corrective feedback으로 구성되며,
절차 정보는 일반적으로 지원 정보보다 훨씬 낮은 상호작용 요소를 가지고 있다.
인지 부하 관점에서, 절차 정보는 학습자가 학습 과제에 대한 작업 중 just-in-time에 제시하는 것이 최선이다.
왜냐하면 (자동화의 한 하위 프로세스) [인지적 규칙의 형성]은 관련성 있는 정보가 이러한 규칙에 포함될 수 있도록 [작업 수행 중 작업 기억에서 활성화되어야 하기 때문이다.
예를 들어, 교사가 연습 중에 학습자에게 '학습자의 어깨너머로 보는 보조자' 역할을 하는 단계별 지시를 하는 경우이다.
Procedural information (indicated by the black beam with upward pointing arrows in Fig.1) and part-task practice (indicated by the series of small circles in Fig.1) help learners learn to perform the recurrent aspects of learning tasks—they aim at knowledge automation.
Procedural information consists of ‘how-to instructions’ and corrective feedback and
typically has much lower element interactivity than supportive information.
From a cognitive load perspective, it is best presented just-in-time, precisely when learners need it during their work on the learning tasks,
because the formation of cognitive rules (one subprocess of automation) requires that relevant information is active in working memory during task performance so that it can be embedded in those rules.
That is, for example, the case when teachers give step-by-step instructions to learners during practice, acting as an ‘assistant looking over the learners’ shoulder’.
마지막으로, 특정 반복 작업recurrent task 측면의 [부분 작업 연습]은 인지적 규칙(자동화의 또 다른 하위 프로세스)을 더욱 강화할 수 있다.
일반적으로 [부분 작업 연습]에 과도하게 의존하는 것은 복잡한 학습에는 도움이 되지 않지만,
기본적이거나 중요한 반복 구성 기술(예: 초등교육의 곱셈표, 보건직업 프로그램의 의료기기 운영)을 완전히 자동화하면 전체 학습 수행과 관련된 인지 부하를 줄임으로써 작업 수행 및 학습에 필요한 처리 리소스를 확보할 수 있습니다.
Finally, part-task practice of selected recurrent task aspects may further strengthen cognitive rules (another subprocess of automation).
In general, an over-reliance on part-task practice is not helpful for complex learning
but fully automating basic or critical recurrent constituent skills (e.g. the multiplication tables in primary education, operating medical instruments in a health professions program) may decrease the cognitive load associated with performing the whole learning tasks and so free up processing resources for performing and learning non-recurrent task aspects.
1998년 이후 기술된 지시 효과 Instructional Effects Described After 1998
이 절은 1998년과 2018년 사이에 연구되고 보고된 가장 중요한 인지 부하 영향을 설명할 것이다. 표 1의 하단에 8개의 새로운 효과가 나열되어 있다. 그러나, 우리는 1998년 이전에 이미 알려져 있지만 1998년 기사에서 인지 부하 효과로 제시되지 않은 요소 상호작용 효과에 대해 논의함으로써 이 절을 시작할 것이다. [요소 상호작용 효과]를 앞에서 열거하지 않은 이유는, 이것이 '단순한' 효과가 아니라 다른 인지 부하 효과의 특성을 변화시키는 효과인 소위 [복합 효과compound effect]이기 때문이다. 1998년 기사에서는 [단순 효과simple effect]만 보고되었다. 복합 효과는 종종 다른 인지 부하 효과의 한계를 나타낸다. 아래에서 논의한 8개의 새로운 효과(요소 상호작용 효과 제외) 중 4개도 복합 효과로 분류되어 먼저 논의된다. 이러한 이론은 단순한 효과뿐만 아니라 단순한 효과의 범위를 제한하는 고차 효과를 포함하기 때문에 이것은 이론이 성숙해가는 표시maturing theory로 볼 수 있다. This section will describe the most important cognitive load effects that have been studied and reported between 1998 and 2018. Eight new effects are listed in the bottom part of Table1. We will, however, begin this section by discussing the element interactivity effect, an effect already known before 1998 but not presented as a cognitive load effect in the 1998 article. The reason for not previously listing the element interactivity effect is that it is not a ‘simple’ effect but a so-calledcompound effect, which is an effect that alters the characteristics of other cognitive load effects. In the 1998 article, only simple effects were reported. Compound effects frequently indicate the limits of other cognitive load effects. Four of the eight new effects (excluding the element interactivity effect) discussed below are also classified as compound effects and are discussed first. This may be seen as an indication of a maturing theory, because such a theory not only includes simple effects but also higher-order effects that limit the reach of simpler effects.
요소 상호작용 효과 Element Interactivity Effect
이 효과는 1998년에 이미 알려져 있었지만 복합 효과로서 인지 부하 효과로 분류되지는 않았다(스웰러 1994 참조). [요소 상호작용이 높은 정보]를 사용하여 얻을 수 있는 효과가 [요소 상호작용이 낮은 자료]를 사용했을 때 사라지거나 역효과로 나타나는 것을 의미한다. 요소 상호작용은
[전문성 역전 효과]를 입증할 때 발생하는 전문성 수준을 변경하거나(아래 설명 참조)
더 높거나 낮은 수준의 요소 상호작용을 통합하기 위해 학습자료를 변경함으로써 변경될 수 있다.
This effect was already known in 1998 but as a compound effect, it was not classed as a cognitive load effect (see Sweller1994). It occurs when effects that can be obtained using high element interactivity information disappear or reverse using low element interactivity material. Element interactivity can be altered either
by altering levels of expertise as occurs when demonstrating the expertise reversal effect (see description below) or
by changing the material to incorporate either higher or lower levels of element interactivity.
학습자가 높은 요소 상호작용에서 낮은 요소 상호작용으로 처리해야 하는 정보의 변경으로 인해 변경된 교육적 이점의 예는 Chen 외(2015, 2016, 2017)에서 찾을 수 있다. 그들은 학생들이 문제를 풀기 위해 배워야 하는 [고-요소 상호작용성 수학 자료]를 사용하여 전통적인 예제 효과를 얻었다. 대조적으로, 학생들이 수학적 정의를 배워야 했던 [저-요소 상호작용 자료]는 역효과를 낳았다. 적절한 반응을 이끌어 내도록 요구된 학생들은 올바른 반응을 보인 학생들보다 더 많이 배웠다.
Examples of changed instructional advantages due to changing information that learners must process from high to low element interactivity may be found in Chen et al. (2015,2016,2017). They obtained a conventional worked example effect using high element interactivity mathematical material in which students had to learn to solve problems. In contrast, low element interactivity material in which students had to learn mathematical definitions yielded a reverse worked example effect. Students who were required to generate an appropriate response learned more than students who were shown the correct response.
전문성 역전 효과 Expertise Reversal Effect
본질적으로, [전문성 역전 효과]는 [요소 상호작용 효과]의 변형이다. 1998년 이전까지, 인지 부하 효과는 높은 요소 상호작용 정보를 처리하는 초보 학습자를 사용하여 얻었다. [전문성이 증가]하면, 요소 상호작용성은 [환경 구성 및 연결 원리]로 인해 감소합니다.
전문지식이 증가함에 따라, [여러 요소로 구성된 개념과 절차]는 (적절한 환경에서 사용하기 위하여 작업 기억으로 전달되는) [단일 요소]로 장기 기억에 저장될 수 있다.
여러 상호작용 요소를 다루는 초보자를 위해 설계된 교육 절차는 전문지식이 증가하고 상호작용 요소가 장기 기억에 저장된 지식 구조에 내장됨에 따라 역효과를 낼 수 있다.
결과적으로, 전문지식이 증가함에 따라 위의 효과는 처음에는 크기가 감소했다가 사라지고 결국 역전될 수 있다(Kalyuga 등, 2003, 2012). 예를 들어, worked examples는 초보자에게 이익이 된다. 지식이 증가함에 따라, 문제를 해결하는 연습은 부정적인 영향을 끼치기 보다는 점점 더 중요해지고 있다.
The expertise reversal effect is, in essence, a variant of the more general element interactivity effect (Chen et al.2017). The pre-1998 cognitive load effects can be obtained using novice learners processing high element interactivity information. With increases in expertise, element interactivity decreases due to the environmental organising and linking principle.
Concepts and procedures that consisted of multiple elements can, with increases in expertise, be stored in long-term memory as a single element that is transferred to working memory for use in appropriate environments.
Instructional procedures designed for novices dealing with multiple, interacting elements can be counterproductive as expertise increases and the interacting elements become embedded in knowledge structures held in long-term memory.
As a consequence, with increasing expertise, the above effects first decrease in size, then disappear, and can eventually reverse (Kalyuga et al.2003,2012). For example, worked examples benefit novices. With increasing knowledge, practice at solving problems becomes increasingly important rather than having negative effects.
가이드-페이딩 효과 Guidance-Fading Effect
[가이드-페이딩 효과]는 [요소 상호작용 효과] 및 [전문성 역전 효과]와 밀접하게 관련되어 있으며, [중복성 효과]가 중심인 또 다른 [복합 효과coumpound effect]이다.
초보자에게는 추가 정보 또는 작업 예제 연구와 같은 특정 활동이 필수적일 수 있습니다.
전문지식이 증가함에 따라 이러한 동일한 활동이 중복될 수 있으며 불필요한 인지 부하를 부과할 수 있다.
어느 시점을 지나면, worked example를 공부하는 것은 역효과를 낼 수 있으므로, faded out되고, 그냥 문제로 대체되어야 한다.
The guidance-fading effect is another compound effect that is closely related to the element interactivity and expertise reversal effects and for which the redundancy effect is central too.
For novices, additional information or particular activities such as studying worked examples may be essential.
With increases in expertise, these same activities may become redundant and impose an unnecessary cognitive load.
Past a certain point, studying worked examples may be counterproductive and they should be faded out and replaced by problems.
이 일반적인 원칙은 [학습자들이 점진적으로 해당 영역에서 더 많은 전문지식을 습득하는 더 긴 기간의 교육 프로그램]에 특히 중요하다. 예를 들어, 그것은 1학년 학생들을 위한 교육 방법이 3학년 학생들을 위한 교육 방법과 다를 필요가 있다는 것을 나타낸다. 3학년 학생들은 영역에 대한 훨씬 더 많은 지식을 갖고 있기 때문이다.
[요소 상호작용 효과]는 낮은 요소 상호작용 대 높은 요소 상호작용 자료와 관련이 있고,
[전문성 역전 효과]는 낮은 전문성 학습자와 높은 전문성 학습자와 관련이 있는 반면,
[지침 페이딩 효과]는 긴 교육 프로그램에서 [프로그램의 시작]과 [프로그램의 끝]의 비교와 관련이 있다.
This general principle is particularly important for educational programs of longer duration, in which learners gradually acquire more expertise in the domain; it indicates, for instance, that instructional methods for first-year students need to be different from instructional methods for third-year students, simply because third-year students have much more knowledge of the domain.
Whereas the element interactivity effect pertains to low element interactivity versus high element interactivity materials, and
the expertise reversal effect pertains to low expertise learners and high expertise learners,
the guidance-fading effects thus pertains to the beginning of a longer educational program versus the end this program.
지침 페이딩 효과의 전조forerunner는 완료 전략completion strategy으로, 여기서 교육 프로그램은 작업 예제를 제공하는 것으로 시작하고, 학습자가 솔루션의 점점 더 큰 부분을 완료해야 하는 완료 문제가 뒤따른다
A forerunner of the guidance-fading effect is the completion strategy, where the educational program starts with providing worked examples, followed by completion problems for which the learners must complete increasingly larger parts of the solution and ending with conventional problems (van Merriënboer and Krammer1990).
일시적 정보 효과 Transient Information Effect
[일시적 정보]는 학습자에게 제공되긴 하나, 몇 초 후에 사라지는 정보입니다(예: 음성 텍스트, 교육용 비디오 또는 애니메이션).
[비-일시적 정보(예: 그림이 있는 서면 텍스트)]의 경우, 모든 정보는 학습자가 동시에 사용할 수 있으며 필요할 때 다시 검토할 수 있다.
[일시적 정보]의 경우, 학습자가 [후속 처리를 위해 작업 기억에 정보를 적극적으로 유지]시켜야 하므로, 외부 인지 부하가 늘어나고, 따라서 학습을 저해한다
Transient information is information that is presented to learners but disappears after a few seconds, for example, in spoken text or in instructional video or animation (Leahy and Sweller2011).
For non-transient information (e.g. a written text with pictures), all information is available to the learner at the same time and may be revisited when needed;
for transient information, it may be necessary for the learner to actively retain information in working memory for later processing which increases extraneous cognitive load and so reduces learning.
이러한 부정적인 효과를 극복하기 위해 [자기-페이싱] 또는 [분할]과 같은 많은 보완적 전략을 사용할 수 있습니다.
[자기 페이스 효과]는 학습자에게 교육 애니메이션의 속도에 대한 제어권을 주는 것이 유익하다는 것으로 보고되었다. 아마도 그것이 이 정보의 일시적인 특성을 다루는 데 도움이 되기 때문일 것이다.
[분할 효과]는 분할된 애니메이션(즉, 중간중간 정지된 부분으로 분할된)이 초보 학습자에게는 연속 애니메이션보다 효율적이지만, 사전 지식이 높은 학습자에게는 그렇지 않다는 것을 발견했다.
마지막 예로, 마지막 예로 Leahy와 Sweller(2011, 2016)는 [제시양식modality 효과]에 대한 [일시적 정보]의 상호작용 효과를 보고했다.
[시청각 정보의 짧은 부분]은 시각 정보만 있는 경우보다 효과적이었다(예: 전통적인 양식 효과).
그러나 [시청각 정보의 긴 부분]은 청각적 부분에 유지시켜야 할 [일시적 정보]가 너무 많아서, 시각 정보보다 덜 효과적이었다.
To overcome these negative effects, a number of compensatory strategies are available such as self-pacing or segmentation.
The self-pacing effect was reported by Mayer and Chandler (2001), who found that it was beneficial to give learners control over the pace of an instructional animation, probably because it helps them deal with the transient nature of this information.
The segmentation effect was reported by Spanjers et al. (2011), who found that segmented animations (i.e. segmented in parts with pauses in between) were more efficient than continuous animations for novice learners, but not for learners with higher levels of prior knowledge.
As a final example, Leahy and Sweller (2011, 2016) reported an interaction effect of transient information on the modality effect:
short pieces of audio-visual information were more effective than visual information only (i.e. traditional modality effect), but
longer pieces of audio-visual information were less effective than visual information only because of the abundance of transient information in the longer, auditory piece.
자기 관리 효과 Self-Management Effect
[자기 관리 효과]는가장 최근의 효과 중 하나이다. [자기 관리 효과]는 학생들이 자신의 인지 부하를 관리하기 위해 [CLT 원칙을 스스로 적용하도록 가르칠 수 있다]는 가정에 기초한다. 이상적으로 학생들은 인지 부하를 고려하여 설계된 자료에만 접근해야 한다. 그러나 현실에서 인터넷은 누구나 정보를 만들고 공유할 수 있어서, 학생들은 [인지 부하를 고려하지 않은 상태로 설계된 저품질의 학습 자료]에 직면하게 될 가능성이 더 높다. 자신의 인지 부하(인지 부하에 대한 자기 관리)를 위해 CLT 원칙을 직접 적용하도록 학습된 학생이, [CLT 원칙에 기초한 일관성 있고 잘 구성된 학습 자료의 교육 시스템에만 노출된 학생]보다 잘못 설계된 자료를 처리할 준비가 더 잘 되어 있다고 가정할 수 있다. One of the most recent effects, the self-management effect, is based on the assumption that students can be taught to apply CLT principles themselves to manage their own cognitive load. Ideally, students should only have access to materials that have been designed with a consideration of cognitive load. However, in reality, the Internet enables information to be created and shared by anyone, which makes it more likely that students will be confronted with low-quality learning materials that have not been designed with any consideration of cognitive load. It can be hypothesised that students who are taught to apply CLT principles themselves to manage their own cognitive load (self-management of cognitive load) are better equipped to deal with these badly designed materials than students who are only exposed to an education system of consistent, well-structured learning materials based on CLT principles.
지금까지 자기 관리 효과는 [주의 분할 학습 자료]로만 연구되어 왔다. 일반적으로 자가 관리 효과를 조사하는 연구는 두 단계로 구성된 세 가지 실험 조건을 비교하였다.
첫 번째 단계에서는 두 가지 실험 조건의 학생들이 멀티미디어 학습 자료를 분할 주의 형식으로 공부한다.
자기 관리 조건에서 학생들은 예를 들어 텍스트와 도표를 재구성하여 자신의 인지 부하를 스스로 관리하는 방법을 배운다.
세 번째, 신체적으로 통합된 조건에서 학생들은 강사가 관리하는 신체적으로 통합된 형식으로 동일한 자료로부터 배웁니다.
두 번째 단계에서는 세 가지 조건 모두에서 학생들은 다른 영역에서 동일한 분할 주의 학습 자료를 받는다. 자기관리 효과를 입증하는 가장 중요한 연구결과는 리콜 및 편입시험의 자기관리 조건에서 학생들의 우수한 성적에 반영된다.
Until now, the self-management effect has only been studied with split-attention learning materials. Typically, studies investigating the self-management effect compare three experimental conditions and consist of two phases (see Roodenrys et al.2012; Sithole et al.2017).
In the first phase, students in two experimental conditions study multimedia learning materials in a split-attention format.
In the self-management condition, students are instructed how to self-manage their cognitive load, for example, by reorganising text and diagrams.
In the third, physically integrated condition, students learn from the same materials in an instructor-managed physically integrated format.
In the second phase, students in all three conditions are presented with the same split-attention learning materials in another domain. The most important finding demonstrating the self-management effect is reflected in superior performance of the students in the self-management condition on recall and transfer tests.
자기 설명 효과 Self-Explanation Effect
[자기 설명 효과]는 인지 부하 이론과 독립적으로 입증되었지만, 이 이론으로 설명할 수 있다. 그것은 작업 예제 효과에서 비롯되며 인지 부하 이론의 맥락에서 렌클 외 연구진(1998)에 의해 처음 설명되었다. 위에서 설명한 바와 같이,
Worked example은, 학습자들이 이것을 늘 주의 깊게 공부하는 것은 아니며, 그저 기존의 문제를 해결하기 전에 간단히 스캔만 할 수 있습니다. 이 경우, 작업한 예는 학습에 긍정적인 영향을 주지 않을 것이다.
연습에서의 Variability는, 학습자가 서로 다른 예제를 비교하고 대조하도록 자극하기 때문에 예제를 더 깊이 처리하는 데 도움이 될 수 있습니다. 그러나 이는 두 개 이상의 예가 제시되면서, 본유적 처리로 인해 증가하는 총 부하가 작업 기억의 용량 한계를 넘지 않았을 때에만 작동합니다.
The self-explanation effect was demonstrated independently of cognitive load theory (Chi et al.1989) but can be explained by the theory. It stems from the worked example effect and in the context of cognitive load theory was first described by Renkl et al. (1998). As indicated above,
learners will not always be inclined to carefully study worked examples and may only briefly scan them before trying to solve conventional problems. In this case, worked examples will not yield positive effects on learning.
Variability of practice might help learners to process the examples more deeply, because variation stimulates them to compare and contrast the different examples. But this will only work when more than one example is presented and when the total load, which increases due to the germane processing, remains within the capacity limits of working memory.
반면, 하나의 예만 사용할 수 있는 경우일지라도, 학습자에게 스스로 [정교한 자기 설명]을 유도하는 [자기 설명 프롬프트]를 제공할 수 있다. 여러 연구에 따르면 총 인지 하중이 가용 용량을 초과하지 않는 한 자기 설명 프롬프트가 없는 작업 예제는 작업 예보다 우수할 수 있다.
Alternatively, when only one example is available, one might provide the learner with self-explanation prompts that elicit sophisticated self-explanations from the learners. Several studies showed that worked examples combined with self-explanation prompts can be superior to worked examples without self-explanation prompts, provided that total cognitive load does not exceed available capacity.
상상 효과 Imagination Effect
학습자가 [운동 과제]를 [정신적으로 연습]하도록 요청받으면 학습이 향상된다는 사실은 한동안 알려져 왔다. 또한 개선이 발생하는 정도는 운동과제가 인지 구성요소를 갖는 정도에 따라 달라진다(Ginns 2005b). 이러한 연구결과는 학습자가 동등한 학습 자료를 연구하도록 요청한 것보다 개념이나 과정을 상상하거나 정신적으로 연습하도록 요청했을 때 발생하는 상상력의 효과의 초기 근원을 제공했다.
It has been known for some time that when learners are asked to mentally rehearse a motor task, learning is improved (Sackett1934). Furthermore, the extent to which improvement occurs depends on the extent to which the motor task has cognitive components (Ginns2005b). These findings provided the initial source of the imagination effect that occurs when learners asked to imagine or mentally rehearse a concept or process learn more than learners asked to study equivalent instructional material.
상상력이 발휘되기 위해서는, 학습자가 관련 개념이나 절차를 상상할 수 있어야 한다. 학습자가 작업 기억에서 정보를 처리할 수 있어야 한다.
특정 영역의 초보자는 새로운 정보를 다룰 때 작업 기억 한계 때문에 높은 요소 상호작용 정보를 적절하게 처리할 수 없을 수 있다. [초보자 학습자]에게는 무언가를 상상하는 것이 어렵거나 불가능할 수 있기 때문에, [정보를 상상하는 것]보다는 [정보를 공부하는 것]에서의 학습이 더 바람직하다.
[지식이 증가함에 따라 작업 메모리 한계가 확장]되고, 따라서 자료를 상상하는 것이 점점 더 실현 가능해집니다. 이는 작업 메모리에서 보다 쉽게 처리할 수 있기 때문이다. 정보를 적절히 상상할 수 있게 되면 imagination instruction이 study instruction보다 우수하다(Cooper et al. 2001). 그 시점까지는 study instruction이 imagination instruction보다 우수하다.
In order for an imagination effect to occur, learners must be able to imagine the relevant concepts or procedures. They must be able to process the information in working memory.
Novices in a given area may be unable to adequately process high element interactivity information because of working memory limits when dealing with novel information. For such learners, imagination may be difficult or impossible and so studying the information results in enhanced learning compared to imagining the same information.
With increased knowledge, working memory limits expand and so imagining the material becomes increasingly feasible because it can be more readily processed in working memory. Once information can be adequately imagined, imagination instructions are superior to study instructions (Cooper et al. 2001). Until that point, study instructions are superior to imagination instructions.
격리 요소 효과 Isolated Elements Effect
일부 [매우 높은 요소 상호작용 정보]는 새로운 정보를 다룰 때 작업 기억 한계를 훨씬 초과하므로 작업 기억에서 처리할 수 없다. 그러나 여전히 그 정도로 복잡한 정보 역시 학습가능하기 때문에, 여기에 어떤 프로세스가 사용되는지에 대한 문제가 제기되었다(Pollock 등 2002). 폴록 등은 아마도 [개별 요소들이 그들 사이의 상호작용을 배우지 않고 먼저 학습되었을 것]이라는 가설을 세웠다. 일단 [개별 요소들이 장기 기억에 저장]되면, 요소들 사이의 상호작용을 학습함으로써 요소들을 후속적으로 통합하는 것이 가능할 수 있다. 만약 이 가설이 옳다면, [일단 개별 요소만 학습자에게 제시한 다음 개별 요소 및 상호 작용을 포함한 모든 정보를 제시하는 것]이, [전체 정보를 두 번 제시하는 것]보다 우월할 것이다. Some very high element interactivity information vastly exceeds working memory limits when dealing with novel information and so cannot be processed in working memory. Since such complex information can be learned, the question of which processes are used was raised (Pollock et al.2002). Pollock et al. hypothesised that perhaps individual elements were learned first without learning the interactions between them. Once the individual elements are stored in long-term memory, it may be feasible to subsequently integrate the elements by learning the interactions between them. If so, a sequence of only presenting the individual elements to learners followed by all of the information including both the individual elements and their interactions would be superior to presenting all of the information twice.
결과는 이 가설을 뒷받침했다.
학습자에게 [모든 정보를 두 번제시]했을 때는, 작업 메모리 부하가 과도해 어느 경우든 제대로 처리할 수 없었습니다.
이와는 대조적으로, 먼저 [쉽게 처리하고 장기 기억에 저장할 수 있는 분리된 요소]만 제시한 다음, 이후에 [완전히 통합된 정보를 제시]했을 때, 그들은 개별 요소들을 통합하는 방법만 배우면 되었다. 또한 전체, 높은 요소 상호작용 정보들을 더 쉽게 동화시킬 수 있었다.
Results supported this hypothesis.
Learners presented all of the information twice were unable to process it properly on either occasion due to an excessive working memory load.
In contrast, learners only presented the isolated elements could easily process them and store them in long-term memory. When subsequently presented the fully integrated information, they only needed to learn how to integrate the individual elements and so more readily assimilated the entire, high element interactivity information.
학습자가 [처음에는 단순하고, 낮은 요소 상호작용 버전]을 연습하고, [나중에는 점점 더 복잡한 버전의 과제를 연습]하는 단순-복잡한simple-to-complex 시퀀싱에서도 유사한 효과가 나타난다.
A similar effect is provided by simple-to-complex sequencing, where learners first practice simple, low element interactivity versions of a task and only later increasingly more complex versions of this task (van Merriënboer et al.2003; van Merriënboer and Sweller2005,2010).
집합 작업 메모리 효과 Collective Working Memory Effect
[집단 작업 기억 효과]는 Kirschner 등에 의해 처음 설명되었다. [협력적 학습자]는 [복수의 제한된 작업 기억으로 구성된 단일 정보 처리 시스템]으로 간주될 수 있다고 주장했다. 이 시스템은 더 크고, 더 효과적이며, 집합적인 작업 공간을 만들 수 있다.
이와 같은 [협력적 학습]에서는, 모든 그룹 구성원이 필요한 모든 지식을 보유하거나, 이용 가능한 모든 정보를 단독으로 처리할 필요가 없다. 대신에, 협력적 학습자들은 그룹의 다른 구성원들이 제공하는 지식과의 격차를 메울 수 있다.
그룹 구성원들 사이에 의사소통과 조정이 있는 한, 직무 내의 정보 요소와 직무의 본질적 성격에 의해 야기되는 관련 인지 부하는 더 큰 인지 능력 저장소로 나눌 수 있다.
그러나 의사소통과 조정은 그룹 구성원이 추가적인 인지적 노력(즉, 거래 비용)을 투자할 것을 요구한다.
The collective working memory effect was first described by Kirschner et al. (2009; see also2011), who argued that collaborative learners can be considered as a single information processing system consisting of multiple, limited working memories which can create a larger, more effective, collective working space.
In collaborative learning, it is not necessary that all group members possess all necessary knowledge, or process all available information alone and at the same time, when faced with a gap in their knowledge they can fill that gap from knowledge provided by other members of the group (borrowing).
As long as there is communication and coordination between the group members, the information elements within the task and the associated cognitive load caused by the intrinsic nature of the task can be divided across a larger reservoir of cognitive capacity.
However, communication and coordination require group members to invest an additional cognitive effort (i.e. transaction costs), an effort that individuals do not have to exert.
Kirschner 외 연구진(2011)은 높은 또는 낮은 인지 부하를 부과하는 과제에서, [그룹 학습 효율성] 대 [개인 학습 효율성]은 그룹 구성원 간의 [정보 처리의 편익]과 [거래 비용] 사이의 균형에 의해 영향을 받는다는 것을 보여주었다. 보다 구체적으로, 그들은 다음을 나타내는 상호 작용 효과를 발견했다.
높은 인지 부하를 부과하는 과제에서 배우는 것이 보다 효율적인 협업 학습을 유도하고
낮은 인지 부하를 부과하는 과제에서 배우는 것이 보다 효율적인 개별 학습을 초래한다
Kirschner et al. (2011) showed that the efficiency of group versus individual learning from tasks imposing a high or low cognitive load was affected by the trade-off between the benefits of dividing information processing among group members and the transaction costs. More specifically, they found an interaction effect, indicating that
learning from tasks imposing a high cognitive load led to more efficient collaborative learning, and
learning from tasks imposing a low cognitive load, resulted in more efficient individual learning.
높은 부하를 부과하는 학습 과제의 경우,
개별 학습자는, 정보를 성공적으로 처리할 수 있는 충분한 처리 능력을 가지고 있지 않았다.
협업 학습자는, 서로 [인지 부하를 분산시키는 이점]이 [거래 비용]보다 더 높은 것으로 입증되었습니다.
결과적으로, 학습자는 [여분의freed 인지 능력]을 학습을 촉진하는 활동에 헌신할 수 있었다.
낮은 인지 부하를 부과하는 학습 과제의 경우,
개별적으로 또는 협력적으로 일하는 학습자는 스스로 모든 정보를 처리할 수 있는 충분한 인지 능력을 가지고 있었다. 따라서, 정보의 개별 간 의사소통과 조정은 불필요했고, [협력 학습 과정에서 그룹 구성원들에게 인지 부하를 분배하는 이익]보다 [더 높은 거래 비용]을 초래했다.
결과적으로, 구성된 지식의 질적 차이는 개별적으로 학습한 사람들에게 더 높은 학습 효율로 나타났다.
For learning tasks imposing a high load,
individual learners did not have sufficient processing capacity to successfully process the information. For collaborative learners, the benefits of distributing the cognitive load among each other proved to be higher than the transaction costs.
Consequently, learners were able to devote the freed cognitive capacity to activities that fostered learning.
For learning tasks imposing a low cognitive load,
learners working either individually or collaboratively had sufficient cognitive capacity to process all information by themselves. Hence, inter-individual communication and coordination of information were unnecessary and resulted in transaction costs that were higher than the benefits of distributing the cognitive load across group members during the collaborative learning process.
Consequently, when cognitive load was low, qualitative differences in constructed knowledge materialised in higher learning efficiency for those who learned individually than for those who learned collaboratively.
휴먼 무브먼트 효과 Human Movement Effect
[일시적인 정보 효과]는 학생들이 일반적으로 [정적 시각화]보다 [동적 시각화]에서 학습이 저하되는 이유를 설명하는데 사용되었지만, [인간 움직임 효과]는 [인간의 움직임을 포함하는 인지 작업]을 가르치는 것에는 정적인 방법보다는 [애니메이션을 사용하는 것이 더 낫다]고 주장한다. 효과는 CLT 연구의 예상치 못한 발견에서 비롯되었으며, 이러한 연구의 공통점은 애니메이션과 정학statics을 사용하여 인간의 운동 기술을 가르쳤다는 것이다(예: 종이 접기, 매듭 묶기). Paas and Sweller (2012)는 [생물학적 일차적인 지식] 개념을 사용하여, 인간이 다른 사람들이 행동에 참여하는 것을 관찰하고 그것을 쉽게 복사할 수 있는 능력을 진화시켰다고 설명했다. 따라서 학습자에게 운동 기술을 배우기 위해 애니메이션을 관찰하도록 요청하는 것은 작업 기억력에 과도한 부담을 주지 않을 수 있습니다. Whereas the transient information effect has been used to explain why students generally learn less from dynamic than from static visualisations, the human movement effect holds that it is better to use animation rather than statics to teach cognitive tasks involving human movement. The effect originated from unexpected findings of CLT research, which indicated superior learning outcomes of transient visualisation formats over non-transient formats (e.g. Ayres et al.2009; Wong et al.2009). What these studies had in common was that they used animations and statics to teach human motor skills (e.g. paper folding, knot tying). Paas and Sweller (2012) used Geary’s (2008) concept of biologically primary knowledge to explain that humans have evolved the ability to learn from observing others engage in action and copy it effortlessly. Therefore, asking learners to observe an animation in order to learn a motor skill may not place an excessive burden on working memory resources.
이 아이디어는 애니메이션이 매우 현실적이고 절차-운동 지식이 관련되었을 때 우수한 학습(가장 큰 효과 크기)이 발견된다는 것을 보여준 Höffler와 Leutner(2007)의 메타 분석에 의해 확인되었다. 반 고그 등은 [휴먼 무브먼트 효과]는 행동을 실행하는 데 관여하는 동일한 피질 회로도 같은 행동을 실행하는 다른 사람을 관찰하는 것에 자동적으로 반응한다는 신경과학 연구의 발견을 반영한다고 제안했다. (즉, 거울 뉴런 시스템; Rizzolatti와 Craigheero 2004)
This idea was confirmed by a meta-analysis of Höffler and Leutner (2007), who showed that superior learning (the largest effect size) was found when the animations were highly realistic and procedural-motor knowledge was involved. Van Gog et al. (2009) have suggested that the human movement effect reflects the finding of neuroscience research that the same cortical circuits that are involved in executing an action oneself also automatically respond to observing someone else executing the same action (i.e. mirror neuron system; Rizzolatti and Craighero2004).
인지 부하 측정 Measuring Cognitive Load
1998년 기사의 출판 이후 인지 부하 측정과 관련된 이슈를 조사하기 위한 지속적인 연구 노력이 있어왔다. 따라서, 사람들은 지난 20년 동안 이러한 문제들에 관해 상당한 진전이 이루어졌을 것으로 예상할 수 있을 것이다. 여기서는 이러한 진행 상황을 평가하고 인지 부하 측정과 관련된 세 가지 주요 개발의 간략한 개요를 제시한다. Since the publication of the 1998 article, there has been an ongoing research effort to examine issues related to the measurement of cognitive load. Therefore, one would expect that in the past 20 years substantial progress has been made regarding these issues. Here, we evaluate this progress and present a concise overview of three major developments regarding the measurement of cognitive load.
첫 번째 중요한 발전은, Paas(1992)가 [인지 부하의 전반적인 측정]을 위해 처음 도입한 주관적 측정 기법의 specification와 관련이 있다. 비록 이 측정법이 좋은 사이코메트리 특성을 보여주는 광범위하고 성공적으로 사용되었지만, 일부 연구자들은 인지 부하를 측정하는 능력에 대해 회의적이다. 회의적인 연구자들은 심지어 생리학적 측정 기법과의 비교에서도 주관적 등급 척도가 객관적 기법만큼 유효하고 신뢰할 수 있으며 사용하기 쉽다는 것을 보여주더라도 그러했다 (예: Szulewski 등. 2018). The first important development is related to the further specification of the subjective measurement technique that was originally introduced by Paas (1992) to provide an overall measure of cognitive load. Although this measure has been extensively and successfully used showing good psychometric properties, some researchers remain sceptical about its capacity to measure cognitive load, even when comparisons with physiological measurement techniques have shown that the subjective rating scale is just as valid and reliable and easier to use as objective techniques (e.g. Szulewski et al.2018).
(생리학적 기법과 비교하면)주관적 기법의 주요 장점은 민감성과 단순성이다. 생리학적 측정 기법과 대조적으로 주관적 등급 척도는 투자한 정신적 노력과 작업 난이도의 작은 차이에 민감하다. 주관적 등급 척도의 단순성이 주요 강점으로 간주되는 반면, 연구와 실무에서 쉽게 사용할 수 있기 때문에, 많은 사람들이 주요 약점으로 간주하기도 한다. 주관적 측정의 단순성 덕분에, 인지 하중(즉, 내적 + 외부 하중)의 전체적인 측정을 제공하지만, 반면 서로 다른 유형의 인지 부하를 구별하는 데 쉽게 사용할 수 없다.
The main advantages of the subjective technique over physiological techniques are its sensitivity and its simplicity. In contrast to physiological measurement techniques, the subjective rating scale is sensitive to small differences in invested mental effort and task difficulty. Whereas the simplicity of the subjective rating scale is considered its major strength, because it can be easily used in research and practice, it is also considered by many as its major weakness. Due to its simplicity, it provides an overall measure of cognitive load (i.e. intrinsic plus extraneous load) and therefore cannot easily be used to differentiate between the different types of cognitive load.
이러한 약점이 인지 부하의 (온라인 측정으로 사용될 수 있는) '객관적' 측정 기법에 대한 검색뿐만 아니라 다양한 유형의 인지 부하를 구별하는 데 사용할 수 있는 기법에 대한 검색이 이루어졌다. 이 두 가지 연구 개발에 대해 더 자세히 논의하기 전에, 우리는 먼저 주관적인 등급 척도 기법의 진행 중인 추가 사양을 논의할 것이다.
This has resulted in a search for techniques that can be used to differentiate between the different types of cognitive load as well as a search for ‘objective’ measurement techniques that can be used as an online measure of cognitive load. Before these two research developments are discussed in more detail, we first will discuss the ongoing further specification of the subjective rating scale technique.
두 번째 발전은 [서로 다른 유형의 인지 부하를 구별할 수 있는 설문지를 설계함]으로써 [주관적 기법을 확장하는 것]과 관련이 있다. 여러 연구자들이 한 가지 특정 유형의 인지 부하(예: 2006)에서만 변화를 측정하려고 시도한 반면, 다른 연구자들은 다른 유형의 인지 부하(예: 시어니아크 등)를 측정하는 방법을 조사했다. 2009). 한 가지 주목할 만한 개발은 Leppink 외 연구진(2013, 2014)에 의해 설명되었는데, Leppink 외 연구진은 다양한 유형의 인지 부하가 여러 지표로 표현되는 새로운 사이코메트리 기기의 유용성을 조사했다. 저자들은 [내적 인지 부하]와 [외적 인지 부하]를 구별할 수 있다는 가정을 뒷받침한다고 결론지었다. 예를 들어, 다른 질문을 사용하고 다른 영역을 살펴봄으로써 더 많은 경험적 증거가 필요하다는 것이 분명하지만, 지금까지의 결과를 살펴보면, 서로 다른 유형의 인지 부하를 구별하는 측정도구의 능력에 관해 긍정적으로 평가하고 있다. The second development is related to extending the subjective technique by designing questionnaires that can differentiate between the different types of cognitive load. Whereas several researchers have tried to measure only changes in one specific type of cognitive load (e.g. Ayres2006), others have investigated methods to measure the different types of cognitive load (e.g. Cierniak et al.2009). One notable development was described by Leppink et al. (2013,2014), who investigated the usefulness of a new psychometric instrument in which the different types of cognitive load were represented by multiple indicators. The authors concluded that the results of both studies provided support for the assumption that intrinsic and extraneous cognitive load can be differentiated using their 10-item psychometric instrument. Although it is clear that more empirical evidence is needed, for example, by using different questions and looking at different domains, the results so far are promising regarding the instrument’s capability of distinguishing between different types of cognitive load.
세 번째 발전은 [인지 부하의 보다 객관적인 측정치]를 찾기 위한 노력과 관련이 있으며, 여전히 진행중이다. 이를 위해 인지 부하 연구자들은 인지 부하에 대한 [2차 작업 기법]과 생리학적 측정을 사용해 왔다. [제한된 작업 기억 용량의 가정]에 기초하여, [2차 작업 기법]은 1차 작업에 의해 부과되는 인지 부하의 지표로서 2차 작업에 대한 성능을 사용한다. 2차 작업에 대한 저성능 또는 고성능은 1차 작업에 의해 부과되는 높은 인지 부하와 낮은 인지 부하를 나타낸다고 가정한다. The third development is related to the ongoing efforts to find more objective measures of cognitive load. To this end, cognitive load researchers have been using secondary task techniques and physiological measures of cognitive load. Based on the assumption of a limited working memory capacity, secondary task techniques use performance on a secondary task as an indicator of cognitive load imposed by a primary task. It is assumed that low or high performance on the secondary task are indicative of high and low cognitive load imposed by the primary task.
최근 2차 과제 기법의 예로는 박 교수와 브룬켄 교수(2015)가 개발한 리듬법이 있다. Korbach 외 연구진(2017)은 이 기법이 정신 애니메이션 그룹, 유혹적인 세부 그룹 및 제어 그룹 사이의 가설된 인지 부하 차이에 민감하다는 것을 보여주었다. 그러나 2차 과제 기법은 비타협성(즉, 1차 과제를 방해할 수 있는 추가 인지 부하를 부과하는 것; Paas 등 2003)과 [서로 다른 유형의 인지 부하를 구별할 수 없다]는 비판을 받아왔다.
A recent example of a secondary task technique is the rhythm method developed by Park and Brünken (2015), which consists of a rhythmic foot-tapping secondary task. Korbach et al. (2017) showed that this technique was sensitive to hypothesised differences in cognitive load between a mental animation group, a seductive detail group and a control group. However, secondary task techniques have been criticised for their intrusiveness (i.e. imposing an extra cognitive load that may interfere with the primary task; Paas et al.2003) and inability to differentiate between different types of cognitive load.
생리학적 기법은 인지 기능의 변화가 생리학적 변수에 의해 반영된다는 가정에 기초한다. 반면 몇몇 연구자들은 기능성 자기공명영상(fMRI)과 같은 신경영상 기법을 사용할 것을 제안했으으나, 인지 부하 연구에 실제로 사용된 기법은 EEG이다. 하이퍼텍스트 기반 학습 환경을 사용하여, 안토넨코와 니더하우저(2010)는 EEG의 여러 측면이 가정된 인지 부하 차이를 반영한다는 것을 보여주었다. 인지 부하를 측정하기 위해 더 자주 사용되는 기술은 동공 팽창, 깜박임 속도, 고정 시간 및 봉합과 같은 눈 추적 변수에 기초한다. 예를 들어, van Gerven 등은 동공 팽창이 젊은 성인의 인지 부하와 긍정적인 상관관계가 있지만 노인의 경우에는 상관관계가 없다는 것을 보여주었다. 모바일 측정 장치의 개발로 인해 생리학적 측정의 사용이 점점 쉬워지고 있지만, 이러한 기법과 인지 부하를 측정할 수 있는 잠재력에 대한 훨씬 더 많은 연구가 필요하다. Physiological techniques are based on the assumption that changes in cognitive functioning are reflected by physiological variables. Whereas several researchers have proposed to use neuroimaging techniques, such as functional magnetic resonance imaging (fMRI; e.g. Whelan2007), a technique that has actually been used in cognitive load research is electroencephalography (EEG; Antonenko and Niederhauser2010; Antonenko et al.2010). Using a hypertext-based learning environment, Antonenko and Niederhauser (2010) showed that several aspects of the EEG reflected hypothesised differences in cognitive load. A more frequently used technique for measuring cognitive load is based on eye-tracking variables, such as pupil dilation, blink rate, fixation time and saccades. For example, van Gerven et al. (2004) showed that pupil dilation is positively correlated with cognitive load in young adults, but not in old adults. Although, it has become increasingly easy to use physiological measures due to the development of mobile measuring devices, much more research is needed into these techniques and their potential to measure cognitive load.
미래 방향 Future Directions
그것의 시작 이래로, 인지 부하 이론은 새로운 데이터를 이용할 수 있게 되면서 지속적인 이론적 발전을 겪어왔다. 이론적인 발전은 결국 일정한 과정에서 더 많은 데이터를 만들어냈다. 현재, 그러한 소용돌이가 계속되고 있으며 향후 발전에 대한 표지판을 제공하고 있다. Since its inception, cognitive load theory has undergone continuous theoretical development as new data have become available. Theoretical developments in turn have generated further data in a constant process. Currently, there is every indication of that spiral continuing and providing a sign-post to future developments.
작업 메모리 리소스 고갈 Working Memory Resource Depletion
한 가지 새로운 연구 라인은 [작업 기억 자원 고갈 가설]을 기반으로 CLT의 확장 가능성을 제안한 최근 연구에서 도출되었다. 이 가설은 작업 기억 자원이 지속적인 인지적 노력 기간 후에 고갈되어 추가 자원을 투입할 수 있는 용량이 감소된다는 것을 보여준다. 이전의 연구는 general 그리고 specific [고갈 효과]를 발견했다.
[일반적인general 고갈 효과]와 관련하여, Schmeicel(2007)은 [자기 통제self-control 작업]을 수행하는 것이, 이어지는 시험에서 [작업 기억의 성능]을 저하시킬 수 있다는 것을 보여주었다.
[특정적인specific 고갈 효과]와 관련하여 힐리 외 연구진(2011)은 첫 번째 과제의 무시될 자극과 작업 기억 과제의 기억될 자극이 일치할 때만 고갈 효과가 발생한다는 것을 보여주었다.
One new line of research is derived from recent work of Chen et al. (2018), who proposed a possible extension of CLT based on the working memory resource depletion hypothesis. This hypothesis holds that working memory resources become depleted after a period of sustained cognitive exertion resulting in a reduced capacity to commit further resources. Previous research has found both general and specific depletion effects.
With regard to general depletion effects, Schmeichel (2007) showed that engaging in self-control tasks can lower performance on subsequent working memory tests.
With regard to specific depletion effects, Healey et al. (2011) showed that depletion effects only occurred when there was a match between the to-be-ignored stimuli in the first task and the to-be-remembered stimuli in the working memory task.
비록 많은 연구들이 작업 기억과는 거의 관련이 없다는 것을 주목할 필요가 있지만, 어떤 조건에서의 [작업 기억의 고갈]은 [자아 고갈ego depletion]과 관련이 있을 수 있다. 예를 들어, 다이어트를 하는 동안 단 것을 피하는 것이 수학을 배우는 것과 같은 작동 기억의 함축성을 가질 것 같지는 않다. 자아 고갈 과제의 엄청난 차이는 자아 고갈의 영향에 대한 의구심에 기여할 수 있다(상충되는 메타 분석에는 에테르톤 외 2018 및 당 2018 참조). 다만, 인지 부하 이론의 관점에서 고려할 때, 자아 고갈에 대한 대부분의 연구는 학습에 대한 것이 아니며, 상당한 작업 기억 부하가 수반될 가능성이 있는 과제을 포함한 연구는 아주 일부이다. 이러한 작업task의 경우, 학습 중 광범위한 인지 노력이 작업 기억 자원을 상당히 고갈시킬 수 있는 경우, 그 요소는 지시를 설계할 때 중요할 수 있다. Working memory resource depletion under some conditions may be linked to ego depletion, although it needs to be noted that many studies on ego depletion bear little relation to working memory. For example, it is unlikely that avoiding sweets while on a diet has the same working memory implications as learning mathematics. The vast differences in ego depletion tasks possibly contributes to doubts concerning the effects of ego depletion (see Etherton et al.2018, and Dang2018, for conflicting meta-analyses). Considered from a cognitive load theory perspective, most studies on ego depletion do not include learning and only some of the literature used tasks that are likely to have imposed a heavy working memory load. For those tasks, if extensive cognitive effort during learning can substantially deplete working memory resources, that factor may be important when designing instruction.
Chen 등은 [자원 고갈 가설]이 [프리젠테이션 사이의 간격]이나 [연습 사이의 간격]을 두는 방식으로 [정보가 간격을 두고 제시되는 것이 [동일한 시간 동안, 동일한 정보가, 간격 없이 대량 형태로 처리될 때]보다 우수한 것으로 확인된 [간격두기 효과spacing effect]에 대한 설명을 제공할 수 있다고 지적했다. Chen 등은 대량 프레젠테이션이 간격 프레젠테이션에 비해 작업 메모리 용량이 감소했음을 나타내는 데이터와 함께 수학 학습을 사용하여 간격 효과를 얻었다. [몰아치기 연습massed practice]은 [작업 기억 리소스]를 지속적으로 줄게 만들지만, [간격을 둔 연습]은 (작업기억) 리소스를 복구할 시간을 준다. Chen et al. (2018). They indicated that the resource depletion hypothesis could provide an explanation of the spacing effect that occurs when spaced presentation of information with spacing between presentation or practice episodes is superior to the same information processed for the same length of time in massed form without spacing between episodes. Chen et al. obtained the spacing effect using mathematics learning along with data indicating that massed presentations resulted in a reduced working memory capacity compared to spaced presentations. Massed practice may reduce working memory resources while spaced practice may allow resources to recover.
[간격두기 효과]는 거의 틀림없이 심리학에서 만들어진 가장 오래된 교육 효과이지만 그 원인에 대해서는 합의가 이루어지지 않았다. 후속 연구에 의해 확인될 경우, Chen 등의(2018) 연구 결과는 효과에 대한 이론적 설명으로 인지 부하 이론을 사용할 수 있게 할 수 있다. The spacing effect is arguably the oldest known psychology-generated instructional effect but there has never been agreement concerning its causes. If confirmed by subsequent work, Chen et al.’s (2018) findings may allow cognitive load theory to be used as a theoretical explanation of the effect.
Chen 외 연구진(2018)은 간격 효과를 통해서 [학습 과제에 대한 작업 메모리 자원 고갈 가설]을 확인하면서, [장기 기억의 내용]이 [작업 기억의 특성]에 대한 [유일한 주요 결정 요인을 제공한다]는(기존의) 인지 부하 이론의 가정은 유지될 수 없다고 주장했다. [협소한 변화 원리]에 기반하자면, [인지 부하 이론]은 개개인에게 있어서 [작업 기억 용량]은 상대적으로 일정하기에, 용량에 영향을 미치는 유일한 주요 요소는 [장기 기억의 내용]이라는 것을 암묵적으로 가정하고 있다. [환경 구성 및 연결 원리]에서 알 수 있듯이, 동일한 정보를 장기 기억에 저장하면 새로운 정보를 처리할 때 작업 기억의 한계를 제거할 수 있다. 일단 조직되고 장기 메모리에 저장되면, [높은 요소 상호작용 정보]가 작업 메모리로 쉽고 빠르게 전송될 수 있기에, 작업 기억에 부하를 최소한의 부하만 부과된다. By confirming the working memory resource depletion hypothesis for learning tasks using the spacing effect as a vehicle, Chen et al. (2018) argued that the assumption of cognitive load theory that the content of long-term memory provides the only major determinant of working memory characteristics may be untenable. An implicit assumption of cognitive load theory, based on the narrow limits of change principle, has been that working memory capacity is relatively constant for a given individual with the only major factor influencing capacity being the content of long-term memory. As indicated by the environmental organising and linking principle, the limitations of working memory when dealing with novel information can be eliminated if the same information has been stored in long-term memory. High element interactivity information, once organised and stored in long-term memory can be easily and rapidly transferred in large quantities to working memory imposing a minimal working memory load.
Chen 외 연구(2018)의 연구 결과는 작업 기억의 용량은
정보 저장소를 통해 저장된 기존 정보, 빌리고 재구성한 정보, [무작위 생성 원리] 뿐만 아니라
인지 노력으로 인한 [작업 기억의 자원 고갈]에 따라서도 달라질 수 있음을 시사한다.
결과적으로, [인지적 노력에 따른 작업 기억 고갈 가정]을 지지하기 위해서는 [고정된 작업 기억 가정]을 폐기할 필요가 있다. 이러한 변화는 상당한 결과를 가져올 것이며 인지 부하 이론의 상당한 확장을 초래할 것으로 여겨진다.
The results of the Chen et al. (2018) study suggest that working memory capacity can be variable depending
not just on previous information stored via the information store, the borrowing and reorganising, and the randomness as genesis principles,
but also on working memory resource depletion due to cognitive effort.
Consequently, a fixed working memory assumption needs to be discarded in favour of a working memory depletion assumption following cognitive effort. It is believed that this change will have considerable consequences and result in a considerable extension of cognitive load theory.
인지부하이론과 자기조절학습 Cognitive Load Theory and Self-Regulated Learning
두 번째 새로운 연구 분야는 [인지 부하 이론]을 [자기 조절 학습]과 관련시킨다. 학습자의 학습 과정에 대한 감시와 제어를 다루는 인지 부하 이론과 자기 통제 학습 모델은 정보가 풍부하고 복잡하며 빠르게 변화하는 사회에서 평생 학습자를 지원하는 데 특히 중요한 관점으로 간주될 수 있다(반 메리엔보어 및 슬루이즈만스 2009). 두 이론적 프레임워크 모두 [인지 자원의 할당](cf. 학습자가 인지 부하를 줄이기 위해 스스로 인지 부하 원리를 적용하는 자기 관리 효과)이나, [학습활동의 선택과 같은 학습자의 조절 결정]에 이미 주의를 기울이고 있다.
A second new line of research relates cognitive load theory to self-regulated learning. Both cognitive load theory and models of self-regulated learning, which deal with learners’ monitoring and control of their learning processes, may be seen as particularly important perspectives for supporting lifelong learners in an information-rich, complex and fast-changing society (van Merriënboer and Sluijsmans2009). Both theoretical frameworks already pay attention to learners’ regulation decisions, such as the allocation of cognitive resources (cf. the self-management effect, where learners apply cognitive load principles themselves in order to decrease cognitive load) and the selection of study activities.
[인지 부하 이론]의 맥락에서, 파스 외 연구진은 자원 할당의 척도로 '과제 참여'를 도입했다.
과제참여task involvement가 높다면, 학습자가 높은 투자 정신적 노력과 함께 상대적으로 높은 성과를 보인다('고통 없으면 얻는 것도 없다')
과제참여task involvement가 낮다면, 학습자는 낮은 정신적 노력과 함께 상대적으로 낮은 성과를 보인다.
In the context of cognitive load theory, Paas et al. (2005) introduced ‘task involvement’ as a measure of resource allocation:
it is high when learners show relatively high performance combined with high invested mental effort (‘no pain, no gain’);
it is low when learners show relatively low performance in combination with low invested mental effort.
또한 [과제 선택]은 일련의 실험에서 (자기)조절 정확도의 지표로 사용되어 왔다. 학습자가 연구를 위해 그들 자신의 학습 과제를 선택하도록 요청받을 때, 수행의 측정과 투자된 정신적 노력은 과제 선택의 질에 대한 결론을 도출하는데 사용될 수 있다. (즉, 학습자가 너무 어렵거나 너무 쉬운 과제를 선택합니까?)
In addition, task selection has been used in a series of experiments (e.g. Nugteren et al.2018) as an indicator of regulation accuracy: when learners are asked to select their own learning tasks for study, measures of performance and invested mental effort can be used to draw conclusions on their quality of task selection (i.e. do learners select tasks that are either too difficult or too easy for them?).
[자기조절 학습의 맥락]에서, [학습 시간의 할당]은 일반적으로 자원 할당의 척도로 사용되며, [학습 활동의 선택]에 있어서는 [학습의 판단 및 재학습 결정('이해도를 높이기 위해 텍스트의 어느 부분을 다시 공부할 것인가?')]은 [수행능력의 척도]와 결합되어서 [자기조절 정확도]의 지표로 사용됩니다. 향후 연구는 자원 할당과 규제 정확도의 서로 다른 측정값을 결합함으로써 이익을 얻을 수 있다.
In the context of self-regulated learning, the allocation of study time is typically used as a measure of resource allocation and for the selection of study activities, judgements of learning and restudy decisions (‘which part of the text do you want to restudy in order to improve your understanding?’) in combination with performance measures serve as an indicator of regulation accuracy. Future research might profit from combining these different measures of resource allocation and regulation accuracy.
일반적인 발견은 '학습자가 자신의 학습을 조절하는 데 능숙하지 않다는 것'이고, 따라서 문제는 그것이 교육가능하냐는 것이다.
한편으로, 학습 과정의 자기조절은 일차적인 지식에 크게 의존할 것이고 따라서 가르치는 것이 불가능할 수도 있다.
반면에, 모든 학습은 1차 지식과 2차 지식의 조합을 포함하며, 2차 지식 구성요소는 확실히 가르칠 수 있다.
A general finding is that learners are not good in regulating their learning (Bjork et al.2013). The question is then whether it can be taught.
On the one hand, the self-regulation of learning processes will largely rely on primary knowledge and might thus be impossible to teach.
On the other hand, all learning involves a combination of primary and secondary knowledge and the secondary knowledge component certainly is teachable.
다음과 같은 상위 수준의 조절 프로세스는, 1차 지식과 2차 지식의 혼합에 의존할 수 있으므로, 적어도 부분적으로는 가르칠 수 있습니다.
스스로 인지 부하 원리를 적용하여 주의분할의 부정적인 영향을 감소시킨다(cf. 자기 관리 효과).
적절한 학습 과제 선택(cf. 자기주도 학습) 및
관련 학습 자원 선택(cf. 정보 문해력)
Higher-level regulation processes such as
reducing the negative effects of split attention by applying cognitive load principles oneself (cf. self-management effect),
selecting suitable learning tasks (cf. self-directed learning) and
selecting relevant learning resources (cf. information literacy)
...may rely on a mix of primary and secondary knowledge and thus—at least partly—be teachable.
학생들은 학습과 미래 수행에 대해 알려주는 단서들을 사용하는데, 흔히 잘못된 단서들을 사용하는 경향이 있다.
students use cues to inform them about their learning and future performance and, moreover, that they are inclined to use invalid cues.
예를 들어, 학생들은 종종 이해와 미래의 수행에 대한 신호로 '처리 용이성ease of processing'을 사용한다:
만약 지문이 쉽게 읽힌다면, 학생들은 전형적으로 본문에 대한 이해와 미래 시험에서 그들의 성취도를 높게 판단한다. 하지만, 훨씬 더 타당한 단서는 텍스트를 읽은 후에 키워드를 생성할 수 있는 능력일 것이다.
수단-목표 분석을 사용하여 전통적인 문제를 해결하는 경우, 학습자는 [높은 인지 부하]를 단서로(하지만 잘못된) 사용할 수 있다(이는 많은 노력을 소모하므로 나는 많이 배웠음에 틀림없다). 그러나, 더 효과적인 방법은 생성된 해결책을 동료 학생에게 설명하는 능력일 것이다.
따라서 다음 교사들은 학생들이 자신의 학습을 조절하는데 더 [타당한 신호의 사용을 돕는 프롬프트]를 제공할 수 있다(예:
'이 텍스트를 읽은 후 약 한 시간 후에 키워드를 생성할 수 있는가?';
'이 문제에 대해 방금 생성한 해결책을 동료에게 설명할 수 있는가?').
For example, students often use ‘ease of processing’ as a cue for understanding and future performance:
if a text is easily read, students typically judge their understanding of the text and their performance on a future test as high. Yet, a much more valid cue would be the ability to generate keywords some time after reading the text.
Similarly, a learner who is solving a conventional problem using means-ends-analysis may use the high cognitive load as an invalid cue for learning (‘this cost me a lot of effort so I must have learned a lot’). Yet, a much more valid cue for germane processing would be the ability to explain the generated solution to a peer student.
Teachers might then give prompts to students that help them learn to use more valid cues for regulating their learning (e.g.
‘Can you generate keywords for this text about one hour after reading it?’;
‘Can you explain the solution that you just generated for this problem to your peer?’).
감정, 스트레스, 불확실성 Emotions, Stress and Uncertainty
세 번째 연구 라인은, 인지 부하의 [환경 관련 인과 요인]을 식별하는 것을 목표로 하는 인지 부하의 새로운 모델에 기초한다(최 외 2014). 새로운 모델은 인지 부하와 학습에 대한 물리적 학습 환경의 세 가지 유형의 영향을 구분한다.
인지 효과(예: 불확실성),
생리학적 효과(예: 스트레스),
정서적 효과(예: 감정; 단, 학습에 대한 여러 영향이 밀접하게 얽힐 수 있다는 점에 유의하라)
A third research line is based on a new model of cognitive load that aims to identify the environment-related causal factors of cognitive load (Choi et al.2014). The new model distinguishes three types of effects of the physical learning environment on cognitive load and learning:
Cognitive effects (e.g. uncertainty),
physiological effects (e.g. stress) and
affective effects (e.g. emotions; but note that the different effects on learning may be closely intertwined; Evans and Stecker 2004).
기본적인 가정은 [스트레스, 감정 및 불확실성]이 업무 관련 프로세스와 경쟁하여, 작업 기억의 용량을 제한할 수 있다는 것이다. 따라서, 그것들은 인지 부하를 증가시키고 학습을 방해하며 전달을 감소시킨다(Moran 2016). 이 현상에 대한 상당한 양의 연구가 있었지만, 대다수의 기본 전제는 [학습]은 [학습에 부정적인 영향을 미칠 수 있는 상태를 방지함]으로써 가장 잘 서포트된다는 것이다(예: Plass 및 Kaplan 2016). The basic assumption is that stress, emotions and uncertainty may restrict the capacity of working memory by competing with task-relevant processes; thus, they increase cognitive load, hamper learning and decrease transfer (Moran2016). There has been a considerable amount of research on this phenomenon, but the basic premise of the great majority of this research is that learning is best supported bypreventingstates that might negatively affect learning (e.g. Plass and Kaplan2016).
이것은 일반 교육에서는 사실일 수 있지만, 직업 및 전문 교육에서는 감정, 스트레스 및 불확실성이 종종 전문 업무를 수행하는 데 필수적인 부분이다.
예를 들어, 간호사들은 인생의 마지막 단계에 있는 환자들을 돌볼 때 부정적인 감정을 다루는 법을 배워야 한다.
보안 담당자들은 고위험 폭력 상황에서 스트레스를 다루는 법을 배워야 하고,
의사들은 불완전한 환자 정보에 기초하여 빠른 의사결정이 필요할 때 불확실성에 직면하는 법을 배워야 한다.
This might be true in general education, but in vocational and professional education, emotions, stress and uncertainty are often an integral part of performing professional tasks. For example,
nurses must learn to handle negative emotions when caring for patients who are in the last phase of their life;
security officers must learn to deal with stress in high-risk violence situations, and
medical doctors must learn to face uncertainty when fast decision-making is required on the basis of incomplete patient information.
이러한 경우, 훈련 중 감정, 스트레스 및 불확실성을 예방하는 것은 비생산적이다.오히려, 교육 프로그램은 학습자가 감정, 스트레스 및 불확실성에 대처하고 전반적인 행복을 유지할 수 있는 능력을 포함하여, 표준에 맞는 전문적인 업무를 수행할 수 있는 전문 역량을 개발할 수 있는 방식으로 신중하게 설계되어야 한다.
In such cases, it is unproductive to prevent emotions, stress and uncertainty during training; on the contrary, educational programs must be carefully designed in such a way that learners develop professional competencies enabling them to perform professional tasks up to the standards, including the ability to deal with emotions, stress and uncertainty and to maintain overall wellbeing.
만약 감정, 스트레스, 불확실성이 [학습에 바람직하지 않은 상태]로 간주된다면, 이러한 상태를 방지하여 감소시켜야 하는 [외적 인지 부하]를 유발한다고 말할 수 있다.
만약 감정, 스트레스, 불확실성이 [학습되어야 하는 과제의 필수적인 요소]로 간주된다면, 그것들은 [내적 인지 부하]에 기여하고 다른 방법으로 다루어져야 한다.
If emotions, stress and uncertainty are seen as undesirable states for learning, one might say that they cause extraneous load that should be decreased by preventing these states.
But if emotion, stress and uncertainty are seen as an integral element of the task that must be learned, they contribute to intrinsic cognitive load and must be dealt with in another way.
예를 들어, 과제를 수행하기 전에 상상력이나 정신적 실천은 실제 과제 수행 중 내재적 부하를 낮추고 스트레스, 감정 또는 불확실성으로 인한 높은 부하를 균형 있게 조정하여 학습과 미래 과제에 대한 스트레스, 감정 또는 불확실성 처리 능력을 향상시킬 것으로 예상할 수 있다(아로라 외 2011). 그러나 초보 학습자들은 성공적인 작업 수행에 필요한 과정을 생생한 방식으로는 아직 상상할 수 없을 것이다(Ginns 2005b). 그들에게 상상력은 아마도 효과가 없겠지만, 예를 들어, 협력은 집단적 작업 기억 효과 때문에 효과적인 작업 기억 용량을 증가시킬 수 있으므로 스트레스, 감정 또는 불확실성으로 인한 높은 부하를 상쇄할 수 있다.
For example, imagination or mental practice prior to performing the task may be expected to lower intrinsic load during actual task performance, counterbalancing the high load resulting from stress, emotions or uncertainty and so improving learning and the ability to deal with stress, emotions or uncertainty for future tasks (Arora et al.2011). Novice learners, however, will not yet be able to imagine the processes that are required for successful task performance in a vivid way (Ginns2005b). For them, imagination will probably not work but, as an example, collaboration might possibly increase effective working memory capacity because of the collective working memory effect and so counteract the high load resulting from stress, emotions or uncertainty.
휴먼 무브먼트 Human Movement
네 번째 새로운 연구 라인은 [휴먼 무브먼트 효과]에 기초한다. 이 효과는 인간의 움직임을 포함하는 인지 작업을 가르칠 때 [애니메이션]이 [정적인 것]보다 더 효과적인 이유를 설명하는데 사용되어 왔다. 인간의 움직임 효과에 대한 연구는 주로 움직임을 관찰함으로써 학습에 초점을 맞췄지만, 최근의 연구는 학습 중에 움직임을 만드는 결과로 인지 부하와 학습에 대한 유사한 영향을 얻을 수 있다고 제안한다. 제스처와 트레이싱tracing 같이, [움직임을 만드는 것]이 가용 작업 기억 자원과 인지 부하에 영향을 미칠 수 있다는 충분한 증거가 있다.
몸짓을 하는 것making gestures이 문제 해결 중 정보의 인지적 오프로드에 사용될 수 있어 작업 기억 부하 감소로 이어질 수 있는 것으로 나타났다.
추적Tracing과 관련하여, Hu 등(2015)은 기하학에서 종이 기반 작업 예제를 공부할 때 집게 손가락으로 각도 관계를 추적한 학생이 예제를 공부한 학생보다 더 높은 학습 성과를 보였다.
마찬가지로, 손가락으로 온도 그래프를 추적 여부를 달리 하여 아이패드로 공부한 초등학생 그룹을 대상으로 한 연구에서 '추적 그룹'에서 더 높은 전송 성능을 발견했다.
A fourth new research line builds on the human movement effect. This effect has been used to explain why animations are more effective than statics when cognitive tasks involving human movement are taught. Although research into the human movement effect has mainly focused on learning by observing movement, recent research suggests that similar effects on cognitive load and learning may be obtained as a result of making movements during learning. There is ample evidence that making movements, such as gestures and tracing, can affect available working memory resources and cognitive load.
It has been shown that making gestures can be used for cognitive offloading of information during problem-solving, leading to a reduction in working memory load (Wagner-Cook et al. 2012; Goldin-Meadow et al. 2001; Ping and Goldin-Meadow 2010; Risko and Gilbert 2016).
With regard to tracing, Hu et al. (2015) showed that students who traced angle relationships with their index finger when studying paper-based worked examples in geometry showed higher learning outcomes than students who only studied the examples.
Similarly, in a study with a group of primary-school children who studied worked examples on an iPad either by tracing temperature graphs with their index finger or without such tracing, Agostinho et al. (2015) found higher transfer performance in the tracing group.
인간의 움직임과 같은 [생물학적 일차적 정보]는 작업기억의 제한에 의해 거의 영향을 받지 않는다는 인지 부하 이론의 견해와 함께, 기초 인지 또는 내재 인지(grounded or embodied cognition)의 이론적 프레임워크는 [인지 부하와 학습에 대한 움직임movement의 영향]을 설명하는데 사용되어 왔다. 이 이론적 프레임워크에서는 (정보 처리 및 학습을 포함한) 인지적 프로세스는 제스처 및 기타 인간 움직임을 포함한 환경 내의 감각 및 운동 기능과 불가분의 관계에 있다고 주장한다 (Barsalou 1999). Together with the cognitive load theory view that biologically primary information, such as human movement, is at most marginally affected by working memory limitations (Paas and Sweller2012), the theoretical framework of grounded or embodied cognition has been used to explain the effects of movements on cognitive load and learning, by asserting that cognitive processes, including information processing and learning, are inextricably linked with sensory and motor functions within the environment, including gestures and other human movements (Barsalou1999).
내장 인지embodied cognition 관점을 지지하는 연구는 [제스처를 관찰하거나 제스처를 취하는 것]이 더 풍부한 인코딩으로 이어지며, 따라서 더 풍부한 인지 표현을 이끌어 낸다는 것을 보여준다. 흥미롭게도, 보다 기본적인 운동 시스템의 개입은 지시 중 작업 메모리에 대한 부하를 감소시키는 것으로 보인다(예: Goldin-Meadow 등). 이는 이러한 풍부한 인코딩이 인지적으로 덜 요구되며 인지 부하 이론의 진화적 설명을 확인한다는 것을 의미한다.
Research supporting the embodied cognition view shows that observing or making gestures leads to richer encoding and therefore richer cognitive representations. Interestingly, the involvement of the more basic motor system seems to reduce load on working memory during instruction (e.g. Goldin-Meadow et al.2001), which means that this richer encoding is less cognitively demanding and which confirms the evolutionary account of cognitive load theory.
[운동 정보motor information]가 WM의 제한된 자원을 차지할 수 있는 [추가적인 제시방식modality]을 구성할 수 있다는 것이 분명하다. [인지 부하 이론에 의해 채택된 작업 기억 모델]과 [인간 움직임의 인지적 효과]를 확실하게 조화시키기는 어려워 보이기 때문에, [인간의 움직임이 기존 WM 모델 내에서 고려되어야 하는 추가적 제시방식modality]을 구성할 수 있다고 주장할 수 있다. From the research, it is clear that motor information may constitute an additional modality that can also occupy WM’s limited resources. As it seems difficult to firmly reconcile the cognitive effects of human movement with the working memory model adopted by cognitive load theory, it can be argued that human movement may constitute an additional modality that should be considered within existing WM models.
결론들 Conclusions
이 절은 인지 부하 이론의 발전에 기여한 20년간의 연구에 대한 우리의 성찰을 끝낸다. 진보는 그 이론을 뒷받침하는 심리적 기반, 새로운 교육적 효과, 인지부하이론의 범위scope와 인지부하의 측정 등과 관련이 있다.
가정된 [인지 구조의 기초]는 진화 심리학, 특히 Geary의 [1차 지식과 2차 지식 사이]의 구별을 사용함으로써 확고히 기초함으로써 강화되었다.
가르침에 대한 직접적인 실질적인 함의를 가진 [새로운 교육 효과]가 공식화되었다. 자기 설명 효과, 상상 효과, 고립된 요소 효과, 집단적 작업 기억 효과, 인간 이동 효과가 포함된다.
또한, 소위 [복합 효과]가 확인되었다. 이러한 영향은 다른 인지 부하 효과의 한계를 나타내며, 우리는 그것들이 보다 성숙한 이론의 특징이라고 본다.
인지 부하 이론의 범위가 넓어져서 [인지 부하에 영향을 미치는 뚜렷한 요소로 물리적 환경]을 포함하게 되었다
마지막으로, 인지 부하의 [새로운 주관적이고 객관적인 측정]이 개발되어 연구자들이 부하의 다른 유형을 더 잘 구별할 수 있게 되었다.
This section ends our reflection on 20 years of research contributing to the development of cognitive load theory. Advances relate to its psychological basis, new instructional effects, its scope and measurements informing the theory.
The basis for the hypothesised cognitive architecture has been strengthened by firmly grounding it in evolutionary psychology, especially by using Geary’s distinction between primary and secondary knowledge.
New instructional effects with direct practical implications for instruction have been formulated, including the self-explanation effect, the imagination effect, the isolated elements effect, the collective working memory effect and the human movement effect.
In addition, the so-called compound effects have been identified; these effects indicate the limits of other cognitive load effects and we see them as being characteristic for a more mature theory.
The scope of cognitive load theory has been broadened by including the physical environment as a distinct factor affecting cognitive load.
Finally, new subjective and objective measurements of cognitive load have been developed, enabling researchers to make a better distinction between the different types of load.
인지 부하 이론의 발전은 관련 이론에 반영되었고 또한 미래 발전을 위한 추세를 설정했다. 예를 들어 멀티미디어 학습 자료의 설계에 초점을 맞춘 [멀티미디어 학습의 인지 이론(CTML; Mayer 2014)]은 새로운 인지 부하 효과 중 몇 가지와 전체 과제 과정과 커리큘럼의 설계에 초점을 맞춘 4개 요소 교육 설계(4C/ID; 반 메리엔보어 및 키르슈네르 2018a)를 포함한다.학습자의 전문지식의 성장은 교육 프로그램의 다른 단계에서 최적의 설계 원칙을 선택하는데 직접적인 영향을 미치기 때문에 복합 효과에 대한 것이다. Advances in cognitive load theory have been reflected in related theories and also set the trends for future developments. For example, the cognitive theory of multimedia learning (CTML; Mayer2014), focusing on the design of multimedia learning materials, includes several of the newer cognitive load effects, and four-component instructional design (4C/ID; van Merriënboer and Kirschner2018a), focusing on the design of whole-task courses and curricula, builds especially on compound effects because the learners’ growth of expertise has direct implications for selecting optimal design principles in different stages of an educational program.
향후 연구 라인에서는 인지 부하 이론의 추가 개발을 위한 흥미로운 새로운 기회가 열립니다.
[작업 기억 자원 고갈]은 [개별 인지 자원의 고정된 시간적 특성에 의문을 제기]하며, 몇 가지 인지적 부하 효과에 주요한 영향을 미칠 수 있다.
[인지 부하 대한 자기 관리 및 기타 유형의 자기 조절 학습]은 교육에 있어 [일차적 지식과 이차적 지식의 결합을 재고할 것]을 요구한다.
스트레스, 감정 및 불확실성을 유발하는 [물리적 환경]은 [인지 부하를 효과적으로 처리하는 방법에 대한 새로운 질문]을 발생시킨다.
[인간의 움직임은 작업기억에서 특별한 역할을 수행]하는 것처럼 보이며, 이는 교육적 설계와 관련하여 인간 인지 구조의 재고를 요구할 수 있다.
Future research lines open up exciting new opportunities for the further development of cognitive load theory:
working memory resource depletion questions the fixed temporal character of individual cognitive resources and might have major implications for several cognitive load effects;
self-management of cognitive load and other types of self-regulated learning require us to rethink the combination of primary and secondary knowledge in teaching;
physical environments that evoke stress, emotions and/or uncertainty generate new questions on how to effectively deal with cognitive load, and
the special role that human movement seems to play in working memory might ask for a reconsideration of human cognitive architecture in relation to instructional design.
인지 부하 이론의 생존가능성은 그것의 주요 강점과 관련이 있다.
(1) 인간 인지 아키텍처에 대한 지식을 바탕으로 한다.
(2) 인간의 인식에 대한 지식이 발전함에 따라 지속적인 개발 중에 있다.
(3) 시험 가능한 가설로 이어지며, 음의 결과가 나올 경우 이론이 수정된다.
(4) 이론에 의해 생성된 방대한 데이터는 무작위화되고 통제된 시험에 기초한다.
(5) 무작위적이고 통제된 시험은 의학 교육에서 영문학에 이르는 광범위한 주제와 함께, 매우 어린 연령에서 성인 학습자에 이르기까지 모든 연령 그룹을 가르치는 전통적인 교실에서 전자 학습에 이르기까지 광범위한 교육적 맥락에서 사용될 수 있는 교육 절차의 효율성에 대한 증거를 제공한다.레의
The viability of cognitive load theory is related to its major strengths, namely,
(1) it is firmly based in our—expanding—knowledge of human cognitive architecture;
(2) it is under continuous development as our knowledge of human cognition advances;
(3) it leads to testable hypotheses with possible negative results leading to modifications of the theory;
(4) the vast bulk of the data generated by the theory is based on randomised, controlled trials; and
(5) those randomised, controlled trials provide evidence for the effectiveness of instructional procedures that can be used in a wide range of educational contexts from conventional classrooms to e-learning, teaching all age groups from very young to adult learners, with an enormous range of subject matter from medical education to English literature.
이러한 강점들 덕분에 인지 부하 이론은 몇 년 동안 급격히 변화했지만 여전히 좋은 상태를 유지하고 있고, 건전한 연구가 그것의 발전을 이끄는 한, 우리는 그것의 밝은 미래를 봅니다.
Thanks to these strengths cognitive load theory has drastically changed over the years but is still in good shape, and as long as sound research is driving its further development, we see a bright future for it.
결론적으로, 우리는 지난 20년 동안 인지 부하 이론의 중요한 변화를 보아왔고, 현재 교육 연구와 실제 교육 분야 모두에서 인지 부하 이론의 인기를 감안할 때, 우리는 앞으로 20년 동안 똑같이 중요한 변화를 예상한다. 이 글에서, 우리는 비록 미래가 예측 불가능하다는 것을 완전히 인정하지만, 이론의 추가적인 발전을 위해 우리가 전망하는 몇 가지 연구 방향을 스케치했다. 1998년 논문에서는, 진화 심리학, 작동 기억 자원 고갈, 내장 인식embodied cognition에 대한 어떠한 언급도 하지 않았습니다. 하지만, 이러한 생각들은 이론의 추가적인 발전에 결정적인 것으로 드러났습니다. 그러니, 미래를 예측하려고 하지 말고 계속해서 좋은 연구를 해서 미래를 창조하자.
To conclude, we have seen important changes in cognitive load theory over the last 20 years and, given the current popularity of cognitive load theory in both educational research and the practical educational field, we expect equally important changes in the 20 years to come. In this article, we sketched some research directions that we see as promising for the further development of the theory, although we fully acknowledge that the future is unpredictable. In the 1998 article, no mention was made whatsoever of evolutionary psychology, working memory resource depletion or embodied cognition, yet, these ideas turned out to be crucial for the further development of the theory. So, let us not try to predict the future but create it by continuing to do good research.
Abstract
Cognitive load theory was introduced in the 1980s as an instructional design theory based on several uncontroversial aspects of human cognitive architecture. Our knowledge of many of the characteristics of working memory, long-term memory and the relations between them had been well-established for many decades prior to the introduction of the theory. Curiously, this knowledge had had a limited impact on the field of instructional design with most instructional design recommendations proceeding as though working memory and long-term memory did not exist. In contrast, cognitive load theory emphasised that all novel information first is processed by a capacity and duration limited working memory and then stored in an unlimited long-term memory for later use. Once information is stored in long-term memory, the capacity and duration limits of working memory disappear transforming our ability to function. By the late 1990s, sufficient data had been collected using the theory to warrant an extended analysis resulting in the publication of Sweller et al. (Educational Psychology Review, 10, 251–296,1998). Extensive further theoretical and empirical work have been carried out since that time and this paper is an attempt to summarise the last 20 years of cognitive load theory and to sketch directions for future research.
전략기획이 중요한가? (Acad Med, 2019) Does Strategic Planning Matter? William T. Mallon, EdD
당신을 전략기획팀에 투입할 겁니다. 그것은 성취할 수 있는 만족감이 아무것도 없는 일과 같다. I’m putting you on the strategic planning team. It’s like work but without the satisfaction of accomplishing anything.
—딜버트의 보스; 스콧 애덤스, 딜버트1 —The Boss to Dilbert; Scott Adams,Dilbert1
전문 문헌, 학술지, 그리고 재미있는 페이지에 그런 냉소를 불러일으킨 전략기획strategic planning에 관한 것은 무엇일까? 전략적 계획이 조직 결과를 개선하는지 여부에 대한 동료 검토 문헌에서 논쟁이 지속되고 있다.
해설자들은 "나쁜 전략의 위험"2에 대해 경고하고,
실무자들은 "전략 계획이 더 이상 관련이 있는지" 묻는다3.
교수진은 전략 계획이 "전략도 계획도 없고, 그저 시간 낭비다."4
What is it about strategic planning that has inspired such cynicism in the professional literature, the academic quad, and the funny pages? A debate persists in the peer-reviewed literature about whether strategic planning leads to improved organizational outcomes.
Commentators issue warnings about “the perils of bad strategy”2;
practitioners ask if “strategic planning [is] relevant anymore”3; and
faculty flat-out assert that the strategic plan is “neither strategy nor plan, but a waste of time.”4
25년 이상 저는 고등교육, 학술 의학 및 비영리 단체의 전략 개발 및 전략 계획 노력의 참여자, 촉진자, 컨설턴트, 학자 및 리더였습니다. 이러한 역할을 하면서 저는 교수, 직원 및 기타 이해 관계자들 사이에서 전략 계획이 중요한지 여부에 대해 의문을 제기하는 상당한 냉소주의에 직면했습니다. 저는 조직 행동과 변화에 대한 실천가이자 연구자로서 냉소주의를 공유하지는 않지만, 전략 계획이 무엇을 성취하는가에 대한 건전한 회의론과 그것이 의미하는 것에 대한 깊은 이해를 얻게 되었다. For more than 25 years, I have been a participant, facilitator, consultant, scholar, and leader of strategy development and strategic planning efforts in higher education, academic medicine, and nonprofit organizations. In these roles, I have encountered a fair amount of cynicism about strategic planning among faculty, staff, and other stakeholders, with many people questioning whether strategic planning matters. While I do not share that cynicism, as both a practitioner and researcher of organizational behavior and change, I have developed a healthy skepticism for what strategic planning achieves and a deep appreciation for what it means.
"전략적 계획" 대 "계획" “Strategic Planning” Versus “Planning”
전략 계획이 중요한지 검토하기 전에 용어를 정의해야 합니다. 너무 자주, "전략적 계획"은 일반적인 정의 없이 catchall 문구로 사용됩니다. 조직의 '미래 계획'은 언제 '전략적 계획'이 됩니까?
Before we can examine whether strategic planning matters, we need to define the term. Too often, “strategic planning” is used as a catchall phrase without a common definition. When does an organization’splanfor the future become astrategic plan?
역사는 고대 군국주의 기원에서 20세기 사업 적용에 이르기까지 전략이 경쟁에 기반을 두고 있음을 보여준다. 즉, [직접적인 경쟁은 존재하지만 분명하지는 않은] 비영리 환경에서도 경쟁사보다 [우위를 점하는 데] 전략이 집중됩니다. 따라서 "전략적 계획"은 조직이 자신의 임무를 달성하기 위하여, [경쟁업체와 어떻게 차별화할지]를 파악하는 프로세스입니다. 즉, 경쟁이 병원 시스템, 학생 또는 교직원의 국가 경쟁업체, 또는 미래의 경쟁 위협업체 등입니다. History shows that strategy, from its ancient militaristic origins to its 20th-century business application (from which higher education’s version of strategic planning developed), is predicated on competition. That is, strategy is focused on gaining advantage over one’s competitors—even in nonprofit settings, where direct competition still exists but may not be as apparent. “Strategic planning,” therefore, is the process whereby an organization identifies how it will differentiate itself from its competition to achieve its mission—whether that competition is a nearby hospital system, a national competitor for student or faculty talent, or a nascent competitive threat on the horizon.
그러나 많은 조직은 "전략적 계획"에 대한 덜 구체적이고 암묵적인 정의를 가지고 있습니다. "전략적 계획"은 한 조직이 개선을 위한 단기 및 장기 목표를 설정하고 이러한 개선을 달성하기 위한 진행 상황을 측정하는 프로세스입니다. 의학교육연락위원회[LCME]5가 승인한 의과대학에 대해서는 칭찬할 만하지만, 그러한 운영 계획은 반드시 "전략적"이라는 별명을 얻지는 않는다. [조직 계획]은
전략 계획("외부 위협에 대응하기 위해, 경쟁사와 비교하여, 조직이 어떻게 달라져야 하는가?")과
운영 계획("조직이 어떻게 끊임없이 더 잘 결과를 개선해나갈 수 있을까?")의 조합일 수 있습니다.
Many organizations, however, hold a less specific, implicit definition of “strategic planning” that is akin to “ongoing planning”—a process whereby an organization establishes short- and long-term goals for improvement and measures progress toward achieving those improvements. While laudable (and mandatory for medical schools accredited by the Liaison Committee on Medical Education [LCME]5), such operational planning does not necessarily earn the “strategic” moniker. Organizational plans may be a combination of
strategic planning (“How will the organization be different in response to external threats and compared with our competition?”) and
operational planning (“How will the organization continuously be better to improve outcomes?”).
운영 계획은 중요합니다. 그러나 그것은 전략적인 계획과 같지 않다. Operational planning is important. But it is not the same as strategic planning.
전략 계획은 크게 중요하지 않음 Strategic Planning Has Not Mattered Much
고등교육에서의 전략계획의 기원은 1959년 매사추세츠공과대학에서 열린 대학시설계획가 회의에서 비롯되었다. 그것은 공공 부문과 고등교육의 전략 계획에 대한 획기적인 책으로 1980년대에 실제로 시작되었다.7-9 그 초기부터 대학, 의과대학 및 학술 보건 센터는 여러가지 전략적인 계획 기법을 사용해 왔다. 환경 스캐닝, SWOT(강점, 약점, 기회 및 위협)분석, 프로그램 및 제품 로드맵, 시나리오 계획, 예측 및 균형 스코어카드, 기타 연구 생성, 컨설턴트 판매 또는 자체 개발 도구 및 기법 등이 그것이다. 대부분의 전략적 계획 수립 노력은 Academic Medicine 이번 호에서 Byrne과 동료들이 기사에서 설명한 것과 같은 익숙한 프로세스를 따르는 경향이 있습니다.10 The genesis of strategic planning in higher education stems from a meeting of university facility planners held at the Massachusetts Institute of Technology in 1959.6It really took off in the 1980s, with groundbreaking books about strategic planning in the public sector and in higher education.7–9Since those early days, universities, medical schools, and academic health centers have employed strategic planning techniques such as environmental scanning, SWOT (strengths, weaknesses, opportunities, and threats) analyses, program and product road maps, scenario planning, forecasting, and balanced scorecards, among other research-generated, consultant-sold, or home-grown tools and techniques. Most strategic planning efforts tend to follow a familiar process—such as the one that Byrne and colleagues describe in their article in this issue ofAcademic Medicine.10
전략 계획은 양적, 질적 및 혼합적 방법을 사용하여 인류학, 행정학, 경영학, 의사결정 과학 및 교육과 같은 다양한 분야의 연구자들에 의해 광범위하게 연구되어 왔다. 메타 분석에서는 전략적 계획과 조직 성과 사이에 긍정적인 관계를 발견했지만, 전략 계획에 대한 연구는 인과 관계를 연관짓는 것에 대해 비판을 받아왔다.14 즉, 전략적 계획이 조직 성과에 영향을 미치지 않을 수 있다; 오히려 다른 요인이 좋은 성과의 원인일 수 있다. 예를 들어 우호적인 외부 요인들, 효과적으로 조직을 관리하는 방법을 아는 유능한 리더들, 그리고 심지어 운까지. 그러나 우리는 전략적인 계획 자체가 강한 성과를 유발한다고 말할 수 없다. 자, 전략계획이 정말 중요합니까? Strategic planning has been studied extensively by researchers in diverse disciplines such as anthropology, public administration, management, decision sciences, and education, using quantitative, qualitative, and mixed methods. Meta-analyses have found positive relationships between strategic planning and organizational performance11–13; however, studies on strategic planning have been criticized for conflating correlation with causation.14That is, strategic planning may not make a difference to organizational performance; rather, positive outcomes may be attributable to other factors, such as favorable external factors, competent leaders who know how to effectively manage organizations, and even luck. But we cannot say that strategic planning in and of itselfcausesstrong performance. Ergo, does strategic planning matter—really?
경험적 증거 너머에는 미국의 의대와 교육병원의 역사적 맥락이 있다. 긴 안목에서, 전략 계획은 산업으로서 학문의학에 큰 영향을 미치지 않았다: 1960년대 이래로, 엄청난 성장은 학문의료센터가 사실상, 한 가지 전략과 다른 전략에 대해 선택이나 절충을 할 필요가 없는 시스템에 [충분한 해이함enough slack]을 만들어냈다. 그들은 모든 임무 분야에서 성장 포트폴리오의 균형을 맞출 수 있었다. 일부 의과대학이 규율되고 다른 의과대학들은 심각한 전략적 선택을 필요로 하는 중대한 위기에 직면하는 등 지역사회 전반에 걸쳐 다양성이 존재해왔지만, 산업으로서의 학문적 의학academic medicine은 많은 사람들에게, 많은 것에서, 엄청난 성공을 거두었다. Beyond the empirical evidence is the historical context of medical schools and teaching hospitals in the United States. In the long view, strategic planning has not mattered much for academic medicine as an industry: Since the 1960s, tremendous growth has created enough slack in the system that academic health centers have, in effect, not needed to make choices or trade-offs regarding one strategy versus another. They have been able to balance growth portfolios in all their mission areas. While there is and has been variation across the community, with some medical schools being disciplined and others facing significant crises that required dire strategic choices, academic medicine as an industry has been enormously successful being many things to many people.
[억제되지 않는 성장]은, 적어도 사라지지는 않더라도, 최소한 더 [휘발성이 강해진다]고만 말해두자. 그리고 Tripartite mission을 위한 전통적인 자금원에 대한 압박이 이어지고 있다. 대부분의 AHC들은 더 이상 진정한 전략의 필요성을 무시할 수 없다. 즉, 기관의 존재 이유를 충족시키기 위해 무엇을 하고 무엇을 하지 말아야 하는지에 대한 선택을 하는 것이다.15 이 전략의 개념은 어떤 것은 선택하지만 다른 것은 선택하지 않는 것을 강조하기 때문에 간단하지만, 어려운 단어를 포함한다. 바로 "아니오No"이다. Suffice it to say that unbridled growth has, if not disappeared, at least become more volatile. And the traditional funding sources for the tripartite missions have been under duress. Most academic health centers can no longer ignore the need for a true strategy—that is, making choices about what to do and what not to do to fulfill the institution’s reason for existence.15This concept of strategy emphasizes choosing some things but not others and, therefore, involves a simple yet difficult word: “No.”
전략 니즈 리더십 노하우 Strategy Needs Leadership No-How
리더는 "아니오"라고 말할 수 있는 사람들이기 때문에 비판적이다. Leaders are critical because they are the ones who can say “no.”
이러한 노하우(nohow)는 어려운 재정 상황에서 확실히 필요하지만, 그 때만이 아니다. 조직의 대차대조표가 양호하더라도, 혁신과 투자의 기회가 많을 때, 어떤 조직도 모든 기회를 추구할 수는 없습니다. This no-how surely is needed under difficult financial circumstances, but not only then. Even if an organization’s balance sheet is healthy, even when there are many opportunities for innovation and investment, no organization can pursue every opportunity.
리더는 조직의 트레이드오프를 정의합니다. 즉, "하나가 더 많이 하려면, 다른 것을 덜 해야 함."16 그렇다고 해서 제로섬 게임을 제안하는 것은 아닙니다. 오히려, 예를 들어, 임상 또는 연구 전문 분야의 한 분야에 투자하되 다른 분야에 투자하지 않기로 선택함으로써, 리더는 조직의 우선 순위를 분명히 합니다. 모든 사람에게 모든 것이 되려고 노력하는 조직은 노력, 예산 및 인적 자원, 심지어 전달된 메시지의 산만함diffusion을 초래할 수 있습니다. 트레이드오프는 "[조직]이 제공하는 것을 의도적으로 제한"하는 것이다16
Leaders define the trade-offs for the organization—meaning that “more of one thing necessitates less of another.”16This is not to suggest a zero-sum game. Rather, by choosing to invest in, say, one area of clinical or research expertise but not another, leaders make organizational priorities clear. Organizations that try to be all things to everyone (patients, students, residents, faculty, staff, the public) risk diffusion of effort, budgetary and human resources, and even messaging. Trade-offs “purposefully limit what the [organization] offers.”16
말하기는 쉬우나 행하기는 어렵다. 조직 생활의 현실은 무엇을 할지, 무엇을 하지 않을지에 대한 선택을 하는 것(즉, 전략을 갖는 것)에 저항한다. Porter가 말했듯이, 트레이드오프는 두려울 수 있다.16 누가 잘못된 선택을 하길 원하겠는가? 우리는 교수진, 직원, 지도자들을 실망시키고 싶지 않다. 우리는 갈등을 최소화하기를 원한다. 우리는 영향력 있는 부서나 교수진과의 소동이 언론 악재로까지 번지는 것을 피하고 싶다. That’s easier said than done. The reality of organizational life works against making choices about what to do and not do (i.e., having a strategy). As Porter states, trade-offs can be frightening.16Who wants to make the wrong choice? We do not want to disappoint faculty, staff, and leaders. We want to minimize conflict. We want to avoid a dustup with an influential department or faculty member that escalates into bad press—or a pink slip.
이러한 경향에 직면하여, 조직과 부서 지도자들이 전략의 성공적인 개발과 실행에서 주장할 수 있는 가장 중요한 단어는 "아니오"일 것이다. In the face of these inclinations, perhaps the most important word that organizational and departmental leaders can assert in the successful development and implementation of strategy is “no.”
리더들은 그들이 조직이나 부서를 위한 "전략적 계획"이라고 부르는 것이 [자신의 사명을 달성하기 위해 취할 수 있는 다양한 경로들 사이의 트레이드오프]에 고유하게 초점을 맞추고 있는지, 아니면 [아무 고성능 조직에게나 모두 중요하고 칭송받을 목표]에 초점을 맞추고 있는지 자문해 볼 필요가 있다. 목표를 다른 업계의 조직의 전략 계획에 쉽게 적용할 수 있다면 전략 계획이 아닌 운영 계획을 수립하는 것일 수 있습니다.
Leaders need to ask themselves whether the thing that they call the “strategic plan” for their organization or department is uniquely focused on trade-offs between various pathways they could take to achieve their mission or focused on goals that are important and laudable for any high-performing organization. If you could take a goal and easily drop it into the strategic plan of an organization in another industry, you are probably working on an operational plan, not a strategic plan.
계획된 전략인가 아니면 비상 전략인가? Planned or Emergent Strategy?
전략 및 전략 계획에 대한 대부분의 접근법은 [조직의 합리성organizational rationality]에 대한 암묵적인 관점을 가지고 있습니다. 즉, 위계적 구조, 합리적인 의사 결정, 비용 편익 분석 및 계획된 개입을 강조합니다. 1987년에 민츠버그가 지적한 것은 오늘날에도 여전히 사실이다: "사실상 전략 수립에 관해 쓰여진 모든 것들은 그것을 [신중한deliberate 과정]으로 묘사하고 있다. 먼저 생각하고, 그 다음에 행동합니다. 공식화한 다음 구현합니다."17 Most approaches to strategy and strategic planning have an implicit point of view of organizational rationality—one that emphasizes hierarchy, rational decision making, cost–benefit analyses, and planned interventions. What Mintzberg pointed out in 1987 is still true today: “Virtually everything that has been written about strategy making depicts it as a deliberate process. First we think, then we act. We formulate, then we implement.”17
민츠버그는 전략이 공식화될 수 있을 뿐만 아니라 형성될formulated 수도 있다고 주장했다. 그것은 진화하는 상황에 대응하여 나타날emerge 수 있고 나타나야 한다. 똑똑한 리더들은 "모든 것을 미리 생각할 수 있을 정도로 항상 똑똑할 수는 없다는 것을 인정한다."
Mintzberg argued that strategy can form as well as be formulated. It can and should emerge in response to evolving situations. Smart leaders “appreciate that they cannot always be smart enough to think through everything in advance.”17
전략이 계획되어야 하는가, 아니면 (상황에 맞춰) 나타나야emerge 하는가? 나는 실용주의자이지 순수주의자가 아니다. 저는 혼합된 접근법을 좋아합니다. 하멜에 의해 요약된 전략 개발의 유형입니다. "전략은 완벽한 질서와 완전한 혼돈, 절대적인 효율성과 맹목적인 실험, 독재 정치와 완전한 애드호크라시 사이의 경계에 놓여 있습니다." Should strategy be planned or should it emerge? I’m a pragmatist, not a purist. I like a hybrid approach, the type of strategy development summarized by Hamel: “Strategy is poised on the border
between perfect order and total chaos,
between absolute efficiency and blind experimentation,
의과대학과 교육병원은 특히 전략 개발이 완전히 계획되지도 않고 완전히 긴급하지도 않은 하이브리드 접근법에 매우 적합하다. 전략 계획은 하향식이며 분산형이며 합리적이고 상징적이며 계획적이고 긴급하다. Medical schools and teaching hospitals are particularly well suited to this hybrid approach, in which strategy development is neither fully planned nor fully emergent. Strategic planning is both top-down and decentralized; rational and symbolic; and deliberate and emergent.
털은 어때요? What About Fluff?
전략 계획들은 그들의 "허풍" 즉, "전문지식으로 가장한, 많은 유행어를 뿌리는, 뻔한 것의 재기술"로 비판을 받아왔다."2 어느 산업이나 조직은 허풍을 떨기 쉽다. 한 유명한 대학은 그것의 전략적 목표가 "학자이자 교사인 이상화," "타의 추종을 불허하는 교육과 경험을 제공하는 것," "대학원과 전문학 분야의 차별성을 보여주는 것," 그리고 "우리 시대의 위대한 아이디어와 이슈에 참여하는 것"이었다고 말했다. Strategic plans have been criticized for their “fluff,” or “restatement of the obvious, combined with a generous sprinkling of buzzwords that masquerade as expertise.”2Organizations across industries are prone to fluff, academe included. One well-known university stated that its strategic goals were to “epitomize the scholar–teacher ideal,” “provide an unsurpassed education and experience,” “demonstrate distinction in graduate and professional studies,” and “engage in the great ideas and issues of our time.”19In other words, this university’s transformational goals were to be a university.
전통적인 전략 계획에 대한 이와 관련된 비판은 그들의 목표가 [어려운 절충difficult trade-off을 촉진하는 것]이 아니라 "달성해야 할 일의 뒤죽박죽"으로 구성된다는 것이다.종종 전략이나 목표로 잘못 분류되는, 해야 할 일의 긴 목록은 전략이 아니다. 그저 해야 할 일의 목록일 뿐이라고 말했다.2
A related criticism of traditional strategic plans is that their goals do not facilitate difficult trade-offs but, rather, constitute “a scrambled mess of things to accomplish. . . . A long list of things to do, often mislabeled as strategies or objectives, is not a strategy. It is just a list of things to do.”2
따라서, [해야 할 일의 목록들]이, 소위 전략 계획이라 불리며, 선반 위에 먼지만 쌓여 간다는 비판을 받아왔다.20 역동적이고 민첩하며 짧은 범위의 계획 방식을 사용하는 조직들조차 때때로 전략을 수립하는 데 너무 많은 시간을 투자하고 전략을 실행하는 데 충분한 시간을 투자하지 않는다. 민츠버그는 이렇게 말했다. Thus, the list of things to do, aka the strategic plan, has been criticized for gathering dust on a shelf.20Even organizations that employ dynamic, nimble, and shorter-span planning approaches sometimes spend too much time coming up with a strategy and not enough time implementing one. Mintzberg proffered:
대부분의 경우, [리더]는 전략을 짜서는 안 된다; 그들은 그들이 이미 가지고 있는 전략을 추구하는데 있어서 가능한 한 효과적으로 그들의 조직을 만들어 나가야 한다. ... . 조직을 특별하게 만드는 것은 세부 사항을 마스터했기 때문이다.
Most of the time, [leaders] should not be formulating strategy at all; they should be getting on with making their organizations as effective as possible in pursuing the strategies they already have. . . . Organizations become distinguished because they master the details.17
민츠버그는 효과가 없는 전략을 고수하는 것에 대해 논쟁하지 않았다. 오히려, 조직은 [환경적 상황이 전략의 유효함을 보여주는 시기에 이미 가지고 있는 전략을 완전히 구현하는 것]이 중요하다.
Mintzberg was not arguing for sticking with a strategy that is not working. Rather, an organization should fully implement the strategy it already has when the environmental circumstances indicate it remains valid.
문화로서의 전략 Strategy as Culture
하지만 여러분의 선반에 저장되어 있는 전략적인 계획에 대해 잠시 생각해 보겠습니다. 전략 계획은 단지 "폭풍과 분노로 가득 차 있고, 아무것도 의미하지 않는 의례화된 과정"에 그치고 있지는 않은가? "일처럼 하지만 아무것도 달성하지 못하는 것"?1
But let us dwell for a moment on those strategic plans stored on your shelf. Is strategic planning nothing more than a ritualized process, “full of storm and fury, signifying nothing”?21Just “like work but without the satisfaction of accomplishing anything”?1
냉소가 퍼지기 전에, 전략과 조직 문화의 관계를 고려할 가치가 있다. 이러한 관계에 대한 한 가지 지배적인 견해는 "문화는 아침으로 전략을 먹는다"는 적대적이다. 이러한 관점이 매력적일 수 있지만(아마도 그것은 리더들이 전략을 조직의 성공과 연계할 필요를 면제하기 때문일 것이다) 정확하지 않다. 문화 테마 이론22와 문화 스키마 이론,23과 같은 인류학에서 나온 이론들은 [(조직의) 문서에서 반복되는 단어와 구절과 주제들]이 "미래 행동을 형상화, 안내 및 패턴화"한다고 제안한다. Before cynicism washes over, it is worth considering the relationship between strategy and organizational culture. One predominant view of this relationship is adversarial—that “culture eats strategy for breakfast.” While this viewpoint may be appealing (perhaps because it absolves leaders from needing to link strategy to organizational success), it is not accurate. Theories from anthropology, such as cultural theme theory22and cultural schema theory,23suggest that the recurrent words and phrases and themes in written documents “stimulate, guide, and pattern future behaviors.”24
이러한 이론들은 전략적인 계획과 여러분의 선반에 있는 먼지투성이의 문서들이 [문서가 만들어내는produce 것]이 아니라 [문서가 표현하는express 것] 때문에 중요할 수도 있다는 것을 암시한다.25 Wiedman과 Martinez에 따르면, "사명, 목표 및 목적을 가진 서면 계획은 다시 업데이트 작업을 할 때에야 읽게 될지 모르겠지만, 위원회 회의, 비공식 대화, 직무 설명 등에서 구두로 재기술된 문화적 주제는 문화적으로 수용되는 행동의 역동적인 힘이 된다."24
These theories suggest that strategic planning, and those dusty documents on your shelf, may be important not for what they produce but for what they express.25According to Wiedman and Martinez, “even though written plans with mission, goals, and objectives may not be read until they are updated again, the cultural themes, orally restated in committee meetings, informal conversations, job descriptions, etc., become a dynamic force of culturally accepted behavior.”24
조직의 공식 및 비공식 담화에서 어떤 주제가 반복된다면, 시간이 지남에 따라 행동을 변화시키고 문화에 영향을 미칠 수 있다. 비드먼과 마르티네스의 새로운 의과대학 전략계획 연구는 "전략적 계획이 조직문화 변화를 지시하는 데 중요한 역할을 할 수 있다."24 (p272) [전략의 언어]는 문화에 결정적인 영향을 미칠 수 있다.10 이러한 상징적인, [문화로서의 전략 효과]는 주요 이해관계자(예: 이사회, 교수, 학생, 주 의회, 기부자)에게 매우 중요하며, 이들 중 다수는 쉽게 이끌림당하지 않을 수 있다.
Repetition of themes in the formal and informal discourse of an organization can, over time, change behavior and influence the culture. Wiedman and Martinez’s study of strategic planning at a new medical school found that “strategic planning can play an important role in directing organizational culture change.”24(p272)The language of strategy may have a decisive effect on culture, as Byrne and colleagues’ case study demonstrates.10This symbolic, strategy-as-culture effect can be critical for leading stakeholders (e.g., governing boards, faculty, students, state legislatures, donors), many of whom may not intend to be led easily.
그래서 어쩌면 우리가 모든 것을 잘못 알고 있었는지도 모른다. 어쩌면 문화는 조직의 전략 수립을 위한 시도를 파괴하는 반대 세력이 아닐 수도 있다. 아마도 전략과 문화는 같은 힘의 다른 표현일 것이다. 아마도 [전략적 계획의 힘]은 [기관의 문화를 형성하기 위해 전략에 대해 이야기하는 방식]에 있을 것입니다. 전략적 계획은 그것이 전달하는 가치, 그것이 구현하는 의식, 그리고 그것이 여러분의 조직을 새로운 방향으로 이끄는 방식에 있어 중요하다.
So maybe we have had it all wrong: Maybe culture is not an oppositional force that wreaks havoc with attempts at strategy setting in organizations. Maybe strategy and culture are different manifestations of the same force. Maybe the power of strategic planning is the way you talk about it to shape the culture of your institution. Maybe strategic planning matters for the values it conveys, the rituals it embodies, and the way it nudges your organization in new directions.
In this Invited Commentary, the author examines the history, use, and effectiveness of strategic planning in higher education, academic medicine, and nonprofit settings. Strategic planning is a process by which an organization differentiates itself from its direct or emergent competition to achieve its mission. This form of planning is distinct from operational planning, in which an organization identifies the ways in which it will continuously improve. Many organizations employ a combination of strategic planning and operational planning but use the former term to describe their planning process without a clear definition or conceptual framework.The empirical literature across disciplines has not demonstrated that strategic planning leads to positive organizational outcomes. Over the modern history of academic medicine in the United States, strategic planning may have had limited impact on organizational outcomes because of favorable environmental circumstances that catalyzed growth and innovation regardless of planning efforts. In the current environment, organizational and departmental leaders need to define trade-offs between the various opportunities that they confront; allow for both planned and emergent strategy formulation; avoid platitudes and fluff; and focus on operational excellence.Theories from anthropology suggest that strategic plans may be more important for what they express than what they produce. Repetition of the themes and language of strategy in formal and informal discourse can have a decisive effect on the culture of the organization. Strategic planning, therefore, matters for its effect on organizational values, rituals, and ability to move the organization in new directions.