의사면허 필기시험 제도의 성과와 과제

Major Reforms and Issues of the Medical Licensing Examination Systems in Korea

백상호

가천대학교 의학전문대학원 해부학과

Sang-Ho Baik

Department of Anatomy, Gachon University Medical School, Incheon, Korea



서 론

우리나라에 의사시험(공식 이름은 의사국가시험)제도가 처음도입된 것은 반세기 전인 1952년이다. 그 뒤 62년이 지난 지금에 이르기까지 의사시험에는 많은 변화가 있었으며 이에 따르는 시련과갈등도 있었다. 결과적으로 의사시험은 많이 개선되었으며 그 주된내용은 예전에 비하여 시험제도와 시험문항의 질 및 수준이 보다높아졌다는 점이다. 이러한 의사시험의 변화는 대학의 의학교육내용, 방법과 학생들의 시험 준비태도에도 상당 부분 영향을 주었다.당시의 변화 과정 속에 나타났던 모든 어려움과 고통, 갈등의 요소가 지금은 너무나도 당연한 것으로 받아들여질 만큼 평가체계 자체의 발전과 이에 관련된 사람들의 의식변화도 많이 달라졌다. 그중에서도 몇 가지 큰 변화를 지적하자면 시험을 주관하는 기관이정부 부서에서 공익 중심의 민간 전문 평가기관으로 옮겨진 것을시작으로 시험목표 설정, 시험과목 수의 감소, 과목별 시험문항 수의 증가, 문항의 질 및 형태개선, 시험장소의 분산, 시험기관의 조직보강 및 업무확장, 시험업무의 전산화, 국제기구와의 협력체계 구축, 실기시험의 도입 등이다.


의사국가시험

의사시험의 기능은 의과대학 교육을 마친 졸업생을 대상으로 기본(1차)진료의사로서 적절한 능력을 가졌는지 여부를 평가하여 이기준을 통과한 사람에게 의사자격을 주고 의료업에 종사할 수 있는 면허를 부여하는 데 있다. 능력평가는 곧 전문지식, 임상수기, 태도, 윤리성과 도덕성 등의 측정을 통해 법 규정에 따른 정답 총계가합격선을 통과하면 이 능력을 갖추고 있다고 인정되는 제도이다. 그러나 초기 시험의 질과 수준, 측정 범위는 만족스럽지 못하여 이것을 개선하는 데 오랜 기간 동안 의학계의 많은 노력이 기울여졌다.우선 시험과목 수가 너무 많았고 상대적으로 시험문항 수는 적었으며 문항의 형태는 출제 교수의 의도에 따라 여러 가지가 섞여 있었고 과목 간의 중복사항을 검증할 만한 장치도 없었다. 그리고 이모든 것을 하루에 서울에서 시행하였다. 이러한 시험의 문제점을개선하려면 법(시행령, 규칙)을 고쳐야 할 부분도 있었고 문항이 얼마나 좋고 나쁜지 분석(문항분석)을 하는 전문가와 조직도 따라야했다. 그때의 의사시험이 전체적으로 내용수준은 높았지만 문항구성수준이 낮은 상태였던 것으로 판단되었지만 사회가 이것을 곧의사의 질과 수준으로 연관시키는 일은 거의 없었고 의학계 자체적으로 자발적이고 자율적인 개선활동으로 이어져 왔다. 과거에 시행한 시험이 내면적으로 의사의 역할 검증을 얼마나 수행했는지는판단할 명확한 증거가 없었기 때문에 단언하기가 어렵다. 그러나 사람의 능력을 시험할 때 갖추어야 할 평가의 기본적인 측정원칙, 평가범위, 절차와 과정 등에는 원리와 논리에 어긋남이 많은 채 수십년을 유지해 왔다는 것은 과거의 의사시험이 걸어온 길을 돌이켜보면 쉽게 납득이 간다(Baik, 1988; Cha, 1993).



시험기관의 신설 및 업무 이관


의사시험은 1952년 제1회 의사시험제도 도입 이후 약 40년 동안은 당시 정부의 한 부서였던 보건사회부 보건원 고시과에서 주관하여 왔었다. 고시과는 소수의 사무직 인원과 시험시행만을 겨우충당할 수 있는 예산을 가지고 부서의 몇몇 인원이 꾸려 왔었기 때문에 당시의 정부가 의사시험의 가치를 어떻게 인식하고 시험의 비중을 어디에 두고 다루어 왔는지 짐작할 수 있었다. 의학계에서는특히 의과대학 학장과 의학교육 전문가들의 모임에서는 의견을 집약하여 정부에 대하여 많은 청원과 건의를 하면서 국민의 의료를담당하는 의사의 질을 국가가 보장하려면 시험의 질과 수준을 높여야 한다는 것을 오랜 기간을 두고 주장하여 왔다. 그러나 그 결정권이 주무부서 행정요원 손에 있는 동안은 개선이 부분적이고 일시적인 입막음에 지나지 않아 큰 틀에서 볼 때 의사시험은 조리가안 맞는 상태로 변화해 왔다. 그러다가 천신만고 끝에 의학교육 평가 전문 교수를 중심으로 한 재단법인 성격의 의사국가시험원이1988년 창립되었다(Korean Health Personnel Licensing ExaminationBoard, 1999a). 그러나 정부는 매우 미온적인 태도로 그 단체의 인가를 약 4년간 끌어오다가 1992년에 들어서야 한국의사국가시험원이라는 이름으로 인가를 하였고 시험위탁기관으로까지 공고를 내기에 이르러 시험개선의 물꼬가 트이게 되었다. 신설된 의사국가시험원에서는 시험업무를 위탁 받을 준비(전문 인력 확보, 과거 시험문항 인수 등)를 마침으로써 실제로 첫 시험을 치른 것은 기존의 문항을 가지고 1993년에야 이루어졌다. 1994년 본격적인 민간평가기관체제에서 새로 개발된 문항으로 시험을 시행하였다. 그 뒤정부는 의사국가시험원을 한국보건의료인국가시험원이라는 기관으로 확대 개편하면서 보건원에서 관장하던 나머지 모든 보건의료인 관련 시험(18개 직종의 23개 시험)마저도 이 기관으로 이관하여현재에 이르렀다(Figure 1).





과거 의사시험의 제도와 질


국가기관에서 시행하던 당시의 의사시험은 연속성 없이 매번 위촉하는 의과대학 교수들의 자문에 의하여 나온 의견이 담당자의손에 의해 그대로 결정되던 상황이었기 때문에 시험의 제도 및 시험문항의 질과 수준은 일관성도 없었고 개선의 의지도 없었으며 형식적인 문제은행의 보안에만 신경을 쓰고 있었다. 무엇보다 의사시험의 가장 첫 단계 핵심은 시험이 왜 존재하는지 무엇을 평가(측정)하려는지 그 의도와 방향이 확고해야 하는데 그런 면이 명확하지않은 채 약 40년 동안 불합리한 제도를 가지고 시험을 치러 왔다. 그중에서도 시험과목, 과목당 문항 수와 배점, 시험시간은 가장 개선이 시급하였고 특히 문제은행 속의 문항의 질과 수준을 높이는 일이 시급하였었다. 당시의 내용을 항목별로 좀 더 깊이 돌이켜보고자 한다.



1. 시험과목


의사국가시험이 시작되면서부터 시험과목은 매우 변화가 많은 길을 걸어왔다. 

  • 1952년 첫 시험을 시작할 때부터 1958년까지는 5개 과목으로 유지해 왔는데 하루 한 과목씩 닷새 동안 시험을 보았다. 그당시에는 기본 핵심과목 4개(내과학, 외과학, 소아과학, 산부인과학)에다 해마다 당해 연도에 공고하는 안과학, 이비인후과학, 피부비뇨기과학이 교대로 선정되었다. 
  • 이것이 1959년도부터는 3개 과목으로줄고(수험자 부담을 줄이기 위해서였던 것으로 추측된다) 그 과목의선정도 6개월 전에 공고하는 임의의 3개 과목을 치르도록 하였다. 그당시의 시험과목은 목표 없는 시험처럼 보였다. 어떤 해에는 내과학,정신과학, 이비인후과학이었다가(1959년) 심지어는 외과학, 소아과학, 이비인후과학(1961년) 등 의사로서 가장 기본적인 지식으로 알고있어야 할 비중이 큰 내과학이 온통 빠진 적도 있었다. 
  • 1962년에서1963년까지는 임상 10개 과목으로 늘어났고, 그 후 12개 과목(1964-1970년), 13개 과목(1971-1983년)으로 늘었다가 드디어는 15개 과목으로 늘어났다(1984-1993년). 이러한 갑작스런 과목 증가는 당시 학문의 전문화와 세분화로 인하여 독립된 새 과목(피부과학과 비뇨기과학 분리, 신경과학과 정신과학 분리, 임상병리과학과 마취과학의신설, 예방의학과 의료법규의 분리 등)의 주장에 따른 것이 대부분이었다. 의사시험과목에서 빠지면 정체성이 낮아진다는 이상한 위축감, 열등의식이 작용하였다. 이것은 의사시험이 무엇을 측정해야 하는지에 대한 원대하고 큰 목표에 따라 결정해야 할 부분이지만 보건부 차관이 주관하는 의사시험위원회에서 위원 교수들의 일방적 주장에 따라 결정해 버렸던 현상의 결과이며 의학계가 자업자득한 것이었다(Figure 2).





시험시간은 일정한데도 과목은 자꾸 늘어나면서 문항 수와 배점에도 불균형이 생겼고 바로 불합리한 상태로 굳어져 갔다. 가령 보기를 들어 1964년에 치러졌던 17회 시험은 과목이 12개로 총점이 250점이었는데 문제 수는 각 과목마다 꼭 더 많이 내야 한다고 주장하였지만 시간(하루)에 제약이 있어 250문제로 결말이 났다. 이것을 각과가 한 문제라도 더 가져가려고 치열한 논쟁 끝에 문제당 0.5점씩이라도 좋으니 꼭 그 수를 채워야 한다는 요구에 이상한 배점계획이 되어버렸다. 그리고 문제형태도 전 해(1963년)까지 모두 주관식 형태였으나 객관식 문제를 섞어서 내야 한다는 주장도 있어 주관식과 객관식문제를 일정 비율 섞어서 출제하게 되었다(Table 1).





2. 시험기간 및 장소


초창기에는 주관식 3-5문제를 서술하는 형태로 냈기 때문에 제1회의 경우 시험기간도 하루 한 과목씩 5일간(분량은 무제한)이었고그 다음 회부터는 2-3일이었다가 1966년 제19회 때부터는 여러 과목이 하루에 치러졌다. 시험장소도 1990년까지는 서울에서만 시행되었다. 지방대학의 학생들이 낯선 서울에 올라와 시험을 보기 위해서는 숙소 확보, 많은 학생들의 안전하고 빠른 이송문제, 익숙하지 않은 분위기 등 수험생에게 부담도 컸고 경비지출도 많았다. 그러나 관리하는 입장에서는 서울 한 곳이 편리하고 지방에 맡기면보안이 불안하다는 이유로 그 제도를 지속해 왔다. 대한의사협회,전국의과대학장협의회의 간곡한 요청과 함께 집행할 예산이 모자라면 의학계가 경제적 부담도 하고 교수들의 자율적 교차 감독을하겠다는 내용을 제시하면서 분산 시행 안을 내놓았고 이것이 받아들여져 1991년부터 서울, 부산, 광주 3곳에서 분산 실시하였다.그러나 시행 장소를 확장하는 것은 더는 받아들이지 않았다. 그 때까지만 해도 소위 필경사라는 직업을 가진 사람이 시험출제 장에들어와 기름종이에 쓰거나 수정하고 등판인쇄로 시험지를 만들어냈었다. 그러나 이미 그 때는 초기지만 컴퓨터를 쓸 수가 있어 의학계 관계 기관에서 컴퓨터를 동원하여 문제지를 작성하였고 프린터로 찍어내는 서비스까지 했었다.


3. 합격률과 합격기준


1952년 제1회 시험부터 1994년까지의 합격률은 평균 89.4% (그중 1983-1994의 합격률은 90-98%)이었으며 최고 98.6%에서 최저57.2%까지 변동의 폭이 매우 컸다(Figure 3). 그리고 합격률이 너무낮았던 해에는 한 해에 두 번 시험을 치른 적도 있었다. 합격기준은처음이나 지금이나 변함없이 총점의 60% 이상으로 되어 있고 과목도 40% 이하가 되면 불합격에 해당하는 과락(과목낙제)으로 법규에는 정해져 있다. 

  • 그러나 시험과목 수가 늘어나면서(1965-1983) 핵심과목에 해당되는 내과학, 외과학, 산부인과학, 소아과학, 예방 및법규에 대해서만 과락을 적용하고 나머지는 과락에서 제외시켰던적이 있다. 
  • 그러나 이에 대한 반발로 1984년부터 1987년까지는 다시 전 과목 과락제로 바뀌었다. 
  • 그러나 여기에도 문제점이 생겨1988년부터 1993년까지는 핵심과목은 40% 이상을 기준으로 하고나머지 과목(특과과목 또는 지원계열 과목)은 내과계열, 외과계열,지원계열로 세 그룹을 지어 ‘그룹과락제’라는 이상한 제도를 만들어낸 적도 있다.





의사시험의 제도 변화


1. 의사국가시험원의 설립


의학교육 분야의 숙원이던 민간평가기관(의사국가시험원)의 신설이 드디어 1992년에 이루어졌다(Korean Health Personnel LicensingExamination Board, 1999b). 이 기관은 의사시험을 평가원칙에 입각하여 불합리하던 제도를 개선하고 시험문항의 질적 수준을 높이려는 데 있었다. 시험의 제도와 질을 높임으로써 교육기관(의과대학)으로서는 교육에 대한 방향 설정이 의사시험과 일치하게 되는 긍정적인 변화의 흐름을 감지하게 되고 의사시험에 합격한 의사에게는 우수한 시험에 통과했다는 전문인으로서의 자긍심을 가지게 하고 사회적으로는 우수한 의료 인력을 배출함으로써국민(환자)의 안전을 도모하기 위한 큰 명분 등 여러 목적을 담고 있었다. 그런 가운데서도 민간평가기관이 설립되면서 시험의 질에는눈에 띄게 다른 점이 나타나기 시작하여 이런 내용을 외국에도 널리 알리게 되었다(Baik, 2001, 2003, 2005). 그 후 의사시험의 타당성과 신뢰성이 인정됨에 따라 정부가 주도하여 시행하던 모든 보건의료인국가시험을 의사국가시험원에 이관하면서 보건의료인국가시험원으로 확대 발전되어 현재는 24개 직종 27개 종목의 국가시험을 시행하는 전문평가기관으로 발전되었다(Figure 1).



2. 시험제도의 개선작


설립 이후 처음 3년 동안 가장 시급한 문제는 시험의 수준 향상에 있었다. 의사국가시험의 수준과 질은 전적으로 측정도구인 시험문제의 질에 달려 있었으며 법과 규칙이 이것을 움직이기 어렵도록만들고 있었으므로 첫 번째로 한 일은 주무 부서인 복지부와의 법령, 규정의 개정을 두고 일어났던 갈등이었다. 의사국가시험원이 생겨 업무 이관은 되었으나 시험에 관련된 모든 내용이 법에 묶여 있어 이것을 개선하기 위해서는 우선 이러한 법적 규제를 고쳐달라고요청하는 길밖에 없었고 이 절차에서 주무 부서에서는 수 없이 되풀이 되는 설명과 논리만으로는 여전히 해결이 안 되었기 때문에많은 시간을 허비하였다. 그런 가운데서도 몇 가지 항목은 기어이개선을 하도록 허락을 받아 모순된 내용을 하나 둘 고쳐나가게 되었다(Korean Health Personnel Licensing Examination Board,1999a). 중요한 개선 부분은 시험이 지향해야 할 목표설정, 시험과목 수의 축소, 출제기준표 작성, 문항 수의 증가와 시간연장, 문항형태와 자료형식 교체, 난이도와 분별도의 안정화, 문항 지식수준의조정, 그리고 앞으로 다가올 실기시험에 대한 준비 등이었다(Hwang et al., 2001; Lee et al., 2004).



3. 의사시험의 변화 내용


1) 시험업무 개선 목표설정


의사시험을 수십 년 동안 실행하면서도 시험의 목표를 별도로설정하지 않았었다. 그래서 시험은 바람 부는 대로 흔들려 왔기 때문에 시험업무의 개선목표 즉, 지향해야 할 목표를 우선 설정했다.그것은 어디까지나 좋은 시험, 좋은 시험의 잣대인 좋은 문항개발에 역점을 두겠다는 의지의 표현이었다(Baik, 1989, 2002a). 

  • 1) 의사‘기본 임무’에 ‘평가내용’을 맞춘다. 
  • 2) 의사국시원의 해당 분야 ‘문항개발기준’을 따른다. 
  • 3) 시험의 주제는 전체 영역 범위 안에서 고르게 정한다. 
  • 4) 실제 의사 임무에서 필요로 하는 영역을 모두 포함시킨다. 
  • 5) 시험형식은 실제상황에 가깝도록 구성한다. 
  • 6) 주제와 내용에 따라 적절한 시험문항의 형태를 선택한다. 
  • 7) 전체 시험문항이 고른 난이도를 가지게 한다.


이 원대한 목표 성취를 위해 기준을 만들 때나 문항개발을 하는교수에게도 이와 같은 개선사항을 당부했다. 이것은 과목에도 통하도록 했고 문항 수, 문항의 내용에도 통하도록 했다. 목표는 평가의 참된 뜻을 반영시킬 두 가지 대표적 개념 즉, 관련성(내용타당성)과 신뢰성을 높이는 데에 맞춘 항목들이다.


2) 시험과목


  • 1994년까지 15개 과목이었던 시험과목을 드디어 
  • 1995년 7과목으로 줄였고 다시 
  • 2002년에는 3개 과목으로 줄였다(Figure 4). 

이 3개 과목은 이미 교과목이나 진료과목이 아닌 통합형태의 영역이었다. 이것은 과거 시험과목이 곧 의학의 진료과목과 동일하게 생각하는 교수들에게 기본 핵심과목과 특과과목의 개념 그리고 기본의사와 전문의사의 개념 및 임무 차이에 새로운 암시를 주기 위한것이었다. 당시 의과대학에서 가르치는 과목별 교육도 서서히 통합교육으로 옮겨가는 트렌드 및 시기와 맞물리고 있어서 몇 해를 두고 시험과목 축소를 진행시킨 결과였다

  • 그 개정된 첫 번째 내용(1995년 7과목)은 내과학, 외과학, 산부인과학, 소아과학, 정신과학,예방의학, 그리고 보건의약관계법규였다. 
  • 그리고 과목의 개념과 벽을 좀 더 헐기 위해 2002년에는 의학총론, 의학각론 그리고 의약법규의 큰 세 영역으로 축소시켰다. 모든 질병의 진료와 예방은 실제로 기관계통을 중심으로 한 의학교육의 통합된 내용에 따라 이루어지고 있었으므로 1차적으로 그런 개념에서 출발한 것이며 그 내용 속에 중요도에 따라 시험문항 수를 조정하는 절차를 밟게 했던것이다. 그리고 총론은 그러한 기관계통을 벗어나서 각론에서 다룰내용의 기초의학적인 영역과 계통의 내용 및 특정 계통에 해당되지 않는 개념의 영역을 한데 묶었던 것이지만 총론은 문항개발자의이해가 거기까지 미치지 못해 임상 각 과목의 개념적인 내용으로대체하여 시작되었다.





3) 출제기준


출제할 때 출제자의 개인적인 의향, 선호보다는 처음부터 정한근거에 따라 출제도 고루 하고 중요성은 강조하고 문항의 성격도 정하는 그런 출제기준표(content outline)가 만들어졌다(Figures 5,6). 시험과목(영역)은 새로 개정된 의학총론, 의학각론, 법규의 큰세 개로 되어 있었고 각 과목 속에 출제할 구성 내용은 대항목(30),중항목 영역(202), 중항목(1,522), 소항목(출제단위)으로 되어 있었으며 소항목은 공개되지 않았고 소항목 속의 출제는 기능, 원인, 기전, 진단, 빈도, 예방, 치료 등이 들어 있게 하였다. 시험출제 항목 속에는 의사로서 기본으로 반드시 알아야 할 내용을 ‘기본항목’으로별도로 분류하였다. 이 기본항목은 중항목에 속하면서 매해 되풀이하여 출제되는 의학의 가장 중요한 내용의 문항으로서 출제문항의 약 30%를 차지하도록 되어 있었다. 그리고 문제은행도 별도로관리하였다. 이것은 전 해에 출제되었다는 이유로 제외시킴으로써사소한 문제는 출제되고 중요한 문제는 빠뜨리는 일이 없도록 꼭알아야 할 사항은 해마다 내어 수험자가 풀이하는 능력을 확인하자는 데 있었다.






4) 문항 수와 시험시간


시험과목이 15개였던 1994년까지는 문항 수가 440개였고 시험시간은 330분이었다. 이것을 과목 수를 7개로 줄였던 1996년에는문항 수는 340개로 정해졌고 시험시간도 400분으로 늘었다. 그 후계속 문항 수를 늘려가면서 시간도 비례해서 늘려 나갔다. 그러나2002년에는 550문항이 되면서 시험시간은 715분이 소요됨으로써시험기간이 겨울철이어서 어두울 때까지 시험을 시행하는 데 현실적으로 제약을 많이 받아 2005년 이후는 더 이상 문항 수와 시험시간을 늘릴 수 없었다(Figure 7). 시험문항 수(length)와 시험시간(duration)은 신뢰성을 결정짓는 중요 변수의 하나인 효율성(efficiency)을 좌우하는 세부 요인이므로 매우 중요한 항목으로 간주하였다.






5) 시험 문항형태


의사국시원이 설립되면서 시험과목의 개선 외에 집중적으로 개선을 하려고 했던 것 중 한 가지는 문항형태 즉, 신뢰성 있는 객관식문항으로의 탈바꿈이고, 다른 하나는 문항내용을 실물에 가까운상태의 자료로 만드는 일이었다. 주관식 문항에서 완전히 객관식으로 바뀐 것은 오래되지 않았다. 1962년까지는 논술형의 주관식이었고 1962년부터 1970년대 중반까지는 단답형의 주관식 문제를 냈었다. 그에 이어 1985년까지는 주관식(단답형 30%)과 객관식(70%)을혼합하여 출제해 왔다. 그러다가 1985년부터 완전히 객관식 문항을 채택해 왔다(Figure 8). 객관식 문항형태는 대학에서 오래 전부터 흔히 써 오던 A형, K형 문항이 섞여서 출제되어 왔는데 그 중 K형 문항(complex true/false items)은 수험생의 능력을 측정하는 도구로서의 가치가 매우 낮게 평가되면서 2010년 1월에 시행했던 74회 의사시험부터 완전히 배제하였다. A형(단일정답형 multiplechoice question [MCQ], one-best-answer item formats)은 가장 보편적으로 써 오던 문항형태였으며 그것과 함께 K형 문항 대신 새로이 미국국시원(United States Medical Licensing Examination,USMLE)에서 개발한 R형 문항(확장결합형 문항, extended matchingtype items)을 채택하기 시작했다(Figure 9). 그동안의 시험에는앞에서 기술하였듯이 객관식 문항도 A형과 K형이 섞여서 출제되었다. 그것은 문제 은행 속에 K형이 많았었기 때문에 일어난 현상이었고 A형 문항조차도 종전에 가졌던 5개의 답가지 중 하나를 선택함에 있어서 답가지에 너무나 명백한 오답가지가 1-2개, 많게는3-4개 있어 정답을 쉽게 고를 수 있는 문항작성의 오류가 심각하였다. 그래서 각 대학의 교수들을 대상으로 문항작성 연수를 여러 차례 시행하여 같은 A형이라도 옳은 정도에 차이가 있는 가운데 가장 올바른 답 하나를 골라내는 one-best answer의 작성능력을 많이 보급시켰다. 그와 동시에 새로운 문항형태인 확장형 객관식 문항으로 각광을 받기 시작했던 R형 문항의 작성법 연수를 거쳐 서서히문제은행 속의 내용을 바꾸어 나갔다. 이 R형 문항은 임상 영역의시험문제뿐만 아니라 기초의학 영역의 문제작성에도 적합한 풍부한 소재를 가지고 있다. R형 문항은 임상상황에 매우 가까운 형식이어서 의사시험에 실용적인 것으로 판단되어 2002년부터 쓰기 시작하였다. 이 문항형식은 동질성이 있는 내용을 여러 측면에서 평가할 수 있다는 장점과 우연에 의한 득점 기회를 줄일 수 있다는 점,아는 만큼 점수를 인정받을 수 있다는 점, 높은 지식수준의 문항개발이 가능하다는 등의 장점이 있어 그 이후로 점차 채택 수를 늘려2010년에는 완전히 A, R형으로 대체되었다.







6) 문항 구성형식


문항 출제자료 내용의 다양화의 일환으로 글로 표현(텍스트 중심)하는 대신 임상자료를 제시하고 묻는 형식을 보강하였다. 시험문항이 아무리 객관식 선택형이라고 해도 글로 된 내용만을 중심으로 공부하던 경향에서 방사선사진, 심정도, 피부사진, 검사결과표, 내시경사진 등을 제시함으로써 임상상황에 좀 더 가까운 자료를 확실하게 판독, 이해, 판단하는 형태로 바뀌었다(Figures 10, 11).







7) 지식수준


지식에는 가장 낮은 암기수준에서부터 이해, 응용, 분석, 합성, 평가에 이르기까지 여러 수준의 등급이 있다. 의사시험에서 오랫동안지적되어 온 또 하나의 문제점은 객관식 형태의 시험문제에 암기형과 이해수준의 문제가 가장 많았다는 분석보고가 있었다. 그동안의사시험위원회에서는 어떤 과목에 얼마를 배점하느냐에 많은 관심을 기울였지만 내용에서 실제 임상과 거의 비슷한 상황을 설정해 놓고 풀어나가는 문제해결형 문항은 거의 찾아볼 수 없었다. 의사에게는 실제로 모든 수준의 지식이 다 필요하지만 궁극적으로는환자의 문제해결을 할 수 있는 능력이 있어야 하고 그것을 위해서는 지식 중 상위의 분석, 합성, 평가능력을 필요로 한다는 점에서문제해결형 문항을 높이도록 함에 따라 많은 문항의 개선 또는 새로운 작성이 필요했다. 아무리 신뢰성을 높이기 위해 객관식 형태,문항 수, 시간 등을 조정한다고 해도 문제내용이 암기형, 이해형의문제만으로는 의사시험의 질, 특히 관련성(내용타당성)을 나타내는 시험의 종합적인 타당성이 낮아짐을 피할 수 없었다. 그래서 이것은 새로운 문항을 개발할 때, 기존의 문항을 폐기할 때, 매우 중요한 지침으로 인식하고 정리하도록 하였다. 실제로 1990년부터 2000년 시험까지의 분석결과를 그림으로 보면 전에 비하여 암기수준의문제는 많이 줄고 문제해결형 문제의 비율이 많이 늘었음을 알 수있다(Figure 12).




8) 시험기간 및 장소


의사국시원이 생기면서 1992년부터는 시험장소를 대폭 확장하여 서울, 부산, 대구, 광주, 대전, 전주 등 6개 도시로 분산하여 2일간그 도시 안의 교육시설을 이용하여 분산 시행한 바 있다. 이것은 수험생의 편의 및 부담 경감을 위한 것이 주된 이유지만 시험시행에는의사국시원의 부담과 인력, 경비 등이 많이 소요되었다. 시험 감독은 그 대신 의과대학이 소재하는 도시 간에 교차하여 파견했기 때문에 교수 인력의 적극적인 협조 없이는 시행할 수 없는 일이었다.


9) 문항 난이도와 합격률


시험형태와 질을 대폭 개선하는 가운데 1995년 제58회 의사국가시험부터 새로운 노력의 변화가 나타나기 시작했다. 그동안의 단순 암기형 중심에서 해석판단 및 문제해결 위주의 문항 비율 증가,텍스트 중심의 문항에서 임상자료 제시형 문항의 증가, 문항 수 자체의 증가 및 시간의 증가 등 여러 변화가 동시에 적용됨으로써 문항의 난이도와 분별도 변화가 나타나기 시작하였다. 문항의 난이도와 분별도의 지수는 시험문항의 질적 검증의 한 방법이다. 말하자면 측정도구인 문항이 공부를 잘한 사람과 잘하지 못한 사람을 예민하게 판별해내는 중요 지수이다. 한편 이 난이도와 분별도는 합격률에도 예리하게 영향이 미쳤다. 그래서 1995년 제58회 의사국가시험은 근래의 의사국가시험 중 가장 낮은 합격률(64.3%)을 보였다(Figure 13). 이러한 출제 경향의 변화는 몇 해 전부터 학장협의회나 학회, 때로는 대학별로 공지하여 왔고 그것이 현실화될 것이라고 예고하였음에도 불구하고 안이한 예상 합격률을 생각했던 수험생이 대량 낙방을 하게 되어 소동이 벌어졌다. 이때의 평균 난이도가 62.7, 분별도가 0.195를 보임으로써 1994년 제57회 의사국가시험(합격률 97.5%, 난이도 76.8, 분별도 0.105)보다 문제수준은 어려웠지만 시험 후 문항분석결과 소위 ‘좋은 문제’가 출제된 것으로 분석되었다(Figure 14). 







난이도와 분별도를 그 이후의 평균과 비교해 보면 매우 대조적이다. 그 이후(1997-2003년)의 평균 성적과 합격률은 큰 변화가 없이 안정되었다(Figure 15). 새로 설립된 의사국시원의 해야 할 일은 시험목적에 알맞도록 개선하는 일이었다. 그것의하나는 시험내용을 되도록 현실 상황과 비슷하게 적용시키는 일(관련성 강조)과 그 시험문제가 측정도구로 되도록 높은 믿음성을가지도록 하는 일(신뢰성 강조)이었기 때문에 문항내용에 많은 변화가 있을 것임을 누차 강조한 바 있었다. 시험의 질 향상 노력에도불구하고 갑작스런 합격률의 저하로 예상했던 의료 인력의 공백이나타났기 때문에 학장협의회의 요청에 따라 그리고 복지부의 승인에 따라 반년 후 시험을 다시 치르는 상황이 나타났다. 그것이 1995년에 두 번의 시험이 있었던 사연이다. 시험 경향과 문항의 질적 강화가 있었던 첫해인 1995년 1월 10일 시행한 58회 시험에서는 대량탈락현상이 나타났지만 그래도 응시자 2,971명 중 1,909명이 합격하여 64.3%가 합격한 것을 보면 많은 대학이 새로운 경향을 적극수용하여 교육시키고 응시한 학생 전체의 2/3가량이 합격하였다는것은 앞날의 변화에 희망적인 예고였다. 그해 추가로 본 시험은1995년 7월 24일에 시행되었는데 1,048명이 응시하고 898명이 합격됨으로써(85.7%) 수험자가 같은 대상이었지만 하면 된다는 것을 보여주었다. 그 뒤로는 대학도 수험생도 예전 같은 시험으로 대충 넘어가는 일은 일어나지 않았고 모든 개선상황은 더욱 강화되었지만비교적 적응이 잘 되어 시험은 전반적으로 수준과 질의 향상을 가져오게 되었다. 의사시험은 치기만 하면 붙는 시험이라는 인식에서시험이 쉽지만은 않다는 인식을 하게 되었다. 그런 시련을 전후한합격률을 비교해 보면 이해가 간다(Figure 16). 이러한 고충과 갈등을 겪으면서 의사시험은 성장한 것이다 그 이후 의사국가시험은 초기의 정책과 마찬가지로 “진료중심의 평가”라는 의사능력 검증방향으로 나아가게 하는 원동력이 되었음은 부정할 수 없다. 결과적으로 볼 때 의사국시원 개원 이후 그때의 시험은 가장 어려웠던 시험으로 국가시험 시행에 있어 시험의 질과 수준뿐만 아니라 문제의난이도 조정과 전문 인력 유지가 중요하다는 점을 단적으로 보여주고 있다(Korean Health Personnel Licensing Examination Board,2013). 그러나 이 목표를 위하여 의사국시원은 문항의 질은 좋게 하고 난이도에 덜 영향을 받으면서 합격선을 적절하게 유지하는 새로운 합격기준의 설정이 절실하게 되었고 이것이 법적인 문구의 개정으로까지 바뀔 것을 기대하고 있다.







10) 합격통지 및 면허 발급


합격 여부의 통지는 전에는 정부의 전통적인 제도와 규칙에 따라 특정한 한 신문에의 공지와 관할 기관 현관에 내걸리는 공고(방)를 통해 알려주었고 의사면허증 발급은 합격한 뒤 면허교부신청서를 내면 4월에야 복지부에서 발급하여 많은 불편을 주었던 것을 정보화시대에 알맞은 빠른 제도로 개선하였다. 채점(전산실), 합격사정(당일 위원회 소집)을 거쳐 확정이 된 합격자는 합격 통지는 핸드폰을 통해 바로 통지해 주는 시스템을 만들었고 면허증은 온라인등록을 할 때 미리 면허교부 신청서를 함께 받아두었다가 두 달 단축시켜 인턴 수련 시작 전인 2월 하순에 교부를 해 줌으로써 인턴수련을 시작하는 의료인 자격에 지장이 없도록 개선하였다. 이제는한국의 의사시험이 외국에서도 좋은 시험을 선도하는 모범적인 시험으로 발돋움을 하게 되었다.




앞으로의 과제


의사시험이 앞으로 개선할 과제는 많다. 더욱이 이 시험결과가인턴 선발에 연동 활용되고 있어 일부에서 의학교육의 변형을 초래했다는 지적이 있기 때문에 시험제도와 문항의 질 향상 그리고 합격사정 등에 더욱 개선 향상시켜야 할 많은 과제를 안고 있다. 그 중우선순위가 급한 두어 가지만 집중적으로 기술하고자 한다.


1. 시험 출제기준


의사시험은 그 내용이 의대교육과 연동이 되어야 한다. 4년에 걸친 교육의 내용은 방대하고 이틀에 걸쳐 보는 시험은 한정적이고 선택적이다. 그러므로 의사시험은 의과대학 교육에서 공부한 내용 범위 중에서 항목이 선정되어야 하고 그 항목 속에서 문항개발이 되어야 한다. 그러나 의과대학 교육이 20세기 형식과 내용을 그대로유지하며 남아 있으면 그리고 교육과정 개발이 지지부진하면 의사시험이 그것을 마냥 따라갈 수는 없다. 의대교육이 좀 더 앞서가야한다. 지금 세계 의학교육의 변화 추세는 성과바탕교육(outcomebasededucation)이 대세이다. 그것은 곧 임무바탕 배움(competence-based learning)으로 이어져야 한다. 그러므로 의과대학에서이것(성과)이 먼저 만들어져야 하고 그것을 의사시험이 따라가도록분발해야 된다. 다만 졸업할 무렵의 기본적이고 필수적인 능력을 갖추기 위해서는 그 원천이 되는 지식은 1학년 시절부터 심어져야 하고 거기서 흐르는 원류는 작더라도 점점 과정이 진행하면서 여러 개가 모여 큰 강의 줄기를 이루게 되도록 치밀하게 잘 구성해야 한다.졸업할 무렵 의과대학 학생에게는 대학과 사회가 협동하여 만들어낸 임무가 계열별로 열거되어야 하며 거기에는 의과대학 교육의 필수인 지식, 수기, 태도의 3가지가 다 녹아 있는 상태의 수행능력(competence)이 갖추어져 있어야 하며 대학에서는 이 마지막 단계인 수행능력을 행동(behavior)과 실천(doing)으로 나타낼 수 있는지 여부를 테스트해서 내보내야 할 것이다. 대학마다의 추가적인 특징을 나타내는 내용은 다를 수가 있지만 우리나라 의과대학의 기본교육성과(outcome)는 모든 대학이 같아야 하고 의사시험은 공통적인 그 부분에서 선별해야 한다. 과거 시험과목은 많은 변화를 거쳐왔다. 즉 진료 과목에서 시작하여 통합된 의학(총론, 각론)으로 나누어져 있는 시험은 되도록 빨리 개인의 임무능력으로 바뀌어야 한다. 의사시험의 출제기준(content outline)이 의과대학의 교육성과(outcome)에서 탄생해야 하고 거기에서 문항이 만들어져야 논리적으로 맞는 것이다. 이미 의사시험에서는 실기시험을 도입한 지 몇 해가 지났다. 새로운 출제기준을 검토할 때 필기시험과 실기시험 사이에 출제항목이 중복되어 있는 것은 없는지 또 어느 한쪽으로 옮겨야 할 것은 없는지에 대해서도 고려를 해야 한다. 즉 두 시험 사이에연계를 가지고 정리를 할 필요가 있다. 필기시험은 지적(cognitive)영역의 테스트가 주이지만 실기시험도 내용적으로는 어느 한 수기사항이 지적인 것(cognitive skill)도 있고 지식을 바탕으로 하는 기계적 수기(mechanical skill)도 있기 때문이다.



2. 합격판정


지금까지의 합격판정은 총점의 60%를 넘어야 되는 것으로 규정하고 있다. 그리고 과목이라는 것이 있었기 때문에 전체 점수가 아무리 좋아도 과락이라는 탈락 함정도 있다. 이 두 가지는 근원적으로는 바로 출제한 문항마다의 난이도와 분별도에 달려 있다. 모든수험생이 모두 합격하도록 하려면 난이도를 낮추면 되고 대부분 탈락시키게 하려면 난이도를 올리면 된다. 그러나 시험은 이처럼 인위적으로 올리고 내리고를 할 수 없고 또 해서도 안 된다. 그러면서도공부를 잘한 사람과 못한 사람과의 구별은 예리하게 할 수 있도록분별도가 높을수록 좋다. 그러나 문항개발을 하는 사람이나 문제은행에서 선택하는 사람이 선택하는 어떤 문항 하나만을 가지고시험 치기 이전에 예측하여 난이도를 알기는 매우 어렵다. 오로지경험에 의존하여 판정하게 되거나 선행시험제도(pre-test system)를 가져야만 되는데 우리나라 교수들의 판정수준은 매우 높은 쪽으로 치중하는 편이다. 말하자면 기본의사와 전문의사를 구별하지않는(못하는) 개인적 식별태도와 안목을 가지고 있다. 이것은 의대교육에서도 마찬가지다. “이 정도는 당연히 알아야 된다”고 하지만실은 전공의 과정에서 공부해야 할 수준일 수 있는 것이 많다는 것이 선정위원들의 견해이다. 그러므로 의과대학 교수가 출제, 문항작성을 하는 과정에서 자칫 잘못 판정하면 다른 제동장치가 있지 않은 한 시험연도에 따라 전체적으로 어렵게 또는 전체적으로 쉽게나올 가능성은 언제든지 있다. 의료 인력의 수급문제는 시험의 난이도와 분별도와는 별개로 생각해야 할 큰 과제이기 때문이다. 시험의 질과 수준이 아무리 좋아도 박자와 장단이 서로가 잘 안 맞으면 1995년의 대량 불합격 같은 현상은 언제고 나타날 수 있다. 이것이 법으로 되어 있기 때문에 적절한 인원을 합격시키려면 쉬운 문제만을 낼 수밖에 없고 그것은 의사시험의 신뢰성과 타당성을 하루아침에 떨어뜨리는 일밖에 안 된다. 출제자, 문항 작성자의 이러한 고민을 덜어주고 적절한 인원 수급도 마련하려면 합격기준을 법으로 바꾸도록(appropriate setting of pass) 해야 한다(KoreanHealth Personnel Licensing Examination Board, 2013). 시험 선진국인 미국의 USMLE도 이러한 경험을 다 거쳤으므로 지금은 소신있게 좋은 문항을 작성한다. 우리나라도 이러한 체제로 바뀔 준비는 다 되어 있다. 문제는 바로 이 법을 고치는 문제이다. 이것은 정부가 결단을 내려줘야 하지만 국장까지 다 결재를 받더라도 장관이정치적인 판단으로 안 된다고 하면 백지화가 되고 만다. 우수한 의사 인력을 길러내어 국민에게 안전한 의료를 서비스하도록 하는 것이 국가의 소임이라는 것보다 내가 모르는 문제는 시끄럽지 않게하는 것이 여러 모로 좋다는 생각을 가지는 한 이것은 난관 중의 난관이다. 전문적인 문제는 전문가에게 판단을 맡기는 것이 가장 정도라고 판단하는 것이 합리적이기 때문이다.



3. 문항개발 인력


모든 문항작성은 교수의 손에 의하여 만들어진다. 다시 말해서많은 좋은 문항을 작성하려면 몇 10배수의 교수가 참여해야 한다.특히 객관식 MCQ를 유형별로 참뜻에 맞게 작성하려면 많은 지식이 있어야 한다. 문항개발에 관한 지식과 수기는 몇몇 교수의 훈련만으로 해결되는 것이 아니기 때문에 대학마다 끊임없는 워크숍을 통하여 훈련과 실전 출제를 하도록 해야 한다. 분야별로 숙달된문항개발능력을 가진 인력이 더 많이 필요하다. 즉 기본 문항은 말할 것도 없고 자료제시형 문항, 문제해결형 문항을 적절히 구성할인력이 더 많이 훈련되고 실제 업무에 투입되어야 한다. 시험문항에 대하여 많은 질적 개선이 있어 왔지만 아직도 문항 타당성을 높이기 위한 길은 멀다. 그것은 시험문항의 질적 수준을 높이는 데관여하는 요인이 많기 때문이기도 하지만 그러한 요인을 개선시키는 데 필요한 조건이나 환경이 성숙되지 못하였기 때문이다. 시험문항 구성단계에서는 전문 분야별 자문 인력의 자문 및 활용이 거의 안 되고 있다. 즉 전문성 내용에 대하여는 관련 분야의 교수 인력으로 충분하지만 문장 구성수준을 높이기 위해서는 평가 전문가, 한글 학자, 용어 전문가 등이 동시에 동원되어 모든 문항을 검토하는 절차를 가져야 한다. 지금 현재로는 극히 한정된 분야만이관여하고 있다.



4. 정보화시대에 맞는 컴퓨터 시험


이미 국가시험에서 많이 도입된 부분이기는 하지만 시험 시행 자체가 컴퓨터를 통해 실시될 날이 멀지 않았다. 이것은 일단 개발되어 실행에 옮기면 많은 인력, 시간, 예산, 수함자의 간접경비 등이 감소된다. 1단계는 종이에 인쇄되는 시험지를 컴퓨터 모니터로 바꾸고 키보드를 눌러 답을 선택하게 하는 방법이지만(computerbasedtest) 이 방법만으로도 시험지 운반, 회수, 채점, 합격사정 등을 순식간의 짧은 시간으로 바꾸어 줄 수 있다. 컴퓨터 화면에서 시험문항을 제시하게 되면 지금까지 자료제시형 문항으로 보던 시험을 그림, 사진, 도표, 소리까지도 직접 보고 듣고 판단할 수 있는 현장중심의 임상상황을 그려낼 수 있다. 그리고 다음 단계로는 수험자마다 다른 문항이 제시되면서도 그러나 평균 난이도는 비슷한다른 문항을 본인이 선택할 수 있게 하는 좀 더 선진화된 전산화시험(computer-assisted test)으로 옮겨갈 수도 있다. 이것은 채점, 합격판정 등이 동시에 이루어지고 이러한 체제로 바뀌면 시험이 끝난뒤 어디를 가 있든 지금처럼 스마트폰의 메시지를 통해 합격 여부가 알려질 수 있는 날이 올 것이다.


결 론


이처럼 많은 시련을 겪으면서 한국의 의사시험은 예전에 비하여많은 변화를 가져왔고 이제는 한국의 의사시험이 외국에서도 좋은시험을 선도하는 모범적인 시험으로 발돋움을 하게 되었다(Baik,2001, 2003, 2005). 과거의 의사시험과는 많이 달라졌다. 그동안 바뀐 점을 요약하면 

  • 1) 의사국시원 설립,
  • 2) 시험의 목표설정, 
  • 3) 시험과목(영역)을 3개로 감소, 
  • 4) 출제기준표 작성, 
  • 5) 문항 수와 시험시간 확대, 
  • 6) 적용할 MCQ (A, R) 형태 도입,
  • 7) 임상자료제시형 문항도입,
  • 8) 문제해결형 문항 증가, 
  • 9) 합격통지와 면허발급을 전산화,
  • 10) 시험장소를 전국으로 확대시킨 내용 등이다. 

서서히 바뀌지만달라지는 평가시스템에 맞추어 대학에서도 미리미리 이렇게 교육시키고 훈련시키는 의지를 가지고 있어 매우 바람직하다. 그리고 각의과대학의 학장들이 모여 평가를 포함한 의학교육의 여러 정책이의사국시원을 선도할 수 있도록 연구하고 실행하고 보급시켜야 할막중한 임무도 의식하게 되었다. 그런 점에서는 2년 또는 3년마다바뀌는 연속성이 없는 학장의 교체 제도는 이제 새로운 시대의 임용 절차로 바뀌어야 될 큰 과제로 남는다.




Since the establishment of the national medical licensing examination board in 1992, the medical licensing examination

system has changed enormously and this has had a number of impacts on examination services. All

those reforms were aimed at improving the relevance and reliability of the test. Several attempts of the testing

system have appeared in the new examination service, and which have also brought about the changes in the

medical school curriculum such as introducing integrated courses instead of traditional subjects, using test

scores as a reference to the post-graduation selection test. Some examples of changes in the examination system

are as follows: 1) choosing three integrated test subjects and outlines of their reference content instead of

15 academic subjects, 2) adjusting the ratio of multiple choice question items to focus more on the problem

solving level, 3) introduction of ‘one-best answer’ single set and ‘extended matching type items, 4) item construction

based on real clinical cases and real clinical materials. Recently, a clinical skill test system has been introduced

to measure examinees’ basic clinical skills competencies. Despite continuing efforts, the examination

system still has many issues remaining to be solved. These problems include the differential weighting of test

items, appropriate threshold for passing, and practicality of pre-testing to stabilize the passing rate and avoid

the hazards of newness and undesirably difficult test items.

Keywords: Medical licensing examination, Integrated subjects, Problem solving focused, Multiple choice questions

+ Recent posts