의학교육 중 공감의 저하에 관한 보고: 과장된 것은 아닌가? 문헌재검토(Acad Med, 2010)

Reports of the Decline of Empathy During Medical Education Are Greatly Exaggerated: A Reexamination of the Research

Jerry A. Colliver, PhD, Melinda J. Conlee, Steven J. Verhulst, PhD, and J. Kevin Dorsey, MD, PhD






공감은 거의 틀림없이 환자 치료에 종사하는 의사의 가장 중요한 정신 사회적 특성이다. "공감"은 [한 개인으로서 환자]를 대하는 caregiver의 인지적 및 대리적 이해이다. 또한 의사와의 관계에 대한 자신감과 신뢰를 낳고, 효과적인 치료와 치유를 촉진하는 것으로 여겨지는 이해이다.

Empathy is arguably the most important psychosocial characteristic of a physician engaged in patient care. “Empathy” refers to a caregiver’s cognitive and vicarious understanding of the patient as a person—an understanding that is thought to generate confidence and trust in the doctor–patient relationship and to promote effective treatment and healing.


자기보고도구들이 주로 의사의 공감을 측정하는 데 사용되었음,133

Self-report instruments have been used to measure physician empathy,1–3


이러한 연구들의 불안한 결론은 의과 교육 과정에서 감정이입이 감소한다는 것이다. 

  • 한 연구는 "환자 치료 상황에서 공감을 측정하기 위해 특별히 개발된 새로운 심리학적 견실한 도구를 사용하여 의과대학에서 공감이 감소한다는 것을 보여주는 경험적 증거를 제공한다"고 말한다. 

  • 또 다른 논문은 "의학연수 중 공감의 감소가 북미 의대생들에게 보고되었으며, 우려의 원인으로 간주되고 있다."9 

  • 이러한 우려의 깊이는 "의대 시절 심장이 딱딱해지는가?"14, "덕을 고치는 것"과 같은 저널 기사 제목과 "관련 질문은 어떻게 (인간적 자질)을 창조하느냐가 아니라 어떻게 의학교육이 그들을 파괴하느냐"와 같은 문장에도 반영되어 있다. 

  • 이러한 생각은 다음과 같이 요약된다: "일화 보고서와 연구 양쪽 모두가 전임상과 임상시기 사이 어디에선가 환자에 대한 학생들의 태도가 현저하게 부정적인 변화가 발생함을 가리키고 있다."17

The disturbing conclusion of these studies is that empathy declines during medical education. 

  • One study says it “provides empirical evidence to show that empathy declines in medical school by using a new psychometrically sound tool developed specifically to measure empathy in patient care situations.”8 

  • Another paper notes, “A decline in empathy during medical training has been reported in North American medical students and is regarded as a cause for concern.”9 

  • The depth of this concern is reflected in journal article titles, such as “Is there hardening of the heart during medical school?”14 and “Vanquishing virtue,”15 as well as in statements like, “The relevant question is not how to create (humane qualities) but how it comes about that medical education destroys them.”16 

  • This thinking is summed up in the following: “Both anecdotal reports and research studies point to significant negative shifts in students’ attitudes toward patients between the preclinical and clinical years.”17


  • 몇몇 저자들은 공감의 감소가 환자나 그 가족과의 임상적 상호작용 동안 겪게 되는 pain and suffering에 눈감아버리는 자기보호적 냉소의 결과라고 추측해 왔다.

  • 그러나 "의대 선발 과정"을 비판하는 사람들도 있는데, "Premedical 트레드밀은 [성적이 높고 시험 점수가 높은, detachment나 competitiveness와 같은 성격적 특성을 보여주는] 과학 전공자에게 우선권을 주는 것"이라고 주장한다. 그리고 이 과정은 "지원자의 성격과 성취의 질적 또는 감정적 측면"을 평가절하한다고 주장한다.

  • 다른 이들은 "(공감의) 감소가 널리 퍼져 있는 교수법을 반영하고 더 나은 방법으로 수정할 수 있다"거나 "의학계에 적응하는 과정이 피할 수 없는 심리적 영향"인지 의문을 제기한다.

  • 이러한 공감의 저하에 의해 생겨난 불안과 좌절은 "어떻게 하면 부패를 막을 수 있을까?"라는 한 글의 부제에도 반영되어 있다.

  • Several authors have speculated that the decline in empathy is a result of a self-protective cynicism that blunts the pain and suffering encountered during clinical interactions with patients and their families.12,14,15 

  • However, others criticize the “medical school selection process, arguing that the premedical treadmill gives precedence to science majors who have high grades and test scores, and who demonstrate personality characteristics such as detachment and competitiveness” and argue that this process “undervalues qualitative or affective aspects of the applicants’ characters and accomplishments.”15 

  • Others question whether “the decline is reflective of the prevalent teaching methods and modifiable with better methods or is an unavoidable psychological effect of the acculturation process into the medical profession.”12 

  • The anxiety and frustration generated by the purported decline are reflected in one article’s subtitle: “How can we stop the rot?”17


이러한 연구의 결과가 수정 조치를 요구하는 환자 치료에 대한 심각한 함축적 의미와 관련하여 자기 보고된 공감이 크게 감소했음을 보여주었는가? 아니면 그 감소는 작고 하찮은 것이었고, 실제적인 의미를 거의 보이지 않았던 것일까? 그리고 관측된 감소는 낮은 응답률 및 차등 응답률과 같은 공통 교란 요인(즉, 지속적인 편견)에 의해 설명될 수 있는가?

did the results of these studies show large declines in self-reported empathy with serious implications for patient care that call for corrective action? Or were the declines small and inconsequential, showing little of practical significance? And, could the observed declines possibly be accounted for by common confounding factors (i.e., constant biases),18,19 such as low and differential response rates?


방법

Method


우리는 의대생과 레지던트들의 시간 경과에 따른 공감의 변화를 조사한 최근의 연구를 확인하기 위해 2000년부터 2008년까지 출판된 논문 초록을 조사했다.

we examined article abstracts published from 2000 to 2008 to identify recent studies that examined change in empathy over time in medical students and residents.


검토한 11개 연구에서 공감도를 측정하기 위해 세 가지 자기 보고 계기를 사용했다: 대인관계 반응 지수 –감정 우려 하위 척도(IRI-EC),1 제퍼슨 의사 감정 감정 척도(JSPE),2 및 균형감정 감정 감정 감정 감정 감정 감정 척도(BEES)3. IRI-EC 하위 척도는 0점부터 4점까지 5점 만점으로 평가된 7개의 항목으로 구성되어 있다. 총점수는 0점부터 28점까지의 시청률로 집계된다. JSPE는 1점(강력하게 동의하지 않음)에서 7점(강력하게 동의함)까지로 평가된 20개의 리커트 척도 항목으로 구성되어 있으며, 총점수는 20점부터 140점이다. BEES는 4점에서 4점까지(매우 강하게 반대) 30점으로 평가되며, 총점수는 120점부터 120점까지이다.

Three self-report instruments were used to measure empathy in the 11 studies reviewed: 

  • the Interpersonal Reactivity Index–Empathy Concern subscale (IRI-EC),1 

  • the Jefferson Scale of Physician Empathy (JSPE),2 and 

  • the Balanced Emotional Empathy Scale (BEES).3 


  • The IRI-EC subscale consists of seven items rated on a five-point scale from 0 (does not describe me well) to 4 (describes me very well). The total scores are summed ratings that range from 0 to 28. 

  • The JSPE consists of 20 Likert scale items rated on a seven-point scale from 1 (strongly disagree) to 7 (strongly agree), with total (summed) scores that range from 20 to 140. 

  • The BEES has 30 items rated on a nine-point scale from  -4 (very strongly disagree) to  +4 (very strongly agree), with total (summed) scores that range from -120 to +120.


놀랍게도, 이 세 척도는 평균 등급에 서술적 의미를 부여하는 데 필요한 미드레인지 앵커가 아니라 양극단 앵커에게만 라벨을 제공한다. 따라서 본 프레젠테이션의 목적을 위해, 관찰된 평균 정격에 해당하는 미드레인지 앵커의 라벨을 다음과 같이 추론했다. 

  • IRI-EC의 경우, 3점은 "잘 묘사한다"; 

  • JSPE의 경우, 4점은 "중립"과 6점은 "동의" 

  • BEES의 경우, 1점은 "약간동의"

Surprisingly, the three scales provide labels for only the extreme anchors and not for the midrange anchors which are needed to give narrative meaning to the mean ratings. Consequently, for the purposes of this presentation, we inferred labels for the midrange anchors, that corresponded to the observed mean ratings, based on the extreme labels and the general pattern used to label such anchors, as follows: for IRI-EC, 3   “describes me well”; for JSPE, 4   “neutral” and 6  “agree”; and for BEES, 1  “somewhat agree.”


결과

Results


평균 공감 점수

Mean empathy ratings


평균적으로 표 1의 11개 연구는 평균 공감도가 감소하여 훈련 첫해에서 마지막 해로 약 0.2포인트가 변화하였다.

On average, the 11 studies in Table 1 showed a decline in mean empathy ratings, a change of about  0.2 points from the first year of training to the last.



응답률

Response rates


4개 연구(Studies 1, 2, 8 및 9)의 연도별로 응답률을 보고(또는 추정)했다. 1차 훈련의 응답률은 상당히 높았고, 이후 마지막 훈련의 경우 평균 약 26%포인트 하락했다. 표 1을 보면, 일반적으로 높은 평균 등급이 높은 응답률과 낮은 평균 등급과 관련이 있음을 보여준다.

Response rates were reported (or estimated) by year of training for four studies (Studies 1, 2, 8, and 9). The response rates were considerably higher for the first level of training and then declined on average by about 26 percentage points for the last level of training. Visual inspection of Table 1 shows that, in general, higher mean ratings were associated with higher response rates and lower mean ratings with lower response rates.


고찰

Discussion


요약하자면, 이 연구 결과는 연구 전반에 걸쳐 일관되고 설득력 있게 [의학 교육으로부터 기인하는 공감의 자기평가 변화가 거의 또는 전혀 없음]을 보여준다. 평균 공감 등급의 변화는 공감이 0.1포인트 증가하는 것(Study 6)에서 0.5포인트 감소하는 것(Study 9)까지 다양했으며, 11개 연구에서는 평균 0.2포인트 감소했다.

In summary, the findings are consistent across studies, showing little or no change in self-ratings of empathy that can convincingly be attributed to medical education training. The changes in mean empathy ratings ranged across studies from a 0.1-point increase in empathy (Study 6) to a 0.5-point decrease (Study 9), with an average of about a 0.2-point decline for the 11 studies.


의대 내 평균 점수는 레지던트 등급과 비슷해 의대에서 레지던트까지의 하락이 없었다. 그 결과는 의학 교육으로 인한 공감이 심각하게 감소하고 있다는 강력하고 불안한 결론을 보증하지 못한다(이러한 불안한 결론은 이것에 대해 뭔가 조치를 취해야 한다는 암시를 담고 있다). 이번 연구 결과는 의학 교육이 인간의 자질을 파괴하고 심장을 딱딱하게 만든다는 것을 보여주지 않으며, 14, 반드시 막아야 할 부패가 있다는 것을 보여주지도 않는다.17

mean ratings in medical school were similar to those in residency, showing no decline from medical school to residency. The results do not warrant the strong, disturbing conclusion that there is a serious decline in empathy due to medical education, with the implication that something must be done about it. The results do not show that medical education destroys humane qualities16 and causes a hardening of the heart,14 nor do they reveal a rot that must be stopped.17


이번 결과는 평균mean점수를 바탕으로 점수를 매기는 것의 장점을 보여준다. 합계점수는 평균점수와 항목 수를 모두 반영해 점수 차이를 확대시키고 차이점을 지금보다 더 큰 것처럼 보이게 한다. 예를 들어, BEES 척도에서 등급 2 "약정"과 등급 3 "약정" 사이의 1점 차이는 합계(60 대 90)에 근거한 점수 사이의 30점 차이가 된다.3

The results illustrate the advantage of scoring based on means. The sums of ratings reflect both the ratings and the number of items, which magnifies differences between scores and makes differences appear more important than they are. For example, a one-point difference between a rating of 2  “somewhat agree” and 3  “agree” on the BEES scale becomes a 30-point difference between scores based on sums (60 versus 90).3


한편, 표 1에 보고된 평균 공감 등급의 작은 감소(평균 0.2점 감소, 0.1점에서 0.5점 범위)는 의료 교육 때문에 공감이 "약간" 감소했다는 더 약한 결론을 확립하는 것으로 생각할 수 있다. 그러나, 응답자 편향response bias은 11개 연구들에서 평균점수 변화가 아주 작다는 것에 대한 매우 그럴듯한 대안적 설명이다. 

  • 감정이입이 약간 감소했다는 약한 결론은 [무응답자가 모든 학생 또는 레지던트의 무작위 표본이거나 대표적인 표본이라는 가정]을 수반하며, 이 경우 응답 편향은 없을 것이다. 

  • 그러나, 그 반대 주장도 타당하다: 즉, 비응답자는 번아웃 되었으며, 공감이 낮다는 것이다(관측정한 하락을 최소화할 것이다.) 또는, 비응답자가 일반적으로 더 공감적이었고, 동일한 공감수단의 재관리에 대해 긍정적인 반응을 반복할 필요가 없다고 느꼈을 수도 있다(관측된 하락을 증가시킬 것이다).

On the other hand, the small declines in mean empathy ratings reported in Table 1 (average decline of  0.2 points; range from  0.1 points to  0.5 points) might be thought to establish the weaker conclusion that empathy declined “just slightly” because of medical education. However, response bias is a very plausible alternative explanation of the small changes in mean ratings for the 11 studies. 

  • The weaker conclusion that empathy declined just slightly entails the assumption that the nonrespondents were a random or representative sample of all students or residents, in which case there would be no response bias. 

  • However, it is just as reasonable to argue the opposite: that the nonrespondents were burned out and less empathic (which would minimize the observed decline)—or that nonrespondents were generally more empathic and felt no need to repeat their positive responses on  readministrations of the same empathy instrument (which would increase the observed decline).


간단히 말해서, 관찰된 작은 감소는 공감이 단지 약간 감소했다는 약한 결론을 확립하지 못한다. 이 문제에 대한 결론은 아직 불분명하다. 공감에 대한 연구는 연구자들이 응답률이 높은지 확인하고(100%에 근접) 의대와 레지던트 전체에 걸쳐 높은 (응답률) 상태를 유지하여, 타당성에 대한 이러한 위협을 해결하고, 약한 효과 가설에 대한 보다 설득력 있는 테스트를 제공하는 단계를 밟는 것이 필요하다.

In brief, the observed small decline does not establish the weaker conclusion that empathy declined just slightly. The rival explanations cannot be ruled out—the case is still open. Studies of empathy are needed in which researchers take steps to ensure that response rates are high (approaching 100%) and remain high throughout medical school and residency to address this threat to validity and provide a more convincing test of the weak effect hypothesis.


그렇다면, 왜 의학 훈련 동안에 인정되는 공감의 감소는 그렇게 쉽게 받아들여지는 것일까? 아마도 그 해답은 그것들을 읽은 의학 교육자들뿐만 아니라 이러한 연구의 주제에 있을 것이다.

Why, then, is the purported decline of empathy during medical training so readily accepted? Perhaps the answer lies in the subject of these studies as well as the medical educators who read them.



자기보고식 공감 검사도구

Empathy self-report instruments


이러한 연구에 대한 또 다른 우려는 공감에 대한 (학생과 레지던트의) 자기보고적 평가도구에 기반을 두고 있다는 것이다. 그러나 (마치 아름다움과 같이) 공감은 caregiver가 아니라 보는 사람(환자)의 눈에 달려있다. 그럼에도 불구하고 우리가 아는 바로는, 이러한 공감 도구들 중 어떤 것도 caregiver의 공감능력에 대해, 환자의 인식과의 관계를 경험적으로 확인하는 방식으로 검증되지 않았다. 필요한 것은 실제 또는 시뮬레이션된 임상적 만남에서 간병인 공감에 대한 실제 또는 표준화된 환자의 평가와 자기 보고 공감 기기에 대한 자기 평가의 상관관계에 대한 연구들이다.23

Another concern about these studies is that they are based on instruments that assess student and resident self-reports of empathy. But empathy—like beauty— would seem to be in the eye of the beholder—the patient, not the caregiver. And yet, to our knowledge, none of these empathy instruments have been validated by determining empirically their relationship with patients’ perceptions of the caregivers’ empathy. What are needed are studies of the correlations of self-ratings on the self-report empathy instruments with real or standardized patients’ assessments of caregiver empathy in actual or simulated clinical encounters.23


현재의 증거 기반 의료 교육 이니셔티브에 따라, 어느 시점에서는 효과적인 치료와 치유의 궁극적인 결과와의 상관관계가 입증되어야 한다. 이렇게 함으로써 공감 수준이 의료실무에 대해 갖는 예측 가치를 문서화해야 한다. 자기보고된 공감능력이 감소한 이유는 [환자가 느낀 공감]이나 [효과적인 임상치료]와는 무관한 여러 가지가 가능하다는 것이 합리이다. 

    • 예를 들어, 훈련생들은 [자신이 새로운 책임에 대한 준비가 미흡하다는 느낌]과 공감 저하를 혼동하거나, [스스로 통제할 수 있는 요인(흡연, 체중)을 제대로 통제하지 못해서 생긴 병을 가져온 환자에 대한 동정 부족]을 공감 저하로 혼동했을 수 있다. 

In keeping with the current evidence-based medical education initiative, at some point even correlations with the ultimate outcomes of effective treatment and healing must be demonstrated to document the predictive value of the empathy ratings for clinical practice. It seems reasonable that self-reports of empathy might decline for a number of reasons that have nothing to do with the patient’s experience of empathic concern and effective clinical care. 

    • For example, trainees might confuse loss of empathy with feeling ill-prepared for their new responsibilities, or with guilt regarding a lack of compassion for patients who “brought on” their own illness by factors under their control, such as smoking or weight control, or by trading empathy for the need to get through the day’s work in the time allotted. 


이유가 무엇이든, 의대와 레지던트가 자기평가한 공감능력의 변화는 너무 작아서 practice outcome의 감소를 예측하지 못하는 것처럼 보인다.

Whatever the reasons, the observed changes in mean self-ratings in medical school and residency are so small that they would not seem to be predictive of diminishing practice outcomes.


여기서 근본적인 문제는 자기 보고 공감 도구가 기본적으로 자기 평가이며 최근 자기 평가에서 광범위하게 논의된 것과 같은 문제에 시달린다는 것이다.24–27 이러한 비평의 저자가 지적한 바와 같이, 문제는 "학생들은 자기 평가의 정확성이 낮다는 것을 일관되게 보여 왔다"23 "방대한 근거는 의사들이 자기 평가 능력이 제한되어 있음을 시사한다."25 이미 보여진 바와 같이, 학생, 레지던트, 의사가 지식과 기술을 정확하게 평가하지 못하는 경우 그들이 (더 불분명indefinite한 특성인) 공감을 정확하게 평가할 수 있는지에 대해서도 의문을 제기하는 것은 타당하다. 또한, 자기 보고식 척도는 공감을 서로 다른 문제, 배경, 성격을 가진 다른 환자와 마주칠 때 서로 다른 방식으로 자신을 드러내는 "상태state"가 아니라 있거나 없거나 하는 "자질trait"로 취급한다.

The fundamental problem here is that the self-report empathy instruments are basically self-assessments and suffer from  the same problem s as discussed extensively in recent critiques of self-assessment.24–27 As the authors of these critiques note, the problem is that “studies have consistently shown that the accuracy of self-assessment is poor”23 and that “the preponderance of evidence suggests that physicians have a limited ability to self-assess.”25 If students, residents, and physicians are unable to accurately self-assess knowledge and skills, as has been shown, it seems reasonable to question whether they can accurately assess something more indefinite—like empathy. Also, the self-report instruments treat empathy as a “trait” that is either present or absent rather than as a “state” that manifests itself in varying ways across encounters with different patients with different problem s, backgrounds, and personalities.


여기서 조사한 11개 연구에서 사용된 세 가지 공감 도구에 대한 관련 질문은 그들이 같은 것을 측정하느냐 하는 것이다. 이들이 언급한 "공감"은 같은 뜻일까? 항목별 차이, 항목별 표현, 항목 수, 등급 척도, 앵커 등을 포함하는 운용 정의의 관점에서 연구마다 '공감'은 분명히 다르다. 그렇다면, 이 기구들은 같은 구인construct를 측정하는가? 한 연구는 세 가지 도구 중 두 가지에 대한 점수 사이의 상관관계를 조사했다.IRI-EC와 JSPE—and는 193명의 의대생에게 r=0.41을, 41명의 레지던트를 대상으로 r=0.40을 보고했다.2

A related question about the three empathy instruments used in the 11 studies reexamined here is whether they measure the same thing. Do they mean the same thing by “empathy?” Clearly, they differ in terms of their operational definitions which involve differences in their items, the wording of the items, the number of items, the rating scales, the anchors, etc. So, do these instruments measure the same construct? One study examined the correlations between scores on two of the three instruments—IRI-EC and JSPE—and reported r  0.41 for n   193 medical students and r  0.40 for n  41 residents.2


직관적으로, 공감은 의료실무와 환자의 치료에 있어 중요한 고려사항이다. 그러나 공감의 개념은 이해하기 어렵고 이론적으로 그리고 조작적으로 설명된다.28 

    • 이론적으로, 공감은 부분적으로 은유와 대조에 의해 정의되어 왔다. 예를 들어, 은유적으로 공감은 "상대방의 입장에서 자신을 넣는다" 또는 "환자의 입장에서 서 있다"라고 묘사되어 왔다. 공감은 흔히 동정과 대조를 이루는데, 공감은 환자의 상황과 감정에 대한 인지적 이해를 더 많이 지칭한다고 하며, 동정은 환자의 감정을 공유하고 느끼는 것을 가리키는 데 쓰인다. 

    • 조작적으로, 은유와 대조를 바탕으로 이론적 의미를 표현하는 진술이나 항목을 개발한다. 여기에서 검토한 11개 연구에서 사용된 3개의 도구의 경우, 응답자에게 각 항목에 대한 자기 자신에 대한 의견을 스스로 보고하도록 요청한다. 그러나 위에서 언급한 바와 같이, 환자 또는 표준화된 환자를 위한 도구를 개발할 수도 있다. 또는 심지어 전문가 관찰자가 (clinical practice의 contributor인) 공감을 포착하도록 훈련되었다. [공감의 자기평가 점수]가 [실제 또는 표준화된 환자]의 평가와도 다르고 [훈련된 전문가의 평가]와도 다르다는 것은 놀랍지 않다(특히 자기 평가점수가 도구에 따라 다르다는 점을 감안하면 더욱 그렇다.)

Empathy is intuitively an important consideration in medical practice and the care of patients. The concept of empathy, however, is elusive, theoretically and operationally.28 

    • Theoretically, empathy has been defined in part by metaphor and contrast. Metaphorically, for example, empathy has been described as “putting oneself in the other’s shoes” or “standing in the patient’s shoes.” Empathy is commonly contrasted with sympathy, whereby empathy is said to refer more to a cognitive understanding of a patient’s situation and feelings, and sympathy is used to refer to a sharing and feeling of the patient’s emotions. 

    • Operationally, statements or items are developed that express the theoretical meanings based on metaphor and contrast and that, in the case of the three instruments used in the 11 studies reviewed here, ask respondents to self-report their opinions about themselves on each item. But, as mentioned above, instruments could also be developed for patients or standardized patients—or even for expert observers trained to capture empathy as a contributor to clinical practice. It would not be surprising to find that self-ratings of empathy differ from real or standardized patient ratings and that both differ from ratings by a trained expert (especially given that self-ratings differ from instrument to instrument).


의사의 공감능력을 훈련시킬 때, 의학 교육자들은 [이해하기 어려운 공감 개념에서 벗어나] [더 좋은 대인관계 행동]에 초점을 두어야 할지도 모른다. 이러한 (더 좋은 대인관계적 행동이) 의사-환자 관계에 중요한 찾는 심리사회적 특성을 더 잘 달성하는데 도움이 될 것이다. 즉, "숨겨진 교육과정"30의 이런 측면은 교사들에 의해 능동적으로 모델링됨으로써 의학 교육에 더 도움이 될 수 있다. 

When it comes to training empathic physicians, medical educators might be better served by shifting their focus from the elusive empathy concept and concentrating more on good interpersonal behaviors to better achieve the sought-after psychosocial characteristic important to the doctor– patient relationship. That is, this aspect of the “hidden curriculum”30 may better serve medical education by being actively modeled by teachers. 


최근 흥미로운 기사인 "에티켓 기반 의학"31에 따르면, "환자들은 그들의 의사가 얼마나 성찰적이고 공감하는지보다, 의사가 얼마나 존중해주고 주의깊게attentive 생각하는지에 더 신경쓸 수도 있다". "에티켓 기반 의학을 연민에 기반한 의술보다 우선하는 것에 대해 교육적 논쟁이 필요하다"고 제안한다. 의사와의 환자 관계의 심리학적 측면에 대한 이러한 [예절에 기초한 접근방식]은 "좋은 매너의 기반 위에 구축"될 것이며, 행동이 변화하기 쉽고 "더 즉각적인 이득"을 가질 수 있기 때문에 감정과 태도보다 행동을 강조할 것이다.

A recent intriguing article entitled “Etiquette-based medicine”31 suggests that “patients may care less about whether their doctors are reflective and empathic than whether they are respectful and attentive” and suggests that “pedagogically an argument could be made for etiquette-based medicine to take priority over compassion-based medicine.” This etiquette-based approach to the psychosocial aspect of the doctor–patient relationship would be “built on a base of good-manners” and would emphasize behavior over feelings and attitudes, because behavior is easier to change and may have “more immediate benefits.”31


의학 교육 연구의 명성은 한동안 의문이 제기되어 왔다.32–35 비평가들은 이 연구가 "방법론적 엄격성 결여"라고 말하며 무작위화 및 통제력 강화를 요구하고 있다.34 우리는 그 문제가 방법론적 결함 그 자체가 아니라고 주장해왔다. 오히려, 연구자들의 실패는, 그 결함을 고려하여 결론을 내리고, 결과를 비판적으로 해석하지 못했다는 점이다.

The reputation of medical education research has been questioned for some time.32–35 Critics say the research “lacks methodological rigour” and call for randomization and greater control.34 However, given that research in medical education is primarily and necessarily quasi-experimental, we have argued that the problem is not the methodological flaws per se but, rather, the failure of researchers, in light of the flaws, to critically interpret the research and its results in reaching and stating their conclusions.21 


준 실험적 측면에서, 결론을 내리기 위해서는 [타당성에 대한 위협]은 rule out되어야 한다. 이것이 공감 감소를 보여준 연구의 문제인 것 같다. 문제는 낮은 응답률이나 다른 응답률 그 자체가 아니라 연구자들이 연구 결론에 도달하는 데 있어 그러한 위협을 인정하지 않는 것이다이 문제는 이 수치들이 정확히 무엇을 의미하는지 알아보기 위해 공감 측정값(등급, 자기 평가, 작은 차이점)을 비판적으로 검토하지 못함으로써 여기서 더욱 복잡해진다.

In quasi-experimentation terms, threats to validity must be ruled out or used to qualify the conclusions. This seems to be the problem with the empathy decline studies. The problem is not the low or differential response rates per se but, rather, the researchers’ failure to acknowledge those threats to validity in reaching a research conclusion. The problem is compounded here by a failure to critically examine the empathy measurements (sums of ratings, self-ratings, and small differences) to see exactly what the numbers mean and take this into account in interpreting research findings.



Summary and conclusions







Comparative Study
 
, 85 (4), 588-93
 

Reports of the Decline of Empathy During Medical Education Are Greatly Exaggerated: A Reexamination of the Research

Affiliations 

Abstract

Purpose: Research is said to show that empathy declines during medical school and residency training. These studies and their results were examined to determine the extent of the decline and the plausibility of any alternative explanations.

Method: Eleven studies published from 2000 to 2008 which reported empathy at various stages of physician training were reexamined. Their results were transformed back to the original units of the rating scales to make results more interpretable by reporting them in the metric of the original anchors. Next, the relationship between empathy ratings and response rates were examined to see whether response bias was a plausible threat to the validity of the empathy decline conclusion.

Results: The changes in mean empathy ranged across the 11 studies from a 0.1-point increase in empathy to a 0.5-point decrease, with an average of a 0.2-point decline for the 11 studies (ratings were on 5-point, 7-point, and 9-point scales). Mean ratings were similar in medical school and residency. Response rates were low and-where reported-declined on average about 26 percentage points.

Conclusions: Reexamination revealed that the evidence does not warrant the strong, disturbing conclusion that empathy declines during medical education. Results show a very weak decline in mean ratings, and even the weak decline is questionable because of the low and varying response rates. Moreover, the empathy instruments are self-reports, and it isn't clear what they measure-or whether what they measure is indicative of patients' perceptions and the effectiveness of patient care.


+ Recent posts