의대 교수자들에게 인센티브 주기: 동기부여에 영향을 주는 인센티브의 역할 탐색 (Acad Med, 2018)
Incentivizing Medical Teachers: Exploring the Role of Incentives in Influencing Motivations 
Katherine M. Wisener, MA, and Kevin W. Eva, PhD

 

 

모든 의학 교육 프로그램의 임무는 의대생들이 환자의 삶을 개선하는 개업의로 성공적으로 전환할 수 있도록 지원하는 것이다. 그 성공 여부는 의학 교육자에게 크게 좌우됩니다. 즉, 강의실과 임상 환경에서 가르치는 임상의사와 다른 교수진들, 그들 중 다수는 급여를 받거나 대학에 고용되지 않았고, 그들 중 다수는 교육자로서 훈련을 받지 않았으며, 그들 중 다수는 2차 직업 선택으로만 교육자로서의 그들의 역할을 발견했다. 이러한 장벽을 고려할 때 동기 부여되고 효과적인 교육자를 식별하고 모집하는 것은 어려울 수 있으며, [교육의 단점]이 점점 더 [이점]을 능가한다는 우려가 있다. 일부 연구자들은 거의 절반의 교직원들이 불만을 가지고 있고 그들의 교사직을 떠나는 것을 심각하게 고려하고 있다는 것을 발견했다. 임상의의 교수 동기에는 개인적, 환경적, 체계적 요인이 영향을 미치며, 의대가 교수를 가장 잘 장려하고 교수의 우수성을 촉진할 수 있는 방법에 대한 이해가 필요하다.
The task of any medical education program is to support medical students’ successful transition into practicing clinicians who improve the lives of their patients.1 The success of this is heavily dependent on medical educators—namely, the clinicians and other faculty who teach in classroom and clinical environments, many of whom are not salaried or employed by the university, many of whom are not trained as educators, and many of whom discovered their roles as educators only as a secondary career choice.2 Given these barriers, identifying and recruiting motivated and effective educators can be challenging, and there is concern that the drawbacks of teaching increasingly outweigh the benefits. Some researchers have found that almost half of teaching faculty are dissatisfied and are seriously considering leaving their teaching roles.3,4 There are individual, environmental, and systemic factors influencing clinicians’ motivations to teach, and understanding how medical schools can best incentivize teaching and promote teaching excellence is needed.

[동기 부여motivation]는 개인이 어떤 일을 맡도록 움직이는 수단을 말한다. 동기가 부족할 때(또는 감소할 때) 인센티브(즉, 노력에 영향을 미치려는 시도로 사용되는 유형 또는 무형의 외부 제공물)를 구현하는 것이 명백한 해결책으로 보일 수 있다. 그러나 인센티브를 시행하는 것은 간단하지 않으며 긍정적인 형태의 동기부여를 줄이거나, 문제적인 형태의 동기부여를 촉진함으로써 역효과를 낼 수 있다. 예를 들어, 헌혈을 늘리려는 시도에 재정적 보상을 도입하는 것은 역효과를 낳았고 헌혈하려는 사람들의 의지를 감소시켰다. 인센티브는 사람들이 "분노, 저항, 무관심을 가지고" 행동을 하게 만들거나, "일의 가치나 효용에 대한 내적인 수용을 반영하는 의지의 태도를 가지고" 행동을 하게 만든다. 따라서 의료 교육자들 사이에서 생산적인 형태의 동기 부여를 촉진하기 위해 인센티브를 적절하게 배치하는 방법을 아는 것이 무엇보다 중요하다.
Motivation refers to the means through which an individual is moved to undertake a task.5 When there is a lack of (or waning) motivation, implementing incentives (i.e., any external offering, tangible or intangible, that is used in an attempt to influence effort) might seem like an obvious solution. However, implementing incentives is not straightforward and can be counterproductive by reducing positive forms of motivation or promoting problematic forms of motivation. For example, introducing financial rewards in attempts to drive up blood donations has backfired and reduced people’s willingness to donate blood.6,7 Incentives can lead people to perform actions “with resentment, resistance and disinterest, or with an attitude of willingness that reflects an inner acceptance of the value or utility of a task.”5 Knowing how to position incentives appropriately to foster productive forms of motivation among our medical educators is, therefore, paramount.4

이 논문은 인센티브가 긍정적으로 영향을 미치는 방법, 이유 및 시기를 탐구하기 위해 수행되는 중요한 합성을 제공한다. 우리는 연구 분야 간의 주요 차별화 요소를 강조하고 연구자들이 인센티브 제도의 부정적인 영향을 완화하기 위해 어떻게 시도했는지 보여준다. 의학 교육 문헌은 문맥을 제공하기 위해 먼저 고려된다. 이어서, 우리는 심리학, 조직 행동 및 행동 경제학 분야의 관련 연구 결과를 설명함으로써 해당 문헌의 인센티브 묘사의 차이를 강조한다. 각각은 의학 교육 맥락에 대한 추가적인 통찰력을 제공하는 관련 경험적 데이터와 이론적 이해에 기여한다. 그런 다음 실질적인 조언을 제공하고 이해의 격차가 남아 있는 부분을 개략적으로 설명하기 위해 이러한 분야 내 및 분야 전반에 걸쳐 수렴 및 분기 영역을 합성한다.
This paper offers a critical synthesis conducted to explore how, why, and when incentives are positively influential. We highlight key differentiators between fields of study and reveal how researchers have attempted to mitigate negative impacts of incentivization schemes. The medical education literature is considered first to provide context. Subsequently, we highlight gaps in that literature’s portrayal of incentives by illustrating relevant research findings from the fields of psychology, organizational behavior, and behavioral economics. Each contributes relevant empirical data and theoretical understanding that provide additional insight into the medical education context. We then synthesize areas of convergence and divergence within and across these disciplines in an effort to offer practical advice and outline what gaps in understanding remain.

방법
Method

이러한 노력의 기초가 되는 목적은 특정 관찰의 일관성/규모에 대한 결론을 도출하기보다는, 인센티브화 현상을 이해하는 데 다양한 중요한 기여를 탐구하는 것이었다. 따라서, 우리는 주어진 분야 내의 문헌을 이해하기 위한 목적적이고 반복적인 접근법에 의해 안내되는 종합synthesis인 [비판적 문헌 검토]를 수행했다. 광범위할 수 있는 기초 논문을 식별하고 조사 중인 주제의 다양한 측면에 대한 특별한 통찰력을 제공하기 위해 출판물의 비판적 평가를 통해 진행된다. 그것의 주요 강점은 연구자가 완전한 체계성에 대한 주장을 허용하기에는 너무 광범위한 현상에 대한 관심을 고려하여 광범위한 이해를 개발하기 위해 상당한 범위의 문헌을 그릴 수 있도록 하는 것이다.
The purpose underlying this effort was to explore a variety of significant contributions to understanding the phenomenon of incentivization rather than to draw conclusions about the consistency/magnitude of any particular observation. As such, we conducted a critical literature review, which is a synthesis guided by a purposeful and iterative approach to understanding the literature within a given field(s). It proceeds through the critical evaluation of publications to identify foundational papers that may be wide reaching and contribute particular insight about different aspects of the topic under investigation.8,9 Its main strength is allowing the researcher to draw on a substantial breadth of literature to develop well-rounded understanding given interest in a phenomenon that is too broad to allow claims of complete systematicity.10

Grant and Booth(2009)에 따라 프로세스를 진행하였으며, 검색, 평가, 합성 및 분석의 4단계를 포함했습니다(그림 1). 검색 단계에서 구글 스콜라는 인센티브와 관련된 주요 논문과 주요 이론적 개념을 식별하는 데 사용되었으며, 이는 검색 용어를 보다 세련된 검색에 적용하는 데 사용되었다. 처음에는 모든 관련 분야가 고려되었지만,

  • 일부는 의학 교육에서 얻은 교훈에 추가적인 지식을 제공하지 않았다. 
    (예를 들어, 일반 교육에서 교사를 장려하는 연구는 개념적으로 의학 교육자를 포함하는 연구에는 거의 불필요했다.) 
  • 그리고 일부 분야는 주로 다른 영역에서 생성된 이론과 증거로부터 이끌어내는 것으로 보였다. 
    (예를 들어, 운동 및 조직 맥락에서 코칭을 탐구하는 것은 우리를 심리학으로 다시 이끌었다.) 

탐색 과정이 전개됨에 따라 두 저자 간의 반복적인 토론을 통해 심리학, 조직행동학, 행동경제학 분야는 의학 교육과 관련될 수 있는 인센티브에 대한 우리의 이해를 심화시키는 것과 관련하여 특히 유익한 것으로 간주되었다.
Our process was informed by Grant and Booth (2009)9 and included four steps: search, appraisal, synthesis, and analysis (Figure 1). In the search stage, Google Scholar was used to identify seminal papers and key theoretical concepts related to incentivization that informed search terms that were then applied to a more refined search. While all relevant fields were considered at first, some did not contribute additional knowledge to the lessons gleaned from medical education (e.g., explorations of incentivizing teachers in general education were largely conceptually redundant to explorations involving medical educators), and some fields appeared predominantly to draw from theory and evidence primarily generated in other domains (e.g., exploring coaching in athletic and organizational contexts largely led us back to psychology). Through iterative discussions between both authors as the search process unfolded, the disciplines of psychology, organizational behavior, and behavioral economics were deemed particularly fruitful with respect to deepening our understanding of incentivization as it might pertain to medical education.

결과적으로, 그러한 관점이 잘 표현되도록 의도적인 노력으로 그러한 문헌들을 통해 추가적인 검색이 이루어졌다. 사용된 데이터베이스에는 CINAHL, 논문 초록, ERIC, MEDLINE, PsycINFO, EconLit, 그리고 Web of Science가 포함된다. 기사는 다음과 같은 질문을 다루는 경우 자세히 조사되었다. 

  • (1) 이 출판물은 인센티브/보상/장벽과 동기부여 사이의 상호작용을 탐구하고 있는가? 
  • (2) 인센티브가 특정 조치를 산출할 수 있는 메커니즘에 대한 이해를 심화시키는 데 기여하는가? 

대부분의 기사는 실증연구였지만, 추가적인 통찰력으로 이어질 수 있기 때문에 관련 사례연구, 책장, 사설 등도 고려되었다.

As a result, additional searches were made through those literatures in a deliberate effort to ensure that those perspectives were represented well. Databases used included CINAHL, Dissertation Abstracts, ERIC, MEDLINE, PsycINFO, EconLit, and Web of Science. Articles were explored in detail if they addressed the following questions:

  • (1) Does the publication explore the interaction between incentives/rewards/barriers and motivation?
  • (2) Does it contribute to deepening understanding of the mechanisms through which incentives can yield certain actions?

Most articles were empirical studies, but relevant case studies, book chapters, and editorials were also considered because they could lead to additional insight.

결과.
Results

의료 교육에서 인센티브가 어떻게 그리고 왜 사용되고 있는가?
How and why incentives are being used in medical education

주로 설문조사와 인터뷰를 통해 개발된 상당한 문헌은 임상 교사들이 가르치는 데 많은 동기를 느낀다는 것을 시사한다. 특히 눈에 띄는 것은

  • 자신의 의학적 지식을 입증하고 새롭게 하는 능력,
  • 교육자로부터 받은 혜택을 "pay it forward"할 수 있는 기회,
  • 학생들과 교류하고 도울 수 있는 기회,
  • 도전을 느끼거나 교사의 정체성을 가정함으로써 얻어지는 개인적인 만족감

가르치는 것에 대한 동기 부여를 보고하는 일부 사람들은 그것이 그들의 역할 중 가장 보람 있는 것이라고 생각한다. 표 1은 보다 포괄적인 목록을 제공한다.

A considerable literature, predominantly developed through surveys and interviews, suggests that clinical teachers feel many motivations to teach. Particularly prominent is

  • the ability to demonstrate and refresh one’s medical knowledge,3,11–14 
  • the opportunity to “pay forward” the benefits received from educators,13–18 
  • the opportunity to interact with and help students,3,11,12,15–18 and
  • personal satisfaction derived from feeling challenged or assuming a teaching identity.13,14,16–18 

Some who report feeling motivated to teach find it to be the most rewarding of their roles.19 Table 1 provides a more comprehensive list.

동시에, 일부 임상의들은 교육에 많은 장벽에 직면해 있다는 것이 분명하다. 교육에 대한 동기 부여를 보고하는 임상의들은 점점 더 그들의 교육 역할에 불만족스러워하고 있으며, 소모와 소진은 불행한 결과이다. 일반적으로 보고되는 교육의 장벽은 경쟁적인 우선순위, 인식된 기술의 부족, 열악한 교육 시설, 관심의 부족을 포함한다. 표 2는 보다 포괄적인 목록을 제공한다.
At the same time, it is clear that some clinicians face many barriers to teaching.17 Clinicians who report being motivated to teach are increasingly dissatisfied with their teaching roles,15 with attrition and burnout being unfortunate outcomes.4,11,14,19,20 Barriers to teaching that are commonly reported include competing priorities,3,11,13,14,17 a lack of perceived skill,7,17,19 poor teaching facilities,3,15,17 and a lack of interest.11,15,19  Table 2 provides a more comprehensive list.


의대 교수 이직률이 매년 평균 8~10%, 조교수 10년 유지율은 43%에 불과하고, 이직으로 발생하는 비용은 임상 교수 1인당 15만5000달러에서 55만9000달러 사이라는 점을 감안하면 이러한 장벽의 영향은 비용이 많이 든다. 이 모든 것은, [교수직을 추구하는 의대생들과 전공의들의 수가 비슷하게 감소하고 있다]는 보고와 함께 생각해본다면, 차세대 교수진을 유치하고, 현재 교수진의 손실을 막는 것이 우선순위가 되어야 한다는 주장으로 이어졌다. 그러나 다가오는 위기가 될 수 있는 것을 피할 수 있는 지침은 거의 없다.
The impacts of these barriers are costly given that medical school faculty turnover averages 8% to 10% each year,4 with the 10-year retention rate of assistant professors only 43%,20,21 and turnover costing between $155,000 and $559,000 per clinical faculty member.19 All this, combined with reports that the number of medical students and residents seeking teaching roles is similarly declining, has led to claims that attracting the next generation of faculty and preventing the loss of current faculty must be a dominant priority.4 Little guidance, however, is available to avoid what could be a looming crisis.

임상 교사들을 향한 [가장 일반적인 인센티브]는 대세를 막지 못했다. 여기에는 학술적 임명, 리더십의 인정, 교수진 개발 기회, 상, 돈, 선물, 지속적인 의학 교육 크레딧, 도서관 자원이 포함된다. 임상의들에게 교수에 대한 인센티브 순위를 물었을 때,

  • [개인적인 만족도]가 가장 높은 순위를 차지했고,
  • [교육 기회와 경력 향상]이 그 뒤를 이었으며,
  • [재정적인 지불과 선물]은 꼴찌를 차지했다.

그러나 이러한 연구에서 [자기 보고 척도]를 주로 사용하는 것은 인센티브가 수행하는 역할에 대한 충분히 미묘한 이해에서 우리가 운영해 온 정도에 대한 우려를 불러일으킨다. 예를 들어, 위에서 언급한 연구에서 재정적 보상이 전체적으로 가장 낮은 순위를 차지했지만, 그 결과는 [응답자들이 일하는 맥락]에 따라 달라진다. [돈]은 [가르치는 데 돈을 받지 않은 사람들]에 의해 가장 낮은 평가를 받았지만, [이미 돈을 받고 있는 사람들]에게는 가장 높은 평가를 받았다. 게다가, 그러한 순위는 일부 사람들이 재정적 인센티브를 위해 가르치지 않는다는 것을 암시할 수 있지만, 그들은 교육과 관련하여 일반적으로 들려오는 재정적 디스인센티브(즉, 진료를 받지 않음으로써 포기되는 돈)에 대한 우려 해결을 간과한다. 이 문헌과 그 한계를 종합하면, 특정 인센티브가 영향력이 있는지 없는지에 대한 단순한 주장보다 더 복잡한 현실을 시사한다.
The most common incentives for clinical teachers have not stemmed the tide. These include academic appointments, recognition from leadership, faculty development opportunities, awards, money, gifts, continuing medical education credits, and library resources.12,13,17 When clinicians have been asked to rank-order incentives for teaching,

  • personal satisfaction ranks highest,
  • followed by educational opportunities and career advancement,
  • with financial payments and gifts ranking last.12,13 

The predominant use of self-report measures in these studies, however, raises concern about the extent to which we have operated from a sufficiently nuanced understanding of the role that incentives play. For example, although financial rewards ranked lowest overall in the study mentioned above, that result depended on the context in which respondents were working: Money was ranked least valued by those who were not paid to teach, but highest by those who were already being paid.12 Further, such rankings may suggest that some people do not teach for financial incentives, but they neglect to address commonly heard concerns of financial disincentives associated with teaching (i.e., money that is given up by not being in clinic). Taken together, this literature and its limitations suggest a more complex reality than simple claims that certain incentives are influential or not.

사람들이 행동을 주도하는 것으로 [인식하는 것]과 [실제 행동 결정 요인] 사이의 단절을 고려할 때, 자기보고에 기초한 인센티브 계획을 설계하는 것은 위험하다. 게다가, 역효과를 내는 인센티브 제도에 대한 다양한 보고서는 우리가 가르칠 필요가 없거나 더 많은 노력을 하도록 장려될 수 있는 사람들에게 인센티브가 미치는 영향을 더 잘 이해하려면 더 깊은 탐구를 요구한다. 우선, 우리는 기대와 관찰 사이의 그러한 단절을 이해하는 것을 전문으로 하는 학문인 심리학으로 눈을 돌렸다.
Given the disconnect between what people perceive to drive their behavior and actual determinants of behavior,22 designing an incentivization scheme based on self-reports is risky. Further, various reports of incentive schemes having counterproductive consequences demand a deeper exploration if we are to better understand the impact of incentives on those who are not required to teach or who could be encouraged to give more effort. To begin, we turned to psychology, a discipline that specializes in understanding such disconnects between expectation and observation.

인센티브에 대한 심리학적 관점
Psychology’s view on incentives

심리학 연구자들은 동기가 발생하는 메커니즘에 대해 광범위한 연구를 수행했다. 동기부여의 [네 가지 요소]는 여러 주요 동기부여 이론들 사이에서 공유된다. 

  • (1) 역량(어떤 일을 잘 할 수 있는 자신의 능력); 
  • (2) 자율성 또는 가치(행위를 완료하기를 원하거나 그 행위에 투자되는 정도) 
  • (3) 귀인(성과에 대해 스스로 인식하는 책임) 및 
  • (4) 사회 인지적 요소: 개인과 사회적 맥락 사이의 상호 작용을 포함

따라서 특정 개인에 대한 인센티브의 효과는 이 네 가지 요소를 어떻게 구축하거나 감소시키느냐에 달려 있다. 자기결정이론(SDT)에서 도출된 이 문헌의 주요 차이점은 다음과 같다. 

  • "본질적으로 흥미롭거나 즐겁기 때문에" 직무가 수행되는 내재적 동기 부여 
  • "분리 가능한 성과separable outcome로 이어지기 때문에" 작업이 수행되는 외적 동기 부여. 

[분리 가능한 성과separable outcome]를 갖는다는 것은 그 일에 [가치가 있다고 여겨지는 보상] 또는 [피해야 할 처벌]의 형태로 나타나는 [도구성instrumentality]이 있다는 것을 의미한다. (예를 들어, 주제가 재미있어서라기보다는 숙제로 배정되어 있기 때문에 책을 읽는 것)

Psychology researchers have conducted extensive research on the mechanisms by which motivation arises. Four components of motivation are shared among several prominent motivational theories:

  • (1) competence (one’s self-perceived ability to do something well);
  • (2) autonomy or value (the extent to which one wants to complete, or is invested in, the act);
  • (3) attribution (one’s perceived responsibility for the outcome); and
  • (4) sociocognitive elements that involve interactions between an individual and the social context.23 

The effectiveness of an incentive for a particular individual, therefore, is dependent on how it builds on or detracts from these four components. A key distinction in this literature, drawn from self-determination theory (SDT), is that between

  • intrinsic motivation, in which a task is performed “because it is inherently interesting or enjoyable”4; and
  • extrinsic motivation, in which a task is performed “because it leads to a separable outcome.”5 

To have a separable outcome means that there is some instrumentality to the task, either in the form of a reward that is valued or a punishment to be avoided (e.g., reading a book because it is assigned as homework rather than because the topic is interesting).

교유에 [내재적 동기]가 부여된 임상의는 재미나 도전을 즐기기 때문에 그렇게 한다. (즉, 보상이 활동 자체에 포함되어 있기 때문입니다.) 일반적으로, 내재적 동기는 개인이 특정한 작업에 참여할 때, 심지어 (그러한 행동을 할 것이라는 타인의) 기대가 없고, 개인이 (특정 활동 대신) 참여할 수 있는 다른 활동이 있더라도 관찰할 수 있다. 이러한 모델에 따르면, 모든 임상의가 교육에 내재적 동기 부여를 갖는다면, 의료 훈련 프로그램을 배치하는 데 문제가 없을 것이며, 따라서 인센티브가 내재적 동기 부여를 구축할 수 있는지에 대한 질문을 제기한다.
A clinician who is intrinsically motivated to teach does so because she enjoys the fun or challenge (i.e., because the reward is embedded within the activity itself). Generally, intrinsic motivation is observable when an individual engages in a particular task even when there is no expectation and despite there being other activities in which the individual could engage.24 According to these models, if every clinician were intrinsically motivated to teach, there would be no issue with staffing medical training programs, thereby begging the question of whether incentives can build intrinsic motivation.

중요한 메타 분석에 따르면, 대부분의 경우 인센티브 제공은 특정 작업에 [내재적 동기를 부여하는 사람들]에게 때로는 영구적으로 해롭다. 인지평가 이론가들은 [보상]이 [개인의 자율성과 역량]을 떨어뜨려, 보상이 [보상을 받지 못하면 하지 않겠다]는 의미를 내포하고 있기 때문에, 그 일을 덜 바람직하지 않게 보이게 한다고 설명한다.

  • 이는 특히 업무와 성과에 따른 보상(즉, 특정 수준에서 업무를 완료하거나 완료하는 것에 기초하여 주어지는 보상)의 경우에 해당된다.
  • 업무에 수반되지 않는 보상(즉, 업무 완료 여부에 관계없이 주어지는 보상)은 [업무와 보상 사이의 도구성을 제거]한다(개인이 자율성을 되찾을 수 있도록 한다). 그러나 [역량 확인competence affirmation]을 동시에 제거하게 되므로, 과제를 잘 수행하는 것에서 오는 고유한 만족감을 제거할 수 있습니다.

A seminal meta-analysis25 reveals that the provision of incentives is, in most cases, detrimental for those who are intrinsically motivated toward a certain task, sometimes permanently. Cognitive evaluation theorists26 explain that rewards lower an individual’s sense of autonomy and competence, making the task seem less desirable because the reward implies that one would not do it if not rewarded.5 

  • This is particularly the case with task-contingent and performance-contingent rewards (i.e., those given based on completing the task or completing it at a certain level).
  • Non-task-contingent rewards (i.e., those given regardless of whether the task is completed) remove the instrumentality between the task and the rewards (allowing individuals to reclaim autonomy) but can simultaneously remove competence affirmation, eliminating the inherent sense of satisfaction that comes from a task well done.25

[인정과 긍정적 피드백]과 같은 [덜 유형적인 보상]은 자율성에 대한 많은 위험 없이 [역량을 긍정affirm]할 수 있으며, 내재적으로 동기 부여 작업에 대한 동기를 구축하는 것으로 나타났지만, 그 전달에는 중요한 뉘앙스가 있다. 심지어 긍정적인 피드백도 그것이 일상적으로 주어져서, 주어질 것이라는 기대가 자리잡으면, 자율성을 감소시킬 수 있기 때문에 결국 본질적인 동기에 부정적인 영향을 미친다. 또한

  • 임상의가 [[긍정적인 피드백]이나 [유형적인 보상]을 받을 수 있다는 것을 알고 있다면], 유형적인 보상은 "상징적 단서적 가치symbolic cue value"를 취하며, 보람 있는 역량의 정도가 달성되었음을 암시한다. 결과적으로, 그러한 상황에서는, [유형적 보상]이 더 효과적인 경향이 있다.
  • 반면에, 임상의가 [보상을 받을 것이라는 것을 모른다면], [유형적 보상]보다 [예상치 못한 언어적 칭찬]이 본질적인 동기를 증가시킨다.

Less tangible rewards such as acknowledgment and positive feedback can affirm competence without as much risk to autonomy and have been shown to build motivation for intrinsically motivating tasks,25 but there are important nuances to their delivery. Even positive feedback eventually impacts intrinsic motivation negatively because it can reduce autonomy when it is given routinely and, thus, becomes expected.25 Further,

  • if clinicians know they can either receive positive feedback or a tangible reward, the tangible reward takes on “symbolic cue value” and implies that a degree of competence has been achieved worth rewarding. As a result, in such situations, tangible rewards tend to be more effective.27 
  • If, on the other hand, clinicians do not know they are to be rewarded, then unexpected verbal praise increases intrinsic motivation more than tangible rewards.

이러한 차이는 의료 교육 문헌에서 교육을 위해 급여를 받는 사람들은 재정적 인센티브를 높게 평가하는 반면 그렇지 않은 사람들은 낮게 평가하는 이유에 대한 통찰력을 제공한다. 일단 [가시적인 보상]을 받을 수 있다는 것이 알려지면, [재정적 인센티브]는 [그 과제가 중요하다고 간주된다는 것]을 보여주는 더 큰 [상징적 단서적 가치]를 갖는다. 비록 내재적인 동기 부여가 더 큰 창의성과 생산성으로 이어지는 경향이 있기 때문에 이상적일 수 있지만, 많은 일상적인 과제들은 본질적으로 흥미롭지 않고, 많은 의학 교육자들은 가르치는 것에 외적인 동기 부여를 받는다.
This distinction offers insight into why the medical education literature suggests that those who are paid to teach rank financial incentives highly, whereas those who are not rank them low.12 Once it is known that a tangible reward is available, the financial incentive takes on greater symbolic cue value as a demonstration that the task is considered important. Although intrinsic motivation might be ideal because it tends to lead to greater creativity and productivity,23 many daily tasks are not inherently interesting, and many medical educators are extrinsically motivated to teach.

[외재적 동기 부여]에는 [과제에 대해 인식하는 자율성의 정도]에 따른 다양한 [도구적 보상의 스펙트럼]이 있다.

  • [자율성이 낮다고 인식]하는 쪽에서는 부서장의 비판을 피하려고 교육을 맡을 수 있다. 
  • [자율성이 높다고 인식]하는 쪽에서는, 비록 그것이 암묵적인 만족을 제공하지 않더라도, 가르치는 것이 자신의 역할에 필수적이라는 믿음 때문에 가르칠 수 있다.

더 큰 자율성은 더 큰 참여, 성과 및 헌신을 가져온다. SDT에 따르면, [역량]과 [관계성]의 느낌이 높아지면, 보다 [자율적인 형태의 외적 동기부여]를 형성한다. 즉, 임상의가 자신이 [성공에 필요한 관련 기술을 가지고 있다]고 믿고, 가르치는 것이 [교육을 장려하는 집단이나 문화에 소속감을 제공]한다면, 그 행동을 [자아의식에 통합할 가능성]이 더 높아질 것이다. 교수진 개발과 교육 아카데미는 역량과 연결을 증진하기 위한 두 가지 실용적인 전략을 제공한다. 이러한 활동에 참여하는 것은 교사의 정체성을 촉진하여 의미 있는 형태의 동기 부여를 구축하는 데 중요한 역할을 할 수 있으며, 이는 디자인보다 세렌디피티를 통해 교육적 역할에 온 사람들에게 특히 중요할 수 있다.

Within extrinsic motivation lies a spectrum of instrumental rewards varying in the degree of autonomy perceived over the task.26 

  • At the lower end, one might teach to avoid critique from one’s department head;
  • at the higher end, one might teach because of a belief that teaching is integral to one’s role even if it does not provide implicit satisfaction.5,28 

With greater autonomy comes greater engagement, performance, and commitment.28 According to SDT,5 increased feelings of competence and relatedness build more autonomous forms of extrinsic motivation. That is, if clinicians believe they have the relevant skills to succeed, and if teaching provides a sense of belongingness to a group or culture that promotes teaching, they’ll be more likely to integrate the behavior into a sense of self.5,29 Faculty development and teaching academies offer two practical strategies for promoting competence and connections.30 Engagement with such activities can facilitate one’s teacher identity, thereby playing a critical role in building meaningful forms of motivation, which may be especially crucial for those who came to educational roles more through serendipity than design.

요약하자면, [내재적 동기 부여된 임상 교사]에게는 긍정적 피드백의 신중한 제공을 넘어서는 인센티브를 지양하는 것이 최선이라고 하지만, [외재적 동기 부여된 교사]에게는 [자율성, 역량 및 관련성을 지원하는 경우] (인센티브가) 기능적 역할이 있을 수 있다. [완전히 내재적으로 동기 부여된 인력workforces]이라는 이상주의 너머에는, 의학교육은 [외적인 동기 부여를 성취하는 것이 최선인 사람들]에게 의존한다는 현실이 있다. 사실, 많은 역할들은 본질적(내재적)으로 흥미로운 측면이 있지만, 다른 많은 역할들은 단지 (누군가에 의해) 수행될 필요가 있다. 게다가, [이미 확인된 교육에 대한 많은 장벽들]은 심지어 본질적으로 동기부여가 될 때 조차 [강력한 저해요인]으로 작용한다. 이러한 복잡한 상황에서 SDT 연구는 제공해야 하는 실제적인 조언과 관련하여 한계에 도달합니다. 따라서 복잡한 사업장에서 직원들에게 인센티브를 주는 방법에 대한 광범위한 초점을 고려하여 조직행동 분야로 눈을 돌렸다.
In sum, although incentives beyond careful provision of positive feedback are best avoided for intrinsically motivated clinical teachers, they may have a functional role for those who are extrinsically motivated if they support autonomy, competency, and relatedness. Beyond the idealism of a fully intrinsically motivated workforce lies the reality that medical education is reliant on people for which extrinsic motivation is the best one can achieve. In fact, many roles will have some aspects that are intrinsically interesting, whereas others simply need to be done. Further, the many identified barriers to teaching act as particularly powerful disincentives even when one is intrinsically motivated. In such complex situations, SDT research hits its limit with respect to the practical advice it has to offer. We, therefore, turned to the organizational behavior field given its extensive focus on how to incentivize employees in complex workplaces.

인센티브에 대한 조직 행동의 관점
Organizational behavior’s view on incentives

조직 행동주의자들은 급여와 다른 인센티브가 직원들의 동기 부여, 만족도, 생산성에 어떻게 영향을 미치는지에 초점을 맞추었다. 직장 환경에 많은 이론이 적용되었지만, 인센티브의 영향을 중재할 것으로 예상되는 [세 가지 상호 연결된 구성요소]를 일관되게 공유한다.
Organizational behaviorists have focused on how salary and other incentives influence employee motivation, satisfaction, and productivity.31 Although numerous theories have been applied to workplace settings, they consistently share three interlinked components that are expected to mediate the impact of incentives:

  • (1) [자신]과 관련된 요소: 자신이 얼마나 많은 노력을 기울이는지 결정(예: 성취 지향, 귀인 상태).
  • (2) [과제]와 관련된 요소: 과제 또는 목표가 바람직한지, 달성 가능한지, 노력할 가치가 있는지 등
  • (3) [환경]과 관련된 요소: 한 사람의 동기를 제한하거나 가능하게 하는 조건

동기부여가 단지 개인 안에서만 존재하는 것이 아니라는 것을 인정하기 때문에, 이 후자의 요소들은 특히 중요한 추가이다. 즉, 인센티브는 [개인 내에서 동기부여를 높이고 환경 내 장벽을 낮추는 이중적인 역할]을 한다.

  • (1) factors related to the self determine how much effort one exerts (e.g., achievement orientation, attributional states);
  • (2) factors related to the task include whether it or the goal is desirable, achievable, and worth the effort; and
  • (3) factors related to the environment create conditions that limit or enable one’s motivations.

This latter class of factors is a particularly important addition because it acknowledges that motivation does not just live within the individual. That is, incentives play a dual role of raising motivation within individuals and lowering barriers within the environment.

예를 들어, 헤르츠버그의 [동기-위생 이론]은 직업 만족(즉, 동기 유발 요인)과 불만족(즉, 위생 요인)에 각각 영향을 미치는 두 가지 요인 세트를 식별한다. 직원들을 대상으로 업무에 대해 유난히 기분이 좋았던 때와 나빴던 때를 인터뷰한 결과, 기분이 좋았던 때와 의욕이 있었던 때, 기분이 나빴던 때와 의욕이 없었던 때에 대해 지속적으로 이야기하는 경우가 있었다.

  • 동기유발요인motivators는 직무의 [본질적인 조건](예: 성취, 인정, 책임, 승진, 성장)에서 비롯되었으며 SDT에 의해 요약된 동기 부여 요소와 잘 일치한다.
  • 반면, 위생 요인hygiene factors은 [상황적 조건]에서 발생하며 요인의 부재(예: 근무 조건, 대인 관계, 급여, 지위, 직업 안정성)를 통해 불만족에 기여했다.

연구에 따르면 두 요인 세트는 별도의 연속성에서 작동하므로 별도로 다루어야 합니다. 이 모델 하에서, 위에서 논의된 [인센티브(예: 교육 아카데미 및 교수 개발)]는 불만족(예: 고용 안정성 부족)을 촉진하는 [위생 요인]의 맥락에는 거의 영향을 미치지 않을 것이다. 
Herzberg’s32 motivation–hygiene theory, for example, identifies two sets of factors that separately influence job satisfaction (i.e., motivators) and dissatisfaction (i.e., hygiene factors). After interviewing employees about when they felt exceptionally good and bad about their jobs, some factors were consistently talked about in terms of feeling good and motivated, and others in terms of feeling bad and unmotivated.32 

  • Motivators arose from intrinsic conditions of the job (e.g., achievement, recognition, responsibility, advancement, growth) and align well with the components of motivation outlined by SDT.
  • Hygiene factors, in contrast, arose from contextual conditions and contributed to dissatisfaction through their absence (e.g., working conditions, interpersonal relations, salary, status, job security).33 

Research suggests that both sets of factors operate on separate continua and need to be addressed separately.34–36 Under this model, the incentives discussed above (e.g., teaching academies and faculty development) will have little influence in the context of hygiene factors that promote dissatisfaction (e.g., lack of job security).

또한 [동기부여 요인]과 [위생 요인]의 차이는 [돈이 할 수 있는 역할]을 새롭게 조명합니다. 부정적인 동기부여자로서, 돈은 조직행동주의자들에 의해 [존재할 때 만족감]을 만들어내기보다는, [부재할 때 불만족]을 만들어낼 것으로 기대된다. 아마도 결과적으로, [(교육에 대한 강한 저해 요인을 만드는) 임상업무에서 손실된 돈]이 [교육(일반적으로 동기 부여 인센티브 목록에서 낮은 순위에 있음)에서 얻는 돈보다 더 중요하다]고 추측하는 것이 타당하다.

Additionally, the distinction between motivators and hygiene factors shines new light on the role that money might play: As a negative motivator, money is expected by organizational behaviorists to create dissatisfaction when absent rather than creating satisfaction when present. Perhaps, as a result, it is reasonable to speculate that money lost from clinical practice (creating a strong disincentive for teaching) is more important to consider than money gained from teaching (commonly ranked low on lists of motivating incentives).

동기부여 요인과 위생 요인을 모두 해결하기 위해, [매슬로의 욕구 위계 이론]의 수정된 버전은 임상 교사의 가장 기본적인 요구 또는 기본적인 요구에서 시작하여, 다음과 같이 진행되는 요인을 순서대로 해결할 것을 제안함으로써 가치를 제공한다.

  • (1) 기본 임금,
  • (2) 복리후생 및 훈련의 안전성,
  • (3) 사회적 소속감,
  • (4) 자존감, 
  • (5) 자기 실현 

To address both motivators and hygiene factors, an adapted version of Maslow’s37 hierarchy of needs theory offers value by suggesting that factors be addressed in order beginning with a clinical teacher’s most fundamental or basic needs and progressing as follows:

  • (1) basic wages,
  • (2) safety in benefits and training,
  • (3) social belongingness,
  • (4) self-esteem, and
  • (5) self-actualization.38 


따라서 적절한 [임금, 직업 안정성, 훈련 기회]가 없다면 [자존감과 자아실현]을 목표로 하는 인센티브는 거의 영향을 미치지 않을 수 있다. 실증적 연구에 따르면, 재정적 인센티브를 제공하는 것은 직원의 생산성을 30% 향상시키는 것으로 나타났으며, 이는 일자리 창출 계획(9%-17%)과 직원 참여 프로그램(1% 미만)보다 더 크게 나타났다. 그러나 일반적으로 근로자들 사이에서는 충분한 급여가 중요할 수 있지만, 임상의들은 일반적으로 임상적인 역할을 수행할 수 있는 시간을 포기하더라도 최소한의 "기본 임금"을 누리기 때문에 이러한 생각들이 의료 교육으로 어떻게 일반화되는지 알기 어렵다. 이런 의미에서 재정적 인센티브에 대한 질문은 아마도 "얼마나"에 대한 것이 아니라 "무엇이 공정한가"에 대한 것이 될 것이다.

Thus, without adequate wages, job security, and training opportunities, incentives targeting self-esteem and self-actualization may have little influence. Supportive empirical work found that providing financial incentives raised employee productivity by 30%, larger than job enrichment initiatives (9%–17%) and employee participation programs (less than 1%).39 However, although sufficient pay may be important among workers in general, it is difficult to know how these ideas generalize to medical education because clinicians generally enjoy at least “basic wages” even when one gives up clinical time to take on teaching roles. In this sense, the question of financial incentives perhaps becomes less about “how much” and more about “what is fair.”

[형평성 이론]은 [절대적인 돈의 양]은 [불공정에 대한 인식]만큼 중요하지는 않을 수 있다고 가정한다. 다른 사람들과 비교하여, [자신의 자격과 노력에 대한 과소 또는 과다 지급]을 인식하는 것은 디스트레스의 감정으로 이어진다. 예를 들어, 조직 내의 두 역할이 더 많은 경험과 기술을 필요로 하는 한 역할에도 불구하고 동일한 급여를 받는 경우, 더 높은 역할에 속한 사람들은 그들이 버는 돈의 양에 만족했지만, 이 금액을 하위 역할에 속한 사람들과 비교했을 때 불만족스러웠다. 즉, 한 사람이 [자신이 과소평가]를 받거나, [다른 사람들이 과대평가]를 받는다고 인식할 때 경제적 지위에 관계없이 동기부여가 위협받을 수 있다. [의학 교육에 대해 (교수가) 인식하는 "공정한fair" 보상금]은 종종 [교수자들이 실제로 받는 것]보다 더 높으며, 이는 [형평성equity의 문제가 작용]할 수 있음을 시사한다. 또한, 아마도 [교육에 대한 보수를 주지 않는 기관에 소속된 사람들]은 재정적 인센티브를 낮게 평가할텐데, 왜냐하면 그러한 환경에서는 아무도 [교육 사례비teaching honoraria]를 받지 못해야만 형평성이 확립되기 때문이다. 직원들은 [더 높은 공정성fairness]을 옹호함으로써 형평성을 회복하려고 하지만, 반대로 이것이 잘 되지 않으면, 노력을 덜 하거나 역할을 완전히 포기함으로써 형평성을 회복하려 할 것이다. 그러나 [급여율rate of pay]이 "공정한" 것으로 간주되는지 여부는 비교되는 기준기준에 따라 달라질 수 있다.

Equity theory40 posits that the absolute amount of money may not be as important as perceptions of unfairness. Perceiving under- or overpayment given one’s qualifications and effort, in comparison with others, leads to feelings of distress. For example, when two roles within an organization received equal pay despite one role requiring more experience and skill, those in the more senior role were satisfied with the amount of money they were making, but dissatisfied when this amount was compared with those in the junior role.41 That is, motivation may be threatened regardless of financial position when one perceives oneself to be underrewarded or others overrewarded. The perceived “fair” rate of compensation for teaching in medicine is frequently higher than what teachers are actually being paid, suggesting that equity issues may be at play.13 Also, perhaps individuals at institutions who are not paid to teach rank financial incentives low because equity is established when nobody receives teaching honoraria in such environments.12 Employees seek to restore equity by advocating for more fairness, or if unsuccessful, by exerting less effort or abandoning the role completely.42 Whether a rate of pay is considered “fair,” however, likely depends on the reference standard against which it is compared.

[다른 인센티브]도 [형평성equitability에 대한 생각]에 의해 영향을 받을 수 있는지는 조직 행동 문헌에서 명확하지 않다. 예를 들어, [교육 아카데미teaching academy]

  • [교육적 역할]을 [임상적 또는 연구적 성공]과 비교하여 [대등한 수준의 명망comparable plane of prestige]에 놓음으로써 [동기부여요인motivator]를 제공할 수 있지만,
  • 만약 아카데미가 [교육자의 이너서클]에서만 가능하다면, [아카데미에서 배제당한 교수자]에게 [지위와 소속감의 부재]를 암시하게 되므로 [위생적 요인]으로 해석될 수 있다.

It is unclear from the organizational behavior literature whether other incentives are susceptibly influenced by considerations of equitability. For example,

  • a teaching academy might provide a motivator by putting educational roles on a more comparable plane of prestige relative to clinical or research successes,
  • but if only available to an inner circle of educators, the same incentive might be interpreted as a hygiene factor by implying the absence of status and belongingness for teachers who are excluded.

[조직행동 분야]는 [개인의 특성] 외에도 [환경적 요인]에 주목함으로써 인센티브를 더 폭넓게 고려하지만, [동기부여의 촉진]에는 (심리학자나 의학교사들이 주장하는 것보다) [재정적 보상이 훨씬 중요하다]는 점도 시사하므로 우리가 어떻게 진행해야 할지에 대한 모순적 메시지를 남긴다. 이러한 주장을 조정하기 시작하기 위해 [행동경제학 분야]는 왜 재정적 인센티브가 동기부여와 동기부여를 동시에 할 수 있는지에 대한 더 미묘한 이해를 제공하고, 우리에게 내재적-외부적 스펙트럼을 넘어서는 다른 형태의 동기부여를 소개한다.
While the organizational behavior field broadens consideration of incentives by drawing attention to environmental factors in addition to individual characteristics, it also suggests that financial rewards are much more important in promoting motivation than psychologists have argued or medical teachers have claimed, leaving us with contradictory messages of how to proceed. To begin reconciling these claims, the behavioral economics field provides a more nuanced understanding as to why financial incentives can be simultaneously motivating and demotivating, and introduces us to other forms of motivation beyond the intrinsic–extrinsic spectrum.

인센티브에 대한 행동경제학자들의 견해
Behavioral economists’ view on incentives

행동 경제학 내에서 [동기구축이론(MCT)]은 [심리학에서 얻은 정보를 전통적인 경제 모델과 결합]하고, 보상에 대한 우리의 이해를 돕기 위해 특히 유용한 관점을 제공한다. MCT는 앞서 설명한 바와 같이 인센티브가 연속체의 내적인 끝과 외적인 끝 사이에서 개인의 동기를 이동시키는 것을 전제로 하지만, [연속체의 각 끝]에서 사람들은 서로 다른 일련의 원칙에 의해 동기가 부여된다는 것을 암시한다.

  • 만약 인센티브가 사람들을 [외재적 동기 극]으로 이동시킨다면, 인센티브는 [내재적 동기]를 "밀어낸다crowds out". 그러한 경우, 노력은 [인센티브의 크기]와 직접적으로 관련이 있으며, 더 큰 인센티브는 더 큰 노력을 추진한다(즉, 사람들은 화폐 시장 시스템에서 작동한다).
  • 반대로, 인센티브가 사람들을 [내재적 동기 극]으로 이동시킨다면, 인센티브는 본질적인 동기를 "밀집crowd in"시킨다. 이러한 경우, 노력은 대신 [상호주의 또는 이타주의]에 의해 추진된다(즉, 사람들은 사회 시장 시스템에서 작동한다).

Within behavioral economics, motivation crowding theory43 (MCT) combines information from psychology with traditional economics models and provides a particularly useful perspective to aid our understanding of rewards. MCT presupposes that incentives shift an individual’s motivation between intrinsic and extrinsic ends of a continuum43 as described previously, but it also suggests that at each end of the continuum, people are motivated by different sets of principles.

  • If an incentive shifts people toward the extrinsic pole, the incentive “crowds out” intrinsic motivation. In such cases, effort is directly related to the size of incentive, with larger incentives driving greater effort (i.e., people operate in money-market systems).44 
  • Alternatively, if an incentive shifts people toward the intrinsic pole, the incentive “crowds in” intrinsic motivation. In such cases, effort is instead driven by reciprocity or altruism (i.e., people operate in social-market systems).44

이러한 방향에서 중요한 의미는 [중소규모의 보상]이 동기부여에 가장 해로울 수 있다는 것이다. 이를 설명하기 위해, 한 주요 연구는 더 [큰 재정적 보상]이 [작은 보상]보다 더 많은 시간을 자선 단체에 자원봉사하게 하지만, 보상을 도입하는 것만으로도 자원봉사 시간이 4시간이나 줄어든다는 것을 발견했다. 자원봉사자들은 특정한 재정적 한계를 넘은 후에야 아무런 보상도 받지 못한 것과 같은 시간을 보냈다. 결과적으로, 충분히 큰 재정적 인센티브는 인센티브를 제공하지 않는 것보다 노력에 더 많은 영향을 미칠 수 있지만, 소규모에서 중간 정도의 재정적 인센티브는 해로울 가능성이 있다. 
The important implication within this orientation is that small- to medium-sized rewards can be the most detrimental to motivation. To illustrate, a seminal study found that larger financial rewards caused individuals to volunteer more hours toward charitable organizations than smaller rewards, but the mere introduction of a reward reduced volunteer time by four hours.45 Only after crossing a particular financial threshold did volunteers commit the same number of hours as without any rewards. As a result, large enough financial incentives can influence effort more than providing no incentives, but small to moderate financial incentives are likely to be harmful.46

안타깝게도 이 임계값을 추정하는 것은 어렵습니다. [이론적으로 충분히 큰 것처럼 보이는 양]은 실제로 사용할 때 너무 작은 것으로 인식될 수 있으며, 다른 관련 요소의 맥락에서 고려될 수 있다. 예를 들어, 50달러 사례비는 마취과 의사에게는 작을지 몰라도, 수련 중인 전공의에게는 클 수도 있다. 하지만 그룹별로 사례비를 다르게 설정하면 [인식된 불평등 위험the risk of perceived inequity]이 발생한다. 아마도 [내재적 동기를 밀어내거나, 오로지 인센티브를 얻기 위해서 교육을 함]으로써 생기는 [질 저하의 위험]을 기억하는 것이 더 중요할 것이다.
It is unfortunately difficult to estimate this threshold value. An amount that seems theoretically large enough can be perceived as too small when put in practice and considered in the context of other relevant factors.46 For example, a $50 honorarium might be small to an anesthesiologist and large to a resident in training, but setting different rates for different groups creates the risk of perceived inequity. Perhaps more importantly, it is critical to remember the risks of lessening quality that come from crowding out intrinsic motivation and having people teach purely to obtain an incentive.

이 딜레마에서 벗어날 수 있는 방법은 [인센티브 규모와 노력 사이의 관계]가 [비금전적 인센티브]에는 적용되지 않는다는 증거에서 나올 수 있다. 예를 들어, 적십자사의 대규모 실험을 통해 [복권과 기프트 카드]는 크기에 관계없이 헌혈자에게 중립적이거나 긍정적인 영향을 미치는 반면, [소액의 금전적 보상]은 헌혈 의지를 낮추는 것으로 나타났다. 그 차이는 매우 강력해서 만약 [비금전적 인센티브가 그것과 관련된 금전적 가치와 함께 제공]된다면(예: "당신은 5달러의 초콜릿 바를 받을 것이다"), 개인들은 마치 [그것이 금전적 인센티브인 것처럼 상호작용]하도록 기본설정된다. 이것은 임상의에게 "사례비"를 제공하는 것이 "150달러의 사례비"를 제공하는 것과 매우 다른 영향을 미칠 수 있음을 시사한다.
The way out of this dilemma may come from evidence suggesting that the relationships between incentive size and effort do not apply with nonfinancial incentives. For example, large-scale experiments with the Red Cross have found that lottery tickets and gift cards have neutral or positive effects on blood donors regardless of size, while small financial rewards lower willingness to donate blood.6,47 The difference is so powerful that if a nonfinancial incentive is provided with a monetary value associated with it (e.g., “you will receive a $5 chocolate bar”), individuals default to interacting as if it were a financial incentive.44 This suggests that offering a clinician “an honorarium” might have a very different influence relative to offering “a $150 honorarium.”

[내적-외적 동기부여 연속체]와 별개로 작용하는 것처럼 보이는 요소들과 관련하여, [이미지 동기부여(다른 사람들과 그들 자신이 좋은 사람이라는 것을 보여주고자 하는 사람들의 욕구)]는 친사회적 행동에 있어서 중요한 역할을 한다. 자선단체에 기부하거나, 헌혈을 하거나, 임상 교사로 봉사하기 위해 자원하는 것은 본질적으로 만족스럽지 않을 수 있지만, 일부 사람들은 이러한 일들이 [자기자신에 대한 느낌 및 자기의 공적 이미지에 대해서 기분 좋게 느끼게 해주기 때문에], 그 일들을 수행하려는 동기가 있는 것처럼 보인다. 이는 아리엘리 외 연구진이 무작위로 참가자들에게 기부 금액을 공개 또는 비공개로 지정해 자선단체에 기부하도록 했다. 그들은 개인적인 기부보다 더 많은 기부가 공공장소에서 이루어졌다는 것을 발견했다. 이러한 결과는 의학 교사medical teachers에게도 일반화될 수 있는데, 이는 임상의들이 [교육에 대한 많은 친사회적 이유]를 드러냈음을 고려하면 합리적이다. 그렇다면, [노력에 대한 대중의 인식]은 재정적 인센티브보다 더 영향을 미칠 수 있다. 그러나 이러한 발견이 인식된 형평성에 대한 관찰과 어떻게 상호 작용하고 기본적인 욕구 계층 구조에 어디에 놓여 있는지는 여전히 불분명하다.
With respect to factors that seem to operate separately from the intrinsic–extrinsic motivation continuum, image motivation (people’s desire to illustrate to others—and themselves—that they are good people) plays an important role when it comes to prosocial behaviors.43,48,49 Contributing to charities, donating blood, or volunteering to serve as a clinical teacher might not be inherently satisfying, but some appear motivated to perform the tasks because these tasks allow them to feel good about themselves and their public image. This was illustrated by Ariely et al,49 who randomly assigned participants to donate to a charity with their donation amounts being made public or private. They found that larger donations were made in public than in private. If these findings generalize to medical teachers, as seems reasonable given the many prosocial reasons for teaching that clinicians express, then public recognition of efforts may be more impactful than financial incentives. How these findings interact with the observations about perceived equitability and where one lies on the fundamental needs hierarchy, however, remains unclear.

이 문헌에서 분명한 것은 [특정한 행동과 관련된 긍정적인 이미지]는 [다른 사람들의 규범과 행동]에서 크게 파생된다는 것이다. 소득세 준수를 장려하고, 예방 접종을 받고, 운동을 하는 것은 사람들이 문화적 규범으로 보일 때 더 많이 하는 행동의 예이다. 따라서, [교육에 의해 유지되는 이미지 동기image motivation]는 부분적으로 [임상의가 위치한 맥락의 문화적 규범]에 의존할 것이다. 즉, [이미지 동기 부여]는 [교육이 인정받지 못하는 병원]에서는 (동기부여)요소가 아닐 것이다. 또한 [이러한 상황에서 제공되는 유형적 보상]은 의도치 않게 [그 행동이 어렵거나 매력적이지 않다는 인식을 강화]할 수 있다. 예를 들어, [인근에 공항이나 교도소가 개발되고 있을 때], 이웃 구성원들에게 재정적 인센티브를 제공하는 것은 [시설에 대한 지역사회의 지원을 감소]시킨다. 학습환경은 학습자의 관점에서 실질적으로 연구되어 왔으나, 특정 환경의 문화가 교사의 수업동기를 변화시키는 정도나 영향요인이 수업노력에 영향을 미치는 방식으로 수정가능한지는 여전히 미지수이다.
What is clear from this literature is that the positive image associated with particular behaviors is largely derived from the norms and behaviors of others.50,51 Encouraging income tax compliance, becoming vaccinated, and exercising are examples of behaviors people do more of when they appear to be the cultural norm.52 It is logical, then, that the image motivation held by teaching would be partially dependent on the cultural norm of the contexts within which clinicians are situated. That is, image motivation is not likely a factor in a hospital where teaching is not endorsed. Further, in such settings, tangible rewards can unintentionally reinforce the perception that the behavior is difficult or unattractive.48 For example, offering financial incentives to members of a neighborhood when airports or jails are being developed nearby reduces the community’s support for the facility.53 Although the learning environment has been studied substantially from learners’ perspectives, the extent to which the culture of a particular environment changes teachers’ motivations to teach, or whether the influential factors are modifiable in a way that impacts teaching efforts, remains unknown.

논의
Discussion

심리학, 조직행동학, 행동경제학에서 검토한 문헌을 종합할 때, 우리는 인센티브가 의학교사의 동기에 미치는 영향에 대해 세 가지 결론을 도출한다. 이것들은 인센티브를 구현하는 경우와 방법을 고려할 때 실용적인 지침으로 아래에 제시되어 있다. 
In synthesizing the literature reviewed in psychology, organizational behavior, and behavioral economics, we draw three conclusions about the influence that incentives have on the motivations of medical teachers. These are framed below as practical guidelines when considering if and how to implement incentives.

무엇이 개인을 행동으로 이끌 것인지를 결정합니다.
Determine what is driving the individual to act in the first place

첫째, [인센티브의 영향]은 [동기 부여에 중요하다고 간주되는 기본 메커니즘]과 인센티브가 [어떻게 상호 작용하는지]에 따라 달라진다. 노력에 영향을 미치는 인센티브를 도입하기 전에, 무엇이 그 사람이 그 일에 참여하도록 동기를 부여하는지를 결정하는 것이 중요하다.

  • 그들은 그것이 흥미롭고 도전적이라고 생각하나요? 
  • 그들은 그것이 그들의 역할의 핵심적인 부분이라고 생각하나요? 
  • 그들이 그것을 해야 한다는 말을 들었니? 
  • 그들은 자신에 대해 좋은 기분을 느끼기 위해 그렇게 하나요? 
  • 그 맥락에서 다른 모든 사람들도 그것을 하고 있나요? 

First, the influence of an incentive is dependent on how it interacts with the underlying mechanisms deemed important for motivation. Before introducing an incentive to influence effort, it is important to determine what is driving the person to engage in the task in the first place.

  • Do they find it interesting and challenging?
  • Do they assume it to be a core part of their role?
  • Have they been told they need to do it?
  • Do they do it to feel good about themselves?
  • Is everyone else in that context doing it?

이러한 질문은 어떤 유형의 인센티브가 가치가 있는지 알려주는 데 도움이 될 수 있는 출발점을 제공할 것이다. 단순히 가치가 있는 것(또는 없는 것)에 대한 주장을 액면 그대로 받아들이기보다, 현재 이러한 동기를 지지하거나 억제하는 인센티브 또는 억제책이 무엇인지 탐구할 가치가 있다. 예를 들어, 만약 사람들이 돈의 중요성을 경시한다면, 그들이 이미 돈을 받고 있는지, 얼마나 많은 돈이 "공정한fair" 것으로 인식될지, 혹은 그들이 돈이 중요하다고 말한다면 그것이 그들을 나쁘게 보이게 할지를 생각해보라. 그러한 고려사항은 동기부여 요인과 장벽의 피상적인 목록과 현재 작용하고 있는 복잡한 요인들의 미묘한 이해 사이를 구별할 것이다.
Such questions will provide a starting point that can help inform what types of incentives might be valued. It is also worth exploring what incentives or disincentives currently support or inhibit these motivations without simply taking claims about what is valued (or not) at face value. For example, if people downplay the importance of money, consider whether they are already being paid, what amount of money would be perceived as “fair,” or whether it might make them look bad if they were to say that money was important. Such considerations will differentiate between a superficial list of motivators and barriers and a nuanced understanding of the likely complex set of factors at play.

인센티브와 동기 부여 유형 간의 고유한 상호 작용을 고려합니다.
Consider the unique interactions between incentives and motivation types

둘째, 기본적인 동기 부여 동기와 가치를 파악한 후에는 인센티브가 실제로 필요한지 또는 해로울 수 있는지 고려하십시오. 본질적으로 동기 부여된 개인은 추가적인 동기 부여가 필요하지 않을 수 있지만, [동기부여된 원동력motivational drives의 실행을 막는 장벽]을 제거하기 위한 노력이 필요할 수 있다. 인센티브가 구현할 가치가 있다고 판단되는 경우, 어떤 유형이 가장 효과적인지(예: 금전적인지 비금전적인지), 어떻게 제공되는지(예: 사적인 것과 공적인 것)를 고려한다. 이는 [인센티브가 잘못]되면 [의미 있는 변화를 가져오지 못할 수도 있고, 지속적인 문제적 형태의 동기 부여를 유발할 수 있다]는 점을 고려할 때 신중한 생각이 필요하다. 그 경우에는 [사회적 규범이 바뀌게] 되고, [바람직한 행동을 장려하기 위한 미래의 노력이 성공할 가능성을 더욱 감소]시키게 되기 때문이다.
Second, once you have grasped the underlying motivational drives and values, consider whether an incentive is actually needed or could be detrimental. An intrinsically motivated individual might not need any additional incentive, but may require efforts toward removing barriers preventing them from enacting their motivational drives. If an incentive is deemed worth implementing, consider which type will be most effective (e.g., financial or nonfinancial) and how it will be provided (e.g., in private vs. public). This requires careful thought given that, if done incorrectly, the incentive can fail to produce meaningful change or can create sustained problematic forms of motivation that alter the social norms in a manner that further decreases the success of future efforts to encourage the desired behavior.

  • [이미지-동기부여된image-motivated 사람]의 경우 [재정적 인센티브]는 사적으로 주어질 때 가장 효과적인 반면, [개인의 기여를 인정하는 인센티브]는 공개적으로 해야 가장 효과적이다. 어떤 행동을 [일반적인 것normalizing으로 만드는 것]은 그 행동을 포용하는 방식으로 문화를 변화시킬 수 있다.
  • [외적 동기부여된extrinsically motivated 사람]의 경우, 인센티브는 예를 들어 [기술 개발 기회를 제공]하거나, [행동을 지지하는 다른 사람과의 연결]을 가능하게 함으로써 [자율성, 역량 및 관련성]에 대한 인식을 구축하려고 노력해야 한다.
  • For image-motivated individuals, financial incentives will work best privately, whereas incentives that recognize the individual’s contributions work best publicly. Normalizing the behavior might change the culture in a way that leads to embracing the behavior.
  • For extrinsically motivated individuals, the incentive should try to build one’s perceived autonomy, competency, and relatedness by, for example, providing skill-building opportunities or enabling connections with others who endorse the behavior.

 

  • [금전적 인센티브]은 효과적으로 사람들을 문 안으로 불러들일 수 있고, 일단 들어오면 그 일 자체를 가치 있게 여기고 감사하는 법을 배울 수 있지만, 무엇이 "충분히 큰" 것인지는 고려해야 할 중요하다: 그러한 인센티브는 crowding effect를 넘어서서 [정당한fair 것]으로 간주될 수 있을 정도로 충분히 커야 하지만, 과제가 어렵거나 인기가 없다는 신호를 보낼 정도로 크지 않아야 한다.
  • [비금전적 인센티브]는 사이즈에 민감하지 않으며, 특히 업무가 친사회적인 것으로 간주된다면 좋은 대안이 될 수 있다. 그러나 동일한 환경에 있는 개인마다 얼마나 충분한지에 대한 서로다른 인식을 가지고 있다면, 다른 사람들에게 다른 크기의 보상을 제공하는 로지스틱한 문제를 야기한다. [비재정적 인센티브]로 여겨질 수 있는 광범위한 것들은 [구두 피드백, 교사 커뮤니티와의 참여, 공적정, 교수진 개발 기회, 정체성 형성 지원] 등이 있다.
  • Financial rewards can effectively get people in the door where an individual can then learn to value and appreciate the task itself, but what constitutes “large enough” is important to consider: Such incentives need to be large enough to override any crowding effects and to be considered fair, but not so large that they signal the task as difficult or unpopular.
  • Nonfinancial incentives aren’t as sensitive to size and offer a good alternative particularly if the task is considered prosocial or if different individuals in the same environment have different perceptions of how much is enough, creating logistical problems in offering different-sized rewards for different people. The wide range of things that could qualify as nonfinancial incentives include verbal feedback, engagement with communities of teachers, public recognition, faculty development opportunities, and identity formation support.

인센티브 효과를 방해할 수 있는 장벽 고려
Consider barriers that may interfere with incentive effectiveness

셋째, 인센티브의 효과는 개인과 그들이 일하는 맥락에 따라 달라진다. [올바른 개인] 또는 [올바른 맥락]에서 [올바른 인센티브를 구현]하는 것은 이 싸움의 절반에 불과하다. [환경적 또는 맥락적 장벽]이 있는 맥락에서는 인센티브가 단기적이거나 거의 영향을 미치지 않기 때문이다. 사람들이 그들의 역할에서 안정감을 느끼는지, 그들이 보상을 받거나 공평하게 인정받고 있다고 느끼는지, 더 근본적인 요구가 충족되고 있는지 여부는 동시에 해결되어야 하는 중요한 고려사항이다. 

Third, the effectiveness of any incentive is dependent on individuals and the contexts within which they work. Implementing the right incentive for the right individual or in the right context is only half the battle as it will have short-term or little impact in a context where there are environmental or contextual barriers. Whether people feel secure in their roles, whether they feel like they are being compensated or acknowledged equitably, or whether more fundamental needs are being met are important considerations that need to be addressed in tandem.

결론들
Conclusions

요약하면, 심리학자, 조직 행동주의자, 행동 경제학자들은 우리에게 인센티브의 역할에 관한 유용한 권고를 개발하도록 이끈 경고 이야기와 성공 사례를 모두 제공했다. 그들이 만들어낸 통찰력에도 불구하고, 우리의 의학 선생님들 사이에서 지속적이고 긍정적인 형태의 동기 부여를 배양할 가장 가치 있고 영향력 있는 인센티브를 식별하기 위해, 그 분야는 교사들이 스스로를 발견하는 다양한 보건 전문적 맥락에서 인센티브가 어떻게, 언제, 왜 작동하는지에 대한 더 큰 명확성이 필요하다.
In sum, psychologists, organizational behaviorists, and behavioral economists have provided us with both cautionary tales and success stories that have led to the development of useful recommendations regarding the role of incentives. Despite the insights they have produced, to identify the most valuable and influential incentives that will cultivate sustained and positive forms of motivation among our medical teachers, the field needs greater clarity regarding how, when, and why incentives operate in the variable health professional contexts in which teachers find themselves.


Acad Med. 2018 Nov;93(11S Association of American Medical Colleges Learn Serve Lead: Proceedings of the 57th Annual Research in Medical Education Sessions):S52-S59. doi: 10.1097/ACM.0000000000002383.Incentivizing Medical Teachers: Exploring the Role of Incentives in Influencing Motivations
Affiliations collapse

Affiliation

1K.M. Wisener is associate director of faculty development, Faculty of Medicine, University of British Columbia, Vancouver, British Columbia, Canada; ORCID: http://orcid.org/0000-0002-6093-8338. K.W. Eva is professor and director of education research and scholarship, Department of Medicine, and associate director and senior scientist, Centre for Health Education Scholarship, University of British Columbia, Vancouver, British Columbia, Canada; ORCID: http://orcid.org/0000-0002-8672-2500.

PMID: 30365430

DOI: 10.1097/ACM.0000000000002383

Abstract

Purpose: Medical education is dependent on clinicians and other faculty who volunteer time and expertise to teaching. Unfortunately, the literature reports increasing levels of dissatisfaction, burnout, and attrition. Incentivization provides an obvious intervention, but rewards must be implemented judiciously or risk unintended consequences. With little known about the effects of incentives in medical education, the authors investigate key insights across three disciplines to explain how, why, and when incentives can be used effectively.

Method: In this critical synthesis, a purposeful and iterative literature search was conducted by exploring a variety of databases to identify seminal articles, key concepts, and generative search terms. Particularly fruitful disciplines were then explored more deliberately.

Results: Psychologists argue that the impact of an incentive depends on an individual's motivational drives. Organizational behaviorists draw attention to environmental incentives and disincentives that build or detract from motivation. Behavioral economists posit that size, type, and way in which an incentive is provided affect motivation differently.

Conclusions: The influence of an incentive depends on how it interacts with underlying mechanisms deemed important for motivation. These mechanisms change across tasks, individuals, and contexts. Recommendations derived from the effort include being deliberate about (1) determining what is driving the individual to act, (2) considering the unique interactions between incentives and motivation types, and (3) considering barriers that may interfere with incentive effectiveness. In examining each of these, the authors argue that the field needs greater clarity regarding how, when, and why incentives operate within the many contexts in which medical educators work.

 

의학교육의 학생참여: 교육과정 개발에서 모듈 공동책임자로서 학생에 관한 혼합연구(Med Teach, 2019)
Student engagement in medical education: A mixed-method study on medical students as module co-directors in curriculum development
Lennart Steffen Milles, Tanja Hitzblech, Simon Drees, Wiebke Wurl, Peter Arends and Harm Peters

 


Introduction

학생들의 참여는 전 세계적으로 의학 교육에 점점 더 많은 관심을 받고 있다. 그것은 학생들과 그들의 기관들을 위한 상호 이익과 함께 협력적인 접근을 구체화한다. 커리큘럼 개발은 학생 참여의 핵심 영역을 나타냅니다. 그러나 학생들은 어느 정도까지 참여할 수 있으며, 어떤 접근법이 효과적이고 실현 가능한가? 교육 평가에서 학생들의 기여도는 잘 확립되어 있지만, 교육과정 개발에서 학생들의 보다 적극적인 역할, 즉 그 설계와 개선에 대한 경험적 정보와 연구가 희박할 뿐이다. 본 논문의 목적은 통합 학부 의학 프로그램의 맥락에서 학생들이 [교육과정 개발]에서 [모듈 공동 책임자]로 기능하는 개념에 대해 보고하고, 이 개념을 통해 교직원 모듈 책임자와 학생 스스로의 경험에 대한 인식을 탐색하는 것이다. 
Engagement of students is experiencing growing attention in medical education world-wide (Bovill et al. 2009; Dhaese et al. 2015; Peters et al. 2018). It embodies a collaborative approach with mutual benefits for the students and their institutions. Curriculum development represents a key domain in student engagement (Aspire-to-Excellence 2013; Harden and Roberts 2015; Peters et al. 2018). But to what extent can students be involved, and what approaches are effective and feasible? While the contribution of students in the evaluation of teaching is well established, there is only sparse empirical information and research present on more active roles of students in curricular development, i.e. its design and improvement (Bovill et al. 2009; Dhaese et al. 2015; Stoddard et al. 2016). The purpose of this article is to report on the concept of students functioning as module co-directors in curriculum development and to explore the perceptions of faculty module directors and the students themselves on their experience with this concept in the context of an integrated undergraduate medical program.

[학생 참여]는 [학생들과 기관들 사이의 상호 유익한 협력적 접근]을 나타내며, [학생들의 학습과 발전]뿐만 아니라, [학업 환경과 제도적 문화의 질]을 향상시키기 위한 광범위한 활동을 의미한다. 그것의 실현은 일반적으로 그들의 기관 내에서 [관리, 교육, 연구 및 지역사회 활동에 학생들의 공식적인 참여]를 포함한다. ASPIRE-to-Excellence 이니셔티브는 학생 참여 활동에 대한 포괄적이고 실용적인 프레임워크를 제공했습니다. 커리큘럼 개발 활동(즉 커리큘럼 설계, 변경 및 개선)은 학교 관리, 학계 및 지역 사회에 대한 참여뿐만 아니라, 의료 교육에 대한 학생 참여의 핵심 영역을 나타냅니다.
Student engagement represents a mutually beneficial collaborative approach between students and their institutions and refers to a broad range of activities to enhance the learning and development of students, as well as the quality of the academic environment and institutional culture (Trowler 2010; Peters et al. 2018). Its realization generally involves formal participation of students in the management, education, research, and community activities within their institutions. The ASPIRE-to-excellence initiative has provided a comprehensive and pragmatic framework on student engagement activities (Aspire-to-Excellence 2013; Harden and Roberts 2015; Drees and Peters 2016). Curriculum development activities, i.e. curriculum design, change, and improvement, represent a key domain for student engagement in medical education in addition to engagement in school management, academic communities, and local community.

[커리큘럼 개발]과 관련하여 [가장 일반적이고 기본적인 학생 참여 모델]은 교수 과정, 프로그램 단위 및 시험에 대한 피드백을 수집하는 것을 포함한다. 이러한 학생들의 평가는 내부 교육과정 검토 과정에 대한 일반적인 인증 기준을 충족하지만, [교육과정 개선을 위한 실행 가능한 계획]으로 효과적으로 전환되지 못하는 경우가 많다. 비록 제한적이기는 하지만, 그들의 [교육 프로그램을 개선하기 위한 의대생들의 기여]가 [아직 충분히 활용되지 않았다]는 것은 문헌을 통해 증명할 수 있다. 학생들은 "실행 중인 교육과정"을 경험했고, 그들은 그 제품을 대표하고 학계의 이해관계자로서 목소리를 가지고 있다.
With regard to curriculum development, the most common and basic model of student participation involves gathering feedback on teaching courses, program units, and examinations (Bovill et al. 2009; Lawson McLean et al. 2013; Peters et al. 2018). While these kinds of evaluations by students fulfill general accreditation standards for internal curriculum review processes, they often fail to become effectively translated into actionable plans for curriculum improvement (Hsih et al. 2015). There is evidence from the literature, although limited, that the contribution of medical students to improve their educational programs has not yet been sufficiently utilized (Bovill et al. 2009). The students have experienced the “curriculum in action”, they represent its product and have a voice as stakeholders in the academic community (Boland 2005; Peluso and Takizawa 2010).

몇몇 연구들은 [의대생들의 교육과정 개발에 대한 보다 적극적인 참여]가 [교육 프로그램의 개선]으로 이어진다고 지적했다. 예를 들어, 학생들의 평가 과정을 최적화하고 대규모 학생 그룹이 참여하는 특정 교육과정 변화와 연결되는 학생 주도 교육과정 검토 모델이 보고되었다. 다른 연구는 [커리큘럼 계획에 대한 더 많은 학생의 투입]이 [계획된 결과]와 [학습된 결과]의 [더 긴밀한 정렬]과 관련이 있다는 것을 보여주었다. 또한 교육단위 기획단에는 교직원 외에 의대생도 정회원으로 참여시키는 것이 관행으로 자리 잡았으며, 여기에는 시범적인 교육과정 개편 사업에 우리 기관도 포함된다. 학생들의 참여를 더욱 높이기 위해, 베를린의 Charité – Universitätsmediz (Charité)는 최근 새롭게 [통합된, 성과-지향 학부 의학 커리큘럼]의 각 모듈의 디렉토리 보드에 의대생을 공식적으로 통합하는 개념을 개발하고 구현했다. 이 개념은 2010년에 도입되었으며 2015년 ASPIRE 학생 참여 우수상을 샤리테에 수여하는 데 핵심적인 역할을 했다.
A few studies have indicated that more active participation of medical student in curriculum development leads to improvement of the educational programs. For instance, a model of student-led curriculum review has been reported which optimized the students’ evaluation process and links to specific curricular changes involving a large group of students (Hsih et al. 2015). Other work has demonstrated that greater student input into curricular planning is associated with a closer alignment of planned and learnt outcomes (Murphy et al. 2009). Furthermore, it has become practice to include medical students in addition to faculty teachers as regular members in the planning groups of educational units, and this includes our own institution in a pilot curricular reform project (Visser et al. 1998; Burger 2006). To go even further with students' participation, the Charité – Universitätsmedizin Berlin (Charité) has recently developed and implemented a concept to formally integrate medical students into the directory board of each module of its newly integrated, outcome-oriented undergraduate medical curriculum. The concept was introduced in 2010 and played a key role in granting of the ASPIRE award for excellence in student engagement to the Charité in 2015.

이 기사의 목적은 다음과 같다. 

  • (1) 통합 학부 의학 커리큘럼의 맥락에서 모듈 공동 책임자로서 기능하는 의대생의 개념, 활동 및 관행을 설명한다. 주요 측면은 기사에 요약되어 있으며 "방법"에 대한 자세한 설명은 부록에 설명되어 있다. 
  • (2) 융합적이고 혼합적인 접근법을 사용하여 교육과정 개발 과정에서 교직원 모듈 책임자와 학생 스스로가 학생 모듈의 역할, 기능, 효과를 어떻게 인식했는지 탐구한다.

The aims of this article are

  • (1) to describe the concept, activities and practices of medical students functioning as module co-directors in the context of an integrated undergraduate medical curriculum; key aspects are outlined in the article and a “how to” elaborations are elucidated in Supplementary Appendix; and
  • (2) to explore how faculty module directors and the students themselves perceived the role, functions, and effects of the student module co-directors in the process of curriculum development using a convergent, mixed-methods approach.

방법들
Methods

설정
Setting

샤리테는 유럽 중부에 위치한 대형 의과대학으로 매년 2회 300명의 의대 신입생을 모집한다. 2010년, 학부 의학 교육과정은 [전통적인 학문 기반]의 교육과정에서 1학기부터 마지막 학기까지 [완전히 통합된 프로그램]으로 전환되었다. 이 모듈은 5년의 학습 기간과 최종 사무직 연도에 걸쳐 40개의 학제 간 주제 모듈로 구성되어 있습니다(부록 2 참조).
The Charité is a large mid-European medical school and enrolls 300 new medical students twice a year. In 2010, the undergraduate medical curriculum was transformed from a traditional, discipline-based curriculum into a fully integrated program from the first to the last semester (Maaz et al. 2018). It is organized into 40 interdisciplinary, thematic modules over a five-year study time and a final clerkship year, see Supplementary Appendix 2.

모듈 공동 책임자로서의 의대생 개념
Concept of medical students as module co-directors

통합 프로그램의 각 모듈은 다양한 분야의 교수진 3명과 의대생 1명 등 4명의 모듈 디렉터 그룹이 주도한다. 이러한 구조는 새로운 교육과정의 개발과 시행 과정에서 긍정적인 경험에서 비롯된다. 4명의 모듈 책임자는 해당 모듈의 교육과 관련된 모든 분야의 대표자로 구성된 특정 모듈 계획 그룹에 의해 선출되고 의장도 됩니다. 그들은 모듈 디렉토리 보드를 구성하고 품질 보증 및 향후 개선과 같은 모듈의 주기적 커리큘럼 개발 프로세스를 공동으로 책임진다. 학생 모듈 공동 책임자는 교직원 및 학생과 상호 작용하고, 정보를 전달하고, 학생 평가 및 피드백을 종합 및 해석하며, 교직원 모듈 책임자와 함께 모듈을 공동 개발하고, 그룹으로 조직한다.
Each module of the integrated program is led by a group of four module directors: three faculty members from various disciplines, and one medical student. This structure originates from positive experiences during the development and implementation of the new curriculum. The four module directors are elected by, and also chair, a specific module planning group, consisting of delegates from all disciplines involved in the teaching of that module. They form the module directory board and are jointly responsible for the cyclic curricular development process of their module, e.g. quality assurance and future improvement. Student module co-directors interact with faculty and students, relay information, synthesize and interpret student evaluation and feedback, co-develop the module together with faculty module directors, and organize themselves as a group.

표 1은 학생 모듈 공동 책임자의 구체적인 업무 및 활동에 대한 개요를 제공합니다. 부록 1은 "방법" 관점에서 그들의 과제와 실천요강에 대한 상세한 설명을 포함한다. 부록 3은 교육과정에 대한 모범적인 기여에 대해 보고한다.
Table 1 provides an overview on the specific tasks and activities of the student module co-directors. Supplementary Appendix 1 entails a detailed description of their tasks and practices from a “how to” perspective. Supplementary Appendix 3 reports on exemplary contributions to the curriculum.

전반적으로 학생 모듈 공동 책임자는 개인으로서도, 집단으로서도 높은 수준의 자율성을 가지고 행동한다. 그들은 우리 [기관의 커리큘럼 개발과 학생 참여를 위한 더 큰 네트워크의 공식적인 요소]로 역할을 한다. 그림 1과 같이, 이 네트워크는 각 모듈에서 공부하는 학생, 모듈 디렉터, 모듈 기획 그룹, 교수진 교육과정 개발자, 학부 프로그램 교육과정 위원회, 샤리테 감독 교육위원회, 학생회 대표 조직과의 지속적인 상호작용을 포함한다. 
Overall, the student module co-directors act with a high level of autonomy, both as individuals and as a group. They serve as formal elements of a larger network for curriculum development and student engagement at our institution (Maaz et al. 2018; Peters et al. 2018). As shown in Figure 1, this network involves ongoing interactions with the

  • students studying in their respective module,
  • module directors,
  • the module planning group,
  • faculty curriculum developers,
  • the curriculum committee for the undergraduate program,
  • the Charité overarching education committee, and
  • the student council representative organization.


그림 1. Charité의 커리큘럼 개발을 위해 학생 모듈 공동 책임자를 조직 네트워크에 포함합니다. 의대생이라면 누구나 모듈 공동 책임자로 공석에 지원할 수 있다. 그들은 학생 모듈 책임자 그룹에 의해 선발되고 학장의 학생 사무실에서 공식적으로 고용된다. 학생 모듈 공동 책임자가 교수 모듈 책임자와 함께 모듈 검토 회의를 주재합니다. 이사회는 교육과정 위원회에 의해 공식적으로 임명된다. 또한 교수협의회에 소속된 학생대표들은 학부 의학 프로그램의 연구위원인 3명의 학생들을 임명한다.
Figure 1. 
Embedding of student module co-directors into the organizational network for curriculum development at the Charité. All medical students can apply to an open position as a module co-director. They are selected by the group of student module directors and formally employed in the Dean’s office of student affairs. Student module co-directors chair the module review meeting together with faculty module directors. The board is formally appointed by the curriculum committee. In addition, the student representatives who are part of the faculty council appoint the three students who are members of the study committee for the undergraduate medical program.

학생 한 명이 여러 모듈의 학생 모듈 공동 책임자 역할을 수행할 수 있습니다. 학생들의 작업은 매달 모듈당 10시간의 노동시간에 해당하는 유로로 보상된다.
One student can act as a student module co-director for multiple modules. The students' work is compensated with a Euro equivalent of 10 working hours per module each month.

 

방법론적 접근
Methodological approach

우리는 학생들이 모듈 공동 책임자라는 개념에 대해 풍부하고 다층적인 관점을 가질 수 있도록 융합 병렬 설계를 가진 혼합 방법 연구를 채택했다. 순차적 혼합 방법 설계에서 먼저 두 개의 온라인 설문 조사의 등급을 정량적으로 분석하였다. 그런 다음, 정량적 평가 결과를 조명하기 위해 설문 내러티브와 포커스 그룹에 대한 정성적 분석을 실시하였다. 그 자료는 2016/2017년 겨울학기 동안 수집되었다. 본 연구는 안전한 자료관리를 위하여 지방청 및 윤리위원회(제406/16호)의 승인을 받았다. 
We employed a mixed-methods study with a convergent parallel design to allow for a rich and multi-layered view on the concept of students as module co-directors (Creswell 2014). In a sequential mixed method design, we first analyzed quantitatively the ratings of two online surveys. Then, we conducted a qualitative analysis of survey narratives and a focus group to illuminate the quantitative rating results. The data were collected during the winter semester of 2016/2017. This study was approved by the local office for safe data management and by the Ethics Committee (no. 406/16).

설문조사
Surveys

두 건의 익명의 온라인 설문조사는 학생 모듈 책임자와 교수 모듈 책임자를 대상으로 했다. 둘 다 용어의 이해와 정교함을 위해 파일럿 테스트를 받았다. 설문조사는 인구통계학적 특성에 대한 질문 외에도 4점, 5점 만점의 리커트 척도 평가를 활용하였으며, 교육과정의 질적 보장과 개선과정에서 학생모듈 공동책임자의 역할, 기능, 역량에 대한 서술적 의견을 요청하였다(부록 4). 
Two anonymous online surveys were conducted, one for student module directors and one for faculty module directors (EvaSys®, Electric Paper Evaluationssysteme GmbH, Lüneburg, Germany). Both were pilot tested for comprehension and refinement of wording. In addition to questions about demographic characteristics, the surveys employed four- and five-point Likert-scaled ratings, and requested narrative comments about the role, functions, and competencies of student module co-directors in the process of curricular quality assurance and improvement (Supplementary Appendix 4).

포커스 그룹
Focus group

교육과정의 다양한 학기(1~10)와 모듈 유형(기초원리, 질병모형, 임상적용)을 다루기 위해 의도적으로 선정된 8명의 학생모듈 공동책임자를 대상으로 포커스 그룹 토론을 실시하였다. 포커스 그룹 인터뷰는 참가자들과 공식적인 상호 관계가 없는 심리학 학사 학위를 가진 건강 교육 연구원에 의해 진행되었다. 공개 토론 지침을 사용하여 그룹이 주제별 우선순위를 정할 수 있습니다(부록 5). 포커스 그룹 토론의 오디오 녹음은 정확하게 기록되었다.
A focus group discussion was carried out with eight purposively chosen student module co-directors in order to cover different semesters (1–10) and module types (foundational principles, disease models, and clinical application) of the curriculum. The focus group interview was moderated by a health education researcher with a Bachelor degree in psychology who had no formal interrelations with the participants. An open discussion guideline was used, thus allowing the group to set their own thematic priorities (Supplementary Appendix 5). An audio recording of the focus group discussion was transcribed verbatim.

양적, 질적 분석
Quantitative and qualitative analyses

정량조사 자료는 SPSS 22(IBM, Armonk, NY, USA)를 이용하여 기술적으로 분석하였다. 결과는 주파수 및 평균 ± 표준 편차로 표시됩니다. 텍스트로부터 범주를 도출하기 위한 귀납적 접근법을 이용하여 포커스 그룹 인터뷰와 내러티브 설문 의견을 정성적으로 분석하였다. 먼저 저자 LM, TH, HP는 주제별로 자료를 독립적으로 분석했다. 그런 다음, 모호성이 있는 경우 합의를 도출하기 위해 구체적인 인용문이 논의되었다. 이 문서에서 개별 학생의 인용구는 괄호 안에 "s"와 각 학생의 숫자로 표시되며, 교수진의 인용구는 "f"를 사용하여 동일한 방식으로 표시됩니다. 인용문은 저자들에 의해 독일어에서 영어로 번역되었다.
Quantitative survey data were analyzed descriptively using SPSS 22 (IBM, Armonk, NY, USA). Results are expressed as frequencies and mean ± standard deviation. The focus group interviews and narrative survey comments were analyzed qualitatively using an inductive approach for deriving categories from text (Mayring 2014). First, authors LM, TH, and HP independently analyzed the material thematically. Then, specific quotes were discussed to yield consensus in cases of ambiguity. In this article, quotes by individual students are indicated in parentheses with an “s” and the number of the respective student; quotes by faculty are displayed in the same manner by using the letter “f”. Quotes were translated from German to English by the authors.

결과
Results

정량분석
Quantitative analyses

스터디 샘플
Study sample

학생공동감독단에서는 25명 중 23명이 설문에 참여(응답률 92%)했다. 20명은 21~25세, 3명은 26~30세, 13명은 여성(57%)이었다. 평균 학습 시간은 2.5년(±1.4년)이었고, 학생 모듈 공동 책임자로서의 평균 학습 시간은 2년(±1.4년)이었다. 대부분(52%)이 하나의 모듈을 담당했습니다. 
In the group of student co-directors, 23 out of 25 students participated in the survey (92% response rate). Twenty were 21–25 and three were 26–30 years of age, 13 participants were female (57%). Mean study time was 2.5 years (±1.4 years) and mean time as student module co-directors 2 years (±1.4 years). Most (52%) were responsible for one module.

교직원 모듈 책임자 그룹에서는 107명 중 81명(응답률 76%)이 응답했다. 3명은 31~40세, 38명은 41~50세, 35명은 51~60세, 4명은 60세 이상, 26명은 여성(32%)이었다. 32명이 임상의, 22명이 임상 이론 분야, 25명이 기초 과학 분야에서 일하고 있다. 
In the group of faculty module directors, 81 out of 107 responded (76% response rate). Three were 31–40, 38 were 41–50, 35 were 51–60 and four were more than 60 years of age, 26 were female (32%). Thirty-two work as clinicians, 22 in a clinical–theoretical discipline and 25 in basic science.

대부분이 1개 모듈(75%)을 담당했으며 4년 이상 모듈 디렉터로 활동(42%, n=34%)했으며, 1년 미만 모듈 디렉터로 활동한 경우는 2개(3%)에 불과했다. 
Most were responsible for one module (75%) and had been active as a module director for more than 4 years (42%, n = 34); only two (3%) had been active for less than one year.

등급
Ratings

그림 2와 같이, 학생 모듈 공동 책임자의 87%가 교육과정 변화에 큰 영향을 미친다는 데 동의하거나 동의하는 경향이 있으며, 96%는 이것이 교육과정에 긍정적인 영향을 미친다고 생각한다. 대다수는 또한 자신이 다른 모듈 이사들과 동등한 파트너라고 생각합니다(87%가 동의하거나 동의하는 경향이 있음). 65%는 자신들의 생각이 때때로 학생들의 평가 결과와 다르다는 것에 동의하거나 동의하는 경향이 있다. 
As shown in Figure 2, 87% of the student module co-directors agree or tend to agree that they have great influence on curricular change and 96% think this has a positive impact on the curriculum. A majority also feels that they are equal partners of the other module directors (87% agree or tend to agree). Sixty-five percent agree or tend to agree that their ideas sometimes diverge from the student evaluation results.

[교직원 모듈 책임자] 대다수는 학생들이 자신의 교육과정에 기여할 수 있다는 점(93%), 학생 모듈 공동 책임자가 교육과정에 혜택을 준다는 점(94%), 업무가 건설적이라는 점(95%)에 동의하거나 동의하는 경향이 있다. 학생 모듈 공동 책임자ㅇ와 일치하여, 교직원 모듈 책임자의 80%도 학생 모듈 공동 책임자를 동등한 파트너로 본다. 교직원 모듈 책임자의 64%는 자신이 다른 교직원 모듈 책임자와 동일한 영향력을 가지고 있다고 생각하는 반면, 61%는 학생 모듈 공동 책임자보다 교육과정에 더 또는 조금 더 많은 영향력을 가지고 있다고 생각한다.
The majority of faculty module directors agree or tend to agree that students are able to contribute to their curriculum (93%), that the student module co-directors benefit the curriculum (94%) and that their work is constructive (95%). In congruence with the student module co-directors, 80% of faculty module directors also see the student module co-directors as equal partners. While 64% of faculty module directors think that they have the same influence on the curriculum as the other faculty module directors do, 61% think they have more or a little more influence on the curriculum than the student module co-directors do.

그림 3은 [교직원 모듈 책임자]가 활동과 관련된 8개의 서로 다른 영역에서 [학생 모듈 공동 책임자의 역량]을 어떻게 평가하는지 보여줍니다. 대다수의 교직원 모듈 책임자들은 학생 모듈 공동 책임자들이 교육과정에 대한 개요를 가지고 있으며, 학생들의 평가를 해석하고 교육과정 개선을 위한 제안을 제공하며 교사 및 학생들과 소통할 수 있다는 점에 83~96%의 비율로 동의하거나 동의하는 경향이 있다. 적어도 86%는 학생 모듈 공동 책임자들이 타협점을 찾을 수 있다는 것에 동의하는 경향이 있다. 이들은 수업의 질을 평가할 수 있는 능력이 있다고 판단되지만(81%가 동의하거나 동의하는 경향이 있다), 모듈의 분야 관련 내용을 평가할 수 있는 능력이 있다는 데 동의하는 교수 모듈 책임자는 훨씬 적다(49%만이 동의하거나 동의하는 경향이 있다).

Figure 3 shows how faculty module directors rate student module co-directors’ competence in eight different areas related to their activities. The majority of faculty module directors agree or tend to agree at rates between 83 and 96% that the student module co-directors have an overview of the curriculum, and that they are able to interpret students’ evaluation, provide proposals for curricular improvement and communicate with teachers and students. Eighty-six percent at least tend to agree that student module co-directors are able to find a compromise. They are deemed to be competent in assessing the quality of classes (81% agree or tend to agree), but far fewer faculty module directors also agree that they have the competence to assess the discipline-related content of the module (only 49% agree or tend to agree).

정성분석
Qualitative analyses

귀납적 접근법을 이용하여 정량적 조사 결과를 더욱 조명하기 위해 '학생 모듈 공동 책임자가 교육과정에 미치는 영향', '전략', '과제'의 세 가지 주제를 파악하고 선정하였다. 다음은 개인별로 특히 표현적이고 대표적인 인용문을 예시적으로 나열한 것이다. 인용문은 개념에 대한 다양한 인식을 설명해야 한다.
Using an inductive approach, we identified and selected the three themes “influence of the student module co-directors on the curriculum”, “strategies,” and “challenges” to further illuminate the results of the quantitative surveys. In the following, particularly expressive and representative quotes by the individuals are listed in an exemplarily manner. The quotes should illustrate the different perceptions towards the concept.

  1. 학생 모듈 공동 책임자가 교육과정에 미치는 영향. 여기서 세 개의 하위 테마가 인식되었습니다.
    Influence of the student module co-directors on the curriculum.
     Three sub-themes were recognized here.
    1. 커리큘럼에 대한 광범위하고 고유한 지식을 가져옵니다. 주제는 교수 모듈 책임자들이 제시한 인용문으로 가장 잘 특징지을 수 있다. 학생 모듈 공동 책임자는 "모듈에 대한 깊은 지식과 따라서 수업의 개요 및 학습 나선으로의 통합"(f50) 때문에 가치가 있다. 여기에는 "전체 교육과정의 주제 맥락"(f2), "어떤 내용이 이미 가르치고 어떤 수준의 세부사항"(f6), "격차"(f6)와 "중복"(f11), "실제로 나쁜 수업"(f13), "교육 계획과 수업의 현실 사이의 차이"(f13)에 대한 지식이 포함된다. 학생 모듈 공동 책임자는 "시스템에서 수업 내용을 상세히 설명할 수 있는 유일한 사람"으로 간주된다(f65). 학생들은 자신을 "진짜로 이루어지는 교육과정의 전문가"로 본다(s1).
      Bringing in broad and unique knowledge on the curriculum. This theme can best be characterized by the quotes given by the faculty module directors. Student module co-directors are valued because of their “profound knowledge of the module and thus also an overview of the classes and their integration into the learning spiral” (f50). This involves knowledge of “context of topics in the overall curriculum” (f2), “which content has already been taught and at what level of detail” (f6), the “gaps” (f6) and “redundancies” (f11), “didactically bad classes” (f13) and “differences between curricular planning and reality of a class” (f13). The student module co-directors are considered as the “only ones in the system who are able to overview in detail the content of the classes” (f65). Students see themselves as “experts of the curriculum that really takes place” (s1).
    2. 학생들의 관점에 목소리를 내는 것. 교수진과 학생들은 모두 학생 모듈 공동 감독을 "학생들의 대변자"로 본다(s23, f54). 학생 모듈 공동 책임자는 "평가 비율이 낮을 때 특히 중요한 학생들의 피드백을 묶는다"(f2). 그들의 대표성은 다양하게 인식된다. 일부 교수진은 "학생 관점이 관련성 있고 대부분 구체적인 피드백을 제공하는 대표적인 목소리를 얻는다"(f31)고 말하는 반면, 다른 교수진들은 학생 모듈 공동 책임자가 "학생의 관점에서 중요한 피드백"을 제공한다고 말한다. 불행하게도, 항상 대표적인 것은 아니다"(f7).
      Giving the students’ perspective a voice.
       Both faculty and students see the student module co-directors as the “mouthpiece of the students” (s23, f54). The student module co-directors “bundle the feedback from students which is particularly important when evaluation rates are low” (f2). Their representativeness is perceived diversely. While some faculty members state that the “student perspective gains a representative voice that provides relatable and mostly concrete feedback” (f31), others state that student module co-directors contribute “important feedback from the perspective of the students. Unfortunately, not always representative” (f7).
    3. 개선을 위한 아이디어를 제공합니다. 교수 모듈 책임자들은 학생들의 기여와 그들이 기여하는 방식의 몇 가지 측면을 중요시한다. 학생 모듈 공동 책임자는 "창의성과 신선함으로"(f24), "새로운 생각"(f4), "건설적인 비판"(f5)에 기여합니다. 그들은 종종 "중요한 강의 시간의 어려움에 대한 창의적인 해결책"(f69)을 가지고 있다. 학생 모듈 공동 책임자들은 "예산과 직업 관심사로부터 독립적"이라는 장점을 지적한다(s24). 그들은 스스로를 "교육과정이 어떻게 돌아가는지 이해하는 학생"이라고 설명한다. 반면, 교수 모듈 책임자들은 학생들이 "가끔 너무 이상적이고 긍정적으로 사물을 본다"(f21), "조직적 타당성을 보지 않고"(f72), "부족한 인적 자원"(f72)을 표현한다.
      Contributing ideas for improvement.
       Faculty module directors value several aspects of the students’ contribution and the way they contribute. The student module co-directors contribute “with creativity and freshness” (f24), “new thoughts” (f4), and offer “constructive criticism” (f5). They often have “creative solutions for difficulties with critical teaching sessions” (f69). Student module co-directors point out the advantage of “being independent of budget and career interests” (s24). They describe themselves as “students that understand how the curriculum works” (s24). On the other hand, faculty module directors express that the students “sometimes see things too idealistically and positively” (f21), “without looking at organizational feasibility” (f72), and “the scarce personnel resources” (f72).
  2. 학생 모듈 공동 책임자의 전략. 학생 모듈 공동 책임자는 모듈 책임자로서 성공하기 위한 네 가지 핵심 전략을 언급합니다.
    Strategies of the student module co-directors.
     The student module co-directors mention four key strategies for being successful as a module director.
    1. 준비를 잘 해라. "첫 번째는 준비하는 것입니다. 잘 준비해서 사람들을 정말 설득할 수 있을 것 같아요."(s26) 또한 "준비에 더 많은 노력을 기울일수록 제안이 받아들여질 가능성이 높다"(s6). 이는 일반적인 회의 준비를 넘어선 것으로 보인다. 사전에 학생들은 "어떤 주장이 나올 수 있고 어떤 반론이 좋을지에 대한 시나리오를 검토한다"(s24) 그리고 가능하다면 "이미 마음 한구석에 있는 문제에 대한 해결책을 가지고 있다"(s24). 교수 모듈 책임자는 "학생들의 준비 작업을 통해 의사 결정을 포함한 회의가 더 쉽고 빠르게 진행된다"고 보고합니다(f46).
      Be well prepared.
       “The first thing is being prepared. I think you can really persuade people by having prepared well” (s26). Furthermore, "the more effort you invest in preparation, the higher are the chances that your proposal gets accepted” (s6). This seems to go beyond general meeting preparations. In advance, students “go through scenarios about what arguments may come up and what would be good counter arguments” (s24) and, if possible, “have a solution for the problem already in the back of your mind” (s24). The faculty module directors report that “working with the students’ preparations, our meetings – including decision-making – become easier and faster” (f46).
    2. 힘들지만 전략적인 위치를 차지합니다. 예를 들어, 모듈 기획 회의에서 학생 모듈 공동 책임자는 보통 회의록을 작성합니다. "회의록을 작성하는 것은 처음에는 귀찮다고 느낄 수 있지만," "결과가 표현되어야 하는 방식으로 표현되기 때문에" (s24) "이것을 당신 자신의 손에 쥐는 것" (s27)이 유리한 것으로 보인다. 이는 회의록이 "회의에서 합의된 변경사항을 요구할 때 참조할 수 있는 문서"(s24)로 간주되기 때문에 중요하다. 학생들은 그들이 "아무도 그것을 하고 싶어하지 않기 때문에 회의록을 작성한다"(s28)는 것을 알고 있지만, "그들을 좋은 위치에 놓는다"(s8)는 것을 발견한다. 반면에, 교수 모듈 책임자들은 학생들이 "일상적인 과부하 때문에 우리가 하지 않았을 업무 패키지를 자주 인계받는다"(f46)는 것을 높이 평가한다.
      Take over laborious, but strategic positions.
       For instance, student module co-directors usually take over the minutes in module planning meetings. “Writing the minutes, may feel annoying in the beginning” (s24), but it is seen as advantageous, “holding this in your own hands” (s27) “as results are phrased in the way they should be phrased” (s24). This is important as the minutes are seen as “the document one can refer to when demanding the changes that were agreed on in the meeting” (s24). The students are aware that they “write the minutes because nobody else would like to do it” (s28), but find that it “puts them into a good position” (s8). On the other hand, the faculty module directors appreciate that the students “frequently take over work packages, which otherwise would not be done by us because of the daily overload” (f46).
    3. 모듈 계획 그룹에 접근하기 전에 모듈 디렉토리 보드 내에서 합의에 도달합니다. 이것은 수업 내용의 변화와 그 변화를 촉진하기 위한 의사소통 전략에 적용된다. 내용과 관련하여 "변경 제안은 모듈 이사 간에 논의된 후 공동으로 제시하고 최종적으로 승인한다"(f36). 커뮤니케이션 전략과 관련해서는 교직원 모듈 책임자가 주도적으로 나서는 경우도 있다. "우리가 무언가를 결정하면, 모듈 책임자 중 한 명이 '내가 알아서 하겠다'고 말하고, 그나 그녀의 글이 더 무게가 실릴 것이기 때문에, 여러 부서에 이메일을 씁니다."(s29) 다른 상황에서는 학생이 제안된 변화를 주로 전달하는데, "단순히 학생이 중립적인 위치에 있기 때문이다. (s24)".
      Reach a consensus within module directory board before approaching the module planning group.
       This applies to changes in content of classes and the communication strategy to facilitate the change. Regarding content, “proposals for change are discussed among the module directors and then jointly presented and eventually endorsed” (f36). Regarding communication strategy, the faculty module directors take the lead in some cases. “When we have decided on something, one of the module directors says, ‘I will take care of it’, and writes the emails to the various departments, since his or her writing will carry more weight” (s29). In other situations, the student primarily communicates the proposed change, “simply because the student is in a neutral position. (s24)”.
    4. 학생 모듈 공동 책임자 그룹의 지원을 받습니다예를 들어, 학생들은 "집단에 의한 지원, 집단 내 정보 교환 및 자신의 모듈에 있는 문제에 대한 다른 관점의 입력"을 중요시한다(s11). 격주 회의에서 "학생 모듈 공동 책임자 간의 교류는 많은 새로운 아이디어를 만들어 내고 그룹은 생산적으로 협력한다"(s18). 그들의 자율성은 "그룹 내의 좋은 협력과 창의성을 위한 기초"로 간주된다.
      Getting support by the group of student module co-directors.
       For example, the students value “the support by the group, the exchange of information within the group and the input from other perspectives on issues in their own module” (s11). In the biweekly meetings, “the exchange between the student module co-directors produces many new ideas and the group productively works together” (s18). Their autonomy is seen as basis “for the good collaboration and creativity within the group” (s21).
  3. 학생 모듈 공동 책임자가 직면한 과제. 학생 모듈 공동 책임자로서의 업무가 긴장감이 없는 것은 아니다. 도전적인 것으로 인식되는 두 가지 하위 주제가 확인되었다.
    Challenges student module co-directors face.
     The work as a student module co-director is not without tension. Two subthemes were identified that are perceived as challenging.
    1. 위계질서를 다루는 것. 일부 학생들은 "위계에서 더 높은 위치에 있는 사람들을 다룰 때" 토론하고 해결책을 찾는 것을 어려움으로 인식했다(s14). 다른 이들은 "더 높은 순위의 사람들과 대화를 시작하는 것에 대한 자신의 억제력의 감소"를 경험했다(s20). 어떤 경우에는 "일부 교사들이 열심히 노력해서 그것을 해낸다"(s27)는 것처럼 "지렛대가 훨씬 적다"(s21)는 경험을 하기도 있다.
      Dealing with hierarchy.
       Some students perceived it as a challenge to discuss and to find solutions when “dealing with persons having a higher position in the hierarchy” (s14). Others experienced “a drop in one’s own inhibition to start a discourse with higher ranking people” (s20). In some cases, they experience “having much less leverage” (s21), as “some faculty teachers dig in their heels and get through with it” (s27).
    2. 커리큘럼 설계의 협상 과정에 익숙해지는 것. 이것은 변화에 영향을 미치기 위해 필요한 시간과 투자된 노력을 의미한다. 예를 들어, 학생들은 "토론을 멈출 때가 왔을 때 깨달을 필요가 있다"(s27)와 "하고 싶은 모든 것을 실행할 수 없기 때문에 집중하는 것이 중요하다"(s14)를 표현한다. 또한, 학생들은 "과잉 반응하지 말고, 모든 것을 개인적으로 받아들이지 말라"(s24) 또는 "합의에 도달하려면 시간이 필요하다"(s28)는 것을 배워야 했다. 학생들은 "인내력"(s10), "자기 주도성과 지속성을 보여주는 것"(s11), " 좌절 관용"(s10)의 증가에 대해 보고했지만, "기관으로서의 자선단체와 다양한 위원회에 대한 더 많은 감사"(s20), "다른 사람의 일을 처리하는 데 더 많은 존경과 감사를 보여주는 것"(s22)도 보고했다. 
      Getting used to the negotiation process in curriculum design.
       This refers to the time needed and the effort invested in order to affect a change. For instance, students express that they “need to realize when the time has come to stop a debate” (s27) and that it is important to get focused because “one cannot implement everything one would like to” (s14). In addition, students had to learn “not to overreact, not to take everything personally” (s24) or that “reaching consensus needs time” (s28). Students reported on increases in “endurance” (s10), “showing self-initiative and persistence” (s11) and “frustration tolerance” (s10), but also “more appreciation for the Charité as an institution and its various committees” (s20) and being “more respectful and showing more appreciation in dealing with the work of others” (s22).

논의
Discussion

본 연구는 의대생들을 교과과정 개발의 순환과정에 적극적으로 참여시키기 위한 새로운 실천모형을 보고하고 연구한다. 우리는 교직원 모듈 책임자와 학생 자신 모두 모듈 공동 책임자로서의 학생들의 개념, 즉 교육과정에 대한 역할, 기능 및 이점에 대한 그들의 경험을 긍정적으로 평가한다는 것이다. 우리의 혼합 방법 접근법은 모듈 공동 책임자로 기능하는 학생들의 여러 측면과 그들의 전략 및 그들이 직면한 과제를 깊이 조명한다. 다음에서는 문헌에 비추어 우리의 발견이 시사하는 바에 대해 논의할 것이다. 
The present study reports on and researches a new practice model for actively engaging medical students in the cyclic process of curricular development. We found that both faculty module directors and the students themselves positively rate their experience with the concept of students as module co-directors, i.e. their role, functions and benefits to the curriculum. Our mixed-methods approach profoundly illuminates the multiple facets of students who are functioning as module co-directors and their strategies and the challenges they face. In the following, we will discuss the implications of our findings in light of the literature.

교직원과 학생 모두 모듈 공동감독으로 일하는 학생들이 교육과정에 도움이 된다고 지적한다. 교육과정에 대한 광범위하고 독특한 지식을 끌어내고 학생들의 평가를 종합하여 잘 배치된 학생 중심의 교육과정 개선 제안서로 번역하는 학생들의 능력은 그런 점에서 중요한 것으로 보인다. 따라서, 모듈 공동 책임자로서의 학생의 개념은 학생들이 자신의 아이디어와 개념을 도입하고 의사결정 과정에 직접 참여함으로써 학생들을 [고전적인 반응적 역할], 즉 교육된 커리큘럼 평가에서 [능동적 역할]로 이동시킨다(Daese et al. 2015). 그들의 작업은 커리큘럼 평가와 혁신을 밀접하게 연결하고 [진행 중인 커리큘럼 검토 및 개선의 주기를 닫는 데 도움]이 된다. 이 개념은 또한 학생들이 배우는 것에 영향을 미칠 뿐만 아니라 받는 가르침에 영향을 미치는 자기 주도 학습의 보다 발전된 모델(Visser et al. 1998)로 볼 수 있다.
Both faculty and students point out that students working as module co-directors benefit the curriculum. Students’ ability to bring in a broad and unique knowledge of the curriculum and translate the syntheses of the students’ evaluation into well-placed, student-oriented proposals for curricular improvement seems to be instrumental in this regard. Thereby, the concept of students as module co-directors moves the students from the classical reactive role, i.e. evaluating the taught curriculum, to a pro-active role by bringing in their own ideas and concepts and being directly involved in decision making processes (Dhaese et al. 2015). Their work closely links curriculum evaluation with innovation and helps to close the cycle of ongoing curriculum review and improvement. The concept may also be seen as a more advanced model of self-directed learning (Visser et al. 1998), where students not only have influence on what they learn, but also have an influence on the teaching they receive.

교수진과 학생들은 함께 학생 모듈 감독을 [학생들의 대변자]로 보고 있다. 그럼에도 불구하고, 두 그룹 모두 개별 학생 모듈 공동 책임자의 의견이 전체 학생 단체를 완전히 대표하는 것은 아니라는 것을 알고 있다. 세계의 다른 많은 곳과 마찬가지로, 우리 기관의 평가 참여는 자발적이며 응답률이 다소 낮다(Bosch et al. 2017). 학생 모듈 공동 책임자는 구두 학생 피드백 세션, 모듈의 학생들과의 대화 및 학생 모듈 공동 책임자 그룹의 다른 구성원들과 같은 다수의 질적 출처와 이용 가능한 정량적 학생 피드백을 합성하여 이에 대처하려고 한다. 이러한 어려움에도 불구하고 학생 모듈 공동 책임자는 학생들의 피드백과 아이디어를 모듈 리뷰에 충분히 반영하여 모듈의 커리큘럼 개선을 실질적으로 추진하는 것으로 보인다.
Faculty and students together see the student module director as a mouthpiece of the students. Nevertheless, both groups are aware that the opinion of the individual student module co-director may not be fully representative of the whole student body. Similar to many other places around the world, participation in evaluation in our institution is voluntary and the response rate is rather low (Bosch et al. 2017). The student module co-directors try to cope with this by synthesizing the available quantitative student feedback with a number of qualitative sources such as the oral student feedback session, conversations with students from the module and other members of the group of student module co-directors. Despite these difficulties, the student module co-directors seem to bring in enough students' feedback and ideas into the module reviews and thereby to substantially drive the curriculum improvement of the modules.

모듈 디렉터로서의 역할과 기능에 관해서는 교직원과 학생 모듈 디렉터는 서로를 동등한 파트너로 봅니다. 이것은 그들이 같은 전문지식을 가지고 있고 업무를 균등하게 분배한다는 것을 의미하지 않는다. [학생들의 강점] 중 하나는 ['실행 중인 교육과정'에 대한 독특한 시각]인 반면, [교직원 모듈 디렉터]들의 강점은 [교육과정의 분야 관련 내용]에 있다. 따라서 교직원과 학생 모듈 책임자는 모듈 검토 및 개선 과정에서 효과적으로 협력하는 다양한 기술과 전문 분야를 가진 개인으로 구성된 팀을 구성합니다. 여기에는 모듈 내용 및 구성에 대한 공동 책임과 커리큘럼 변경에 대한 공동 의사 결정이 포함됩니다. 이 작업이 항상 긴장감이 없는 것은 아니지만, 일반적으로 [학생들과 교수 모듈 책임자들 사이의 대화]가 [서로 분야가 다른 교수진들 사이에서의 대화]보다 분명히 덜 강렬하다는 것을 우리가 발견한 것은 흥미로웠다.
With regard to their role and function as module director, faculty, and student module directors see each other as equal partners. This does not mean that they possess the same expertise and distribute the tasks equally. One strength of the students is their unique perspective on the “curriculum in action”, while the faculty module directors’ strength lies in the discipline-related contents of the curriculum. Thus, faculty and student module directors form a team of individuals with varied sets of skills and areas of expertise which works effectively together in the process of module review and improvement. This involves shared responsibility regarding the module content and organization and shared decision-making in curricular change. This work is not always without tension, but it was interesting for us to see that in general discourses between students and faculty module directors were apparently less intense than those seen among faculty members of different disciplines.

학생 모듈 공동 책임자가 되는 연습은 학생들이 그들의 일을 효과적으로 하기 위해 몇 가지 전략을 채택하도록 이끌었다. 특히 교육 위원회에서 우리가 학술 위원회의 일원인 사람들에게, 성공 전략은 좋은 준비, 힘들고 전략적인 위치를 차지하고, 다른 주요 그룹과 사전에 동의를 찾고, 동료 커뮤니티로부터 지지를 받는 것을 포함하는 것은 놀라운 일이 아닐 수 있다. 학생들이 인식하는 도전도 마찬가지다. [커리큘럼 설계와 개선에 참여하는 교수들]은 [위계구조를 경험하고 다루는 것]과 [변화를 이루기 위해서는 노력과 시간이 필요하다는 것]을 잘 알고 있다. 모듈 공동 책임자인 학생들은 [학계에서 적극적인 역할을 하기 위해 빠르게 배우는 것] 같다. 이를 따른다면, 이 개념은 [커리큘럼 설계와 개선의 공동 창조에서의 공유 거버넌스 모델]을 의미한다(Boland 2005; Bovill et al. 2009). 학생들의 역할은 "이해관계자", "고객 또는 소비자", 또는 단순히 "시스템의 산물"을 넘어선다(Boland 2005). 그들의 역할은 [학문적 민주주의의 이상이 실천되고 배양되는 학문 공동체에서 공식적인 구성원]이 되는 것으로 바뀐다(Boland 2005). 
The practice of being a student module co-director has led students to adopt several strategies to do their work effectively. For those of us being a member of academic committees, especially in educational committees, it may not be surprising that success strategies involve good preparation, taking over laborious, strategic positions, finding consent in advance with other key groups and getting support from their peer community. The same applies to the challenges which students perceive. Experiencing and dealing with hierarchy and the efforts and time it takes to achieve changes are all well known by faculty members involved in curricular design and improvement. It seems that the students as module co-directors learn quickly to play an active role in the academic community. Along this line, the concept implies a model of shared governance in the co-creation of curriculum design and improvement (Boland 2005; Bovill et al. 2009). The role of students goes beyond being a “stakeholder”, a “client or consumer,” or just a “product of the system” (Boland 2005). Their role changes to being a formal member in the academic community, where the ideal of academic democracy is practiced and cultivated (Boland 2005).

우리의 결과를 해석할 때 커리큘럼 맥락을 고려해야 한다. 교육과정의 통합적 성격과 최근의 시행은 학생들을 모듈 공동 책임자로 두는 긍정적인 인식에 기여했을 것이다. 통합 학부 의료 프로그램은 상당한 복잡성을 수반한다(Stodard et al. 2016; Maaz et al. 2018). 새로운 통합 프로그램을 구현하기 전에, 우리의 이전 학부 교육과정은 전통적인 학문 기반 방식으로 구성되었으며, 요소 간의 상호작용이 제한적이고 감독의 필요성이 거의 없었다. 게다가, 대부분의 교직원들은 그들 자신이 학생이었을 때 비슷한 프로그램을 경험했다. 이것은 그들에게 그러한 커리큘럼에 대한 개요와 이해를 제공했다. 우리 기관의 주요 개혁으로 프로그램은 수많은 수평 및 수직 상호 연결을 가진 통합되고 복잡한 시스템으로 전환되었다(Maaz 등 2018). 문제는 오늘날의 많은 교직원들이 학생 시절에 이러한 새로운 커리큘럼을 경험하지 못했다는 것이다. 모듈 디렉터로 근무할 때, 그들은 아마도 그들의 부서와 분야의 기여가 전체 교육 프로그램에 어떻게 들어맞는지, 그리고 단일 수업의 변화가 교육과정의 다른 부분과 학생들의 학습 결과에 어떻게 잠재적으로 영향을 미칠 수 있는지 상상하기 어려울 것이다. 우리는 이러한 격차가 학생 모듈 공동 책임자와의 협업에 의해 쉽게 해소된다고 가정하며, 이는 결국 이 개념에 대한 교직원의 긍정적인 반응에 중요하다. 
The curricular context has to be taken into account in the interpretation of our results. The integrated nature of the curriculum and its recent implementation may have contributed to the positive perception of having students as module co-directors. Integrated undergraduate medical programs involve a substantial complexity (Stoddard et al. 2016; Maaz et al. 2018). Before implementation of the new, integrated program, our former undergraduate curriculum was organized in a traditional, discipline-based manner, with limited interactions between its elements and little need for oversight. In addition, most faculty teachers have gone through a similar program when they were students themselves. This provided them with an overview and understanding of such curricula. With the major reform at our institution, the program was transformed into an integrated, complex systems with numerous horizontal and vertical interconnections (Maaz et al. 2018). A problem is that many of today’s faculty members did not experience these new curricula as students. When serving as a module director it is probably difficult for them to envision how the contribution of their departments and disciplines fits into the whole educational program and how change in a single class may potentially affect other parts of the curriculum and the students’ learning outcome. We assume that this gap is closed easily by the collaboration with student module co-directors, which in turn is important for the positive response by faculty members to this concept.

이 연구는 한계가 있다. 단일 센터 환경을 나타냅니다. 지역적 맥락, 새로 구현된 커리큘럼 및 프로그램의 통합 특성은 다른 맥락으로의 이전 가능성을 제한할 수 있다. 우리의 연구는 교수 모듈 책임자가 있는 포커스 그룹을 포함하지 않았다. 교수모듈국장 설문조사의 229개 내러티브는 그들의 인식에 대한 질적 통찰력을 도출할 수 있는 실질적인 자료를 제공하였다. 우리는 예를 들어 전체 학생이나 교직원과 같은 우리 기관에 관련된 다른 그룹의 인식을 조사하지 않았다. 이러한 한계는 우리와 다른 의대에서 이 분야의 추가 연구를 위한 로드맵 또는 영감으로 보일 수 있다.
This study has limitations. It represents a single center experience. The local context, the newly implemented curriculum and the integrated nature of the program may limit transferability to other contexts. Our study did not involve a focus group with faculty module directors. The 229 narratives in the faculty module director survey provided substantial material to derive qualitative insights into their perceptions. We did not investigate the perception of other groups involved at our institution, for instance, the whole student or teaching body. These limitations may be seen as a roadmap or inspiration for further research in this area in our and other medical schools.

결론적으로, 본 논문은 학부 의학 교육과정의 지속적인 개발 과정에서 학생들의 참여를 위한 새로운 모델을 소개한다. 이 모델을 실천하는 것은 교수진과 학생 모듈 책임자 모두에게 긍정적으로 경험됩니다. 교육과정의 결과적인 개선은 학생들과 기관의 이익을 위한 것이다. 우리의 보고서는 다른 의학부들이 학생들을 커리큘럼 개발과 학생 참여의 다른 주요 영역에서 공동 책임자로 공식적으로 참여하도록 장려할 수 있다. 
In conclusion, this article introduces a new model for student engagement in the continuous development process of an undergraduate medical curriculum. Practicing this model is experienced positively by both faculty and student module directors. The resulting improvements of the curriculum are for the benefit of the students and the institution. Our report may encourage other medical faculties to formally engage their students as co-directors in curriculum development as well as in other key domains of student engagement.

 

 


Med Teach. 2019 Oct;41(10):1143-1150. doi: 10.1080/0142159X.2019.1623385. Epub 2019 Jun 16.

Student engagement in medical education: A mixed-method study on medical students as module co-directors in curriculum development

Affiliations collapse

Affiliation

1Dieter Scheffner Center for Medical Education and Educational Research, Dean's Office of Student Affairs, Charité - Universitätsmedizin Berlin , Berlin , Germany.

PMID: 31203695

DOI: 10.1080/0142159X.2019.1623385

Abstract

Introduction: Beyond participation in evaluation of teaching, there is sparse research available on more active roles of medical students in curriculum development. We report on a model of student engagement where medical students function as module co-directors, and how this is experienced by faculty and student module directors. Methods: Student engage in co-development of their curriculum with a high level of autonomy in organizing their activities. We conducted a mixed-methods, convergent design study based on surveys with faculty and student module co-directors and a student co-director focus group. Quantitative data were analyzed descriptively. Qualitative analysis was performed inductively. Results: Quantitatively, the majority of both faculty and student module directors report that the curriculum benefits from the students' work (95 and 94%). Both groups see each other as equal partners (80 and 87%). Qualitatively, this is related to students' competencies such as "bringing in broad and unique knowledge of the curriculum", "giving the students' perspective a voice," and "contributing ideas for improvement". Key strategies and challenges of the student co-module directors are illuminated. Conclusions: Student module co-directors represent a well-accepted practice model for curriculum development. This report may stimulate other faculties to engage their students more actively in medical education.

교육혁신을 구축-측정-학습으로 빠르게 평가하기: 린 스타트업을 보건의료전문직 교육에 적용하기 (Med Teach, 2022)
Evaluating education innovations rapidly with build-measure-learn: Applying lean startup to health professions education
David A. Cook, Abhishek Bikkani & M. Jeannie Poterucha Carter

 

 

서론
Introduction

교육자는 항상 혁신합니다. 교육 혁신의 예로는

  • 기존 과정의 새로운 교육 활동(예: 온라인 모듈, 그룹 토론, 수업 전 비디오 또는 인공지능 적응형 학습 인터페이스),
  • 평가에 대한 새로운 접근 방식(예: 학생이 절차적 과제에 대한 성과를 직접 기록),
  • 커리큘럼 내에서의 새로운 과정 또는 관리 절차 (예: 로테이션 성적 제출 또는 데이터 웨어하우스의 개발 및 사용을 위한 온라인 도구) 또는
  • 완전히 새로운 커리큘럼 내의 요소.

물론, 어떤 아이디어들은 다른 아이디어들보다 더 잘 작동한다. 유지할 혁신과 중단할 혁신을 선택하는 것은 유익성, 비용 및 단점과 관련된 경험적 증거를 이상적으로 기반으로 한다. 그러나 전통적인 연구 방법의 답은 종종 혁신 평가를 시기적절하고 의미 있는 방식으로 안내하기에는 너무 늦고 너무 드물게 나타난다. 예를 들어, e-러닝 및 시뮬레이션과 같은 교육 기술을 사용하는 혁신은 현재 특히 흔하지만, 이러한 기술은 매우 빠르게 발전하여 일반적인 교육 연구 연구를 수행하는 데 걸리는 시간(12~18개월) 동안 현대 스마트폰은 두 가지 디자인 '세대'를 거치게 될 수 있다. 혁신자들은 어떻게 따라갈 수 있을까?
Educators innovate all the time. Examples of educational innovations include

  • new instructional activities in an existing course (e.g. an online module, group discussion, pre-class video, or artificial intelligence adaptive learning interface),
  • novel approaches to assessment (e.g. students self-recording their performance on a procedural task),
  • new courses or administrative procedures within a curriculum (e.g. an online tool for submitting rotation grades, or development and use of a data warehouse), or
  • an entirely new curriculum.

Of course, some ideas work better than others. Choosing which innovations to sustain and which to stop is ideally based on empiric evidence regarding benefits, costs, and disadvantages. Yet the answers from traditional research methods often come too late and too infrequently to guide innovation evaluations in a timely and meaningful way. For example, innovations using educational technologies such as e-learning and simulation are particularly common at present, yet these technologies evolve so rapidly that in the time it takes to conduct a typical education research study (12–18 months), a modern smartphone might go through two design ‘generations.’ How can innovators keep up?

혁신 평가에 대한 '린 스타트업' 접근법은 전통적인 연구에 대한 유용한 대안을 제공한다. 이 접근법은 첨단 소프트웨어 시장에서 혁신의 개발과 생존에 기원을 두고 있지만, 그 이후 산업과 군대를 포함한 인터넷 기반 사업과 '전통적' 사업 모두에 널리 적용되어 왔다. 창안자(기업가)는 (적어도 서류상 또는 이사회에서) [좋게 들리는 아이디어]에서 [수익성 있는 비즈니스 모델]로 빠르게 전환하도록 촉진하기 위해 이 프로세스를 만들었습니다. 기업가들과 그들의 자금 제공자들은 제한된 시간과 자원을 고객의 요구를 충족시키는 데 효과적이고, 실행 가능하고, 지속 가능한(수익성) 아이디어에 사용할 강력한 인센티브를 가지고 있다. 그리고 그렇지 않은 아이디어들을 가능한 한 빨리 버려야 한다. [린 스타트업 접근 방식]은 짧은 평가 및 수정 주기를 사용하여 중요한 가정을 테스트하고 효과가 있는 모델에 빠르게 수렴하고 실행 불가능한 아이디어를 버린다. 신제품 제작 도구(예: 게시, 웹 사이트 제작, 게임 디자인 및 3D 인쇄용 도구)가 널리 보급되어 있다는 점을 감안할 때, 현대의 초점은 제품을 효율적으로 [구축하는 것building]이 아니라 고객이 원하고, 사용하고, 실제로 지불할 제품에 대해 [배우는 데learning] 있습니다. 실제로 '학습 속도가 새로운 불공평한 장점'이다(Maurya 2022).
The ‘Lean Startup’ approach to innovation evaluation offers a useful alternative to traditional research. This approach has its origins in the development and survival of innovations in the fiercely-competitive market of high-tech software, although it has since been widely applied to both Internet-based and ‘traditional’ businesses including industry and the military. The originators—business entrepreneurs—created this process to promote rapid transition from ideas that sound good (at least on paper, or in the board room) into profitable business models. Entrepreneurs and their funders have strong incentives to channel limited time and resources to ideas that are effective in meeting customer needs, practicable, and sustainable (profitable); and abandon as quickly as possible ideas that are not. The Lean Startup approach uses short cycles of evaluation and revision to test critical assumptions and rapidly converge on a model that works, and discard nonviable ideas. Given widespread availability of tools to build new products (e.g. tools for publishing, website creation, game design, and 3D printing), the contemporary focus is not on efficiently building a product but on learning about the product that customers want, use, and will actually pay for. Indeed, ‘Speed of learning is the new unfair advantage (Maurya 2022).

교육 혁신은 기업가적인 벤처이며, 상업적인 비즈니스 스타트업은 유망한 아이디어를 신속하게 식별하고 다듬는 린 스타트업 방법의 혜택을 받을 것이다. 그러나 린 스타트업 접근법은 교육에서 거의 주목을 받지 못했다. '린 스타트업'에 대한 PubMed 검색 결과, 혁신 보고서의 일환으로 린 스타트업 방법론을 간략하게 설명한 교육 중심 기사(Kaylan et al. 2021)가 1건만 공개됐다. 구글이 'Lean Startup Education'을 검색한 결과 다수의 블로그 게시물, 한 가지 방법 중심 기사(LeMahieu et al. 2017b), 박사 논문(Tran 2015)이 나타났다.
Education innovations are entrepreneurial ventures, and like a commercial business startup would benefit from Lean Startup methods to rapidly identify and refine promising ideas. Yet the Lean Startup approach has received little attention in education. A PubMed search for ‘Lean Startup’ revealed only one education-focused article (Kaylan et al. 2021) that briefly outlined the Lean Startup methodology as part of an innovation report. A Google search for ‘Lean Startup Education’ revealed a number of blog posts, one method-focused article (LeMahieu et al. 2017b), and a doctoral thesis (Tran 2015).

이 글의 목적은 린 스타트업의 역사와 주요 원칙을 개괄하고, 이를 보건 전문직 교육에 적용하고, 우리의 개인적인 경험을 활용하여 설명하는 것이다. 주요 청중은 보건 전문 교사들이다. 교육 관리자, 연구자 및 기업가들은 또한 이 접근법이 유용하다는 것을 알게 될 것이다. 
The purpose of this article is to outline the history and key principles of Lean Startup, apply these to health professions education, and illustrate these using our personal experience. The primary audience is health professions teachers. Education administrators, researchers, and business entrepreneurs will also find this approach useful.

교육자는 기업가이고, 혁신 팀은 스타트업입니다.
Educators are entrepreneurs, innovation teams are startups

[기업가]의 한 가지 정의는 '대개 상당한 진취성과 위험을 지닌 모든 기업을 조직하고 관리하는 사람'이다. 대부분의 교육 혁신가들은 스스로를 조직자이자 창시자로 인식하겠지만, 그들은 정말 위험을 감수하는 사람들일까? 교육 혁신의 위험은 벤처 캐피털 투자를 수반하지 않을 수 있지만, 그럼에도 불구하고 위험은 사소하지 않다.

  • 첫째로, 혁신의 개발과 구현은 혁신자와 그 팀의 시간과 자원의 헌신을 요구한다.
  • 둘째, 기술혁신을 사용하는 것은 사용자(학습자 또는 기타 교육자)에 의한 투자도 포함한다:
    • 시간과 자원의 투자(예: 기회 비용)와
    • 기술혁신이 실제로 의도한 대로 작동하는 신뢰의 투자(예: 이러닝 모듈이 그들을 임상실습을 위해 적절하게 준비할 것이다).
  • 셋째, 일부 혁신은 학교나 프로그램의 인증 상태에 영향을 미칠 것이다.
  • 마지막으로, 혁신자의 명성은 위태롭습니다. 실패한 혁신은 이력서에 좋지 않을 수 있습니다.

One definition of entrepreneur (www.dictionary.com) is ‘a person who organizes and manages any enterprise, usually with considerable initiative and risk.’ Most education innovators will recognize themselves as organizers and initiators, but are they really risk-takers? Risk in education innovation may not involve a venture capital investment, but risks are nonetheless non-trivial.

  • First, the innovation’s development and implementation requires a commitment of time and resources by the innovator and their team.
  • Second, using the innovation involves investments by users (learners or other educators) as well:
    • investments of time and resources (i.e. opportunity costs), and
    • investment of trust that that the innovation actually works as intended (for example, that an e-learning module will adequately prepare them for clinical practice).
  • Third, some innovations will impact a school or program’s accreditation status.
  • Finally, the innovator’s reputation is on the line: a failed innovation might not look good on one’s curriculum vitae.

[스타트업]은 '극도의 불확실성 조건 하에서 새로운 제품과 서비스를 창출하도록 설계된 인간 기관'으로 정의되어 왔다(Ries 2011). 이러한 기준을 충족할 수 있는 다양한 기관 중에는 혁신자와 협력하여 아이디어를 실현하는 교육 혁신 팀이 있습니다. 교육 혁신은 확실히 '불확실성이 있는 조건'이다. 예를 들어, 전공의 정오 회의를 재설계하려면 다음과 같은 수많은 우선 순위를 균형 있게 조정해야 한다.

  • 전공의의 실제 학습 요구 충족(이전보다 더 효과적으로 개선됨), 
  • 현상 유지를 원하는 교직원의 기분을 상하게 하지 않고, 
  • 지원 직원을 압도하지 않으며, 
  • 인증 요구 사항을 충족하며, 
  • 관리자들을 행복하게 하고, 
  • 제한된 시간과 리소스로 이를 달성합니다. 

어떻게 이런 일이 일어날 수 있을까요? 그것은 불확실합니다!

A startup has been defined as, ‘A human institution designed to create new products and services under conditions of extreme uncertainty’ (Ries 2011). Among the various institutions that might meet these criteria is the education innovation team—those working with the innovator to bring their ideas to fruition. An educational innovation certainly represents a ‘condition of uncertainty.’ For example, a redesign of resident noon conferences would require balancing numerous priorities:

  • meeting residents’ real learning needs (hopefully more effectively than before),
  • avoiding offending faculty members who want to maintain the status quo,
  • not overwhelming the support staff,
  • meeting accreditation requirements,
  • keeping administrators happy, and
  • accomplishing this with limited time and resources.

How can this happen? It is uncertain!

우리의 목적을 위해, 우리는 '제품'이라는 용어를 매우 폭넓게 정의하며, 기본적으로 [모든 교육 활동이나 혁신]을 포함합니다.
For our purposes, we define the term ‘product’ very broadly—encompassing essentially any educational activity or innovation.

또한 우리는 '고객'이라는 용어를 혁신자가 해결하려고 하는 문제를 실제로 물건을 구매하는지 여부에 관계없이 폭넓게 정의합니다. 교육 고객은 일반적으로 학습자이지만 다른 이해관계자(교사, 관리자, 환자, 연구원)도 포함될 수 있다. 일반적인 사업에서 고객은 제품과 공급업체 중에서 선택한 후 제품을 구매합니다. 때때로 이것은 학생이 대학, 선택 과정, 지속적인 교육 활동, 교과서 또는 온라인 자원 구독을 선택할 때 교육에서도 마찬가지이다. 또는 관리자가 온라인 학습 관리 시스템 또는 표준화된 테스트를 선택할 때에도 그렇다. 그러나 일반적으로 교육 고객은 의식적으로 특정 제품을 선택하거나 구입하지 않습니다. 일단 레지던트 프로그램에 연결되면 대학원 의사는 훈련과 환자 치료 활동을 거의 통제할 수 없습니다. 
일단 과정에 등록하면, 학생들은 일반적으로 교육이 매일 어떻게 진행되는지 선택하지 않는다. 그럼에도 불구하고 학습자와 기타 이해관계자를 고객으로 보는 것은 비금전적 투자(시간, 정신적 에너지)와 암묵적 옵션(지시적 격차, 필요, 욕구, 우선순위, 혁신, 솔루션, 개입 및 다른 상황에서 선택을 제시할 수 있는 대안)에 주의를 집중한다면 도움이 될 수 있다.

We also define the term ‘customer’ broadly, as anyone whose problem the innovator is trying to solve—regardless of whether anyone actually buys anything. The customer in education is usually the learner, but could also include other stakeholders (teachers, administrators, patients, researchers). In a typical business a customer purchases a product after choosing among products and suppliers. Sometimes this is also true in education, as when a student chooses a university, an elective course, a continuing education activity, a textbook, or an online resource subscription; or when an administrator chooses an online learning management system or standardized test. Commonly, however, education customers don’t consciously choose or purchase a specific product: once attached to a residency program, postgraduate physicians have little control over training and patient care activities; once enrolled in a course, students don’t typically choose how instruction proceeds day by day. Nonetheless, viewing learners and other stakeholders as customers can be helpful if it focuses attention on non-monetary investments (time, mental energy) and implicit options (instructional gaps, needs, wants, priorities, innovations, solutions, interventions, and alternatives that could present a choice under other circumstances).

린 스타트업 접근 방식
The lean startup approach

내역 및 개요
History and overview

에릭 리스는 2000년대 후반에 소프트웨어 회사를 공동 설립하면서 '린 스타트업'의 아이디어를 개발했으며, 자신의 경험을 앞서 설명한 두 가지 개념과 결합했다(Ries 2011).

  • 컨셉 1은 도요타의 '린 제조'(Womack et al. 2007)로, [제조 공정에서 낭비를 전략적으로 제거하는 데 중점]을 두고 있다. 그리고 제품이 사전에 완전히 명시되지 않고 짧고 반복적인 주기로 개발되고 정제되는 소프트웨어 산업의 '애자일 개발'의 보완적 개념(Beck et al. 2001). 
  • 컨셉 2는 Steve Blank의 '고객 개발' 아이디어입니다(Blank 2013, 2020). [고객의 니즈를 이해하고 대응하는 것]이 엔지니어링 및 제품 개발보다 더 중요하다는 것을 의미합니다. 

Eric Ries developed the idea of the ‘Lean Startup’ while co-founding a software company in the late 2000s, merging his own experiences with two previously-described concepts (Ries 2011).

  • Concept 1 is Toyota’s ‘lean manufacturing’ (Womack et al. 2007), which focuses on strategically eliminating waste in a manufacturing process; and the complementary concept of ‘agile development’ (Beck et al. 2001) from the software industry in which products are developed and refined in short, repeated cycles rather than being fully specified up-front.
  • Concept 2 is Steve Blank’s idea of ‘customer development’ (Blank 20132020)—that understanding and responding to customer needs (sources of ‘pain’) are more important than engineering and product development.

[린 스타트업의 핵심 전제]는 다음과 같다.

  • 모든 새로운 벤처(우리의 경우 교육 혁신을 포함)가 성공하는 방법을 배워야 한다.
  • 학습은 경험적 데이터에 기반해야 한다,
  • 이러한 데이터는 '사무실 밖으로 나가기'와 고객과의 상호작용을 통해 가장 잘 얻어낸다.

The central premises of the Lean Startup are

  • that any new venture (including, in our case, education innovations) must learn how to be successful,
  • that learning must be based on empiric data, and
  • that these data are best obtained by ‘getting out of the office’ (Blank 2020) and interacting with customers.

린 스타트업 접근 방식은 혁신가들이 아이디어를 기능성 제품으로 전환하고, 고객이 어떻게 반응하는지 측정하고, 이러한 결과로부터 학습하여 제품을 개선한 다음, 이 사이클을 반복하도록 지원합니다(이상적으로 여러 번, 그리고 빠르게). 중요한 것은 초기 제품이 잘 개발되어서는 안 된다는 것입니다. 오히려, 아이디어를 미리 완성하려는 모든 노력은 시간과 자원의 낭비이기 때문에 거의 기능적이지 않아야 합니다('최소한의 실행 가능한 제품'). 핵심은

  • 가능한 한 빠르고 빈번하게 주기를 반복하여
  • 고객의 요구를 더 잘 이해하고 응답하도록 제품을 반복적으로 수정하고,
  • 이로서 제품 아이디어를 고객이 실제로 사용할 수 있는 것으로 신속하게 다듬는 것입니다(이는 혁신자가 처음에 구상한 것과 상당히 다를 수 있음).

The Lean Startup approach helps innovators turn their idea into a functional product, measure how customers respond, learn from these results to refine the product, and then repeat this cycle (ideally multiple times, and rapidly). Importantly, the initial product need not—in fact, should not—be well-developed. Rather, it should be barely functional (a ‘minimal viable product’), because any efforts to perfect the idea up-front are a waste of time and resources. The key is

  • to repeat the cycle as quickly and as frequently as possible,
  • iteratively revising the product to better understand and respond to customer needs, and
  • thus rapidly refine the product idea into something that customers will actually use (which may be quite different from what the innovator initially envisioned).

린 스타트업은 실제로 [특정 영역에 초점을 둔 과학적 방법의 응용]일 뿐이며, 실용적인 시간에 민감한 문제로 용도 변경되었다(Ries 2011).
Lean Startup is really just a focused application of the scientific method, repurposed to a practical time-sensitive problem (Ries 2011).

5대 원칙
Five key principles

Ries(2011)는 린 스타트업의 5가지 핵심 원칙을 개략적으로 설명합니다. 첫째, 기업가들은 어디에나 있다. 위에서 언급했듯이, 교육 혁신가들은 기업가이고, 그들의 팀은 스타트업이다.
Ries (2011) outlines five core principles of the Lean Startup. First, entrepreneurs are everywhere. As noted above, education innovators are entrepreneurs, and their teams are startups.

둘째, 기업가정신은 경영이다. 스타트업은 '단순한 상품이 아니라 기관'이며 효과적인 관리가 필요하다. 핵심 혁신자인 팀 리더는 벤처 기업을 관리하고 팀에 책임을 물을 준비가 되어 있어야 합니다.
Second, entrepreneurship is management
. A startup ‘is an institution, not just a product’ and requires effective management. The team leader—the key innovator—must be prepared to manage the venture and hold the team accountable.

셋째, 스타트업은 고객에 대해 학습한 것을 검증할 필요가 있다. 스타트업(즉, 혁신 팀)의 목적은 [학습하는 것]이지 반드시 제품을 구축하거나 고객의 요구를 충족하기 위한 것은 아닙니다. Ries는 혁신자들이 효과적이고 지속 가능한 제품과 사업을 구축하는 방법(즉, 무엇을 구축해야 하는지)을 배울 필요가 있다고 주장한다. 만약 그들이 배움learning 대신 스스로의 구축building하는 데 초점을 맞춘다면 그들은 결국 실패할 것이다. 학습은 혁신자들이 그들의 기본 가정과 비전을 경험적으로 시험할 수 있게 하는 실험을 필요로 한다.—비즈니스 모델을 'de-risk'하는 것이다. 교육 환경에서, 이는 새로운 과정 아이디어를 도입하기보다는, 혁신 팀이 [변화가 정말로 필요한지 여부를 결정하는 데 집중]하도록 장려한다는 것을 의미합니다. 그리고 변화의 필요가 당연하자면warranted, 코스 개발에 [반복적인 '지속적인 품질 개선' 접근법]을 채택해야 한다. 학습자가 정말로 필요로 하는 것(현재 어떤 gap이 존재하는가, 학습자가 무엇을 실제로 사용할 것인가, 무엇이 학습 결과를 실제로 최적화할 것인가)을 파악하는 데 초점을 맞춥니다. 마우리아가 말했듯이, '인생은 아무도 원하지 않는 것을 만들기에는 너무 짧다'(Maurya 2012). 혁신의 [지속가능성]과 [확장성] 또한 테스트되어야 합니다. 새로운 고객들(예: 내년 또는 다른 기관의 학생)이 그것을 사용할 수 있을까?
Third, startups need validated learning about customers
. The purpose of a startup (i.e. the innovation team) is to learn, not necessarily to build a product or meet customer needs. Ries maintains that innovators need to learn how to build an effective and sustainable product and business (i.e. what to build). If they focus on building itself instead of learning they will ultimately fail. Learning requires experiments that allow innovators to empirically test their fundamental assumptions and vision—to ‘de-risk’ their business model. In an education setting, this means that rather than jumping in and implementing a new course idea, Lean Startup encourages the innovation team to focus on determining whether a change is really needed; and if change is warranted then to adopt an iterative ‘continuous quality improvement’ approach to course development. The focus is on identifying what learners really need (what gaps currently exist, what they will actually use, and what will really optimize learning outcomes). As Maurya stated, ‘Life’s too short to build something nobody wants’ (Maurya 2012). The sustainability and scalability of the innovation should also be tested: will new customers (e.g. students next year or from other institutions) be able to use it?

넷째, 검증된 학습을 달성하기 위해 스타트업(혁신 팀)은 빌드-측정-학습 사이클(그림 1 및 아래 설명)을 빠르고 자주 거쳐야 합니다. 성공적인 팀은 주요 질문(가정)에 계속 집중하면서 이 프로세스를 가속화할 수 있습니다.
Fourth, to accomplish validated learning, startups (innovation teams) need to go through the Build-Measure-Learn cycle (Figure 1, and described below) quickly and frequently. Successful teams can accelerate this process while continuing to focus on key questions (assumptions).

다섯째, 스타트업(혁신팀)은 혁신회계에 집중해야 한다. 여기에는 의미 있는 메트릭스 식별, 구체적인 목표 설정, 결과 측정, 데이터에 대응하고 목표를 달성하기 위한 작업의 우선 순위가 포함됩니다. 이러한 초점은 혁신자들이 장기적으로 원하는 결과를 달성할 책임을 지게 한다.

Fifth, startups (innovation teams) must focus on innovation accounting. This involves identifying meaningful metrics, setting specific goals, measuring results, and prioritizing work to respond to data and meet objectives. Such focus holds innovators accountable to achieving the long-term desired outcomes.

 

검증된 학습 및 빌드-측정-학습 주기
Validated learning and the build-measure-learn cycle

성공 정의: 비즈니스 모델 명확화
Define success: Articulate the business model

그것은 '성공'이 어떻게 생겼는지 명확하게 정의하는데 도움이 된다. 비즈니스 벤처의 경우, 성공은 보통 고객에게 지불하고 순이익에서 측정된다. 교육 혁신의 경우 성공은 [신규 사용자, 완료율, 학습자 지식 또는 개발 또는 지속적인 비용(교사 시간 포함)]에서 측정될 수 있다.
It helps to clearly define what ‘success’ would look like. For a business venture, success is usually measured in paying customers and net profits. For an educational innovation, success might be measured in new users, completion rates, learner knowledge, or development or ongoing costs (including teacher time).

이러한 성공의 비전을 '비즈니스 모델'('조직이 가치를 창출, 제공 및 포착하는 방법'에 대한 설명)에서 포착하면 훨씬 더 도움이 됩니다. Maurya(2012)는 혁신의 본질(및 수반되는 비즈니스 모델)을 한 페이지로 증류하기 위해 [린 캔버스]를 개발했다. 린 캔버스를 제작하면 팀은 깊이 있고 명확하게 생각할 수 있으며, 가정을 우선시하고, 다른 모델을 대조하며(예: 다른 고객, 문제, 솔루션 또는 비용 구조로 여러 캔버스 생성) 효과적으로 의사 소통할 수 있습니다. 우리는 이 템플릿을 새로운 린 교육 캔버스를 만들기 위해 적용했습니다(그림 2).
Capturing this vision of success in a ‘business model’ (a description of ‘how an organization creates, delivers, and captures value’ [https://en.wikipedia.org/wiki/Business_model]) helps even more. Maurya (2012) developed the Lean Canvas to distill the essence of an innovation (and the accompanying business model) onto a single page. Creating a Lean Canvas forces the team to think deeply and clearly, and helps to prioritize assumptions, contrast different models (e.g. generating several Canvases with different customers, problems, solutions, or cost structures), and communicate effectively. We have adapted this template to create a novel Lean Education Canvas (Figure 2).


린 교육 캔버스를 사용하여 가정의 우선순위를 정하고 프로젝트 전체의 진행 상황/진화를 모니터링할 수 있습니다. 전문가들은 캔버스의 초기 완성을 다음과 같은 순서로 권장합니다(Maurya 2012). 섹션을 공백으로 두어도 괜찮습니다(이는 높은 우선순위 테스트를 수행할 수 있는 위험한 문제가 될 수 있습니다).
The Lean Education Canvas can be used to prioritize assumptions and monitor the progress/evolution of the project as a whole. Experts recommend that the Canvas be initially completed in a single sitting, in the following order (Maurya 2012). It’s ok to leave a section blank (this might suggest a risky issue that warrants high-priority testing).

1. 고객 부문 + 문제 – 이러한 섹션은 긴밀하게 연결되어 있으므로 함께 작성합니다. 즉, '고객'과 2차 수혜자를 모두 식별합니다(예: 의대생에 대한 평가를 기록하는 임상 강사의 새로운 시스템의 경우, 1차 수혜자는 강사, 2차 수혜자는 학생, 지원 직원 및 학장).
1. Customer Segments + Problem
– complete these sections together, as they are tightly interconnected; identify both immediate ‘customers’ and secondary beneficiaries (for example: for a novel system for clinical preceptors to record assessments of medical students, the immediate customer is the preceptor; secondary beneficiaries include students, support staff, and the dean).

3. 고유한 가치 제안 – 차이가 중요한지 확인하고 얼리 어답터를 목표로 삼으십시오. [사람들이 제품을 사용한 후 얻을 수 있는 혜택]의 관점에서 이를 설명하도록 하십시오.
3. Unique Value Proposition
– make sure your difference matters and aim for the early adopters; try to state this in terms of benefits derived after people use your product.

4. 솔루션 – 단일 솔루션에 얽매이지 말고 '각 문제를 해결하기 위해 구축할 수 있는 가장 간단한 것'을 적습니다(Maurya 2012).
4. Solution(s)
– don’t get bound to a single solution; write down the ‘simplest thing you could possibly build to address each problem’ (Maurya 2012).

5. 채널 – 주요 인력(기본 및 보조 고객)과 어떻게 소통하고 참여를 이끌어낼 것인가? 여기에는 푸시 메시징(예: 이메일), 풀 메시징(예: 고객이 웹 사이트) 및 입소문 공유(리퍼링)가 포함될 수 있습니다.
5. Channels
– how will you communicate with and get buy-in from key people (primary and secondary customers)? This can include push messaging (you initiate contact, e.g. email), pull messaging (customers find you, e.g. website), and word-of-mouth sharing (referral).

6. 재정 지원 – 일부 교육 혁신은 수익을 창출하기 위한 것이지만, 장기적인 지속 가능성을 보장하기 위해 재정적 지원을 받지 않아도 됩니다. 수익 출처에는 학교 예산 기금, 외부 보조금 및 등록금이 포함될 수 있습니다.
6. Financial Support – some educational innovations intend to generate revenue, but even those that do not must garner financial support to ensure long-term sustainability; revenue sources might include school budget funds, external grants, and subscription fees.

7. 비용 구조 – 혁신을 개발하고 구현하는 데 필요한 비용에 대한 상세하고 현실적인 추정치를 개략적으로 설명합니다.
7. Cost Structure – outline a detailed, realistic estimate of costs required to develop and implement the innovation.

8. 주요 지표 – 여기에는 혁신의 초기 및 반복 사용, 학습 결과(지식, 기술, 행동), 시스템 결과(학교 또는 환자 치료에 미치는 영향), 유료 구독 및 추천이 포함될 수 있습니다.
8. Key Metrics – these might include initial and repeated use of the innovation, learning outcomes (knowledge, skills, behaviors), system outcomes (impact on school or patient care), paid subscriptions, and referrals.

9. 불공평한 이점 – 주어진 제품을 처음 출시하는 것은, 이점이 아니라, 실제로 위험입니다. (Maurya 2012) 진정한 '불공정한' 이점에는 고객과의 연계 가치, 내부자 정보, 개인 전문 지식, 개발 팀 기술, 수많은 기존 고객 및 대규모 네트워크/커뮤니티가 포함됩니다.
9. Unfair Advantage – being first to launch a given product is actually a risk, not an advantage; (Maurya 2012) truly ‘unfair’ advantages include customer-aligned values, insider information, personal expertise, development team skills, numerous existing customers, and a large network/community.


원래의 비즈니스 모델은 경험적 테스트에서 거의 살아남지 못할 것이다(Blank 2020). 당연하다. 실제로 비즈니스 모델을 변경하거나 성공의 비전을 재정의할 수 있는 증거(검증된 학습!)를 제공하는 것이 린 스타트업의 핵심 목적입니다.
The original business model will almost never survive empiric testing (Blank 2020). That’s expected. Indeed, providing evidence (validated learning!) to change the business model or redefine the vision of success is the central purpose of the Lean Startup.

 

가정 식별 후 테스트
Identify assumptions, then test

스타트업(혁신팀)의 목적은 고객에 대해 최대한 많이 배우는 것입니다. 팀은 일반적으로 고객이 무엇을 원하거나 필요로 하는지 아이디어로 시작하지만, 실제로는 단순한 가정일 뿐이며 가정을 테스트해야 합니다. 가정을 식별하는 것은 직관적이거나 쉽지 않다. 표 1은 다음 두 가지 접근 방식을 설명합니다

  • 스스로에게 일련의 탐색적 질문을 던지고
  • 린 교육 캔버스의 각 진술을 체계적으로 잠재적인 가정으로 봅니다.

The purpose of a startup (innovation team) is to learn as much as they can about their customers. The team usually starts with an idea of what the customer wants or needs, but in reality this is merely an assumption—and assumptions need to be tested. Identifying assumptions is not intuitive or easy. Table 1 describes two approaches:

  • asking oneself a series of probing questions, and
  • systematically viewing each statement in the Lean Education Canvas as a potential assumption.

일단 식별되면, 가정은 프로젝트 실패의 위험에 기초한 시험을 위해 [우선 순위]를 매겨야 한다: [불확실성]이 높고, 잠재적으로 [임팩트]가 큰 가정이 우선 순위가 된다. [테스트하기 쉬운 가정]도 종종 조기에 테스트됩니다.
Once identified, assumptions should be prioritized for testing based on risk of project failure: assumptions with high uncertainty and potentially high impact get first priority. Assumptions that are easy to test are often tested early as well.

 

사무실에서 나가십시오. 고객과의 대화
Get out of the office: Talk with customers

가정을 식별하고 테스트하기 위해 혁신자들은 [사무실에서 나와 잠재 고객과 소통]해야 합니다(Blank 2020). 만트라는 다음과 같다. '당신의 건물 안에는 사실이 없으니 밖으로 나가세요'(Blank 2012). 고객 중심 학습('고객 개발')은 '깨달음으로 가는 길'(Blank 2020)으로 분류되었습니다.
To both identify and test assumptions, innovators need to get out of the office (Blank 2020) and interact with potential customers (Constable 2014). The mantra is: ‘There are no facts inside your building, so get outside’ (Blank 2012). Customer-focused learning (‘customer development’) has been labeled the ‘path to epiphany’ (Blank 2020).

'문제점'(고객 발견)에 대한 초기 이해는 일반적으로 고객과의 대화(질적 데이터)를 수반합니다. 전문가들은 포커스 그룹(그룹 사고를 유발함)이나 서면 질문지(팀이 이미 올바른 질문과 잠재적 답을 알고 있다고 가정함)보다는 일대일 인터뷰를 권고한다(Maurya 2012; Constable 2014). 이러한 인터뷰에 대한 자세한 지침을 이용할 수 있다(Constable 2014). 정량적 테스트는 이후 단계에서 인터뷰를 보완한다(Constable 2018; Blank 2020).
Initial understanding of ‘pain points’ (customer discovery) typically involves talking with customers (qualitative data). Experts recommend 1-on-1 interviews rather than focus groups (which promote group-think) or written questionnaires (which presume the team already knows the right questions and potential answers) (Maurya 2012; Constable 2014); detailed guidance on such interviews is available (Constable 2014). Quantitative testing complements interviews at later stages (Constable 2018; Blank 2020).

빌드: 실행 가능한 최소 제품
Build: The minimal viable product

불행히도, 고객들은 자신이 진정으로 원하는 것이 무엇인지, 무엇이 가장 효과적으로 작동할 것인지 모르는 경우가 많습니다. 그들의 의견과 믿음은 시험되어야 할 추가적인 가정이다. 따라서 고객(학습자, 교사 등)과 상호 작용할 수 있는 '최소 실행 가능한 제품'(MVP)이라는 가시적인 것을 매우 조기에 구축하는 것이 중요합니다. MVP는 가정을 경험적으로 테스트할 수 있게 한다. 

  • 고객은 정말 그 제품을 사용하나요? 
  • 고객은 그것을 예상한 대로 사용하나요? 
  • 원하는 (학습) 결과를 쉽게 얻을 수 있습니까? 
  • 어떤 장애물에 부딪히고, 이를 해결하기 위해 제품을 재설계할 수 있는 방법은 무엇입니까? 
  • 이러한 변화가 초기 비전과 의도된 기능에 어떤 영향을 미칩니까? 

이러한 모든 질문 및 기타 질문에 대한 답변은 빌드-측정-학습 주기(그림 1)에 따라 이루어집니다.
Unfortunately, customers often don’t know what they really want or what will work most effectively; their opinions and beliefs are further assumptions that need to be tested. Thus, it is critical to build something tangible very early—a ‘minimal viable product’ (MVP) with which customers (learners, teachers, etc) can interact. The MVP enables assumptions to be empirically tested:

  • Do customers really use the product?
  • Do they use it as envisioned?
  • Does it facilitate the desired (learning) outcomes?
  • What stumbling blocks do they encounter, and how can the product be redesigned to resolve these?
  • How do these changes affect the initial vision and intended functionality?

All of these questions, and more, will be answered in cycles of Build-Measure-Learn (Figure 1).

혁신자들은 일반적으로 그들의 제품이 거의 완벽하기를 원하지만, 린 스타트업은 정반대의 것을 장려한다. 첫 번째 제품은 '최소한의 노력(시간과 비용 포함)으로 검증된 학습을 최대한 수집할 수 있는 신제품 버전'이어야 합니다(Ries 2009). 이것은 보통 MVP가 의도적으로 저렴하고 불완전하다는 것을 의미한다. [스타트업의 초점]은 제품을 만들거나 고객을 기쁘게 하는 것이 아니라 [문제에 대한 실행 가능하고 지속 가능한 솔루션을 구축하는 방법을 배우는 것]입니다. 따라서 MVP에는 [하나 이상의 중요한 가정(가설)을 테스트하는 데 필요한 최소한의 기능]만 포함되어야 한다. 종종 이것은 [계획된 최종 제품과 표면적으로 거의 유사하지 않은 구현]을 포함한다. 그러나 MVP는 기능성의 [더 깊은 수준에서 강한 오버랩]을 가져야 한다. 기능 보존 단축키의 구체적인 예로는 주문을 처리하기 위해 컴퓨터 프로그램을 작성하는 대신 손으로 주문을 처리하는 것, 소셜 네트워크를 사용하는 대신 혁신 팀이 사용자의 질문에 답하도록 하는 것, 화면상의 아바타가 화면을 돌아다니는 것보다 한 곳에 서도록 하는 것 등이 있다. 표 2에는 추가적인 미니멀리즘 대안이 나열되어 있다.
Innovators typically want their product to be near-perfect, but Lean Startup encourages precisely the opposite: the first product should be a ‘version of a new product which allows a team to collect the maximum amount of validated learning with the least effort’ (Ries 2009) (including time and money). This usually means the MVP is deliberately inexpensive and incomplete. Remember that the focus of the startup is not to build products or please customers, but to learn how to build practicable, sustainable solutions to a problem. Thus, the MVP should contain only the minimal features required to test one or more critical assumptions (hypotheses). Often this involves an implementation that bears little superficial resemblance to the envisioned final product. However, the MVP should have strong overlap at deeper levels of functionality. Specific examples of function-preserving shortcuts include processing orders by hand instead of writing a computer program to process orders; having the innovation team answer users’ questions instead of employing a social network; and making on-screen avatars stand in one place rather than walk around the screen. Table 2 lists additional minimalistic alternatives.

MVP 출범이 늦어진다는 것은 학습의 지연을 의미한다. 혁신자들은 종종 열등하거나 불완전한 제품을 출시하는 것에 대해 우려를 표하며, 고객을 소외시킬 것을 두려워한다. 이러한 두려움은 고객이 누구인지, 고객이 진정으로 원하는 기능이 무엇인지 알고 있으며, 고객은 누락된 기능에 대해 충분히 신경 써서 불쾌감을 느낀다고 가정합니다. 이 모든 가설은 시험할 수 있고, 종종 시험할 때 거짓으로 판명된다. 실제로 가장 중요한 질문 중 하나는 항상 이것이다. 고객은 품질을 어떻게 정의합니까? 즉, 고객이 진정으로 관심을 갖는 기능은 무엇입니까? 중요한 것은, MVP가 '실패'하더라도 학습이 이루어지면(특히 실패가 예상한 방식으로 발생하지 않는 경우가 많기 때문에) 그 경험이 큰 성공을 거둘 수 있다는 것이다.
Any delay in launching the MVP means a delay in learning. Innovators often express concerns about releasing an inferior or incomplete product, fearing to alienate customers. This fear assumes that they know who their customer is, they know what features their customer truly wants, and the customers will care enough about missing features that they will be offended. All of these are hypotheses that can (and should) be tested; and often, when tested, they prove false. Indeed, one of the most important questions is always: How does the customer define quality, i.e. what features do they really care about? Importantly, even if the MVP ‘fails’ the experience can be a great success if learning is gained (especially since failure often does not occur in the expected way).

다시 강조하자면, MVP의 목적이 꼭 고객을 기쁘게 하기 위한 것이어야 할 필요는 없으며, 전반적인 혁신에 대한 가정(가설)을 테스트하여 학습하는 것입니다.
To again emphasize: the purpose of the MVP is not (necessarily) to please customers, but to test assumptions (hypotheses) about the overall innovation and thereby to learn.

측정
Measure

MVP를 테스트하려면 [의미 있고 실행 가능한 결과]의 측정이 필요합니다. '의미 있음'은 테스트 중인 가설(가정)과의 관계를 나타냅니다. 이상적으로, 결과는 강력한 원인-효과 추론(즉, MVP에 대한 학습)을 지원할 것이다. 웹사이트 조회수 또는 환자 체류 기간과 같은 결과를 측정하는 것은 이러한 결과가 MVP의 특정 특징에 기인할 수 없거나 핵심 가정을 다루지 않는 경우 검증된 학습을 제공하지 않는다.
Testing the MVP requires measurement of meaningful, actionable outcomes. ‘Meaningful’ indicates a relationship with the hypothesis (assumption) being tested: ideally, outcomes will support a strong cause-effect inference (i.e. learning about the MVP). Measuring outcomes such as Website hits or patient length of stay does not provide validated learning if these outcomes cannot be attributed to a specific feature of the MVP or do not address a key assumption.

정성적 데이터(인터뷰)는 모든 단계에서 필수적이지만, 프로젝트가 진행됨에 따라 정량적 데이터(수치)의 중요성이 점점 커지고 있습니다. 유료 고객을 유치하는 데 의존하는 기업에게 '해적 지표'(McClure 2007)는 의미가 있다('AARR'이라는 머리글자가 해적처럼 들리기 때문에 일명). 이러한 지표는 다음에 초점을 맞춥니다. 

  • 고객 획득(신규 방문자 수), 
  • 활성화(진행 상황을 저장하거나 계정을 활성화하여 재방문을 계획할 수 있을 만큼 충분한 경험을 누리는 고객), 
  • 유지(실제 재방문), 
  • 추천(동료에 대한 추천), 
  • 수익(어떤 것에 대한 지불)

이들은 많은 교육 환경에 적응할 수 있다(예: 온라인 모듈은 새로운 사용자, 모듈 완료, 지속적인 사용 및 추천을 추적할 수 있다). 교육의 다른 성과로는 환자 결과 및 재정적 비용뿐만 아니라 학습자 만족도, 동기 부여, 태도, 지식, 기술 및 침대 머리맡에서의 행동이 포함될 수 있다'최고의' 결과는 문제의 가정을 직접적으로 알려주는 것이다. 잠재적 결과 측정의 비용, 타당성, 타당성 및 임상/교육 관련성 또한 중요한 고려사항이다.
Qualitative data (interviews) are vital at all stages, but quantitative data (numbers) become increasingly important as a project progresses. For a business dependent on attracting customers who pay, the ‘pirate metrics’ (McClure 2007) (so-called because the acronym ‘AARRR’ sounds like a pirate) are meaningful. These metrics focus on customer

  • Acquisition (number of new visitors),
  • Activation (customers who enjoy the experience enough to plan a return visit by saving progress or activating an account),
  • Retention (actual return visits),
  • Referral (recommendations to colleagues), and
  • Revenue (payment for something);

these could be adapted to many education settings (e.g. an online module might track new users, module completion, ongoing use, and referrals). Other outcomes in education might include learner satisfaction, motivation, attitudes, knowledge, skills, and behaviors at the bedside, as well as patient outcomes and financial cost. The ‘best’ outcome is one that directly informs the assumption in question. Cost, feasibility, validity, and clinical/educational relevance of potential outcome measures are also important considerations.

정량적 데이터는 시간 경과에 따른 비교(설계 변경과 이상적으로 연계), '경쟁사'와의 비교(또는 전통적인 접근 방식) 또는 동시 통제군과의 비교 등이 있다. 강력한 원인 효과 결정을 용이하게 하는 한 가지 방법은 'A-B 테스트'를 포함하며, 이는 기본적으로 두 가지 버전의 MVP(버전 A, 버전 B)가 생성되는 제어 실험이며, 중요할 것으로 의심되는 특징에서만 다르다. 사용자의 절반은 버전 A를 제공하고 절반은 버전 B를 제공하며 결과는 비교된다. 대면 교육에서는 종종 어렵지만, A-B 비교는 컴퓨터 보조 교육에서는 비교적 간단하며 소프트웨어 개발에서는 일반적이다. 실제로 구글과 아마존 같은 거대 기술기업들은 제품 디자인을 다듬기 위해 지속적으로 A-B 테스트를 사용한다. 한 전문가(McLure 2007)는 무엇을 해야 할지 모르면 '대단히 추측해 보고 A-B 테스트를 해보십시오.'라고 제안합니다.
Quantitative data can be compared over time (ideally linked with design changes), with a ‘competitor’ (or traditional approach), or with a concurrent control. One way to facilitate robust cause-effect determinations involves ‘A-B testing,’ which is basically a controlled experiment in which two versions of the MVP (version A, version B) are created, differing only in a feature suspected to be important. Half the users are offered version A, half are offered version B, and outcomes are compared. While often difficult in face-to-face instruction, A-B comparisons are relatively straightforward for computer-assisted instruction, and are commonplace in software development. In fact, technology giants such as Google and Amazon use A-B testing continuously to refine their product design. One expert (McClure 2007) suggests that if you don’t know what to do, ‘Just guess and then A-B test—a lot!’

학습: 피벗 또는 지속성
Learn: Pivot or persevere

측정이 수집되고 분석되면 학습(데이터 해석)과 의사결정이 필요한 시점이다. 근본적인 결정은 [인내]할 것인지(초기 아이디어를 계속 다듬을 것인지) 아니면 [피벗]할 것인지(초기 아이디어를 포기하거나 근본적으로 변경하여 다른 고객, 기능 세트 또는 제품에 초점을 맞출 것인지)입니다. 핵심은 각 결정이 검증된 학습을 기반으로 한 정보에 정통하다는 것입니다. 다시 말하지만 스타트업(혁신팀)의 초점은 제품을 만들거나 고객(학습자)에게 서비스를 제공하는 것이 아니라 효과적이고 실용적이며 지속 가능한 솔루션(비즈니스 모델)을 구축하는 방법을 배우는 데 있습니다.
Once measurements have been collected and analyzed, it is time for learning (data interpretation) and decisions. The fundamental decision is whether to persevere (continuing to refine the initial idea) or to pivot (abandoning or radically changing the initial idea to focus on a different customer, feature set, or product). The key is that each decision is well-informed—based on validated learning. Again, the focus of a startup (innovation team) is not so much to build a product or serve customers (learners) but rather to learn how to build an effective, practicable, sustainable solution (business model).

반복하다…빠르게 
Repeat … rapidly

그런 다음 또 다른 핵심 가정(가설)의 우선 순위를 정하고, 그 가설, 측정 및 결정을 테스트할 MVP를 만드는 것으로 다시 순환이 시작됩니다. 가설과 측정값이 더 우수하고 각 사이클이 더 빨리 완료될수록 혁신 팀은 더 잘 배우고 더 많은 경쟁 우위를 확보할 수 있습니다.
And then the cycle begins again—with prioritization of another key assumption (hypothesis), creation of an MVP to test that hypothesis, measurement, and decision. The better the hypotheses and measurements, and the faster each cycle can be completed, the better and more the innovation team will learn and the greater their competitive advantage.

전체적으로, Maurya(2012)는 [고객과 관련성을 유지하고, 솔루션이 아닌 문제를 사랑하며, 전체 혁신(효과와 지속 가능성 포함)의 위험을 체계적으로 제거]할 필요성을 강조한다. 린(교육) 캔버스(그림 2)는 모델의 만족도, 실행 가능성 및 실현 가능성을 포함하여 모델을 체계적으로 '스트레스 테스트'하는 데 도움이 됩니다.
Throughout, Maurya (2012) emphasizes the need to stay relevant to customers, love the problem not the solution, and systematically de-risk the entire innovation (including effectiveness and sustainability). The Lean (Education) Canvas (Figure 2) is helpful in systematically ‘stress testing’ the model, including its desirability, viability, and feasibility.

물론, 실제 교육 설정은 전형적으로 과정 빈도(예: 매년 1회)와 사이클 빈도를 제한하는 잠재적 '고객'(예: 연간 25명)에 의해 제약을 받는다. 그러나 초점은 [제품 테스트]보다는 [검증된 학습]에 있다. 관련 가정을 테스트할 수 있다면 구체적인 과정, 주제, 참여자는 중요하지 않습니다. 따라서, 많은 빌드-측정-학습 주기는 의도된 과정과 학습자의 외부에 초점을 맞출 수 있습니다(제안 내용은 표 2 참조).
Of course, real-life education settings are typically constrained by the course frequency (e.g. once each year) and potential ‘customers’ (e.g. 25 students per year), which limit the cycle frequency. However, the focus on validated learning rather than product testing is liberating: the specific course, topic, and participants don’t matter if relevant assumptions can be tested. Thus, many Build-Measure-Learn cycles could focus outside the intended course and learners (see Table 2 for suggestions).

교육은 복잡하고 완전히 이해되지 않는 활동이다. 교육 관련 문제에 대한 혁신적인 해결책도 마찬가지로 복잡하며 '효과가 있었는가'라는 단순한 예/아니오 질문으로 좀처럼 줄어들지 않는다. Build-Measure-Learn의 반복적 특성은 각 사이클이 점진적으로 미묘한 질문을 다루면서 자연스럽게 이 상황에 적합하다(이게 중요한 문제인가). 이 혁신은 실행 가능한 해결책입니까? 그것이 얼마나 학습을 촉진하는가? 비용 효율적이고 지속 가능한 제품입니까?)

Education is a complex and incompletely understood activity. Innovative solutions to education-related problems are likewise complex and rarely reduce to simple yes/no questions of ‘Did it work?’ The iterative nature of Build-Measure-Learn lends itself naturally to this situation, with each cycle addressing progressively nuanced questions (

  • Is this an important problem?
  • Is this innovation a viable solution?
  • How well does it promote learning?
  • Is it cost-effective and sustainable?).

린 스타트업의 실제 적용: 사례 시리즈
Application of lean startup in practice: A case series

2015년 9월부터 2016년 1월까지 린 스타트업(Lean Startup) 방법에 대한 경험이 있는 외부 컨설팅 업체와 제휴하여 보건전문가를 위한 온라인 학습에 적극적으로 혁신을 꾀했습니다. 이 기간 동안 우리는 고객 개발 인터뷰와 시장 조사를 실시했으며, 이 정보를 사용하여 세 가지 개별 교육 혁신을 식별하고 테스트했습니다(표 3 참조). 이 중 두 개는 실패했다. 세 번째는 상당한 가능성을 보였지만 불행히도 지속적인 개발을 우선시할 자금을 확보하지 못했다. 이러한 프로젝트 중 어느 것도 규모에 맞게 구현된 적은 없지만, 교육 활동을 분류하고 개발하는 린 스타트업의 속도와 유연성을 보여줍니다. 예를 들어, 우리는 다른 가정들이 더 높은 우선순위로 판단되었기 때문에 이러한 혁신들 중 어떤 것이 실제로 학습을 얼마나 잘 촉진시키는지 시험하지 않았다(예: 혁신의 학습 효과는 사람들이 그것을 사용하지 않거나 재정적으로 실행 불가능한지는 중요하지 않다).
From September 2015 to January 2016 we partnered with an external consulting firm with experience in Lean Startup methods to actively innovate in online learning for health professionals. During this period we conducted customer development interviews and market research, and using this information we identified and tested three separate educational innovations (see Table 3). Two of these failed. The third showed substantial promise, but unfortunately has not secured funding to prioritize continued development. While none of these projects was ever implemented at-scale, they illustrate the speed and flexibility of Lean Startup in triaging and developing educational activities. For example, we did not test how well any of these innovations actually promoted learning because other assumptions were judged as higher priority (e.g. an innovation’s learning effectiveness doesn’t matter if people don’t use it or if it is financially infeasible).

 

초기 고객 발굴 및 아이디어 발굴
Initial customer discovery and ideation

지역 리더와의 대화를 바탕으로 중간 수준의 제공자(간호사 실무자 및 의사 보조자)가 지속적인 교육을 위해 혁신적인 지원이 잠재적으로 필요한 것으로 파악했다. 13개 중간 수준의 제공자와의 인터뷰는 사례 기반 학습(서면, 시뮬레이션 및 실제 환자와의 학습), 동료와 사례를 논의할 기회, 매우 짧은 기간 동안의 활동을 포함한 몇 가지 '페인 포인트'을 확인했다.
Based on conversations with local leaders, we identified midlevel providers (nurse practitioners and physician assistants) as potentially needing innovative support for continuing education. Interviews with 13 midlevel providers identified several ‘pain points’ including a desire for more case-based learning (written, simulated, and with real patients), opportunities to discuss cases with colleagues, and activities of very short duration.

후속 팀 브레인스토밍 세션은 세부 사항, 관련성, 혁신 및 실현 가능성에 있어 큰 차이를 나타내는 30개 이상의 고유한 아이디어를 식별했습니다. 비록 많은 아이디어가 모호하거나 실현 불가능했지만, 이 활동은 팀을 단결시키고 후속 활동을 위한 토대를 제공했다. 시간이 지남에 따라, 우리의 목표 고객 그룹은 (인터뷰에서) 사례 기반 학습의 인지된 가치를 확인한 실무 의사와 거주자를 포함하도록 다양화되었습니다.
A subsequent team brainstorming session identified over 30 unique ideas representing large variation in detail, relevance, innovation, and feasibility. Although many ideas were vague or infeasible, the activity united the team and provided a foundation for subsequent activities. Over time, our target customer group diversified to include practicing physicians and residents, who affirmed (in interviews) the perceived value of case-based learning.

혁신 1. '케이스 앱'
Innovation 1. ‘CasesApp’

고객 발굴, 아이디어 제시 및 가정
Customer discovery, ideation, and assumptions

우리의 초기 고객 개발은 임상의가 진정한 임상 사례에 대한 접근과 논의를 중요시할 것을 제안했다. 임상의들은 또한 우리에게 학습 시간이 매우 제한적이라고 말했고, 모바일 장치가 이 장벽을 극복하는 데 도움이 될 수 있다고 제안했다. 따라서 신뢰할 수 있는 동료와 실제 환자 사례를 공유하고, 보고, 비동기적으로 논의하는 것을 지원하는 모바일 앱이 중요한 요구를 충족할 것이라고 가정했다. 바쁜 임상의들이 서면 사례를 입력할 시간이 없을 수 있다는 것을 인지하고, 모바일 장치 카메라로 캡처한 비디오를 사용하여 사례를 만들고 논의하는 것이 더 빠르고 쉬울 것이라는 가설을 세웠다.
Our initial customer development suggested that clinicians would value access to, and discussion of, authentic clinical cases. Clinicians also told us that time for learning was very limited, and proposed that mobile devices might help overcome this barrier. Consequently, we hypothesized that a mobile app to support sharing, viewing, and asynchronously discussing real patient cases with trusted colleagues would fill a critical need. Recognizing that busy clinicians might not have time to type out a written case, we further hypothesized that creating and discussing cases would be faster and easier using video captured with mobile device cameras.

우리는 기존 제품을 탐색하는 시장 조사를 실시했습니다. 여러 제품이 의사 사례 기반 학습을 지원했지만 모바일 장치를 사용한 제품은 거의 없었고 신뢰할 수 있는 그룹 내에서 사례 토론을 지원하지 않았습니다.
We conducted market research exploring existing products. Several products supported physician case-based learning, but few used mobile devices and none supported case discussions within trusted groups.

우리는 몇 시간 동안 브레인스토밍을 하고 사실이 아닐 경우 실패로 이어질 수 있다는 가정에 우선순위를 매겼다(표 3 참조). 그런 다음 가장 위험한 가정을 테스트하기 시작했습니다.
We spent several hours brainstorming and prioritizing the assumptions that, if untrue, could lead to failure (see Table 3). We then set out to test the riskiest assumptions.

초기 가정 테스트: 빌드-측정-학습
Testing initial assumptions: Build-measure-learn

한 가지 중요한 가정은 임상의가 짧은 사례를 구두로 제시하고 모바일 기기를 사용하여 기록하는 것이 편하다는 것이었다. 이번 테스트에서 MVP는 단순히 표준 비디오 녹화 기능을 갖춘 스마트폰이었다. 주요 지표는 사례를 다른 사람과 공유하고자 하는 임상의의 수와 2분 이내에 사례를 생각해 낼 수 있으며 스마트폰을 사용하여 구술 발표를 편안하게 비디오로 녹화하는 것이었다. 우리는 질문한 임상의의 80%가 하나의 사례를 기록할 의향이 있고 기록할 수 있을 것이라는 가설을 세웠다. 우리는 스마트폰을 손에 들고 복도를 뛰었고, 한 시간 내에 6명의 의료 전문가(의사 5명, 중간급 의료진 1명)에게 접근했다. 6명 모두 2분 이내에 사례를 기록했고, 4명은 최소한의 도움만 필요했으며, 5명은 다른 임상의와 사례를 기꺼이 공유했습니다. 이것은 우리의 가정을 확인했고, 우리는 다음 단계로 진행하기로 결정했다. 
One key assumption was that clinicians were comfortable orally presenting a short case and recording it using a mobile device. The MVP for this test was simply a smartphone with standard video recording capability. Key metrics were the number of clinicians willing to share a case with others, able to come up with a case in two minutes or less, and comfortable video-recording their oral presentation using our smartphone. We hypothesized that 80% of clinicians asked would be willing and able to record one case. We hit the hallways with smartphones in hand, and within an hour had approached six health professionals (five physicians and one midlevel provider). All six recorded a case in under two minutes, four required only minimal help, and five were willing to share their case with other clinicians. This affirmed our assumption, and we decided to proceed with the next step.

빌드
Build

다음 가정은 임상의가 다른 임상의의 비디오 클립 사례와 관련이 있다는 것이었습니다. 이 가정을 테스트하려면 표준 스마트폰 소프트웨어보다 더 많은 것이 필요했습니다. 양방향 상호 작용을 용이하게 하는 프로토타입이 필요했습니다. 따라서 우리는 임상의가 환자 사례를 비디오로 녹화하여 스스로 선택한 동료 그룹과 공유할 수 있는 매우 간단한 스마트폰 앱을 개발했다. 그런 다음 동료들은 비디오로 녹화하고 사건에 대한 의견을 공유할 수 있었다. 우리는 6명의 임상의사를 고용하여 각각의 사례를 기록하고 이 사례를 논의하기 위해 동료 그룹을 초대했다.
The next assumption was that clinicians would engage with video clip cases from other clinicians. Testing this assumption required more than standard smartphone software; we needed a prototype that would facilitate bi-directional interaction. Thus, we developed a very simple smartphone app that allowed clinicians to video-record themselves presenting a patient case and share this with a group of self-selected peers. The peers could then video-record and share comments on the case. We recruited six clinicians to each record a case and invite a group of peers to discuss this case.

재다
Measure

우리는 세 가지 주요 메트릭스를 제안했습니다. 예를 들어 사례를 본 응답자의 30%는 질문이나 코멘트로 응답하고, 40%는 두 번째 사례를 보고, 40%는 동료에게 사례 앱을 추천합니다. 테스트에서 초청된 72개 공급자 중 24개(33%)가 실제로 시제품을 사용해 보았다. 이 중 5명(21%)이 댓글 달기에 성공했고, 2명(10%)은 두 번째 사례를 봤으며, 2명(10%)은 동료에게 케이스앱을 추천하겠다고 답했다. 
We proposed three key metrics: 30% of those who viewed a case would respond with a question or comment, 40% would view a second case, and 40% would recommend CasesApp to a colleague. In testing, 24 of 72 (33%) invited providers actually tried the prototype. Of these, 5 (21%) successfully added a comment, 2 (10%) viewed a second case, and 2 (10%) indicated they would recommend CasesApp to a colleague.

배우다.
Learn

목표 메트릭을 충족하지 못했습니다. 임상의들이 사례 기반 논의에 관심을 표명했지만, 실제로는 이러한 비디오 녹화 사례에 관여하지 않았다. 그래서 우리는 이 생각을 버렸습니다. 
We failed to meet any target metrics. Although clinicians expressed interest in case-based discussions, in actuality they did not engage with these video-recorded cases. So, we abandoned this idea.

혁신 2. '''비디오 360'''
Innovation 2. ‘Video360’

고객 발굴, 아이디어 제시 및 가정
Customer discovery, ideation, and assumptions

11월 중순에 첫 번째 혁신을 포기한 후 연말(4주) 전에 두 번째 제품을 구상, 개발 및 테스트하자고 제안했습니다. 깨끗한 슬레이트로부터 시작하여 고객 개발 대화를 재분석하고 광범위하게 브레인스토밍했으며, 마지막으로 시뮬레이션된 환자 만남의 몰입형 온라인 가상 현실(VR) 비디오가 실제 환자와의 더 많고 다양한 경험에 대한 명시된 욕구를 대체할 수 있는 아이디어(가설)를 선택했다. 우리는 이것이 학습 결과에 어떻게 긍정적인 영향을 미칠지에 대한 명확한 기대를 가지고 있지 않았지만, 이 고위험 고수익 아이디어를 테스트하는 것은 타당해 보였다. 결국, 린 스타트업 접근 방식을 사용하면 우리는 노력해도 크게 손해 볼 것이 없다. 
After abandoning our first innovation in mid-November, we proposed to ideate, develop, and test a second product before year-end (4 weeks). Starting with a clean slate we re-analyzed our customer development conversations and brainstormed broadly, finally choosing the idea (hypothesis) that immersive online virtual reality (VR) videos of simulated patient encounters might substitute for the stated desire for more, varied experiences with real patients. We didn’t have a clear expectation for how this would favorably impact learning outcomes, but it seemed reasonable to test this high-risk, high-payoff idea. After all, using the Lean Startup approach we would not lose much for trying.

다시 한 번 우리는 관련 임상 주제 범위를 중심으로 한 중요한 가정(표 3)을 우선시했다(이것이 틈새에서만 작동할 것인가). 아니면 우리는 이것을 임상 훈련의 범위에 걸쳐 사용할 수 있습니까?) 
Once again we prioritized critical assumptions (Table 3), which revolved around the range of relevant clinical topics (Would this work only in a niche? Or could we use this across the spectrum of clinical training?).

제작 및 측정
Build and measure

제안된 혁신은 360° 카메라(비용 $400)를 사용하여 시뮬레이션 또는 실제 환자 만남을 기록하고, 저렴한 VR 헤드셋(각 $10)을 사용하여 후속 재생을 수행하는 것이었다. 다양한 주제에 대한 우리의 가정을 테스트하기 위해, 우리는 상담, 신체 검사 및 외상 소생이라는 세 가지 다른 임상 활동의 시뮬레이션을 비디오로 녹화했다. 우리는 이 비디오들을 진행하기 위해 유튜브를 이용했다. 우리는 공식적인 '사용자 경험' 실험을 통해 이러한 시나리오를 평가할 계획이었지만, 임상의, 교육자 및 전문 혁신자로 구성된 우리 팀은 이 단계 이전에도 심각한 문제를 확인했다.

  • 우선 영상이 다소 흐릿하고 편집이 예상보다 번거로웠다.
  • 둘째, 신체 검사와 의사소통 만남은 360° 기능의 혜택을 받지 못했고, 어떤 면에서는 실제로 더 나빴다.
  • 셋째, 소생 시나리오의 증분적 이점은 최소였고, 여러 카메라의 비디오와 더 광범위하고 비용이 많이 드는 편집이 필요했을 것이다.

The proposed innovation involved recording simulated or real patient encounters using a 360° camera (cost USD $400) and subsequent playback using inexpensive VR headsets ($10 each). To test our assumption regarding range of topics, we video-recorded simulations of three distinct clinical activities: counseling, physical exam, and trauma resuscitation. We used YouTube to host these videos. We planned to evaluate these scenarios through formal ‘user experience’ experiments, but our team of clinicians, educators, and professional innovators identified serious problems even before this step. First, the video was somewhat blurry and the editing more cumbersome than anticipated. Second, the physical exam and communication encounters did not benefit from the 360° feature, and in some ways were actually worse. Third, the incremental benefit for the resuscitation scenario was minimal, and would have required video from multiple cameras and more extensive (and costly) editing.

배우다.
Learn

이러한 발견은 360° 비디오가 광범위한 주제에 걸쳐 가치를 더할 것이라는 우리의 희망을 반증했다. 따라서 우리는 정량적 데이터 수집이나 최종 사용자 테스트를 진행하지 않았습니다. 대신, 우리는 이 아이디어가 만들어진 지 2주 만에 포기했다.
These findings disproved our hope that 360° video would add value across a broad spectrum of topics. As such, we never proceeded with quantitative data collection or end-user tests. Instead, we abandoned this idea only two weeks after its genesis.

혁신 3. '온 파'
Innovation 3. ‘OnPar’

아이디어와 첫 번째 MVP
Ideation and first MVP

우리의 세 번째 혁신은 다시 사례 기반 학습과 연결되었습니다. 그러나 이 아이디어는 공식적인 브레인스토밍에서 나오는 것이 아니라 비디오360 프로젝트를 중단한 후 팀이 압축을 풀기 위해 카드 게임을 하는 동안 발생했다. 누군가가 카드 게임이 임상 사례 관리를 시뮬레이션할 수 있다고 제안했고, 우리는 그 아이디어를 Solitaire와 유사한 게임으로 정교하게 만들었다. 다음 근무일에, 우리는 의사에게 최근의 흥미로운 사례에 대해 설명하도록 요청하고 주요 결과(이력, 시험, 테스트 결과)를 종이 색인 카드에 기록했습니다. 각 카드의 반대편에 우리는 발견을 이끌어낼 임상 질문을 작성했다('가슴 엑스레이에서 무엇을 나타냈습니까?'). 간단한 규칙을 만들었습니다. 플레이어는 각 카드의 질문을 검토하고 사건 해결을 위해 결과가 필요한지 여부를 결정했다. 만약 그렇다면, 그들은 카드를 넘기고, 그렇지 않다면 그들은 카드를 버렸습니다. 가장 적은 카드를 내면서 올바른 진단을 내리는 것이 목표였다. 
Our third innovation again connected to case-based learning. However, rather than emerging from formal brainstorming, this idea occurred while the team was playing cards to decompress after dropping the Video360 project. Someone suggested that a card game might simulate management of clinical cases, and we elaborated the idea into a game similar to Solitaire. The following workday, we asked a physician to describe a recent interesting case and recorded key findings (history, exam, test results) on paper index cards. On the opposite side of each card we wrote a clinical question that would elicit that finding (‘What did chest x-ray show?’). We created simple rules: The player reviewed each card’s question and decided whether the result was needed to solve the case. If yes, they turned the card over; if not they discarded the card. The goal was to make the right diagnosis while playing the fewest cards.

우리는 여러 명의 임상의와 함께 그 게임을 테스트했다. 모두가 게임을 즐겼고, 이 개념을 열렬히 지지했으며, 이는 일상적인 임상 실습에서 시간과 비용 효율에 대한 실질적인 요구를 모방했음을 시사했다. 한 임상의 교육자는 이것이 비분석적 임상 추론 과정을 장려한다고 추가로 제안했다. 
We tested the game with several clinicians. All enjoyed the game and enthusiastically endorsed the concept, suggesting that it emulated the practical demands for time and cost efficiencies in their daily clinical practice. One clinician educator further suggested that this encouraged nonanalytical clinical reasoning processes.

빌드-측정-학습: 2세대 MVP
Build-measure-learn: Second-generation MVP

이 MVP에 대한 호의적인 반응이 우리를 앞으로 나아가게 했다. 가장 위험한 가정(표 3)은 임상의가 게임을 원하는지 여부(구체적으로 2차 게임을 원하는지 여부)와 임상의가 게임 라이브러리를 강화하기 위해 새로운(실제) 사례를 공유하는지 여부에 초점을 맞췄다. 2세대 MVP는 인덱스 카드로 다시 구성되었는데, 이번에는 진단 관련 심전도와 교과서에서 복사한 흉부 X-ray의 접착 이미지를 사용하여 더욱 세심하게 제작되었다. 
The favorable reception to this MVP prompted us to move forward. The riskiest assumptions (Table 3) focused on whether clinicians would want to play the game (specifically, that they would play a second round), and whether clinicians would share new (real) cases to augment our game library. The second-generation MVP again consisted of index cards, this time more carefully constructed (but still hand-written) and using glued-on images of diagnosis-relevant electrocardiograms and chest x-rays copied from textbooks.

우리는 세 가지 사례를 만들고 여러 전문 분야와 훈련 단계를 대표하는 임상의와 함께 게임을 시험해 보았고, 각 시험 후에 게임 규칙을 반복적으로 개선했다. 각 케이스가 끝난 후 우리는 우리의 가정을 테스트하고, 그들이 두 번째 라운드를 하기를 원하는지 물어보고(가능한 경우 허용) 그들을 초대하여 케이스를 작성하는 데 도움을 주었다. 골프(최소 타수를 노리는 것)와 유사성을 인식해 경기 이름을 '온파'로 지었다. 
We created three cases and trialed the game with clinicians representing several specialties and stages of training, iteratively refining the game rules after each trial. After each case we tested our assumptions, asking if they wanted to play a second round (allowing this when possible) and inviting them to help us write a case. Recognizing the similarity to golf (i.e. striving for the fewest strokes), we named the game ‘OnPar.’

빌드-측정-학습: 3세대 MVP
Build-measure-learn: Third-generation MVP

종이 프로토타입에 대한 반응이 매우 좋았기 때문에 우리는 빠른 프로토타이핑 도구를 사용하여 컴퓨터 기반 MVP를 만들 수 있었다. 우리는 개인적으로 약 30명의 임상의들을 초대했고, 그들은 차례로 이메일과 트위터를 통해 동료들을 초대했고, 그 결과 30일 동안 90명이 프로토타입에 액세스했다. 이 중 30%는 계정을 활성화하고 최소 1건의 사례를 완료했다. 예상을 뛰어넘는 성과로 우리는 더 많은 발전을 지속하기로 했다. 불행하게도, 우리 기관은 다른 교육 우선 순위를 추구하기로 결정했고 이 프로그램에 대한 자금 지원은 철회되었다. 
The highly-favorable response to paper prototypes led us to create a computer-based MVP using a rapid-prototyping tool. We personally invited about 30 clinicians to play, who in turn invited colleagues by email and Twitter resulting in 90 people accessing the prototype over a 30-day period; of these, 30% activated an account and completed at least 1 case. With outcomes exceeding expectations, we decided to persevere with further development. Unfortunately, our institution opted to pursue other educational priorities and funding for this program was withdrawn.

논의
Discussion

린 스타트업은 지금까지 주로 비즈니스 벤처에 적용되었지만, 우리의 경험은 교육 혁신을 신속하게 테스트, 정제 및 포기하는 데 있어 이 접근 방식의 유용성을 강조합니다. 불과 5개월 만에 고객 니즈를 파악하고, 혁신을 위한 수많은 아이디어를 창출했으며, 공식적으로 3개의 혁신을 테스트했습니다(그 중 2개는 불과 2주 만에 폐기). 우리는 이 접근 방식이 교실 수업 방법, 온라인 모듈 및 게임, 소규모 그룹 형식, 임상 순환 구조, 평가 활동 및 커리큘럼 재설계를 포함한 사실상 모든 교육 혁신에 적용될 수 있다고 예상한다.
Although Lean Startup has thus far been applied primarily to business ventures, our experience highlights the utility of this approach in rapidly testing, refining, and abandoning education innovations. In only five months we identified customer needs, generated numerous ideas for innovation, and formally tested three innovations (abandoning two of them in as little as two weeks). We envision that this approach could apply to virtually any educational innovation, including classroom teaching methods, online modules and games, small group formats, clinical rotation structures, assessment activities, and curriculum redesigns.

우리는 (초기 '지속적 vs 피벗' 결정으로 제한되지 않음) 구현을 위해 선택된 아이디어를 다듬는 데 있어 이 접근 방식의 가치를 강조한다. Build-Measure-Learn은 혁신을 최대 규모(및 전체 투자)로 구축 및 테스트하는 일반적인 접근 방식과 달리 소규모(저비용) 테스트 실행을 기반으로 제품을 정교하게 다듬기 위해 반복되는 빠른 데이터 중심 주기를 강조합니다. 혁신자도 고객도 대개 고객이 진정으로 필요로 하는 것이 무엇인지 알지 못합니다. 린 스타트업은 상상된 니즈가 아닌 실제 니즈를 발견하고 해결할 수 있는 도구를 제공합니다.
We underscore the value of this approach in refining ideas once selected for implementation (not limited to the initial ‘persevere vs pivot’ decision). Build-Measure-Learn emphasizes fast, data-driven cycles that iterate to refine the product based on small-scale (inexpensive) test runs, in contrast to the typical approach of building and then testing an innovation at full scale (and full investment). Neither innovators nor customers usually know what the customer really needs; Lean Startup provides the tools to discover and address real rather than imagined needs.

린 스타트업은 (전통적인) 린 접근법, PDSA(Plan-Do-Study-Act), 식스 시그마, 구현 과학 등의 품질 개선 프레임워크와 대비된다. 이러한 전통적 접근법은 [고객 개발 및 검증된 학습('무엇을 만들 것인가?')]이 아닌, 주어진 제품이나 결과를 최소의 낭비와 오류('어떻게 더 낫게 만들 것인가?')로 제공하는 방법에 초점을 맞추고 있습니다. 린 스타트업은 디자인 사고(고객 중심 아이디어에 초점을 맞춘) 및 민첩성과 같은 다른 혁신 프레임워크를 보완하고 겹칩니다. (고객의 요구를 충족하기 위해 아이디어를 신속하게 점진적으로 세분화합니다.) 
Lean Startup contrasts with quality improvement frameworks such as (traditional) Lean approaches (Womack et al. 2007; LeMahieu et al. 2017b), Plan-Do-Study-Act (PDSA) (Cleghorn and Headrick 1996; Berwick 1998; LeMahieu et al. 2017b), Six Sigma (LeMahieu et al. 2017a), and implementation science (Glasgow et al. 1999; Nordstrum et al. 2017). These traditionally focus on how to deliver a given product or outcome with minimum waste and error (‘How to build it better?’) rather than customer development and validated learning (‘What to build?’). Lean Startup complements and overlaps other innovation frameworks such as design thinking (which focuses on customer-focused ideation) and Agile (which quickly incrementally refines ideas to meet customer demands) (Kidd and Johnson 2020).

Build-Measure-Learn은 과학적 방법의 다른 이름일 뿐이며, A-B 테스트는 단순히 집중(잠재적으로 무작위화됨) 제어 시험이다(Constable 2018). 잘 실행된 린 스타트업 프로젝트의 연구 결과는 종종 동료 검토 출판을 보증할 수 있으며, 특히 여러 주기의 연구 결과가 '실제로 작동하는 것'에 대한 일관된 메시지로 통합되는 경우 더욱 그렇다.
Build-Measure-Learn is just another name for the scientific method, and A-B testing is simply a focused (potentially randomized) controlled trial (Constable 2018). Findings from well-executed Lean Startup projects could often warrant peer-reviewed publication, especially if findings from several cycles are amalgamated into a coherent message of ‘what really works.’

우리가 '고객'이나 '비즈니스 모델'과 같은 용어를 사용하는 것은 교육의 시장화에 대한 지지를 의미하는 것이 아니라, 린 스타트업이 그 기원을 두고 있는 분야에서 이러한 용어를 빌렸을 뿐입니다. 교육의 시장화, 경제성, 비용효율은 이 글의 범위를 넘어서는 복잡한 주제이다.
Our use of terms like ‘customer’ and ‘business model’ does not imply endorsement of the marketization of education; we merely borrowed these terms from the field in which Lean Startup had its origin. The marketization, economics, and cost-effectiveness of education are complex topics beyond the scope of this article (Furedi 2011; Cook and Beckman 2015; Maloney et al. 2019).

결론
Conclusion

린 스타트업은 보건 전문 교육 분야에서 빠르고 강력한 혁신과 평가를 위한 엄청난 잠재력을 가지고 있다.
Lean Startup has tremendous potential for rapid, robust innovation and evaluation in health professions education.

 


Med Teach. 2022 Sep 28;1-12. doi: 10.1080/0142159X.2022.2118038. Online ahead of print.

Evaluating education innovations rapidly with build-measure-learn: Applying lean startup to health professions education

Affiliations collapse

Affiliation

1Division of General Internal Medicine, Mayo Clinic College of Medicine, Rochester, NY, USA.

PMID: 36170876

DOI: 10.1080/0142159X.2022.2118038

Abstract

Purpose: The Lean Startup approach allows innovators (including innovative educators) to rapidly identify and refine promising ideas into models that actually work. Our aim is to outline key principles of Lean Startup, apply these to health professions education, and illustrate these using personal experience.

Methods and results: All innovations are grounded in numerous assumptions; these assumptions should be explicitly identified, prioritized, and empirically tested ('validated learning'). To identify and test assumptions, innovators need to get out of the office and interact with customers (learners, teachers, administrators, etc). Assumptions are tested using multiple quick cycles of Build (a 'minimal viable product' [MVP]), Measure (using metrics that relate meaningfully to the assumption), and Learn (interpret data and decide to persevere with further refinements, or pivot to a new direction). The MVP is a product version that allows testing of one or more key assumptions with the least effort. We describe a novel 'Lean Education Canvas' that synopsizes an innovation and its business model on one page, to help identify assumptions and monitor progress. We illustrate these principles using three cases from health professions education.

Conclusions: Lean Startup has tremendous potential for rapid, robust innovation and evaluation in education.[Box: see text].

Keywords: Program evaluation; agile development; empirical research; qualitative research; research design.

코멘터리: 의학교육의 패러다임, 가치론, 인간행동학 (Acad Med, 2018)
Commentary: Paradigms, Axiology, and Praxeology in Medical Education Research
Zareen Zaidi, MD, PhD, and Douglas Larsen, MD, MEd

 

 

연구자들의 [연구 패러다임]과 [이론적 관점]은 [연구 과정]에 영향을 미친다. 승인된 RIME(Research in Medical Education) 기사를 예로 들어 다음 질문을 살펴봅니다. 연구자들의 철학적 기반은 무엇이며, 그것이 출판물에서 드러나나요? 어떤 연구 패러다임이 잠재적으로 그들의 방법 선택을 가이드하는가? 그런 다음 우리는 연구 결과가 다른 의학 교육자들의 행동에 어떻게 영향을 미칠 수 있는지 논의한다. 우리는 연구 설계가 패러다임, 이론, 방법론 및 방법을 어떻게 포괄하는지 강조한다. 더 진행하기 전에, 우리는 이 요약을 준비하는 동안 사용한 주요 개념에 대한 간단한 개요를 제공한다. 입문서와 관련된 더 자세한 자료는 관심 있는 사람들을 위한 참고 문헌에 제공된다. 우리는 독자들이 이러한 개념과 이론의 적용 가능성을 고려하여 자신의 실천과 연구를 안내할 것을 권장한다.
Research paradigms and theoretical perspectives of researchers influence the research process—even research questions posited by researchers are shaped by how they view the world. Using the accepted Research in Medical Education (RIME) articles as exemplars, we explore the following questions: What are the philosophical underpinnings of the researchers, and are they made visible in their publications? What research paradigms potentially guide their choice of methods? We then discuss how the results from research can influence actions of other medical educators. We highlight how research design encompasses paradigms, theory, methodology, and methods. Before proceeding further, we provide a brief primer on the key concepts that we used while preparing this summary. More detailed resources1–6 related to the primer are provided in the bibliography for those interested. We encourage readers to consider the applicability of these concepts and theories to guide their own practice and research.

프라이머: 연구자들은 그들의 연구 활동에 영향을 미치는 다양한 [철학적 프레임워크]나 [패러다임]을 따른다. [패러다임]은 신념이나 세계관의 집합으로 볼 수 있으며, 세계의 본질과 개인이나 사물에 대한 세계의 관계, 또는 단순히 인식론적 입장으로 볼 수 있다. 이러한 패러다임은 시간이 지남에 따라 진화해왔고 현재까지도 계속 그렇게 하고 있다. 연구자들은 일부 중첩이 있는 패러다임에 대해 다른 레이블을 사용할 수 있다. 따라서 패러다임은 경직된 프레임워크보다는 [관련이 있는 사상적 학파의 느슨한 결합]으로 간주되어야 한다. 가장 잘 알려진 패러다임으로는 실증주의/후기실증주의, 포스트모더니즘/포스트구조주의, 비판론/이데올로기 패러다임, 구성주의, 실용주의 등이 있다. 패러다임에 대한 포괄적인 검토를 제공하는 것은 저자들의 의도가 아니다. 오히려 우리는 독자들에게 이해하기 쉬운 설명을 우리의 후속 대화의 기초로서 제공하는 것을 목표로 한다.
Primer:
 Researchers follow various philosophical frameworks or paradigms that impact their research activities. Paradigms can be viewed as a set of beliefs or worldviews, the nature of the world and the relationship of the world to individuals or objects, or simply as epistemological stances.7 These paradigms have evolved over time and continue to do so to date. Researchers may use different labels for the paradigms with some overlap; therefore, the paradigms should be regarded as loosely bound, related schools of thought rather then rigid frameworks.3 The best-known paradigms include positivism/postpositivism, postmodernism/poststructuralism, critical theory/ideological paradigm, constructivism, and pragmatism.3,8 It is not the intent of the authors to provide an encompassing review of paradigms; rather, we aim to provide easy-to-understand descriptions for readers as a primer to our subsequent conversation.

[실증주의]는 역사적으로 가장 잘 알려진 패러다임이다. 이 패러다임을 따르는 연구자들은 [발견되어야 할 하나의 진실]이 있으며, [현실은 관찰 가능하고 측정 가능]하며, [인과관계 연구]를 통해 발견될 수 있다고 믿는다. 고정된 측정 가능한 현실에 대한 생각은 많은 비판을 받았고, 연구자들은 측정이 잘못될 수 있고, 편견이 있으며, 완전한 객관성은 불가능하다는 것을 인정했다. 이것은 객관성을 위해 노력하지만 완전한 중립성은 어떤 절대적인 의미에서도 얻을 수 없다는 것을 이해하는 연구자들과 함께 후기실증주의 패러다임을 이끌었다. [후기실증주의자]들은 "진실"은 근사치이며 "우리가 현실에 대해 알고 있는 것은 지금은 진실이다. 단, 더 많은 연구가 더 나은 설명, 더 정확한 척도를 찾을 때까지"라고 이해한다.
Positivism is historically the best-known paradigm.3 Researchers following this paradigm believe that there is a single truth to be discovered and that reality is observable, is measurable, and can be discovered in cause-and-effect studies.3,9 The idea of a fixed measurable reality received much criticism with researchers conceding that measurement is fallible, researchers have biases, and complete objectivity is not possible.3 This led to the postpositivist paradigm with researchers striving for objectivity but understanding that complete neutrality is not obtainable in any absolute sense.
Postpositivists understand that “truth” is an approximation or “what we know about reality is true for now—until more studies find a better explanation, a more accurate measure.”9,10 

[포스트모더니즘]은 어떤 현상의 현실이 그것을 경험하는 자와 주관적으로 상대적이라고 가정한다. 이 패러다임은 또한 탈구조적 또는 탈식민지적이라 불리며 [현대 사회에 대한 비판]을 제공한다. 포스트모던 연구자들은 [기존의 내러티브를 해체]하고 [현상에 대한 재개념화된 설명]을 만드는 것을 목표로 한다. 
Postmodernism posits that reality of a phenomenon is subjectively relative to those who experience it.11 This paradigm is also variably referred to as poststructural or postcolonial and offers critiques of modern society.3 Postmodern researchers aim to deconstruct existing narratives and produce reconceptualized descriptions of phenomena.12 

[비판적 이론/이데올로기 패러다임]은 연구를 통해 [인식된 사회적 부당성]을 [해결하는 것]을 목표로 한다. 이 패러다임에서는 [현실은 시간이 지남에 따라 결정되는 사회적, 정치적, 문화적, 경제적, 민족적, 성별적 가치에 의해 형성된다]는 것을 인정한다. 이 경우 연구자는 (포스트모더니즘과는 반대로) 연구과제, 목적, 방법의 중심이 되는 가치에 대해서 [proactive한 입장]을 가지고 있다. 
Critical theory/ideological paradigm aims to address perceived social injustices through research and advocating for policy changes, acknowledging that reality is shaped by social, political, cultural, economic, ethnic, and gender values crystallized over time.7 The researcher in this case (as opposed to postmodernism) has a proactive stance with values being central to the task, purpose, and methods of research.13 

[구성주의]는 현실이 그것을 경험하는 사람들에 의해 구성되고 상대적이라는 것을 인식한다. 지식은 [연구자와 참가자 사이의 경계]를 흐리게 하는 [우리의 상호 작용]을 통해 만들어진 구성으로 구성되므로 [객관성에 도전]한다. 지식은 연구자와 참여자에 의해 [공동으로 만들어지며 시간에 따라, 개인에 따라, 상황에 따라 달라진다]
Constructivism recognizes that reality is constructed by those who experience it and is relative.14 Knowledge consists of the constructions made through our interactions blurring the line between researchers and participants, therefore challenging objectivity. Knowledge is cocreated by researchers and participants and is time dependent, individual dependent, and context dependent.9 

[실용주의]는 종종 진실과 현실의 문제를 회피하는 "대안적 패러다임"으로 간주되며, 이는 연구자가 실증주의/후지향주의에서 구성주의에 이르는 패러다임의 범위 사이에서 선택을 강요받지 않도록 한다. 이 연구자들은 사회적, 역사적, 정치적 맥락을 인정하면서도, [연구의 목적에 초점]을 맞춘다. 즉, [진실]은 그 당시에 작동하는work 것으로 간주합니다. 
Pragmatism is often regarded as an “alternate paradigm” sidestepping issues of truth and reality, allowing the researcher to be free of being forced to make a choice between the ranges of paradigms from positivism/postpositivism to constructivism.15 These researchers focus on the purpose of research while appreciating social, historical, and political context—describing truth as what works at the time.16

[방법론]은 [방법의 설명과 정당화]이지 [방법 자체]가 아니다. [방법]은 연구의 실제 연구 활동 또는 실제 활동이다.1 빈틈없는 성찰적 연구자는 연구와 관련하여 자신의 패러다임을 설명하는 데 세심한 주의를 기울일 것이며, work에 inform하는 philosophy를 설명할 것이다. 
Methodology is the description and justification of methods, and not the methods themselves. Methods are the actual research actions or practical activities of research.1 An astute reflexive researcher will pay careful attention to describing their paradigm in relation to the research, describing the philosophy informing the work.

[가치론]은 연구 과정에서의 [가치의 역할과 위치], 특히 [패러다임, 방법론, 방법론 사이의 관계]에 대한 가치의 영향을 의미한다. 즉, 연구 패러다임이 가치론적인 이유는 [연구자의 가치]가 [방법의 선택]에 inform하기 때문이다.
The role and place of values in the research process, specifically the influence of values on the relationship between paradigm, methodology, and methods, is known as axiology—that is, the research paradigm is axiological in that the values of the researcher inform the choice of methods.

[프락세오로지]라는 단어는 프락시스, 즉 액션에서 유래했다. 프락세오로지(Praceology)는 [인간의 행동의 영향을 연구하거나 의미를 만들고 행동을 해석하는 과학의 한 분야]이다. [교육이 효과를 발휘하게 하고, 일상적인 교육 실천에서 더 잘 작동하게 만드는 데 있어서 연구의 의미는 무엇이냐]는 질문에 구체적으로 답한다.
The word praxeology stems from praxis—action. Praxeology is the branch of science which studies the effect of human actions or makes meaning and interprets actions.4,5 It specifically answers the question of what research means for making education work and making it work better in the everyday practice of teaching.4

RIME 출판물의 연구 패러다임은 어떻게 제정되는가?
How Are Research Paradigms Enacted in RIME Publications?

우리는 각 연구팀의 패러다임이 방법론에 어떤 영향을 미쳤는지 탐구함으로써 독자들에게 기사의 일반적인 요약을 제공하는 것을 넘어서는 것을 목표로 한다. "AM 마지막 페이지: 의학교육과 관련된 연구 패러다임에 대한 가이드"를 지침 프레임워크로 사용하여, 우리는 각 수용된 RIME 논문을 검토하여 작가의 연구 패러다임이 어떻게 가시화되고 사용되는 방법인 축성과 관련된 정보에 근거한 선택을 할 수 있는지 고려했다(표 1). 그런 다음 우리는 일상적인 교수 관행인 사전학에서 연구의 영향에 대해 논평한다. 우리는 저자들의 명시적인 진술이 없다면, 아래의 분류는 우리 자신의 해석을 나타내며, 저자나 다른 독자들이 동의하지 않을 수 있다는 것을 인식한다. 우리는 먼저 실증주의/후기실증주의 패러다임을 대표한다고 느끼는 연구 논문을 고려하고, 그 다음으로는 비판이론, 구성주의, 실용주의 패러다임을 가진 논문을 고려한다.
We aim to go beyond providing the readers with a general summary of the articles by exploring how paradigms of each research team influenced the methodology. Using “AM Last Page: A Guide to Research Paradigms Relevant to Medical Education17 as our guiding framework, we reviewed each accepted RIME paper to consider how authors’ research paradigm might be made visible and informed choices related to methods used—axiology (Table 1). We then comment on the impact of the research in the everyday practice of teaching—praxeology. We recognize that without explicit statements from the authors, the categorizations below represent our own interpretations, and the authors or other readers may disagree. We first consider the research papers we felt represented a positivist/postpositivist paradigm, followed by papers with critical theory, constructivist, and pragmatist paradigms.

Research paradigms in medical education research Suzanne Bunniss & Diane R Kelly

 

실증주의자/후기 실증주의자 패러다임 연구
Positivist/postpositivist paradigm research

이 패러다임에서 지식은 가설 검증에 의해 얻어진다. 쿨라세가람 등은 "발견의 순서와 그에 따른 직접 지도가 학생들의 기술 이전에는 도움이 되지만, 학생들의 유지나 시험 후 즉각적인 성과에는 도움이 되지 않는다"는 명확한 가설을 밝혔다. 연구 설계는 공식 지시(Do then see) 전에 시뮬레이션된 환경에서 학습자 봉합 기술 성능을 보다 일반적인 공식 지시 순서와 비교하고, 이어서 실습(Do then see)을 비교하기 위한 설득력 있는 무작위 제어 시험이다. 연구원들은 자기효능감과 학생들의 성취도에 관한 자료를 수집했는데, 이는 눈이 먼 평가자에 의해 5점 만점의 글로벌 평가 척도로 평가되었다.

Knowledge in this paradigm is gained by hypothesis testing. Kulasegaram et al18 articulate a clear hypothesis that “the sequence of discovery, followed by direct instruction would benefit students’ transfer of skills, but not their retention or immediate post-test performance.” The study design is an eloquent randomized controlled trial to compare learner suturing skills performance in a simulated setting before formal instruction (Do then See) versus the more typical sequence of formal instruction, followed by practice (See then Do). The researchers gathered data related to self-efficacy and student performance scored on a five-point global rating scale by a blinded rater.

연구자들의 [후기 실증주의 패러다임]은 기술 습득 측정에 초점을 맞춘 [실험 설계]에 반영된다. 후기실증주의에 충실하게, 저자들은 그들의 결과가 완전히 객관적일 수 없으며 봉합 작업에 할당된 단일 비율, 맥락 및 시간의 사용에 의해 영향을 받았다는 것을 인정한다. 또한, 그들은 다른 outcome를 연구하기로 선택할 수 있었다는 점에 주목한다. 특히, [행동 과정]은 [구성주의 패러다임]을 사용하여 가장 잘 연구되었을 수 있다.

The researchers’ postpositivist paradigm is reflected in the design of the experiment with its focus on the measurement of skill acquisition. True to postpositivism, the authors acknowledge that their outcomes cannot be completely objective and were impacted by the use of a single rater, the context, and time allocated for the suturing task. Additionally, they note that they could have chosen to study different outcomes—specifically, behavioral processes, which may then have been best studied using constructivist paradigms. 

[가치론]과 관련하여, 연구 목적을 보았을 때, 후기실증주의는 [연구 설계와 잘 일치]하고, [유용한 정보를 제공]한다. 저자들은 [먼저 스스로 과제를 탐색하고 고군분투한 다음 지시를 받은 학생]들이 [먼저 교육을 받은 다음 독립적인 연습을 통해 과제를 탐색하도록 허용된 학생]들에 비해 나중에 이전 과제를 더 잘 수행한다는 것을 보여준다. 이 연구의 결과는 직접 교육과 과제 완료를 수반하는 전통적인 교육에 도전하기 때문에 [시뮬레이션에 참여하는 의학 교육자들에게 영향]을 미칠 수 있다. [Guided SRL]과 [직접 교육]의 사려 깊은 조합은 그러한 학습 기회를 최적화할 수 있다.

Regarding axiology, for the purpose of their study the postpositivist paradigm is well aligned with the research design and provides useful information. The authors show that students who first are allowed to explore and struggle with the task on their own and then receive instruction perform better on a later transfer task compared with those who are instructed first and then allowed to explore the task through independent practice. The results of this study can and should impact medical educators involved in simulation as the results challenge traditional teaching involving direct instruction followed by completion of tasks. A thoughtful combination of guided self-regulated learning and direct instruction can optimize such learning opportunities.

[실증주의자/후기실증주의자 연구(양적 또는 질적)의 목적]은 [가설을 검정하고 변수 간의 인과관계를 설정하는 것]이다. 펠드만 외 연구진과 오니시 외 연구진은 모두 [테스트가 교육에 미치는 영향]을 조사한다. 펠드만과 동료의 연구에서, [후기실증주의 패러다임]은 국립 의학 컨퍼런스에서 사전 및 사후 테스트를 모두 통합한 정보를 가지고, [객관식 질문 기반 시험 강화 학습(TEL) 개입]의 사용과 관련된 연구 질문에 답하는 데 매우 적합했다. [무작위 대조 시험]을 실시한 결과, 그들은 사실을 반복적으로 검색하면 지속적인 의료 교육 환경(CME)에서 선언적 지식의 보존이 시간이 지남에 따라 향상된다는 것을 발견했다. 지속적인 전문성 개발(CPD)은 의료 전문가들이 자신의 업무 분야의 최신 변화를 최신으로 유지하도록 보장하는 데 필수적이다. 의료 전문가들은 CME 과정에 참여하며 지식과 숙련도를 입증하기 위해 면허 시험을 다시 치러야 한다. 본 연구가 기존 문헌에 덧붙이는 것은 검색실습을 촉진하는 인지시험이 학부 또는 대학원 교육에서 CPD에게도 마찬가지로 가치가 있다는 점이다. CME 인가 기관은 참석자들이 지식을 공고히 할 수 있도록 반복적인 TEL을 고려해야 한다.
The objective of positivist/postpositivist research (quantitative or qualitative) is to test hypotheses and to establish cause-and-effect relationships between variables.19 The studies by Feldman et al20 and Onishi et al21 both investigate the effect of testing on education. The postpositivist paradigm was well suited to answer Feldman and colleagues’ research question regarding the use of a multiple-choice-question-based test-enhanced learning (TEL) intervention on knowledge, which incorporated both pre- and posttesting at a national medical conference. Undertaking a randomized controlled trial, they found that repeated retrieval of facts improved retention of declarative knowledge in a continuing medical education setting (CME) over time. Continuing professional development (CPD) is essential in ensuring that health care professionals remain up-to-date with the latest changes in their fields of practice. Health care professionals attend CME courses and are often required to retake licensing exams to demonstrate knowledge and proficiency. What this study adds to the existing literature is that cognitive tests promoting retrieval practice are just as valuable for CPD as they are in undergraduate or postgraduate education. CME-granting agencies should consider repeated TEL to help attendees solidify their knowledge.

오오니시 등의 연구의 초점은 [이사회 인증 결정의 영향]을 결정하는 데 있으며, 이는 다음을 기반으로 합니다. 교육생이 전체 평가를 통과하기 위해 모든 하위 구성요소를 통과해야 하는지 여부(즉, 비보상적) 또는 한 하위 구성요소에 대한 성능이 평가의 다른 섹션에 대한 성능을 보상할 수 있는지 여부(보상적). 후기실증주의 패러다임에 기초하여, 저자들은 일본의 국가 데이터베이스를 사용하여, [종합점수]와 [보상성 및 비보상성 점수와 관련된 종합결정]의 [내부구조]와 [결과적 타당성] 증거를 검토했다. 그들은 인증 평가의 보상 및 비보상 채점에 대한 결정이 신뢰성에 극적인 영향을 미친다는 것을 입증한다. 특히, [역량과 안전이라는 이름으로 특정 요소를 반드시 통과시켜야 한다는 결정]에서 나오는 [비보상 채점]은 종종 평가의 신뢰성을 크게 떨어뜨릴 것이다. 비보상 채점은 학습자가 환자 안전에 영향을 미치는 특정 내용 영역에서 완전히 유능함을 보장하는 이점이 있지만, 전체적인 의사 결정 신뢰도 감소를 포함한 심리측정학적 결과를 고려할 필요가 있다. 연구의 [가치론(즉, 후기실증주의적 패러다임 렌즈)]과 [방법]은 잘 일치하지만, 저자들은 검사자의 설정, 맥락, 전문성, 학습자 샘플 및 가치가 모두 연구에 영향을 미칠 수 있다는 것을 인정한다. 본 연구의 결과는 자체 기관 또는 국가 차원에서 고평가 시험 계획에 참여하는 교육자들에게 특히 중요합니다. 예를 들어, 미국 의료 면허 시험(USMLE) 또는 면허 시험.


The focus of Onishi and colleagues’ research is to determine the impact of examining board certification decisions, which are based on whether trainees should pass all subcomponents to pass the entire assessment (i.e., noncompensatory)—or whether performance on one subcomponent can compensate for performance on other sections of the assessment (compensatory). Grounded in the postpositivist paradigm, using psychometric theory the authors used a national database in Japan to examine internal structure and consequential validity evidence of composite scores and composite decisions related to compensatory and noncompensatory scoring. They demonstrate that decisions about compensatory and noncompensatory scoring of certification assessments have dramatic effects on the reliability. Specifically, noncompensatory scoring, which emerges from a determination that a certain element absolutely must be passed in the name of competence and safety, often will significantly reduce the reliability of the assessment overall. Although noncompensatory scoring does have its benefits to ensure that learners are fully competent in specific content areas with implications for patient safety, there is a need to consider psychometric consequences including reducing the overall decision reliability. While the axiology of the study (i.e., the postpositivist paradigm lens) and its methods are well aligned, the authors do acknowledge that the setting, context, specialty, learner sample, and values of the examiners could all influence the study. The results of this study are particularly important for educators involved in the planning of high-stakes exams at their own institutions or at national levels—for instance, United States Medical Licensing Examination (USMLE) or licensing examinations.

펠드만 외 연구진과 오니시 외 연구진은 지식 측정에 대해 [후기실승주의적 관점]에서 접근하지만, 둘 다 [구성주의적 접근]이 가장 적합한 미래 연구에 대해 질문을 제기한다. 지식 보유도 중요하지만, CPD가 환자 치료나 의사가 침대 머리맡에서 "하는 것"을 개선하도록 하는 것이 중요하다. [구성주의적 방법]은 실제 수행, 테스트되고 평가되는 것에 대한 가치 판단, 특정 사실과 성과를 다른 것보다 더 중요하게 여기는 권력 구조, 신념 체계 및 문화적 편견에 대한 질문에 답하는 가장 좋은 접근법일 수 있다. 구성주의 연구는 후기실증주의 연구의 결과와 다른 관점을 제공하거나 추가할 수 있다.
Though the studies by Feldman et al and Onishi et al regarding the measurement of knowledge approach education from a postpositivist perspective, they both raise questions for future research that are best suited to a constructivist approach. Although knowledge retention is important, it is important to ensure that CPD improves patient care or what the physician “does” at the bedside. Constructivist methods may be the best approach to answering questions about real-life performance, about the value judgments made around what is tested and assessed, and about the power structures, belief systems, and cultural biases that value certain facts and performances over others. Constructivist studies may provide a different perspective than or could add to the results of the postpositivist research.

포스터 외 연구진과 박 연구진은 또한 실증주의 및 후기실증주의 패러다임을 사용하여 특정 작업장의 과제와 성과를 연구한다. 포스터 등은 [지식을 객관적인 것으로, 즉, 측정 가능한 고정된 현실]로 보았다. 그들은 [USMLE 테스트 상황]을 전자 건강 기록(EHR)의 사용과 관련하여 의대생들을 조사하는 기회로 사용했다. 데이터에 따르면 전국적으로 EHR을 사용하는 임상실습의 비율은 5년 동안 증가했지만, 이러한 기록에 메모를 입력하는 학생의 비율은 안정적으로 유지되었고, 오더를 실제로 입력하는 학생의 비율은 감소했다고 한다. 이 연구는 예측에 초점을 맞추고 일반화 가능한 데이터를 생성하는 것을 목표로 하기 때문에 주로 실증주의 패러다임에 속하지만, 저자들은 맥락(EHR의 가용성)이 결과에 영향을 줄 수 있다고 언급한다. 그들의 작업은 [두 가지 진행중인 대화에 영향]을 미칩니다. 하나는 환자 차트에 의대생에 의한 문서화를 허용하고 장려하는 [새로운 메디케어 가이드라인]에 관한 것이고, 다른 하나는 [레지던트 시작 전 환자 오더 작성 및 프로그레스 노트 작성의 숙련]을 권장하는 AAMC의 Core EPA 문서에 관한 것입니다. 커리큘럼 계획에 참여하는 의학 교육자들은 학생들이 이러한 과제를 연습하고 피드백을 받을 수 있는 적절한 기회를 갖도록 보장해야 한다.
Foster et al22 and Park et al23 also use positivist and postpositivist paradigms to study specific workplace tasks and performance. Foster et al view knowledge as objective—that is, a fixed reality, which is measurable. They used the USMLE test setting as an opportunity to survey medical students regarding the use of electronic health records (EHRs). Data revealed that while the percentage of clerkships nationwide using EHRs has increased over a five-year period, the percentage of students entering notes into those records has remained stable, and the percentage of students entering orders has actually decreased. This study falls mainly in the positivist paradigm as they focus on prediction and aim to produce generalizable data, though the authors mention that context (availability of EHRs) can impact the results. Their work has implications for two ongoing conversations, one regarding the new Medicare guideline that allows and encourages documentation by medical students in patient charts, and another regarding the Association of American Medical Colleges’ core entrustable professional activities document, which recommends proficiency in writing patient orders and progress notes prior to entering residency. Medical educators involved in curricular planning must ensure that students have adequate opportunity to practice these tasks and receive feedback.

Park 등은 [완전한 객관성이 달성될 수 없다는 것을 인정]하면서, 객관적인 지식을 얻기 위해 노력한다. 이들은 소아 인턴의 역량 등급 통계 분석에 업무량 측정치가 포함될 때 평가 점수의 신뢰성과 정밀도가 크게 증가한다는 것을 보여준다. 이 연구는 [후기실증주의적 패러다임과 일치]하여, 측정을 사용하여 복잡한 현상을 명확히 하고 통찰력을 제공한다. 이 연구는 직장 기반 평가(WBA)에서 교육생의 업무량 같은 [교란 요인을 식별]하는 것의 중요성을 강조한다. 대학원 의학 교육을 위한 인증 위원회는 이제 WBA가 필수적인 마일스톤 보고의 사용을 의무화하고 있다. 이 논문은 교육자 작업량을 포함한 작업장의 다른 복잡성을 고려하지 않고 WBA의 정확성에 대해 교육자들에게 생각할 거리를 제공한다.
Park et al strive to obtain objective knowledge, acknowledging that complete objectivity is not achievable. They demonstrate that when measures of workload are included in the statistical analysis of competency ratings for pediatric interns, the reliability and precision of assessment scores increase substantially. Consistent with a postpositivist paradigm, the study uses measurement to clarify and give insights into complex phenomena. The study highlights the importance of identifying confounders to workplace-based assessment (WBA), such as workload of trainees. The Accreditation Council for Graduate Medical Education now mandates the use of milestones reporting, for which WBA is essential. This paper provides food for thought for educators regarding the accuracy of WBA without taking into account other complexities of the workplace including trainee workload.

Burkhardt 등은 의대 입학전형에서 판단의 주관성을 제거하는 데 [예측적 입학모형(EM)]을 사용할 경우의 이점에 대한 가설을 생성하는데, 의대 입학사정관 등 교육 지도자들이 자신의 학교에 누가 다닐지 예측한다. 그들은 그들의 결과가 연역적이며 결과가 절대적으로 객관적이지 않을 수 있다는 것을 인정한다. 저자들은 [후기실증주의적 도구]를 사용하면 주관적인 판단을 제거함으로써 과정을 개선할 수 있음을 보여준다. EM 모델은 입학관리실에서 지원자의 가능한 행동에 대한 정보를 제공하기 위해 사용될 수 있으며, 특히 대표성이 낮은 소수자와 여성의 모집에서 유용하고, 주 내 지원자와 주 외 지원자의 균형을 맞추기 위해 사용될 수 있다. 저자들은 인간의 판단에 비해 열등하지 않고 일부 측면에서는 모델의 우월성을 보여준다. 이 연구는 다양성을 개선하기 위한 의도적인 실천/단계들이 얼마나 도움이 될 수 있는지를 보여주는 사례이다.
Burkhardt et al24 generate a hypothesis about the benefits of using a predictive enrollment model (EM) in eliminating subjectivity of judgments in the medical school admissions process, where educational leaders such as medical school admissions officers make predictions about who will attend their school. They acknowledge that their results are deductive and that outcomes may not be absolutely objective. The authors demonstrate that the use of a postpositivist tool can improve the process by eliminating subjective judgments. EM models can be used by admissions offices to provide information about likely behavior of applicants, which can be valuable in the admissions office particularly in the recruitment of underrepresented minorities and women, and to balance in-state versus out-of-state applicants. The authors show noninferiority and in some aspects superiority of their model compared with human judgment. This study is an example of how deliberate practice/steps to improve diversity can be helpful.

올해 RIME 선정에서 또 다른 [실증주의 연구]는 Aakre 등의 스코핑 리뷰이다. 연구자들은 전자 지식 및 관리 시점 교육 자원과 관련된 양적 및 질적 연구를 연구하기 위해 [중립적이고 객관적이며 독립적이며 가치 없는value-free 입장]을 유지한다. 가장 자주 인용되는 전자 자원은 UpToDate였다. 지식 자원의 교육적 또는 임상적 영향에 대한 연구는 부족했다. 의학 지식의 지속적인 성장과 그에 따른 효과적인 지식 합성과 실천으로의 번역의 필요성을 고려할 때, 이 분야의 추가 연구는 특히 자원이 지식과 치료 시점에 영향을 미치도록 보장하는 것이 중요하다.
Another positivist study in this year’s RIME selection is the scoping review by Aakre et al.25 The researchers maintain a neutral, objective, independent, and value-free stance to study quantitative and qualitative research related to electronic knowledge and point-of-care education resources. UpToDate was the most frequently cited electronic resource. A paucity of research was noted regarding the educational or clinical impact of knowledge resources. Given the ever-accelerating growth of medical knowledge, and the consequent need for effective knowledge synthesis and translation to practice, further research in this field is important, particularly ensuring that resources have impact on knowledge and at the point-of-care.

비판적 이론과 구성주의 패러다임 연구
Critical theory and constructivist paradigm research

곤잘레스 외 연구진과 수헤라 외 연구진은 [암묵적 편향 훈련]에 참여한 교육자와 학습자의 경험을 이해하고자 한다. 연구자들은 [구성주의 패러다임]을 가지고 있고 [근거 이론]을 사용한다. 구성주의에 충실하게, 저자들은 개인들 사이에 여러 진실이 구성된다고 믿으며, 연구 결과는 현실에 대한 인식이 사회적으로 어떻게 만들어지는지를 보여준다. 두 연구 모두 지속적인 성찰과 자기계발의 중요성을 강조한다. 수헤라 등은 [편견을 드러냄으로써 나타나는 긴장]과 [학습자와 교사가 이러한 긴장을 어떻게 조정하는지] 논의하는 반면, 곤잘레스 등의 연구는 [편향과 관련된 대화를 촉진하기 위한 교수진의 준비되지 않은 모습]을 보여준다. 그 결과는 편향 교육과 관련된 교수진 개발 및 참여자들이 자신의 편견을 발견했을 때 불안감을 해소하는 데 사용될 수 있다. 미국 의사회는 최근 의사를 고용하는 모든 조직에 의한 정기적이고 반복적인 암묵적인 편향 훈련의 제공을 옹호하는 입장문을 발표했다. 곤잘레스 외 연구진과 수헤라 외 연구진의 연구 결과는 교육과정 설계에 참여하는 교육자들에게 도움이 될 것이며, 과정을 알리는 중요한 팁을 제공할 것이다.
The studies by Gonzalez et al26 and Sukhera et al27 seek to understand the experiences of educators and learners engaged in implicit bias training. The researchers have a constructivist paradigm and use grounded theory. True to constructivism, the authors believe that multiple truths are constructed between individuals, and the results of the studies showcase how the perception of reality is socially created. Both studies highlight the importance of a constant process of reflection and self-improvement. Sukhera et al discuss the tensions emerging from revealing bias and how learners and teachers navigate these tensions, while the work by Gonzalez et al demonstrates the unpreparedness of faculty to facilitate conversations related to bias. The results can be used for faculty development related to bias instruction and to allay anxieties when participants discover their own biases. The American College of Physicians recently released a position statement advocating for the provision of regular and recurring implicit bias training by all organizations that employ physicians.28 The results of the research by Gonzalez et al and Sukhera et al will be helpful for educators involved in curriculum design, providing important tips to inform the process.

[비판적인 종합 검토]에서, 와이즈너와 에바는 [교육에 대한 인센티브]를 탐구하기 위해 문헌을 검토한다. [비판적 합성]은 [비판]과 [합성]의 두 가지 주요 방법론을 중심으로 진행된다. 저자들이 자신의 패러다임을 명시적으로 밝히지는 않지만, 기사를 검토한 결과, [여러 개의 진실이 존재한다는 것을 인정]하면서, [비판적인 입장]을 취하고 있음을 알 수 있다. 저자들은 문학의 종합(의학 교육뿐만 아니라 심리학, 행동학, 조직학 문헌도 포함)을 제공한다. 그러나 한 걸음 더 나아가 이용 가능한 문헌을 비평한다. 그들은 교수진별로 자체 보고된 인센티브를 나열하고, 비판을 제공하는 동안 교수진이 어떻게 교수와 관련된 재정적 의욕 저하에 대한 우려(즉, 진료소에 있지 않음으로써 포기하는 돈)를 제기하지 않는지에 대해 논의한다. 또한, 그들은 [인센티브의 영향]은 다른 개인의 동기 부여에 영향을 미치는 요인에 좌우되며 제공되는 인센티브의 유형은 신중하게 고려되어야 한다고 지적한다. 비판적 합성은 의료 교육자들이 일하는 많은 맥락에서 인센티브가 어떻게, 언제, 왜 작동하는지에 대한 더 큰 명확성이 필요하다는 것을 강조한다.
In a critical synthesis review, Wisener and Eva29 review the literature to explore incentives for teaching. Critical synthesis revolves around two main types of methodology: criticism and synthesis. Although the authors do not explicitly state their paradigm, a review of the article reveals that they take on a critical stance, acknowledging that multiple truths do exist. The authors provide a synthesis of literature—not just from medical education but also psychology, behavioral, and organizational literature—but then go a step further to critique the available literature. They list self-reported incentives by faculty and, while providing a critique, discuss how faculty neglect to bring up concerns of financial disincentives associated with teaching (i.e., money that is given up by not being in clinic). Additionally, they point out that the influence of an incentive is dependent on factors influencing different individuals’ motivation and that the type of incentive offered has to be carefully thought out. The critical synthesis highlights that the field needs greater clarity regarding how, when, and why incentives operate within the many contexts in which medical educators work.

실용주의 패러다임 연구
Pragmatism paradigm research

Gowda 등은 [예술에 대한 조사를 통해 관찰능력을 기르는 과목]의 효과를 [성찰 능력, 불확실성에 대한 관용, 개인적 편견에 대한 인식에 미치는 영향]으로 조사하였다. [과정이 관찰에 미치는 영향]을 탐구한다. 저자들은 그들의 패러다임을 명시적으로 언급하지는 않지만, 현실 세계의 입장을 채택하면서 엄격함을 만들어내기 위한 [다양한 방법의 필요성]을 인정한다. 즉, "질문에 대한 과정[연구] 접근법 및 혼합을 명확히 하는 것"입니다. 저자들은 수업의 효과를 질적으로 탐구하기 위해 포커스 그룹뿐만 아니라 반영 능력에 대해 이전에 확립된 평가 척도를 사용하는 혼합 방법 설계를 사용한다. 그들은 과정에 참여하는 학생들의 성찰 능력이 향상되고, 세상을 관찰하고 해석하는 데 있어 주관성의 역할에 대한 인식이 증가된 것을 발견했다. 이 연구는 모든 교육자, 특히 임상 기술을 가르치는 데 관련된 모든 교육자에게 중요하다. [주의 깊은 관찰]은 학생들에게 자동적으로 존재하는 것으로 추정되어서는 안 되며, 학습된 기술로 간주되어야 한다. 또한 관측한 것의 불확실성을 성찰하는 능력은 학생들에게 모호하게 될 수 있다. 그 연구는 또한 교과과정에서의 예술과 인간의 통합을 지원하기 위해 증거를 제공하는 증거이다.

Gowda et al30 explore the effects of a course on observation through examining art in influencing reflective ability, tolerance for uncertainty, and awareness of personal bias. The authors do not explicitly state their paradigm but do acknowledge the need for diversity of methods to produce rigor, adopting a real-world stance, i.e., a “horses for courses [whatever works] approach to the question, and clarifying the mix.”16 The authors use a mixed-methods design using previously established rating scales for reflection ability as well as focus groups to explore the effects of the course qualitatively. They found improvement in reflective ability of students participating in the course and an increased awareness of the role of subjectivity in observing and interpreting the world. This study is important for all educators but particularly those involved in teaching clinical skills. Careful observation should not be presumed to be automatically present in students and should be considered a learned skill. Additionally, the capacity to reflect on the uncertainty of observations can help students deal with ambiguity. The study is also valuable because it provides evidence to support the integration of arts and humanities in the curriculum.

결론들
Conclusions

올해의 RIME 기사에서, 저자들은 개념적 틀을 명확하게 표현했거나, 저자들이 누구의 작품을 만들고 있는지에 대해 진술했다. 그러나 연구 패러다임을 명확히 밝힌 논문은 두 편뿐이었다. 이 두 저자들은 구성주의 관점에서 연구 질문을 하고 있다고 언급했다. 질적 연구원들은 그들이 방법을 정당화하기 위해 그들의 패러다임을 분명히 할 수 있다는 것을 느낄 수 있다. 우리가 느끼기에 드러났다고 보는 논문은 실증주의, 후기실증주의, 실용주의 패러다임에 대한 것이었는데, 패러다임적 입장을 명시하지 않았다. 대부분의 서류들이 실증주의/후기실증주의 패러다임을 주목하는 것은 흥미롭다. 우리는 연구논문에 귀속되는 연구 패러다임이 논문에 제공된 정보를 바탕으로 한 우리 자신의 연구 해석임을 지적하고 싶다. 작가로부터 명확한 진술 없이, 우리는 이러한 해석에 동의하지 않았고, 작가들은 우리의 해석과 동의하지 않을 수 있다. 
In this year’s RIME articles, the authors have either clearly articulated conceptual frameworks (Burkhardt et al,24 Gonzalez et al,26 Kulasegaram et al18), or the authors state on whose work they are building (Aakre et al,25 Feldman et al,20 Foster et al,22 Gowda et al,30 Onishi et al,21 Park et al,23 Sukhera et al,27 Wisener and Eva29). However, only two papers had clearly articulated a research paradigm (i.e., Gonzalez et al and Sukhera et al). These authors state that they were approaching the research questions from a constructivist perspective. It is possible that qualitative researchers may feel they need to state their paradigm clearly to justify the methodology. The papers that we felt represented positivist, postpositivist, and pragmatism paradigms did not explicitly state their paradigmatic position. It is interesting to note that the majority of papers belonged to the positivist/postpositivist paradigms. We would like to point out that the research paradigms attributed to the research papers (other then Gonzalez et al and Sukhera et al) are our own interpretations of the research, based on information provided in the paper. Without clear statements from the authors, we had difficulty making these interpretations, and it is possible that authors may disagree with our interpretations.

연구 패러다임에 관한 연구는 거의 없다. 그러나 의학교육에 대한 실험적 연구를 검토한 결과, 사용된 개념적 틀에 대한 명시적 문구가 조사된 논문의 절반 미만이 포함되어 있어 의학교육 연구자들이 연구에 사용한 개념적 틀을 명확하게 기술해야 한다는 주장이 제기되었다. 패러다임 입장과 관련한 명시적 진술이 담긴 전체 의학교육 연구 논문의 수에 대해서는 언급할 수 없지만, 모든 의학교육 연구자들이 자신의 [개념적 프레임워크]뿐만 아니라 [연구 패러다임]도 명확하게 밝힐 것을 권장한다. 예를 들어 후기실증주의 저자들의 명시적 진술은 지식 및 지식 및 지식에 영향을 미칠 수 있다. 연구원들은 택시 기술을 유지하는 방법에 대한 설명을 추가하고 그들의 연구를 논의해야 한다. 검토자, 편집자, 편집자 및 독자들은 일반적이어야 한다. 우리는 "우리가 알고 있는 것을 의도적으로 아는 것"은 것이 어려울 수 있다는 것을 인정한다. 그리고 라벨을 붙이는 것은 때때로 불가능해 보일 수 있지만, 패러다임의 한계를 아는 것은 그것을 명확히 하는 것만큼 중요하다. 
There is little available in medical education literature about research papers articulating research paradigms. However, a review of experimental studies in medical education revealed that less half the articles examined contained an explicit statement of the conceptual framework used, leading to calls for medical education researchers to clearly state the conceptual framework they have used in their research.31,32 We are unable to comment on the number of overall medical education research papers containing explicit statements regarding paradigms stances, but we encourage all medical education researchers to clearly state not just their conceptual frameworks but also the research paradigm. Explicit statements of paradigm by postpositivist authors, for example, might influence the discourse around knowledge and the limitations of any one way of knowing. Researchers should also consider adding a statement of how they maintained axiology and discuss the praxeology of their research. Reviewers, editors, and readers need to evaluate the rigor of research, and clear statements by authors should be the norm. We acknowledge that it can be challenging to “intentionally know what we know,” and to articulate and label may at times seem impossible, but knowing the limits of our paradigm is as important as articulating it.33

좋은 품질의 연구는 패러다임, 방법론, 그리고 방법들을 다루고 그들 사이의 내부적인 일관성을 입증한다.1 이러한 가치론적 무결성은 연구 증거를 전달, 번역 또는 합성하는 데 가치를 유지할 수 있는 능력을 가지고 있다. 우리는 의학 교육 연구자들이 그들의 연구의 가치론적 무결성을 고려할 것을 권고한다. 연구자들은 시간이 지남에 따라 연구자의 기억, 성찰 및 관점을 위한 저장소 역할을 하기 위해 [성찰 저널]을 유지하는 것을 고려할 수 있다. 연구과정에 대한 메타인지적 성찰을 위한 저널 형태로 제공되는 공간은 성찰성 발달에 도움이 될 수 있다. 
Good-quality research attends to paradigm, methodology, and methods and demonstrates internal consistency between them.1 This axiological integrity then has the ability to retain values in transferring, translating, or synthesizing research evidence.34 We recommend that medical education researchers consider the axiological integrity of their research. Researchers can consider maintaining a reflexive journal to serve as a repository for their researcher’s memories, reflections, and perspective over time. The space provided in the form of a journal for metacognitive reflection on the research process can help in the development of reflexivity.35

결론적으로, 연구자들은 종종 특정한 연구 패러다임을 가지고 연구 질문들에 접근한다. [패러다임적 입장]은 질문의 유형과 선택 방법을 결정합니다. 비록 패러다임의 명확성이 중요하지만, 어떤 한 가지 입장도 인간 학습의 복잡한 현상의 모든 측면을 설명하는 것은 불가능하다는 것을 인식하는 것이 중요하다. 각 접근 방식에는 강점과 한계가 있습니다. 교육에서 가장 중요한 많은 이슈들은 다중 렌즈를 통해 탐구될 수 있다. 올해 RIME 프로그램의 연구는 연구자들이 다루는 질문의 다양한 패러다임을 보여준다. 렌즈의 다양성을 고려함으로써, 자신의 접근 방식의 한계와 향후 단계에 대한 가능성이 더 명확해진다. 이러한 깨달음은 우리의 연구에 겸손함을 가져다 주고 더 큰 가능성을 열어줍니다.
In conclusion, researchers often approach the questions that they investigate from a particular research paradigm. This stance determines the types of questions that can be asked and the methods that are chosen. Although paradigmatic clarity is important, it is important to recognize that no one view or approach is able to describe all aspects of the complex phenomena of human learning. Each approach will have its strengths and limitations. Many of the issues that are most important in education can be explored through multiple lenses. The studies from this year’s RIME program demonstrate a diversity of paradigms of the questions that researchers address—by considering the diversity of lenses, the limitations of one’s own approach and possibilities for future steps become more clear. This realization brings humility to our research and opens us up to greater possibilities.

 

 


Acad Med. 2018 Nov;93(11S Association of American Medical Colleges Learn Serve Lead: Proceedings of the 57th Annual Research in Medical Education Sessions):S1-S7.

 doi: 10.1097/ACM.0000000000002384.

Commentary: Paradigms, Axiology, and Praxeology in Medical Education Research

Affiliations collapse

Affiliation

1Z. Zaidi is associate professor and associate chief of faculty development, Division of General Internal Medicine, director of scholarship, Department of Medicine, and director of longitudinal portfolios, University of Florida College of Medicine, Gainesville, Florida; ORCID: http://orcid.org/0000-0003-4328-5766. D. Larsen is associate professor of neurology and pediatrics, Department of Neurology, and director of medical student education, Division of Pediatric and Developmental Neurology, Washington University School of Medicine, St. Louis, Missouri.

PMID: 30365423

DOI: 10.1097/ACM.0000000000002384

Abstract

This supplement includes 11 research papers accepted by the 2018 Research in Medical Education Committee. In this Commentary, the authors draw the attention of medical educators and researchers to questions about the researcher's philosophical paradigm. Such questions fundamentally guide research-the choice of conceptual frameworks, methods, and methodology. The authors provide a brief overview of research paradigms and the related concept of axiology and praxeology in medical education research. The authors map the 11 accepted research articles, describing the researchers' stated or implied worldviews and the impact on chosen methods. The authors close by encouraging researchers to state the research paradigm behind their research, comment on how they ensured that the methods used displayed consistency with that paradigm, and highlight the value the research adds to everyday education.

의학교육연구자의 연구 패러다임 선택 가이드: 더 나은 연구를 위한 기반 만들기(Med Sci Educ. 2019)
A Medical Science Educator’s Guide to Selecting a Research Paradigm: Building a Basis for Better Research 
Megan E.L. Brown1 & Angelique N. Dueñas1

 

서론
Introduction

최근 의학 교육 내에서 방법론적 엄격성을 높이는 움직임이 있었다[1, 2]. 많은 학자들은 "학문적 정당성"을 달성하기 위해서는 [3] 강력한 이론적 틀[4,5]이 작품 내에서 지식의 본질에 관한 논의에 참여하는 것이 필요하다고 주장한다[6]. 간단히 말해서, 명확한 연구 원칙은 다른 사람들이 당신의 연구를 이해하는 데 도움이 됩니다.
There has been a recent movement within medical education towards greater methodological rigor [1, 2]. Many scholars argue that in order to achieve “academic legitimacy” [3] strong theoretical frameworks [4, 5] engaging in discussion concerning the nature of knowledge within a piece of work are required [6]. Put simply, clear research principles assist others in understanding your research.

연구 프로젝트의 패러다임 내에서 작품 내 지식의 본질을 상세히 설명하고 탐구한다. [연구 패러다임]은 "문제를 어떻게 이해하고 다루어야 하는지에 대해 과학자들 간에 공유되는 공통의 믿음과 합의의 집합"으로 정의될 수 있다[7]. 패러다임은 사물이 어떻게 작동하는지에 대한 가정이며, 때때로 "현실에 대한 공유된 이해"를 포함하는 "세계관"으로 설명된다[8, 9]. 패러다임은 "문제 해결 방법을 안내"하고, 작가의 방법 선택에 직접적인 영향을 미치기 때문에 자신의 연구 패러다임을 상세히 설명하는 것이 필수적이다[10]. 모든 연구자들은 연구를 시작하기 전에 [세계의 상태에 대한 가정]을 한다. 그 연구가 양적인지 질적인지에 관계없이, 이러한 가정은 연구 결과의 해석에 영향을 미치기 때문에 중요하다. 미트로프와 보노마는 이러한 입장을 요약하고 "실험의 힘은 그 기초가 되는 기본 가정의 명확성만큼만 강력하다. 이러한 가정은 실험실 실험뿐만 아니라 사회적 연구에도 기초를 두고 있습니다."라고 말했다 [11]. 패러다임은 또한 현상을 관찰할 때 이론의 적용을 위한 [기본 규칙ground rules을 설정]하는 데 도움이 된다. 이러한 기본 규칙은 연구를 위한 "상황을 설정set the scene"하여 새로운 개념을 가장 잘 평가하는 방법에 대한 정보를 제공한다[7].
The nature of knowledge within a piece of work is detailed and explored within a research project’s paradigm. A research paradigm may be defined as “the set of common beliefs and agreements shared between scientists about how problems should be understood and addressed” [7]. A paradigm is an assumption about how things work, sometimes illustrated as a “worldview” involving “shared understandings of reality” [8, 9]. Detailing one’s research paradigm is essential, as paradigms “guide how problems are solved” [10], and directly influence an author’s choice of methods. All researchers make assumptions about the state of the world before undertaking research. Regardless of whether that research is quantitative or qualitative, these assumptions are important as they impact upon the interpretation of a study’s results. Mitroff and Bonoma summarize this position and put forth “the power of an experiment is only as strong as the clarity of the basic assumptions which underlie it. Such assumptions not only underlie laboratory experimentation but social… research as well” [11]. Paradigms also assist in setting ground rules for the application of theory when observing phenomena. Such ground rules “set the scene” for research, providing information as to how best evaluate new concepts [7].

그 결과, 의학 및 보건 전문직 교육은 전통적으로 실증주의 또는 포스트 실증주의 패러다임에서 수행되어 왔으며, 이 두 패러다임 모두 [보편적인 진리가 존재함]을 유지하며, "의학에서는 신체 부위, 상태 및 치료에 대한 강조하는 것은, 보편적으로 일정하게 복제 가능한 팩트가 있음을 가정한다." [12] 이러한 신념이 지배적이라는 점을 감안할 때, 의학 교육 내에서는 패러다임적 가정을 명시적으로 상술하는 문학이 상대적으로 부족했다. 이것은 연구 및 강의실 모두에서 결과 해석과 기본 규칙 설정에 있어 가정이 수행하는 중요한 역할을 점점 더 널리 인식하면서 변화하고 있다[13, 14]. 이처럼 자신의 패러다임을 명시적으로 인정하는 것이 의료과학교육 연구의 기대 요소가 되고 있다.
Medicine and, as a consequence, health professions education, has traditionally been conducted from a positivist or post-positivist paradigm, detailed later in this paper, both of which maintain a universal truth exists, as, “in medicine, the emphasis on… body parts, conditions and treatments assumes that these are universally constant replicable facts” [12]. Given the dominance of this belief, there has been a relative dearth of literature within medical sciences education explicitly detailing paradigmatic assumptions. This is changing, with an increasingly widespread recognition of the important role assumptions play in result interpretation and in setting ground rules, both in research and in classrooms [13, 14]. As such, explicitly acknowledging one’s paradigm is becoming an expected element of medical science education research.

연구의 패러다임을 자세히 설명하기 위해서는 패러다임이 무엇으로 구성되어 있는지를 고려하는 것이 중요하다. 작품의 패러다임은 그림 1에 자세히 나와 있는 여러 개의 "구성 요소"로 구성되어 있다. 이러한 구성 요소들의 첫 번째 집합(축론, 존재론, 인식론, 방법론)은 자신의 방법을 선택하는 것과 같은 "직접적인 사고와 행동"이라는 철학적 가정으로 구성된다[16].
In order to detail your work’s paradigm, it is important to consider what a paradigm consists of. The paradigm of a piece of work is constructed of several “building blocks,” detailed in Fig. 1. The first set of these building blocks (axiology, ontology, epistemology, methodology) are composed of philosophical assumptions that “direct thinking and action” such as selecting one’s methods [16].

프로젝트 패러다임 구축의 첫 번째 "벽돌"인 가치론Axiology는 가치와 윤리에 대한 연구를 포함합니다 [17]. 연구할 가치가 있는 영역이 확인되고 연구 윤리가 고려되면 "현실의 본질"에 대한 질문인 존재론Ontology가 고려되어야 한다[3]. 일단 당신이 당신의 연구 영역의 현실에 대한 확고한 철학적 이해를 가지고 있다면, [그 현실 안에 있는 지식의 본질]은 결정할 필요가 있다. —이것은 인식론epistemology이라고 알려져 있다.
Axiology, the first “brick” in the construction of a project’s paradigm involves the study of value and ethics [17]. Once an area of value to study has been identified, and research ethics considered, ontology, which questions “the nature of reality” [3] must be contemplated. Once you possess a firm philosophical understanding of your study area’s reality, the nature of knowledge within that reality needs determining—this is known as the epistemology of a piece of work.

작품의 존재론와 인식론에 대한 솔직한 논의를 통해 적절한 방법론Methodology적 접근법을 선택할 수 있고 결과 해석을 둘러싼 모호성을 줄일 수 있다[18]. 그러한 규정regulation이 없으면 "가정의 기본 맥락"이 불분명하기 때문에 "세심하게 수집된 결과도 오해를 일으킬 수 있다" [19]. 이 모노그래프는 의학 교육 연구에 적합한 패러다임을 선택하기 위한 방법 가이드를 구성하는 일련의 고려 사항을 자세히 설명합니다.
Frank discussion of a work’s ontology and epistemology allows an appropriate methodological approach to be selected and reduces the ambiguity surrounding result interpretation [18]. Without such regulation “even carefully collected results can be misleading” as the “underlying context of assumptions” is unclear [19]. This monograph will detail a series of considerations, forming a how-to guide, for selecting an appropriate paradigm for your medical sciences education research.

연구를 시작하기 전에 연구 패러다임을 선택하십시오.
Select your Research Paradigm Before You Begin Researching

패러다임이 양적 및 질적 연구의 설계에 정보를 제공하고 근본적으로 뒷받침한다는 점을 고려할 때, 연구를 시작하기 전에 패러다임을 선택하는 것이 중요합니다. Terherani 등은 이 필요성을 훌륭하게 설명한다. "연구 접근법의 기초가 되는 신념 체계, 연구 질문, 연구 접근법 사이의 정렬은 엄밀한 연구를 위한 전제 조건이다."[20]. 이러한 정렬은 오로지 전향적으로만 확보될 수 있다.
Given that paradigms inform the design of, and fundamentally underpin, both quantitative and qualitative research, it is important to select your paradigm before you begin researching. Teherani et al. emphasize the need for this nicely: “alignment between the belief system underpinning the research approach, the research question, and the research approach itself is a prerequisite for rigorous… research” [20]. Such alignment can only be assured prospectively.

작품의 연구 패러다임을 고려하지 않는 것에 대해 자주 인용되는 한 가지 주장은 이 과정의 시간 소모적인 특성이다. 인정하건대, 연구 패러다임을 선택하는 것은 시간이 걸리며, 잘 수행된다면 그렇게 해야 한다. 연구 프로젝트의 일정표를 작성할 때 이러한 고려 사항을 계획에 포함시키십시오. 해당 프로젝트와 연구팀에 따라 연구 패러다임을 선택하는 데 얼마나 많은 시간을 할애해야 하는지에 대한 지침을 제공하기는 어렵다. 연구 패러다임의 고려사항을 연구의 "설계" 단계에 포함시키는 것이 좋습니다. 현재 작업을 사용하는 것은 또한 이 작업의 시간 소모적인 측면을 줄이는 데 기여할 것이다. 많은 초보자들에게 패러다임의 언어와 과정에 접근하는 것은 힘들고 시간이 걸릴 수 있다. 그러나 이 작업은 그 과정을 쉽게 하기 위해 고안되었습니다. 
One frequently cited argument for not considering the research paradigm of a piece of work is the time-consuming nature of this process. Admittedly, selecting a research paradigm does (and should if done well) take time. Ensure you factor this consideration into your plans when drafting a timeline for your research project. It is difficult to provide guidance on how much time one should spend selecting a research paradigm as, depending upon the project in question and research team, this may vary. We recommend threading consideration of your research paradigm into the “design” phase of your research. Using the present work will also contribute to reducing the time-consuming aspect of this work; for many novices, approaching the language and process of paradigms can prove daunting and take time. However, this work is designed to ease that process.

유리 상자의 은유를 사용하여 연구 패러다임에 대해 생각해 보세요.
Try Thinking About Research Paradigms Using the Metaphor of a Glass Box

연구 패러다임은 위압적으로 보일 수 있습니다. 실제로, 경험이 많은 학자들조차도 패러다임을 구성하는 다양한 구성 요소를 구별하는 데 어려움을 겪을 수 있다. Varpio[21]가 설명한 바와 같이 [유리 상자의 은유]를 사용하여 연구 패러다임을 생각하는 것은 패러다임의 구성 요소를 더 잘 시각화하고 이해하는 데 도움이 될 수 있다. 이 은유에 따르면, 여러분의 패러다임은 여러분이 서 있는 유리 상자입니다. 여러분이 바깥 세상을 어떻게 보는지 틀을 잡습니다. 지식의 존재론과 인식론에 대한 한 사람의 믿음은 다른 방식으로 유리 상자를 색칠하여 개인마다 같은 상황에 다른 빛을 제공한다. 따라서, 같은 영역 내의 동료와 다른 접근 방식을 사용하여 주제를 연구할 수 있습니다.
Research paradigms can seem overwhelming—indeed, even experienced academics may struggle to distinguish between the various building blocks constituting a paradigm. Thinking of one’s research paradigm using the metaphor of a glass box, as described by Varpio [21], may assist in better visualizing and understanding the constituent elements of a paradigm. Using this metaphor, your paradigm is the glass box in which you stand, framing how you see the outside world. One’s beliefs regarding the ontology and epistemology of knowledge color the glass box in different ways, lending different lights to the same situation for different individuals. Given this, you may research a topic using a different approach to your colleague within the same area.

연구를 수행하는 이유에 대해 생각해 보세요.
Think About your Reason for Carrying Out the Research

이는 너무나도 당연한 고려사항으로 보일 수 있지만, 의학교육 연구 내에서 의식적으로 반영되지 않는 경우가 많은 분야이다. 이 주제를 공부하게 된 동기가 무엇입니까? 당신은 실질적으로, 학문적으로, 또는 정치적으로 동기부여를 받은 적이 있습니까? 다시 말해,

  • 여러분이 일상 업무에서 깨달은 것이 더 많은 공부가 필요한 것일까요? 
  • 당신은 단순히 더 많은 것을 알고 싶은 걸까요?
  • 당신이나 다른 사람들이 관심이 있는 정치적인 "핫 토픽"이 있는가?

This may seem like an obvious consideration, but it is an area that is often not consciously reflected upon within medical science education research. What is your motivation to study this topic? Have you been practically, academically, or politically motivated? In other words,

  • is it something you have noticed in your day to day work that requires further study;
  • are you simply passionate to know more; or
  • is there a political “hot topic” you or others are interested in researching?

여러분의 동기에 대한 여러분의 초기 생각을 바탕으로, 여러분이 정말로 성취하려고 하는 것에 대해 더 깊이 반성하도록 노력하세요. Chilisa는 표 1 [23]에서 볼 수 있듯이 연구를 수행하는 다양한 패러다임적 이유를 비교합니다. 연구를 하는 당신 자신의 이유를 생각하고 이것을 칠리사의 이유와 비교하는 것은 어떤 패러다임이 당신의 연구에 적합한 선택일 수 있는지를 비추기 위한 시작이 되어야 한다.
Building upon your initial thoughts regarding your motivation, try to reflect more deeply regarding what you are really trying to achieve. Chilisa compares different paradigmatic reasons for doing research, as can be seen in Table 1 [23]. Thinking of your own reason for doing research and comparing this with Chilisa’s reasons should begin to cast light on which paradigm may be an appropriate choice for your research.

당신의 공리학적 접근 방식을 고려하라.
Consider your Axiological Approach

당신의 연구를 위한 적절한 패러다임을 고려하는 다음 단계는 당신의 공리학적 접근 방식을 반영하는 것이다. 전통적으로 구바와 링컨은 패러다임을 [세 가지 구성 요소]를 포함하는 것으로 설명한다. [존재론, 인식론, 방법론] [24]. 그러나, 패러다임의 네 번째 정의 특성으로 [가치론]을 포함하는 방향으로의 움직임이 있었다[25]. 가치론은 윤리적 고려를 포함하며, 연구 분야 내에서 "무엇이 이뤄져야 하는지" 묻는다 [26]. [연구할 가치가 있는 것이 무엇인지]과 [해당 영역 내에서 윤리적 연구를 수행하는 방법]을 고려하기 때문에 제안된 연구의 중요한 출발점이다[27]. 이를 고려하여 Grix의 패러다임 구성 요소[15]를 수정하여 패러다임 선택의 초기 핵심 고려사항으로 가치론을 포함시켰다(그림 1).

The next step in the consideration of an appropriate paradigm for your research is reflecting upon your axiological approach. Traditionally, Guba and Lincoln describe a paradigm as involving three building blocks: ontology, epistemology, and methodology [24]. However, there has been a move towards including axiology as a fourth defining characteristic of a paradigm [25]. Axiology involves ethical considerations and “asks what ought to be” within a field of research [26]. It is an important starting point for any proposed research, as it considers what would be of value to research and how to go about conducting ethical research within that area [27]. Given this, we modified Grix’s paradigmatic building blocks [15] to include axiology as a key early consideration in paradigm selection (Fig. 1).

[가치론적 접근 방식]을 고려하는 것은 연구 제안의 계획 단계에서 여러분의 연구 팀의 모든 구성원과 함께 지정된 성찰적 공간에서 수행하는 것이 가장 좋습니다. 연구를 하는 목적을 고려하면서, 당신은 당신의 프로포절에 informing하는 [개인적인 가치]를 고려해야 한다. 자신에게 다음과 같이 물어보세요.

  • 왜 이 연구가 [내 시간과 관심을 기울일 가치]가 있을까요?
  • 무엇이 [나에게 동기를 부여]합니까? 나는 어떤 명령(예: 자금, 사회 정의)에 의해 움직입니까?
  • 아니면, [나는 교육이 본질적으로 가치있]고, [교육실천에 inform하는 모든 연구에 정당성을 제공한다]고 믿습니까? [28]

Considering your axiological approach is best done in a designated reflective space with all members of your research team during the planning phase of a research proposal. Building on considering your purpose in doing research, you must consider the personal values informing your proposal. Ask yourself the following:

  • Why is this research worth my time and attention?
  • What motivates me? Am I driven by imperatives (e.g. funding, social justice)?
  • Or, do I believe education to be inherently valuable, providing justification for any research that informs educational practice? [28]

일단 당신의 연구를 뒷받침하는 [가치가 명확]하고, 당신의 [연구가 정당]하다는 것이 확실하다면, 잠재적인 [윤리적 문제]도 고려되어야 한다. 예를 들어, 당신의 [가치론적 성찰]이 당신이 [외부의 동기 부여]에 의해 움직인다는 것을 드러낸다면, 당신의 연구 설계 내에서 이것을 공개하는 것이 적절할 수 있다. 대부분의 저널은 당신의 연구를 뒷받침하는 모든 자금과 이해 상충(개인 자금 출처를 포함할 수 있음)에 관한 세부 사항을 포함하도록 규정하고 있다. 커크만 등은 주니어 의사와 의대생에 대한 최근 환자 안전 개입의 결과를 평가하는 체계적 검토에 상세한 "경쟁적 이해관계" 진술을 포함한다[29]. 특히 관련된 것은 영국의 의사 규제 기관인 GMC(General Medical Council)와의 두 저자의 제휴와 여러 저자가 다양한 기관의 환자 안전에 대해 이전에 수행한 자문 작업이다. [어느 기관에 소속되었는지institutional affiliations]는 기관의 가치에 따라 저자의 관점과 해석을 암묵적인 방식으로 물들일 수 있다. 따라서 팀의 가치론적 성찰 내에서, 이러한 [상충하는 이해관계]나 연관성을 고려하는 것이 중요합니다.
Once the values underpinning your inquiry are clear and it is evident your research is justified, potential ethical issues should also be considered. For example, if your axiological reflection reveals you are being driven by an external motivator, it may be appropriate to disclose this within your research design. Most journals mandate inclusion of detail regarding any funding underpinning your research and any conflicts of interest (which could include sources of personal funding). Kirkman et al. include a detailed “competing interests” statement in their systematic review evaluating the outcomes of recent patient safety interventions for junior doctors and medical students [29]. Particularly relevant are two author’s affiliations with the General Medical Council (GMC), the UK’s regulatory body for physicians, and consultancy work several authors had undertaken previously on the topic of patient safety for a variety of institutions. These institutional affiliations could color the author’s perspectives and interpretations in tacit ways, in line with institutional values. As such, considering any such competing interests or associations within your team’s axiological reflection is the key.

온톨로지적 가정 반영
Reflect upon your Ontological Assumptions

비록 우리가 그것들을 명시적으로 고려하거나 자세히 설명하지 않더라도, 우리는 모두 [존재론적 가정]을 가지고 있다. 그것들을 되돌아보면 [현실의 본질에 대한 자신의 신념]에 따라 패러다임을 선택할 수 있다[3]. 현실은 당신이 연구를 수행하기를 원하는 사회 세계를 의미합니다 [22].
We all hold ontological assumptions, even if we do not explicitly consider or detail them. Reflecting upon them allows you to choose a paradigm in keeping with your beliefs regarding the nature of reality [3]. Reality refers to the social world in which you wish to conduct your research [22].

다른 패러다임은 현실의 본질을 정의하기 위해 다른 접근 방식을 채택한다. 일부 학자들은 최근 몇 년 동안 사회과학 내에서 새로운 패러다임을 정의하려고 시도하기도 한다[30]. 이를 감안할 때, 사용 가능한 모든 패러다임의 온톨로지를 자세히 설명하는 것은 이 기사의 범위를 벗어난다. 그 대신 일반적으로 의학 교육[3]에서 가장 일반적으로 사용되는 네 가지 패러다임, 즉 실증주의, 후기 실증주의, 구성주의/해석주의, 비판론에 초점을 맞추겠다.
Different paradigms adopt different approaches to defining the nature of reality. There are many paradigms research may operate within, with some scholars even attempting to define new, albeit contested, paradigms within the social sciences in recent years [30]. Given this, detailing the ontology of every available paradigm is beyond the scope of this article. Instead, we will focus upon the four paradigms most commonly used within general medical education [3]: positivism, post-positivism, constructivism/interpretivism, and critical theory.

존재론적 가정을 평가하기 위해 스스로에게 질문하세요: 당신은 "확인할 수 있는 하나의 현실"이 있다고 믿습니까, 아니면 "여러 사회적으로 구성된 현실"이 존재한다고 믿습니까? [21, 31] 

  • 전자의 입장은 "현실주의" 온톨로지적 입장으로 불리며, 
  • 후자의 입장은 "반현실주의" 또는 "상대주의"로 알려져 있다[32]. 

넓게 보면, 의학 교육에서 가장 일반적으로 사용되는 네 가지 패러다임은 이 두 가지 범주 중 하나에 속하지만, 표 2에 자세히 설명된 바와 같이, 그들의 입장을 구성하는 방법에는 차이가 있다.
To assess your ontological assumptions, ask yourself this: do you believe there is “one verifiable reality,” or that “multiple socially constructed realities” exist? [21, 31]

  • The former stance is sometimes referred to as a “realist” ontological position,
  • with the latter stance known as “anti-realism” or “relativism” [32].

Broadly speaking, the four paradigms most commonly used within medical education fall into either of these two categories, but there are differences in how they frame their position, detailed in Table 2.

당신의 인식론적 가정을 반성하라.
Reflect upon your Epistemological Assumptions

일단 당신이 [현실의 본질에 대한 당신의 가정]을 인식한다면, [지식의 본질에 대한 당신의 인식론적 가정]을 성찰하는 것은 필요하다. 당신의 연구 인식론을 고려할 때, "세상 내에서 지식으로 간주되는 것"에 대해 숙고하는 것이 유용할 수 있다[40]. 인식론은 두 가지 질문에 답하고자 합니다.

  • 첫째, 지식이란 무엇인가,
  • 둘째, 지식은 어떻게 획득되는가? [41].

Once you are aware of your assumptions regarding the nature of reality, reflecting upon your epistemological assumptions regarding the nature of knowledge is necessary. When considering your research epistemology, it may be useful to reflect upon “what counts as knowledge within the world” [40]. Epistemology seeks to answer two questions—

  • one, what is knowledge, and
  • two, how is knowledge acquired? [41].

실증주의, 후기 실증주의, 구성주의, 비판론의 인식론적 접근은 다르다. 이러한 내용은 표 3에 요약되어 있습니다.
Again, the epistemological approaches of positivism, post-positivism, constructivism, and critical theory differ. These are outlined within Table 3.

다양한 유형의 패러다임에 익숙해져 자신과 자신의 업무가 적합한지 평가
Become Familiar with Different Types of Paradigm to Evaluate Where You and Your Work Fit

이상에서는 의학교육에서 흔히 볼 수 있는 네 가지 패러다임으로 실증주의, 사후 실증주의, 구성주의, 비판론에 초점을 맞추었다[37]. 이는 개인의 의료 교육 연구 목표와 일치할 수 있는 패러다임의 일부일 뿐이다[42]. 우리는 연구원들이 가능한 한 많은 다른 유형의 패러다임에 익숙해지고, 연구원으로서 당신이 어디에 있는지 가장 잘 이해할 것을 권고하며, 또한 당신의 팀과 프로젝트가 적합하다.
Above, we have focused on positivism, post-positivism, constructivism, and critical theory as four common paradigms in medical education [37]. These are only a subset of paradigms that might align with an individual’s medical education research aims [42]. We recommend researchers to familiarize themselves with as many different types of paradigms as possible, to best understand where you as a researcher, but also your team and project fit.

패러다임의 복잡성을 고려할 때 패러다임과 관련된 철학의 뉘앙스를 너무 깊이 파고들기보다는 단순한 인포그래픽과 은유를 찾는 것이 탐구를 더 다루기 쉽게 만들 수 있다. 우리는 이미 몇 가지 간단한 표와 유리집 은유[21]를 소개했지만, 당신은 다음과 같은 다른 시각화를 찾는 것이 도움이 될 수 있다.
Given the complexity of paradigms, rather than delving too deeply into the nuances of philosophy associated with paradigms, seeking simple infographics and metaphors can make exploration more manageable. We have already introduced some simple tables and the glass house metaphor [21], but you may find it helpful to seek other visualizations, such as the

"양파" [43, 44] 간단히 말해서, "연구 양파"는 건축 블록이나 유리 벽 대신 층으로 패러다임을 고려합니다.
“research onion” [43, 44]. In brief, the “research onion” depicts paradigmatic considerations as layers, in lieu of building blocks or glass walls.

패러다임을 탐구하는 또 다른 도움이 되는 방법은 문헌 리뷰에서 그러한 점을 염두에 두는 것이다. 작가들은 그들의 패러다임을 명시적으로 논의하고 있는가? 그렇다면, 동의하십니까? 만약 그렇지 않다면, 그들의 연구 세부사항에 근거하여 그들의 패러다임을 어떻게 분류할 것인가? 자이디와 라르센은 자체 해석을 사용하여 연구 패러다임에 따라 논문을 분류하는 훌륭한 논평을 제공한다[45]. 그러한 활동은 패러다임에 대한 이해를 실용적인 방식으로 향상시키기를 원하는 사람들에게 유용할 수 있다.
Another helpful way to explore paradigms is to be mindful of such in your own reviews of literature. Are authors explicitly discussing their paradigms? If so, do you agree? If not, how would you categorize their paradigm based on their study details? Zaidi and Larsen provide an excellent commentary where they categorize papers based on research paradigms, using their own interpretations [45]. Such an activity may prove useful to those wishing to improve their understanding of paradigms, in a practical fashion.

선택한 패러다임을 사용하여 적절한 방법론 선택
Use your Chosen Paradigm to Select an Appropriate Methodology

다음으로, 지식을 어떻게 "획득"할 수 있으며, 그것이 당신의 패러다임과 자연스럽게 일치할 수 있는지를 고려할 수 있다. 예를 들어, 한 개인이 단일한 진실이 있고, 그러한 진실이 측정될 수 있다고 믿는 [엄격한 실증주의자]라면, 당신은 그들이 명시적인 가설 테스트를 통해 더 [엄격한 형태의 실험 연구]를 이용할 것으로 기대할 수 있을 것이다. 다른 방법론은 다른 패러다임과 가장 잘 일치한다[46].
How you can go about “acquiring” knowledge, so that it aligns naturally with your paradigm, might be considered next. For example, if an individual is a strict positivist, believing that there are single truths, and that such truths can be measured, you would expect them to utilize stricter forms of experimental research, with explicit hypothesis testing. Different methodologies align best with different paradigms [46].

연구팀의 방법론을 고려하는 것은 또한 연구 프로젝트를 진행하기 전에 당신의 패러다임을 이해하는 데 도움이 될 수 있다. 위의 예에 따라, 당신의 연구팀이 당신의 프로젝트에서 [실험 설계]를 가장 자주 사용한다면, 이것은 당신이 [가치있게 여기는 지식과 정보]에 대한 [당신의 관점]에 대해 뭐라고 말할 수 있습니까?
Consideration of research teams’ methodologies can also be helpful in understanding your paradigm, prior to moving forward with research projects. Following the example above, if your research team most often utilizes experimental design in your projects, what might this say about your regard for what knowledge and information you place value in?

적절한 데이터 수집 방법을 선택하려면 방법론을 검토하십시오.
Examine your Methodology in Order to Select an Appropriate Data Gathering Technique

[방법론]과 [방법]은 별개의 개념으로 간주되어야 할 때 초보 연구자에 의해 상호 교환적으로 사용되는 경우가 너무 많다[47].

  • [방법론]은 지식을 습득하기 위한 전략 또는 전체 계획이며,
  • [방법]은 데이터를 수집하고 분석하는 데 사용되는 실제 기법이다[33].

Too often, methodology and methods are used interchangeably by novice researchers, when they should be regarded as distinct concepts [47].

  • Methodology is the strategy or overall plan to acquire knowledge, and
  • methods are the actual techniques used to gather and analyze data [33].

예를 들어, 의료 환경에서 전문성 간 조사에 관심이 있는 연구팀은 [현실은 개인에 의해 주관적으로 구성된다]고 믿는 [구성주의 패러다임]과 가장 일치할 수 있다.

  • 이 팀은 적절한 [방법론]은 [민족지학]이라고 생각할 수 있다.
  • 그러나 실제 연구 [방법]은 [현장 기록, 오디오 또는 비디오 녹화 또는 정성적 인터뷰]를 통한 다양한 관찰일 수 있다[48].

이러한 방법은 방법론과 일치하지만, 방법의 최종 선택은 패러다임 고려 사항 외에도 그러한 [기술의 실용성]과도 크게 연관될 수 있다.
For example, a research team interested in examining interprofessionalism in a healthcare setting may identify most with a constructivist paradigm, believing reality is subjectively constructed by individuals.

  • Such a team might consider ethnography to be an appropriate methodology.
  • But the actual research methods they undertake might be a variety of observations with field notes, audio or video recordings, or qualitative interviews [48].

These methods align with the methodology, although eventual selection of methods may also be highly associated with the practicality of such techniques, in addition to paradigm considerations.

위의 섹션에서는 연구 프로젝트 패러다임의 "구성 요소"에 대한 개요를 제공했습니다. 참조의 용이성을 위해, 이러한 구성 요소는 의학 교육에서 사용되는 4가지 주요 패러다임에 대해 그림 2에 요약되어 있습니다 [30, 36, 49, 50].
The above sections have provided an overview of the “building blocks” of a research project’s paradigm. For ease of reference, these building blocks are summarized for the four main paradigms used within medical science education, in Fig. 2 [30, 36, 49, 50].

연구에 대해 쓸 때 패러다임과 구성 요소를 명확하게 설명하십시오.
Clearly Detail Your Paradigm and its Building Blocks When You Write about your Research

패러다임은 연구자의 마음속에만 존재하고 명확하게 전달되지 않으면 아무 소용이 없다. 연구자로서의 이해를 위해 패러다임을 명확하게 설명하세요. 그림 1과 같이 빌딩 블록에 요약된 질문에 답함으로써 패러다임을 설명하는 것이 도움이 되는 경우가 많습니다.
A paradigm does no good if it only exists in the mind of the researcher and is not clearly communicated. Clearly detail your paradigm, for your own understanding as a researcher. It is often helpful to describe your paradigm by answering the questions outlined in the building blocks, as shown in Fig. 1.

그러나 또한 여러분의 연구를 전파할 때, 여러분의 타겟 독자들이 접근 가능하고 이해할 수 있도록, 여러분의 패러다임에 대한 세부 사항을 만들어야 한다는 것을 명심하세요. 연구의 범위와 목표에 따라, 당신의 패러다임에 대한 설명은 출판을 위해 설계된 연구 보고서의 한 두 단락에서 더 큰 보고서나 논문의 여러 페이지 하위 장에 이르기까지 다양할 수 있다. 어느 경우든 패러다임에 대해 글을 쓰는 것은 독자 분이 패러다임을 전달하는 세부 사항의 수준은 다를 수 있지만 독자 분이 연구한 맥락을 이해하는 데 핵심입니다.
But also keep in mind to make any details of your paradigm accessible and understandable for your target audience when disseminating your research. Depending on the scope and goals of your research, description of your paradigm could range from a paragraph or two in a research report designed for publication, to a multipage subchapter of a larger report or thesis assignment. In either case, writing about the paradigm is key for the audience to understand the context of your research, although the level of detail in which you communicate your paradigm may vary.

당신의 패러다임에 대해 쓸 때 참고할 수 있는 접근 가능한 문헌을 찾는 것은 어려울 수 있다. 이 분야에는 패러다임 선택에 대한 시간적 고려에서 앞서 다루었던 것처럼 패러다임의 세계로 진입하는 장벽으로 작용할 수 있는 철학적 전문 용어들이 산재해 있다. 이 가이드가 이 분야의 몇 가지 기본 용어를 이해하는 데 도움이 되기를 바랍니다. 관심이 있고 시간이 있다면 지식의 본질과 다양한 패러다임적 입장을 명시적으로 논하는 '과학철학' 분야에는 풍부한 문학이 있다. 일부 중요한 문헌에는 사회 연구의 기초[36], 과학 혁명의 구조[7], 브루노 라투르가 있다. 하이브리드 세계에서의 하이브리드 사고[51]와 패러다임 대화[52].
Locating accessible literature to draw upon when writing about your paradigm can prove difficult. The field is littered with philosophical jargon that can act as a barrier to entry into the world of paradigms, as earlier addressed in time consideration of paradigm selection. We hope this guide will assist you in beginning to understand some of the foundational terms within this field. If you are interested and have time, there is a wealth of literature within the field of “Philosophy of Science” that explicitly discusses the nature of knowledge and varying paradigmatic stances. Some seminal texts include The Foundations of Social Research [36], The Structure of Scientific Revolutions [7], Bruno Latour: Hybrid thoughts in a Hybrid world [51], and The Paradigm Dialog [52].

몇몇 입문 교과서와 기사들은 다음과 같은 중요한 텍스트의 통합 요약을 제공합니다. 그러나 이에 국한되지는 않습니다. 
- Kivunja와 Kuyini의 "교육적 맥락에서 연구 패러다임의 이해와 적용" [53]; 
- Avramidis와 Smith의 "특수 니즈 연구를 위한 주요 연구 패러다임과 방법론적 함의 소개" [54]; 
- Denzin과 Lincoln의 The Sage Handbook of Qualityative Research [55] 및 
- 과학 철학: 매우 짧은 소개 [56].

Several introductory textbooks and articles offer integrated summaries of these seminal texts including, but not limited to
- Kivunja and Kuyini’s “Understanding and Applying Research Paradigms in Educational Contexts” [53];
- Avramidis and Smith’s “An introduction to the major research paradigms and their methodological implications for special needs research” [54];
- Denzin and Lincoln’s The Sage Handbook of Qualitative Research [55];
- Philosophy of Science: A Very Short Introduction [56].

철학에서 실용으로 전환
Move from Philosophy to Practicality

의료 교육의 일상적인 측면에 관련된 사람들에게, 연구의 철학적 토대를 둘러싸고 생각나는 첫 번째 질문 중 하나는 [이것이 어떻게 제 일에 실질적으로 적용될 수 있는가]하는 것입니다. 철저하게 논의된 바와 같이 엄격성과 이해도를 향상시키는 것 외에도 [연구의 실용적인 측면에 접근하는 두 가지 핵심 방법]이 있다. : 전 그리고 후
For those involved in the day-to-day aspects of healthcare teaching, many times one of the first questions that comes to mind around the philosophical underpinnings of research is: how can this be practically applied to my work? Beyond improving rigor and understanding, as thoroughly discussed, there are two key ways to approach the practical side of research: from the before and the after.

의학 교육자로서 직면하는 실제적인 문제와 질문을 고려한다면, 다른 방식으로 문제에 접근하기 위해 어떻게 다른 패러다임이 사용될 수 있는지를 고려하는 것은 패러다임을 고려하는 실용적인 "전before" 방법이다. 실제 문제가 패러다임 정보에 입각한 관점에서 접근될 수 있는 방법을 설명하기 위해 그림 3에 몇 가지 예를 포함시켰다. 일부 다양한 실제 사례의 경우, 다른 교육 수준에서, 우리는 자연스럽게 다른 패러다임과 일치할 수 있는 연구 접근법의 몇 가지 다른 예를 제공했습니다.
Considering the practical problems and questions you face as a medical sciences educator, then considering how different paradigms could be used to approach problems in different ways, is a practical “before” way to consider paradigms. To elucidate the ways in which real-world problems can be approached from a paradigm-informed perspective, we’ve included some examples in Fig. 3. For somevarious real-world examples, at different educational levels, we have provided some different examples of research approaches, that would naturally align with different paradigms.

["After" 연구 관점]에서, 프락세오로지(praxoology)는 당신이 성찰해야 하는 마지막 '-론 (-ology)'이다. 연구로부터 종종 발생하는 보다 실용적인 권고사항과 관련하여, 프랙세오로지(praxoology)는 [인간의 행동을 이해하는 것]뿐만 아니라, [의미 있는 방식으로 해석하는 것]에 관심이 있다[45]. 만약 당신의 연구가 "지식"에 기여했다면, 이것은 [의학 교육자로서 당신의 일상적인 역할]에 무엇을 의미합니까? 이렇게 하면 연구 과정 이후에 실용성도 중요해질 수 있다. 그림 2의 중간 수준의 예를 이용하여, 구성주의 접근법에서 연구를 완료했다면, [가상 조직학 실험실]의 [셀프-가이드 방법]이 유익한 학습 환경으로 이어지지 않는다는 것을 발견했을 수 있다. 이로 인해 가상 조직학 리소스와 함께 사용할 [비디오 가이드]를 만들기로 결정하게 될 수 있습니다. 따라서 학생들은 처음에 학습을 안내하는 강사 주도 예제를 사용할 수 있습니다.
From the “after” research perspective, praxeology is the last -ology you may wish to reflect upon. Concerned with the more practical recommendations that often arise from research, praxeology is concerned with not just understanding human actions, but interpreting them in meaningful ways [45]. If your research has contributed to “knowledge,” what does this mean for your day-to-day role as a medical sciences educator? In this way, practicality can be also important after the research process. Using the mid-level example from Fig. 2, if you completed research from a constructivist approach, you may have discovered that self-guided methods in virtual histology labs was not leading to a conducive learning environment. This may lead to your decision to create video guides to accompany virtual histology resources, so students have instructor-led examples to initially guide their learning.

패러다임에 실질적으로 접근하는 위의 방법들 외에도, 연구자들은 [실용주의pragmatism]의 실용적인 패러다임을 고려하기를 원할 수 있다. [실용주의]는 연구 결과에 초점을 맞추고, 따라서 인식론이나 존재론을 고려하는 데 가치를 두지 않는다. 대신, 실용주의는 문제를 이해하고 해결하는 데 가장 효과적인 것에 초점을 맞추려고 노력한다[57]. 실용주의자들은 특정 연구 질문에 답하기 위해 [실제로 가장 잘 작동하는 방법]에 의존하며, 단순히 패러다임 정렬이 아닌 [선택된 접근 방식의 실용성]에 가장 중점을 둔다[58]. 그러나 실용주의는 ["진정한" 패러다임]이라기보다는 [접근법]에 가깝다는 견해가 있다. 결과적으로, 본 연구는 다른 공통 패러다임을 가지고 있기 때문에 실용주의를 자세히 탐구하지 않았다[30].
In addition to the above ways of practically approaching paradigms, researchers may also wish to contemplate the practical paradigm of pragmatism. Pragmatism focuses on research outcomes and, as such, does not place value on considering either epistemology or ontology. Instead, pragmatism strives to focus on what works best for understanding and solving problems [57]. Pragmatists rely on the methods that work best in practice to answer specific research questions, focusing most heavily on the practicalities of the chosen approach, not just paradigmatic alignment [58]. However, it is the view of some that pragmatism should be viewed as more of an approach, rather than a “true” paradigm. Consequently, the present work has not explored pragmatism in detail as it has other common paradigms [30].

가능한 경우 숙련된 연구원과의 협업 또는 상담
Collaborate with or Consult Experienced Researchers Where Possible

패러다임은 의학 교육계의 많은 사람들에게 복잡하고 참신해 보일 수 있지만, 연구의 핵심 측면이며 사회학 및 일반 교육과 같은 다른 분야에서는 확실히 새로운 것이 아니다[59,60,61]. 이러한 점을 감안할 때, 협업은 성과를 거둘 수 있으며 성공의 최종 열쇠가 될 수 있습니다. 가능한 경우, 경험 많은 연구원들, 특히 방법론에 집중하는 연구원들과 협력하는 것은 매우 유익할 수 있다. 경험 많은 학자들은 패러다임과 관련된 철학적 질문에 대한 지침을 제공할 수 있으며, 연구팀이 어떤 방법론과 방법을 가장 잘 활용할 수 있는지 유념할 수 있다. 협업이 불가능할 경우 방법론자 또는 경험이 풍부한 연구자에게 연락하여 연구 접근 방식을 검토할 수 있는 상담 서비스를 제공하는지 여부를 문의할 수 있습니다.
While paradigms might seem complex and novel for many in the medical education community, they are a key facet of research, and certainly not new to other disciplines, such as sociology and general education [59,60,61]. Given this, collaboration can prove fruitful and may be the final key to success. When possible, collaborating with experienced researchers, particularly those who focus upon methodology, can be very beneficial. Experienced scholars can provide guidance regarding the philosophical questions associated with paradigms, while keeping in mind which methodology and methods may be best utilized by the research team. Where collaboration is not feasible, you may wish to contact a methodologist or experienced researcher to enquire as to whether they provide consultation services to review your research approach.

연구 능력을 개발하고자 하는 사람들에게는 매우 도움이 되지만, 패러다임 선택에 관한 협력은, 특히 연구자들이 [연구에 가장 적합한 패러다임에 대해 동의하지 않을 경우] 긴장을 유발할 수 있다. 협업 프로젝트에 동의하기 전에 잠재적 협력자가 만나 "공유 의제"를 개발할 것을 권장합니다. 공유된 의제에는 공통 목표 집합, 사용 가능한 자원 목록, 관심 있는 연구 질문 및 각 연구자의 개인 패러다임에 대한 토론이 포함됩니다. 개인 입장에 익숙하지 않지만 협력팀의 공유 의제에 가장 적합한 패러다임 내에서 연구해야 하는 한 명 또는 여러 명의 연구자를 대신하여 [타협]이 필요할 수 있다. 예를 들어,

  • 위에서 소개한 바와 같이, 만약 당신이 엄격한 실용주의자라고 생각한다면, 온톨로지와 현실에 대한 광범위한 논의가 연구 시간을 비생산적으로 사용한다고 생각할 수 있다.
  • 그러나 해석학자 팀과 함께 일하는 경우, 이 과정은 연구 노력과 연구 설계의 핵심 부분으로 간주될 수 있다. 개인적인 입장을 인식하고, 그것에 헌신하는 성찰적 공간에서 명확하게 표현할 수 있게 됨으로써, 협업이 완화되고 심지어 강화될 수 있다.

Although immensely helpful for those wishing to develop their research skills, collaboration with regard to paradigm choice can generate tension, especially if researchers disagree concerning which paradigm would be best suited for their research. We recommend that, prior to agreeing upon any collaborative projects, potential collaborators meet to develop a “shared agenda.” Shared agendas include a set of common objectives, a list of available resources, research questions of interest, and discussion as to each researcher’s personal paradigm. Compromise may be required on the behalf of one, or several, researchers, who may need to research within a paradigm unfamiliar to their personal stance, but best befitting the shared agenda of the collaborative team. For example,

  • if you consider yourself to be a strict pragmatist, as introduced above, you might find extensive discussions about ontology and reality to be an unproductive use of research time.
  • However, if working with a team of interpretivists, this may be viewed as a key part of their research efforts and study design. Through recognizing personal stances and being able to clearly express them in a dedicated reflexive space, collaboration may be eased, and even enhanced.

마지막으로, 출판을 위해 글을 쓸 때, 우리는 각 팀 [구성원의 패러다임적 입장에 대한 투명성]과 [긴장을 해결하기 위해 성찰성이 어떻게 사용되었는지]에 대한 세부 사항을 포함할 것을 권고한다. 이 모노그래프는 공동 집필의 예로 사용될 수 있다. 저자들은 이 주제에 중립적으로 접근했지만 개인 패러다임이 다르다. 한 작가(MB)는 구성주의자이고, 다른 작가(AD)는 실용주의자입니다. 이 작품의 개념과 구성에 있어서, 저자들은 본 논문에서 논의된 과학철학에 대한 개인적인 견해를 포함하여 그들의 패러다임적 가정에 대한 반사적 논의로 시작했다. 이 연구의 공유 의제는 각 저자가 가지고 있는 잠재적 가정을 인정하면서 가능한 한 중립을 유지하는 것으로 결정되었다. 우리는 이것이 이 모노그래프를 더 투명하게 보여줄 수 있기를 바란다.
Lastly, when writing for publication, we recommend transparency as to each team member’s paradigmatic stance and inclusion of detail regarding how reflexivity was used to navigate any tensions. This monograph may be used as an example of collaborative writing. The authors approached this topic neutrally but have different personal paradigms. One author (MB) is a constructivist, and the other (AD) is a pragmatist. In the conception and construction of this work, the authors began with reflexive discussions on their paradigmatic assumptions, including personal views regarding the philosophy of science discussed in this paper. It was determined the shared agenda of this work was to remain as neutral as possible, while acknowledging potential assumptions each author holds. We hope this allows for a more transparent presentation of this monograph.

결론들
Conclusions

초기에는 복잡하지만, 연구 패러다임의 식별은 엄격한 연구 프로젝트의 필수적인 측면이다. 또한 개별 프로젝트를 넘어 지식을 특정 패러다임과 결부시키면 의학교육 내 연구에 대한 전반적인 이해도가 높아져 전체 분야의 발전을 도모할 수 있다.
While initially complex, identification of a research paradigm is an essential aspect of any rigorous research project. Further, beyond individual projects, association of knowledge with specific paradigms may lead to a better overall understanding of research within medical education, furthering the advancement of the entire field.

이 기사를 통해, 우리는 연구 패러다임의 식별을 통해 프로젝트를 개선하고자 하는 연구자들을 위한 몇 가지 초기 팁을 간략하게 설명하려고 시도했다. 이러한 팁과 연구 팀 내에서 더 많은 열린 토론을 고려한다면, 여러분의 연구는 새로운 목적을 가지고 더 깊이 있게 이해될 수 있습니다.
Through this article, we have attempted to outline some initial tips for researchers looking to improve on projects via identification of a research paradigm. With consideration of these tips, and more open discussions within research teams, your research can take on new purpose and be understood with greater depth.

 


Med Sci Educ. 2019 Dec 27;30(1):545-553. doi: 10.1007/s40670-019-00898-9. eCollection 2020 Mar.

A Medical Science Educator's Guide to Selecting a Research Paradigm: Building a Basis for Better Research

Affiliations collapse

Affiliation

1Health Professions Education Unit, Hull York Medical School, John Hughlings Jackson Building, University Road, Heslington, York, YO10 5DD UK.

PMID: 34457699

PMCID: PMC8368685

DOI: 10.1007/s40670-019-00898-9

Free PMC article

Abstract

A research paradigm, or set of common beliefs about research, should be a key facet of any research project. However, despite its importance, there is a paucity of general understanding in the medical sciences education community regarding what a research paradigm consists of and how to best construct one. With the move within medical sciences education towards greater methodological rigor, it is now more important than ever for all educators to understand simply how to better approach their research via paradigms. In this monograph, a simplified approach to selecting an appropriate research paradigm is outlined. Suggestions are based on broad literature, medical education sources, and the author's own experiences in solidifying and communicating their research paradigms. By assisting in detailing the philosophical underpinnings of individuals research approaches, this guide aims to help all researchers improve the rigor of their projects and improve upon overall understanding in research communication.

Keywords: Medical education; Methodology; Paradigm; Research approach.

EPA 프레임워크의 논리: 스코핑 리뷰 (Med Educ, 2022)
The logic behind entrustable professional activity frameworks: A scoping review of the literature
Marije P. Hennus1 | Marjel van Dam2 | Stephen Gauthier3 | David R. Taylor3 | Olle ten Cate4

 

 

1 소개
1 INTRODUCTION

신뢰할 수 있는 전문 활동(EPA)은 역량 적용을 위한 명확한 목적을 제공하는 보건 전문가 교육에서 빠르게 진화하는 개념을 나타낸다.

  • [역량]은 교육자가 임상 실습에 제공하는 능력을 반영하는 반면,
  • EPA는 이러한 역량이 필요한 의료의 과제이다.

EPA는 개별적인 직업별 작업(또는 작업 묶음)으로, 일반적으로 식별 가능한 환자 치료 행위이며, 여기에는 여러 역량(중요한 지식, 적절한 기술 및 태도 포함)의 통합이 필요하다. 학습자는 기본적으로 이러한 작업을 수행함으로써 EPA를 위해 훈련되고 있으며, 처음에는 엄격한 감독 하에 점차 자율적으로 훈련되고 있다. EPA에서 유능해지기 위한 진행은 소위 [위탁-감독 척도]를 따른 학습자의 여정을 반영한다. 이러한 척도는 학습자가 안전한 환자 치료를 보장하기 위해 필요한 감독 수준을 포착하는 것을 목표로 한다. 역량이 증가함에 따라 감독 강도를 시간이 지남에 따라 신중하게 낮춰야 한다. 전체적으로 본다면, 일련의 EPA는 전문 교육을 위한 커리큘럼의 틀을 정의하고 알리기 위해 사용될 수 있으며, 실제로 전문직의 핵심 활동을 반영한다. 이와 같이 EPA 기반 커리큘럼은 임상 훈련과 평가를 임상의가 일상 업무에서 실제로 수행하는 작업과 연결할 수 있는 잠재력을 가지고 있다. 결과적으로, 점점 더 많은 수의 대학원 의학 훈련 프로그램이 커리큘럼을 재설계하기 위해 그것들을 사용하기 시작했다. 

Entrustable professional activities (EPAs) represent a rapidly evolving concept in health professionals' education that offers clear purpose for the application of competencies. Whereas

  • competencies reflect the capabilities trainees bring to clinical practice,1 
  • EPAs are the tasks of health care for which these competencies are needed.

An EPA is a discrete profession-specific task (or bundle of tasks), typically an identifiable act of patient care, which requires the integration of multiple competencies (including vital knowledge, appropriate skills and attitudes).2, 3 Learners are essentially being groomed for EPAs by performing these tasks, initially under strict supervision and gradually more autonomously. Progression towards becoming competent in an EPA reflects a learner's journey along so-called entrustment-supervision scales. These scales aim to capture the level of supervision a learner requires to ensure safe patient care; with increasing competence, the intensity of supervision should be carefully lowered over time.4, 5 Taken collectively, a set of EPAs can be used to define and inform the framework of a curriculum for specialty training and, in fact, reflects the profession in its core activities. As such, an EPA-based curriculum has the potential to link clinical training and assessment to the work that clinicians actually do in daily practice.6 Consequently, an increasing number of postgraduate medical training programmes have begun using them to redesign their curricula.7, 8

EPA는 이해관계자 간에 내용 타당성과 수용성을 모두 제공할 수 있는 신중하게 구성된 접근방식을 요구한다. EPA의 개발 과정을 안내하는 데 도움이 되는 지침이 존재하지만, [예비 프레임워크 초안을 작성하기 위해 사용할 논리]를 결정하는 것은 중요하고 종종 어려운 첫 번째 단계를 제시한다. EPA 프레임워크의 논리는 개발자가 직업의 관행을 전문 작업 단위로 분해하기 위해 사용하는 관점으로 정의할 수 있다. 현존하는 문헌에서 발견된 보고된 접근법에는 다음이 포함된다. 

  • 역할 ('다른 분야의 컨설턴트 전문가 역할'), 
  • 절차 ('일반적인 폐 및 중환자 치료 절차를 안전하고 효율적으로 수행') 
  • 질병 관리 ('패혈증 환자 관리') 
  • 환자 범주 ('청소년 의료') 및 
  • 기능 ('외래 환자 클리닉 실행') 

EPAs require a carefully constructed approach that can deliver both content validity and acceptance among stakeholders.9 Although guidelines exist to help guide the developmental process of EPAs,310 deciding what logic to use to draft a preliminary framework poses a crucial and often difficult first step. The logic of an EPA framework can be defined as the perspective used by the developers to break down the practice of a profession into units of professional work.11 Reported approaches found in extant literature include

  • roles (‘Act as the consultant specialist for other disciplines’),
  • procedures (‘Safely and efficiently perform common pulmonary and critical care procedures’),
  • disease management (‘Management of a patient with sepsis’),
  • patient categories (‘Adolescent healthcare’) and
  • functions (‘Running the outpatient clinic’).78 

유사한 분야에서도 서로 다른 접근법이 사용되어 왔다. 예를 들어 폐 및 중환자 의료에 대한 [미국] 펠로우십 교육을 위한 '기능' 및 '역할 기반' EPA를 [네덜란드] EPA의 보다 '질병 관리' 지향 EPA 프레임워크와 비교한다. '모든 사람에게 맞는 하나의 크기'라는 격언은 EPA 프레임워크의 개발에 분명히 적용되지 않는다. 설정, 목적, 교육 프로그램에 기반한 맞춤화가 불가피해 보인다.
Even within similar disciplines, different approaches have been used. Compare for instance the predominantly ‘function-’ and ‘role-based’ EPAs for American Fellowship Training in Pulmonary and Critical Care Medicine12 with the more ‘disease management’ orientated EPA-framework of their Dutch counterparts.13 The ‘one size fits all’ adage clearly does not hold true for the development of EPA frameworks; customisation based on setting, purpose and/or training programme seems inevitable.

이 범위 문헌 검토는 대학원 의학 교육 및 펠로우십 프로그램에 걸쳐 EPA 프레임워크 개발에 사용된 지배적인 논리와 추가 연구를 위한 영역을 강조할 뿐만 아니라 EPA 개발을 위한 모범 사례 지침을 잠재적으로 알리기 위한 그들의 합리성을 매핑하는 것을 목표로 했다.
This scoping literature review aimed to map the dominant logics used in the development of EPA frameworks across postgraduate medical education and fellowship programmes and their rationales to potentially inform best practice guidelines for EPA development in addition to highlighting areas for further research.

2 방법
2 METHODS

2.1 설계
2.1 Design

주제에 대한 기존 연구 결과를 수집, 평가 및 제시하는 반복적이고 유연한 방법인 범위 검토가 수행되었다. 우리는 철저한 검토를 추구하지 않고 지배적인 EPA 논리를 식별하고 매핑하기 위해 시작했기 때문에 체계적인 검토 대신 범위를 사용했다. 이는 체계적 검토 및 메타 분석을 위한 선호 보고 항목(PRISMA)의 범위 검토 확장에 따라 보고되었다. 
A scoping review, an iterative and flexible method to collect, evaluate and present findings from existing research on a topic,14 was performed. We used a scoping, instead of a systematic review, as we did not seek to be exhaustive but set out to identify and map dominant EPA logics.15 This was reported in accordance with the Preferred Reporting Items for Systematic Review and Meta-analysis (PRISMA)'s extension for Scoping Reviews.16

2.2 검색 전략
2.2 Search strategy

문헌 본문의 범위를 평가하기 위해, 우리는 Khalil 등으로부터 채택된 스코핑 리뷰에 대한 증거 기반 다단계 접근법을 사용했다. 2005년 1월부터 2020년 12월까지의 연구는 타당성과 폭 및 포괄성의 균형을 맞추기 위해 3단계 문헌 검색을 사용하여 확인되었다.

  • 1단계는 제목과 초록에 포함된 텍스트 단어(위탁가능 프로페셔널 활동*)를 2명의 저자(MH, MD)가 독립적으로 선별하여 MEDLINE과 Embase에 대한 제한된 검색으로 구성되었다.
  • 두 번째 단계는 이 텍스트 단어들을 포함된 모든 데이터베이스(구글 스콜라, 스코푸스, 웹 오브 사이언스 추가)에서 검색어로 사용했다. 이러한 데이터베이스는 EPA에 대한 문헌을 포괄하고 함께 고려할 때 가능한 포괄적으로 선택되었다. 이 검토에서 사용된 검색 구문에 대한 자세한 내용은 지원 정보(부록 1)에서 확인할 수 있습니다.
  • 세 번째 단계에는 확인된 모든 보고서 및 추가 연구를 위한 논문의 참조 목록 분석이 포함되었다.

To assess the extent of the body of literature, we used an evidence-based multistage approach to scoping reviews adapted from Khalil et al.17 Studies from January 2005 until December 2020 were identified using a three-step literature search in order to balance feasibility with breadth and comprehensiveness.

  • The first stage consisted of a limited search of MEDLINE and Embase by screening of text words (Entrustable Professional Activit*) contained in the title and abstract by two authors (MH, MD) independently.
  • The second stage used these text words as search terms across all included databases (adding Google Scholar, Scopus and Web of Science). These databases were chosen to span literature on EPAs and to be as comprehensive as possible when considered together. The full details of the search syntaxes used in this review can be found in the Supporting Information (Appendix 1).
  • The third stage included analysis of the reference lists of all identified reports and articles for additional studies.

2.3 연구 선정
2.3 Study selection

2.3.1 포함 기준
2.3.1 Inclusion criteria

포함시킬 수 있는 연구들은 다음과 같은 연구였다.

  • (i) 개발된 EPA 프레임워크의 논리를 설명하거나 최소한 EPA 제목을 제공한다. 
  • (ii) 대학원 의학 교육 또는 펠로우십 프로그램 및 
  • (iii) 영어로 쓰여졌다.

포함된 연구는 대조, 요약 및 결과 보고가 가능하도록 표와 서술 형식으로 차트화되었습니다.

Eligible for inclusion were studies that

  • (i) either described the logic of developed EPA frameworks and/or provided at least the titles of EPAs for
  • (ii) a postgraduate medical education or a fellowship programme and
  • (iii) were written in English.

Included studies were charted in a tabular and narrative format allowing for collation, summarising and reporting of results.

2.3.2 배제 기준
2.3.2 Exclusion criteria

다음과 같은 문헌은 제외되었다.

  • (i) 주 원고, 보충 데이터 및 온라인 보충 데이터에 EPA 프레임워크를 제공하지 않아 기본 논리를 분석할 수 없었다. 
  • (ii) EPA의 규모와 복잡성의 결정에 영향을 미칠 수 있으므로 (하위) 전문 교육 프로그램의 단일 EPA 또는 일부 EPA에 대해서만 설명한다. 
  • (iii) 학부생, 대학원 의학 교육(GME)에 입학하는 신규 졸업생의 평가 및 기타 보건 전문직(예: 간호사, 수의사, 약사)을 위한 EPA 프레임워크를 제공했다.

Papers were excluded if they

  • (i) did not provide an EPA framework in either the main manuscript, supplemental data and/or online supplemental data, making it impossible to analyse the underlying logic;
  • (ii) described only a single EPA and/or EPAs for a part of a (sub)specialty training programme as this may have impacted decisions of size and complexity of the EPAs; and/or
  • (iii) offered an EPA framework for undergraduates, for the evaluation of newly graduated students entering graduate medical education (GME) and/or for other health professions (e.g., nurses, veterinarians and pharmacists).

2.4 선별과정
2.4 Screening process

두 명의 저자(MH, MD)는 검색 과정에서 반환된 모든 제목과 초록을 독립적으로 선별하여 포함 기준을 충족하지 않는 논문을 거부하였다. 논문을 포함하거나 제외하는 결정을 제목 및/또는 요약에 기초하여 내릴 수 없는 경우, 그 결정을 알리기 위해 전문에 접근했다. 현시점에서 불확실성이 여전했다면 제3의 저자(SG)가 심판 역할을 해 합의를 이끌어냈다. 
Two authors (MH, MD) independently screened all titles and abstracts returned during the search process, rejecting papers that did not meet the inclusion criteria. If a decision to either include or exclude a paper could not be made based on title and/or abstract, the full text was accessed to inform the decision. If uncertainties still remained at this point, a third author (SG) served as referee to help reach consensus.

2.5 논리의 분류
2.5 Categorisation of logic

심사 과정 동안 데이터의 반복 분석(종종 근거 분석이라고 함)을 이용한 귀납적 코딩 스타일을 두 명의 저자(MH, MD)가 독립적으로 사용하여 코드 초안을 작성했다. 이후 팀 미팅(MH, MD, SG, DT, OtC)을 개최하여 10편의 논문의 파일럿 코딩에 대해 논의하고, 이후 데이터 코딩과 추출을 MH와 MD가 수행하는 코딩 절차를 미세 조정하였으며, 두 저자는 제3저자(SG)와 함께 논문 내 포함된 모든 논문과 코딩된 EPA 로직을 독립적으로 읽고 재독하였으며, 사용된 논리에 대한 합의가 즉시 이루어지지 않았을 때 심판 역할을 맡았습니다. 
During the screening process, an inductive coding style using iterative analysis of the data (often referred to as Grounded Analysis) was be used by two authors (MH, MD) independently resulting in draft codes.18 Hereafter, a team meeting (MH, MD, SG, DT and OtC) was held to discuss a pilot coding of 10 papers and to fine-tune the coding procedure, following which data coding and extraction were performed by MH and MD. Both authors independently read and re-read all of the included papers and coded EPA logics within the papers with the third author (SG) serving as referee for papers when consensus on the logic used was not immediately reached.

3 결과
3 RESULTS

검색전략은 총 2607개의 인용을 확인하였으며, 중복제외 후 681개의 인용을 도출하였다. 이 중 42편의 논문이 이 검토에 포함되도록 선택되었다(PRISMA 다이어그램의 경우 그림 1 참조). 
In total, the search strategy identified 2607 citations, resulting in 681 citations after de-duplication. Of these, 42 papers were selected for inclusion in this review (for a PRISMA diagram see Figure 1).

3.1 EPA 프레임워크의 논리를 설명하는 논문의 일반적인 특성
3.1 General characteristics of papers describing the logic of EPA frameworks

Microsoft Excel 버전 16.54(표 1)를 사용하여 관련 연구 데이터(예: 출판 연도, 국가, 전문성 및 교육 수준)를 추출하고 표로 작성했습니다. 포함된 논문의 주요 특성은 표 2에 요약되어 있습니다. 대학원 또는 펠로우십 프로그램에 대한 EPA 프레임워크의 논리를 설명하는 대부분의 연구는 미국(n = 22; 52%), 캐나다(n = 6; 14%), 네덜란드(n = 4; 10%)(표 2)에서 수행되었다. 보고된 전공의 범위 전체에서 가정의학과(n=4;10%), 내과학과(n=4;10%), 소아과(n=3;7%), 정신과(n=3;7%)가 가장 많았다. 또한 프레임워크의 69%는 전공의용(n = 29), 31%는 전임의용(n = 13)으로 개발되었다. 
Relevant study data (e.g., publication year, country, specialty and level of training) were extracted and tabulated using Microsoft Excel Version 16.54 (Table 1). Key characteristics of included papers are summarised in Table 2. Most studies describing the logic of EPA frameworks for postgraduate or fellowship programmes were conducted in the United States (n = 22; 52%), Canada (n = 6; 14%) and the Netherlands (n = 4; 10%) (Table 2). Across the reported range of specialties, family medicine (n = 4; 10%), internal medicine (n = 4; 10%), paediatrics (n = 3; 7%) and psychiatry (n = 3; 7%) were the most common. Furthermore, 69% of the frameworks had been developed for residency (n = 29), 31% for fellowships (n = 13).

 

3.2 다양한 EPA 프레임워크 로직
3.2 Variety of EPA-framework logics

총 862개의 EPA가 EPA 프레임워크(범위 3-79)당 14개의 EPA의 중위수로 42개 조항에 설명되었다(표 1). 데이터의 반복 분석을 사용한 귀납적 코딩 스타일을 기반으로 다음 논리가 확인되었습니다(예시).

  • 1) 임상 서비스를 포함한 서비스 제공: 직접('중상환 신생아의 영양 요구 관리') 및 간접 환자 치료('가족 회의 촉진') 및 
    비임상 의료 서비스('혈액 성분 수혈과 관련된 부작용 평가 및 보고') 
  • 2) 프로시져 ('삽관, 기관지경, 흉부천자, 중심 정맥 카테터 배치 및 초음파를 포함한 일반적인 중환자 치료 절차 수행' 및 
  • 3) 질병 또는 환자 그룹('비감염성 질염성 질염 환자 식별 및 관리') (표 1) 

A total of 862 EPAs were described in the 42 articles with a median of 14 EPAs per EPA framework (range 3–79) (Table 1). Based on an inductive coding style using iterative analysis of the data, the following logics were identified (with examples):

  • 1) service provision including clinical services for direct (‘Managing nutritional needs of critically ill newborns’) and indirect patient care (‘Facilitating family meetings’) as well as non-clinical health care services (‘Evaluating and reporting adverse events involving the transfusion of blood components’);
  • 2) procedures (‘Performing common critical care procedures, including intubation, bronchoscopy, thoracentesis, central venous catheter placement, and ultrasound’; and
  • 3) disease or patient groups (‘Identifying and managing patients with noninfectious GI luminal disease’) (Table 1). 

눈에 띄는 것은, 보고된 모든 EPA의 13%(n = 109)가 의사가 서비스하는 사람들의 의료 요구를 효과적으로 충족시키기 위해 필요한 능력을 기술했다. (예: '평생 학습 참여', '전문적 행동 시연'). 이러한 EPA는 종합적인 위탁 결정에 적합하지 않기 때문에, 이 그룹은 4) 비 EPA로 분류되었다.
Notably, 13% (n = 109) of all reported EPAs described abilities physicians require to effectively meet the health care needs of the people they serve (e.g. ‘Engaging in life-long learning’, ‘Demonstrating professional behavior’). As these EPAs are not suitable for summative entrustment decisions, this group was categorised as 4) non-EPAs.

대부분의 논문(n = 37; 88%)은 EPA 프레임워크 개발에 2개 이상의 논리를 사용했다(표준 = 3, 범위 = 1~4). 질병 또는 환자 그룹과 서비스 제공이 가장 많이 사용된 논리(각각 39%와 37%)였다(표 1).
The majority of papers (n = 37; 88%) used two or more logics in the development of EPA frameworks (median = 3, range = 1–4). Disease or patient groups and service provision were the most common logics used (39% and 37%, respectively) (Table 1).

4 토론
4 DISCUSSION

이 검토에서, 우리는 대부분의 프로그램이 EPA의 프레임워크를 확립하기 위해 [논리의 조합을 사용한다]는 것을 발견했다. 그러한 프로그램의 개발자들이 의도적으로 이러한 분류를 선택했을 수도 있고 아닐 수도 있지만, 많은 사람들은 단지 하나의 논리적 분류를 찾지 않고 최선의 접근법이 무엇인지 알아내는 데 시간을 보냈을 것이다. 지금까지 '최선의' 접근법에 대한 권고안이 제시되지 않았으며, 의료 전문 분야와 다른 보건 전문 교육 프로그램 간의 차이는 방어 가능한 것으로 보인다. 빠르게 확장되는 문헌에 비추어, 우리는 실제로 사용되어 온 지배적인 논리를 탐색하고 EPA 프레임워크를 만들기 위한 새로운 이니셔티브에 유용할 수 있는 권장 사항을 증류하고자 했다. 
In this review, we found that most programmes use a mix of logics to establish a framework of EPAs. Whereas the developers of those programmes may, or may not, have deliberately chosen these categorizations, many will have likely spent time to figure what the best approach would be, without finding just one logical categorisation. So far, no recommendations for a ‘best’ approach20 have been offered, and differences between medical specialties, and among other health professions educational programmes, seem defensible. In light of the quickly expanding literature, we sought to explore the dominant logics that have been used in practice and to distil recommendations that may be useful for new initiatives to create EPA frameworks.

4.1 EPA의 광범위한 서비스 범위
4.1 The broad service range of EPAs

EPA를 정의할 때 [EPA의 목적]을 염두에 두는 것이 유용하다. 여러 출판물들은 그것의 정의와 EPA가 역량과 어떻게 다른지 상세히 설명하였다. '전문 실무 단위'로서 EPA는 전문 업무를 개념화하기 때문에 반드시 교육 모델이 될 필요는 없다. 그들은 주로 전문 교육을 위한 커리큘럼을 개발하고 직장 평가 절차를 만드는 데 사용되었다. 그러나 [필수 작업essential tasks]을 정의하는 것이 항상 명확한 것은 아닙니다. 또한, EPA는 고유한 우선 순위, 의무 및 목적을 가진 국가 또는 심지어 [국제 기구]에 의해 점점 더 공식화되고 있다. 이는 지역적으로 EPA를 선택하거나 식별하는 자유를 제한하며 프로그램, 기관 또는 국가를 넘어서는 [총괄적 위임 결정]을 인정하는 역할을 한다. 가까운 장래에 EPA는 예를 들어 관련된 교육생과의 부작용 발생 시 책임에 대한 분쟁이 발생하거나 [의료행위 범위의 정당성]이 위태로울 때 사법기관에 의해 인정될 수 있다. 그것은 자격 증명으로 인정되고, 위탁되고, 인증될 수 있는 전문 실무 단위의 건전한 공식화의 필요성을 강조한다. 
In defining EPAs, it is useful to keep their purpose in mind. Multiple publications have elaborated on its definition and how EPAs differ from competencies.3, 10, 21 EPAs, as ‘units of professional practice’, are not necessarily an educational model as they just conceptualise professional tasks.10 They have primarily been used to develop curricula and create workplace assessment procedures for specialty training; however, defining the essential tasks is not always clear-cut. Furthermore, EPAs are increasingly formulated by national or even international bodies with unique priorities, mandates and purposes.22-26 This limits the freedom to choose or identify EPAs locally and serves to acknowledge summative entrustment decisions beyond a programme, institution or country. In a foreseeable future, EPAs may be acknowledged by legal bodies, for example, when disputes arise about accountability in case of adverse events with trainees involved27 or when the legitimacy of a scope of practice is at stake. That stresses the need for a sound formulation of the units of professional practice that can be acknowledged, entrusted and certified as a credential.

최근 몇 년 동안 교육 후 EPA의 잠재적 역할이 더 많은 관심을 받고 있다. 3개의 네덜란드 UMC의 상주 코디네이터는 최근 EPA에게 재인증의 핵심 지위를 줄 것을 간청했다. 또한, EPA의 사용은 어떤 직원이 어떤 의료 특권을 가지고 어떤 훈련을 어떤 수준에서 수행할지 명시하도록 요청하는 'Joint Commission'가 수행하는 것과 같은 [병원 자격 증명 요건]과 자연스럽게 일치fit한다. 이는 EPA의 추가 목적 역할을 한다.
In recent years, the potential role of EPAs after training has received more attention.28, 29 Residency coordinators of three Dutch UMCs recently pleaded to give EPAs a core status in recertification.30 In addition, the use of EPAs naturally fits with requirements of hospital credentialling, such as done by the ‘Joint Commission’,31 which ask to specify which employees have which health care privileges and which tasks are to be performed by which trainees under which level of supervision. This serves as an additional purpose of EPAs.

4.2 주요 논리의 장단점
4.2 Pros and cons of the main logics

EPA 프레임워크 개발을 위한 논리를 선택하는 것은 어려울 수 있다. 각 접근방식은 아래에 논의된 바와 같이 장점과 단점이 있기 때문이다.
The choice of a logic for developing an EPA framework may be difficult, as each approach comes with benefits and drawbacks as discussed below.

4.2.1 서비스 제공
4.2.1 Service provision

[서비스 제공 EPA]는 [일반적으로 임상의의 스케쥴에 포함된 활동]을 반영하므로, 장점은 손쉽게 인식, '지정assigned', 금지prohibited된다. 그것들은 [광범위하고 일반적]이며, 위임 결정은 이러한 서비스 중에 발생할 수 있는 프로시져와 질병에 대한 [적절한 경험]을 전제로 한다. 이로 인해 EPA가 주니어 학습자들에게 덜 적합하게less suitable 된다. EPA '표준 외래 환자 상담'을 예로 들 수 있는데, 이는 보다 상급 의료 교육생에게 논리적이고 적합한 활동이다. 이 EPA에는 의대생에게 적합한 독립적 EPA로서 기능할 수 있는 '의학 이력서 작성' 및 '전체 표준 신체검사 수행'과 같은 활동이 포함될 것으로 추정된다. 또한, [서비스 제공 EPA]는 사례 특이성이 부족할 수 있으며, 결과적으로 감독 임상의가 적용apply하기 어려울 수 있다. 평가 시 표본 추출에 주의하지 않는 한, 이 접근 방식은 또한 특정 EPA에 대한 평가가 포함된 환자의 프레젠테이션 전반에 걸쳐 일반화될 수 있다고 가정한다.
These EPAs reflect activities as they are usually scheduled for clinicians and are therefore easily recognised, ‘assigned’ and/or prohibited. They are broad and general, and entrustment decisions assume adequate experience with procedures and diseases that may be encountered during these services. This makes them less suitable for junior learners.3 Take for example the EPA ‘standard outpatient consultation’, a logical and suitable activity for more advanced medical trainees. This EPA will presumably include activities like ‘taking a medical history’ and ‘performing a full standard physical examination’, activities that in itself may serve as suitable standalone EPAs for medical students. Furthermore, service provision EPAs may lack case specificity and as a result can be challenging for supervising clinicians to apply.6 Unless there is careful attention to sampling in assessment, this approach also presumes assessments for a given EPA can be generalised across included patients' presentation.

4.2.2 프로시져
4.2.2 Procedures

일부 전공 분야의 경우 프로시져(또는 프로시져의 클러스터)가 선호 EPA(예: 내시경 및 수술)가 될 수 있다. 일반적으로 잘 훈련될 수 있는 명확하고 잘 표시된 작업이다. 프로시져를 EPA로 채택하는 위험은 [개별적으로 고려할 때 매우 작거나 좁은 범위의 기술에 초점]을 맞춘다는 것이다. 작고 따라서 많은 절차적 EPA가 본질적으로 문제가 되는 것은 아니지만, 학습자에게 이러한 자격을 부여하기 위한 심각한 [총괄적 위임 결정]의 절차는 까다로운 일이 될 수밖에 없다. 또한, 이러한 소규모 EPA는 신뢰에 대한 여러 조건을 포함하기보다는 [정신운동 능력에만 초점을 좁힐 위험]도 수반한다.
For some specialties, procedures (or clusters of procedures) can be preferred EPAs (e.g. endoscopies and surgeries); they are clear and well-demarcated tasks that generally can be trained well. The risk of adopting procedures as EPAs is that they may be very small when considered individually and that the focus is on a narrow range of skills.3, 6 Small and thus many procedural EPAs are not inherently problematic, but serious summative entrustment decisions to qualify learners for these are bound to lead to cumbersome procedures.3, 6 Furthermore, these small EPAs incorporate the risk that the focus will narrow to psychomotor skills only, rather than including multiple conditions for trust.

4.2.3 질병 또는 환자군
4.2.3 Disease or patient group

[비시술적 전문분야]의 경우 [질병]이 빨리 떠오른다; [질병 X를 가진 환자를 관리하는 것]은 분명한 임무처럼 들린다. 질병이 논리로 나타나는 단점은 [감별 진단이 첫 번째 과제임을 무시하는 것]이다. 또한 질병은 학습자가 취급할 수 있는 공식적인 자격을 얻기보다는 '만난 것'의 체크박스 항목이 될 위험이 있는 [길고 상세한 목록]을 초래할 수 있다. [프로시져 EPA]와 유사하게, 질병에 대한 의료 전문지식을 중심으로 한 [좁은 범위의 역량에 초점]을 맞출 수 있다. 질병을 EPA의 논리로만 사용하는 것은 유용하고 실용적이지 않을 수 있다. 예를 들어 [진단 및 리퍼referral 후 치료가 일반적인 경우]에는 [질병 또는 질병 그룹]이 유용한 논리가 될 수 있다.
For non-procedural specialties, diseases come to mind quickly; managing patients with disease X sounds like a clear task. A draw-back of diseases as a logic is the disregard of differential diagnosis as a first task. Further, diseases may result in long and detailed lists with the risk of becoming checkbox items of what the learner ‘has encountered’ rather than having received a formal qualification to handle.3, 6 Analogously to the procedural EPA, it can focus on a narrow range of competencies centred on medical expertise for a disease. Using diseases only as the logic for EPAs may not be useful and practical. In some cases, diseases or disease groups can be a useful logic, for example, when treatment after diagnosis and referral is common practice.

4.2.4 비EPA
4.2.4 Non-EPAs

우리는 발표된 모든 'EPA'가 종합위탁 결정에 적합한 것은 아니며, 어떤 것은 EPA로서 유용성이 떨어진다고 판단했다. 우리는 모든 EPA의 13%(표 1)를 비 EPA로 분류했으며, 종종 의사가 서비스하는 사람들의 의료 요구를 효과적으로 충족시키는 데 필요한 능력을 설명한다. '평생 학습 참여', '전문적 행동 시연', '환자 안전 강화', '환자 개개인에 대한 옹호' 등이 대표적이다. 이러한 활동을 수행하는 것을 금지하는 것에서 직간접적인 감독 하에 허가하는 것으로의 전환을 상상하는 것은 어렵다. 우리는 훈련에 대한 이러한 목표의 중요성에 이의를 제기하지 않지만, 그것들은 독립적 EPA와는 다른 방식으로 훈련에 통합되어야 한다. EPA로 유용하게 개념화되지 않은 훈련 목표를 다루는 몇 가지 방법이 최근 텐 카테와 슈마허에 의해 제공되었다. 
We deemed not all published ‘EPAs’ as suitable for summative entrustment decisions and hence are less useful as EPAs. We qualified 13% (Table 1) of all EPAs as non-EPAs, often describing the abilities physicians require to effectively meet the health care needs of the people they serve. Examples include ‘Engaging in life-long learning’, ‘Demonstrating professional behavior’, ‘Enhancing patient safety’ and ‘Advocating for individual patients’. It is difficult envision the transition from a prohibition to perform these activities to permission to do so with direct or indirect supervision. We do not dispute the importance of these objectives for training, but they should be incorporated in training in a different way than stand-alone EPAs. Several ways to deal with objectives of training that are not usefully conceptualised as EPAs were recently provided by ten Cate and Schumacher.32

이 연구의 몇 가지 한계를 고려해야 한다. 첫째, 의학 대학원 및/또는 동료 훈련 프로그램의 발표된 EPA 프레임워크만 포함되었기 때문에 선택과 출판 편향의 문제가 있다. 네덜란드의 모든 전문 교육 프로그램에서 사용되는 EPA 유형의 요약을 포함하는 최근 논문은 유사한 논리를 발견했으며 부분적인 '회색 문학' 확인으로 볼 수 있다. 우리의 검토에서, 주요 이해관계자 그룹과 관련된 초기 EPA 프레임워크에 대한 근거는 일반적으로 설명되지 않았다. 개발자는 처음부터 시작했거나 통치 기관이나 국가 기관이 부과한 지침과 요구사항을 따랐을 수 있다. 다음으로, 적격 기사들은 외과 전문분야의 거의(n = 2)를 포함하였고, 이는 잠재적으로 논리로서 '구조'를 과소평가하게 만들었다. 그러나 이러한 유형의 논리의 중요성은 네덜란드에서 더 높은 발생률로 뒷받침된다. 보고된 일부 EPA는 둘 이상의 논리 범주로 분류될 수 있다. EPA 세트에 따라 EPA는 한 세트에서는 환자 범주이고 다른 세트에서는 서비스 범주일 수 있다. 

Several limitations of this study must be considered. First, there is the issue of selection and publication bias as only published EPA frameworks of medical postgraduate and/or fellow training programmes were included. A recent paper that includes a summary of the types of EPAs used by all specialty training programmes in the Netherlands found similar logics and can be seen as a partial ‘grey literature’ confirmation.26 In our review, the rationales for the initial EPA frameworks as relates to key stakeholder groups were usually not described. Developers may have started from scratch or have followed guidelines and requirements imposed by governing institutions or national bodies. Next, eligible articles included few (n = 2) from surgical specialties, potentially leading to an underestimation of ‘procedures’ as a logic. The importance of this type of logic, however, is supported by its higher occurrence in the Netherlands.26 Some reported EPAs could be categorised in more than one logic category; depending on the set of EPAs, an EPA may be a patient category in the one set and a service in the other.

수용된 권장 사항을 따름으로써 [개선할 수 있는 많은 EPA 제목]을 접했는데, 이는 논리 범주에 대한 의구심을 해소했다. 예를 들어, '검사 결과 전달'은 전문 실무의 독립적 단위로 간주할 가치가 거의 없기 때문에 확실히 더 성숙한 EPA에 내포될 수 있는 조기 교육 EPA일 수 있으며 부정사infinitive로 더 잘 공식화될 수 있다('진단 시험 결과의 소통'). 우리가 했던 [범주화의 한계]는 [full EPA description]에 대한 통찰력을 거의 갖지 못했다는 것이다. 예를 들어, 우리는 '예방'을 비 EPA로 인정했지만, 규격에는 EPA가 서비스 제공 논리에 속하는 것으로 간주하도록 만들 수 있는 매우 구체적인 하위 활동의 번들 또는 목록이 포함되어 있었을 수 있다. 단지 '예방'을 위해 임상의사를 인증하는 것은 종합적인 위탁 결정에 필요한 명확성이 부족하다. 마지막으로, EPA의 효과나 유효성을 설명하는 제한된 연구가 존재하며, 현재까지 우리는 어떤 논리 범주의 우월성을 지지할 이유가 없다. 향후 연구는 일반적인 EPA 사용에 대한 타당성 증거를 제공하는 것뿐만 아니라 설명된 논리의 사용(또는 우월성)을 뒷받침하는 데 초점을 맞춰야 한다.
We encountered many EPA titles that could be improved, if accepted recommendations10 were followed, which we gave the benefit of the doubt for a logic category. For example, ‘Communicates results of exams’ might be an early training EPA that would definitely be nested in a more mature EPA, as it is hardly worth considering it a stand-alone unit of professional practice, and it might be better formulated with an infinitive (‘Communicating diagnostic exam results’). A limitation of our categorisation is that we rarely had insight into the full EPA description. For example, we qualified ‘Prevention’ as a non-EPA, but the specifications might have included a bundle or list of very concrete sub-activities that could have made us consider the EPA as belonging to the service provision logic. Certifying clinicians just for ‘prevention’ lacks the necessary clarity for a summative entrustment decision. Finally, limited studies exist describing the effectiveness or validity of EPAs, and to date, we have no reason to support superiority of any one logic category. Future research should be directed at providing validity evidence for not only the use of EPAs in general but also to support the use (or superiority) of the described logics.

5 결론
5 CONCLUSION

이 연구는 대학원 의학 교육 및 펠로우십 프로그램에 걸쳐 EPA 프레임워크 개발에 사용되는 논리를 매핑하기 시작했다. '서비스 제공', '절차' 및/또는 '질병 또는 환자 그룹'이라는 세 가지 주요 논리가 식별될 수 있다. 각 논리에 대해 명확한 정의는 예, 이점 및 한계와 함께 제공됩니다. EPA에서 직업의 필수 업무를 포착하려고 할 때, 발견된 논리 유형 중 두세 가지를 조합하여 사용하는 것이 가장 적합해 보인다. 이러한 결과는 향후 EPA 프레임워크 개발자에게 유용한 발판을 제공할 수 있다.
This study set out to map the logics used in development of EPA frameworks across postgraduate medical education and fellowship programmes. Three dominant logics could be identified, namely, ‘service provision’, ‘procedures’ and/or ‘disease or patient groups’. For each logic, a clear definition is provided together with examples, benefits and limitations. When trying to capture the essential tasks of a profession in EPAs, the use of a combination of two or three of the types of logic found seems most suitable. These findings may provide helpful scaffolding for future EPA-framework developers.

 


Med Educ. 2022 Sep;56(9):881-891.  doi: 10.1111/medu.14806. Epub 2022 Apr 19.

 

The logic behind entrustable professional activity frameworks: A scoping review of the literature

 

Affiliations

1Department of Pediatric Intensive Care, University Medical Center Utrecht, Utrecht, The Netherlands.

2Intensive Care Center, University Medical Center Utrecht, Utrecht, The Netherlands.

3Department of Medicine, Queen's University School of Medicine, Kingston, Ontario, Canada.

4Center for Research and Development of Education, University Medical Center Utrecht, Utrecht, The Netherlands.

PMID: 35388517

PMCID: PMC9542438

DOI: 10.1111/medu.14806

Free PMC article

 

Abstract

Introduction: Entrustable professional activities (EPAs), discrete profession-specific tasks requiring integration of multiple competencies, are increasingly used to help define and inform curricula of specialty training programmes. Although guidelines exist to help guide the developmental process, deciding what logic to use to draft a preliminary EPA framework poses a crucial but often difficult first step. The logic of an EPA framework can be defined as the perspective used by its developers to break down the practice of a profession into units of professional work. This study aimed to map dominant logics and their rationales across postgraduate medical education and fellowship programmes.

Methods: A scoping review using systematic searches within five electronic databases (Medline, Embase, Google Scholar, Scopus and Web of Science) was performed. Dominant logics of included papers were identified using inductive coding and iterative analysis.

Results: In total, 42 studies were included. Most studies were conducted in the United States (n = 22; 52%), Canada (n = 6; 14%) and the Netherlands (n = 4; 10%). Across the reported range of specialties, family medicine (n = 4; 10%), internal medicine (n = 4; 10%), paediatrics (n = 3; 7%) and psychiatry (n = 3; 7%) were the most common. Three dominant logics could be identified, namely, 'service provision', 'procedures' and/or 'disease or patient categories'. The majority of papers (n = 37; 88%) used two or more logics when developing EPA frameworks (median = 3, range = 1-4). Disease or patient groups and service provision were the most common logics used (39% and 37%, respectively).

Conclusions: Most programmes used a combination of logics when trying to capture the essential tasks of a profession in EPAs. For each of the three dominant logics, the authors arrived at a definition and identified benefits, limitations and examples. These findings may potentially inform best practice guidelines for EPA development.

산을 옮기는 일: 대형 유럽 의과대학의 주요 교육과정 개편을 향한 실용적 통찰(Med Teach, 2018)
Moving a mountain: Practical insights into mastering a major curriculum reform at a large European medical university
Asja Maaz , Tanja Hitzblech , Peter Arends, Antje Degel, Sabine Ludwig, Agata Mossakowski, Ronja Mothes, Jan Breckwoldt and Harm Peters 

 

서론
Introduction

학부 의학 교육의 가장 중요한 혁신 중 하나는 전통적인, 학문-기반 프로그램에서 통합 및 역량 기반 프로그램으로의 세계적인 움직임이다(Frenk et al. 2010). 이러한 근본적인 변화에 대한 요구는 의료 제공의 엄청난 발전, 환자와 사회의 확장된 요구, 그리고 의학 교육 자체의 이론과 실천의 진전에 기초하고 있다. 주요 커리큘럼 개혁은 밀접하게 관련된 이중 과제를 숙달하는 것을 의미한다. [커리큘럼]과 [전달 조직]의 모두의 변화. 이 도전의 규모는 "산을 움직이는 것"이라는 은유에 의해 잘 반영된다. 잘 설계된 계획과 엄청난 노력이 필요하다. 이 분야에서는 실용적인 추천을 받은 문학이 드물다. 따라서, 많은 기관들이 여전히 그들의 프로그램을 개혁하는 것을 주저하고 있다는 것은 놀라운 일이 아닐 수 있다. 본 논문에서는 이러한 주요 교육과정 개혁을 우리 기관에서 마스터링하기 위한 전략을 프로젝트 관리 관점에서 보고하고 실질적인 통찰력을 제공한다.
One of the most significant innovations in undergraduate medical education is the global movement from traditional, discipline-based to integrated, and competency-based programs (Frenk et al. 2010). The demand for this fundamental change is based on tremendous advances in the delivery of health care, the expanded needs of patients and society, as well as the progress in theory and practice of medical education itself. A major curricular reform implies mastering of a closely interrelated, dual challenge: the change of both, the curriculum and the delivering organization (Loeser et al. 2007; Jippes et al. 2015). The magnitude of this challenge is well reflected by the metaphor of “moving a mountain”: it needs a well-designed plan and a magnitude of effort (Bland et al. 2000; Bordage and Harris 2011). Literature with practical recommendations is scarce in this field. Thus, it may not be surprising that many institutions are still hesitant to reform their programs. In this article, we report from a project management perspective on the strategies in mastering such a major curriculum reform at our institution and provide practical insights.

베를린에 있는 Charité – Universitaets mediz in Berlin은 연간 두 번 300명의 의대생을 수용하는 유럽의 큰 의대를 대표합니다. 200명 이상의 교수들과 2000명 이상의 교수진들이 100여 개 학부에 걸쳐 교직에 종사하고 있다. 그 출발점은 전임상 2년, 임상 3년, 최종 사무원 1년으로 구성된 Flexner형 전통적인 학과 기반 학부 과정이었다. 주요 교육 형식은 강의, 세미나, 실험실 과정 및 개별 학과에 의해 제공되는 침대 머리맡 교육이었다. 환자와 함께 가르치는 것은 3학년 때부터 시작되었다.
Our institution, the Charité – Universitaetsmedizin Berlin represents a large European medical university with an intake of 300 medical students twice a year. More than 200 professors and 2000 faculty members, spread over some 100 departments, are involved in teaching. Starting point was a Flexner-type traditional, discipline-based undergraduate program consisting of two preclinical years, three clinical years, and one final clerkship year. The predominant teaching formats were lectures, seminars, laboratory courses, and bedside-teaching delivered by individual disciplines (Kiessling et al. 2004). Teaching with patients started in the third year.

교육과정과 전달기구의 주요 개혁은 세 가지 단계를 거쳤다. 

  • 시작 단계, 
  • 커리큘럼 개발 및 구현 단계,  
  • 지속 가능성 단계. 

다음은 변경 관리 관점에서 이 세 단계의 주요 특징을 설명하겠습니다.
The major reform at the Charité of both the curriculum and the delivering organization went through three sequential stages:

  • the initiation phase,
  • the curriculum development and implementation phase, and
  • the sustainability phase.

In the following, we will describe the main characteristics of these three phases from a change management perspective (Kotter and Schlesinger 2008).

시작 단계
The initiation phase

이 단계의 핵심은 [변화의 필요성을 확립]하고 [기관의 준비를 촉진]하는 것이었습니다. 우리의 경우, 전통적인 교육과정의 학생들이 변화의 필요성을 분명히 하는 주요 동인이었다. 그들의 시위는 환자 중심의 교육과 훈련뿐만 아니라 더 많은 연습practice을 요구하는 [1989년 파업]으로 절정에 달했다. 이를 통해 [실무 및 커뮤니케이션 능력 교육]이 가능한, 대안적 문제기반학습(PBL) 교육과정 제안서를 마련한 교직원과 학생들로 구성된 워킹그룹을 공식 설치하게 됐다.
The key to this phase was establishing the need for change and facilitating the readiness of the institution. In our case, students from the traditional curriculum were the main drivers in making the need for change evident. Their protest culminated in a strike in 1989 to demand more practice as well as patient-oriented education and training. This led to the official installation of a working group of faculty and students who prepared a proposal for an alternative, problem-based learning (PBL) curriculum with practical and communicative skills training.

[커리큘럼 개혁에 대한 시범 연구를 수행하는 것]이 변화에 대한 준비를 촉진하는 핵심 전략으로 부상했다. 1999년, 샤리테는 [학생 집단의 10%]에게 독일에서 최초로 [개편된 의과대학 교육과정]을 시행하는 개혁 시범 연구를 시작했다. 이번 개혁 시범사업은 실현가능성을 입증하는 것으로 매우 가치가 있었다. 동시에 커리큘럼 개발과 새로운 교육 형식에 대한 전문 지식을 갖춘 실질적이고 헌신적인 교수진을 구성했다. 파일럿은 학생들을 포함한 교직원의 많은 이해 관계자들과 함께 커리큘럼 개혁에 대한 지속적인 토론을 자극했다. 토론의 결과 중 하나는 학생들이 [새로운 커리큘럼의 비전과 결과를 설명하는 상세한 제안서]를 작성했다는 것이다. 이 기여는 학생들의 입장에 대한 신뢰도에 많은 것을 더했다.
Doing a pilot study on curricular reform emerged as the key strategy to facilitate readiness for change. In 1999, the Charité started a reform pilot study whereby 10% of the students´ cohort implemented the first reformed medical curriculum in Germany. This reform pilot work was very valuable as a demonstration of general feasibility. Simultaneously it built-up a substantial and dedicated group of faculty with expertise in curriculum development and new teaching formats. The pilot stimulated a continuous debate on curricular reform with many stakeholders in the faculty including the students. One result of the discussion was that the students drafted a detailed proposal delineating their vision and outcomes of the new curriculum. This contribution added much to the credibility of the students’ position.

두 프로그램을 병행 운영하면 졸업생을 비교 대조할 수 있었다. 이러한 연구에서 두 커리큘럼의 학생들은 졸업 의사에 대한 기대가 매우 비슷했지만, 학생들은 개혁 파일럿 프로그램에 의해 훨씬 더 잘 준비되었다고 느꼈다. 그 결과는 변화의 필요성을 촉진시켰고 학장들에게 미래의 전체 학생들을 위한 주요 커리큘럼 개혁을 시작하기 위한 설득력 있는 주장을 제공했다.
Running two programs in parallel allowed one to compare and contrast their graduating students. In such a study, students from both curricula had very similar expectations of a graduating physician, but students felt much better prepared by the reform pilot program (Burger et al. 2003; Pruskil et al. 2009; Dettmer and Kuhlmey 2010). The results catalyzed the need for change and provided the deanery with persuasive arguments to initiate the major curricular reform for the future entire students cohorts.

커리큘럼 개발 및 구현 단계
Curriculum development and implementation phase

2009년, 학장은 변화의 절박한 필요성에 대응하여 주요 교육과정 개혁을 결정했다. 새로운 학부 의료 프로그램은 [2010년에 새로 등록한 모든 학생들]을 위해 시작하도록 제안되었고, 따라서 전통적인 프로그램 및 시범 프로그램을 대체했다.
In 2009, the deanery responded to the pressing need for change and decided for a major curricular reform. A new undergraduate medical program was proposed to start in 2010 for all newly enrolled students, thus replacing the traditional and reform pilot programs.

프레임 설정
Setting up the frame

새 커리큘럼의 일반적인 청사진을 정의하기 위해 [주요 샤리테 이해당사자들과 함께 위원회가 설치]되었다. 위원들은 경험이 풍부한 교수와 교직원이었으며, 이들 중 상당수가 개혁 파일럿에 참여했으며 개혁 파일럿에 참여했던 학생들의 지원을 받았다. 이것은 변화의 원동력을 모으는 데 매우 중요했다. 6개월에 걸친 매우 집중적이고 논란의 여지가 있는 토론에서 위원회는 모듈식 구조를 개발하고 2004년에 교수진 전체의 델파이 프로세스를 포함하는 기존 결과 카탈로그에 합의했다. 결과 카탈로그는 [스코틀랜드 닥터]나 [브라운 대학 의과대학 교육 청사진]과 같은 당시 논의된 [역량 카탈로그]에서 영감을 받았다. 새로운 6년 프로그램은 40개의 수직 및 수평 통합 모듈로 구성되었습니다(연간 8개의 모듈, 최종 사무직 연도, 보충 자료 1 참조). 첫 주부터 환자접촉을 중심적으로 하고 학생 스스로 [작은 전문적 과제]를 수행할 수 있는 능력을 꾸준히 키워 임상역량을 키워나가는 것이 핵심 요소였다. 이러한 결과 방향을 지원하기 위해 [세 개의 종단 트랙]이 설계되었다.

  • 첫째, 협업 학습(및 직장에서의 미래 협업)을 지원하기 위한 형식으로서 PBL, 
  • 둘째, 환자 접촉과 밀접하게 연관된 트랙 "커뮤니케이션, 상호작용, 팀워크"와 
  • 셋째, 과학적 기반 추론(증거 기반 추론에 필요한 경우)을 육성하기 위한 "과학적 작업 트랙". 

지역사회 기반 교육(일반의사실 실습 배치, 응급의료서비스, 노숙인 환자 서비스 기관 등)에도 관심이 쏠렸다.

A committee with key Charité stakeholders was installed for defining a general blueprint of the new curriculum. Committee members were experienced professors and teaching faculty members, many of which were involved in the reform pilot and were supported by students who were also involved in the reformed pilot. This was crucial to bring together the drivers of change (Lewin 1943; Giesler et al. 2017). In a very intensive and controversial discussion over a six months period, the committee developed a modular structure and agreed on an existing outcome catalogue that had been complied in 2004 involving a faculty-wide Delphi process. The outcome catalogue was inspired by the competency catalogues discussed at those times such as the Scottish Doctor (Simpson et al. 2002) or the Educational Blueprint for the Brown University Medical School, (Brown University website 2004). The new six-year program consisted of 40 vertically and horizontally integrated modules (eight modules per year, followed by a final clerkship year, see Supplementary Material 1). The core element was to develop clinical competencies from the first week on by making patient contact central and steadily building up students abilities to carry out small professional tasks on their own. To support this outcome orientation, three longitudinal tracks were designed:

  • first, PBL as a format to support collaborative learning (and future collaboration at the workplace),
  • secondly, a track “Communication, Interaction, and Teamwork” closely interwoven with patient contact, and
  • thirdly a “scientific work track” to foster scientifically based reasoning (as needed for evidence-based reasoning).

Attention was also paid to community-based teaching, including practice placements at general practitioners offices, the emergency medical services, and an institution serving homeless patients.

[평가 프로그램]은 발달 시험을 포함한 지식 테스트, 기술의 실제 시연, 객관 구조 임상 검사(OSCE) 및 과학적 프레젠테이션을 통합했습니다. 위원회는 또한 새로운 프로그램에 의해 달성될 특정한 지식, 기술 및 태도를 가진 역량의 정의된 결과 카탈로그에 합의했다.
The assessment program integrated knowledge testing including progress testing (van der Vleuten et al. 1996), practical demonstrations of skills, Objective Structured Clinical Examinations (OSCEs), and scientific presentations. The committee also agreed on a defined outcome catalogue of competencies with specified knowledge, skills and attitudes to be achieved by the new program.

이후 general blueprint는 공식 인증 기관(샤리테 교수 위원회와 베를린 주립 대학교)이 승인하였다. 변화 과정을 용이하게 하기 위해, 학장은 비록 수업 내용, 형식, 또는 교과 시점이 다를 수 있지만, 모든 학과가 새로운 커리큘럼에서 수업 시간과 재정적 보상을 유지할 것이라는 보장을 주었다. 이는 교수진의 불확실성을 줄이고 다가올 변화에 대한 개방성을 창출했다.
The general blueprint was subsequently approved by the Charité faculty board and the State of Berlin as the formal accreditation body. To facilitate the change process, the deanery gave the guarantee that every department would maintain its teaching time and financial reimbursement in the new curriculum, although teaching content, formats, or curricular time points might differ. This reduced faculty’s uncertainty and created openness for the upcoming change (Burke 2018).

새로운 교육과정은 학기별로 6년의 기간에 걸쳐 계획되고 시행되었다. 그 과정에 대한 우리의 성찰에서, 다음 요소들이 성공의 열쇠였습니다.
The new curriculum was planned and implemented over a six-year period, semester-by-semester. In our reflection on the process, the following elements were the key to success.

효과적인 학제간 프로젝트 관리 팀 설치
Installing an effective, interdisciplinary project management team


학장은 기초과학, 임상 교수 및 의사, 커리큘럼 개발 및 변경 관리 분야의 학제 간 전문성을 한데 모은 [프로젝트 관리팀]을 신설했다. 게다가, 공식적으로 임명된 두 명의 학생들은 정회원이었다. 이 팀은 [세 가지 주요 임무]가 있었다.

  • (i) 학제간 커리큘럼 계획 및 후속 통합 전달을 위한 변경 프로세스를 위한 [교수진 전체의 구조]를 구축한다. 
  • (ii) 일반 커리큘럼 청사진을 학기 중 [구체적인 모듈]로 운영한다. 즉, 특정 교육 시간, 형식 및 내용에 대한 세분화 및 단계별 커리큘럼 결과에 도달할 수 있도록 평가와의 정렬 
  • (iii) 교직원은 환자 치료, 연구 및 교육에 대한 의무로 크게 점유되기 때문에, 교육과정 개혁이 요구하는 실질적인 구조 및 내용 관련 업무로부터 교직원의 부담을 덜어준다.

The deanery established a project management team that brought together interdisciplinary expertise in the fields of basic science, clinical teaching and physicianship, curriculum development, and change management. Furthermore, two officially appointed students were regular members. The team had three main tasks:

  • (i) to build-up a faculty-wide structure for the change process for interdisciplinary curriculum planning and the subsequent integrated delivery;
  • (ii) to operationalize the general curriculum blueprint into concrete module und semester structures, i.e. a break-down to specific teaching hours, formats, and content, as well as an alignment with assessments so that step-by-step the curricular outcomes would be reached; and
  • (iii) to unburden the faculty from the substantial structural and content-related work which a curriculum reform requires, since the faculty is largely occupied by duties in patient care, research, and teaching.

우리 팀의 필수적인 임무는 [교직원과 자주 솔직하게 소통]하여, [저항을 수용]하고, [건설적인 힘]을 발휘하는 것이었다. 팀은 [모든 부서장에게 브리핑을 실시]하여, 교육 내용과 재정적 영향에 대한 정보를 제공했습니다. 달라진 경영 관점에서 볼 때, 이러한 [브리핑]은 불확실성을 줄이고, 취해야 할 단계에 대한 교수진의 [핵심 참가자를 준비]시키기 위한 결정적인 단계였습니다. 프로젝트 관리 팀의 신뢰성을 위해 새로운 커리큘럼의 전달에 관여하지 않는 것이 중요했고, 따라서 잠재적인 이해 상충을 피하는 것이 중요했습니다.
An essential task of our team was to communicate frequently and forthrightly with faculty members to take up resistance and to use its constructive power. The team conducted briefings with every department director to inform on the effects about teaching content and financial implications. From a changed management point of view, these briefings were a decisive step to reduce uncertainty and to prepare faculty key players for the steps to be taken. For the credibility of the project management team it was important not to be involved in the delivery of the new curriculum, thereby avoiding potential conflicts of interest.

표준화된 커리큘럼 개발 및 구현 프로세스 수립
Establishing a standardized curriculum development and implementation process

핵심 요소는 커리큘럼 개발을 위한 컨의 원칙에 기초하여 각 모듈에 대한 [구조화된 8단계 계획 과정]이었다. 이 과정은 학제간, 협업 및 상향식 과정을 지원하기 위해 투명하고 전체 교수진에게 완전히 개방되었다.
Core element was a structured, eight-step planning process for each module based on Kern´s principles for curriculum development (Kern et al. 1998). The process was transparent and completely open to the entire faculty in order to support an interdisciplinary, collaborative, and bottom-up process.

그림 1은 모듈 계획 프로세스의 8가지 단계를 개략적으로 보여주고 그림 2는 교육과정 위원회와 평가위원회의 모듈 계획과 설문 조사 간의 상호 작용을 보여줍니다.
Figure 1 provides an overview of the eight steps in the module planning process and Figure 2 shows the interaction between module planning and survey by the curriculum committee and assessment board.

 

각 모듈은 학습 목표, 교육 형식, 평가 및 결과와의 정렬을 정의하는 8주의 기간 동안 매주 공개 세션에서 계획되었습니다. 첫 번째 회의에서, 기획 그룹은 그들의 [모듈 의장]을 선출했다: [세 명의 학제간 교수진]과 [한 명의 학생 공동 의장]. 이들은 공동으로 모듈 계획 프로세스를 조정하고 구성했습니다(그림 1 참조). 모듈에 대한 계획 원칙은 "인풋에서 아웃풋까지"였다. 이것은 다양한 샤리테 부서에 최초로 제공된 모든 주제 인풋thematic inputs에서 시작되도록 의도되었다. ("심혈관 시스템" 모듈의 예는 보충 자료 2를 참조하십시오.) 그런 다음 모듈 그룹은 표준화된 8단계 내에서 구체적인 내용을 공동으로 선택, 합성 및 정제하였다. 이 과정에서 [프로젝트 관리 팀]의 주요 업무는 [광범위한 수평 및 수직 통합을 촉진]하는 것이었습니다. 처음에는 여러 부서에서 해결해야 할 과제였습니다. 그러나 기초 과학자들이 그들의 교육 내용에 추가된 임상적 의미를 인식했을 때 통합은 더욱 쉬워졌다. 
Each module was planned in weekly public sessions during a period of eight weeks defining learning objectives, teaching formats, assessment, and its alignment with outcomes. In the first meeting, the planning group elected their module chairs: three interdisciplinary faculty members and a student co-chair. They collaboratively moderated and structured the module planning process (see Figure 1). Planning principle for the modules was “from inputs to outcomes”. This was meant to start from all of the thematic inputs which the various Charité departments had first given (for an example of the module “cardiovascular system” see Supplementary Material 2). The module group then collaboratively selected, synthesized, and refined the specific content within the standardized eight steps. A main task for the project management team in this process was to facilitate a broad horizontal and vertical integration. Initially, this was a challenge for several departments. However, the integration became more facile when the basic scientists recognized the added clinical meaningfulness to their teaching content.

우리 팀은 [일반 청사진의 의도된 모듈 성과] 범위 내에서 [콘텐츠와 학생들의 작업량]을 유지하도록 도왔다. [웹 기반 플랫폼]을 사용하여 프로세스를 촉진하고 교수진 전체에게 투명성을 보장했습니다. 플랫폼에는 모든 과정에 대한 정보(전달 형식 및 기간, 전체 커리큘럼 및 모듈 내 위치, 전달 기관)가 포함되어 있습니다. 8개의 단계를 마친 후, 설계한 모듈 핸드북은 검토를 위해 커리큘럼 위원회에 넘겨졌다(부록 자료 3 참조).
Our team helped to keep the content and the students workload within the range of intended module outcomes of the general blueprint. We used a web-based platform to facilitate the process (Balzer et al. 2016) and to ensure faculty-wide transparency. The platform entailed information on every single course, format and duration of delivery, the position within the total curriculum and within the module, and the delivering institution. Finishing the eight steps, the designed module handbook was then handed over to the curriculum committee for review (see Supplementary Material 3).

[모듈의 도입]은 [다차원 평가 전략]과 병행되었다. 여기에는 학생과 교사의 온라인 평가, 초청 학생의 질적 그룹 토론, 평가 결과 등이 포함됐다. 최신 정보를 얻고 새로운 모듈의 구현을 면밀히 모니터링하기 위한 특별한 전략으로, 우리는 첫 번째 코호트 학생들이 제공하는 일일 항목이 있는 온라인 학습 일지를 사용했다. 연구 일지는 개념적으로 던디 레디 교육 환경 측정(DREEM)을 기반으로 했다.
The implementation of modules was paralleled by a multidimensional evaluation strategy. This included online evaluations by students and teachers, qualitative group discussions by invited students, and the results of assessments. As a special strategy to obtain up-to-date information and to closely monitor the implementation of new modules, we employed online study diaries with daily entries provided by students of the first cohort. The study diary was conceptually based on the Dundee Ready Education Environment Measure (DREEM; Roff et al. 1997).

많은 교수진을 참여시키고 소유권을 창출합니다.
Engaging a large body of faculty and create ownership

교수진 전체, 투명성 및 상향식 프로세스는 참여와 오너십을 촉진했습니다. [학제간 기획회의]에는 학과장 자문위원, 과학자, 학생 등 많은 교수진이 협업해 참여했다. 교수진들은 내용과 적절한 교육 형식의 중요성에 대해 토론했다. 우리 팀은 회의를 주최하고 교수진의 새로운 업무에 점점 더 힘을 실어주기 위해 교수개발 활동을 체계적으로 포함시켰습니다. 이러한 과정에 기초하여 다음 요소들이 소유권을 더욱 촉진하였다.

  • (i) 모듈 계획에 참여하는 많은 교수진이 [개별 과정]을 책임지게 되었다. 
  • (ii) 상당한 수의 교수진과 학생이 모듈 의장 자리를 맡게 되었다. 
  • (iii) 합의 달성이 주요 의사 결정 원칙이었다. 

그것은 갈등이 없었다는 것을 의미하지 않는다. 반대 의견을 해결하기 위해, 우리는 갈등을 처리하기 위한 세 가지 단계를 설정했습니다. 

  • (i) 모듈 계획 그룹에서 논의에 의한 중재 노력 
  • (ii) 모듈 의장 멤버에 의한 협상 시도 
  • (iii) 교육과정 위원회의 청문 및 결정.

The faculty-wide, transparent and bottom-up process promoted engagement and ownership. Many faculty members such as department directors consultants, scientists, and students collaboratively took part in the interdisciplinary planning meetings. Faculty members debated about the importance of content and adequate teaching formats. Our team moderated the meetings and systematically included faculty development activities to increasingly empower faculty for their new tasks. On the basis of this process, the following elements further promoted ownership:

  • (i) many faculty members participating in module planning became responsible for individual courses;
  • (ii) a substantial number of the faculty and students overtook module chair positions; and
  • (iii) achieving consensus was the main decision-making principle.

That does not mean that there was no conflict. To resolve dissent, we established three levels to handle conflicts:

  • (i) mediation efforts by discussion in the module planning group;
  • (ii) negotiation attempts by members of the module chairs; and
  • (iii) hearing and decision by the curriculum committee.

여러 단계의 학생들을 참여시킨다.
Involving students at many levels

[교수의 오너십]을 촉진하기 위한 우리의 전략은 [학생의 오너십]을 촉진하기 위한 접근법과 병행되었다. 학생들은 교육과정 변화의 중요한 이해당사자이다. 그들은 실제 커리큘럼을 경험한다. 교육위원회에서 정식 위원이라는 공통적인 역할을 넘어, 모든 모듈 계획 회의에 [모듈 공동 의장] 및 [팀 상임이사]로서 학생들을 적극적으로 참여시켰습니다. 교수진들은 학생들이 훌륭한 의사가 되려는 욕구에 초점을 맞춘 기여도를 높이 평가했습니다. 또한, 부서 이익과 무관한 것으로 인식되어 갈등을 중재하는 데 도움이 되었다. 모듈이 구현될 때 [학생 모듈 공동의장]은 특정 모듈을 거친 모든 학생들의 피드백을 체계적으로 정리하고 후속 모듈 검토회에서 개선안을 제시하였다. 이에 따라 학생들은 광범위한 소유권과 함께 지속적인 교육과정 개발을 위한 중요한 동인이 되었다.

Our strategies to facilitate faculty ownership were paralleled with approaches to facilitate students ownership. Students are important stakeholders in curricular change (Peluso and Takizawa 2010). They experience the curriculum in action. Beyond the common role of being formal members in educational committees, we actively involved students in all module planning meetings as module co-chairs and as permanent members of our team. Faculty members valued the students contribution as it focused on their needs to become good physicians. Also, it was perceived to be independent of department interests and that helped to mediate conflicts. When the modules were implemented, the student module co-chairs systematically compiled the feedback of all students who had gone through the specific module and presented proposals for improvement at the subsequent module review meeting. By that, students became important drivers for ongoing curriculum development with far-reaching ownership.

주요 커리큘럼 구조로 전문 활동 활용
Employing professional activities as main curricular structure

프로젝트 관리 팀이 업무를 시작했을 때, 신뢰할 수 있는 전문 활동(EPA)의 개념은 지식, 기술 및 태도를 통합하고 역량을 직장 내 특정 실무 활동에 연결할 수 있는 잠재적 개념으로 막 등장하기 시작했습니다. 우리는 당시 대학원 교육을 위해 고안된 개념을 학부 커리큘럼에 채택하고 초기 모듈 계획 라운드에 도입했습니다. 거기서, 그것은 임상의와 기초 과학자들 모두에게 좋은 공명을 발견했고, 그래서 우리는 우리의 주요 종적 교육 구조로서 전문적인 활동을 이용하기로 결정했다. EPA는 커리큘럼 연속체를 따라 1차년도 소규모 과제에서 졸업생에게 적합한 과제까지 내포되었다. 
When the project management team took up their work, the concept of entrustable professional activities (EPAs) just began to emerge as a potential concept allowing one to integrate knowledge, skills, and attitudes and to connect competencies to specific practical activities in the workplace (ten Cate and Scheele 2007; ten Cate et al. 2015). We adopted the concept, which at that time was designed for post-graduate training, into our undergraduate curriculum and introduced it into the early module planning rounds (Peters et al. 2017). There, it found good resonance by both clinicians and basic scientists, so that we thus decided to employ professional activities as our main longitudinal curricular structure. EPAs were nested from smaller tasks in year 1 along the curricular continuum up to tasks appropriate for graduating students.

표 1은 EPA "의학적 기록을 취하고, 신체 검사를 수행하고, 결과에 대한 구조화된 요약을 제공한다"의 예시적인 개요를 제공한다. [계획 회의]에서, 우리는 중첩된 전문 활동을 주요 모듈 결과로 사용하고 복잡한 기술을 위한 과정 설계에 대한 전체 작업 접근법을 제공하는 4가지 구성 요소 교육 설계 모델(4C/ID)을 기반으로 교육을 구성했다(Jansen-Noordman et al. 2006). 그림 3은 "심혈관 시스템" 모듈 내에서 3주차 과정 및 강의 통합이 어떻게 달성되었는지를 보여주는 예입니다. 
Table 1 provides an exemplary overview of nesting the EPA “Take a medical history, perform a physical examination, and provide a structured summary of the results”. In the planning meetings, we used nested professional activities as a main module outcome and organized the teaching on the basis of the four-component instructional design model (4 C/ID, Van Merriënboer and Kirschner 2007) which provides a whole-task approach to course design for complex skills (Janssen-Noordman et al. 2006). Figure 3 illustrates an example of how course and lecture integration was achieved in week 3 within the module “cardiovascular system”.

 

그림 3. 학습 주간 매트릭스에 따라 교육 접점을 분류합니다. 
(a) 학습 목표의 차원 및 
(b) "건강"에서 "병리학적" 상태까지의 연속체 
모듈 11 "심혈관 시스템"의 예, 3주차(2차 연구) 행렬은 다음을 보여준다. 

  • (a) 학습 목표의 차원: 그림 [하단]의 교육 형식은 인지적 내용에 초점을 맞추고, [상단]의 형식은 (밀러의 피라미드에서 채택된) 실용적인 (통합적) 역량에 초점을 맞춘다. 
    (b) "정상" 조건(그림의 왼쪽)에서 "병리학적" 조건(그림의 오른쪽)까지의 연속체.

이 매트릭스를 적용함으로써 수직적, 수평적 통합이 가시화되고 인지적, 실용적 콘텐츠의 균형 잡힌 혼합이 모니터링될 수 있다.
Figure 3. 
Matrix of a study week to classify the teaching encounters according to (a) dimensions of learning objectives and (b) the continuum from «healthy» to «pathological» conditions. Example from module 11 “Cardiovascular System”, week 3 (2nd year of studies).

  • The matrix shows (a) dimensions of learning objectives: teaching formats in the bottom part of the figure focus on cognitive content, while formats in the upper part focus on practical (integrative) competencies (adapted from Miller’s pyramide).
  • The matrix also shows (b) the continuum from «healthy» conditions (left side of the figure) to «pathological» conditions (right side of the figure). By applying this matrix, vertical and horizontal integration are made visible, and a balanced mix of cognitive and practical content may be monitored.

이 주의 1강좌는 내분비내과와 사회과학(기초과학 수평통합)과 2강좌, 1강좌는 생리학, 2강좌는 임상화학, 2강좌는 내분비내분비내과(수직통합)와 2강좌는 해부학, 심장학, 2강좌가 공동으로 진행한다. 수술(수직 통합). "이번 주의 환자 사례"는 중첩된 전문 활동 "임상 조우 따라"의 한 요소를 구성한다.
Lecture 1
in this week is jointly held by the departments Physiology and Anatomy (basis science horizontal integration) and
lecture 2 by Endocrinology and Social Medicine (clinical horizontal integration),
seminar 1 by Physiology,
seminar 2 by Clinical Chemistry, and Endocrinology (vertical integration) and
practical course 2 by Anatomy and Cardiac Surgery (vertical integration).
The “patient case of the week” constitutes one element of the nested professional activity “Along the clinical encounter”.

전체 커리큘럼 개발 과정에서 EPA 개념은 기획 교직원과 학생들이 잘 받아들였고 지금도 진화하고 있다. 최근 교육 종료 EPA는 40명 이상의 주요 교수진이 참여한 델파이 연구에서 도출된 후 새로운 커리큘럼의 중요한 결과로 채택되었다.
Along the whole curriculum development process, the EPA concept was well taken up by the planning faculty and students and is still evolving. Recently, end-of-training EPAs were adopted as overarching outcomes for the new curriculum after having been derived from a Delphi study, which involved more than 40 key faculty members (Holzhausen et al. 2015).

지속가능성 단계
The sustainability phase

이 단계는 모듈 계획 및 구현이 고등 연구 기간 동안 계속 진행되는 동안 점차적으로 진화했습니다. 그것의 토대는 이미 커리큘럼 개발 및 시행 단계에 놓여 있었다. 지속가능성에 기여한 여러 가지 요소들, 가장 중요한 요소들이 다음과 같이 보고된다.
This phase gradually evolved while module planning and implementation was still going on in higher years of studies. Its foundation had already been laid in the curriculum development and implementation phase. A number of factors contributed to sustainability, the most important are reported the following.

학과들은 가르치는 데 있어 그들의 역할을 유지한다.
Departments maintain their role in teaching

새로운 교육과정에 대한 부서들의 참여에 대한 학장들의 약속은 실제로 지켜지는 것이 중요하다고 여겨졌다. 이것은 학문의 기여와 교수에 대한 보상 모두에 적용된다. 프로젝트 관리팀은 이를 항상 염두에 두고 직접 회의뿐만 아니라 웹 기반 교육과정 플랫폼을 통해 부서별 기여도를 이사들에게 가시화시켰다.
It was considered important that the deanery promises on the departments involvement in the new curriculum were indeed kept. This applies to both the contribution of the discipline and the reimbursement for teaching. The project management team always had this in mind and made the department contribution visible to the directors, not only in meetings directly but also through the web-based curriculum platform.

성과는 학생들에 의해 충족된다.
Outcomes are met by students

이것은 개혁의 미래에 매우 중요하다. 우리는 적극적으로 교육과정 성공을 소통했다. 초기 시행 동안, 우리는 [새로운 커리큘럼의 학생들]이 [전통적인 커리큘럼에 참여한 학생들]보다 더 잘했다는 것을 증명하는 [의학 발달 시험]의 결과를 기반으로 했다. 시행 후기에는 단순하지만 의미 있는 설문조사를 통해 새 교육과정 학생들이 이전 교육과정 학생들이 했던 것보다 내과의사로서 일할 준비가 훨씬 더 잘 된 것으로 나타났다. 이러한 성공은 교직원과 학생들에 의해 잘 받아들여졌다. 학생들 스스로 실시한 대규모 설문조사는 또한 대다수의 학생들이 새로운 프로그램에서의 그들의 공부방식에 상당히 만족하고 있다는 것을 보여주었다.
This is crucial to the future of the reform. We actively communicated curriculum successes. During early implementation, we built on the results of a progress test medicine demonstrating that the students of the new curriculum did better than those who had participated in the traditional one. In later stages of the implementation, a simple but meaningful survey showed that the new curriculum students felt much better prepared for working as a physician than the former curriculum students did. These successes were taken up well by the faculty and students. A large survey, undertaken by the students themselves, indicated also that the majority of students were quite satisfied with their way of studying in the new program.

새로운 구조가 작동하고 학제간 협업이 계속됩니다.
The new structures work and the interdisciplinary collaboration continues

세 번의 성공적인 실행 후, 각 모듈에 대한 책임은 [코스 코디네이터, 모듈 의장 및 교육과정 위원회]에 넘겨졌습니다. 새로 개발된 구조물과 업무는 큰 추가 지원 없이 기능해야 했다. 전반적으로, 이러한 구조물은 충분히 작동했습니다. 
또한, 60개 이상의 세미나 및 120개 이상의 강의에서 달성된 광범위한 학제간 협력이 교수 목표와 내용에 대한 상호 공유된 이해로 예시된다.
After three successful runs, the responsibility for each module was handed over to course coordinators, module chairs, and the curriculum committee. The newly developed structures and tasks had to function without any major extra support. Overall, these structures worked sufficiently. In addition, the broad interdisciplinary collaboration achieved is exemplified in more than 60 seminars and more than 120 lectures given within two disciplines in a mutually shared understanding of the teaching goals and content.

지속적인 커리큘럼 개발을 위한 구조
Structures allowing for ongoing curriculum development

시행 단계를 넘어 달성된 상태를 유지하고 커리큘럼을 더욱 발전시킬 수 있는 [적절한 구조와 자원]을 갖추는 것이 중요하다. 우리 시대에 조정의 필요성이 일정한 특징이 되었기 때문이다. 한 가지 위험은 대학 교직원의 높은 변동과 그에 따른 교육 지식의 손실이다. 효과적인 전략은 (웹 기반 플랫폼을 사용하여) 신규 교직원이 실제로 검색할 수 있는 교육과정에 대한 모든 정보를 만들고, 모든 교육적 교수개발 활동의 중심에 새로운 교육과정의 개념과 철학을 두는 것이었다. 또한, 그것은 지속가능성에 기여하는 [새로운 커리큘럼의 매우 투명한 구조]였고, 따라서 환자 치료나 연구로 지속되는 긴장에서 교육에 불리한 영향을 미칠 수 있는 모든 기회를 줄였다. 마지막으로 지속적인 교육과정 개발은 기관의 내부 교수구조와 긴밀히 연계되면서 외부협력을 통해 교육적 발전을 가져오는 구조가 필요하다.
Beyond the implementation phase, it is important to have adequate structures and resources in place which maintain the status achieved and then further develop the curriculum. This is due to the fact that in our times, the need for adjustment has become a constant feature. One risk is the high fluctuation of faculty members at universities and the subsequent loss of educational knowledge. An effective strategy was to make any information about the curriculum actually retrievable for new faculty members (by use of the web-based platform) and put the concepts and philosophy of the new curriculum at the center of all educational faculty development activities. Also, it was the highly transparent structure of the new curriculum which contributed to sustainability, thereby reducing any possible opportunities to affect unfavorably teaching in its ever-lasting tension with patient care or research. Finally, continuous curriculum development needs a structure which brings in educational advances through external collaborations, while being closely connected with the internal teaching structures of the institution.

다음 단계
Next steps

지속적인 발전의 중요한 분야는 학부생과 대학원생 사이의 연결을 강화하는 것이다. 전문 활동은 다시 한번 학생과 교직원에게 학습 궤적을 가시화하는 데 유용한 구성인 것으로 나타났습니다. 우리는 현재 위탁 척도를 전자 포트폴리오와 OSCE 체크리스트 개발 가이드라인에 통합하여 이러한 활동을 다루고 있다.
An important field of ongoing development is to enhance the connection between under- and postgraduate education. Professional activities once more turned out to be a useful construct to make the learning trajectories visible – to students and faculty. We are currently addressing these activities by integrating entrustment scales into an electronic portfolio and into Guidelines for the Development of OSCE checklists.

지역 사회 기반 교육 조치와 관련하여, 정부 규제가 지역 사회 의학을 통합하기 위한 보다 의무적인 프로그램을 위해 노력하고 있기 때문에 가까운 미래에 조치가 취해질 것이다.
Regarding community-based education actions will be taken in the near future, as governmental regulations are striving towards more obligatory programs to integrate community medicine.

교훈
Lessons learned

이 기사에서, 우리는 샤리테에서 주요 커리큘럼 개혁을 마스터하기 위한 우리의 노력에서 우리의 경험과 실용적인 통찰력을 증류했다. 다음은 해당 기관에서 주요 교육과정 개혁을 고려하고 있거나 이미 시행하기 시작한 사람들을 위한 일반적인 권고의 형태로 배운 우리의 교훈을 되새겼습니다.

In this article, we distilled our experiences and practical insights in our endeavor to master a major curriculum reform at the Charité. In the following we have reflected on our lessons learned in the form of general recommendations for those who are considering or already have started to perform a major curricular reform at their institutions.

많은 일을 기대하세요.
Expect a lot of work

그것이 쉬울 거라고 기대하지 마세요. 꽤 오랜 시간 동안 해야 할 일이 많고 많은 도움의 손길이 필요하다. 교수진은 기본적으로 변화를 마스터하고 싶어하지 않지만, 환자 치료, 연구 및 교육에 대한 일상적인 의무가 계속되는 동안 기여할 수 있는 위치에 있기 위해서는 [물리적 및 개념적 지원]이 필요합니다. [프로젝트 관리 팀]을 구성하면 추가 작업에 대한 교수진의 부담을 상당히 덜어줄 수 있습니다. 교수진은 교육과정 개발과 새로운 교수, 학습 및 평가 형식에 대한 교수 개발 활동의 시간 절약적 통합에 대해 높이 평가했습니다.
Do not expect that it will be easy. It is a lot of work to be done for quite a long time and it needs many helping hands. The faculty is not principally unwilling to master the change, but they do need physical and conceptual support to be in a position to contribute while their usual duties in patient care, research and teaching are continuing. Establishing a project management team can substantially unburden the faculty from the extra work. Faculty members have appreciated the time-saving integration of the faculty development activities on curriculum development and the new teaching, learning, and assessment formats.

저항을 받아들이고 대처하라.
Accept resistance and deal with it

저항을 두려워하거나 무시하지 마십시오. 교과과정의 변화는 항상 저항과 관련이 있다. 사실 어떤 교직원의 저항에도 대처할 수 있는 전략이 있다. 종종 불확실성을 반영하는 것이므로 그들의 우려를 진지하게 받아들이세요. 우리의 경험상, 개혁 반대자들을 적극적으로 담론에 참여시키는 것이 항상 도움이 되었다. 그들 중 다수는 그 후 새로운 커리큘럼의 중요한 지지자이자 승수supporters and multipliers가 되었다.
Do not fear or ignore resistance. Curriculum change is always associated with resistance. There are in fact strategies to deal with any faculty member's resistance. Take their reservations seriously as it often reflects uncertainty. In our experience, it has always been helpful to proactively involve reform adversaries into the discourse. Many of them subsequently became important supporters and multipliers for the new curriculum.

소통하고 경청합니다.
Communicate and listen

핵심 선수들과의 신뢰할 수 있고 빈번하며 솔직한 의사소통의 중요성을 과소평가해서는 안 된다. 주요 관계자(청장, 교육과정위원회, 교직원) 간의 원활한 소통을 위한 프로젝트 관리팀의 핵심 업무 중 하나였다. 여기에는 변화에 대한 원하는 목표를 영구적으로 소통하고 토론하고, 주요 참가자들의 반응을 정확히 듣고, 잠재적인 조직 문제를 예측하는 것이 포함됩니다.
One should not underestimate the importance of a reliable, frequent, and forthright communication with key players. It was one of the key tasks of the project management team to facilitate communication between the key players involved (deanery, curriculum committee, and faculty members). This includes communicating and discussing the desired goals of change permanently, listening precisely to the key players reactions, and anticipating potential organizational problems.

전문 활동을 핵심 종단 구조로 활용
Use professional activities as core longitudinal structures

우리는 이 새로운 개념에 의한 우리의 커리큘럼 형식, 내용 및 구조의 합성이 교수진들(임상사 및 기초 과학자뿐만 아니라 학생들도)에 의해 얼마나 잘 받아들여졌는지 놀랐다. 전문적 활동은 모든 이해 관계자들에게 의대생들의 학업 과정에 대한 점진적인 성장에 대한 유형적이고 개념적인 이해를 제공했다. 이 개념은 학습 콘텐츠를 수평 및 수직으로 자연스럽게 통합할 수 있도록 허용하고 우리 프로그램의 교육, 학습 및 평가를 전반적인 교육 종료 결과와 일치시켰다.
We were surprised how well the synthesis of our curricular formats, content, and structures by this new concept was taken up by the faculty (not only clinicians and basic scientists, but also students). Professional activities provided all stakeholders with a tangible and conceptual understanding in the gradual growth of medical students over their course of studies. The concept allowed to integrate the learning content horizontally and vertically in a natural way and aligned the teaching, learning, and assessment in our program with its overarching end-of-training outcomes.


Med Teach. 2018 May;40(5):453-460. doi: 10.1080/0142159X.2018.1440077. Epub 2018 Mar 5.

Moving a mountain: Practical insights into mastering a major curriculum reform at a large European medical university

Affiliations collapse

Affiliation

1a Dieter Scheffner Center for Medical Education and Educational Research Charité, Dean's Office of Student Affairs Universitätsmedizin Berlin, Free and Humboldt University Berlin , Germany.

PMID: 29504437

DOI: 10.1080/0142159X.2018.1440077

Abstract

Aim: Undergraduate medical education is currently in a fundamental transition towards competency-based programs around the globe. A major curriculum reform implies a dual challenge: the change of the curriculum and the delivering organization. Both are closely interwoven. In this article, we provide practical insights into our approach of managing such a fundamental reform of the large undergraduate medical program at the Charité - Universitätsmedizin Berlin.

Methods: Members of the project management team summarized the key features of the process with reference to the literature.

Results: Starting point was a traditional, discipline-based curriculum that was reformed into a fully integrated, competency-based program. This change process went through three phases: initiation, curriculum development and implementation, and sustainability. We describe from a change management perspective, their main characteristics, and the approaches that were employed to manage them successfully.

Conclusions: Our report is intended to provide practical insights and guidance for those institutions which are yet considering or have already started to undergo a major reform of their undergraduate programs towards competency medical education.

 

어떻게 의과대학이 공감을 바꾸는가: '환자에 대한 공감'과의 사랑 및 이별 편지 (Med Educ, 2020)
How medical school alters empathy: Student love and break up letters to empathy for patients 
William F. Laughey1 | Megan E. L. Brown1 | Angelique N. Dueñas1 | Rebecca Archer1 | Megan R. Whitwell1 | Ariel Liu2 | Gabrielle M. Finn1,3 

1 소개
1 INTRODUCTION

의과대학에서 공감을 가르치는 것은 확인된 역사를 가지고 있다. 불과 10여 년 전, Hojat 등은 학생들이 환자 치료의 현실을 경험함에 따라 3학년 때부터 침식이 가속화되는 등 의대 기간 동안 학생들의 공감이 실제로 침식된다는 결론을 내린 영향력 있는 논문을 발표했다. 공감이 미래의 의사의 핵심 자질이라는 점을 감안할 때, 공감의 감소는 ('윤리적 침식' 문제의 일부이며) 충격적인 결과입니다. 비록 의대 중 공감을 측정하는 연구에 대한 최근 리뷰가 적어도 서구 국가에서 전반적인 추세는 확실히 공감 점수가 감소하는 것으로 나타났지만, 모든 정량적 연구가 동일한 결론에 도달한 것은 아니다.
Empathy teaching in medical school has a chequered history. Just over a decade ago, Hojat et al1 published an influential paper concluding that student empathy actually erodes during medical school, with erosion accelerating from third year onwards as students experience the realities of patient care. Given that empathy is a core quality for a future physician, empathic decline—part of the problem of ‘ethical erosion’2—is a shocking result. Not all quantitative studies have reached the same conclusion, though a recent review3 of studies that measure empathy during medical school found that, in Western countries at least, the overall trend is indeed for empathy scores to decline.

그러나 정량적 연구를 고려할 때, 공감을 측정하는 바로 그 노력이 복잡하거나 논란이 없는 것은 아니라는 것을 인식해야 한다. 공감의 구성 요소는 인지적 측면과 정서적 측면을 모두 포함하며, 일부 정의는 전적으로 인지적 특징에 중점을 두고 있지만, 다른 이들은 감정적 공명이 없는 공감이라고 주장하기도 한다. 따라서 공감을 측정하기 위한 모든 척도가 실제로 그렇게 하는 것은 아니다. 공감에는 인지적, 정서적 요소 외에도 행동적, 도덕적 요소도 있다. 또한 존재론적 관점에서 공감을 인지행동적 용어로 보아야 하는지, 습득해야 할 기술로 보아야 하는지, 아니면 한 인간이 다른 사람에게 빚지고 있는 자질인 '존재의 방식'으로 보아야 하는지에 대한 논쟁이 있다. 인지적, 정서적, 행동적, 도덕적 요소를 포함한 이러한 공감의 측면은 본 연구와 정보에 입각한 데이터 수집 및 분석에서 민감화 개념sensitizing concepts으로 작용한다.
In considering quantitative research, it should be recognised, however, that the very endeavour of measuring empathy is not without complication or controversy.4-6 Empathy is complex, its components include both cognitive and affective aspects, and while some definitions centre entirely on cognitive characteristics (including Hojat's1), others argue that empathy without emotional resonance may not be empathy at all.7 Therefore, not all scales that purport to measure empathy may actually do so.6 Besides cognitive and affective elements, empathy also has behavioural and moral components.7 Furthermore, in ontological terms, there is debate regarding whether empathy should be viewed in cognitive-behavioural terms, as a skill to be acquired, or as a personal attribute, a quality that one human owes to another, a ‘way of being’.8, 9 These facets of empathy—including cognitive, affective, behavioural and moral components—act as sensitising concepts10 within this study and informed data gathering and analysis.

의과대학이 학생 공감에 어떤 영향을 미치는지 조사하는 대안적 접근 방식은 질적 탐구 쪽으로 눈을 돌리는 것이며, 이러한 다면적인 개념의 뉘앙스를 탐구하는 데 더 적합할 것이다. 현재까지 질적 연구는 [숨겨진 커리큘럼]의 측면을 의대생들이 임상적 공감을 어떻게 보는지에 대한 핵심 영향력자influencer로 파악한다. 이러한 측면에는 다음이 포함된다.

  • 긍정적 및 부정적 역할 모델링,
  • 환자 관계 확립보다 생물의학 지식 습득을 우선 순위에 두는 것
  • 환자 관여에 대한 암묵적 감정 규칙
  • 대처 전략으로 냉소주의를 채택하는 것

질적 연구는 또한 다음에 의해 학생들의 공감이 어떻게 부정적인 영향을 받는지를 밝혀냈다.

  • 시간의 압박,
  • '어렵다'고 인식되는 환자,
  • 스트레스 받는 근무환경,
  • 성찰의 기회 부족

An alternative approach to investigating how medical school influences student empathy is to turn to qualitative enquiry, arguably better suited to exploring the nuances of such a multifaceted concept.11 To date, qualitative research identifies aspects of the hidden curriculum12 as key influencers of how medical students view clinical empathy. These aspects include

  • positive and negative role modelling,
  • the prioritising of acquiring biomedical knowledge over establishing patient rapport,
  • the implicit emotional rules of engaging with patients and
  • the adoption of cynicism as a coping strategy.13-15 

Qualitative research has also identified how student empathy is adversely influenced by

  • the pressures of time,
  • patients who are perceived to be ‘difficult’,
  • stressful working conditions and
  • a lack of opportunity for reflection.1416-19 

그러나 본 논문에서 다룬 연구 격차인 의학적 교육에 의한 공감의 형성방식과 공감감소 문제에 대한 질적 연구가 미흡하다는 것이 대체적인 의견이다.
However, it is generally agreed that there is insufficient qualitative research into how empathy is shaped by medical education, and the problem of empathic decline,11, 16 the research gap addressed in this paper.

우리는 이전에 의료 교육에서 전혀 활용되지 않았던 질적 탐구 형태인 사랑 및 이별 편지 방법론(LBM)으로 눈을 돌렸다.
We have turned to a form of qualitative enquiry never previously utilised in medical education—love and break up letter methodology (LBM).20, 21

연애와 이별 편지 방법론은 기술 기반 연구인 UX(User Experience)에 뿌리를 두고 있다. UX에서, 참가자들은 기술의 한 측면에 사랑과 이별의 편지를 쓰도록 요청 받는다. 글자는 다음 포커스 그룹 토론의 트리거가 됩니다. LBM은 정서적 영역을 포함하여 논의 중인 개념과 참가자의 관계를 이해하는 창의적인 방법이다. 우리는 LBM이 의대를 통해 학생들이 공감에 대해 얻는 긍정적이고 부정적인 감정을 이해하는 데 도움이 될 것이라고 추론했다. 특히 부정적인, 혹은 '헤어진' 감정은 윤리적 침식의 개념에 대한 유용한 통찰력을 제공할 수 있다. 이와 같이 LBM은 환자공감 실천을 통해 학생관계의 변화하는 성격을 이해하고자 하는 본 연구의 요구조건에 부합한다.
Love and break up letter methodology has roots in User Experience (UX), a technology-based research.22 In UX, participants are asked to write a love and break up letter to an aspect of technology. The letters form the triggers for the focus group discussion that follows. LBM is a creative way to understand participants' relationships with the concept under discussion, including affective domains. We reasoned that LBM would help us understand the positive and negative feelings that students acquire about empathy as they progress through medical school. The negative, or ‘break up’, feelings, in particular, may provide useful insight into the concept of ethical erosion.2 As such, LBM suits the requirements of this study, which aims to understand the changing nature of student relationships with the practice of empathy for patients.

우리의 주요 연구 질문은 [상급 의대생]들이 [환자에 대한 공감]이라는 개념과의 [변화하는 관계]를 어떻게 특징짓는가 하는 것이었습니다. 우리의 목표는 의과대학 과정을 거치면서 공감에 대한 그들의 감정이 어떻게 변하는지 탐구하는 것이다.
Our primary research question was how do senior medical students characterise their changing relationship with the concept of empathy for patients? Our aim is to explore how their feelings about empathy change as they progress through medical school.

2 방법
2 METHODS

2.1 연구 접근법
2.1 Research approach

본 연구에서는 [현실과 지식의 주관성과 사회성]을 강조하는 [상대론적 존재론]과 [사회구성주의 인식론]을 채택한다. 이는 [현실주의자realist], 또는 실증주의자의 양적 관점에서 진행된 대다수의 임상적 공감 연구와는 대조적이다. 후자는 공감의 변화를 측정하는 데 적합하지만, 이러한 변화가 왜 또는 어떻게 발생하는지에 대한 자세한 통찰력을 제공하지 못했다. 이 접근 방식 내에서, 우리는 성찰적 주제 분석을 선택하여 참여자의 경험을 해석하는 데 있어 연구팀의 적극적인 역할을 인정하는 방식으로 데이터를 분석하였다.

Within this study, we adopt a relativist ontology and social constructionist epistemology, which highlight the subjectivity and social nature of reality and knowledge.23-26 This is in contrast to the majority of clinical empathy research, which has been undertaken from a realist, or positivist, quantitative standpoint.11, 27-29 Whilst the latter is suited to measuring changes in empathy, it has not provided detailed insights into why or how these changes occur, questions better explored with a relativist, qualitative approach, adopted here. Within this approach, we have selected reflexive thematic analysis30, 31 to analyse our data in a way that acknowledges the active role of the research team in interpreting participant experiences.32

2.2 설정 및 참가자
2.2 Setting and participants

데이터는 HYMS 윤리 위원회(1902)의 승인에 따라 2019-20학년도 동안 헐 요크 의과대학(HYMS)에서 수집되었다. 모집은 의과대학 경험이 충분한 학생들이 연구 질문에 답할 수 있도록 객관적인 표본을 얻기 위해 4, 5학년 때부터 독점적으로 이루어졌다. HYMS는 850명(여 59%, 남 41%)의 학생이 재학 중인 중소규모 학교이다. 4학년과 5학년은 각각 147명(여 58%, 남 42%)과 132명(여 52%, 남 48%)이다. 모든 자발적 참여자(n = 21)는 포커스 그룹에 참여했지만, 이후 날짜를 맞출 수 없는 한 학생은 예외였다. 우리는 연구 질문에 맞추기 위해 전임 임상 배치 경험이 있는 학생들을 의도적으로 모집했다. 참여는 인센티브가 아닌 자발적이었고, 이메일, 소셜 미디어, 입소문을 통해 모집이 이루어졌다.

Data were collected at the Hull York Medical School (HYMS), during the academic year 2019-20, following approval from the HYMS ethics board (1902). Recruitment was exclusively from years 4 and 5 in order to obtain a purposive sample of students with sufficient experience of medical school to answer the research question. HYMS is a small-medium sized school with 850 students (59% female, 41% male). Years 4 and 5 have 147 (58% female, 42% male) and 132 (52% female, 48% male) students respectively. Every volunteer (n = 21) took part in the focus groups, with the exception of one student who subsequently could not make the date. We purposively recruited students with experience of full-time clinical placements, in order to align with our research questions. Participation was voluntary, not incentivised, and recruitment occurred via email, social media, and word of mouth.

2.3 데이터 수집
2.3 Data collection

포커스 그룹 참여에 앞서, 각 참가자는 익명의 인구 통계 데이터를 수집하기 위한 온라인 설문조사를 완료했다. 학생들은 공감에 대한 자신의 정의와 의과대학 재학 중 공감의 변화가 있었는지에 대해 고려하도록 요청받았다. 이러한 설문 질문은 후속 포커스 그룹 토론을 위해 학생들의 생각을 자극하기 위해 휴리스틱하게 작용했으며, 따라서 독립적인 결과로 보고되지 않는다. 
Prior to focus group participation, each participant completed an online survey to collect anonymous demographic data. Students were prompted to consider their own definition of empathy and whether their empathy had changed during medical school. These survey questions acted heuristically to stimulate student thoughts for the subsequent focus group discussion, and so are not reported as standalone results.

포커스 그룹의 시작에서, 참가자들은 30분 동안 환자에 대한 공감을 위해 사랑과 이별 편지를 모두 쓸 수 있는 시간이 주어졌다. 편지 쓰기 프롬프트는 보충 자료로 제공됩니다. 그리고 나서 학생들은 그들의 편지를 큰 소리로 읽는 동안 연구원들은 후속 토론 프롬프트를 위해 메모를 했다. 각 포커스 그룹에는 적어도 두 명의 연구원이 참석했는데, 한 명이 퍼실리테이션을 하는 동안 다른 한 명은 현장 메모를 했다. 레터 리딩에 이어 진행자는 토론을 위해 레터에 의해 제기되는 반복 포인트를 강조했는데, 그 중 상당수는 동료들이 의견을 내고 서로의 기여를 논의하면서 학생 주도로 이루어졌다. 
At the beginning of the focus group, participants were given 30 minutes to write both a love and a break up letter to empathy for patients. The letter writing prompts are provided as Supplementary Material. Students then read their letters aloud whilst researchers took notes for subsequent discussion prompts. At least two researchers were present at each focus group – one facilitated whilst the other took field notes. Following letter reading, the facilitator highlighted recurrent points raised by the letters for discussion, much of which was student-led, as peers commented and discussed one another's contributions.

4개의 포커스 그룹이 소집되었지만, 1개는 너무 작아서 분석에 포함시킬 수 없었다(마지막 순간에 결석한 학생은 2명만 참석했다는 의미). 총 3개의 포커스 그룹이 사용 가능했다. 이 세 그룹은 각각 7, 8, 5명의 학생으로 구성되어 있으며, 총 20명이었다. 토론 시간(편지 읽기 제외)은 각각 48분, 42분, 43분이었다. 포커스 그룹 1, 2는 대면 진행했지만 그룹 3은 코로나19로 인해 비디오 스트림으로 진행되었습니다. 포커스 그룹이 녹음한 오디오는 MW & WL에 의해 수동으로 변환되었습니다. 다른 정성적 연구와 마찬가지로, 우리는 (이미 사본이 있는) 편지 읽기 같은 일부 내용을 생략하고 집중적인 전사 전략을 선택했다. 모든 예시적인 인용문은 그대로 캡처되었다.
Four focus groups were convened, but one was too small to be included in the analysis (last minute absence meant only two students attended), leaving a total of three usable groups. These three groups comprised 7, 8 and 5 students respectively, total 20. Discussion times (excluding letter reading) were 48, 42 and 43 minutes respectively. Focus groups 1 and 2 were conducted face-to-face, but group 3 was conducted by video stream, due to COVID-19. Focus group recorded audio was manually transcribed by MW & WL. In common with other qualitative research,33, 34 we chose a focussed transcription strategy, omitting some content such as the reading of letters (where we already had copy). All illustrative quotes were captured verbatim.

2.4 데이터 분석
2.4 Data analysis

포커스 그룹 성적표와 연애편지와 이별편지를 함께 분석하였다. 브라운과 클라크가 자세히 설명하고 키거와 바르피오가 최근 요약한 과정에 따른 반사적 주제 분석이 수행되었다. 브라운과 클라크의 주제 분석 6단계는 다음과 같다.

  • (a) 데이터를 숙지합니다. 
  • (b) 초기 코드 생성 
  • (c) 테마 검색; 
  • (d) 주제 검토 
  • (e) 테마 정의 및 이름 지정 
  • (f) 보고서 작성

연구자(WL, MB, MW, RA)는 포커스 그룹 대화록과 편지를 독립적으로 코딩하여 분석을 심화하도록 모든 데이터를 이중 코딩하였다. 코드북은 공유 Google 드라이브를 사용하여 구성되었으며 포커스 그룹을 분석하면서 귀납적 코드를 추가했습니다. 분석 및 연구자 토론은 각 포커스 그룹 이후 데이터 수집과 동시에 수행되었으며 그룹은 몇 주씩 분리되었다. 주제는 WL에 의해 서면 서술로 구성되었다. 그 팀은 '정보력'이 충족된 시점에 대해 논의하기 위해 정기적으로 만났다.
— 연구 연구 질문에 답하고 전이 가능한 결과를 생성하기에 충분한 표본 크기:

Focus group transcripts and love and break up letters were analysed together. Reflexive thematic analysis, following the process detailed by Braun and Clarke,30 and recently summarised by Kiger and Varpio31 was undertaken. Braun and Clarke's six steps of thematic analysis were adhered to:

  • (a) Familiarise with data;
  • (b) Generate initial codes;
  • (c) Search for themes;
  • (d) Review themes;
  • (e) Define and name themes; and
  • (f) Produce the report.

Researchers (WL, MB, MW, RA) independently coded focus group transcripts and letters, ensuring all data were double coded to deepen the analysis. The code book was formed using a shared Google drive and inductive codes were added as the focus groups were analysed. Analysis and researcher discussion were occurring contemporaneously with data collection, after each focus group, with the groups being separated by several weeks. Themes were constructed into a written narrative by WL. The team met regularly to discuss the point at which ‘information power32, 35 —a sample size sufficient to answer the study research question and generate transferrable findings—had been met.

2.5 반사적 고려사항 및 민감 개념
2.5 Reflexive considerations and sensitising concepts

우리의 접근 방식은 귀납적이었지만, 이론은 내내 논의되었다. 반사적 대화를 통해 정서적, 인지적, 행동적, 도덕적 요소를 포함한 광범위한 관점에 동의하면서 공감에 대한 개인적인 해석을 명확히 했다. 이 모든 것은 우리의 포커스 그룹 질문 및 데이터 분석을 구상한 [민감한 개념]을 형성했다. 예를 들어, 거의 필요하지 않았지만, 우리는 이러한 개념을 중심으로, 자발적인 논의가 수그러들 경우, 포커스 그룹 질문 프롬프트를 고안했다.
Although our approach was inductive, theory was discussed throughout. Through reflexive conversations, we clarified our personal interpretations of empathy, agreeing on a broad-based view, including affective, cognitive, action and moral components. All of these formed the sensitising concepts10 around which we conceived our focus group questioning and data analysis: for example, although rarely needed, we devised focus group question prompts in case spontaneous discussion waned, which centred on these concepts.

3 결과
3 RESULTS

3.1 인구통계 및 배경 설문지 데이터
3.1 Demographics and background questionnaire data

20명의 학생들은 주로 의학교육 4학년이었고, 15명의 여성과 5명의 남성이 참여했다. 표 1은 조사 데이터의 전체 세부 정보를 제공합니다.
The 20 students were primarily in their fourth year of medical education, 15 women and 5 men participated. Table 1 provides full details of survey data.

분석 결과 22개의 하위 테마와 3개의 주요 테마(표 2)가 생성되었습니다.
Analysis generated 22 sub-themes and three major themes (Table 2).

주요 주제는 예술과 기교로서의 공감, 공감 부담, 미덕으로서의 공감이었다. 결과는 이 제목 아래에 서술적으로 제시된다.
The major themes were

  • empathy as art and artifice,
  • empathic burden, and
  • empathy as a virtue.

Results are presented narratively under these headings.

3.2 예술과 책략으로서의 공감
3.2 Empathy as art and artifice


학생들은 진정한 공감 소통이 [숙달을 위한 예술]이고, 그 [예술의 숙달]은 [장기적인 노력]이라는 것을 인식했습니다. 역설적이게도, 그들은 또한 임상적 공감의 실천에 많은 책략이 있다는 것을 인식했다.
Students recognised that true empathic communication is an art to master, and mastery of that art is a long-term endeavour. Paradoxically, they also recognised that there is much artifice in the practice of clinical empathy.

여러분의 작은 몸짓과 신호를 포착하는 것은 진정한 예술입니다. 제가 어떤 식으로든, 어떤 형태로든, 어떤 대가도 될 수 없지만, 계속 노력할 것입니다. 편지, 5학년 3반
Picking up on all your little gestures and signals is a true art that I am in no way, shape or form a master at, but will continue to work on. Letter, 5th year student, group 3

난 그걸 속이고 있었어…. 아주 오랫동안 그러지 않겠다고 약속했던 건 알지만 더 이상 숨길 수 없어 편지, 4학년 학생, 1조
I’ve been faking it…. for so long. I know I promised I wasn't, but I can't hide it anymore. Letter, 4th year student, group 1


학습은 모의환자(SP)와 함께 형식적인 수업과 실습으로 시작됐고, 임상배치 체험이 이어져 실제 환자와의 공감을 관찰하고 실천할 수 있는 기회가 마련됐다. SP와의 세션은 실제 환자를 만나기 전에 연습할 수 있는 귀중한 기회를 제공했지만 [SP 시나리오의 허구성]과 [역할극의 당혹스러운 요소]가 한계로 보였다. 공식적인 가르침은 [비언어적 표현]보다는 [공감적 진술]에 중점을 둔 것으로 보고되었다.

Learning began with formal teaching and practice with simulated patients (SPs), followed by the experience of clinical placement, allowing opportunity to observe and practice empathy with real patients. Sessions with SPs afforded a valued opportunity to practice before meeting real patients, though the fictitious nature of SP scenarios and the embarrassment factor of role plays were seen as limitations. Formal teaching was reported to centre on empathic statements rather than non-verbal expression.

의과대학은 우리에게 공감을 가르칠 것입니다. 하지만 그것은 항상 언어적이고 우리가 전에 사용했던 공감을 매우 많이 가지고 있습니다. 하지만 그들은 당신의 끄덕임이나 눈맞춤 같은 것을 체크하지 않습니다. 그것은 정말 중요하지 않습니다. 토론, 5학년 학생, 그룹 3
Med school will teach us empathy but it's always verbal and there are so many types of empathy that we did use before, but they don't tick that box kind of, like your nod or your eye contact or whatever, it doesn't really matter. Discussion, Year 5 student, group 3


평가는 또한 공감 진술, 특히 객관적 구조 임상 검사(OSCE)에 초점을 맞췄고, 여기서 공감 기술은 [속임수]로 바뀌었다. 이런 고압적인 상황에서 말 그대로 '공감 상자 체크'를 하기 위해 학생들은 강제적이고 거짓된 공감 발언을 하는 것 외에는 대안이 없었다.
Assessments also focussed on empathic statements—particularly, Objective Structured Clinicals Examinations (OSCEs)—and here the art of empathy turned to artifice. In order to literally ‘tick the empathy box’ in these high-pressure situations, students had no alternative other than to make forced, fake empathic statements.

내 생각에 너는 체크박스가 된 것 같아, '힘들겠다' '정말 답답하다' '이런 일을 겪어야 해서 미안하다'. 하지만 10분간의 OSCE에서, 내가 정말 신경 썼을까? 이게 정말 무슨 의미가 있었나요? 편지, 4학년 학생, 1조
I think you became a tick-box, ‘that must be hard’ ‘really frustrating’ ‘sorry you've had to go through this’. But in a 10-minute OSCE, did I really care? Did this really mean anything? Letter, 4th year student, group 1


학생들은 시험에서 [감정이입 진술을 위조하는 관행]과 같은 아이러니를 보았다. 시험이 [가짜 공감을 평가하는 것]이 되기 때문이다.
Students saw irony in the practice of faking empathic statements in examinations, as the examination then becomes an assessment of fake empathy.

그러니까 어차피 가짜일 거고 공감하는 척을 얼마나 잘하는지 평가하시는 거에요. 토론, 4학년 학생, 1조
So it's gonna be fake anyhow and you are assessing how good you are at faking empathy. Discussion, 4th year student, group 1


학생들은 시험공감과 실생활공감이 별개라는 것을 인식했다.
Students recognised that examination empathy and real-life empathy were two different things.

분명히 시험에서는 단어라고 생각합니다. 하지만 병동에서는 컨설턴트를 보면 정해진 문구보다는 환자들과 어떻게 지내는지가 중요하다고 생각합니다. 컨설턴트들은 진술 없이 여전히 매우 공감해 왔다. 토론, 5학년 2반
I think definitely for exams it's the words, but I think on the wards, if you watch consultants, it's how you are with the patients rather than set phrases. Consultants have still been very empathetic, without the statements. Discussion, 5th year student, group 2


이 문제는 [SP를 사용하는 것]으로부터 강화되었는데, SP는 이미 non-authentic한 OSCE 설정에 추가적인 인공적 요소를 추가했기 때문이다.
The problem was augmented by the use of SPs, which adds an additional layer of artifice to the already non-authentic OSCE setting.

나는 SP에게 진짜 공감을 보여주는 것은 정말 어렵다고 생각한다. 마치 모든 것이 가짜이고, 그들이 배우라는 것을 알고 있고, 그것이 진짜가 아니라는 것을 알고 있다. 토론, 5학년 2반
I think it's really hard with the SPs to show any real empathy, like it's all fake, you know they are actors, you know it's not real. Discussion, 5th year student, group 2

현재의 검사 기반 시스템을 [임상 배치 중에 병원 지도교사와 GP가 내린 판단으로 대체]하는 등 평가에 대한 대안적 접근법이 제시되었다.
Alternative approaches to evaluation were suggested, including replacing the current exam-based system with judgments made by hospital tutors and GPs during clinical placement.

공감에서의 속임수의 문제는 평가에 국한되지 않았다. 실제로, 학생들은 공감하는 말을 속이는 것이 [실제 환경에서도 흔한 관행]이라는 것을 자유롭게 인정했습니다. 대화의 공백을 메우기 위한 장치로 '힘드시겠어요'와 같은 말을 사용하는 것이 일반적인 주제였다.
The problem of artifice in empathy was not confined to assessment. Indeed, students freely acknowledged that faking empathic statements was common practice in real-world settings too. A common theme was the use of statements like ‘that must be difficult’ as a device to fill gaps in conversation.

 

그들은 약간 단어 토사물처럼 되기 시작한다.
They start to become a bit like word vomit …

우리는 그것을 필러처럼 사용해왔습니다. 마치 여러분이 보통 멈췄을 때, 우리는 그것을 거기에 넣는 것을 배웠습니다. 토론 교류, 4, 5학년 학생, 2조
We have used it as our fillers, it's like, whenever you would have a normal pause, we have learned to put it in there. Discussion exchange, 4th & 5th year students, group 2


한 편지는 이것을 시로 표현했다:
One letter expressed this in poetry:

침묵은 시간이 생각할 수 있도록 많은 것을 말해준다.
탄산음료 같은 빈 충전재만 있는 게 아닙니다.
당신은 진정한 의미를 가질 수 있는 많은 잠재력을 가지고 있습니다.
하지만 강요된 말은 당신이 기울고 있는 방식입니다. 편지, 5학년 2반

Silence speaks volumes it allows time to think.
Not just empty fillers like a carbonated drink.
You have so much potential to really have meaning.
But forced words is the way you are leaning. Letter, 5th year student, group 2


가짜 공감이 감지되기 쉽다고 추론하면서, 학생들은 공허한 공감을 나타내는 말에 위화감을 느꼈습니다. 우리가 [공감적 불협화음]이라고 부르는 불편감입니다.
Reasoning that fake empathy is easy to detect, students felt a sense of discomfort around hollow empathic statements, a discomfort we have termed empathic dissonance.

제가 당신에 대해 가장 싫어하는 것은, 감정이입입니다. 우리가 거짓으로 말할 때, 우리는 진정성을 잃는다. 사람들은 이것과 그것을 바로 꿰뚫어 볼 수 있다… 그리고 나는 진심이 아닌 것처럼 보이고 싶지 않다. 편지, 4학년 학생, 1조
What I hate most of all about you, empathy, is when we are faking it, when we lose authenticity. People can see straight through this and its embarrassing… and I hate to seem not genuine. Letter, 4th year student, group 1





진정한 예술 공감 연습을 마스터하기 위해, 학생들은 [가장 가치 있는 교훈]은 [단어보다는 침묵에 있다]는 것을 나타낸다. 여기서 배우는 것은 모범적인 비언어적 의사소통을 보여주는 임상의사의 역할 모델에서 영감을 받아 공식적인 커리큘럼과 맞지 않는다.
In seeking to master the true art empathic practice, students indicate the most valuable lessons are more often in the silences rather than the words. Learning here is out-with the formal curriculum, inspired by clinician role models demonstrating exemplary non-verbal communication.

의대에서의 후반기를 향하면서 초점은 [당신이 말하는 것]에서 [당신이 말하는 방식]으로 바뀐다. … 목소리 톤을 바꾸고 조금 더 앉아서 눈을 마주칠 때처럼… 그리고 그것이 병원 의사들이 정말 잘하는 것입니다. 특히 완화의료 의사들 말입니다. 선배가 침대 옆에 무릎을 꿇는 의사들을 내가 보는 것만큼 자주 보는 것 같지는 않은데… 토론, 5학년 2반
The focus towards the later years in med school switches from what you say to how you say it… sort of when you change your voice tone and sit a bit further in making the eye contact… and that's what hospital doctors are really good at, especially… the palliative care physicians. I don't think I see doctors that senior get on their knees next to beds as often as I see them… Discussion, 5th year student, group 2


학생들은 또한 공감을 언제 적용할지를 선택하고 선택하는 법을 배우는 과정을 묘사했다. 어떤 환자들에게는 공감이 도전이였는데, 여기에는 자신을 도울 준비가 되어 있지 않은 사람들, 그리고 불평하거나 요구하거나 불친절해 보이는 사람들이 포함된다. [어려운 환자]에게는 당연히 공감능력이 더 어렵다는 인식과, 임상의가 이러한 상황에서 학생 공감능력에 악영향을 미쳐 [이러한 환자에 대한 학생의 냉소]를 증가시키고 있다는 인식 모두 있었다.

Students also described a process of learning to pick and choose when to apply empathy. For certain patients, empathy was a challenge, including those who seemed unprepared to help themselves and those who were otherwise complaining, demanding or unfriendly. There was both a sense that empathy is naturally more difficult for difficult patients, and also that clinicians were exerting an adverse influence over student empathy in these situations, increasing student cynicism in regard to these patients.

어려운 환자라고 생각되는 환자에게 공감하는 것은 어려울 수 있습니다. 토론, 4학년 학생, 2반
Patients you see as difficult, it can be difficult to be empathetic towards them… Discussion, 4th year student, group 2

또한, 여러분은 더 냉소적이 될 수 있습니다. 만약 여러분이 GP에 있고 GP가 '이 환자가 병원에 오는 것은 정말 그들에게 도움이 되지 않는다'와 같다면 그것은 여러분의 공감을 반대로 영향을 미칩니다. 토론 교환, 5학년 학생 두 명, 그룹 3
Also, you can become more cynical as well… if you are in GP and the GP is like ‘this patient coming in just really doesn't help themselves’ then that impacts your empathy the other way… Discussion exchange, two 5th year students, group 3

 

3.3 감수해야 할 짐
3.3 Empathy as a burden to bear

[다른 사람의 이야기에 자신을 담는 행위]는 특히 [우울하거나 불행한 상황에 직면한 환자]를 본 후에 감당해야 할, 상당한 부담으로 판명되었다. 시간이 지남에 따라, 그들은 환자 이야기의 감정적인 측면에 더 많이 노출됨에 따라, 학생들은 그들이 적응을 하고 그들의 동정심 있는 반응을 무시한다는 것을 인식한다.
The act of putting yourself in somebody else's story proved a significant burden to bear, especially after a run of patients who were either depressed or facing unfortunate circumstances. Over time, as they became more exposed to the emotional aspects of patient stories, students recognise they undergo an adaptation, a blunting of their compassionate response.

난 끝이야, 끝이야. 난 더 이상 신경 안 써. 여러분은 매일, 환자 한 명 한 명, 눈물 한 방울을 흘리고 있습니다. 항상 할 수는 없어요. 편지, 4학년 학생, 1조
I am so done, so done. I just don't care anymore. You are draining… day after day, patient after patient, tears after tears. I can't do it all the time. Letter, 4th year student, group 1

여러분은 공감할 수 있는 어려운 상황을 가진 환자들에게 노출되지만, 그것에 대해 무뎌져야 합니다. 그래서 그들을 사례로 더 많이 보세요. 토론, 4학년 학생, 3반
You're exposed to patients with difficult situations that you do empathise with, but you do have to become blunt to that, so see them more as cases. Discussion, 4th year student, group 3


어떤 상황에서는, 특히 정서적으로 '나쁜 곳'에 있는 경우, 공감 노력이 닿지 않는 것처럼 느껴졌다. 예를 들면, 학생 스스로가 평가의 압박으로 스트레스를 받거나, 원거리 배치에서 외로움을 느낄 때.
In some circumstances, the empathic effort felt out of reach, particularly if students themselves were in an emotionally ‘bad place’, for example when feeling stressed by the pressure of assessments, or lonely in a remote placement.

하지만 그 동안 너(=공감)에 대한 나의 감정은 시험받았고, 사실 3, 4학년 때 나는 너(=공감)에 대해 대부분 무시하고 잊어버렸어. 왜 그랬을까? 어쩌면 제가 의학에 대해 즐겼던 것을 잊었는지도 모릅니다. 어쩌면 우리가 배워야 할 터무니없는 양의 지식, 시험을 치르고, 아무도 없는 곳에 갇혀서 어떤 종류의 삶을 유지하는 것이 여러분보다 선례가 되었는지도 모릅니다. 편지, 5학년 1조
Along the way, however, my feelings towards you have been tested, in fact in 3rd and 4th year, I largely ignored and forgot about you. Why was this? Maybe I forgot what I enjoyed about medicine, maybe the ridiculous amount of knowledge we have to learn, the constant pressure of performing in exams, being stuck in the middle of nowhere and maintaining some sort of life took precedent over you. Letter, 5th year student, group 1


임상발표의 다양한 진단과 관리적 함의를 파악해야 하는 [인지부하]는 공감을 할 수 있는 공간을 적게 남겼다. 이와 관련하여 학생들은 '오토파일럿'에 대한 임상 추론의 상당 부분을 수행하는 숙련된 임상의에 비해 불이익을 느꼈습니다.
The cognitive load of grasping the various diagnostic and management implications of a clinical presentation left less space for empathy. With regard to this, students felt disadvantaged compared to experienced clinicians who do much of their clinical reasoning on ‘autopilot’.

...생각하는 시간의 압박도 있습니다. 그래서, 컨설턴트들과 함께, 그들의 주제를 알고 있는 좋은 사람들은 공감할 수 있는 그런 종류의 사고 시간을 가집니다. 그리고 그 상담, 즉 의학적 측면에서는 단지 2~3분 정도의 생각만 하면 됩니다. 토론 4학년 학생, 그룹 1
…there is also the thinking time pressure. So, with consultants, the nice ones, who know their subject back to front, they have that kind of thinking time to be empathetic and the consultation, the medical side of it, only takes like 2 or 3 minutes of their thinking. Discussion 4th year student, group 1


헤어진 편지들에서 특히 분명한 것은 ['시시한 것fluffy'으로서의 공감]의 개념이었다. 이것은 소중한 시간을 소비하고 평가를 통과하지 못하게 하는 [사소한 방해물]이다. 당신은 공감 부분이 아니라 과학 부분에서 배우는데, 왜 신경을 써야 하는가?
Especially apparent in the break up letters was the concept of empathy as ‘fluffy’, a trivial distraction that eats up precious time and does not get you through assessments—you learn from the science part, not the empathy part, so why bother?

우리가 추는 춤은 주요 이슈를 회피하고 끝없는 감정을 탐구하는 데 시간을 낭비하는 경향이 있다. 요점을 고수하고 잡다한 말fluff 없이 우리가 필요한 것을 말하는 것이 훨씬 간단하다. 편지, 5학년 2반
The dance we tend to do, skirting ‘round the main issue and wasting time exploring endless emotions. Much simpler just to stick to the point and say what we need without the fluff. Letter, 5th year student, group 2


일부 학생들은 공감해야 한다고 생각했을 때 공감을 경험하지 못한 것에 대해 잘못을 느끼고, 또 다른 공감 부담을 가중시켰다.
Some students were left feeling at fault for being unable to experience empathy when they thought they should, adding another layer of empathic burden.

공감은 또한 내가 나 자신이나 환자에 대해 [매우 다른 견해를 가진 사람들]과 같이 특정 환자들과 공감하려고 애쓸 때 죄책감을 느끼게 할 수 있다. 나는 어렵다고 느낀다. 편지, 4학년 2반
Empathy can also make me feel guilty when I struggle to empathise with certain patients such as those with very different views to my own or patients… I feel are difficult. Letter, 4th year student, group 2



학생들은 공감의 부담에 대처하기 위한 다양한 메커니즘을 가지고 있었다. 압도적으로, 가장 일반적인 대처 전략은 [또래 또는 가족과 함께 디브리핑]하는 것이었다. 다른 전략에는 정서적 고립이 포함되었고, 학생들은 순수하게 진료의 '과학'에 집중했다.
Students had a variety of mechanisms for coping with the burden of empathy. Overwhelmingly, the most common coping strategy was debriefing with peers or family. Other strategies included emotional detachment, with students concentrating purely on the ‘science’ of a consultation.

내 친구나 엄마랑 얘기하고 싶어 나는 어떤 기술도 있다고 생각하지 않는다. 그것은 단지 내가 어떤 속상한 상황에 대처하는 방법일 뿐이다. 토론, 4학년 학생, 3반
I feel like I would chat to my buddy about it, or my mum. I don't feel like there are any techniques, it's just how I would deal with any upsetting situation. Discussion, 4th year student, group 3

만약 그들이 울면서 들어와서 여러분이 과학에 집중한다면, 여러분은 그것을 피할 수 있을 것입니다. 하지만 여러분이 공감과 아이디어, 우려, 기대에 정말 열심히 노력한다면, 여러분은 빨려들어갈 것입니다. 토론, 4학년 학생, 1조
If they come in crying and you just focus on the science bit then you kind of get around it… but then if you try really hard on the empathy and the ideas, concerns, expectations, you get sucked in. Discussion, 4th year student, group 1


일반적으로 학생들은 [의과대학의 자원]으로 눈을 돌리기 보다는 [그들 자신의 대처 전략]을 찾았다. 어떤 사람들은 그들이 대화할 수 있다고 느끼는 배치당 적어도 한 명의 튜터를 찾기를 희망했지만, 배치의 일시적 성격은 전문적인 관계를 구축하는 것을 더 어렵게 만들었다.
Generally, students found their own coping strategies rather than turning to the resources of the medical school. Although some hoped to find at least one tutor per placement that they felt they could talk to, the temporary nature of placements made building professional relations more difficult.

…. 만약 당신이 당신이 친하게 지내는 그 튜터를 찾을 수 있다면, 그래서 각 블록에 대해 당신은 때때로 하나를 찾을 수 있지만, 당신은 다음 블록으로 이동한다. 토론, 4학년 학생, 1조
…. if you can find that tutor you get along with, so for me each block you can sometimes find one, but then you move blocks. Discussion, 4th year student, group 1


공감교육의 [잠재 교육과정]을 탐색하는 것 자체가 부담으로 작용했다. 학생들은 [공식 교육과정]이 공감의 가치를 증진시키는 반면, [잠재 교육과정]은 이를 폄하하는 경우가 많은 상황에서 위선을 보았다. 학생들은 환자의 아이디어, 우려 및 기대(ICE)에 대한 논의를 [적극적으로 방해하는 감독관]과 함께 일하는 현실적 과제를 설명했습니다.

Navigating the hidden curriculum of empathic teaching proved a burden in itself. Students saw hypocrisy in a situation in which the formal curriculum promotes the value of empathy, whilst the hidden curriculum is often disparaging of it. Students described the real-world challenge of working with supervisors who actively discourage discussions of patient's ideas, concerns and expectations (ICE).

그는 매번 ICE를 한다고 우리를 꾸짖는다.
He tells us off for doing like ICE every time.

네, ICE를 하면 문제가 생기죠 토론 교류, 4학년 학생, 1조
Yeah, we do ICE, we get into trouble. Discussion exchange, 4th year students, group 1

병원에서는 ICE에 대해 이야기하면 낙담당하거나 서두르기 때문에 우리의 관점을 바꾸게 됩니다. 이는 분명히 그들의 관리를 바꾸지 않기 때문에 '내가 단지 그것을 위해 그것을 하고 있는 것인가?'라고 생각하게 만듭니다. 이것은 공감에 대한 우리의 관점을 바꾼다. 토론, 5학년 2반
In hospital it is discouraged or hurried along if you talk about ICE, so this does change our view, it makes you think ‘am I doing it just for the sake of it?’ as clearly it does not change their management. This changes our view on empathy. Discussion, 5th year student, group 2

3.4 미덕으로서의 공감
3.4 Empathy as a virtue

특히 러브레터를 통해 학생들이 공감을 '더 나은' 사람으로, 더 사심 없는 사람으로 만드는 미덕으로 본다는 것이 특히 분명했다.
It was particularly apparent, especially through love letters, that students see empathy as a virtue, something that makes you a ‘better’, more selfless person.

타인에 대한 생각, 걱정, 기대는 당신의 존재의 중심이며, 나의 이기적인 영혼을 당신에게 끌어당긴 것은 바로 그 사심 없는 마음입니다. 편지, 4학년 학생, 1조
Ideas, concerns, and expectations of others is the centre of your being, and it is that selflessness that has drawn my selfish soul to you. Letter, 4th year student, group 1


공감은 [관련 이익의 집합]과 일치했으며, 그 중 다수는 [선순환적 함의]를 가지고 있다. 학생들은 공감이 [환자와의 연결, 관계와 신뢰 구축, 경청 및 돌봄의제 수립, 환자를 사례나 질병이 아닌 사람으로 대하는 길]이라고 판단했다. 환자에 대한 이해도 향상되면 관리 계획을 조정할 수 있는 등 실질적인 이점도 얻을 수 있습니다.
Empathy was aligned with a collection of associated benefits, many of which also have virtuous connotations. Students reasoned empathy was the route to

  • connecting with patients,
  • building rapport and trust,
  • establishing a listening and caring agenda and
  • treating patients as people, not cases or diseases.

Improved understanding of patients also yields practical benefits, such as being able to tailor management plans.

환자와의 관계와 발전, 그리고 신뢰 관계를 구축할 수 있게 해주셔서 정말 좋습니다. 편지, 4학년 2반
I love how you enable me to build rapport and develop and a trusting relationship with patients. Letter, 4th year student, group 2

공감은 지속적으로 제가 환자에게 더 나은 치료를 제공할 수 있도록 허락한다. 환자를 전체적으로 고려함으로써, 질병 이외의 복잡한 요구를 가진 누군가가... 당신이 없는 저를 상상하고, 그 숫자를 상상하세요. 편지, 4학년 3반
You continuously allow me to provide patients with better care …. through considering the patient as a whole, someone with complex needs other than a disease… imagine me without you, imagine the number. Letter, 4th year student, group 3


공감능력이 보다 효과적인 학습과 연결되었는데, 그 이유는 공감능력이 환자와의 교육적 만남을 더 기억에 남도록 만들기 때문이다.
Empathy was linked to more effective learning, largely because it made educational encounters with patients more memorable.

공감은 당신이 더 많은 공감을 가졌을 때의 경험을 기억하게 한다고 생각한다. 여러분이 무언가에 더 관심을 가질 때, 여러분은 그것을 더 잘 기억할 것입니다. 공감을 더 많이 할 때 학습에 도움이 된다고 생각해요. 토론, 4학년 학생, 1조
I just think it makes you remember experiences when you have more empathy involved. When you care more about something you are going to remember it better… I think it does help your learning when you have more empathy. Discussion, 4th year student, group 1


공감은 또한 전문적 정체성과 밀접한 관련이 있었고, 의대에 [입학하는 동기]와 그곳에 [남아 있는 이유] 둘 다로 보였다.
Empathy was also closely linked to professional identity and was seen both as a driver for entering medical school and reason for remaining there.

공감은 우리가 의대를 시작한 이유였습니다. 모든 예비 학생들은 동기부여와 필수품으로 인용했습니다. 편지, 5학년 2반
You were the reason we started medical school; cited by every prospective student as a motivator and a necessity. Letter, 5th year student, group 2

공감과 함께라면 저는 이 정도 수준의 함정과 높은 수준을 따라잡을 수 있을 것 같습니다. 왜냐하면 궁극적으로 여러분이 제가 이 일을 하는 이유라는 것을 상기시켜주기 때문입니다. 편지, 4학년 학생, 1조
Together I think I can keep up with the pitfalls and heights of being in this degree, because ultimately you remind me that you're the reason why I’m doing this. Letter, 4th year student, group 1

4 토론
4 DISCUSSION


이 정성적 연구는 의과대학 4학년이 될 때까지 학생들이 환자에 대한 공감을 어떻게 느끼는지 이해하기 위해 LBM을 활용했다. 학생들이 보고한 이별 감정 중 일부를 고려하는 것은 특히 흥미롭다. 왜냐하면 이러한 감정들이 우리가 공감의 쇠퇴를 이해하는 데 도움이 될 수 있기 때문이다.

This qualitative study has utilised LBM to understand how students feel about empathy for patients by the time they reach the senior years of medical school. It is particularly interesting to consider some of the break up feelings that students reported, because these may help us to understand empathic decline.

아마도 가장 인상적인 발견은 [가짜 공감]과 관련이 있을 것이고, 학생들은 '그 말을 들으니 유감이다'와 같은 공감하는 진술이 종종 불성실하다는 것을 자유롭게 인정한다. 이는 배치와 평가 설정, 특히 OSCE 모두에 해당했다. 연구는 이전에 의료 교육 및 실습에서 가짜 공감을 강조했습니다. 또한, PA(Physicien Associate) 학생을 대상으로 한 연구는 OSCE의 공감 평가와 동일한 과제를 보고한다. 학생들은 문자 그대로 '공감 상자'를 클릭하도록 강요받고 그들이 진정으로 의도하지 않은 감정 표현을 억지로 외운다. PA학생에 대한 연구와 마찬가지로, 이 연구는 의대생들이 공감 부조화를 경험한다는 것을 확인했다. [공감 부조화]란 [진짜 의도하지 않은 공감의 진술을 하도록 강요당했을 때 학생들이 느끼는 불편함]을 뜻한다. 우리의 데이터는 또한 이러한 진정성 부족, 평가 시스템에 대한 좌절, 공감 부조화 문제가 공감 실천에 대한 일반적인 학생의 냉소를 키울 위험이 있음을 시사한다. 이러한 냉소주의는 다른 곳에서 보고되었고 학생들이 진정한 공감 실천에서 멀어지게 할 위험이 있다. 
Perhaps the most striking finding relates to fake empathy, with students freely acknowledging that empathic statements like ‘I am sorry to hear that’ are often insincere. This was true both for placement and for assessment settings, particularly OSCEs. Research has previously highlighted fake empathy in medical education and practice.36-38 Furthermore, research with Physician Associate (PA) students38 reports identical challenges with the assessment of empathy in OSCEs: students feel compelled to literally ‘tick the empathy box’ and force out rote empathic statements that they do not truly mean. As with research on PA students, this study has identified that medical students experience empathic dissonance38—the discomfort students feel when are forced into making statements of empathy they do not truly mean. Our data also suggest that this lack of authenticity, frustration with the assessment system and the problem of empathic dissonance risk breeding a general student cynicism towards the practice of empathy. This cynicism has been reported elsewhere and risks turning students away from authentic empathic practice.13

[공감의 불성실성insincerity]에 대한 우리의 발견은 [공감적 진술]에 중점을 두고 있지만, 우리는 이러한 유형의 진술을 평가절하하고 싶지 않다. 진료에 관한 모델들은 [공감적 진술]의 authentic한 사용을 정확히 지지한다. 시뮬레이션된 환자(SP)를 사용한 연구는 인간 연결의 가치를 확인한다. 그러나, 이 같은 연구는 또한 [공허한 공감적 진술]이 흔하게 발견되고, 환자를 좌절시킬 위험이 있다는 것을 시사한다. 교육자들에게 [공감적 진술]에 대해 균형 잡힌 시각을 가지고, 그들의 장점뿐만 아니라 한계도 인정하면서, 또한 비언어적 의사소통의 가치를 증진시킬 것을 제안한다. 본 연구의 학생들은 환자의 머리맡에 무릎을 꿇는 시간을 갖는 임상의들의 바디랭귀지에 감명을 받았고, 이에 대한 지지는 공감적 경청을 중심으로 문헌에 나와 있다. 

Whilst our findings regarding insincerity in empathy centre on the empathic statement, we do not wish to devalue this type of statement. Models of the consultation rightly support its authentic use.39 Research with simulated patients (SPs) confirms their value in establishing a human connection.40 However, this same research also suggests that hollow statements of empathy are easy to detect and risk frustrating the patient.40 We propose that educators take a balanced view on empathic statements, acknowledging their merits but also their limitations, whilst also promoting the value of non-verbal communication. Students in this study were impressed by the body language of clinicians who take the time to kneel by the patient's bedside, and there is support for this in the literature around empathic listening.40-42

['감정노동']과 [연민 피로]로서의 공감의 개념은 실제 임상의에 대한 연구에서 확립된다. 우리의 데이터는 또한 학생들이 [너무 많은 공감적 참여]가 [정서적 소진]으로 이어질 것을 두려워한다는 것을 확인시켜준다. 여기에 발표된 증거는 이 우려를 뒷받침하는 일부 연구와 반박하는 다른 연구로 모순된다. 그러나 [공감이 번아웃으로 연결될 위험이 있다는 단순히 인식]이 학생들을 환자에 대한 공감에서 멀어지게 할 수도 있다. 본 연구는 또한 학생들의 공감을 저해할 수 있는 유사한 잠재력을 가진 숨겨진 교육과정 내의 요소들을 강조한다. 의학교육이 '과학적인 것'을 우선시하는 경향과 임상실천에서 공감할 시간이 없음을 암시하는 부정적 역할모델링 등 일부 요인은 이전에 보고되었다. 
The concepts of empathy as ‘emotional labour43 and compassion fatigue44 are established in research with practising clinicians. Our data confirm that students also fear that too much empathic engagement leads to emotional burnout. Published evidence here is contradictory, with some research to support this concern45, 46 and other research to refute it.46 However, simply the perception that empathy risks burnout may turn students away from empathy for patients. This study also highlights factors within the hidden curriculum11 with similar potential to deter student empathy. Some factors have been previously reported, including the tendency for medical education to prioritise the ‘science stuff’47 and the negative role modelling that implies there is no time for empathy in the real world of clinical practice.38

또한 우리의 자료에서 그리고 이전에 PA 학생 연구에서 보고된 것은 의학교육의 경향으로 [일부 환자들은 공감할 자격이 있지]만, [다른 환자들은 공감할 자격이 없다]고 믿도록 학생들을 사회화하는 것이다. 학생들은 감독관들이 '어려운' 환자에 대해 하는 부정적인 논평에 영향을 받았다. 공감에 대한 그녀의 글에서, Halpern은 [의료진을 향한 도전적인 행동]이 때로는 [도움을 요청하는 외침]이라는 것을 상기시킨다. 샤피로는 내집단을 위한 공감을 유보하고, 외집단을 배제하지 말라고 경고한다. 모든 환자를 '무조건적 긍정적 존중'으로 대하라는 로저스의 문구는 완벽함을 위한 조언이지만, 교육자들이 학생들에게 소통할 수 있는 전문적인 기준으로 남아 있다.
Also evident in our data, and previously reported in PA student research,38 is the tendency of medical education to socialise students into the belief that whilst some patients ‘deserve’ empathy, others do not. Students were influenced by negative comments supervisors make about ‘difficult’ patients. In her writing on empathy, Halpern reminds us that challenging behaviours are sometimes a cry for help.48 Shapiro cautions against reserving empathy for in-groups and excluding out-groups.47 Rodgers’ phrase of holding all patients in ‘unconditional positive regard’49 is a counsel of perfection, but remains a professional standard for educators to communicate to students.

본 연구의 학생들은 회복탄력성에 대한 선행연구와 마찬가지로, 회복탄력성이 낮을 때 공감적 진료상담이 이루어지기 어렵다는 것을 알 수 있다. 특히 회복탄력성을 감소시킨 두 가지 요인은 [평가에 대한 스트레스]와 [원격 배치의 외로움]이었다. 외로움은 학생들이 동료들로부터 지지를 구하는 것을 확인한 주요 대처 전략에 반한다. 학생들은 학교의 자원보다 동료들에게 더 쉽게 의지했다. 교육자들은 또한 학생들이 배치를 통해 자주 로테이션할 때 임상 멘토를 찾기 어렵다는 것을 알아야 한다. 이것은 회복력에 부정적인 영향을 미칠 수 있으며 종적 통합 임상실습에 대한 잠재적인 논쟁거리이다. 
As with previous research on resilience,44, 45, 50 students in this study indicate that when resilience is down empathic consulting is difficult to achieve. Two factors which particularly reduced resilience were the stresses of assessments and the loneliness of remote placements. Loneliness militates against the main coping strategy that students identified that of seeking support from peers. Students more readily turned to peers than to the resources of the school. Educators should also be aware that students find clinical mentors difficult to find when frequently rotating through placements. This may have adverse effects on resilience and is a potential argument for longitudinal integrated clerkships.51

[미덕으로서의 공감]이라는 주제는 학생들이 공감을 직업 정체성에 맞추고, 의학을 선택하는 주요 동기로 인용하면서 데이터를 통해 강하게 흘러갔다. 이러한 미덕적 측면은 임상적 공감의 진정한 본질과 그것이 의학 교육 내에서 어떻게 간주되어야 하는지에 대한 철학적, 존재론적 고려를 제기한다. 미덕이 특성, 즉 인간의 속성이라는 것을 감안할 때, 우리는 공감을 같은 방식으로 보아야만 할까요? 블룸의 분류학에서 공감은 기술보다 태도에 가까운가? 연구자들은 현대 의학 교육이 공감을 [기술]로서 가르치고 평가하는 데 너무 중점을 두고 있으며, 공감이 한 인간human being이 다른 사람에게 빚진owes to 자질이라는 개념을 과소평가한다고 주장해왔다. 
The theme of empathy as a virtue ran strong through the data, with students aligning empathy to professional identity and citing it as a prime motivator for choosing medicine. These virtue aspects raise philosophical and ontological considerations as to the true nature of clinical empathy and how it should be regarded within medical education. Given that virtue is a trait, a human attribute, should we regard empathy in the same way? In terms of Bloom's taxonomy,52 is empathy closer to an attitude than a skill? Researchers have argued that contemporary medical education puts too much emphasis on teaching and assessing empathy as a skill and undervalues the notion that empathy is a quality that one human being owes to another.48

기술에서 벗어나 태도 또는 더 나은 속성으로 패러다임 전환을 통해 본 논의에서 제기된 몇 가지 문제에 대한 가능한 해결책을 제시합니다. OSCE의 경우, 교육자들은 공감의 '보여주기shows'와 '수행능력'를 평가하는 효용성을 재고할 수 있다. '보여주기shows'와 '수행능력'은 [정확히 OSCE가 밀러의 피라미드에서 차지하는 수준]이기 때문이다. [공감을 '존재의 방식'으로 여기는 교육자들]은 [동정심을 보이는 것] 만으로는 [진정한 공감 행위]와 동일시되지 않는다는 것을 인식하고, 두 가지를 혼동하는 평가를 거부할 가능성이 높다. 공감을 조금이라도 평가하려면 본 연구에서 학생들이 제안한 대로 튜터가 실제 임상 배치 판단을 선호할 것이다. 샤피로는 의학교육 내에서 [공감적 진료상담의 기풍]에 중점을 둔다면, 학생들은 현재 의학 문화에서 아웃그룹으로 간주되는 어렵고 도전적인 환자들에 대한 공감을 찾기 위해 더 많은 노력을 기울일 것이라고 주장한다. [공감의 미덕적 측면]을 재확인하는 것은 학생들이 숨겨진 교육과정 안에 내포된 다른 부정적인 메시지들을 극복하는데 유사하게 도움이 될 수 있다.

A paradigm-shift away from skills and towards attitudes—or perhaps better, attributes—presents possible solutions to some of the problems raised in this discussion. In the case of OSCEs, educators may reconsider the utility of assessing ‘shows’ and ‘performances’ of empathy, for ‘show’ and ‘performance’ is precisely the level the OSCE occupies in Miller's pyramid.53 Educators who regard empathy as a ‘way of being’8 are more likely to recognise that the mere show of compassion does not equate to the true act, and would reject an assessment that confuses the two.54 If empathy is to be assessed at all, our preference would be real-world clinical placement judgments made by tutors, as suggested by students in this study. Shapiro argues that if emphasis is made on committing to an ethos of empathic consulting within medical education, students would be more likely to stive to find empathy for those difficult and challenging patients who are currently regarded as outgroups in the culture of medicine.47 Reaffirming the virtue aspects of empathy may similarly help students overcome other negative messages implied within the hidden curriculum.

4.1 제한 사항
4.1 Limitations

본 연구의 주된 한계는 한 기관에 국한되어 있다는 것이다. 비록 통합 커리큘럼과 커뮤니케이션 교육이 많은 다른 서양 학교들과 비슷할 것으로 예상하지만, 가르침에 관한 일부 연구 결과는 이 학교에 특별할 수 있다. 우리는 학교가 커뮤니케이션 교육에 널리 채택된 [캘거리 캠브리지 모델]을 사용하고, 대부분의 학교에서 비슷하게 사용되는 SP와의 세션을 포함하여 초기에 대학 기반 커뮤니케이션 교육을 집중하는 관행을 기반으로 한다. OSCE를 통한 커뮤니케이션 능력 평가는 다른 기관에서도 널리 채택되고 있다. 예를 들어, HYMS 학생들은 1학년, 2학년, 3학년 때 종합 OSCE를 가졌다. LBM 방법론은 데이터 수집이 포커스 그룹에서만 이루어졌다는 것을 의미했으며, 이는 이러한 그룹의 공공성에 대해 우려하는 일부 학생들의 보다 민감한 기여를 방해했을 수 있다. 우리의 코호트는 여성이 남성보다 더 많은 공감을 보인다는 증거를 고려할 때, 여성 대 남성 비율이 3:1이었다. 이것은 또한 소견의 전달 가능성에 영향을 미칠 수 있다.

The principle limitation of this research is that it is confined to one institution. Some findings regarding teaching may be specific to this school, although we anticipate its integrated curriculum and communication teaching are similar to many other Western schools. We base this assumption on the school's use of the widely adopted Calgary Cambridge55 model for communication teaching, and the practice of concentrating university-based communication teaching in the early years, including sessions with SPs, which are similarly utilised in the majority of schools.56 The assessment of communication skill through OSCEs is also widely adopted in other institutions—for context, HYMS students had summative OSCEs in 1st, 2nd and 3rd years. LBM methodology meant data collection was exclusively from focus groups, which may have hindered more sensitive contributions from some students concerned about the public nature of these groups. Our cohort had a female to male ratio of 3:1, given the evidence that females demonstrate more empathy than males,57, 58 this may also affect the transferability of findings.

5 LBM 반사
5 LBM REFLECTIONS

의학 교육 연구에서 LBM의 첫 번째 사용이기 때문에, 우리는 방법론에 대한 간략한 반성을 제공한다.
As this is the first use of LBM has in medical education research, we offer brief reflections on the methodology.

사랑과 이별의 편지는 여기서 의인화, 은유, 과장, 심지어 시를 포함한 고조되고 비유적인 언어를 요구한다. 이 글은 더 다채롭다. 그것은 흥미와 참여를 높이며, 그렇지 않으면 추상적인 주제가 될 수 있는 것에 대한 토론을 부추긴다. 그 편지들은 또한 우리의 연구 분석에 우리를 참여시켰다. 창의적인 글쓰기는 더 풍부한 메시지를 전달하고 더 풍부한 메시지는 분석을 위한 더 풍부한 데이터로 변환됩니다. LMB는 [모든 그룹 구성원이 초기 음성을 가질 수 있도록] 하여, 조용한 구성원이 수다스러운 구성원에 의해 가려질 수 있는 포커스 그룹의 한계를 완화한다. [큰소리로 편지를 읽는 것]도 토론이 이어질 수 있는 쇄빙선 역할을 한다. 마지막으로, 편지는 포커스 그룹 내용을 보완합니다. 즉, 분석을 위한 증가된 데이터를 제공합니다.
Love and break up letters call for heightened, figurative language, here including personification, metaphor, hyperbole, even poetry. This writing is more colourful. It elevates interest and engagement, fuelling discussion around what could otherwise be an abstract topic. The letters also engaged us in our research analysis. Creative writing communicates richer messages and richer messages translate to richer data for analysis. LMB allows all group members to have an initial voice, mitigating a limitation of focus groups that quieter members may be over-shadowed by talkative ones.59 Reading letters aloud also acts as an icebreaker for the discussion to follow. Finally, the letters supplement the focus group transcripts: they provide increased data for analysis.

물론 한계가 있다. 사랑과 이별의 편지는 본질적으로 이분법적이어서 극적 대립에 초점을 맞추고 그 사이의 회색 음영을 희생시킨다. 포커스 그룹 진행자들은 이것을 유념할 필요가 있다. 진행자들은 또한 창의적인 글쓰기를 경계하고 그들의 편지를 읽는 것을 부끄러워하는 참가자들에게 민감할 필요가 있다. 실제 수준에서, 쓰기 과제는 본 연구에서 20-30분을 추가하여 포커스 그룹의 기간을 연장한다.
Of course, there are limitations. By their nature, love and break up letters are dichotomous, risking a focus on polar opposites and sacrificing shades of grey between. Focus group moderators need to be mindful of this. Moderators also need to be sensitive to participants who are wary of creative writing and embarrassed to read their letters. On a practical level, the writing task extends the duration of the focus group, adding 20-30 minutes in this study.

6 결론
6 CONCLUSION

본 연구는 의과대학 재학 중 환자에 대한 학생 공감의 질적 변화를 확인한다. 학생들은 먼저 [공감적 진술]을 배우고 나서, 그들의 의사소통 연습을 [더 자연스러운 어구 및 비언어적 표현]을 포함하도록 진화시킨다. 그러나 그들은 또한 현재의 평가 방법에 의해 악화되는 문제인 [공감적 진술을 위조하는 법]을 배운다. [연민적 의사소통의 장벽]에는 [공감 부담, 부정적인 역할 모델링, 어려운 환자에게 연민적 접근 방식을 채택하는 문제]가 포함된다. 이러한 장벽에도 불구하고, 학생들은 계속해서 공감을 미덕으로 인식하고 기술에 숙달된 임상의로부터 긍정적인 동기를 얻는다. 조사 결과를 바탕으로 교육자의 주요 요점을 제시합니다(표 3).

This study confirms qualitative changes in student empathy for patients during their time in medical school. Students first learn empathic statements and then evolve their communication practice to incorporate more natural turns of phrase and non-verbal expression. However, they also learn to fake empathic statements, a problem exacerbated by current assessment methods. Barriers to compassionate communication include empathic burden, negative role modelling and the challenges of adopting a compassionate approach for difficult patients. Despite these barriers, students continue to identify with empathy as a virtue and take positive motivation from those clinicians who demonstrate mastery of the art. Based on our findings, we include key points for educators (Table 3).



표 3. 교육자의 주요 사항
Table 3. Key points for educators

  • 의대생들은 배치와 평가 환경 모두에서 종종 [가짜 감정 표현]을 하는 것을 자유롭게 인정해야 한다.

    교육자들은 [공감적 진술의 장점과 한계]를 모두 가르쳐야 하며, 또한 [비언어적 의사소통의 중요성]을 인정해야 한다.

    의대생들은 [연민 피로]를 두려워하고, 특히 고부담 시험의 시기나 고립된 장소에서 외로움의 위험이 있을 때 [회복탄력성]을 향상시키기 위한 전략으로부터 이익을 얻을 것이다.

    교육자는 OSCE와 같이 [공감적 퍼포먼스와 진실된 상태를 혼동하는 임상 평가]를 경계해야 한다.

    학생들은 공감을 미덕으로 보고, 의학교육은 공감을 기술로 간주하고 그것을 속성, 즉 환자와 함께 있는 방식으로 다시 구상하는 것에서 벗어나 패러다임 전환을 받아들여야 한다.


    Medical students freely admit to making frequent fake empathic statements, in both placement and assessment settings.
  • Educators should teach both the merits and the limitations of empathic statements, and also acknowledge the importance of non-verbal communication.
  • Medical students fear compassion fatigue and would benefit from strategies to improve resilience, especially around the time of high stakes examinations or when at risk of loneliness in remote placements.
  • Educators should be wary of clinical assessments, like OSCEs, that confuse performances of empathy with the authentic state.
  • Students see empathy as a virtue and medical education should embrace a paradigm-shift away from regarding empathy as a skill and re-envisioning it as an attribute, a way of being with patients.

 

 


Med Educ. 2021 Mar;55(3):394-403. doi: 10.1111/medu.14403. Epub 2020 Nov 17.

How medical school alters empathy: Student love and break up letters to empathy for patients

Affiliations collapse

Affiliations

1Health Professions Education Unit, Hull York Medical School, York, UK.

2Google Inc, Mountain View, CA, USA.

3Division of Medical Education, School of Medical Sciences, Faculty of Biology, Medicine and Health, The University of Manchester, Manchester, UK.

PMID: 33128262

DOI: 10.1111/medu.14403

 

Abstract

Introduction: Medical education is committed to promoting empathic communication. Despite this, much research indicates that empathy actually decreases as students progress through medical school. In qualitative terms, relatively little is known about this changing student relationship with the concept of empathy for patients and how teaching affects it. This study explores that knowledge gap.

Methods: Adopting a constructivist paradigm, we utilised a research approach new to medical education: Love and Breakup Letter Methodology. A purposive sample of 20 medical students were asked to write love and break up letters to 'empathy for patients'. The letters were prompts for the focus group discussions that followed. Forty letters and three focus group discussions were thematically analysed.

Results: The three major themes were: art and artifice; empathic burden; and empathy as a virtue. Students were uncomfortable with the common practice of faking empathic statements, a problem exacerbated by the need to 'tick the empathy box' during examinations. Students evolved their own empathic style, progressing from rote empathic statements towards phrases which suited their individual communication practice. They also learned non-verbal empathy from positive clinician role-modelling. Students reported considerable empathic burden. Significant barriers to empathy were reported within the hidden curriculum, including negative role-modelling that socialises students into having less compassion for difficult patients. Students strongly associated empathy with virtue.

Conclusions: Medical education should address the problem of inauthentic empathy, including faking empathic s in assessments. Educators should remember the value of non-verbal compassionate communication. The problems of empathic burden, negative role modelling and of finding empathy difficult for challenging patients may account for some of the empathy decline reported in quantitative research. Framing empathy as a virtue may help students utilise empathy more readily when faced with patients they perceive as challenging and may promote a more authentic empathic practice.

자기조절학습의 리뷰: 여섯 개 모델과 네 개의 연구방향(Front Psychol. 2017)
A Review of Self-regulated Learning: Six Models and Four Directions for Research
Ernesto Panadero*

 

 

서론
Introduction

자기조절학습(SRL)은 학습의 인지적, 동기적, 감정적 측면을 이해하기 위한 핵심 개념 프레임워크이다. SRL은 학자들이 SRL과 메타인식을 구별하기 시작한 최초의 논문 이후 교육심리학에 큰 기여를 했다. 이후 SRL 이론 분야의 출판물은 개념적 발전 측면에서 증가 및 확장되었으며, 현재 SRL의 여러 모델이 존재한다. 2001년, 보카르트, 보르코프스키, 핀트리히, 윈, 짐머먼의 이론적인 리뷰가 출판되었다. 그러나 이 분야는 2001년 이후 크게 발전했다.

Self-regulated learning (SRL) is a core conceptual framework to understand the cognitive, motivational, and emotional aspects of learning. SRL has made a major contribution to educational psychology since the first papers in which scholars began to distinguish between SRL and metacognition (e.g., Zimmerman, 1986; Pintrich et al., 1993a). Since then, publications in the field of SRL theory have increased and expanded in terms of conceptual development, and there are now several models of SRL (Sitzmann and Ely, 2011). In 2001, a theoretical review was published (Puustinen and Pulkkinen, 2001) that included the most relevant models at that time–those articulated by Boekaerts, Borkowski, Pintrich, Winne, and Zimmerman. However, the field has developed significantly since 2001.

  • 이러한 진화의 첫 번째 징후는 SRL의 영향에 대한 세 가지 메타 분석이 있다는 것이다: 디그너와 뷔트너(2008년), 디그너 외 연구진(2008년), 시트만과 엘리(2011년).
  • 두 번째 지표는 교육심리학 분야에서 2001년에는 존재하지 않았던 새로운 SRL 모델이 현재 존재한다는 것이다.
  • 마지막으로, 세 번째 측면은 SRL을 평가하기 위해 확립된 다양한 방법을 제시하는 새로운 핸드북이 있다는 것이다.
  • A first sign of that evolution is that there are now three meta-analyses of the effects of SRL: Dignath and Büttner (2008)Dignath et al. (2008), and Sitzmann and Ely (2011).
  • A second indicator is that there are now new SRL models in the educational psychology field that did not exist in 2001 (e.g., Efklides, 2011Hadwin et al., 2011, in press).
  • And lastly, a third aspect is that there is a new handbook1 (Zimmerman and Schunk, 2011) that presents a variety of established methods to evaluate SRL.

이전 핸드북과 비교하여, 최근의 핸드북에는 새로운 모델을 제시하는 데 전념하는 섹션이 없으며, SRL의 특정 측면(예: 기본 도메인, 교육 문제, 방법론 문제)에 초점을 맞추고 있으며, 이는 해당 분야가 발전하여 보다 성숙한 단계에 도달했음을 보여준다. 
Compared to the previous handbook (Boekaerts et al., 2000), the recent handbook has no sections dedicated to presenting new models, being focused on specific aspects of SRL (e.g., basic domains, instructional issues, methodological issues), which shows that the field has evolved and reached a more mature phase.

따라서 SRL 모델의 개발을 기반으로 알려진 것을 비교하고 이론적 및 실제적 함의가 무엇인지 추출하여 재분석해야 할 때입니다. 따라서 본 검토의 목적은 다양한 SRL 모델을 이에 따라 분석하고 최신 기술 및 이용 가능한 새로운 경험적 데이터와 비교하는 것이다. 
It is time, then, to reanalyze what is known based on the development of SRL models by comparing them and extracting what are the theoretical and practical implications. Therefore, the aim of this review is to analyze and compare the different SRL models accordingly with the current state of the art and the new empirical data available.

방법들
Methods

포함 기준
Criteria for Inclusion

이론적, 경험적 배경이 통합된 모델만 포함이 고려되었다. 모델을 선택하는 기준은 다음과 같다.
Only models with a consolidated theoretical and empirical background were considered for inclusion. The criteria to select a model were that

  • (a) JCR 저널 또는 SRL 핸드북에 게시되어야 하므로 동료 검토를 거쳐야 한다.
  • (b) 영어로 작성되어야 한다.
  • (c) 최소 인용 수가 있어야 합니다.
  • (a) it should be published in JCR journals or SRL handbooks, thus peer-reviewed;
  • (b) it should be written in English; and
  • (c) it should have a minimum number of cites.

2010년 이전에 발표된 모델에는 최소 500개의 참조 자료가 있어야 한다. 이 모델이 2010년 이후에 출판되었다면 적어도 연간 20개의 인용구가 있어야 한다.
Models published earlier than 2010 should have at least 500 references. If the model was published after 2010, it should at least have 20 cites per year.

선택 과정
Selection Process

첫 번째 단계로 2001년 검토에 포함된 모델 중 어떤 모델이 여전히 활발히 사용되고 있는지를 분석하였다. Boekaerts, Winne, Zimmerman의 모델은 널리 사용되고 있으며 저자들은 최신 핸드북(2011)에 발표된 활발한 SRL 학자들이다. 그러나 2001년 리뷰의 다른 두 모델인 핀트리히와 보르코프스키를 더 고려해야 했다. 핀트리히는 불행히도 그의 연구를 더 발전시킬 수 없었지만, 그의 모델과 그에 기반한 설문지인 학습 동기 부여 전략 설문지(MSLQ)는 여전히 연구에 널리 사용되고 있다. 메타인식에 강한 기반을 두고 있는 보르코프스키 외 연구진(2000)의 모델은 최근 몇 년간 SRL 분야 개발에서 존재감이 떨어졌고, 주요 저자는 자신의 연구 초점을 '예외성'(예: 학습장애)으로 옮겼다. 그러므로, 그것은 제외되었다.

As a first step, it was analyzed which of the models included in the 2001 review were still actively used. The models by Boekaerts, Winne, and Zimmerman were included as they are widely used and the authors are active SRL scholars who published in the latest handbook (2011). However, the two other models from the 2001 review–Pintrich and Borkowski–needed further consideration. Pintrich was, unfortunately, not able to develop his work further (Limón et al., 2004), but his model and the questionnaire based on it, the Motivated Strategies for Learning Questionnaire (MSLQ) (Pintrich et al., 1993b), are still widely used in research (e.g., Moos and Ringdal, 2012). Borkowski et al.’s (2000) model, which has a strong basis in metacognition, has had less of a presence in the development of the SRL field in recent years, and the main author has transferred his research focus to “exceptionality” (e.g., learning disabilities). Therefore, it was excluded.

두 번째 결정은 새로운 모델을 고려하는 것이었다. 두 가지 조치가 취해졌다.
The second decision was to consider new models. Two actions were taken.

  • 첫째, 2001년부터 "자기조절학습모델"이라는 용어를 사용하여 PsycINFO에서 문헌 검색을 수행하였다.
  • 두 번째로, 나는 8명의 SRL 동료들에게 새로운 모델을 식별하도록 요청했다.
  • First, a literature search was performed in PsycINFO using the term “self-regulated learning model” from 2001 onward.
  • Second, I asked eight SRL colleagues to identify new models.

5개의 새로운 모델이 확인되었다. Efklides'(2011) 모델은 감정과 동기가 메타인지와 상호 작용하는 방식을 탐구하며, Boekaerts'와 비교하여 학생들의 하향식/하향식 처리에 대한 다른 해석을 제공하여 SRL에 대한 이해를 넓힌다. Hadwin 등의 모델은 SRL 분야에서 새로운 연구 라인이 되어온 학습 규제의 사회적 측면을 다룬다. 또한, 다음 세 가지가 고려되었다.
Five new models were identified. Efklides’ (2011) model explores how emotion and motivation interact with metacognition, and offers a different interpretation of students’ top–down/bottom–up processing in comparison to Boekaerts’, thereby broadening our understanding of SRL. Hadwin et al.’s (2011, in press) model addresses the social aspects of the regulation of learning, which has been an emerging line of research within the SRL field (Panadero and Järvelä, 2015). Additionally, three others were considered:

  • (a) Wolters(2003)는 동기부여 규제에 중점을 두고 있다.
  • (b) 아제베도 외. (2004) 이는 Winne과 동료의 작업을 기반으로 하며 SRL의 마이크로 레벨 분석을 설명한다.
  • (c) 슈미츠와 비제(2006)는 짐머만의 모델을 기반으로 몇 가지 수정을 제안한다.

  • (a) Wolters (2003), which has a strong focus on motivation regulation;
  • (b) Azevedo et al. (2004), which builds upon the work of Winne and colleagues (e.g., Azevedo and Cromley, 2004, p. 525, fourth paragraph) and describes a micro-level analysis of SRL; and
  • (c) Schmitz and Wiese (2006), which takes Zimmerman’s model as a foundation and proposes some tweaks.

이 세 가지 모델은 관련성이 있고 학자들은 SRL에 대한 중요한 경험적 연구를 수행했지만, 두 가지 이유로 포함하지 않기로 결정했다.
While these three models are relevant and the scholars have conducted important empirical research on SRL, it was decided not to include them for two reasons.

  • 첫째, Wolters는 동기 부여에 중점을 두고 있으며, SRL 구성 요소의 전체 스펙트럼을 다루지 않는다.
  • 둘째, 아제베도 외 연구진(2004)과 슈미츠와 비제(2006)는 이미 포함된 다른 두 모델(각각 윈과 짐머만)과 상당한 유사성을 가지고 있다.
  • First, Wolters has a strong focus on motivation and does not cover the whole spectrum of SRL components.
  • Second, Azevedo et al. (2004) and Schmitz and Wiese (2006) have considerable similarities with two other models that were already included (Winne and Zimmerman, respectively).

요약하면, 짐머만, 보에카르트, 윈, 핀트리치의 모델들은 최근 몇 년간의 연구를 바탕으로 새로운 렌즈로 분석될 것이다. 또한, 에프클리데스와 하드윈, 예르벨래, 밀러의 두 가지 새로운 모델이 더 확립된 모델과 비교될 것이다. 다음으로, 모델들은 시간 순서대로 논의될 것이다.
In sum, the models from Zimmerman, Boekaerts, Winne, and Pintrich, will be analyzed with a new lens based on the research of recent years. Additionally, two new models–those of Efklides and of Hadwin, Järvelä, and Miller–will be compared to those more established models. Next, the models will be discussed in chronological order.

자율 학습 모델
The Self-Regulated Learning Models

짐머만: SRL의 사회인지적 시각에 관한 연구
Zimmerman: A Socio-cognitive Perspective of SRL Grounded by Three Models

짐머만은 최초의 SRL 작가 중 한 명이다. 그는 SRL에 영향을 미치는 상호 작용을 설명하기 위한 첫 번째 시도인 1989년에 발표된 첫 번째 SRL 모델을 세 가지 다른 SRL 모델을 개발했다.
Zimmerman was one of the first SRL authors (e.g., Zimmerman, 1986). He has developed three different SRL models, being the first one published in 1989 representing what was the first attempt to explain the interactions that influence SRL.

모델의 역사와 개발
History and Development of the Models

짐머먼(2013)은 자신의 경력과 작품발전을 사회인지 이론(즉, 개인은 타인과 사회적 상호작용을 관찰함으로써 지식을 얻는다)으로 구성했다. 짐머맨의 연구는 알베르트 반두라, 테드 L. 로젠탈과 공동으로 인지 모델링 연구로부터 시작되었다. 나중에 짐머만은 개별 학습자들이 어떻게 인지 모델을 습득하고 다른 업무에서 전문가가 되는지 탐구하기 시작했다.
Zimmerman (2013)reviewed his career and the development of his work, framing it into the socio-cognitive theory (i.e., individuals acquire knowledge by observing others and social interaction). Zimmerman’s work started from cognitive modeling research in collaboration with Albert Bandura and Ted L. Rosenthal. Later Zimmerman began to explore how individual learners acquire those cognitive models and become experts in different tasks.

가장 많은 SRL 작가 중 한 명인 짐머만은 SRL의 세 가지 모델을 개발했다.
As one of the most prolific SRL writers, Zimmerman has developed three models of SRL (Panadero and Alonso-Tapia, 2014).

  • SRL의 삼원적 분석으로 알려진 첫 번째 모델(그림 1)은 SRL의 세 가지 형태의 상호 작용을 나타낸다: 환경, 행동 및 사람 수준. 이 모델은 반두라의 사회적 인식에 대한 3원적 모델 내에서 SRL을 어떻게 구상할 수 있는지를 설명한다.
  • 두 번째 모델(그림 2)은 SRL의 주기적 단계를 나타내며, 개인 수준에서 메타인지 및 동기 부여 프로세스의 상호 관계를 설명합니다. 이 모델은 2000년 핸드북의 한 장에 제시되었으며, 일반적으로 짐머만의 모델로 알려져 있다. 각 단계에 속하는 하위 프로세스가 제시되었지만, 이러한 하위 프로세스가 그림에 포함된 것은 2003년이 되어서였다. 
  • 마지막으로, Zimmerman과 Moylan(2009)에서 모델은 성능 단계의 새로운 메타인지 및 자발적 전략을 포함하여 몇 가지 조정을 거쳤다(그림 3). 최근에 Multi-Level Model로 불리는 Zimmerman이 개발한 세 번째 모델(그림 4)은 학생들이 자율규제 역량을 습득하는 네 가지 단계를 나타낸다.
  • The first model (Figure 1), known as the Triadic Analysis of SRL, represents the interactions of three forms of SRL: environment, behavior and person level (Zimmerman, 1989). This model describes how SRL could be envisioned within Bandura’s triadic model of social-cognition.
  • The second model (Figure 2) represents the Cyclical Phases of SRL, which explains at the individual level the interrelation of metacognitive and motivational processes. This model was presented in a chapter in the 2000 handbook, and it is usually known as Zimmerman’s model. There the subprocesses that belong to each phase were presented, but it was not until 2003 that these subprocesses were embedded in the figure (Zimmerman and Campillo, 2003).
  • Finally, in Zimmerman and Moylan (2009) the model underwent some tweaks (Figure 3), including new metacognitive and volitional strategies in the performance phase. The third model Zimmerman developed (Figure 4), which recently has been called the Multi-Level model, represents the four stages in which students acquire their self-regulatory competency (Zimmerman, 2000).

이 검토에서는 순환 단계 모델이 분석됩니다. 여기서 분석된 다른 저자의 모델과 동일한 수준에서 SRL 프로세스를 설명하기 때문입니다.
In this review, Cyclical Phases model will be analyzed, as it describes the SRL process at the same level as the models from the other authors analyzed here.

Figure 1

FIGURE 1. Triadic model of SRL. Adapted from Zimmerman (1989).

Figure 2

FIGURE 2. Cyclical phases model (1st version). Adapted from Zimmerman (2000).

Figure 3

FIGURE 3. Current version Cyclical phases model. Adapted from Zimmerman and Moylan (2009).

Figure 4

FIGURE 4. Multi-level model. Adapted from Zimmerman (2000).

짐머만의 주기적 위상 모형
Zimmerman’s Cyclical Phases Model

Zimmerman(2000) SRL 모델은 사전 고려, 성능 및 자기 성찰의 세 단계로 구성됩니다(그림 3 참조).
Zimmerman’s (2000) SRL model is organized in three phases: forethought, performance and self-reflection (see Figure 3).

  • [선행 사고 단계]에서 학생들은 과제를 분석하고 목표를 설정하고, 목표에 도달하는 방법을 계획하며, 많은 동기부여 신념이 과정에 에너지를 주고 학습 전략의 활성화에 영향을 미친다.
  • [수행 단계]에서, 학생들은 실제로 과제를 실행하면서, 그들이 어떻게 진행되고 있는지 관찰하고, 그 과제를 끝내기 위해 인지적으로 참여하고 동기를 부여하기 위해 많은 자기 통제 전략을 사용한다.
  • 마지막으로, [자기 성찰 단계]에서, 학생들은 그들이 어떻게 과제를 수행했는지 평가하며, 그들의 성공 또는 실패에 대한 귀인을 만든다.
  • In the forethought phase, the students analyze the task, set goals, plan how to reach them and a number of motivational beliefs energies the process and influence the activation of learning strategies.
  • In the performance phase, the students actually execute the task, while they monitor how they are progressing, and use a number of self-control strategies to keep themselves cognitively engaged and motivated to finish the task.
  • Finally, in the self-reflection phase, students assess how they have performed the task, making attributions about their success or failure.

이러한 속성은 학생들이 이후의 공연에서 과제에 접근하는 방식에 긍정적인 또는 부정적인 영향을 미칠 수 있는 자기 반응을 생성한다.
These attributions generate self-reactions that can positively or negatively influence how the students approach the task in later performances.

짐머만의 주기적 모델을 뒷받침하는 경험적 증거
mpirical Evidence Supporting Zimmerman’s Cyclical Model

짐머만의 경험적 증거에 대한 개요는 그의 경력 검토에서 찾을 수 있다. 짐머만의 경험적 연구의 특별한 특징은 보다 전형적인 학문적 기술과 함께 운동 기술을 사용한다는 것이다. 짐머만 모델의 다양한 측면을 테스트하기 위해 많은 연구가 수행되었으며, 특히 다단계 및 주기적 위상 모델이 그러하다. 짐머만은 키산타스와 클리어리와 함께 다단계 모델을 테스트하는 작업을 수행했다. 이 네 가지 스터디는 두 가지 유형으로 분류할 수 있습니다.
An overview of Zimmerman’s empirical evidence can be found in his career review (Zimmerman, 2013). A special feature of Zimmerman’s empirical research is the use of athletic skills, along with more typical academic skills. A number of studies have been conducted to test different aspects of Zimmerman’s models (Puustinen and Pulkkinen, 2001; Zimmerman, 2013), especially the Multi-level and the Cyclical phase models. Zimmerman conducted work with Kitsantas and Cleary that tested the Multi-level model (Zimmerman and Kitsantas, 1997, 1999, 2002; Kitsantas et al., 2000). Those four studies can be grouped in two types.

  • 첫째, 1997년과 1999년에 발표된 논문은 고등학생과 함께 다트 던지기, 쓰기 두 가지 다른 과제에서 결과 및 과정 목표의 차등적 효과를 연구하여 모형에 대한 지지를 찾았다.
  • 그리고 둘째, 2000년과 2002년에 발표된 논문은 다트 던지기 및 쓰기 SRL 기술 개발에 있어 서로 다른 유형의 모델을 관찰하는 효과를 연구하였다.
  • First, the articles published in 1997 and 1999 studied the differential effect of outcome and process goals with high school students in two different tasks dart throwing and writing, finding support for the model.
  • And second, the articles published in 2000 and 2002 studied the effect of observing different types of models in the development of SRL skills in dart throwing and writing.

순환 위상 모델은 일련의 네 가지 연구에서 테스트되었다.
The cyclical phase model has been tested in a series of four studies.

  • 째, Cleary와 Zimmerman(2001)은 농구에서 전문가, 비전문가, 초보자인 사춘기 소년들이 보여주는 SRL 기술을 연구한 결과, 전문가들이 SRL 동작을 더 많이 수행한 것으로 나타났다.
  • 둘째, 유사한 연구에서 Kitsantas와 Zimmerman(2002)은 배구의 전문가와 비전문가인 대학생 여성을 비교한 결과, SRL 기술이 서브 기술에서 90%의 차이를 예측하였다.
  • 셋째, 클리어리 외 연구진(2006)은 50명의 대학생을 농구 자유투로 훈련시켰다: 1상 SRL, 2상 SRL, 3상 SRL, 통제 그룹 연습 전용 및 통제 그룹 연습 없음. 결과는 선형 추세를 보였다: 더 많은 단계가 훈련될수록 참가자들의 점수가 더 좋았다.
  • 마지막으로, DiBenedetto와 Zimmerman(2010)은 과학 수업 중 51명의 고등학교 3학년생을 대상으로 높은 성취도가 Zimmerman 모델의 하위 프로세스를 더 많이 사용하는 것으로 나타났다.
  • First, Cleary and Zimmerman (2001) studied the SRL skills showed by adolescent boys who were experts, non-experts and novices in basketball, finding that experts performed more SRL actions.
  • Second, in a similar study, Kitsantas and Zimmerman (2002) compared college women that were experts and non-experts in volleyball, finding that the SRL skills predicted 90% variance in serving skills.
  • Third, Cleary et al. (2006) trained 50 college students in basketball free throws organized in five different conditions: one-phase SRL, two-phases SRL, three-phases SRL, control group practice-only and control group no-practice. The results showed a linear trend: the more phases trained the better the participants’ scores.
  • Finally, fourth, DiBenedetto and Zimmerman (2010) studied 51 high school seniors during science courses seniors finding that higher achievers showed more use of subprocesses from Zimmerman’s model.


짐머만의 모델에 대한 또 다른 중요한 연구는 베른하르트 슈미트와 동료들이 수행한 연구이다. 이미 언급했듯이, 슈미트는 짐머먼을 기반으로 한 SRL 모델을 개발했고, 쿨(2000) 모델의 영향을 받아 단계와 하위 프로세스의 이름이 변경되었다. 이 이론적 제안은 SRL에서 자기 모니터링의 역할을 크게 강조한다. 또한 Schmitz는 학습 일지의 사용과 시계열 분석으로 알려진 다양한 데이터 분석에 대한 중요한 연구를 개발했다. 그의 주요 결과는 학습 일지의 사용이 모든 SRL 단계를 향상시켜 학생들의 SRL과 성과에 영향을 미치는 효과적인 방법이라는 것이다.
Another important piece of research into Zimmerman’s model is the work performed by Bernhard Schmidt and colleagues. As already mentioned, Schmidt has developed a SRL model based on Zimmerman’s and influenced by Kuhl’s (2000) model with changes in the names of the phases and subprocesses included (Schmitz and Wiese, 2006). This theoretical proposal gives a major emphasis to the role of self-monitoring in SRL (Schmitz et al., 2011). Additionally, Schmitz has developed significant research on how the use of learning diaries and its different data analysis known as time-series analysis. His main results have been that the use of learning diaries enhances all SRL phases being an effective way to impact in students’ SRL and performance.

기기 및 측정 방법
Instruments and Measurement Methods

짐머만의 모델 우산 아래, 5개의 기구와 측정이 개발되었다.
Under Zimmerman’s model umbrella, five instruments and measurements have been developed.

  • 첫째, Zimmerman 모델에 존재하는 하위 프로세스는 부분적으로 SRLIS(Self-Regulated Learning Interview Schedule)의 검증 과정에서 발견된 결과에 기초한다. 
  • 둘째, Zimmerman은 필기 및 다트 던지기 실험 훈련 환경에서 SRL을 평가하는 절차를 개발했다. 
  • 셋째, Cleary와 Zimmerman, Kitsantas와 Zimmerman, DiBenedetto와 Zimmerman은 순환 단계 모델의 타당성을 평가하기 위해 미세 분석 측정을 개발했다. 
  • 넷째, Zimmerman은 자기효능감과 자기평가에 대한 자기조절 및 교정조치를 위해 다양한 자기효능감의 측정방법을 개발하였다. 
  • 그리고 다섯째, Zimmerman과 Martinez-Pons(1986, 1988)가 SRL의 틀에 고정시킨 Magno(2010)는 잘 확립된 두 SRL 도구인 MSLQ와 학습 및 연구 전략 인벤토리(LASSI)에 대한 기능적 상관관계를 분석하는 것으로 검증된 학술 자율규제 척도(A-SRL)를 개발했다. 
  • First, the subprocesses present in Zimmerman’s model are partly based on the results found in the validation process of the Self-Regulated Learning Interview Schedule (SRLIS) (Zimmerman and Martinez-Pons, 19861988).
  • Second, Zimmerman has developed procedures to assess SRL in experimental training settings for writing and dart throwing (Zimmerman and Kitsantas, 19971999).
  • Third, Cleary and Zimmerman (20012012), Kitsantas and Zimmerman (2002)DiBenedetto and Zimmerman (2010) developed microanalytic measures to assess the validity of the Cyclical Phases model.
  • Fourth, Zimmerman has developed different measures of self-efficacy to self-regulate (Zimmerman and Kitsantas, 20052007) and calibration measures of self-efficacy and self-evaluation (Zimmerman et al., 2011).
  • And, fifth, anchored on the framework of SRL by Zimmerman and Martinez-Pons (19861988), Magno (2010) developed the Academic Self-Regulation Scale (A-SRL) which has been validated analyzing its functional correlation against two well-established SRL instruments the MSLQ and the Learning and Study Strategies Inventory (LASSI) (Magno, 2011).

Boekaerts: 다양한 목표 로드맵(상하/하상)과 감정의 역할
Boekaerts: Different Goal Roadmaps (Top–Down/Bottom–Up) and the Role of Emotions

보에카르트(Boekaerts)의 저작은 SRL 문헌에서 가장 오래된 것 중 하나이며 1980년대 후반으로 거슬러 올라갈 수 있다. 얼마 지나지 않아 그녀는 자신의 첫 SRL 모델을 선보였다. 그녀의 연구는 목표의 역할(예: 학생들이 SRL과 관련하여 다른 유형의 목표를 활성화하는 방법)을 설명하는 데 초점을 맞췄고, 그녀는 동기 부여와 SRL을 평가하기 위해 상황별 측정을 최초로 사용했다. 또한, Boekaerts는 자기 조절과 감정 조절에 관한 임상 심리학 문헌에 대한 방대한 지식을 보여주었다.
The work by Boekaerts is also one of the earliest in the SRL literature and can be traced back to the late 1980s (e.g., Boekaerts, 1988). Shortly after she presented her first SRL model (Boekaerts, 1991). Her work has focused in explaining the role of goals (e.g., how students activate different types of goals in relation to SRL), and she was the first to use situation-specific measures to evaluate motivation and SRL. In addition, Boekaerts has demonstrated a vast knowledge of the clinical psychology literature on self-regulation and emotion regulation (see Boekaerts, 2011).

모델의 역사와 개발
History and Development of the Models

Boekaerts는 SRL의 두 가지 모델을 개발했습니다. 먼저, 그녀는 자체 규제가 다음과 같은 6가지 요소로 구분되는 구조 모델(그림 5)을 개발했습니다.
Boekaerts has developed two models of SRL. First, she developed a structural model (Figure 5) in which self-regulation was divided into six components, which are:

  • (1) 도메인 특이적 지식 및 기술,
  • (2) 인지 전략,
  • (3) 인지적 자기 조절 전략,
  • (4) 동기부여의 신념과 마음의 이론,
  • (5) 동기부여 전략,
  • (6) 동기부여적인 자기조절 전략
  • (1) domain-specific knowledge and skills,
  • (2) cognitive strategies,
  • (3) cognitive self-regulatory strategies,
  • (4) motivational beliefs and theory of mind,
  • (5) motivation strategies, and
  • (6) motivational self-regulatory strategies (Boekaerts, 1996b).

이것들은 그녀가 당시 고려했던 SRL의 두 가지 기본 메커니즘인 [인지적 및 정서적/동기적 자기 조절]을 중심으로 구성되었다. 이 모델은 주로 다음의 목적으로 사용되어 왔다.
These were organized around, what she then considered to be, the two basic mechanisms of SRL: cognitive and affective/motivational self-regulation. This model has been mainly used

  • (a) SRL의 도메인별 구성 요소에 대한 더 많은 통찰력을 얻기 위해,
  • (b) 교사들을 훈련시키기 위해,
  • (c) 연구를 위한 새로운 측정 장비를 구축한다.
  • (d) 개입 프로그램을 설계한다.
  • to (a) gain more insight into domain-specific components of SRL,
  • to (b) train teachers,
  • to (c) construct new measurement instruments for research, and
  • to (d) design intervention programs (Boekaerts, M. personal communication to author 08/06/2014).
Figure 5

FIGURE 5. Six-component model of SRL. Adapted from Boekaerts (1996b).

둘째, Boekaerts의 출판물 대부분은 두 번째 SRL 모델, 즉 [적응형 학습 모델]을 공식화하기 위해 설정되었다. 이 모델(그림 6 참조)은 90년대 초에 제시되었습니다. SRL의 역동적 측면을 설명하고, 나중에 [듀얼 프로세싱 자기조절 모델]로 발전했습니다(그림 7). 적응학습모형은 동기부여, 감정, 메타인지, 자기개념, 학습 등 다양한 심리적 틀에서 도출된 결과를 이해하기 위한 이론적 발판을 제공했다. 모델은 두 가지 [병렬 처리 모드]를 설명했습니다.

Second, most of Boekaerts’ publications were set up to formulate a second SRL model, namely, the Adaptable Learning Model. This model (see Figure 6) was presented at the beginning of the 90s (Boekaerts, 1991, 1992). It describes the dynamic aspects of SRL, and later, evolved into the Dual Processing self-regulation model (Figure 7). The Adaptable Learning Model offered a theoretical scaffold for understanding the findings from diverse psychological frameworks, including motivation, emotion, metacognition, self-concept, and learning. The model described two parallel processing modes:

  • (a) 숙달 또는 학습 모드 및
  • (b) 대처 또는 웰빙 모드
  • (a) a mastery or learning mode and
  • (b) a coping or well-being mode.

2000년 자기조절 핸드북의 한 장에서 Boekaerts와 Niemivirta(2000)는 학생들의 행동에 어떤 영향을 미치는지 시각화하기 위해 서로 다른 수치를 사용하여 목표 경로에 대한 새로운 아이디어를 제시했다. 비록 2000년에 보에카어츠는 이미 하향식 이론과 상향식 이론의 비전에 대한 몇 가지 개념을 제시했지만, 2000년 중반이 되어서야 이러한 이론적 통찰이 그녀의 모델에서 명확하게 정의되었다. 2011년 SR의 SRL 핸드북에서 Boekaerts는 [학습 과정 중 자율 규제의 다양한 목적을 지적한 이 모델의 확장 버전]을 제시했다.
In a chapter of the 2000 Handbook of self-regulation, Boekaerts and Niemivirta (2000) presented new ideas on goal paths using different figures to visualize how they influence students’ behavior (see pp. 434–435). Although, in 2000, Boekaerts had already presented some notions on her vision of top–down and bottom–up theory, it was not until mid-2000 that these theoretical insights were clearly defined in her model, which was then renamed as the Dual Processing self-regulation model (Boekaerts and Corno, 2005; Boekaerts and Cascallar, 2006). In the 2011 SRL handbook of SR, Boekaerts presented an extended version of this model, which pointed to the different purposes of self-regulation during the learning process, namely,

  • (1) 지식과 기술을 넓히는 것,
  • (2) 학습 활동에 대한 자신의 헌신을 보호하는 것, 그리고
  • (3) 자신에 대한 위협과 해를 예방하는 것.
  • (1) expanding one’s knowledge and skills,
  • (2) protecting one’s commitment to the learning activity, and
  • (3) preventing threat and harm to the self.

Boekaerts는 SRL에서 긍정적인 감정과 부정적인 감정이 수행하는 주요 역할을 강조하며, 두 가지 서로 다른 상향식 전략, 즉 [의지적 전략]과 [감정 조절 전략]을 기술하였다(그림 7; Boekaerts, 2011).
Boekaerts emphasized the key role that positive and negative emotions play in SRL, and described two different bottom–up strategies, namely, volitional strategies and emotion regulation strategies (Figure 7; Boekaerts, 2011).

Figure 6

FIGURE 6. Model of adaptable learning. Extracted from the 2000 handbook but cited there as: the original model of adaptable learning. Adapted from Boekaerts (1996a).

Figure 7

FIGURE 7. Dual processing self-regulation model. Adapted from Boekaerts (2011).

Boekaerts의 듀얼 프로세싱 모델
Boekaerts’ Dual Processing Model

[이중 처리 모델](Boekaerts and Cascalar, 2006)에서, 학생들이 어떤 목표 경로를 활성화시킬지 결정하는 데 있어 학생들의 [평가appraisals]가 중요하다. 여기서 목표는 행동을 이끄는 "지식 구조"로 간주된다.

  • 예를 들어, 만약 학생들이 그 과제가 그들의 행복에 위협적일 수 있다는 것을 인식한다면, 부정적인 인식과 감정이 촉발된다. 그런 다음 자아를 손상으로부터 보호하기 위한 전략이 지시되고, 이에 따라 학생들은 웰빙의 길로 나아간다.
  • 반면에, 과제가 학생들의 목표와 요구에 부합한다면, 그들은 그들의 역량을 증폭시키고 긍정적인 인식과 감정을 유발하며, 이에 따라 숙달/성장의 길로 나아가는 것에 관심을 가질 것이다.

Boekaerts(2011)는 또한 [숙달/성장 경로]에서 과제를 시작한 학생들이 성공하지 못할 수 있다는 단서를 발견하면, [웰빙 경로]로 이동할 수 있다고 설명한다.
In the Dual Processing model (Boekaerts and Cascallar, 2006), the appraisals made by the students are crucial to determine which goal pathway the students will activate. Here, goals are viewed as the “knowledge structures” that guide behavior.

  • For example, if students perceive that the task could be threatening to their well-being, negative cognitions and emotions are triggered. Strategies are then directed to protect the ego from damage, and thereby, students move onto a well-being pathway.
  • On the other hand, if the task is congruent with the students’ goals and needs, they will be interested in amplifying their competence, triggering positive cognitions and emotions, and thereby, moving onto the mastery/growth pathway.

 Boekaerts (2011) also explains that students who have started a task in the mastery/growth pathway may move to the well-being pathway if they detect cues that they might not be successful.

Boekaerts (2011)에 따르면, 자기조절의 목적은 세 가지가 있다.
According to Boekaerts (2011), there are three different purposes for self-regulation:

(a) 지식 및 기술 확장…
(b) 자신의 행복이 합리적인 범위 내에서 유지되도록 자신에 대한 위협과 자원 손실을 방지한다.
(c) 웰빙 경로에서 마스터 경로로 주의를 재루팅하는 활동을 사용하여 자신의 헌신을 보호합니다.

(a) expanding knowledge and skills…
(b) preventing threat to the self and loss of resources so that one’s well-being is kept within reasonable bounds…and
(c) protecting one’s commitments by using activities that re-route attention from the well-being pathway to the mastery pathway (pp. 410–411).

 

  • 첫 번째 목적은 그녀가 "톱 다운"이라고 부른 것인데, 과제 목표의 추구는 학생들의 가치, 요구, 그리고 개인적인 목표(마스터리/성장 경로)에 의해 추진되기 때문이다.
  • 두 번째 목적은 "바텀 업"이라고 불리는데, 그 전략은 자아가 손상되는 것을 막기 위해 노력하고, 학생들은 과제 목표와 개인적인 목표 사이에 불일치를 경험할 수 있다.
  • 세 번째 목적은 학생들이 자신의 전략을 웰빙에서 숙달/성장 경로로 전환하려고 할 때 발생하는데, 이는 외부(예: 교사 또는 동료의 압력) 또는 내부(예: 자기결정적 생각)의 힘을 통해 발생할 수 있다.
  • The first is what she called “top–down,” as the pursuit of task goals is driven by the students’ values, needs and personal goals (mastery/growth pathway).
  • The second purpose is called “bottom–up,” as the strategies try to prevent the self from being damaged (well-being pathway), and students may experience a mismatch between the task goals and their personal goals.
  • The third purpose occurs when students try to redirect their strategies from the well-being to the mastery/growth pathway, which may happen via external (e.g., teacher or peer pressure) or internal (e.g., self-consequating thoughts) forces.

따라서 학생들이 [부정적인 감정을 경험할 때, 웰빙 경로를 활성화하고, 상향식 전략을 사용]하기 때문에 보에카르트 모형에서 감정은 필수적이다. 이러한 관심에 따라, Boekaerts는 다양한 감정 조절 전략을 심층적으로 연구했다.
Therefore, emotions are essential in Boekaerts’ model, because when students experience negative emotions, they will activate the well-being pathway and use bottom–up strategies. Pursuant to this interest, Boekaerts has studied, in depth, the different emotion regulation strategies (see Boekaerts, 2011).

이중 처리 모델을 뒷받침하는 경험적 증거
Empirical Evidence Supporting the Dual Processing Model

대부분의 경험적 지원은 Boekaerts와 그녀의 박사과정 학생들이 온라인 동기 설문지(OMQ)와 기타 구체적인 조치를 사용하여 제공했습니다. 적응형 학습 모델에 대한 그들의 연구는 그림 7의 모델의 위쪽 절반에 집중되었다. 다른 측정 도구를 사용하여 네 가지 주요 연구 영역을 식별할 수 있습니다.
Most of the empirical support was provided by Boekaerts and her Ph.D. students using the On-line Motivation Questionnaire (OMQ) – next section for more information- and other specific measures. Their work on the Model of Adaptable Learning concentrated on the top half of the model in Figure 7. Four main areas of research can be identified using different measurement tools.

  • 첫째, 시거와 보에카르트(Seegers)는 인지적 평가의 다양한 측면과 그들이 전향적, 예상적 긍정 및 부정적 감정과 학습 의도를 어떻게 결정하는지 연구하였다. 그들은 활성화된 평가의 유형에서 성별 차이를 발견했다. 또 다른 논문에서 Boekaerts(1999)는 학습 활동에 대한 학생들의 해석에 대한 이러한 과제별 지표가 능력에 대한 자기개념, 숙달 및 수행 목표의 활성화, 영역에 대한 관심과 같은 영역 척도보다 학습의도의 차이를 더 많이 설명한다는 것을 입증했다.
  • First, Seegers and Boekaerts (19931996) studied different aspects of cognitive appraisals and how they determine prospective, anticipatory positive and negative emotions and learning intentions; they found gender differences in the types of appraisals activated. In another publication, Boekaerts (1999) demonstrated that these task specific indices of the students’ interpretations of the learning activity explain more of the variance in learning intention than domain measures, such as self-concept of ability, activation of mastery and performance goals, and interest in the domain.
  • 둘째, OMQ를 이용하여 학습의도에 대한 전향적 인식과 감정의 영향을 연구하였다. 확인 요인 분석 결과, 시험된 모형의 내부 구조는 학문적 과제에 대해 불변성이었고 또한 반년 동안 안정적인 것으로 보였기 때문에, 8개의 전제 요인 중 7개가 경험적으로 구별될 수 있었다.
  • Second, the effect of prospective cognitions and emotions on learning intention was also studied using the OMQ (Boekaerts et al., 1998Crombach et al., 2003); a confirmatory factor analysis revealed that seven of the eight presupposed factors could be distinguished empirically, as the internal structure of the tested model was invariant over the academic tasks and also seemed stable over a half-year period.
  • 셋째, 잠재인식과 감정의 성별 차이를 OMQ와 40초마다 단어 문제를 수행하면서 학생들의 자신감 감정을 측정하는 신뢰와 의심 척도를 이용하여 연구하였다. 남학생과 여학생은 수학 문제, 특히 단어 문제에 다르게 참여하는 것으로 밝혀졌다. 남학생들은 여학생들보다 더 높은 자신감, 더 많은 일을 좋아하고, 더 긍정적인 감정과 더 많은 노력을 투자하려는 의지를 표현했다. 신뢰와 의심 척도를 사용한 Vermeer 외 연구진(2001)은 여학생들이 기본적으로 수학 문제를 푸는 것을 수학적 규칙을 적용하는 것으로 본다는 결론을 도출했다.
  • Third, gender differences in prospective cognitions and emotions were studied using the OMQ and the Confidence and Doubt scale -which measures students’ feelings of confidence every 40 s while they are performing word problems-, (Boekaerts, 1994Boekaerts et al., 1995Vermeer et al., 2001). It was found that boys and girls attend differently to math problems, especially word problems. Boys expressed higher confidence, more liking for the tasks, more positive emotions and more willingness to invest effort than girls. Vermeer et al. (2001) using the Confidence and Doubt scale, led to the conclusion that girls view solving math problems basically as applying mathematical rules.
  • 넷째, 메타인지적 지식을 쌓고 심층처리를 사용할 수 있는 기회를 창출하는 데 중점을 둔 네덜란드 중등직업학교에 대한 여러 개입이 수행되었다. 이 개입은 연구 초기에 이미 심층 처리 전략에 익숙하고 사용된 학생들에게 가장 잘 효과가 있는 것으로 나타났다.
  • Fourth, several interventions in Dutch secondary vocational schools were conducted that focused on building up metacognitive knowledge and creating opportunities to use deep-level processing (Rozendaal et al., 2003Boekaerts and Rozendaal, 2006). It was found that the intervention worked best for students who were already familiar with (and used) deep-level processing strategies at the beginning of the study.

Boekaerts는 또한 듀얼 프로세싱 모델과 학생들의 결과 평가, 과제 후 보고된 노력 및 특성(모델의 하단 부분)을 결정하는 요인에 대한 연구를 수행했습니다. 여기에는 두 가지 주요 연구 라인이 있습니다.

  • 첫째, Boekaerts(2007)는 구조방정식 모형을 사용하여 학생의 결과평가에 대한 역량과 가치평가의 영향을 보다 면밀히 살펴보고 보고하였으며, 과제 중 긍정정서와 부정정서가 이러한 결과변수에 미치는 영향을 탐색하였다. 그녀는 수학 숙제를 한 후 노력을 기울였다고 보고한 학생들이 처음에는 숙제를 할 수 있는 능력이 있다고 보고했고, 이것은 그 과제 동안 긍정적인 감정을 낳았다는 것을 발견했다. 처음에 작업을 평가하면 보고된 작업도 상당히 증가했습니다. 추가연구에서 숙제를 한 후 결과평가는 역량과 가치평가 모두에 긍정적인 영향을 미치는 것으로 나타났다.
  • 두 번째 작업 라인은 Neural Network Methodology(동물의 중추신경계, 보다 구체적으로 생물학적 신경망에서 영감을 받은 통계적 학습 모델 계열)를 사용하여 학생들의 작문 수행 품질(저조/중조/고성능 그룹)을 특성에 기초하여 예측할 수 있는지 여부를 조사하였다. (OMQ를 기반으로 특별히 설계된 소프트웨어 프로그램으로 측정) SR 시스템의. 신경망은 56개의 예측 변수를 기반으로 어떤 학생이 저학력, 중학력, 고학력 그룹에 속할지를 높은 정확도(범위 94와 100%)로 예측할 수 있는 것으로 나타났다.

Boekaerts has also conducted research on the Dual Processing model and the factors that determine students’ outcome assessments, their reported effort after a task, and their attributions (bottom part of the model). There are two main lines of research here.

  • First, using structural equation models, Boekaerts (2007) looked more closely at the effect of competence and value appraisals on the students’ outcome assessments and reported effort; she also explored the influence that positive and negative emotions during a task have on these outcome variables. She found that students who reported that they had invested effort after doing their mathematics homework, had initially reported that they were competent to do their homework tasks, which produced positive emotions during the task. Valuing a task initially also substantially increased the reported effort. In further research (Boekaerts et al., 2003Boekaerts, 2007), it was found that outcome assessments after doing homework were positively influenced by both competence and value appraisals.
  • The second line of work, using Neural Network Methodology (family of statistical learning models inspired by the central nervous systems of animals, more specifically biological neural networks) it was examined whether the quality of students’ writing performance (poor/mid/high performance group) could be predicted on the basis of characteristics of the SR system (measured with a specially designed software program based on the OMQ) (Cascallar et al., 2006Boekaerts and Rozendaal, 2007). It was found that neural networks could predict with high accuracy (ranging 94 and 100%) which students would be in the poor, mid, or high performance groups, based on 56 predictors.

기기 및 측정 방법
Instruments and Measurement Methods

Boekaerts는 SRL의 측정에 대한 여러 성찰문(가장 잘 알려진 Boekaerts and Corno, 2005)을 작성했으며, 네 가지 도구와 평가 방법의 작성에 참여했다.
Boekaerts has written a number of reflection papers about the measurement of SRL (the most known Boekaerts and Corno, 2005), and has participated in the creation of four instruments and assessment methods.

  • 먼저, 그녀는 "구체적인 상황에서 학습하는 민감성"을 측정하는 OMQ(Boekaerts, 1999)를 개발했다. 두 부분으로 구성되어 있습니다.
    First, she developed the OMQ (Boekaerts, 1999), which measures the “sensitivity to learn in concrete situations.” It is composed of two parts:
    • (a) 학생들은 그들의 감정, 생각, 그리고 그들이 구체적인 과제에 소비하고 싶은 노력을 스스로 보고한다.
    • (b) 과제 후에, 학생들은 그들이 어떻게 느끼는지와 그들의 속성을 보고한다.
    • OMQ를 사용한 그녀의 SRL 모델의 검증은 Boekaerts(2002)에서 확인할 수 있다.
    • (a) students self-report their feelings, thoughts and the effort they want to expend on a concrete task, and
    • (b) after the task, the students report how they feel and their attributions.
    • The validation of her SRL model with the OMQ can be found in Boekaerts (2002).
  • 둘째, 그녀는 인터랙티브 러닝 그룹 시스템(ILGS) 혁신이라고 불리는 SRL 원칙을 기반으로 네덜란드의 중등학교를 위한 교육 설계를 만들었습니다.
  • 셋째, Boekaerts는 앞서 설명한 학생들의 동기부여를 기록하는 도구를 개발했습니다.
  • 넷째, 그녀는 그러한 모델에서 높은 예측력을 찾기 위해 SRL을 위한 신경망의 구현에서 다른 학자들과 협력했다.
  • Second, she created an instructional design for secondary vocational schools in the Netherlands based on SRL principles that was called the Interactive Learning Group System (ILGS) innovation (Boekaerts, 1997Boekaerts and Minnaert, 2003).
  • Third, Boekaerts developed an instrument to record student motivation: the Confidence and Doubt Scale (Vermeer et al., 2001) – explained earlier.
  • And, fourth, she has collaborated with other scholars in the implementation of neural networks for SRL finding high predictive power in such models (e.g., Cascallar et al., 2006).

Winne과 Hadwin: 메타인지적 관점에서 SRL 탐색
Winne and Hadwin: Exploring SRL from a Metacognitive Perspective

Winne과 Hadwin의 SRL 모델은, SRL의 목표 주도 특성과 동기 부여에 대한 자기 규제 행동의 영향을 주장하면서, 자기 조절 학생이란, 주로 [(메타) 인지 전략을 사용하는 모니터링을 통하여, 자신의 학습을 능동적으로 관리하는 강한 메타인지 관점을 가진 사람]으로 인식하였다. 특히 컴퓨터 지원 학습 설정을 구현하는 연구에서 널리 사용되는 모델이다(Panadero et al., 2015b).
Winne and Hadwin’s model of SRL has a strong metacognitive perspective that recognizes self-regulated students as active and managing their own learning via monitoring and the use of, mainly, (meta)cognitive strategies (Winne, 1995, 1996, 1997; Winne and Hadwin, 1998) while asserting the goal driven nature of SRL and the effects of self-regulatory actions on motivation (Winne and Hadwin, 2008). It has been a widely used model, especially in research implementing computer supported learning settings (Panadero et al., 2015b).

모델의 역사와 개발
History and Development of the Model

Winne과 Hadwin의 모델은 정보처리이론의 영향을 강하게 받아 Efklides를 제외한 다른 SRL 모델보다 SRL의 [인지적 측면과 메타인지적 측면]을 더 자세히 탐구한다.

  • 필 윈의 초기 아이디어 중 일부는 SRL을 정보 처리와 정보 처리의 융합으로 개념화한 것으로 거슬러 올라갈 수 있으며, 버틀러와 윈은 피드백과 SRL에 대한 이론적 검토에서 내부 피드백의 개념이 주요 역할을 하며 모델의 첫 버전이 제시되었다. (버틀러와 윈의 그림 1, 1995).
  • 또한, 그들은 목표가 취할 수 있는 다양한 프로파일과 목표 목표와 현재 작업 모니터링 상태 사이의 불일치를 탐구하는 두 번째 그림을 제시하였다(Butler and Winne의 그림 2, 1995).

Winne and Hadwin’s model is strongly influenced by the Information Processing Theory (Winne, 2001; Greene and Azevedo, 2007), exploring the cognitive and metacognitive aspects of SRL in more detail than the other SRL models with the exception of Efklides’.

  • Some of Phil Winne earliest ideas that led to the model can be traced to his conceptualization of SRL as a fusion of information processing and information processed (Winne, 1995) and Butler and Winne (1995) in their theoretical review of feedback and SRL, in which the concept of internal feedback had a major role and the first version of the model was presented (Figure 1 in Butler and Winne, 1995).
  • Additionally, they presented a second figure in which they explored the different profiles a goal can take and the discrepancy between the goal aims and the current state of work monitoring (Figure 2 in Butler and Winne, 1995).

 

  • 1996년 Winne은 SRL의 차이를 설명하는 메타인지적 측면에 대한 반영과 함께 방금 언급한 두 수치가 하나로 융합된 자신의 모델의 업데이트된 버전(그림 8)을 제시했다.
  • 1997년에 그는 COPES 대본 아이디어를 제시했다.
  • 마침내 1998년에 COPES에 대한 더 자세한 내용과 더 명확한 프레젠테이션을 포함한 그의 모델의 새로운 버전이 출시되었다(그림 9).
  • In 1996, Winne presented an updated version of his model (Figure 8) in which the two just mentioned figures were fused into one, along with a reflection about the metacognitive aspects that explains the differences in SRL (Winne, 1996).
  • In 1997, he presented the COPES script ideas -see next section- (Winne, 1997).
  • Finally, in 1998, a new version of his model was released (Figure 9) including more details and a clearer presentation of COPES (Winne and Hadwin, 1998).

모델을 참조할 때 인용되는 것은 일반적으로 후자의 작업이다: Winne의 모델 대신 Winne과 Hadwin. 이 교호는 현재 SRL 커뮤니티와의 일관성을 유지하기 위해 이 검토에서도 사용되지만, 모델이 이전 연구에서 처음 제시되었다는 것을 명심하는 것이 중요하다(Winne, 1996, 1997). 또한, 이 두 저자는 일상적으로 협력하면서 2011년 SRL 핸드북의 다른 장에서 알 수 있듯이 SRL 연구 내에서 다른 경로를 따라왔다. Winne은 자신의 gStudy 및 nStudy(Winne et al., 2010)와 같은 모델의 인지적 측면을 계속 검토해왔다. 또한, 그는 프로세스를 보여주는 figure는 그대로이지만, 모델에 대한 사소한 개선 작업을 수행했습니다. Hadwin은 모델의 경험적 증거에서 협업을 계속하는 동안 협업 학습 환경에서 상황, 상황 및 동기 SRL 측면에 추가로 초점을 맞추었다. 이 작업 라인은 Järvelä 및 Miller와 협력하여 사회적 공유 규제 학습(SSRL) 모델을 제작했다. 이 섹션에서는 Hadwin의 작품이 자체 섹션을 가질 것이기 때문에 Winne의 작품에 대해 더 자세히 살펴볼 것이다.
It is usually the latter work that is cited when the model is referenced: Winne and Hadwin instead of Winne’s model. That denomination is also used in this review for now onward to keep the consistency with the SRL community, but it is important to keep in mind that the model was firstly presented in previous work (Winne, 1996, 1997). Additionally, these two authors, while collaborating in usual basis, have followed different paths within SRL research as signaled by different chapters in the 2011 SRL handbook (Hadwin et al., 2011; Winne, 2011). Winne has continue examining (meta)cognitive aspects of the model, such as his work on gStudy and nStudy (Winne et al., 2010). Furthermore, he performed minor enhancements to the model although the figure that illustrates the process remains the same (Winne, 2011). Hadwin, while continuing collaborating in the empirical evidence of the model (Winne et al., 2010; Winne and Hadwin, 2013) has additionally focused on the situational, contextual and motivational SRL aspects in collaborative learning settings. This line of work has produced the model of Socially Shared Regulated Learning (SSRL) in collaboration with Järvelä and Miller (see Hadwin, Järvelä, and Miller: SRL in the Context of Collaborative Learning). This present section will explore in more detail the work by Winne as the one by Hadwin will have its own section.

Figure 8

FIGURE 8. First version of Winne’s SRL model. Adapted from Winne (1996).

Figure 9

FIGURE 9. Current version of Winne’s SRL model. Adapted from Winne and Hadwin (1998).

윈과 해드윈의 SRL 모델
Winne and Hadwin’s Model of SRL

윈과 해드윈의 모드에 따르면, 학습은 개방적이고 재귀적이며 피드백 루프에서 이해되는 4개의 연결된 단계에서 SRL에 의해 작동된다. 다음 4단계는 다음과 같습니다(그림 9).
According to Winne and Hadwin’s model (e.g., Winne, 2011), studying is powered by SRL across four linked phases that are open and recursive and are comprehended in a feedback loop. These four phases are (Figure 9):

  • (a) 과제 정의: 학생은 수행할 과제에 대한 이해를 구한다.
  • (b) 목표 설정 및 계획: 학생들은 목표를 달성하기 위한 목표와 계획을 생성합니다.
  • (c) 학습 전술 및 전략 실행: 이러한 목표에 도달하는 데 필요한 조치의 사용.
  • (d) 메타인지적으로 적응하는 공부: 주요 과정이 완료되고 학생이 미래에 대한 동기, 신념 및 전략에 장기적인 변화를 만들기로 결정한 후에 발생합니다.
  • (a) task definition: the students generate an understanding of the task to be performed;
  • (b) goal setting and planning: the students generate goals and a plan to achieve them;
  • (c) enacting study tactics and strategies: the use of the actions needed to reach those goals; and
  • (d) metacognitively adapting studying: occurs once the main processes are completed and the student decides to make long-term changes in her motivations, beliefs and strategies for the future.


Winne은 특히 실수가 발생한 이후의 단계에서 실수가 감지될 수 있다고 강조한다.
Winne especially emphasizes that mistakes can be detected in a posterior phase to the one in which they occurred.

또한 SRL은 앞서 언급한 4단계로 수행될 수 있는 5가지 작업 측면을 구현합니다. 이러한 다섯 가지 측면은 Winne(1997)에서 처음으로 사용된 COPES 약어(즉, Carla COPES와 산술 워크시트를 함께 사용)를 사용하여 식별된다. 의 약자이다

Additionally, SRL deploys five different facets of tasks that can take place in the four phases just mentioned (Winne and Hadwin, 1998). These five facets are identified using the COPES acronym, that was used for the first time in Winne (1997) -i.e., Carla COPES with an arithmetic worksheet- (p. 399). It stands for

  • (a) 조건: 개인이 사용할 수 있는 자원과 작업 또는 환경에 내재된 제약(예: 상황, 시간)
  • (b) 운영: 학생이 SMART(검색, 모니터링, 조립, 리허설 및 번역)라고 하는 인지 프로세스, 전술 및 전략(예: 과제 수행 방법 계획)
  • (c) 제품: 운영으로 생성된 정보(예: 새로운 지식);
  • (d) 평가: 학생이 내부적으로 생성하거나 외부 출처에서 제공하는 제품과 표준 간의 적합성에 대한 피드백(예: 교사 또는 동료 피드백)
  • (e) 표준: 제품을 모니터링하는 기준(Winne and Hadwin, 1998; Greene and Azevedo, 2007) (예: 평가 기준)
  • (a) Conditions: resources available to a person and the constrains inherent to a task or environment (e.g., context, time);
  • (b) Operations: the cognitive processes, tactics and strategies used by the student that are referred to as SMART -Searching, Monitoring, Assembling, Rehearsing and Translating- (Winne, 2001) (e.g., planning how to perform a task);
  • (c) Products: the information created by operations (e.g., new knowledge);
  • (d) Evaluations: feedback about the fit between products and standards that are either generated internally by the student or provided by external sources (e.g., teacher or peer feedback); and
  • (e) Standards: criteria against which products are monitored (definitions taken from Winne and Hadwin, 1998Greene and Azevedo, 2007) (e.g., assessment criteria).

또한 Winne(2011) 모델은 과제를 계획, 수행 및 평가하는 동안 학생들의 인지적 처리가 어떻게 작동하는지 자세히 설명한다. 중요한 측면은 자체 평가 연구와 일치하는 측면을 설정, 모니터링 및 평가하기 위해 기준과 표준을 사용하는 것이다. 이 모델은 학생들이 표준과 비교하여 활동을 지속적으로 모니터링하고 과제를 수행하기 위해 전술을 사용하는 방법을 설명합니다. 한 가지 두드러진 특징은, model figure에는 감정에 대한 언급이 없고 동기 부여에 대한 암시만 있다는 것이다. 그럼에도 불구하고 Winne과 Hadwin은 SRL이 본질적으로 목표 지향적이며 Pintrich(2003)와 Wolters(2003)의 동기 조절에 대한 연구와 자신의 모델 간의 연결을 구축했다는 데 동의한다(Winne and Hadwin, 2008).
Furthermore, Winne (2011) model explains in detail how students’ cognitive processing operates while planning, performing and evaluating a task. A crucial aspect is the use of criteria and standards to set goals, monitor and evaluate, aspects which are aligned with self-assessment research (Andrade, 2010; Panadero and Alonso-Tapia, 2013). The model describes how students constantly monitor their activities against standards and use tactics to perform tasks (Winne and Hadwin, 1998). One salient feature is that, in the model figure there is no reference to emotions, and there is only an allusion to motivation. Regardless of this Winne and Hadwin also agrees that SRL is goal-driven in nature and has built connections between his model and research by Pintrich (2003) and Wolters (2003) on regulation of motivation (Winne and Hadwin, 2008).

Winne과 Hadwin의 SRL 모델을 뒷받침하는 경험적 증거
Empirical Evidence Supporting Winne and Hadwin’s SRL Model

그린과 아제베도(2007)는 모델에 대한 경험적 증거를 검토했다. 이론적 검토로 제시했지만, '경험적 문헌에 대한 포괄적인 검토'를 수행하지 않았기 때문에 모델에 대한 실증적 지원을 제공하는 설득력 있는 연구(113)를 검토하였다. 검토는 모델에서 고려된 모든 측면을 다루었고 연구의 초기 범위를 벗어났을 수 있는 추론을 했다(예: 원래 모델에서 명시적으로 언급되지 않은 감정에 대한 섹션을 포함). 결론에서, 그들은 모델의 미래 연구 가능성을 언급하고 추가적인 설명이 필요한 네 가지 과제를 지적했다.

Greene and Azevedo (2007) reviewed the empirical evidence for the model. Although they presented it as a theoretical review, due to the fact that they did not perform a “comprehensive review of the empirical literature” (p. 338), they reviewed a compelling number of studies (113) that provide empirical support for the model. The review covered all the aspects considered in the model, and made inferences that may have been beyond the initial scope of the work (e.g., they included a section for emotion, which is not explicitly mentioned in the original model). In their conclusions, they stated the model’s potential for future research and pointed out four challenges that needed additional clarification.

  • 첫째, 4단계 및 외부 평가, 특히 학생들의 SRL의 장기적인 변화와 4단계 작동 방식에 대한 더 많은 세부 사항(예: SRL 활동의 산물로서의 조건 역할 설명)을 명확히 한다.
  • 둘째, 그들은 Wonne과 Hadwin의 모델이 연결 구축을 위한 참고 자료로 Wolters(2003)를 사용하여 동기부여의 규정을 통합할 것을 요구했다.
  • 셋째, Greene과 Azevedo는 SRL 기술이 평생 동안 어떻게 발전하는지에 대한 토론을 권고했다.
  • 그리고 넷째, 학생 특성(예: 학습장애)이 SRL에 어떤 영향을 미칠 수 있는지 고려하기 위해 전화를 걸었다.
  • First, phase four and external evaluations, especially clarifying long-term changes in the students’ SRL and more details on how phase four works (e.g., describing the role of conditions as products of the SRL activity).
  • Second, they made a call for Winne and Hadwin’s model to incorporate the regulation of motivation, using Wolters (2003) as a reference to build the connection.
  • Third, Greene and Azevedo recommended a discussion of how SRL skills develop over the life span.
  • And, fourth, they made a call to consider how student characteristics (e.g., learning disabilities) might impact SRL.

이후 몇 년간 윈 교수팀은 학생들의 SRL을 측정하면서 동시에 발판을 만드는 컴퓨터로 연구를 바탕으로 모델에 대한 확실한 경험적 증거를 수집할 수 있는 기반을 구축해 왔다. 이러한 내용은 다음 절에서 설명합니다. 또한 Winne은 데이터 마이닝 및 학습 분석과 SRL에 대한 적용 가능성을 모색하고 있습니다.
In the later years, Winne and his team have been building a basis for gathering solid empirical evidence on the model based on the work with computers that scaffold students’ SRL while measuring it at the same time (Panadero et al., 2015b). These will be described in the next section. Additionally, Winne has also been exploring the potential of data mining and learning analytics and their application to SRL (e.g., Winne and Baker, 2013).

기기 및 측정 방법
Instruments and Measurement Methods

Winne과 Hadwin의 모델을 기반으로 한 고전적인 측정 기구는 구축되지 않았지만, 모델을 이론적 프레임워크로 사용하여 SRL의 흔적을 측정하는 비계 도구들이 많이 있다. 그들은 추적 및 로그 데이터를 위해 학생들의 활동을 기록하는 동안 SRL의 사용이 발판화되는 컴퓨터 지원 학습 환경인 nStudy와 gStudy를 개발했다. 또한 Winne의 이전 작업을 통해 SRL 연구에 가져온 추적 데이터는 SRL의 시간적 및 순차적 분석에 대한 새로운 기회를 열어주었으며, 이는 해당 분야에 대한 유망한 새로운 통찰력을 보여주고 있다. 또한 Winne은 SRL 측정에 대한 중요한 성찰문을 썼다.

  • Winne과 Perry(2000)에서는 "즉시" 또는 "온라인" SRL 측정의 중요성을 강조하고 SRL 측정에 대한 새로운 접근 방식을 열었다.
  • Winne et al(2011)에서는 추적 데이터를 사용한 SRL 방법을 검토하였다.

No classical measurement instruments have been constructed based on Winne and Hadwin’s model, but there are a number of scaffolding tools that measure traces of SRL using the model as theoretical framework (e.g., Winne et al., 2010). They have developed nStudy and gStudy, which are computer-supported learning environments in which the use of SRL is scaffolded while students’ activities are recorded for trace and log data (Winne et al., 2010; Winne and Hadwin, 2013). Additionally, trace data which was brought to SRL research via Winne’s earlier work (Winne, 1982; Winne and Perry, 2000) has opened up new opportunities for the temporal and sequential analysis of SRL which is showing promising new insights for the field (Azevedo et al., 2010; Malmberg et al., 2013). Furthermore, Winne has written important reflection papers on SRL measurement, especially

Pintrich:SRL에서 동기 부여의 역할을 강조하고 분야의 토대를 구축함
Pintrich: Grounding the Field and Emphasizing the Role of Motivation in SRL

Pintrich의 연구는 SRL 개념 프레임워크를 명확히 하는 데 큰 기여를 했고, SRL과 동기 부여의 관계에 대한 중요한 경험적 연구를 수행했으며, 그의 설문지 MSLQ-가 계속해서 널리 사용되고 있기 때문에 현장에서 계속 중요하다.
Pintrich’s work continues to be important in the field as he made a major contribution toward clarifying the SRL conceptual framework (e.g., Pintrich and de Groot, 1990), he conducted crucial empirical work on the relationship of SRL and motivation (Pintrich et al., 1993a), and his questionnaire -MSLQ- (Pintrich et al., 1993b) continues to be widely used (Schunk, 2005; Moos and Ringdal, 2012).

역사와 모델 개발.
History and Development of the Model

Pintrich는 SRL과 동기부여의 관계를 경험적으로, 이론적으로, 그리고 동기부여와 인지 사이의 연관성 부족을 최초로 분석한 사람 중 하나이다(Pintrich, 2000). 또한 이후 메타인지와 자율규제의 차이를 강조하고 명확히 했으며 SRL의 추가 탐구가 필요한 영역을 지적했다. 모델 자체의 관점에서, SRL의 첫 번째 핸드북에 제시된 것 중 하나의 버전만 있다.
Pintrich was one of the first to analyze the relationship between SRL and motivation empirically (Pintrich and de Groot, 1990), theoretically (Pintrich, 2000), and the lack of connections between motivation and cognition (Pintrich et al., 1993a). Further, he later emphasized and clarified the differences between metacognition and self-regulation (Pintrich et al., 2000) and pointed out the areas of SRL that needed further exploration (Pintrich, 1999). In terms of the model itself, there is only one version of it, the one presented in the first handbook of SRL (Pintrich, 2000).

Pintrich의 Serial통과 번호 모델
Pintrich’s SRL Model

Pintrich(2000년)모델에 따르면, SRL 4단계는 다음과 같다.
According to Pintrich (2000) model, SRL is compounded by four phases:

  • (1)Forethought, 계획 및 활성화;.
  • (2)모니터링;
  • (3)제어;
  • (4)반응과 반영
  • (1) Forethought, planning and activation;
  • (2) Monitoring;
  • (3) Control; and
  • (4) Reaction and reflection.

그들은 각각의 규제를 위한 4개의 다른 지역:인지, motivation/affect, 행동, 컨텍스트다. 단계 지역의 조합은 SRL 프로세스에서 상당한 수의(예:사전 콘텐츠 지식 활성화 효능 판단, 행동의 self-observations)(그림 10)를 포함한 종합 사진을 제공한다. 게다가, Pintrich(2000년)는 어떻게 SRL의 서로 다른 components/areas가 서로 다른 단계에 deploy되는지 아주 상세하게 설명했다. 다음으로 서로 다른 영역이 어떻게 개념화되었는지를 간략하게 설명하겠습니다.

  • 첫 번째 영역인 [인지]의 조절 측면에서 핀트리히는 학습의 판단과 아는 느낌과 같은 메타인지 연구를 통합하였다. 이 통합은 Pintrich's에 대한 인식이 얼마나 중요한지를 강조한다.
  • 두 번째 영역인 [동기 부여와 감정]의 조절에 대해 핀트리히는 자신의 경험적 연구에 기초하여 동기 부여와 영향이 학생들에 의해 조절될 수 있다고 설명했다. 3년 후, Wolters (2003)는 더 많은 경험적 증거를 찾는 작업을 계속했다.
  • 세 번째 영역인 [행동] 조절은 반두라(1977년, 1986년, 1997년)의 연구와 짐머먼(1989년)의 트라이아딕 모델을 기반으로 한다. 이 영역에서 핀트리히는 "자신의 겉으로 보이는 행동을 통제하려는 개인의 시도"를 통합했다. 여기서 분석된 다른 SRL 모델은 그러한 영역을 이해하는 것이 없으므로, 이러한 의미에서 Pintrich의 모델을 독특하게 만든다.
  • 네 번째 영역, 핀트리치가 포함시킨 [맥락] 조절은 학생들이 "학습 맥락을 모니터링, 제어 및 규제"하려는 SRL의 측면을 다루기 때문에 포함된다.

Each of them has four different areas for regulation: cognition, motivation/affect, behavior and context. That combination of phases and areas offers a comprehensive picture that includes a significant number of SRL processes (e.g., prior content knowledge activation, efficacy judgments, self-observations of behavior) (see Figure 10). Furthermore, in that chapter, Pintrich (2000) explained in great detail how the different SRL components/areas for regulation are deployed in the different phases. Next how the different areas were conceptualized will be shortly presented.

  • First, in terms of regulation of cognition, Pintrich incorporated metacognitive research such as judgments of learning and feelings of knowing. This incorporation emphasizes how important is cognition for Pintrich’s.
  • Regarding the second area, regulation of motivation and affect, Pintrich explained that motivation and affect could be regulated by the students based on his own empirical work (Pintrich et al., 1993aPintrich, 2004). Three years later, Wolters (2003) continued this line of work finding more empirical evidence.
  • The third area, regulation of behavior, is based on the work by Bandura (197719861997) and the Triadic model by Zimmerman (1989). In this area Pintrich incorporated the “individual’s attempts to control their own overt behavior” (Pintrich, 2000, p. 466). There is no other SRL model analyzed here that comprehends such area, making Pintrich’s in this sense unique.
  • And, fourth area, the regulation of context which Pintrich included because it addresses those aspects of SRL in which the students attempt to “monitor, control and regulate the (learning) context” (p. 469).
Figure 10

FIGURE 10. Pintrich’s SRL model. Adapted from Pintrich (2000).

Pintrich의 SRL 모델을 뒷받침하는 경험적 증거
Empirical Evidence Supporting Pintrich’s SRL Model

Pintrich의 모델 검증을 직접적으로 다루는 경험적 증거는 없다. 그러나 Pintrich가 SRL 모델을 기반으로 한 초기 경험적 연구인 설문지인 MSLQ의 검증에 대한 경험적 데이터가 있다. 해당 계측기는 다음 섹션에서 분석됩니다. 추가적으로, 그의 기억에 바쳐진 특별호에서, 슝크(2005)는 핀트리치가 SRL 분야에 기여한 6가지 다른 분야를 검토했다.
There is no empirical evidence directly addressing Pintrich’s model validation. However, there is empirical data on the validation of the MSLQ, questionnaire that is the initial empirical work in which Pintrich based his SRL model. That instrument will be analyzed in the next section. Additionally, in a special issue dedicated to his memory, Schunk (2005) reviewed Pintrich’s major contributions to the SRL field identifying six different areas:

  • (a) SRL에 대한 개념적 프레임워크 및 모델(이전 섹션에서 방금 설명됨)
  • (b) 목표 지향에 특별한 초점을 둔 SRL에서 동기 부여의 역할
  • (c) SRL, 동기 부여 및 학습 결과 간의 관계
  • (d) SRL에서 강의실 맥락의 역할 및 동기 부여
  • (e) 경험적 연구를 통한 SRL 개발
  • (f) SRL(MSLQ) 측정기 개발
  • (a) a conceptual framework and model for SRL (just described in the previous section);
  • (b) the role of motivation in SRL with a special focus on goal orientation;
  • (c) the relationship between SRL, motivation and learning outcomes;
  • (d) the role of classroom contexts in SRL and motivation;
  • (e) the development of SRL through empirical studies; and
  • (f) the development of an instrument to measure SRL (MSLQ).

기기 및 측정 방법
Instruments and Measurement Methods

SRL 필드에 대한 주요 기여 중 하나는 MSLQ이다. MSLQ는 15가지 척도로 구성되며 31개 항목이 있는 동기부여 부문과 50개 항목이 있는 학습전략(SRL) 부문으로 구성되며 인지, 메타인지, 자원관리 등 3가지 일반적인 척도로 세분화된다. MSLQ의 장점 중 하나는 학생들의 학습 전략 사용에 대한 자세한 정보를 제공하는 SRL과 동기 부여의 결합이다. 설문지의 두 가지 버전이 대학생과 고등학생을 위해 개발되었다. Duncan과 McKeachi(2005)와 Moos와 Ringdal(2012)에 대한 추가 정보는 MSLQ를 사용한 연구 목록을 제공했다. 보다 최근에는 두 가지 리뷰에서 MSLQ가 SRL 측정과 자기효능감 측정에서 가장 많이 사용되는 도구라는 것을 발견했다. 이것은 SRL에서 핀트리히의 작업이 매우 중요한 영향을 미친다는 것을 강조한다.

One major contribution to the SRL field is the MSLQ (Pintrich et al., 1993b). The MSLQ is composed of 15 scales, divided into a motivation section with 31 items, and a learning strategies (SRL) section with 50 items which are subdivided into three general types of scales: cognitive, metacognitive, and resource management (Duncan and McKeachie, 2005). One of the strengths of the MSLQ is its combination of SRL and motivation, which offers detailed information about students’ learning strategies use. Two versions of the questionnaire have been developed for college (Pintrich et al., 1993b) and high school students (Pintrich and de Groot, 1990). For further information on the instrument Duncan and McKeachie (2005) and Moos and Ringdal (2012) provided a list of studies that have used MSLQ. More recently, two reviews have found that the MSLQ is the most used instrument in SRL measurement (Roth et al., 2016) and in self-efficacy measurement (Honicke and Broadbent, 2016). This emphasizes the highly significant impact of Pintrich’s work in SRL.

에프클라이드: 메타 인식과 SRL 사이의 누락된 부분
Efklides: The Missing Piece between Metacognition and SRL

Efklides(2011) 모델은 메타인지 기반인 Winne과 Hadwin's를 제외하면, 다른 모델보다 메타인지 배경이 강하다. 그러나, Efklides의 모델 동기 및 영향에서 후자와 비교할 때, Efklides의 형상에서 중심적인 역할을 차지한다. 이 모델은 최근 발표되었음에도 불구하고 상당한 횟수로 인용되었다.

Efklides (2011) model has a stronger metacognitive background than the other models, except Winne and Hadwin’s which is also metacognitively based. However, when comparing with the latter in Efklides’ model motivation and affect occupy a central role in Efklides’ figure. The model has been cited a significant number of times despite being recently published.

모델의 역사와 개발
History and Development of the Model

Efklides(2011)는 2011년에 MASRL(Metacognitive and Affective Model of Self-Regulated Learning)을 제시했는데, 이는 이전에 두 개의 이론적 논문에서 발표된 그녀의 아이디어를 확장했다(Efklides, 2006, 2008). 이 모델은 저자가 말한 고전적 사회인지 이론(Bandura, 1986)을 기반으로 한다. Efklides는 던로스키와 메트칼프(2008), 아리엘 외(2009), 코리엇과 누슨(2009)이 만든 메타인지 모델과 함께 기존 SRL 모델의 영향을 받았다. 언급된 메타인지 모델과 Efklides의 차이점은 그녀의 모델이 이론적으로 이전의 SRL 모델(예: 짐머먼의 윈과 해드윈, 핀트리치 모델)을 기반으로 한다는 것이다. 또한, Efklides의 모델은 여기서 분석된 다른 SRL 모델에 추가되어 SRL에 대한 메타인지 모델의 함의를 철저히 보여준다.

Efklides (2011) presented the Metacognitive and Affective Model of Self-Regulated Learning (MASRL) in 2011, which extended her ideas previously published in two theoretical articles (Efklides, 20062008). The model is grounded in classic socio-cognitive theory (Bandura, 1986), as stated by the author herself. Efklides has been influenced by the existing SRL models, along with metacognitive models such as those created by Dunlosky and Metcalfe (2008)Ariel et al. (2009), and Koriat and Nussinson (2009). The distinction of Efklides with the metacognitive models mentioned is that hers is theoretically grounded on previous SRL models (e.g., Zimmerman’s Winne and Hadwin’s, and Pintrich’s). Additionally, Efklides’ model adds to the other SRL models analyzed here, a thorough presentation of the implications of metacognitive models for SRL.

MASRL 모델
MASRL Model

MASRL에는 두 가지 수준이 있습니다(그림 11). 첫째, SRL에 대한 가장 "전통적인" 관점으로 학생의 개인적 특성을 이해하는 사람 수준(매크로 수준이라고도 함)이 있다. Efklides의 말에 따르면, "개인 수준은 SRL 기능의 일반화된 수준을 나타냅니다. 기억 지식, 기술, 동기 및 메타인지 신념에 주로 의존하는 작업을 볼 때 작동하며 영향을 미친다."(Efklides, 2011, 페이지 10). 따라서 다음과 같이 구성된다. 
In the MASRL, there are two levels (Figure 11). First, there is the Person level-also called macrolevel-which is the most “traditional” view of SRL and comprehends the personal characteristics of the student. In Efklides’ own words: “The Person level represents a generalized level of SRL functioning. It is operative when one views a task resorting mainly on memory knowledge, skills, motivational and metacognitive beliefs, and affect” (Efklides, 2011, p. 10). Therefore, it is composed of:

  • (a) 인지,
  • (b) 동기부여,
  • (c) 자기 개념,
  • (d) 감정
  • (e) 의지,
  • (f) 메타인지 지식의 형태로 메타인지
  • (g) 메타인지 기술의 형태의 메타인지
  • (a) cognition,
  • (b) motivation,
  • (c) self-concept,
  • (d) affect,
  • (e) volition,
  • (f) metacognition in the form of metacognitive knowledge, and
  • (g) metacognition in the form of metacognitive skills.

핵심 측면은 Efklides가 이 과제에 대한 학생들의 목표를 중심으로 구성되기 때문에, [Person level][하향식]으로 간주한다는 것입니다. 다시 말해, 학생이 투자할 목표의 추진력이 "인식 처리와 노력의 양을 안내한다"는 결정이며, 이는 "과제의 인식과 요구에 대한 개인의 능력, 직무 영역에서의 자기 개념, 동기 부여 및 영향"에 기초한다.
A key aspect is that Efklides considers the Person level to be top–down because it is structured around students’ goals for the task. In other words, the thrust of the student’s goals “guides cognitive processing and the amount of effort” the student will invest, a decision based “on the interactions of the person’s competences, self-concept in the task domain, motivation, and affect, vis-à-vis the perception of the task and its demands” (Efklides, 2011, p. 12).

Figure 11

FIGURE 11. Metacognitive and affective Model of Self-Regulated Learning model (MASRL). Adapted from Efklides (2011).

두 번째 단계인 [과제 × 개인 수준](마이크로 레벨이라고도 함)은 [과제 유형]과 [학생의 특성(즉, 개인 수준)] 간의 상호 작용이 발생하는 곳이다. 메타인지 활동이 학생의 행동을 통제하기 때문에, 이 수준은 [상향식]입니다. 따라서 활동은 특정 과제의 요구 사항을 해결하는 데 중점을 두는 "데이터 중심"이 됩니다. 쉽게 말해, 학생의 주의력은 [과제를 수행하는 구체적인 메커니즘]으로 이동하고, 일반적인 학습 목표(예를 들어 요약 완료)는 보다 구체적인 목표(예를 들어 철자 오류 확인)에 포함된다. 여기서는 [마이크로 레벨 모니터링]이 주요 프로세스입니다; 동기 부여와 감정 반응은 메타인지 자원의 진화와 개인의 성과에서 오는 피드백에 따라 달라진다. 마지막으로, Efklides는 이 level에서 [네 가지 기본 기능]을 식별합니다.

The second level, the Task × Person level–also known as microlevel–is where the interaction between the type of task and the student’s characteristics –i.e., person level–takes place. This level is bottom–up, as the metacognitive activity takes control of the student’s actions, which causes activity to be “data-driven” with the focus on addressing the demands of the specific task. To put it more simply, the student’s attention moves toward the specific mechanisms of performing the task, and the general learning goal (for example, finishing a summary) is subsumed in a more specific goal (for example, checking for spelling mistakes). Here, the microlevel monitoring is the main process; motivation and affect reactions depend on the evolution of the metacognitive resources and the feedback that comes from the person’s performance – i.e., if s/he is progressing appropriately. Finally, Efklides identifies four basic functions at this level:

  • (a) 인지
  • (b) 메타인지
  • (c) 감정 
  • (d) 감정과 노력의 조절
  • (a) cognition,
  • (b) metacognition,
  • (c) affect, and
  • (d) regulation of affect and effort,

이들은 독립적으로, 수직으로, 또는 통합적으로 수평으로 개념화할 수 있다(그림 11 참조).
which can be conceptualized independently, vertically, or, in an integrative way, horizontally (see Figure 11).

[개인 수준]과 [개인 × 사용자 수준] 간의 이러한 차이는 아마도 MARSL 모델의 가장 두드러진 특징일 것이다.

  • [개인 수준]은 목표 중심적이고, 하향식인 학생들의 SRL의 [일반적 특성 지향성] 특징을 나타낸다. 이 수준에서 MASRL 모델은 짐머먼(2000)과 같은 다른 person-level-oriented models과 유사하다.
  • [과제 × 개인 수준]에서 발생하는 행동은 덜 의식적이고 사람 지향적이다. 과제 수행은 학생의 주의와 처리의 대부분을 차지하며, 행동은 데이터 중심적이고 상향식이어서 Winne(2011)과 유사성을 보인다.

This distinction between the Person level and the Task × Person level is probably the most salient feature of the MARSL model.

  • The Person level represents the general trait-oriented features of students’ SRL, which are goal-driven and top–down. At this level, the MASRL model is similar to other more person-level-oriented models, such as Zimmerman’s (2000).
  • At the Task × Person level, the actions that take place are less conscious and person-oriented: the execution of the task occupies most of the student’s attention and processing, and the actions are data-driven and bottom–up, showing similarities with Winne’s (2011).

요약하면, MASRL 모델은 거시적 수준과 미시적 수준의 상호작용을 통해 메타인지, 동기부여 및 영향 간의 관계를 상세히 설명하고, Boekaerts와 Corno(2005)가 제공한 개념화와는 다른 하향/하향적 의미를 제시한다. 중요한 것은, 이 모델은 또한 모든 인지 자원이 활동을 주도하는 가장 인지 부하가 높은 단계인 과제 실행 동안 학생들이 어떻게 수행하는지 보여준다.
In sum, the MASRL model clarifies, in detail, the relationship among metacognition, motivation, and affect via the interaction of the macro and micro levels, and presents a different conceptualization of the top–down/bottom–up implications from the one provided by Boekaerts and Corno (2005). Importantly, the model also illustrates how students perform during the task execution, the phase with the highest cognitive load where all the cognitive resources are leading the activity.

MASRL 모델을 뒷받침하는 경험적 증거
Empirical Evidence Supporting the MASRL Model

Efklides(2011)는 지난 20년간의 설득력 있는 증거를 검토하여 경험적 지원을 받은 기본 MASRL 기능을 탐구했다. 먼저, 그녀는 경험적 증거가 다루어야 할 모델의 세 가지 기본 원리를 제시했습니다.

Efklides (2011) explored the basic MASRL features that have received empirical support by reviewing a compelling amount of evidence from the last two decades. First, she presented the three basic tenets of the model that the empirical evidence needs to address:

  • (a) MASRL의 두 가지 수준(매크로 및 마이크로 수준), 과제 요구가 두 수준에 미치는 영향 및 이들 간의 상호작용 확인
  • (b) 두 수준에서의 동기 부여 및 영향의 상호 작용
  • (c) 메타인식이 두 수준에서 취하는 다른 형태들
  • (a) identifying the MASRL’s two levels (macro- and microlevel), the effects of the task demands on both levels, and what the interactions among them are;
  • (b) the interaction of motivation and affect in the two levels; and
  • (c) the different forms that metacognition takes at both levels.


그리고 나서 그녀는 메타인지, 동기, 그리고 두 수준에서 영향 사이의 상호작용을 보여주는 연구와 그들의 상호작용이 실제로 모델을 지지한다고 주장했다. 마지막으로, 그녀는 "과제 × 사람 수준에서 인지, 메타인지 및 동기/영향의 관계" 또는 "메타인지 경험에 미치는 영향"과 같은 다양한 섹션으로 분류된 이러한 측면 중 일부를 다루는 많은 연구를 제시했다.
Then she argued that research showing interactions among metacognition, motivation, and affect at the two levels and their interaction actually supports the model. Finally, she presented a large number of studies addressing some of these aspects, grouped in different sections such as “Relations of cognition, metacognition and motivation/affect at the Task × Person level” or “Effects of affect on metacognitive experiences.”

기기 및 측정 방법
Instruments and Measurement Methods

MASRL 모델의 측면을 반영하는 두 가지 계측기가 있습니다.
There are two instruments that reflect aspects of the MASRL model.

  • 먼저 Dermitzaki와 Efklides(2000)는 언어 과제에 대한 자기 개념을 측정하기 위한 설문지를 구성했다. 이 도구는 학생들의 언어 수행 능력을 자기 인식, 자기 효능감, 자존감, 그리고 다른 사람들에 의한 능력에 대한 인식의 네 가지 범주들과 비교합니다. 예를 들어, 이러한 구성 요소의 상호 작용은 MASRL 모델의 핵심 측면이며, 이는 메타 인식을 통해 개인 및 개인 × 작업 수준에서 상호 작용한다.
  • 둘째, Efklides(2002)는 인지적 처리에 대한 판단과 감정을 탐구하는 메타인지 경험 설문지를 만들었다. 본 논문에서는 메타인지 경험과 성과 간의 관계를 살펴보고, 과제 난이도가 메타인지 경험에 미치는 영향을 살펴보았다.
  • First, Dermitzaki and Efklides (2000) constructed a questionnaire to measure self-concept for a language task. This instrument compares students’ language performance against the four reported categories: self-perception, self-efficacy, self-esteem, and perception of their abilities by others. The interaction of these components is a key aspect of the MASRL model as, for example, these interact at both the Person and the Person × Task levels with metacognition.
  • Secondly, Efklides (2002) created the Metacognitive Experiences Questionnaire, which explores judgments and feelings about cognitive processing. In that paper, the relationship between metacognitive experiences and performance was explored, as well as the effect of task difficulty on metacognitive experiences.

Hadwin, Järvelä 및 Miller: 협업 학습의 맥락에서 SRL
Hadwin, Järvelä, and Miller: SRL in the Context of Collaborative Learning

Hadwin 외 연구진과 Järvelä 및 Hadwin은 다른 동료들과 함께 정보통신 기술(ICT) 및 컴퓨터-지원 협업 학습(CSCL) 설정과 같은 학습의 사회적 및 대화형 특징에 대한 규제를 설명하는 데 SRL 이론의 잠재력을 탐구했다. 이러한 특별한 목적을 가진 SRL과 메타인식의 탐구는 비교적 최근의 것으로 2003년이 최초의 경험적 증거가 발표된 해로 확인되었다. 또한, 이 모델은 "모형의 역사와 개발" 섹션에서 언급했듯이 윈과 해드윈의 1998년 모델에 의해 강한 영향을 받았다.

Hadwin et al. (2011in press) and Järvelä and Hadwin (2013), together with other colleagues (for a review, see Panadero and Järvelä, 2015), have explored the potential of SRL theory in explaining regulation in social and interactive features of learning, e.g., use of information and communication technology (ICT) and computer-supported collaborative learning (CSCL) settings. The exploration of SRL and metacognition with this particular purpose is relatively recent, with 2003 identified as the year for the first empirical evidence published (Panadero and Järvelä, 2015). Additionally, the model is strongly influenced by Winne and Hadwin’s (1998) model, as noted in Section “History and Development of the Model.”

모델의 역사와 개발
History and Development of the Model

그들의 전제 중 하나는 학습을 위한 협업과 컴퓨터 지원 협업의 장점에도 불구하고, 협업은 인지적, 동기적, 사회적 및 환경적 과제를 제기한다는 것이다. 효과적으로 협업하기 위해 그룹 구성원은 그룹 작업에 전념하고 공유된 공통점을 확립하며 과제 인식, 전략 및 목표를 협상하고 공유해야 합니다: 즉, 그들은 학습의 조절(SSRL)을 공유할 필요가 있다. SSRL의 핵심 문제는 [개인적 및 사회적 프로세스]를 기반으로 병합하며, [개개인 수준]으로 축소할 수 없다는 것입니다. 이는 SSRL이 발생할 수 있는 기회를 제공하는 상황적 여건을 포함하여 학습 상황에서 사회적 주체의 활동으로 설명된다.
One of their premises is that, despite the advantages of collaboration and computer-supported collaboration for learning (Dillenbourg et al., 1996), collaboration poses cognitive, motivational, social, and environmental challenges (Järvelä et al., 2013; Koivuniemi et al., 2017). To collaborate effectively, group members need to commit themselves to group work, establish a shared common ground, and negotiate and share their task perceptions, strategies, and goals (Hadwin et al., 2010); in other words, they need to share the regulation of their learning (SSRL). The key issue in SSRL is that it builds on and merges individual and social processes, and it is not reducible to an individual level. It is explained by the activity of the social entity in a learning situation (Greeno and van de Sande, 2007), including situational affordances that provide opportunities for SSRL to happen (Volet et al., 2009).

위에서 언급한 바와 같이, SSRL은 최근에 SRL 내에서 개발된 분야이다. 이 때문에, Hadwin, Järvelä 및 Miller에 의해 제안된 모델(이하 SSRL 모델)은 2011년 핸드북의 첫 번째 제안에서 다가오는 SRL 핸드북의 장으로 크게 변경되었다.2 최근에 통합된 두 가지 가장 큰 변화는 저자들이 공동 조절 학습(아래 정의)에 대한 관점을 명확히 하고 COPES의 영향을 모델에 통합하고 명확히 했다는 것이다.
As mentioned above, SSRL is a field recently developed within SRL. Because of this, the model proposed by Hadwin, Järvelä, and Miller (hereinafter referred to as the SSRL model) has changed significantly from their first proposition in the 2011 handbook to the chapter in the forthcoming SRL handbook.2 The two biggest changes incorporated in the latest are: the authors have clarified their perspective on what is Co-regulated Learning (definition below) and they have incorporated and clarified the influence of COPES (Winne, 1997) in their model (Hadwin et al., in press).

모델
The Model

SSRL 모델은 협업 환경에서 자율규제(SRL), 공동조절(CoRL), 공유조절(SSRL)의 세 가지 조절 모드의 존재를 제안했다(그림 12). 
The SSRL model (Hadwin et al., 2011, in press) proposed the existence of three modes of regulation in collaborative settings: self-regulation (SRL), co-regulation (CoRL), and shared regulation (SSRL) (Figure 12). 

Figure 12

FIGURE 12. Socially shared regulated learning model 1. Adapted from Järvelä and Hadwin (2013).

첫째, [협력 속 SRL]은 (다른 그룹 구성원과의 상호작용에 적응하는 것을 포함하는) 개별 학습자의 조절 행동(인지, 메타인지, 동기, 감정, 행동)을 의미한다.
First, SRL in collaboration refers to the individual learner’s regulatory actions (cognitive, metacognitive, motivational, emotional, and behavioral) that involve adapting to the interaction with the other group members.

둘째, [협력 속 공동조절CoRL]은 "(다른 학생 또는 그룹 구성원과 상호작용할 때 발생하는) 전략적 계획, 제정, 성찰 및 적응의 (학생의) 전유appropriation을 자극하는 어포던스과 제약 조건을 광범위하게 의미한다. 이 규제 수준은 그동안 사용이 일관되지 않아 현장에서 가장 논란이 많았던 분야다.

Secondly, CoRL in collaboration “refers broadly to affordances and constraints stimulating the (student’s) appropriation of strategic planning, enactment, reflection, and adaptation (occurring when in interaction with other students or group members)” (Hadwin et al., in press, p. 5). This regulatory level is the one that has been in the most dispute in the field, as its use has not been consistent (Panadero and Järvelä, 2015).

마지막으로, 세 번째 유형인 [협력 속 공유조절SSRL]은 그룹 내에서 "의도적이고 전략적이며 거래적인 계획, 과제 제정, 반영 및 적응"을 취할 때 발생한다. SSRL과 CoRL의 주요 차이점은

  • SSRL에서는 조절 조치가 "그룹 구성원 간의 일련의 거래적 교류를 통해 나타난다"는 것이지만
  • CoRL에서는 특정 그룹 구성원(들)에 의해 안내 또는 지시된다는 것이다.

Finally, the third type, SSRL in collaboration, occurs when “deliberate, strategic and transactive planning, task enactment, reflection and adaptation” are taken within a group (Hadwin et al., in press, p. 5). The key difference between SSRL and CoRL is that,

  • in the former, the regulatory actions “emerge through a series of transactive exchanges amongst group members” whilst
  • in CoRL they are guided or directed by (a) particular group member/s.

2011년 모델 버전과 향후 버전 사이의 중요한 변경 사항은 무엇입니까? 첫째, CoRL 모드는 경험적 증거를 기반으로 재개념화되었다. Hadwin 외 연구진(2011)은 세 가지 유형의 CoRL을 제안하였다.
What are the significant changes between the 2011 model version and the forthcoming version? First, the CoRL mode has been reconceptualized based on the empirical evidence (Panadero and Järvelä, 2015). Hadwin et al. (2011) proposed three types of CoRL:

  • (a) SRL 촉진을 위하여 이뤄지는 조절학습의 일시적 중재(학습자 외)
  • (b) 협업 과제에서 서로의 학습에 대한 분산된 조절, 그리고
  • (c) 사회적 환경이 학습을 함께 촉진하는 상호 작용에 초점을 맞춘 미시 분석적 접근법
  • (a) temporary mediation (by other than the learner) of regulated learning to promote SRL,
  • (b) distributed regulation of each other’s learning in a collaborative task, and
  • (c) a microanalytic approach focusing on interactions through which social environments co-regulate learning.

다가오는 제안에서, 그들은 [협력의 효과]만으로 초점을 옮겼으며, [미시 분석 접근법]에 대해 그렇게 자세히 논의하지 않았다. 또 다른 중요한 변화는 그들이 CoRL과 SSRL 모두 발생할 수 있다는 근거를 검토하면서,  "그룹들이 그들의 협업에서 서로 다른 단계를 진행하면서, SSRL은 물론이거니와, CoRL도 단독으로 발생하지 않을 것"이라고 언급했다.
In their forthcoming proposal, they have shifted the focus to the effects of collaborating alone and have not discussed the microanalytic approach in such detail. Another crucial change is that they have considered the reviewed empirical evidence that CoRL and SSRL could both occur “as groups progress through different phases on their collaboration and not always SSRL nor will co-regulation happen in isolation” (Panadero and Järvelä, 2015, p. 199).

Hadwin 외 연구진(2011)은 SSRL을 Winne과 Hadwin(1998)에서 추출한 느슨하게 시퀀싱되고 재귀적으로 연결된 4개의 피드백 루프에서 전개되는 것으로 개념화했다.

Hadwin et al. (2011) conceptualized SSRL as unfolding in four loosely sequenced and recursively linked feedback loops (Figure 13) taken from Winne and Hadwin (1998).

  • [첫 번째 루프] 동안 그룹은 내부 및 외부 작업 조건을 기반으로 공유된 작업 인식을 협상하고 구성한다.
  • [두 번째 루프]를 통해, 그룹들은 과제에 대한 공유된 목표를 설정하고 과제에 함께 접근하는 방법에 대한 계획을 세운다.
  • [세 번째 루프]에서 그룹은 전략적으로 협업을 조정하고 진행 상황을 모니터링합니다. 이 모니터링 활동을 기반으로, 그룹들은 그들의 집단 활동을 최적화하기 위해 그들의 과제 인식, 목표, 계획 또는 전략을 바꿀 수 있다.
  • [네 번째 루프]에서 그룹은 미래의 성과를 평가하고 규제한다. 본질적으로, 그룹이 SSRL에 참여할 때, 그들은 "나" 또는 "너" 수준을 벗어나, 규제 활동을 확장하여 합의된 집단 활동을 조절한다.
  • During the first loop, groups negotiate and construct shared task perceptions based on internal and external task conditions.
  • Through the second loop, groups set shared goals for the task and make plans about how to approach the task together.
  • In the third loop, groups strategically coordinate their collaboration and monitor their progress. Based on this monitoring activity, the groups can change their task perceptions, goals, plans, or strategies in order to optimize their collective activity.
  • Finally, in the fourth loop, groups evaluate and regulate for future performance. In essence, when groups engage in SSRL, they extend regulatory activity from the “I” or “you” level to regulate their collective activity in agreement (Hadwin et al., 2011).
Figure 13

FIGURE 13. Socially shared regulated learning model 2. Adapted from Hadwin et al. (2011).

다가오는 모델 제안에서, 4단계 주기는 여전히 그대로지만, 다른 레이블 아래, 이제 윈과 해드윈의 연구에서 제안된 것을 사용한다. 또한 다음과 같은 중요한 변화가 있습니다. Winne(1997)의 COPES 아키텍처는 SSRL 모델에 처음으로 도입되었습니다. 이 추가는 특히 동기 부여 및 감정에 대한 영향과 함께 세 가지 규제 모드에서 (메타) 인지 처리를 명확히 한다.
In the forthcoming model proposal, the four-phase cycle remains, but under different labels, now using the ones proposed in Winne and Hadwin’s work. Additionally, there is a crucial change: Winne’s (1997) COPES architecture is introduced for the first time in the SSRL model. This addition clarifies, especially, the (meta)cognitive processing at the three regulatory modes along with the effects on motivation and emotion (Hadwin et al., in press, Figure 1).

모델을 뒷받침하는 경험적 증거
Empirical Evidence Supporting the Model

SSRL 저자들은 그들의 모델에 대한 경험적 검증을 위해 노력해 왔다. 한편, 다른 연구자들 또한 SSRL에 대한 많은 연구를 수행했다. Panadero와 Järvelä(2015)의 CoRL 및 SSRL에 대한 검토는 세 가지 주요 결론을 도출했다.
The SSRL authors have been working toward empirical verification of their model (e.g., Järvelä et al., 2013). Meanwhile, other researchers have also conducted a growing number of studies on SSRL. A review on CoRL and SSRL by Panadero and Järvelä (2015) extracted three main conclusions.

  • 첫째, 사회적 조절의 또 다른 수준이 확인되었다:
    • CoRL이라고 불리는, 집단의 한 구성원이 앞장서는, 덜 균형 잡힌 유형;
    • SSRL이라고 불리는, 목표를 협상하고 전략을 공유하는 공동 조절 유형.
    • 이러한 이유로, 이 저자들은 CoRL과 SSRL 모드가 어떻게 서로 얽히는지 재개념화하자고 제안했는데, 이는 향후 모델의 주요 변경사항 중 하나이다.
  • 둘째, [인지적, 메타인지적, 동기적, 정서적 공유 영역에서 SSRL의 발생에 대한 경험적 증거]가 발견되었다. 이 발견은 공유 조절이 모든 SRL 영역 내에서 발생한다는 것을 보여주기 때문에 중요하다.
  • 셋째, [SSRL이 학습과 성과를 촉진할 수 있다는 증거]가 있었습니다. 또한 검토 후 발표된 새로운 연구는 모델 주변의 경험적 증거를 계속 강화했다.
  • First, different levels of social regulation were identified:
    • a less balanced type called co-regulation, in which one member of the group takes the lead; and
    • a jointly regulated type, in which goals are negotiated and strategies are shared, known as SSRL.
    • Because of this, those authors proposed to reconceptualize how the CoRL and SSRL modes intertwine, which constitutes one of the main changes in the forthcoming version of the model.
  • Secondly, empirical evidence of the occurrence of SSRL in cognitive, metacognitive, motivational, and emotional shared areas were found. This finding is important, as it shows that shared regulation happens within all SRL areas.
  • And third, there was evidence that SSRL might promote learning and performance. Additionally, new research published after the review has continued strengthening the empirical evidence around the model (e.g., Järvelä et al., 2016a,b).

기구
Instruments

현재, 자체 보고 데이터를 이용한 해당 분야의 연구가 있음에도 불구하고 SSRL 모델에 따라 고전적인 측정 도구(예: 설문지)는 개발되지 않았다. 학습의 대인관계 규제의 맥락적 특성으로 인해 SSRL을 조사하기 위한 새로운 방법론이 개발되었다. 현재 도구는 예를 들어, 집단 인식, 계획 및 평가를 촉진하기 위해 컴퓨터 지원 환경으로서 문맥에서 발판과 측정을 결합한다. 또한, 모델 저자들의 공동 노력은 학생들의 개념과 의도와 같은 주관적 데이터로 삼각측량된 객관적 데이터(예: 시선 추적, 생리학적 반응)를 포함한 다중 모드 데이터 수집을 개발하는 데 있었다.

At this time, no classical measurement instruments (e.g., questionnaires) have been developed under the SSRL model, even though there is research in the field using self-reported data (e.g., Panadero et al., 2015a). Because of the contextual nature of interpersonal regulation of learning (Vauras and Volet, 2013), new methodologies have been developed to investigate SSRL. Current instruments combine scaffolding and measures in context as, for example, a computer-supported environment to promote group awareness, planning, and evaluation (e.g., Järvelä et al., 2015). Additionally, the joint effort of the model authors has been in developing multi-modal data collections including objective data (e.g., eye tracking, physiological responses) triangulated with subjective data, such as students’ conceptions and intent (Hadwin et al., in press).

자기조절학습 모델 비교
Comparing Self-Regulated Learning Models

다음으로, 모델을 다음 범주로 비교합니다.
Next, the models will be compared in the following categories.

  • 첫째, 모델의 인용 수.
  • 둘째, 모든 모델은 서로 다른 SRL 단계와 하위 프로세스로 나뉜다. 그들은 결론을 도출하기 위해 여기서 비교된다.
  • 셋째, SRL이 탐구하는 분야는 크게 (메타)인지, 동기, 감정 등 3가지로, 6가지 모델 각각에서 이들의 위치를 분석한다.
  • 넷째, SRL 모델은 개념화의 세 가지 주요 측면, 즉 상향식/하향식, 자동성 및 컨텍스트에서 상당한 차이를 보인다.
  • First, the models’ number of cites.
  • Second, all the models are divided into different SRL phases and subprocesses. They are compared here, to extract conclusions.
  • Thirdly, there are three main areas that SRL explores; (meta)cognition, motivation, and emotion; therefore, their positioning in each of the six models is analyzed.
  • And, fourth, the SRL models present significant differences in three major aspects of conceptualization: top–down/bottom–up, automaticity, and context.

현장에서의 인용과 중요성
Citations and Importance in the Field

이 섹션을 시작하기 전에 한 마디 조언: 인용 횟수는 모델의 품질과 전적으로 관련이 없는 측면에 의해 영향을 받을 수 있는 지표입니다. 중요한 혁신은 실제로 그렇게 많은 인용문을 받지 못한 모델들에 의해 이루어질 수 있다. 그럼에도 불구하고, 몇 가지 결론을 도출하는 것은 흥미로운 지표이다. 
One word of advice before starting this section: the number of citations garnered is an indicator that can be influenced by aspects not related exclusively to the quality of the model. Important innovations can actually be made by models that have not received so many cites. Nevertheless, it is an interesting indicator to extract some conclusions from.

표 1에는 모델당 인용 횟수가 제시되어 있습니다. Efklides 및 SSRL 모델은 최근에 게시된 것처럼 총 수가 더 적습니다. 그럼에도 불구하고, 그들은 연간 인용에서 유망한 숫자를 보여주는데, 이것은 그들의 관련성을 나타낸다. Boekaerts와 Winne 및 Hadwin의 모델은 인용 횟수에 따라 두 번째 그룹을 형성합니다. Boekaerts와 Corno(2005)의 연구는 Boekaerts의 모델뿐만 아니라 Corno와 Kuhl의 모델에 대한 정보, 특히 SRL 측정에 대한 반영을 포함하고 있음을 지적하는 것이 중요하다. 따라서, 그것은 보에카르트 모델의 인용을 부분적으로 표현한 것일 뿐이지만, 그녀의 모델이 제시되는 가장 많이 인용된 논문이다. Winne과 Hadwin(1998)의 책은 그들의 모델과 관련하여 가장 많이 인용된 작품이지만, 앞서 논의된 바와 같이 그들의 작품의 원래 발표는 아니다. 마지막으로, 2000년 핸드북에 제시된 핀트리히와 짐머만의 모델은 가장 많은 인용 수를 가지고 있으며, 짐머만이 가장 많이 인용되었다. 
In Table 1, the number of citations per model is presented. The Efklides and SSRL models have a lower total number, as they were published recently. Nevertheless, they show promising numbers in citations per year, which indicates their relevance. The models of Boekaerts and of Winne and Hadwin’s models form a second group according to their number of citations. It is important to point out that Boekaerts and Corno’s (2005) study includes not only Boekaerts’ model, but also information about Corno’s and Kuhl’s models and, especially, a reflection on SRL measurement. Therefore, it is only a partial representation of citations of Boekaerts’ model, but it is her most cited paper where her model is presented. Winne and Hadwin’s (1998) book is the most cited work regarding their model, but it is not the original presentation of their work, as earlier discussed. Finally, Pintrich’s and Zimmerman’s models, both presented in the 2000 handbook, have the highest number of citations, with Zimmerman as the most cited.

Table 1

TABLE 1. Number of citations of the different SRL models main publication.

구형 모델 4종을 비교해보면, [핀트리히와 짐머먼의 모델]은 [보에카르트나 윈과 해드윈의 모델]에 비해 더 널리 사용되고 있다. 두 가지 가능성이 있는 원인이 있다.

  • 하나는 첫 번째 것이 더 포괄적이고 이해하기 쉽고 교실에서 적용하기가 쉽다는 것이다. 첫 번째 원인과 관련하여, Pintrich와 Zimmerman의 모델은 서로 다른 유형의 하위 프로세스에 대한 보다 완전한 비전을 포함하고 있다. 이 네 가지 모델 수치를 비교해 보면, 짐머만과 핀트리치는 (a) 보에카르트보다 더 구체적인 하위 과정을 제시하고 (b) 윈과 해드윈이 직접 제시하지 않는 동기부여와 감정적 측면을 포함한다는 점이 두드러진다.
  • 두 번째 원인은 Boekaerts의 모형과 Winne과 Hadwin의 모형은 직관력이 약간 떨어지기 때문이며, 정확한 적용을 위해서는 기초 이론에 대한 더 깊은 이해가 필요하다. 이것은 이 두 모델이 다른 모델보다 덜 관련이 있다는 것을 말하는 것은 아니다. 반대로, 두 가지 모두 SRL에 대한 두 가지 중요한 측면, 즉 감정 조절과 메타 인식을 심층적으로 다룬다. 

If we compare the number of the four older models, Pintrich’s and Zimmerman’s models have been more widely used in comparison to Boekaerts’ and that of Winne and Hadwin. There are two probable causes.

  • One is that the first ones are more comprehensive and easier to understand and apply in classrooms (Dignath et al., 2008). With regards to the first cause, both Pintrich’s and Zimmerman’s models include a more complete vision of different types of subprocesses. If we compare these four models figures, it is salient that Zimmerman and Pintrich (a) present more specific subprocesses than Boekaerts and (b) include motivational and emotional aspects that are not directly presented by Winne and Hadwin.
  • The second cause is that Boekaerts’ model and Winne and Hadwin’s are slightly less intuitive, and a deeper understanding of the underpinning theory is needed for a correct application. This is not to say that these two models are less relevant than the others; on the contrary, both cover in depth two critical aspects for SRL: emotion regulation and metacognition.

마지막으로, 무스와 링달(2012)은 교실에서 SRL에서 교사의 역할에 대한 검토를 통해 Zimmerman의 모델이 이러한 저자들에 의해 제안된 것처럼 교사들과 함께 일할 때 가장 도움이 될 수 있는 "강력한 설명 렌즈"를 제공하기 때문에 그 연구 분야에서 우세하다는 것을 발견했다.
To finalize, Moos and Ringdal’s (2012) review of the teacher’s role in SRL in the classroom found that Zimmerman’s model has been the predominant in that line of research, as it offers “a robust explanatory lens” which might help the most when working with teachers as proposed by these authors.

단계 및 하위 프로세스
Phases and Subprocesses

모든 모델 저자들은 SRL이 다른 단계와 하위 프로세스로 구성된 [주기적cyclical]이라는 데 동의한다. 그러나 모델은 서로 다른 단계와 하위 프로세스를 제시하며, 이를 식별함으로써 몇 가지 결론을 도출할 수 있다. 일반적으로, Puustinen과 Pulkkinen(2001)의 리뷰는 그들이 분석한 모델이 세 가지 식별 가능한 단계를 가지고 있다고 결론지었다.
All of the model authors agree that SRL is cyclical, composed of different phases and subprocesses. However, the models present different phases and subprocesses, and by identifying them we can extract some conclusions. In general terms, Puustinen and Pulkkinen’s (2001) review concluded that the models they analyzed had three identifiable phases:

  • (a) 준비, 작업 분석, 계획, 목표 활성화 및 목표 설정
  • (b) 성과, 진행 상황을 모니터링 및 제어하는 동안 실제 작업이 수행
  • (c) 평가, 학생이 미래의 성과를 반영하고, 조절하고, 적응
  • (a) preparatory, which includes task analysis, planning, activation of goals, and setting goals;
  • (b) performance, in which the actual task is done while monitoring and controlling the progress of performance; and
  • (c) appraisal, in which the student reflects, regulates, and adapts for future performances.

추가된 두 모델에서 SRL 단계의 개념화는 무엇인가? (표 2 참조).

  • 첫째, Efklides(2011)는 반복된 작업 수행 후 개인 수준이 영향을 받는다고 간주하지만, 자신의 모델에서 평가 단계를 명확하게 명시하지 않는다.
  • 둘째, 2011년 버전의 SSRL 모델은 Winne과 Hadwin의 영향을 많이 받았지만, Pintrich와 유사하면서 다른 명명을 사용하는 4가지 단계를 제시한다. 따라서 표의 SSRL 모델 분류는 Puustinen과 Pulkkinen(2001)이 Pintrich's에 대해 제안한 것과 동일하다.

What is the conceptualization of SRL phases in the two added models? (see Table 2).

  • First, Efklides (2011) does not clearly state an appraisal phase in her model, although she considers that the Person level is influenced after repeated performances of a task.
  • Second, the SSRL model in its version from 2011, although strongly influenced by Winne and Hadwin’s, presents four phases that are similar to Pintrich’s but using different labels.Therefore, the SSRL model classification in the table is the same one that Puustinen and Pulkkinen (2001) proposed for Pintrich’s.
Table 2

TABLE 2. Models’ phases.

결론은 무엇인가? 여기서 Efklides'를 제외한 모든 모델이 Puustinen과 Pulkkinen에 의해 제안된 세 단계를 중심으로 개념화될 수 있다고 하더라도 SRL 단계의 두 가지 개념화는 구별할 수 있다. 

  • 첫째, 일부 모델은 각 단계에서 발생하는 단계와 하위 프로세스 간의 더 명확한 구별을 강조한다. 짐머만과 핀트리치의 모델은 이 그룹에 속하며, 각 단계마다 매우 뚜렷한 특징을 가지고 있다.
  • 두 번째 그룹인 윈과 해드윈, 보에카르트, 에프클라이드, SSRL(향후 버전) 모델은 SRL이 재귀적 단계를 가진 "개방적" 과정이며 첫 번째 그룹처럼 구분되지 않는다는 것을 더 분명하게 전달한다. 예를 들어, Winne과 Hadwin의 figure는 각 단계와 각 단계에 속하는 과정을 명확하게 구분하지 못한다: SRL은 시간이 지남에 따라 진화하는 피드백 루프로 제시된다. Winne과 Hadwin(1998)은 이 수치에 첨부된 텍스트를 통해서만 4가지 단계를 제안하고 있음을 명확히 했다.

What can be concluded? Even if all of the models considered here except Efklides’, can be conceptualized around those three phases proposed by Puustinen and Pulkkinen, two conceptualizations of the SRL phases can be distinguished.

  • First, some models emphasize a clearer distinction among the phases and the subprocesses that occur in each of them. Zimmerman’s and Pintrich’s models belong to this group, each having very distinct features for each phase.
  • Those in the second group-the Winne and Hadwin, Boekaerts, Efklides, and SSRL (in its forthcoming version) models-transmit more explicitly that SRL is an “open” process, with recursive phases, and not as delimited as in the first group. For example, Winne and Hadwin’s figure does not make a clear distinction between the phases and the processes that belong to each: SRL is presented as a feedback loop that evolves over time. It is only through the text accompanying the figure that Winne and Hadwin (1998) clarified that they were proposing four phases.


이 독특한 차이에서 오는 한 가지 의미는 다른 모델에 따라 개입하는 방법에 있을 수 있다. 

  • 첫 번째 모델 그룹은 효과 측정이 더 실현 가능하기 때문에 [더 구체적인 개입]을 허용할 수 있다. 예를 들어, 교사가 과제를 수행하는 동안 학생 중 한 명이 동기부여 문제를 가지고 있다는 것을 인지하는 경우, 그 특정 단계에서 짐머만이 제시한 하위 프로세스(예: 자기 결과)의 일부를 적용하면 긍정적인 결과를 얻을 수 있다.
  • 반면에, 두 번째 모델 그룹은 SRL을 더 관성적으로 관련된 하위 프로세스로 구성된 더 연속적인 프로세스로 인식하기 때문에 [더 전체적인 개입]을 제안할 수 있다. 그러나 이 가설은 미래에 탐구될 필요가 있을 것이다.

One implication from this distinctive difference could be in how to intervene according to the different models.

  • The first group of models might allow for more specific interventions because the measurement of the effects might be more feasible. For example, if a teacher recognizes that one of her students has a motivation problem while performing a task, applying some of the subprocesses presented by Zimmerman at that particular phase (e.g., self-consequences) might have a positive outcome.
  • On the other hand, the second group of models might suggest more holistic interventions, as they perceive the SRL as a more continuous process composed of more inertially related subprocesses. This hypothesis, though, would need to be explored in the future.

 

(메타) 인지, 동기, 감정
(Meta)cognition, Motivation, and Emotion

다음으로 SRL 활동의 세 가지 주요 영역과 각 모델이 SRL 활동을 어떻게 개념화하는지 살펴본다. 모델의 figure에 의해 해석이 가이드된다. figure는 각 저자에게 가장 중요한 SRL 측면을 보여주기 때문이다. 앞서 언급한 세 가지 영역에 대해 서로 다른 수준에 기초한 분류가 제안되었다(표 3). 수준이 본질적으로 가까운 것이 아니라 연속체 상의 위치로 개념화되었다는 것을 명확히 하는 것이 중요하다.

Next, the three main areas of SRL activity and how each model conceptualizes them will be explored. The interpretation is guided by the models’ figures as they reveal the most important SRL aspects for each author. A classification based on different levels for the three aforementioned areas is proposed (Table 3). It is important to clarify that the levels were conceptualized, not as being close in nature, but rather, as being positions on a continuum.

Table 3

TABLE 3. Models figures comparison on cognition, motivation, and emotion.

(메타) 인식
(Meta)cognition

(메타) 인식과 관련하여 세 가지 수준이 고려된다. 첫 번째 수준에는 (메타) 인식이 강조된 모델이 포함된다. 

Three levels are considered with regard to (meta)cognition. The first level includes models with a strong emphasis on (meta)cognition.

  • 이 수준의 첫 번째 모델은 
    • 윈과 해드윈의 모델로, 주요 과정은 메타인지적이다: "메타인지 모니터링은 자신의 학습을 스스로 조절하는 관문이다.
    • Efklides의 모델은 동기부여와 정서적 측면을 포함하지만 메타인지적 측면은 작업 × 사람 수준에서 더 자세히 정의되며 더 많은 실체를 가지고 있다. 
    • 마지막으로 SSRL 모델에는 Winne과 Hadwin의 COPES 아키텍처가 포함되어 있습니다. 그러나 SSRL 2011 버전은 (메타)인식을 강조하지 않았기 때문에, 두 개의 메타인지 모델 이후에 위치하기로 결정했다. 
  • 2층에는 핀트리치와 짐머만의 모델이 있다. 
    • Pintrich(2000)는 FOKs 및 FOLs와 같은 메타인지 이론의 측면과 함께 중심적인 역할을 하는 "인식의 조절"을 통합한다. 
    • Zimmerman(2000)은 앞서 설명한 모델의 경우처럼 여러 가지 선도적인 인지/메타인지 전략을 제시하지만 동기 부여 전략보다는 강조되지 않는다. 
  • 세 번째 단계에서, 보에카르트(Boekaerts)는 자신의 그림에 (메타)인지 전략의 사용을 포함하지만, 특정 전략을 명시적으로 언급하지는 않는다.
  • The first model at this level is
    • Winne and Hadwin’s, in which the predominant processes are metacognitive: “Metacognitive monitoring is the gateway to self-regulating one’s learning” (Winne and Perry, 2000, p. 540).
    • Efklides’ model includes motivational and affective aspects, but the metacognitive ones are defined in more detail at the Task × Person level and are the ones with more substance.
    • Finally, the SSRL model includes in the forthcoming version the COPES architecture from Winne and Hadwin. However, due to the fact that the SSRL 2011 version did not emphasize (meta)cognition, it was decided to locate it after the two more metacognitive models.
  • At the second level are Pintrich’s and Zimmerman’s models.
    • Pintrich (2000) incorporates the “regulation of cognition,” which has a central role along with aspects of metacognitive theory such as FOKs and FOLs.
    • Zimmerman (2000) presents a number of leading cognitive/metacognitive strategies, but they are not emphasized over the motivational ones, as is the case for the models just discussed.
  • At the third level, Boekaerts includes the use of (meta)cognitive strategies in her figures, but does not explicitly refer to specific strategies.

동기
Motivation

2단계 분류가 제안된다.

첫 번째 수준에는 짐머만, 보에카르트, 핀트리치 모델이 있다.

  • Zimmerman 자신의 SRL 정의는 목표의 중요성을 명시하고 목표 주도 활동으로서 SRL을 제시한다. 그의 모델에서,
    • 전-사고 단계에서, 자기 동기 부여 믿음은 중요한 구성 요소이다.
    • 수행performance 단계는 원래 의지의 중요성을 나타내는 성능/의지 제어로 설명되었다. 그리고
    • 자기반성 단계에서는 자기주장이 미래의 과제를 수행하려는 동기부여에 영향을 미친다.
  • Boekaerts에 따르면, 학생들은 학습 과제와 맥락을 "해석"한 다음 두 가지 다른 목표 경로를 활성화합니다. 이러한 경로는 학생들이 활성화(또는 활성화하지 않음)하는 규제 조치를 이끄는 경로입니다. 또한 Boekaerts는 SRL의 핵심 측면으로 자신의 모델에 동기부여 신념을 포함했습니다(그림 7 참조).
  • 마지막으로, Pintrich(2000)는 또한 짐머만의 것과 유사한 측면을 고려하는 동기/영향 영역을 그의 모델에 포함시켰지만, Pintrich는 메타인식에 더 중점을 두었다. 또한 Pintrich가 SRL에서 목표지향성의 역할을 탐구한 최초의 연구를 수행했다는 점도 언급해야 한다.

A two-level classification is proposed. The Zimmerman, Boekaerts, and Pintrich models are at the first level.

  • Zimmerman’s own definition of SRL explicitly states the importance of goals and presents SRL as a goal-driven activity. In his model,
    • in the forethought phase, self-motivation beliefs are a crucial component;
    • the performance phase was originally described (Zimmerman, 2000) as performance/volitional control, which indicates how important volition is; and
    • at the self-reflection phase, self-reactions affect the motivation to perform the task in the future.
  • According to Boekaerts, the students “interpret” the learning task and context, and then activate two different goal paths. Those pathways are the ones that lead the regulatory actions that the students do (or do not) activate (e.g., Boekaerts and Niemivirta, 2000). In addition, Boekaerts also included motivational beliefs in her models as a key aspect of SRL (see Figure 7).
  • Finally, Pintrich (2000) also included a motivation/affect area in his model that considers aspects similar to those in Zimmerman’s, but Pintrich’s places a greater emphasis on metacognition. It is also important to mention that Pintrich conducted the first research that explored the role of goal orientation in SRL (Pintrich and de Groot, 1990).

두 번째 수준에는 SSRL, Efklides, Winne 및 Hadwin 모델이 포함됩니다. 

  • SSRL은 2011년 버전 그림에 동기부여를 포함시키고 협업 학습 상황에서 자신의 역할을 강조했지만 동기부여 요소를 세부적으로 구분하지는 않았다. 그럼에도 불구하고, 저자들은 그룹 차원에서 동기 부여와 그 규제에 관한 상당한 양의 연구를 수행했다.
  • 마지막으로, Winne과 Hadwin(1998)과 Efklides(2011)는 그들의 모델에 동기를 포함했지만, 그것은 그들의 주요 분석 초점은 아니다.

The second level includes the SSRL, Efklides, and Winne and Hadwin models.

  • SSRL included motivation in the 2011 version figure and emphasized its role in collaborative learning situations, but without differentiating motivational components in detail. Nevertheless, the authors have conducted a significant amount of research regarding motivation and its regulation at the group level (e.g., Järvelä et al., 2013).
  • Finally, Winne and Hadwin (1998) and Efklides (2011) included motivation in their models, but it is not their main focus of analysis.

감정
Emotion

세 가지 수준이 제안된다.

  • 첫째는 학생들의 목표에서 감정의 영향과 이것이 어떻게 두 가지 가능한 경로와 다른 전략을 활성화시키는지 강조한다. Boekaerts에게 자아 보호는 웰빙 경로에서 중요한 역할을 하며, 그러한 이유로 학생들은 대신 학습 경로를 활성화하기 위해 감정을 조절하는 전략을 갖는 것이 필수적이다.
  • 두 번째 수준에서,
    • Pintrich(2000)와 Zimmerman(2000)은 감정에 대한 비슷한 해석을 공유했다. 그들은 둘 다 학생들이 마지막 SRL 단계에서 자신의 작업을 자체 평가할 때 발생하는 반응(즉, 귀속 및 정서적 반응)에 가장 중점을 둔다. 또한 두 사람 모두 공연 중 감정을 통제하고 모니터링하는 전략을 언급했다.
      • 핀트리히는 "인식 및 모니터링"과 "관리하기 위한 전략의 선택과 적응"에 대해 논의했고,
      • 짐머만은 이미지와 자기 결과가 학생들이 긍정적인 감정을 자아내는 데 사용될 수 있다고 말했다.
      • 그럼에도 불구하고 준비단계에서는 둘 다 감정을 직접적으로 언급하지 않는다. 단, 짐머만은 자신의 사전 사고 단계에 포함된 자기효능감이 감정이나 감정 조절보다 그 단계에서 성과를 더 잘 예측할 수 있다고 주장한다.
    • SSRL 모델은 2011년 버전 그림에 감정을 포함하지만 감정 규제의 기초가 되는 하위 프로세스는 명시되지 않는다. 그럼에도 불구하고, 이러한 저자들은 협업 학습 상황이 중요한 정서적 과제를 제시한다고 분명히 주장하며, 이 문제를 탐구하는 경험적 연구를 수행했다. 
  • 마지막으로, Efklides (2011)와 Winne과 Hadwin은 SRL에서 감정의 역할에 대해 언급한다. [예를 들어, "영향은 기분과 같이 메타인지 경험에 직접적인 영향을 미칠 수 있다." (Efklides, 2011, 페이지 19, 그리고 그녀는 그것을 두 가지 수준에서 그녀의 모델에 포함시켰다.) 그러나, 그들은 감정 조절 전략에 큰 중점을 두지 않는다.

Three levels are proposed.

  • In the first one (Boekaerts, 1991Boekaerts and Niemivirta, 2000) emphasizes the influence of emotions in students’ goals and how this activates two possible pathways and different strategies. For Boekaerts, ego protection plays a crucial role in the well-being pathway, and for that reason it is essential for students to have strategies to regulate their emotions, so that they will instead activate the learning pathway.
  • At the second level, Pintrich (2000) and Zimmerman (2000) shared similar interpretations of emotions. They both put the most emphasis on the reactions (i.e., attributions and affective reactions) that occur when students self-evaluate their work during the last SRL phase. In addition, both mentioned strategies to control and monitor emotions during performance:
    • Pintrich discusses “awareness and monitoring” and “selection and adaptation of strategies to manage” (Pintrich, 2000), and
    • Zimmerman stated that imagery and self-consequences can be used by students to self-induce positive emotions (Zimmerman and Moylan, 2009).
  • Nevertheless, in the preparatory phases, neither of them mentions emotions directly. Yet, Zimmerman argues that self-efficacy, which is included in his forethought phase, is a better predictor of performance at that phase than emotions or emotion regulation (Zimmerman, B. J. personal communication with the author, 28/02/2014). The SSRL model includes emotion in its 2011 version figure (Hadwin et al., 2011), but the subprocesses that underlie the regulation of emotion are not specified. Nonetheless, these authors clearly argue that collaborative learning situations present significant emotional challenges, and they have conducted empirical studies exploring this matter (e.g., Järvenoja and Järvelä, 2009; Koivuniemi et al., 2017).
  • Finally, Efklides (2011) and Winne and Hadwin (e.g., Winne, 2011) mention the role of emotions in SRL [e.g., “affect may directly impact metacognitive experiences as in the case of the mood” (Efklides, 2011, p. 19, and she included it in her model at two levels]. However, they do not place a major emphasis on emotion-regulation strategies.

비교를 위한 세 가지 추가 영역
Three Additional Areas for a Comparison

앞서 언급했듯이 모델이 현저한 차이를 보이는 세 가지 영역이 추가로 확인되었다.
As mentioned earlier, three additional areas in which the models present salient differences were identified.

하향식/상향식(TD/BU)
Top–Down/Bottom–Up (TD/BU)


이러한 자율규제의 분류를 포함하는 첫 번째 모델은 Boekaerts와 Niemivirta(2000)였다.

  • 하향식(top-down)은 학습/과제 목표가 학생과 더 관련이 있는 숙달/성장 경로입니다. 반면에
  • 상향식(bottom-up)은 학생들이 자아 보호라고도 알려진 자아 개념(즉, 자존감)이 손상되는 것을 막기 위해 목표를 활성화하는 웰빙 경로이다.

Efklides(2011)도 이 분류를 사용하지만 다른 의미를 갖는다. 그녀에게 있어

  • [하향식 조절]은 그 사람의 특성(예: 인지 능력, 자기 개념, 태도, 감정 등)에 따라 목표가 설정될 때 발생하며, 그러한 개인적 목표에 따라 자기 조절이 지도된다.
  • [상향식 조절]은 데이터 중심일 때, 즉 과제 수행의 세부 사항(예: 과제 진행 상황 모니터링)이 학생의 행동을 지시하고 조절할 때 발생한다. 다시 말해, 학생이 과제를 수행하려고 할 때 인지 과정이 주된 초점이 된다.

The first model that included this categorization of self-regulation was Boekaerts and Niemivirta (2000).

  • Top–down is the mastery/growth pathway in which the learning/task goals are more relevant for the student. On the other hand,
  • bottom–up is the well-being pathway in which students activate goals to protect their self-concept (i.e., self-esteem) from being damaged, also known as ego protection. 

Efklides (2011) also uses this categorization, but with different implications. For her,

  • top–down regulation occurs when goals are set in accordance with the person’s characteristics (e.g., cognitive ability, self-concept, attitudes, emotions, etc.), and self-regulation is guided based on those personal goals.
  • Bottom–up occurs when the regulation is data-driven, i.e., when the specifics of performing the task (e.g., the monitoring of task progress) direct and regulate the student’s actions. In other words, the cognitive processes are the main focus when the student is trying to perform a task.

일부 암묵적 해석을 추출할 수 있지만, 다른 모델은 이 분류를 명시적으로 탐구하지 않는다. 이렇게 하면 짐머먼 모델과 윈과 해드윈 모델의 상호작용적 특성을 기반으로 한 TD/BU의 세 번째 비전이 있을 수 있습니다. 짐머먼(저자 27/02/2014)은 다음과 같이 설명했습니다.
The other models do not explore this categorization explicitly, although some implicit interpretations can be extracted. This way, there could be a third vision of TD/BU that is based on the interactive nature of Zimmerman’s model and Winne and Hadwin’s. Zimmerman (personal communication to author 27/02/2014) explained:

역사적으로, 하향식 이론은 인지적이었고 개인적인 믿음과 정신적 과정을 주로 강조해왔다(예: 정보처리 이론 대조적으로 상향식 이론은 행동적이었고 행동과 환경을 주로 강조해 왔다(예: 행동 수정 이론). 1977년 반두라(Bandura)가 사회 인지 이론을 발전시켰을 때, 그는 두 입장이 모두 절반씩 옳았다고 결론 내렸다. 그의 이론은 삼원적 묘사를 사용하여 두 관점을 통합한다. 나는 그의 공식이, 하향식이나 상향식이 아니라, 인지 과정이 양방향의 원인이 되고 행동과 환경에 의해 야기되는 상호작용주의적이라고 주장한다. SRL의 나의 순환 모델은 이러한 3원 구성 요소를 정교하게 설명하고 피드백의 반복된 관점에서 상호 작용을 설명한다. 따라서 이 모델의 변수(예: 학생의 자기 효능감 신념)는 다음 피드백 주기 동안 변경될 수 있습니다. 목표가 없는 사람들이 스포츠, 음악, 예술, 또는 학계에서 성공을 경험하고 그 과정에서 강한 목표를 개발하는 예는 셀 수 없이 많다. 인터랙티브 이론은 목표를 따르는 것만큼 목표를 개발하는 것을 강조한다.

Historically, top–down theories have been cognitive and have emphasized personal beliefs and mental processes as primary (e.g., Information Processing theories). By contrast, bottom–up theories have been behavioral and have emphasized actions and environments as primary (e.g., Behavior Modification theories). When Bandura (1977) developed social cognitive theory, he concluded that both positions were half correct: both were important. His theory integrates both viewpoints using a triadic depiction. I contend that his formulation is neither top–down [n]or bottom–up but rather interactionist where cognitive processes bi-directionally cause and are caused by behavior and environment. My cyclical model of SRL elaborates these triadic components and describes their interaction in repeated terms of cycles of feedback. Thus, any variable in this model (e.g., a student’s self-efficacy beliefs) is subject to change during the next feedback cycle…. There are countless examples of people without goals who experience success in sport, music, art, or academia and subsequently develop strong goals in the process. Interactionist theories emphasize developing one’s goals as much as following them.

Winne은 다음과 같이 말했다.
Winne (personal communication to the author 27/02/2014) stated:

나는 이 용어가 제한적이기 때문에 소개하지 않았다. SRL의 중요한 특성은 정보의 단방향 흐름이 아닌 [정보 흐름의 사이클]입니다. 어떤 주기는 사람 내부에 있고 어떤 주기는 사람과 환경의 경계를 넘나든다.
I didn’t introduce this terminology because it is limiting. A vital characteristic of SRL is cycles of information flow rather than one-directional flow of information. Some cycles are internal to the person and others cross the boundary between person and environment.


요약하자면, 짐머먼과 윈은 성능 중 피드백의 재귀적 주기가 자체 규제와 목표의 특수성에 변화를 일으키기 때문에 TD/BU가 그들의 모델에 적용 가능하다고 생각하지 않는다.
In sum, Zimmerman and Winne do not consider TD/BU to be applicable to their models, as the recursive cycles of feedback during performance generate self-regulation and changes in the specificity of the goals.

Pintrich(2000) 모델이 목표 중심이기 때문에 Efklides(2011)가 제안한 것처럼 하향식 동기 부여는 개인적 특성에서 오는 것으로 개념화된다고 가정할 수 있다. 그럼에도 불구하고, 핀트리히는 성과와 회피 목표를 내포하는 목표 지향도 포함했는데, 이는 보에카츠의 웰빙 경로, 특히 회피 목표와 관련이 있다. 따라서 TD/BU의 해석이 그의 모델에 어떤 영향을 미칠지 정확하게 식별하기는 어렵다. SSRL 모델은 아직 이 문제를 명확히 밝히지 않았지만, Winne과 Hadwin의 입장과 유사한 입장을 전제로 할 수 있다.
As Pintrich’s (2000) model is goal-driven, it could be assumed that it conceptualizes top–down motivation as coming from personal characteristics, as proposed by Efklides (2011). Nevertheless, Pintrich also included goal orientation, which implicates performance and avoidance goals, which has a connection to Boekaerts’ well-being pathway, especially avoidance goals. Therefore, it is difficult to discern with any precision what the interpretation of TD/BU would be for his model. The SSRL model (Hadwin et al., 2011) has not yet clarified this issue, though a stance similar to that of Winne and Hadwin could be presupposed.

자동성
Automaticity

SRL에서 자동성은 일반적으로 [자동 응답 패턴이 된 기본 프로세스]를 의미합니다. [(메타)인지 과정]을 가리키는 말로 자주 쓰인다. 일부 저자들은 SRL이 발생하기 위해서는 일부 과정이 자동으로 되어야 학생들이 인지 부하를 덜 가질 수 있고 전략을 활성화할 수 있다고 주장한다. 그러나, 그것은 또한 학생들의 의식 없이 일어나는 동기부여와 감정적 과정을 의미할 수도 있다. 다음으로, 자동성에 대한 다양한 관점을 설명하기 위해 이 주제에 대한 모델의 몇 가지 인용문이 제시될 것이다. Winne (2011)은 다음과 같이 말했다.

In SRL, automaticity usually refers to underlying processes that have become an automatic response pattern (Bargh and Barndollar, 1996; Moors and De Houwer, 2006; Winne, 2011). It is frequently used to refer to (meta)cognitive processes: some authors maintain that, for SRL to occur, some processes must become automatic so that the student can have less cognitive load and can then activate strategies (e.g., Zimmerman and Kitsantas, 2005; Winne, 2011). However, it can also refer to motivational and emotional processes that occur without student’s awareness (e.g., Boekaerts, 2011). Next, some quotations from the models on this topic will be presented to illustrate the different perspectives of automaticity. Winne (2011) stated:

대부분의 인지는 학습자가 그것을 하는 것에 대해 숙고하거나 그것이 어떻게 전개되는지에 대한 세밀한 세부 사항을 통제할 필요 없이 수행된다. 일부 연구자들은 그러한 인식을 "의식적이지 않은unconscious" 라고 부르지만, 나는 '암묵적implicit'이라는 명명을 선호한다. 인지 활동의 많은 부분이 암묵적이기 때문에, 학습자들은 그들의 인지를 거의 인식하지 못한다. 두 가지 조건이 있습니다.

첫째, 오류와 장애물이 발생할 때 인식은 암묵적인 것에서 명시적인 것으로 바뀔 수 있다. 

그러나 둘째, 학습자가 인지적 산물을 유형적 표현으로 추적하거나, 예를 들어 주요 아이디어에 대한 차별을 나타내는 강조를 하지 않는 한, 시간에 따른 사건에 대한 인지적 추적은 신뢰할 수 없고 일시적인 기억일 수 있다.
Most cognition is carried out without learners needing either to deliberate about doing it or to control fine-grained details of how it unfolds…Some researchers describe such cognition as “unconscious” but I prefer the label implicit…Because so much of cognitive activity is implicit, learners are infrequently aware of their cognition. There are two qualifications.

First, cognition can change from implicit to explicit when errors and obstacles arise. But, second, unless learners trace cognitive products as tangible representations -“notes to self” or underlines that signal discriminations about key ideas, for example-the track [of] cognitive of events across time can be unreliable, a fleeting memory (p. 18).

또한 Efklides(2011)는 다음과 같이 밝혔다.
In addition, Efklides (2011) indicated:

작업 × 사람 수준에서 작동하는 SRL의 개념은 [행동에 직접적인 영향을 미치는 무의식적인 자동 프로세스 및 암시적 지식]뿐만 아니라 [의식적인 분석 프로세스와 명시적 지식]이 있는 인지 아키텍처를 전제로 한다.
This conception of the SRL functioning at the Task × Person level presupposes a cognitive architecture in which there are conscious analytic processes and explicit knowledge as well as non-conscious automatic processes and implicit knowledge that have a direct effect on behavior (p. 13).


Boekaerts는 또한 자동성이 학생들이 활성화할 수 있는 다양한 경로에서 중요한 역할을 할 수 있다고 가정했다. "Bargh (1990)의 입장은 목표 활성화가 자동적이거나 의도적일 수 있다는 것이고 Bargh와 Barndollar (1996)는 일부 목표가 개인의 인식 밖에서 환경적 단서에 의해 직접 활성화되거나 촉발될 수 있다는 것을 입증했다. Pintrich(2000)는 이렇게 구체화했다: "어느 정도 수준에서, 사전 지식의 활성화 과정은, 의식적인 생각 없이 자동으로 일어날 수 있고 실제로 일어난다." 마지막으로 짐머먼과 모일런은 2009년에 다음과 같이 주장했다.
Boekaerts also assumed that automaticity can play a crucial role in the different pathways that students might activate: “Bargh’s (1990) position is that goal activation can be automatic or deliberate and Bargh and Barndollar (1996) demonstrated that some goals may be activated or triggered directly by environmental cues, outside the awareness of the individual” (Boekaerts and Niemivirta, 2000, p. 422). Pintrich (2000) specified: “At some level, this process of activation of prior knowledge can and does happen automatically and without conscious thought” (p. 457). Finally, Zimmerman and Moylan (2009) asserted:

사전 사고에 미치는 영향의 관점에서, 프로세스 목표는 전략적 계획(두 가지 주요 업무 분석 프로세스를 결합하는 것)을 포함하도록 설계되었습니다. 공부 및 연습에서, 학생들은 결국 그 전략을 자동적으로 사용할 것이다. 자동화는 긴밀한 메타인지 모니터링 없이 전략을 실행할 수 있을 때 발생합니다. 자동화 시점에서는 농구 자유투 슈터가 마지막 샷의 결과에 따라 던지기 전략을 조정할 때와 같이 자신의 개인 능력에 따라 경기력을 적응시키는 데 도움을 주기 때문에 결과 피드백의 혜택을 받을 수 있다. 그러나, 심지어 전문가들도 전략이 자동화된 후에 후속적인 어려움에 직면하게 될 것이며, 이것은 그들이 그들의 모니터링을 결과에서 프로세스로 다시 전환하도록 요구할 것이다. 
In terms of their impact on forethought, process goals are designed to incorporate strategic planning-combining two key task analysis processes. With studying and/or practice, students will eventually use the strategy automatically. Automization occurs when a strategy can be executed without close metacognitive monitoring. At the point of automization, students can benefit from outcome feedback because it helps them to adapt their performance based on their own personal capabilities, such as when a basketball free throw shooter adjusts their throwing strategy based on the results of their last shot3. However, even experts will encounter subsequent difficulties after a strategy becomes automatic, and this will require them to shift their monitoring back from outcomes to processes (p. 307).

따라서 자동성은 대부분의 모델에서 중요한 측면이다. 여기서, 성찰을 위한 세 가지 측면이 있다.
Thus, automaticity is an important aspect in the majority of the models. Here, there are three aspects for reflection.

  • 첫째, SRL에 영향을 미치는 자동 작업이 있습니다. 예를 들어, Pintrich(2000)는 사전 지식으로의 접근을 언급했고 Boekaerts(2011)는 목표 활성화에 대해 논의했다.
  • 둘째, Winne(2011)이 제안한 바와 같이, 학생들의 목표에 도달하기 위한 다수의 학습전략의 제정으로 이해될 때, 자기조절도 암묵적으로 일어날 수 있다고 가정할 수 있다. 이것은 학생들이 전략적으로 행동하기 위해 명백하고 의식적이며 목적적인 행동이 필요하지 않을 정도로 SRL 전략을 사용하는 데 있어서 매우 진보할 수 있다는 것을 의미한다. 그럼에도 불구하고, 이것은 연습이 필요하다.
  • 셋째, 일부 자동 반응, 특히 일부 감정, 심지어 일부 복잡한 감정 조절 전략은 학습에 긍정적이지 않을 수 있다. 예를 들어, Boekaerts(2011)는 웰빙 경로가 학생들이 알지 못하는 경우에도 활성화될 수 있다고 언급한다. 따라서 학생들이 이러한 부정적인 자동 과정을 인식하도록 돕는 것은 [학습 지향적인 자기조절]을 강화할 수 있는 잠재력을 가질 수 있다.
  • First, there are automatic actions that affect SRL; for example, Pintrich (2000) mentioned access to prior knowledge and Boekaerts (2011) discussed goal activation.
  • Second, we can assume that even self-regulation, when it is understood to be the enactment of a number of learning strategies to reach students’ goals, can happen implicitly, as proposed by Winne (2011). This means that students can be so advanced in their use of SRL strategies that they do not need an explicit, conscious, purposive action to act strategically. Nevertheless, this takes practice.
  • Third, some automatic reactions, particularly some emotions, and even some complex emotion-regulation strategies may not be positive for learning (Bargh and Williams, 2007). For example, Boekaerts (2011) mentions that the well-being pathways can be activated even when students are not aware. Therefore, assisting students to become aware of those negative automatic processes could have the potential to enhance self-regulation that is oriented toward learning.

맥락
Context

SSRL 모델은 맥락의 역할뿐만 아니라 사회적 영향력을 행사하여 개인의 자율규제를 촉진하는 다른 외부 출처(집단 구성원, 교사 등)의 능력이나 협력하는 동안 공동으로 규제하는 학생 집단의 능력을 강조하는데, Zimmerman(2000)은 그의 Cyclical phase model에 맥락을 포함시키지 않았고, 특정 전략 "환경 구조화"만 약간 언급하고 있다. 그러나 그의 3차원 및 다단계 모델에서 [맥락의 영향과 및 대리 학습]은 자기조절 능력 개발의 핵심이다. Boekaerts와 Niemivirta(2000)는 맥락에 대한 학생들의 해석이 다른 목표 경로를 활성화하고 이전의 경험이 학생들이 교실에서 채택하는 다양한 역할(예: 조커, 괴짜)에 영향을 미친다고 주장한다. 윈(1996년), 핀트리치(2000년), 에프클라이드(2011년) 모델의 경우 맥락은 다음과 같다.
The SSRL model emphasizes not only the role of context, but also the ability of different external sources (group members, teachers, etc.) to promote individual self-regulation by exerting social influence (CrRL) or of groups of students to regulate jointly while they are collaborating (SSRL) (Järvelä and Hadwin, 2013). Zimmerman (2000) did not include context in his Cyclical Phases model, only a minor reference to the specific strategy “environmental structuring.” However, in his Triadic and Multi-level models, the influence of context and vicarious learning is key to the development of self-regulatory skills (Zimmerman, 2013). Boekaerts and Niemivirta (2000) posits that students’ interpretation of the context activates different goal pathways and that previous experiences affect the different roles that students adopt in their classrooms (e.g., joker, geek). For Winne (1996), Pintrich (2000), and Efklides (2011) models, context is:

  • (1) 작업 요구에 적응하는 데 중요하다.
  • (2) 학생들이 상황으로부터 정보를 받고 그에 따라 전략을 조정할 때 피드백의 고리의 일부.
  • (1) important to adapt to the task demands, and
  • (2) part of the loops of feedback as students receive information from the context and adapt their strategies accordingly.

요약하면, 모든 모델은 SRL에 대한 중요한 변수로 컨텍스트를 포함한다. 그럼에도 불구하고, Hadwin, Järvelä 및 Miller의 연구를 제외하고, 다른 맥락이나 작업 맥락이 SRL에 어떻게 영향을 미치는지 탐구하는 데 다른 사람들에 의해 수행된 연구는 많지 않다.
In sum, all of the models include context as a significant variable to SRL. Nevertheless, with the exception of Hadwin, Järvelä, and Miller’s work, not much research has been conducted by the others in exploring how significantly other contexts or the task context affect SRL.

논의
Discussion

본 검토의 목적은 SRL의 교육심리모델을 비교하는 것이었다. 이 목표를 달성하기 위해 포함된 모델을 제시하고 비교했다. 다음으로, 몇 가지 최종 결론이 제시될 것이다.
The aim of this review was to compare educational psychology models of SRL. To achieve this goal, the included models have been presented and compared. Next, some final conclusions will be presented.

모델에 대한 메타분석적 경험적 증거
Meta-Analytical Empirical Evidence for the Models

모든 모델은 주요 측면 중 일부에 대한 타당성을 뒷받침하는 경험적 증거를 가지고 있다. 그러나 SRL 모델은 많은 수의 프로세스를 공유하기 때문에 경험적 증거에 상당한 중복이 있다. 예를 들어, 자기효능감은 일부 SRL 모델에서 중요한 변수입니다. 따라서 고등교육 학생의 자기효능감에 영향을 미치는 요인에 대한 반 딘터 외 연구진(2010) 검토를 고려한다면, 중요한 SRL 과정으로서 자기효능감을 강조하는 모든 모델에 영향을 미친다. 이러한 이유로, 특정 SRL 모델에 맞춘 각각의 개별 경험적 기여를 분리하여 다른 5개 모델에 적용하는 것은 매우 복잡할 것이다. 결과적으로, 분석은 SRL 분야에서 수행된 메타 분석에서 비롯되는 더 많은 횡단적 발견에 초점을 맞출 것이다.
All of the models have empirical evidence that supports the validity to some of their main aspects. However, because the SRL models share a high number of processes, there is a significant overlap in the empirical evidence. For example, self-efficacy is a crucial variable for some SRL models (e.g., Pintrich, 2000; Zimmerman, 2000). Thus, if we consider van Dinther et al. (2010) review on factors affecting self-efficacy in higher education students, it has implications for all those models that emphasize self-efficacy as a crucial SRL process. For this reason, trying to disentangle each individual empirical contribution tailored to a specific SRL model and applying it to the other five models would be very complex. As a consequence, the analysis will focus on more transversal findings, which stem from the meta-analyses conducted in the SRL field.

SRL 효과를 연구하기 위한 주요 목적으로 세 가지 메타 분석이 수행되었고 네 번째 메타 분석은 SRL 연구에 직접적인 영향을 미치는 학습 기술 개입을 탐구했다. 
Three meta-analyses have been conducted with the main aim to study SRL effects (Dignath and Büttner, 2008; Dignath et al., 2008; Sitzmann and Ely, 2011) and a fourth meta-analysis have explored learning skills interventions with direct implications for SRL research (Hattie et al., 1996).

첫째, 해티 외 연구진(1996)과 관련하여, 그들은 SRL 이론이나 모델의 미분 효과를 탐구하지 않았다. 이러한 한계에도 불구하고, 한 가지 흥미로운 결론은 다음과 같았다. "다음과 같은 훈련을 권장할 수 있다. (a) 맥락 속에서의 훈련, (b) 대상 콘텐츠와 동일한 도메인 내의 과제를 사용한 훈련, (c) 그리고 높은 수준의 학습자 활동과 메타인지 인식을 촉진하는 훈련."
First, regarding Hattie et al. (1996), they did not explore differential effects of SRL theories or models. Despite this limitation, one interesting conclusion was that: “it is recommended that training (a) be in context, (b) use tasks within the same domain as the target content, (c) and promote a high degree of learner activity and metacognitive awareness” (Hattie et al., 1996, p. 131).

반면 Dignath과 Büttner 추가 secondary-education 학생들(2008년)두번째로, Dignath의 작품은,primary-school 학생들에서 Serial통과 번호 개입의 효과를 탐험했다. 으로서 후자에서, 초등 학교 결과들에 대한 추출되는 학업 수행에 영향 크깄다 더하여 만약“개입social-cognitive 이론(B=0.33)보다는 초인지 이론에 근거하였다(참조 범주)” 높은 "만약 개입 또한 초인지(B=0.39)과 동기 strateg의 명령을 포함했다.ies(B=0.36)". 동일한 연구에서는 그와 같은 변수에 대해 중등 교육 결과를 효과 크기 더 높을 것:발견되었다.

Secondly, Dignath’s work explored the effects of SRL interventions in primary-school students (Dignath et al., 2008), while Dignath and Büttner (2008) added secondary-education students. As extracted from the latter, regarding primary school results, effects size on academic performance were higher if “the intervention was based on social-cognitive theories (B = 0.33) rather than on metacognitive theories (reference category)” plus “if interventions also included the instruction of metacognitive (B = 0.39) and motivational strategies (B = 0.36)” (p. 246). In the same study, effects sizes for secondary education results about the same variables were found to be higher:

만약 개입 초인지 반사(B=0.82)나 동기 전략에 집중했다“만약 개입 초인지 이론적 배경(참조 범주)보다는social-cognitive(B= -1.41)또는 동기 이론에(B= -0.97)기반을 두고 있다.”+"보다는 인지 전략(참조 범주)에 있었지만,highe(B=0.56).개입보다는 초인지 인지 전략 촉진을 위한 R(우편 246)(B= -0.64)".
“if the intervention was based on metacognitive theoretical background (reference category) rather than on social-cognitive (B = -1.41) or motivational theories (B = -0.97)” plus “if the intervention focused on metacognitive reflection (B = 0.82) or motivation strategies (B = 0.56) rather than on cognitive strategies (reference category), but higher for interventions promoting cognitive rather than metacognitive strategies (B = -0.64)” (p. 246).

Sitzmann과 일리(2011년)에 의한 지난 메타 분석, 어떻게 어른들은 두가지 설정:고등 교육과 일터 학습을 규제하고 영화에 초점을 맞추었다. 로 Dignath와 동료들 거 이 저자들, 진행으로 Serial통과 번호 이론적 배경을 포함하지 않았다. 하지만 그들은 이 논평의 목적에 적용되는 세가지 중요한 결과를 뽑아 냈다.
The last meta-analysis, by Sitzmann and Ely (2011), focused on how adults regulate their learning in two settings: higher education and the workplace. These authors did not include the SRL theoretical background as a moderator, as Dignath and colleagues did. However, they extracted three key results that apply to the aim of this review.

  • 첫째, 저자들은 [더 많은 SRL 이론에 포함된 구인일수록 학습에 더 강한 영향을 미치는 구인]들이라는 것을 발견했다.
  • 둘째, 실증 결과의 겹치는 부분은 [여러 모델들 사이에 상당히 유의한 관계들이 있음]을 나타내다.
  • 셋째,"자기 조절 과정의 대부분, 학습, 목표 수준, 끈기, 노력과 긍정적인 관계를 가지며, 자기 효능감은 가장 강력한 효과를 보인다. 이들 네 개의 구인이 인지 능력과 학습 전 지식을 통제한 후 학습에 분산의 17%를 차지했다."
  • First, the authors found that the constructs that there were included in more SRL theories were the ones that had stronger effects on learning (p. 433).
  • Second, the overlap of the empirical results indicates that significant relationships exists between the different models.
  • Third, “most of the self-regulatory processes exhibited positive relationships with learning, goal level, persistence, effort, and self-efficacy having the strongest effects. Together these four constructs accounted for 17% of the variance in learning after controlling for cognitive ability and pre-training knowledge” (p. 438).

세 가지 주요 결론들 이 4meta-analyses에서 추출할 수 있다.
Three main conclusions can be extracted from these four meta-analyses.

  • 첫째, SRL은 학습에 영향을 미치는 결정적 요인을 묶어주는 강력한 우산이며, 동시에 그 요인들의 관계를 설명하는 포괄적 프레임워크이다.
  • 둘째, SRL 개입은 적절하게 설계되면, 학생들의 학습을 향상시키기 위한 성공적 방법이다.
  • 셋째, SRL 개입은 학생들의 교육수준에 따른 차등적 효과를 갖는다.
  • First, SRL is a powerful umbrella to anchor crucial variables that affect learning, offering, at the same time, a comprehensive framework that explains their interactions.
  • Second, SRL interventions are successful ways to improve students’ learning, if properly designed.
  • Third, SRL interventions have differential effects based on the students’ educational level.

 

  • [사회인지 이론에 기초한 자기조절학습 개입]은 초기 교육 단계(예: 초등)에서 사용될 때, 그리고 학생과 교사를 위한 프레임워크가 제공될 때 더 높은 영향을 미친다. 사회 인지적 모델이 더 포괄적이고 이해하기 쉽기 때문에 이런 일이 일어날 수 있다는 가설이 제기되었다. 또한 이러한 모델에는 동기부여와 정서적 측면이 포함되어 있어 초등교육 중 학업성취도가 더욱 두드러진다. 
  • 더 성숙한 학생(즉, 중등교육 학생)에 관해서는, 그들은 더 많은 [메타인지적 측면을 포함한 개입]으로부터 더 많은 이익을 얻는다. 이것은 아마도 더 구체적인 전략을 사용해야 하는 인지적으로 까다로운 작업의 성능이 증가했기 때문일 것이다. 따라서 이러한 교육수준에서 메타인지모형이 더 높은 영향을 미친다는 가설을 세울 수 있었다. 
  • 마지막으로 고등교육과 직장연수생의 결과는 발견된 4대 예측 변수인 목표수준, 지속성, 노력, 자기효능감이 유의미한 동기부여 가치를 가지고 있으며, 모두 사회인지 이론에서 이해되고 있음을 보여준다. 
  • Self-regulated learning interventions that are grounded in socio-cognitive theory (Bandura, 1986) have a higher impact when used at earlier educational stages (e.g., primary), and when a framework is provided for students and teachers (Dignath et al., 2008). It has been hypothesized that this probably happens because socio-cognitive models (e.g., Zimmerman, 2000) are more comprehensive and easier to understand (Dignath et al., 2008). In addition, these models contain motivational and emotional aspects, which are more salient for academic performance during primary education (Dignath et al., 2008).
  • When it comes to more mature students (i.e., those in secondary-education), they benefit more from interventions including more metacognitive aspects (Dignath and Büttner, 2008). This is probably due to the increased performance of cognitively demanding tasks in which it is necessary to use more specific strategies (Dignath and Büttner, 2008). Therefore, it could be hypothesized that metacognitive models (e.g., Efklides, Winne, and Hadwin) would have a higher impact at this educational level.
  • Finally, the results from higher education and workplace trainees (Sitzmann and Ely, 2011) show that the four biggest predictors that were found—goal level, persistence, effort, and self-efficacy—have a significant motivational value and are all comprehended in the socio-cognitive theory.

이러한 결과는 리처드슨 외 연구진(2012)의 결과와 일치한다.
These results align with those of Richardson et al. (2012), who found that

  • (a) 자기 효능감이 가장 높은 예측 변수였고
  • (b) 목표 설정 전략은 노력 조절을 강화합니다.
  • (c) 다면적인 개입이 더 효과적일 수 있다.
  • (a) self-efficacy was the highest predictor,
  • (b) goal-setting strategy boosts effort regulation, and
  • (c) multifaceted interventions may be more effective (pp. 375–376);


그리고 Robbins et al(2004)의 결과와 함께, GPA에 대한 최고의 예측 변수는 [학업 자기효능감과 성취 동기]였다. 따라서, 개입이 [동기부여와 정서적 측면(즉, 자기 결정과 목표 설정)]을 목표로 한다면 고등교육 학생들은 더 나은 결과를 얻는 경향이 있는 것으로 보인다. 따라서 동기와 감정에 중점을 둔 모델이 더 높은 영향을 미칠 수 있다는 가설을 세울 수 있다. 그럼에도 불구하고 고등교육 학생에 대한 결론은 초중등교육과 마찬가지로 서로 다른 SRL 모델(즉, 이론적 배경) 개입을 명시적으로 비교하는 메타 분석에 기초하지 않는다는 점을 강조하는 것이 중요하다. 

and with the results of Robbins et al. (2004), where the best predictors for GPA were academic self-efficacy and achievement motivation. Therefore, there seems to be a tendency for higher education students to have better results if the interventions are aiming at motivational and emotional aspects—i.e., self-efficacy and goal setting. It could, thus, be hypothesized that models with an emphasis on motivation and emotion (e.g., Boekaerts, Pintrich, and Zimmerman) might have a higher impact. Nevertheless, it is important to emphasize that the conclusions regarding higher education students are not build on meta-analyses that explicitly compared different SRL models (i.e., theoretical backgroud) interventions as are the ones for primary and secondary education.

마지막으로, 디그너트와 동료 메타 분석가들로부터 또 다른 흥미로운 발견이 있었다. 그들은 그룹 활동을 포함한 SRL 개입이 초등 학생들에게는 해롭지만 중등교육 학생들에게는 긍정적인 영향을 미친다는 것을 발견했다. 이러한 결과는 초등교육에서 SSRL 모델 개입의 구현이 주의 깊게 수행되어야 긍정적인 효과를 극대화할 수 있음을 시사한다. 또한 그룹 작업의 양이 증가하는 중등 및 고등 교육에서 SSRL 개입이 필요할 수 있다.
Finally, there was another interesting finding from Dignath and colleagues meta-analyses. They found that SRL interventions, including group work, were detrimental for primary students but that they had positive impact in secondary education students (Dignath and Büttner, 2008). This finding implies that the implementation of SSRL model interventions should be carefully conducted in primary education to try to maximize positive effects. Additionally, SSRL interventions might be needed in secondary and higher education, where the amount of group work increases.

교육적 의미
Educational Implications

네 가지 교육적 함의가 논의될 것이다. 

첫째, 학업성취도에 영향을 미치는 심리적 상관관계(예: 자기효능감, 노력조절, 미루기)를 살펴본 결과, 이러한 상관관계 대부분은 SRL 모델에 포함된다는 결론이다. 또한, SRL 개입은 학생들의 학습을 촉진한다. 따라서, 첫 번째 의미는 학생들의 학습을 극대화할 수 있는 방법을 이해하기 위해 교사들은 SRL 이론과 모델에 대한 교육을 받을 필요가 있다는 것이다. 개입하는 데는 세 가지 방법이 있다. 

  • 첫째, 예비역 교사들은 그들의 미래 직장 적응을 위한 교육학적 훈련을 받아야 한다. 예비 서비스 교사들을 대상으로 수행된 많은 연구가 있지만, 그들이 일을 시작할 때 그러한 훈련의 최종 결과를 탐구하는 종단 연구가 필요하다. 
  • 둘째, 재직 중인 교사들도 SRL에 대한 교육을 받아야 하는데, 이는 그들이 대부분 복무 전 준비 기간 동안 받지 못했기 때문이다. 
  • 셋째, 교사는 그 자신도 학습자로서 SRL 전문성을 얻어야 하는데, 이는 교사의 지식과 교육 기술에 영향을 미치기 때문이다.

Four educational implications will be discussed. First, if we examined the psychological correlates (e.g., self-efficacy, effort regulation, procrastination) that influence academic performance (Richardson et al., 2012), the conclusion is that the vast majority of these correlates are included in the SRL models. Additionally, SRL interventions promote students’ learning (Dignath et al., 2008; Rosário et al., 2012). Therefore, a first implication is that teachers need to receive training on SRL theory and models to understand how they can maximize their students’ learning (Paris and Winograd, 1999; Moos and Ringdal, 2012; Dignath-van Ewijk et al., 2013). There are three ways of intervening.

  • First, pre-service teachers should receive pedagogical training for their future adaptation to the workplace. There is a significant number of studies conducted with pre-service teachers (e.g., Kramarski and Michalsky, 2009Michalsky and Schechter, 2013), however, there is need for longitudinal studies exploring the final outcomes of such training when they start working.
  • Second, in-service teachers also need to receive training on SRL, as they most probably did not receive any during their pre-service preparation (Moos and Ringdal, 2012).
  • Third, teachers should gain SRL expertize themselves as learners, as this will impact their knowledge and pedagogic skills (Moos and Ringdal, 2012).

두 번째 의미는 다른 교육 수준에서 SRL을 가르치는 방법과 관련이 있다. 서로 다른 모델들은 서로 다른 교육 수준에서 더 잘 작동한다. 게다가, 다른 리뷰는 서로 다른 교육 수준 교사들은 예상하지 못한 방향에서 SRL의 다른 접근 방식 사용을 보여 준다. 이 저자들이 발견:
A second implication relates to how to teach SRL at different educational levels. Different models work better at different educational levels (Dignath and Büttner, 2008). Furthermore, another review shows that teachers at different educational levels used different approaches to SRL (Moos and Ringdal, 2012), but not in the expected direction. These authors found that:

  • (a)고등 교육 선생님들이 과목 내용에, SRK 비계를 위해서 제한된 기회를 제공하고 집중하는 경향이 있다.
  • (b)중등 학교 교사지만 SRL 의 관점에서 명료한 지시 사항을 공식화하지 않는다이며 이 기회를 갖고 있다.
  • (c)초등 학교 교사들 더 SRL 관행을 실행하고 있다.
  • (a) higher education teachers tend to focus on the course content, providing limited opportunities for scaffolding SRL;
  • (b) secondary teachers offer more of those opportunities but do not formulate explicit instructions in terms of SRL; and
  • (c) primary teachers implement more SRL practices.

따라서 SRL 연구가 다른 교육 수준에서 SRL의 구현에 대해 말하는 것과 교사들이 교실에서 실제로 하는 것 사이에는 불일치가 있다. 이것은 이전의 시사점으로 되돌아간다. 더 많은 교사 교육이 필요하지만, 개입은 SRL 모델의 차별적 효과를 고려하도록 조정될 필요가 있다.

There is, therefore, a misalignment between what SRL research says about its implementation at different educational levels (Dignath and Büttner, 2008), and what teachers actually do in their classroom (Moos and Ringdal, 2012). This brings us back to the previous implication: more teacher training is then needed, however, it needs to be tailored so that the interventions take the differential effects of SRL models into account.

세번째 의미 배움에 대한 학생들의 행동을 이끌어내는 환경을 만들어 내는 데 관계가 있다. 모든 SRL 모델은 SRL을 목표-유도적이라고 보며, 그래서 학생들의 목표가 최종적인 자기조절적 행동을을 유도한다. 그러나 Boekaerts(2011)의 주장처럼 학생들은 학습 지향적이지 않은 목표(웰빙 경로)를 활성화하고, 결과적으로 회피 목표(예: 시험을 놓친 척)를 향한 자기조절을 하게 될 수 있다. 교사들이 학습 목표에 도움이 되는 교실 환경을 조성할 수 있는 방법을 탐구하는 일련의 연구가 있다. 교육자들 학습을 촉진하기 위해 SRL 대한 학습 교실 분위기를 극대화할 필요가 있다.
A third implication is related to creating environments that leads students’ actions toward learning. All of the models consider SRL as goal-driven, so students’ goals direct their final self-regulatory actions. However, as Boekaerts (2011) argues, students also activate goals not oriented to learning (well-being pathway) and, as a consequence, students might self-regulate toward avoidance goals (e.g., pretending they are sick to miss an exam) (Alonso-Tapia et al., 2014). There is a line of research that explores how teachers can create a classroom environment that is conducive toward learning goals (Meece et al., 2006; Alonso-Tapia and Fernandez, 2008). Educators need to maximize the learning classroom climate for SRL to promote learning.

넷째, SRL 기술의 발달적 접근은 더 학습에 유용합니다. 우리는 이미 SRL 기술이 연습, 피드백 및 관찰을 통해 시간이 지남에 따라 발전한다는 것을 알고 있습니다. 우리는 또한 인지 부하 이론이 주장하는 바와 같이 학생들이 새로운 과제를 수행할 때 높은 인지 부하를 경험한다는 것을 알고 있다. 인지 부하의 영향을 최소화하기 위해 교육 환경을 설계하는 방법에 대해 우리가 알고 있는 것을 고려한다면, SRL 기술의 발달적 접근법이 선택되어야 한다. 이러한 접근 방식은 짐머만의 다단계 모델에서 공식화된 SRL 획득을 위한 네 가지 단계를 고려할 것이다. 관찰, 에뮬레이션, 자기 제어(자동성 포함) 및 자기 조절. 이 접근법은 SRL 기술 개발을 극대화할 것이며 SRL의 중요한 프로세스인 자체 평가를 위해 제안되었다.

Fourth, a SRL skill developmental approach is more beneficial for learning. We already know that SRL skills develop over time with practice, feedback, and observation (Zimmerman and Kitsantas, 2005). We also know that students experience a high cognitive load when performing novel tasks, as claimed by cognitive load theory (Sweller, 1994). If we consider what we know on how to design instructional environments to minimize the impact of cognitive load (Kirschner, 2002), then a SRL skill developmental approach should be chosen. Such an approach would consider the four stages for acquisition of SRL, formulated in Zimmerman’s Multi-Level model (Zimmerman and Kitsantas, 2005): observation, emulation, self-control (including automaticity), and self-regulation. This approach will maximize SRL skill development and has been proposed for self-assessment, which is a crucial process for SRL (Panadero et al., 2016).

미래 연구 라인
Future Research Lines

향후 4개 노선이 논의될 예정이다.

첫째, SRL에 대한 경험적 증거와 학습과 학업성취도 상관관계에 대한 메타분석적 증거의 연관성을 요구해야 한다. 이미 주장했듯이 SRL 모델은 포괄적인 모델입니다. 따라서 모델의 검증은 다음 중 하나를 필요로 하기 때문에 복잡해진다. 

  • (a) 매우 많은 수의 변수를 사용하여 하나의 연구를 수행하거나 
  • (b) 더 좁은 접근 방식으로 여러 연구를 수행합니다. 

그러나 향후 연구가 이전의 메타 분석과 SRL 모델 타당성 연구의 결론을 결합한다면, 우리는 SRL에 대한 이해를 높이고 훨씬 더 구체적인 SRL 모델의 차등 효과를 테스트할 수 있을 것이다. 메타분석적 연구와 일차적 연구 연구를 결합하려는 이러한 시도는 모든 SRL 영역을 포함하고 기존 모델을 상호 연결하는 SRL의 메타 모델의 구축으로 이어져야 한다. 예비 시도는 시츠만과 엘리(2011)에서 찾을 수 있지만, 더 많은 개발이 필요하다.

Four future lines will be discussed.

First, a call for a connection between the empirical evidence on SRL and meta-analytic evidence of correlates of learning and academic performance should be issued (e.g., Hattie et al., 1996; Richardson et al., 2012). As already argued, SRL models are comprehensive models. Therefore, the validation of the models becomes complex, as it requires either

  • (a) conducting one study with a very large number of variables, or
  • (b) conducting a number of studies with a narrower approach.

However, if future research combines conclusions from previous meta-analyses (e.g., Hattie, 2009) and SRL models validational studies, we could advance our understanding of SRL and test even more specific SRL models’ differential effects. This attempt to combine meta-analytic and primary research studies should lead to the construction of a meta-model of SRL, including all SRL areas and interconnecting the existing models. A preliminary attempt can be found in Sitzmann and Ely (2011), however, it needs to be developed further.

둘째, SRL의 구체적인 작동 방식을 이해하기 위해 보다 세밀한 연구도 실시되어야 한다. SRL 모델은 프로세스의 꽤 구체적인 그림을 제공하지만, 여전히 SRL 메커니즘(예: 자기반사가 작동하는 방식, 속성으로 이어지는 상호 작용)을 더 정확하게 이해해야 할 필요가 많다. 이것은 이상한 변수를 제어하는 견고한 실험 설계를 통해 달성될 수 있다.
Second, more fine-grained studies should also be conducted to understand how the specifics of SRL work. Although SRL models provide a quite specific picture of their processes, there is still much needed to understand SRL mechanisms more precisely (e.g., how self-reflection works, interactions that leads to attributions). This could be achieved through solid experimental designs controlling for strange variables.

셋째, 특히 직장 내 성인에게 SRL이 어떻게 적용되는지에 대한 평생 SRL 기술개발에 대한 종단적 연구가 필요하다. 정규 교육 기간 동안 SRL 개발에 대한 상당한 양의 연구가 있다. 그러나 상당한 기간을 포함하는 종단 연구를 추가로 구현하고 성인 생활에서 SRL의 역할을 강조할 필요가 있다. 후자의 관점에서, 우리의 요구는 새로운 SRL 모델을 개발하는 것보다 먼저 사용 가능한 모델이 유효한지 테스트하는 것이다. 또한 SRL에 대한 보다 구체적이고 짧은 기간 동안의 개발에 초점을 맞춘 보다 종단적인 연구가 필요하다. 예를 들어, 특정 중요한 학년(예: 대학교 1학년)에 초점을 맞춘 연구입니다. 학습 일기에 대한 연구는 세로 방향으로 정보를 추출할 수 있는 매우 유망한 연구 흐름이다. 
Third, longitudinal research on the development of SRL skills throughout the life span is needed, especially regarding how SRL applies to adults in their workplace (Sitzmann and Ely, 2011). There is a compelling amount of research on SRL development during formal education years (Paris and Newman, 1990; Ley and Young, 1998; Núñez et al., 2013). However, we need to further implement longitudinal studies that cover a significant amount of years, and emphasize the role of SRL in adult life. In terms of the latter, our call would be to first test if the available models are valid, rather than developing a new SRL model (Sitzmann and Ely, 2011). Additionally, more longitudinal research on SRL, which focuses on its development during more specific and shorter periods of time, is needed. For example, studies that focus on one specific crucial academic year (e.g., first year of university). The research on learning diaries (Schmitz et al., 2011) is a very promising stream of research that allows for extraction of information in a longitudinal manner.

넷째, SRL 프로세스에 대한 새로운 통찰력은 SRL 측정의 최근 개발에서 나올 것이다. SRL 연구에 컴퓨터를 도입하는 것은 SRL을 측정하는 것뿐만 아니라 SRL의 발판을 마련하기 위해 유망한 결과를 보여주고 있다. 이것은 앞으로 몇 년 동안 더 맞춤형 개입과 학습 환경을 제공할 것이며, 이는 기존의 지식 본체에 통합되어야 한다.
Fourth, new insights into SRL processes will come from recent developments in SRL measurement (Panadero et al., 2015b). The introduction of computers in SRL research, not only to measure but also to scaffold SRL, is showing promising results. This will provide more tailored interventions and learning environments over the coming years, which should be integrated into the existent body of knowledge.

결론
Conclusion

자기조절학습은 학생들의 학습에 영향을 미치는 변수를 이해할 수 있는 우산을 제공하는 넓은 분야이다. 지난 20년 동안 SRL은 교육심리학 연구의 주요 분야 중 하나가 되었으며, 현재 이 분야의 발전은 관련성이 지속될 것이라는 신호이다. 이 검토에서 나온 한 가지 결론은 SRL 모델이 연구자와 실무자가 추가로 고려해야 할 측면인 다양한 상황과 모집단에서의 개입에 유익하다는 것이다. 또한 SRL 모델은 다양한 연구 영역(예: 감정 조절, 협업 학습)을 다루므로 연구자가 연구 목표와 초점에 더 적합한 영역을 활용할 수 있다. 연구자들과 교사들이 그들의 개입을 더 효과적으로 조정할 수 있기 때문에 모델의 레퍼토리를 갖는 것은 풍요롭다. 마지막으로, 저는 새로운 세대의 연구자들이 새로운 접근법, 조치, 그리고 물론 SRL 모델을 개발하는 데 앞장서거나, 이미 존재하는 것을 계속 검증할 것을 요청하고 싶습니다. 이러한 미래 발전은 SRL에 대한 우리의 이해와 연구가 수행되는 수단의 변화를 촉진해야 한다.

Self-regulated learning is a broad field that provides an umbrella to understand variables that influence students’ learning. Over the last two decades, SRL has become one of the major areas of research in educational psychology, and the current advances in the field are a signal that its relevance will continue. One conclusion from this review is that the SRL models are beneficial for interventions under different circumstances and populations, an aspect that need to be further considered by researchers and practitioners. Additionally, SRL models address a variety of research areas (e.g., emotion regulation, collaborative learning) and, therefore, researchers can utilize those that better suit their research goals and focus. Having a repertoire of models is enriching because researchers and teachers can tailor their interventions more effectively. Finally, I would like to issue a call for a new generation of researchers to take the lead in developing new approaches, measures, and, of course, SRL models—or to continue validating the ones that already exist. These future advances should promote changes in our understanding of SRL and the means through which research is conducted.

 


 

 

Front Psychol. 2017 Apr 28;8:422. doi: 10.3389/fpsyg.2017.00422. eCollection 2017.

A Review of Self-regulated Learning: Six Models and Four Directions for Research

Affiliations collapse

Affiliation

1Departamento de Psicología Evolutiva y de la Educación, Facultad de Psicología, Universidad Autónoma de MadridMadrid, Spain.

PMID: 28503157

PMCID: PMC5408091

DOI: 10.3389/fpsyg.2017.00422

Free PMC article

 

Abstract

Self-regulated learning (SRL) includes the cognitive, metacognitive, behavioral, motivational, and emotional/affective aspects of learning. It is, therefore, an extraordinary umbrella under which a considerable number of variables that influence learning (e.g., self-efficacy, volition, cognitive strategies) are studied within a comprehensive and holistic approach. For that reason, SRL has become one of the most important areas of research within educational psychology. In this paper, six models of SRL are analyzed and compared; that is, Zimmerman; Boekaerts; Winne and Hadwin; Pintrich; Efklides; and Hadwin, Järvelä and Miller. First, each model is explored in detail in the following aspects: (a) history and development, (b) description of the model (including the model figures), (c) empirical support, and (d) instruments constructed based on the model. Then, the models are compared in a number of aspects: (a) citations, (b) phases and subprocesses, (c) how they conceptualize (meta)cognition, motivation and emotion, (d) top-down/bottom-up, (e) automaticity, and (f) context. In the discussion, the empirical evidence from the existing SRL meta-analyses is examined and implications for education are extracted. Further, four future lines of research are proposed. The review reaches two main conclusions. First, the SRL models form an integrative and coherent framework from which to conduct research and on which students can be taught to be more strategic and successful. Second, based on the available meta-analytic evidence, there are differential effects of SRL models in light of differences in students' developmental stages or educational levels. Thus, scholars and teachers need to start applying these differential effects of the SRL models and theories to enhance students' learning and SRL skills.

Keywords: emotion regulation; learning strategies; metacognition; motivation regulation; self-regulated learning; self-regulation; shared regulation of learning; socially shared regulated learning.

수행능력이 저조한 학생들도 행동-중-성찰 시에는 통찰력이 있다(Med Educ, 2017)
Low performing students have insightfulness when they reflect-in-action
Mike Tweed,1 Gordon Purdie1 & Tim Wilkinson2

 

서론
Introduction

현재의 전문 의료 실무 모델, 즉 학부 의료 교육은 자기 조절, 자기 평가 및 자기 모니터링에 의존한다. 정확한 자체 평가와 자체 모니터링은 의료 전문가의 자기 조절에 필수적이다.

  • 자기 평가는 전반적인 성과에 대한 누적 평가로 간주될 수 있는 반면,
  • 자기 모니터링은 그 순간의 성과와 관련이 있다.

The current model of professional medical practice, and therefore undergraduate medical education, relies on self-regulation, self-assessment and self-monitoring.1-9 Accurate self-assessment and self-monitoring are vital to health care professionals' self-regulation.

  • Self-assessment can be considered as a cumulative evaluation of overall performance, whereas
  • self-monitoring relates to performance in the moment.6910 

[행동-중-성찰]로서의 [자체 모니터링]은 일상 업무에 authentic하다.

  • 임상의가 결정을 내릴 때, 그들은 옳다는 것에 대한 적절한 확신을 가질 필요가 있다.
  • 올바른 진단 또는 관리를 결정하지 못하면 환자에게 해를 끼칠 수 있으며 과소평가된 위험이 될 수 있습니다.
  • 더 나쁜 것은 [잘못된 행동]이 [높은 확실성]으로 유지되는 상황이다. 진단 오류는 병원 실무에서 발생하는 부작용의 10%에 기초한다. 진단 오류의 74~96%가 일부 인지적 요인을 포함하고 있는 것으로 보고되었다.
  • [인지 오류]는 모든 수준에서, 그리고 다양한 방식으로 임상의에 의해 발생한다.
  • 임상의는 그들이 환자의 진단 또는 최적의 치료라고 믿는 것을 고려한다.
  • 그런 다음 그들은 자신의 결정을 정당화하기 위해 도움을 구할 필요가 있는지 아니면 추가 정보를 구할 필요가 있는지 결정한다.
  • 임상 실무에서 의사결정에 대한 부적절한 확실성의 정도는 부작용과 환자 위해를 초래할 수 있다. 따라서 보건의료 전문가나 학생을 평가할 때, [응답에 대한 확실성]을 고려하는 것은 잠재적 가치가 있다.  

Self-monitoring as reflection-in-action is authentic to daily practice.5, 6, 9 

  • When clinicians make decisions, they need to have an appropriate certainty of being correct.1112 
  • Failure to decide on the correct diagnosis or management can lead to patient harm and is probably an underestimated risk.13 
  • Worse is the situation where an incorrect action is held with high certainty. Diagnostic error underlies 10% of adverse events in hospital practice.14 It is reported that 74–96% of diagnostic errors include some cognitive factors.
  • Cognitive errors are made by clinicians at all levels and in different ways.14 
  • Clinicians consider what they believe to be the patient's diagnosis or optimal treatment.
  • They then decide whether they need to seek assistance or additional information in order to justify their decisions.15 
  • In clinical practice, an inappropriate degree of certainty regarding a decision has the potential to lead to adverse outcomes and patient harm.16-18 Therefore, when assessing health care professionals or students, there is potential value in considering their certainty in their responses.19-21

[자신의 결함에 대해 잘 알지 못하는 사람들]은 [자신의 결정이 옳다는 확신]을 부적절하게 가질 수 있으며, 따라서 실수를 하기 쉽다. 일반 문헌의 상당 부분이 있으며, 의료 문헌은 기술이 낮은 사람들도 자신의 성과에 대해 덜 인식하고 있다는 것을 발견한다: ‘the unskilled are unaware’. 이는 숙련도가 낮은 사람들이 자신의 행동을 반성하고 스스로 바로잡을 수 없기 때문일 수 있다. 그러나 성적이 낮은 응시자는 성적이 좋은 또래와 마찬가지로 객관식 질문 응답 시간, 질문 플래그 지정 및 응답 변화를 분석할 경우, 실제로 '그 순간에in the moment' 성찰한다. 이는 형식이 [성찰과 자기 평가의 결과]에 영향을 미칠 수 있음을 시사한다. 
Those who are less aware of their deficiencies can have inappropriately high certainty that their decisions are correct,22-24 and are therefore more prone to error.25 There is a significant body of general literature 23, 25-30 and health care literature31-33 that finds that those with less skill are also less aware of their performance: ‘the unskilled are unaware’. This could be because the less skilled cannot reflect on their actions and self-correct. However, lower performing candidates, like their higher performing peers, do actually reflect ‘in the moment’ if multiple-choice question response time, flagging questions and changing response are analysed.8 This suggests the format may influence the results of reflection and self-assessment.34

[자기 평가의 정확성]을 결정하는 것은 임상 실습에서 자가 모니터링에 대한 모든 것이 진짜인 것은 아니지만 다양한 방법으로 달성되었다. 예를 들어, 정확할 확률을 추정하는 것은 적절하지 않을 수 있으며, 복잡한 의료 결정과 같은 일부 상황에서는 [확실성의 서면 서술자]가 선호될 수 있다. 환자와 관련된 결정을 내리는 임상의는 일반적으로 확률로 정확할 가능성에 대해 스스로 반성하지 않는다. 즉, 임상의는 '내가 70% 맞을 것 같다'고 생각하지 않는다. 대신, 그들은 [더 많은 정보나 도움이 필요한지] 고려할 수 있다. 이와 같이 의료 전문가 실무에서 일부 측정은 자체 모니터링을 위해 다른 측정보다 더 적절하다. 예를 들어, 반응이 정확할 확률을 추정하는 대신 도움을 구하는 것을 가리키는 확실성 설명자는 임상 실습과 더 유사하다. 마찬가지로 '찾아봐야 할 때'나 '타인에게 양보해야 할 때'와 같은 자기감시 수단을 일상적 실천에서의 [행동-중-성찰]로 보는 것이 더 적절할 수 있으며, 이러한 방법은 이전에 시범적으로 시행된 적이 있다. 이러한 발전은 임상 실무에 정통한 설명자를 사용하는 경우 일반적으로 평가가 더 정확하다는 연구 결과와 일치한다. 
Determining accuracy of self-assessment has been achieved in a variety of ways, not all of which are authentic to self-monitoring in clinical practice. For example, estimating the probability of being correct may not be appropriate35 and written descriptors of certainty may be preferable in some situations,36 such as in complex health care decisions.37 A clinician making a decision related to a patient generally does not self-reflect on his or her likelihood of being correct as a probability. In other words, a clinician does not consider ‘I'm likely to be 70% correct’. Instead, they might consider whether more information or assistance is needed. As such, within health care professional practice, some measurements are more appropriate than others for self-monitoring.5, 9 For example, certainty descriptors that refer to seeking assistance,37 as opposed to estimating a probability that a response is correct,9, 38 are more analogous to clinical practice. Likewise, looking at measures of self-monitoring such as ‘when to look it up’ or ‘defer to others’ as reflection-in-action in daily practice may be more appropriate,5, 6 and such methods have previously been piloted.19, 21 These developments are also consistent with the finding that assessments in general are more accurate if descriptors are used that are authentic to clinical practice.39

[reflection-in-action]에 의해 계층화된 확실성을 포함함으로써 [실제와 유사authentic to practice]한 평가 시스템은 형식의 무작위 제어 시험을 포함한 연구 프로젝트의 맥락에서 가능하다는 것이 입증되었다. 그러나 연구 프로젝트 상황에서의 응답은 [과정 평가in-course assessment]에서 응시자가 어떻게 응답하는지 반영하지 못할 수 있다.
An assessment system that is authentic to practice, by including certainty, stratified by reflection-in-action, has proven possible in the context of a research project, including a randomised controlled trial of formats.19, 21 However, responses in the setting of a research project may not reflect how candidates would respond in an in-course assessment.

자체 모니터링 능력과 정확성 사이의 연관성을 살펴보는 데 있어 추가 고려 사항은 해당 코호트의 능력 범위와 관련이 있다. 그러나 의과대학에서는 높은 능력을 가진 학생 코호트가 미리 선발된다. 그러므로 그들이 '미숙함'의 정도는 명확하지 않다.
A further consideration in looking at the association between ability and accuracy of self-monitoring, relates to the range of ability of the cohort in question.40 Within medical school classes, however, the cohort is preselected as having high ability. Therefore the extent to which they are ‘unskilled’ is not clear.

따라서 본 연구를 안내하는 개념적 프레임워크는 이러한 이전 연구를 바탕으로 하고 다음을 제안합니다. 

  • (i) [자체 모니터링 척도]가 평가 속성에 반영되어야 하는 [바람직한 실천 속성]임을 확인한다. 
  • (ii) [자체 모니터링의 측정방식]authentic practice와 관련이 있어야 한다. (즉, 질문의 문구는 그러한 판단이 임상 실무에서 어떻게 발생하는지와 관련되어야 한다.) 
  • (iii) 의과대학에서는 학생 간 능력이 균질하므로, 다른 그룹의 연구 결과가 의과대학 학생에게 적용되지 않을 수 있음을 의미한다.

The conceptual framework guiding this study therefore draws on these previous studies and suggests:

  • (i) that measures of self-monitoring are desirable attributes of practice that should be reflected in attributes of assessment
  • (ii) that the manner in which self-monitoring is measured needs also to relate to authentic practice (i.e. the wording of the question needs to relate to how such judgements occur in clinical practice); and
  • (iii) that the homogeneous nature of the abilities of individuals within medical school classes means the findings in other groups may not be applicable to medical students.

progress test 상황에서는 전 학년 학생들이 같은 시험 문제를 동시에 출제하는 것이 일반적이다. 학생들이 그 과정을 통과함에 따라 그들의 능력과 그에 따라 점수가 향상될 것으로 기대된다. 그러므로 하나의 progress test에는 다양한 범위의 경험과 능력을 가진 학생들이 동일한 시험을 본다. 이는 경험 수준에 따라 반응을 비교할 수 있는 기회를 제공합니다. 또한, 우리 기관에서 사용하는 progress test는 확실도 수준을 요구한다. 이러한 요인은 학생 경험과 학생 능력에 따라 계층화된 확실성과 정확성 수준 사이의 연관성을 탐구할 수 있는 독특한 기회를 제공한다.
In the setting of a progress test, it is usual for students from all years to sit the same examination questions at the same time. It is expected that as students pass through the course their ability and therefore scores will improve.41 Therefore for any given progress test there are students with a diverse range of experiences and abilities sitting an identical test. This provides an opportunity to compare responses according to levels of experience. Furthermore, the progress test used in our institution also asks for levels of certainty. These factors provide a unique opportunity to explore associations between levels of certainty and levels of correctness, stratified by student experience and by student ability.

이것은 객관식 질문(MCQ) 진행 테스트에서 행동 중 반영으로 설명되는 응답에 대한 후보 확실성의 첫 번째 사용이다. 이 연구는 두 가지 질문을 해결하기 위해 시작되었습니다. 

  • (i) 응답 확실성과 정확성 사이에는 어떤 관계가 있습니까? 
  • (ii) 이러한 확실성과 정확성의 측정은 연도 그룹 및 능력에 따라 어떻게 달라집니까?

This is the first use of candidate certainty regarding responses, described by reflection-in-action, in a multiple-choice question (MCQ) progress test. This research set out to address two questions.

  • (i) What is the relationship between response certainty and correctness?
  • (ii) How do these measures of certainty and correctness vary with year group and ability?

방법
Method

설정
Setting


오타고 의과대학의 의학 학위 과정은 6년 과정으로 4개의 뚜렷한 부분으로 나뉘어져 있다.

  • 첫번째는 일반적인 보건의료과학의 해이다.
  • 이것은 단일 캠퍼스에서 2학년과 3학년으로 이어진다.
  • 이후 학생들은 지리적으로 분리된 세 개의 캠퍼스 중 하나에서 4학년과 5학년 과정을 밟는다.
  • 마지막 해는 교육생 인턴(TI)의 해로, 학생들은 많은 다른 건강 관리 지역에 퍼져 있다. 비록 TI가 아직 학생이지만, 그들은 감독 아래 다양한 임무를 수행하는 건강 관리 팀의 구성원이다.

2-5학년 학생들은 모두 progress test를 보아야 한다.

The Medicine degree course at the University of Otago Medical School is a 6-year course that is divided into four distinct sections.

  • The first is a common health science year.
  • This is followed by years 2 and 3 at a single campus.
  • Following this, the students undertake years 4 and 5 at one of three geographically separate campuses.
  • The final year is a Trainee Intern (TI) year, with students spread across many different health care locations. Although TIs are still students, they are members of health care teams undertaking a variety of duties under supervision.

All students in Years 2–5 are expected to sit the progress test.

경과검사
Progress test

진도 테스트는 1년에 두 번 온라인으로 제공됩니다. 각 테스트는 무작위로 전달되는 150개의 MCQ로 구성됩니다. 각 MCQ는 스템, 질문 과제 및 5-16가지 옵션을 통합한다. 그 내용은 과정을 마칠 때까지 어느 시점에나 핵심 커리큘럼의 모든 측면과 관련이 있다.
The progress test is delivered online twice per year. Each test is made up of 150 MCQs delivered in random order. Each MCQ incorporates a stem, question task and a range of 5–16 options. The content is related to any aspects of the core curriculum at any point through to the completion of the course.

이 시험은 시험 조건 하에서 실시되지 않으며 학생들은 시험을 치를 수 있는 2주간의 기간이 있다. 학생들은 참고자료를 찾아보지 않고 시험에 참여하고 도전하도록 권장되지만, [확실성 응답certainty response]을 사용하여 이를 인정한다. 각 질문에 따라 학생들은 설명자를 기준으로 확실도 등급을 완성합니다(표 1).
This test is not administered under examination conditions and the students have a 2-week window to undertake the test. The students are encouraged to engage with and undertake the test without seeking resources, but acknowledge this by the use of the certainty response. Following each question the students complete a certainty rating based on descriptors (Table 1).

개별 시험에서 학생 개개인이 획득한 점수는 능력 부족을 벌하는 데 사용되지 않는다. 다만 정답 수가 찍어서맞출 확률(chance) 이하이거나, 시험 시간이 적은 학생(문항당 평균 20초 미만)은 개인적 교육 참여도에 대해 고려해보아야 할 수 잇으므로, 해당 학생진도위원회에 보고한다.
The score achieved by an individual student on an individual test is not used to penalise a lack of ability. However, students whose number of correct answers is at or less than chance or who spend little time on the test (a mean of < 20 seconds per question) are reported to the relevant student progress committee as this may inform consideration of their degree of engagement in personal education.

채점에 따라 각 연도 그룹의 최소 기준은 정답의 총 수를 기준으로 설정되었습니다.42 최소 기준은 피드백의 일부로 학생들에게 제공됩니다.

  • 모든 학생들에게 주어지는 추가 피드백에는 [학년별 각 확실도 수준에 따른 정답 비율]이 포함되어 있었다.
  • 개별 학생에게 주어지는 피드백에는 [커리큘럼 분야 또는 영역 분류에 따라, 각 확실도 수준에 따른 정답 비율]이 포함되었다.

2015년의 시험은 두 개의 다른 문제 풀로 구성되었다.
Minimum standards for each year group were set following the scoring, based on total number of correct answers.42 The minimum standards are given to students as part of their feedback.

  • Additional feedback given to all students included means of proportion correct for each level of certainty by year group.
  • Individual feedback included proportion correct for each level of certainty and proportion correct by curriculum discipline or domain categorisation.

The tests in 2015 were made up of two different pools of questions.

분석.
Analysis

혼합 모형 로지스틱 회귀 분석을 사용하여 확실도 수준, 검정 번호, 연도 그룹, 정답 수가 검사 시 표준보다 높거나 낮거나 이러한 요인 간의 모든 가능한 교호작용에 대한 항을 사용하여 모든 개별 문항에 대해 정답의 로그 확률을 모델링했습니다. 이 모형에는 학생과 모든 예측 변수, 그리고 학생과의 교호작용에 대한 랜덤 항이 포함되어 있습니다(학생이 1년 그룹에만 속해 있기 때문에 연도 그룹과 관련된 항은 제외). sas 9.4(SAS Institute Inc., Cary, North Carolina, 미국)의 글림믹스 절차를 사용하였다. 
A mixed model logistic regression analysis was used to model the log odds of being correct for any individual question with terms for level of certainty, test number, year group, number correct being above or below standard on examination and all possible interactions between these factors. The model included random terms for student and all of the predictors, and their interactions, with student (except those involving year group, as students were only in one year group). The glimmix procedure of sas 9.4 (SAS Institute Inc., Cary, North Carolina, USA) was used. 

결과.
Results


1차 시험 응시자는 1114명으로, 이 중 2학년 290명(정답 30.8%, 기준 67명), 3학년 279명(정답 36.6%, 기준 26명), 4학년 260명(정답 42.5%, 기준 14명), 5학년 285명(정답 280명)이었다.47.2%의 정확도, 5는 표준 이하).
2차 시험 응시자는 1114명으로, 이 중 2차 시험 287명(정답 31.2% 이하 73명), 3차 시험 272명(정답 232명, 정답 36.4% 이하 40명), 4차 시험 266명(정답 41.6% 이하 16명), 5차 시험 289명(정답 285명 이상 285명)이었다.
48.1%의 정확도, 4는 표준 이하). 

Test 1 was sat by 1114 students, of whom 290 were in Year 2 (223 were above the standard of 30.8% correct, 67 below the standard), 279 were in Year 3 (253 were above the standard of 36.6% correct, 26 below the standard), 260 were in Year 4 (246 were above the standard of 42.5% correct, 14 below the standard) and 285 were in Year 5 (280 were above the standard of 47.2% correct, 5 below the standard).
Test 2 was sat by 1114 students, of whom 287 were in Year 2 (214 were above the standard of 31.2% correct, 73 below the standard), 272 were in Year 3 (232 were above the standard of 36.4% correct, 40 below the standard), 266 were in Year 4 (250 were above the standard of 41.6% correct, 16 below the standard) and 289 were in Year 5 (285 were above the standard of 48.1% correct, 4 below the standard).

각 확실도 수준에 따른 MCQ 보기의 수는 거의 차이가 없었다(모든 확실도 수준에 대해 중위 6, 사분위간 범위 5-8). 전체적으로 51%의 경우, 정답을 맞추었고, 85%는 높은 확실성, 65%는 중간 정도, 38%는 낮은 확실성, 32%는 확실성이 없었다.
There was little difference in the number of MCQ options for each level of certainty (median 6, interquartile range 5–8 for all levels of certainty). In total, on 51% of occasions the questions were answered correctly, 85% with high certainty, 65% with moderate, 38% with low and 32% with no certainty.

혼합 모형 로지스틱 회귀 분석은 희소 데이터 때문에 4차 교호작용에 대해 가능하지 않으므로 교호작용이 포함되지 않았습니다. 모든 [3차 교호작용]이 있는 모형에서 확실도*테스트*표준, 확실성*연도 그룹*표준 및 검정*연도 그룹*표준 교호작용이 유의하지 않았으므로(각각 p = 0.30, 0.92, 0.43) 모형에서 제거되었습니다. 후속 모델인 Test*Standard와 Year group*Standard 교호작용은 유의하지 않았으며(각각 p = 0.20, 0.18)
The mixed-models logistic regression analysis was not possible for the four-way interaction because of sparse data, and hence the interaction was not included. In the model with all three-way interactions, Certainty*Test*Standard, Certainty*Year Group*Standard and Test*Year group*Standard interactions were not significant (p = 0.30, 0.92, 0.43, respectively) and so were removed from the model. In the subsequent model Test*Standard and Year group*Standard interactions were not significant (p = 0.20, 0.18, respectively) and were removed from the model.

결과 로지스틱 모형(표 2)에서 확실도*테스트*학년 그룹, 확실성*기준(위/아래)테스트*학년 그룹 상호작용이 유의했습니다(각각 p < 0.0001, p < 0.0001, p = 0.001). 모델은 주어진 테스트, 표준 및 연도 그룹(표 3)의 각 확실도 수준에 대한 정확성에 대한 승산비(OR)를 계산하는 데 사용되었다. OR은 2학년 학생들이 [기준 이하]이고, [답안에 대한 확신이 없는 질문]에 대해 계산되었다.
In the resulting logistic model (Table 2) the Certainty*Test*Year group, Certainty*Standard and Test*Year group interactions were significant (p < 0.0001, p < 0.0001 and p = 0.001, respectively). The model was used to calculate odds ratios (ORs) for correctness for each level of certainty given test, standard and year group (Table 3). The ORs were calculated relative to questions answered by Year 2 students who were below standard and had no certainty in their answers.

 

가장 경험이 부족하고 가장 낮은 수행자인 시험 1의 2학년 최소 기준 미달자를 포함한 모든 그룹, 표준 및 시험 번호의 경우, 확실도가 증가할 때마다 정확할 확률이 유의하게 증가하였다(모든 p < 0.0001).e all p < 0.01).
For all groups, allowing for year group, standard and test number, including Year 2 students who were below the minimum standard for Year 2 on Test 1, the most inexperienced and lowest performers, there were significant increases in the odds of being correct with each increasing level of certainty (all p < 0.0001, except from no to low certainty where all p < 0.01).

낮은 확률과 불확실한 확률에 대한 OR은 1.15(95% 신뢰 구간 [CI], 1.03–1.29)로 표준보다 낮았다(p = 0.02). 중간 대 낮은 확실성에 대한 OR은 1.15(95% CI, 1.03–1.27) 더 높았다(p = 0.009). 높은 확실성 대 중간 확실성의 경우 OR은 1.09배(95% CI, 0.94–1.25)로 유의하게 다르지 않았다(p = 0.26). 예를 들어, 2학년의 경우 표준보다 낮은 확률과 높은 확실성의 OR은 2.20/1.38(표 3) = 1.59로 표준 1.39(표 3)보다 1.15배 높다. 표 전체에 동일한 비율이 적용되므로, 이는 학년별 그룹 및 확실도 수준에서 확인할 수 있습니다.
The ORs for low versus no certainty were 1.15 (95% confidence interval [CI], 1.03–1.29) higher for those above the standard than those below (p = 0.02). The ORs for moderate versus low certainty were 1.15 (95%CI, 1.03–1.27) higher (p = 0.009). For high certainty versus moderate certainty the ORs were not significantly different at 1.09 times higher (95%CI, 0.94–1.25) (p = 0.26). For example, for year 2, the OR for low versus no certainty above the standard is 2.20/1.38 (Table 3) = 1.59, which is 1.15 times higher than for below the standard 1.39 (Table 3). As the same ratio applies throughout the table, this can be seen across year groups and levels of certainty.

논의
Discussion

우리는 [정답 확률이 확실성의 수준과 강하게 연관되어 있다]는 발견에 의해 결정되는 자체 모니터링의 정확성의 증거를 발견했다. 또한, 이전 연구와 달리, 우리는 [가장 정확할 가능성이 가장 낮은 학생]들, 특히 저학년 그룹에 있는 학생들, 가장 경험이 적은 학생들, 그리고 기준 이하의 성과를 가진 학생들에서도 그러한 정확한 자기 모니터링이 존재한다는 것을 발견했다. 표준 이하와 위의 OR을 비교할 때 낮은 확실도와 낮은 확실도, 낮은 확실도 또는 중간 정도의 확실도 사이에서 OR이 약간 증가했다.
We have found evidence of accuracy of self-monitoring as determined by the finding that the odds of being correct are strongly associated with the levels of certainty. Furthermore, and unlike previous work, we have found such accurate self-monitoring present even in those students who were least likely to be correct, specifically those in the earliest year group, those with the least experience and those with performance below standard. There was a small increase in the OR between no to low certainty and low to moderate certainty, but not moderate to high certainty, when comparing those below and above the standard.

[순간순간의moment-by-moment 성찰]을 장려하는 평가 형식은 자신의 한계에 대한 인식을 자극할 수 있다. 우리는 이러한 측정이 중요한 문헌과 달리 잘 수행되는 이유 중 하나가 [확실성 질문의 문구와 형식]이 임상 실습에 더 authentic했기 때문일 수 있다고 가정한다. 구체적으로, 문구는 정확할 가능성을 추정하기보다는 '찾아볼 때' 또는 '다른 사람에게 양보할 때'를 언급하였다. 응답 척도는 인지적 구조를 반영할 때 가장 잘 작동하는데, 이 경우 행동 중 반영을 목표로 하고 도움을 요청할 필요성과 관련이 있다. 확실성 설명자의 표현은 반응 및 의미를 변경할 수 있습니다. 안전하고 효과적인 임상 성과를 보장하기 위해서는 일상적 실무에서 반사를 다루는 평가가 더 중요할 수 있다.
Formats of assessment that encourage moment-by-moment reflection can stimulate awareness of limitations.9 We postulate that one of the reasons these measures perform well, and contrary to a significant body of literature,23, 25-33 could be that the wording and format of the certainty questions were more authentic to clinical practice. Specifically, the wording referred to ‘when to look it up’ or ‘defer to others’ rather than estimating a likelihood of being correct. Response scales work best when they reflect cognitive structuring,39 which in this case was targeted at reflection-in-action and tied to the need to ask for assistance. The wording of certainty descriptors can alter responses and therefore meanings.34, 43 An assessment that addresses reflection-in-action in daily practice could be more important for ensuring safe and effective clinical performance.5


연구 결과에 대한 대안적인 설명은 코호트와 하위 그룹은, 심지어 표준 이하의 성능을 가진 사람들조차도, 다른 요인 때문에 자기 모니터링의 증거를 보여주었다는 것이다. 이러한 요소에는 다음과 같은 것들이 포함될 수 있다.

  • 일반적인 프로세스가 자기 모니터링 용어보다는 자기 반성을 장려한다. 
  • 또는 의학적 학위 및 자체 모니터링 능력에 따라 선택된 이러한 학생 집단에게 고유한 요인.

An alternative explanation for the findings is that the cohort and subgroups, even those with performance below standard, demonstrated evidence of self-monitoring because of other factors. These factors may include:

  • the general process encouraged self-reflection, rather than specifically the self-monitoring terminology; or
  • a factor specific to these cohorts of students, selected according to the medical degree, and their ability to self-monitor.

기준 이하의 학생과 비교하여 기준 이상의 학생이 확실도 수준에 따라 정답을 맞출 OR이 작게 증가함을 고려할 때, [기준 이상above standard의 수행자]에 대한 자기 모니터링의 일부 개선이 발생할 수 있다. 그러나 자기 모니터링은 [기준 이하below standard]의 수행자에 대해서도 명백하다.
Given the small increase in the OR of being correct between levels of certainty for those above compared with those below standard, it could be that some improvement in self-monitoring occurs for those performing above standard; however, self-monitoring is apparent even for those performing below standard.

이 연구의 강점은 경험과 성과에 의해 정의된 하위 그룹 내에 충분한 수험자 수가 있는 데이터 세트에 대해 반사 작용으로 확실도 수준을 사용하여 정확성의 정확도를 탐구하는 첫 번째 분석이라는 것을 포함한다. 두 개의 서로 다른 테스트 관리에서 분석을 반복하고 동일한 결과를 찾으면 결과의 일반화 가능성이 높아집니다. 
The strengths of this study include that this is the first analysis, to our knowledge, to explore the accuracy of correctness using levels of certainty as reflection-in-action, for a dataset where there are sufficient examinee numbers within subgroups defined by experience and performance. Repeating the analysis across two separate administrations of a test, and finding the same results, increases the generalisability of the findings.

[도움의 필요성을 인정]한다면 외부 인지적 지원의 역할을 인식할 수 있다. 이 응답 형식에서 생성된 추가 정보는 학생 학습을 안내하고 학생 진행에 대한 결정을 안내할 수 있습니다. 비록 우리는 학생들이 일반적으로 정확한 자기 모니터링을 보인다는 것을 발견했지만, 이것을 덜 할 수 있는 특이치 학생들이 있을 수 있다. 이러한 학생들을 식별하고 추적하며, 그들의 결과를 다른 평가와 비교하고 학습에 미치는 영향을 평가하는 것은 미래 탐구 영역이다. 특히, 현재 연구는 단일 학년도 안에서 확인한 스냅샷을 보고했지만, 시간이 지남에 따라 응답 패턴이 분명해질 수 있다. 우리는 잘못된 정보를 높은 수준의 확실성으로 보유하는 소규모 학생 그룹을 식별할 수 있는 잠재적 이점이 있다고 제안한다.
Acknowledging the need for assistance recognises the role of external cognitive support.15 The extra information generated from this response format can guide student learning and can guide decisions on student progress. Although we have found that the student cohorts generally show accurate self-monitoring, there may well be outlier students who are less able to do this. Identifying and following such students, comparing their results with other assessments and evaluating any effect on learning, are areas for future exploration. In particular, the current study reports a snapshot within a single calendar year, but over time response patterns may become apparent. We suggest that there is potential benefit in being able to identify the small group of students who hold erroneous information with high levels of certainty.

정답 숫자를 가지고 합격 또는 불합격 결정을 내리는 데 사용되는 평가에는 [행동 중 성찰의 설명자]에 의해 정의된 확실성이 포함될 수 있다. 주어진 시점에서 학생 확실성과 관련된 단일 응답 집합은 특히 과정 초기에 충분한 증거로 간주되지 않을 수 있다. 그러나 피드백과 반영하고 개선할 시간에도 불구하고 지속되는 대응 패턴은 주목할 만하다.
Certainty defined by descriptors of reflection-in-action could be included in assessments where the numbers correct are used to inform pass or fail decisions. A single set of responses relating to student certainty, at a given point in time, might not be considered sufficient evidence, especially early in a course; however, a concerning pattern of response that persists despite feedback and time to reflect and improve might become noteworthy.

[실무와 맞는 평가]를 만드는 것은 의학 교육에서 지속적인 도전이다. 우리의 [지식 테스트]가 그러한 [전문적인 관행과 병행되도록 보장]하는 것은 [authentic한 응답의 형식과 표현을 개발]하는 데 도움이 된다. 이 시험 형식은 학생들의 반응이 다른 형식과 다르다는 것을 보여줄 뿐만 아니라, 전문적인 실습에서 기대와 일치한다.
Making assessments authentic to practice is an enduring challenge in medical education. Ensuring our tests of knowledge parallel such professional practice is aided by developing formats and wording of responses that are authentic. This test format not only shows that student responses are different from other formats, but is aligned with expectations in professional practice.

결론들
Conclusions

[행동-중-성찰 설명자]는 실무에 authentic하며, 학생들의 응답에 대한 확실성을 문서화하는 더 나은 방법입니다. 심지어 확실성 수준과 무관하게, 정답을 맞출 가능성이 낮을 [저학년 그룹과 수행능력 저조 그룹의 학생들]도 확실성이 증가함에 따라 정답률이 증가함을 보여주었다. 실제 자체 모니터링에 적합한 reflection-in-action 설명자를 사용하면 능력이 낮은 사람들이 적절한 확실성을 확인할 수 있다.
Reflection-in-action descriptors are authentic to practice and a better way to document students' certainty in their responses. Even students in lower year groups and lower performance groups who were less likely to be correct for any given level of certainty, still demonstrated an increase in correctness with increasing certainty. Using reflection-in-action descriptors, which are authentic for self-monitoring in practice, enables those of lower ability to confirm their appropriate certainty.

 

 


 

Med Educ. 2017 Mar;51(3):316-323. doi: 10.1111/medu.13206. Epub 2017 Jan 12.

Low performing students have insightfulness when they reflect-in-action

Affiliations collapse

Affiliations

1School of Medicine and Health Sciences, University of Otago, Wellington, New Zealand.

2School of Medicine and Health Sciences, University of Otago, Christchurch, New Zealand.

PMID: 28084033

DOI: 10.1111/medu.13206

Abstract

Context: Measuring appropriateness of certainty of responses in a progress test using descriptors authentic to practice as reflection-in-action builds on existing theories of self-monitoring. Clinicians making decisions require the ability to accurately self-monitor, including certainty of being correct. Inappropriate certainty could lead to medical error. Self-assessment and certainty of assessment performance have been measured in a variety of ways. Previous work has shown that those with less experience are less accurate in self-assessment, but such studies looked at self-assessment using methods less authentic to clinical practice. This study investigates how correctness varies with certainty, allowing for experience and performance.

Methods: Students in Years 2-5 were certain of their responses to two iterations of a progress test during one calendar year. Analyses compared correctness for certainty of response, test number, student year cohort and performance level, defined by criterion scores.

Results: The odds of a correct response increased with student certainty for all subsets allowing for year group and ability, including student subsets with less experience and subsets in lower-performance groups.

Conclusion: Unlike previous work showing poorer accuracy of self-assessment for those with less experience or ability, we postulate that our finding of similar increases in correctness with increasing certainty even in the less experienced and lower performance groups, relates to certainty descriptors being worded in a way that is authentic to clinical practice, and in turn related to reflection-in-action.

교육적 퀄리티의 지속적 개선 - 퀄리티 문화 촉진: AMEE Guide No. 147 (Med Teach, 2022)
Continuous enhancement of educational quality – fostering a quality culture: AMEE Guide No. 147
Renee E. Stalmeijer , Jill R. D. Whittingham , Guy W. G. Bendermacher , Ineke H. A. P. Wolfhagen, Diana H. J. M. Dolmans and Carolin Sehlbach

 

서론
Introduction

내부 품질 보증의 목적
Aims of internal quality assurance

[내부 품질 보증(IQA)]은 교육 기관이 교육 품질을 제어, 모니터링, 개선 및 향상시키기 위해 시행하는 일련의 활동과 프로세스로 설명할 수 있다. IQA는 교육 관리와 조직의 일상적인 관행에 필수적일 뿐만 아니라, 조직 내 교육 관행이 표준(즉, 외부 품질 보증)에 부합한다는 인증 기관에 대한 증거를 제공한다. 본 AME 가이드에서는 IQA 실무에 대해 중점적으로 설명합니다.
Internal quality assurance (IQA) can be described as the set of activities and processes implemented by educational organisations to control, monitor, improve and enhance educational quality. IQA is not only essential to the day-to-day practices of educational management and organisation, but also provides evidence towards accrediting bodies that the educational practices within an organisation are up to standard (i.e. external quality assurance). This AMEE Guide specifically focuses on IQA practices.

교육 기관 내에서 IQA의 목적을 논의할 때 많은 다른 개념들이 사용된다. 이러한 개념은 종종 서로 다른 함축적 의미와 정의에 주목하지 않고 상호 교환적으로 사용됩니다.

  • IQA의 목적이 품질 관리인 경우, 교육 기관은 교육 프로그램의 결과가 [미리 결정된 표준에 부합하는지 여부]를 확인하려고 한다(Harvey 2004-2021).
  • 교육 품질 모니터링은 교육 기관이 제공하는 교육의 [품질을 보장하기 위해 시행하고 있는 절차]를 더 많이 말한다(Harvey 2004-2021).
  • 품질 개선은 종종 [어떤 것이 '표준에 부합하는지'(이전에는 특정 표준에 미달했던 곳)]를 확인하기 위해 시행 중인 프로세스를 말합니다(Williams 2016).
  • Williams(2016)는 품질 향상이라는 용어가 학생들의 [학습 경험을 증가시키는 의도적이고 지속적인 과정]을 기술한다고 제안한다.

Many different concepts are used when discussing the aims of IQA within educational organisations. These concepts are often used interchangeably without noting different connotations and definitions that are attached to them.

  • When the aim of IQA is quality control, educational organisations want to check whether the outcomes of an educational programme are conform predetermined standards (Harvey 20042021). 
  • Monitoring educational quality refers more to the procedures that an educational organisation has in place to ensure the quality of education provided (Harvey 20042021).
  • Quality improvement often refers to processes in place to ensure that something is ‘up to standard’ (where it previously was below a certain standard) (Williams 2016).
  • Williams (2016) suggests that the term quality enhancement describes the deliberate and continuous process of augmenting students’ learning experiences (QAA 2003).

품질 관리, 모니터링, 개선 및 향상은 모두 IQA의 중요한 목표입니다. 그러나 각 개념에는 고유한 표준과 프로세스가 있습니다. 따라서, 교육 기관은 IQA의 어떤 목표를 향해 노력하고 있는지, 그리고 그러한 목표를 달성하기 위한 올바른 프로세스가 마련되어 있는지 여부를 고려해야 합니다. 

Quality control, monitoring, improvement and enhancement are all important goals of IQA. However, each concept comes with its own standards and processes. Therefore, an educational organisation needs to consider which goals of IQA it is striving towards and whether the right processes are in place to attain them.

선의의 부작용 – 균형 추구
Adverse effects of good intentions – seeking balance

교육 품질의 '관리being in control'와 건전한 IQA 시스템 보유는 인증 기관의 중요한 관심 분야이다(EUA 2009). 그러나 결과적으로 [품질 보증]은 '먹이가 필요한 짐승' 즉 체크 표시가 필요한 관료적 상자의 목록으로 간주될 위험이 있다(Newton 2000). Harvey와 Stensaker(2008)는 품질관리 데이터의 지속적인 생성이 직원 및 학생의 요구와 단절되어 실제로 교육 향상과 향상을 저해한다는 신호를 보냈다. 궁극적으로, 교육의 질 [모니터링]의 중요성을 소홀히 하지 않으면서도, IQA의 핵심에는 [향상enhancement]이 있어야 한다는 Kleijnen et al(2014)의 연구에 참여한 교사들의 목소리처럼, 질 관리 및 개선이 모두 필요하다. 간결성을 위해, 본 가이드는 [모니터링 및 강화monitoring and enhancement]에 대해 설명합니다.

  • [모니터링]은 IQA의 [제어 및 모니터링 목표]를 모두 다루고,
  • [향상enhancement]은 IQA의 [개선 및 향상 목표]를 모두 다루룰 것이다.


‘Being in control’ of educational quality and having a sound IQA system are important areas of attention for accreditation bodies (EUA 2009). As a consequence, however, quality assurance runs the risk of being considered a ‘beast that requires feeding: a list of bureaucratic boxes that needs to be ticked (Newton 2000). Harvey and Stensaker (2008) signalled that the continuous generation of quality control data has often been disconnected from staff and students’ needs which actually inhibited educational improvement and enhancement. Ultimately, both quality control and improvement are needed, as also voiced by teachers participating in a study by Kleijnen et al. (2014) who acknowledged that enhancement should be at the core of IQA without neglecting the importance of monitoring educational quality. For brevity purposes, this guide will from here on out speak of monitoring and enhancement where

  • monitoring covers both control and monitoring goals, and
  • enhancement covers the improvement and enhancement goals of IQA.

양질의 문화 구축
Building a quality culture

유럽 대학 협회(EUA)는 [퀄리티 문화]의 개념을

  • '영구적으로 품질을 향상시키려는 조직 문화'이며, 두 가지 뚜렷한 요소로 특징지어진다
    • [문화적/기술적 요소]: 퀄리티에 관한 가치, 신념, 기대 및 헌신
    • [구조/관리 요소]: 퀄리티를 향상시키고 개별 노력을 조정하는 것을 목표로 하는 정의된 프로세스

The European University Association (EUA) coined the concept of quality culture as

  • ‘an organisational culture that intends to enhance quality permanently and is characterised by two distinct elements:
    • a cultural/psychological element of shared values, beliefs, expectations and commitment concerning quality and
    • a structural/managerial element with defined processes that enhance quality and aim at coordinating individual efforts’ (EUA 2006, p. 10).

퀄리티 문화의 개념은 [IQA 시스템 및 프로세스]뿐만 아니라, 공유된 교육 가치, 유연성, 개방성, 소유의식 및 집단 헌신을 육성하려는 의도를 포착합니다. 퀄리티 문화는 다음에 도움이 된다.

  • 개인의 개선 노력을 조정하고,
  • 상호 기대를 형성하며,
  • 집단 책임을 자극함(EUA 2006).

이러한 요소와 평가 프로그램 간의 시너지를 통해 [지속적인 교육 향상]이 일상적인 교육 실습에 포함되게 됩니다.
The notion of quality culture captures the intention to nurture shared educational values, flexibility, openness, a sense of ownership, and a collective commitment – alongside IQA systems and processes (Sursock 2011; Bendermacher et al. 2020). A quality culture is considered to help

  • coordinate individual improvement efforts,
  • shape mutual expectations, and
  • stimulate a collective responsibility (EUA 2006).

It is through a created synergy between these elements and evaluation programmes that continuous educational enhancement becomes embedded in the everyday teaching practice (Ehlers 2009; Blouin 2019).

이 AMEE 가이드
This AMEE guide

이전의 [가이드 29번]은 [프로그램 평가의 역사]를 살펴보고, 윤리적인 질문을 포함하여 평가 시스템을 설계할 때 물어봐야 하는 다양한 질문 세트를 설명했습니다. Goldie의 제안을 바탕으로 제작된 [67번 가이드]는 [교육 프로그램(과정 수준에서 커리큘럼에 이르기까지)이 변화를 가져왔는지 여부]를 결정하는 데 사용할 수 있는 일반적인 평가 모델의 개요를 제공합니다. 즉, 교육 프로그램의 성과에 초점을 맞추는 것이다.
An earlier AMEE Guide, number 29, (Goldie 2006) looked into the history of programme evaluation and described various sets of questions one needs to ask when designing a system of evaluation, including ethical questions. Guide number 67 (Frye and Hemmer 2012), built on the suggestions by Goldie and provided an overview of common evaluation models which can be used to determine whether an educational programme (ranging from the level of course to curriculum) has brought about change, i.e. focusing on the outcomes of an educational programme.

본 AMEE 가이드는 [퀄리티 문화] 개념을 사용하여, 교육의 IQA에 대한 [포괄적인 접근 방식]을 구축하는 데 초점을 맞추고 있습니다. 우리는 교육 기관이 IQA에 정보를 제공하는 프로세스와 시스템을 최적화하는 동시에 지속적인 교육 퀄리티 향상에 대한 인식과 헌신을 촉진하기 위해 사용할 수 있는 관행(그림 1 참조)을 설명한다. 다음 단락에서는 보건전문교육 분야의 사례를 활용하여 보건전문교육의 질 높은 문화발전이 어떻게 육성될 수 있는지 설명하고자 한다. 우리가 설명하는 관행은 본질적으로 위계적이지 않으며, 그것들을 사용하는 과정에 실질적인 선형성이 없다는 것에 주목하는 것이 중요하다. 조직의 퀄리티 문화를 정의하고 창조하려면, [모든 측면에 동시]에 주의를 기울여야 합니다.

This AMEE Guide focuses on building a comprehensive approach to IQA of education by using the concept of quality culture (EUA 2006; Ehlers 2009; Blouin 2019). We describe practices (see Figure 1) that educational organisations can use to optimise the processes and systems informing IQA while simultaneously fostering the awareness of and commitment to continuous enhancement of educational quality (Bendermacher et al. 2017). Throughout the following paragraphs, we will use cases from the field of health professions education, to illustrate how quality culture development in health professions education can be nurtured. It is important to note that the practices we describe are not hierarchical in nature and that there is no real linearity to the process of employing them. Defining and creating an organisational quality culture requires simultaneous attention to all aspects.

 

우리의 관점 – 반사성
Our perspective – reflexivity

이 가이드는 '태스크포스 프로그램 평가'라는 제목의 마스트리히트 대학교 보건의학과 생명과학부(FHML)의 IQA 전문가 그룹의 관점에서 작성되었습니다. Task Force는 관련 이해 관계자들과 협력하여 FHML 내의 모든 교육 프로그램의 교육 품질을 모니터링하고 향상시킬 책임이 있습니다. 이 책임은 다음과 같이 수행됩니다.

  • (1) 표준화된 기기를 통해 유효하고 신뢰할 수 있는 데이터 수집을 보장
  • (2) 양적 및 질적 연구 방법론의 혼합을 통해 교육의 질에 대한 심층 연구를 수행
  • (3) 관련 이해 관계자에게 교육 품질 보증에 대한 교수진 개발 제공
  • (4) FHML 내에서 프로그램의 지속적인 품질 향상을 위한 대화를 자극

This guide is written from the perspective of an expert group on IQA at Maastricht University, Faculty of Health Medicine and Life Sciences (FHML) entitled ‘task force programme evaluation’. The task force is, in collaboration with relevant stakeholders, responsible for monitoring and enhancing educational quality of all educational programmes within FHML. This responsibility is executed by

  • (1) ensuring valid and reliable data collection through standardized instruments,
  • (2) executing in-depth studies on educational quality through a mix of quantitative and qualitative research methodologies,
  • (3) providing faculty development on educational quality assurance to relevant stakeholders, and
  • (4) stimulating a dialogue towards continuous quality enhancement of the programmes within FHML.

본 AMEE 가이드의 저자들은 모두 보건전문교육대학원 소속 연구원으로 교육과학(RS, IW, DD), 교육심리학(JW), 보건과학(CS), 정책 및 관리(GB) 분야에서 경력을 가지고 있다. 또한 저자(GB) 중 한 명은 [퀄리티 문화]의 개념을 전문적으로 다루는 정책 자문위원으로 그의 연구를 통해 질문화의 개념을 더욱 탐구했다. 우리는 모든 보건 전문 교육 학교가 유사한 전담팀을 고용하는 것은 아니며 때로는 프로그램 평가의 과제가 한 개인의 어깨에 달려 있을 수 있다는 것을 알고 있다. 그럼에도 불구하고, 우리는 우리의 경험, 연구 및 통찰력이 교육 품질 보증에 관련된 모든 사람에게 필요한 지침과 지원을 제공하기를 바란다.

The authors of this AMEE Guide are all researchers within the School of Health Professions Education and have backgrounds in educational sciences (RS, IW, DD), educational psychology (JW), health sciences (CS), and policy and management (GB). In addition, one of the authors (GB) is a policy advisor who specializes specifically in the concept of quality culture and, through his research, has further explored the concept of quality culture. We are aware that not all health professions education schools employ similar task forces and that sometimes the task of programme evaluation may rest on the shoulders of a single individual. Nevertheless, we hope that our experiences, research and insights provide the necessary guidance and support to anyone involved in educational quality assurance.

퀄리티 문화 육성 – 우리는 무엇을 위해 노력하고 있는가?
Fostering a quality culture – what are we striving for?

기본 목표 및 가치 논의 및 결정
Discuss and determine underlying goals and values

퀄리티란 무엇인가?
What is quality?

IQA가 어떤 목표를 가지고 있는지 고려할 때, 해결해야 할 중요한 질문은 '우리가 품질을 말할 때 무엇을 의미하느냐'이다.; 종종 잊혀지는 것은 퀄리티는 보는 사람의 눈에 달려 있다는 것이다. 이로 인해 '퀄리티란 무엇인가'라는 질문에 대해 한 조직 내에서 여러 이해 관계자가 서로 다른 개념을 갖게 될 수 있습니다. 하비와 그린(1993)은 품질에 대한 다섯 가지 다른 개념을 정의하였다: 우수성, 완벽성/우수성, 목적에 맞는 가치, 비용 대비 가치, 혁신. excellence, perfection/consistency, fit-for-purpose, value for money, and transformation

When considering what goals IQA has, an important question to address is ‘what do we mean when we say quality?’; what is often forgotten is that quality lies in the eye of the beholder. This may result in multiple stakeholders within a single organisation having different conceptions when it come to the question ‘what is quality?’. In their seminal work Defining Quality, Harvey and Green (1993) discerned five different conceptions of quality:

  • excellence,
  • perfection/consistency,
  • fit-for-purpose,
  • value for money, and
  • transformation.

질을 ['목적 적합']을 위해 노력하는 것으로 보는 것은, 예를 들어, 교육 목표를 달성하고 졸업생들이 일정한 기준을 통과하도록 보장하는 것을 필요로 한다. 그러나, IQA는 [변혁]의 관점에서 학생들에게 어느 정도 '가치가 추가되었는가'와 학생들에게 권한이 부여되었는지empowered를 판단하기 위해 노력할 것이다. 본 AME 가이드의 범위 밖에서는 각 정의에 대해 자세히 설명하지만, 독자들은 이러한 품질 개념을 숙지할 것을 권장합니다. 이러한 개념에 익숙해지면 교육 기관 내의 이해관계자들이 어떤 정의를 중시하고 그 전경을 논할 수 있는 어휘를 제공할 것이다. 

Seeing quality as striving for fit-for-purpose requires, for example, ensuring that educational goals are attained and that graduates pass a certain standard. Through the lens of quality as transformation, however, IQA would be striving to determine to what extent ‘value has been added’ to the student and that students have been empowered. Although it is outside of the scope of this AMEE Guide to go into depth on each definition, we encourage readers to familiarise themselves with these conceptions of quality. Familiarity with these conceptions will provide a vocabulary through which stakeholders within an educational organisation can discuss which definition(s) they value and foreground.

우리는 교육 기관들은 [늘 서로 다른 유형의 품질을 동시에 달성하는 것을 목표로 할 것]이라고 믿는다. 교육 기관의 순위를 보장하는 것과 비교하여 프로그램의 재정finances이 제대로 되어 있는지 생각해 보십시오. 따라서, 우리는 독자들이 퀄리티에 대해 그들 자신의 조직에 있는 관련 이해 관계자들과 토론할 것을 강력히 권고한다. 왜냐하면, 조직 내에서 IQA의 목표를 정의하는 것과 마찬가지로, 어떤 품질 개념을 가지고 있는지는 다음에 대한 방향과 지침을 제공할 것이기 때문이다.

  • IQA를 위한 도구와 절차를 설계하는 방법
  • 어떤 이해 당사자가 참여해야 하는지
  • 품질 문화를 형성하는 방법

We believe that educational organisations will always be aiming to attain different types of quality simultaneously. Imagine ensuring that the finances of a programme are in order versus ensuring the ranking of an educational organisation. Therefore, we strongly advise readers to discuss with relevant stakeholders in their own organisation what quality means to them. Because, just like defining the aims of IQA within your organisation, the conception(s) of quality that are held will provide direction and guidance on

  • how to design instruments and procedures for IQA,
  • which stakeholders to involve and
  • how to shape a quality culture.

[IQA의 목표퀄리티의 개념에 대한 인식의 불일치]는 생산적인 품질 문화를 구축하는 과정을 방해할 수 있다. 왜냐하면, [퀄리티]를 [목적적합성에 따라 inform하는 과정]은 [퀄리티]를 [변혁에 따라 inform하는 과정]과 다르기 때문이다.
Misalignment in perceptions about goals of IQA and conceptions of quality may thwart the process of building a fruitful quality culture as the processes that inform quality as fit-for-purpose are different to those informing quality as transformation.

어떤 양질의 문화?
Which quality culture?

퀄리티 문화는 기관이 처음부터 개발해야 하는 것도 아니며, '이상적인' 퀄리티 문화도 없다는 것을 깨닫는 것이 중요하다.즉, 각 기관은 [이미] 외부의 발전에 어떻게 반응하는지를 결정하고, 내부적인 협력을 촉진하기 위해 노력하는 특정한 종류의 퀄리티 문화를 보유하고 있다. 또한 퀄리티 문화는 품질 관리를 다루는 조직의 [맥락과 발전 단계]에 의해 영향을 받습니다. 예를 들어,

  • IQA 시스템을 설정하는 초기 단계에 있는 교육 기관은 우선 교육 품질을 모니터링하고 제어하는 데 집중함으로써(즉, 절차와 표준을 설치 또는 미세 조정하는 것) 가장 큰 이익을 얻을 수 있다.
  • 최소 기준이 충족되는지 여부를 모니터링하는 강력한 시스템을 이미 구축한 조직은 조직의 환경 변화에 대처하는 동시에 지속적인 개선으로 초점을 전환할 수 있습니다.


It is important to realise that a quality culture is not something that institutions have to develop from scratch and also that there is no such thing as ‘the ideal’ quality culture. That is, each institution already possesses a certain kind of quality culture which determines how that institution reacts to external developments, and attempts to foster internal collaborations (Bendermacher 2021). Moreover, a quality culture is influenced by the organisation’s context and its developmental phase in dealing with quality management (Harvey and Stensaker 2008). For instance,

  • educational organisations who are in the early stages of setting-up their IQA system would probably benefit most from first focusing on monitoring and controlling educational quality (i.e. to install or fine-tune procedures and standards).
  • Those organisations who already have established a robust system which monitors whether minimum criteria are met, can shift their focus towards continuous enhancement while addressing changes in the organisation’s environment.

조직 문화 평가 지수(상자 1 참조)에 대한 논의와 같은 성찰 연습은 이해 관계자가 자신의 핵심 가치를 공개하는 데 도움이 될 수 있습니다. 이 논의는 이러한 가치와 조직 절차 간의 더 나은 조정으로 이어지는 전략과 솔루션을 형성하는 데 도움이 될 수 있습니다. 이러한 성찰과 대화는 또한 강조를 '일이 잘 되어가고 있는가'에서 '옳은 일이 되어가고 있는가'로 바꾸는 데 도움이 될 수 있다(Cartwright 2007).
Reflection exercises like discussing the Organisational Culture Assessment Index (see Box 1) can aid stakeholders to disclose their core values. This discussion can help shape strategies and solutions that lead to a better alignment between these values and organisational procedures (Berings and Grieten 2012). Such reflections and dialogues can also help to alter the emphasis from ‘whether things are being done well’, to ‘whether the right things are being done’ (Cartwright 2007).

품질 문화 구축 – 구조 및 관리 구성요소
Building a quality culture – structural & managerial components

[정기적인 데이터 유입] 없이는 IQA 시스템이 존재할 수 없다. 이것은 IQA의 목표를 해결하는 데 도움이 되고, 이해 당사자들이 프로그램의 품질을 모니터링하고 향상시킬 수 있도록 정보를 제공한다. 이 제도가 품질문화 강화에 기여할 수 있도록 하기 위해서는 다음과 같은 측면을 고려할 필요가 있다:

  • 도구의 설계와 삼각 측량, 
  • 이해관계자의 참여, 
  • IQA의 사이클릭한 특성.

No system of IQA can exist without a regular influx of data that helps to address the goals of IQA and provides input for stakeholders to monitor and enhance the programme’s quality. To ensure that this system contributes to strengthening the quality culture, the following aspects need to be considered:

  • the design and triangulation of instruments,
  • involvement of stakeholders, and
  • the cyclical nature of IQA.

도구의 설계 및 삼각 측량
Design & triangulation of instruments

설계에 교육 원리 포함
Incorporating educational principles in design

IQA는 교육 활동이나 과정과 같은 [커리큘럼을 구성하는 핵심 구성 요소]에 맞춰져야 하며, 학습과 교육에 대한 [이론과 문헌에 확고하게 기반]을 둔 평가 도구를 구축해야 한다. 즉, 평가 도구의 항목은 문헌이 교육 프로그램의 질을 결정하는 것으로부터 파생되어야 한다. IQA 도구의 설계가 이러한 [교육 원리]에 기초하는 경우, 이는 서로 다른 이해관계자가 실행할 수 있는 데이터 수집 결과의 가능성을 증대시킬 것이다. [교육 원리]는 [교육 프로그램이 효과적인 방법과 이유에 대한 사고 방식]으로 정의될 수 있다(그림 2). 평가하려는 교육 과정이나 프로그램의 성격에 따라 여러 교육 원칙이 적용될 수 있습니다. Box 2에서는 두 가지 예를 제공합니다.

  • (1) 문제 기반 학습을 평가하기 위한 구성주의 학습의 원칙, 그리고 
  • (2) 임상 교육을 평가하기 위한 인지적 견습.

IQA should be geared towards the key components that make up a curriculum, such as educational activities or courses, and should build evaluation instruments firmly grounded in theories and the literature on learning and teaching (Frick et al. 2010). In other words, the items of an evaluation instrument must be derived from what the literature has shown determines the quality of an educational programme. If the design of IQA instruments is based on these educational principles, this will augment the chances of outcomes of data collection being actionable by the different stakeholders (Bowden and Marton 1999; Dolmans et al. 2011). Educational principles can be defined as a way of thinking about how and why an educational program is effective (Figure 2). Depending on the nature of the curriculum or the programme you want to evaluate, multiple educational principles might apply. In Box 2, we provide two examples (1) principles of constructivist learning to evaluate problem-based learning, and (2) cognitive apprenticeship to evaluate clinical teaching.

도구를 설계할 때 [교육 원리]가 중요하다는 사실 외에도, 교육이 고도로 [맥락 특이적]이라는 사실, 즉 이론적 원칙에 기초했을 때, 무엇이 제대로 작동할 것인지는, 맥락적 차이뿐만 아니라 특정 목적과 대상 그룹에 따라 다를 수 있다는 사실도 고려해야 한다. 결과적으로, 가급적 이론적 지침에 기초한 도구의 설계는 여전히 [커스터마이제이션의 문제]로 남아 있다. 목표와 기기가 사용되는 상황에 따라 기기를 지속적으로 조정하고 조정하는 것이 중요합니다.

In addition to the fact that educational principles are important to keep in mind when designing an instrument, it is essential to also consider the fact that education is highly context-specific, i.e. what might work, based on theoretical principles, might differ dependent on the particular aims and target groups as well as contextual differences (Hodges et al. 2009; Kikukawa et al. 2017). As a consequence, the design of instruments, which is preferably based on theoretical guidelines, remains a matter of customisation. It is important to continuously adapt and align your instruments, depending on what your aims are and the context in which the instruments are being used.

  

도구의 삼각 측량
Triangulation of instruments

[IQA의 목적]에 따라 [평가하려는 프로그램의 측면]과 [입력이 필요한 이해 관계자의 도구 설계 요구 사항]이 변경됩니다.

  • 주된 목적이 [책무성 목적]을 위해 [품질을 통제하고 모니터링하는 것]이라면, 대다수의 모집단에서 표준화된 요인 집합에 대해 [타당하고 신뢰할 수 있는 데이터를 수집하는 것]이 우선된다. 이 목표는 데이터 수집에 대한 [정량적 접근법]을 보장한다.
  • 교육의 [질 개선과 향상]에 초점을 맞출 때, 필요한 정보는 본질적으로 [풍부하고 기술적]이며, 보다 [정성적]이어야 하며, 이를 통해 교육을 개선하고 향상시키는 방법에 대한 명확하고 구체적인 의견을 찾을 수 있어야 한다. 교육의 질이 다차원적이고 학습환경이 복잡하기 때문에 이를 측정하기 위해서는 [양적 방법과 질적 방법을 병행]하는 것이 좋다. 설문지, 인터뷰, 강의실 관찰, 문서 분석 및 포커스 그룹이 모두 일반적으로 사용됩니다. 

Depending on the aims of IQA, the aspects of the programme you are trying to evaluate and the stakeholders whose input you need, requirements for instrument design change.

  • When the primary aim is to control and monitor quality for accountability purposes, collecting valid and reliable data for a standardised set of factors from the majority of the population takes precedent (Dolmans et al. 2011). This goal warrants a quantitative approach to data collection.
  • When the focus is on the improving and enhancing of educational quality, the information that is needed should be rich, descriptive and more qualitative in nature so that clear and specific input can be found on how to improve and enhance education. Since educational quality is multidimensional and learning environments are complex, it is recommended to combine both quantitative and qualitative methods to measure it (Cashin 1999). Questionnaires, interviews, classroom observations, document analysis and focus groups are all commonly used (Braskamp and Ory 1994; Seldin 1999).

예를 들어, 먼저 대규모 정량적 학생 설문지를 관리하여 과정의 전반적인 강점과 약점을 파악할 수 있습니다. 그런 다음 후속 질적 초점 그룹은 이러한 데이터에 대해 자세히 설명하고 더 명확한 관점에 배치할 수 있다. 품질 문화를 구축하려면 교육 프로그램의 품질에 대한 전체적인 개요를 제공하고 모니터링 또는 개선 목적에 정보를 제공할 수 있는 데이터를 수집하기 위해 다양한 도구와 절차의 삼각측량이 필요하다.
For instance, one could first evaluate a course by administering a large-scale quantitative student questionnaire to bring into focus the course’s overall strengths and weaknesses. Subsequent qualitative focus groups can then elaborate on these data and place them in a clearer perspective. Building a quality culture requires triangulation of different instruments and procedures to provide a holistic overview of the quality of an educational programme and to collect data that may inform either monitoring or enhancement purposes.

모든 관련 이해관계자 참여
Involving all relevant stakeholders

이해당사자
Identifying stakeholders

지속적인 품질 향상 시스템을 설계할 때 다양한 이해 관계자가 참여해야 합니다. '퀄리티는 보는 사람의 눈에 달려 있다'는 것과 평가가 이루어지는 맥락을 고려해야 하기 때문에, 각 이해관계자는 전체적인 평가 프로그램을 제공하기 위해 교육적 질에 대한 자신의 관점을 추가하도록 초대되어야 한다. 이해 관계자를 식별하기 위해 다음과 같은 질문을 고려할 수 있다.

  • '이 교육의 수혜자는 누구인가?' 
  • '누가 이 교육을 가르치고 관리하는 데 관여하고 있는가?' 
  • 누가 이 교육의 효과를 판단할 수 있습니까? 

When designing a system of continuous quality enhancement various stakeholders need to be involved. Since ‘quality is in the eye of the beholder’ and we need to consider the context in which evaluations take place, each stakeholder should be invited to add their perspective on educational quality to render a holistic programme of evaluation (Harvey and Stensaker 2008). To identify stakeholders one may consider questions like

  • ‘Who are the recipients of this education?’
  • ‘Who are involved in teaching and managing this education?’
  • ‘Who can judge the effectiveness of this education?’.

일단 관련 이해당사자가 확인되면,

  • 그들이 어떻게 그리고 어떤 도구를 통해 관여할 수 있고,
  • 어떤 측면과 교육 수준을 가장 잘 평가할 수 있는지에 대한 문제가 발생하고,
  • 이어서 그들을 참여시키고 접근하는 최적의 타이밍에 대한 질문이 뒤따른다.

Once relevant stakeholders are identified, the question arises of

  • how and through which instruments they can be involved,
  • what aspects and level of education they can best evaluate,
  • followed by the question of best timing of involving them and approaching them.

맥락과 시기에 따라, 각 이해당사자는 교육의 질을 높이는 과정에서 제공할 수 있는 기여뿐만 아니라 자신의 [위치적situated 지식]과 [실제 경험]을 가질 수 있다. 이러한 모든 질문은 적절한 개입이 제도, 인증 또는 심지어 문화적 표준에 따라 다른 형태를 취할 수 있으므로 이해관계자가 관여할 지역적 맥락에 비추어 고려할 필요가 있다.
Depending on context and timing, each stakeholder might have their own situated knowledge and lived experience as well as contribution to offer in the process of enhancing educational quality (Kikukawa et al. 2021). All these questions need to be considered within the light of the local context in which stakeholders will be involved as appropriate involvement may take different shapes depending on institutional, accreditation or even cultural standards.

주요 이해관계자 참여
Involving key stakeholders

[학생]들은 교육의 소비자로서 QA 과정에 중요한 이해관계가 있다고 여겨지기 때문에 전통적으로 과정 평가를 받아왔다. '경험이 풍부한 전문가'로서 과정, 워크샵 또는 교사 성과와 같은 개별 [교육 기관에 대한 상세하고 자세한 정보를 제공]할 수 있습니다. 이 데이터는 검증된 설문지를 통해 양적으로 그리고 인터뷰와 포커스 그룹을 통해 질적으로 수집될 수 있다. 서로 다른 데이터(숫자와 서술, 일반적이고 구체적)가 생성될 수 있지만, 전체적으로 학생들의 관점을 포함하면 [커리큘럼이 설계된 방식]과 비교해서 [커리큘럼이 실제로 실행되는 방식]에 대한 통찰력을 제공할 수 있다. 여기에는 인식된 강점과 개선점을 포함한다. 양질의 문화를 강화하기 위해 학생들은 [교육과 제도적 의사결정에 참여]할 수 있다.

Students have traditionally been subjected to course evaluations, for, as the consumers of education, they are considered to have a crucial stake in the QA process (Coates 2005; Marsh 2007). As ‘experienced experts’, they can provide detailed, information on distinct educational entities such as a course, workshop or teachers’ performance. This data can be collected both quantitatively through validated questionnaires and qualitatively through interviews and focus groups. Although different data might be generated (numeric and narrative, generic and specific), as a whole, involving students’ perspectives can provide insight into the way the curriculum is put into practice compared to how it has been designed, including perceived strong points and points for improvement. To strengthen a quality culture students can also be involved in education and institutional decision-making.

  • 예를 들어, 그들은 학생 평가 위원회(SEC)에서 활동하거나 학생 대표로서 관리 기관의 교수진 및 프로그램 조정자와 함께 일할 수 있다. 이러한 학생들은 종종 이미 콘텐츠 전문 지식을 얻고, 교수진과 공유 언어를 개발하며, 잠재적인 권력 관계를 극복하는 방법을 배웠다. 
  • They can, for instance, serve on a student evaluation committee (SEC) (Stalmeijer et al. 2016) or, as student representatives, join faculty and programme coordinators on management bodies (Elassy 2013; Healey et al. 2016). These students often already have gained content expertise, developed a shared language with faculty, and learned how to overcome potential power relations.

교육 관행에 관한 [설계, 구현 및 의사 결정]에 있어 학생들의 보다 신중한 참여를 향한 강한 움직임이 있다. 이는 디자인 기반 연구, 참여형 디자인, 공동 창작, 공동 디자인, 학생 목소리, 학생-직원 파트너십, 변화 주체로서의 학생, 학생 참여 및 학생 권한 부여와 같은 다양한 학생 참여 접근 방식에 반영됩니다. 교육(디자인) 과정에 학생들의 적극적인 참여를 강화함으로써 [교직원과 학생 모두의 교수와 학습을 동시에 개선]하는 것이 목적이다. 이러한 접근 방식은 단순히 학생들의 목소리에 귀를 기울이는 것을 넘어 학생들이 교사 및 교육 관리와 적극적으로 협력할 수 있도록 하는 데 초점을 맞추고 있다는 점을 강조하는 것이 중요하다. 이러한 접근 방식을 통해 학생과 교직원은 파트너십을 형성하고, 공동 창작 및 (재)디자인 교육을 할 수 있습니다.

There is a strong movement towards more deliberate involvement of students in the design, implementation and decision making regarding educational practices (e.g. Bovill et al. 2016). This is reflected in different, approaches to student participation like design-based research, participatory design, co-creation, co-design, student voice, student–staff partnership, students as change agents, student engagement, and student empowerment (Seale 2009; Anderson and Shattuck 2012; Bovill et al. 2016). By intensifying the active engagement of students in the educational (design) processes, the aim is to simultaneously improve teaching and learning of both faculty and students (Bovill et al. 2016). It is important to stress that this approach goes beyond just listening to student voices; the focus is on empowering students to actively collaborate with teachers and educational management (Bovill et al. 2011). Through this approach students and staff can form partnerships, co-create, and (re-)design education (Martens et al. 2019; 2020).

학생들의 입력만이 통찰력이 있을 수 있는 것이 아니라, 평가 과정에 [교직원]을 초대하는 것은 실제 teaching 및 조직적인 측면에 대한 훌륭한 통찰력을 줄 수 있고, 동시에 buy-in와 헌신을 증가시킬 수 있다. 교직원은 대부분 과정과 훈련 프로그램을 개선하기 위한 평가 데이터의 사용자이지만, 평가 응답자가 되어 IQA에 기여할 수도 있다. 또한 교육 활동 중 또는 교육 활동 종료 시 관찰된 헛점pitfalls이나 조직 과제를 평가하기 위해 teaching staff를 구조적으로 포함할 수 있다.

  • 예를 들어, PBL 사례 평가에 PBL 튜터, 교육 활동의 정렬에 대한 강의 및 워크샵 제공자 또는 프로그램 평가에서 자신의 역할을 수행하는 멘토를 참여시키는 것을 고려하십시오(박스 3 참조).

[메타 수준]에서, 교수진은 또한 프로그램 평가 절차의 평가에 참여할 수 있다. 코스 코디네이터의 성과에 대한 공식적인 평가 데이터가 없음을 고려하여, 과목 책임교수course coordinators는 피드백 대화와 성찰 또는 보고 세션에 참여할 수 있도록 교직원들을 적극적으로 초대할 수 있다. 또한, 교육 인력이 (일부) IQA 접근 방식을 공동 설계할 수 있도록 권한을 부여함으로써, 이러한 관행과 필요한 후속 조치에 대한 교사들의 참여가 더욱 증가할 수 있다(Bendermacher 2021).

Not only students’ input can be insightful, inviting faculty into the evaluation process can give great insight into practical teaching and organizational aspects and simultaneously increase buy-in and commitment. While faculty is mostly the user of evaluation data to improve courses and training programmes, they can also become evaluation respondents and thereby contribute to IQA. Teaching staff could also be included structurally during or at the end of an educational activity to evaluate observed pitfalls or organizational challenges.

  • As an example, consider involving PBL tutors in the evaluation of PBL cases, lectures and workshop providers on the alignment of their educational activities, or mentors in fulfilling their roles in programmatic assessment (see Box 3).

On a meta-level, faculty can also be engaged in the evaluation of programme-evaluation procedures. Considering the absence of formal evaluation data for course coordinators’ performance, course coordinators could actively invite faculty to engage in feedback dialogues and reflection or debriefing sessions. Moreover, by empowering teaching staff to co-design (part of the) IQA approaches, their involvement in these practices and their required follow-up might be further increased (Bendermacher 2021).

 

학생들의 [미래 고용주]는 또한 IQA의 중요한 이해당사자이다.

  • 직업 현장의 대표들은 졸업생들에 대해 어떻게 생각하는가? 
  • 취업 현장에 참여하는 학생들은 필요한 기술, 지식 및 태도를 잘 준비하고 갖추고 있는가? 
  • 교육과정이 노동력의 요구를 반영하고 있는가? 

고용주는 새로운 커리큘럼을 설계할 때 대화나 설문지를 통해 임시로 상담받거나 인턴십, 커리큘럼 또는 동문 평가 동안 학생들의 성과를 논의하기 위해 더 정기적으로 상담받을 수 있다.
The future employers of students are also important stakeholders in IQA:

  • how do representatives from the work field feel about the graduates?
  • Are students joining the work field well-prepared and equipped with the required skills, knowledge and attitudes?
  • Does the curriculum reflect the needs of the workforce?

Employers could be consulted ad-hoc in dialogue or through questionnaires when designing a new curriculum or on a more regular basis to discuss students’ performance during internships or curriculum or alumni evaluations.

[동문]들은 평가 설문지를 통해 [프로그램에서 놓친 영역]과 [가르치고 훈련한 역량이 자신의 경력(선택)에 어느 정도 도움이 되었는지]에 대한 귀중한 정보를 제공할 수 있다. 이는 교육과정 재설계에 직면할 때 특히 통찰력이 있을 수 있으며, 이는 구조적인 차원에서 동문들의 참여가 필요하지 않음을 나타낸다.
Alumni can provide valuable information through evaluation questionnaires about areas they missed in the programme and the extent to which the competences taught and trained have helped them in their career(choice). This can be particularly insightful when facing a curriculum redesign, indicating that involvement of alumni is not required on a structural level.

이와 유사한 맥락에서, [고객이나 환자]는 학생들의 현장진출 준비성이나 교육의 질 향상에 대해 그들의 관점에서 조명할 수 있다(Romme et al. 2020). 이것은 교육을 설계하는 맥락일 수 있지만, 모의 환경이나 임상 순환 중에 학생들의 성과에 대한 피드백을 초대하는 것을 통해서도 가능하다. 그러나 이를 위해서는 검증된 설문지의 개발과 사용, 전력 역학에 대한 인식 및 성과 평가 제공과 관련된 개별 환자 선호도에 대한 존중이 필요하다.
In a similar vein, clients or patients can shed light on students’ preparedness to enter the field or on educational quality improvement from their perspective (Romme et al. 2020). This can either be in the context of designing education but also through inviting their feedback on student’s performance in a simulated setting or during clinical rotations. This, however, requires the development and use of validated questionnaires, awareness of power dynamics and respect for individual patient preferences concerning the provision of performance evaluation (Sehlbach et al. 2020).

 

체계적이고 구조적이며 통합된 IQA에 대한 주기적인 접근 방식
A cyclical approach to IQA – systematic, structural and integrated

IQA 관행에 의해 생성된 데이터가 지속적인 교육 품질 향상으로 이어지도록 하기 위해, IQA는 (1) 체계적이고 (2) 구조적이며 (3) 통합적인 실천으로 특징지어지는 [주기적 과정]을 필요로 한다(그림 3).
To ensure that data generated by IQA practices results in continuous improvement of educational quality, IQA requires a cyclic process characterised by practices that are (1) systematic, (2) structural and (3) integrated (Dolmans et al. 2003) (Figure 3).

[체계적]이라는 것은 커리큘럼의 [모든 중요한 교육 설계 요소]가 [다양한 평가 도구와 절차]에 의해 다루어지고 포괄된다는 것을 의미한다. 체계적인 것은 이해관계자의 참여에도 적용된다. 예를 들어, PBL 커리큘럼을 평가하려면 강의, 실습, 튜토리얼 그룹 미팅, PBL 튜터의 질, 평가의 질, 학생들의 수행 등 각 과정의 다양한 측면에 대한 정보가 필요합니다. 이 정보는 학생, 강사, 교사, PBL 튜터, 코스 코디네이터와 같은 과정에 관련된 이해 관계자에 의해 제공되어야 합니다.
Systematic implies that all important educational design elements of a curriculum are addressed and covered by a variety of evaluation instruments and procedures (Dolmans et al. 2003). Systematic also applies to the involvement of stakeholders. For example, evaluating a PBL curriculum requires information about various aspects of each course: lectures, practicals, tutorial group meetings, the quality of PBL tutors, the quality of the assessment and performance of students. This information should be provided by the stakeholders involved in the course: students, lecturers, teachers, PBL tutors, course coordinators.

[구조적]이라는 것은 정기적인 간격의 주기적 평가의 중요성을 지적한다(Dolmans et al. 2003). 이러한 간격의 빈도는 평가되는 측면의 중요도에 따라 결정해야 한다(그림 3). 예를 들어, 2학년이 지난 후 과정의 질이 안정되었다면, 평가 피로를 피하기 위해 2년에 한 번만 프로그램의 일부를 심층적으로 평가하기로 결정할 수 있다. 이러한 관행이 명확하고 합의된 것이 중요하다. 정책 문서를 통해서 다음을 전달해야 한다.

  • 활동 유형(예: 설문지, 포커스 그룹 등), 
  • 활동 목적(예: 모니터 대 강화) 
  • 활동 빈도(예: 정기적인 간격, 임시 평가 회피) 
  • 커리큘럼 수준(예: 과정 수준 대 커리큘럼 수준) 및 
  • IQA와 관련된 관련 이해관계자(예: 책임자)

Structural points to the importance of periodic evaluation at regular intervals (Dolmans et al. 2003). Frequency of these intervals should be determined based on the importance of the aspect being evaluated (Figure 3). For instance, if after two academic years the course quality has stabilised, one may decide to evaluate parts of the programme in depth only once in 2 years to avoid evaluation fatigue (Svinicki and Marilla 2001). It is important that these practices are clear and agreed upon. Policy documents should communicate the

  • different activities (e.g. questionnaire, focus groups etc.),
  • purposes (e.g. monitor versus enhance), frequency
  • of activities (e.g. regular intervals, avoid ad-hoc evaluations),
  • levels of curriculum (e.g. course level versus curriculum level) and
  • relevant stakeholders (e.g. responsibilities) involved in IQA.

마지막으로, IQA 관행은 [통합적]이어야 해야 하며, 이는 관련 이해 관계자가 교육 품질을 모니터링하고 향상시키는 데 있어 [자신의 책임을 인식하고 구체화한다는 것]을 의미한다. 교육 기관은 IQA 프로세스에 발언권을 부여함으로써 이해관계자의 적극적인 참여를 가능하게 해야 한다. 또한 조직은 [개선 계획]이 [개발, 구현 및 평가]되고, 이 [프로세스가 정기적으로 투명하게 논의되는지 확인]해야 합니다. 전반적으로, IQA 활동이 [조직의 정규 업무 패턴에 통합]될 때, 이는 지속적인 주기적 과정과 지속적인 교육 품질 향상에 기여할 것이다.
Finally, IQA practices should be integrated, meaning that relevant stakeholders are aware of and give shape to their responsibilities within monitoring and enhancing educational quality (Dolmans et al. 2003). Educational organisations should enable active involvement of stakeholders by giving them a voice in the IQA process. Furthermore, organisations need to ensure that improvement plans are developed, implemented and evaluated, and that this process is discussed regularly and transparently. Overall, when IQA activities are integrated in the organisation's regular work patterns, this will contribute to a continuous cyclical process and continuous enhancement of educational quality.

양질의 문화 구축 – 문화적, 심리적 요소
Building a quality culture – cultural & psychological components

IQA 목적을 위해 수집된 데이터가 모든 이해 관계자가 지속적으로 교육의 질을 향상시키겠다는 약속을 인식하고 느끼는 퀄리티 문화에 확실히 반영되기를 원한다면, 몇 가지 요소에 대한 관심이 필요하다.

  • 성찰과 대화를 자극하는 것
  • 교수개발과 실천공동체를 가능하게 하여 이해 관계자를 지원하는 것
  • 퀄리티 문화를 육성하는 리더십

If we want to ensure that the data collected for IQA purposes will indeed feed into a quality culture in which all stakeholders are aware of and feel commitment towards continuously enhancing educational quality, several components require attention:

  • the extent to which reflection and dialogue are stimulated,
  • supporting stakeholders through faculty development and enabling communities of practice, and
  • leadership that fosters a quality culture.

교육의 질에 대한 성찰과 대화의 자극
Stimulating reflection and dialogue regarding educational quality

성찰 자극
Stimulating reflection

[교육의 퀄리티에 관한 데이터를 갖는 것]이 [자동적으로 교육의 질 향상]으로 이어지지는 않는다. 이론적인 원칙에 입각한 평가 설계를 바탕으로 이론적으로 근거가 있는 풍부한 데이터가 생성되지만, 상황별적이고 보다 실행 가능한 연구도 해당 데이터의 수신자가 교육 품질을 향상시키는 활동으로 데이터를 번역하는 데 도움이 필요할 수 있음을 보여줍니다. 종이와 행동 사이에는 긴 길이 있을 수 있다. 데이터를 행동으로 변환하는 것은 다른 방식으로 자극될 수 있다. [대조적인 평가 데이터]를 제공함으로써 조치를 취할 수 있다.

  • 예를 들어, 과정의 평가 결과를 보고할 때, 과정의 평가 결과 옆에 상대적 평가 데이터(예: 다른 과정과의 비교, 전년도 과정과의 비교)를 보고하는 것을 고려할 수 있습니다(상자 4 참조). 
  • 이와 유사하게, 그러나 개별 교사에게 피드백을 제공하는 경우, 해당 교사에 대한 실제 학생 평가와 함께 교사들에게 자기 평가를 작성하도록 요청하고 이러한 결과를 제시하면 해당 교사에게 개선해야 할 부분에 대한 추가적인 통찰력을 제공할 수 있다.

Having data on educational quality does not automatically lead to enhancement of education quality (Richardson and Placier 2001; Hashweh 2003). Although grounding the design of your evaluation in theoretical principles will generate rich data that is theoretically grounded, context-specific and more actionable (Bowden and Marton 1999) research also demonstrates that the recipients of that data, may need help translating the data to activities that will enhance educational quality (Stalmeijer et al. 2010; Boerboom et al. 2015; van Lierop et al. 2018). There may be a long road between paper and action. Translating data to action may be stimulated in different ways. Action may be spurred by providing contrasting evaluation data.

  • For example, when reporting evaluation results of a course, one can consider to report relative evaluation data (e.g. comparison with other courses, with the course results of the previous year) next to the evaluation results of a course (see Box 4).
  • Similarly, but in the case of providing feedback to individual teachers, asking teachers to fill out a self-assessment and presenting these results next to actual student evaluations of the teacher in question could provide the teacher in question with added insights of areas to improve in.

 

임상교사들이 이러한 자기평가 효과에 대해 인터뷰를 한 결과, 특히 자기평가와 학생평가 사이에 부정적인 불일치가 변화에 대한 강력한 자극으로 경험된 것으로 나타났다. 그러나 같은 연구에서 임상 교사들은 피드백의 특정 측면을 행동으로 옮기는 데 도움이 필요하다고 지적했다. 예를 들어, 교수들은 [학생들이 학습 목표를 세우는 것을 돕는 것]에 어려움을 겪었고, 이에 대한 추가적인 코칭을 요청했습니다. 또한, 평가 데이터가 부정이나 방어 같은 감정적 반응을 일으킬 수 있다는 증거가 있어 데이터에 대한 논의가 필수적이다. 반 리에로프 외 연구진(2018)은 임상 교사들이 자기 평가와 학생 평가에 대해 논의하는 동료 그룹 성찰 회의를 도입하여 임상 교사들을 위한 코칭을 실험했다. 이 연구는 또래 집단 성찰 회의가 임상 교사들이 개선 계획을 수립하는 데 도움이 된다는 것을 발견했다.

Clinical teachers being interviewed about the effect of this self-assessment indicated that especially negative discrepancies between their self-assessment and the evaluations of students were experienced as a strong impetus for change (Stalmeijer et al. 2010). However, in the same study, clinical teachers indicated needing help to translate certain aspects of the feedback to action. For example, they had a hard time helping students to formulate learning goals and requested additional coaching. Furthermore, there is evidence that evaluation data may cause emotional reactions like denial or defensiveness (DeNisi and Kluger 2000; Sargeant et al. 2008; Overeem et al. 2009) making discussion of the data essential. van Lierop et al. (2018) experimented with coaching for clinical teachers by introducing peer group reflection meetings in which clinical teachers would discuss their self-assessments and student evaluations. The study found that the peer group reflection meetings assisted clinical teachers in formulating plans for improvement.

대화.
Dialogue

교육의 질을 지속적으로 향상시키려면, 수집 중인 데이터가 개선 이니셔티브에 inform하고, 교육 조직의 [모든 계층과 구조에 의해 논의되는 것]이 중요하다. 마찬가지로 [조직적 대화organizational dialogue]도 퀄리티 보증quality assurance으로서 조직 [프로세스 내에 구조적으로 포함되어야] 한다. 그렇지 않으면 평가 결과에 따라 적절한 조치를 취하지 않고, 정보의 정글이 될 위험이 있습니다. 그러기 위해서는 평가는 커리큘럼의 여러 수준(예: 과정, 사무직, 연도, 학사)의 의제에 대한 반복적인 주제가 되어야 한다. 평가 활동에 대한 [공개적 대화]는 교육 기관의 여러 수준에 대해 조정자가 수립한 실행 계획에 의해 inform되어야 한다. 이러한 실행 계획의 구현과 평가는 정기적으로 논의되어야 한다. 성과가 지속적으로 교육 개선에 효과적으로 활용될 수 있도록 공개적으로 논의되어야 한다. 즉, judgemental하지 않으면서, 결과와 성과를 논하는 방법을 평가하고, 개선을 지원하는 건설적인 언어에 초점을 맞춘다. 이러한 방식으로 대화는 개선 목적을 위한 평가 데이터의 사용을 향상시킬 것이다(Kleijnen et al. 2014). 이 대화의 기회를 창출하는 것은 [구조적 특성structural character]을 띠어야 하는데, 이는 이러한 논의가 [정해진 빈도]로 조직되고, [모든 관련 이해 관계자가 참여]한다는 것을 의미한다. 예를 들어, 코스 코디네이터는 반성 세션 동안 교사 및 학생 대표와 평가 보고서를 논의하고, 구체적인 실행 계획을 수립하고, 구조적으로 이러한 계획의 이행 및 평가에 타임라인을 첨부할 수 있습니다. 더 큰 규모로 (Griffin 및 Cook 2009) 강의에서 평가 결과와 개선 계획을 제시함으로써 학생들을 교육 품질의 적극적인 소유자로 만들 수 있습니다. 학생을 토론의 일부로 만드는 것은, 학생들이 그들의 [참여 결과를 보고, 교수진의 의견을 듣고, 의견을 교환할 수 있는 기회]만 주어진다면, 평가 절차에 참여할 수 있는 추가적인 인센티브를 제공할 것이다.

To ensure continuous enhancement of educational quality, it is important that the data which is being collected informs improvement initiatives and is discussed by all layers and structures of the educational organisation. The organisational dialogue should similarly be structurally embedded within the organisational process as quality assurance. Otherwise it may run the risk of becoming a jungle of information without appropriate steps being taken to act on the evaluation results. To do so, evaluation should be a recurring topic on the agenda of different levels in the curriculum (e.g. course, clerkship, year, bachelor). This open dialogue about the evaluation activities should be informed by action plans formulated by coordinators on the different levels of the educational organisation. Implementation and evaluation of these action plans should be discussed regularly. Results must be discussed openly so that they can be used effectively to improve education continuously (Dolmans et al. 2011; Bendermacher et al. 2020). That is, avoiding judgemental, assessing way of discussing results and performances, instead focus on constructive language supporting improvement. In this way, dialogue will enhance the use of evaluative data for improvement purposes (Kleijnen et al. 2014). Creating opportunities for this dialogue should take on a structural character, meaning that these discussions are organised with a set frequency and involving all relevant stakeholders. For example, course coordinators can discuss evaluation reports with teachers and student representatives during reflection sessions (van der Leeuw et al. 2013), formulate specific plans for action and attach a timeline to implementation and evaluation of these plans on a structural basis. On a larger scale, students can be made active owners of educational quality by presenting evaluation results and plans for improvement during (online) lectures (Griffin and Cook 2009). Making them a part of the discussion will provide students with an extra incentive to participate in evaluation procedures if they see the results of their participation and are afforded the opportunity to be heard by faculty and exchange views (Griffin and Cook 2009; Healey et al. 2015).

 

교수진 개발 및 실무 커뮤니티를 통한 이해관계자 지원
Supporting stakeholders through faculty development and communities of practice

품질 보증에 관한 교수 개발
Faculty development on quality assurance

QA 과정에서 적극적으로 참여하는 이해관계자에게 [교수 개발]을 제공하는 것은 교육의 질에 관한 데이터가 효과적으로 교육의 질 향상에 번역될 수 있도록 하기 위해 사용될 수 있는 또 다른 전략이다. 품질 보증 프로세스 내에서 특정(그룹) 이해관계자가 갖는 역할에 따라 교수진 개발 워크숍에서 다양한 측면을 다룰 수 있다. 예를 들어, FHML에서는 학생 평가 위원회(SEC)교육 프로그램 위원회(EPC)의 구성원을 위한 연간 워크숍을 제공한다. SEC는 보통 10-12명의 학생들로 구성되어 있으며, 그들의 목표는 교육 활동에 대한 질적 데이터를 생성하고 교수 팀과 결과에 대해 논의하는 것이다. 연례 워크숍에서 SEC 회원들은 자신의 역할을 효과적으로 수행하는 방법에 대한 지침을 받는다(박스 5).

Providing faculty development for stakeholders actively involved within the process of quality assurance, is another strategy that may be employed to ensure that data on educational quality can be effectively translated to enhancement of educational quality. Depending on the role that a certain (group of) stakeholder(s) has within the process of quality assurance, different aspects can be addressed during faculty development workshops. For example, at FHML we provide yearly workshops for members of the student evaluation committees (SEC) (Stalmeijer et al. 2016) and the educational programme committees (EPC). The SEC, usually comprise 10–12 students, and their goal is to generate qualitative data on educational activities and to discuss outcomes with teaching teams. In a yearly workshop, members of the SEC are provided with guidelines on how to effectively fulfil their role (Box 5).

EPC 회원들에게는 또 다른 연례 워크숍이 제공된다네덜란드에서는 각 대학 프로그램에 EPC가 의무화되어 있다. EPC는 직원 및 학생 대표가 섞여 있으며, 프로그램 수준에서 교육 품질을 전반적으로 모니터링하는 역할을 한다. EPC는 [시험 규정과 그 시행, 교육 예산, 교육 혁신, IQA 시스템 등과 같은] 교육 문제에 대해 요청하거나 자발적으로 조언을 제공할 수 있다. 연례 워크숍(상자 5 참조) 동안 EPC 구성원은 공동으로 교육을 받고 교육 품질 보증 과정에서 자신의 역할에 대한 활발한 토론에 참여한다.

Another yearly workshop is provided to members of the EPC. In the Netherlands, each university programme is mandated by law to have an EPC. An EPC consists of a mix of staff and student representatives and is tasked with overall monitoring of educational quality at the programme level. The EPC can give advice, either on request or on their own initiative, on education matters like examination regulation and its implementation, education budget, educational innovation, and the system of IQA. During the yearly workshop (see Box 5) EPC members are trained jointly and involved in an active discussion about their role in the process of educational quality assurance.

실천 공동체
Communities of practice

CoP(Community of Practice)는 '중첩된 지식 기반, 공통 관행 및 상호 기업mutual enterprise에 초점을 맞춘 [신념, 가치, 역사 및 경험의 집합]을 [공유하고 발전]시키는 [개인들의 지속적이고 지속적인 사회적 네트워크]'로 정의할 수 있다.

  • CoP(Community of Practice)의 설립은 [혁신을 위한 전문 지식과 아이디어의 교환]을 촉진하기 때문에 교육을 더욱 향상시킬 수 있습니다.
  • CoP는 [모범 사례를 공유]하는 등의 방법으로 직원이 [새로운 관점 및 개선 기회]를 얻는 데 도움이 됩니다.
  • CoP는 특히 [퀄리티 문화의 심리적 차원을 육성]하는 것과 관련이 있다. CoP는 교수와 학습의 가치, 일상적인 업무 경험과 과제에 대한 성찰, 교사 정체성 구축이 중심이 되는 [환경을 형성]한다.
  • CoP의 [건설적인 동료 피드백 프로세스]와 [상호 전문직업적 및 사회적 지원 제공]은 주인의식을 개발하는 것과 교육 향상에 대한 책임감을 느끼는 사이의 관계를 균형 있게 유지하는 데 도움이 됩니다.
  • CoP의 [개방적이고 종단적인 특성]은 그들의 성공에 필수적이다. CoP는 단순히 이미 고도로 관련되고 교육에 헌신하는 사람들로 구성된 임시적 그룹을 만드는 것을 넘어서야 한다.

A Community of Practice (CoP) can be defined as a ‘persistent, sustaining, social network of individuals who share and develop an overlapping knowledge base, set of beliefs, values, history, and experiences focused on a common practice and/or mutual enterprise’ (Barab et al. 2002, p. 495).

  • The establishing of communities of practice (CoPs), can further educational enhancement as they foster an exchange of expertise and ideas for innovation (de Carvalho-Filho et al. 2020).
  • CoPs facilitate staff in gaining new perspectives and opportunities to improve, e.g. by means of sharing good practice.
  • CoPs are specifically relevant for the nurturing of the psychological dimension of a quality culture; they form an environment in which the valuing of teaching and learning, reflection on daily work experiences and challenges, and teacher identity building is central (Cantillon et al. 2016).
  • Constructive peer feedback processes in CoPs, and the offering of mutual professional and social support help to balance the relation between developing a sense of ownership and feeling accountable for educational enhancement (Bendermacher et al. 2020).
  • An open and longitudinal character of CoPs is essential to their success; they should go beyond the mere establishment of a temporal group of those already highly involved and committed to education.

FHML에서 우리는 저널 클럽, 교육 혁신이 제시되고 논의되는 월간 회의, 참가자들이 동료들과 경험을 공유하도록 명시적으로 초대되는 과정 조정자를 위한 종단 리더십 훈련과 같은 CoP를 자극하기 위한 몇 가지 활동을 조직한다. 우리는 교수 개발 목적으로 CoP를 구현하는 방법에 대한 영감을 얻기 위해 Carvalho-Filho와 동료들의 12가지 팁을 추천한다.
At FHML we organise several activities aimed at stimulating CoPs like journal clubs, monthly meetings in which educational innovations are presented and discussed, and a longitudinal leadership training for course coordinators in which participants are explicitly invited to share experiences with their colleagues. We recommend the twelve tips by Carvalho-Filho and colleagues (2020) for inspiration on how to implement a CoP for faculty development purposes.

퀄리티 문화를 육성하는 리더십
Leadership that fosters a quality culture

학생과 교직원의 목소리를 중시하기 위해, 교육 지도자들은 교육의 질에 대한 토론을 촉진하고, 또한 조직 내의 다른 사람들에게 귀를 기울이고 반응함으로써 차이를 만들 수 있습니다. Bland 등이 수행한 검토 결과, 성공적인 교육과정 개발을 위한 바람직한 [리더십 행동]은 [개방적인 커뮤니케이션 환경을 조성]하는 것 외에도, 적극적이고 참여적이며 문화적/가치에 영향을 미치는 행동과 관련이 있는 것으로 나타났다(Bland 등). 2000). 즉, 성공적인 리더는 협업을 촉진하고, 계획된 변화에 비추어 가치를 공유하며, 신뢰를 구축하고 참여를 촉진합니다.

To value the voice of students and staff members, educational leaders can make a difference by facilitating debate about the quality of education (Sursock 2011), but also by listening and being responsive to others within the organisation (Knight and Trowler 2000). A review conducted by Bland et al, indicated that, in addition to creating an open communication climate, favourable leadership behaviours for successful curriculum development concern assertive, participative and cultural/value-influencing behaviours (Bland et al. 2000). That is, successful leaders promote collaboration, share values in the light of the envisioned change, and build trust and facilitate involvement (Bland et al. 2000).

Bendermacher et al(2021)은 퀄리티 문화를 육성하기 위한 그들의 노력에서, 조직 내에서 다양한 수준에서 행동하는 리더들은 [다양한 도전에 직면한다]고 강조했습니다.

  • [상급 관리 수준]에서 리더는 일반적으로 퀄리티 문화가 뿌리내리는 데 필요한 규칙, 정책, 책임 및 책임과 관련된 '정치적', '전략적' 및 '구조적' 문제를 다룬다. 교육 리더십은 [현재의 구조와 시스템]과 [직원 가치] 사이의 균형을 잡는 것을 의미하며, [자원을 위한 연합 구축, 협상 및 중재]를 필요로 한다. 이를 위해 교육 리더들은 기관 내에서 [강력한 관계와 네트워크]를 구축하고 협력과 상호작용을 촉진하기 위해 노력해야 한다.
  • 조직적인 meso 또는 micro 수준에서 일하는 리더들은 [교육 내용의 직접적인 개선]에 더 많이 참여하고, [팀 학습을 촉진]하는 데 더 집중하는 것으로 보인다. 

Bendermacher et al. (2021) highlighted that in their efforts to nurture a quality culture, leaders acting at different levels within the organisation face various challenges.

  • On the higher management level, leaders typically deal with ‘political’, ‘strategic’ and ‘structural’ issues which concern rules, policies, responsibilities and accountability, needed for a quality culture to take root. Educational leadership entails a balancing of present structures and systems with staff values and requires coalition building, negotiation and mediating for resources (Bolman and Deal 2003). To this end, educational leaders should work to build strong relationships and networks within the institution and stimulate collaboration and interaction (O’Sullivan and Irby 2011).
  • Leaders working on the organisational meso, or micro level appear to be more engaged in the direct improvement of the educational content and focus more on facilitating team learning.

보건 전문직 교육에서 [복잡한 조직 구조와 학제간 협력]이라는 새로운 경향은 리더의 영향력이 점점 더 [간접적인 형태]로 행사되게 한다. 교육의 질 향상에 대한 리더의 영향은 점점 더 [공유되고 협력적이며 분산된 접근 방식]을 통해 나타나고 있다. 따라서, 리더는 '강인한' 리더에게 교육의 질적 향상에 대한 책임을 전가하는 대신 동기부여자, 멘토, 촉진자 역할을 할 것으로 기대되며, 보건직 교육의 리더십은 [개별 직원의 감독, 지도, 지원]을 넘어서, 보다 [광범위한 집단적인 것]으로 바뀌고 있다.

Complex organisational structures and emerging trends of interdisciplinary collaboration in health professions education, cause the influence of leaders to be exerted more and more in indirect ways (Meeuwissen et al. 2020; Bendermacher et al. 2021). The influence of leaders on educational quality enhancement is increasingly being manifested through shared, collaborative and distributed approaches (e.g. McKimm and Lieff 2013; Sundberg et al. 2017; Sandhu 2019). Hence, instead of attributing responsibility for educational quality enhancement to ‘strong’ leaders, leaders are expected to be motivators, mentors, and facilitators and leadership in health professions education is changing from individual staff supervision, guidance, and support to a focus on the broader collective.

보건 전문 교육 기관의 지식 집약적 환경에서 교육 지도자와 기타 교직원은 [조직 문제에 대한 의미와 해결책을 함께 구성]합니다. 보건직 교육에서의 리더십은 [다층적]이기 때문에, (의학) 학교 위계구조의 현실 안에서 [동시에 리더이자 팔로워]가 될 수 있다. 더욱이, 학계는 단순한 리더십 수혜자가 아니라 공동창조를 통해 다른 이들의 리더십을 주도하고 조직 발전에 영향을 미칠 수 있다.
In the knowledge-intensive setting of health professions education institutes, educational leaders and other teaching staff members co-construct meaning and solutions to organisational issues (Tourish 2019). As leadership in health professions education is multi-layered, within the reality of (medical) school hierarchies, one might be a leader and a follower at the same time (McKimm and O’Sullivan 2016). Moreover, instead of being mere leadership recipients, academics can steer the leadership of others and impact organisational developments through co-creation (Uhl-Bien et al. 2014).

교육 리더가 양질의 문화 발전과 IQA를 최대한 활용할 수 있도록 지원하는 개입으로는 리더를 양성하여 성찰, 전문성 및 지식 공유를 자극하고, 리더를 학습하여 교사 팀의 안전과 신뢰 관계를 배양하고, 리더의 상황 민감성을 강화하는 것이 포함된다. 보건 전문직 교육은 여러 스타일을 결합할 수 있고 다양한 이해 관계자의 목표와 야망을 통합할 수 있는 리더에게 가장 잘 제공됩니다.
Interventions that can aid educational leaders to make the most out of quality culture development and IQA include: training leaders to stimulate reflection, expertise, and knowledge sharing, learning leaders to foster safety and trust relations in teacher teams, and strengthen leader’s situational sensitivity (Hill and Stephens 2005; Edmondson et al. 2007; Nordquist and Grigsby 2011). In order to continuously enhance, health professions education is best served with leaders who are able to combine multiple styles and who are able to coalesce different stakeholder goals and ambitions (Lieff and Albert 2010).

결론
Conclusion

본 AMEE 가이드는 '품질 문화'의 개념을 사용하여 교육 기관이 IQA가 자주 제기하는 '체크박스' 연습에서 벗어나도록 도울 수 있는 다양한 관행에 대해 설명했습니다. 우리는 이것이 쉬운 작업이라고 주장하는 것이 아니다. 지속적인 교육의 질 향상은 많은 사람들의 기여를 필요로 하는 진정한 팀의 노력이다. 품질 문화의 체계적/관리적 측면과 문화적/심리적 측면을 창출하는 데 필요한 관행을 다루어(그림 1 참조) 본 AMEE 가이드가 교육 품질에 이해관계가 있는 모든 사람들에게 영감과 방향을 제공하기를 바랍니다.

Using the concept of ‘Quality Culture’ this AMEE Guide has described various practices that can aid educational organisations in moving beyond the ‘tick-box’ exercises that IQA practices often evoke. We are not claiming that this is an easy task. Continuous enhancement of educational quality is a veritable team effort requiring the contribution of many. By addressing practices needed to create the systematic/managerial and cultural/psychological aspects of a quality culture (see Figure 1), we hope this AMEE Guide provides inspiration and direction for all those with a stake in educational quality.

 


Med Teach. 2022 Apr 25;1-11. doi: 10.1080/0142159X.2022.2057285. Online ahead of print.

Continuous enhancement of educational quality - fostering a quality culture: AMEE Guide No. 147

Affiliations collapse

Affiliation

1School of Health Professions Education, Faculty of Health, Medicine and Life Sciences, Maastricht University, Maastricht, the Netherlands.

PMID: 35469546

DOI: 10.1080/0142159X.2022.2057285

Abstract

Internal quality assurance (IQA) is one of the core support systems on which schools in the health professions rely to ensure the quality of their educational processes. Through IQA they demonstrate being in control of their educational quality to accrediting bodies and continuously improve and enhance their educational programmes. Although its need is acknowledged by all stakeholders, creating a system of quality assurance has often led to establishing a 'tick-box' exercise overly focusing on quality control while neglecting quality improvement and enhancement. This AMEE Guide uses the concept of quality culture to describe the various dimensions that need to be addressed to move beyond the tick-box exercise. Quality culture can be defined as an organisational culture which consists of a structural/managerial aspect and a cultural/psychological aspect. As such this AMEE Guide addresses tools and processes to further an educational quality culture while also addressing ways in which individual and collective awareness of and commitment to educational quality can be fostered. By using cases within health professions education of both formal and informal learning settings, examples will be provided of how the diverse dimensions of a quality culture can be addressed in practice.

Keywords: Internal quality assurance; programme evaluation; quality culture.

 

질적연구에서 성찰성(reflexivity)의 실용적 가이드: AMEE Guide No. 149 (Med Teach, 2022)
A practical guide to reflexivity in qualitative research: AMEE Guide No. 149
Francisco M. Olmos-Vegaa , Renee E. Stalmeijerb , Lara Varpioc and Renate Kahlked

 

 

서론
Introduction

질적 연구가 보건전문교육(HPE) 장학금(Varpio and Meyer 2017)에서 신뢰를 얻으면서 엄격한 연구 과정에 대한 현장의 이해가 다듬어졌다. 이러한 방향에서, [연구 엄격성]에 대한 마커는 정량적 연구에서 일반적으로 사용되는 마커와는 근본적으로 다르다. 많은 [정량적 연구]는 연구자 "편견"으로부터 가능한 한 자유로운 근본적인 진실을 밝히기 위해 노력하는 반면, [정성적 연구]는 주관성에 의존한다(Rees et al. 2020). 질적 연구자들은 [주관성]이 그들의 연구를 어떻게 형성shapes하는지 설명하기 위해 [반사성]에 관여한다. 반사성은 [참여자의 경험과 사회적 관행의 지저분한 부분]을 반영하는 [실세계 데이터를 생성하는 복잡한 작업] 속에서, [미묘한 윤리적 결정을 내리고 소통]하는 연구자의 능력과 관련이 있다. 

As qualitative research has gained credibility in health professions education (HPE) scholarship (Varpio and Meyer 2017), the field’s understanding of rigorous research processes has been refined. In this orientation, markers for research rigor are fundamentally different from those commonly used in quantitative research (Tracy 2010; Varpio et al. 2017). Whereas much of quantitative research strives to reveal (or at least approximate) fundamental truths that are as free as possible from researcher “bias” (Young and Ryan 2020), qualitative research depends on subjectivity (Rees et al. 2020). Qualitative researchers engage in reflexivity to account for how subjectivity shapes their inquiry. Reflexivity is tied to the researcher’s ability to make and communicate nuanced and ethical decisions amid the complex work of generating real-world data that reflect the messiness of participants’ experiences and social practices (Finlay 2002a).

즉, 연구자의 주관적 관점(또는 "편견")은 질적 연구 과정과 근본적으로 얽혀 있다. 그리고 연구자의 관점은 많은 긍정적인 영향을 미치지만, 반사성에 주의를 기울이지 않는 것은 질적 연구를 통해 구축된 지식과 그것과 관련된 지식에 부정적인 영향을 미칠 수 있다. 예를 들어, 참가자와 면접관 사이의 [예상치 못한 권력 역학]을 설명하지 못하면, 일부 참가자가 말하기 불편하게 느끼는 [개인적인 세부 사항을 공개해야 한다는 부담]을 느끼거나, [침묵해야한다고 느끼]면서, 경험의 온전함을 공유하지 못하게 되는 상황이 발생할 수 있다. 이러한 경우 참여자가 피해를 입고 데이터 품질이 저하될 수 있습니다. 반사성에 참여하는 것은 연구자들이 그러한 함정을 피하는 데 도움이 될 수 있다.

In other words, their subjective perspective (or “bias”) is fundamentally intertwined with qualitative research processes. And while the researcher’s perspective has many positive impacts, failure to attend to reflexivity can negatively impact the knowledge built via qualitative research and those connected to it. For example, failing to account for unexpected power dynamics between participant and interviewer can lead to situations where some participants feel pressured to disclose personal details that they are not comfortable talking about, or feel silenced, preventing them from sharing the fullness of their experience. In such cases, participants can be harmed and data quality suffers. Engaging in reflexivity can help researchers avoid such pitfalls (Finlay 2002a).

불행하게도 반사성은 종종 많은 사람들에 의해 모호하게만 이해되고, 결과적으로 대부분의 질적 출판물에서 제대로 다루어지지 않는다. 이 모호성은 몇 가지 문제에 매핑될 수 있다. 예를 들어, 반사성에 대한 [많은 정의]가 있으며, 각각의 정의는 서로 다른 핵심 이슈를 뒷받침한다. 결과적으로 반사성 문헌과 이를 적용하기 위한 [무수한 방법]을 탐색하는 것은 많은 연구자들에게 어려운 과제이다. 또한 반사성은 주관성을 중시하는 방향으로 고정되어 있으며, 그 의미가 연구과정을 통해 능동적으로 구성되기 때문에, 연구자가 연구에 미치는 영향을 탐구할 필요가 있다(Varpio et al. 2021). 이러한 방향은 역사적으로 HPE에서 영향력을 행사해 온 [양적 연구와 관련된 후기실증주의적 가정]과 배치된다. 이러한 문제를 고려할 때, 반사성이 무엇이고 그것을 어떻게 사용하는지를 이해하는 데 있어서 HPE 학자들은 종종 불확실성의 안개 속에서 길을 잃는 것은 놀라운 일이 아니다. 그럼에도 불구하고, 이러한 불확실성에도 불구하고, 반사성이 질적 연구의 필수적인 측면이라는 인식이 증가하고 있어(Barrett et al. 2020), 많은 연구자들이 주저하며 반사성 물 속으로 들어간다. 우리는 반사성에 대한 미묘한 정의를 설명하고 이용 가능한 구체적인 반사 관행의 예를 제공하는 것이 HPE 학자들이 엄격한 질적 연구를 개발하고 소통하는 데 도움이 될 수 있다고 믿는다.
Unfortunately, reflexivity is often only vaguely understood by many and, as a result, is poorly addressed in most qualitative publications. This ambiguity can be mapped to several issues. For instance, there are many definitions of reflexivity, each foregrounding different key issues (Schwandt 2014). As a result, navigating the reflexivity literature and the myriad of methods for applying it is a difficult task for many researchers (D’Cruz et al. 2005; Finlay and Gough 2008). Furthermore, reflexivity is anchored in an orientation that values subjectivity and requires researchers to explore their influence on research, as its meaning is actively constructed through the research process (Varpio et al. 2021). This orientation runs counter to the post-positivist assumptions, tied to quantitative research, that have historically held sway in HPE (Varpio et al. 2017). Given such issues, it is not surprising that HPE scholars are often lost in a fog of uncertainty when it comes to understanding what reflexivity is and how to use it. And yet, despite this uncertainty, there is increasing recognition that reflexivity is an essential aspect of qualitative studies (Barrett et al. 2020), so many researchers hesitantly wade into the reflexivity waters. We believe that delineating a nuanced definition of reflexivity and offering examples of the concrete reflexive practices available can help HPE scholars to develop and communicate rigorous qualitative research.

이 AMEE 가이드에서 우리는 그 목표를 달성하기를 희망한다. 이를 위해 반사성이 무엇을 의미하고 수반하는지 명확히 하고, 연구를 수행하고 전파하는 동안 반사성에 관여하는 구체적인 방법을 제시한다. 우리는 HPE 연구원들이 반사성에 대해 직면하는 가장 일반적인 몇 가지 문제에 답한다. 

  • 반사성이란 무엇인가? 
  • 그것의 목적은 무엇입니까? 
  • 어떤 유형의 반사성이 HPE 연구에서 중요합니까? 
  • 내 HPE 연구에서 반사성을 연습하기 위해 어떤 전략을 사용할 수 있을까? 
  • 원고에서 반사성을 어떻게 전달합니까? 
  • 반사성에 대한 가장 흔한 비판은 무엇인가?

In this AMEE Guide, we hope to achieve that goal. To that end, we clarify what reflexivity means and entails, and we offer specific methods of engaging in reflexivity while conducting and disseminating research. We answer some of the most common challenges HPE researchers face vis-a-vis reflexivity:

  • What is reflexivity?
  • What are its purposes?
  • What types of reflexivity are important in HPE research?
  • What strategies can I use to practice reflexivity in my HPE research?
  • How do I communicate reflexivity in my manuscript?
  • What are the most common critiques of reflexivity?

반사성이란 무엇인가?
What is reflexivity?

반사성에 대한 많은 다른 정의가 존재하며, 그 결과 연구원들은 반사성이 무엇인지, 어떻게 하는지는 말할 것도 없고, 종종 확신하지 못하게 된다. 사용 가능한 다양한 정의를 존중하고 그 사이의 차이를 인식하는 반사성에 대한 포괄적인 정의를 구성하기 위해 반사성에 명시적으로 초점을 맞춘 출판물에 대한 정성적 방법론 문헌을 검색했다. 그런 다음 일치성을 식별하기 위해 귀납적으로 분석했습니다. 표 1은 아래에 제공된 정의에 통합된 일부 설명의 예를 보여 줍니다. 그런 다음 이러한 결과를 종합하여 다음과 같은 포괄적인 정의를 개발했습니다.

Many different definitions of reflexivity exist, and, as a result, researchers are often left unsure of what reflexivity is, let alone how to do it. To construct a comprehensive definition of reflexivity that both respected the variety of definitions available and appreciated the differences between them, we searched the qualitative methodological literature for publications focused explicitly on reflexivity. We then inductively analyzed them to identify congruences. Table 1 provides examples of some of the descriptions we encountered, which are incorporated in the definition provided below. We then synthesized these findings to develop the following comprehensive definition:

반사율(Reflexivity)은 연구자들이 [자신의 주관성과 맥락]이 [연구 과정]에 어떤 영향을 미치는지 [스스로 의식적]으로 [비판하고, 감정하고, 평가]하는 [지속적이고 협력적이며 다면적]인 실천의 집합이다.
Reflexivity is a set of continuous, collaborative, and multifaceted practices through which researchers self-consciously critique, appraise, and evaluate how their subjectivity and context influence the research processes.

우리의 정의는 반사성이 [연구 노력의 전체 기간]에 걸쳐 확장되는 [지속적인 과정]이라는 것을 강조한다.

  • 우리는 반사성의 [공유적이고, 협력적인 성격]을 강조한다. 반사성이 가장 효과적이려면 [연구팀 역학에 통합]되어야 한다.
  • 우리는 또한 반사성의 [다면적인 본성]을 강조한다; 그것은 수행 중인 연구에 영향을 미치는 [개인적, 대인적, 방법론적 및 맥락적 요인]에 대한 비판적인 관심을 포함한다.

우리는 이러한 반사성의 복합 프레임이 HPE의 정성적 연구에 종종 존재하지 않는다는 것을 인식한다. 우리 분야에서는 각 협력자의 주관성을 설명하면서, [개인적인 측면]을 강조하는 경향이 있다. 우리는 반사성이 더 넓고 미묘하기 때문에 우리의 정의와 적용은 그 이질성과 복잡성을 반영하도록 수정되어야 한다고 주장한다.

Our definition highlights that reflexivity is an ongoing process that extends across the entire duration of a research endeavor.

  • We emphasize its shared and cooperative nature; reflexivity must be integrated into the research team dynamic to be most effective.
  • We also stress the multifaceted nature of reflexivity; it involves critical attention to personal, interpersonal, methodological, and contextual factors that influence the study being conducted.

We recognize that this composite framing of reflexivity is not often present in HPE’s qualitative research. In our field, we have tended to highlight the personal aspect, describing each collaborator’s subjectivity. We contend that reflexivity is broader and more nuanced, so our definition and application must be revised to reflect that heterogeneity and complexity.

우리가 제안하는 반사성 정의는 연구자 주관성(예: 주관주의, 사회구성주의)을 수용하는 연구 방향에 고정되어 있다. 우리는 반사성이 연구 프로젝트에서 [객관성이 결여된 것에 대한 사과]라고 생각하지 않는다. 구성주의의 관점에서, 목표는 정확하거나 공정한 표현을 달성하는 것이 아니다. 이는 불가능하며, 바람직하지도 않다(리스 외 2020). 대신, 우리는 반사성을 [주관성을 존중하고 가치있게 여기는 것]에 뿌리를 두고 있다고 생각한다. 그것은 연구를 존재하게 하는 서로 얽힌 개인적, 대인관계적, 방법론적, 맥락적 요소들의 중요성을 질적 연구자들이 어떻게 설명하느냐의 일부이다.

The reflexivity definition we propose is anchored in orientations to research that embrace researcher subjectivity (e.g. subjectivism, social constructionism). We do not conceive reflexivity as an apology for the lack of objectivity in a research project. From a constructionism perspective, the goal is not to achieve an accurate or impartial representation; this is neither possible nor desirable (Rees et al. 2020). Instead, we conceive of reflexivity as rooted in a respect for and a valuing of subjectivity. It is part of how qualitative researchers account for the significance of the intertwined personal, interpersonal, methodological, and contextual factors that bring research into being.

반사성의 목적은 무엇인가?
What are the purposes of reflexivity?

연구자들이 반사성에 관여할 때 가지고 있는 여러 가지 다른 목표들이 있는데, 여기에는 주관성의 영향을 중화시키고, 이를 인정하며, 설명하거나, 또는 이를 활용하는 것이 포함된다(Gentles et al. 2014). 이러한 목적은 연구자들이 그들의 [정체성, 맥락, 연구 사이의 관계]에 대해 생각할 수 있는 다른 방법을 가리킨다.
There are several different goals held by researchers when they engage in reflexivity, including neutralizing the influence of their subjectivity, acknowledging it, explaining it, or capitalizing on it (Gentles et al. 2014). These purposes point to different ways researchers might think about the relationships between their identity, context, and research.

연구자 주관성의 영향을 [중화]시키는 위치에 있을 때, 반사성은 빈 서판tabula rasa으로 접근하려는 연구자의 시도를 의미한다. 즉, 새로운 현상을 연구하기 위한 [객관적 거리]의 관점인 빈 슬레이트를 채택한다. 예를 들어, 이 중화 작업은 초월 현상학에서 "브라케팅"을 통해 접근된다. [괄호치기]는 연구자들이 자신의 연구에 영향을 미칠 수 있는 자신의 모든 측면(예: 기존 이론, 개인적 견해 등에 대한 지식)을 제쳐두려고 시도하는 과정이다. 이러한 중화 노력은 질적 연구의 일부 분야에 여전히 존재한다. 예를 들어,

  • 근거이론은 원래 후기 실증주의에 기반을 두고 있었고, 연구자들은 관점이나 사전 지식이 전혀 없는 '빈 서판'으로서 연구에 참여하도록 장려되었다(Glaser와 Strauss 2017).
  • 초월 현상학은 연구자의 관점을 '브래킷'하고 연구 과정에 미치는 영향을 제거하고자 했다. 

When it is positioned to neutralize the impact of researcher subjectivity, reflexivity refers to the researchers’ attempts to take a tabula rasa approach—i.e. to adopt a blank slate, a perspective of objective distance from which to study a phenomenon afresh. This neutralizing work is, for example, approached in transcendental phenomenology via “bracketing” (Gearing 2004; Neubauer et al. 2019). Bracketing is a process through which researchers attempt to set aside any aspects of themselves (e.g. knowledge of pre-existing theories, personal views, etc.) that might influence their study (Neubauer et al. 2019). This neutralizing effort is still present in some branches of qualitative research. For example,

  • grounded theory was originally grounded in post-positivism, and researchers were encouraged to come to their research as a ‘blank slate’ with no perspective or prior knowledge whatsoever (Glaser and Strauss 2017).
  • Transcendental phenomenology sought to ‘bracket’ the researcher’s perspective and eliminate (as far as possible) its influence on the research process (Neubauer et al. 2019).

그러나 이러한 관점은 [연구자의 영향력을 완전히 무력화하려는 목표]는 [문제적이고 심지어 불가능하다]고 보는 현대 질적 연구자들의 선호에서 크게 벗어났다. 예를 들어, 인류학자들은 신선하고 무관심한 눈으로 문화를 볼 수 있는 외부 연구자로 자신들을 설정하려고 시도한 적이 있다(Paradis and Sutkin 2017). 그러나 현대 인류학자들은 이러한 [무력화 시도]가 연구자를 연구 집단과 동떨어진, [연구참여자보다 위에 서 있는 중립적인 관찰자]로 배치함으로써, 연구자와 참여자 사이의 [위계 구조를 활성화]시켰다는 것을 인정한다. 따라서 이러한 발전과 다른 정성적 방법론에 걸친 발전에 따라 반사성의 [중화적 목적]은 남겨두고 떠날 것이다.

However, this perspective has largely fallen out of favor with modern qualitative researchers who see the goal of utterly neutralizing researcher influence as problematic and even impossible (Levasseur 2003; Pillow 2003). To illustrate, anthropologists once attempted to frame themselves as outsider-researchers who could see a culture with fresh, indifferent eyes (Paradis and Sutkin 2017). However, modern anthropologists now acknowledge that these neutralizing attempts galvanized a hierarchy between researcher and participant by positioning researchers as neutral observers who stood apart from and above the studied population, and comprehended truths inaccessible to their participant-subjects (Pillow 2003; Marcus 2011; Holmes 2020). Thus, in line with these developments and those across other qualitative methodologies, we leave behind the neutralizing purpose of reflexivity.

중화시키는 것을 넘어서면서, 반사성의 주된 역할은 [주관성을 인정하는 것]으로도 간주되어 왔다. 이러한 목적을 염두에 두고 반사성은 [연구자의 주관성이 연구 노력의 각 단계에 영향을 미쳤음을 분명히 하는 것]으로 생각된다(Russell과 Kelly 2002). 그러나 단순히 이러한 영향을 인정하는 것만으로는 데이터, 참가자, 상황 또는 연구자에 대한 영향을 설명할 수 없습니다. 따라서, 우리는 반사성의 목적을 [오로지 연구자의 영향력을 인정하는 것]으로 설정하는 것은 그것의 약한 개념화라고 주장한다.
Moving beyond neutralizing, the primary role of reflexivity has also been seen as acknowledging subjectivity. With this end in mind, reflexivity is conceived of as making explicit that researcher subjectivity has influenced each step of the research endeavor (Russell and Kelly 2002). However, simply acknowledging this influence does nothing to elucidate the effect of that influence on the data, participants, context, or researcher. Therefore, we contend that framing the purpose of reflexivity solely as acknowledging researcher influence is a weak conceptualization of it.

일부 학자들은 반사성의 목적이 연구자가 조사에 미치는 [영향을 설명하는 것]이라고 주장한다. 이 방향에서는, 그들의 [연구에 대한 그들의 영향력을 깊이 생각하고 설명하는 것]이 연구자들이 연구 finding에서 다음의 두 가지를 향상할 수 있게 한다.

  • 확인 가능성(다른 연구자가 결과를 확인할 수 있는 정도) 및 
  • 전송 가능성(결과를 다른 설정에 적용할 수 있는 정도)

그러나 반사성의 목적이 단순히 연구자의 영향력을 설명하는 데 그칠 때, 우리는 [주관성의 잠재적 가치를 제한할 위험]이 있으며, 종종 ["편견"의 렌즈를 통해 그들의 주관성을 고백하는, 사과하는 입장]에 빠지게 된다. 따라서 반사성을 설명하는 접근법explaining reflexivity은 질적 연구의 목표를 훼손하는 '내 탓이로소이다mea culpa' 선언로 전락할 수 있다.
Some scholars, attempting to extend beyond acknowledgement, have proposed that reflexivity’s purpose is to explain the researcher’s impact on the investigation. In this orientation, thinking through and explaining their influence on their research enables researchers to enhance the

  • confirmability (the degree to which the results could be confirmed by other researchers) and
  • transferability (the degree to which the results can be applied to other settings) of the findings (Koch and Harrington 1998; Malterud 2001).

However, when reflexivity’s purpose stops at simply explaining researchers’ influence, we risk limiting the potential value of subjectivity, often falling into an apologetic stance, confessing their subjectivities through the lens of “bias.” Thus, the approach to explaining reflexivity can devolve into mea culpa statements that undermine the goals of qualitative research (Lingard 2015).

마지막으로, 많은 현대의 질적 연구자들은 [주관성을 활용하고 데이터 생성의 필수적인 부분으로 간주]하기 위해 노력한다. 이 연구원들은 연구 과정에서 [주관성이 지워질 수 없다]고 가정할 뿐만 아니라, 그러한 노력이 연구에 해롭다고 믿는다. 이러한 관점에서 볼 때 [연구자의 영향력]은 [무력화]되거나, 단순히 [인정]되거나 [설명]될 수 있는 것이 아니다. 반대로 주관성은 모든 인간 상호작용의 생산적인 결과이므로, [데이터와 결과를 적극적으로 공동 구성하는 자산]이 될 수 있다(Finlay 2002a; Koopman et al. 2020). 이러한 방향에서 반사성은 [연구자의 지식과 정체성을 활용하는 수단]이다. 
Finally, many contemporary qualitative researchers strive to capitalize on their subjectivity and consider it an integral part of data generation (Finlay 2002b; Charmaz 2014; Koopman et al. 2020). These researchers not only assume that subjectivity cannot be erased from the research process, they believe that such efforts are detrimental to the research. From this perspective, a researcher’s influence is not something to be neutralized, merely acknowledged, or explained away. On the contrary, since subjectivity is a productive result of all human interaction, it can be an asset to actively co-construct data and results (Finlay 2002a; Koopman et al. 2020). In this orientation, reflexivity is a means of capitalizing on the researcher's knowledge and identities.

질적 연구에서 반사성의 중심적 역할을 추진한 두 가지 요인은 [연구의 사회적, 정치적 함의를 고려한 프로젝트의 확산]과 [참여적 방법론]의 부상이었다. 질적 연구의 참여적 접근법에는 [연구 참여자를 공동 연구자로 참여]시키는 데 공통점을 차지하는 다양한 방법론이 포함된다. 참여형 연구에서 [연구자와 참여자 모두 반사적인 존재]로 확인된다. 여기에는 프로젝트 라이프사이클 전체에 걸쳐 [연구자와의 반사적 대화에 참여자가 참여하는 것]이 포함되며, 이는 연구자가 데이터에 대한 해석에 맞서고 수정하며 연마하도록 한다(Smith 1994). [연구자와 참여자 주관성]을 활용한다는 아이디어는 이후 참여적 연구 방법을 넘어 확장되었으며, 우리는 모든 질적 방법론에서 반사성을 향상시킬 수 있다고 주장한다.

Two factors that propelled the central role of reflexivity in qualitative research were the proliferation of projects that considered research's social and political implications and the rise of participatory methodologies (England 1994; Kuehner et al. 2016; Koopman et al. 2020). Participatory approaches in qualitative research include a range of methodologies that occupy common ground in enlisting participants as co-researchers (Finlay 2002b). In participatory research, both the researcher and the participants are identified as reflexive beings (Bergold and Thomas 2012). This includes involving participants in a reflexive dialogue with the researchers and among themselves throughout the lifecycle of the project, which pushes the researcher into confronting, modifying and honing their interpretations of the data (Smith 1994). The idea of capitalizing on researcher and participant subjectivities has since expanded beyond participatory research methods and, we argue, can enhance reflexivity in any qualitative methodology.

연구자들이 반사성에 참여하기 위해 사용할 수 있는 오리엔테이션은 무엇인가?
What Orientations can researchers use to engage in reflexivity?

이러한 다른 반사성 목적을 염두에 두고, 우리는 이제 연구원들이 이용할 수 있는 반사성의 유형을 구별할 수 있다. 질적 방법론자들은 다양한 반사율 유형을 제안했지만, HPE 내 또는 그 이상에서는 어느 것도 두드러지지 않았다. 이 AME 가이드에서는 월시(2003)의 접근법이 연구 프로젝트의 수명과 관련된 광범위하고 포괄적인 반사 관행 유형을 구성하기 때문에 제시한다. 우리는 각 반사율이 연구자의 목표에 따라 다른 형태를 취할 수 있기 때문에 각 반사율에 대한 설명을 위에서 설명한 목적과 통합한다. 
With these different reflexivity purposes in mind, we can now differentiate between the types of reflexivity available to researchers. Qualitative methodologists have proposed various reflexivity typologies (Finlay 2002a; Walsh 2003; D’Cruz et al. 2005), though none have gained prominence within HPE or beyond. In this AMEE Guide, we present Walsh’s (2003) approach since it constitutes a broad and comprehensive typology of reflexive practices relevant throughout the life of a research project. We integrate our description of each type of reflexivity with the purposes described above because each reflexivity can take a different shape depending on the researcher’s goals.

월시와 같은 유형론은 반사성에 대한 더 넓은 이해에 다음으로서 포함되어야 한다.

  • 추상적 개념(위에서 제공한 정의와 목적 참조)으로서,
  • 연구 프로젝트 및 원고의 한 부분(다음 섹션의 적용 원리 참조)으로서,

월시에 따르면, 반사 과정에는 4개의 겹치고 상호작용하는 차원이 있다: 개인적, 대인관계적, 방법론적, 맥락적. 이러한 과정을 가능한 한 유형적이고 쉽게 적용할 수 있도록 하기 위해, 우리는 우리의 연구 중 하나를 사용하여 각 유형의 반사성이 연구 프로젝트에서 어떻게 나타날 수 있는지와 연구자들이 각각에 대해 어떤 질문을 할 수 있는지 보여줄 것이다. 우리는 이 연구를 Box 1에 요약한 다음 Walsh의 각 치수를 설명한 후 반사성이 어떻게 적용될 수 있는지 설명한다.

Typologies such as Walsh’s need to be embedded within a broader understanding of reflexivity,

  • as an abstract concept (see definition and purposes provided above) and
  • as a part of a research project and manuscript (see application principles in the sections to follow).

According to Walsh, there are four overlapping and interacting dimensions of reflexive processes: personal, interpersonal, methodological and contextual. To make these processes as tangible and easily applicable as possible, we will use one of our studies (Olmos-Vega et al. 2018) to demonstrate how each type of reflexivity might manifest in a research project and what questions researchers might ask themselves concerning each. We summarize this study in Box 1 and then illustrate how reflexivity can be applied after describing each of Walsh's dimensions.

개인적 반사성
Personal reflexivity

개인 반사성(Box 2)은 연구자가 [상황, 참가자 및 데이터]에 대한 [기대, 가정, (의식적 및 무의식적) 반응]을 [성찰]하고 [명확히] 할 것]을 요구한다. 연구자의 참여는 연구과정의 중요한 측면으로서 분석되고 해석되어야 한다. 개인 반사성에 참여하는 것은 각 조사자의 [배경과 훈련]을 공개하는 것 이상의 것이어야 한다. 연구자의 [이전 경험과 동기]가 프로젝트 전반에 걸쳐 내린 [결정에 어떤 영향을 미칠 수 있는지]에 대한 설명을 포함해야 한다(Finlay 2002b), 그러한 영향이 긍정적이든 부정적이든 또는 둘 다에 대한 설명을 포함해야 한다. 개인적 반사성은 조사 기간 동안 지속적으로 발생해야 하며 프로젝트의 모든 측면(즉, 프로젝트의 개념부터 연구 결과까지)과 상호 연관되어야 한다
Personal reflexivity (Box 2) requires researchers to reflect on and clarify their expectations, assumptions, and conscious and unconscious reactions to contexts, participants, and data (Walsh 2003; Dowling 2006; Gentles et al. 2014). The researcher’s participation is a significant aspect of the research process that should be analyzed and interpreted. Engaging in personal reflexivity should go beyond disclosing each investigator’s background and training; it should include descriptions of how the researcher’s prior experiences and motivations might influence the decisions made throughout the project (Finlay 2002b), whether that influence is positive, negative, or neither. Personal reflexivity ought to occur continuously across the duration of the investigation and should be interwoven with all aspects of the project—i.e. from the project’s conception to research outputs.

또한, 개인적 반사성은 [연구가 연구원들에게 미치는 영향]을 다루어야 한다. 개인적 반사 운동에 참여하는 것은 강력한 학습 경험이 될 수 있다; 그것은 연구자의 관행을 재구성하고 다른 종류의 변화를 촉진할 수 있다. 그러나 잠재적으로 부정적인 영향을 고려하는 것도 필수적이다. 예를 들어, 참가자들과 상실과 슬픔에 대해 토론하는 것은 그러한 경험을 공유하는 연구자들에게 강렬한 감정을 촉발할 수 있다(Rowling 1999).
Additionally, personal reflexivity should address the impact of the research on the researchers (Mauthner and Doucet 2003; Finefter-Rosenbluh 2017). Engaging in a personal reflexive exercise can be a powerful learning experience (Mann et al. 2009); it can reshape a researcher’s practices and catalyze other kinds of change (Finlay 2002a; Koopman et al. 2020). However, it is also essential to consider potentially negative impacts; for example, discussing loss and grief with participants may trigger intense emotions for researchers who share those experiences (Rowling 1999).

 

대인 반사성
Interpersonal reflexivity


대인적 반사성(Box 3)은 [연구과정을 둘러싼 [관계]가 [맥락, 관련자 및 결과]에 어떤 영향을 미치는지] 나타낸다(Walsh 2003). 이들 중 가장 중요한 것은 [연구자와 참가자 사이의 관계]일 것이다. 대인 반사성에 대한 사려 깊은 접근은

  • [참가자의 고유한 지식과 관점]을 [인식recognize]하고, [감사appreciate]하며,
  • (이 지식과 관점이) 연구 과정에 미치는 영향에 [주의를 기울이는attending to] 것을 포함한다. —예: 질문을 해석하는 방법. 

반대로, [참가자들에 의해 공유된 정보와 통찰력]은 [연구자들의 결정과 결과]에 직접적인 영향을 미칠 것이다. 그러나 이러한 인식과 감상은 [중립적인 공간]에서 비롯된 것이 아니다. 대인 반사성은 반드시 작동 중인 [권력 역학]에 대한 분석을 포함해야 한다(Finlay 2002a). 이러한 역학관계는 결코 보편적이거나 고정된 것은 아니지만, 연구자들은 종종 참여자와의 관계 속에서 권력 위치를 차지한다.

  • 참여자의 관점의 [해석자]로서,
  • "타당한" 정보로 간주되는 것의 [결정권자]로서,
  • 널리 인정받는 [자격의 보유자]로서 

Interpersonal reflexivity (Box 3) refers to how the relationships surrounding the research process influence the context, people involved, and results (Walsh 2003). Likely the most significant of these are the relationships between researchers and participants. A thoughtful approach to interpersonal reflexivity involves

  • recognizing and appreciating participants' unique knowledge and perspectives and
  • attending to their impacts on the research process—e.g. how they interpret our questions.

Conversely, the information and insights shared by participants will directly influence researchers’ decisions and results. However, this recognition and appreciation do not stem from a neutral space; interpersonal reflexivity must include an analysis of the power dynamics at play (Finlay 2002a). Though these dynamics are by no means universal or fixed, researchers often occupy power positions relative to participants, as the

  • interpreters of their views,
  • arbiters of what counts as “valid” information, and
  • holders of widely recognized credentials.

따라서 [데이터]는 [연구자와 참여자 간의 고유한 권력 관계의 산물]로만 이해될 수 있다. 이와 관련하여 대인반사성은 [맥락적 반사성(아래에서 논의함)]과 중첩되며 연구 맥락에서 미묘한 힘의 감상이 필요하다. 이 역학을 인정하는 목적 중 하나는 참가자와 데이터에 미치는 영향을 완화하거나 관리하는 것일 수 있다.

Thus, data can only be understood as a product of the unique power relationship between researcher and participants (England 1994; Finlay 2002b; Pillow 2003; Burns et al. 2012). In this regard, interpersonal reflexivity overlaps with contextual reflexivity (discussed below) and requires a nuanced appreciation of power in the research context. One of the aims of acknowledging this dynamic might be to temper or manage its influence on participants and data.

대인적 반사성의 또 다른 차원은 [연구팀 구성원들 사이의 관계]가 어떻게 전개되고 연구에 영향을 미치는지를 포함한다. 반사적인 연구 협력이란 다음을 포함한다.

  • 팀 구성원의 동기, 기대 및 가정 간의 상호 작용에 대한 능동적이고 지속적인 탐구
  • 이러한 관점과 역학이 어떻게 활용되거나 관리될 수 있는지를 조사
  • (연구자의 패러다임과 관점의 차이를 포함하여) 주요 연구 이슈에 대한 의견 차이를 반영하고 문서화

Another dimension of interpersonal reflexivity includes how the relationships among the research team members unfold and impact the research (Barry et al. 1999; Russell and Kelly 2002). Reflexive research collaboration involves

  • active and ongoing exploration of the interplay between team members' motivations, expectations, and assumptions,
  • while examining how these perspectives and dynamics can be leveraged or managed.
  • It also includes reflecting on and documenting disagreements on main research issues, including differences in researchers’ paradigms and perspectives (Leggatt-Cook et al. 2011). 

이러한 유형의 대인 반사성에 참여하는 것은 연구팀의 [모든 구성원들이 참여하는 협력적인 노력]이다.
Engaging in this type of interpersonal reflexivity is a collaborative effort involving all members of the research team.

 

 

방법론적 반사성
Methodological reflexivity

세 번째 유형의 반사성은 방법론적 반사성(Box 4)으로, 연구자들은 방법론적 결정의 뉘앙스와 영향을 비판적으로 고려한다. 그것은 종종 연구자들의 [패러다임 지향]에 대한 사려 깊은 고려로 시작된다(Walsh 2003). 패러다임은 연구 노력에 inform하고, 연구 과정 전반에 울려 퍼지며reverberates, 결과에 영향을 미치는 세계관이다. [패러다임을 선택하거나 인정하는 것]은 [특정한 가능성을 열고 배제하는 것]을 의미하므로, [방법론적 반사성을 사용하는 것]은 [선택된 패러다임이 연구에 부과하는 경계를 이해하는 것]을 의미한다(Raven 2006). 

The third type of reflexivity is methodological reflexivity (Box 4), where researchers critically consider the nuances and impacts of their methodological decisions. It often begins with thoughtful consideration of researchers’ paradigmatic orientation(s) (Walsh 2003). A paradigm is a worldview that informs research efforts and, as such, reverberates throughout the research processes and impacts results (Varpio and MacLeod 2020). Choosing or acknowledging a paradigm entails opening and foreclosing particular possibilities, so using methodological reflexivity implies understanding the boundaries that a chosen paradigm imposes upon the research (Raven 2006).

연구 초기부터, 연구자들은 [방법론적 선택]을 [패러다임과 이론적 또는 개념적 틀에 맞추는 것]에 대해 반사적일 필요가 있다. 연구자들은 또한 질적 조사가 풍부한 맥락에 내재되어 있고 반응적이라는 것을 기억해야 하며, 이것이 [방법론적 의사 결정이 연구 과정의 초기에 설정되어서는 안 되는 이유]이다. 대신, 반사적 연구자들은 지속적으로 결정을 내리고, 데이터나 예기치 못한 상황에 대응한다(Varpio et al. 2020). 따라서 방법론적 반사성은 이러한 [결정의 의미]에 초점을 맞추고, [윤리적이고, 엄격하며, 패러다임적으로 정렬되도록 하는 것]을 의미한다.

At the outset, researchers need to be reflexive about aligning their methodological choices with their paradigm and theoretical or conceptual framework (Varpio et al. 2020). Researchers must also remember that qualitative inquiry is embedded in and reactive to rich contexts, that is why methodological decision making should not be set at the beginning of the research process. Instead, reflexive researchers are constantly making decisions and reacting to their data or unforeseen circumstances (Varpio et al. 2020). Thus, methodological reflexivity means focusing on the meaning of these decisions and ensuring that they are ethical, rigorous, and paradigmatically aligned.

 

문맥 반사율
Contextual reflexivity

반사성의 마지막 유형은 맥락적 반사성(Box 5)이며, 이는 [문화적, 역사적 맥락에서 특정 프로젝트를 위치시키는 것locating]을 의미한다(Walsh 2003). 그것은 [연구 질문과 연구자의 대답]이 [가정과 실천이라는 사회적 분야]에 [어떻게 포함되어embed 있고, 어떻게 영향을 받는지] 강조한다. 맥락적 반사성은 또한 연구가 의도하였거나 의도하지 않은 방식으로 수행되어지면서 [사회 분야를 어떻게 변화시키는지] 이해하는 것을 수반한다. 윤리적 연구는 [그 연구가 일어나는 맥락에 긍정적으로 영향을 미치기를 추구]한다; 새로운 통찰력은 참여자들의 연구에 대한 성찰이나 참여가 그들의 실천과 맥락에 어떻게 영향을 미치는지로부터 생성될 수 있다.

The last type of reflexivity is contextual reflexivity (Box 5); it refers to locating a particular project in its cultural and historical context (Walsh 2003). It highlights how the research questions and their answers are embedded in and influenced by a social field of assumptions and practices (Naidu and Sliep 2011). Contextual reflexivity also entails understanding how research transforms the social field in which it is conducted in ways that are both intended and unintended (Smith 1994; Reid et al. 2018). Ethical research seeks to positively impact the contexts in which it takes place; new insights can be generated from how participants’ reflections or engagement in the study affects their practices and context (Bishop et al. 2002).

 

내 연구에서 반사성을 어떻게 활용할 수 있을까?
How can I harness reflexivity in my research?

이러한 반사적 목적과 유형을 실행에 옮기기 위해서는 계획과 구체적인 실천이 필요하다. 반사성이 여러 차원으로 구성된 지속적인 과정이라는 점을 감안할 때, 선택할 수 있는 여러 가지 실천이 있다는 것은 놀라운 일이 아니며, 그 중 많은 실천이 연구 과정 전반에 걸쳐 사용될 수 있다. 아래에 제시된 방법은 [반사적 글쓰기]와 [협업적 성찰]이라는 두 가지 주요 우산 아래에 있습니다. 
Putting these reflexivity purposes and types into action requires planning and concrete practices. Given that reflexivity is an ongoing process comprised of multiple dimensions, it is not surprising that there are several practices to choose from, many of which might be used throughout the research process (Finlay and Gough 2008). The methods we present below fall under two main umbrellas – reflective writing and collaborative reflection.

[반사적 글쓰기]는 아마도 반사성에 대한 가장 잘 알려진 접근법일 것이다. 연구자 메모, 필드 노트, 기타 연구 과정의 어느 시점에서 발생하는 서면 또는 기록된 성찰과 같은 문서 형태를 포함한다.

  • 저널링은 연구자의 관점과 연구 과정에 대한 가정에 의도를 가져오는bring intention 데 사용될 수 있다.
  • 메모 및 필드 노트는 다음을 위해 사용할 수 있습니다.
    • 참가자와 그 데이터에 영향을 미치는 중요한 대인관계 역학을 문서화한다.
    • 결정을 기록하고 조사하며 분석적 통찰력의 순간에 주의를 환기하고 구축한다(Birks et al. 2008).
    • 연구 활동에 영향을 미치거나 영향을 받을 수 있는 맥락의 측면에 주의를 환기한다(Lempert 2007).

일관되고 사려깊게 받아들인다면, 이러한 과정들은 연구 과정에서 작용하는 [가정, 결정, 맥락 및 권력 역학]을 조사하는 애매한 과정일 수 있는 의도를 가져오는 필수적인 도구가 될 수 있다. 또한, 그들은 기초를 제공하고 연구자들의 지식과 생각의 차이를 강조할 수 있다(Mruck and Mey 2019).

Reflexive writing is perhaps the best-known set of approaches to reflexivity. It includes forms of documentation such as researcher memos, field notes, and other written or recorded reflections occurring at any point in the research process.

  • Journaling might be used to bring intention to the researchers’ perspectives and assumptions to the research process (Watt 2007; Ortlipp 2008; Mruck and Mey 2019).
  • Memos and field notes might be used
    • to document critical interpersonal dynamics impacting participants and their data;
    • to record and probe decisions and to call attention to and build on moments of analytic insight (Birks et al. 2008); or
    • to call attention to aspects of context that may impact or be impacted by the study activities (Lempert 2007).

When taken up consistently and thoughtfully, these processes can be an essential tool to bring intention to what can be a nebulous process of examining the assumptions, decisions, contexts, and power dynamics at play in the research process. Additionally, they can provide a foundation and highlight gaps in the researchers' knowledge and thinking (Mruck and Mey 2019).

두 번째 반사 전략 세트는 [협업]을 중심으로 한다. 자신의 사각지대를 찾아내는 일은 어렵다. 당신은 당신이 볼 수 없는 것을 어떻게 보나요? 협력적 반사성은 질적 연구자들이 연구팀으로부터 격리되어 반사성에만 관여하는 경우가 거의 없다는 것을 인정한다. 대신, 연구 협력자들은 종종 가정과 결정에 대한 어려운 질문을 하기 위해 서로에게 의존한다. [가정]은 [같은 가정을 공유하지 않는 다른 사람들의 관점]에서 볼 때 가정이 가장 명백해지기 때문에, 연구팀에 대한 관점의 다양성과 훈련은 반사성과 참가자와의 협력적(또는 적어도 대화적) 관계에 매우 유익할 수 있다(Barry et al. 1999). 그러나 [파워 다이내믹스]는 개방적인 의사소통을 위협할 수 있다. 따라서 연공서열과 지위고하를 막론하고 [팀 내]에서, 그리고 [팀원과 참가자 사이]에 윤리적이고 엄격한 연구를 위한 [상호 책임의 확고한 기반]과 [상호 책임의 문화]를 구축하는 것이 필요하다. 이러한 관계는 모든 사람이 가정과 결정에 의문을 제기할 수 있는 공간을 허용한다(Linabary et al. 2020).
The second set of reflexivity strategies is centered on collaboration. The task of uncovering one’s blind spots is challenging. How do you see what you cannot see? Collaborative reflexivity acknowledges that qualitative researchers rarely engage in reflexivity alone, in isolation from the research team; instead, research collaborators often rely on each other to ask difficult questions about assumptions and decisions (Bieler et al. 2021). Because assumptions become most evident when viewed from the point of view of others who do not share them, diversity of perspectives and training on a research team can be quite beneficial for reflexivity as well as a collaborative (or at least dialogic) relationship with participants (Barry et al. 1999). However, power dynamics can threaten open communication. Thus, building a solid foundation of trust and a culture of mutual responsibility for ethical and rigorous research within a team and between team members and participants, regardless of seniority and status, is necessary. Such relationships allow space for all to question assumptions and decisions (Linabary et al. 2020).

협업과 반사적 글쓰기는 상호 배타적인 전략이 아니다. 예를 들어, 팀 반사적 대화는 개인 또는 그룹 반사적 글쓰기와 공동작업에 기초할 수 있다. 우리는 또한 전략이 하나 이상의 반사율을 다룰 가능성이 있다는 것에 주목한다. 따라서 이 모든 것을 단일 프로젝트에 적용할 필요가 없으며, 이 목록은 결코 완전하지 않습니다. 대신, 우리는 반사성을 연습하는 구체적이고 실용적인 방법을 보여주기 위한 예시로 이러한 전략을 제공한다.

Collaboration and reflexive writing are not mutually exclusive strategies–for example, team reflexive dialogue may be grounded in individual or group reflective writing and collaboration. We also note strategies are likely to address more than one type/dimension of reflexivity. Thus, there is no need to apply them all into a single project, and this list is by no means exhaustive. Instead, we offer these strategies as exemplars to demonstrate concrete and practical ways to practice reflexivity.

서사 자서전
Narrative autobiography

[서사적 자서전]은 처음에는 autoethnography을 둘러싼 방법론 문헌에서 개발되었지만, 어떤 프로젝트에서든 개인적인 반사성을 다룰 수 있는 강력한 자료이다. 이러한 성찰적 글쓰기에 대한 접근에서, 연구자들은 그들의 배경과 연구 프로젝트를 수행하게 된 동기에 대해 자유롭게 글을 쓰며, 연구에 영향을 미칠 수 있는 구체적인 인생 경험을 기록한다. 연구원들은 그들의 [개인적인 경험]이 참가자들의 이야기accounts에 대한 연구자 자신의 이해에 어떻게 영향을 미칠 수 있는지, 그리고 이러한 통찰력이 잠재적으로 결과를 형성할 수 있는 방법에 대해 성찰하는 것을 목표로 한다. 우리는 서술의 저자가 간과할 수 있는 문제를 발견하기 위해 [적어도 한 명의 다른 연구 팀원과 이 이야기를 공유할 것]을 제안한다. 궁극적으로, 이 연습은 연구자들이 관계 형성을 방해할 수 있는 문제를 분리함으로써 참여자들과의 상호작용을 준비하는 데 도움이 될 것이다. (예: 민감한 주제에 대한 가정). 연구를 구상하는 동안 및 데이터 생성 중에 이 연습을 수행하는 것이 좋습니다. 서술적 자서전은 연구자의 첫 메모 또는 반사적 저널의 항목 중 하나가 될 수 있다.

The narrative autobiography was initially developed in the methodological literature surrounding autoethnography (Ellis 2004), but it is a powerful resource to tackle personal reflexivity in any project. In this approach to reflective writing, researchers write freely about their background and the motives that led them to conduct their research project, recording specific life experiences that might influence the research. Researchers aim to reflect on how their personal experiences might influence their understandings of participants' accounts and how these insights could potentially shape results (Koopman et al. 2020). We suggest sharing this narrative with at least one other research team member to unearth issues that the author of the narrative might overlook. Ultimately, this exercise will help researchers prepare for interactions with participants by disentangling issues that might hinder rapport building (e.g. assumptions on sensitive topics) (Gentles et al. 2014). We suggest doing this exercise while conceiving the study and during data generation. Narrative autobiography can serve as one of the researcher’s first memos or entries in a reflexive journal (Watt 2007; Barrett et al. 2020).

자체면접수
Self-interview

[연구 프로토콜 작성]에는 연구자가 [데이터를 생성하는 방법]을 구체화하는 것이 포함되며, 이는 종종 인터뷰나 포커스 그룹을 위한 특정 질문을 생성하는 것을 수반한다. 우리는 내부자로 간주될 수 있는 연구 팀원들이 그들 [자신이 만든 질문에 대답해보고, 주제에 대한 그들의 가정을 반영할 것]을 추천한다. 연구원들은 [자체 인터뷰]를 수행하거나, [다른 연구 팀원의 인터뷰]를 받을 수 있었다. 이러한 자체 인터뷰는 연구자들이 개인적인 경험과 그들의 주제에 대한 견해를 형성한 이론과 연구를 탐구할 수 있는 좋은 기회이다(Crawley 2012). 자체 인터뷰는 연구자들이 주제에 대한 [자신의 경험]을 [참가자들의 경험]과 지속적으로 비교할 수 있도록, 상세히 기록되고 분석될 수 있다. 이 연습은 초기 연구 프로토콜을 개발한 후 데이터 생성 전 또는 데이터 생성 중에 수행하는 것이 가장 좋습니다. 연구원들은 심지어 그들의 신념이 연구를 통해 어떻게 진화했는지 이해하기 위해 한 번 이상 자체 인터뷰를 할 수도 있다.
Writing the study protocol includes specifying how the researcher will generate data, which often entails creating specific questions for interviews or focus groups. We recommend those research team members who could be considered insiders to answer their questions and reflect on their assumptions about the topic. Researchers could conduct a self-interview or be interviewed by another research team member (Koopman et al. 2020). These self-interviews are an excellent opportunity for researchers to explore personal experiences and the theories and research that have shaped their views on their topic (Crawley 2012). Self-interviews can be transcribed and analyzed in detail to enable researchers to constantly compare their experiences of the topic to those of the participants (Gentles et al. 2014). This exercise might be best conducted after developing the initial study protocol and before or during data generation. Researchers may even conduct self-interview more than once to understand how their beliefs have evolved throughout the study.

 

독자 반응 연습
Reader-response exercise

이 연습은 [연구자의 가정]이 [참여자와의 상호작용]에 어떤 영향을 미칠 수 있는지를 다룬다(Mauthner와 Doucet 2003). [독자 반응]은 [데이터 분석 중]에 수행되며, 연구자가 [자신의 배경 및 개인 이력과 관련하여 참여자 accounts에 어떻게 반응하고 해석하는지를 나타내는 코드 레이어]를 포함시키는 것이다. 이 연습 전에 [서술형 자서전]이나 [자기 인터뷰]를 해 연구자들이 그들의 [개인적인 반사적 자세를 이미 인식하도록 하는 것]이 도움이 된다. 이 연습은 반사 메모와 짝을 이뤄 코딩 연습 후 반응과 해석을 심층적으로 분석한다. 이러한 반응들은 또한 저널 또는 다른 형태의 성찰적 글쓰기의 기사의 기초를 형성할 수 있다. 이 분석은 연구자와 참여자 사이의 힘 역학이 참여자의 계정과 연구자의 반응에 어떤 영향을 미칠 수 있는지에 초점을 맞출 수 있다.
This exercise addresses how the researchers' assumptions might affect their interactions with participants (Mauthner and Doucet 2003). Reader response is conducted during data analysis and involves including a layer of codes representing how researchers react to and interpret participants accounts in relation to their background and personal history (Gilligan et al. 1990). It is helpful to have done a narrative autobiography or a self-interview before this exercise so that the researchers are already aware of their personal reflexive stance. This exercise is paired with reflexive memos to analyze reactions and interpretations in-depth after the coding exercise. These reactions may also form the basis of entries in a journal or other form of reflective writing. The analysis may focus on how the power dynamics between researcher and participant could have influenced both participants’ accounts and researchers’ reactions.

조직화된 팀 성찰적 토론
Structured team-reflexive discussion

연구자들이 협력적 반사성을 자극하는 데 도움이 될 수 있는 한 가지 연습은 [팀-반사적 토론]이다. 이 연습 동안 각 팀 구성원은 배리 외 연구진(1999)이 제안한 것과 같은 개인적인 반사적 질문에 답하기 위해 반성적 글쓰기에 참여한다.

One exercise that can help researchers to spark collaborative reflexivity is the team-reflexive discussion. During this exercise, each team member engages in reflective writing to answer personal reflexive questions such as those proposed by Barry et al. (1999):

  • 제 경험이 프로젝트 참여를 어떤 식으로 형성할 수 있을까요?
  • 질적 연구에 대해 어떤 경험을 했는가?
  • 질적 연구에 대한 나의 지향점은 무엇인가?
  • 이 프로젝트에서 어떤 결과가 나올 것으로 예상하나요?
  • 데이터를 분석할 때 선호하는 이론은 무엇입니까?
  • 그 연구에서 내가 가진 지분은 무엇인가? 내가 그것을 통해 무엇을 얻기를 바라는가?
  • 내가 두려워하는 것은 무엇인가?
  • In what way might my experience shape my participation in the project?
  • What experiences have I had with qualitative research?
  • What is my orientation to qualitative research?
  • What results do I expect to come out of this project?
  • What theories do I tend to favor while analyzing data?
  • What is my stake in the research? What do I hope to get out of it?
  • What are my fears?

그런 다음 모든 답변이 팀 내에서 공유되고 논의됩니다. 이것은 연구 내에서 각 팀 구성원의 위치와 이 앙상블이 결과에 어떤 영향을 미칠 수 있는지를 이해하는 강력한 방법입니다. 우리는 이 연습이 잠재력을 극대화하기 위해 연구 과정 초기에 수행하는 것이 최선이라고 믿는다. 그러나 프로젝트 전반에 걸쳐 팀 미팅에서 정기적으로 논의해야 하는 주제가 많을 것입니다.

All answers are then shared within the team and discussed. This is a powerful way to understand each team member’s position within the research and how this ensemble could impact the results. We believe it is best to conduct this exercise early in the research process to maximize its potential. However, many topics will likely need to be discussed regularly in team meetings throughout the project.

멤버 반사
Member reflection

협력적 반사적 연습은 [연구 참가자와의 협업]을 포함할 수 있다(그리고 그래야 한다). 초기의 질적 작업은 "회원 확인member checking"을 데이터의 진실 또는 정확성을 검증하는 방법으로 보았다. 그러나 보다 최근에는 질적 연구자들이 자료와 해석이 맥락에 맞게 구성되고, 참여자들이 다시 참여하게 되면 관점을 바꾸거나 새로운 해석을 추가할 수 있다는 점을 고려하여, 참여자들과 다른 이해당사자들과의 "checking in"에 대한 좀 더 미묘한 접근법으로 "member reflection"을 채택하고 있다. 이 접근 방식은 연구가 가장 신뢰할 수 있으려면credible, [참여자나 지식 사용자에게 돌아가서, 그들의 맥락과 아이디어에 대한 우리의 초기 해석을 기반으로 그들과 협력]해야 한다가정에 기초한다. 이러한 프로세스에는

  • 협력과 피드백을 위해 참가자에게 [원시 데이터 및 연구자 해석을 전송]하거나,
  • 참가자가 결과에 응답할 수 있도록 [후속 인터뷰 또는 포커스 그룹을 예약]하는 것이 포함될 수 있다.

Collaborative reflexive practice can (and likely should) involve collaboration with participants. Early qualitative work saw “member checking” as a way to validate the truth or accuracy of data (Varpio et al. 2017). However, more recently, qualitative researchers have taken up “member reflection” as a more nuanced approach to “checking in” with participants and other stakeholders, taking into account that data and interpretations are constructed in context, and participants may change their perspective or add new interpretations when they are re-engaged (Tracy 2010; Ravenek and Rudman 2013). This approach is built on the assumption that our research is most credible if we return to participants or knowledge users to work with them to build on our earlier interpretations of their contexts and ideas. Such processes can involve

  • sending participants the raw data and/or researcher interpretations for collaboration and feedback (Birt et al. 2016), or
  • booking follow-up interviews or focus groups to allow participants to respond to results.

[윤리적]측면에서, 이러한 반사적 과정은 [참가자들에게 그들의 말이 어떻게 해석되는지에 대한 발언권을 제공]하여, 그들이 자신을 대표하고, 연구 결과에 의미 있게 기여할 수 있도록 한다. 예를 들어, 연구자는 [후속 인터뷰follow-up interview]를 수행하여, 연구가 연구 주제에 대한 [참가자들의 견해를 어떻게 변화시켰는지], 또는 그들의 [실천이 어떻게 영향을 미쳤는지]를 탐구할 수 있다. 이 도구는 일반적으로 초기 데이터가 생성된 후 연구의 후반 단계에서 수행되지만 동시 데이터 생성 및 분석 과정에서 발생할 수 있습니다. 참여자 참여에 대한 보다 급진적인 접근방식은 참여적 연구 설계를 사용하여 연구 라이프사이클 전체에 걸쳐 지식 사용자와 참여자를 참여시킬 수 있다.

Ethically, these reflexive processes offer participants a say in how their words are interpreted, ensuring that they can represent themselves and contribute meaningfully to research findings. For example, researchers could conduct follow-up interviews to explore how the research has changed participants' views on the study subject or how their practices have been influenced (Naidu and Sliep 2011). This tool is generally done in the later stages of the research once initial data has been generated, though it could occur throughout concurrent data generation and analysis. More radical approaches to participant engagement might use participatory research designs to engage knowledge users and participants throughout the research lifecycle fully (Finlay 2002b).

반사 원고를 어떻게 쓰죠?
How do I write a reflexive manuscript?

우리가 우리의 연구에 반사성을 위한 전략을 통합함에 따라, 우리는 또한 반사적 연구의 뉘앙스가 빛을 발할 수 있도록 하는 강력한 보고 관행을 향해 노력해야 하며, 연구자들의 관점과 결정에 대한 투명성을 통해 연구의 신뢰성을 전달해야 한다. 본 안내서를 작성하기 위한 자극의 일부는 원고에서 반사성 문장을 읽고, 검토하고, 쓴 우리의 실망스러운 경험에서 비롯된다. 많은 경우 반사성에 대한 보고는 "연구자의 특성 및 반사성"과 같은 짧은 문단에 국한된다. 이런 반사성 섹션은 (개인적인 반사성의 복잡성을 탐구하기보다는) 본문의 이 부분들은 각 저자의 소속과 연구 방향에 대한 [짧은 전기적인 진술]이 된다. 반사성을 위한 또 다른 문제 있는 글쓰기 전략이 한계 부분에서 나타났는데, 여기서 저자들은 주관성이 어떻게 그들이 객관적인 연구에 참여하는 것을 방해했을 수 있는지 한탄한다(Lingard 2015).

As we integrate strategies for reflexivity in our research, we must also work toward robust reporting practices that enable the nuances of reflexive research to shine through, communicating the work’s credibility through transparency around the researchers’ perspectives and decisions. Part of the impetus for writing this Guide stems from our own disappointing experiences reading, reviewing, and writing reflexivity statements in manuscripts. In many cases, reporting on reflexivity is isolated to a short paragraph such as “researcher characteristics and reflexivity.” Instead of this reflexivity section delving into the intricacies of personal reflexivity, these portions of the text become short biographical statements of each author's affiliation and research orientation. Another problematic writing strategy for reflexivity has emerged in the limitations section, where the authors lament how their subjectivity may have prevented them from engaging in objective research (Lingard 2015).

[별도의 단락]을 통해 반사성을 보고하거나, [데이터에 대한 연구자의 영향에 대한 사과]로 보고하기보다는, 효과적인 보고가 되려면 [연구 과정 전반에 연구자의 주관성을 수용하고 걸쳐 결정의 뉘앙스를 다루어야 한다]고 제안한다. 월시의 유형학은 원고 전체에 짜여진 반사적 보고 관행을 구조화하는 데 도움이 될 수 있으며, 독자는 연구를 형성한 관행과 의사 결정을 살펴볼 수 있는 기회를 제공한다. 그러나 단어 수 제한, 특히 HPE 저널에 제출된 원고의 경우 연구자가 모든 연구 결정 뒤에 숨겨진 미묘한 사고와 팀워크를 보고할 여유가 없을 수 있다는 것을 인식한다. 따라서 대신, 우리는 연구 과정에서 [가장 큰 영향을 미친 결정과 역학]에 초점을 맞추고 개인, 대인관계, 방법론 및 맥락적 차원을 강조할 것을 권고한다.
Rather than reporting reflexivity via a discreet paragraph or as an apology for the researcher’s influence on the data, we suggest that effective reporting should embrace researcher subjectivity and address the nuances of decisions throughout the research process. Walsh’s typology can be instrumental in structuring reflexive reporting practices woven throughout the manuscript, offering the reader an opportunity to journey through the practices and decision-making that shaped the study. However, due to word count limitations, particularly for manuscripts submitted to HPE journals, we recognize that researchers may not have the luxury of reporting the nuanced thinking and teamwork behind every research decision. So instead, we recommend focusing on decisions and dynamics that were most impactful in the research process, highlighting personal, interpersonal, methodological, and contextual dimensions.

서론
Introduction

서론은 연구자들이 자신들의 주장과 핵심 아이디어를 제시하는 공간이다. 따라서, 연구자는 그들의 [패러다임, 이론적 또는 개념적 프레임워크, 그리고 연구 질문 또는 목적 사이의 정렬을 명확히 함]으로써 반사성을 보여줄 수 있다. 여기에는 연구자들의 [패러다임과 이론적 전제를 투명하게 하는 것]이 포함되며, 독자는 이 입장이 결과에 어떤 영향을 미치는지 이해할 수 있다. 연구에 참여한 사람들의 패러다임적 입장을 명확하게 파악함으로써 독자는 그러한 맥락에서 결과를 이해하고 평가할 수 있다. 게다가, 연구원들은 그들이 사용하는 언어가 어떻게 [모순된 메시지]를 만들 수 있는지 알아야 한다. 예를 들어, 연구자들은 서론에서 [구성주의적 입장]을 취하고 있다고 진술하면서, 정작 다른 섹션의 데이터에서 "편견 완화" 또는 "발견"을 의미하는 것에 대해 이야기하여, "발견"할 수 있는 진실이 있다는 경쟁적인 후기 실증주의적 믿음을 보이는 모수이 있다.
The introduction is a space where researchers lay out their arguments and core ideas. Thus, they can demonstrate reflexivity by articulating alignment between their paradigm, theoretical or conceptual framework, and research questions or purpose. This includes being transparent about the researchers’ paradigmatic and theoretical presuppositions, allowing the reader to understand how this stance influences the results (Varpio and MacLeod 2020). Having a clear picture of the paradigmatic stances of those involved in the research, the reader can understand and evaluate the results in that context. Additionally, researchers should be aware of how the language they use can create contradictory messages. For example, researchers might state in the introduction that they are taking a constructivist stance but then talk about “mitigating bias” or meaning “emerging” from the data in other sections, suggesting a competing post-positivist belief that there is a truth that can be “uncovered” (Varpio et al. 2017).

방법
Methods

모든 원고의 방법 섹션은 저자들의 [반사적 관행에 대한 가장 자세한 내용]을 제공할 것이다. 개인적 반사성과 관련하여, 우리는 [연구자의 배경과 관점을 상세히 설명]하는 섹션이 강력한 반사 운동을 구성한다고 생각하지 않는다. 대신, 우리는 연구자들에게 [그들의 관점이 연구에 어떤 영향을 미쳤는지], 그리고 그러한 [관점을 어떻게 활용했는지] 설명함으로써 강력한 개인적 반사성을 보여줄 것을 요구한다. 이러한 설명은 방법에 대한 설명에만 국한될 필요는 없으며, 원고 전체에 걸쳐 수행할 수 있다.
The methods section of any manuscript will likely offer the most detail about authors’ reflexive practices. Regarding personal reflexivity, we do not believe sections detailing researchers' backgrounds and perspectives constitute a robust reflexivity exercise. Instead, we call on researchers to demonstrate a robust sense of personal reflexivity by explaining how their perspectives impacted the study and how they capitalized on those perspectives. Such descriptions need not be limited to the description of methods; instead, they can be carried throughout the manuscript.

[대인관계 관점]에서, 반사성은 참여자와 연구자, 그리고 연구팀 내에서 [권력 차이와 역학]을 논의함으로써 입증될 수 있다. 또한 저자는 모집, 데이터 생성, 분석 및 구성원 반영에서 이러한 역학을 어떻게 고려했는지 논의해야 한다. 윤리적으로, 연구자들은 익명성과 기밀성에 관한 참가자의 선호에 어떻게 주의를 기울였는지 논의해야 한다.
From an interpersonal perspective, reflexivity can be demonstrated by discussing the power differentials and dynamics between participants and researchers and within the research team. Authors should also discuss how these dynamics were considered in recruitment, data generation, analysis, and member reflection (Shulman 1990). Ethically, researchers should discuss how they attended to participants’ preferences around anonymity and confidentiality.

[방법론적 반사성]은 방법론적 결정이 어떻게 이루어졌는지에 대한 투명성을 수반한다. 방법론적 반사성은 연구 결정과 절차를 주의 깊게 설명하고 이러한 결정이 어떻게 그리고 왜 내려졌는지에 주의를 기울임으로써 해결된다. 예를 들어, "우리는 12개의 면접에서 포화를 이루었다"라고 쓰는 것보다, 반사적 보고는 [어떻게 연구자가 자신의 데이터나 분석이 연구의 목적에 충분하다고 결정하였는지에 대해 더 투명할 것]을 요구한다(Mason 2010). 

Methodological reflexivity entails transparency around how methodological decisions were made. Methodological reflexivity is addressed by carefully describing study decisions and procedures and attending to how and why these decisions were made. For example, rather than writing “we achieved saturation at 12 interviews,” reflexive reporting requires the researchers to be more transparent about how they decided that their data or analyses were sufficient for the purposes of their study (Mason 2010).

마지막으로, [맥락적 반사성]은 특히 현장에서 시간을 포함하지 않는 연구에서 종종 간과된다. 맥락 반사성을 입증하고 그들의 발견을 정당화하기 위해, 연구자들은 [어떻게 자신의 맥락을 알게 되었는지]를 명확히 해야 한다.

  • 맥락에 대한 그들의 관계는 무엇인지
  • 어떻게 연구자가 맥락의 뉘앙스에 대한 이해를 심화시키고, 어떻게 그 지식을 데이터에 활용하려고 노력했는가.

우리가 위에서 언급한 바와 같이, 연구는 긍정적이거나 부정적으로 맥락에 어떻게 영향을 미쳤는지에 대한 정보도 포함할 수 있다.

Finally, contextual reflexivity is often overlooked, particularly in studies that do not involve time in the field. To demonstrate contextual reflexivity and legitimate their findings, researchers should articulate how they came to know their context—

  • what their relationship is to the context and
  • how they sought to deepen their appreciation of its nuances and capitalize on that knowledge in their data.

As we noted above, they may also include information on how the research impacted the context, either positively or negatively.

 

결과.
Results

결과 섹션은 종종 엄격하게 데이터를 제시하는 곳으로 간주됩니다. 그러나, 우리는 연구자들의 목소리와 해석이 결과 및 토론 섹션과 밀접하게 연관되어 있다고 주장한다. 즉, 결과는 스스로 "발현"하지 않고 대신 구성되고 해석됩니다(Varpio et al. 2017). 따라서, 연구자들은 다음을 명확히 함으로써 반사성을 보여줄 수 있다. 

  • 제시하는 데이터가 어디에서 왔는지,
  • 어떻게 해석되었는지, 
  • 어떻게 사용되고 있는지

이러한 유형의 반사성을 달성하기 위한 전략에는 결과에서 [참가자 인용문]과 [연구자의 설명]의 [균형]에 대해 논의하거나(Homes 2020), 데이터 세트에서 조사 결과가 대표되는representative 정도를 입증하는 것이 포함될 수 있다.

Results sections are often thought of as strictly data presentation. However, we contend that the researchers' voices and interpretations are intimately connected to the results and discussion sections; in other words, the results do not “emerge” by themselves but are instead constructed and interpreted (Varpio et al. 2017). Thus, researchers can demonstrate reflexivity by clarifying

  • where the data they present came from,
  • how it was interpreted, and
  • how it is being used.

Strategies for achieving this type of reflexivity might involve discussing the balance of participant quotes and researchers’ description in the results (Holmes 2020), or demonstrating the extent to which findings are representative across a data set.

논의
Discussion

결과 섹션과 마찬가지로, 논의는 연구자들의 적극적인 해석 작업과 그들의 발견을 더 넓은 문헌에 위치시키기 위한 노력을 반영해야 한다. 그러나 이것은 단순히 [연구자들의 해석을 확인하는 수단을 찾는 작업]이 되어서는 안 된다. 대신, 우리는 [연구자들의 해석에 도전할 수 있는 문헌의 측면을 찾고 제시하는 것]이 중요한 개인적이고 방법론적인 반사 작업을 구성한다고 주장한다.
Like the results section, the discussion should reflect researchers’ active interpretive work and efforts to situate their findings in the broader literature. However, this should not simply be an exercise of finding means of confirming the researchers' interpretations. Instead, we argue that seeking out and presenting aspects of the literature that might challenge researchers’ interpretations constitutes important personal and methodological reflexive work.

아마도 무엇보다도, 많은 사람들이 후기 실증주의적 기대에 부응하고자, 작아 보일 수 있는 작은 표본 크기나 연구의 맥락적 특수성에 대해 사과하면서 연구 한계에 대한 진부한 보고를 끝내버리고 싶어한다. 그보다, 한계는 독자들이 연구 결과의 다른 맥락으로의 전이가능성을 평가하는 데 특히 중요한 연구 인구와 맥락의 측면에 대한 통찰력을 제공할 수 있다.
Perhaps most of all, we would like to end trite reporting of study limitations that seek to meet post-positivist expectations, offering apologies for a small sample size that may seem small or for the study’s contextual specificity. Instead, limitations can offer insights into the aspects of the study population and context that are particularly important to help readers assess the transferability of the study’s findings to other contexts.

반사성에 대한 비판은 무엇인가?
What are the criticisms of reflexivity?

반사실행의 배후에 있는 좋은 의도에도 불구하고, 우리는 반사실행을 둘러싼 일부 비판에 눈을 감아서는 안 된다. 이러한 비판을 해결함으로써, 우리는 연구자가 이러한 잠재적 문제를 기회로 전환하는 데 필요한 이해를 갖추는 것을 목표로 한다.
Despite the good intentions behind the practices of reflexivity, we must not close our eyes to some of the criticism surrounding reflexivity as a practice. By addressing these criticisms, we aim to equip the researcher with the necessary understanding to transform these potential problems into opportunities (Finlay and Gough 2008).

나르시시즘과 같은 반사성
Reflexivity as narcissism

연구자들은 개인의 반사성에 좁게 초점을 맞추고, 반사성을 (그들의 배경, 가정, 위치 결정 및 행동이 연구 과정에 어떤 영향을 미치는지에 대한) 비판적 자기 인식의 과정으로만 정의할 때, 참여자의 목소리를 꺾어버릴overpowering 위험이 있다(Week 1999). Week(1999)는 이러한 위험을 자기애의 한 형태로 분류하고(p. 894), '재미있는 통찰력과 반사적인 계정에서의 자기 집중성 사이의 얇은 경계' 를 만들 수 있다며 [개인 반사성의 한계]를 지적했습니다: 

Researchers run the risk of overpowering the voice of the participant (Weick 1999) when they narrowly focus on personal reflexivity and define reflexivity solely as a process of critical self-awareness, reflecting on how their background, assumptions, positioning, and behavior impact the research process (Finlay and Gough 2008). Weick (1999) labelled this risk as a form of narcissism (p. 894) and pointed to the limitations of personal reflexivity as it can create a thin line between interesting insights and self-indulgence in reflexive accounts (Nadin and Cassell 2006).

따라서, 반사적인 연습에서, 우리는 연구원들이 [참가자들의 목소리를 잃지 않을 것]을 권고한다. 이는 앞서 설명한 것처럼 [결과 섹션]을 작성할 때 특히 관련이 있는데, 연구자가 [참가자의 인용문]과 [결과에 대한 설명] 사이의 균형을 잘 확인해야 하기 때문이다(Holmes 2020). 또한, 개인적, 대인적, 방법론적, 그리고 상황적 반사성을 연습하는 것은 반사성과 그것이 강화하고자 하는 연구에 더 균형 잡힌 접근을 만드는 데 도움이 될 것이다.

Therefore, in their reflexive practices, we encourage researchers not to lose sight of the participants’ voices. This is especially pertinent when writing the results section, as we explained earlier, as researchers need to ascertain a good balance between participant quotes and their description of the results (Holmes 2020). Also, practicing personal, interpersonal, methodological, and contextual reflexivity will aid in creating a more balanced approach to reflexivity and the research it aims to strengthen.

특권으로서의 반사성
Reflexivity as privilege

반사성은 용기 있는 행동이다. 연구자는 그들의 가정과 연구에 대해 잠재적으로 불편한 진실과 마주할 필요가 있다. 어떤 사람들에게는 이러한 [불편한 진실을 인정하고 토론하는 것]이 다른 사람들보다 더 용이할affordable 수 있다. Mauthner와 Doucet(2003)은 어떻게 박사과정을 이수하고, 학문적 지위를 확보하고, 각 분야에서 자리를 잡았는지를 돌아보며 데이터 분석에서 혼란과 모호함을 고백할 수 있는 안전감을 조성하였다. [신진 연구자]들은 [혼란과 모호성을 인정하는 것]이 타인의 평가에 매우 취약해지는 상황에서, 연구자로서의 신뢰성과 기술에 좋지 않은 영향을 미칠 수 있다고 걱정할 수 있다. 이와 같이, 연구 과정의 [불확실성과 실수에 초점을 맞춘 반사성을 정상화normalize]하는 데 다음의 것이 도움이 될 수 있다.

  • 연구팀 내 반사성 실천에 대한 공개 대화,
  • 선임 연구원의 취약성 모델링,
  • 연구 네트워크 내 반사성에 대한 논의

Reflexivity is an act of bravery: the researcher needs to confront themselves with potentially uncomfortable truths about their assumptions and their research. Admitting to and discussing these uncomfortable truths might be more affordable for some than for others. Mauthner and Doucet (2003) reflect on how completing their PhD’s, securing academic positions, and becoming established in their respective fields created a sense of safety that enabled them to confess confusions and ambiguities in their data analysis. Newer researchers may worry that admitting confusion and ambiguity could reflect poorly on their credibility and skills as researchers at a time when they are very vulnerable to the assessments of others. As such,

  • an open dialogue about the practice of reflexivity within the research team,
  • modelling of vulnerability by senior researchers, and
  • discussions about reflexivity within research networks

...might help normalize reflexivity centered on uncertainty and mistakes in research processes.

끝없는 거울의 전당으로서의 반사성
Reflexivity as a never-ending hall of mirrors

반사성을 연습하는 데는 유일한 방법이 없다. 연구자의 인식론적 입장에 따라 반사성의 다른 측면이 다른 측면보다 우선할 수 있다(Day 2012). 우리 역시 린치(2000)처럼 반사성을 질적 연구를 수행하는 데 있어 '피할 수 없는 특징'으로 보고 있지만, 반사성을 과도하게 사용하는 것은 '거울의 전당'에 갇힌 것과 같다고 할 수 있다. 하나는 다음과 같은 질문을 제기한다. 
우리가 언제 충분한 반사율을 보였습니까? 언제 끝나요? 특히 반사성을 프로젝트의 라이프사이클 전체에 걸쳐 계속되는 엄격한 연구의 특징으로 본다면, 실망스럽게도 대답은 '절대 끝나지 않는다'일 수 있습니다
There is no one way to practice reflexivity. Depending on the epistemological stance of the researcher, different aspects of reflexivity might be foregrounded over others (Day 2012). Although we, like Lynch (2000), see reflexivity as an ‘unavoidable feature’ in performing qualitative research, overdoing reflexivity might be likened to being stuck in a ‘hall of mirrors’ (Lynch 2000). One poses the questions: When have we done enough reflexivity? When does it end? The disheartening answer might be ‘never,’ especially if we see reflexivity as a hallmark of rigorous research that continues throughout the projects’ lifecycle.

그러나 [반사율 연습의 충분성]을 확인하는 방법은 [최종 원고를 검토하는 것]이다. 청중에게 명확한 메시지를 전달하기 위해, 연구원들은 다음을 해야 한다.

  • [연구 질문]과 [연구의 이론적 및 개념적 근거] 사이의 정렬을 주시한다.
  • [방법론적 선택]에 대한 명확한 정당성을 제공한다.
  • [방법 섹션]에 연구 맥락에 대한 명확한 설명을 제시한다.
  • [결과 섹션]에서 참가자와 연구자의 목소리를 균형 있게 조정한다.

구체적인 관행과 투명한 보고에 토대를 둔다면, [거울을 보는 것]이 [에셔 그림에 갇힌 것]처럼 느낄 필요가 없다(Lynch 2000).

However, a way to check the sufficiency of reflexivity practices is to examine the final manuscript. To convey a clear message to the audience, researchers need to

  • keep sight of the alignment between the research question and the study’s theoretical and conceptual grounding,
  • provide clear justification for their methodological choices,
  • put forth a clear description of the research context in the methods section, and
  • balance the participant and researcher voices in the results section (Day 2012).

When grounded in concrete practices and transparent reporting, looking in the mirror does not have to feel like you are stuck in an Escher painting (Lynch 2000).

저자 개인 반사성
Authors personal reflexivity

우리는 사려 깊은 질적 연구 과정에 대한 상호 열정 때문에 이 가이드에 왔습니다. 우리는 엄격한 질적 작업을 수행하는 데 관심이 있는 HPE 연구원들이 이용할 수 있는 반사성에 대한 이론적 및 실용적인 지침의 부족으로 어려움을 겪었다. 따라서 우리는 반사성에 관한 문헌에 대해 중립적인 입장을 취하려고 시도하지 않았다. 대신, 본 가이드는 효과적인 반사적 실천을 중심으로 한 우리의 지식과 믿음의 결합과 우리가 보는 문헌의 표현을 나타냅니다. 
We came to this Guide because of a mutual passion for thoughtful qualitative research processes. We were troubled by a lack of theoretical and practical guidance on reflexivity available to HPE researchers interested in doing rigorous qualitative work. Thus, we did not attempt to take a neutral stance regarding the literature on reflexivity. Instead, this Guide represents a combination of our knowledge and beliefs around effective reflexive practice and a representation of the literature as we see it.

우리 팀은 국제기구와 학제간 프로그램을 통해 질적 연구에 대한 전문성을 키워왔기 때문에 우리의 관점에 많은 차이가 있다. 그러나, 우리 모두는 주관주의 또는 사회 구성주의 패러다임 내에서 연구를 포지셔닝하고, 반사성에 대한 우리의 입장은 이러한 관점을 깊이 반영한다. 이 안내서에 사용된 언어는 이러한 관점을 명시적으로 식별합니다. 올모스-베가 박사는 마스트리히트 대학에서 HPE 박사 학위를 받은 마취과 의사입니다. 그는 학생들이 사회문화적, 사회적 물질적 이론을 이용하여 직장에서의 사회적, 물질적 상호작용을 통해 어떻게 배우는지 연구한다. 그는 연구 프로젝트를 감독하기 시작한 이후 질적 연구에 관심이 있는 연구자들이 사용할 수 있는 반사성에 대한 명확한 지침이 없어 좌절감을 느꼈다. 이 좌절감이 마침내 그를 이 안내서를 쓰게 만들었다. Stalmeijer 박사는 마스트리히트 대학에서 HDE 박사 학위를 받은 교육학자입니다. 그녀는 교육의 질적 관리에 대한 배경과 인지적 견습 이론을 이용한 임상 교사 평가에 초점을 맞춘 박사 학위를 가지고 있다. 그녀는 현재 사회문화 이론을 사용하여 직장 학습과 지도를 연구하고 직장 학습 중에 존재하는 전문직 간 역학을 전경화하는 데 초점을 맞추고 있다. Varpio 박사의 박사 학위는 수사학에 중점을 두고 있으며, 그녀의 HPE 경력은 과학 철학에 대한 세심한 주의와 그러한 철학이 연구 실천에 어떻게 영향을 미치는지에 기초하고 있다. 이러한 배경과 질적 HPE 연구원으로서의 활발한 연구를 고려할 때, 그녀는 반사성을 포함한 다양한 연구 패러다임과 방법론에 걸쳐 엄격함을 유지하는 기본 원칙을 명확히 할 필요가 있다고 주장한다. 칼케 박사는 맥마스터 대학교, 앨버타 대학교, 브리티시 컬럼비아 대학교에서 교육학 박사 학위를 취득했다. 그녀는 사회문화 이론과 비판 이론(예: 비판적 인종 이론)의 분과를 사용하여 훈련생 및 의사 기관과 의료 시스템의 사회 정의에 대한 연구를 수행한다. 그녀는 참여자의 목소리를 부각시킬 수 있는 새로운 연구 전략에 열정을 가지고 있으며, 그녀의 작품의 사회 정의 목표를 위협하는 권력 역학을 관리한다. 이러한 관점은 대인관계 반사성에 대한 그녀의 견해를 깊이 알려준다. Dr. Kahke, Varpio 및 Stalmeijer는 석사 및 박사 수준의 대학원생들에게 질적 연구 방법론을 가르치고 그들의 교수 실습에 반사성에 대한 논의를 통합한다. 우리 팀의 경험은 이 가이드를 형성했고, 우리는 이 연구와 작성 과정에 도움을 주었고, 이는 우리의 연구와 교육 실습에서 반사성에 대한 우리의 이해를 다시 형성했습니다. 이 기사가 우리의 집단적 전문성과 주관성으로부터 이익을 얻는다는 것을 인정하기 위해, 우리는 이 원고 전체에 1인칭 복수 "우리"와 "우리"를 사용한다.
Our team developed expertise in qualitative research through international institutions and interdisciplinary programs; thus, there are many differences in our perspectives. However, we all position our research within subjectivist or social constructionist paradigms, and our stances on reflexivity deeply reflect this perspective. The language used in this Guide explicitly identifies this perspective. Dr Olmos-Vega is an anesthesiologist with a PhD in HPE from Maastricht University. He studies how students learn through social and material interactions in the workplace using sociocultural and socio-material theories. Since he started supervising research projects, he felt frustrated by the lack of a clear guide to reflexivity that could be used by researchers interested in qualitative research. This frustration finally drove him to write this Guide. Dr Stalmeijer is an educationalist with a PhD in HPE from Maastricht University. She has a background in quality management of education and her PhD focused on the evaluation of clinical teachers using Cognitive Apprenticeship theory. She currently studies workplace learning and guidance using sociocultural theories and focuses on foregrounding the interprofessional dynamics present during workplace learning. Dr Varpio’s doctoral degree is in English, focusing on rhetoric; her HPE career has been built on careful attention to philosophies of science and how those philosophies impact research practices. Given this background and her active work as a qualitative HPE researcher, she advocates for the need to clarify the foundational principles that uphold rigor across different research paradigms and methodologies—including reflexivity. Dr Kahlke holds a PhD in Education and trained at McMaster University, the University of Alberta, and the University of British Columbia. She uses sociocultural theory and branches of critical theory (such as Critical Race Theory) to conduct her research on trainee and physician agency and social justice in healthcare systems. She has a passion for novel research strategies that can highlight participant voices and manage power dynamics that threaten the social justice aims of her work. This perspective deeply informs her views on interpersonal reflexivity. Drs. Kahlke, Varpio, and Stalmeijer teach qualitative research methodology to graduate students at both Masters and PhD levels and incorporate discussions on reflexivity in their teaching practice. Our team’s experience shaped this Guide, and we benefited this research and writing process, which reshaped our understandings of reflexivity in our research and teaching practice. To acknowledge that this article benefits from our collective expertise and subjectivities, we use the first-person plural “we” and “our” throughout this manuscript.

결론
Conclusion

이 AME 가이드에서는 반사성에 대한 명확하고 통일된 정의를 발전시켰습니다. 우리는 독자들에게 그것들을 해결하기 위한 도구와 전략을 제공하는 동시에 반사성의 여러 측면을 탐구했다. 우리는 이 가이드가 질적 연구에 관심이 있는 사람들에게 반사성 연습에 대한 간단한 접근법을 제공할 수 있다고 믿는다. 그것은 또한 그들의 학생들과 멘티들을 질적인 연구의 세계에 소개하고 싶어하는 연구 감독관들을 위한 교육 도구로 사용될 수 있을 것이다. 마지막으로 본 가이드를 통해 HPE 분야에서 엄격하고 고품질의 표준을 홍보하여 질적 연구에 대한 관심이 높아지고 있는 것을 공고히 할 수 있는 기반을 마련하고자 한다. 이 가이드를 마무리하기 위해 다음과 같은 네 가지 테이크홈 메시지를 제공합니다. 
In this AMEE Guide, we have advanced a clear and unified definition of reflexivity. We have explored multiple facets of reflexivity while giving readers tools and strategies to address them. We believe this Guide can provide a straightforward approach to reflexivity practice for those interested in qualitative research. It could also be used as a teaching tool for research supervisors who want to introduce their students and mentees to the world of qualitative research. Finally, we hope that we promote rigorous, high-quality standards in the HPE field through this Guide, cementing a solid foundation to consolidate the growing interest in qualitative research. To close this Guide, we would like to provide four take-home messages:

  • 연구 설계의 모든 측면에 포함시켜 반사성을 위한 공간과 시간을 만듭니다. 반사율을 실현하기 위한 도구와 전략을 포함하는 반사율 계획을 수립한다. 불행하게도, 반사성은 집중적인 데이터 생성과 분석을 완료해야 하는 압박이라는 긴급한 문제에서 종종 상실된다. 그러나 무분별한 결정은 질적 연구의 무결성을 위협하고, 문서의 부족은 뉘앙스와 반사적 연구에 대한 보고 능력을 손상시킨다.
  • 협업 내에 반사성을 포함시킨다. 반사성은 사려 깊고 협력적인 방법으로 도전적인 가정과 결정에 의존한다. 이를 위해서는 팀들이 상호 관계를 구축하고 의사 결정과 데이터를 함께 씨름할 시간이 필요합니다.
  • 다양한 유형의 반사성을 탐색합니다. 당신의 연구에 대인관계, 방법론, 문맥 유형을 포함하기 위해 개인적인 반사성을 넘어 모험하라. 각 유형의 뉘앙스를 탐색하고 특정 패러다임과 방법론에 따라 심층적으로 탐색할 반사성 측면을 결정합니다.
  • 당신의 주관성을 수용하라; 기본 목표로서의 객관성을 버리고 의미 있는 반사성 연습을 통해 당신의 주관성의 힘을 받아들인다. 반사율은 제한이 아니다; 그것은 당신의 연구에 있어 자산이다.
  • Make space and time for reflexivity by embedding it in all aspects of study design; construct a reflexivity plan that includes tools and strategies to actualize reflexivity. Unfortunately, reflexivity often gets lost in the pressing issues of intensive data generation and pressure to complete analyses. However, thoughtless decisions threaten the integrity of qualitative research, and lack of documentation impairs the ability to report on nuanced and reflexive research.
  • Embed reflexivity within collaborations; reflexivity relies on challenging assumptions and decisions in thoughtful and collaborative ways. To do this, teams need time to build rapport and grapple with their decisions and data together.
  • Explore different types of reflexivity; venture beyond personal reflexivity to include interpersonal, methodological and contextual types in your study. Explore each type's nuances and decide which reflexivity aspect to explore in-depth according to your specific paradigm and methodology.
  • Embrace your subjectivity; abandon objectivity as a foundational goal and embrace the power of your subjectivity through meaningful reflexivity practices. Reflexivity is not a limitation; it is an asset in your research.

Med Teach. 2022 Apr 7;1-11. doi: 10.1080/0142159X.2022.2057287. Online ahead of print.

A practical guide to reflexivity in qualitative research: AMEE Guide No. 149

Affiliations collapse

Affiliations

1Anesthesiology Department, Pontificia Universidad Javeriana, Bogotá, Colombia.

2Department of Educational Development and Research, School of Health Professions Education, Faculty of Health, Medicine and Life Sciences, Maastricht University, Maastricht, the Netherlands.

3Department of Medicine and Center for Health Professions Education, Uniformed Services University of the Health Sciences, Bethesda, Maryland, USA.

4Division of Education and Innovation, Department of Medicine and Scientist, McMaster University, Hamilton, Canada.

PMID: 35389310

DOI: 10.1080/0142159X.2022.2057287

Abstract

Qualitative research relies on nuanced judgements that require researcher reflexivity, yet reflexivity is often addressed superficially or overlooked completely during the research process. In this AMEE Guide, we define reflexivity as a set of continuous, collaborative, and multifaceted practices through which researchers self-consciously critique, appraise, and evaluate how their subjectivity and context influence the research processes. We frame reflexivity as a way to embrace and value researchers' subjectivity. We also describe the purposes that reflexivity can have depending on different paradigmatic choices. We then address how researchers can account for the significance of the intertwined personal, interpersonal, methodological, and contextual factors that bring research into being and offer specific strategies for communicating reflexivity in research dissemination. With the growth of qualitative research in health professions education, it is essential that qualitative researchers carefully consider their paradigmatic stance and use reflexive practices to align their decisions at all stages of their research. We hope this Guide will illuminate such a path, demonstrating how reflexivity can be used to develop and communicate rigorous qualitative research.

Keywords: Reflexivity; qualitative methods; qualitative research.

 

보건전문직교육을 위한 인공지능(NAM Perspect. 2021)
Artificial Intelligence for Health Professions Educators
Kimberly Lomis, MD, American Medical Association; Pamela Jeff ries, PHD, RN, FAAN, ANEF, Vanderbilt School of Nursing; Anthony Palatta, DDS, EdD, PalattaSolutions; Melanie Sage, PHD, MSW, University at Buff alo School of Social Work; Javaid Sheikh, MD, MBA, Weill Cornell Medicine-Qatar; Carl Sheperis, PhD, MS, Texas A&M University-San Antonio; and Alison Whelan, MD, Association of American Medical Colleges

 

 

행동을 향한 요청
A Call to Action

인공지능(AI)은 이미 미국 생활의 많은 측면에 영향을 미치고 있으며, 건강 유지와 건강 관리 전달을 극적으로 변화시킬 준비가 되어 있다. 보건 전문가의 업무를 알리기 위해 이용할 수 있는 [정보의 폭발]은 그것을 효과적으로 처리할 수 있는 각 개인의 능력을 초과한다[1]. 자신의 [개인적 능력을 강화하기 위해 집단적 지식을 사용하는 법]을 배우는 것이 미래의 건강 제공자와 과거의 건강 제공자를 구별할 것이다. AI는 정통한 제공자를 대체하지 않고 보완함으로써 이러한 진화를 가능하게 할 것이다. 모든 보건직 종사자는 AI 도구를 활용하여 환자와 인구의 관리를 최적화할 수 있는 기회를 갖는다.

Artificial intelligence (AI) is already impacting many facets of American life and is poised to dramatically alter the maintenance of health and the delivery of health care. The explosion of information available to inform the work of health professionals exceeds each individual’s capacity to process it effectively [1]. Learning to wield collective knowledge to augment their own personal abilities will distinguish the health provider of the future from the health provider of the past. AI will help enable this evolution by supplementing—not supplanting—the savvy provider. All health professions have an opportunity to leverage AI tools to optimize the care of patients and populations.

2019년, 국립 의학 아카데미는 의료 분야의 인공지능이라는 제목의 특별 간행물을 발간했다. 희망, 과대광고, 약속, 위험[2]. 학습 건강 시스템의 비전을 지원하기 위해 저자들은 다음과 같이 말했다. "의사, 간호사 및 기타 임상의, 데이터 과학자, 의료 관리자, 공중 보건 공무원, 정책 입안자, 규제 기관, 의료 서비스 구매자 및 환자가 AI 및 기계 학습에서 혁명의 기본 개념, 현재 상태 및 향후 영향을 이해할 필요가 있습니다."[3] 이 원고는 이전의 특별 간행물을 보완하고 보건 전문 교육(HPE) 커뮤니티에 대한 조치 촉구 역할을 하기 위한 것입니다. 교육자들은 이제 AI의 가능성을 활용하거나 잠재적인 위험을 탐색할 준비가 되지 않은 의료 인력을 만들 위험을 감수해야 한다.

In 2019, the National Academy of Medicine released a Special Publication titled Artificial Intelligence in Health Care: The Hope, the Hype, the Promise, the Peril [2]. Intended to support the vision of a learning health system, the authors addressed “the need for physicians, nurses, and other clinicians, data scientists, health care administrators, public health officials, policy makers, regulators, purchasers of health care services, and patients to understand the basic concepts, current state of the art, and future implications of the revolution in AI and machine learning.”[3] This manuscript is intended to complement the prior Special Publication and serve as a call to action to the health professional education (HPE) community. Educators must act now to incorporate training in AI across health professions or risk creating a health workforce unprepared to leverage the promise of AI or navigate its potential perils.

AI의 개요와 의료에서의 응용
Overview of AI and its Applications in Health Care

현재 및 미래 학습자의 교육을 지도하기 위해 [AI에 대한 자신의 이해]를 높이는 것은 HPE의 리더들에게 책임이 있다. 교육적 의미에 대한 후속 논의를 뒷받침하기 위해 간략한 개요가 여기에 제공됩니다(이전 특별 간행물은 더 자세한 정보를 제공합니다).
It is incumbent on leaders of HPE to enhance their own understanding of AI in order to guide the training of current and future learners. A brief overview is provided here to anchor the subsequent discussion of educational implications (the prior Special Publication provides more detail).

AI는 다양한 방법과 기능을 포괄하는 포괄적 용어이다. "하이프"의 많은 부분은 사람처럼 기능할 수 있는 강력한 컴퓨터의 공상 과학에 초점을 맞추고 있다. 훨씬 덜 흥미진진한 [좁은 AI], 즉 단일하고 구체적인 작업을 지원하는 도구 개발이 2021년 AI의 실제 현실이다. AI에 대한 다른 용어로는 알고리즘, 머신러닝, 신경망 등이 있다. 알고리즘은 AI의 중심에 있으며 계속해서 정교해지고 있다[4]. "무엇을 해야 하는지 배우도록" 설계된 알고리즘의 목표는 컴퓨터가 각 단계마다 코딩 지침을 받지 않고 행동할 수 있도록 하는 것이다. 감지하고, 생각하고, 행동하는 기계는 몇 십 년 전만 해도 상상할 수 없었던 방식으로 의료에 영향을 미칠 것이다[2]. 그림 1은 의학 분야와 관련된 AI의 다양한 측면을 개략적으로 보여줍니다.
AI is an umbrella term encompassing multiple methods and capabilities. Much of the “hype” is focused on the science fiction vision of a powerful computer capable of functioning like a human being. The much less exciting narrow AI, or the development of a tool to support a single, specific task, is the actual reality of AI in 2021. Other terms for AI include algorithms, machine learning, and neural networks. Algorithms are at the center of AI and are continually growing in sophistication [4]. Designed to “learn what to do,” the goal of algorithms is to enable computers to act without being given coding guidance for each and every step. Machines that sense, think, and act will impact health care in ways that were unimaginable a few short decades ago [2]. Figure 1 outlines various aspects of AI as they relate to the field of medicine.

 

[희망과 약속]은 증거 기반 관행을 뒷받침하는 광범위한 데이터를 포착하고 처리하기 위한 AI의 활용에 있다. 적절하게 활용된다면, AI는 의료의 접근성, 저렴성 및 품질을 높일 것이며, 환자 데이터의 개인 정보 보호 및 보안을 강화할 수 있는 잠재력을 가지고 있다. 반복적인 작업 및 관리 정보 처리(문서 부담 등)를 오프로드하면, 의료제공자는 창의적인 사고 프로세스에 집중하고, 환자에게 보다 직접적으로 주의를 기울일 수 있다. 의료 분야에서 AI의 잠재적 역할을 완전히 분류하는 것은 본 문서의 범위를 벗어나지만, Matheny et al(표 1 참조)이 제공한 예는 분야와 직업에 걸친 응용 프로그램을 보여준다[2]. AI 도구를 파트너로 받아들이는 것은 전체 의료 시스템과 그 안에 있는 개인에 대한 증강된 지능을 초래할 것이다.
Hope and promise lie in the utilization of AI to capture and process extensive data supporting evidence-based practice. If properly leveraged, AI will increase access, affordability, and quality of health care, and has the potential to enhance privacy and security of patient data. Offloading repetitive tasks and administrative informational processing (such as documentation burdens) frees providers to focus on creative thought processes and attend more directly to their patients. It is beyond the scope of this document to fully catalog potential roles for AI in health care, but examples provided by Matheny et al (see Table 1) demonstrate applications across disciplines and professions [2]. Embracing AI tools as partners will result in augmented intelligence of the entire health care system and the individuals within it.

새로운 기술에는 잠재적인 위험이 있다. 헬스케어를 형성한 이전 기술과 비교했을 때, AI의 근본적인 차이점은 진화 능력이다. 일부 AI 도구는 특정 작업을 완료하도록 프로그래밍된 규칙 기반입니다. 그러나 [AI의 장점]은 대규모 데이터 세트에 대한 노출을 통해 도구를 훈련할 수 있다는 것이며, 이를 통해 AI는 데이터 내에서 작업을 완료하는 자체 방법을 식별할 수 있다. 현재 이러한 데이터 기반 툴은 대부분 애플리케이션 시점에 잠겨locked 있습니다. 즉, 과거 데이터를 사용하여 만들어진 공식에 새로운 데이터를 적용하여 분류한다. 그러나 일부는 지속적으로 학습할 수 있습니다. 도구가 점점 더 많은 데이터에 노출되면, 작업을 처리하는 방법도 수정될 수 있습니다. 

There is potential peril in any new technology. Compared to prior technologies that have shaped health care, a fundamental difference of AI is its capacity to evolve. Some AI tools are rules-based, programmed to complete a specific task. But an advantage of AI is the ability to train a tool via exposure to a large dataset, allowing AI to identify within the data its own method to complete a task. Currently, many such data-based tools are locked at the point of application; using past data, they apply a formula to categorize new data. But some are set to learn continuously: as the tool is exposed to more and more data, it may modify how it addresses the task.

적응 학습 능력은 AI의 경이로움이자 위협이다. 외과의사가 손을 흔들 때 수술 기구가 변형되는 것과 유사하게, 지속적인 AI 도구는 생산량과 성능을 비판적으로 평가할 때 의료 전문가의 주의를 필요로 한다. AI 도구의 설계 및 적용에 대한 인간의 기여는 이미 미국 의료 시스템에 침투한 것과 동일한 편향으로 가득 차 있으며, 그러한 편향은 면밀히 모니터링하지 않으면 AI에 의해 증폭될 수 있다[5]. 따라서 AI 도구의 부상은 임상 추론 및 증거 기반 의학과 같은 분야에서 [인간의 과실을 인정할 필요성]을 상기시키면서 기존 보건 전문가 훈련에 영향을 미친다. 현재 AI 개발의 상당 부분은 경제적 동인과 기업의 이해관계에 의해 형성되고 있다. 의료 제공자들은 [환자와 지역사회의 요구에 대한 옹호자]로서의 역할을 하기 위해 정보를 얻어야 한다. 모든 의료 제공자는 [약속을 극대화하고 위험을 완화]하기 위해 AI에 대한 기본적인 이해가 필요하다.

The ability for adaptive learning is simultaneously the wonder and threat of AI. Analogous to a surgical instrument morphing in the surgeon’s hand as they wield it, continuous AI tools require vigilance from health professionals in critically appraising their outputs and performance. Human contribution to the design and application of AI tools is fraught with the same bias already infiltrating U.S. health care systems, and such bias could be amplified by AI if not closely monitored [5]. The rise of AI tools thus has implications for existing health professions training, reminding of the need to acknowledge human fallibility in areas such as clinical reasoning and evidence-based medicine. Currently, much of AI development is shaped by economic drivers and corporate interests; health providers must be informed to serve as advocates for the needs of patients and communities. All health providers need foundational understanding of AI in order to maximize the promise and mitigate the peril.

AI는 효과적인 [전문직 간 협업 관행]을 가속화할 수 있는 큰 잠재력을 가지고 있다. AI는 [전문적 정체성의 닻]을 [특정 지식의 기금 보유]에서 [해당 정보에 접근, 평가 및 적용하는 전문성]으로 전환하면서 제공자 역할의 근본적인 변화를 촉진할 것이다. 각 제공자는 더 넓은 범위의 정보를 이용할 수 있지만, 각 직업의 고유한 관점은 해당 정보의 의미 있는 적용에 필수적인 것으로 남아 있을 것이다. 학습 조직을 지원하고 건강 시스템을 지속적으로 개선하기 위해 [전문직 간 렌즈]는 AI의 효과적인 교육을 개발하는 데 중요하다[6].

  • "교육자, 의료 시스템 리더 및 정책 입안자 간의 [조정된 계획]은 최적의 학습 환경과 효과적인 의료 인력을 만들기 위한 전제 조건입니다(Cox and Naylor, 2013). [조정된 계획]을 위해서 교육자는 의료 시스템의 지속적인 재설계 노력을 인식해야 하고, 의료 시스템 리더가 유능한 의료 인력을 교육하고 훈련하는 현실을 인식해야 합니다."[7].

AI holds great potential to accelerate effective interprofessional collaborative practice. AI will spur a fundamental alteration in provider roles, shifting the anchor of professional identities from the possession of a specific fund of knowledge toward expertise in accessing, assessing, and applying that information. A greater breadth of information will be available to each provider, but the unique perspectives of each profession will remain essential in the meaningful application of that information. To support a learning organization and continuously improve the health system an interprofessional lens is critical to developing effective education in AI [6].

  • “Coordinated planning among educators, health system leaders, and policy makers is a prerequisite for creating an optimal learning environment and an effective health workforce (Cox and Naylor, 2013). Coordinated planning requires that educators be cognizant of health systems’ ongoing redesign efforts, and that health system leaders recognize the realities of educating and training a competent health workforce” [7].

일부 의료 전문가들은 AI 도구의 개발, 구현 및 진화에 있어 [의료 제공자의 중요한 영향력]을 제공하기 위해 AI를 직업의 초점으로 삼고 광범위한 훈련을 추구할 것이다. 그러나 이 행동 요구는 [모든 의료 전문가]의 준비에 초점을 맞추고 있다. 즉, 일상적인 치료 제공에 다양한 AI 도구를 활용할 사람들을 준비시키는 것이다. 의료 전문가들은 비판적 추론과 데이터 분석의 원칙이 이미 의료 훈련의 기본이라는 점에서 AI를 업무에 통합하는 방법을 성공적으로 학습하는 데 유리하다.

  • "AI 미래의 의료 종사자들은 정보 시스템을 사용하고 상호 작용하는 방법을 배워야 할 것이다. 이를 위해서는 다음을 알아야 한다. 
    • 정보 검색 및 통합,
    • 통계 및 근거 기반 의학에서 평가의 기초 교육,
    • 진단 성능 측정의 관점에서 예측 모델의 해석[2]. "

AI가 도구라기보다는 동료로 인식될 수 있기 때문에, 이러한 상호 작용은 제공자의 태도 변화를 요구할 것이다. HPE의 리더들은 모든 제공자들이 AI의 책임 있는 배치에 기여할 수 있도록 긴급히 행동해야 한다.

Some health professionals will make AI a focus of their careers and will pursue extensive training in order to provide the critical influence of health care providers in the development, implementation, and evolution of AI tools. This call to action, however, focuses on the preparation of all health care professionals — those who will utilize a variety of AI tools in their routine provision of care. Health professionals are at an advantage to successfully learn how to incorporate AI into their work, in that principles of critical reasoning and data analysis are already fundamental to health care training.

  • “Health care workers in the AI future will need to learn how to use and interact with information systems, with foundational education in information retrieval and synthesis, statistics and evidence-based medicine appraisal, and interpretation of predictive models in terms of diagnostic performance measures” [2].

Such interactions will demand an attitudinal shift in providers, as AI may be perceived more as a colleague than a tool. It is imperative that leaders of HPE urgently act to ensure that all providers are positioned to contribute to the responsible deployment of AI.

동시에 교육자가 교육 과정 자체 내에서 강력한 AI 도구를 활용할 가능성이 있다. 교육 프로그램과 관련된 [행정적 부담]은 AI에 의해 상쇄될 수 있으며, 이는 교육자들이 그들의 작업의 더 창의적이고 관계적인 측면에 집중할 수 있게 한다. 특히 흥미로운 점은 경력을 통해 각 전문가의 교육을 강화할 수 있는 기회이다. "정밀의학"과 유사하게, 교육자들은 훈련과 평가를 개인화하기 위해 데이터를 활용함으로써 "정밀 교육"을 육성할 수 있다. 데이터는 교육 자원의 전략적 배치를 알리고 실습과 교육 간의 연결을 강화할 수 있으며, 교육자는 적절한 도구 개발을 옹호할 수 있습니다.
Simultaneously, there is potential for educators to exploit powerful AI tools within the process of education itself. Administrative burdens associated with educational programs could be offset by AI, freeing educators to focus on more creative and relational aspects of their work. Particularly intriguing is the opportunity to enhance the education of each professional throughout one’s career. Analogous to “precision medicine,” educators can foster “precision education” by leveraging data to individualize training and assessment. Data can inform the strategic deployment of educational resources and strengthen the link between practice and education, and educators can advocate for the development of appropriate tools.

따라서 이 원고는 보건 전문 교육자들이 현재 고려해야 하는 이중성, 즉 [AI에 대한 훈련]의 필요성과 [훈련에서 AI의 역할]을 다룬다.
This manuscript thus addresses the duality that health professions educators must consider now: the need for training in AI and the role of AI in training.

 

보건 전문 교육에 AI를 통합하는 것에 대한 망설임 해소
Addressing Hesitance to Incorporating AI into Health Professions Education

이 원고의 저자는 다양한 교육 현장에서 그리고 보건 분야의 청중들과 함께 AI에 대한 더 나은 훈련을 옹호할 기회를 가졌다. 투명한 방식으로 직접 다루어야 하는 그러한 논의에서 많은 의구심이 제기되었다. 회의론은 이러한 행동 요구를 부정할 수 없다. 실제로 AI에 대한 많은 우려는 [학습자를 위한 더 많은 적절한 교육]을 강력히 주장한다[8,9].
The authors of this manuscript have had the opportunity to advocate for better training in AI in various educational venues and with audiences across health professions. Many doubts have been raised in those discussions, which warrant addressing directly in a transparent manner. Skepticism cannot negate this call to action; indeed, many of the concerns about AI argue all the more for appropriate education of learners [8,9].

인공지능에 대한 두려움은 로봇이 창조자를 추월하는 디스토피아 사회로 이어지며 공상 과학 소설을 통해 불멸로 이어졌고, 일부 사람들은 AI의 위험이 그 이점보다 훨씬 크다고 믿게 되었다. 의료 및 HPE 내에서 AI에 대한 우려는 더 구체적이며, 따라서 더 쉽게 해결되어야 한다. 일반적인 경악의 주제에는 다음이 있다.

  • 잠재적인 일자리 감소에 대한 우려,
  • 전통적인 "전문가" 역할에 대한 위협,
  • 기존 정보 기술 및 전자 건강 기록(EHR) 시스템에 AI를 통합하기 위한 전략의 부족,
  • 데이터 수집 및 분석에 관해 잘 훈련된 팀의 부족,
  • AI가 결정이 완전히 투명하지 않은 "블랙박스"인 임상 도구인 것에 대한 우려

Fear of AI leading to a dystopian society where robots overtake their creators has been immortalized through science fiction, leading some to believe that the dangers of AI far outweigh its benefits [10]. Within health care and HPE, concerns about AI are more specific, and therefore should be more readily addressed. Common topics of consternation include

  • concerns for potential job loss,
  • threats to the traditional “expert” role,
  • a lack of strategies for integrating AI into current information technology and electronic health record (EHR) systems,
  • shortage of a well-trained team in data collection and analysis [11], and
  • concerns about AI being a clinical tool that is a “black box” in which decisions are not fully transparent.

AI의 기본 전제는 보건 전문가와 교육자의 업무를 [대체하는 것]이 아니라 [보완하는 것]이다. 이 개념을 오해하는 것은 변화에 대한 보다 근본적인 저항과 함께 실제와 교육에서 AI에 대한 망설임의 주요 원인이다. AI가 무엇이고 할 수 있거나 할 수 없는지에 대한 지식의 부족은 이러한 저항에 기여한다. 방사선학과 병리학의 의학 분야는 이러한 점들을 예시한다. 연구는 알고리즘이 악성 종양을 식별하는 데 있어 방사선사를 능가한다는 것을 입증했지만, 그것은 AI가 방사선사를 대체할 가능성보다는 도구로서의 AI의 가치에 더 많은 것을 말해준다[12]. 사실, 인공지능 시스템은 방사선 이미지를 읽고 해석하는 것과 같은 특정 작업을 수행하도록 설계되었다. 방사선과 의사는 또한 AI를 통해 생산된 여러 접점을 통합하고, 다른 건강 전문가와 상담하며, 환자와 상호 작용할 것으로 기대된다. — 이 모든 것은 인간과 인간의 상호 작용을 위해 가장 적절하게 설계된 역할이다.

The basic premise of AI is to supplement, not supplant, the work of health professionals and educators. Misunderstanding this concept is a primary cause of hesitancy around AI, in practice and in education, along with a more fundamental resistance to change. A lack of knowledge of what AI is and can or cannot do contributes to this resistance. The medical disciplines of radiology and pathology exemplify these points. Studies have documented that algorithms outperform radiologists in identifying malignant tumors, but that speaks more to the value of AI as a tool rather than the likelihood that AI will replace radiologists [12]. In fact, AI systems are designed to accomplish specific tasks like reading and interpreting radiographic images; radiologists are also expected to integrate multiple touch points produced through AI, consult with other health professionals, and interact with patients — all of which are roles most appropriately designed for human-to-human interaction.

다른 건강 직업의 예로는 [정신 건강 관리와 관련된 AI]의 발전이 있다. AI는 전 세계 정신 건강 전문가의 심각한 부족을 해결하기 위해 활용되고 있다. 임상적으로 입증된 인지행동치료(CBT) 챗봇 플랫폼인 Worebot은 AI를 사용하여 사용자와 치료 동맹을 형성하고 개별 제시 증상을 기반으로 CBT 접근 방식을 채택한다[13].
Examples from other health professions include advances in AI related to mental health care. AI is being utilized to address the critical shortage of mental health professionals throughout the world. Woebot, a clinically proven Cognitive Behavioral Therapy (CBT) chatbot platform, uses AI to form a therapeutic alliance with the user and adapts the CBT approach based on the individual presenting symptoms [13].

정신 건강에서 임상적으로 입증된 또 다른 AI 구현은 테스Tess로, 사용자의 행동 변화를 촉진하기 위해 교육, 대화 및 치료 접근 방식을 채택한다[14]. 테스는 전 세계적으로 1천9백만 명 이상의 사람들에 의해 이용되었다. 수백만 명의 사람들이 정신 건강 전문가의 업무를 보완하기 위해 AI를 사용하고 있지만, 역량 영역은 AI 접근 방식과 관련하여 실무자가 필요로 하는 지식 기반을 반영하거나 기존 AI 사용의 치료 과정에 필요한 통합을 반영하기 위해 업데이트되지 않았다. 딥 러닝 및 고급 데이터 분석과 같은 AI의 특정 애플리케이션은 의료 전문가의 대체자로 간주되지 않고 파트너 및 협력자로 간주될 수 있다[15]. AI가 제공자를 대체하는 것이 아니라, AI를 활용하는 제공자가 그렇지 않은 제공자를 대체할 것이다.
Another clinically proven AI implementation in mental health is Tess, which employs educational, conversational, and therapeutic approaches to foster behavior change in the user [14]. Tess has been used by more than 19 million people worldwide. While millions of people are using AI to supplement the work of mental health professionals, competency domains have not been updated to reflect the knowledge base that practitioners need in relation to AI approaches or to reflect the needed integration of existing AI usage into the treatment process. Certain applications of AI, like deep learning and advanced data analytics, could be viewed as partners and collaborators and not feared as displacers of health care professionals [15]. AI will not replace providers, but providers who leverage AI will replace those who do not.

이미 보건 분야 전반에 걸쳐 [과부하가 걸린 커리큘럼]은 학습자를 위해 AI에 추가 역량을 추가하는 것에 대한 저항을 불러일으킨다. 촘촘한 커리큘럼은 학생들의 복지와 교직원의 번아웃에 영향을 미친다. 그러나 모든 진화하는 의료 영역과 마찬가지로 [AI가 기존 콘텐츠와 어떻게 관련되는지 결정]하고, [모든 콘텐츠 영역에 대해 향후 practice에 미치는 상대적 영향을 평가]하는 것이 향후 경로를 식별하기 위해 중요할 것이다. 보건 분야의 새로운 정보가 기하급수적으로 증가함에 따라, "정보 과부하"는 학생들과 교육자들의 정신의 인지 및 정신적 능력을 계속해서 압도하고 있다. 이러한 모순이 커짐에 따라 교육에 대한 보건 전문 교육자들의 생각이 바뀌었고, 현재와 같은 오랜 "정보 획득" 모델이 아닌 "지식 관리"에 학습을 다시 집중해야 한다는 요구가 제기되었습니다. 여기서 아이러니한 점은 AI를 보건직의 과목으로 추가하고 교육과정을 관리하는 도구로 추가하면 실제로 교육과정 부담을 줄일 수 있다는 것이다. 일부 생물의학 및 임상 지식을 AI 알고리듬으로 마이그레이션함으로써 교육자는 보건 전문 교육과정에 더 많은 숨통을 틔우고 학생과 교직원의 실제 경험에 주입할 수 있다[16,17].
The already overloaded curriculum across health professions creates resistance to adding additional competencies in AI for learners. The dense curriculum has implications for students’ well-being and faculty burnout. But, as with all evolving areas of medicine, determining how AI relates to existing content and weighing the relative impact of all areas of content on future practice will be critical in order to identify paths forward. As new information in the health professions continues to exponentially grow, “information overload” continues to overwhelm the cognitive and mental capacity of students’ and educators’ minds. This growing incongruence has led to a shift in health professions educators’ thinking regarding instruction, with calls to refocus learning on “knowledge management” rather than the current and long standing “information acquisition” model. The irony here is that the addition of AI as a subject in health professions and as a tool to manage the curriculum can actually reduce curricular load. By migrating some biomedical and clinical knowledge to AI algorithms, educators can instill more breathing room into health professions curricula and into the lived experiences of students and faculty [16,17].

AI에서 교육과정을 만들고 전달할 수 있는 [적절한 전문성을 갖춘 교수진의 부족]도 우려된다. 교육 프로그램과 보건 시스템의 전문가들 사이의 새로운 관계를 개발하는 것이 출발점을 제공할 수 있다. 교육과정 감독을 담당하는 보건직 교직원은 인공지능과 수학적 모델링, 결정론 등 주제에 대한 디지털 활용능력을 향상시켜야 할 것이며, 그만큼 교직원의 육성이 우선돼야 한다. 마찬가지로, 교육 과정을 개선하기 위해 AI를 가장 잘 활용할 수 있는 지식과 기술의 부족과 그러한 도구를 개발할 수 있는 자원의 부족은 진전을 방해한다.
There is also concern about a lack of faculty with the appropriate expertise to create and deliver curricula in AI. Developing new relationships between the educational program and experts in the health system may offer a starting point. Health professions faculty members responsible for curricular oversight will need to improve their digital literacy regarding AI and topics such as mathematical modelling and decision theory, and as such, faculty development must be a priority. Similarly, a lack of knowledge and skills to best utilize AI to enhance the process of education and lack of resources to develop such tools stymies progress.

예측 분석을 위해 AI와 머신러닝을 사용하거나 작업량을 상쇄하는 보건 전문 강사는 [빅데이터와 알고리즘의 편향]과 관련된 유익성과 위해성 모두에 대해 교육을 받아야 한다. 마이크로소프트의 봇 테이Tay의 예는 감독되지 않은 기계 학습에 대한 경고적인 이야기이다. "대화적 이해"를 위한 실험으로 설계된 Tay는 공개적으로 AI 트위터 사용자로 자리매김했다. 24시간 이내에 해커들은 혐오와 인종차별적 댓글로 시스템을 압도했고, Tay는 데이터 입력을 반영한 메시지를 쏟아냈다[18]. 학생과 교육자는 AI가 정체된 기능이 아니며 지속적으로 분석, 평가 및 업데이트되어야 한다는 것을 깨달아야 한다. 인공지능 알고리즘의 효율성은 인간이 수집한 데이터에 의해 영향을 받기 때문에 무의식적인 편견이 의도하지 않게 통합될 수 있다. 이전에 수행된 연구는 과소 대표되고 소외된 그룹이 전통적으로 데이터 세트에서 제외되었기 때문에 AI 파생 결과에 편견을 추가할 수 있다[19]. AI 교육은 보건 전문가들이 자신의 무의식적 편견을 이해하고 보건 전문가에 대한 불신의 역사가 있는 소외된 집단에게 AI가 지원하는 의사 결정을 설명하는 데 도움이 되는 기술을 개발하는 데 매우 중요하다.

Health professional instructors who use AI and machine learning for predictive analytics or to offset their workloads must be educated on both the benefits and the risks regarding bias in big data and algorithms. The example of Microsoft’s bot Tay is a cautionary tale of unsupervised machine learning. Designed as an experiment in “conversational understanding,” Tay was established as an openly AI Twitter user. Within 24 hours, hackers overwhelmed the system with hateful and racist comments, leading Tay to spew messages reflective of its data input [18]. Students and educators must realize that AI is not a stagnant function and must be constantly analyzed, evaluated, and updated. Because the efficacy of AI algorithms is impacted by the data collected by humans, unconscious biases can be incorporated unintentionally. Previously conducted research can also add biases to AI-derived outcomes because underrepresented and marginalized groups have traditionally been excluded from datasets [19]. Education in AI is critical so that health professionals understand their own unconscious biases and develop the skills to help explain AI-supported decision making to marginalized groups that have a history of mistrust with and in the health professions.

[AI의 잠재적인 부정적인 영향에 대한 우려]와 [교육 조정을 실행할 수 있는 자원의 부족]은 교육자들이 지금 이 과제를 해결해야 한다고 주장한다. 교육자는 모든 제공자가 환자를 돌보고 보호해야 할 전문적인 의무를 이행할 수 있도록 하는 교육을 제공하는 것이 필수적이다. 인공지능의 추가 개발과 통합은 일부 교육자들의 두려움이나 우려 때문에 멈추지 않을 것이다. 보건 분야와 컴퓨터 과학자들 사이의 대화를 촉진하고 파트너십을 개선하면 현실적이고 유용하며 효과적으로 적용되는 기술의 개발이 가능해질 것이다. 중요한 것은, 현재 교육받고 있는 학생들과 학습자들인 건강 직업의 미래는 HPE와 실습에서 AI에 대한 더 긍정적인 수용을 보여주었다. 방사선과 레지던트들을 대상으로 실시한 연구에 따르면, 대다수의 학생들은 AI가 방사선과학을 혁신(77%)하고 개선(86%)할 것이라는 데 동의한 반면, 인간 방사선과 의사가 교체될 것이라는 진술(83%)에는 동의하지 않는 것으로 나타났다. 3분의 2 이상이 AI가 의료 훈련에 포함되어야 한다는 필요성에 동의했다(71%) [20]. 보건 전문 교육자들이 안전하고 양질의 환자 치료를 제공하기 위해 학습자가 임상 환경에서 AI의 사용을 이해하고 지원할 수 있도록 포지셔닝해야 할 때이다.

Concerns about potential negative impacts of AI and a lack of resources to implement educational adjustments argue all the more for educators to tackle this challenge now. It is imperative that educators provide training that empowers all providers to fulfill their professional duty to care for and protect patients. The further development and incorporation of AI will not stop due to the fears or concerns of some educators. Promoting a dialogue and improving partnerships between the health disciplines and computer scientists would enable the development of realistic, usable, and effectively applied technology. Importantly, the future of the health professions, the students and learners being educated now, have demonstrated a more positive acceptance of AI in HPE and practice. A study conducted with radiology residents showed that a majority of students agreed that AI will revolutionize (77 percent) and improve (86 percent) radiology, while disagreeing with statements that human radiologists will be replaced (83 percent). More than two-thirds agreed with the need for AI to be included in medical training (71 percent) [20]. The time is right for health professions educators to position their learners to understand and support the use of AI in the clinical setting with the intent to provide safe, quality patient care.

따라서 보건 전문 교육자들은 보건 및 의료 제공에서 AI의 출현의 두 가지 측면을 고려해야 한다.

  • 보건 전문가들이 그들의 일을 잘하기 위해 어떤 AI 교육이 필요할까?
  • 보건 전문가의 교육을 개선하기 위해 AI 기능을 어떻게 활용할 수 있습니까?

Thus, health professions educators must consider two aspects of the emergence of AI in health and health care delivery:

  1. What training in AI will health professionals need to do their jobs well?
  2. How can AI capabilities be leveraged to improve the training of health professionals?

 

AI 교육
Training in AI

앞서 언급했듯이, 이 원고의 범위는 모든 제공자의 기본적 요구를 고려하는 것이지, [AI 개발을 전문으로 선택할 사람들]의 요구를 개략적으로 설명하는 것이 아니다. 모든 분야가 이 과정에서 비교적 초기 단계이고 AI가 발전함에 따라 직업 간 업무 관계가 바뀔 가능성이 높기 때문에 AI 훈련은 전문 교육 접근에 무르익었다. 서로에 대해, 서로에게서, 그리고 함께 배우는 것은 보건 전문가들이 위험을 예측하고 완화하고 AI의 가능성을 증폭시킬 수 있는 풍부한 관점을 추가한다. 다음 영역은 AI에 대한 교육에서 다루어야 할 핵심 요소를 요약한다.

As mentioned previously, the scope of this manuscript is to consider foundational needs of all providers, not to outline the needs of those who will choose to specialize in AI development. Training in AI is ripe for interprofessional educational approaches because all fields are relatively early on in this process and the relationships of work across professions will likely shift as AI advances. Learning about, from, and with one another adds rich perspectives that will enable health professions to anticipate and mitigate perils and amplify the promise of AI. The following domains outline key elements to be addressed in education about AI.

 

정보 오버로드
Information Overload

역사적으로 [정보의 획득, 정보의 합성 및 적절한 적용]은 의료 전문가의 훈련을 특징지었다. EHR, 이미징, 생체인식, 멀티오믹스 및 센서를 통한 원격 모니터링의 [데이터가 폭발적으로 증가]하기 때문에, 이러한 데이터의 분석을 관리하는 데는 정교한 알고리즘의 적용이 점점 더 필요하다. 기존 커리큘럼은 더 이상 지식 관리와 기계 학습 및 데이터 분석의 효과적인 활용이 필요한 진화하는 요구에 의료 전문가를 대비시킬 수 없습니다[16]. 또한 훈련생은 사람들이 행동을 적응하고 건강한 생활방식을 선택하는데 도움이 되는 여러 디지털 도구(예: Apple Watch는 수면 평가를 포함한 다양한 생리학적 측정치를 수집할 수 있음)를 사용하여, 상세하고 개인화된 데이터를 수집할 수 있기 때문에, 정밀 건강에 점점 더 초점을 맞출 수 있도록 준비해야 한다. [정보 과부하]라는 이 과제를 명시적으로 명명하는 것은 보건 전문가 학습자들이 AI 지원과 지속적인 학습의 필요성을 이해하는 데 도움이 된다.

Historically, acquisition of information, its synthesis, and proper application has characterized health care professionals’ training. Due to the explosion of data from EHRs, imaging, biometrics, multi-omics, and remote monitoring via sensors, managing analyses of such data increasingly requires application of sophisticated algorithms. Traditional curricula can no longer prepare health professionals for the evolving needs that require knowledge management and effective utilization of machine learning and data analytics [16]. In addition, trainees need to be prepared for an increasing focus on precision health due to the ability to gather detailed, personalized data using multiple digital tools (e.g., an Apple Watch can collect various physiological measurements including sleep assessment) that will help people adapt their behavior and make healthy lifestyle choices. Explicitly naming this challenge of information overload helps health professions learners understand the need for AI support and for their own continual learning.

 

인공지능의 기반
Foundations in AI

모든 제공자는 [AI가 무엇인지, AI가 어떻게 작동하는지, 그리고 현재 실행 중인 다른 형태의 기술과 어떻게 다른지에 대한 근본적인 이해]가 필요하다. 보건 전문가의 업무에 AI가 적용되는 다양한 방법에 대한 일반적인 이해는 훈련의 초기 단계에서 적절합니다. 주어진 분야에서 발전함에 따라, 자신의 분야에서 사용되는 더 구체적인 응용 분야에서 추가적인 훈련이 필요할 것이다. [규제 및 윤리적 문제]를 포함하여 [AI 애플리케이션을 감독oversight]하는 제공자의 역할을 이해하는 것은 이러한 새로운 도구가 [약속을 최적화하고 잠재적 위험을 최소화]하는 방식으로 사용되도록 보장하는 [집단적 전문적 의무]를 충족하는 데 도움이 될 것이다.
All providers need a fundamental understanding of what AI is, how it works, and how it differs from other forms of technology currently in practice. A general understanding of various ways in which AI is applied to the work of health professionals is appropriate at early stages of training; as one advances in a given field, additional training will be needed in more specific applications used in one’s discipline. Understanding the provider’s role in oversight of AI applications, including regulatory and ethical concerns, will aid in meeting the collective professional obligation to ensure that these new tools are used in a manner that optimizes their promise and minimizes potential perils.

 

새로운 역량
New Competencies

최근 문헌은 HPE에 통합될 AI의 훈련 요소에 대한 제안을 제공한다. 맥코이 외 [21] 광범위한 역량을 다음과 같이 설명한다.

의료 전문가들이 의료 서비스 제공에서 수행해야 하는 새로운 역할:

  • 평가자: 주어진 임상 상황에 [테크놀로지 활용이 적합한 시점]이 언제이며, 의미 있는 결과를 위해 [필요한 입력이 무엇인지]를 평가할 수 있는 능력
  • 해석가: 오류, 편향 또는 임상적 부적절성의 잠재적 원인을 아는 것을 포함하여, 합리적인 정확도로 지식과 기술에 대한 해석
  • 소통가: 환자 및 기타 의료 전문가가 [이해할 수 있는 방식]으로 결과 및 기본 프로세스 전달

더 넓은 전문적 맥락에서 AI를 이해할 수 있는 역량:

  • 스튜어드십: 환자 데이터에 대한 책임 있는 스튜어드(지킴이)가 되어 공급자와 환자 간의 기본적인 신뢰를 보장합니다.
  • 어드보커시: 데이터 보안 및 개인 정보 보호와 관련된 위험 이해—의료 제공자는 [윤리적이고 공정한 시스템] 개발 및 배치를 옹호할 준비가 되어 있어야 합니다.

Recent literature offers suggestions regarding the elements of training in AI to be incorporated into HPE. McCoy et al. [21] describe broad competencies as:

New roles that health professionals must assume in delivering care:

  • Evaluator: Being able to evaluate
    • when a technology is appropriate for a given clinical context and
    • what inputs are required for meaningful results
  • Interpreter: Interpretation of knowledge and skills with a reasonable degree of accuracy including knowing potential sources of error, bias, or clinical inappropriateness
  • Communicator: Communication of results and underlying process in a way that patients and other health professionals can understand

Competencies for understanding AI in a broader professional context:

  • Stewardship: Be a responsible steward for patient data to ensure basic trust between provider and patient
  • Advocacy: Understand the risks around data security and privacy—health care providers must be equipped to advocate for the development and deployment of ethical and equitable systems

McCoy 등과 Law 등은 [기본적인 컴퓨터 프로그래밍 기술]에 대한 보건 전문가의 명시적 훈련, 소프트웨어 설계의 모범 사례에 대한 이해, 그리고 새로운 도구를 실무에 통합하는 방법을 구상하는 능력에 대한 추가적인 필요성을 주장한다[20, 21]. [프로그래밍 훈련]이 모든 보건 전문직 학생들에게 필요한 것은 아니지만, 그들 모두는 알고리즘 개발 및 유지보수의 모범 사례와 한계에 대한 근본적인 이해가 필요하다.
McCoy et al. and Law et al. argue for the additional need for explicit training of health professionals in fundamental computer programming skills, an understanding of good practices in software design, and the ability to envision how to incorporate new tools into practice [20, 21]. Training in programming may not be indicated for every health professions student, but all of them need a fundamental understanding of best practices in, and limitations of, algorithmic development and maintenance.

 

역량을 폭넓게 고려
Considering Competency Broadly

인공지능에 대한 지식을 넘어, 보건 직업에 필요한 다른 역량 영역도 영향을 받을 것이다. AI가 제공자의 작업을 대체하지 않고 보완할 것이라는 것을 받아들이는 것은 제공자가 AI와 효과적으로 협력하기 위해 필요한 질적 속성에 대한 신속한 고려가 보증되고 필요하다. 예를 들어, AI가 임상적 만남에 통합됨에 따라, 보건 전문직 학생들은 진료 전달의 중요한 휴머니즘 요소를 유지하기 위해 [새로운 의사소통 기술과 전문성에 대한 훈련]이 필요하다. 기술에 민첩하면서도 환자와 효과적으로 연결할 수 있는 전문가를 준비하기 위해 명확한 의사소통, 공감 배양, 건강 옹호 및 협업과 같은 기술에 대한 강조가 점점 더 필요할 것이다[22, 23]. 의사소통, 공감 및 배려를 촉진하려면 더 많은 관심과 전문지식이 필요합니다 [24]. 많은 사람들, 그리고 아마도 가장 많은 지노 윅맨에게 귀속된 인용구를 참조하기 위해, "예측 가능한 것을 체계화하라, 그러면 당신은 예외적인 것을 인간화할 수 있다."  이런 '하이테크, 하이 터치' 방식이 인기를 끌고 있는 것으로 보인다. 2016년 미국 의과대학 협회 자료에 따르면, 의과대학의 94%가 필수 또는 선택 과목을 제공하여 학생들이 다양한 환자의 요구를 더 잘 이해할 수 있도록 포지셔닝하는 등 지난 몇 년 동안 [의학 인문학 훈련]이 지속적으로 증가해왔다[25].

Beyond knowledge of AI, other competency domains necessary for health professions will be impacted as well. Accepting that AI will supplement, not supplant, the work of providers, prompt consideration of the qualitative attributes that providers need to partner effectively with AI is both warranted and necessary. For example, as AI is incorporated into clinical encounters, health professions students need training in new communication skills and professionalism to retain the critical humanist elements of care delivery. Increased emphasis on skills such as clear communication, empathy cultivation, health advocacy, and collaboration will be increasingly needed to prepare professionals who can connect effectively with patients while being facile with technology [22, 23]. Fostering communication, empathy, and caring will require more attention and expertise [24]. To reference a quote that is attributed to many, but perhaps most to Gino Wickman, “Systemize the predictable, so you can humanize the exceptional.” Such a “high tech, high touch” approach seems to be gaining popularity. According to 2016 Association of American Medical Colleges data, training in medical humanities has consistently increased during the past few years, with 94 percent of medical schools offering either required or elective courses positioning students to better understand the needs of diverse patients [25].

 

기존 콘텐츠 재고
Rethinking Traditional Content

AI의 출현은 또한 [전통적인 콘텐츠의 영역을 새로운 방식으로 다룰 필요가 있다는 증거]를 제시한다. 의사 결정 시 임상의가 이용할 수 있는 [정보의 확산은 개인 제공자의 처리 능력을 초과]했다. 인공지능은 집단지식으로 개인의 역량을 강화함으로써 도움을 줄 수 있다. 이는 최근 수십 년 동안 [인간 진단 오류의 현실]에 대한 인식 증가를 반영한다[26]. 비슷하게, 사회는 건강 관리를 포함한 모든 시스템에 스며드는 [구조적 편견]을 수용하고 있다. 앞서 언급했듯이, 많은 사람들은 AI가 이미 존재하는 편견을 증폭시킬 수 있는 위험을 빠르게 지적하는데, 이는 인간의 편견과 건강의 기존 구조적 결정 요인에 대한 더 강력한 훈련을 주장한다. 그러므로 건강 전문직 학생들은 메타인식(인간이 어떻게 생각하고 결정을 내리는지에 대한 이해)에 대한 더 깊은 훈련이 필요하다. 

The emergence of AI also presents evidence that traditional areas of content may need to be addressed in new ways. The proliferation of information available to clinicians at the time of decision making has exceeded the processing capacity of an individual provider; AI can assist by augmenting one’s individual capabilities with collective knowledge. This reflects increasing acknowledgment over recent decades of the realities of human diagnostic error [26]. Similarly, society is coming to terms with the structural biases that permeate every system, including health care. As noted previously, many are quick to point to the risk that AI could amplify bias that already exists, which argues for stronger training around human bias and existing structural determinants of health. Health professions students thus need deeper training in metacognition — an understanding of how humans think and make decisions.

역사적 편견을 인식하고 극복하려면 체계적인 훈련 프로그램이 필요하다[27]. AI는 기존 데이터 세트를 활용하기 때문에 건강 데이터의 [체계적이고 역사적인 편견, 오류 및 누락]을 강조하기 위한 추가 교육이 필요하다. 의료 전문가들은 데이터 품질을 보장하는 책임을 수용하도록 교육받아야 한다. 모든 제공자는 환자와 지역사회에 대한 정보 수집(그리고 더 중요하게는 문서화)에 기여한다. [책임 있는 문서화 프로세스에 관한 교육]과 [EHR에 대한 적절한 기여]는 AI가 의존하는 데이터 세트를 강화할 것이다. 마지막으로, 임상의는 특정 환경과 특정 모집단에서 AI 응용 프로그램의 관련성을 결정할 때 건강 및 건강 관리의 맥락에 대한 이해를 적용할 수 있도록 학습해야 한다.

Systematic training programs are required to become aware of and to overcome historical biases [27]. Because AI draws on existing datasets, additional training is needed to emphasize systematic and historical biases, errors, and omissions in health data. Health professionals must be trained to embrace responsibility for ensuring data quality. All providers contribute to the collection of — and, importantly, the documentation of — information about patients and communities. Education in responsible documentation processes and appropriate contribution to EHRs will strengthen the datasets on which AI relies. Finally, clinicians must be taught to apply an understanding of contexts of health and health care when determining the relevance of AI applications in a particular milieu and for particular populations.

 

전문직 간 역할 전환
Shifting Interprofessional Roles

HPE는 [전문직 간 관행 패턴의 변화]를 예상해야 한다. 의료 제공자가 되는 것이 무엇을 의미하는지에 대한 비전은 [개인이나 주어진 공동체의 요구에 정보를 접근하고 평가하고 적용]하는 데 있어 [정보의 개별 책임자]에서 [시스템 사고 전문가]로 이동할 것이다. 각 제공자는 데이터 입력이 치료 및 치료를 안내하는 AI 출력에 영향을 미친다는 것을 배우는 것이 중요하다. 인공지능으로 연결된 [웨어러블 기기]는 예방과 관리 전달을 점점 더 통합할 것이다. 디지털 건강 리터러시 훈련은 특정 보건 직업의 관점에서 그러한 데이터에 대한 이해를 촉진하는 동시에, 그러한 정보가 다른 보건 직업과 더 넓은 보건 시스템의 전문지식에 어떻게 적합한지를 인식하는 데 필요하다. 스마트 기술 모니터링을 통해 환자 스스로 수집한 데이터는 각 진료 제공자가 제출한 데이터를 보완한다. 보건 전문 인력 양성은 환자 및 제공자와의 파트너십의 맥락에서 학생들이 전통적인 "질병 중심의 의학"에서 건강 증진으로 패러다임 전환에 대비할 필요가 있다. 의료 제공자가 데이터 과학자 및 기타 디지털 전문가와 협력하기 때문에 [전문직 간 팀의 구성]이 변경될 것이다[28]. 팀의 역할은 딥 러닝 알고리즘을 기반으로 한 더 건강한 선택과 의사 결정으로 개인들을 안내하는 보다 [간-전문직적 사람 중심의 접근 방식interprofessional person-centered approach]으로 전환될 것이다. 따라서 교육자들은 팀이 의사 결정을 유도하기 위해 데이터 기반 알고리즘에 점점 더 많이 의존함에 따라 [데이터 편향, 생명윤리적 과제 및 책임에 대한 영향]을 인식할 수 있는 [전문직간interprofessional 학습 기회]를 개발해야 한다[28]. 

HPE must anticipate shifts in interprofessional practice patterns. The vision of what it means to be a health care provider will move away from individual stewards of information toward systems-thinking experts in accessing, assessing, and applying information to the needs of an individual or a given community. It is critical that each provider be taught that data inputs impact AI outputs that guide care and treatment. Wearable devices connected by AI will increasingly integrate prevention and care delivery. Training in digital health literacy is needed to promote understanding of such data from the lens of a specific health profession, but also in recognizing how such information fits within the expertise of other health professions and the broader health system. Data collected by patients themselves through smart technology monitoring will supplement data submitted by each care provider. Health professions training needs to prepare students for the paradigm shift from the traditional “disease-oriented medicine” to promotion of wellness in the context of a partnership with patients and providers. The composition of the interprofessional team will be altered, as health care providers will collaborate with data scientists and other digital experts [28]. The role of the team will shift toward a more interprofessional person-centered approach, guiding individuals toward healthier options and decision making based on deep learning algorithms. Educators must thus develop interprofessional learning opportunities to recognize data biases, bioethical challenges, and implications for liability as teams increasingly rely on data-driven algorithms to drive decision making [28].

다른 유형의 사람이 보건 전문가로서 성공할 수도 있다. 의료 팀의 동료 구성원으로부터든 AI 도구로부터든 외부 인풋을 수용하도록 제공자를 위치시키는 [개인적 겸손personal humility]의 가치에 대한 인식이 증가하면, [강력한 개인적 지식personal knowledge]를 가치있게 여기던 전통적인 것과의 균형을 맞춰야 한다. 건강전문 학습자를 대상으로 AI와 머신러닝의 위험과 이점에 대해 함께 교육하는 것은 학생들이 건강전문팀의 일원이 되면서 공유지식의 체계를 구축할 것이다. 
It may be that a different type of person will succeed as a health professional. An increasing recognition of the value of personal humility that positions a provider to accept external input, whether from fellow members of the care team or from AI tools, must balance a traditional value for strong personal knowledge. Educating health professions learners together on the risks and benefits of AI and machine learning will set up a system of shared knowledge as students become members of the health professional team.

 

윤리적 및 전문적인 영향
Ethical and Professional Implications

[AI에 대한 윤리적 및 규제적 감독oversight]에 참여하는 보건 전문가의 의무도 교육의 대상이 되어야한다고 주장한다. 미국에서는 의료 기관의 의사 결정자들이 AI가 의학을 개선할 것이라고 얼마나 확신하느냐는 질문을 받았을 때, 약 50%가 치명적인 오류를 일으키고, 운영상의 결함이 있으며, 충족되지 않은 기대를 낳을 것이라고 우려했다[29]. 영국에서는 성인 인구의 63%가 AI를 통한 건강관리 개선을 위해 개인 데이터를 제공하고 허용하는 것에 대해 불편함을 느끼고 있다. 제공자가 [데이터 보호 요구사항, 환자 개인 정보 보호 및 기밀성]을 이해하고 모니터링하도록 보장하고, [편향된 샘플링을 최소화]하며, [AI 개발자가 이러한 노력을 다루는 투명한 의사소통 및 조치를 제공할 것을 요구]하도록 교육을 개발해야 한다[29]. 의료 분야에서 인공지능의 침투가 증가함에 따라 어떤 추가 역량이 필요한지, 역사적 역량이 어떻게 조정되어야 하는지를 명확히 하기 위해 전문 교육자 간 추가적인 협업이 필요할 것이다. 

The duty of health professionals to engage in ethical and regulatory oversight of AI also argues for targeted education. In the United States, when decision makers at health care organizations were asked how confident they were that AI would improve medicine, roughly 50 percent feared that it will produce fatal errors, have operational flaws, and produce unmet expectations [29]. In the United Kingdom, 63 percent of the adult population is not comfortable with providing and allowing personal data to be used to improve health care through AI. Training must be developed to ensure that providers understand and monitor data protection requirements, patient privacy, and confidentiality, as well as minimize bias sampling and demand that AI developers provide transparent communication and actions addressing these endeavors [29]. Further collaboration among interprofessional educators will be necessary to clarify what additional competencies are needed and how historical competencies must be refined in light of increasing penetrance of AI in health care.

 

AI 인 트레이닝
AI in Training

보건 전문 학습자가 향후 작업에 AI 도구를 활용할 수 있도록 준비하는 것 외에도, 교육자들은 교육 과정을 개선하기 위해 AI의 엄청난 잠재력을 고려해야 한다. 아래에 설명된 여러 예는 AI를 활용하는 것이 훈련의 연속에 걸쳐 교수와 학습에 대한 혁신적인 접근법을 어떻게 추진할 수 있는지를 보여주는 이미 등장했다. 
In addition to preparing health professions learners to utilize AI tools in their future work, educators should consider the tremendous potential of AI to improve the process of education. Multiple examples, which are laid out below, have already emerged that show how leveraging AI can propel innovative approaches to teaching and learning across the continuum of training.

관리 부담 완화
Easing Administrative Burdens

정보는 교육 시스템과 개별 보건 전문가의 학습 요구를 인식하고 해결하는 능력에 매우 중요합니다. 그러나 교육 시스템에는 중요한 행정적 측면이 있다. 제공자의 문서 부담을 줄이기 위한 AI의 임상 적용과 마찬가지로, AI를 활용하면 학생과의 직접적인 상호 작용과 HPE의 혁신을 진전시키기 위한 보다 창의적인 활동을 위한 대역폭을 확보할 수 있다. 예를 들어, 조지아 공과대학교[30]는 온라인 교육에 대한 역량을 확대하려고 노력했지만, 지도자들은 교사 보조(TA)에 대한 수요가 공급을 초과할 것이라고 인식했다. TA에 대한 많은 질문이 더 깊은 학습 문제에 초점을 맞추기보다는 본질적으로 관리적이라는 것을 식별하여, 그들은 TA의 기능을 할 AI 애플리케이션인 질 왓슨Jill Watson을 개발했다. 질은 간단한 질문들을 빠르게 해결하는 데 성공했고 인간 교육자들에게 언급될 필요가 있는 더 발전된 문제들을 인식할 수 있었다. 기능을 최적화하기 위해 지속적인 개선이 진행 중입니다. 
Information is critical to educational systems and their ability to recognize and address the learning needs of individual health professionals. However, there are significant administrative aspects to educational systems. Akin to the clinical application of AI to reduce a provider’s burden of documentation, leveraging AI could free bandwidth for direct interactions with students and for more creative activities to advance innovation in HPE. As an example, the Georgia Institute of Technology [30] sought to expand its capacity for online education, but leaders recognized that the demand for teaching assistants (TAs) would exceed supply. Identifying that many questions for TAs are administrative in nature rather than focused on deeper learning issues, they developed an AI application, Jill Watson, to function as a TA. Jill was successful in quickly addressing simple questions and was able to recognize more advanced issues that needed to be referred to human educators. Ongoing refinement is under way to optimize functionality.

또 다른 예는 뉴욕 대학 그로스만 의과대학에서 왔다. 이 학교가 모든 등록 학생들에게 전액 장학금을 수여할 것이라고 발표되자 지도자들은 이미 명성이 자자한 이 프로그램에 대한 신청이 급증할 것으로 예상했다. 그들은 1,000명 이상의 이전 입학자들의 입학 지원 기록에서 추출한 53개 변수의 데이터 세트를 개발했고 의대에서의 후속 성공과 상관관계가 있는 요인을 식별하기 위해 분석을 수행했다. 빅 데이터 접근 방식은 후속 애플리케이션의 처리를 강화하여, 국가적으로 입학 절차에 공통되는 사전 편향을 완화하도록 의도적으로 설계된 방식으로 초기 전형 시점에 보다 holistic measures를 통합했다[31]. 다른 용도는 PubMed가 색인화한 관련 연구 기사를 분류하고 전문 프로그램 지원자 수를 줄이고 학습 능력과 동기 부여에 따라 클래스를 나누는 것과 같은 특정 활동을 자동화함으로써 교사와 학자의 업무량을 완화했다[32]. 

Another example comes from the New York University Grossman School of Medicine. Upon the announcement that the school would award full-tuition scholarships to all enrolled students, leaders anticipated a surge in applications to the already prestigious program. They developed a dataset of 53 variables extracted from the admissions applications records of more than 1,000 previous matriculants and performed an analysis to identify factors correlated with subsequent success in medical school. Their big data approach enabled enhanced processing of subsequent applications, incorporating more holistic measures at the point of initial screening in a manner intentionally designed to mitigate prior biases common to admissions processes nationally [31]. Other uses have similarly eased the workload of teacher-scholars by triaging relevant research articles indexed by PubMed and automating certain activities like narrowing the number of applicants for specialized programs and dividing classes based on competencies and motivation to learn [32].

 

콘텐츠 제공 및 적응형 학습 지원
Delivery of Content and Enabling Adaptive Learning

콘텐츠 전달에 적용되는 AI는 다음과 같은 목표를 가지고 적응형 학습과 평가를 가능하게 한다. 

  • "잘 훈련된 휴먼 튜터가 학생들에게 지원, 지도를 제공하고, 학생의 답변을 해석하고, 토론에 대한 더 많은 대화를 장려하는 것의 이점을 제공한다."[33]. 

예를 들어, BRCA Gist라고 알려진 AI 애플리케이션은 유방암의 유전적 위험에 대한 학습을 지원하는 데 유용한 것으로 밝혀졌다[34]. 유전자 검사를 진행할지 여부를 환자가 직접 결정하도록 돕기 위해 개발된 이 도구는 복잡한 AI 애플리케이션을 활용하여 대화 방식으로 상호 작용하는 아바타를 만들고 환자의 텍스트 응답에 대한 응답을 조정하는 것을 포함한다. 마치 자신이 환자인 것처럼 시스템과 상호 작용하도록 선택한 학생들은 유전적 위험에 대한 선언적 지식이 증가했음을 보여주었다. 교육 프로그램에서 이러한 기술을 사용하면 교육자가 학생들이 노출되는 사례의 혼합을 확대하고, 시스템의 즉각적인 피드백과 함께, 대화형 방식으로 새로운 개념을 발견할 수 있는 기회를 제공할 수 있습니다. 학습 과정은 더 이상 시간과 장소에 얽매이지 않고 대신 "견습생" 튜터형 경험을 제공한다. 보건 분야의 수행 트레이너는 존재하며 필요한 과외를 성취하는 것으로 밝혀져 전통적인 교실에서 배우는 것보다 더 높은 수행 점수를 얻는다.

As applied to content delivery, AI enables adaptive learning and assessment with the goal of

  • “serve[ing] the benefits of a well-trained human tutor providing students support, guidance, interpreting student answers and encouraging more dialogue on the discussion” [33].

For example, an AI application known as the BRCA Gist has been found to be beneficial in supporting learning about genetic risk in breast cancer [34]. Developed to help patients navigate the personal decision whether to pursue genetic testing, this tool involves leveraging complex AI applications to create avatars that interact in a conversational manner, adjusting responses to the patient’s text replies. Students selected to interact with the system as if they were a patient demonstrated increased declarative knowledge of genetic risk. Use of such technology in educational programs would enable educators to expand the mix of cases that students are exposed to and provide the opportunity to discover new concepts in an interactive manner with prompt feedback from the system. The learning process is no longer bound by time and place and instead offers an “apprenticeship” tutor-type experience. Performance trainers in the health professions exist and are found to achieve the tutoring needed, resulting in higher performance scores than learning in the traditional classroom.

 

정보 및 피드백 제공
Providing Information and Feedback

AI는 또한 고등 교육에서도 [개별화된 피드백을 제공]하고, [학습 경로를 구축]하며, [비용을 절감]하는 데 사용되었다[35]. 비록 그것이 인간이 하는 일을 바꾸겠지만, 그것은 인간 교사들을 대체하지 않을 것이다. 한 사례에서, 컴퓨터 과학 석사 학생의 한 교수가 TA로 학생들과 함께 작업하도록 교사 로봇을 설계하여, 동시에 여러 학생을 위해 하루 종일 온라인 질문에 신속하게 답변했다[18]. 이러한 모델은 어떤 학생이 온라인 수업 활동에 참여도가 낮은 참여자가 될 것인지 예측하는 데 사용되었으며 과정 내내 추가 지원이 필요할 가능성이 높다[36]. 이것은 특히 Massive Open Online Cources를 실행할 때 유용할 수 있습니다. 또한 많은 보건 전문가 프로그램은 임상 학습 환경에서 피드백을 컴파일하고 표시하기 위해 대시보드를 도입했다. AI 도구를 레이어링layering하면 데이터 수집 부담을 간소화할 수 있으며, 필요한 특정 피드백과 이를 제공할 수 있는 위치에 있는 감독자에 대한 우선순위를 알릴 수 있다. 
AI has also been used in higher education to provide individualized feedback, build learning pathways, and decrease costs [35]. It will not replace human teachers, although it will change the work that humans do. In one case, a professor of computer science’s master’s students designed a teacherbot to work with students as a TA, promptly answering online questions at all hours of the day for multiple students simultaneously [18]. Such models have been used to predict which students will be low-engagement participants in online class activities and are likely to require additional assistance throughout the course [36]. This could be especially valuable when running Massive Open Online Courses. Additionally, many health professions programs have instituted dashboards to compile and display feedback from the clinical learning environment. Layering AI tools could streamline the data collection burden, signaling priorities regarding what specific feedback is needed and which supervisors could be in a position to provide it.

 

역량 기반 평가 및 개별화된 학습 경로 지원
Supporting Competency-Based Assessment and Individualized Learning Pathways

어떤 보건 분야의 학습자도 다양한 사전 교육 및 인생 경험을 통해 교육을 받게 되며, 따라서 그들의 진정한 교육 요구는 다양하다. 최근 HPE에 대한 역량 기반 접근법에 대한 관심은 학습의 대용으로서 시간에 대한 전통적인 의존보다, [학습 결과를 모니터링]하는 데 더 큰 관심을 강조한다. 역량 기반 접근법은 각 학습자에 대한 풍부한 프로그램 평가 데이터에 의존한다. 이상적으로, 각 보건 전문 학습자는 복잡한 임상 시스템 내에서 다양한 감독자에 의해 평가된다. 기대치에 대한 어느 정도 표준화가 필요하지만, 성과에 대한 감독관 관점의 다양성은 풍부하다. 역량 기반 접근 방식의 구현에 대한 역사적 장벽은 풍부한 성능 증거를 관리하고, 이를 시각화 및 해석하여 미래의 학습을 알리는 과제였다. 일부 의과대학의 예비 연구[37-39]는 과정과 시간에 걸쳐 있는 [프로그램 평가]와 [개별화된 성과 대시보드의] 힘을 입증하지만, 이러한 프로그램은 여전히 [인간 처리 능력]에 의해 제한된다. AI를 적용하여 성능 증거에서 일관된 신호를 식별하여 추가 진단 평가 또는 학습 경험을 유도할 수 있다. AI는 [정밀의학]과 마찬가지로 개인의 수행 동향을 파악하고 개별화된 학습 경로를 지원하기 위한 권고안을 제시함으로써 [정밀 교육]이 가능해진다. 
Learners in any health profession come to their training with a rich diversity of prior educational and life experiences, and as such, their true educational needs vary. Recent interest in competency-based approaches to HPE emphasizes greater attention to monitoring learning outcomes over traditional reliance on time as a proxy for learning. Competency-based approaches rely on rich programmatic assessment data about each learner. Ideally, each health professions learner is assessed by a variety of supervisors within a complex clinical system. Some standardization of expectations is necessary, yet there is richness in this diversity of supervisor perspectives on performance. A historical barrier to implementation of competency-based approaches has been the challenge of managing a wealth of performance evidence, visualizing and interpreting it in a manner that informs future learning. Preliminary work at some medical schools [37-39] demonstrates the power of programmatic assessment and individualized performance dashboards that span courses and time, but these programs are still limited by the capacity of human processing. AI could be applied to identify consistent signals in performance evidence that in turn would steer additional diagnostic assessments or learning experiences. Akin to precision medicine, AI enables precision education by identifying individual performance trends and making recommendations to support individualized learning pathways.

 

지속적인 전문성 개발의 스트림라이닝
Streamlining Continual Professional Development

지속적인 교육은 모든 보건 직업의 근본적인 측면이지만, 의미 있는 지속적인 전문성 개발 또한 이러한 맞춤화의 부족으로 인해 어려움을 겪었으며, 각 제공자의 실제 관행과 잘 맞지 않는다. 최근 미국 의료 전문 위원회(American Board of Medical Specialty)는

  • "학습을 지원하고, 지식과 기술 격차를 식별하며, 전문의diplomates가 최신 상태를 유지하도록 돕는 종단 및 기타 혁신적인 형성적 평가 전략을 통합하는 방향으로, continuing certification이 변화되어야 한다"고 주장했다[40].

자격Certification은 자신의 업무 역량에 대한 요구에 기초해야 한다. AI는 제공자의 환자 패널과 결과를 모니터링하고 적절한 교육 자원을 적시에 추천할 수 있는 잠재력을 제공한다. 자신의 실제 업무 범위를 이해하고 인증 지속을 위한 적절하고 표적화된 평가를 권고하는 데 사용할 수 있으며, 따라서 업무와 면허 사이의 연계를 강화할 수 있다. 
Ongoing education is a fundamental aspect of every health profession, but meaningful continuing professional development has also suffered from this lack of customization, with poor alignment to each provider’s actual practice. The American Board of Medical Specialties recently argued that

  • “continuing certification must change to incorporate longitudinal and other innovative formative assessment strategies that support learning, identify knowledge and skills gaps, and help diplomates stay current” [40].

Certification must be based on the competency demands of one’s practice. AI offers the potential to monitor a provider’s patient panel and outcomes and recommend appropriate educational resources just in time. It can be used to understand one’s true scope of practice and recommend appropriate, targeted assessments for continuing certification, thus strengthening the link between practice and licensure.

 

학습을 위한 교육자원의 배치 최적화
Optimizing the Deployment of Educational Resources for Learning

교육 자원은 모든 보건 분야에 걸쳐 제한된다. 조언, 교육 경험 및 평가 관행을 효율적으로 배치하면 자료 공급과 교육자 및 직원의 시간과 노력을 확장할 수 있습니다. 사회 사업 분야에서 AI는 훈련 데이터에 포함된 인간 편향을 계산적으로 그리고 최종 의사 결정에 인간을 포함시킴으로써 어떻게 최소화할 수 있는지 조사하는 동시에 위탁 관리에 참여하는 개별 청소년이 특별한 지원을 필요로 할지를 더 잘 예측하기 위해 탐구되고 있다[41]. 마찬가지로, 보건 전문 교육자는 AI를 활용하여 어떤 학습자와 의사가 추가 학습 지원이 필요한지 예측할 수 있다.
Educational resources are limited across all health professions. The efficient deployment of advising, educational experiences, and assessment practices would serve to extend material supplies and the time and effort of educators and staff. In the field of social work, AI is being explored to better anticipate which individual youth involved in foster care will require special support, while examining how human bias embedded in training data can be minimized computationally and by including humans in final decision making [41]. Similarly, health professions educators could leverage AI to predict which learners and practitioners need extra learning support.

 

학습 의료 시스템 활성화
Enabling the Learning Health Care System

학습 의료 시스템의 이상은 AI의 지원으로 실현될 수 있다. [Amplifire 학습 플랫폼]은 이러한 개념을 잘 보여줍니다 [42]. Amplifire 내에서 의료 시스템 메트릭과 EHR 데이터를 마이닝하여 개선 기회와 공유 학습 요구를 식별한 다음, 전문 분야 전반의 시스템 훈련으로 변환된다. 평가 단계에서 각 참가자는 질문에 답변할 뿐만 아니라 자신의 답변에 대한 신뢰도를 평가하도록 요구됩니다. 정확하지 않지만 자신감이 떨어지는 참가자는 단순히 더 많은 교육이 필요할 수 있습니다. AI는 확신에 찬 잘못된 정보를 가진 개인들을 발견하는 데 도움이 된다. 이 그룹을 다루는 것은 전체 학습 커뮤니티의 성공에 매우 중요하다. 따라서 AI는 의료 시스템이 각 개인 및 시스템의 학습 요구를 충족하기 위해 교육의 깊이와 접근 방식을 모두 조정할 수 있도록 합니다.
The ideal of a learning health care system [5] can be realized with support from AI. The Amplifire learning platform illustrates these concepts well [42]. Within Amplifire, health system metrics and EHR data are mined to identify opportunities for improvement and shared learning needs, which is then converted into system-wide training across professions. During the assessment phase, each participant is asked not only to answer questions but also to rate confidence in one’s answer. Participants who are incorrect but less confident may simply need more training. AI helps to uncover individuals harboring confidently held misinformation; addressing this group is critical to the success of the entire learning community. Thus, AI enables the health system to tailor both the depth of and approach to education in order to meet each individual’s — and thus the system’s — learning needs.

 

번아웃 완화
Mitigating Burnout

AI는 정신 건강과 웰빙을 지원하는 데 효과적으로 적용되었다. 교수자 작업량의 일부를 자동화하면 보건 전문 교육자의 스트레스 및 소모량을 완화하는 데 도움이 될 수 있습니다. 정신 건강 장애 위험이 높은 의료 종사자의 조기 발견에 고급 기술이 적용되었다[43]. 유사한 알고리즘을 개발하여 스트레스와 불안을 보건 전문직 학생에게 모니터링할 수 있다. 마찬가지로, 청소년들 사이에서 시험된 스마트폰 앱과 파일럿 테스트를 통해 개발된 자연어 처리 알고리즘 모델은 교육자와 교사가 자살위험이 있는 학생을 식별하는 데 도움이 될 수 있다[44, 45].
AI has effectively been applied to supporting mental health and well-being. Automating parts of instructors’ workload can help mitigate some of the stress and burnout of health professions educators. Advanced technology has been applied by mental health practitioners in the early detection of health care workers at high risk for mental health disorders [43]; similar algorithms could be developed to monitor health professions students for stress and anxiety. Similarly, natural language processing algorithmic models developed through a smartphone app and pilot tested among adolescents might help educators and preceptors identify suicidal health professions students [44, 45].

학습 효과를 향상시키고 HPE의 비용을 절감하는 것뿐만 아니라 궁극적으로 환자에 대한 더 나은 학습 경험을 제공하기 위해 훈련 프로그램과 교육 실습의 전환이 필요하다.

A call for transformation of training programs and educational practice is needed, not only to improve learning effectiveness and reduce costs of HPE, but also to provide a better learner experience that ultimately leads to higher quality care for patients.

 

다음 단계: 행동에 대한 요구에 응답하기
Next Steps: Answering the Call to Action

교육자들은 AI 훈련을 HPE에 통합하는 것을 더 잘 정의하기 위해 협력해야 한다. 교육자들 사이의 행동 부족은 위험하다. [AI에 관한 의료 전문가의 적절한 훈련이 위험이 아닌 약속을 촉진하는 가장 강력한 도구라는 점]이기 때문이다. 이전 섹션에서 설명한 광범위한 이해 범주는 [학습 목표와 역량]으로 공식적으로 명시되어야 합니다. 적절한 훈련의 "복용dosing"은 보건 직업 전반에 필요한 핵심 내용뿐만 아니라 주어진 직업과 각 직업 내의 다양한 전문 분야에 걸친 고급 훈련 요구 사항을 정의하는 것과 함께 고려되어야 한다. 또한, 보건 분야 전반에 걸친 일반적인 교육 행정 과제는 AI를 활용하여 교육 과정을 개선할 수 있는 공유 기회를 제공한다.
Educators must collaborate to better define the necessary incorporation of AI training into HPE. A lack of action among educators poses risk in that adequate training of health professionals in AI is the strongest tool to promote its promise over its peril. The broad categories of understanding outlined in prior sections will need to be formally articulated as learning objectives and competencies. Appropriate “dosing” of training must be considered along with defining the core content needed across health professions, as well as advanced training needs in given professions and across the various specialties within each profession. Additionally, common educational administrative challenges across health professions offer shared opportunities to leverage AI to improve the process of education.

이 원고는 실천을 촉구하는 역할을 하기 위한 것으로, 저자들은 그 안에서 교육자들이 지금 취해야 할 구체적인 단계들을 제시하고 있다(박스 1 참조). 보건 전문직에 걸친 교육자들의 집단 행동은 의도하지 않은 결과를 완화하는 동시에 AI의 힘이 최적화되는 원하는 미래 상태를 조성할 것이다.

This manuscript is intended to serve as a call to action, and in it, the authors offer concrete steps that health professions educators should take now (see Box 1). Collective action of educators across health professions will foster a desired future state in which the power of AI is optimized while mitigating unintended consequences.


박스 1 | 인공지능(AI)을 학습자를 위한 교육과 훈련에 통합하기 위해 교육 지도자들이 지금 해야 할 일
Box 1 | What Health Professions Education Leaders Should Do Now to Incorporate Artificial Intelligence (AI) into Education and Training for Learners


AI와 관련된 기본 개념과 논쟁에 대해 자신과 교수진을 교육합니다.
• 다양한 교수진의 역할에 필요한 다양한 이해 수준 고려

Educate yourself and your faculty in basic concepts and controversies related to AI
• Consider the diff ering levels of understanding needed for various faculty roles

아래 리소스를 고려하면서 관계를 구축한다.
• 의료 시스템 정보학 및 임상 의사 결정 지원 팀
  • 제휴 임상 기업에서의 AI 애플리케이션의 침투는 무엇인가?
  • 임상 시스템에서 교육은 어떻게 수행되고 있는가?
• 대학 컴퓨터 공학부
• 윤리학자
• 이 주제에 관심이 있는 교수진과 학습자
• 전문 교육 동료들

Build relationships while considering the resources below
• Health system informatics and clinical decision support teams
  • What is the penetration of AI applications in affi liated clinical enterprise?
  • How is training being carried out in the clinical system?
• University computer science departments
• Ethicists
• Faculty and learners with interest in this topic
• Interprofessional education colleagues

기존 교육과정 감독 프로세스에 협력할 로컬 자문단을 설립한다.
• 교수진 리더십과 기관 커뮤니티를 위한 AI에 대한 학습 기회 창출
• AI에 대한 회의론을 공개적으로 대응한다.
• 평가와 같은 교육 관행을 촉진하는 데 AI가 적용됨에 따라 학습자를 보호하기 위한 메커니즘을 고려하십시오.
Establish a local advisory group to collaborate with the existing curricular oversight process
• Create learning opportunities about AI for faculty leadership and the institutional community
• Openly address skepticism about AI
• Consider mechanisms to protect learners as AI is applied to facilitating educational practices, such as assessment

기존 프로그램에서의 [역량 성과 및 커리큘럼]을 검토한다.
• AI의 확장이 의료 지식, 환자 치료, 커뮤니케이션 기술, 전문직 간 협업 실습, 시스템 기반 진료, 전문성 및 실습 기반 학습 및 개선과 같은 기존 역량 영역의 이해에 어떻게 영향을 미칠지 고려합니다.
• 컴퓨터 과학 및 기술에 필요한 새로운 역량 영역을 고려하십시오.
• 임상 추론, 메타 인지, 진단 오류, 인지 편향 등과 같은 관련 기존 콘텐츠 영역에 AI 학습 목표를 통합하는 것을 고려하십시오. 
• AI가 커리큘럼 관리를 지원할 수 있는 잠재적 기회 식별

Review the program’s existing competency outcomes and curriculum
• Consider how expansion of AI will impact understanding of existing competency domains, such as medical knowledge, patient care, communication skills, interprofessional collaborative practice, systems-ased care, professionalism, and practice-based learning and improvement
• Consider new domains of competency needed in computer science and technology
• Consider incorporation of AI learning objectives into relevant existing content areas, such as clinical reasoning, metacognition, diagnostic error, cognitive bias, etc. 
• Identify potential opportunities for AI to assist in the administration of the curriculum

기존 [평가 프로그램]을 검토한다.
• 각 학습자의 지식 보유를 평가하는 데 중점을 두는 것에서 각 학습자의 지식 접근, 비판적 평가 및 적용 능력을 평가하는 것으로 이동합니다. 예를 들어 임상 의사 결정 지원 도구를 시뮬레이션 이벤트에 통합하는 것을 고려한다. 
• 필요한 새로운 역량과 기술을 평가할 기회를 고려합니다.
• AI가 프로그램 평가 관리를 지원할 수 있는 잠재적 역할 식별

Review the existing assessment program
• Move from an emphasis on assessing each learner’s possession of knowledge to assessing each learner’s ability to access, critically appraise, and apply knowledge. For example, consider incorporating clinical decision support tools into simulation events 
• Consider opportunities to assess necessary new competencies and skills
• Identify potential roles for AI to assist in the administration of programmatic assessment

기존 입학/선발 프로세스를 검토한다.
• 개인의 지식과 성취에 대한 강조에서 팀워크와 상황 판단의 증거로 이동합니다. 
• 지원자 심사에서 AI가 지원할 수 있는 잠재적 역할 파악
Review existing admissions/selection processes
• Move from an emphasis on individual knowledge and accomplishment toward evidence of teamwork and situational judgment 
• Identify potential roles for AI to assist in the review of applicants

AI가 교육에 미치는 영향에 대한 평가 및 연구에 참여한다.
Participate in evaluation and research regarding the impact of AI in education

국가 및 글로벌 토의에 참여합니다.
• AI 교육 강화
• AI에 대한 학습 목표 설정 및 개발적으로 적절한 교육 진행
• 교육에 AI 활용
• 교육 프로그램 전달을 지원하는 AI 기능 개발

Engage in national and global discussions to
• Enhance training in AI
• Establish learning objectives and developmentally appropriate progression of training in AI
• Leverage AI in training
• Develop AI capabilities that assist in the delivery of educational programs


 

제한 사항
Limitations

이 원고는 AI와 AI가 보건, 의료 및 교육에 미치는 영향에 대해 학습하는 과정에 있는 많은 보건 분야의 저자들의 경험을 통해 알 수 있다. 인공지능은 빠르게 발전하는 분야이기 때문에 여기서 제공되는 아이디어에는 영구적이지 않다. 일부 건강 전문직과 분야는 현재 다른 분야보다 더 많은 영향을 받고 있지만, 시간이 지남에 따라 AI의 발전 기능이 실현됨에 따라 모든 수준의 교육 목표가 진화해야 한다. AI에 대한 현재 교육에 대한 비공식 검토는 이러한 개요를 제공했지만, 모범 사례를 명확히 하기 위해 보건 전문 교육 프로그램 전반에 걸친 협업 연구 의제가 필요하다.

This manuscript is informed by the experience of authors across many health professions, who themselves are in the process of learning about AI and its implications for health, health care, and education in the health professions. AI is a rapidly advancing field, so there is impermanence to the ideas offered here. Some health professions and disciplines are currently more impacted than others; however, as advancing capabilities of AI are realized over time, educational objectives at all levels must evolve. An informal review of current training in AI informed this overview, but a collaborative research agenda is needed across health professions educational programs to clarify best practices.

 

 


 

 

NAM Perspect. 2021 Sep 8;2021:10.31478/202109a. doi: 10.31478/202109a. eCollection 2021.

 

Artificial Intelligence for Health Professions Educators

Affiliations collapse

Affiliations

1American Medical Association.

2Vanderbilt School of Nursing.

3PalattaSolutions.

4University at Buffalo School of Social Work.

5Weill Cornell Medicine-Qatar.

6Texas A&M University-San Antonio.

7Association of American Medical Colleges.

PMID: 34901780

PMCID: PMC8654471

DOI: 10.31478/202109a

Free PMC article

 

No abstract available

어떻게 의학교육이 건강 형평성을 후퇴시키는가 (Lancet, 2022)
How medical education holds back health equity

 

 

나이지리아의 첫 의과대학은 1948년 이바단 대학의 일부로서 설립되었다. 영국 런던 대학의 커리큘럼을 본떠서 만들었기에, 나이지리아인들을 위해 설계되지 않았고, 반짝이는 교육 병원도 아니었다. 대안은 다양한 지역 요구에 맞게 조정되고 토착 의료 시스템, 지식 및 사회 조직을 기반으로 하는 중앙 형평성 촉진 1차 의료가 있었을 것이다. 나이지리아의 첫 의과대학은 아프리카와 다른 지역의 식민지 정부에 의해 설립된 많은 의과대학과 마찬가지로 식민지 시대 건물이었다.

The first medical school in Nigeria was founded in 1948 as part of University College Ibadan. Its curriculum, modelled on that of the University of London in the UK, was not designed for Nigerians—neither was its sparkling teaching hospital. The alternative would have been to centre equity-promoting primary health care tailored to diverse local needs and built on Indigenous health systems, knowledge, and social organisation. Nigeria's first medical school was a colonial edifice, as were many medical schools founded by colonial governments across Africa and elsewhere.

1970년 나이지리아 서부 정부는 이페 대학교(현재의 오바페미 아울로우 대학교)에 새로운 의과 대학을 설립하였다. 당시 [이바단 의대 커리큘럼]은 [이페 의대 설립자]들에 의해 대부분의 나이지리아인들의 건강 요구에 반응하지 않는 것으로 인식되었다. 나중에 의학 및 보건 전문 교육의 Ife 철학으로 명명된 실험에서, Ife 의과대학은 형평성 중심의 원칙에 따라 설립되었다. Ife 철학은 나이지리아의 의학자인 토마스 아데산야 아이게 그릴로가 고안한 것으로, 그는 의과대학의 창립 학장이 되었다. 학생들은 1차 및 2차 의료 시설망에서 교육을 받았으며, 접근 가능한 3차 병원이 하나 있다. 1978년 알마 아타 선언 이전에, Ife 의과대학은 지역 사회에 가깝고 반응하는 건강 시스템을 보장하는 데 1차 의료가 필수적이라고 인정했습니다. 1971년 호주 원주민 활동가들은 주류 의료에 대한 평등한 대안으로서 원주민 공동체 통제 보건 서비스를 시작했다. Ife 의대생들은 기존의 전문적 위계질서를 보강하기보다는 간호, 물리치료, 기타 교육생들과 동일한 수업에서 교육을 받아 지역사회에서 팀워크를 함께 할 수 있도록 하였다. 그들의 훈련은 사회과학, 농업, 교육을 포괄하는 다학제적 교육이었다. 학생들은 약 500개의 마을과 2개의 마을에 서비스를 제공하는 보건 센터 전반에 걸친 지역사회 기반 1차 건강 관리 활동에 참여했습니다. 그들은 교육과정 코드개발에 참여한 의료 종사자들과 지역 사회로부터 경험적으로 배웠다. 이 커리큘럼은 예방과 치료 사이의 구분을 없애고 1차 의료와 농촌 의료 서비스에 초점을 맞췄다.
In 1970, the Government of the then Western State of Nigeria established a new medical school at the University of Ife (now Obafemi Awolowo University, Ile-Ife). At the time, Ibadan medical school's curriculum was perceived by the founders of Ife medical school as unresponsive to the health needs of most Nigerians. In an experiment, later named the Ife Philosophy of medical and health professions education, Ife medical school was founded on an equity-oriented principle. The Ife Philosophy was conceived by Nigerian medical scholar Thomas Adesanya Ige Grillo, who became the medical school's founding dean. Students were trained in a network of primary and secondary health-care facilities, with one accessible tertiary hospital. Before the Alma Ata Declaration of 1978, Ife medical school recognised primary health care as integral to ensuring a health system that was close and responsive to local communities. There were similar efforts elsewhere—in 1971, Indigenous Australian activists initiated Aboriginal Community-Controlled Health Services as an equity-oriented alternative to mainstream health care. Rather than reinforce existing professional hierarchies, Ife medical students were trained in the same classes as nursing, physiotherapy, and other trainees so that they could work together in teams in the community. Their training was multidisciplinary and encompassed the social sciences, agriculture, and education. Students participated in community-based primary health-care activities across health centres that served about 500 villages and two towns. They learnt experientially from health workers and the community, who were involved in codeveloping the curriculum. The curriculum removed divisions between preventive and curative care and focused on primary health care and rural health services.

그것의 약속에도 불구하고, Ife 철학은 도전에 직면했다. Ife에서 교육을 받은 의사들이 졸업하기 시작했을 때, 그들은 보통 병원에서 일하기를 기대했다. 일부 졸업생들은 주로 병원에서 훈련을 받은 동료들에게 폄하당하거나 주로 1차 의료 종사자로 일할 수 없는 것에 실망했다. 식민주의 의과대학에서 교육을 받은 일부 Ife 학자들은 If 철학에 저항했다. 이러한 긴장감을 고려할 때, 1980년대 초반에는 프로그램이 서서히 후퇴했다. Ife 의대를 설립했던 정부는 사라졌다. 시간이 지남에 따라, Ife는 점점 더 다른 의과대학과 같이 되어, 자신만의 반짝이는 교육 병원을 완성했다. Ife 실험은 부분적으로 의과대학이 나이지리아의 식민지 대학 시스템의 더 넓은 맥락에서 운영되었기 때문에 흔들렸다.
Despite its promise, the Ife Philosophy faced challenges. When Ife-trained medical doctors began to graduate, they were usually expected to work in hospitals. Some graduates felt disparaged by colleagues who had trained primarily in hospitals or were disappointed they could not work mainly as primary health care practitioners. Some Ife academics, trained in more colonial medical schools resisted the Ife Philosophy. Given these tensions, the programme was slowly rolled back during the early 1980s. The government that had established Ife medical school was defunct. Over time, Ife became increasingly like other medical schools, complete with its own sparkling teaching hospital. The Ife experiment faltered partly because the medical school operated within the broader context of Nigeria's colonial university system.

유럽 정착민들에 의해 이전과 현재 식민지화된 많은 나라에서, 식민지 기관으로서의 의학 교육은 보건, 지식, 사회 조직의 서구 시스템에 기반을 두고 있다. 무엇이 유럽인지 보편화함으로써, 이 식민지 기관은 다른 인식론을 지우고 흡수한다. 서양의 [영점 인식론zero-point epistemology]은 서양의 관점을 이상적이고 표준적이며 보편적인 것으로 간주한다. 나이지리아, 남아프리카공화국 등 과거 식민지 국가들과 호주, 미국 등 정착민 식민지의 원주민 공동체가 없애기 위해 고군분투해온 족쇄를 만든다. 그것은 지역의 필요를 충족시키지 못해 생명을 앗아간다. 식민지 침략 이전에 존재해왔던 [앎의 방법]과 [경험 해석의 방법]을 지움으로써 인식 살해를 야기한다.
In many countries previously and currently colonised by European settlers, medical education as a colonial institution is based on western systems of health, knowledge, and social organisation. By universalising what is European, this colonial institution erases and subsumes other epistemologies. The western zero-point epistemology places western perspectives as the ideal, standard, and universal. It creates shackles that previously colonised countries, such as Nigeria and South Africa, and Indigenous communities in settler colonies such as Australia and the USA have been struggling to remove. It costs lives by failing to serve local needs. By obliterating ways of knowing and interpreting experiences that predate colonial invasions, it causes epistemicide.

의학계에서 일어나는 많은 일들은 서양의 생물의학 모델이 지배하는 계층적 시스템으로 학생들을 사회화하는 교육 시스템에 의해 형성된다. 이 지배적인 건강 모델은 세계 대부분의 사람들의 경험에 둔감하다. 의과대학에 의한 다수 세계의 인식론에 대한 부정은 의도적으로 또는 기본적으로 학생들에게 모호하다. 대다수의 의사들은 그들의 맥락과 일치하지 않는 지배적인 시스템에 적응하도록 훈련 받고 그것을 지원하고 복제하도록 훈련시킨다; 그들은 때때로 이 지배적인 시스템의 결함에 대해 그들 자신, 환자, 그들의 문화, 그리고 그들의 맥락을 비난하게 될 수 있다.

Much of what happens in the world of medicine is shaped by an educational system that socialises students into a hierarchical system dominated by the western biomedical model. This dominant model of health is insensitive to the experiences of most of the world's people. The denial of majority world's epistemologies by medical schools remains deliberately or by default obscure to students. Doctors in the majority world are trained to fit into a dominant system that is discordant with their contexts and trains them to support and replicate it; they can sometimes end up blaming themselves, their patients, their culture, and their context for the failings of this dominant system.

 

Frantz Fanon은 그의 책 Black Skin, White Masks에서 부분적으로 자신의 의료 훈련 경험을 바탕으로 의학 교육은 원주민, 인종, 소외되고 억압받는 공동체 학생들을 [비존재non-being의 영역]으로 몰아넣는다고 주장했다. 이는 "좋은 의사"가 되기 위해 끊임없이 노력하지만 결코 [좋은 백인 의사]라는 지위는 얻을 수 없는 물리적, 경험적 공간을 의미한다. "좋은 의사"의 개념은 1910년 미국의 교육학자 아브라함 플렉스너에 의해 기술되었으며 서양 인식론에 확고하게 뿌리를 두고 있으며 백인, 서구, 건강한 남성의 특징과 사회화가 스며 있다. 플렉스너의 업적은 미국의 대부분의 시골과 아프리카계 미국인 의과대학들을 폐교시키는 결과를 가져왔다. 이상화된 "좋은 의사"의 개념은 의학 교육에서 암묵적으로 추구되고 배양되는 것이다. "좋은 의사"는 서양의 이상, 도덕, 그리고 윤리적, 사회적으로 바람직한 특징에 바탕을 둔 전문성과 같은 특성으로 존경받는다. 

In his book Black Skin, White Masks, Frantz Fanon argued, partly based on his own experiences of medical training, that medical education puts students from Indigenous, racialised, marginalised, and oppressed communities into a zone of non-being—into a physical and experiential space where they constantly strive to be the “good doctor” but can never attain the state of being a good white doctor. The concept of the “good doctor” was described by US educationist Abraham Flexner in 1910 and is firmly rooted in western epistemology and infused with the characteristics and socialisation of white, western, able-bodied males. Flexner's work led to the closure of most rural and African American medical schools in the USA. This idealised concept of the “good doctor” is what is tacitly sought and cultivated in medical education. The “good doctor” is revered for characteristics such as professionalism, founded in western ideals, morals, and ethical and socially desirable traits.

나이지리아와 남아프리카 공화국의 보건 전문가로서의 경험으로부터, 다른 전문가에 대한 존중, 전통적인 교훈, 환자 및 가족 구성원과의 광범위하고 서두르지 않는 상담이 중요하다. 서양의 전문성 개념에서 볼 때, 그러한 접근법은 지각, 자신감 부족 또는 우유부단함을 암시할 수 있지만, 그것은 [건강, 지식 및 사회 조직에 관한 토착 시스템]의 일부인 대인 관계 규범과 일치한다. 그것이 식민지화된 공간과 마음 안에서 복제되는 과정 속에서, 의학 교육을 뒷받침하는 서구 인식론은 토착 건강 지식 시스템을 소멸시킨다. 이것은 인식론적 폭력의 한 형태이다.

From our experience as health professionals in Nigeria and South Africa, respect for other professionals, traditional precepts, and wide and unhurried consultation with patients and members of their family are crucial. From a western notion of professionalism, such an approach might suggest tardiness, lack of confidence, or indecisiveness, but it is consistent with interpersonal norms of care that are part of our Indigenous systems of health, knowledge, and social organisation. As it replicates itself within colonised spaces and minds, the western epistemology that underpins medical education annihilates Indigenous health knowledge systems. This is a form of epistemic violence.

그래서 영어를 제2외국어로 하는 가난한 배경의 남아공 '유색인종 여성'이 남아프리카 의대에 입학할 때, 그녀는 [플렉스너가 자신과 같은 사람들을 위해 정한 기준]에 의해 판단될 가능성이 높다. 그녀의 정체성은 침묵하고, 그녀의 역사적, 조상적, 맥락적, 그리고 살아있는 경험도 침묵한다. 세상을 이해하고 관련짓는 그녀의 방식은 이상적이고 표준적이며 보편적인 것을 정의하는 제로포인트 관점으로 대체된다. 내부 갈등이 뒤따른다. 그녀는 파논이 [소외의 상태state of alienation]라고 불렀던 것을 느끼고, 존재하며 배운다. 소외의 결과로 생기는 것은 [파열rupture]이다: 한 사람이 [배운 것]과 [진실이라고 알고 있는 것] 사이의 충돌이다. 우리는 불협화음을 이해하려고 노력한다. 우리는 우리가 알고 있는 우리 자신이 되기를 갈망한다. 마침내 우리는 [우리가 알고 있는 우리 자신]과는 거리가 먼, [건강, 지식 및 사회 조직의 시스템을 기반으로 한 유럽 중심적 캐논]으로부터 배울 수 밖에 없었다는 것을 깨닫고, 그 때 우리는 [무엇이 알려진 것으로 추정되는지presumed to be known]에 대해 의문을 제기하기 시작한다
So, when a South African “woman of colour” from an impoverished background with English as second language enters medical school in South Africa, she is likely to be judged by the standards set by Flexner for people like himself. Her identity is silenced, so is her historical, ancestral, contextual, and lived experience. Her way of understanding and relating to the world is replaced by the zero-point perspective that defines what is ideal, standard, and universal. An internal conflict ensues. She feels, exists, and learns in what Fanon called a state of alienation. What results from the alienation is rupture: a clash between what one is taught and what one knows to be true. We seek to make sense of the dissonance. We yearn to be who we know ourselves to be. When we finally realise that we have been forced to learn primarily from a Eurocentric canon based on systems of health, knowledge, and social organisation far removed from who we know ourselves to be, we start to call into question what is presumed to be known.

[파열]은 [기존의 사회적, 인식론적 관행과 관계의 붕괴]를 나타낸다. [파열의 시간]은 무엇이 정상화normalize되었는지 의문을 제기합니다. 그래야 다른 것이 성장할 수 있습니다. 분열과 함께, 식민지 사람들은 그들의 [교육에 의해 그들의 정신에 뿌려진 열등감이라는 허구]를 추방하기 시작한다. 이 파열이 널리 퍼지면 치료용 바이오의학, 스파클링 병원, 의사들에게 특권을 주는 [위계 구조를 해체]하고, 대신 심층적으로 맥락화되고 포괄적인 1차 의료 서비스를 중심으로 하는 등 형평성에 어긋나는 방식으로 [의료 교육의 집단적 재상상collective reimagining]을 기대한다. 우리는 또한 [지역사회에서 실천]하고, 그 실천이 [전통적인 치료사healer의 혜택benefit과 반향echo하는 사람들]이 의학 교육에 포함되기를 기대한다. 그들의 커뮤니티에 위치한 그러한 사람들은, 본질적으로 건강의 사회적 결정요인에 대한 개념과 영적, 정치적 행위자들과의 전문직 간 협력, 즉 서양 사회에서 소외되는 효과를 고려할 때 의학 교육이 이제 겨우 수용되기 시작했다는 개념을 이해한다. [위계 구조를 평탄화flattening]한다는 것은 [간과해온 인식론의 잠재성을 충분히 탐구할 수 있는 공간]을 제공하면서, [다수성plurality을 포용]하고, [서구 인식론의 이점을 인식]하는 것을 의미한다. 우리는 잘못된 출발로부터 배워야하며, Ife 철학과 같이 과거에 놓쳤던 기회로부터 배워야 한다.

Ruptures represent breakdowns in existing social and epistemic practices and relations. Times of rupture call into question what is normalised, so that something else can grow. With rupture, colonised people begin to expel the fictions of their own inferiority sown in their psyche by their education. If this rupture becomes widespread, we expect a collective reimagining of medical education in ways that default to equity, including by dismantling the hierarchies that privilege curative biomedicine, sparkling hospitals, and medical doctors and centring instead deeply contextualised and comprehensive primary health care. We also expect the encompassing into medical education of those who practise in their communities and whose practice echoes the benefits of traditional healers. Located in their communities, such people inherently understand concepts of the social determinants of health and interprofessional collaboration with spiritual and political actors—concepts that medical education is only beginning to embrace, given its alienating effects in western societies. Flattening hierarchies means embracing plurality and recognising the benefits of western epistemology while giving space for underexplored potentials of neglected epistemologies. We must learn from the false starts and the missed opportunities of the past, such as the Ife Philosophy.

하지만 이 파열음이 널리 퍼질 수 있을까? 우리는 현재의 위계질서를 유지하기 위해 사회화된 서구 및 다수 세계의 교육자와 실무자들의 반발이 예상된다. 많은 환경에서 의학교육은 일반적으로 [기존의 위계를 유지하는 전문가를 생산하는 자본주의적 생산라인]이다. 세계적으로, 특권층의 학생들이 의대에 입학할 가능성이 가장 높다. 높은 사회적 지위와 소득의 매력은 계층에 진입하고 유지하기 위한 강력한 인센티브이다. Ife의 경험에서 알 수 있듯이, 하나의 의과대학이 바뀌는 것만으로는 충분하지 않다; 전체 국가 커리큘럼과 사고 방식이 바뀌어야 한다.
But can this rupture become widespread? We expect pushbacks from western and majority world educators and practitioners who have been socialised to uphold current hierarchies. Medical education in many settings is a capitalist production line that typically produces professionals who maintain existing hierarchies. Globally, students of privileged backgrounds are the most likely to enter medical schools. The allure of high social status and income are powerful incentives to enter and sustain hierarchies. As the Ife experience showed, it is not enough that one medical school changes; entire national curricula and ways of thinking must change.

서구 배우들이 너무 오랫동안 대다수의 세계에서 의료 교육의 목덜미에 발을 디뎠다는 것을 인정한다면 좋을 것이다. 미국 페미니스트와 폐지론자 사라 무어 그림케가 물었던 것처럼 우리가 요청하는 것은 "목에서 발을 떼고 우리가 똑바로 서도록 허락해 달라"는 것이다. 과거와 현재 진행 중인 인식론적 폭력을 인정하는 것은 치유를 위해 필요하며, 행동을 촉진할 수 있다. 일단 서양이라는 발western feet이 들어올려지면, 우리는 다음에 무슨 일이 일어날지 예측할 수 없고, 그렇게 하기 위해 서두를 필요가 없다; 그것은 집단적으로 이루어져야 한다. 파논은 "중요한 것은 300명의 사람들이 계획을 세우고 그것을 실행하기로 결정하는 것이 아니라, 비록 두세 배의 시간이 걸리더라도 전체 사람들이 계획하고 결정하는 것이다."라고 썼다.

If only western actors would acknowledge that they have had their foot on the neck of medical education in the majority world for far too long. All we ask, as the US feminist and abolitionist Sarah Moore Grimké asked, is for them to “take their feet from off our necks and permit us to stand upright”. Acknowledging past and ongoing epistemic violence is necessary for healing—and may facilitate action. Once western feet have been lifted, we cannot predict what happens next, and there should be no hurry to do so; it must be done collectively. As Fanon wrote in The Wretched of the Earth: “the important thing is not that three hundred people form a plan and decide upon carrying it out, but that the whole people plan and decide, even if it takes them twice or three times as long”.

 

 


Lancet. 2022 Aug 20;400(10352):556-557. doi: 10.1016/S0140-6736(22)01423-4. Epub 2022 Jul 30.

How medical education holds back health equity

Affiliations collapse

Affiliations

1School of Nursing and Public Health, Nelson R Mandela School of Medicine, University of KwaZulu-Natal, Durban 4041, South Africa. Electronic address: naidut10@ukzn.ac.za.

2School of Public Health, University of Sydney, Sydney, NSW 2006, Australia.

PMID: 35914535

DOI: 10.1016/S0140-6736(22)01423-4

심리학에서 이론의 위기: 어떻게 나아갈 것인가(Perspect Psychol Sci, 2021)
The Theory Crisis in Psychology: How to Move Forward
Markus I. Eronen1 and Laura F. Bringmann2

 

최근 몇 년 사이 심리학의 이론적 토대가 흔들리고 있다는 사실에 주목해야 하는 저자들이 늘고 있다. 심리학 이론은 일반적으로 질이 나쁘고 심리학은 통계 기술과 관행을 개선하고 더 많은 복제 연구를 수행하는 대신 더 나은 이론을 개발하는 쪽으로 더 많이 전환되어야 한다는 주장이다. 훨씬 많은 관심을 받았던 복제 위기보다 더 근본적인 '이론 위기'를 맞고 있는 셈이다.

In recent years, more and more authors have called attention to the fact that the theoretical foundations of psychology are shaky. The claim is that psychological theories are in general of poor quality and that the focus in psychology should shift more toward developing better theories instead of (just) improving statistical techniques and practices and performing more replication studies. In other words, we are facing a “theory crisis” that is more fundamental than the replication crisis that has received far more attention.

이 점은 물론 새로운 것은 아니지만, 폴 미엘이 그의 경력을 통해 강조하기도 했다(예: 미엘, 1967, 1978, 1990). 멜은 심리학자들은 새로운 이론들을 개발하는 것을 좋아하지만, 이러한 이론들은 누적된 이론적 진보를 낳는 대신 그냥 왔다가 사라지는 경향이 있다고 지적했다. 이론은 결정적으로 반박되거나 확립된 지식의 일부로 받아들여지지 않는다. 그들은 버려지거나 잊혀질 때까지 그저 빈둥거린다. 그는 1930년대와 1960년대에 각각 많은 열정으로 받아들여졌지만 지금은 대부분 잊혀진 '열망의 수준'과 '위험한 변화'의 이론을 예로 든다.

This point is of course not new but notably was also emphasized by Paul Meehl throughout his career (e.g., Meehl, 1967, 1978, 1990). Meehl pointed out that psychological scientists are fond of developing new theories, but instead of resulting in cumulative theoretical progress, these theories tend to just come and go: Theories are neither decisively refuted nor accepted as part of established knowledge; they simply hang around until they are abandoned or forgotten. He mentions as examples theories of “level of aspiration” and “risky shift,” which were received with much enthusiasm in the 1930s and 1960s, respectively, but are now largely forgotten.

미엘(1978)의 고전적 글 이후 40년이 지난 지금까지 심리학에서 이론의 역할은 크게 변하지 않았다. 예를 들어, 행동 변화 이론의 ABC라는 책에는 자기 조절 이론과 자기 효능감 이론에서부터 생태 모델에 이르기까지 [행동 변화 분야에만 83개의 이론]이 나열되어 있다(Michie et al., 2014). 이러한 이론들 중 어느 것도 보편적으로 받아들여지거나 결정적으로 반박되지 않는다고 가정해도 무방하다. 좀 더 구체적인 예로, [자아 고갈 이론]을 떠올려보라. 이 이론은 대단한 열정을 가진 기간 후에, 최근 몇 년 동안 심하게 비판되어 왔으며, 현재 그것에 대한 찬반 양측의 결정적인 증거는 없다.
In the 40 years that have passed since Meehl’s (1978) classic article, the role of theories in psychology has not changed much. For example, the book ABC of Behavior Change Theories lists 83 theories in the field of behavior change alone, ranging from self-regulation and self-efficacy theories to ecological models (Michie et al., 2014).1 It is safe to assume that none of these theories is universally accepted or decisively refuted. As a more specific example, consider ego-depletion theory (Baumeister et al., 1998, 2000). After a period of great enthusiasm, this theory has been heavily criticized in recent years, and currently there is no conclusive evidence either for or against it (Friese et al., 2019).

심리학에서 이론적 진보가 부족한 이유는 심리학 이론이 너무 모호하거나 추상적으로 공식화되는 경향이 있기 때문에 이를 위조하거나 시험하기 어렵다는 것이다(Meehl, 1978, 1990). 더욱이, 이론이 부족하고 일부 현상을 설명할 수 없는 것으로 밝혀진 경우에도, 심리학자들은 종종 그것의 과거의 성공에 초점을 맞추어 그것을 계속 사용한다(예: 고전적 조건화의 레스콜라-바그너 모델; 밀러 외, 1995). 이러한 요인들로 인해 [부족한 것으로 알려져 있지만 결정적으로 잘못된 것은 아닌 공존하고 중복되는 심리학 이론]이 많이 발생한다(Meehl, 1990). 따라서 최근 이론위기에 관한 문헌에서 공통적으로 제기되는 주제는 심리이론을 보다 형식적이고 정밀하게 만들거나 심리학자들에게 더 나은 이론을 구축하는 방법을 가르쳐야 한다는 것이다.
An explanation for the lack of theoretical progress in psychology is that psychological theories tend to be formulated so vaguely or abstractly that it is difficult to falsify or test them (Meehl, 1978, 1990). Moreover, even when a theory is found to be deficient and unable to explain some phenomena, psychological scientists often continue to use it, focusing on its past successes (e.g., the Rescorla-Wagner model of classical conditioning; Miller et al., 1995). These factors result in a plethora of coexisting and overlapping psychological theories that are known to be deficient but have not been decisively falsified (Meehl, 1990). Therefore, a common theme in the recent literature on the theory crisis is that psychological theories should be improved by making them more formal and precise or by teaching psychologists how to build better theories (e.g., Gigerenzer, 2010; Muthukrishna & Henrich, 2019; Oberauer & Lewandowsky, 2019; van Rooij & Baggio, 2021).

우리는 이러한 노력이 중요하고 칭찬받을 만하다고 생각한다. 그러나 이 기사에서는 다른 접근 방식을 취합니다. 우리는 좋은 심리이론을 개발하는 것이 극히 어렵고, 그것이 어려운 이유를 이해하는 것이 이론위기의 진전을 이루는 중요한 첫걸음이라고 주장한다. 즉, 심리학자들이 이론 개발에 충분한 노력을 기울이지 않거나 이론을 세울 줄 모르는 것이 아니라, 주제의 특성상 좋은 심리학 이론을 구축하는 데 큰 장애가 있다는 것이 문제이다. 이러한 장애물을 설명하고 분석하기 위해, 우리는 최근의 과학 철학에서 도출한다.
We find these efforts important and laudable. However, in this article, we take a different approach. We argue that the core of the problem is that developing good psychological theories is extremely difficult and that understanding the reasons why it is so difficult is a crucial first step in making progress in the theory crisis. In other words, the problem is not (just) that psychological scientists do not put enough effort into developing theories or do not know how to build theories but that there are great obstacles to building good psychological theories because of the nature of the subject matter. To explain and analyze these obstacles, we draw from recent philosophy of science.

이러한 접근 방식을 통해 우리는 미엘의 발자취를 따라갑니다. 이 특별호(Meehl, 1978)의 초점인 글에서 그는 인간의 심리를 과학적으로 연구하기 어렵게 만드는 어려움의 목록을 제공했다. 그러나 미엘은 자연히 당대 과학철학에 의존하고 있었고, 그 이후로 특히 자료, 이론, 인과관계를 이해하는 데 있어 이론의 위기와 매우 관련성이 높은 많은 발전이 있었다. 우리는 과학철학의 이러한 발전으로부터 출발하여, 좋은 심리이론을 개발하는 것이 왜 그렇게 어려운지에 대한 세 가지 주요 이유를 논의한다:

  • 강력한 현상에 의한 이론에 대한 제약의 부족,
  • 심리구조의 타당성의 문제, 
  • 심리변수들 사이의 인과관계를 발견하는 것의 장애물

With this approach, we follow in Meehl’s footsteps: In the article that is the focal point of this special issue (https://doi.org/10.1037/0022-006X.46.4.806" data-mce-href="https://journals.sagepub.com/doi/10.1177/1745691620970586#">Meehl, 1978), he provided a list of difficulties that make human psychology hard to study scientifically. However, Meehl was naturally relying on the philosophy of science of the day, and since then there have been many developments that are highly relevant for the theory crisis, especially in understanding the nature of data, theories, and causality. We draw from these developments in philosophy of science and discuss three key reasons for why developing good psychological theories is so hard:

  • the lack of constraints on theories by robust phenomena,
  • problems of validity of psychological constructs, and
  • obstacles to discovering causal relationships between psychological variables.

이론의 제약으로서의 현상
Phenomena as Constraints for Theories

이 절에서 우리는 현상이 과학에서 이론 발전을 제약한다고 주장하지만, 심리학에서는 충분한 제약을 가할 만큼 강력한 현상에 대한 지식이 충분하지 않다. 우선 과학철학에서는 [데이터, 현상, 이론]을 구분하는 것이 일반적이다. [데이터]는 실험 또는 데이터 수집을 기반으로 하는 원시 관측치입니다. 심리학의 경우, 예를 들어 설문지나 행동의 관찰에 대한 반응일 수 있다. [데이터]는 세계의 비교적 안정적인 특징인 현상에 대한 증거로 작용한다. 예를 들어, 서로 다른 Stroop 작업 실험의 데이터는 Stroop 효과에 대한 증거를 제공합니다. 만약 우리가 그 현상들을 설명하고 싶다면, 우리는 그것들이 어떻게 발생하는지 설명하는 이론이 필요하다.
In this section, we argue that phenomena constrain theory development in science, but that in psychological science, there is not enough knowledge of robust phenomena to impose sufficient constraints. To start with, in philosophy of science, it is common to distinguish among data, phenomena, and theories (Bogen & Woodward, 1988; Haig, 2013; Woodward, 1989). Data are the raw observations based on experiments or data collection: In the case of psychological science, they can be, for example, responses to questionnaires or observations of behavior. Data serve as evidence for phenomena, which are relatively stable features of the world: For example, the data from different Stroop task experiments provide evidence for the Stroop effect. If we then want to explain the phenomena, we need theories that describe how they come about.2

이 프레임워크는 잘 확립되었고 심리학에 적용되었다(Borsboom et al., 2021; Haig, 2013). 그러나 [이론과 현상] 사이의 관계는 일반적으로 "일방향 트래픽"으로만 논의된다. [이론]은 [현상]을 설명하기 위해 [공식화formulated]되며, 따라서 [이론]으로부터 관련 [현상]을 [도출derive]하거나 [예측predict]하는 것이 가능해야 한다. 예를 들어, 심리학 이론 논쟁에서 심리학 이론이 너무 모호하게 공식화되어 현상에 대한 정확한 예측을 하지 못한다는 것이 핵심이다. 이 논쟁에서 훨씬 덜 주목받은 것은 이 관계가 양방향이라는 것이다. 현상들은 또한 가능한 이론들에 제약을 가한다. 즉, 이론은 가능한 이론의 공간을 좁히는 현장의 모든 관련 현상과 일치해야 한다.
This framework is well established and has been applied to psychological science (Borsboom et al., 2021; Haig, 2013). However, the relationships between theories and phenomena are usually discussed only as “one-way traffic”: A theory is formulated to explain phenomena, and therefore it should be possible to derive or predict the relevant phenomena from the theory. For example, a central (and, in our view, valid) argument in the theory debate in psychological science is that psychological theories are so vaguely formulated that they do not make precise predictions regarding phenomena (e.g., Oberauer & Lewandowsky, 2019). What has received far less attention in this debate is that this relationship is bidirectional: Phenomena also impose constraints on the possible theories (Bechtel & Richardson, 1993; Craver & Darden, 2013). In other words, a theory has to be consistent with all the relevant phenomena of the field, which narrows the space of possible theories.

이것을 예로 들어 설명하겠습니다. 진화론을 도입하기 전에 찰스 다윈은 엄청난 양의 설명적 증거를 수집했다. 그는 H.M.S. 비글호를 타고 유명한 항해를 하는 동안 (거의 5년 동안 지속되었다) 수많은 관찰을 하고 노트에 기록했는데, 위에서 설명한 프레임워크는 데이터와 일치한다. 이 자료로부터 그는 갈라파고스 섬에 서로 다르지만 매우 유사한 새 종의 분포와 같은 흥미로운 패턴을 도출했다. 다윈은 돌아온 후 몇 년 동안 선택적 번식, 화석 기록, 항해 중에 수집한 표본을 포함한 광범위한 주제를 집중적으로 연구했다. 이 모든 영역에서 그는 종들이 공통의 조상을 가지고 있고 선택적인 번식과 유사한 방식으로 자연에 의해 선택된다는 것을 암시하는 [현상]을 발견했다. 그는 이러한 발견을 바탕으로 다양한 증거의 상세한 설명으로 구성된 종의 기원을 썼다(브라운, 2006; 다윈, 1859).
Let us illustrate this with an example. Before introducing the theory of evolution, Charles Darwin had gathered an immense amount of descriptive evidence (Browne, 2006; Darwin, 1859; Rozin, 2001). During his famous voyage on the H.M.S. Beagle (lasting nearly 5 years), he made numerous observations and wrote them down in his notebooks, which in the framework described above correspond to data. From these data he derived interesting patterns, such as the distribution of different but very similar bird species on the islands of the Galapagos. Over the years after his return, Darwin intensively studied a broad range of topics, including selective breeding, the fossil record, and the samples he had collected during the voyage. In all of these areas, he found phenomena suggesting that species have common ancestors and are selected by nature in a manner analogous to selective breeding. He wrote the Origin of Species, a large part of which consists of detailed descriptions of the various lines of evidence, on the basis of these findings (Browne, 2006; Darwin, 1859).

중요한 것은 이 증거가 다양할 뿐만 아니라 매우 강력하다는 것입니다. 이 [현상]은 몇 가지 독립적인 방법으로 검증 및 탐지 가능하며 특정 이론적 틀이나 관찰 방법에 의존하지 않았다. 예를 들어, 비둘기, 소, 개의 선택적 사육에서 형질의 진화의 패턴을 관찰할 수 있었고, 다른 연구자는 원칙적으로 이러한 패턴을 확인할 수 있었다. 그러므로 이러한 [현상]들은 과학계에서 일반적으로 동의되었고 [가능한 이론possible theories]의 공간에 [매우 강한 제약]을 가했다. 진화론은 이러한 강력한 패턴들 중 한두 개에만 해당되는 것이 아니라, [모든 것]과 일치해야 했습니다.
Importantly, this evidence was not only diverse but also highly robust: The phenomena were verifiable and detectable in several independent ways and not dependent on a specific theoretical framework or observation method (Eronen, 2015, 2019; Kuorikoski & Marchionni, 2016; Munafò & Smith, 2018; Wimsatt, 2007). For example, the patterns of the evolution of traits could be observed in the selective breeding of pigeons, cattle, and dogs, and any other researcher could in principle confirm these patterns. These phenomena were therefore generally agreed on in the scientific community and imposed very strong constraints on the space of possible theories. A theory of evolution had to fit with not just one or two of these robust patterns but with all of them.

천문학의 역사는 [현상이 이론에 강요하는 제약]의 훨씬 더 놀라운 예를 제공한다. 이 경우 관련 [현상]은 천체(가장 중요한 것은 달과 행성)의 운동 패턴이었다. 이러한 패턴은 수세기에 걸친 관찰에 기초했으며 매우 강력했다. 문제는 현상에 의해 부과된 엄격한 제약을 만족시키는 이론을 생각해내고 있었다(호스킨, 1997). 행성들이 복잡한 에피사이클 기반 궤적을 따른다는 프톨레마이오스의 지구중심적 모델은 부분적으로 현상에 더 적합하거나 동등하게 잘 맞을 이론을 내놓기가 매우 어려웠기 때문에 수세기 동안 살아남았다. 그러므로, 코페르니쿠스와 갈릴레오가 그들의 태양 중심 이론을 발전시켰을 때, 가능한 이론의 공간은 현상에 의해 매우 강하게 제약을 받았다. 현대의 [이론 물리학에 대한 제약]은 훨씬 더 극단적이다. 입자 물리학에서 천문학에 이르는 강력하고 논쟁의 여지가 없는 패턴의 방대한 본체가 있으며, 물리학에 대한 새로운 이론은 이 [모든 패턴]과 일치할 필요가 있다.
The history of astronomy provides an even more striking example of the constraints that phenomena impose on theories. In this case, the relevant phenomena were the patterns in the movement of celestial objects (most importantly the moon and the planets). These patterns were based on centuries of observations and highly robust; the problem was coming up with a theory that satisfied the stringent constraint imposed by the phenomena (Hoskin, 1997). Ptolemy’s geocentric model, according to which planets followed complex epicycle-based trajectories, survived for centuries partly because it was extremely difficult to come up with a theory that would have fit the phenomena better or equally well (Hoskin, 1997). Thus, when Copernicus and Galileo developed their heliocentric theories, the space of possible theories was very strongly constrained by the phenomena. The constraints on contemporary theoretical physics are even more extreme: There is a vast body of robust and undisputed patterns ranging from particle physics to astronomy, and any new theory of physics needs to be consistent with all of these patterns.

심리학에서의 상황은 매우 다르다. 이를 보기 위해 데이터와 현상의 구분을 상기해 보자. 심리학에서는 설문지, 웨어러블 기기, 인터넷 행동 등에서 사용할 수 있는 데이터의 양이 증가하고 있다. 그러나 이러한 데이터는 종종 의심스러운 품질(다음 절 참조)이며, 심리 과학의 많은 분야는 여전히 생물학이나 물리학에 필적할 만한 강력한 현상의 큰 본체를 가지고 있지 않다.

The situation in psychological science is very different. To see this, let us recall the distinction between data and phenomena. In psychological science, there is an increasing amount of data available from questionnaires, wearable devices, Internet behavior, and so on. However, these data are often of questionable quality (see the next section), and many areas of psychological science still have no large body of robust phenomena comparable to that of biology or physics.

예를 들어, [자아 고갈 효과]를 고려해보자. 이전에 자제력이 필요한 작업에 참여한 후(예: 쿠키를 먹고 싶은 유혹에 저항하는) 사람들이 자제력이 필요한 작업(예: 어려운 퍼즐 풀기)에서 더 나쁜 성과를 거두는 현상. 이 현상을 설명하는 독창적이고 매우 영향력 있는 이론은 자기 통제의 힘(또는 근육 또는 자원) 모델이며, 이에 따르면 [자기 통제]는 자기 통제가 필요하고 고갈될 수 있는 모든 작업에 사용되는 제한적이고 도메인-일반적인 자원이다.

As an example, consider the ego-depletion effect (Baumeister et al., 1998, 2000): the phenomenon that people perform worse on a task requiring self-control (e.g., solving a difficult puzzle) after having previously engaged in a task requiring self-control (e.g., resisting the temptation to eat cookies). The original and highly influential theory explaining this phenomenon is the strength (or muscle, or resource) model of self-control, according to which self-control is a limited and domain-general resource that is used by any tasks that require self-control and can be depleted (Baumeister et al., 1998, 2000).

이 이론을 지지하는 것으로 보이는 수백 개의 연구가 발표되었다(Inzlicht & Friese, 2019). 그러나 최근 몇 년 동안 자아 고갈 효과 자체와 그 이면에 있는 이론 모두에 의문이 제기되었다. 멀티랩 사전 등록 복제 연구에서 자아 고갈에 대한 증거는 거의 발견되지 않았다. 전체 효과 크기는 작았고(d = 0.04) 대부분의 참여 실험실의 경우 효과 크기의 95% 신뢰 구간이 0을 포함했다. 저자들은 "만약 어떤 효과가 있다면, 그것은 0에 가깝다" 더욱이 효과가 실제적이라 하더라도, 이용 가능한 근거는 자기통제의 강도모델 외에 다른 이론과도 양립할 수 있다는 지적이 있었다(Inzlicht & Friese, 2019). 예를 들어, Inzlicht와 Schmeichel(2012)이 제안한 프로세스 모델에서는 고갈된 일반적인 자원 대신 동기부여 감소와 관심의 이동에 의해 자아 고갈 효과가 설명된다.

Hundreds of studies that seem to support this theory have been published (Inzlicht & Friese, 2019). However, in recent years, both the ego-depletion effect itself and the theory behind it have been called into question (Friese et al., 2019). In a multilab preregistered replication study (Hagger et al., 2016), little evidence for ego depletion was found: The overall effect size was small (d = 0.04), and for most of the participating laboratories, the 95% confidence intervals of the effect size included zero. The authors concluded that “if there is any effect, it is close to zero” (p. 558). Moreover, it has been pointed out that even if the effect is real, the available evidence is compatible with other theories in addition to the strength model of self-control (Inzlicht & Friese, 2019). For example, in the process model proposed by Inzlicht and Schmeichel (2012), the ego-depletion effect is explained by reduced motivation and shifts in attention instead of a generic resource that is depleted.

중요한 것은 이것이 유일한 예가 아니라는 것이다. 심리학에서 발견의 수많은 복제 실패는 [심지어 잘 확립되었다고 생각되었던 현상]들(예: 고정관념 위협, 신생아 모방, 다양한 프라이밍 효과)도 심리학의 다른 영역에서도 상황은 비슷하다는 것을 시사한다. 다시 말해, 심리학 분야에서는 이론에 강한 제약을 가하는 광범위한 강력한 현상이 존재하지 않는다. 이는 가능한 이론들이 증거에 의해 [과소 결정]된다는 것을 의미한다. 즉, 사용 가능한 증거(즉, 관련 현상)는 우리가 어떤 이론을 진실이라고 믿어야 하는지 결정하기에 충분하지 않다(Stanford, 2017). 이런 점에서 [비교적 강력한 현상]이 거의 확립되지 않은 심리학 분야에서 [이론적인 진보]가 거의 이루어지지 않은 것은 놀라운 일이 아니다.

Importantly, this is not an isolated example. The numerous replication failures of findings in psychology, even phenomena that were thought to be well established (e.g., stereotype threat, neonatal imitation, various priming effects; Bird, 2018), suggest that the situation is similar in other areas of psychology (Inzlicht & Friese, 2019). In other words, in many areas of psychology, there is no broad range of robust phenomena that would impose strong constraints on theories. This means that the possible theories are underdetermined by evidence: The available evidence (i.e., the relevant phenomena) is not sufficient to determine which theory we should believe to be true (Stanford, 2017).3 In this light, it is not surprising that little theoretical progress has been made in areas of psychology in which relatively few robust phenomena have been established.

심리적 구조와 인식론적 반복
Psychological Constructs and Epistemic Iteration

심리학에서 좋은 이론이 왜 그렇게 적은지를 설명하는 또 다른 중요한 요소는 심리 구조를 개선하고 검증하는 데 관심이 부족하다는 것이다. 심리학 문헌에서 우리는 점점 더 많은 수의 심리학 구조를 발견한다. 새로운 구조와 그에 상응하는 척도가 지속적으로 도입되고, 오래된 구조처럼 보이는 것에 대해 새로운 용어가 발명되며, 명백히 다른 구조에 대해 동일한 용어가 사용된다(Hagger, 2014). 예를 들어, 엘렌 스키너(1996)는 통제 심리학 문헌의 구조에 대한 리뷰에서 [인식된 통제]와 관련된 구조만 30개 이상 발견했으며, 그 이후로 더 많은 구조물이 소개되었다(Hagger, 2014).
Another important factor explaining why there are so few good theories in psychology is the lack of attention on improving and validating psychological constructs. In the psychological literature, we find a large and increasing number of psychological constructs. New constructs and corresponding scales are constantly introduced, new terms are invented for what seem to be old constructs, the same term is used for apparently different constructs, and so on (Hagger, 2014). For example, in her review of constructs in the psychological literature on control, Ellen Skinner (1996) found more than 30 constructs related to perceived control alone, and since then many more have been introduced (Hagger, 2014).


원칙적으로, 수용 가능한 과학적 구조가 되기 위해서는, 이러한 모든 심리적 구조가 타당성을 가져야 한다. 구인 타당성의 개념은 Cronbach와 Meehl(1955)에 의해 도입되었으며, 그 의미는 그 후 수십 년 동안 크게 진화 및 영향을 받았다. 핵심 아이디어 중 일부는 구조가 [이론적 프레임워크](또는 Cronbach & Meehl의 처음 표현에 따르자면 "노몰로지 네트워크")에 포함되어야 하며, [구인의 측정]은 [측정하려는 것을 측정한다]는 의미에서 타당해야 한다는 것이다.
In principle, to be acceptable scientific constructs, all of these psychological constructs should have construct validity. The notion of construct validity was introduced by Cronbach and Meehl (1955), and its meaning has greatly evolved and ramified in the decades that followed (Newton & Shaw, 2013). Some of the core ideas are that the construct should be embedded in a theoretical framework (or a “nomological network” as originally phrased by Cronbach & Meehl, 1955) and that measurements of the construct should be valid in the sense that they measure what they are intended to measure (Borsboom et al., 2004).

문제는 구인 타당성이 결정적으로 중요하다는 데 널리 동의하지만, 실제로 심리학자들은 신뢰성과 같은 척도에 비교하자면, 구인 타당도에는 거의 주의를 기울이지 않는다는 것이다. 예를 들어, Flake et al(2017)은 Journal of Personality and Social Psychology에 게재된 논문의 무작위 샘플을 검토한 결과, 검토한 논문의 대부분이 사용된 구조에 대한 타당성 증거를 전혀 보고하지 않았다는 것을 발견했다. 증거가 보고되었을 때, 그것은 일반적으로 다른 기사에 대한 인용만으로 구성되었다. 마찬가지로 Zumbo와 Chan(2014)에 수집된 논문은 심리학자들이 상대적으로 타당성 증거를 적게 보고하고 다른 심리측정학적 특성, (가장 주요하게는) [신뢰성에 훨씬 더 집중하는 경향]이 있음을 보여준다. 이에 대한 가장 간단한 설명은 신뢰성 증거를 제공하는 것이 비교적 쉬운 반면, 타당성 증거를 제공하는 것은 매우 어렵다는 것이다. 전자의 경우 크론바흐의 α와 같이 잘 확립되고 정량화된 측정값이 있다. 후자의 경우 단순한 정량적 측정이 없으며, 구성 타당성이 무엇인지 또는 타당성 증거가 어느 정도여야 하는지에 대한 합의조차 이루어지지 않았다(Newton & Shaw, 2013). 구성 타당성이 교과서 및 지침서에 자주 등장하는 "시험은 측정하고자 하는 것을 측정해야 한다"는 문구로 이해된다면, 타당성을 확립하려면 관심 속성의 변동이 실제로 시험 점수의 변동을 야기하고 있음을 보여줄 필요가 있다. 이런 종류의 구조 검증은 거의 이루어지지 않기 때문에, 그 결과 심리학은 타당성을 알 수 없는 수많은 심리 구조들에 의해 스며들고 있다.

The problem is that although it is widely agreed that construct validity is crucially important, in practice psychological scientists give it very little attention compared with measures such as reliability. For example, Flake et al. (2017) reviewed a random sample of articles published in Journal of Personality and Social Psychology and found that most of the articles reviewed reported no validity evidence whatsoever for the constructs used. When evidence was reported, it typically consisted only of a citation to another article. Likewise, the articles collected in Zumbo and Chan (2014) show that psychological scientists tend to report relatively little validity evidence and focus much more on other psychometric properties, most importantly reliability. The simplest explanation for this is that providing reliability evidence is relatively easy, whereas providing validity evidence is very hard. For the former, there are well-established and quantified measures, such as Cronbach’s α. For the latter, there is no simple quantitative measure, and there is not even agreement on what construct validity is or what validity evidence should amount to (Newton & Shaw, 2013). If construct validity is understood in terms of the phrase “the test should measure what it is intended to measure,” which often appears in textbooks and guidelines, then establishing validity requires showing that variation in the attribute of interest is actually causing the variation in the test scores (Bringmann & Eronen, 2016; Borsboom et al., 2004). As construct validation of this kind is hardly ever done, the result is that psychological science is permeated by numerous psychological constructs of unknown validity (Flake et al., 2017; Fried & Flake, 2018).

자아 고갈 연구는 이것의 대표적인 예이다. 루르퀸과 미야케(2017)가 지적하듯이 핵심 개념인 '자기통제'가 명확하게 정의되거나 운용된 적은 없다. 종종 이 통제의 성격을 더 구체적으로 명시하지 않고 생각, 감정 또는 행동에 대한 모든 종류의 (억제적) 통제를 지칭하기 위해 매우 광범위하게 사용된다(Lurquin & Miyake, 2017). 또한 자아 고갈 연구에서 자기 통제를 측정하거나 조작하는 데 사용되는 설정은 검증되지 않았다. 최근 연구에서 윔머 외 연구진(2019)은 자아 고갈을 유도하기 위해 가장 널리 사용되는 작업 중 하나인 [편지 취소 작업]을 체계적으로 테스트했는데, 참가자들은 복잡한 규칙에 따라 문자를 지워야 한다. 그들은 이 작업이 자기 통제나 억제 통제에 영향을 미친다는 어떤 증거도 발견하지 못했다.

Ego-depletion research is a prime example of this. As Lurquin and Miyake (2017) point out, the key concept “self-control” has never been clearly defined or operationalized. It is often used very broadly to refer to any kind of (inhibitory) control over thoughts, emotions, or actions without further specifying the nature of this control (Lurquin & Miyake, 2017). Moreover, the setups that are used to measure or manipulate self-control in ego-depletion studies have never been validated (Inzlicht & Friese, 2019). In a recent study, Wimmer et al. (2019) systematically tested one of the most widely used tasks to induce ego depletion, the letter-cancellation task, in which participants have to cross off letters following complex rules. They did not find any evidence that this task would affect self-control or inhibitory control (Wimmer et al. 2019).

임상심리학에서 예로 주요 우울증(MDD)을 들 수 있다. MDD의 정의는 1970년대부터 시작되었으며, 그 이후로는 근본적으로 바뀌지 않았다. 예를 들어, MDD의 다른 경우에 큰 이질성이 있기 때문이다. (예를 들어, 두 사람이 단일 증상을 공유하지 않고 MDD를 가질 수 있다.) MDD 자체가 잘 정의된 카테고리인지 의심스럽다. 또한, MDD를 측정하는 데 사용되는 수많은 척도는 내용이 중복되지 않는 경우가 많아 실제로 하나의 동일한 구조를 측정하는 것인지 불분명하다.

As an example from clinical psychology, consider major depressive disorder (MDD). The definition of MDD stems from the 1970s and has not essentially changed since then, although it is increasingly clear that the validity of the construct is problematic (De Jonge et al., 2015; Fried, 2017). For example, because there is great heterogeneity in different cases of MDD (e.g., two individuals can have MDD without sharing a single symptom), it is doubtful that MDD in itself is a well-defined category (Fried, 2017). In addition, the numerous scales that are used to measure MDD often have little content overlap, making it unclear whether they are really measuring one and the same construct (Fried, 2017; Fried & Flake, 2018).

이러한 예들을 자연과학과 대조하는 것은 명확하다. 자연과학의 개념이나 분류는 추가 실험과 관찰을 통해 그리고 그것들이 내재된 이론적 틀을 개선함으로써 지속적으로 정제된다. 초기에 거칠고 잘못 정의된 개념(예: 상식적인 개념 "물고기fish")은 정제되고 재개념화된다. (예를 들어, 린네의 전통적인 종 분류법에서 물고기Pisces라는 개념으로, 대략 물 속에서 영원히 사는 지느러미 동물로 정의된다.) 그리고 새로운 버전은 새로운 이론과 증거에 기초하여 다시 테스트되고 조정된다. (예를 들어, 물고기는 더 이상 과학적 범주로 간주되지 않고 진화적 관계에 기초하여 몇 개의 다른 부류로 나뉘었다.)
It is illuminating to contrast these examples with the natural sciences. Concepts or classifications in the natural sciences are constantly refined through further experiments and observations and by improving the theoretical framework in which they are embedded. A concept that is initially rough and poorly defined (e.g., the commonsense notion “fish”) is refined and reconceptualized (e.g., into the concept “Pisces” in the traditional Linnaean taxonomy of species, defined roughly as finned animals perpetually living in water), and then the new version is again tested and adjusted on the basis of new theories and evidence (e.g., “Pisces” is no longer considered a scientific category but has been divided into several distinct classes on the basis of evolutionary relationships).

이것의 예는 과학에 많이 있다. 예를 들어, "전자"라는 개념은 1890년대에 물리학에 도입되었고, 처음에는 전하의 기본 단위를 의미했지만, 그 이후 양자 이론과 같은 실험과 이론적 발전을 통해 그 의미가 진화했고, 현재 "전자"는 페르미온이고, 전하가 -1인 소립자를 가리킨다. 1/2 등등.  Chang(2004, 2016)은 이 과정을 "인식적 반복"이라고 부르며, "특정 인식론적 목표의 달성을 강화하기 위해, 각각에 선행한 것 위에 구축되는, 지식의 연속적인 단계가 만들어지는 과정"이라고 특징짓는다(Chang, 2004, p.224).

Examples of this are abundant in the sciences: For example, the concept “electron” was introduced to physics in the 1890s, and it initially meant an elementary unit of electric charge, but since then its meaning has evolved through experiments and theoretical advances such as the quantum theory, and now “electron” refers to an elementary particle that is a fermion, has a charge of −1, spin of 1/2, and so on. Chang (2004, 2016) calls this process “epistemic iteration” and characterizes it as “a process in which successive stages of knowledge, each building on the preceding one, are created in order to enhance the achievement of certain epistemic goals” (Chang, 2004, p. 224)

이와는 대조적으로 심리학에서는 공식 지침이 검증의 중요성과 진행 중인 프로세스로 어떻게 봐야 하는지를 강조하지만, 이러한 반복은 표준이 아니다(Flake et al., 2017). 그러나 몇 가지 긍정적인 예외가 있다. 예를 들어, 에빙하우스가 1880년대에 기억의 과학적 연구를 개척했을 때, 그는 "기억"을 하나의 상식적인 개념으로 취급하고 있었고, 다른 종류의 기억들을 구별하지 않았다. 이후 연구, 특히 1950년대부터 시작된 [비선언적 기억]과 [선언적 기억]과 같은 많은 종류의 기억들이 도입되었으며, 그 중 [후자(선언적 기억)]는 [에피소드적 기억]과 [의미적 기억]으로 더 나눌 수 있다. 기억의 다른 범주와 종류는 고정되어 있지 않지만 새로운 증거와 주장에 비추어 여전히 정제되고 논의되고 있다(Tulving, 2007).
In contrast, in psychology, this kind of iteration is not the norm, although official guidelines emphasize the importance of validation and how it should be seen as an ongoing process (Flake et al., 2017). There are, however, some positive exceptions (see also Kendler, 2012). For example, when Ebbinghaus pioneered the scientific study of memory in the 1880s, he was treating “memory” as a monolithic commonsense notion and did not distinguish between different kinds of memory (Tulving, 2007). In subsequent research, especially starting from the 1950s, many different kinds of memory have been introduced, such as nondeclarative and declarative memory, the latter of which can be further divided into episodic and semantic memory (Michaelian & Sutton, 2017). The different categories and kinds of memory are not fixed but are still refined and debated in light of new evidence and arguments (Tulving, 2007).

심리학적 구조가 종종 변화에 그렇게 저항하는 실용적인 이유 중 하나는, 윌리엄 윔샛에 의해 만들어지고 개발된 개념인 , "생성적 고착(알박기)"이다. 일단 어떤 개념이 그것에 따라 다른 많은 개념, 이론, 또는 실천을 가지면, 그것은 "고착"이 되고, 그것이 부족하거나 문제가 있다고 알려져도 바꾸기가 매우 어려울 것이다. 개념을 바꾸면 그에 따라 구조가 무너져 재앙이나 혁명으로 이어질 수 있기 때문이다. 심리학적 구조(특히 임상심리학)는 다른 이론과 모델뿐만 아니라 사회 전반에서도 적용되기 때문에 시간이 지남에 따라 깊이 자리 잡게 되는 경우가 많다. 예를 들어, MDD와 같은 구조는 환자를 진단하거나 건강보험에 대한 결정을 내리는 데 중요한 역할을 한다.
One practical reason why psychological constructs are often so resistant to change is “generative entrenchment,” a concept coined and developed by William Wimsatt (1986, 2007). Once a concept has many other concepts, theories, or practices depending on it, it becomes “entrenched” and will be very difficult to change, even if it is known to be deficient or problematic. This is because changing the concept could collapse the structures depending on it, leading either to a disaster or a revolution (Wimsatt, 2007, p. 140). Psychological constructs (especially in clinical psychology) often become deeply entrenched over time, as they have applications not only in other theories and models but also in society at large. For example, constructs such as MDD play an important role in diagnosing patients or in making decisions about health insurance.

그러나 인식론적 반복과 심리적 구조의 검증은 이론의 위기에서 벗어나는 방법을 찾는 데 결정적으로 중요하다. 앞 절에서 주장했듯이 [좋은 이론의 근거]는 [강력한 현상]이다. 결국, 현상은 데이터에서 추론되며, 데이터가 대부분 잘 이해되거나 검증되지 않은 구성과 측정을 기반으로 한다면, 추론된 현상은 강력하지 않을 것이다. 다시 말해, 심리학에서 강력한 현상이 없는 한 가지 원천은 구성 검증 과정에 대한 강조의 부족이다.
However, epistemic iteration and validation of psychological constructs is crucially important for finding a way out of the theory crisis. As we argued in the previous section, the basis for good theories is robust phenomena. Phenomena, in turn, are inferred from data, and if the data are based on constructs and measurements that for the most part have not been well understood or validated, the phenomena that are inferred are unlikely to be robust. In other words, one source for the lack of robust phenomena in psychology is the lack of emphasis on the process of construct validation.

심리학적 이론과 원인 규명의 문제
Psychological Theories and the Problem of Finding Causes

심리학에서 좋은 이론이 그렇게 적은 세 번째 이유는 심리적 원인을 찾는 것이 매우 어렵기 때문이다. 좋은 이론의 주요 특징은 어떤 식으로든 인과관계를 추적해야 한다는 데 널리 동의되고 있다. 예를 들어 다윈의 진화론은 진화의 원인(자연선택)을 기술했고, DNA 이론은 유전의 인과적 메커니즘을 기술했다. 이러한 관점에서, 심리학적 이론들이 정신이 어떻게 작용하는지를 설명하는 것을 목표로 하는 한, 정신의 인과적 메커니즘을 또한 반영해야 한다고 요구하는 것은 타당하다. 즉, 심리적 변수들 간의 인과관계를 포착해야 한다.
The third reason why there are so few good theories in psychology is that finding psychological causes is extremely challenging. It is widely agreed that a key feature of good theories is that they should, in one way or another, track causal relationships (e.g., Craver, 2007; Pearl, 2000; Woodward, 2003). For example, Darwin’s theory of evolution described the causes of evolution (natural selection), and the DNA theory describes the causal mechanism of inheritance. In this light, it is reasonable to require that psychological theories, insofar as they aim to explain how the mind works, should also reflect the causal mechanisms of the mind (Bechtel, 2008; Thomas & Sharp, 2019). In other words, they should capture causal relationships between psychological variables.

그러나 문제는 Eronen(2020)에서 광범위하게 주장되었듯이 심리적 변수들 간의 인과관계를 발견하는 것이 종종 극도로 어렵거나 불가능하다는 것이다. 그 이유를 설명하기 위해 인과관계를 명확하고 일반적인 방법으로 추론할 수 있는 조건을 제시하는 개입주의적 인과관계의 틀에 의존한다. 
The problem, however, is that discovering causal relationships between psychological variables is often extremely difficult or impossible, as extensively argued in Eronen (2020). To explain why, we rely on the framework of the interventionist theory of causation (Woodward, 2003, 2015; see also Pearl, 2000, 2009), which lays out the conditions for inferring causal relationships in a clear and general way.

[인과관계]의 특징은 (상관관계와 달리) 조작과 통제에 이용될 수 있는 관계라는 것이다. [원인에 개입]하는 것은 [효과의 변화]를 가져오는 방법이다. 개입주의 이론은 이것을 출발점으로 삼아 다음과 같이 인과관계를 정의한다. 다른 변수가 해당 값에 고정되어 있을 때 X에 개입하여 Y를 변경할 수 있는 경우에만 X가 Y의 원인입니다. [개입]은 [Y에 대한 X의 교란 없는unconfounded 조작]이어야 한다: 즉, 'X를 조작'했을 때, [X를 거치지 않는 다른 경로]를 통해 Y를 변화시켜서는 안 된다. (더 정확한 정의는 Eronen, 2020; Woodward, 2003 참조). 실제로 개입을 수행할 필요가 항상 있는 것은 아닙니다. 
때때로 예를 들어 관찰 데이터를 기반으로 간접적으로 개입의 효과에 대한 지식을 얻는 것이 가능하다. 또한, 루빈의 인과관계 모델(예: 루빈, 2005)이나 캠벨의 인과관계 모델(예: 샤디쉬 외, 2002)과 같이 심리과학자들에게 더 친숙한 인과관계에 대한 다른 접근법에서도 동일한 생각이 다른 형태로 나타난다.

The characteristic feature of causal relationships is that (unlike correlations) they are relationships that are exploitable for manipulation and control: Intervening on the cause is a way of bringing about a change in the effect. The interventionist theory takes this as the starting point and defines causation (roughly) as follows: X is a cause of Y if (and only if) it is possible to intervene on X to change Y when other variables are held fixed to their values. The intervention should be an unconfounded manipulation of X with respect to Y: The manipulation of X should not change Y via any other route that does not go through X (for more precise definitions, see Eronen, 2020; Woodward, 2003). It is not always necessary to actually perform an intervention; sometimes it is possible to gain knowledge about the effects of interventions indirectly, for example, on the basis of observational data. The same ideas also appear in different forms in other approaches to causation that are more familiar to psychological scientists, such as Rubin’s causal model (e.g., Rubin, 2005) or Campbell’s causal model (e.g., Shadish et al., 2002).

무작위 대조 시험은 일반적으로 인과 추론을 위한 "금본위제"로 간주되며 위의 조건을 만족시킨다. 예를 들어, 약물 실험에서 참가자는 무작위로 치료 및 대조군에 할당되며, 이 무작위화는 원인(약물)과 효과(회복)가 아닌 다른 변수를 "고정"하는 효과를 생성한다. 치료 그룹의 참가자에게 약물을 투여하는 개입은 근거가 없어야 한다. 예를 들어, 알약에는 약물 자체를 순환하는 원인 경로를 통해 회복에 영향을 미치는 다른 성분이 있어서는 안 된다.
Randomized controlled trials are usually taken to be the “gold standard” for causal inference and for satisfying the above conditions. For example, in a drug trial, participants are randomly assigned to treatment and control groups, and this randomization generates the effect of “holding fixed” other variables than the cause (the drug) and the effect (recovery). The intervention of administering the drug to participants in the treatment group should be unconfounded: For example, there should not be other ingredients in the pill that would affect recovery through a causal route that goes around the drug itself.

많은 [심리 실험]은 약물, 교육 자료 또는 시각 및 청각 자극과 같은 비심리적 원인의 조작을 포함한다(Eronen, 2020). 이러한 경우, 올바른 종류의 개입을 수행하는 것은 원칙적으로 다른 분야보다 어렵지 않다. 따라서 다음의 주장은 외적 독립 변수를 조작하고 심리적 영향을 추적하는 빌헬름 분트까지 거슬러 올라가는 오래된 실험 전통과 관련이 없다. 그러나 정신의 [인과적 메커니즘]을 기술하는 [실체적인 심리학 이론substantive psychological theory]을 개발하는 것이 목적이라면, [외부 독립 변수]와 [심리적 변수] 사이의 인과 관계를 확립하는 것만으로는 충분하지 않다. 우리는 또한 [심리적 변수]들 사이의 인과관계를 배울 필요가 있다. 그리고 이것을 하기 위해서, 우리는 개입이 심리적 변수에 미치는 영향에 대해 배울 필요가 있다.

Many psychological experiments involve the manipulation of nonpsychological causes, such as drugs, educational materials, or visual and auditory stimuli (Eronen, 2020). In such cases, performing the right kinds of interventions is in principle not more difficult than in other fields. Therefore, the following arguments do not concern the venerable experimental tradition, going all the way back to Wilhelm Wundt, of manipulating external independent variables and tracking their psychological effects. However, if the aim is to develop substantive psychological theories that describe causal mechanisms of the mind, establishing causal relationships between external independent variables and psychological variables is not enough: We also need to learn causal relationships between psychological variables. And to do this, we need to learn about the effects of interventions on psychological variables.

[심리적 변수]에 대한 개입의 문제는 일반적으로 "뚱뚱한 손"이라는 것이다. 이 variable는 대상 variable 하나만 변경하는 것이 아니라 여러 다른 variable도 바꿔놓습니다. 생각이나 영향 등 심리적 변수를 직접 조작할 방법이 없기 때문이다. 대신, 그들은 구두 지시나 다른 외부 자극을 통해 간접적으로 조작되어야 하며, 그러한 기술은 일반적으로 하나의 변수만 변경할 정도로 정확하지 않다. 예를 들어, (적어도 현재) 동기, 주의 또는 불안감과 같은 다른 심리 상태를 변경하지 않고 [통제력 상실의 감정을 조작하는 것]은 불가능하다. 또한 심리적 변수는 예를 들어 자기 보고서나 행동 대용물을 기반으로 간접적으로만 측정할 수 있다(De Houwer, 2011). 따라서 개입이 정확히 어떤 변수를 변경했는지, 따라서 어느 정도까지 뚱뚱했는지 검증하거나 확인하는 것이 매우 어렵습니다.

The problem with interventions on psychological variables is that they are typically “fat-handed” (Eronen, 2020)4: They do not change just the one variable that is targeted but several other variables as well. This is because there is no direct way of manipulating psychological variables such as thoughts or affects (Chiesa, 1992; Hughes et al., 2016). Instead, they have to be manipulated indirectly via verbal instruction or other external stimuli, and such techniques are typically not precise enough to change just one variable. For example, it is (at least currently) impossible to manipulate feelings of loss of control without changing any other psychological states, such as motivation, attention, or feelings of anxiety. Moreover, psychological variables can be measured only indirectly, for example, on the basis of self-reports or behavioral proxies (De Houwer, 2011). This makes it very difficult to verify or check what variables the intervention precisely changed and therefore to what extent it was fat-handed.

이것은 심리적인 원인을 찾는 데 문제를 일으키는데, 왜냐하면 개입이 뚱뚱할 때, 우리는 그것들이 [인과적 추론]을 할 수 있게 만들어주는 [교란 없는unconfounded 조작manipulation]이라고 가정할 수 없기 때문이다. 보다 구체적으로, 우리는 그것들이 추정 원인 X를 통과하는 경로를 통해서만 추정 효과 Y를 변화시킨다고 가정할 수 없다. 이것을 설명하기 위해, 다시 한번 자아 고갈 연구에 초점을 맞추자. 자아 고갈 실험에서, 자기 통제는 매우 다양한 방식으로 조작된다(예: 참가자가 복잡하거나 좌절하는 작업이나 게임에 참여하게 하거나 맛있는 음식을 먹고 싶은 유혹을 뿌리치게 함으로써). Friese et al., 2019. 두 번째 작업에서 자기 통제가 성능 저하의 원인이라는 결론을 보증하기 위해, 이러한 개입은 추정 효과(즉, 두 번째 작업에서 성능 저하)와 관련하여 근거 없는 자기 통제의 조작이어야 한다. 다시 말해, 그들은 효과의 다른 가능한 원인(예: 동기, 주의, 분노의 감정)에 영향을 미치지 않는 방식으로 자기 통제를 변화시켜야 한다. 그러나 개입의 다소 일반적인 성격과 자기 통제 및 관련 구성(동기, 주의 등)의 인과 구조에 대한 우리의 지식이 부족하다는 점을 고려할 때, 
우리는 현실적으로 이것이 사실이라고 가정할 수 없다. 예를 들어, 쿠키를 먹고 싶은 유혹에 저항하는 것은 또한 동기부여에 영향을 미치거나 분노와 좌절의 감정을 유발시킬 수 있다. 이는 자아 고갈 실험이 감소된 자기 통제 자원이 두 번째 작업에서 성능 저하에 대한 원인이라는 충분한 증거를 제공하지 않는다는 것을 의미하며, 이는 실제로 최근 연구 상태에 대한 검토에서 도달한 결론과 일치한다.

This creates a problem for finding psychological causes because when interventions are fat-handed, we cannot assume that they are unconfounded manipulations that license causal inferences. More specifically, we cannot assume that they change putative effect Y only via a route that goes through the putative cause X. To illustrate this, let us again focus on ego-depletion research. In ego-depletion experiments, self-control is manipulated in very diverse ways (e.g., by letting participants engage in a complex or frustrating task or game or by letting them resist the temptation to eat delicious food; Friese et al., 2019). To warrant the conclusion that self-control is the cause of impaired performance in the second task, these interventions should be unconfounded manipulations of self-control with respect to the putative effect (i.e., impaired performance in the second task). In other words, they should change self-control in such a way that other possible causes of the effect are not affected (e.g., motivation, attention, feelings of anger). However, given the rather general nature of the interventions and our lack of knowledge of the causal structure of self-control and related constructs (motivation, attention, etc.), we cannot realistically assume that this is the case (Friese et al., 2019). For example, resisting the temptation to eat cookies might also affect motivation or induce feelings of anger and frustration. This means that ego-depletion experiments do not provide sufficient evidence that a diminished self-control resource is the cause for the impaired performance in the second task which is indeed in line with the conclusion reached in recent reviews of the state of the research (Friese et al., 2019; Inzlicht & Friese, 2019).

요약하면, [심리 변수에 대한 개입]은 [뚱뚱한 손]일 가능성이 높으며, 그러한 개입은 인과 추론의 [신뢰할 수 있는 근거를 제공하지 못한다]. 심리변수에 대한 개입은 종류가 완전히 다르고 외부변수에 대한 개입보다 훨씬 어렵기 때문에 외부요인을 조작하고 그 심리적 영향을 추적하는 실험적 전통은 단순히 심리변수를 조작하는 것으로 확장될 수 없다(Chiesa, 1992; De Houwer, 2011 참조). 심리학 이론이 인과관계를 추적해야 하는 한, 이는 심리학에서 좋은 이론이 왜 그렇게 적은지, 그리고 왜 그렇게 발전하기 어려운지를 설명하는 데 중요한 요소이다.
In sum, interventions on psychological variables are likely to be fat-handed, and such interventions do not provide a reliable basis for causal inference. The experimental tradition of manipulating external factors and tracking their psychological effects cannot simply be extended to manipulate psychological variables, as interventions on psychological variables are entirely different in kind and far more difficult than interventions on external variables (see also Chiesa, 1992; De Houwer, 2011). Insofar as psychological theories should track causal relationships, this is an important factor in explaining why there are so few good theories in psychology and why they are so difficult to develop.

논의
Discussion

이 글에서는 좋은 심리이론을 개발하는 데 있어 세 가지 근본적인 어려움에 대해 논의하였다. 

  • (충분한) 강력한 현상의 부족,
  • 심리적 구조에 대한 타당성과 인식론적 반복의 부족,
  • 심리적 원인 정립의 문제 등

이러한 문제들은 이론 위기 해결에 진전을 이루기 위해 다루어지고 논의되어야 한다. 우리는 이제 이러한 문제에 기초하여 심리 연구에 대한 몇 가지 권장 사항을 개략적으로 설명한다.

In this article, we have discussed three fundamental difficulties in developing good psychological theories:

  • the lack of (sufficient) robust phenomena,
  • the lack of validity and epistemic iteration for psychological constructs, and
  • the problem of establishing psychological causes.

These issues should be addressed and discussed to make progress in resolving the theory crisis. We now outline several recommendations for psychological research on the basis of these issues.

첫째, 우리의 논의는 심리학에서 최근 더 많은 "현상 감지" 또는 "현상 주도 연구"에 대한 요구를 지지한다. [새로운 현상을 발견]하고, 이미 발견된 것에 대한 보다 강력한 증거를 수집함으로써 가능한 이론의 공간은 제한될 것이다. 

First, our discussion supports the recent calls for more “phenomena detection” or “phenomenon-driven research” in psychology (Borsboom et al., 2021; De Houwer, 2011; Haig, 2013; see also Trafimow & Earp, 2016). By discovering new phenomena and gathering more robust evidence for those already discovered, the space of possible theories will be constrained.

[현상 주도 연구]를 지지하는 또 다른 중요한 이유는 현상이 과학과 사회에 매우 중요할 수 있기 때문이다(Eronen, 2020). 
예를 들어 확증편향과 같이 심리학자들이 발견한 광범위한 인지편향은 대부분 매우 강력한 현상이다(길로비치 외, 2002). 이러한 현상을 설명하기 위해 다양한 이론이 제안되었는데, 예를 들어, 사람들이 간단한 휴리스틱으로 어려운 계산을 대체한다고 보는 [속성-대체 이론]이나, 이것보다 훨씬 일반적인 [이중 시스템 이론](Kaneman & Frederick, 2002) 등이 있다. 그러나 이러한 이론들은 현상 자체보다 훨씬 더 논란이 많다. 더욱이, 이러한 [현상들이 존재한다는 것]을 아는 것은 비록 우리가 그 이면의 이론이나 메커니즘을 알지 못하더라도 과학과 사회에 매우 중요하다. 심리학에서 발견된 광범위한 다른 강력한 현상, 예를 들어, 사람들이 [익숙하지 않은 자극]보다 [익숙한 자극]을 선호하는 경향이 있는 현상도 마찬가지다(즉, 단순한 노출 효과; Bornstein, 1989). 이러한 [현상이 존재한다는 것]을 [아는 것, 그리고 그것을 기술하는 것]은 그것들을 설명할 수 있는 받아들여진 이론이 없는 경우에도 유용하다. 

Another important reason to support phenomenon-driven research is that phenomena can also be extremely important for science and society as such (https://doi.org/10.1016/j.newideapsych.2020.100785" data-mce-href="https://journals.sagepub.com/doi/10.1177/1745691620970586#">Eronen, 2020): Consider, for example, the broad range of cognitive biases that psychologists have discovered, such as confirmation bias, most of which are very robust phenomena (Gilovich et al., 2002). Various theories have been proposed to explain these phenomena, such as the attribute-substitution theory, according to which people substitute difficult computations with simple heuristics, or the more general dual-system theory (Kahneman & Frederick, 2002). However, these theories are far more controversial than the phenomena themselves. Moreover, knowing that these phenomena exist is extremely important for science and society, even if we do not know the theory or mechanism behind them. The same holds for a broad range of other robust phenomena discovered in psychology, for example, the phenomenon that people tend to prefer familiar stimuli to unfamiliar ones (i.e., the mere-exposure effect; Bornstein, 1989). Simply knowing that these phenomena exist and describing them is useful, even in the absence of an accepted theory that would explain them.

발견되고 기술되는 것 외에도, [서로 다른 현상들에서 공유된 추상적 구조]를 찾아냄으로써 현상을 더욱 분석할 수 있다(Hughes et al., 2016). 예를 들어, 추상적 수준에서, [끊임없이 전화기를 확인]하고 [사탕으로 아이들의 좋은 행동을 보상하는 것]이라는 이 두 가지 서로 다른 현상들은 둘 다 (긍정적) 강화의 사례로 볼 수 있다(Hughes et al., 2016). 이러한 모든 이유로, [현상 탐지]는 그 자체로 중요한 목표이자 심리 연구의 중심적인 부분으로 간주되어야 한다(Fiedler, 2017; Haig, 2013; Rozin, 2001 참조).
In addition to being discovered and being described, phenomena can also be further analyzed by looking for shared abstract structures in different phenomena (Hughes et al., 2016). For example, at an abstract level, phenomena as different as constantly checking your phone and rewarding the good behavior of children with candy can both be seen as instances of (positive) reinforcement (Hughes et al., 2016). For all of these reasons, phenomena detection should be seen as an important goal in itself and as a central part of psychological research (see also Fiedler, 2017; Haig, 2013; Rozin, 2001).

그러나 우리는 결코 심리학에서의 이론화가 절망적이거나 자원의 낭비이거나 정신적 과정에 대한 이론이 비과학적이라고 거부되는 일종의 행동주의로 돌아가야 한다고 제안할 생각은 없다. 우리가 제기한 문제는 극복할 수 없는 장애물이 아니라 주어진 영역에서 좋은 심리학 이론이 개발되기 전에 충족되어야 할 도전으로 보아야 한다.
However, we by no means intend to suggest that theorizing in psychology is hopeless or a waste of resources or that we should return to a kind of behaviorism in which theories about mental processes are rejected as unscientific. The issues we have raised should not be seen as insurmountable obstacles but rather as challenges that need to be met before good psychological theories can be developed in a given domain.

이제 다음 사항을 살펴보겠습니다. 최근 문헌에서 공통적으로 다루어지는 주제인 [심리이론을 좀 더 수학적으로, 형식적으로 만드는 것]이 과학으로서 심리학의 상당한 발전으로 이어질지 의문이다.5 우리가 논의한 문제들 중 어떤 것도 심리학 이론을 공식화하는 것으로 해결되지 않는다. (심리 이론을 formalize하더라도) 여전히 [이론을 제약할 강력한 현상]은 많이 나타나지 않을 것이며, 따라서 [사용된 구인]이 더 유효해지지도 않을 것이며, 공식적인 처치formal treatment만으로는 [인과관계와 뚱뚱한 개입의 문제]를 해결할 수 없다. 또한 생명과학에서 많은 성공적이고 매우 중요한 이론들은 형식화되거나 수학적인 이론이 아니다. (예: 발효 이론 또는 시냅스 전달 이론; Bechtel & Richardson, 1993; Machamer, Darden & Craver, 2000) Rozin(2001; Morey et al., 2018 참조)이 지적한 바와 같이, 복잡한 통계 및 계산 모델을 사용한다고 해서 심리학이 더 과학적이지는 않으며, [개념 및 경험적 기초(예: 강력한 현상)]가 아직 견고하지 않다면 오히려 역효과를 낼 수 있다.

This brings us to our next point: It is doubtful whether making psychological theories more mathematical or formal, which is a common theme in the recent literature (e.g., Borsboom et al., 2021; Muthukrishna & Henrich, 2019; Oberauer & Lewandowsky, 2019; van Rooij & Baggio, 2021), will lead to significant advances in psychology as a science.5 None of the problems we have discussed is solved by formalizing psychological theories: There will still be no large body of robust phenomena to constrain the theories, the constructs used do not become more valid, and a formal treatment alone does not solve the problem of causality and fat-handed interventions. Moreover, many successful and extremely important theories in the life sciences are not formalized or mathematical theories (e.g., the fermentation theory or the theory of synaptic transmission; Bechtel & Richardson, 1993; Machamer, Darden & Craver, 2000). As pointed out by Rozin (2001; see also Morey et al., 2018), using complex statistical and computational models does not make psychology more scientific and can be even counterproductive if the conceptual and empirical basis (e.g., robust phenomena) is not yet solid.

마지막으로, [이론의 기초]로서 [명확하고 투명하게 정의된 개념을 갖는 것]의 중요성을 아무리 강조해도 지나치지 않다. 이는 이론의 공식화와는 다르다. 개념은 [정성적으로 공식화된 이론]에서도 잘 정의될 수 있으며(예: 다윈의 진화론), 형식 이론은 제대로 정의되지 않은 개념을 요소로 가질 수 있다(예: 명확한 수학적 구조를 가지고 있지만 중심 개념 "밈"이 잘 정의되지 않은 밈학 모델; Kronfeldner, 2011). [개념적 명확화]와 [구인 타당화construct validation]은 연구의 중요하고 가치 있는 부분으로 간주되어야 하며, validation은 단지 넘어야 할 장애물이 아닌 반복적이고 지속적인 과정으로 간주되어야 한다. 우리가 볼 때, 심리학 이론의 개념적 기초를 강화하는 것은 적어도 심리학 연구에서 통계적 기법과 관행을 향상시키는 것만큼 중요하다.

Finally, it is hard to overemphasize the importance of having clearly and transparently defined concepts as the basis for theories. Note that this is not the same as formalization of theories: Concepts can be well defined in qualitatively formulated theories as well (e.g., Darwin’s theory of evolution), and formal theories can have poorly defined concepts as their elements (e.g., models in memetics that have a clear mathematical structure but for which the central concept “meme” is not well defined; Kronfeldner, 2011). Conceptual clarification and construct validation should be seen as an important and valuable parts of research, and validation should be taken to be an iterative and ongoing process instead of just a hurdle that needs be crossed. In our view, strengthening the conceptual basis of psychological theories is at least as important as improving statistical techniques and practices in psychological research.

장기적으로, 이것은 [명확하게 정의되고, 명확하게 측정 가능한 구인]을 가지게 해줌으로써, [표적 개입]을 수행하고 그 영향을 추적하는 것을 더 쉽게 만들어주고, 궁극적으로 [인과 추론] 문제에 도움이 될 것이다. 충분히 [잘 정의된 구조]와 [타당한 측정]으로, 순수한 [관측 데이터로부터 인과 관계를 추론]할 수도 있다(예: Eronen, 2020; Roher, 2018 참조). 심리학적 원인을 찾는 문제에 대한 또 다른 가능한 반응은, 예를 들어, 현상으로부터 추출된 추상적 기능 원리의 형태로 [비인과 이론noncausal theory]을 개발하는 것이지만, [비인과 이론]이 진정으로 설명될 수 있는지는 현재 진행 중인 논쟁의 문제이다.

In the long run, this will also help with the problem of causal inference, as having clearly defined and clearly measurable constructs makes it easier to perform targeted interventions and to track their effects. With sufficiently well-defined constructs and valid measurements, it may also be possible to eventually infer causal relationships from purely observational data (for more, see, e.g., Eronen, 2020; Rohrer, 2018). Another possible reaction to the problem of finding psychological causes is to develop noncausal theories, for example, in the form of abstract functional principles extracted from phenomena (De Houwer, 2011; Hughes et al., 2016), although whether noncausal theories can be truly explanatory is a matter of ongoing debate (see, e.g., Reutlinger & Saatsi, 2018).

다행히도, 우리가 위에서 설명한 좋은 관행을 예시하는 심리학의 지속적인 연구 프로그램들이 있다. 예를 들어, 최근 [자아 고갈 연구]에서 실망한 이후, [자기 통제 및 관련 개념]과 같은 핵심 구조를 더 잘 정의하고 이를 측정하는 다양한 방법을 검증하려는 노력이 증가하고 있다. 더 넓은 예는 먼저 [환경-행동 관계(강력한 현상)]를 확립한 후 [매개자 역할]을 하는 명확하게 정의된 정신적 구조의 관점에서 이에 대한 설명을 공식화하는 것을 목표로 하는 기능-인지 패러다임이다. 마지막으로, 보다 구체적인 예로서, Robinaugh 외 연구진(2020)은 이러한 특정 장애에 맞춤화되어 현상에 의해 제약을 받는 공황 장애에 대한 이론을 제안하고, 저자들은 또한 핵심 개념을 정의하는 데 명시적으로 초점을 맞추고 있다.
Fortunately, there are ongoing research programs in psychology that exemplify the good practices we have describe above. For example, after the recent disappointments in ego-depletion research, there are now increasing efforts to better define the key constructs, such as self-control and related concepts, and to validate different ways of measuring them (Friese et al., 2019; Inzlicht & Friese, 2019; Lurquin & Miyake, 2017). A broader example is the functional-cognitive paradigm (De Houwer, 2011; Hughes et al., 2016) that aims at first establishing environment-behavior relations (robust phenomena) and then formulating explanations for them in terms of clearly defined mental constructs that act as mediators. Finally, as a more concrete example, Robinaugh et al. (2020) propose a theory for panic disorder that is tailored to this specific disorder and thereby constrained by phenomena (there is robust evidence for many central phenomena related to panic attacks), and the authors also explicitly focus on defining the key concepts.


결론적으로, 우리는 이론 위기의 근저에 있는 가장 근본적인 요인은 주제 그 자체인 심리학이 좋은 이론을 개발하는 것을 매우 어렵게 만든다는 것이라고 믿는다(Meehl, 1978). 현대 과학 철학을 바탕으로, 우리는 심리학적 이론을 발전시키기 위한 세 가지 핵심 과제에 대해 논의했습니다. 이론을 제약할 만큼 [강력한 현상]이 없는 경우가 많고, [구인를 정의하고 검증]하는 데 충분한 주의를 기울이지 않으며, 심리적 [원인을 규명]하는 것은 매우 어렵다. 우리는 이 기사가 이러한 중요한 문제들에 더 많은 관심을 가져옴으로써 심리학의 이론적 토대를 위한 보다 견고한 구성 요소를 제공하는 데 도움이 되기를 바란다.

To conclude, we believe that the most fundamental factor underlying the theory crisis is that the subject matter itself, psychology, makes it very hard to develop good theories (https://doi.org/10.1037/0022-006X.46.4.806" data-mce-href="https://journals.sagepub.com/doi/10.1177/1745691620970586#">Meehl, 1978). Drawing on contemporary philosophy of science, we have discussed three central challenges to developing psychological theories: There are often not enough robust phenomena to constrain theories, not enough attention is paid to defining and validating constructs, and establishing psychological causes is very hard. We hope that this article brings more attention to these crucial issues and thereby helps to provide more solid building blocks for the theoretical foundations of psychology.

 

 


Perspect Psychol Sci. 2021 Jul;16(4):779-788. doi: 10.1177/1745691620970586. Epub 2021 Jan 29.

The Theory Crisis in Psychology: How to Move Forward

Affiliations collapse

Affiliations

1Department of Theoretical Philosophy.

2Department of Psychometrics and Statistics, University of Groningen.

PMID: 33513314

PMCID: PMC8273366

DOI: 10.1177/1745691620970586

Free PMC article

Abstract

Meehl argued in 1978 that theories in psychology come and go, with little cumulative progress. We believe that this assessment still holds, as also evidenced by increasingly common claims that psychology is facing a "theory crisis" and that psychologists should invest more in theory building. In this article, we argue that the root cause of the theory crisis is that developing good psychological theories is extremely difficult and that understanding the reasons why it is so difficult is crucial for moving forward in the theory crisis. We discuss three key reasons based on philosophy of science for why developing good psychological theories is so hard: the relative lack of robust phenomena that impose constraints on possible theories, problems of validity of psychological constructs, and obstacles to discovering causal relationships between psychological variables. We conclude with recommendations on how to move past the theory crisis.

Keywords: causation; phenomena; robustness; theory; validity.

 

교육적 평가의 타당화: 시뮬레이션 등을 위한 프라이머(Adv Simul (Lond). 2016)
Validation of educational assessments: a primer for simulation and beyond
David A. Cook1,2,3* and Rose Hatala4

 

 

 

좋은 평가가 중요하며 시뮬레이션이 도움이 될 수 있습니다.
Good assessment is important; simulation can help

교육자, 관리자, 연구원, 정책 입안자, 심지어 일반 대중들도 건강 전문가 평가의 중요성을 인식하고 있습니다. 역량 기반 교육, 이정표 및 숙달 학습과 같은 트렌드 주제는 성과에 대한 필수 정보를 제공하기 위해 정확하고 시기 적절하며 의미 있는 평가에 달려 있습니다. 전문 역량 평가는 교육을 넘어 임상 실습으로 점차 확대되며, 초기 및 지속적인 전문 면허 및 인증 요건에 대한 지속적인 논의가 이루어진다. 일선 교육자와 교육 연구자는 임상 및 비임상 환경에서 의료 전문가의 방어 가능한 평가를 요구합니다. 실제로, 좋은 평가에 대한 필요성은 그 어느 때보다도 컸으며 앞으로도 계속 증가할 것입니다.
Educators, administrators, researchers, policymakers, and even the lay public recognize the importance of assessing health professionals. Trending topics such as competency-based education, milestones, and mastery learning hinge on accurate, timely, and meaningful assessment to provide essential information about performance. Assessment of professional competence increasingly extends beyond training into clinical practice, with ongoing debates regarding the requirements for initial and ongoing professional licensure and certification. Front-line educators and education researchers require defensible assessments of health professionals in clinical and nonclinical settings. Indeed, the need for good assessments has never been greater and will most likely continue to grow.

직장 기반 평가가 필수적이지만 [1–3] 시뮬레이션은 안전한 환경에서 특정 주제와 기술을 목표로 삼을 수 있기 때문에 보건 전문직 평가에서 중요한 역할을 하며 앞으로도 그럴 것이다 [4–6]. 시뮬레이션에서 평가 조건은 학습자 간에 표준화될 수 있으며 질병, 임상 상황 및 합병증의 스펙트럼을 조작하여, 예를 들어 [흔하지만 중요한 작업, 자주 보이지 않는 조건, 환자를 위험에 빠뜨릴 수 있는 활동 또는 특정 감정 반응을 유발하는 상황]에 초점을 맞출 수 있다[7, 8]. 따라서 시뮬레이션 기반 평가가 점점 일반화되고 있는 것은 놀랄 일이 아니다. 2013년에 발표된 리뷰에서는 시뮬레이션 기반 평가를 평가하는 400개 이상의 연구가 확인되었으며[9] 그 수는 확실히 증가했다. 그러나 동일한 검토에서는 이러한 평가를 뒷받침하는 증거와 그러한 증거를 수집하기 위해 설계된 연구(즉, 검증 연구)에서 심각하고 빈번한 결함을 확인했다. 좋은 시뮬레이션 기반 평가의 필요성과 현재 검증 노력의 과정과 산물의 결함 사이의 차이는 검증 과학의 현재 상태에 대한 인식을 높일 필요가 있음을 시사한다.
Although workplace-based assessment is essential [13], simulation does and will continue to play a vital role in health professions assessment, inasmuch as it permits the targeting of specific topics and skills in a safe environment [46]. The conditions of assessment can be standardized across learners, and the spectrum of disease, clinical contexts, and comorbidities can be manipulated to focus on, for example, common yet critical tasks, infrequently seen conditions, activities that might put patients at risk, or situations that provoke specific emotional responses [7, 8]. Thus, it comes as no surprise that simulation-based assessment is increasingly common. A review published in 2013 identified over 400 studies evaluating simulation-based assessments [9], and that number has surely grown. However, that same review identified serious and frequent shortcomings in the evidence supporting these assessments, and in the research studies designed to collect such evidence (i.e., validation studies). The gap between the need for good simulation-based assessment and the deficiencies in the process and product of current validation efforts suggests the need for increased awareness of the current state of the science of validation.

이 기사의 목적은 교육자와 교육 연구자를 위한 평가 검증에 대한 입문서를 제공하는 것입니다. 우리는 건강 전문가에 대한 시뮬레이션 기반 평가의 맥락에 중점을 두지만, 이 원칙은 다른 평가 접근법과 주제에도 광범위하게 적용된다고 믿는다.
The purpose of this article is to provide a primer on assessment validation for educators and education researchers. We focus on the context of simulation-based assessment of health professionals but believe the principles apply broadly to other assessment approaches and topics.

타당화는 프로세스입니다.
Validation is a process

[타당화]는 [평가 결과에 기초하여 해석, 사용 및 결정의 적절성을 평가하기 위해 타당성 증거를 수집하는 과정]을 의미한다[10]. 이 정의는 몇 가지 중요한 점을 강조합니다.
Validation refers to the process of collecting validity evidence to evaluate the appropriateness of the interpretations, uses, and decisions based on assessment results [10]. This definition highlights several important points. 

첫째, 검증은 엔드포인트가 아닌 프로세스입니다. 평가에 "타당화됨"이라는 라벨을 붙이는 것은 타당화 검사 프로세스가 적용되었다는 것, 즉 증거가 수집되었다는 것만을 의미하며, 다음의 것들은 알려주지 않는다. 

  • 어떤 프로세스가 사용되었는가,
  • 증거의 방향 또는 크기는 어떠한가(즉, 유리한가, 불리한가, 어느 정도까지 사용되었는가?), 
  • 어떤 gap이 남아 있는가, 또는 
  • 어떤 맥락(집단, 학습 목표, 교육적 설정)에 대한 증거.

First, validation is a process not an endpoint. Labeling an assessment as “validated” means only that the validation process has been applied—i.e., that evidence has been collected. It does not tell us

  • what process was used,
  • the direction or magnitude of the evidence (i.e., was it favorable or unfavorable and to what degree?),
  • what gaps remain, or
  • for what context (learner group, learning objectives, educational setting) the evidence is relevant.

둘째, 타당화는 다음 절에서 논의한 바와 같이 타당성 증거 수집을 포함한다.
Second, validation involves the collection of validity evidence, as we discuss in a following section.

셋째, 타당화와 타당성은 궁극적으로 (이러한 수치 점수 또는 서술적 의견[11]과 같은) 평가 데이터의 특정 해석 또는 사용을 의미하며, 이 해석에 근거한 결정을 의미한다. 우리는 임상 의학에서의 진단 테스트와 유추를 통해 이 점을 설명하는 것이 도움이 된다는 것을 발견했다[12]. 임상시험은 (a) 시험이 결정에 영향을 미치고 (b) 이러한 결정이 조치 또는 환자 결과에 의미 있는 변화를 가져오는 정도까지만 유용하다. 따라서, 의사들은 종종 "만약 그것이 환자 관리에 변화를 주지 않는다면 검사를 지시하지 말라"고 가르친다. 예를 들어, 전립선특이항원(PSA) 검사는 신뢰성이 높고 전립선암과 강하게 연관돼 있다. 그러나 전립선암 검진은 암이 없을 때 상승하는 경우가 많고, 검사가 불필요한 전립선 생체검사와 환자의 불안감을 유발하며, 종종 발견되는 암을 치료해도 임상 결과가 개선되지 않기 때문에 더 이상 널리 권장되지 않는다. (즉, 치료가 필요하지 않음). 즉, 많은 환자에서 부정적인/유해한 결과가 시험(검진)의 유익한 결과보다 크다[13–15].

Third, validation and validity ultimately refer to a specific interpretation or use of assessment data, be these numeric scores or narrative comments [11], and to the decisions grounded in this interpretation. We find it helpful to illustrate this point through analogy with diagnostic tests in clinical medicine [12]. A clinical test is only useful to the degree that (a) the test influences decisions, and (b) these decisions lead to meaningful changes in action or patient outcomes. Hence, physicians are often taught, “Don’t order the test if it won’t change patient management.” For example, the prostate-specific antigen (PSA) test has high reliability and is strongly associated with prostate cancer. However, this test is no longer widely recommended in screening for prostate cancer because it is frequently elevated when no cancer is present, because testing leads to unnecessary prostate biopsies and patient anxiety, and because treating cancers that are found often does not improve clinical outcomes (i.e., treatment is not needed). In other words, the negative/harmful consequences outweigh the beneficial consequences of testing (screening) in many patients [1315]. 

그러나 PSA 검사는 전립선암을 진단하고 치료한 후에도 여전히 질병의 지표로 유용하다. 이 예를 교육 테스트(평가)와 의사 결정의 중요성에 반영하면 이러하다.

  • (1) 만약 그것이 관리management를 바꾸지 않는다면, 시험을 하지 말아야 한다. 
  • (2) 하나의 목표 또는 설정에 유용한 시험은 다른 맥락에서 덜 유용할 수 있다. 
  • (3) 시험의 전반적인 유용성을 결정할 때 시험의 장기적인 결과와 다운스트림 결과를 고려해야 한다.

However, PSA testing is still useful as a marker of disease once prostate cancer has been diagnosed and treated. Reflecting this example back to educational tests (assessments) and the importance of decisions:

  • (1) if it will not change management the test should not be done,
  • (2) a test that is useful for one objective or setting may be less useful in another context, and
  • (3) the long-term and downstream consequences of testing must be considered in determining the overall usefulness of the test.

평가 타당화가 중요한 이유는 무엇입니까?
Why is assessment validation important?

교육적 평가에 대한 엄격한 타당화는 최소한 두 가지 이유로 매우 중요하다.
Rigorous validation of educational assessments is critically important for at least two reasons. 

첫째, 평가를 사용하는 사람들은 결과를 신뢰할 수 있어야 한다. 유효성 확인은 신뢰도(유효성)에 관한 간단한 예스/노 답변을 제공하지 않습니다. 오히려, 신뢰도나 타당성의 판단은 의도된 적용과 맥락에 따라 달라지며 일반적으로 정도의 문제이다. 타당화는 그러한 [판단]과 [남아있는 격차gaps]에 대한 비판적 평가를 할 수 있는 증거를 제공한다.
First, those using an assessment must be able to trust the results. Validation does not give a simple yes/no answer regarding trustworthiness (validity); rather, a judgment of trustworthiness or validity depends on the intended application and context and is typically a matter of degree. Validation provides the evidence to make such judgments and a critical appraisal of remaining gaps.

둘째, 새로운 객관식 문제, 척도 항목 또는 시험장이 사실상의 새로운 도구를 만들기 때문에 평가 도구, 도구 및 활동의 수는 본질적으로 [무한]하다. 그러나 주어진 교육자에게 평가가 필요한 관련 과제와 구성은 [유한]하다. 따라서 각 교육자는 자신의 즉각적인 요구에 가장 잘 맞는 평가 솔루션을 식별하기 위해 무수한 가능성을 분류하고 선별할 수 있는 정보가 필요합니다. 잠재적 해결책으로는 기존 평가도구 선택, 기존 평가도구 적응, 여러 평가도구의 요소 결합 또는 새로운 평가도구를 새로 생성 등이 있습니다 [16]. 교육자는 점수의 신뢰도뿐만 아니라 시험 시행과 관리 과정에서 발생하는 비용, 수용성, 타당성 등 물류 및 실무적 이슈에 대한 정보가 필요하다.
Second, the number of assessment instruments, tools, and activities is essentially infinite, since each new multiple-choice question, scale item, or exam station creates a de facto new instrument. Yet, for a given educator, the relevant tasks and constructs in need of assessment are finite. Each educator thus needs information to sort and sift among the myriad possibilities to identify the assessment solution that best meets his or her immediate needs. Potential solutions include selecting an existing instrument, adapting an existing instrument, combining elements of several instruments, or creating a novel instrument from scratch [16]. Educators need information regarding not only the trustworthiness of scores, but also the logistics and practical issues such as cost, acceptability, and feasibility that arise during test implementation and administration.

또한 시뮬레이션 기반 평가는 그 정의상 "의미 있는meaningful" 임상 또는 교육적 결과의 대체물surrogate로 사용된다[17]. 우리는 [학습자들이 시뮬레이션된 환경에서 얼마나 잘 수행하는지]를 알고 싶은 것이 아니다; 우리는 그들이 실제 생활에서 어떻게 수행하는지 알고 싶다. 타당화에 대한 포괄적인 접근법에는 평가 결과가 다른 설정과 결과에 추정하는 정도를 평가하는 것이 포함된다[18, 19].
In addition, simulation-based assessments are almost by definition used as surrogates for a more “meaningful” clinical or educational outcome [17]. Rarely do we actually want to know how well learners perform in a simulated environment; usually, we want to know how they would perform in real life. A comprehensive approach to validation will include evaluating the degree to which assessment results extrapolate to different settings and outcomes [18, 19].

타당성 증거란 무엇을 의미하는가?
What do we mean by validity evidence?

[고전적인 타당화 프레임워크]는 적어도 세 가지 다른 "유형"의 타당성을 식별했다: 내용, 구성, 준거. 표 1을 참조하십시오. 그러나 이러한 관점은 보다 미묘하면서도 통일된 실용적 타당성 관점으로 대체되었다[10, 12, 20]. 현대의 틀은 타당성을 [가설]로 보고, 연구자가 [연구 가설]을 지지하거나 반박하기 위해 증거를 수집하는 것처럼, 타당성 증거는 [타당성 가설]을 지지하거나 반박하기 위해 수집된다. 가설을 절대 증명할 수 없듯이, 타당성은 절대 증명할 수 없다. 그러나 증거가 축적됨에 따라 [타당성 주장을 지지하거나 반박]할 수 있다.

Classical validation frameworks identified at least three different “types” of validity: contentconstruct, and criterion; see Table 1. However, this perspective has been replaced by more nuanced yet unified and practical views of validity [10, 12, 20]. Contemporary frameworks view validity as a hypothesis, and just as a researcher would collect evidence to support or refute a research hypothesis, validity evidence is collected to support or refute the validity hypothesis (more commonly referred to as the validity argument). Just as one can never prove a hypothesis, validity can never be proven; but evidence can, as it accumulates, support or refute the validity argument.

최초의 현대적 타당성 프레임워크는 1989년 Messick에 의해 제안되었고 [21] 1999년 [22] 그리고 2014년 [23]에 이 분야의 표준으로 채택되었다. 이 프레임워크는 고전적 프레임워크와 부분적으로 중복되는 다섯 가지 타당성 증거의 출처를 제안한다[24–26]. (표 2 참조)

  • 콘텐츠 증거(콘텐츠 유효성의 개념과 본질적으로 동일)는 평가 항목(시나리오, 질문 및 응답 옵션 포함)이 측정하고자 하는 구성을 반영하도록 하기 위해 취한 단계를 말한다.
  • 내부 구조 증거는 신뢰성, 도메인 또는 요인 구조, 항목 난이도 등 개별 평가 항목과 주요 구성 요소 간의 관계를 평가한다.
  • 다른 변수와의 관계 증거는 평가 결과와 다른 측정 또는 학습자 특성 사이의 연관성을 긍정 또는 부정, 강 또는 약하게 평가한다. 이것은 준거criterion 타당성과 구성construct 타당성에 대한 고전적인 개념과 밀접하게 일치한다.
  • 반응 프로세스 증거는 문서화된 레코드(응답, 등급 또는 자유 텍스트 서술)가 관찰된 성능을 얼마나 잘 반영하는지 평가합니다. 응답 품질을 방해할 수 있는 문제에는 제대로 훈련되지 않은 평가자, 저품질 비디오 녹화, 부정행위 등이 포함된다.
  • 결과 증거는 유익하거나 유해한 평가 자체와 그 결과로 발생하는 결정과 조치의 영향을 살펴봅니다 [27–29].

The first contemporary validity framework was proposed by Messick in 1989 [21] and adopted as a standard for the field in 1999 [22] and again in 2014 [23]. This framework proposes five sources of validity evidence [2426] that overlap in part with the classical framework (see Table 2). 

  • Content evidence, which is essentially the same as the old concept of content validity, refers to the steps taken to ensure that assessment items (including scenarios, questions, and response options) reflect the construct they are intended to measure. 
  • Internal structure evidence evaluates the relationships of individual assessment items with each other and with the overarching construct(s), e.g., reliability, domain or factor structure, and item difficulty. 
  • Relationships with other variables evidence evaluates the associations, positive or negative and strong or weak, between assessment results and other measures or learner characteristics. This corresponds closely with classical notions of criterion validity and construct validity. 
  • Response process evidence evaluates how well the documented record (answer, rating, or free-text narrative) reflects the observed performance. Issues that might interfere with the quality of responses include poorly trained raters, low-quality video recordings, and cheating. 
  • Consequences evidence looks at the impact, beneficial or harmful, of the assessment itself and the decisions and actions that result [2729].

교육자와 연구자는 평가 및 해당 결정과 가장 관련이 있는 증거를 확인한 후 이 증거를 수집하고 평가하여 타당성 주장을 공식화해야 한다. 불행하게도, 이 "5가지 근거 소스" 프레임워크는 증거 사이의 우선 순위를 정하거나, 증거를 선택하는 데 있어 불완전한 지침만을 제공한다.
Educators and researchers must identify the evidence most relevant to their assessment and corresponding decision, then collect and appraise this evidence to formulate a validity argument. Unfortunately, the “five sources of evidence” framework provides incomplete guidance in such prioritization or selection of evidence.

Kane의 최신 유효성 프레임워크는 평가 활동에서 4가지 주요 추론을 식별함으로써 우선순위 부여 문제를 다룬다(표 3). 고전적 또는 5가지 증거 소스 프레임워크에 익숙한 사람들에게 케인의 프레임워크는 용어와 개념이 완전히 새로워 처음에는 종종 도전적이다. 사실, 이 프레임워크를 학습할 때, 우리는 이전 프레임워크의 개념과 일치하려고 시도하지 않는 것이 도움이 된다는 것을 발견했다. 오히려, 우리는 모든 평가 활동에 관련된 단계들을 개념적으로 고려하는 것으로 혁신을 시작한다.
The most recent validity framework, from Kane [10, 12, 30], addresses the issue of prioritization by identifying four key inferences in an assessment activity (Table 3). For those accustomed to the classical or five-evidence-sources framework, Kane’s framework is often challenging at first because the terminology and concepts are entirely new. In fact, when learning this framework, we have found that it helps to not attempt to match concepts with those of earlier frameworks. Rather, we begin de novo by considering conceptually the stages involved in any assessment activity.

평가는 객관식 시험 항목에 대한 답변, 실제 또는 표준화된 환자 인터뷰 또는 절차적 작업 수행과 같은 일종의 [수행performance]으로 시작한다.

  • 이 관찰에 기초하여, 우리가 성능 수준을 반영한다고 가정하는 점수 또는 서면 서술이 문서화됩니다. 
  • 여러 점수 또는 서술이 결합되어 시험 환경에서 수행능력을 반영한다고 가정하는 전체 점수 또는 해석을 생성합니다. 
  • 시험 환경에서의 수행능력은 실제 환경에서 원하는 성능을 반영하는 것으로 가정한다. 
  • 그리고 그 성과는 의미 있는 결정을 내리기 위한 합리적인 근거를 구성한다고 가정한다(그림 1 참조).

An assessment starts with a performance of some kind, such as answering a multiple-choice test item, interviewing a real or standardized patient, or performing a procedural task.

  • Based on this observation, a score or written narrative is documented that we assume reflects the level of performance;
  • several scores or narratives are combined to generate an overall score or interpretation that we assume reflects the desired performance in a test setting;
  • the performance in a test setting is assumed to reflect the desired performance in a real-life setting; and
  • that performance is further assumed to constitute a rational basis for making a meaningful decision (see Fig. 1).

이러한 가정들 각각은 실제로 정당화될 수 없는 추론을 나타낸다.

  • 성과의 문서화가 부정확할 수 있다. (점수 추론)
  • 개별 점수의 합성은 원하는 시험 영역에 걸쳐 수행능력을 정확하게 반영하지 못할 수 있다(일반화 추론). 
  • 합성 점수는 또한 실제 수행능력을 반영하지 않을 수 있다(외삽 추론). 
  • 이 성능(시험 설정 또는 실제)은 원하는 결정을 위한 적절한 기반을 형성하지 못할 수 있다. (함의 또는 결정 추론)

Each of these assumptions represents an inference that might not actually be justifiable.

  • The documentation of performance (scoring inference) could be inaccurate;
  • the synthesis of individual scores might not accurately reflect performance across the desired test domains (generalization inference);
  • the synthesized score also might not reflect real-life performance (extrapolation inference); and
  • this performance (in a test setting or real life) might not form a proper foundation for the desired decision (implications or decision inference).

케인의 타당성 프레임워크는 이 네 가지 추론에 대한 정당성을 명시적으로 평가한다. 우리는 케인의 프레임워크에 대해 더 알고 싶은 사람들을 그의 설명[10, 30]과 그의 최근 작품 개요[12]에 언급한다.

Kane’s validity framework explicitly evaluates the justifications for each of these four inferences. We refer those wishing to learn more about Kane’s framework to his description [10, 30] and to our recent synopsis of his work [12].

교육자들과 연구원들은 종종 얼마나 많은 타당성 증거가 필요한지 그리고 새로운 맥락에서 도구를 사용할 때 이전 검증의 증거가 어떻게 적용되는지 묻는다. 불행하게도, 이러한 질문에 대한 대답은 잘못된 결정의 위험성(즉, 평가의 "부담stakes"), 의도된 사용 및 상황적 차이의 크기와 중요성을 포함한 몇 가지 요인에 따라 달라진다. 모든 평가가 중요해야 하지만, 일부 평가 결정은 다른 평가보다 학습자의 삶에 더 많은 영향을 미친다. 연구 목적으로 사용되는 평가를 포함하여 더 큰 영향력 또는 더 큰 위험성을 가진 평가는 증거의 양, 품질 및 범위에 대해 더 높은 기준을 가질 가치가 있다. 엄밀히 말하면, 타당성 증거는 그것이 수집된 목적, 맥락 및 학습자 그룹에만 적용된다. 기존 증거는 평가 접근법의 선택을 안내할 수 있지만 향후 해석과 사용을 지지하지는 않는다

Educators and researchers often ask how much validity evidence is needed and how the evidence from a previous validation applies when an instrument is used in a new context. Unfortunately, the answers to these questions depend on several factors including the risk of making a wrong decision (i.e., the “stakes” of the assessment), the intended use, and the magnitude and salience of contextual differences. While all assessments should be important, some assessment decisions have more impact on a learner’s life than others. Assessments with higher impact or higher risk, including those used for research purposes, merit higher standards for the quantity, quality, and breadth of evidence. Strictly speaking, validity evidence applies only to the purpose, context, and learner group in which it was collected; existing evidence might guide our choice of assessment approach but does not support our future interpretations and use.

물론, 현실에서, 우리는 타당성 주장을 구성할 때 기존 증거를 일상적으로 고려한다. 오래된 증거가 새로운 상황에 적용되는지 여부는 상황 차이가 증거의 관련성에 어떻게 영향을 미칠 수 있는지에 대한 비판적인 평가를 필요로 한다. 예를 들어,

  • 체크리스트의 일부 항목은 서로 다른 직무에 걸쳐 관련될 수 있는 반면, 다른 항목은 직무에 특정적일 수 있다.
  • 신뢰성은 그룹마다 크게 다를 수 있으며, 일반적으로 더 동질적인 학습자 사이에서 더 낮은 값을 갖는다. 
  • [맥락의 차이(입원 환자 대 외래 환자), 학습자 수준(의대학생 대 시니어 전공의), 목적]의 차이가 내용, 다른 변수와의 관계 또는 결과에 대한 우리의 해석에 영향을 미칠 수 있다. 

Of course, in practice, we routinely consider existing evidence in constructing a validity argument. Whether old evidence applies to a new situation requires a critical appraisal of how situational differences might influence the relevance of the evidence. For example,

  • some items on a checklist might be relevant across different tasks while others might be task-specific;
  • reliability can vary substantially from one group to another, with typically lower values among more homogeneous learners; and
  • differences in context (inpatient vs outpatient), learner level (junior medical student vs senior resident), and purpose might affect our interpretation of evidence of content, relations with other variables, or consequences.

우리의 것과 유사한 맥락에서 수집된 증거와 다양한 맥락에서 일관된 발견은 우리의 타당성 주장을 구성하는 데 기존 증거를 포함하려는 우리의 선택을 뒷받침할 것이다.
Evidence collected in contexts similar to ours and consistent findings across a variety of contexts will support our choice to include existing evidence in constructing our validity argument.

타당성 논쟁은 무엇을 의미합니까?
What do we mean by validity argument?

케인은 네 가지 핵심 추론을 명확히 하는 것 외에도 사전 "해석-사용 주장argument" 또는 "IUA"와 최종 "타당성 주장"이라는 두 가지 뚜렷한 논쟁 단계를 강조함으로써 검증 과정에서 "주장"에 대한 우리의 이해를 진전시켰다.

In addition to clarifying the four key inferences, Kane has advanced our understanding of “argument” in the validation process by emphasizing two distinct stages of argument: an up-front “interpretation-use argument” or “IUA,” and a final “validity argument.”

위에서 언급한 바와 같이, 모든 해석과 사용(즉, 결정)은 다수의 가정을 수반한다. 예를 들어 가상 현실 평가의 점수를 해석할 때 시각적 표현, 시뮬레이터 제어 및 작업 자체를 포함한 시뮬레이션 작업이 임상적으로 중요한 작업과 관련이 있다고 가정할 수 있다. 

  • 채점 알고리즘이 해당 작업의 중요한 요소를 설명하는지 여부 
  • 교육자 성과를 신뢰성 있게 측정하기에 충분한 과제와 과제 간 다양성이 있는지 여부 
  • 훈련생들이 목표 점수를 달성할 때까지 계속 연습하도록 하는 것이 유익한지 여부

As noted above, all interpretations and uses—i.e., decisions—incur a number of assumptions. For example, in interpreting the scores from a virtual reality assessment, we might assume that the simulation task—including the visual representation, the simulator controls, and the task itself—has relevance to tasks of clinical significance;

  • that the scoring algorithm accounts for important elements of that task;
  • that there are enough tasks, and enough variety among tasks, to reliably gauge trainee performance; and
  • that it is beneficial to require trainees to continue practicing until they achieve a target score.

이러한 가정들은 테스트할 수 있고 테스트해야 합니다! 많은 가정이 암묵적이며 증거를 수집하거나 조사하기 전에 이를 인식하고 명시적으로 진술하는 것이 필수적인 단계이다. 의도된 용도를 지정했으면 다음을 수행해야 합니다.

  • (a) 가능한 한 많은 [가정을 확인]한다. 
  • (b) 가장 우려되거나 의심스러운 [가정에 우선 순위]를 매긴다. 
  • (c) 각 가정의 정확성을 확인하거나 반박할 [증거를 수집하는 계획]을 세우다 

그 결과 우선 순위화된 가정과 원하는 증거 목록이 [해석-사용 주장]을 구성한다. 해석-사용 주장을 명시하는 것은 연구 가설을 진술하고 그 가설을 경험적으로 검증하는 데 필요한 증거를 명확히 하는 것과 개념적으로나 중요하다.

These and other assumptions can and must be tested! Many assumptions are implicit, and recognizing and explicitly stating them before collecting or examining the evidence is an essential step. Once we have specified the intended use, we need to

  • (a) identify as many assumptions as possible,
  • (b) prioritize the most worrisome or questionable assumptions, and
  • (c) come up with a plan to collect evidence that will confirm or refute the correctness of each assumption.

The resulting prioritized list of assumptions and desired evidence constitute the interpretation-use argument. Specifying the interpretation-use argument is analogous both conceptually and in importance to stating a research hypothesis and articulating the evidence required to empirically test that hypothesis.

일단 평가 계획이 구현되고 증거가 수집되면, 우리는 증거를 합성하고, 이러한 발견을 원래의 해석-사용 논쟁에서 예상한 것과 대조하고, 강점과 약점을 식별하고, 이것을 [최종 타당성 주장]으로 증류한다. 타당성 주장은 해석과 용도가 실제로 방어할 수 있다는 것(또는 중요한 갭이 남아 있다는 것)을 다른 사람들에게 설득하려고 시도하지만, [잠재적 사용자들]은 [근거의 충분성]과 [bottom-line 평가]의 정확성에 관한 자신의 결론에 도달할 수 있어야 한다. 우리의 일은 변호사가 배심원 앞에서 사건을 주장하는 것과 비슷하다. 우리는 전략적으로 증거를 찾고 정리하고 해석하며 정직하고 완전하며 설득력 있는 주장을 제시하지만, 궁극적으로 의도된 사용과 맥락에 대한 타당성에 대한 판단을 내리는 것은 [잠재적 사용자]라는 "배심원jury"이다. [31]

Once the evaluation plan has been implemented and evidence has been collected, we synthesize the evidence, contrast these findings with what we anticipated in the original interpretation-use argument, identify strengths and weaknesses, and distill this into a final validity argument. Although the validity argument attempts to persuade others that the interpretations and uses are indeed defensible—or that important gaps remain—potential users should be able to arrive at their own conclusions regarding the sufficiency of the evidence and the accuracy of the bottom-line appraisal. Our work is similar to that of an attorney arguing a case before a jury: we strategically seek, organize, and interpret the evidence and present an honest, complete, and compelling argument, yet it is the “jury” of potential users that ultimately passes judgment on validity for their intended use and context. [31]

단일 연구가 특정 결정을 뒷받침하는 데 필요한 모든 타당성 증거를 수집할 가능성은 낮다. 오히려, 다른 연구는 일반적으로 논쟁의 다른 측면을 다룰 것이며, 교육자들은 그들의 맥락과 필요에 대한 평가 도구를 선택할 때 [증거의 전체성totality]을 고려할 필요가 있다.
It is unlikely that any single study will gather all the validity evidence required to support a specific decision. Rather, different studies will usually address different aspects of the argument, and educators need to consider the totality of the evidence when choosing an assessment instrument for their context and needs.

물론, 연구원들이 단순히 증거를 수집하는 것만으로는 충분하지 않다. 중요한 것은 증거의 양뿐만 아니라 관련성, 품질 및 폭이다. 점수 신뢰성에 대한 풍부한 증거를 수집한다고 해서 내용, 관계 또는 결과에 대한 증거가 필요하지 않습니다. 반대로, 기존의 증거가 견고하고 엄격한 항목 개발 과정과 같이 우리의 맥락에 논리적으로 적용될 수 있다면, 그러한 노력을 복제하는 것이 최우선 순위가 아닐 수 있다. 불행하게도, 연구자들은, 종종 가정의 중요성을 의도적으로 우선시하지 못하거나 [해석-사용 주장]을 완전히 건너뛰기 때문에, 가장 중요한 가정보다는 시험하기 쉬운 가정에 대한 증거를 보고할 수 있다.
Of course, it is not enough for researchers to simply collect any evidence. It is not just the quantity of evidence that matters, but also the relevance, quality, and breadth. Collecting abundant evidence of score reliability does not obviate the need for evidence about content, relationships, or consequences. Conversely, if existing evidence is robust and logically applicable to our context, such as a rigorous item development process, then replicating such efforts may not be top priority. Unfortunately, researchers often inadvertently fail to deliberately prioritize the importance of the assumptions or skip the interpretation-use argument altogether, which can result in reporting evidence for assumptions that are easy to test rather than those that are most critical.

검증에 대한 실용적인 접근 방식
A practical approach to validation

위의 개념들은 검증 과정을 이해하는 데 필수적이지만, 이 과정을 실용적인 방법으로 적용할 수 있는 것도 중요하다. 표 4에는 위에서 설명한 타당성 프레임워크(클래식, 메식 또는 케인)와 함께 작동할 수 있는 검증에 대한 하나의 가능한 접근법이 요약되어 있다. 이 섹션에서는 가상 시뮬레이션 기반 예를 사용하여 이 접근 방식을 설명합니다.
Although the above concepts are essential to understanding the process of validation, it is also important to be able to apply this process in practical ways. Table 4 outlines one possible approach to validation that would work with any of the validity frameworks described above (classical, Messick, or Kane). In this section, we will illustrate this approach using a hypothetical simulation-based example.

 

파트 태스크 트레이너를 사용하여 1학년 내과 레지던트에게 요추 천자(LP)를 가르치고 있다고 상상해 보십시오. 교육 세션이 끝나면 학습자가 실제 환자와 함께 안전하게 LP를 시도할 준비가 되어 있는지 평가하고자 합니다.
Imagine that we are teaching first year internal medicine residents lumbar puncture (LP) using a part-task trainer. At the end of the training session, we wish to assess whether the learners are ready to safely attempt an LP with a real patient under supervision.

 

1. 구성 및 제안된 해석을 정의합니다.
1.Define the construct and proposed interpretation

타당화는 관심 구인을 고려하는 것으로 시작한다. 예를 들어, 우리는 LP 표시와 위험에 대한 학습자의 지식, LP 수행 능력 또는 LP를 시도할 때 비기술적 기술에 관심이 있는가? 이들은 각각 다른 평가 도구를 선택해야 하는 서로 다른 구인이다. 지식을 평가하기 위해 객관식 질문(MCQ)을 선택할 수도 있고, 부분 작업 트레이너를 사용하여 절차적 스킬을 평가하기 위한 일련의 스킬 스테이션(OSATS) [32] 또는 소생 시나리오를 사용하여 선택할 수도 있습니다. 충실도가 높은 마네킹과 비기술적 기술(NOTECHS) 척도로 비기술적 기술을 평가하기 위한 공급자 팀[33].
Validation begins by considering the construct of interest. For example, are we interested in the learners’ knowledge of LP indications and risks, their ability to perform LP, or their non-technical skills when attempting an LP? Each of these is a different construct requiring selection of a different assessment tool: we might choose multiple-choice questions (MCQs) to assess knowledge, a series of skill stations using a part-task trainer to asses procedural skill with an Objective Structured Assessment of Technical Skills (OSATS) [
32], or a resuscitation scenario using a high-fidelity manikin and a team of providers to assess non-technical skills with the Non-Technical Skills (NOTECHS) scale [33]


우리의 예에서, [구인]은 "LP 기술"이고 [해석]은 "학습자는 실제 환자에게 감독된 LP를 시도하기에 충분한 기본적인 LP 기술을 가지고 있다"는 것이다.
In our example, the construct is “LP skill” and the interpretation is that “learners have fundamental LP skills sufficient to attempt a supervised LP on a real patient.”

2. 의도된 결정을 명시합니다.
2.Make explicit the intended decision(s)

그러한 해석에 기초하여 [우리가 내릴 것으로 예상되는 결정]에 대한 명확한 생각이 없다면, 우리는 일관성 있는 타당성 주장을 만들 수 없을 것이다.
Without a clear idea of the decisions we anticipate making based on those interpretations, we will be unable to craft a coherent validity argument.

우리의 예에서, 우리의 [최우선 결정]은 [학습자가 실제 환자에게 감독된 LP를 시도할 수 있는 충분한 절차적 역량을 가지고 있는지 여부]이다. 대안적으로 고려할 수 있는 다른 결정에는 학습자에게 [피드백을 제공할 성과 지점을 식별]하거나, 학습자가 [다음 교육 단계로 승진할 수 있는지 여부]를 결정하거나, 학습자에게 [라이센스를 인증]하는 것이 포함됩니다.
In our example, our foremost decision is whether the learner has sufficient procedural competence to attempt a supervised LP on a real patient. Other decisions we might alternatively consider include identifying performance points on which to offer feedback to the learner, deciding if the learner can be promoted to the next stage of training, or certifying the learner for licensure.

3. 해석-사용 주장을 정의하고, 필요한 타당성 증거의 우선 순위를 정합니다.
3.Define the interpretation-use argument, and prioritize needed validity evidence

우리는 해석과 결정을 내릴 때, 많은 가정을 실행하며, 이것들은 검증되어야 한다. 주요 가정을 식별하고 우선 순위를 정하고 우리가 찾기를 원하는 증거를 예상하면 해석-사용 논쟁의 개요를 설명할 수 있다[30].
In making our interpretations and decisions, we will invoke a number of assumptions, and these must be tested. Identifying and prioritizing key assumptions and anticipating the evidence we hope to find allows us to outline an interpretation-use argument [30].

우리의 시나리오에서, 우리는 "합격"이 실제 환자에게 감독된 LP를 시도할 수 있는 능력을 나타내는 평가 도구를 찾고 있다. 우리는 이것이 기술 스테이션에서 학생들의 성과를 평가하는 의사를 포함할 것으로 예상한다. 이러한 맥락에 포함된 가정은 다음과 같다.

  • 스테이션은 LP 성능에 필수적인 기술(무균 기술 또는 기구 취급에 대한 일반적인 기술 대)을 테스트하도록 설정되었고,
  • 평가자가 적절하게 훈련되었으며,
  • 서로 다른 평가자도 유사한 점수를 줄 것이며,
  • 시험에서 더 높은 점수를 받은 학습자가 첫 번째 환자 대상 시도에서 더 안전하게 수행하게 될 것이다.

In our scenario, we are looking for an assessment instrument in which a “pass” indicates competence to attempt a supervised LP on a real patient. We anticipate that this will involve a physician rating student performance on a skills station. Assumptions in this context include

  • that the station is set up to test techniques essential for LP performance (vs generic skills in sterile technique or instrument handling),
  • that the rater is properly trained,
  • that a different rater would give similar scores, and
  • that learners who score higher on the test will perform more safely on their first patient attempt.

이러한 [가정을 지지하거나 반박해야 할 수 있는 증거]를 고려하고 케인의 프레임워크를 지침으로 삼아 다음과 같은 해석-사용 주장을 제안한다. 증거가 이미 수집됐는지, 직접 수집해야 할지는 현 단계에서 알 수 없지만 최소한 무엇을 찾아야 할지는 파악했다.

  • (a)점수 매기기: 성능에 대한 관찰이 일관된 숫자 점수로 올바르게 변환됩니다. 증거는 기기 내의 항목이 LP 성능과 관련이 있고 평가자가 기기 사용 방법을 이해했으며 비디오 녹화 성능이 직접적인 관찰과 유사한 점수를 산출한다는 것을 이상적으로 보여준다.
  • (b)일반화: 단일 성능의 점수는 테스트 설정의 전체 점수와 일치합니다. 증거는 우리가 성능을 적절하게 샘플링했다는 것(충분한 시뮬레이션 LP 수와 시뮬레이션된 환자 습관 변경과 같은 충분한 다양한 조건)과 성과 간 및 평가자 간(스테이션 간 및 평가자 간 신뢰성)을 이상적으로 보여줄 것이다.
  • (c)외삽: 평가 점수는 실제 성과와 관련이 있습니다. 증거는 기기의 점수가 절차 로그, 환자 부작용 사건 또는 감독자 등급과 같은 실제 상황에서 다른 LP 성능 측정과 상관관계가 있다는 것을 이상적으로 보여준다.
  • (d)함의: 평가는 학습자, 훈련 프로그램 또는 환자에게 중요하고 긍정적인 영향을 미치며 부정적인 영향은 미미합니다. 증거는 이상적으로 학생들이 평가 후에 더 준비가 되었다고 느끼고, 교정조치가 필요한 학생들은 이 시간이 충분히 소비되었다고 느끼고, 실제 환자의 LP 합병증은 시행 후 1년 동안 감소한다는 것을 보여줄 것이다.

Considering the evidence we might need to support or refute these assumptions, and using Kane’s framework as a guide, we propose an interpretation-use argument as follows. We do not know at this stage whether evidence has already been collected or if we will need to collect it ourselves, but we have at least identified what to look for.

  1. (a)Scoring: the observation of performance is correctly transformed into a consistent numeric score. Evidence will ideally show that the items within the instrument are relevant to LP performance, that raters understood how to use the instrument, and that video-recording performance yields similar scores as direct observation.
  2. (b)Generalization: scores on a single performance align with overall scores in the test setting. Evidence will ideally show that we have adequately sampled performance (sufficient number of simulated LPs, and sufficient variety of conditions such as varying the simulated patient habitus) and that scores are reproducible between performances and between raters (inter-station and inter-rater reliability).
  3. (c)Extrapolation: assessment scores relate to real-world performance. Evidence will ideally show that scores from the instrument correlate with other LP performance measures in real practice, such as procedural logs, patient adverse events, or supervisor ratings.
  4. (d)Implications: the assessment has important and favorable effects on learners, training programs, or patients, and negative effects are minimal. Evidence will ideally show that students feel more prepared following the assessment, that those requiring remediation feel this time was well spent, and that LP complications in real patients decline in the year following implementation.

우리는 타당화에서 이 처음 세 단계의 중요성을 아무리 강조해도 지나치지 않다. 제안된 해석, 의도된 결정(들) 및 가정과 그에 상응하는 증거를 명확하게 설명하는 것은 그 이후의 모든 것을 위한 단계를 집합적으로 설정한다.
We cannot over-emphasize the importance of these first three steps in validation. Clearly articulating the proposed interpretations, intended decision(s), and assumptions and corresponding evidence collectively set the stage for everything that follows.

4. 후보 평가도구 식별 및/또는 새 평가도구 생성/어댑트
4.Identify candidate instruments and/or create/adapt a new instrument

우리는 목표 구인과 개념적으로 일치하는 측정 형식을 식별한 다음, 우리의 요구에 부합하거나 적응할 수 있는 기존 도구를 검색해야 한다. 엄격한 검색은 최종 평가를 뒷받침할 내용 증거를 제공합니다. 적절한 기존 평가도구를 찾을 수 없는 경우에만 평가도구 개발을 해야 한다.
We should identify a measurement format that aligns conceptually with our target construct and then search for existing instruments that meet or could be adapted to our needs. A rigorous search provides content evidence to support our final assessment. Only if we cannot find an appropriate existing instrument would we develop an instrument de novo.

우리는 LP[34]에서 PGY-1의 절차적 역량 평가를 위한 체크리스트에 대한 설명을 찾는다. 체크리스트는 유사한 교육적 맥락에서 사용될 것이기 때문에 우리의 목적에 매우 적합한 것으로 보인다. 따라서 우리는 도구를 변경하지 않고 증거를 평가하는 작업을 계속합니다.

We find a description of a checklist for assessing PGY-1’s procedural competence in LP [34]. The checklist appears well suited for our purpose, as we will be using it in a similar educational context; we thus proceed to appraising the evidence without changing the instrument.

5.기존 증거를 평가하고 필요에 따라 새로운 증거를 수집합니다.
5.Appraise existing evidence and collect new evidence as needed

기존 증거는 그렇지 않지만, 엄밀히 말하면, 실제적인 목적을 위해 우리는 이 도구를 사용할지 여부를 결정할 때 기존 증거에 크게 의존할 것이다. 물론, 우리는 우리 자신의 증거도 수집하기를 원하겠지만, 우리는 현재 이용 가능한 것에 기초해야 한다.
Although existing evidence does not, strictly speaking apply to our situation, for practical purposes we will rely heavily on existing evidence as we decide whether to use this instrument. Of course, we will want to collect our own evidence as well, but we must base our initial adoption on what is now available.

우리는 기존의 증거를 찾는 것에서부터 타당성 주장에 대한 평가를 시작한다.

  • 원본 설명[34]은 공식적인 LP 과제 분석과 전문가 합의를 통해 체크리스트 항목의 개발을 기술함으로써 채점 증거를 제공한다.
  • 평가자 간 신뢰성이 우수하여 일반화 증거를 제공하고, 경험이 많은 거주자가 체크리스트 점수가 더 높았음을 확인함으로써 제한된 외삽 증거를 추가한다.
  • 동일하거나 약간 수정된 체크리스트를 사용한 다른 연구는 좋은 평가자 간 신뢰성으로 추가 일반화 증거를 제공하며 [35, 36] 훈련 후 점수가 더 높고 [35, 37] 계측기가 실제 환자 LP를 평가하는 데 사용될 때 중요한 학습자 오류를 식별했다는 것을 보여줌으로써 외삽 증거를 제공한다[38].
  • 또한 한 연구는 시뮬레이션 환경에서 역량을 획득하는 데 필요한 연습 시도 횟수를 계산하여 제한적인 함의 증거를 제공했다[37]. 

We begin our appraisal of the validity argument by searching for existing evidence.

  • The original description [34] offers scoring evidence by describing the development of checklist items through formal LP task analysis and expert consensus.
  • It provides generalization evidence by showing good inter-rater reliability, and adds limited extrapolation evidence by confirming that residents with more experience had higher checklist scores.
  • Other studies using the same or a slightly modified checklist provide further evidence for generalization with good inter-rater reliabilities [3536], and contribute extrapolation evidence by showing that scores are higher after training [3537] and that the instrument identified important learner errors when used to rate real patient LPs [38].
  • One study also provided limited implications evidence by counting the number of practice attempts required to attain competence in the simulation setting [37].

이러한 기존 연구에 비추어 볼 때, 우리는 이 도구를 처음 채택하기 전에 더 많은 증거를 수집할 계획을 세우지 않을 것이다. 그러나, 우리는 이행하는 동안, 특히 우리가 중요한 gap을 식별한다면, 우리 자신의 증거를 수집할 것이다. 즉, 유효성 검사 프로세스의 후반 단계에서 수집할 것이라는 의미이다.

In light of these existing studies, we will not plan to collect more evidence before our initial adoption of this instrument. However, we will collect our own evidence during implementation, especially if we identify important gaps, i.e., at later stages in the validation process; see below.

6. 비용을 포함한 실질적인 문제를 추적합니다.
6.Keep track of practical issues including cost

중요하지만 종종 제대로 평가되지 않고 연구되지 않은 검증의 측면은 개발, 구현 및 점수의 해석을 둘러싼 실제 문제와 관련이 있다. 평가 절차는 뛰어난 데이터를 산출할 수 있지만, 비용이 엄청나게 많이 들거나, 필요한 물류나 전문성이 현지의 가용 자원을 초과하는 경우 구현이 불가능할 수 있습니다.

An important yet often poorly appreciated and under-studied aspect of validation concerns the practical issues surrounding development, implementation, and interpretation of scores. An assessment procedure might yield outstanding data, but if it is prohibitively expensive or if logistical or expertise requirements exceed local resources, it may be impossible to implement.

LP 계측기의 경우, 한 연구[37]는 시뮬레이션 기반 LP 교육 및 평가 세션의 운영 비용을 추적했다. 저자들은 훈련된 비의사 평가자를 사용함으로써 비용을 줄일 수 있다고 제안했다. 우리가 그 기구를 시행하면서, 특히 새로운 타당성 증거를 수집한다면, 우리는 마찬가지로 돈, 인적 및 비인적 자원, 그리고 다른 실질적인 문제와 같은 비용을 모니터링해야 한다.
For the LP instrument, one study [37] tracked the costs of running a simulation-based LP training and assessment session; the authors suggested that costs could be reduced by using trained non-physician raters. As we implement the instrument, and especially if we collect fresh validity evidence, we should likewise monitor costs such as money, human and non-human resources, and other practical issues.

7.해석-사용 주장와 관련하여 타당성 인수를 공식화/합성합니다.
7.Formulate/synthesize the validity argument in relation to the interpretation-use argument

이제 우리는 원하는 해석과 결정(해석-사용 주장)을 뒷받침하기 위해 필요한 것으로 사전에 식별한 증거와 사용할 수 있는 증거(유효성 주장)를 비교한다.
We now compare the evidence available (the validity argument) against the evidence we identified up-front as necessary to support the desired interpretations and decisions (the interpretation-use argument).

우리는 합리적인 점수 매기기 및 일반화 증거, 외삽 증거의 차이(시뮬레이션과 실제 성능 간의 직접적인 비교가 이루어지지 않음) 및 제한된 함의 증거를 찾는다. 거의 항상 그렇듯이 해석-사용 주장과 사용 가능한 증거 사이의 일치는 완벽하지 않다. 일부 갭은 남아 있고, 일부 증거는 우리가 원하는 만큼 유리하지 않다.
We find reasonable scoring and generalization evidence, a gap in the extrapolation evidence (direct comparisons between simulation and real-world performance have not been done), and limited implications evidence. As is nearly always the case, the match between the interpretation-use argument and the available evidence is not perfect; some gaps remain, and some of the evidence is not as favorable as we might wish.

8.판단을 내리십시오. 그 증거가 의도된 사용을 뒷받침합니까?
8.Make a judgment: does the evidence support the intended use?

검증의 마지막 단계는 증거의 충분성과 적합성을 판단하는 것이다. 즉, 타당성 주장과 관련 증거가 제안된 해석-사용 주장의 요구를 충족하는지 여부.
The final step in validation is to judge the sufficiency and suitability of evidence, i.e., whether the validity argument and the associated evidence meet the demands of the proposed interpretation-use argument.

위에서 요약한 증거를 바탕으로, 우리는 타당성 주장이 그러한 해석을 뒷받침하고 합리적으로 잘 사용하고 있으며, 체크리스트는 우리의 목적에 적합한 것으로 보인다고 판단한다. 게다가, 비용은 지출된 노력에 비해 합리적인 것 같고, 우리는 평가자로서 훈련을 받기를 열망하는 시뮬레이션 실험실의 조수를 만날 수 있다.
Based on the evidence summarized above, we judge that the validity argument supports those interpretations and uses reasonably well, and the checklist appears suitable for our purposes. Moreover, the costs seem reasonable for the effort expended, and we have access to an assistant in the simulation laboratory who is keen to be trained as a rater.

우리는 또한 우리 기관에서 도구를 구현하면서 연구 연구를 수행하여 위에 언급된 증거 격차를 해소할 수 있도록 도울 계획입니다. 외삽 추론을 뒷받침하기 위해 시뮬레이션 평가의 점수를 진행 중인 작업 공간 기반 LP 평가와 상관시킬 계획이다. 또한 성과가 부진한 전공의에 대한 추가 훈련의 효과를 추적하여 시사점 추론을 다룰 것이다. 즉, 평가의 다운스트림 결과입니다. 마지막으로, 우리는 학습자 모집단의 평가자 간, 사례 간 및 내부 일관성 신뢰성을 측정하고 위에서 언급한 바와 같이 비용과 실제 문제를 모니터링할 것이다.
We also plan to help resolve the evidence gaps noted above by conducting a research study as we implement the instrument at our institution. To buttress the extrapolation inference we plan to correlate scores from the simulation assessment with ongoing workplace-based LP assessments. We will also address the implications inference by tracking the effects of additional training for poor performing residents, i.e., the downstream consequences of assessment. Finally, we will measure the inter-rater, inter-case, and internal consistency reliability in our learner population, and will monitor costs and practical issues as noted above.

 

동일한 평가도구를 다른 설정에 적용
Application of the same instrument to a different setting

사고 실험으로서, 만약 우리가 [같은 기구를 다른 목적과 결정에 사용]하기를 원한다면, 예를 들어, 신경과 수련생들이 [레지던시를 마칠 때 인증하는 고부담 시험의 일부]로서 위의 것들이 어떻게 전개될지 생각해 보자. 우리의 결정이 바뀌면, 우리의 해석-사용 주장도 바뀐다. 우리는 이제 [체크리스트의 "합격" 점수]가 [다양한 실제 환자에게 독립적으로 LP를 수행할 수 있는 능력]을 나타난대는 증거를 찾고 있을 것이다. 우리는 다른 또는 추가적인 타당성 증거를 요구할 것이다.

  • 일반화 (연령, 신체 습관 및 난이도에 영향을 미치는 기타 요인에 따라 달라지는 시뮬레이션된 환자에 대한 분석) 
  • 외삽 (시뮬레이션과 실제 성능 사이의 더 강력한 상관 관계 찾기) 및 
  • 함의 (예: 학습자를 독립적 실천을 위한 유능 또는 무능으로 정확하게 분류하고 있었다는 증거) 

As a thought exercise, let us consider how the above would unfold if we wanted to use the same instrument for a different purpose and decision, for example as part of a high-stakes exam to certify postgraduate neurologist trainees as they finish residency. As our decision changes, so does our interpretation-use argument; we would now be searching for evidence that a “pass” score on the checklist indicates competence to independently perform LPs on a variety of real patients. We would require different or additional validity evidence, with increased emphasis on

  • generalization (sampling across simulated patients that vary in age, body habitus, and other factors that influence difficulty),
  • extrapolation (looking for stronger correlation between simulation and real-life performance), and
  • implications evidence (e.g., evidence that we were accurately classifying learners as competent or incompetent for independent practice).

우리는 현재의 증거들이 이 주장을 뒷받침하지 않으며 다음 중 하나가 필요하다고 결론지어야 할 것이다. 

  • (a) 우리의 요구에 부합하는 증거를 가진 새로운 도구를 찾아라. 
  • (b) 새 도구를 만들고 처음부터 증거를 수집하기 시작합니다. 
  • (c) 공백을 메우기 위해 추가 타당성 증거를 수집합니다.

We would have to conclude that the current body of evidence does not support this argument and would need to either

  • (a) find a new instrument with evidence that meets our demands,
  • (b) create a new instrument and start collecting evidence from scratch, or
  • (c) collect additional validity evidence to fill in the gaps.

이 사고 연습은 두 가지 중요한 점을 강조한다. 첫째, 의사 결정이 변경될 때 해석-사용 주장이 변경될 수 있다. 둘째, 기구 자체는 "유효"하지 않다. 오히려, 검증되는 것은 해석이나 결정이다. 동일한 증거에 기초한 타당성의 최종 판단은 제안된 결정마다 다를 수 있다.

This thought exercise highlights two important points. First, the interpretation-use argument might change when the decision changes. Second, an instrument is not “valid” in and of itself; rather, it is the interpretations or decisions that are validated. A final judgment of validity based on the same evidence may differ for different proposed decisions.

타당화에서 피해가야 할 일반적인 실수
Common mistakes to avoid in validation

당사 자체의 타당화 노력[39–41]과 타인의 작업[9, 25, 42]을 검토하면서 최종 사용자의 결과를 이해하고 적용하는 능력을 저해하는 몇 가지 일반적인 실수를 확인했습니다. 우리는 동료 검토자에게 경고하고, 독자를 좌절시키고, 도구의 사용을 제한하도록 보장된 10개의 실수를 제시한다.
In our own validation efforts [3941] and in reviewing the work of others [9, 25, 42], we have identified several common mistakes that undermine the end-user’s ability to understand and apply the results. We present these as ten mistakes guaranteed to alarm peer reviewers, frustrate readers, and limit the uptake of an instrument.

1번 실수. 바퀴 재창조(매번 새로운 평가 작성)
Mistake 1. Reinvent the wheel (create a new assessment every time)

우리의 검토[9]는 대부분의 타당성 연구가 기존 도구를 사용하거나 채택하기보다는 새로 만들어진 도구에 초점을 맞춘다는 것을 발견했다. 그러나 대부분의 구조를 평가하는 도구가 이미 어떤 형태로 존재하기 때문에 학습자 평가를 시작할 때 완전히 처음부터 시작할 필요는 거의 없다. 기존 도구를 사용하거나 기존 도구를 사용하여 구축하면 도구를 새로 개발하는 수고를 덜 수 있고, 우리의 결과를 다른 사람의 이전 작업과 비교할 수 있으며, 다른 사람이 우리의 작업과 비교할 수 있으며, 해당 도구, 작업 또는 평가 양식에 대한 전체 증거 기반에 우리의 증거를 포함할 수 있다. OSATS [42], 복강경 수술의 기초 (FLS) [43] 및 기타 시뮬레이션 기반 평가에 대한 근거 검토[9]는 모두 근거 기반에 중요한 차이를 보여준다. 이러한 공백을 메우기 위해서는 동일한 평가에서 도출된 점수, 추론 및 결정에 대한 증거를 수집하는 데 초점을 맞춘 여러 조사관의 협업 노력이 필요하다.

Our review [9] found that the vast majority of validity studies focused on a newly created instrument rather than using or adapting an existing instrument. Yet, there is rarely a need to start completely from scratch when initiating learner assessment, as instruments to assess most constructs already exist in some form. Using or building from an existing instrument

  • saves the trouble of developing an instrument de novo,
  • allows us to compare our results with prior work, and
  • permits others to compare their work with ours and
  • include our evidence in the overall evidence base for that instrument, task, or assessment modality.

Reviews of evidence for the OSATS [42], Fundamentals of Laparoscopic Surgery (FLS) [43], and other simulation-based assessments [9] all show important gaps in the evidence base. Filling these gaps will require the collaborative effort of multiple investigators all focused on collecting evidence for the scores, inferences, and decisions derived from the same assessment.

실수 2. 타당화 프레임워크를 사용하지 않음
Mistake 2. Fail to use a validation framework

위에서 언급한 바와 같이, 검증 프레임워크는 증거의 선택과 수집에 엄격함을 더하고 그렇지 않으면 놓칠 수 있는 격차를 식별하는 데 도움이 된다. 어떤 프레임워크를 선택했느냐보다 더 중요한 것은 검증 노력에 프레임워크가 적용되는 시기(이상적으로 초기)와 방식(엄정하고 완전하게)이다.
As noted above, validation frameworks add rigor to the selection and collection of evidence and help identify gaps that might otherwise be missed. More important than the framework chosen is the timing (ideally early) and manner (rigorously and completely) in which the framework is applied in the validation effort.

3번 실수. 전문가와 초보자의 비교를 타당성 논쟁의 핵심으로 삼는다.
Mistake 3. Make expert-novice comparisons the crux of the validity argument

[경험이 적은 그룹의 점수]를 [경험이 많은 그룹의 점수]와 비교하는 것(예: 의대생 대 시니어 전공의)은 다른 변수와의 관계에 대한 증거를 수집하는 일반적인 접근법이다. 시뮬레이션 기반 평가 연구의 73%에서 보고되었다[9]. 그러나 이 접근법은 점수 차이가 의도된 구성과 무관한 무수한 요인에서 발생할 수 있기 때문에 약한 증거만을 제공한다[44]. 예를 들어, [봉합 능력]을 측정하기 위한 평가에서 실제로 [멸균 기술을 측정]하고 [봉합 능력 측정은 완전히 무시되었다]고 가정합니다. 만약 조사관이 3학년 의대생과 재학 중인 의사들 사이에서 실제로 이것을 시험한다면, 그는 아마도 주치의에게 유리한 상당한 차이를 발견할 것이고, 이 증거가 제안된 해석의 타당성(즉, 봉합 기술)을 뒷받침한다고 잘못 결론지을 수 있다.

Comparing the scores from a less experienced group against those from a more experienced group (e.g., medical students vs senior residents) is a common approach to collecting evidence of relationships with other variables—reported in 73% of studies of simulation-based assessment [9]. Yet this approach provides only weak evidence because the difference in scores may arise from a myriad of factors unrelated to the intended construct [44]. To take an extreme example for illustration, suppose an assessment intended to measure suturing ability actually measured sterile technique and completely ignored suturing. If an investigator trialed this in practice among third-year medical students and attending physicians, he would most likely find a significant difference favoring the attendings and might erroneously conclude that this evidence supports the validity of the proposed interpretation (i.e., suturing skill).

물론, 이 가상의 예에서, 우리는 어텐딩이 봉합과 멸균 기술 모두에서 의대생보다 낫다는 것을 알고 있습니다. 그러나 실제 삶에서, 우리는 [실제로 평가되고 있는 것]이 무엇인지에 대해서는 전지적 지식이 부족하다. 우리가 아는 것은 오로지 시험 점수이고, 동일한 점수는 어떤 수의 기본 구조를 반영하는 것으로 해석될 수 있다."교란confounding"의 문제(복수의 가능한 해석)는 그룹 간의 차이가 실제로 의도된 구조와 연결된다고 말하는 것을 불가능하게 만든다. 반면에 예상 차이를 확인하지 못하면 점수 무효의 강력한 증거가 될 수 있다.

Of course, in this hypothetical example, we know that attendings are better than medical students in both suturing and sterile technique. Yet, in real life, we lack the omniscient knowledge of what is actually being assessed; we only know the test scores—and the same scores can be interpreted as reflecting any number of underlying constructs. This problem of “confounding” (multiple possible interpretations) makes it impossible to say that any differences between groups are actually linked to the intended construct. On the other hand, failure to confirm expected differences would constitute powerful evidence of score invalidity.

쿡은 이 문제에 대한 확장된 토론과 설명을 제공했고, 다음과 같이 결론을 내렸다. "연구자들이 한계를 이해한다면, 그러한 분석을 수행하는 것은 잘못된 것이 아니다." … 이러한 분석은 [달라야 할 집단을 구별하지 못하거나] [차이가 없어야 할 곳에 차이를 발견하게 된다면] 가장 흥미로울 것이다. 가설상의 차이 또는 유사성의 확인은 타당성 주장에 거의 추가되지 않는다." [44]
Cook provided an extended discussion and illustration of this problem, concluding that “It is not wrong to perform such analyses, … provided researchers understand the limitations. … These analyses will be most interesting if they fail to discriminate groups that should be different, or find differences where none should exist. Confirmation of hypothesized differences or similarities adds little to the validity argument.” [44]

4번 실수. [가장 중요한 증거]보다는 [쉽게 접근할 수 있는 타당성 증거]에 초점을 맞춘다.
Mistake 4. Focus on the easily accessible validity evidence rather than the most important

검증 연구자들은 종종 쉽게 이용할 수 있거나 쉽게 수집할 수 있는 데이터에 초점을 맞춘다. 이 접근법은 이해할 수 있지만, 종종 한 소스에 대해 풍부한 유효성 증거가 보고되는 반면 동등하거나 더 중요할 수 있는 다른 소스에 대해서는 큰 증거 격차가 남아 있다. 그 예로는

  • [내부 구조]를 무시하면서 [내용 증거]를 강조하거나,
  • [평가자 간 신뢰성]이 더 중요할 때 [문항 간 신뢰도]를 보고하거나,
  • 다른 변수와의 관계에 대해 [독립적인 측정과의 상관관계]보다는 [전문가-초심자 비교를 보고하는 것]이 있다.

우리의 검토에서, 우리는 306/417(73%)의 연구가 전문가와 초보자의 비교를 보고했고, 이 중 138(45%)은 추가 증거를 보고하지 않았다는 것을 발견했다. 이에 비해 별도의 측정으로 관계를 보고한 경우는 128명(31%), 내용증거 보고는 142명(34%), 점수 신뢰성 보고는 163명(39%)에 불과했다. 이러한 보고 패턴의 모든 이유를 알 수는 없지만, 적어도 부분적으로 일부 요소(예: 전문가-노바이스 비교 데이터)를 쉽게 얻을 수 있기 때문일 것으로 추측한다.
Validation researchers often focus on data they have readily available or can easily collect. While this approach is understandable, it often results in abundant validity evidence being reported for one source while large evidence gaps remain for other sources that might be equally or more important. Examples include

  • emphasizing content evidence while neglecting internal structure,
  • reporting inter-item reliability when inter-rater reliability is more important, or
  • reporting expert-novice comparisons rather than correlations with an independent measure to support relationships with other variables.

In our review, we found that 306/417 (73%) of studies reported expert-novice comparisons, and 138 of these (45%) reported no additional evidence. By contrast, only 128 (31%) reported relationships with a separate measure, 142 (34%) reported content evidence, and 163 (39%) reported score reliability. While we do not know all the reasons for these reporting patterns, we suspect they are due at least in part to the ease with which some elements (e.g., expert-novice comparison data) can be obtained.

이것은 해석-사용 주장을 명확하고 완전하게 진술하고, 기존의 증거와 격차를 식별하고, 가장 중요한 격차를 해결하기 위해 증거 수집을 조정하는 것의 중요성을 강조한다.
This underscores the importance of clearly and completely stating the interpretation-use argument, identifying existing evidence and gaps, and tailoring the collection of evidence to address the most important gaps.

5번 실수. 점수 해석 및 사용보다는 평가도구에 집중
Mistake 5. Focus on the instrument rather than score interpretations and uses

위에서 언급한 바와 같이, 타당성은 평가도구의 속성이 아니라 점수, 해석 및 용도의 속성이다. [동일한 도구]를 [다양한 용도]에 적용할 수 있으며(PSA는 임상 검사 도구로 유용하지 않을 수 있지만, 전립선암 재발을 모니터링하는 데 계속 가치가 있다), 많은 타당성 증거는 상황에 따라 다르다. 예를 들어,

  • 점수 신뢰성은 서로 다른 모집단에 걸쳐 크게 변할 수 있으며 [44],
  • 외래 진료와 같은 한 학습 상황에 대해 설계된 평가는 병원이나 급성 치료 의료와 같은 다른 맥락과 관련되거나 관련되지 않을 수 있으며,
  • OSATS 글로벌 등급 척도와 같은 일부 도구는 새로운 작업에 대한 평가에 쉽게 적용할 수 있지만, OSATS 체크리스트와 같은 것은 그렇지 않다 [42]

물론 의과대학과 같이 한 맥락에서 수집된 증거는 레지던트 훈련과 같은 다른 맥락과 적어도 부분적인 관련성을 갖는 경우가 많지만, 증거가 언제 어느 정도 새로운 환경으로 전이가능한지transfer에 대한 결정은 판단의 문제이며, 이러한 판단은 잠재적으로 잘못될 수 있다.

As noted above, validity is a property of scores, interpretations, and uses, not of instruments. The same instrument can be applied to different uses (the PSA may not be useful as a clinical screening tool, but continues to have value for monitoring prostate cancer recurrence), and much validity evidence is context-dependent. For example,

  • score reliability can change substantially across different populations [44],
  • an assessment designed for one learning context such as ambulatory practice may or may not be relevant in another context such as hospital or acute care medicine, and
  • some instruments such as the OSATS global rating scale lend themselves readily to application to a new task while others such as the OSATS checklist do not [42].

Of course, evidence collected in one context, such as medical school, often has at least partial relevance to another context, such as residency training; but determinations of when and to what degree evidence transfers to a new setting are a matter of judgment, and these judgments are potentially fallible.

[해석-사용 주장]은 엄밀히 말하면 [의도된 적용의 맥락]을 명확히 하지 않고서는 적절하게 만들어질 수 없다. 연구자의 문맥과 최종 사용자의 문맥은 거의 항상 다르기 때문에 해석-사용 논쟁도 반드시 다르다. 연구자들은 [데이터 수집의 맥락]을 명확하게 명시함으로써 후속 작업의 활용을 촉진할 수 있다. 예를 들어, 학습자 그룹, 과제 및 의도된 사용/사용 범위, 그리고 자신의 연구 결과가 타당하게 적용될 수 있다고 믿는 범위를 제안함으로써.
The interpretation-use argument cannot, strictly speaking, be appropriately made without articulating the context of intended application. Since the researcher’s context and the end-user’s context almost always differ, the interpretation-use argument necessarily differs as well. Researchers can facilitate subsequent uptake of their work by clearly specifying the context of data collection—for example, the learner group, task, and intended use/decision—and also by proposing the scope to which they believe their findings might plausibly apply.

점수의 타당성에 대해 언급하는 것은 허용되지만, 위에 명시된 이유로, 그러한 점수의 의도된 해석과 사용, 즉 의도된 결정을 명시하는 것이 더 낫다. 우리는 연구자와 최종 사용자(교육자) 모두가 모든 검증 단계에서 해석과 사용을 명확히 할 것을 강력히 권장한다.
It is acceptable to talk about the validity of scores, but for reasons articulated above, it is better to specify the intended interpretation and use of those scores, i.e., the intended decision. We strongly encourage both researchers and end-users (educators) to articulate the interpretations and uses at every stage of validation.

6번 실수. 타당성 증거를 종합하거나 비평하지 못함
Mistake 6. Fail to synthesize or critique the validity evidence

우리는 종종 연구자들이 [증거를 합성하거나 평가하려는 시도 없이, 그저 보고하기만 하는 것]을 관찰했다. 교육자와 미래 연구자 모두 제안된 [해석-사용 주장]에 비추어 연구자가 [자신의 발견을 해석]하고, 이를 [이전 작업과 통합]하여 [현재 및 포괄적인 타당성 주장]을 만들고, [한계 및 지속적인 gap 또는 불일치를 식별]할 때 큰 이익을 얻는다. 교육자와 다른 최종 사용자도 증거에 익숙해져야 하며, 연구자의 주장을 확인하고 특정 상황에 대한 타당성에 대한 자체 판단을 공식화해야 한다.
We have often observed researchers merely report the evidence without any attempt at synthesis and appraisal. Both educators and future investigators greatly benefit when researchers interpret their findings in light of the proposed interpretation-use argument, integrate it with prior work to create a current and comprehensive validity argument, and identify shortcomings and persistent gaps or inconsistencies. Educators and other end-users must become familiar with the evidence as well, to confirm the claims of researchers and to formulate their own judgments of validity for their specific context.

7번 실수. 평가 개발을 위한 모범 사례 무시
Mistake 7. Ignore best practices for assessment development

평가 과제, 도구 및 절차의 개발, 개선 및 구현에 대한 책이 작성되었습니다 [23, 45–48]. 이러한 모범 사례를 고려하지 않고 평가를 개발하거나 수정하는 것은 경솔한 일일 것이다. 우리는 이것들을 요약할 수 없었지만, 우리는 건강 전문 교육자들에게 특별한 인상에 대한 두 가지 권고를 강조한다. 두 가지 모두 콘텐츠 증거(클래식 또는 5가지 소스 프레임워크 기준)와 일반화 추론(케인 기준)과 관련이 있다.
Volumes have been written on the development, refinement, and implementation of assessment tasks, instruments, and procedures [23, 4548]. Developing or modifying an assessment without considering these best practices would be imprudent. We could not begin to summarize these, but we highlight two recommendations of particular salience to health professions educators, both of which relate to content evidence (per the classic or five sources frameworks) and the generalization inference (per Kane).

첫째, [작업 또는 토픽의 표본]은 원하는 수행능력 영역을 나타내야 한다. 보건 전문가 평가에서 반복적으로 발견되는 것은 [일반화 가능한 기술]이란 것은 거의 존재하지 않는다는 것이다. 한 과제에 대한 성과는 다른 과제에 대한 성과를 예측하지 못한다[49, 50]. 따라서 평가는 시나리오, 사례, 과제, 스테이션 등의 충분히 많고 광범위한 샘플을 제공해야 한다.

First, the sample of tasks or topics should represent the desired performance domain. A recurrent finding in health professions assessment is that there are few, if any, generalizable skills; performance on one task does not predict performance on another task [49, 50]. Thus, the assessment must provide a sufficiently numerous and broad sample of scenarios, cases, tasks, stations, etc.

둘째, 평가 응답 형식은 [객관화]와 [판단 또는 주관성]의 균형을 이루어야 한다[51]. 체크리스트와 글로벌 등급의 장점과 단점은 오랫동안 논의되어 왔으며, 둘 다 장단점이 있는 것으로 밝혀졌다[52]. 체크리스트는 원하는 행동에 대한 구체적인 기준과 형성적 피드백을 위한 지침을 개략적으로 설명하므로 평가 과제에 익숙하지 않은 평가자가 종종 사용할 수 있다. 그러나 체크리스트의 "객관성"은 대체로 착각이다. [53] [관찰된 행동에 대한 정확한 해석]은 여전히 [과제와 관련된 전문지식]을 필요로 할 수 있으며, 평가자에게 등급을 이분화하도록 강요하는 것은 정보의 손실을 초래할 수 있다. 또한 각 특정 작업에 대해 새로운 점검표를 작성해야 하며, 해당 항목은 종종 임상 역량을 보다 정확하게 반영할 수 있는 조치를 희생하여 철저성을 보상한다. 대조적으로, 글로벌 등급은 사용하기 위해 더 큰 전문지식이 필요하지만 성능의 더 미묘한 뉘앙스를 측정하고 여러 보완적 관점을 반영할 수 있다. 글로벌 등급은 또한 OSATS의 경우와 마찬가지로 여러 작업에 걸쳐 사용하도록 설계될 수 있다. 최근의 체계적 검토에서, 우리는 여러 연구에서 평균을 낼 때 글로벌 등급보다 체크리스트에 대한 등급 간 신뢰성이 약간 더 높았지만, 글로벌 등급은 항목 간 및 스테이션 간 신뢰성이 더 높았다[52]. 정성적 평가는 일부 학습자의 속성을 평가하기 위한 또 다른 옵션을 제공한다[11, 54, 55].
Second, the assessment response format should balance objectification and judgment or subjectivity [51]. The advantages and disadvantages of checklists and global ratings have long been debated, and it turns out that both have strengths and weaknesses [52]. Checklists outline specific criteria for desired behaviors and guidance for formative feedback, and as such can often be used by raters less familiar with the assessment task. However, the “objectivity” of checklists is largely an illusion; [53] correct interpretation of an observed behavior may yet require task-relevant expertise, and forcing raters to dichotomize ratings may result in a loss of information. Moreover, a new checklist must be created for each specific task, and the items often reward thoroughness at the expense of actions that might more accurately reflect clinical competence. By contrast, global ratings require greater expertise to use but can measure more subtle nuances of performance and reflect multiple complementary perspectives. Global ratings can also be designed for use across multiple tasks, as is the case for the OSATS. In a recent systematic review, we found slightly higher inter-rater reliability for checklists than for global ratings when averaged across studies, while global ratings had higher average inter-item and inter-station reliability [52]. Qualitative assessment offers another option for assessing some learner attributes [11, 54, 55].

8번 실수. 평가도구에 대한 세부 정보 생략
Mistake 8. Omit details about the instrument

의도된 용도를 뒷받침하는 타당성 증거와 지역 요구와 관련된 평가를 식별하는 것은 실망스러운 일이지만, 평가가 적용을 허용하기에 충분한 세부 사항을 명시하지 않았다는 것을 발견하는 것은 좌절스러운 일이다. 주로 누락되는 중요한 사항에는 다음이 있다.

  • 평가도구 문항의 정확한 워딩,
  • 채점 기준(rubric)
  • 학습자 또는 평가자에게 제공되는 지침,
  • 스테이션 배치에 대한 설명(예: 절차적 작업에 필요한 자료, 표준화된 환자 접견에서 참가자 교육) 
  • 사건의 순서. 

대부분의 연구자들은 다른 사람들이 그들의 창작물을 사용하고 그들의 출판물을 인용하기를 원한다. 
필요한 세부 정보가 보고될 경우 이 문제가 발생할 가능성이 훨씬 높습니다. 온라인 부록은 기사 길이가 문제인 경우 인쇄 출판에 대한 대안을 제공합니다.

It is frustrating to identify an assessment with relevance to local needs and validity evidence supporting intended uses, only to find that the assessment is not specified with sufficient detail to permit application. Important omissions include

  • the precise wording of instrument items,
  • the scoring rubric,
  • instructions provided to either learners or raters, and
  • a description of station arrangements (e.g., materials required in a procedural task, participant training in a standardized patient encounter) and
  • the sequence of events.

Most researchers want others to use their creations and cite their publications; this is far more likely to occur if needed details are reported. Online appendices provide an alternative to print publication if article length is a problem.

9번 실수. 시뮬레이터/평가 기구의 가용성이 평가를 주도하도록 합니다.
Mistake 9. Let the availability of the simulator/assessment instrument drive the assessment

교육자로서, 우리는 너무 자주 [수행능력 기반 평가]가 임상실습의 목표와 더 잘 일치함에도 불구하고, [임상실습 말 평가를 위해 기성 MCQ 시험을 보는 것]과 같처럼 [평가 도구의 가용성]이 평가 프로세스를 끌어나가게 방치한다. 이 문제는 시뮬레이터의 가용성이 교육 프로그램을 설계하고 교육 요구에 맞는 최적의 시뮬레이션을 선택하는 것과 반대로 교육 프로그램을 구동할 수 있는 시뮬레이션 기반 평가와 더욱 복잡하다[56]. 우리는 [우리가 가르치고 있는 구조]를 [그 구조를 가장 잘 평가하는 시뮬레이터 및 평가 도구]와 일치시켜야 한다.
Too often as educators, we allow the availability of an assessment tool to drive the assessment process, such as taking an off-the-shelf MCQ exam for an end-of-clerkship assessment when a performance-based assessment might better align with clerkship objectives. This issue is further complicated with simulation-based assessments, where the availability of a simulator may drive the educational program as opposed to designing the educational program and then choosing the best simulation to fit the educational needs [56]. We should align the construct we are teaching with the simulator and assessment tool that best assess that construct.

10번 실수. 평가도구를 '타당화된'이라고 명명
Mistake 10. Label an instrument as validated

계측기를 유효하다고 레이블링하는 데는 세 가지 문제가 있습니다.

  • 첫째, 타당성은 도구가 아니라 점수, 해석, 결정의 속성이다.
  • 둘째, 타당성은 정도의 문제이다. 예스냐 아니냐의 결정이 아니다.
  • 셋째, 타당화는 엔드포인트가 아닌 프로세스입니다.

Validated라는 단어는 [프로세스가 적용되었다는 것]을 의미할 뿐이며, 프로세스에 대한 세부 정보를 제공하지 않으며 경험적 소견의 크기나 방향(지지 또는 반대)을 나타내지 않는다.
There are three problems with labeling an instrument as validated.

  • First, validity is a property of scores, interpretations, and decisions, not instruments.
  • Second, validity is a matter of degree—not a yes or no decision.
  • Third, validation is a process, not an endpoint. 

The word validated means only that a process has been applied; it does not provide any details about that process nor indicate the magnitude or direction (supportive or opposing) of the empiric findings.

시뮬레이션 기반 평가의 미래
The future of simulation-based assessment

우리는 시뮬레이션 기반 평가의 미래를 아는 척하지 않지만, 실현되기를 바라는 여섯 가지 야심찬 개발로 결론을 내린다
Although we do not pretend to know the future of simulation-based assessment, we conclude with six aspirational developments we hope come to pass.

1.우리는 일련의 학습자 평가의 일환으로 시뮬레이션 기반 평가를 더 많이 사용할 수 있기를 바란다. 시뮬레이션 기반 평가는 그 자체로 목표가 되어서는 안 되지만 일반적으로 더 빈번한 평가를 예상하고 시뮬레이션이 중요한 역할을 할 것으로 믿는다. 양식 선택은 먼저 주어진 상황, 즉 학습 목표, 학습자 수준 또는 교육적 맥락에서 최선의 평가 접근법이 무엇인지 고려해야 한다. 특히 조건과 내용의 표준화가 필요한 기술 평가에서 다양한 형태의 시뮬레이션이 해답이 될 수 있다.

1.We hope to see greater use of simulation-based assessment as part of a suite of learner assessments. Simulation-based assessment should not be a goal in and of itself, but we anticipate more frequent assessment in general and believe that simulation will play a vital role. The choice of modality should first consider what is the best assessment approach in a given situation, i.e., learning objective, learner level, or educational context. Simulation in its various forms will often be the answer, especially in skill assessments requiring standardization of conditions and content.

2.우리는 시뮬레이션 기반 평가가 [테크놀로지보다는 교육적 필요성에 더 명확하게 초점]을 맞추기를 바란다. 값비싼 마네킹과 가상현실 작업 트레이너가 역할을 할 수도 있지만 족발, 펜로즈 배수구, 나무 말뚝, 판지 마네킹은 더 많은 빈도와 더 적은 제약으로 사용될 수 있기 때문에 실제로 더 실용적인 유용성을 제공할 수 있다. 예를 들어, 이러한 저가 모델은 전용 시뮬레이션 센터보다는 가정이나 병동에서 사용할 수 있다. 고부가가치, 비용 의식이 높은 교육의 필요성을 고려함에 따라[57] 혁신적인 교육자들이 저기술 솔루션을 적극적으로 모색할 것을 권장한다.
2.
We hope that simulation-based assessment will focus more clearly on educational needs and less on technology. Expensive manikins and virtual reality task trainers may play a role, but pigs feet, Penrose drains, wooden pegs, and cardboard manikins may actually offer more practical utility because they can be used with greater frequency and with fewer constraints. For example, such low-cost models can be used at home or on the wards rather than in a dedicated simulation center. As we consider the need for high-value, cost-conscious education [57], we encourage innovative educators to actively seek low-tech solutions.


3. 처음 두 가지를 바탕으로, 우리는 비용이 적게 들고 덜 정교하며 덜 거슬리고 덜 거슬리는 저부담 평가가 시뮬레이션과 작업장에서 모두 더 다양한 맥락에서 더 자주 수행되기를 바란다. 슈워츠와 반 데르 블류텐이 제안했듯이, 이 모델은 시간이 지남에 따라 아무리 잘 설계되었더라도 어떤 단일 평가보다 학습자의 완전한 그림을 그릴 것이다.
3.Building off the first two points, we hope to see less expensive, less sophisticated, less intrusive, lower-stakes assessments take place more often in a greater variety of contexts, both simulated and in the workplace. As Schuwirth and van der Vleuten have proposed [58], this model would—over time—paint a more complete picture of the learner than any single assessment, no matter how well-designed, could likely achieve.

4.새로운 평가 도구가 더 적게 생성되고 기존 도구를 지원하고 적용하기 위해 더 많은 증거를 수집하기를 바랍니다. 우리는 새로운 도구의 창조를 장려할 수 있는 힘을 높이 평가하지만, 연구자들이 [더 작은 집합의 유망한 도구]에 대해 타당성 증거를 확장하기 위해 노력을 모으고, [다른 맥락에서 그러한 도구를 평가]하여 [증거 공백을 연속적으로 메워간다면], 이 분야가 점점 더 빠르게 발전할 것이라고 믿는다. 
4.
We hope to see fewer new assessment instruments created and more evidence collected to support and adapt existing instruments. While we appreciate the forces that might incentivize the creation of novel instruments, we believe that the field will advance farther and faster if researchers pool their efforts to extend the validity evidence for a smaller subset of promising instruments, evaluating such instruments in different contexts, and successively filling in evidence gaps.

5.우리는 평가의 결과 및 시사점을 알려주는 더 많은 증거를 보기를 바란다. 이것은 아마도 가장 중요한 증거 자료일 것이지만, 가장 자주 연구되지 않는 것 중 하나이다. 평가의 결과에 대한 연구를 위한 제안이 최근에 발표되었다[27].
5.
We hope to see more evidence informing the consequences and implications of assessment. This is probably the most important evidence source, yet it is among the least often studied. Suggestions for the study of the consequences of assessment have recently been published [27].

6.마지막으로, 우리는 해석-사용 주장의 더 빈번하고 명시적인 사용을 볼 수 있기를 바란다. 위에서 언급한 바와 같이, 이 초기 단계는 어렵지만 의미 있는 검증에 매우 중요하다.
6.
Finally, we hope to see more frequent and more explicit use of the interpretation-use argument. As noted above, this initial step is difficult but vitally important to meaningful validation.

 

 


Adv Simul (Lond). 2016 Dec 7;1:31. doi: 10.1186/s41077-016-0033-y. eCollection 2016.

Validation of educational assessments: a primer for simulation and beyond

Affiliations collapse

Affiliations

11Mayo Clinic Online Learning, Mayo Clinic College of Medicine, Rochester, MN USA.

22Office of Applied Scholarship and Education Science, Mayo Clinic College of Medicine, Rochester, MN USA.

33Division of General Internal Medicine, Mayo Clinic College of Medicine, Mayo 17-W, 200 First Street SW, Rochester, MN 55905 USA.

44Department of Medicine, University of British Columbia, Vancouver, British Columbia Canada.

PMID: 29450000

PMCID: PMC5806296

DOI: 10.1186/s41077-016-0033-y

Free PMC article

Abstract

Background: Simulation plays a vital role in health professions assessment. This review provides a primer on assessment validation for educators and education researchers. We focus on simulation-based assessment of health professionals, but the principles apply broadly to other assessment approaches and topics.

Key principles: Validation refers to the process of collecting validity evidence to evaluate the appropriateness of the interpretations, uses, and decisions based on assessment results. Contemporary frameworks view validity as a hypothesis, and validity evidence is collected to support or refute the validity hypothesis (i.e., that the proposed interpretations and decisions are defensible). In validation, the educator or researcher defines the proposed interpretations and decisions, identifies and prioritizes the most questionable assumptions in making these interpretations and decisions (the "interpretation-use argument"), empirically tests those assumptions using existing or newly-collected evidence, and then summarizes the evidence as a coherent "validity argument." A framework proposed by Messick identifies potential evidence sources: content, response process, internal structure, relationships with other variables, and consequences. Another framework proposed by Kane identifies key inferences in generating useful interpretations: scoring, generalization, extrapolation, and implications/decision. We propose an eight-step approach to validation that applies to either framework: Define the construct and proposed interpretation, make explicit the intended decision(s), define the interpretation-use argument and prioritize needed validity evidence, identify candidate instruments and/or create/adapt a new instrument, appraise existing evidence and collect new evidence as needed, keep track of practical issues, formulate the validity argument, and make a judgment: does the evidence support the intended use?

Conclusions: Rigorous validation first prioritizes and then empirically evaluates key assumptions in the interpretation and use of assessment scores. Validation science would be improved by more explicit articulation and prioritization of the interpretation-use argument, greater use of formal validation frameworks, and more evidence informing the consequences and implications of assessment.

Keywords: Content Evidence; Lumbar Puncture; Validation Framework; Validity Argument; Validity Evidence.

테크놀로지-강화 평가: 오타와 합의문과 권고(Med Teach, 2022)
Technology enhanced assessment: Ottawa consensus statement and recommendations
Richard Fullera, Viktoria C. T. Goddardb, Vishna D. Nadarajahc , Tamsin Treasure-Jonesd, Peter Yeatese , Karen Scottf , Alexandra Webbg, Krisztina Valterh and Eeva Pyoralai 

 

 

배경
Background

2011년 이전의 오타와 기술 강화 평가(TEA) 합의 성명 이후, 기술 향상은 평가 관행을 혁신할 수 있는 이전에는 상상할 수 없었던 가능성을 실현했습니다(Amin et al. 2011). 테크놀로지와 교육의 인터페이스가 직원, 학습자 및 기관을 연결하는 학습, 교육 및 평가에 대한 새로운 접근 방식을 개발함에 따라 흥미로운 새로운 지평이 계속 드러나고 있다(Alexander et al. 2019). 이러한 연결성은 점점 더 쉽게 액세스할 수 있는 '빅 데이터'와 결합되어 개인화된 평가와 시기적절한 피드백을 제공할 수 있는 실질적인 기회를 제공합니다.
Since the previous Ottawa Technology Enhanced Assessment (TEA) consensus statement of 2011, technology enhancements have realised previously unimagined possibilities to innovate assessment practices (Amin et al. 2011). Exciting new horizons continue to be revealed as the interface of technology and education develops new approaches to learning, teaching, and assessing, connecting staff, learners, and institutions (Alexander et al. 2019). This connectivity, coupled with increasingly accessible ‘big data,’ presents real opportunities to deliver personalised assessment and timely feedback.

그러나 평가에서 (새로운) 테크놀로지를 무비판적으로 채택하는 것은 (평가 보안 및 시스템 장애에 걸친 우려에서 학문적 무결성을 포함하여 학습자와 교수진에 미치는 영향에 이르기까지) 상당한 위험을 초래한다(Andreou et al. 2021). 혁신의 기회 또는 테크놀로지의 오용 및 잘못된 적용 가능성(예: 의사 결정을 촉진하기 위한 분석 사용)은 교육이 제공되는 환경에서 학습자, 교수진 및 조직에 복잡한 [학문적 및 윤리적 딜레마]를 가져옵니다.
However, uncritical adoption of (new) technologies in assessment brings substantial risk, from concerns spanning assessment security and systems failure through to their impact on learners and faculty, including academic integrity (Andreou et al. 2021). Opportunities for innovation, or the potential for misuse and misapplication of technology (for example, the use of analytics to drive decision making), bring complex academic and ethical dilemmas for learners, faculty, and organisations in settings where education is delivered.

우리는 테크놀로지를 비교적 '새로운' 구인construct으로 인식할 수도 있지만, 역사적으로 [사용 및 경험을 통해 테크놀로지를 적용할 수 있는 '규칙'을 생성하는 동시에, 테크놀로지 업그레이드 및 혁신의 역동적이고 가속화하는 지형과 씨름하면서] 혁신은 교육에 도전해 왔습니다. 테크놀로지 변화의 속도는 교육 개혁보다 훨씬 더 빠르며, 영원한 '따라잡기catch up' 감각을 만들어낸다. 이러한 지속적인 도전은 이러한 변화와 함께 교육자들이 평가 관행을 혁신하고자 할 때 '정치, 교육학, 실천'의 3원적 인터페이스에 반영된다(Shum and Luck in 2019).
Whilst we might recognize technology as a relatively ‘new’ construct, innovations throughout history have challenged education as we generate ‘rules’ for its application through use and experience, whilst grappling with an increasingly dynamic, accelerating landscape of technology upgrades and innovation. The pace of change in technology continues to be much quicker than educational reform, creating a perpetual sense of ‘catch up.’ This continual challenge is reflected in the triadic interface of ‘politics, pedagogy, and practices’ as educators seek to innovate assessment practices alongside these changes (Shum and Luckin 2019).

2020년 오타와 회의 이후 코로나19 범유행으로 인한 글로벌 혼란이 사회 모든 부문에 영향을 미치고 있다. 교육은 학습자의 세대 간 집단(학전부터 지속적인 전문적 발달까지)에 영향을 미쳐 기관이 원격/온라인 교육을 신속하게 채택하고 적응해야 한다(아리스토브니크 외 2020; 클렐란드 외 2020; 고든 외 2020; 라힘 2020; 파로키 외 2021; 그래프톤-클라케 외 2021). 평가는 특별한 과제를 보았지만 보건 전문 교육(HPE)에서 창의적이고 혁신적인 솔루션을 제공하기 위해 테크놀로지를 채택했다(Fuller et al. 2020; Hegazy et al. 2021). 예를 들어, TEA에서 '온라인 OSCE'(객관적 구조 임상 검사)(Hytönen et al. 2021; Roman et al. 2022)와 같은 새로운 담론이 등장했지만, 이는 우수한 평가 관행과 OSCE의 목적에 대한 정의나 정렬이 부족할 수 있다(Boursicot et al. 2020, 2021). 학습 분석과 같은 다른 제안된 기술 솔루션은 상당한 잠재력을 보여주지만, 현재 중요한 증거 기반이 부족하다(Sonderlund et al. 2019; Archer and Prinslo 2020). 결과적으로, 교육을 혁신하기 위한 테크놀로지 사용을 뒷받침하기 위해 더 큰 연구가 필요하다는 주장이 제기되었고(Ellaway et al. 2020), 이것은 이 새로워진 TEA 합의문을 탐구하는 데 유용한 배경을 제공한다.
Since the Ottawa conference of 2020, global disruption caused by the Covid-19 pandemic continues to impact every sector of society. Education has affected a cross-generational cohort of learners (from pre-school to continuing professional development), necessitating institutions to rapidly adopt and adapt to remote/online education (Aristovnik et al. 2020; Cleland et al. 2020; Gordon et al. 2020; Rahim 2020; Farrokhi et al. 2021; Grafton-Clarke et al. 2021). Assessment has seen particular challenges but has embraced technology to deliver creative, innovative solutions in Health Professions Education (HPE) (Fuller et al. 2020; Hegazy et al. 2021). Whilst new discourses have emerged in TEA, for example, the ‘online OSCE’ (Objective Structured Clinical Examination) (Hytönen et al. 2021; Roman et al. 2022), these may lack definition or alignment to good assessment practice and the purpose of the OSCE (Boursicot et al. 2020, 2021). Other proposed technology solutions, such as learning analytics show significant potential, but currently lack a critical evidence base (Sonderlund et al. 2019; Archer and Prinsloo 2020). Consequently, calls have emerged for a greater scholarship to underpin the use of technology to innovate education (Ellaway et al. 2020), and this provides a helpful backdrop to explore this refreshed TEA consensus statement.

과거를 통해 미래를 볼 수 있을까? 2011년 컨센서스와 새로운 10년을 위한 새로운 프레임워크로부터의 교훈
Looking back to the future? Lessons from the 2011 consensus and a refreshed framework for a new decade

이전의 Ottawa TEA 컨센서스에 의해 예측된 많은 [테크놀로지 혁신]은 이제 평가의 게이미피케이션에서 증가하는 추세와 함께 일상적인 교육 관행(가상 학습 환경, 컴퓨터 기반 평가, 시뮬레이션 및 마네킹 포함)으로 인식될 수 있다(Wang et al. 2016; Prochazkova et al. 2019; Tsoy et al. 2019; Tu.tie et al. 2020; Roman et al. 2022). 또한 지난 10년간 [모바일 기술]의 급속한 확산은 학습자가 임상 작업장에서 정보를 검색할 수 있는 기회를 제공했지만 학생, 임상 교사, 의료 전문가, 환자와 보호자 사이에 긴장을 조성했다(Scott et al. 2017; Harrison et al. 2019; Folger et al. 2021).
Many of the technology innovations forecasted by the previous Ottawa TEA consensus may now be perceived as everyday education practice (including virtual learning environments, computer-based assessment, simulation, and mannequins) with growing trends in the gamification of assessment (Wang et al. 2016; Prochazkova et al. 2019; Tsoy et al. 2019; Tuti et al. 2020; Roman et al. 2022). Furthermore, the rapid spread of mobile technology over the past decade has provided learners opportunities to retrieve information in the clinical workplace but has also created tensions between students, clinical teachers, health care professionals, and patients and carers (Scott et al. 2017; Harrison et al. 2019; Folger et al. 2021).

그러나 [자원과 테크놀로지의 한계]는 [일부 기관이 새로운 테크놀로지를 필요로 하는 교수, 학습 및 평가 관행을 구현할 수 없음을 의미함]을 인식하는 것이 중요하다. 게다가, 모든 학생들이 최신 테크놀로지에 접근할 수 있는 것도 아니다. 이러한 요인들은 테크놀로지 강화 학습에 대한 접근성을 매개로 이미 고착화된 [저자원 환경과 고자원 환경] 간의 격차를 확대한다(Aristovnik et al. 2020). 이전의 합의 이후, 더 넓은 사회에서 등장한 많은 광범위한 '하드웨어' 솔루션은 학습을 평가하는 방법을 근본적으로 변화시켰다. 예를 들면 OSCE(Judd 등 2017; Daniels 등)에서의 태블릿 기반 표시와 직장에서의 스마트폰 지원 평가(Mooney 등 2014; Joynes 및 Fuller 2016)와 같은 것이 있다.

However, it is important to recognise that resource and technology limitations mean that some institutions have been unable to implement teaching, learning, and assessment practices that require new technology. In addition, not all students have access to the latest technology. These factors widen an already established disparity between lower and higher-resourced environments through access to technology-enhanced learning (Aristovnik et al. 2020). Since the previous consensus, many of the broader ‘hardware’ solutions that have emerged in wider society have radically changed how we can assess learning, e.g. tablet-based marking in OSCEs (Judd et al. 2017; Daniels et al. 2019) and smartphone assisted assessment in the workplace (Mooney et al. 2014; Joynes and Fuller 2016).

[테크놀로지 '도구tools']에 초점을 맞추는 것은 유혹적이지만,이전 오타와 프레임워크의 핵심 개념 중 일부는 구현과 연구 질문의 최전선에 남아 있으며, 특히 다음과 관련된다.

  • 온라인 환경에서 [기존 평가 과제와 관행을 복제]하기 위한 기술 적용('변환transmediation') 또는
  • 시험 및 채점 [속도를 높이는 테크놀로지-지원 평가 도구 사용]의 효율성 향상('보조기구prosthesis'). 

Whilst it is tempting to explore a focus on technology ‘tools,’ some of the key concepts from the previous Ottawa framework remain at the forefront of implementation and research questions, particularly relating

  • to the application of technology to replicate the existing assessment assignments and practices in an online environment (‘transmediation’) or
  • to the efficiency in the use of technology-assisted assessment tools that speed up examinations and grading (‘prosthesis’).

TEA는 실생활에서 필요한 지식, 기술 및 행동의 조합 또는 학생의 역량에 대한 진정한authentic 평가를 제공하기 위해 제안되었다(Gulikers et al. 2004). 그러나 [의도하지 않은 구조에 대한 의도하지 않은 평가] 또는 [결과적으로 학습자의 참여와 행동에 영향을 미치는 실제 관행으로부터의 deviation]으로 인해서, [TEA를 통한 진정한 평가]에 대한 위험은 여전히 높다. 2011년 프레임워크는 또한 고비용 및 충실도 평가 기술 관행의 일부 과제에 초점을 맞췄습니다. 특히 학습자와 기관 간의 디지털 불평등의 출현과 이해로 인해 현재 더욱 어려워지고 있습니다(UNESCO 2018). 10년간의 혁신과 연구에도 불구하고 평가의 진실성과 학습의 영향을 둘러싼 몇 가지 핵심 질문이 우리의 생각의 최전선에 남아 있다.
TEA has been suggested to provide authentic assessments (Gulikers et al. 2004) of students' competencies or combinations of knowledge, skills, and behaviours required in real life. However, the risks to authentic assessment through TEA remain high, either through unintentional assessment of unintended constructs, or deviation from real-life practices that consequently affect learner engagement and behaviours. The 2011 framework also focused on some of the challenges of high cost and high-fidelity assessment technology practices—now particularly challenged by the emergence, and understanding, of digital inequity amongst learners and institutions (UNESCO 2018). Despite ten years of innovation and scholarship, some of the key questions posed, surrounding the authenticity of assessment and the impact of learning remain at the forefront of our thinking.

이러한 교훈을 바탕으로, 이 새로워진 프레임워크는 평가가 이루어지는 더 넓은 환경에서 평가, 기술 및 교육 관행에 걸친 광범위한 범위에서 도출된다. 2010-2020년(Auxier et al. 2019)을 형성한 확립된 (교육) 테크놀로지과 능동적 학습의 실천을 뒷받침하는 새로운 테크놀로지 및 이론을 모두 반영한다.
Drawing on these lessons, this refreshed framework draws from broad scoping across assessment, technology, and educational practices in the wider environment in which assessment takes place. It draws on a reflection of both the established (educational) technology that shaped the 2010–2020 decade (Auxier et al. 2019), emergent technologies, and theories that underpin the practice of active learning.

2020년 오타와 컨퍼런스 및 후속 공개 컨설팅 및 워크숍의 직접 워크숍 피드백에 민감한 합의 프레임워크는 다음의 세 가지 핵심 단계로 나뉜다.

  • (1) 기술 채택 준비,
  • (2) 평가 라이프사이클에 적용(대표적 사례 연구 포함)
  • (3) TEA의 평가와 확산을 위한 프로세스 

Sensitised by feedback from in-person workshops in the 2020 Ottawa Conference and subsequent open consultation and workshops, the consensus framework is divided into three key stages, spanning

  • (1) readiness for technology adoption,
  • (2) its application to the assessment lifecycle (supported by illustrative case studies), and
  • (3) processes for evaluation and dissemination of TEA.

1단계: 평가 개선을 위한 기술 채택 준비 상태 평가
STAGE 1: Assessing readiness to adopt technology to enhance assessment

기술은 최근 HPE의 학습 및 평가에 대한 많은 COVID 관련 과제에 대한 공통적인 해결책으로, 학회 및 저널 플랫폼에 걸쳐 개별 기관 반응을 보여주는 전체 범위의 학술 커뮤니케이션(예: Khalaf et al. 2020; Jaap et al. 2021)이 있다. 그러나 다른 저자들은 코로나 이전에 존재했던 교육 관행에 대한 많은 우려가 이러한 접근 방식을 통해 해결될 가능성이 낮다고 강조했다(Ellaway et al. 2020). 게다가, 테크놀로지는 형편없는 평가 관행의 영향과 위험을 증가시킬 수 있다. 자동화된 프로세스는 '버튼을 누르면' 상당한 오류가 발생할 수 있으며(예: 부정확한 점수 보고를 통해) 평가 프로세스 주변의 학습자와 교직원의 신뢰에 장기적인 손상을 줄 수 있습니다.
Technology has been a common solution to many of the recent COVID-related challenges to learning and assessment in HPE, with a whole range of scholarly communications illustrating individual institutional responses across conference and journal platforms (e.g. Khalaf et al. 2020; Jaap et al. 2021). However, other authors have highlighted that many of the concerns around educational practice that existed pre-COVID are unlikely to have been resolved through these approaches (Ellaway et al. 2020). Moreover, technology may increase the impact and risk of poor assessment practises. Automated processes may ‘at the push of a button’ generate a substantial error (e.g. through inaccurate score reporting), causing long-lasting damage to learner and faculty trust around assessment processes.

이전 섹션에서 확인한 바와 같이, 평가에서 테크놀로지를 무비판적으로 도입한다는 것은 [잠재적 편익]이 다양한 [잠재적 단점(학업적, 재정적, 제도적)]으로 상쇄될 수 있다는 것을 의미한다. 테크놀로지 도입에 있어 가장 중요한 것은 '평가'를 통해 차선의 평가 관행을 파악하고 해결할 필요가 있다는 것입니다.
As identified in the previous section, non-critical adoption of technology in assessment means potential benefits could be offset by a range of potential disadvantages (academic, financial, and institutional). Critical to the adoption of technology is the need to ‘assess assessment,’ to ensure that any sub-optimal assessment practices are identified and resolved.

이 오타와 합의의 핵심 권고 사항 중 하나는 '기술은 제쳐두고' TEA와 관련된 네 가지 중요한 영역을 조사하는 것입니다.

  • 기존 평가 관행의 품질
  • TEA 도입의 목적
  • 디지털 형평성에 관한 당면 과제 
  • 테크놀로지를 채택할 수 있는 제도적 역량

One of the key recommendations of this Ottawa consensus is to ‘put aside the technology’ and investigate four critical areas associated with TEA:

  • The quality of existing assessment practice
  • The purpose of introducing TEA
  • Engagement with digital equity challenges
  • Institutional capacity to adopt technology

목적에 맞는 평가?
Assessment fit for purpose?

[기존 평가 프로세스에 대한 검토는 TEA 채택 준비의 핵심]이며, 다음에 초점을 맞춰야 합니다. 

  • 단순히 평가 '도구'뿐만 아니라,
  • 보다 광범위한 평가 프로그램과 그것의 이론적 기반
  • 평가 제공에 사용된 기존 테크놀로지(예: 강의실 데스크톱 또는 개인용 노트북 컴퓨터 또는 모바일 장치) 를 포함하여
  • 평가를 수행할 수 있는 환경(캠퍼스/임상 실습/학습자의 개인 공간)

A review of existing assessment processes is central to readiness for adoption of TEA, and should focus

  • not just on assessment ‘tools,’
  • but the wider programme of assessment, its theoretical underpinning and
  • environments in which assessment may be undertaken (campus/clinical practice/learners’ personal space)
  • including any existing technology used to deliver assessment (e.g. classroom desktop or personal laptop computers, or mobile devices).

광범위한 전문가, 목적 적합 규격 및 지침이 이 평가 검토를 지원해야 한다(Norcini et al. 2018; Boursicot et al. 2021; Heeneman et al. 2021; Torre et al. 2021). 시작시에 '평가를 평가하는 것assessing assessment'는 평가가 기존 형식에서 목적에 적합한지 확인하는 데 도움이 될 뿐만 아니라 테크놀로지 채택 전에 해결할 수 있는 잠재적 함정을 식별하는 데 도움이 된다. 또한 평가 관행의 개선을 탐구할 기회를 마련하거나 이 검토의 다음 권고사항에 중심이 될 새로운 개발을 식별한다.

A broad range of expert, fit-for-purpose specifications and guidance should support this assessment review (Norcini et al. 2018; Boursicot et al. 2021; Heeneman et al. 2021; Torre et al. 2021). ‘Assessing assessment’ at the outset helps not just ensure that assessment is fit for purpose in its existing format but identifies potential pitfalls that can be resolved in advance of technology adoption. It also establishes opportunities to explore the enhancement of assessment practices or identifies new developments that will be central to the next recommendation of this review.

TEA를 채택하는 목적은 무엇입니까?
What is the purpose of adopting TEA?

TEA 도입에 앞서 가장 중요한 질문은, 모든 교육 테크놀로지와 마찬가지로, 이 테크놀로지가 학생들의 학습과 이를 지원하는 교수진의 능력을 어느 정도까지 향상시킬 것인가이다(Fuller and Joynes 2015). TEA의 목적이 단지 동일한 평가의 종이 버전을 '대체'하는 것이라면, 평가가 기술에 의해 '향상'될 것이라는 주장은 이미 잃어버린 것과 마찬가지다. 또한 비용이 많이 드는 실수이거나, 더 나쁜 것일 가능성이 높으며, '허영 프로젝트'로 인식될 경우 평판 훼손이 더 오래 지속된다. 대신, 교육자로서, 우리는 과정 내용, 학습 활동, 제안된 평가 및 원하는 과정 결과 간의 정렬을 살펴봄으로써 모든 잘 이론화된 교육 발전을 안내하는 원칙으로 돌아가야 한다(Biggs and Tang 2011; Villaroel et al. 2019). 학습자들은 그들이 배우기 위해 하는 일에 의미를 부여한다. 따라서 교수진은 특정 평가 방법을 구현하는 데 초점을 맞추기보다는 학습 성과 달성을 촉진하는 학습 활동과 평가 과제를 의도적으로 설계해야 한다.
The overriding question ahead of the introduction of TEA should be, as with all educational technology, to what extent will the technology enhance students’ learning and faculty’s ability to support this? (Fuller and Joynes 2015). If the purpose of TEA is only to ‘replace’ a paper version of the same assessment, the argument that the assessment would be ‘enhanced’ by technology is already lost, and could likely be an expensive mistake or worse, have longer lasting reputational damage if perceived as a ‘vanity project.’ Instead, as educators, we need to return to the principles that guide all well-theorised educational developments, looking at alignment between course content, learning activities, the proposed assessment, and the desired outcomes of the course (Biggs and Tang 2011; Villarroel et al. 2019). Learners build meaning on what they do to learn. Thus, faculty should intentionally design learning activities and assessment tasks that foster the achievement of learning outcomes, rather than focussing on implementing specific assessment methods.

[교육학에서 informed된 접근 방]식을 사용하면 팀은 테크놀로지 투자가 (일회성 맞춤형 요소든 프로그램적 접근 방식이든) 자신의 코스에 가장 유의미한 부분이 어딜지 살펴볼 수 있습니다. 그럼에도 불구하고, 단편적인 투자는 거의 지속 가능하지 않으며 학습자와 교수진이 커리큘럼의 단일 영역에서 여러 도구를 사용하는 방법을 배우도록 요청받을 위험이 있다는 점에 주목할 필요가 있다. 고부담 평가를 수반하는 경우, 학습자에게 상당한 인지 부하로 이어질 수 있다(Davies et al. 2010). 새롭고 유망한 테크놀로지가 등장할 때, 평가를 강화하기 위해 이를 도입하려는 결정은 거의 즉시 이루어지지 않으며, 잠재적으로 혁신을 지연시킨다. 그러나 동일한 우려 사항은, (테크놀로지가) 단순히 평가 측면에서 수행되고 있는 것을 '대체'하는 것을 넘어 practice를 발전시키는 데 실패했다는 것입니다.
Using an approach informed by pedagogy will enable teams to look at where investment in technology will be the most meaningful to their courses, either as a one-off bespoke element or as a programmatic approach. Nevertheless, it is worth noting that piecemeal investment is rarely sustainable and risks learners and faculty being asked to learn how to use multiple tools in a single area of a curriculum. If they involve high-stakes assessments, this can lead to a significant cognitive load on learners (Davies et al. 2010). When new and promising technology emerges, decisions to introduce it to enhance assessment are rarely immediate, potentially delaying innovation. However, of equal concern is a failure to evolve practices beyond merely ‘replacing’ what is, and has always been, done in terms of assessment.

주어진 기관에서 TEA의 목적을 고려할 때, 주목할 만한 교육적 설계를 위한 더 넓은 기회가 있다. 소규모 또는 대규모 평가 변경을 가져올 때, 예를 들어, [몰입형 설계의 도입]과 심지어 [평가의 공동 제작]을 통한 과정의 광범위한 전환 측면에서 이점을 활용할 수 있으므로 교육자와 학습자 모두가 그 결과에 투자하고 참여할 수 있습니다. 이것은 학습자들로 하여금 [평가가 자신들과 '함께' 하는 것이 아니라 '그들에게' 행해지는 것이라고 느끼게 만드는] 것을 줄여준다. 평가에 테크놀로지를 도입함으로써, 평가 프로세스를 통해 수집된 데이터를 사용하여 [어떤 학습과 피드백이 이루어지고 있는지 살펴볼 수 있는 기회]도 강화됩니다. 그럼에도 불구하고 이것은 TEA 도입의 긍정적인 부산물이지 도입의 동력이라고 보아서는 안 된다.
Within considerations of the purpose of TEA in any given institution, there are wider opportunities for an educational design that are worth noting. When bringing in either small or large-scale assessment change, it is possible to leverage benefits from the process in terms of wider course transformation through, for example, the introduction of immersive design and even co-production of assessment so that both educators and learners are invested and engaged with the result (Holmboe 2017; Cumbo and Selwyn 2022). This moves away from the perennial challenge of learners feeling that assessment is something that is done ‘to’ them, rather than done ‘with’ them. Through the introduction of technology in assessment, there are also enhanced opportunities to use the data which are gathered through the assessment processes to explore what learning and feedback is taking place. Nevertheless, this should be seen as a positive by-product of the introduction of TEA and not the driving force for its introduction.

TEA 프로세스를 개발하는 데 존재하는 광범위한 기회 내에서, 우리는 또한 그러한 도입이 가져오는 도전을 인식해야 한다. 차세대 학습자가 개인 생활에서 모바일 기기를 유창하게 사용하기 때문에 학습 및 평가에서 새로운 기술을 쉽게 수용하는 이른바 '디지털 네이티브'라는 신념을 수용하는 것을 피해야 할 필요성이 지속적으로 제기되고 있다(Tapscott 1998; Prensky 2001; Bennett et. 2008; Jones 2010; Jones et. 2010). 학습자와 교수진의 테크놀로지 몰입도는 높아졌지만, 이는 주로 [사회적/개인적 공간]에 존재한다. [일상생활에서 디지털 기술을 사용하는 것]과 [학습에서 디지털 기술을 사용하는 것] 사이의 격차는 이전 연구에서 보고되었다(Selwyn 2010; Pyörä et al. 2019). 따라서 HPE는 여전히 모든 학습자와 교육자가 필요로 하는 지원에 초점을 맞춰 TEA를 효과적으로 만들어야 합니다. 
Within the broader opportunities that exist in developing TEA processes, we must also be cognisant of the challenges such introduction brings. There is a continued need to avoid embracing the myth that the next generation of learners are so-called ‘digital natives’ who easily embrace the use of new technology in learning and assessment because they use mobile devices fluently in their personal lives (Tapscott 1998; Prensky 2001; Bennett et al. 2008; Jones 2010; Jones et al. 2010). Whilst learners and faculty have increased technology immersion, this primarily exists in their social/personal spaces; gaps between their use of digital technology in their daily life and in learning have been reported in previous studies (Selwyn 2010; Pyörälä et al. 2019). HPE therefore still needs to focus on the support that all learners and educators will need, to make TEA effective.

또한 TEA의 도입은 이미 큰 성취 격차를 더 벌릴 위험도 있다. 한 기관의 다른 [학습자 그룹 간] 또는 [기관 간]에서 발생할 수 있다(Rahim 2020; Hegazy et al. 2021). (이전 교육을 통해 또는 HPE 내에서) 더 나은 IT 시스템, 지원 및 연결성에 [이미 접근하고 있는 사람들]은 [기본적 인프라에서 불안정을 겪거나 박탈에 직면한 사람들]보다 TEA를 도입/채택하는 것이 더 쉽다는 것을 알게 될 것이다(Aristovnik et al. 2020). 기관들과 교육자들은 필연적으로 그들 자신의 지역적 과제에 집중하게 될 것이지만, TEA의 도입으로 제기되는 더 큰 질문 중 하나는 [디지털 형평성]을 촉진하는 기술 변화를 어떻게 바꿔나가고 주도할 수 있는가 하는 것이다.
There is also a risk that the introduction of TEA will widen the already large attainment gaps, between different groups of learners in an institution or between/across institutions (Rahim 2020; Hegazy et al. 2021). Those already with access to better IT systems, support, and connectivity (either through their previous education or within HPE) will find TEA easier to introduce/adopt than those who face instability or deprivation in the basic infrastructure (Aristovnik et al. 2020). While institutions and educators will inevitably be focused on their own local challenges, one of the larger questions posed by the introduction of TEA is how we could steer and drive technology change that promotes digital equity.

TEA에서 디지털 형평성의 중요성은?
The importance of digital equity within TEA?


개별 프로그램 수준에서 TEA는 모든 학습자가 필요한 테크놀로지와 온라인 테크놀로지에 대한 [동등한 접근성]을 갖도록 하기 위해 모든 학습자의 [디지털 형평성]을 보장해야 한다(Alexander et al. 2019). 따라서 온라인 평가를 구현할 때 학습자(및 교수진) 간의 기술적 차이를 제한하기 위해 디지털 형평성을 보장하는 전략이 필요하다. 전략은 학습에 사용되는 장치의 카파시티, 학습(즉, 장치 생성), 운영 체제(예: iOS, Android) 및 필요한 액세서리(예: 카메라, 마이크)를 고려해야 한다. 이 전략은 학생들의 디지털 역량이 특정 업무와 기술과 관련이 있다는 점을 감안하여 각 [온라인 평가에 필요한 디지털 역량]을 포함해야 한다(Bennett et al. 2008). TEA에 대한 디지털 형평성 보장은 한 기관의 프로그램 내에서 학습자 또는 전국적으로 기관 면허/전문 평가를 받기 위해 앉아 있는 피평가자에게 [평가 동등성]을 보장하는 중요한 단계이다(Wilkinson and Nadarajah 2021).
At an individual programme level, TEA needs to ensure the digital equity of all learners to ensure they have the required skills and comparable access to online technology (Alexander et al. 2019). When implementing online assessments, a strategy that ensures digital equity is therefore needed to limit the technological differences between learners (and faculty). Strategies need to consider the capacity of devices used for learning (i.e. the generation of devices), operating systems (e.g. iOS, Android), and accessories required (e.g. camera, microphone). The strategy ought to include the digital capabilities students need for each online assessment, given that students’ digital capabilities relate to specific tasks and technologies (Bennett et al. 2008). Ensuring digital equity for TEA is a crucial step to ensuring assessment equivalence for learners within a programme in one institution or for candidates sitting for licencing/professional assessments across institutions nationally (Wilkinson and Nadarajah 2021).

[디지털 형평성]은 학생들의 기존 기기와 디지털 역량 내에서 작동하는 온라인 평가와 새로운 테크놀로지를 구매해야 하는 학생들을 위한 능력과 비용에 이르는 기기를 나열하는 기기 사양을 통해 강화될 수 있다. BYOD(Bring Your Own Device) 평가의 성공적인 성장은 공동 생성 및 학습자 연결을 촉진하는 학습자가 보유한 커뮤니티 기반 기술의 신중한 사용에 의존했습니다(Sundgren 2017). 가정 내 온라인 평가를 포함하는 프로그램은 학습자의 고속 인터넷 연결의 용량과 안정성을 고려해야 한다.
Digital equity can be enhanced through online assessments that operate on students’ existing devices and within their digital capabilities, and a device specification that lists devices ranging in capability and cost for students who need to purchase new technology. The successful growth of BYOD (Bring Your Own Device) assessments relied on the deliberate use of community-based technologies, held by learners, that facilitate co-creation and learner connectivity (Sundgren 2017). A programme involving in-home online assessments needs to consider the capacity and stability of learners’ high-speed internet connectivity.

그러나, 세계 다른 지역에 위치한 기관들 간의 형평성을 보장하는 TEA의 능력에 대한 더 광범위한 질문이 있으며, 이는 여기서 만들어진 권고안이 [저자원 기관]을 뒤처지게 하지 않도록 하기 위해 명시적인 논의가 필요하다. 유네스코는 디지털 접근성에는 두 가지 차원이 있다고 언급했다.

  • 기술적(장치의 연결과 용량을 위한 인프라) 차원
  • 사회경제적(저렴성과 학생의 디지털 능력) 차원

[테크놀로지에 대한 불평등한 접근]과 그에 따른 TEA는 [지역사회 간 및 지역사회 내의 기존 소득 및 자원 불평등]과 관련이 있으며 이를 악화시킬 수 있다(UNESCO 2018). 인터넷 사용률이 높은 지역 내에서도 소외된 지역사회는 기회를 놓칠 수 있다. 예를 들어 뉴욕에서는 25%의 가정이 인터넷 접속이 없다(Mozilla 2017). 개별 기관만으로는 이러한 문제를 해결할 수 없을 것 같지만, TEA에서 기술 사용이 잘 될 때, 그리고 더 중요한 것은, 다른 프로그램이 비용이 많이 드는 실수를 하지 않도록 돕기 위해 다양한 기술 솔루션을 시험해 볼 수 있는 사람들이 결과를 공유하는 것이 중요합니다.
However, there are broader questions around the ability of TEA to ensure equity between institutions situated in different parts of the globe, and these need explicit discussion to ensure that recommendations made here do not leave lower resourced institutions behind. UNESCO noted that there are two dimensions to digital accessibility:

  • technical (infrastructure for connectivity and capacity of devices) and
  • socio-economic (affordability and students’ digital capabilities).

Unequal access to technologies and subsequently to TEA is linked to and can exacerbate, existing inequalities of income and resources between and within communities (UNESCO 2018). Even within areas of high internet use, marginalised communities may be missing out on opportunities; for example, in New York, 25% of homes have no internet access (Mozilla 2017). While individual institutions are unlikely to be able to solve these issues alone, it is vital that those who are able to trial different technological solutions share their results when the use of technology in TEA goes well—and even more importantly, when it goes less well, to help other programmes avoid making costly mistakes.

프로그램, 인력, 제품 및 프로세스?
Programmes, people, products, and processes?

성명서 작성자 및 워크숍 참석자 중 많은 사람의 경험에 비추어 보았을 때, 테크놀로지 채택을 준비할 때 [의도된 결과]보다는 [테크놀로지 자체]에 초점을 맞추는 경우가 많다. 이 접근 방식이 위험한 이유는 테크놀로지는 활성화자enabler가 아니라 [그 자체가 평가 향상의 초점이자 동인]이 된다는 것입니다. 이러한 접근 방식은 또한 개인적인 선호와 이전의 경험에 기초하여 특정 기술 제공자, 제품 또는 솔루션에 과도하게 초점을 맞추는 결과를 초래할 수 있다. 이를 방지하기 위해 본 권고안은 TEA를 채택할 때 포괄적인 팀 기반 접근법으로 '4P' 접근법(프로그램, 인력, 프로세스 및 제품)을 제안한다.
Based on the experiences of many of the statement’s authors and workshop attendees, considerations regarding readiness to adopt technology are often focused on the technology itself rather than the intended outcome. The risk of this approach is that the technology becomes the focus and driver of assessment enhancement rather than the enabler. This approach may also result in an over-focus on a particular technology provider, product, or solution based on personal preferences and previous experiences. To avoid this, this recommendation proposes a ‘4P’ approach (Programmes, People, Processes, and Products) as a comprehensive team-based approach when adopting TEA.

프로그램
Programmes

첫 번째로 [맥락과 교육적 요구]의 프레임에 넣어야 한다. 평가 Blueprint는 현재 구현 격차, 기술 솔루션(있는 경우), 리스크 평가 및 필요한 리소스를 포함하도록 더욱 확장될 수 있습니다. 위험 평가에는 규제 준수에 대한

  • 로컬(새로운 형식/승인 일정을 변경/도입하는 과제)과
  • 외부(해당되는 경우 국가 및/또는 규제 요건에 대한 지속적인 준수) 및
  • 자원(기반시설, 하드웨어 또는 소프트웨어 업그레이드)이 포함되어야 한다.

the first area of consideration should frame the context and educational need. Assessment blueprints can be further expanded to include

  • current implementation gaps,
  • technological solutions (if any),
  • risk assessment, and
  • resources needed.

Risk assessments should include

  • the impact on regulatory compliance locally (challenges of switching/introducing new formats/approval timelines) and
  • (compliance) externally (where appropriate, continued compliance with national and/or regulatory requirements), and
  • resources (upgrading infrastructure, hardware, or software).

사람
People

성공적인 구현을 이루려면, 변화 관리의 우선 순위는 항상 사람에게 집중됩니다(Er et al. 2019). 평가 강화와 관련하여 참여해야 할 인력은 [교수진, 전문 지원 인력(예: 시험장, IT) 및 학생] 등 세 그룹으로 구성됩니다. 이 계약에는 개선과 관련된 새로운 스킬과 관련된 교육 및 파일럿 개발 후 피드백을 제공할 수 있는 기회가 포함되어야 합니다. 마찬가지로, 학습자와 전문 지원 인력의 참여는 끝이 아니라 [프로젝트의 시작]에 참여해야 합니다. 학생들은 평가 향상과 협력하거나 공동 개발을 위해 성공적으로 협력할 수 있다(Er. et al. 2019, 2020).
Priorities for change management always focus on people, as their buy-in, participation, and feedback are crucial for successful implementation (Er et al. 2019). In the context of enhancing assessments, there are three groups of people to engage with: faculty, professional support staff (e.g. exam office, IT), and students. It is critical that this engagement includes training related to any new skill sets related to the enhancement and opportunities to give feedback after pilot developments. Similarly, the engagement of learners and professional support staff should be genuine, with their involvement at the start of the project rather than the end. Students can be successfully co-opted to partner with or co-develop the assessment enhancements (Er et al. 2019, 2020).

과정
Processes

평가를 효율적으로 구현하기 위해 관련 이해 관계자들 간에 공유해야 하는 [내부 프로세스]가 있습니다. 그러나 평가를 위해 테크놀로지가 사용되거나 추가될 때, 종종 파편적이거나 직접적인 '잘라서 붙여넣기 접근법'(전환)을 하는 함정에 빠질 수 있다. [평가 데이터 관리]는 특히 이러한 프로세스의 변화에 민감할 수 있습니다. 다양한 레벨에서 [평가 데이터 거버넌스, 보안, 전송 및 보고]에 대한 테크놀로지 향상의 영향을 검토하면 데이터 [상호 운용성]을 지원하고, 테크놀로지 평가의 실패 위험을 줄일 수 있습니다.

To implement assessments efficiently, there are internal processes that should be shared across relevant stakeholders. However, when technology is used or added for assessments, process change pitfalls often include piecemeal or direct ‘cut and paste approaches’ (transmediation). Assessment data management can be particularly susceptible to changes in such processes. A review of the impact of the technology enhancement on assessment data governance, security, transfer, and reporting at different levels can help enable data interoperability and reduce risks of technology assessment failure.

상품들
Products

기술 제품의 선택은 [업무 범위, 접근성, 기관의 지불가능성]에 따라 달라집니다. 전자에 기반한 평가는 제품을 개발하기 위해 외부 조직과 구매, 구축 또는 파트너 관계를 결정하는 것으로 이어질 수 있습니다. 모든 제품을 선택할 때, 기존의 제도적 기술(예: MS Office와 같은 일상적 제품의 모든 능력을 더 잘 활용할 수 있는 기회)과 이미 개인 및 전문 학습을 지원하기 위해서 이용할 수 있는 광범위한 테크놀로지를 갖춘 '현대 전문 학습 도구 키트'의 개념을 신중하게 고려할 필요가 있다. (Hart 2021).
The selection of the technology product depends on its alignment to the scope of work, accessibility, and affordability to the institution. An evaluation based on the former can lead to the decision to buy, build or partner with an external organisation to develop the product. In the selection of any product, careful consideration needs to be given to the utilisation of existing institutional technology (e.g. opportunities to better leverage the full abilities of everyday products, such as MS Office) and the concept of the ‘modern professional learner’s toolkit’ with an extensive range of technology already available to support personal and professional learning (Hart 2021). 

https://www.toptools4learning.com/

2단계: '평가 라이프사이클' 내 기술 적용
STAGE 2: Applying technology within the ‘assessment lifecycle’

이 논문은 다른 최근의 오타와 합의 진술과 함께 기술을 통한 평가 향상을 안내하는 핵심 원칙의 프레임워크를 제공한다. 보다 광범위한 고등교육 평가 라이프사이클 모델을 지원으로 채택하는 것은 의도적인 것으로, 이 합의의 다중 교육 맥락에 대한 적용 가능성을 극대화한다. 라이프사이클은 평가의 이해관계와 목적에 관계없이 평가에 관련된 모든 핵심 프로세스에 대해 쉽게 식별할 수 있는 '헬리콥터 뷰'를 제공합니다. 라이프사이클 프로세스는 반복적이며, 평가 설계, 스케줄링 및 전달을 무결성 및 행동, 조정 및 학생 진행 추적(JISC 2016)을 둘러싼 주요 학문적 프로세스까지 포괄하는 품질 개선 접근 방식을 가능하게 합니다. 그림 1에 나타난 바와 같이:
In keeping with other recent Ottawa consensus statements, this paper provides a framework of core principles to guide the enhancement of assessment with technology. Adopting a broader Higher Education assessment lifecycle model as support is intentional, maximising the applicability of this consensus to multiple educational contexts. The lifecycle provides a readily identifiable ‘helicopter view’ of all key processes involved in assessment, whatever the stakes and purpose of the assessment. The lifecycle process is iterative, enabling a quality improvement approach that spans assessment design, scheduling, and delivery through to key academic processes surrounding integrity and conduct, moderation, and student progress tracking (JISC 2016). As demonstrated in Figure 1:

 

이 라이프사이클 접근 방식은 [평가 '도구']에서 [우수한 평가의 시스템과 프로그램], 특히 프로그램 평가에서 볼 수 있는 [전체론적 접근 방식]으로 HPE의 초점 변화를 반영한다(Heeneman et al. 2021). 의료 교육에서 라이프사이클은 OSCE와 같은 복잡한 평가 개입의 설계 및 전달에도 성공적으로 적용되었다. TEA의 컨텍스트에 적용되는 라이프사이클은 [5가지 핵심 초점]과 적용 대상을 제공합니다.

  • 평가의 Authenticity 향상(대원칙)
  • 학습자를 평가에 참여시킵니다.
  • 설계 및 스케줄링을 강화한다.
  • 평가 전달 및 학습자 성과 기록을 최적화한다.
  • 학습자 진행 과정 및 교수진 활동을 트래킹한다 —종방향 학습 및 지속적인 평가 지원.


This lifecycle approach reflects the changing focus in HPE from assessment ‘tools’ to systems and programmes of good assessment, particularly the holistic approach seen in programmatic assessment (Heeneman et al. 2021). Within medical education, the lifecycle has also been successfully applied to the design, and delivery, of complex assessment interventions, such as the OSCE. Applied to the context of TEA, the lifecycle provides five key foci, and targets for application:

  1. Advancing authenticity of assessment (an overarching principle)
  2. Engaging learners with the assessment
  3. Enhancing design and scheduling
  4. Optimising assessment delivery and recording of learner achievement
  5. Tracking and learner progress and faculty activity—supporting longitudinal learning and continuous assessment.

합의된 직접 워크숍의 피드백과 이론 정보를 바탕으로 한 실천 혁신 보고서의 가치에 따라, 이러한 원칙은 합의된 저작자로부터 도출된 일련의 모범 사례로 보완된다. 언제든지 교육 혁신을 도입하는 것이 도전이라는 것을 인식하면서(그리고 이러한 예들은 전염병 시대/대유행 시대에는 더욱 그렇다), 영감을 주는 동시에 잠재적 템플릿으로 기능하는 것을 목표로 하며, 위에서 설명한 기준에 따라 정의된 TEA의 기존 우수 관리 사례에 대한 [사례 연구]를 제공한다. 모든 예가 모든 맥락에서 작동하는 것은 아니지만, 독자들이 자신의 환경에서 작동하도록 적응될 수 있는 모든 사례 연구와 지원 문헌의 요소를 찾을 수 있기를 바란다. 형평성에 관한 합의의 모범 사례 조언에 따라, 사례 연구는 의도적으로 이러한 목적을 위한 하나의 '최고의' 기술을 의미하지 않는다. 각 위치에서 작동하는 실제 하드웨어 및 소프트웨어는 기존 기관 인프라와 투자에 의존하며, 이는 맥락에 관계없이 교육자가 전 세계적으로 작업하는 범위를 제한합니다.
Following feedback from consensus in-person workshops, and the value of theory-informed, practice innovation reports, these principles are supplemented by a series of good practice exemplars are drawn from the consensus authorship. Recognising that introducing educational innovation at any time is a challenge (and arguably more so in peri/post-pandemic times), these exemplars aim to serve both as inspiration and a potential template, providing case studies of existing good practice in TEA as defined by the criteria outlined above. Not all the examples will work in all contexts, nevertheless, it is hoped that readers will be able to find elements of all the case studies and supporting literature that could be adapted to work in their own environments. Following the consensus’ best practice advice in relation to equity, case studies deliberately do not imply one ‘best’ technology for this purpose. The actual hardware and software that works in each location depend upon existing institutional infrastructures and investment, confines under which educators work globally, regardless of context.

원칙 1: 평가의 진정성 제고
Principle 1: Advancing assessment authenticity

커리큘럼의 적절한 단계 및 관련 역량과 일치하는 ['진짜Authentic' 평가] 과제의 설계는 학습자 참여 및 품질 평가의 초석입니다. 기술이 이러한 과제를 추가로 개발하기 위해 사용될 때(예: 가상 현실 시뮬레이션의 도입) 학습자 참여 및 기술 혁신의 잠재적 이점은 [의도하지 않은 다른 구조(테크놀로지 친숙성/네비게이션 요구 포함)]의 도입으로 상쇄될 수 있다. 교육 연구는 'Authentic' 과제에 대한 참여와 평가가 진정으로 고립 상태에서 과제를 숙달하는지, 아니면 실천과 진정한 학습자 개발에 더 통합적으로 적용하는지 여부를 계속 조사한다(Wiliam 2021). 따라서 HPE에서의 TEA 개발은 [교육적, 기술적, 임상적]으로  '진정성 인터페이스authenticity interface'를 어떻게 연결하는지 비판적으로 검토할 필요가 있다.
The design of ‘authentic’ assessment tasks, aligned with the appropriate stage of a curriculum and relevant competencies, is a cornerstone of learner engagement and quality assessment. When technology is used to develop these tasks further (e.g. introduction of virtual reality simulation), the potential benefits of enhanced learner engagement and innovation may be offset by the unintentional introduction of different constructs (including familiarity/navigation requirements of the technology). Educational research continues to examine whether engagement in, and assessment of, ‘authentic’ tasks truly leads to mastery of the task in isolation, or more integrative application to practice and true learner development (Wiliam 2021). The development of TEA in HPE, therefore, needs to critically examine how it bridges the ‘authenticity interface’ of pedagogy, technology, and clinical practice.

[교육학적]으로, 평가의 초점은 [학습의 평가]만을 유일한 초점으로 가지고 있다가 [학습을 위한 평가]라는 더 큰 표현으로, 더 나아가 '지속 가능한 평가sustainable assessment'로 계속 전환되고 있다(Boud 2000). 목표는 학생들의 [오늘날 성적]에 대한 점수를 주는 것뿐만 아니라 그들의 [미래 학습과 자기 조절 학습 기술]의 성장을 지원하는 것, 그들이 스스로 [학습 목표를 설정하고 그들의 지식, 기술 및 행동을 모니터하는 능력]이다. [지속가능한 평가]는 학생이 교육 환경뿐만 아니라 미래의 직장 생활 전반에 걸쳐 자신의 성과를 평가하는 능력을 배워야 한다고 강조한다(Boud 2000; Boud and Soler 2016).

Pedagogically, the focus of assessment continues to shift from a sole focus of the assessment of learning to a greater representation of assessment for learning and thus to ‘sustainable assessment’ (Boud 2000). The goal is not only to give grades on the students’ performance today but to support their future learning and growth of self-regulated learning skills, the ability to set goals for their learning, and monitor their knowledge, skills, and behaviour. Sustainable assessment emphasises that the student should learn the ability to assess their own performance not only in their educational settings but throughout their future working lives (Boud 2000; Boud and Soler 2016).

TEA에서, 이것은 우리가 평가 도구의 측정과 테크니컬한 개발에 초점을 덜 맞추고, 진정한 학습/직장 맥락에서 학생 학습을 촉진하는 질적이고 인격화된personified 평가에 더 큰 초점을 맞추어야 한다는 것을 의미한다. 평가 도구와 더불어서, [평가의 결과]로 [메타인지 기능과 학생 참여를 고려하는 대안적alternative 학습 분류법]을 사용하면 Authentic tools의 선택과 설계에 정보를 제공할 수 있다. Higher and Continuous Education의 광범위한 경험과 평가에 대한 접근 방식은 다음과 같은 대안적인 평가 형식을 위한 추가적인 유용한 리소스입니다.

  • 오픈 북 및 테이크아웃 평가(예: Sambell 및 Brown 2021),
  • 교사가 학생의 진도를 추적하는 동시에 학습자가 학습 진도와 계획 개선에 대한 판단을 내릴 수 있는 능력을 개발할 수 있도록 지원하는 평가 도구(말레카 및 Boud 2021).

In TEA, this means that we should ensure less focus on the measurement and technical development of assessment tools, and a greater focus on the qualitative and personified assessment fostering student learning in authentic learning/workplace contexts. The use of alternative learning taxonomies that consider metacognitive function and student engagement as a result of the assessment, alongside assessment tools, can inform the selection and design of authentic tools (Marzano and Kendall 2007; Villarroel et al. 2018). The wider experiences of, and approaches to, assessment in Higher and Continuing Education are an additional useful resource for alternative assessment formats including

  • open book and takeaway assessments (e.g. Sambell and Brown 2021), and
  • assessment tools that help teachers track their students' progress whilst allowing learners to develop their own capacity to make a judgement about their learning progress and plan improvement (Malecka and Boud 2021).

[테크니컬하게], TEA는 교육 테크놀로지 개발에 inform하는 핵심 원칙을 활용하여, '네비게이션' 문제는 최소화하고, 학습자와 교직원을 설계의 중심에 두어야 합니다(Divami 2021). 평가가 다음의 특징을 갖도록 설계되어야 한다.

  • 기회적 (예: 광범위한 환경에서 WBA를 지원하기 위한 스마트폰 사용)
  • 몰입적 (예: 학습자가 자체 및 그룹 평가 기회를 만들 수 있음)
  • 연결적 (학습 조직 내 개인화 및 연결성 향상—예: 전공의의 성찰을 촉진하기 위한 스마트폰 앱/코칭 그룹)

Technically, TEA should leverage key principles that inform educational technology development, minimising ‘navigation’ issues and place learners and faculty at the heart of design (Divami 2021). Design should allow the assessment to be

  • opportunistic (e.g. the use of smartphones to support WBA in a wide range of settings),
  • immersive (e.g. allowing learners to create their own self- and group assessment opportunities), and
  • connected (allowing personalisation and connectivity within learning organisations—e.g. smartphone apps/coaching groups to promote reflection by residents) (Konings et al. 2016).

[임상적]으로 TEA가 기술 지원 의료에 대한 현재 및 새로운 접근 방식과 효과적으로 상호 작용할 수 있는 상당한 기회가 있습니다. HPE 평가에서 현재 교육 테크놀로지는 많은 경우에 ([개인, 그룹 및 인구의 관리를 강화하기 위해 테크놀로지가 어떻게 사용되는지에 맞추는 기회보다는]) 전달delivery에만 초점을 맞추고 있다. 예를 들어, 평가 기회를 안내하기 위해 다음과 같은 간단한 프레임워크를 제안합니다.
Clinically, there are significant opportunities for TEA to interface effectively with current and emerging approaches to technology-enabled healthcare. Much of the current focus of educational technology in HPE assessment focuses on delivery, rather than an opportunity to align to how technology is used to enhance the care of individuals, groups, and populations. For example, we suggest the following simple framework to guide assessment opportunities:

장치 증강 치료
Device augmented care

많은 의료 시스템에서 [종이 없는 의료 시스템]과 클라우드 기반 '공유 진료shared care'의 출현은 온라인 상담, 커뮤니케이션 및 의사 결정에 필요한 빠른 [업스킬링]을 강조한다(Greenhalgh et al. 2016; Darnton et al. 2021). 학부생과 전문가 모두를 위한 침상 진단 및 치료 절차로서의 침상 초음파의 출현과 성장은 TEA 개발의 목표를 제공한다(McMenamin et al. 2021).
In many health systems, the advent of paperless healthcare systems and cloud-based ‘shared care’ (e.g. Philips 2021) spotlight the rapid upskilling needed for online consultation, communication, and decision making (Greenhalgh et al. 2016; Darnton et al. 2021). The advent and growth of bedside ultrasound as a bedside diagnostic and therapeutic procedure for undergraduates and professionals alike provides targets for TEA development (McMenamin et al. 2021).

환자 및 전문가에 대한 기대 및 보건 기술 사용능력
Expectations, and health technology literacy, of patients and professionals

빠르게 변화하는 치료 속도는 HPE 학습자와 전문가의 글로벌 커뮤니티가 [끊임없이 변화하는 가이드라인, 프로시저 및 약물을 사용하여 치료를 제공한다]는 것을 의미하며, 이를 위해서는 [온라인 리소스에 대한 적시 액세스]와 [지속적인 전문 개발CPD]이 필수적이다. 환자 치료의 일환으로 [그러한 자원에 '언제, 왜, 어떻게' 접근하는지를 입증하는 것]이 평가의 중요한 대상이 되어야 한다.
A rapidly changing pace of care means the global community of HPE learners and professionals will deliver care using constantly changing guidelines, procedures, and drugs, where timely access to online resources and continuing professional development are essential. Demonstrating ‘when, why, and how’ such resources are accessed as part of patient care should be a critical target for assessment.

상태 분석 및 리스크 커뮤니케이션
Health analytics and risk communication

[빅 데이터와 딥 머신 러닝]의 사용은 건강에 점점 더 기여하고 알고리즘과 의사 결정을 안내하며 진단에 기여한다(Rajpurkar et al. 2022). [공유된 환자-전문가 상담 모델] 내에서 [위험 커뮤니케이션, 디지털 사용능력 및 의사 결정]을 통합하는 평가를 설계하면 AI의 기회와 한계에 대한 지속적인 논의를 수용하면서 매우 정통한 평가 작업에 대한 기회를 제공한다(원칙 5).
The use of big data and deep machine learning increasingly contribute to health, guiding algorithms and decision making, and contributing to diagnosis (Rajpurkar et al. 2022). Designing assessments that integrate risk communication, digital literacy, and decision making within shared patient-professional consultation models provide opportunities for highly authentic assessment tasks, accepting the ongoing debate about the opportunities and limitations of AI (Principle 5).

 

원칙 2: 학습자를 평가에 참여시킵니다.
Principle 2: Engaging learners with assessment

이상적인 교육 프로그램에서, 학습자는 (중요하다고 인식할 때뿐만 아니라) [언제나] 학습 프로그램 전반에 걸쳐 평가에 완전히 참여합니다. 합의 전반에 걸쳐 제시된 각 모범 사례 연구의 헤드라인 원칙은 비동기성과 연결의 기회가 주어지면 학습자 참여를 TEA를 통해 더 잘 촉진할 수 있다는 것을 강화한다. [능동적인 학습자 참여]는 [심층 학습]과 [성취 및 활동 측정 및 모니터링을 위한 기술 사용(예: 가상 학습 환경을 통한)]과 강하게 연관되어 있으며, 평가 성과에서 [초기 및 지속적인 학습자 참여의 중요성]을 강조한다(Korhonen 2021). 이 첫 번째 사례 연구에서 Webb와 Valter는 평가에 대한 참여와 창의성을 개선하고 재사용 가능한 학습 리소스를 개발하며 학습자 그룹을 연결하는 단순하고 쉽게 사용할 수 있는 기술의 힘을 입증합니다.

In an ideal educational programme, learners would always be fully engaged with assessment throughout their programmes of study (not just when they perceive it matters). The headline principle for each of the good practice case studies presented throughout the consensus reinforces that learner engagement can be facilitated better through TEA given the opportunities for asynchronicity and connectivity. Active learner engagement is strongly associated with deeper learning (Villarroel et al. 2019) and achievement and the use of technology (e.g. through virtual learning environments) to measure and monitor activity highlights the importance of both early, and sustained learner engagement in assessment outcomes (Korhonen 2021). In this first case study, Webb and Valter demonstrate the power of simple, readily available technology to improve participation and creativity in assessment, develop reusable learning resources, and connect groups of learners:


사례 연구 1
Case Study 1

유튜브 세대를 위한 평가: [학생이 만든 해부학 비디오]에 대한 사례 연구(Alex Webb & Chrisztina Valter, 호주 국립 대학교)
Assessment for the You-Tube generation: a case study on student-created anatomy videos (Alex Webb & Krisztina Valter, Australian National University)

맥락
Context

우리는 선생님이 제공한 5가지 옵션 목록에서 선택한 [해부학 주제에 대한 2000단어 개별 에세이 평가]를 현대화하려고 했다.
We sought to modernise a 2000-word individual essay assessment on anatomy topics chosen from a list of five options provided by the teacher.

우리가 달성하려고 했던 게 뭐죠?
What were we trying to achieve?

우리는 주제에 대한 학생 질문을 자극하고 일반적으로 사용 가능한 기술을 사용하는 자체 지식 표현의 구성을 촉진하기 위해 평가 과제를 다시 설계했다. 또한 이 과제가 학생들의 선택권을 부여하고, 학습을 재미있게 하며, 학생들이 창의적으로 할 수 있도록 하며, 학생들이 동료들과 쉽게 공유할 수 있는 결과물을 생산할 수 있는 기회를 제공하는 것도 중요했다. 게다가, 우리는 더 적은 시간 안에 더 즐겁게 채점를 할 수 있기를 바랐습니다!
We re-designed the assessment task to stimulate student interrogation of the topic and construction of their own knowledge representations utilising commonly available technology. It was also important that the task empowered student choice, made learning fun, allowed students to be creative, and provided an opportunity for students to produce outputs that could easily be shared with peers. In addition, we hoped to make marking more enjoyable in less time!

우리가 한 일
What we did

학생들은 5명으로 구성된 스스로 선택한 그룹의 해부학적 주제에 대한 5-7분짜리 재미있는 교육 비디오를 만들어야 했다. 각각의 비디오는 선생님들에 의해 채점되었다. 비디오는 평가와 수정을 위해 전체 코호트에 제공되었다.
Students were tasked to create a 5–7-min entertaining educational video on an anatomy topic of their choice in self-selected groups of five. Each video was graded by the teachers. The videos were provided for the whole cohort for evaluation, and for their revision.

영향의 지속적인 평가
Ongoing evaluation of impact

대다수의 학생들이 이 활동을 즐겼으며(93%) 이 활동을 통해 주제에 대한 이해도(90%)가 향상되는 것으로 나타났다. 주제를 연구하고 지식을 통합할 수 있는 기회가 학습에 도움이 되는 핵심 요소였습니다. 하지만, 시간과 새로운 기술을 배우는 것은 그들의 학습에 방해가 되었다. 교사들에게는, 채점하고 피드백을 제공하는 것이 더 효율적이고 즐거웠습니다.
The majority of students enjoyed the activity (93%) and found that it improved their understanding of the topic (90%). The opportunity to research the topic and consolidate their knowledge were key factors aiding their learning. However, time and learning a new technology detracted from their learning. For teachers, marking and providing feedback were more efficient and enjoyable.

테이크홈 메시지
Take home message

비디오를 만드는 과정은 학생들이 동료들과 쉽게 공유할 수 있는 그들 자신의 학습을 돕기 위해 해부학적 개념에 대한 그들 자신의 표현을 구성하기 위해 팀으로 일할 수 있는 재미있고 자극적인 기회를 제공했다.The process of creating videos provided students with a fun and stimulating opportunity to work as a team to construct their own representations of anatomical concepts to aid their own learning, which can be easily shared with peers.


이 사례는 학습자가 평가 과정에 참여하는 강력한 사례로, '하면서 배우는 것을 선호하는' 세대를 위한 평가 적응에 있어 최상의 원칙(Marzano와 Kendall 2007)과 학습자가 학습하기 위해 하는 일에 의미를 구성한다는 원칙(Biggs와 Tang 2011)을 보여준다. 이러한 작업(평가 지분 범위에 적응할 수 있음)은 [공동 제작 콘텐츠 생성]의 추가적인 이점을 가지고 있으며, 그 결과 다음 코호트에 대한 교육 및 평가 참여를 향상시키는 데 사용될 수 있는 [리소스 뱅크]가 생성된다. 건강 인문학적 관점에서, 이러한 과제들은 또한 학생들이 평가를 통해 창의적 역량을 발휘할 수 있게 한다.
The case study is a powerful example of learner engagement with the assessment process, demonstrating the best principles in adapting assessment for a generation who ‘prefer to learn by doing’ (Marzano and Kendall
 2007) and the principle that learners construct meaning on what they do to learn (Biggs and Tang 2011). Such tasks (which can be adapted to a range of assessment stakes) have the additional benefit of co-produced content creation, resulting in a bank of resources that can then be used to enhance teaching and assessment engagement for the following cohort. From a health humanities perspective, such tasks also enable students to demonstrate their creative capacities through assessment.


[디지털 및 지리적 형평성 관점]에서 TEA는 국경을 넘어 교육자와 학습자 간에 낮은 [저부담 평가 포맷]을 공유할 수 있는 무한한 가능성을 제시합니다. 단순하고 확립된 기술의 사용은 종종 학습자가 (컴퓨터나 노트북이 아닌) 비교적 [기본적인 스마트폰 장치]만을 접근/보유하는 것으로도 충분하다. 인구와 관련된 장치의 보급을 고려할 때 2014년에 전세계적으로 실현 가능한 것으로 간주되었다. 현재 테크놀로지는 모든 모바일 장치에서 현재 보편화된 필기, 오디오 또는 'STT' 기능을 통해 [무엇이 잘 진행되고 있는지, 무엇을 개선할 수 있는지, 어떻게 다음 단계로 나아갈 수 있는지]에 대한 생각을 순간적으로 요청하고 기록할 수 있는 기회를 제공할 수 있습니다(Tuti et al. 2020). 이러한 기회는 실제로 학습자 주도적이고 실행 가능한 피드백의 확립된 이론적 원칙을 기반으로 평가와 학습 행동을 긍정적으로 형성할 수 있는 기술의 힘을 열어줍니다(Sadler 2010; Boud and Molloy 2013).
From a digital and geographical equity perspective, TEA presents endless possibilities to share low-stakes assessment formats between educators and learners across borders. The use of simple, established technology often requires learners only to access/hold a relatively basic smartphone device (rather than a computer or laptop); something which was considered to be feasible worldwide in 2014, given the prevalence of devices in relation to the population (International Telecommunication Union 2014 in Fuller and Joynes 2015). Technology can present opportunities to engage learners differently with feedback; offering quicker ways to request and record in the moment thoughts on what is going well, what can be improved, and how to progress to the next level, through written, audio, or ‘speech to text’ functions now common in all mobile devices (Tuti et al. 2020). Such opportunity really opens up the power of technology to positively shape both assessment and learning behaviours, building on established theoretical principles of learner-driven, actionable feedback (Sadler 2010; Boud and Molloy 2013).

원칙 3: 평가 설계 및 스케줄링 개선
Principle 3: Enhancing design and scheduling of assessment

지난 10년간의 많은 기술 발전은 특히 품질 또는 유효성 렌즈를 통해 볼 때 HPE 평가에 대한 접근 방식의 상당한 개발을 가능하게 했다(St-Onge et al. 2017). 소프트웨어는 이제 개인, 기관, 컨소시엄 및 국가 수준에서 [지식 시험 문제은행(예: 단일 모범 답안 형식)]의 창설을 지원하기 위해 일상적으로 사용된다. 평가 문항을 설계하고 공유하기 위해 평가 컨소시엄 내에서 [원격 작업]하는 것은 상당한 비용 절감과 효율성을 제공하며, 항목의 정교한 [태깅]은 테스트 생성과 해당 구성 정렬에서 틀림없이 더 나은 품질을 가능하게 한다(Kickert et al. 2022). 문항의 개발, 수정 및 은행 업무와 관련된 상당한 비용은 현재 [자동 문항 생성]의 잠재력에 의해 도전받고 있다(Lai et al. 2016).
Many of the technological developments of the last decade have enabled considerable development of approaches to HPE assessment, particularly when viewed through a quality, or validity lens (St-Onge et al. 2017). Software is now used routinely to support the creation of knowledge test item banks (e.g. for single best answer formats) at the individual, institutional, consortia, and national levels. Working remotely within assessment consortia to design and share assessment items presents substantial cost savings and efficiencies, and sophisticated tagging of items allows arguably better quality in the creation of tests and their constructive alignment (Kickert et al. 2022). The substantial costs associated with the development, emendation, and banking of items are now being challenged by the potential of automatic item generation (Lai et al. 2016).

성과 평가에서 TEA의 사용은 임상 실습에서 보다 학습자 중심의 기회주의적 성과 평가 문화를 개발할 수 있는 기회를 제공하는 WBA(Work Based Assessment) 형식을 사용하는 데 특히 영향을 미쳤다. 프로그램 수준 [WBA의 기관 및 국가 모델]은 [테크놀로지 기반 플랫폼과 테크놀로지 기반 포트폴리오]를 사용하여 환자 치료 시에 평가(기회)를 잡아낸다. 이러한 발전의 대부분은 'BYOD(Bring Your Own Device)' 모델(Sundgren 2017)을 사용하여 이루어졌지만, 기회의 불평등을 방지하고 섹션 배경에서 강조했듯이 이러한 접근 방식을 지원할 수 있는 충분한 인프라를 확보할 수 있도록 주의를 기울여야 합니다.

The use of TEA within performance assessment has been particularly impactful using Work Based Assessment (WBA) formats, presenting opportunities to develop more learner-centred, opportunistic cultures of performance assessment in clinical practice. Institutional and national models of programme level WBA operate using technology-based platforms and technology-based portfolios (van der Schaaf et al. 2017; NHS eportfolios 2021), with the use of mobile devices to capture assessment at the point of patient care (Joynes and Fuller 2016; Harrison et al. 2019; Maudsley et al. 2019). Much of this advancement has been facilitated using ‘Bring Your Own Device’ (BYOD) models (Sundgren 2017) but care needs to be taken to avoid inequity of opportunity and to ensure sufficient infrastructure to support these approaches as highlighted in Section Background.

학습자의 개인과 코호트 수준 [진전을 일상적으로 포착하는 평가 관리 시스템]의 성장은 평가에 대한 새로운 접근 방식을 설계하기 위해 [대규모 데이터 세트]를 의미 있게 사용할 수 있게 했다. 평가 프로그램(Pell et al. 2012)에서 [보더라인과 저성과자의 결과를 종단적으로 추적하는 작업]은 평가 품질에 미치는 영향을 점점 더 입증하는 [데이터 중심 순차적 테스트sequential testing 형식]의 구현을 지원했다. [적응형 지식 시험 시스템]을 지원하는 작업은 잠재적으로 고도로 개인화된 응용 지식 테스트 및 피드백의 출현을 보여준다(Collares and Cecilio-Fernandes 2019).
The growth in assessment management systems that routinely capture individual, and cohort level progress of learners has enabled meaningful use of large data sets to design newer approaches to assessment. Work to track the longitudinal consequences of borderline and underperformance in programmes of assessment (Pell et al. 2012) has supported the implementation of data-driven Sequential Testing formats (Pell et al. 2013; Homer et al 2018), which are increasingly demonstrating impact on assessment quality. Work supporting adaptive knowledge testing systems demonstrates the emergence of potentially highly personalised applied knowledge testing and feedback (Collares and Cecilio-Fernandes 2019).

[온라인 테스트에 대한 대규모 글로벌 경험](그리고 단일 모범 답안 형식의 전통적인 사용을 통한 '클로즈드 북' 형식 테스트의 과제)은 오픈 북 테스트 형식과 기술이 가져올 수 있는 기회에 대한 새로운 관심을 불러일으켰다. 이전에는 HPE 내에서 지배적인 평가 형식은 아니었지만, 의학 교육 및 특히 더 광범위한 교육에서 Open Book 또는 'Take home/take away' 테스트 형식의 사용에 대한 실질적인 증거가 있다. 이런 시험이 '클로즈드 북' 형식을 대체하는 것에 대한 방대한 실무 경험이 쌓이기 시작한 것이다. 주장하건대, 이것은 개별적으로 또는 그룹으로 연구와 합성이 필요한 복잡한 문제(예: 많은 보건 문화, 특히 복잡한 임상 결정을 위해 일하는 다학제 팀의 사용에 맞춰 조정)를 설계하고 학습자가 해결해야 하는 매우 정통한 평가 접근 방식을 제시한다. 테크놀로지는 '책'(예: 모바일 기기)을 재정의할 수 있는 실질적인 레버리지를 제공합니다. 사례 연구 2에서 입증되었듯이, [학습자가 어떻게 검색 전략을 개발 및 운영하고, 다른 사람과 협업/연결하여 문제를 해결하는지]를 모니터링하고 이해할 수 있는 잠재력은 '저부담' 평가를 위한 새로운 기회를 제공합니다.
Large scale, global experience of online testing (and the challenges of ‘closed book’ format testing, e.g. through traditional use of Single Best Answer formats) have renewed interest in Open Book test formats and the opportunities that technology may bring (Zagury-Orly and Durning 2021). Whilst previously not a dominant assessment format within HPE, there is substantial evidence about the use of Open Book or ‘take home/take away’ test formats within both medical education (Westerkamp et al. 2013; Durning et al. 2016; Johanns et al. 2017), and particularly within wider education (Bengtsson 2019; Spiegel and Nivette 2021), with extensive practical experience on replacement of closed book formats (Sambell and Brown 2021). Arguably, this presents a highly authentic approach to assessment which challenges faculty to design, and learners to solve, complex problems that require research and synthesis, either individually or in groups (e.g. aligning to the use of multi-disciplinary teams working in many health cultures, particularly for complex clinical decisions). Technology presents a real lever to redefine the ‘Book’ (e.g. a mobile device). The potential to monitor and understand how learners develop and operate search strategies and collaborate/connect with others to solve problems provides new opportunities for ‘lower stakes’ assessments, as demonstrated in Case Study 2.


사례 연구 2
Case Study 2

오픈 북 온라인 평가: 보건 전문 프로그램에 걸친 제도적 구현 사례 연구(국제 의학 대학, 말레이시아)
Open Book Online Assessments: A case study of institutional implementation across health professions programmes (International Medical University, Malaysia)

맥락
Context

그 대학은 2018년에 건강 전문 프로그램에 대한 온라인 평가 시스템(OAS)을 시행했다. OAS는 문제 개발, 시험 후 분석을 통한 지식 기반 및 OSCE 평가 전달, 학습 결과에 기반한 개별 학생 보고서를 제공한다는 점에서 포괄적이었다. COVID-19 팬데믹의 초기 단계에서 OAS는 학생과 교직원을 위한 오프사이트 온라인 시험 플랫폼으로 수정되었다.
The university implemented an online assessment system (OAS) for its health professions programmes in 2018. The OAS was comprehensive in that it allowed for question development, delivery of knowledge-based and OSCE assessments with post-exam analysis, and individual student reports based on learning outcomes. During the early phase of the Covid-19 pandemic, the OAS was modified to be an offsite online test-taking platform for students and staff, as the physical campus space was unable to be used for assessments due to national lockdown restrictions.

우리가 이루려고 했던 것은
What we were trying to achieve

OAS에 프록토링 기능이 없었기 때문에, 오프사이트 온라인 평가를 활성화할 수 없었고, 이러한 적응에서 새로운 문제가 발생했다. 코로나 19로 인한 교수 및 학습 활동의 변경과 비-프록토링 평가가 학생 진행에 미치는 위험을 고려하여, 우리는 저부담 시험에 대한 기존 평가 형식을 사용하여 온라인 비-프록토링non-proctored 시간 기반 오픈 북 평가를 구현했다. 오픈북 시험은 학습 결과에 대해 청사진으로 작성된 지식 응용 항목 형식을 사용했다.
A new challenge emerged from this adaptation as we were unable to invigilate the offsite, online assessment as no proctoring feature existed in the OAS. Given the modifications to teaching and learning activities due to Covid-19 and the risks of non-proctored assessment on student progression, we implemented an online, non-proctored time-based open book assessment using existing assessment formats for low stakes exams. Open book assessments used knowledge application item formats which were blueprinted against learning outcomes.

영향의 지속적인 평가
Ongoing evaluation of Impact

오프사이트 온라인 테스트를 실시한 1차 구현에서는 학생의 데이터 용량 및 기기 제한, 기술 지원 능력, 교직원과 학생 간의 부정행위에 대한 우려에 대한 주요 우려가 강조되었습니다. 이로 인해 [기기 또는 데이터 카파시티]가 있는 학생을 위한 추가 조항과 (외부 보호 소프트웨어 대신) 사내 온라인 활성화의 도입을 포함한 추가 개선이 이루어졌다. 후속 분석 결과, 이러한 개선으로 개별 학생과 코호트 평가 성과는 적응 전 평가와 강하게 상관관계가 있는 것으로 나타났다(Er et al 2020).
The first round of implementation with offsite online test taking highlighted major concerns around data capacity and device limitation of students, ability to provide technical support, and concerns of cheating amongst faculty and students. This led to further improvements including additional provisions for students with device or data capacity and the introduction of in-house online invigilation (instead of external proctoring software). Subsequent analysis showed that, with these improvements, individual student and cohort assessment performance correlates strongly with pre-adaption assessments (Er et al 2020).

테이크홈 메시지
Take home message

오프사이트 온라인 오픈북 평가로 전환할 때, 교수진은 처음에는 오픈북 평가의 사용과 진행에 따른 학생 역량에 미치는 영향에 대해 더 우려했다. 대신, 발생된 문제는 현장검사에서 외부검사로의 테크놀로지 변화와 관련이 있었다. 위기 상황에서 적응할 수 있는 기회를 잡은 것도 유익했지만, 첫 시행 후 평가를 적응시켜 더 개선하는 것도 마찬가지로 중요하다.

When shifting to offsite online open book assessments, faculty were initially more concerned about the use of open book assessments and their impact on student competencies as they progressed. Instead, issues that arose were related to technological shifts from an onsite to an offsite examination. It was beneficial to take the opportunity to adapt during a crisis, but it is also equally important to adapt the assessment after its first implementation to improve it further.



지속적인 코로나 팬데믹에 대응하여, 온라인 테스트를 하는 것이 거의 wholesale로 전환된 덕분에 테스트에 필요한 리소스(공간, 인력)와 테스트 타이밍 및 배치를 개선할 수 있는 기회도 새롭게 볼 수 있었다. 저부담 시험 및 특히 학습 형식에 대한 평가의 경우, 웹과 발터는 비물리적 환경에서 평가와 함께 학습자 참여의 기회를 보여준다. [대규모 시험장을 예약하고 여러 프로그램을 계획하는 제약]은 테크놀로지를 [지능으로 사용]함으로써 통해 해방되었지만, 동시에 학습자 불안과 감정에 대한 물리적 평가 환경의 중요성에 대한 증거가 새롭게 등장했다(Harley et al. 2021). 이러한 평가의 설계, 준비 및 전달에 있어 학습자와 교직원에 대한 지원의 중요성은 아무리 강조해도 지나치지 않으며(Tweed et al. 2021), 여기에 더 넓은 교육 자원을 게시할 수 있는 기회를 제공한다(Wood 2020a, 2020b).

The near wholesale switch to online test delivery in response to the ongoing Covid pandemic has also allowed a fresh look at resources needed for testing (space, staffing) and opportunities to improve the timing and deployment of testing. For lower stakes tests, and particularly assessment for learning formats, Webb and Valter demonstrate the opportunities for learner engagement with assessment in non-physical settings. The constraints of booking large exam halls and scheduling multiple assessments within, and across, programmes are liberated through the intelligent use of technology, with emerging evidence about the importance of the physical assessment environment on learner anxiety and emotion (Harley et al. 2021). The importance of support for learners and faculty in the design, preparation, and delivery of such assessments cannot be overstated (Tweed et al. 2021), with the opportunity to signpost wider education resources there (Wood 2020a, 2020b).

 

원칙 4: 평가 전달 및 학습자 성과 기록 최적화
Principle 4: Optimising assessment delivery and recording of learner achievement

이 합의의 향후 반복에서 2020-2021년을 돌아보고 평가에 대한 COVID-19의 가장 큰 영향을 검토하는 것은 흥미로울 것이다. 그러나 이 단계에서 TEA의 가장 가시적인 영향은 [평가 전달delivery]에 있었다. 온라인 지식 테스트의 성장은 효과적인 대량 온라인 테스트의 출현을 목격했다. 여기서 테크놀로지는 시험과 자동 채점의 전달을 지원하는 데 사용된다. 정교한 평가 관리 시스템(문제은행도 제함공)은 공인된 합격선 설정 방법(예: Ebel, Angoff)의 자동 적용을 지원합니다. 또한 테크놀로지VSA(Very Short Answer) 질문을 포함한 대체 지식 테스트 형식의 전달 및 자동 채점을 가능하게 하여, 응시자가 자유 텍스트를 사용하여 답변할 수 있도록 하고 머신 러닝 알고리즘을 사용하여 대부분의 채점을 수행할 수 있도록 했다(Sam et al. 2018).
It would be interesting to look back at 2020–2021 in future iterations of this consensus and review the biggest impact Covid-19 had on assessments—but at this stage, the most visible impacts of TEA have been on assessment delivery. The growth of online knowledge testing has seen the emergence of effective mass, online testing where technology is used to support the delivery of testing and automated marking. Sophisticated assessment management systems (which also provide item banking) support the automated application of recognised standard setting methods, e.g. Ebel, Angoff. Technology has also enabled the delivery and automated marking of alternative knowledge testing formats including VSA (Very Short answer) questions, allowing candidates to answer using free text, and the use of machine learning algorithms to undertake most of the marking (Sam et al. 2018).

또한 [평가 관리 시스템Assessment Management System]수행능력 평가에서 채점 및 자동화된 합격선 설정(예: 경계선 방법 사용)을 제공하며, 특히 OSCE는 모바일 장치를 사용한 채점 등을 통해 학습자에게 피드백을 포착할 수 있다. ['버추얼' OSCE]의 부상은 [고품질의 방어 가능한 평가]를 만들어내는 데 필요한 [복잡한 로지스틱스]를 포함하여, 무엇것을 완전히 가상 형식을 사용하여 진정한 평가를 할 수 있는지(또는 할 수 없는지)를 재개념화할 수 있는 기회를 보여주었다(Boursicot et al. 2020). 이러한 경험의 대부분은 TEA를 테크놀로지 강화 의료(예: 온라인/가상 환자-전문가 상담의 일상적인 사용)와 연계할 필요성에 초점을 맞추는 데 도움이 되었다. 원칙 3에서 강조했듯이, WBA 전달을 용이하게 하기 위한 모바일 장치의 사용은 점진적으로 증가했지만, [프로페셔널리즘 평가에 대한 테크놀로지의 영향]은 덜 확산되었다. 예를 들면 여기에는, [360/멀티 소스 피드백의 완전한 온라인 시스템]에서부터, [피드백을 즉시 제공하거나 학습자의 웰빙 또는 행동에 대한 우려를 즉시 제기]하는 테크놀로지 연결의 힘에 대한 적극적인 연구 등이 있다(JISC 2020).
Assessment Management Systems also supports the delivery of marking and automated standard setting (e.g. using Borderline Methods) in performance assessment, notably OSCEs, e.g. through scoring using mobile devices, which can also capture feedback to learners. The rise of ‘virtual’ OSCEs has demonstrated opportunities to further reconceptualise what can (and cannot) be authentically assessed using a fully virtual format, including the complicated logistics needed to return a high-quality, defensible assessment (Boursicot et al. 2020). Arguably, much of this experience has helped focus on a need to align TEA with technology-enhanced healthcare (e.g. the routine use of online/virtual patient-professional consultations). As highlighted in Principle 3, the use of mobile devices to facilitate the delivery of WBA has grown progressively, but less well-disseminated has been the impact of technology on delivering professionalism assessment, e.g. from fully online systems of 360/multi-source feedback, through to active research into the power of technology connectivity to instantly provide feedback or immediately raise concerns about a learner’s well-being or behaviour (JISC 2020).

평가에 테크놀로지를 사용하는 것은 평가 품질 분석, 사후 측정 기준 및 점수 보고에도 강력한 이점을 제공했다(Boursicot et al. 2021). [테크놀로지 기반 포트폴리오]는 [연계된 다양한 'artefacts'(즉, 성과 자체, '점수', 평가자 피드백 및 후보 반영)]을 통해 [누적적이고 종단적인 학습 성과를 기록할 수 있는 기회]가 생기고, 이는 진정으로 지속 가능한 평가에 영향을 미칠 수 있는 강력한 저장소를 제공합니다. 평가 및 피드백 증거의 포괄적인 저장소는 평가 프로그램 및 프로그램 평가 접근법에서 학습자 진행에 대한 효과적인 의사 결정의 중심이다. [TEA의 결과로 포착된 광범위한 데이터]는 OSCE 내의 검사자 행동과 의사 결정에 대한 강력한 통찰력을 제공하여 사례 연구 3에서 입증한 바와 같이 테크놀로지가 OSCE 품질을 더욱 향상시킬 수 있는 방법에 대한 추가 연구(비디오와 같은 간단한 기술을 사용)를 생성합니다.

The use of technology within assessment has also provided powerful benefits to the analysis of assessment quality, post-hoc metrics, and score reporting (Boursicot et al. 2021). The opportunities to record cumulative and longitudinal learner achievement through a range of linked ‘artefacts’ (i.e. the performance itself, the ‘score,’ assessor feedback, and candidate reflection) within a technology-based portfolio presents a powerful repository to influence truly sustainable assessment. A comprehensive repository of assessment and feedback evidence is central to effective decision-making about learner progression in programmes of assessment and programmatic assessment approaches. The extensive data captured as a result of TEA provides powerful insights into examiner behaviour and decision making within the OSCE, generating further research (using simple technology, such as video) into how technology might further augment OSCE quality, as demonstrated in Case Study 3.


사례 연구 3
Case study 3

[분산형 OSCE의 품질보증]을 강화하기 위한 방법으로서의 비디오 기반 Examiner Score 비교 및 조정(VECA) (Peter Yeates, Keele Medical School, UK)
Video-based Examiner Score Comparison and Adjustment (VESCA) as a method to enhance quality assurance of distributed OSCEs (Peter Yeates, Keele Medical School, UK)

맥락
Context

응시자의 숫자 때문에 대부분의 기관은 각각 다른 검사 그룹을 가진 여러 개의 OSCE(객관 구조 임상 검사) 병렬 회로를 운영한다. 이러한 서로 다른 '시험관-단체'들이 모두 같은 기준으로 학생들을 판단하는 것은 타당성 사슬에 매우 중요하다. 기존 문헌은 검사자-코호트 효과가 응시자의 점수에 중요한 영향을 미칠 수 있다고 제안하지만, 이러한 효과의 측정은 일반적으로 다른 검사자-코호트가 판단하는 후보 간 교차점이 없기 때문에 어렵다(즉, 완전히 네스팅된 설계).

Owing to candidate numbers, most institutions run multiple parallel circuits of Objective Structured Clinical Exams (OSCEs), with different groups of examiners in each. It is critical to the chain of validity that these different ‘examiner-cohorts’ all judge students to the same standard. Whilst existing literature suggests that examiner-cohort effects may importantly influence candidates’ scores, measurement of these effects is challenging as there is usually no crossover between the candidates which different examiner-cohorts judge (i.e. fully nested designs).

우리가 달성하려고 했던 것은 무엇인가?
What were we trying to achieve

우리는 OSCE에서 완전히 네스팅된 평가자 코호트의 일반적인 문제를 극복하기 위해 기술 지원 방법을 개발하는 것을 목표로 했다.
We aimed to develop a technology-enabled method to overcome the common problem of fully nested examiner-cohorts in OSCEs.

우리가 한 일
What we did

우리는 '비디오 기반 시험자 점수 비교 및 조정(VESCA)'이라는 3단계 절차를 개발했다. 여기에는 다음이 포함된다.

  • (1) OSCE의 모든 스테이션에서 학생들의 자원봉사 샘플을 비디오로 촬영한다.
  • (2) 또한 모든 검사관examiner에게 스테이션-특이적 비교군comparator 비디오 점수를 매기도록 요청합니다(모든 검사관-코호르트가 동일한 비디오 점수를 매김).
  • (3) 비디오 기반 점수에 의해 제공되는 연결을 사용하여 많은 면 래쉬 모델링을 사용하여 검사자-코호트 효과를 비교하고 조정한다.

We developed a three-stage procedure called ‘Video-based Examiner Score Comparison and Adjustment (VESCA).’ This involved

  • (1) videoing a volunteer sample of students on all stations in the OSCE;
  • (2) asking all examiners, in addition, to live examining, to score station-specific comparator videos (collectively all examiner-cohorts scored the same videos);
  • (3) using the linkage provided by video-based scores to compare and adjust for examiner-cohort effects using Many Facet Rasch Modelling.

영향의 지속적인 평가
Ongoing evaluation of impact

카메라를 배치하려면 학생의 성과를 방해받지 않고 볼 수 있도록 세심한 최적화가 필요했고 침입을 완화했습니다. 비디오 스코어링은 OSCE에 추가적인 시간 요구 사항을 부과했지만 데이터는 인터넷을 통한 지연 스코어링의 동등성을 지원하여 실현 가능성을 향상시켰다. 학생들은 일반적으로 표준화를 강화하기 위한 절차를 환영했다. 점수 조정은 링크 비디오 수 또는 심사관 참여율의 변동에 대해 허용될 정도로 강력했다. 시험관-코호트 효과는 학생 점수의 표준 편차 이상을 설명하면서 때때로 상당했다. 그에 따라 점수를 조정하면 상당한 소수 학생들의 합격/불합격 결정에 영향을 미치거나 그들의 순위를 크게 바꿀 수 있다.

Camera placement required careful optimisation to provide unobstructed views of students’ performances whilst mitigating intrusion. Scoring videos imposed additional time demands on the OSCE but data supported equivalence of delayed scoring via the internet thereby enhancing feasibility. Students generally welcomed procedures to enhance standardisation. Score adjustments were acceptably robust to variations in the number of linking videos or examiner participation rates. Examiner-cohort effects were sometimes substantial, accounting for more than a standard deviation of student scores. Adjusting scores accordingly could influence the pass/fail decisions of a substantial minority of students or substantially alter their rank position.

테이크홈 메시지
Take home message

VESCA는 개별 기관, 평가 파트너십 또는 국가 시험 기관이 다중 회로 또는 분산/국가 OSCE 시험의 품질을 향상시키고 공정성을 보장할 수 있도록 지원하는 유망한 기술 지원 방법을 제공한다(Yeates et al. 2020, 2021a, 2021b, 2022).VESCA offers a promising technology-enabled method to assist individual institutions, assessment partnerships, or national testing organisations to enhance the quality and ensure fairness of multi-circuit or distributed/national OSCE exams (Yeates et al. 2020, 2021a, 2021b, 2022).


전달, 분석 및 점수 보고 외에도, 테크롤로지를 광범위하게 사용하다보면, [테스트 보안, 부정행위 및 후보 추궁에 대한 상당한 의견]을 유발한다. 이 논평은 5가지 핵심의 신중한 균형을 강조합니다. 다음과 같이 요약될 수 있다.

  • 신뢰: 평가를 제공하는 기관, 교직원 및 후보자 자신(그리고 향후 평가에 대한 후속 신뢰와 신뢰)
  • 프로페셔널리즘: 그리고 평가 제공 내부 및 주변에서 후보자와 교수진의 기대
  • 적극적 프록토링: 문맥과 무관한 분산이나 후보 또는 교수진에게 추가적인 인지 부하를 주지 않으며 디지털 불평등을 심화시키는 복잡한 브라우저 시스템/장치에 액세스할 필요가 없는 온정적이고 비례적인 응답
  • 탐지 및 보안: 평가 내 학업 오류, 보안 테스트 뱅크 위반 또는 타사 또는 클라우드 기반 시스템에 의해 저장될 수 있는 후보 특성/성능 데이터의 우발적 손실.
  • 결과: 학문적 과실이 발견되었을 때 제재 측면에서뿐만 아니라 학습자, 전문가 및 환자의 신뢰를 강화하는 측면에서도 마찬가지이다.

Beyond delivery, analysis, and score reporting, the extensive use of technology has generated substantial comments about test security, cheating, and candidate proctoring (Roberts et al. 2020; Bali 2021; Selwyn et al. 2021). The commentary highlights the careful balance of 5 key, overlapping issues which can be best summarised as:

  • Trust: In the institution delivering the assessment, within and amongst Faculty and candidates themselves (and the subsequent confidence and trust in future assessments)
  • Professionalism: and the expectations of candidates and faculty within, and around, the delivery of assessments
  • Active proctoring: compassionate and proportionate responses that do not introduce context irrelevant variance, or additional cognitive load on candidates or Faculty, nor require access to complex browser systems/devices that widen digital inequity
  • Detection and security: of both academic malpractice within an assessment, the breach of e.g. a secure test bank, or inadvertent loss of candidate characteristics/performance data that may be stored by a third party or cloud-based systems.
  • Consequences: both in terms of sanctions when academic malpractice is detected, but also to reinforce the trust of learners, professionals, and patients

현재까지 데이터에 따르면 일부 대규모 국가 평가는 온라인/오프라인 테스트 전달과 비교하여 후보 성과에 차이가 없다고 보고하는 등 보안과 관련하여 테스트 기관 전반에 걸쳐 매우 혼합된 경험을 제시한다. 보다 광범위하게, 테크롤로지는 '부정행위 계약contract cheating'의 성장을 실질적으로 가능하게 했다. 이는 [아웃소싱된 학습자 평가]와 [아웃소싱 평가를 완료한 사람(개인 및 기업)] 간의 결과 균형을 요구한다. 또한 제도적 관행과 입법 모두에 문제를 남긴다.
Data to date suggests very mixed experiences across testing institutions in relation to security, with some larger scale national assessments reporting no differences in candidate performance comparing online/offline test delivery (Andreou et al. 2021; Hope, Davids, et al. 2021; Tweed et al. 2021). More widely, technology has substantially enabled the growth of ‘contract cheating,’ requiring a balance of consequences across learners ‘outsourcing’ assessment and those completing the outsourcing (individuals and companies) and challenges both institutional practices and legislation (Ahsan et al. 2021; Awdry et al. 2021).

원칙 5: 학습자 진행 상황 및 교수 활동 추적—종방향 학습 및 지속적인 평가 지원
Principle 5: Tracking learner progress and faculty activity—supporting longitudinal learning and continuous assessment

테크놀로지 사용은 평가 프로세스와 실무에서 잠재적으로 혁신적이었지만, 학습자 진급에 대한 테크놀로지 주도 '결정'의 출현은 상당한 도전과 우려를 제기합니다. 의료 분야에서 '인공지능'(AI)의 보다 광범위한 사용은 질병의 조기 발견 또는 보다 정확한 진단에 잠재적인 이점을 제공한다(예: 류 외 2019; Yan 외 2020). 그러나 브루사드는 [모든 데이터가 궁극적으로 인간에 의해 생성되기 때문에 잘못된 의사 결정, 코딩 및 출력 사용에 대한 책임은 인간에게 있다]고 강조한다(Broussard 2018).
Whilst the use of technology has been potentially transformational in assessment processes and practice, the advent of technology-driven ‘decisions’ on learner progress presents significant challenges and concerns. The use of ‘artificial intelligence’ (AI) more widely in healthcare presents potential benefits in the early detection of disease or more accurate diagnosis (e.g. Liu et al. 2019; Yan et al. 2020). However, Broussard highlights that all data is ultimately generated by humans, so the challenge for ‘AI’ of poor decision making, the responsibility for coding and use of any outputs remains with humans (Broussard 2018).

교육에서 AI 기반 기술은 학습 또는 웰빙과 관련하여 학습자의 [성공을 예측]하거나, [특정 지원이 필요한 사람]을 탐지할 수 있는 기회를 예고했다(JISC 2020). 그러나 학습자와 교수진에 대한 이러한 테크놀로지의 성과를 살펴보는 고품질 경험적 연구는 거의 없다(Sonderlund et. 2019). 평가 내에서 논평은 개별 평가 내에서 또는 종단적 데이터 세트의 분석을 통해 기계 기반 의사 결정에 초점을 맞췄다(Hope, Dewar, et al. 2021).
In education, AI-based technologies have heralded opportunities to predict learner success or detect those in need of targeted support, whether relating to learning or well-being (JISC 2020). However, there is little high-quality, empirical research that looks at the outcomes of such technology on learners and faculty (Sonderlund et. 2019). Within the assessment, commentaries have focused on either machine-based decision-making within individual assessments (Hodges 2021) or through the analysis of longitudinal data sets (Hope, Dewar, et al. 2021).

광범위한 교육에서 데이터 처리 및 학습자 분석이 TEA의 일부로 사용되는 방법에 대한 몇 가지 접근법이 있었다. 시스템의 설계, 데이터 처리 또는 결과의 이해/적용 불량으로 인해 '프로파일과 예측'이 실패할 수 있으며, 이는 학습자에게 불명확한 결과, 학습자에게 부정적인 영향(실패에 대한 두려움을 강화함) 또는 '게임 행동'을 초래할 수 있다. 교수진과 기관에 의한 그러한 시스템에 대한 이해와 적용은 동등하게 중요하다(Lawson et al. 2016). 이와는 대조적으로, 사례 연구 4에 나타난 바와 같이, 지능형 시스템 설계와 데이터의 목적적 사용은 미래의 실패 위험에 있는 학습자를 식별하고 의미 있게 지원하기 위해 데이터를 사용하거나(Foster and Siddle 2020), 자율 규제와 더 나은 학습자 선택(Broos et al. 2020)을 지원하는 데 사용될 수 있다. 현재의 과제는 이 원칙이 학습에 대한 의미 있는 영향의 측면에서 교육에 대한 혼합 결과를 강조하는 제한된 공개된 증거 기반 내에 있다는 것이다(2019년 슘과 행운).
Within wider education, there have been several approaches to how data processing and learner analytics have been used as part of TEA. Poor design of systems, data processing, or understanding/application of outcomes can lead to failure in ‘profile and predict,’ resulting in either unclear outcomes for learners (Foster and Francis 2020), negative impact on learners (through reinforcing the fear of failure) or development of ‘gaming behaviours’ (Archer and Prinsloo 2020). Of equal consequence is poor understanding and application of such systems by faculty and institutions (Lawson et al. 2016). In contrast, intelligent systems design and purposeful use of data can be used to ‘gather and guide,’ using data to identify and meaningfully support learners at risk of future failure (Foster and Siddle 2020) or support self-regulation and better learner choices (Broos et al. 2020), as shown in Case Study 4. A current challenge is that this principle is situated within a limited published evidence base which highlights mixed outcomes for education in terms of meaningful impact on learning (Shum and Luckin 2019).


사례 연구 4
Case study 4

지속적인 학습 및 평가 준비를 위한 온라인 형태 형성 평가, 학생 피드백 및 학습 분석 안내(호주 시드니 대학 Karen Scott)
Online formative assessment for continuous learning and assessment preparation, guided by student feedback and learning analytics (Karen Scott, University of Sydney, Australia)

맥락
Context

4년제 시드니 메디컬 프로그램의 학생들은 8주간의 소아과 블록에 참여한다. 대부분의 70~80명의 학생들은 시드니 웨스트메드에 있는 아동병원에 1일차 오리엔테이션, 5주차 수업, 8주차 시험을 위해 있으며, 8~12명의 학생들은 시골 병원에 있다. 나머지 블록에서 학생들은 어린이 병원, 광역 및 농촌 병원, 지역사회 보건 센터에서 임상 배치를 받는다.
Students in the four-year Sydney Medical Program undertake an 8-week paediatric block. Most of the 70–80 students are at The Children’s Hospital at Westmead, Sydney for the Day 1 orientation, Week 5 teaching, and Week 8 examinations; 8–12 students are at rural hospitals. For the remaining block, students undertake clinical placements at the Children’s Hospital, metropolitan and rural hospitals, and community health centres.

우리가 달성하려고 했던 게 뭐죠?
What were we trying to achieve?

소아과는 일반 소아과, 소아외과, 그리고 30개 이상의 하위 전공으로 구성되어 있다. 이 광범위한 교육과정에 걸쳐 학생들은 다양한 대면 및 가상 소규모 및 대규모 그룹 교육 세션을 준비하고, 학습을 통합, 검토 및 확장해야 합니다. 학생들은 블록 말기 필기시험과 임상시험도 준비해야 하며, 기말고사는 필기시험이 있다. 
Paediatrics comprises general paediatrics, paediatric surgery, and over 30 sub-specialties. Across this broad curriculum, students need to prepare for a range of face-to-face and virtual small- and large-group teaching sessions, and consolidate, review and extend their learning. Students also need to prepare for end-of-block written and clinical examinations, and final-year has written examinations.

우리가 한 일
What we did

실질적인 온라인 자기 주도형 형성 평가가 개발되었다. 대부분은 전개, 사례 기반 학습으로 구성되어 핵심 지식을 임상 사례에 적용할 수 있다. 일부는 핵심 지식을 학습의 통합 및 확장을 위한 실습 활동과 통합한다. 모든 기능에는 광범위한 자동 피드백이 포함되어 있으며 일부는 보조 웹 링크가 포함되어 있습니다. 핵심지식개발(주로 짧은 포맷으로 녹음된 강의)에 초점을 맞춘 온라인 자료에는 자가테스트를 위한 형성 평가와 이를 통한 장기지식 보유가 포함된다.
Substantial online self-directed formative assessment has been developed: most comprise unfolding, case-based learning, enabling the application of core knowledge to clinical cases; some integrate core knowledge with practice activities for consolidation and extension of learning. All include extensive automated feedback, some with supplementary web links. Online materials focusing on core knowledge development (primarily short format recorded lectures) include formative assessment for self-testing and through this, long-term knowledge retention.

영향 평가
Evaluation of impact

학습 분석 및 학생 설문 조사에 따르면 대부분의 학생들은 대부분의 형태별 평가를 수행하며 더 많은 것을 원합니다! 최근 학습 분석과 평가 결과를 비교한 결과 학생들의 평가 결과는 일반적으로 형성적 평가를 사용하는 범위와 일치한다.
Learning analytics and student surveys show most students do most formative assessments—and want more! A recent comparison of learning analytics and assessment results highlights that students’ assessment results generally correspond with the extent to which they use formative assessment.

테이크홈 메시지
Take-home message

이 연구 결과는 모든 학생(특히 미니멀리스트 접근법을 취하는 학생)이 온라인 형성 평가를 잘 활용하도록 장려하기 위해 의료 프로그램 전체에 전달되고 있다.

This finding is being communicated throughout the Medical Program to encourage all students (especially those taking a minimalist approach) to make good use of online formative assessment.


 

[교육학적 원칙과 좋은 테크놀로지 설계]에 부합하면 TEA는 '올바른 데이터'를 수집하는 데 상당한 이점을 제공할 수 있으며, 이는 인간의 인지 부하를 해방시켜 데이터를 더 잘 이해하고 따라서 교수진의 시간을 학습자 지원에 집중할 수 있다. 여기에는 데이터 기반 신속한 교정조치(리케츠 및 블라이 2011), 코칭 및 멘토링 접근법(말레카 및 바우드 2021), 행동 넛지(담가드 및 닐슨 2018), 예방적 개입으로 (잠재적) 연말 실패 시점을 앞두고 적용되는 전문가 사례 관리가 포함될 수 있다(윈스턴 외 2012). 그러나 광범위한 데이터 수집은 [학습의 관리를 책임지는 사람들]과 [독립적인 행위자agents으로서 학습자 자신] 사이에 긴장을 야기할 수 있다(Tsai et al. 2020). [데이터 소유권에 대한 문제]는 문헌에 의해 대부분 해결되지 않았지만 가장 중요하다.
When aligned to pedagogic principles and good technology design, TEA can provide substantial benefits in collecting the ‘right data,’ freeing up the cognitive load of humans to better understand the data and therefore focus faculty time on learner support. This can include data-driven rapid remediation (Ricketts and Bligh 2011), coaching and mentoring approaches (Malecka and Boud 2021), considered use of behavioural nudges (Damgaard and Nielsen 2018) and specialist case management to be applied ahead of a (potential) end of year point of failure as a preventive intervention (Winston et al. 2012). However, extensive data collection may cause tensions between those responsible for the management of studies and learners themselves as independent agents (Tsai et al. 2020). This question of data ownership remains largely unanswered by the literature but is of paramount importance.

그러나 [평가 설계에 대한 테크놀로지의 지능적 적용]은 특히 포트폴리오 도구의 개발을 통해 학습자 자신의 종단적 참여를 변화시킬 수 있다. Driessen(2017) [포트폴리오]가 [관료적 도구로 보이는지] 또는 [학습 및 평가의 진정한 가능자enabler로 보이는지]에 따라 달라지는 포트폴리오의 함정을 강조한다. Silveira(2013)는 음악과 예술 교육의 교훈을 바탕으로, [포트폴리오]는 [학습과 피드백을 위한 커뮤니케이션 도구]이며, [학습자를 적극적으로 참여시키고 더 나은 자기 조절, 오너십/큐레이션, 종적 개발을 촉진할 수 있는 강력한 기회]를 제시한다고 본다. 그러나 쉽게 접근할 수 있는 포트폴리오에서 성찰의 요건(평가 구성요소)과 '고해성사로서의 성찰'의 심리적 해악에 대해 주의를 기울여야 한다(Hodges 2015). 포트폴리오 평가의 효과적인 활용을 위해 학습자, 감독자 및 역량 위원회를 지원하는 것은 필수적이다(Oudkerk Pool et al. 2020; Pack et al. 2020).

However, the intelligent application of technology to assessment design can transform the longitudinal engagement of learners themselves, particularly through the development of portfolio tools. Driessen (2017) highlights the pitfalls of portfolios depending on whether they are seen as bureaucratic tools or true enablers of learning and assessment. Drawing on the lessons from music and arts education, seeing portfolios as communication tools for learning and feedback, Silveira (2013) presents powerful opportunities to actively engage learners and promote better self-regulation, ownership/curation, and longitudinal development (Clarke and Boud 2018). Caution however needs to be exercised about the requirement of reflection (as a component of assessment) in an easily accessible portfolio, and the psychological harm of ‘reflection as confession’ (Hodges 2015). Supporting learners, supervisors, and competence committees in the effective use of portfolio assessment is essential (Oudkerk Pool et al. 2020; Pack et al. 2020).

테크놀로지는 [학습자에 대한 광범위한 데이터를 수집하고 이해할 수 있는 능력]을 갖추었으므로, 기본적으로 평가자(직장 및 시뮬레이션 평가 모두)와 평가 품질 개선에 대한 기관의 반응에 강력한 렌즈를 제공합니다. 학습자를 지원하기 위한 패러랠 메커니즘으로서, 이 데이터는 목표 지원targeted support나(예: 집중 OSCE 검사자 교육(Gormley et al. 2012) 더 나은 평가자 참여를 촉진하기 위해 TEA(예: 웹 양식, 앱)의 재설계를 추진할 수 있다. 
With the ability to collect and understand extensive data about learners, technology, by default, provides a powerful lens into assessors (both in the workplace and simulated assessment) and the responses of the institution to driving assessment quality. In a parallel mechanism to supporting learners, this data can drive targeted support, e.g. focused OSCE examiner training (Gormley et al. 2012), or redesign of TEA (e.g. webforms, apps) to facilitate better assessor engagement.

4차 산업 혁명(McKinsey 2022)은 교육자가 직면한 미래를 강조하며, 더 많은 양의 (평가) 데이터와 알고리즘 기반 결과를 기록하는 장치와 공존하여 교수진이 학습자 진행 및 의사 결정을 조정할 수 있도록 지원합니다. 교육 평가educational assessment의 주요 과제는 이러한 [상호 연결을 시각화, 연결, 영향 및 연구하는 방법]에 초점을 맞춘다. 개발자, 기술자 및 교육자 간의 증강 및 인공지능의 함정과 잠재력을 더 잘 이해하려면 지속적으로 발생하는 윤리적 문제에 대응할 필요가 있다(Selwyn 2021). 
The fourth industrial revolution (McKinsey 2022) highlights the future that educators face, coexisting with devices recording larger volumes of (assessment) data and algorithm-based outcomes helping faculty coordinate learner progression and decision making. Key challenges of educational assessment focus on how we visualise, connect, influence, and research this interconnectivity. A better understanding of the pitfalls and potential of augmented and artificial intelligence between developers, technologists, and educationalists needs to interface with the ethical challenges that continue to arise (Selwyn 2021).

3단계: TEA 사용의 영향 보건 전문직 교육 내 평가, 보급 및 가속화
STAGE 3: The impact of TEA usage needs evaluating, disseminating, and accelerating within health professions education

글로벌 팬데믹에도 불구하고, 2020년에는 평가에 대한 기술 솔루션을 포함하여 교육에서의 기술 사용에 있어 혁신 보고서의 급속한 성장으로 돌아왔다(Fuller et al. 2020). 이 생산성 기간 동안 우리는 무엇을 배울 수 있을까? 이러한 위기가 창의적 대응으로 이어지는 것은 놀라운 일이 아니지만, 테크놀로지 기반 창의성에 상당한 자원이 필요하다는 요구는 '소박한 혁신'의 가치를 간과하고 있습니다(Tran and Ravaud 2016). 그러나 이러한 창의성으로부터 배우는 모든 것의 중심은 '설명description'을 넘어, [보급과 의미 있는 학술활동]을 통해 그 영향을 극대화해야 한다는 요구이다(Ellaway et al. 2020).
Despite (and indeed because of) the global pandemic, 2020 saw a return to the rapid growth of innovation reports in technology use in education, including technological solutions to assessment (Fuller et al. 2020). What can we learn from this period of productivity? That crisis leads to creative responses is unsurprising, but a requirement that technology-based creativity requires substantial resources overlooks the value of ‘frugal innovation’ (Tran and Ravaud 2016). However, central to any learning from this creativity is a requirement to move beyond ‘description’ and maximise its impact through dissemination and meaningful scholarship (Ellaway et al. 2020).

HPE를 통한 TEA의 학술적 연구 보급은 북미, 유럽, 오스트랄라시아에 걸쳐 개인 및 소규모 그룹의 출판물에 의해 주로 이루어졌다. 아시아 태평양 지역의 생산량이 증가하고 있지만, 아프리카와 남아메리카의 출판물은 거의 남아 있지 않다. TEA가 전 세계적으로 HPE에 진정한 혜택을 주기 위해서는 기술 지원 평가의 설계, 구현 및 평가의 내러티브도 다양성이 필요합니다. 이러한 다양성은 HPE(예: 주제별 통화, 혁신 보고서)에 반영되며 빠르게 변화하는 교육 설계 및 소셜 미디어 영역의 단서로부터의 학술활동 채택으로 인해 반영된다. 이러한 접근 방식은 TEA에 초점을 맞춘 학술 출판물이 실무자의 의견을 통해 협력적이고 점진적으로 구축될 수 있음을 의미한다.
Dissemination of scholarly work in TEA across HPE has largely been dominated by publications from individuals and small groups across North America, Europe, and Australasia. While there is a growing trend of output from the Asia Pacific region, publications from Africa and South America remain few. For TEA to truly benefit HPE globally, the narratives of design, implementation and evaluation of technology-enabled assessments need diversity too. This diversity is reflected within HPE (e.g. thematic calls, innovation reports) and from the adoption of scholarship from cues in the fast-changing realm of instructional design and social media. Such approaches mean that scholarly publications focused on TEA can be built collaboratively and progressively with input from practitioners.

교육 내에서 [지속적으로 새로운 테크놀로지를 채택]하는 실험적인 특성은 [장단기 의도된 결과와 의도하지 않은 결과]의 프레임워크에 적합하다. 이를 위한 '최선의' 방법에 대해서는 HPE 전체에서 합의가 이루어지지 않았지만, 서로 다른 프레임워크는 과정 또는 프로그램 수준 평가(Cook 및 Ellaway 2015) 또는 단일 자원 평가(Pickering and Joynes 2016)에 대한 제안을 제공한다. 이러한 프레임워크의 핵심은 [어떤 형태로든 영향의 evaluation와 assessment가 이루어져야 하며], [TEA 혁신이 학습 경험, 행동 또는 프로세스에 진정한 차이를 가져왔는지] 또는 [기존의 평가에서 일부 긍정적인 요소가 손실되었는지]에 대해 고려해야 한다는 것이다(William 2021).).
The experimental nature of continually adopting new technologies within education lends itself well to frameworks of short- and long-term intended and unintended consequences. There is no agreement across HPE on the ‘best’ way to do this, but different frameworks offer suggestions for course or programme level evaluations (Cook and Ellaway 2015) or for evaluation of a single resource (Pickering and Joynes 2016). The key point of these frameworks remains that evaluation and assessment of impact need to occur in some form and that consideration is given to whether a TEA innovation has truly made a difference to learning experiences, behaviours, or processes, or whether some positive elements have been lost from the assessment which came before (William 2021).

마무리 멘트
Concluding remarks

팬데믹으로 인해 더 넓은 교육이 계속해서 형성되고 있는 상황에서, 미래는 무엇을 유지할 것인가? 국제 고등 교육 정보 기술 그룹 Educause는 디지털 기술이 교육 및 평가를 지속적으로 형성하는 방법을 탐구하기 위해 '복원', '진화', '변환'의 세 가지 모델을 제안합니다(EDUCHAUSE 2021). 저자들은 일련의 대안, 전염병 이후의 미래를 지적하지만, [어포더빌리티, 디지털 보안, 디지털 형평성 및 교육에 대한 평등한 접근 문제]가 TEA에 대한 우리의 전략적 접근 방식을 형성해야 하는 원동력이 될 것이다.

With wider education continuing to be shaped by the pandemic, what does the future hold? The international higher education information technology group Educause proposes three models—‘restore,’ ‘evolve,’ and ‘transform’—to explore how digital technologies may continue to shape education, and assessment (EDUCAUSE 2021). The authors point to a series of alternative, post-pandemic futures, but where issues of affordability, digital security, digital equity, and equitable access to education will be the driving forces that must shape our strategic approaches to TEA.

향후 10년간의 기술 동향에 대한 예측은 일, 건강 및 사회(Gartner 2015)에 대한 광범위한 변화를 강조할 수 있지만, HPE의 보다 근본적인 것은 학습 테크노롤지가 어떻게 사람에 초점을 맞추도록(예: 창의성과 혁신, 학습자 행위자성 및 웰빙) 축을 전환할 것이냐이다. 이러한 것들은 학습자의 자기 조절, 개발, 기여 및 자기 관리를 지원하기 위해 이러한 기술에 참여하는 학습자의 능력을 어떻게 '평가'하는지 생각하는 TEA에게 흥미로운 잠재력을 제공합니다. 테크놀로지 미래학자들은 '인간만의 특성'(예: 동정심, 창의성)을 우리가 배우는 것만큼 점점 더 가치가 있다고 지적하고, 더 많은 자동화를 사용하여 의료 서비스를 제공한다(Leonhard 2021). 테크놀로지와의 공존을 위해서는, 이러한 특성, 관행 기반 윤리 및 의사 결정(및 자동화된 시스템으로부터의 포기)을 어떻게 '평가'하는지가 HPE의 평가에 대한 주요 과제일 것이다.
Whilst predictions around technology trends of the next 10 years may highlight broader changes to work, (health), and society (Gartner 2015), more fundamental to HPE is how learning technologies will shift their axes to focus on people—transformative competencies (e.g. creativity and innovation), learner agency and well-being (OECD 2015). These present interesting potential for TEA, thinking about how we ‘assess’ learners' ability to engage with these technologies to support their self-regulation, development, contribution, and self-care. Technology futurists point to ‘human only traits’ (e.g. compassion, creativity) as increasingly valuable as we learn, and provide healthcare, using more automation (Leonhard 2021). How we ‘assess’ these traits, practice-based ethics, and decision making (and abdication from automated systems) in our co-existence with technology will prove major challenges for assessment in HPE.

모든 기여자들이 이러한 합의를 도출하는 과정에서 핵심 주제는 '더 나은 평가 미래'를 진정으로 가능하게 하는 기술의 필요성을 지적합니다. HPE에서, 이것은 이것을 제공하는 데 필요한 학습과 기술에 초점을 맞추고 진정으로 혁신적인 TEA가 기술을 사용한 진정한 평가를 추구하기 위해 평가 라이프사이클뿐만 아니라 학습자, 교수진 및 환자의 요구를 고려하도록 보장하는 것으로 해석된다.

A key theme throughout the development of this consensus from all contributors points to the need for technology to truly enable ‘better assessment futures.’ In HPE, this translates to focus on the learning and skills needed to deliver this and to ensure that truly transformative TEA considers not just the assessment lifecycle, but the needs of learners, faculty, and patients in the pursuit of authentic assessment using technology.

 


Med Teach. 2022 Jun 30;1-15. doi: 10.1080/0142159X.2022.2083489. Online ahead of print.

Technology enhanced assessment: Ottawa consensus statement and recommendations

Affiliations collapse

Affiliations

1Christie Education, The Christie NHS Foundation Trust, Manchester, UK.

2School of Medicine, University of Liverpool, Liverpool, UK.

3International Medical University, Kuala Lumpur, Malaysia.

4Kubify, Leeds, UK.

5School of Medicine, University of Keele, Keele, UK.

6Faculty of Medicine and Health, University of Sydney, Sydney, Australia.

7College of Health and Medicine, Australian National University, Canberra, Australia.

8John Curtin School of Medical Research, Australian National University, Canberra, Australia.

9Center for University Teaching and Learning, University of Helsinki, Helsinki, Finland.

PMID: 35771684

DOI: 10.1080/0142159X.2022.2083489

Abstract

Introduction: In 2011, a consensus report was produced on technology-enhanced assessment (TEA), its good practices, and future perspectives. Since then, technological advances have enabled innovative practices and tools that have revolutionised how learners are assessed. In this updated consensus, we bring together the potential of technology and the ultimate goals of assessment on learner attainment, faculty development, and improved healthcare practices.

Methods: As a material for the report, we used the scholarly publications on TEA in both HPE and general higher education, feedback from 2020 Ottawa Conference workshops, and scholarly publications on assessment technology practices during the Covid-19 pandemic.

Results and conclusion: The group identified areas of consensus that remained to be resolved and issues that arose in the evolution of TEA. We adopted a three-stage approach (readiness to adopt technology, application of assessment technology, and evaluation/dissemination). The application stage adopted an assessment 'lifecycle' approach and targeted five key foci: (1) Advancing authenticity of assessment, (2) Engaging learners with assessment, (3) Enhancing design and scheduling, (4) Optimising assessment delivery and recording learner achievement, and (5) Tracking learner progress and faculty activity and thereby supporting longitudinal learning and continuous assessment.

Keywords: Assessment; curriculum; medical education research.

 

의과대학에서 전문직업성 기르기: 1990년과 2019년 사이 교육과정의 체계적 스코핑 리뷰(Med Teach, 2020)
Nurturing professionalism in medical schools. A systematic scoping review of training curricula between 1990–2019
Yun Ting Onga,b, Cheryl Shumin Kowa,b, Yao Hao Teoa,b, Lorraine Hui En Tana,b, Ahmad Bin Hanifah Marican Abdurrahmana,b, Nicholas Wei Sheng Queka,b, Kishore Prakasha,b , Clarissa Wei Shuen Cheonga,b, Xiu Hui Tana,b, Wei Qiang Lima,b, Jiaxuan Wua,b, Laura Hui Shuen Tana,b, Kuang Teck Taya,b , Annelissa Chinc, Ying Pin Tohd, Stephen Masone and Lalit Kumar Radha Krishnaa,b,e,f,g 

 

서론
Introduction

전문직업성의 정의
Definition of professionalism

프로페셔널리즘은 의사-환자 관계, 환자 만족도 및 의료 결과에 영향을 미치는 [진화하고, 사회 문화적으로 영향을 받으며, 다차원적인 구인]이다(Li et al. 2017). 임상 치료에 대한 전문직업성의 직접적인 영향은 이 개념을 더 잘 이해하고 임상 실무에서 그 역할에 대한 인식을 높이기 위한 노력을 강조한다(Wilkinson et al.). 그러나 전문직업성을 기르는 일은 전문직업성이 어떻게 인식되는지에conceived 대한 차이로 인해 복잡하다. ACGME, ABIM, GMC 및 CanMEDs 프레임워크 등에 의해 제시된 프로페셔널리즘의 정의는 여기에 [사회문화적, 맥락적, 지리-정치적 요인이 미치는 영향을 보여준다. 이러한 요인의 영향을 인정한다는 것은 현재의 훈련 접근법의 적절성과 실행 가능성을 재고할 필요성을 강조한다(Mueller 2009).
Professionalism is an evolving, socioculturally informed, multidimensional construct (Li et al. 2017) that influences doctor-patient relationships, patient satisfaction and healthcare outcomes (Wilkinson et al. 2009). Professionalism’s direct impact upon clinical care underlines efforts to better understand this concept and nurture greater awareness of its role in clinical practice (Wilkinson et al. 2009). Yet the task of nurturing professionalism is complicated by differences in how professionalism is conceived. Definitions set out by the Accreditation Council for Graduate Medical Education(ACGME), the American Board of Internal Medicine (ABIM), General Medical Council (GMC) and the CanMEDs framework by the Royal College of Physicians and Surgeons of Canada allude to the impact of prevailing sociocultural, contextual and geopolitical factors on prevailing concepts of professionalism. Acknowledging the impact of these factors underlines the need to reconsider the appropriateness and viability of current training approaches (Mueller 2009).

이번 체계적인 범위 지정 검토는 학부 및 대학원 의과대학에서 전문직업성이 양성되는 방식을 지도화하여 의대생들의 전문성 양성을 목표로 하는 프로그램에 대한 설계 정보를 개선하고 지원 및 평가를 강화하는 것을 목표로 한다(Munn et al. 2018).
This systematic scoping review aims to map how professionalism is nurtured in undergraduate and postgraduate medical schools so as to better inform design and enhance support and assessment of programs aimed at nurturing professionalism amongst medical students (Munn et al. 2018).

방법론
Methodology

체계적인 범위 검토는 광범위한 교육 및 실습 설정(Chidwick et al. 2018)에 걸쳐 실행 가능하고 적용 가능한 정보(DuMont et al. 2015)와 사용 가능한 문헌 요약(O'Donovan et al. 2018; Osama et al. 2018)을 체계적으로 추출하고 합성할 수 있다. 2004; Pape and Manning 2006).
A systematic scoping review allows for systematic extraction and synthesis of actionable and applicable information (Du Mont et al. 2015) and a summary of available literature (O’Donovan et al. 2018; Osama et al. 2018) across a wide range of pedagogies and practice settings (Chidwick et al. 2004; Pape and Manning 2006).

싱가포르 국립대학교의 Yong Loo Lin 의과대학(YLLsoM)과 싱가포르 국립 암 센터(NCCS)의 의료 도서관, NCCS의 지역 교육 전문가 및 임상의의 지도 아래 YLsOM 및 Duke-NUS 의과대학(EXPorth)의 의료 사서, NCCS의 현지 교육 전문가 및 임상의의 지도 아래, YLsoM 및 Duke-NUS 의과대학(EXPorthen)은 다음과 같은 의과 함께 의료기관을 운영하고 있습니다. 주요 연구 질문은 '의대생들의 전문직업성 함양에 대해 알려진 것'으로 결정되었다. 연구팀 17명은 또 2차 연구 질문을 '학부와 대학원 의학 커리큘럼에서 전문직업성이 어떻게 이해되고 실천되고 있는가'로 결정했다.

Guided by the medical librarians from the medical library at the Yong Loo Lin School of Medicine (YLLSoM) at the National University of Singapore and at the National Cancer Centre Singapore (NCCS) and local educational experts and clinicians at the NCCS, the Palliative Care Institute Liverpool, YLLSoM and Duke-NUS Medical School (henceforth the expert team), the primary research question was determined to be ‘what is known about nurturing professionalism amongst medical students?”. The 17 members of the research team also determined the secondary research questions to be “how is professionalism understood and practiced in prevailing undergraduate and postgraduate medical curricula?”.

이 체계적인 범위 검토는 Li 등(2017)의, Wilkinson 등을 기반으로 한다. (2009) 및 벨로스키 외. (2005)의 전문성 평가 도구 검토. 향후 체계적인 검토의 기초가 되는 것 외에도, 체계적인 범위 검토를 사용함으로써 의료 전문직업성 훈련의 개인과 시스템에 대한 관련 문헌 부족에 의해 제기되는 한계를 우회할 수 있다(Pinkus et al. 1995; Pinkus 1999; 2001년 5월, Chidwick et al. 2004; Pape and Manning 2006).
This systematic scoping review, builds upon Li et al. (2017)’s, Wilkinson et al. (2009)’s and Veloski et al. (2005)’s reviews of assessment tools in professionalism. Aside from being the basis for a future systematic review, use of a systematic scoping review circumnavigates limitations posed by a dearth of relevant literature on individual and systems of the training of medical professionalism (Pinkus et al. 1995; Pinkus 1999; May 2001; Chidwick et al. 2004; Pape and Manning 2006).

Levac et al. (2010) 의 Arcsey and O'Malley (2005) 의 시스템 스캔 프레임워크가 사용되었습니다. 이를 통해 "연구 영역과 주요 원천과 증거의 종류"를 검색하고, 주제 내에 존재하는 문헌의 프로파일을 만들어서 풍부한 데이터베이스를 구축하였고, 이것이 실천과 후속 연구를 가이드할 수 있는 토대가 되었다. PRISMA-P 2015 체크리스트와 결합하여 Levac et al (2010)의 Arcsey and O'Malley (2005)의 시스템 리뷰를 위한 프레임워크는 6-stage systematic review Protocol의 포워딩으로 확장된다.

Levac et al. (2010)’s adaptation to Arksey and O'Malley (2005)’s framework for systematic scoping review was used to map the key concepts underpinning a research area and the main sources and types of evidence available” (Mays et al. 2001) and “produce a profile of the existing literature in a topic area, creating a rich database of literature that can serve as a foundation” to inform practice and guide further research (Grant and Booth 2009; Daudt et al. 2013; Pham et al. 2014). Combined with the PRISMA-P 2015 checklist (Osama et al. 2018), Levac et al. (2010)’s adaptation to Arksey and O'Malley (2005)’s framework for systematic scoping review allowed the forwarding of a 6-stage systematic review protocol (Mays et al. 2001; Arksey and O'Malley 2005; Grant and Booth 2009; Levac et al. 2010; Thomas et al. 2014; Lorenzetti and Powelson 2015).

프레임워크의 첫 번째 단계에서는 전문가 팀이 연구 질문을 결정하도록 지도했다. 이러한 질문은 PICOS 형식(표 1)을 사용하여 포함 및 배제 기준의 인구, 개념 및 맥락 요소에 대해 설계되었다(Peters et al. 2015).
In the first stage of the framework the expert team guided the research team in determining the research questions. These questions were designed on the population, concept and context elements of the inclusion and exclusion criteria (Peters et al. 2015), using a PICOS format (Table 1).

전문가 팀의 안내와 의료 전문성에 대한 지배적인 정의와 설명에 따라 연구팀은 PubMed(부록 A), Embase, PsycINFO, ERIC, Cochrane Database of Systematic Reviews 및 Scopus 데이터베이스에 대한 검색 전략을 개발했다. 실행 가능하고 지속 가능한 연구 프로세스를 보장하고 지배적인 인력 및 시간 제약을 수용하려는 Pham 등(2014)의 접근 방식에 따라 연구팀은 1990년 1월 1일과 2019년 12월 31일 사이에 발표된 기사로 초점을 제한했다. 영어로 출판되거나 영어로 번역된 논문의 모든 연구 방법론(양적 및 질적)이 포함되었다. 2019년 2월 14일부터 2019년 4월 24일까지, 2019년 10월 18일부터 2020년 1월 17일까지 각각 단독 수색을 실시했다. 

Guided by the expert team and prevailing definitions and descriptions of medical professionalism, the research team developed a search strategy for PubMed (Supplementary Appendix A), Embase, PsycINFO, ERIC, Cochrane Database of Systematic Reviews and Scopus databases. In keeping with Pham et al. (2014)’s approach of ensuring a viable and sustainable research process and to accommodate to prevailing manpower and time constraints the research team confined their focus to articles published between 1 January 1990 and 31 December 2019. All research methodologies (quantitative and qualitative) in articles published in English or had English translations were included. The independent searches were carried out between 14 February 2019 and 24 April 2019 and again between 18 October 2019 and 17 January 2020.

3단계에서는 PICOS에서 정한 심사기준을 이용하여 식별된 제목과 초록을 독자적으로 심사하고, 온라인에 포함될 개별 기사목록을 논의한 후 최종 검토 대상 기사목록에 합의했다. Sandelowski와 Barroso(2006)의 '협상된 합의 검증' 접근 방식을 사용하여 분석할 전체 텍스트 기사의 최종 목록에 대한 합의를 도출했다.
In the third stage, the research team independently screened the identified title and abstracts using the screening criteria set out in the PICOS, discussed their individual lists of articles to be included online and agreed on the final list of articles to be reviewed. Sandelowski and Barroso (2006)’s ‘negotiated consensual validation’ approach was used to achieve consensus on the final list of full text articles to be analysed.

선험적a priori 프레임워크가 없었기에, 포함된 기사에서 공통적인 주제를 식별하였고, [의대생들의 다양한 목표와 모집단 및 의대생들의 존재]에 의해 제기되는 한계, [전문직업성이 맥락-특이적이고 사회문화적으로 영향]을 받는 한계를 우회하기 위해 브라운과 클라크(2006)의 주제 분석에 대한 접근법이 채택되었다.  또한 이 접근방식은 통계적 풀링의 사용을 방지하며, 포함된 기사의 분석을 방지하는 광범위한 연구 방법론을 더 잘 설명한다. 브라운과 클라크(2006)의 접근방식은 다음과 같다.
In the absence of a priori framework, Braun and Clarke (2006)’s approach to thematic analysis was adopted to identify common themes across the included articles and circumnavigate the limitations posed by the presence of different goals and populations of medical students as well as the context-specific, socio-culturally influenced nature of medical professionalism (Van Der Vleuten and Schuwirth 2005; Braun and Clarke 2006; Goldie 2013; Birden et al. 2014; Li et al. 2017; Norcini et al. 2018; Patterson et al. 2018; Hodges et al. 2019). This approach also better accounts for the wide range of research methodologies present that prevent use of statistical pooling and analysis of the included articles (Haig and Dozier 2003a, 2003b; Braun and Clarke 2006; Riquelme et al. 2009; Schönrock-Adema et al. 2009; Soemantri et al. 2010; Gordon and Gibbs 2014). The phases of Braun and Clarke (2006)’s approach are detailed below

  1. 연구팀 구성원 11명이 포함된 기사를 '적극적으로' 읽어 자료에서 의미와 패턴을 찾는 등 반복적인 단계별 주제분석을 진행했다.
  2. An iterative step-by-step thematic analysis was carried out with 11 members of the research team ‘actively’ reading the included articles to find meaning and patterns in the data.
  3. 연구팀의 각 구성원은 텍스트의 '표면' 의미로부터 '코드'를 구성했다. 그런 다음 '오픈 코딩'의 초기 코드를 유사성에 따라 범주로 분류했다.
  4. Each member of the research team constructed ‘codes’ from the ‘surface’ meaning of the text (Boyatzis 1998; Braun and Clarke 2006; Voloch et al. 2007; Sawatsky et al. 2016). The initial codes from ‘open coding’ were then grouped into categories according to their similarities.
  5. 그런 다음 범주를 데이터를 가장 잘 나타내는 테마로 구성했다. 마인드 맵은 다양한 코드 간의 연결을 설명하고 주제를 설명하는 데 사용되었다. [귀납적 접근]은 테마를 "사전 결정된 분류 없이 원시 데이터에서 정의"할 수 있게 했다(Cassol et al. 2018). 브라운과 클라크(2006)는 테마를 "데이터에 대한 중요한 것… 그리고 데이터 집합 내의 패턴화된 반응이나 의미를 나타낸다"고 설명한다.
  6. The categories were then organised into themes that best represent the data. Mind maps were used to illustrate the links between the various codes and to help delineate themes. An inductive approach allowed themes to be “defined from the raw data without any predetermined classification” (Cassol et al. 2018). Braun and Clarke (2006) describe themes as something important about the data… and represents some level of patterned response or meaning within the data set”.
  7. 연구팀의 각 구성원은 테마가 일관적이고 전체 데이터 세트를 대표하는지 확인하기 위해 테마를 검토하고 다듬었다.
  8. Each member of the research team reviewed and refined their themes to ensure they were coherent and representative of the whole data set.
  9. 연구팀의 각 구성원들은 각각의 테마의 구체적인 특징들을 명명하고 설명하기 위해 독립적으로 일했다. 그런 다음 그들은 '협상된 합의된 검증' 접근 방식을 사용하여 공통 코딩 프레임워크와 코드북에 합의하기 위해 온라인과 대면 회의에서 개별 발견에 대해 논의했다(산델로스키와 바로소 2006). 코드북은 코드, 서브테마, 정의, 용어에 대한 설명, 적용 시기와 적용 안 함에 대한 지침으로 구성됐다. 이 회의들은 11명의 회원 모두가 같은 10, 30, 50개의 전문 기사를 검토한 후 3개의 시점에서 진행되었다.
  10. Each member of the research team worked independently to name and delineate specific characteristics of each theme. They then discussed their individual findings online and at face-to-face meetings to agree upon a common coding framework and code book using the ‘negotiated consensual validation’ approach (Sandelowski and Barroso 2006). The code book consisted of the codes, sub-themes, definitions, descriptions of terms and guidelines on when to use and when not to apply. These meetings were carried out at three junctures- after all 11 members had reviewed the same 10, 30 and 50 full text articles.
  11. 브라운과 클라크의 접근법 6단계(2006)의 일환으로, 역 교육자, 임상의사, 임상 환경에서 의료 전문성 교육 및 평가에 경험이 있는 연구자(자문팀)와 전문가 팀과 논의하는 동안 확인된 테마가 Birden 외(2013)의 "BEME 가이드 No.25: 의료 교육에서의 전문성 교육"에서 제안된 범주 및 Wilkinson 외(2009) 및 Veloski의 전문성 평가 도구 검토와 일치한다고 제안했다. 자문 및 전문가 팀은 데이터를 독립적으로 평가하고, 일반적인 이론에 깊이를 더하고, 식별된 주제를 검증하는 데 도움을 주기 위해 [지시된 내용 분석]을 사용해야 한다는 데 동의했다(Hsieh and Shannon 2005; Humble 2009).
  12. During discussions with local educationalists, clinicians and researchers who are experienced in medical professionalism teaching and assessment in clinical settings (advisory team) as well as the expert team as part of the sixth stage of Braun and Clarke (2006)’s approach, it was suggested that as the themes identified were consistent with the categories highlighted by Birden et al. (2013)’s “BEME Guide no.25: Teaching professionalism in medical education” and Wilkinson et al. (2009)’s and Veloski et al. (2005)’s reviews of assessment tools in professionalism. The advisory and expert teams were in agreement that directed content analysis ought to be used to independently evaluate the data, add depth to prevailing theories and would help verify the themes identified (Hsieh and Shannon 2005; Humble 2009).

브라운과 클라크의 주제 분석에 대한 접근 방식(2006)을 이용한 데이터 분석에 관여하지 않은 두 명의 독립 검토자가 [지시된 내용 분석]을 수행했다(Hsieh와 Shannon 2005). 지시적 내용 분석의 3단계는 다음과 같습니다.
Two independent reviewers not involved in the analysis of the data using Braun and Clarke’s approach to thematic analysis (2006) carried out directed content analysis (Hsieh and Shannon 2005). The 3 phases of directed content analysis are as follows.

  1. 첫 번째 단계연역 범주 적용(Elo and Kyngäs 2008)을 사용하여, 검토자가 버거 외(2019), 린치 외(2004), 버든 외(2013)의 BEME 가이드 No.25 및 Wilkinson 외 (2009) 및 벨로스키 외 연구진(2005)의 전문성 평가 도구 리뷰에 의해 제시된 훈련 전문성의 핵심 요소 설명에 기초하여 [코드를 독립적으로 결정]한다. 각 코드는 [코드북]에 정의되었으며, 이후 코딩 과정을 안내하는 역할을 했다.
  2. [2단계]에서는 두 검토자가 '코드북'을 사용하여 포함된 문서에서 관련 데이터를 독립적으로 추출하고 코드화하는 것을 보았다. 이러한 코드에 의해 포착되지 않은 관련 데이터는 연역 범주 적용에 따라 새로운 코드가 할당되었다. 포함된 10개의 기사에 대한 독립적인 검토 후, 검토자들은 온라인에서 그들의 발견을 논의했고, 코드와 코드북의 합의를 얻기 위해 '협상된 합의 검증'을 이용했다.
  3. 코드로부터 4개의 범주가 도출되었다. 이러한 범주(닐 외 2018)는 검토된 기사의 70% 이상(Curtis et al. 2001; Humble 2009)에 나타났는지 여부에 따라 선정되었다. 
  4. Using deductive category application (Elo and Kyngäs 2008), the first stage (Mayring 2000) saw the reviewers independently determine the codes based on descriptions of key elements of training professionalism set out by Berger et al. (2019), Lynch et al. (2004), Birden et al. (2013)’s BEME Guide no.25: Teaching professionalism in medical education and Wilkinson et al. (2009)’s and Veloski et al. (2005)’s reviews of assessment tools in professionalism. Each code was defined in the code book that then served to guide the subsequent coding process.
  5. Stage 2 saw the two reviewers using the ‘code book’ to independently extract and code the relevant data from the included articles. Any relevant data not captured by these codes were assigned a new code in keeping with deductive category application. Following independent review of the same 10 included articles, the reviewers discussed their findings online and ‘negotiated consensual validation’ was used to achieve consensus of the codes and the code book.
  6. From the codes were derived 4 categories. These categories (Neal et al. 2018) were selected based on whether they appeared in more than 70% of the articles reviewed (Curtis et al. 2001; Humble 2009).

[제작된 내러티브]는 BEME(Best Evidence Medical Education) 협업 가이드(Haig and Dozier 2003b)와 STORES(증거 합성의 의료 교육 보고에 대한 체계화된 접근법) 선언문(Gordon and Gibbs 2014)에 의해 안내되었다.

The narrative produced was guided by the Best Evidence Medical Education (BEME) Collaboration guide (Haig and Dozier 2003b) and the STORIES (Structured approach to the Reporting In healthcare education of Evidence Synthesis) statement (Gordon and Gibbs 2014).

품질평가
Quality assessments

연구팀 4명은 의학교육연구품질기구(MERSQI) (Read et al. 2008)와 COREQ (Consolidated Criteria for Report Qualitative Studies) (COREQ) (Tong et al. 2007)를 사용하여 정량적 연구의 개별 평가를 수행하였다.그의 평론 연구 팀은 평가의 차이를 조정하기 위해 대면했다. 품질 평가 요약은 이 체계적 검토에 포함된 기사 목록과 함께 부록 B와 C에 제시되어 있다.
Four members of the research team carried out individual appraisals of quantitative studies using the Medical Education Research Study Quality Instrument (MERSQI) (Reed et al. 2008) and the Consolidated Criteria for Reporting Qualitative Studies (COREQ) (Tong et al. 2007) to evaluate the quality of qualitative and quantitative studies included in this review. The study team met face-to-face to reconcile any differences in their assessments. A summary of the quality assessment together with the list of articles included in this systematic review is founded in Supplementary Appendices B and C.

결과.
Results

6개의 데이터베이스에서 13921개의 추상적인 내용을 확인했고 854개의 전문 기사를 검토했으며 162개의 전문 기사를 체계적으로 검토했다(그림 1: PRISMA 흐름도).

13921 abstracts were identified from six databases, 854 full-text articles reviewed, and 162 full-text articles were thematically analysed in this systematic review (Figure 1: PRISMA Flowchart).

브라운과 클라크(2006)의 접근 방식을 사용한 [주제 분석 결과]와 [지시된 내용 분석]에서 식별된 범주(Hsieh와 Shannon 2005)는 유사했다. 이것들은 1) 전문성의 정의, 2) 영역, 3) 훈련 접근법, 4) 전문성 교육에 대한 장벽과 가능자였습니다.
The results of the thematic analysis using Braun and Clarke’s (2006) approach and the categories identified from directed content analysis (Hsieh and Shannon 2005) were similar. These were 1) definition of professionalism, 2) domains, 3) training approaches, and 4) barriers and enablers to the teaching of professionalism.

전문직업성의 정의
Definition of professionalism

전문직업성의 개념은 여전히 제대로 정의되지 않고 있다. 분석된 162개의 기사에는 58개의 전문직업성 정의와 설명이 있었다. 이러한 정의의 핵심 요소 및 전문성에 대한 설명은 보충 표 1에 주제별로 분석 및 요약되었다.
The concept of professionalism remains poorly defined. There were 58 definitions and or descriptions of professionalism featured in the 162 articles analysed. The key elements of these definitions and or descriptions of professionalism were thematically analysed and summarised in Supplementary Table 1.

Subtheme Elaboration
Abstract concept Comprises of abstract concepts

Is an identity
Influenced by concepts of medicine’s role and place Involves understanding the nature of medicine
 
And underpins the trust in the doctor-patient relationship
 
Knowing the hierarchy and understanding their position in it
Sociocultural informed Varies according to cultural contexts
 
Societal aspects (political, economic and social dimensions)/ interaction with the community
Good clinical practice Having Clinical competence (including clinical judgement, breadth of knowledge, clinical care)
 
Good communication skills
 
Having ethical, moral and legal knowledge and standards
 
Exhibiting teamwork with colleagues

Strong leadership skills

Being sensitive to the needs, beliefs and cultures of others
Driving self-improvement Striving for excellence
 
Having a commitment to the job and learning

Self-assessment, reflection and regulation
Includes a set of virtues Honour and integrity

Accountability and responsibility

Humanism (respect for others, empathy)

Spirituality

Altruism

 

전문 분야
Domains of professionalism

전문직업성의 교육은 표 2에 요약된 임상 역량, 인문학적 자질 및 반사 능력의 세 가지 영역을 포함한다.

Training professionalism involved 3 domains: clinical competence, humanistic qualities and reflective capacity outlined in Table 2.

교육 접근법
Training approaches

전문직업성 육성을 위한 접근방식을 논의할 때, 비공식적이고 숨겨진, 비공식적이고 공식적인 커리큘럼이 교육 접근법에 미치는 영향을 고려하는 것이 유용하다(그림 2).

In discussing approaches to nurturing professionalism it is useful to consider the impact of the informal, hidden, the non-formal and formal curricula upon the training approaches (Figure 2).

 
 
 

접근법 자체는 보충 표 2에 설명되어 있습니다.
The approaches themselves are featured in Supplementary Table 2.

Subtheme Elaboration Reason for Use
Didactic Methods Ceremonies, such as the White Coat Ceremony or a ceremony held prior to dissection. Ceremonies such as the White Coat Ceremony “symbolize the matriculating students’ induction into the medical profession”
Workshops, Lectures, Seminars and Tutorials Such methods appear to be in the minority in favour for methods that encourage active participation from students.
Dialectic Methods Small Group Discussions
 
These require a safe space, such as through a collegial setting.
In preparation for small group discussions, students have an opportunity to reflect on their experiences
 
Additionally, by participating in discussions, students gain “a large bag of tools” to “be able to understand [their] peers better, or [their] patients better”
Role-modelling A role model may be understood as “an individual whose behaviour is admired or imitated by others”.
 
Role models may be assigned by the school as part of a formal mentoring programme.
By demonstrating strong professional attributes, students can understand how such attributes can be adopted into their future practice.
 
Experiential Learning Students are given opportunities to practice professionalism by interacting with patients (real or simulated). These encounters may (or may not) be planned specifically by faculty for the express objective of nurturing professionalism. The key is to integrate theory and practice.
Focused on Reflection Portfolio which is a “a collection of written accounts of events and activities experienced by an individual, kept in the form of a journal.” Reflection should be incorporated into curricula as it allows for the internalisation of attributes taught.
Methods that focus on medical humanities, such as creative writing in response to a prompt.


35개 프로그램은 전문직업성을 가르치기 위한 접근 방식을 조합하여 사용하였다(보완 표 2). 30개의 프로그램은 "서비스 대상 개인과 공동체의 이익을 위한 커뮤니케이션, 지식, 기술 기술, 임상적 추론, 감정, 가치 및 일상적 실천에서의 성찰"과 같은 특정 역량에 대한 교육을 목표로 했다. 반면 다른 이들은 환자 중심 치료 접근법 개발에 초점을 맞췄다(엡스타인 외). 2004) 및 성찰 능력 개선(Elango et al. 2005) (보조 표 2).
35 programmes used a combination of approaches to teach professionalism (Supplementary Table 2). 30 programs targeted training on specific competencies such as “habitual and judicious use of communication, knowledge, technical skills, clinical reasoning, emotions, values, and reflection in daily practice for the benefit of the individual and community being served”(Epstein et al. 2004) whilst others focused upon developing a patient centred approach to care (Epstein et al. 2004) and improving reflective capacity (Elango et al. 2005) (Supplementary Table 2).

일부 프로그램은 몇 년 동안 지속된 종적 접근 방식을 취했다(Branch 2015; Karunakaran et al. 2017). 예를 들어, 프로그램은 "의대생과 함께 2년 이상 동안 매주 - 2회 월별로" 개최될 수 있으며(지점 2015), 5.5년 동안 반년마다 한 번 개최될 수 있다(Kalén et al. 2015).
Some programs took a longitudinal approach that ran over the course of a few years (Branch 2015; Karunakaran et al. 2017). For instance, programmes may be held “weekly to twice monthly for 2 years or longer with medical students”(Branch 2015) or once every half a year for 5.5 years (Kalén et al. 2015).

장벽 및 활성화 요소
Barriers and enablers

장벽은 시스템 수준, 기관 수준, 교수 수준, 개인 수준(표 4)에 존재하는 전문성 교육의 효율성을 저해하는 요인이다. 많은 경우에 이 장벽들은 얽혀있다. 높은 수준의 장벽은 "낙수 효과"를 가지고 있고 낮은 수준의 장벽에 영향을 미친다는 점도 유의하는 것이 유용하다(그림 3).

Barriers are factors that undermine the effectiveness of professionalism training which exist at the system-level, institution-level, faculty-level, individual-level (Table 4). In many instances these barriers are entwined. It is also useful to note that barriers at a higher level have a “trickle-down effect” and affect barriers at a lower level (Figure 3).

 
 
 
 

Enabler전문직업성 훈련의 효과를 촉진하는 요소로 이해될 수 있다. 여기에는 다음이 포함됩니다.

  • 프로그램에 대한 학생들의 적극적인 참여는 매우 중요하다.
  • 학생들에게 전문직업성에 대한 학습 동기를 부여하고, 자기 주도 학습을 강화하며, 전문직업성 훈련에 대한 관심을 전파한다.
  • 그들이 배우고 관찰하는 것의 불일치를 토론할 플랫폼. 이를 통해 교직원과 학생 사이에 신뢰 관계를 구축하여 개방적인 커뮤니케이션과 필요한 경우 후속 교정 작업을 수행할 수 있습니다.
  • 기관과 교수진의 지원은 필수적이다.

Enablers can be understood as factors that promote the effectiveness of professionalism training. These include

  • active student involvement in the programme is crucial (Humphrey et al. 2007; Parker et al. 2008).
  • motivating students about learning about professionalism, enhancing self-directed learning and propagating interest in professionalism training (Humphrey et al. 2007; Parker et al. 2008) (Kenyon and Brown 2007; Monrouxe et al. 2011).
  • a platform to discuss discrepancies in what they learn and observe (Driessen et al. 2003; Rabow et al. 2007; Wald et al. 2009; Monrouxe et al. 2011). This builds trust between faculty and students to allow for open communication and subsequent remediation if needed (Driessen et al. 2003; Rabow et al. 2007; Wald et al. 2009; Monrouxe et al. 2011).
  • support from institutions and faculty is vital (Shapiro and Rucker 2003; Elango et al. 2005; Du Preez et al. 2007; Goldie et al. 2007; Humphrey et al. 2007; Kalet et al. 2007; Kenyon and Brown 2007; Parker et al. 2008; Jayasuriya-Illesinghe et al. 2016).

품질평가
Quality assessments

본 연구에 포함된 논문은 합리적인 품질이었다(부록 C). 이것은 연구의 타당성을 뒷받침한다.
The papers included in this study were of reasonable quality (Supplementary Appendix C). This supports the validity of the study.

논의
Discussion

[지시된 내용 분석]과 브라운과 클라크의 [주제 분석]에 대한 접근 방식을 동시에 사용하는 것은 참신하며, 식별된 범주를 검증하는 역할을 한다. 데이터를 분석하기 위해 두 가지 독립적인 접근 방식을 사용하면 방법적 삼각측량(Asarroudi et al. 2018)을 제공할 수 있으며, 각 검토자는 동일한 데이터를 독립적으로 분석하도록 하여 연구자 삼각측량을 하였다(Davey et al. 2015). 삼각측정은 또한 외부 타당성을 향상시키고 이 접근 방식 내의 객관성을 향상시킨다(Hsieh 및 Shannon 2005).
Concurrent use of directed content analysis (Hsieh and Shannon 2005) and Braun and Clarke’s approach to thematic analysis is novel and does serve to validate the categories identified. Use of two independent approaches to analyse the data also provides method triangulation (Assarroudi et al. 2018) whilst having each reviewer independently analyse the same data provides investigator triangulation (Davey et al. 2015). Triangulation also enhances external validity and improves the objectivity within this approach (Hsieh and Shannon 2005).

주요 연구 질문에 답하기 위해, 전문직업성[전문적 정체성 형성]에 영향을 미치는, [임상 역량, 인문학적 자질, 성찰 능력, 자기 관리 및 자기 인식]에 기반을 둔, 사회문화적으로 영향을 받은, 윤리적으로 민감한 개념으로 스케치할 때, 이 체계적 범위 검토는 앞서 기술된 것보다 더 넓은 전문직업성 개념을 제안합니다. 이러한 관점은 싱가포르의 전문직업성 개념 내의 요소들과 특히 관련이 있다. 예를 들어, 자율성의 '전통적인' 원자론적 개념보다는 임상 치료에서 지배적인 가족 중심적 서술에 민감하다. 이러한 [사회문화적 정보]는 의사 소통, 전문가 간 상호작용, 임상의 역할에 대한 관점, 따라서 싱가포르, 말레이시아, 중국, 일본 및 한국에서 전문성을 바라보는 방식에 영향을 미친다.
In answering its primary research question and sketching professionalism as a socioculturally influenced, ethically sensitive concept built upon clinical competence, humanistic qualities, reflective capacity, self-care and self-awareness that influences professional identity formation this systematic scoping review suggests a wider concept of professionalism than previously described (Cruess and Cruess 2008; Cruess et al. 2016). This perspective is especially relevant with elements within concepts of professionalism in Singapore, for example, being sensitive to the dominant family centric narrative in clinical care rather than ‘traditional’ atomistic concepts of autonomy (Krishna 2014; Krishna et al. 2014; Krishna and Kwek 2015; Radha Krishna and Alsuwaigh 2015). This socioculturally informed practice impacts communication, interprofessional interactions, views on the role of the clinician and thus the manner that professionalism is viewed in Singapore, Malaysia, China, Japan and Korea (Ho et al. 2013; Chai et al. 2014; Chong et al. 2015; Loh et al. 2016; Chang et al. 2017).

[전문적 정체성 형성]은 또한 의대생들 사이에서 전문성을 기르려는 노력에서 더 큰 역할을 부여받지만, 그 정확한 영향은 추가적인 설명이 필요하다(보완표 1). 이는 시간이 지남에 따라, 전문직업성에 대한 평가에 [학습자 개인적 특질personhood이라든가 '나를 나로 만드는 것'에 대한 학습자의 관점]이 동반되어야 한다는 것을 암시한다. 이러한 변화를 보다 효과적으로 그리고 개인 차원에서 지원하는 것은 전문직업성 발달에 대한 교육 및 감독을 더 잘 할 수 있게 할 것이다.

Professional identity formation is also afforded a greater role in efforts to nurture professionalism amongst medical students though its precise impact requires further elucidation (Cruess RL and Cruess SR 1997; Cruess SR and Cruess RL 1997; Inui 2003; Cruess and Cruess 2008; Cruess et al. 2016) (Supplementary Table 1). This suggests evaluations of the professionalism of an individual learner overtime should also be accompanied by they view their personhood or “what makes you, you’ (Krishna 2013; Alsuwaigh and Krishna 2014; Krishna 2014; Alsuwaigh and Krishna 2015; Krishna and Kwek 2015). Supporting these changes more effectively and on an individual level will allow better inculcation and oversight of the development of professionalism.

전반적으로 이러한 연구 결과는 다음과 같이 전문직업성이 길러져야 한다는 것을 시사한다.
Overall these findings suggest that professionalism should be nurtured as

  • I. 구조화된 커리큘럼의 일부분으로
    • 이를 통해 일반적인 지리정치적, 사회문화적 요소와 일치하는 적절한 임상 실무 규범와 관련 전문적 관리 표준이 교육 과정에 적절히 반영되도록 보장할 수 있다.
    • 전문직의 주요 특성(보완표 1)을 교육하고, 역할 모델링하고, 평가하고, 기준을 준수하도록 보장합니다.
    • 안전한 환경과 적절한 시점에 이러한 기술의 연습을 촉진하는 것은 학습과 가치, 신념과 실천을 포함하는데 도움이 될 것이다. 
    • 프로세스에 대한 감독 및 학습자의 지원을 강화합니다.
    • 전문직업성과 관련하여 사고, 실천 및 태도에 영향을 미치는 비공식, 숨겨진, 공식 커리큘럼(그림 2)의 영향을 더 잘 다루고 평가한다.
  1. I. part of a structured curriculum.
    • This will ensure appropriate clinical codes of practice and relevant professional standards of care consistent with prevailing geo-political and sociocultural factors are appropriately inculcated into the training process.
    • Ensures that the key characteristics of a professional (Supplementary Table 1) are taught, role modelled, assessed and standards are policed.
    • facilitate practice of these skills in safe environments and at appropriate junctures will help embed learning and values, beliefs and practice.
    • enhance oversight of the process and support of the learners.
    • better address and assess the impact of the informal, hidden and formal curriculum (Figure 2) that influence thinking, practice and attitudes with regards to professionalism.
  2. II. 단계적으로. (그림 4와 같이) 프로페셔널리즘은 단계별로 발전하며, 각 단계는 다른 단계 위에 구축된다.
    1. 구조화된 접근 방식은 각 개발 단계에서 학습자와 관련된 방식으로 전문직업성을 배양할 수 있도록 한다.
      1. 1단계. 지식 주입
  3. II. in stages (as shown in Figure 4). Professionalism develops in stages, with each stage building upon the other.
    • A structured approach allows professionalism to be nurtured in a manner that is relevant to the learner at each stage of their development.
      • Stage 1. Instilling knowledge
 
 

전문직업성 육성은 수평적, 수직적 통합이 필요하다. 이 단계는 다음에 대한 지식을 주입하기 위한 교육적 프로그램으로 시작한다.

  • 전문직업성의 다양한 차원들,
  • 전문직업적 실천의 중요성,
  • 의료 전문가의 역할과 책임 
  • 여기에 필요한 기술

Nurturing professionalism needs to be horizontally and vertically integrated. This stage begins with didactic programs to instil knowledge about

  • the various dimensions of professionalism,
  • the importance of professional practice,
  • the roles and responsibilities of a medical professional and
  • the skills required.

[의대 신입생]의 경우 [의대생으로서의 전문적 역할]을 중심으로 전문직업성 소개가 이뤄진다. 이러한 역할은 전문 단체와 가능한 경우 [기관의 명예 규범]에 의해 규정된다. 이 문서들은 학생의 행동과 책임에 대한 기대치를 제시한다. 기대치를 설정하고 조정하는 것과는 별개로, 전문성과 전문적 행위에 대한 '핵심' 또는 필수적인 지식의 제공은 전문적 실천과 정체성 형성의 기초를 형성한다.
For new medical students, the introduction to professionalism revolves around their professional roles as medical students. These roles are set out by the professional bodies and where possible, the honour code of the institution. These documents lays out the expectations upon the student’s conduct and responsibilities. Aside from setting out and aligning expectations, provision of ‘core’ or essential knowledge of professionalism and professional conduct forms the basis for professional practice and identity formation.

  • 2단계. 전문적인 아이덴티티 수용
  • Stage 2. Embracing a professional identity

전문적 정체성 형성 단계 2에서 전문직업성의 역할을 반복하는 것은 [사례 기반 토론]과 [새로운 책임을 상징하기 위한 "화이트 코트" 세리머니와 같은 공식적인 행사]의 조합을 포함한다.

Reiterating professionalism’s role in professional identity formation Stage 2 involves a combination of case based discussions and formal events such the “white coat” ceremony to symbolise the new responsibilities.

  • 전문직업성 교육과정의 지식과 기술 구성요소의 [수직적 통합]은 주입되는 전문성의 새로운 요소들이 널리 퍼진 지식과 학생들이 그것의 관련성을 즉시 인식할 수 있는 교육의 배경 위에 구축되도록 하는 수평적 통합이 수반될 것이다.
  • Vertical integration of the knowledge and skills components of the professionalism curriculum will be accompanied by horizontal integration ensuring that new elements of professionalism being instilled build upon prevailing knowledge and a background of teaching where students can immediately appreciate its relevance.

 

  • 3단계. 전문직업성 개념의 맥락화
  • Stage 3. Contextualising the concept of professionalism

[소규모 그룹 토론]은 또한 학습 과정을 [맥락적으로 이해]하는 데 도움이 될 것이다. 이를 통해 학생들은 전문적인 특성, 기대, 사회적 의미 및 기술의 목적과 장소를 볼 수 있다. 이것은 또한 훈련의 초기 단계에서 흡수된 지식, 기술 및 태도를 통합하는 데 도움이 됩니다.
Small groups discussions will also help contextualise the learning process. This allows students to see the purpose and place of professional characteristics, expectations, social implications and skills. This also helps integrate the knowledge, skills and attitudes imbibed in earlier stages of training.

  • 4단계. 역할 모델링
  • Stage 4. Role modelling

[역할 모델링]은 학습 과정 전반에 걸쳐 발생하며 [능동적이고 의식적으로 수행되어야] 합니다. 여기서 1단계와 2단계에서 학습한 우수한 전문적 행동과 실습에 대한 지식은 학생들이 "긍정적인 역할 모델링과 부정적인 역할 모델링을 구별하는 데 도움이 된다"(Karnieli-Miller et al. 2013).

Role modelling occurs throughout the learning process and must be actively and consciously carried out. Here knowledge of good professional conduct and practice learned in Stages 1 and 2 helps students “[discern] between positive and negative role modelling” (Karnieli-Miller et al. 2013).

  • 5단계. 커뮤니케이션을 통한 전문직업성
  • Stage 5. Professionalism through communications

이 단계는 학생들이 의사 소통과 임상 환경에서 [모의 환자] 및 [의료 전문가와의 시뮬레이션]을 사용하여 전문가 간 기술을 개발하는 것을 보여줍니다. 여기서는 문화적 감수성뿐만 아니라 임상적 역량, 인문학적 자질과 성찰 능력이 일제히 실천된다.
This stage sees students practicing professionalism in communication and in the clinical setting using simulations with simulated patients and healthcare professionals to develop interprofessional skills. Here clinical competence, humanistic qualities and reflective capacity as well as cultural sensitivity are practiced in unison.

  • 6단계. 프로페셔널리즘을 표현
  • Stage 6. Portraying professionalism


6단계에서는 의대생들이 [환자 및 그들의 가족들]과 상호작용을 시작하는 것을 본다. 이러한 상호작용은 평가되고, 안전한 환경에서 적시에 피드백이 제공된다.
Stage 6 sees medical students begin interactions with patients and their families. These interactions are assessed and timely feedback provided in a safe environment.

  • 7단계. 전문적 특성 심화
  • Stage 7. Deepening professional traits

여기에는 성찰, 보고 및 피드백이 포함됩니다. 이 '단계'는 학습을 강화하기 위해 모든 초기 단계와 평행하게 진행되어야 한다. 성찰적 실천에는 효과적이고, 개인화되고, 적절하고, 구체적이고, 시기적절하며, 전체적인 피드백과 지원이 수반되어야 한다.

This involves reflections, debriefs and feedback. This ‘stage’ ought to run parallel with all the earlier stages to enhance learning. Reflective practice must be accompanied by effective, personalised, appropriate, specific, timely, holistic feedback and support.

  • III. 종단적으로. 인문학적 특징과 성찰적 실천의 주입은 의대생의 전문직업적 정체성의 발전과 실천의 변화를 지원하기 위한 [종단적 지원과 평가의 필요성]을 강조한다. 교육 과정 전반에 걸쳐 일관성, 수평 및 수직 통합 및 지원을 보장하는 구조화된 접근 방식을 유지하는 것 외에도, 종단적 접근 방식은 교육 과정의 모든 요소에 대한 지속적인 평가를 위한 효과적인 플랫폼을 제공한다.
  • III. longitudinally. The inculcation of humanistic features and reflective practice underlines the need for longitudinal support and assessment to support changes in practice and development of the medical student’s professional identity. Aside from maintaining a structured approach that ensures consistency, horizontal and vertical integration, and support throughout the training process, a longitudinal approach provides an effective platform for continuous assessments of all elements of the training process.
  • IV. 역량 기반 프로세스(Stockley and Forbes 2014; Ziring et al. 2015). 평가는 명확한 이정표를 통해 통보되어야 한다. 역량 기반 프로세스는 "예측할 수 없는 상황을 탐색할 수 있는 내면의 나침반"을 개발하고 "체크리스트 채우기"에 대한 의존을 방지하는 수단으로 간주됩니다. 역량 기반 프로세스는 다음과 같은 특성이 있다.
  • IV. competency based process (Stockley and Forbes 2014; Ziring et al. 2015). Assessments must be informed by clearly delineated milestones. A competency based process is seen as a means of developing an “inner compass in preparation for navigating unforeseeable circumstances” (Baker et al. 2011) and prevent reliance upon “fulfilling checklists” (Stockley and Forbes 2014). A competency based process
    • 널리 퍼진prevailing 지식과 기술을 기반으로 합니다. 이는 교육 과정 전과 과정 중에 능력, 지식 및 기술에 대한 효과적인 평가를 의미합니다. 여기서 데이터는 다루는 주제들이 서로 기반해야 한다는 것을 보여준다. 여기에는 임상 기술 개발, 작업 관리, 전문가 간 관계 관리, 사회와 법률 및 전문 및 임상 기준의 관점에서 그들의 진화하는 역할 이해 및 사회에서의 전문가의 위치 파악이 포함된다. 이러한 주제들은 새로운 학습을 알리는 모든 단계에서 혼합될 수 있다.
    • builds on prevailing knowledge and skills. This means effective evaluation of ability, knowledge and skills before and during the training process. Here the data reveals that the topics covered should build on one another. This includes development of clinical skills, work management, managing interprofessional relationships, understanding their evolving roles in society and in the eyes of the law and professional and clinical standards and appreciation of the professional’s place in society. These topics may be mixed at all stages informing new learning.
    • 효과적으로 평가되어야 한다. 각 단계별로 전문성에 대한 구체적인 평가가 요구된다. 이러한 도구는 숨겨진 공식 커리큘럼의 영향을 고려해야 하며 예측 타당성과 함께 적응 가능하고 신뢰할 수 있어야 합니다. 그러나 일반적인 평가 도구에 대한 데이터는 거의 없다.
    • must be effectively assessed. Specific assessments of professionalism at each stage is required. These tools must consider the impact of the hidden and formal curricula and be adaptable and authentic with predictive validity. There is however little data on prevailing assessment tools.
    • 포트폴리오 기반 종단 교육 프로그램의 일부가 되어야 합니다. 훈련의 종적 성격과 전문 기술, 전문성 평가의 개선을 위한 지속적인 의료 교육 및 동기의 필요성은 전체론적holistic이고, 임상 영역 내에 있어야 한다(Birden et al. 2013). 이 접근 방식은 효과적이고 시기적절한 평가와 일관된 피드백에 의존하여 "학습된 기술을 성숙시키고 반영하고 발전시킬" 수 있는 구체적인 지침과 기회를 적시에 제공합니다(Stockley and Forbes 2014). 현재 평가 방법은 다양하나, 제대로 평가된 바 없다.
    • ought to be part of a portfolio based longitudinal training program. The longitudinal nature of training and the need for continued medical education and motivation to improve on professional skills, assessments of professionalism must be holistic and within the clinical arena (Birden et al. 2013). This approach relies on effective and timely assessments and consistent feedback to provide timely specific guidance (Elango et al. 2005; Chretien et al. 2008) and opportunities to “mature, reflect and build upon skills learned” (Stockley and Forbes 2014). Currently, assessment methods have been varied and poorly evaluated.
    • 학생의 능력, 태도, 지식 및 기술에 따라 [개인화된personalized 프로세스]이므로, 프로그램에 대한 적응을 지원하는 [개인화된individualized 프로세스]여야 합니다(Birden et al. 2013). 이는 필요한 경우 재교육을 주입할 수 있는 가능성을 높인다(Parker et al. 2008).
    • be a personalised process dependent upon the abilities, attitude, knowledge and skills of the student and thus must be an individualised process that supports adaptations to the program (Birden et al. 2013). It also raises the potential to inculcate remediation where needed (Parker et al. 2008).

[일반적인 정의(부록 D)]와 [전문직업성이 길러지는 방법에 대한 일반적인 설명]을 통해 임상적으로 관련된 전문직업성 개념을 전달할 수 있습니다. 여기서 전문직업성은 다음과 같이 개념화될 수 있다."[사회문화적 요인]과 [사회 내에서 의학과 의학의 정체성의 역할에 대한 지배적인 의철학]에 의해 정의되는 진화하는 개념으로, 다음의 것들을 함양하는 과정에서 [역량-기반 단계]로 개발된다.
Drawing from prevailing definitions (Supplementary Appendix D) and prevailing accounts of how professionalism is nurtured allows the forwarding of a clinically relevant concept of professionalism. Here professionalism may be conceived as an evolving concept defined by sociocultural factors and prevailing medical philosophy on the role of medicine and medicine’s identity within a society and developed in competency based stages that include the inculcation of

  1. 의사가 지속적으로 개발하고 추가하고자 하는 [핵심 속성 및 덕목]. 여기에는 자기계발, 좋은 임상진료에 대한 헌신, 임상역량 향상, 리더십 및 지속적 학습, 자기평가, 자기성찰 및 자기조절, 그리고 사회문화적 정보에 기반하며, 윤리적으로 적절하며, 도덕적으로 민감한 돌봄에 대한 관점
  2. 성별, 나이, 문화, 인종, 종교, 장애, 출신, 사회경제적 지위 및 성적 지향에 [관계없이 돌봄의 의무, 공공의 이익을 증진하는 것]을 포함한 [핵심 가치].
  3. 돌봄에 대한 [전문직의 조화]와 동료 전문가와의 효과적이고 [동료적collegial 협력]을 보장하는 책임.
  4. 명예와 성실, 책임과 책임, 휴머니즘, 영성과 이타성을 포함한 전문가의 [덕목]"
  5. core attributes and virtues that physicians seek to continue to develop and add to such as self-improvement, commitment to good clinical care, enhancing clinical competence, leadership and continuous learning, self-assessment, self-reflection and self-regulation and to developing a socioculturally informed, ethically appropriate, morally sensitive perspective to care.
  6. core values including an obligation to care, promote public good irrespective of gender, age, culture, race, religion, disabilities, national origin, socioeconomic status, and sexual orientation that is consistent with prevailing standards of care and conduct.
  7. a responsibility to ensure professional coordination of care and effective and collegial cooperation with fellow professionals.
  8. virtues of a professional including honour and integrity, accountability and responsibility, humanism, spirituality and altruism.”

이 개념은 의학 분야에서 전문적 정체성 형성의 중요성, 그리고 활기차고 훈련된 역할 모델 및 교육자가 전문성의 핵심 가치, 신념 및 원칙을 가르치고 학생들이 안전하고 구조화된 임상 공간에서 이러한 기술을 연마하도록 감독하는 것을 강조한다. 동시에 이 개념은 사회문화적, 지정학적 고려사항의 차이뿐만 아니라 프로그램의 목표와 학습자의 능력을 지적하면서 지배적인 정의의 이질성에 대한 근거를 설명한다.

This concept underscores the importance of professional identity formation, the critical role of emersion in the field of medicine and having vibrant, trained role models and educators instil the key values, beliefs and principles of professionalism and oversee students hone these skills in a safe and structured clinical space. Concurrently this concept explicates the rationale for heterogeneity in prevailing definitions, pointing to differences in sociocultural and geopolitical considerations as well as the goals of the program and abilities of the learners.

검토의 한계
Limitations of the review

의료 전문직업성은 추상적인 개념 때문에 명확하지 않다. 그 결과, 리뷰를 영어로 출판되거나 영어로 번역된 기사로 한정하면 주요 논문 누락의 위험이 있습니다. 또한 영어로 출판되거나 영어로 번역된 논문 기사에 초점을 맞추면서 북미와 유럽에서의 연구에 초점을 맞추게 되었다. 이것은 매우 다른 문화적 환경에서 의료 행위가 일어날 수 있는 다른 나라들에서 결과의 적용 가능성을 감소시킨다.
Medical professionalism is ill-defined due to its abstract (Gauger et al. 2005; Lesser et al. 2010; Pryor 2010; Monrouxe et al. 2011; Bennett et al. 2013; Bernabeo et al. 2014; Cuesta-Briand et al. 2014; Ziring et al. 2015), evolving (Gauger et al. 2005; Lesser et al. 2010; Pryor 2010; Monrouxe et al. 2011; Bennett et al. 2013; Bernabeo et al. 2014; Cuesta-Briand et al. 2014; Ziring et al. 2015) and context-dependent nature (Godkin and Savageau 2001; Kochar et al. 2003; Monrouxe et al. 2011; Bernabeo et al. 2014; Saeedi Tehrani et al. 2017). As a result confining our review to articles published in English or had English translations, risks of missing key papers. In addition, focus upon papers articles published in English or had English translations led to focus upon studies in North America and Europe. This diminishes the applicability of results in other countries where medical practice could take place in a vastly different cultural setting.

또한 시간과 인력 제약으로 인해 체계적인 검토는 1990년부터 2019년까지의 논문만 고려했다.
Additionally, due to time and manpower constraints, the systematic review only considered papers from 1990 to 2019.

교육을 포착할 수 있을 정도로 광범위하지만 전문직업성을 육성하는 데 초점을 제한하고 전문직업성에서 지식, 기술 및 태도의 개발을 지원하는 것은 많은 중요한 영역을 생략한 것으로 보인다. 여기에는 튜터 교육 및 평가, 전문가 정체성 형성을 위한 평가 도구 및 교정 평가가 포함됩니다.
Confining focus upon nurturing professionalism though broad enough to capture teaching and supporting the development of knowledge, skills and attitudes in professionalism does appear to have omitted a number of significant domains. These include tutor training and assessment, assessment tools for professional identity formation and evaluations of remediation.

집중 검토는 또한 전문직업성이 특히 젊은 의사의 사고, 의사 결정 및 행동을 지도하는 가치, 신념 및 원칙을 주입할 때 전문적 정체성 형성의 발전과 개인 및 직업적 정체성을 바라보는 방법에 대한 영향을 폭넓게 이해하도록 방해한다.

A focused review also prevents wider appreciation of the development of professional identity formation and its impact on how professionals view their personal and professional identities particularly when professionalism inculcates values, beliefs and principles that guides thinking, decision making and behaviour of young physicians.

결론
Conclusion

이러한 체계적인 범위 검토는 전문직업성이 의대생들의 성격에 대한 관점의 변화에 영향을 받는 전문적 정체성 형성과 밀접하게 얽혀 있음을 시사한다. 결과적으로, 이 체계적인 범위 검토는 전문가 정체성 형성, 인격의 개념, 과정의 진화하는 맥락에 민감한 종적 특성 및 학습 환경에 미치는 영향을 고려하는 효과적인 도구의 설계에 전문성 육성에 대한 향후 연구가 집중되어야 한다는 결론을 내린다. 이러한 관심 영역에 대한 체계적인 검토가 뒤따라야 한다. 이러한 초기 단계를 통해 의과대학에서 전문성을 효과적으로 육성하고 평가할 수 있다.

This systematic scoping review suggests that professionalism is intimately and inextricably entwined with professional identity formation affected by a change in how medical students’ view their personhood. As a result, this systematic scoping review concludes that future research into nurturing professionalism must be focused upon design of effective tools that consider professional identity formation, concepts of personhood, the evolving context sensitive longitudinal nature of the process and the impact upon the learning environment. Systematic reviews of these domains of interest must follow. It is with these initial steps can professionalism be effectively nurtured and assessed in medical schools.

 


Med Teach. 2020 Jun;42(6):636-649. doi: 10.1080/0142159X.2020.1724921. Epub 2020 Feb 17.

Nurturing professionalism in medical schools. A systematic scoping review of training curricula between 1990-2019

Affiliations collapse

Affiliations

1Division of Supportive and Palliative Care, National Cancer Centre Singapore, Singapore, Singapore.

2Yong Loo Lin School of Medicine, National University of Singapore, Singapore, Singapore.

3Medical Library, National University of Singapore Libraries, National University of Singapore, Singapore, Singapore.

4Family Medicine Residency, National University Health System, Singapore, Singapore.

5Palliative Care Institute Liverpool, Academic Palliative and End of Life Care Centre, University of Liverpool, Liverpool, England.

6Education Department, Duke-NUS Graduate Medical School, Singapore, Singapore.

7Centre for Biomedical Ethics, National University of Singapore, Singapore, Singapore.

PMID: 32065016

DOI: 10.1080/0142159X.2020.1724921

Abstract

Introduction: Professionalism is an evolving, socioculturally informed multidimensional construct that influences doctor-patient relationships, patient satisfaction and care outcomes. However, despite its clinical significance there is little consistency in how professionalism is nurtured amongst medical students. To address this gap a systemic scoping review of nurturing professionalism in medical schools, is proposed.Methods: Levac's framework and the PRISMA-P 2015 checklist underpinned a 6-stage systematic review protocol. Concurrent use of Braun and Clarke's approach to thematic analysis and directed content analysis was used to identify the key elements in nurturing professionalism.Results: 13921 abstracts were identified from six databases, 854 full-text articles reviewed, and 162 full-text included articles were included. The 4 themes identified through thematic analysis are consistent with findings of the directed content analysis. These were the definition of professionalism, the approaches, content, barriers and enablers to teaching professionalism.Conclusion: Informed by a viable definition of professionalism and clear milestones nurturing professionalism nurturing professionalism begins with culturally appropriate training in clinical competence, humanistic qualities and reflective capacity. This process requires effective evaluations of professional identity formation, and the impact of the learning environment underlining the need for longitudinal assessments of the training process.

Keywords: Medical professionalism; medical education; medical students; professionalism training.

판도라의 상자 열기: 누가 프로페셔널리즘을 소유하고 있으며, 21세기 정의가 필요한 시점인가? (Med Educ, 2022)
Re-opening Pandora's box: Who owns professionalism and is it time for a 21st century definition?
Viktoria C. T. Goddard | Susannah Brockbank

 

1 소개
1 INTRODUCTION

"프로페셔널리즘은 성공적인 이데올로기이며,
따라서 지위와 소득을 위해 경쟁하는 광범위한 직업 집단의 정치적 어휘로 들어갔다." (추가됨)

“[P]rofessionalism is a successful ideology and as such has entered the political vocabulary of a wide range of occupational groups who compete for status and income”.1 (emphasis added)


의료 종사자로서 졸업하는 것은 새로운 전문직업적 정체성의 개발, 즉 그러한 정체성을 얻음으로써 획득되는 지위status와 특권 때문에 정확히 중요한 개념이다. 의료 전문직으로 졸업하는 젊은이들이 직면하는 도전은, 이러한 정체성에는 일군의 기대치가 따라온다는 것이다. 관련 규제 기관을 대표하여, 사회를 대표하여 시행enforced된다. 바로 전문직업성이다.
"전문직업성"은 의료 교육 및 모든 의료 학생의 삶에서 지배적인 개념이다.

Graduating as a health-care practitioner involves the development of a new professional identity,1 a concept that matters precisely because of the status and privilege that is acquired with gaining such an identity.2 The challenge that befalls the (often) young people graduating into the health-care professions is that with this identity comes a set of expectations, observed by their educational establishments, on behalf of the relevant regulatory bodies, enforced on behalf of society: professionalism. “Professionalism” then is a dominant concept in health-care education and in the life of any health-care student.

몇 년 전부터 의료 전문직업성과 정체성 개발 분야에서 연구·출판해 왔지만, 여전히 이 분야에서는 상대적으로 신인이라는 느낌이 든다. 전문직업성에 관한 도전에 대해 글로벌 동료들과 논의하는 과정에서 우리가 공유한 반성은 이 분야에서 우리만 있는 것이 아니라는 것이다. 전문직업성을 이해하고 정의하기 위해, 우리는 모두 보건 전문가들 사이에서 공인된 일련의 저자들을 이용한다. 이 규약 자체는 대개 의학을 기반으로 한다. 특히, 법률가과 성직자와 함께 최초로 정의된 전문직 중 하나로서, 다른 의료 직업에서 전문성을 배치하는 것과 관련된 작업이 부족하지는 않지만, 보다 새롭게 "전문직화된" 보건의료 관련직보다, 의료전문직 분야에서 전문직업성의 개념을 논의하는 시간이 더 길었다고 할 수 있다. 

We have been researching and publishing in the area of medical professionalism and identity development for some years,1, 3-5 but it still feels as if we are relative newcomers to the field. Our shared reflection from discussing challenges concerning professionalism with global colleagues6-8 is that we are not alone in this; in order to understand and define professionalism, we all draw upon the same set of authors as recognised canon across the health professions.9, 10 This canon itself is usually based in medicine; notably, as one of the first defined professions alongside law and the priesthood, there has arguably been longer to debate the concept of professionalism in this field than for the more newly “professionalised” health-care occupations, although there is no shortage of work related to positioning professionalism in other health-care professions.11, 12

그러나 "전문직업성"을 이해하기 위한 공동 참조 프레임에도 불구하고, 우리가 전문직업성 위반의 시나리오를 논의할 때, 추가적인 위반을 방지하거나 교정하는 데 합의된 접근 방식은 결코 없다.4 우리는 종종 사회적 또는 문화적 맥락의 중요성에 대해 이야기합니다; 그리고 우리는 전문직업성에 대한 출판된 문헌이 우리 자신의 생각과 가치를 나타내지 않는 것처럼 보인다는 것을 반영합니다. 현재 전문직업성에 관한 지배적인 정의는 [성별, 민족성, 일과 삶의 균형에 대한 21세기의 기대, 그리고 종종 가장 걱정스러운 것은 신체적, 정신적 건강에 대한 고려]를 무시하는 듯 보인다.
Yet despite a shared frame of reference for understanding “professionalism”, when we discuss scenarios of professionalism transgressions, there is never one agreed approach to remediation nor prevention of further transgressions.4 We often talk about the importance of social or cultural context; and we reflect that the published literature on professionalism does not seem to represent our own thoughts and values. Dominant definitions seem to ignore considerations of gender, ethnicity, twenty-first century expectations of work-life balance and often, most worryingly of all, physical and mental health concerns.

한편, 의료 외에서는 이러한 고려사항이 전문직업성에 대한 논의에서 이미 존재하는 것으로 보인다. 실제로, 우리의 우려는 40년 전 프리드슨 자신이 "전문직"을 정의할 때 반영했던 것과 같다. 프리드슨은 이 용어를 "영국-미국 제도들에 의해 강한 영향을 받은 산업국가들에서 특별한 뿌리를 가진 변화된 역사적 개념"임을 인정하지 않고, 대신 "일반적인 개념generic concept"으로 정의하려는 시도의 어리음에 주목했다. 이러한 점을 염두에 두고, 우리는 전문직업성의 정의를 재검토하여 그것들이 다른 맥락에서 어떻게 적용되는지 이해할 시간이 지났다고 느낀다. 여기서 우리 연구는 다시 한번 의학을 기반으로 할 것이다. 따라서 우리가 이러한 논쟁을 모든 보건의료 직업과 관련이 있다고 말하는 동안, 우리는 각각의 단일 건강관리 직업의 맥락이 이 토론이 각각의 직업 정체성에 대해 특별히 이루어져야 한다는 것을 의미할 수 있다는 것을 인정해야 한다.
Meanwhile outside health care, these considerations appear to already exist in discussions of professionalism.13, 14 Indeed, our concerns mirror Friedson's own reflections15 in defining a “profession” 40 years ago. Friedson noted the folly of attempting to define the term as a “generic concept” rather than acknowledging it is a “changing historic concept with particularistic roots in those in industrial nations that are strongly influenced by Anglo-American institutions” (p32). With this in mind, we feel it is beyond time to review the definitions of professionalism to understand how they are applied in different contexts. Our own work here will once again be based in medicine; thus whilst we speak of these debates as relevant to all health-care professions, we must acknowledge the context of each singular health-care profession may mean this debate needs to be had specifically for each occupational identity.

또한 질 개선quality improvement을 주제로 한 이 특별호 내에서 논의를 진행하는 것도 중요합니다. 교육자로서, 우리는 우리 학생들 사이에서 전문직업성 과실을 관리하기 위한 최적의 방법을 찾을 뿐만 아니라 우리의 전문직업성 교육의 질을 향상시키기 위해 끊임없이 노력하고 있다는 것을 발견합니다. 그러나 우리는 종종 단순히 그 일을 감당할 수 없는 [전문직업성의 정의]에 의해 좌절된다는 것을 발견한다. 그러므로, 우리의 눈에는, 전문직업성의 교육 및 관리의 질을 향상시키는 첫 번째 단계는 [기존의 정의]에 대한 공개 토론을 장려하고 이를 뒷받침하는 기원과 가정에 의문을 제기하는 것이다.
It is also important to situate this discussion within this special issue on the theme of quality improvement. As educators, we find ourselves constantly striving to improve the quality of our professionalism teaching, as well as searching for optimal methods to manage professionalism lapses amongst our students.4 We often, however, find ourselves hamstrung by definitions of professionalism that are simply not up to the task. Thus, in our eyes, the first step to improving quality in teaching and management of professionalism is to encourage an open debate of existing definitions and to interrogate the origins and assumptions that underpin these.

현재의 의료 전문직업성 상태에 대한 비판적 평가를 실시하기 위해, 우리는 다음과 같은 질문들을 다룰 것입니다.

  • 전문직업성을 정의하도록 "허용"되는 지배적인 목소리는 누구인가? 전문직업성을 정의하는 것은 규제자, 학자, 전문가 또는 실제로 비정형 "공공"의 소관이 되어야 하는가?
  • 만약 지배적인 목소리가 직업 내에서 모든 것 혹은 심지어 다수를 대변하지 않는다면, 그것은 전문직업성의 패권적 정의와 그에 따른 전문적 기준의 설명에 무엇을 의미합니까?
  • 서로 다른 국가적, 문화적 맥락에 걸쳐 서로 다른 이해를 고려한다면, 모든 사람에게 "통하는" 전문직업성에 대한 하나의 허용되는 정의가 있을 수 있을까?
  • 전문직업성에 대한 현재의 정의를 무비판적으로 수용하는 것이 그 개념이 무기화되고 전문가 자체에 대해 사용되는 결과를 초래할 위험이 있는가?

In order to undertake a critical appraisal of the current state of medical professionalism, we will seek to address the following questions:

  • who are the dominant voices that are “allowed” to define professionalism? Should defining professionalism be the remit of regulators, academics, the profession or indeed the amorphous “public”?
  • If the dominant voices do not speak for all – or even a majority – within a profession, what does that mean for hegemonic definitions of professionalism and for the subsequent delineation of professional standards?
  • Taking into account different understandings across different national and cultural contexts, is it even possible for there to be one single accepted definition of professionalism that “works” for everyone?
  • Is the danger that uncritical acceptance of current definitions of professionalism results in the concept being weaponised and used against the professions themselves?

이 논문은 이러한 대화들이 [현재 존재하는 전문직업성의 정의가 최종적인 것definitive ones]이라는 입장에서 나아가야 할 필요가 있다는 것을 입증하기 위해 이러한 질문들에 대한 토론을 탐구한다.
This paper explores the debate on each of these questions, to make the case that these conversations need to move on from the position that the extant definitions of professionalism are the definitive ones.

2 프로페셔널리즘을 정의할 수 있는 사람(그리고 허용되어야 함)은 누구입니까?
2 WHO IS – AND SHOULD BE – ALLOWED TO DEFINE PROFESSIONALISM?


"전문직"을 정의하려는 시도는 사회학 분야에서 시작되었다. 가장 넓게 본다면, 전문직업성은 사회에서 구성원의 위치를 정당화하는 직업의 측면이다. 이러한 정의에서 "사회적 계약"의 개념이 등장했다. 그것은 전문가들이 사회에 유용한 지식과 기술에 [접근할 수 있게 만들어준다]. 이러한 지식은 전문직 자체에 의해 보호되므로 모든 사람이 이용할 수 있는 것은 아닙니다. 그러므로, 지식을 휘두르고 그것에 대한 접근을 계속 규제하기 위해, 의사들은 전문직업 밖의 사람들의 신뢰를 정당화하는 방법으로 행동해야 한다. 이는 전문직업성이 대중들에 의해 정의된다는 것을 시사한다. 오직 전문직 바깥에 있는 사람들만이 신뢰를 정당화할 수 있는 것을 정의할 수 있다. 그러나 이는 분명히 그렇지 않다. 심지어 의학 교육 분야에 존재하는 이 기사는 전문직업성에 대한 논쟁이 의사들에 의해 지배되고 있다는 것을 보여준다. 따라서 다음과 같은 의문이 제기된다. 전문직의 어떤 구성원들이 전문직업성을 규정할 수 있는 힘을 주장합니까?

Attempts to define a “profession” and thus professionalism started in the field of sociology; most broadly, professionalism is the aspects of occupations that justify members' position in society.16 From these definitions emerged the concept of a “social contract”,17 that is where professionals have access to knowledge and skills that are useful to society. This knowledge is safeguarded by the profession itself – so is not accessible to all – thus, in order to be trusted to wield said knowledge and continue to regulate access to it, doctors must behave in a way that justifies the trust of those outside the profession. Immediately this suggests that professionalism is defined by members of the public: only those out with the profession can define what would justify their trust. This is, however, clearly not the case: even this article, existing within the field of medical education, demonstrates that the debate regarding professionalism is one dominated by doctors. Thus, the question arises: which members of the profession claim the power to define professionalism?

2.1 학술
2.1 Academics

2.1.1 전문성은 의학과 사회계약의 기초이다. 
2.1.1 Professionalism is the basis of medicine's contract with society18

이 인용문이 시사하듯이, 전문직업성을 논하는 학술 문헌들 중 상당수는 의사가 반드시 전문적이어야 하는 이유로 '사회적 계약'을 꼽고 있다. 우리는 대중이 정한 정의에 대해 거의 알려져 있지 않다는 것을 증명했으므로, [대중의 기대]는 [의사들이 생각하는 대중의 기대]와 [헤드라인을 강타한 의료사고의 이야기에 대한 대중의 반응]의 조합에서 추론될 수밖에 없다. 비록 "사회적 계약"이 유용한 이론적 구조일 수도 있지만, 현실은 그것이 기껏해야 역사적 추측에 기초하고, 최악의 경우 허구인 것처럼 보인다는 것이다.
As this quotation suggests, much of the academic literature that discusses professionalism cites the “social contract” as the reason why doctors must be professional.19, 20 As we have established that little is known about definitions set by the public, it must follow that the expectations of the public are only inferred from a combination of what doctors think members of the public expect and the public reaction to stories of malpractice that hit the headlines.21, 22 Though the “social contract” may be a useful theoretical construct, the reality is that it seems at best to be based on historical guesswork and at worst to be a fiction.

이 단계에서는 아마도 전문직업성의 정의와 사회계약에 대한 통제력을 가진 듯한 기득권의 힘으로 몇 가지 어려움을 개략적으로 설명하는 것이 중요할 것이다. "전문직"의 개념은 적어도 1930년대부터 논의되어 왔지만, 직업과 관련된 표준과 관행을 참조하는 개념으로서의 전문직업성은 직업의 가치에 관한 영국과 미국의 사회학적 분석에서 등장하여 1970년대 말과 1980년대 초에 주목을 받았다. 실제로 1990년, 버라지와 토르스텐달 24는 이 분야에서 주의가 필요하다고 통찰력 있게 주장했다. 사회적, 정치적 맥락으로부터 정의된 전문직의 분리separation, 그리고 전문가 간 관계의 무시와 영미 편향은 모두 전문가 행동의 이론화 적용에 대한 우려로 확인되었다.
At this stage, it is perhaps important to outline some difficulties with the power of the establishment that seems to have control over the definition of professionalism and the social contract. Whilst the concept of a “profession” has been discussed since at least the 1930s,23 professionalism as a concept referring to the standards and practices associated with a profession emerged from British and American sociological analysis concerning the value of occupations, gaining traction towards the end of the 1970s and early 1980s.24, 25 Indeed in 1990, Burrage and Torstendahl24 insightfully argued that caution was needed in this field; the separation of a defined profession from its social and political context, and the neglect of inter-professional relationships and an Anglo-American bias were all identified as concerns in the application of the theorising of professional behaviours.

이미 심하게 논의되고 있는 이 작품에서, 전문직업성에 대한 학문적인 토론에 끼어들기가 도전적이라고 느끼는 것은 이해할 수 있을 것이다. 그럼에도 불구하고, 이는 의료 전문직업성의 진화를 이해하고 그 분야에서 [특정 인물의 명백하고, 꿈쩍하지 않는 지배력]과, 위에서 강조된 우려에 대한 후속적인 비판적 관여의 부족에 더 관련되는 데 전념하는 시간과 관련이 적을 수 있다. 예를 들어 크루즈와 크루즈는 20년 넘게 전문성의 정의와 가르침에 대해 출판해 왔으며, 다른 작가들에 의해 전문직업성을 정의하기 위한 일종의 roadstone으로 종종 인용된다. 그러나 크루즈 부부는 1950년대에 졸업한 백인 캐나다인 부부라는 사실을 주목할 필요가 있다. 이것을 염두에 두고, 그들의 전문직업성에 대한 정의는 약간의 질문을 필요로 한다.전문직업성에 대한 이러한 정의가 처음 받아들여졌을 때, 의학은 매우 다르게 보였다. 그것은 여전히 매우 동질적인 노동력에 의해 지배되고 있는 직업이었다. 이러한 정의는 맥락에 대해 사려 깊고 잘 이론화되었을 수 있지만, 우리는 현재와 미래의 노동력에 기존의 정의를 적용하는 것이 의심할 여지 없이 점점 더 어려워지고 있다고 믿는다.

In this already heavily debated body of work, it is perhaps understandable that it feels challenging to break into scholarly discussion of professionalism. Nevertheless, this may be less to do with the time dedicated to understanding the evolution of medical professionalism and relate more to the apparent immovable dominance of particular figures in the field, and a subsequent lack of critical engagement with the concerns highlighted above. Cruess and Cruess, for example, have been publishing about definitions and teaching of professionalism for over 20 years,9, 26 and they are often cited by other authors as a kind of lodestone for defining professionalism.27 It is worth noting, however, that the Cruesses are a white, Canadian couple who graduated in the 1950s.28 With this in mind, their definitions of professionalism require some interrogation. When these definitions of professionalism were first accepted,9, 18 medicine looked very different. It was a profession still dominated – certainly in senior positions – by a very homogeneous workforce. Whilst these definitions may have been thoughtful and well theorised for their context, we believe it is increasingly challenging to apply them unquestioningly to the current and future workforce.

그러나 대안적 정의를 제시하는 데 있어 난제 중 하나가 토론에서 설득력을 얻은 것으로 보인다. 예를 들어, 2006년에 Wear와 Aultman은 다른 이론적 틀을 사용하여 전문성에 대한 비판적 분석 모음집을 편집했다. 이들 중 하나는 전문직업성에 대한 전통적인 정의를 사용할 때 성 불평등의 가능성을 강조한다. 예를 들어, 만약 전문직업성이 초특권supererogation을 요구한다면 – 의무 이상의 것을 요구한다면 – 그들의 아이들을 돌보기 위해 제 시간에 떠나야 하는 부모들은 여전히 전문직업적일 수 있는가? 아마도 의학에 대한 무조건적인 헌신은 모든 국내 업무를 책임지는 파트너에 의해 개인 생활에서 지원받는 사람들의 특권이 될 수 있을 것이다. 의학이 점점 더 다양한 노동력을 수용함에 따라, 정시에 퇴근해도 전문직업적이 되는 것이 확실히 가능해졌는가? 그러나 셜리와 패젯의 비평은 지배적인 정의를 인용하고 암송하라는 소동 속에서 크게 사라졌다. 이것은 전문직업성에 대한 학문적academic 논의와 "현장on the ground"에서 일어나고 있는 일 사이에 더 큰 차이가 있음을 시사한다. 만약 그렇다면, 아마도 전문직업성에 대한 실용적인 정의는 practicing physician들에게 더 널리 적용될 수 있을 것이다.

One of the challenges in presenting an alternative definition, however, seems to have been gaining traction in the debate. In 2006, for example, Wear and Aultman29 edited a collection of critical analyses of professionalism using different theoretical frames. One of these highlights the potential for gender inequality when using conventional definitions of professionalism.30 For example, if professionalism requires supererogation – going above and beyond the call of duty – can parents who need to leave on time to care for their children still be professional? Perhaps, unqualified commitment to medicine can only be the privilege of those supported in their personal lives by a partner who assumes responsibility for all domestic tasks. As medicine embraces an increasingly diverse workforce, surely it has become possible to leave work on time and be professional? And yet Shirley and Padgett's30 critique has been largely lost in the clamour to cite and recite the dominant definitions. This suggests to us that there is a widening gulf between the academic discussion of professionalism and what is happening “on the ground”. If this is the case, perhaps a practical definition of professionalism is more widely applicable to practising physicians.

"사회적 계약"을 일반적으로 합의된 정의로 변환하려고 시도할 때 추가적인 문제가 발생한다. 행동에만 의존하는 전문성의 정의는 "깊이가 얕다skin deep"는 비판을 받아온 반면, 덕목virtues에 의존하는 정의는 비정형적이고 평가에서 구현하기 어렵다. 어떤 이들은 규범적normative 정의 - 대부분의most 의사들이 어떻게 행동할 것인가에 기초하는 -가 도움이 된다고 제안했다. 그러나, 규범은 세대에 따라 변화하며 여기에 어려움이 있다: 전문직업성의 정의는 직업의 모든 구성원에 의해 동등하게 통제되지 않는다. 대신 학계와 규제당국과 같은 강력한 이해당사자들이 정의를 통제하는 것처럼 보인다.
A further challenge arises when attempting to translate the “social contract” into a commonly agreed definition.31 Definitions of professionalism that rely solely on behaviour have been criticised for being “skin deep”,32 whereas definitions that rely on virtues are amorphous and difficult to implement in assessment.33 Some have suggested that normative definitions – based on how most doctors would behave – are helpful.34 Pertinently, however, norms change with generations and herein lies the difficulty: the definition of professionalism is not equally controlled by all members of the profession. Instead, powerful stakeholders such as academics and regulators seem to control the definition.

2.2 규제 기관
2.2 Regulators

아마도 전문직업성에 대한 가장 직접적인 정의는 규제 기관들이 사용하는 정의일 것이다. 이러한 정의와 이를 통제하는 기관들은 전문성을 측정하는 사실상의 기준을 형성하기 때문에 힘을 가지고 있다. 예를 들어, 영국에서 GMC(General Medical Council)전문직업성이 무엇을 의미하는지 설명하기 위해 이 정의를 사용한다.

Perhaps the most straightforward definition of professionalism is one used by regulatory bodies. These definitions – and thus the institutions that control them – have power as they form de facto standards against which professionalism is measured. In the United Kingdom, for example, the General Medical Council (GMC) uses this definition to outline what they believe professionalism means:

 

"좋은 의사들은 환자를 돌보는 것을 첫 번째 관심사로 삼는다. 그들은 유능하고, 지식과 기술을 최신 상태로 유지하고, 환자 및 동료들과 좋은 관계를 수립하고 유지하고, 정직하고 신뢰할 수 있으며, 그리고 법 안에서 정직하게 행동한다." 
“Good doctors make the care of their patients their first concern: they are competent, keep their knowledge and skills up to date, establish and maintain good relationships with patients and colleagues, are honest and trustworthy, and act with integrity and within the law.”35

규제 기관은 의학에 진입하는 조건, 그리고 의학 내에서 합법적인 고용 조건을 설정하기 때문에 전문성을 정의하는 데 강력한 역할을 한다. 그러나 이와 같은 정의에는 명백한 문제가 있다. 첫째, 각 용어 - "좋은good"를 예로 들어 - 더 많은 설명이 필요합니다. 다음으로, 각 개념은 주어진 의사의 경험, 훈련 단계 및 당면한 특정 시나리오와 맥락화되어야 하는데, 이 모든 것은 객관적인 방법으로 측정하기 어렵다. 이러한 명확성의 결여는 해석의 정의를 열어주고 이러한 해석은 일종의 비공식 규제 사례법을 통해 이루어지게 한다. 전문직업성에 대한 GMC의 자체 정의는 의사들과 일반인들이 전문적 위법 행위와 실천의 적합성에 대한 문제를 다루는 데 있어 수행하는 [의료 종사자들의 재판소tribunals]를 통해 검증된다. 따라서, "체제establishment"에는 외부 비판의 기회가 거의 없으며, 자신의 정의를 그대로 유지한다.
Regulatory bodies have a powerful role in defining professionalism as they set the conditions of entry to – and legitimate employment within – medicine. Yet there are manifest problems with a definition such as this. Firstly, each term – take “good” as an example – requires further clarification. Next, each concept needs to be contextualised with a given doctors' experience, stage of training and the specific scenario at hand, all of which are challenging to measure in an objective way. This lack of clarity then opens the definition to interpretation and leaves these interpretations to be made through a kind of informal regulatory case law. The GMC's own definition of professionalism is tested through tribunals of medical practitioners, which are conducted by doctors and lay people experienced in dealing with matters of professional misconduct and fitness to practise. Thus, the “establishment” maintains its own definitions with little opportunity for external critique.

전문직업성에 대한 규제적 정의에 의존할 때 생기는 또 다른 문제는 [전문직업적 기준을 충족하지 못하는 행동과 태도]만 공개적으로 평가된다는 것이다. 이 경우 시간이 지날수록 전문직업성의 '흑백(옳고 그름)'이 조금씩 바뀌기 때문에 도움이 되지 않는다. 개인적인 금전적 이익을 위해 환자를 죽이는 것은 어느 때라도 전문직업적이지 않을 것이다. 하지만 "회색 지대"는 바뀐다. 즉, 이것은 덜 명확한 결정이며, 규제 기관의 소관이 덜한 결정입니다. 대신, 그것들은 교육자, 의료 서비스 제공자, 의사 및 대중이 매일 해야 할 결정입니다.
Another challenge of relying on a regulatory definition of professionalism is that it is only tested in relief: only behaviours and attitudes that do not meet professional standards are publicly measured against it. This is unhelpful as the “black and white” of professionalism changes little over time. It is never going to be professional to kill your patients for personal financial gain. What do change are the “shades of grey”, the decisions that are less clear, which are less often the remit of the regulator. Instead, they are decisions that fall to educators, health-care providers, “jobbing” doctors and members of the public to make on a day-by-day basis.

3 다양한 국가 및 문화적 맥락에 걸친 다른 이해를 고려하여, 모든 사람에게 "효과적"인 전문성에 대한 하나의 허용되는 정의가 가능할까요?
3 TAKING INTO ACCOUNT DIFFERENT UNDERSTANDINGS ACROSS DIFFERENT NATIONAL AND CULTURAL CONTEXTS, IS IT EVEN POSSIBLE FOR THERE TO BE ONE SINGLE ACCEPTED DEFINITION OF PROFESSIONALISM THAT “WORKS” FOR EVERYONE?


여러 이전 출판물에서 인정된 바와 같이, 국가 또는 국제 경계를 넘어서는 전문직업성에 대한 단일 또는 합의된 정의는 없다. 따라서 각 국가/지역 규제 기관 또는 의료 면허 기관은 자체 규정과 어느 정도 "전문직업성"에 대한 자체 정의를 가지고 있다. 이러한 정의는 때때로 전문직 규정 문서에 통합된 지침으로 캡슐화되지만, 다른 정의는 학부 교육 또는 등록된 전문가에 대한 전문적 기대에 초점을 맞춘 전체 문서에서 캡처된다.  실제로, 어떤 맥락에서 전문직업성의 정의는 규제 기관보다는 의사 협회에 의해 생성되는 것처럼 보인다. 여러 가지 시도가 있었음에도 불구하고 전문직업성이 어떻게 다른 국가 지침에서 다루어지는지를 고려할 수 있는 쉽게 식별할 수 있는 비교 가능한 문서 세트는 없다. 가장 주목할 만한 것은, 최근 일련의 문헌에서 서구의 전문직업성 정의가 반드시 비서구 국가의 문화적 가치를 반영하는 것은 아니며, 따라서 다른 맥락에서 다른 전문성 정의가 필요할 수 있다는 점에 주목하고 있다. 
As has been acknowledged in multiple previous publications, there is no single or agreed definition of professionalism across national or international borders.36 As such, each national/regional regulator or medical licensing organisation has its own regulations and to a certain extent their own definition of “professionalism”. These definitions are sometimes encapsulated in guidance incorporated into professional regulatory documents,37 whereas other definitions are captured in whole documents focussed on professional expectations either in undergraduate training38 or for registered professionals.39 Indeed, in some contexts definitions of professionalism seem to be generated by doctors' associations, rather than the regulatory body.39, 40 There is not then an easily identifiable set of comparable documents by which we can consider how professionalism is addressed in different national guidance, though there have been a number of attempts to do so. Most notably, a recent set of literature notes that Western definitions of professionalism do not necessarily reflect the cultural values of non-Western countries, and therefore, that different professionalism definitions could be needed in different contexts.41-50

표 1은 규제 기관 또는 인증 기관 웹 사이트에서 "전문직업성"을 검색할 경우 나타나는 지침의 작은 표현을 결합하려고 시도한다. 이 길이의 기사 범위 내에서, 의학이 규제 직업으로 시행되는 모든 국가의 사례를 검색하고 포함할 수 없었다. 대신 우리는 전문성을 정의하는 복잡성을 보여주기 위해 대륙을 가로질러 가능한 한 횡단면을 포함하기로 선택했습니다. 따라서 이 정보에 대한 검색은 의도적으로 실용적이었으며, 우리가 알고 있는 의학교육 문헌의 큰 단체들이 이미 국제 무대에서 대표성을 가지고 있다는 것을 알 수 있는 장소(영국, 유럽, 미국, 호주 - 이전에는 "서구"라고 불렸을 수도 있는 것)와 다른 것들은 잘 표현되지 않은 장소들을 포함했다. (중국, 사우디아라비아, 남아프리카 및 일본) 그러나, 우리는 이것이 이미 그 분야에서 지배적인 목소리를 더욱 증폭시키고 덜 대표되는 국가들을 여전히 듣지 못하게 한다는 것을 인정한다. 이것은 이러한 토론이 필요한 이유 중 하나를 강조합니다: "전문직업성"에 대한 견해를 [명확하게 정의되고 보편적으로 이해되는 용어인 것처럼 사용하는 사람들]에게 [알려지지 않은 국가가 있다는 것]을 인정하기 위해서입니다.
Table 1 attempts to bring together a small representation of guidance that emerges if one searches for “professionalism” on the regulatory or accreditation body websites. Within the confines of an article of this length, it was not possible to search for and include an example from every country where medicine is practised as a regulated profession. Instead we chose to include a cross-section as far as we could across continents to demonstrate the complexities of defining professionalism. The search for this information was therefore deliberately pragmatic and included locations from where we knew large bodies of medical education literature already had representation on the international stage (UK, Europe, USA and Australia – what might previously have been termed the “Western” voice) and then others less well represented (China, Saudi Arabia, South Africa and Japan). However, we acknowledge this further amplifies the already dominant voices in the field and leaves the underrepresented nations still unheard. This highlights one of the reasons these debates are needed: to acknowledge there are whole nations whose views on “professionalism” are unknown to those who use it as if it were a clearly defined and universally understood term.

표 1. 전문성과 관련된 이용 가능한 정의 또는 지침의 국가 간 비교
TABLE 1. A cross-national comparison of available definitions of, or guidance related to, professionalism

국가/지역 출처 전문성/전문적 행동에 대한 요구사항/지침 발췌
Country/region  Source  Excerpts of requirements/guidance on professionalism/professional behaviours

Australia Australian Medical Council (AMC)36 Nothing articulated in training standards.
AMC promotes a published guide on “Good Medical Practice: Professionalism, Ethics and the Law”:
Professionalism covers a wide range of elements, including good communication skills, an empathetic attitude, the virtues of self-reflection, truthfulness and dependability, cultural awareness in our multicultural society, and awareness of relevant laws pertaining to medical practice. Above all it covers an assumption that a person wishing to practise medicine effectively will bring positive attitudes to all the roles involved in being a doctor
China National Health Commission of the Peoples Republic of China website51; Chinese Medical Doctor Association (CMDA) charter52 Nothing returned in search for “professionalism” on National Health Commission (main national health agency) website. New legislation to “better protect doctors” introduced in August 2021 clarifies that doctors must not produce false medical certification documents and not perform unnecessary examinations and treatments on patients.
CMDA defines “six tenets” of medical practice:
  • equality and benevolence;
  • primacy of patients;
  • honesty and fidelity to promises;
  • commitment to excellence and prudence;
  • incorruptibility and impartiality;
  • lifelong learning.

Germany German Medical Association53 Publishes a (Model) Professional Code for Physicians in Germany which contains the “Rules for Professional Practice”. Excerpts:
Physicians serve the health of the individual and of the population. The medical profession is not a trade. It is by nature a liberal profession.
Physicians practice their profession according to their conscience, the precepts of medical ethics and humaneness. They may not acknowledge any principles, or comply with any regulations or instructions, that are irreconcilable with their tasks or for whose observance they cannot answer.
If physicians who are permanently established or perform their professional activity in another Member State of the European Union temporarily and occasionally perform their medical activity on a cross-border basis in the territory covered by this Professional Code without establishing a practice, they must observe the provisions of this Professional Code.
In addition to practising their profession, physicians are forbidden to engage in any other activity that is irreconcilable with the ethical principles of the medical profession. Physicians are also forbidden to allow their name to be used in conjunction with a medical occupational title in an unfair manner for commercial purposes. They may equally not permit use to be made of their name, or of the professional reputation of physicians, in such a way.
Japan Japan Medical Association Website39 “… the physician should serve society with a basic love for humanity.” Underpinned by the following six principles:
  • continuing education;
  • dignity and responsibility, striving “to enhance his/her cultural refinement, education, and integrity”;
  • respecting the individuality of patients, treating them with compassion and earning their trust;
  • maintaining respect for his/her fellow physician and serving “the cause of medical care to the best of his/her abilities”;
  • respecting the spirit of public service and contributing to the development of society;
  • not engaging in profit-making medical activities.
Saudi Arabia Kingdom of Saudi Arabia Education & Training Evaluation Commission (ETEC) website54 SaudiMeds Framework developed by Saudi Medical Deans Committee; Theme V – Professionalism:
“The commitment to deliver the highest standards of ethical and professional behaviour in all aspects of health practice, and take a responsibility for own personal and professional development.
  • Adhere to professional attitudes and behaviours of physicians
  • Apply Islamic, legal and ethical principles in professional practice
  • Demonstrate the capacity for self-reflection and professional development”

South America Centeno et al 201655 Nothing obvious available in English but Centeno et al. 2016 discuss a collaboration between three South American Schools with a shared aim to promote professionalism amongst their students; the agreed definition of professionalism used was Epstein and Hunderts56 definition where professionalism is:
“The habitual and judicious use of communication, knowledge, technical skills, clinical reasoning, emotions, values, and reflection in daily practice for the benefit of the individual and the community being served”
South Africa Health Professions Council of South Africa website57 Health Professions Council publishes a lengthy document with very specific requirements of all registered health-care practitioners. An example of this is that they provide guidance on a practitioners stationery as follows:
“4. (1) A practitioner shall print or have printed on letterheads, account forms and electronic stationery information pertaining only to such practitioners – (a) name; (b) profession; (c) registered category; (d) speciality or subspeciality or field of professional practice (if any); (e) registered qualifications or other academic qualifications or honorary degrees in abbreviated form; (f) registration number; (g) addresses (including email address); (h) telephone and fax numbers; (i) practice or consultation hours; (j) practice code number; and (k) dispensing licence number (if any).”
The Netherlands Royal Dutch Medical Association (KNMG)40 KNMG Manifesto on Medical Professionalism
“The aim of this manifesto is to perpetuate and promote the trust that society should be able to place in medical professionals.
… A good doctor is a medical professional: he is a medical expert, he keeps his professional know-how up-to-date, communicates in an empathic way with his patients, cooperates with colleagues, exercises his profession within the (moral) boundaries of the professional group, organises quality in his practice and renders account.
The doctor needs society to place trust in him. Trust is necessary for the proper operation of the health-care sector as a whole, for the doctor-patient relationship and for the intrinsic motivation of medical professionals. The medical professionals intrinsic motivation is the most powerful driving force for qualitatively sound, meaningful and efficient care.”
United Kingdom General Medical Council Website Outcomes for Graduates38 defines the standards which all medical graduates are expected to reach by the end of their pre-registration training. It states that “newly qualified doctors must behave according to ethical and professional responsibilities” and gives a 28-point list detailing specific requirements including:
  • demonstrate compassionate professional behaviour and their professional responsibilities in making sure the fundamental needs of patients are addressed
  • act with integrity, be polite, considerate, trustworthy and honest
  • recognise the potential impact of their attitudes, values, beliefs, perceptions and personal biases (which may be unconscious) on individuals and groups and identify personal strategies to address this
Good Medical Practice,35 a document defining professional values and behaviours expected of any qualified doctor registered with the GMC, states that:
“As a good doctor you will:
  • make the care of your patient your first concern
  • be competent and keep your professional knowledge and skills up to date
  • take prompt action if you think patient safety is being compromised
  • establish and maintain good partnerships with your patients and colleagues
  • maintain trust in you and the profession by being open, honest and acting with integrity”

United States of America Accreditation Council for Graduate Medical Education Website58 Common Programme Requirements for residency training includes a long list related to professionalism, including but not limited to:
“Residents and faculty members must demonstrate an understanding of their personal role in the:
  • provision of patient- and family-centred care;
  • safety and welfare of patients entrusted to their care, including the ability to report unsafe conditions and adverse events;
  • assurance of their fitness for work, including:
  • management of their time before, during, and after
  • clinical assignments; and, recognition of impairment, including from illness, fatigue, and substance use, in themselves, their peers, and other members of the health-care team.
  • commitment to lifelong learning;
  • monitoring of their patient care performance improvement indicators; and,
  • accurate reporting of clinical and educational work hours,
  • patient outcomes, and clinical experience data …

“All residents and faculty members must demonstrate responsiveness to patient needs that supersedes self-interest. This includes the recognition that under certain circumstances, the best interests of the patient may be served by transitioning that patients care to another qualified and rested provider …
“Programmes, in partnership with their Sponsoring Institutions, should have a process for education of residents and faculty regarding unprofessional behaviour and a confidential process for reporting, investigating, and addressing such concerns.”

어떤 경우에는, 이것들은 번역된 버전이며, 우리는 여기서 한계점을 인정합니다. 우리는 영어로만 이용 가능한 자원들에 접근할 수 있었고, 때로는 2차 소스를 통해서요. 따라서 우리는 이것을 전문직업성에 대해 이용 가능한 모든 국제 지침의 결정적 표현이라고 주장하지 않으며, 우리는 몇몇 큰 차이가 있다는 것을 인정한다; 예를 들어 러시아의 의학 교육 시스템은 러시아의 모든 핵심 문헌을 찾는다. 따라서 우리는 이 지역, 또는 표에 포함되지 않은 다른 곳에서의 전문직업성에 대한 태도에 대한 지식을 주장할 수 없다. 그러나, 이것이 보여주는 것은 서로 다른 맥락에서 "전문직업성"이 의미하는 것을 이해하는 것이 누구에게나 얼마나 복잡한지이며, 입증하기 위해 국가 기관 웹사이트에서 이용 가능한 기대와 요구사항의 샘플을 제공하는 것이다.

In some instances, these are translated versions, and we acknowledge a limitation here is that we were only able to access resources that were available in English, sometimes via secondary sources. We therefore do not claim this as a definitive representation of all international guidance available on professionalism, and we acknowledge there are some large gaps; the inwardly facing medical education system in Russia for example locates all key literature in Russia; therefore, we can make no claims to knowledge about attitudes to medical professionalism in this part of the world, nor anywhere else not included in the table. What it does, however, is give a sample of the types of expectations and requirements made available on national agency websites for the purpose of demonstrating how complex it is for anyone to make sense of what “professionalism” means in different contexts.

각 국가 규제 기관이 고유한 기준을 갖는 것은 이해할 수 있는데, 이는 의약품과 의료가 고유한 맥락과 관련이 있음을 보장하는 중요한 부분이다. 표 1은 "전문직업성"의 정의, 적용 및 규제가 얼마나 멀리 떨어져 있는지를 보여준다. 이러한 차이에도 불구하고, 우리는 의학 교육 내에서 그것이 하나의 단일한 개념인 것처럼 말하고 쓴다. 흥미롭게도, 대부분의 맥락에서, 지침은 평생 학습 및 전문직업적 개발의 중요성을 포함하지만, 여기서 직접적인 비교는 끝난다. 
It is understandable that each national regulator will have its own standards, an important part of ensuring medicine and health care is relevant to its own context.59 What Table 1 demonstrates is quite how far apart the definition, application and regulation of “professionalism” is. Despite these differences, we speak and write about it within medical education as if it is just one singular concept. Interestingly, in most contexts, guidance incorporates the import of lifelong learning and/or professional development but here the direct comparison ends.

네덜란드 왕립의학협회(Royal Dutch Medical Association)의 가이던스는 학술적 담론을 따르고 있으며, 사회가 전문직에 두는 신뢰와 직업적 지위 사이의 관계에 초점을 맞추고 있다. 일부 규제당국의 경우 교육 제공자에 대한 지침을 포함하여 등록 전pre-registration부터 대학원 교육까지 일련의 지침이 존재한다는 증거가 더 많다. 다른 국가에는 개별 시나리오에 전문적인 판단을 적용할 수 있는 여지를 상상하기 어렵게 만드는 엄청나게 상세한 지침 목록이 있다. 

The guidance from The Netherlands from the Royal Dutch Medical Association,40 a professional organisation rather than a regulator, follows an academic discourse and focusses on the relationship between professional status and the trust that society puts in the profession. For some regulators38, 58 there is more evidence of a continuum of guidance from pre-registration to postgraduate training including guidance for training providers. For others,57 there is an incredibly detailed list of instructions leaving it hard to imagine room for application of professional judgement to individual scenarios.

특히, 한 나라의 교리가 다른 나라에 어떻게 적용될지 상상하는 것은 매우 어려운 일이다; 의료 보험 회사가 바로 그 목적(영리활동)을 위해 존재하는 많은 나라에서는, 의료 활동이 "영리화"를 위해 수행되지 않을 것이라는 일본의 가이던스는 이치에 맞지 않을 것이며, 반면 사우디아라비아의 맥락에서 이슬람 관행을 고수하는 것에 대한 언급은 비이슬람 국가들에게는 거의 의미가 없다. 사실, 종교가 의도적으로 국가와 분리되어 있고 따라서 의료 서비스 제공이 이루어지는 많은 나라에서, 전문직 행위의 일부로서 특정 종교에 대한 언급을 포함하는 것은 꽤 성가신 일이다. 금요기도를 위해 보건활동이 일시 중단되는 일국의 기대가 전문직업적인 것으로 인정되겠지만, 또 다른 문화적 맥락에서, 종교적 교리를 따르기 위해 환자 치료로부터 "휴식"을 고려하는 것은 전문적이지 않은 것으로 보일 수 있다.

Notably, it is extremely challenging to imagine how the tenets of one country would apply in another; the guidance from Japan that medical activities will not be undertaken for “profit-making” would not work in many countries where medical insurance firms exist for that very purpose, whilst reference to adherence to Islamic practice in the Saudi Arabian context54 makes little sense for non-Islamic countries. Indeed, in many countries where religion is deliberately separated from the state and therefore health service provision, the inclusion of a mention of a specific religion as part of professional practices is quite jarring. Where the expectation in one country that health care activity is paused for Friday prayers is seen as professional; in another cultural context, it might be seen as unprofessional to consider a “break” from patient care for religious observance.

개별 국가의 가이던스는 전문직업성에 대한 표면적으로 "유사한" 이해에서 비롯될 수 있지만, 이에 따른 적용은 훨씬 더 멀리 떨어져 있으며, 이는 국제 경계를 넘어 학생과 교직원의 이동에 영향을 미친다. 이는 지배적 정의가 세계화된 의료 관행의 맥락에서 보편적으로 적용될 수 없음을 시사하며, 이는 전문직업적 표준을 이해하려고 시도할 때 의사에게 불확실성을 야기한다. 실제로, 독일의 지침은 그들의 의사가 일시적으로 국경을 넘어 일하는 경우, 그들의 의사는 여전히 독일의 규칙을 따라야 한다고 명시하고 있는데, 이것은 "전문직업적이지 않은" 행동에 대한 어떠한 비난도 누구의 관할권에 의해 중재될 것인지 의문을 제기한다. 

Whilst individual national guidance may originate in superficially “similar” understandings of professionalism, the resultant application of these is much further apart, which has implications for the movement of students and staff across international boundaries. This suggests that dominant definitions are not universally applicable in the context of globalised medical practice, creating uncertainty for doctors when attempting to understand professional standards. Indeed, the German guidance specifies that, where their doctors are temporarily working on a cross-border basis, their physicians must still follow the German rules, which raises questions for whose jurisdiction any accusations of “unprofessional” behaviours would be arbitrated by.53

우리의 분석에서 분명한 것은 비교적 작은 전문 규제자 표본 내에서도 국경, 문화, 맥락을 초월한 전문직업성에 대한 보편적인 정의는 존재하지 않는다는 것이다. 실제로, 우리는 보편적 정의에 대한 어떠한 시도도 서구 중심의 세계관에 의해 지배될 가능성이 높기 때문에 이것이 바람직하지 않다고 주장할 것이다.
What seems clear from our analysis is that, even within a relatively small sample of professional regulators, a universal definition of professionalism that transcends borders, cultures and contexts does not exist. Indeed, we would argue that this is not desirable as in all likelihood any attempt at a universal definition would be dominated by a Western-centric view of the world and thus would not be representative of the needs of many doctors and indeed their patients.

4 만약 지배적인 목소리가 직업 내 전체 또는 심지어 과반수를 대변하지 않는다면, 전문성의 헤게모니적 정의와 후속적인 전문성 표준의 설명에 어떤 의미가 있는가?
4 IF THE DOMINANT VOICES DO NOT SPEAK FOR ALL – OR EVEN A MAJORITY – WITHIN A PROFESSION, WHAT DOES THAT MEAN FOR HEGEMONIC DEFINITIONS OF PROFESSIONALISM AND FOR THE SUBSEQUENT DELINEATION OF PROFESSIONAL STANDARDS?


최근 수십 년간 전문직업성 논쟁에서 변화의 원동력 중 하나는 소셜 미디어의 부상이었다. 많은 의사들이 학문적, 규제적 대화에서 제외되었을 수 있는 반면, 트위터와 같은 플랫폼은 종종 매우 공개적인 방식으로 개인이 토론에 참여하도록 허용했다. 지역 근무 환경 밖에서 새로운 전문직업적 관계를 개발하는 것은 이전에는 컨퍼런스 네트워킹에 국한되었지만 소셜 미디어 플랫폼은 의사로서 공개적인 프로필과 전문직업적 정체성을 갖는 것이 의미하는 것의 성격을 바꾸었다. 소셜 미디어 토론은 종종 논쟁적인 견해와 출판물에 대한 토론을 포함한다. 예를 들어, 2020년 혈관외과 저널은 "젊은 혈관외과 의사들 사이에서 비전문적인 소셜 미디어 콘텐츠의 보급"이라는 제목의 논문을 발표했다. 이 글에서 저자들은 비키니를 입은 자신의 사진을 SNS에 올리는 것은 비전문적이라고 암시했다. 전 세계 의사들로부터 "MedBikini"라는 해시태그를 사용한 소셜 미디어에 대한 반발은 매우 충격적이었고, 저널은 얼마 지나지 않아 논문을 철회해야 했다. 많은 면에서, 소셜 미디어 플랫폼은 새로운 세대의 의사들이 그들의 [온라인 존재]뿐만 아니라, [전문직업성이 그들에게 무엇을 의미하는지 상대적으로 검열없이 토론을 할 수 있는 능력]을 통해서, [전문직업성에 대한 자기만의 정의에 대한 소유권]을 주장할 수 있게 해주었다.

One of the forces for change in the professionalism debate over recent decades has been the rise of social media. Where many doctors may have been excluded from academic and regulatory conversations, platforms such as Twitter have allowed individuals to become involved in the discussion, often in a very public way. Developing new professional relationships outside of local working environments was previously limited to conference networking, but social media platforms have changed the nature of what it means to have a public profile and professional identity as a doctor.60 Social media debates have often included discussions of controversial views and publications. For example, in 2020, the Journal of Vascular Surgery published a paper entitled “prevalence of unprofessional social media content amongst young vascular surgeons“. In this article, the authors implied that posting a picture of oneself on social media wearing a bikini was unprofessional.61 The backlash on social media from doctors around the world – employing the hashtag “MedBikini” – was so impactful; the journal was forced to retract the paper shortly thereafter. In many ways, social media platforms have allowed a new generation of doctors to claim ownership of their own definition of professionalism, not just in their online presence but also in their ability to have relatively uncensored discussion of what professionalism means to them.

흥미롭게도, 소셜 미디어의 사용은 윤리적으로 보이는 것이 개인의 해석에 달려있을 수 있는 전문직업성과 관련하여 논쟁적인 영역이다. 미국 의사협회가 소셜미디어 가이드라인을 2010년 이전부터 도입했고, 의료교육자로서 소셜미디어 활용에 대한 팁페이퍼의 존재에도 불구하고 규제당국은 빠르게 진화하는 소셜미디어와 'e-프로페셔널리즘'의 세계에 발맞추지 못하는 듯했다. 온라인 활동을 하면서 어떻게 "전문직업적"이 될 수 있는지는 점점 더 불분명해지고 온라인에서의 "전문적" 행동이 어떻게 보이는지에 대한 합의가 거의 없는 것 같다.66 백신을 예로 들어보자: 의료 종사자가 개인이 백신을 접종하는 것을 막는 것은 파격적인가, 아니면 비전문적인가? 더욱이, 만약 [비관습적 신념들]이 [전문적이지 않다]고 해석된다면, 누가 이러한 견해를 단속하는 데 책임이 있는지 이해하는 것이 중요합니다. 의료 규제 기관들은 소셜 미디어를 보유하고 있지만, 이것들은 현재 규제 목적보다는 홍보를 위해 존재한다. 이 경우에, 소셜 미디어는 의료 전문가들에게 "동료로 구성된 배심원들에 의해 재판"을 받을 수 있는 기회를 제공한다. 학문적 용어로, 이것은 (e-) 전문성에 대한 규범적 정의와 일치하며, 전문적이라고 여겨지는 것을 통제하는 가장 일반적으로 보유되는 아이디어와 일치한다. 그러나 여기서의 어려움은 [파격적인 아이디어]가 프로페셔널하지 않은 것은 아니더라도, 파괴적일 수도 있다는 것이다. 여기에 [전문직업성]과 [언론의 자유] 사이에서 긋기 어려운 선이 있다. 예를 들어, [극우적인 정치적 의견]을 말하는 것은 전문적이지 않은가? 우리는 개인적으로 이러한 관점이 의사 조직/규제자의 전문적 가치와 어떻게 양립할 수 있는지 보기 위해 고군분투하겠지만, 이러한 맥락에서 의견을 표현하는 것이 [전문적이지 않은 행동]에 해당하는지는 불분명하다.
Interestingly, the use of social media is itself a contentious area in relation to professionalism where what is viewed as ethical can be down to individual interpretation.62 Despite the fact that the American Medical Association introduced social media guidelines as long ago as 2010,63 and the existence of tips papers on using social media as a medical educator,64 regulators have not seemed to keep pace with the rapidly evolving world of social media and “e-professionalism”.56, 65 It is increasingly unclear how “professional” it is possible to be whilst engaging online at all and there seems to be little consensus on what “professional” behaviours online looks like.66 Take the debate around vaccines as an example: is it unconventional, or unprofessional, for a health-care worker to discourage individuals from receiving vaccines? Furthermore, if unconventional beliefs are construed as unprofessional, it is important to understand who is responsible for policing these views. Medical regulators do have a social media presence, but these currently exist for promotion rather than regulatory purposes. In this case, perhaps social media offers medical professionals the opportunity to be “tried by a jury of their peers”. In academic terms, this aligns with a normative definition of (e-)professionalism, with the most commonly held ideas controlling what is deemed professional. The difficulty here, however, is that unconventional ideas may be disruptive – but might not be unprofessional. In addition, there is a line that is difficult to draw between professionalism and freedom of speech. Is it unprofessional, for example, to voice far right political opinions? Whilst we personally would struggle to see how these views are compatible with the professional values of doctors' organisations/regulators, it is unclear whether expressing an opinion in this vein amounts to unprofessional behaviour.

점점 더 많은 소셜 미디어는 ["전문직업성"의 개념이 외모, 언어 및 기타 개인 속성을 감시하기 위한 목적]으로 오용/사용 되었던 예를 공유하기 위해 쓰인다. 걱정스러운 것은, 여기에는 운동화 착용(하루 종일 발바닥에서 일하는 사람들에게 이치에 맞는 말), 넥타이를 매지 않는 것(영국에서는 감염 통제 조치에 따라 금지됨), 화장하고 염색한 머리, 그리고 한 예로 "전문적이지 않은" 이름에 대한 비판만을 포함하는 것이 아니다. 이것은 당연하게도 공동체 내에서, 그리고 실제로 그 직업에 합류하기 위한 훈련을 받고 있는 사람들로부터 점점 더 많은 우려를 유발했다. 전문직업성의 개념이 "무기화weaponised"되고 있으며, 동료 "전문가"들은 소셜 미디어를 사용하여 서로 다른 세계관과 의견을 바탕으로 한 비전문적인 행동으로 서로를 비난하고 있다. 예들은 거의 항상 존재해왔다. 그러나, 소셜 미디어는 이러한 토론을 공유하고, 토론하고, 증폭시키는 새로운 방법을 제공한다.

Increasingly, social media is used to share examples of where the concept of “professionalism” has been (mis-)used to police appearance, language and other personal attributes. Worryingly, not only do examples include wearing of trainers (which make sense for people working on their feet all day), not wearing a tie (which is banned under infection control measures in the UK), wearing make-up, dyed hair and, in one example, a criticism of an “unprofessional” name.67 This has understandably led to increasing concern from within the community and indeed from those training to join the profession that the notion of professionalism is being “weaponised”, with fellow “professionals” using social media to accuse one another of unprofessional behaviour based on differing world views and opinions.68 Examples have arguably always existed; however, social media offers the profession new ways of sharing, discussing and amplifying these debates.

전문직업성이라는 용어를 무기화한 최근의 두드러진 예가 뉴캐슬 대학의 의대생으로부터 나왔다. 이 학생은 치마 길이로 실기시험에서 벌점을 받았다. 억울함을 느낀 그녀는 그 이야기와 그 스커트의 사진으로 무장한 트위터에 글을 올렸고, 처벌을 내린 개인과 그것을 지지한 의대는 광범위한 비난을 받았다. 이는 [전문직업성이 더 이상 의심의 여지 없이 임상 및 학술 엘리트들에 의해 규제될 수 있는 것이 아님]을 보여준다. 학생들과 훈련생들은 침묵할 수 없고, 침묵해서는 안 되는 목소리를 가지고 있다.

A recent prominent example of the weaponisation of the term professionalism emerged from a medical student at the University of Newcastle (UK). This student received a penalty in a practical examination based on the length of her skirt. Feeling aggrieved, she took to Twitter armed with the story and a picture of the said skirt, attracting widespread criticism of the individual who issued the penalty and the medical school that upheld it.69 This demonstrates that professionalism can no longer be unquestioningly policed by the clinical and academic elite: students and trainees have a voice that cannot, and should not, be silenced.

그럼에도 불구하고, 전문직업성 논쟁을 소셜 미디어로 가져가는 흥미로운 측면 중 하나는 그것이 공공 영역이라는 것이다. 만약 우리가 "사회적 계약"의 개념으로 돌아간다면, 아마도 소셜 미디어는 전문직업성이 그들에게 어떤 의미인지에 대한 토론에 대중을 포함시킬 새로운 기회를 제공할 것이다. 궁극적으로, [학문적, 규제적 논쟁]이 아무리 중요하게 보일지라도, 그들은 대체로 "일반lay" 사람들의 목소리를 배제하고, 논쟁을 종결시키며, 그 결과 편협하고 사회 전반에 맞지 않게 된다.
Nevertheless, one of the interesting aspects of taking the professionalism debate to social media is that it is in the public domain. If we return to the idea of the “social contract”, perhaps social media offer a new opportunity to include the public in the debate about what professionalism means to them. Ultimately, however important the academic and regulatory debates may seem, they largely exclude the voices of “lay” people, closing the debate down and ensuring it is insular and out-of-step with society at large.

5 결론
5 CONCLUSIONS

이 기사에서는 우리가 제공한 답변보다 더 많은 질문을 제기했습니다. 우리의 의도는 전문직업성에 대한 지배적인 담론에 도전하고 그 개념이 더 이상 한 때 나타났던 것처럼 간단하지 않다는 것을 증명하는 것이었다. 이번 기사를 통해 학술대화의 질적 향상을 위해 이해당사자들과 폭넓게 참여하는 전문성의 정의에 대한 대화가 활성화되기를 기대한다. 우리는 단일한 글로벌 정의를 추구하는 것은 무의미하다는 대담한 진술을 하고 싶습니다. 우리가 논의한 바와 같이, 문화적 맥락은 전문직업성을 이해하는 데 매우 중요합니다. 이는 전 세계의 전문직업성에 대한 수준 높은 정의가 각 사회의 요구에 문화적으로 양립되고 정서적으로 지적인 정의라는 것을 의미한다.
In this article, we have posed more questions than we have provided answers. Our intention was to challenge dominant discourses around professionalism and demonstrate that the concept is no longer as straightforward as it once appeared. Through this article, we hope to reinvigorate conversations about the definition of professionalism that engage widely with stakeholders in order to improve the quality of the academic conversation. We want to make a bold statement: that seeking a single global definition is pointless. As we have discussed, cultural context is so important to our understanding of professionalism. This means that a high-quality definition of professionalism around the world is one that is culturally compatible and emotionally intelligent to the needs of each society.

간결함을 위해서, 우리가 토론에 포함하지 못한 몇 가지 쟁점들이 있다. 한 가지 예는 전문직업성의 구성에 내재된 잠재적인 사회 경제적 불평등이다: 특정 사회 규칙이나 단서에 대한 무의식적인 인식이 일부 개인에게 다른 개인보다 전문직업성에 더 쉽게 접근할 수 있도록 하는 정도가 있을 수 있다. 게다가, 전문직업성 문제가 발생할 때, 부는 비용이 많이 드는 변호사를 접하게 하고, 따라서 불리한 결과로부터 어느 정도의 보호를 제공하기 때문에 중요하다. 하지만, 이것들은 우리가 여기에 공간을 줄 수 있는 것보다 더 큰 아이디어들이기 때문에, 우리는 토론을 계속하도록 초대합니다.
In the interests of brevity, there are several issues that we have failed to include in our discussion. One example is the potential socioeconomic inequity built into the construct of professionalism: there is perhaps an extent to which unconscious awareness of particular social rules or cues makes access to professionalism easier for some individuals than others.4 Furthermore, when professionalism problems arise, wealth matters as it provides access to expensive defence lawyers and thus a degree of protection from adverse consequences. These are, however, bigger ideas than we can give space to here, so we invite the debate to continue.

마지막으로, 우리가 전문직업성에 대한 이해를 "사회적 계약"에 계속 기초한다면, 품질의 지표는 "대중"이 의료 전문가에 대한 그들의 기대치에 대해 어떻게 상담되는지are consulted가 될 필요가 있다. 변화하는 사회에 맞춰 전문직업성이 진화할 수 있도록 '전문직profession'과 '공공public'의 쌍방향 담론이 진행돼야 한다. 우리는 이것이 종종 서구, 백인, 이단 규범, 남성 엘리트들로부터 전문성에 대한 통제권을 빼앗는 데 도움이 될 수 있기를 바라며, 그 정의가 직업과 사회를 좀 더 폭넓게 대표할 수 있는 쪽으로 방향을 틀게 할 수 있기를 바란다. 따라서, 우리의 맥락에서, 만약 전문직업성이 "무기화"된다면, 우리는 이것이 지배적인 아이디어들을 영구화하기 보다는 도전하기 위한 것이기를 바랍니다.

Finally, if we are going to continue to base understandings of professionalism on the “social contract”, a marker of quality needs to be how the “public” are consulted about their expectations of medical professionals. There needs to be an ongoing two-way discourse between the “profession” and the “public” so that professionalism can evolve in line with changing societies. We hope that this may help us wrest control of professionalism from an academic – and often Western, white, hetero-normative, male – elite and allow the definition to pivot towards one that is more representative of the profession and society more widely. So, in our context, if professionalism is to be “weaponised”, we hope that this will be to challenge dominant ideas rather than to perpetuate them.

 


Med Educ. 2022 Jun 27. doi: 10.1111/medu.14862. Online ahead of print.

Re-opening Pandora's box: Who owns professionalism and is it time for a 21st century definition?

Affiliations collapse

Affiliation

1School of Medicine, University of Liverpool, Liverpool, UK.

PMID: 35761477

DOI: 10.1111/medu.14862

Abstract

Background: The concept of professionalism is dominant within health care education and the lives of practising clinicians globally, and yet there is no single agreed definition nor framework applied universally across the health care professions. This article questions how much attention is paid to where definitions of the concept of professionalism came from and whether the accepted norms within the dominant discourses are still truly applicable to a 21st century workforce.

Method: Taking a critical look at the existing body of literature on professionalism using a locus of medical education, this article reviews who the dominant voices have been in the creation of current understandings of professionalism. Using a pragmatic and targeted approach, regulatory body definitions of professionalism from across the world are compared to demonstrate the complexities of finding a universally accepted definition of the concept.

Results: The article suggests that the extant definitions are grounded but also stuck in a background of Western, White, heteronormative view of society and the professions of the past and argues that we need to better understand the expectations of professionalism from the perspectives of those who now work in health care and health care education, as well as reviewing the views of the "public" within this debate.

Conclusions: By reopening the "Pandora's box" of professionalism, this article argues that we can improve the quality of definitions-and thus application-of professionalism for health care professionals and patients.

논증 이론이 어떻게 평가 타당도에 정보를 제공하는가: 비판적 문헌고찰 (Med Educ, 2022)
How argumentation theory can inform assessment validity: A critical review
Benjamin Kinnear1,2 | Daniel J. Schumacher1 | Erik W. Driessen3 | Lara Varpio4

 

1 소개
1 INTRODUCTION

많은 현대 의료 전문 교육(HPE) 학자들은 [평가의 타당성]을 논증argumentation의 한 형태로 제시한다. 즉, 평가 데이터의 특정한 해석 및 사용에 대한 주장을 의미한다. 그러나 HPE 학자들은 아직 validation을 뒷받침하는 논증argumentation의 철학적, 이론적, 또는 실제적 측면을 탐구하지 않았다. [타당성 주장validity argument]라고 주장하는 것은 종종 평가의 장점을 평가, 우선순위 부여 또는 토론하기 위한, 가이딩 프레임워크가 없는, 그저 증거의 나열일 뿐이다. 이는 증거를 정리할 줄만 알고 [변론이 어떻게 구성돼야 하는지, 누가 변론을 평가할지, 어떻게 변론을 평가할지]는 모르면서 법정 재판을 여는 것과 비슷하다. 우리는 HPE가 우리의 현재 이해와 유효성의 사용을 지원하기 위해 논쟁 이론에 대한 더 깊은 이해를 개발하는 것이 중요하다고 주장한다.

Many modern health professions education (HPE) scholars frame assessment validity as a form of argumentation: A claim about a specific interpretation and use of assessment data.1-4 However, HPE scholars have yet to delve into the philosophical, theoretical, or practical aspects of argumentation that undergird validation. What are purported to be validity arguments are often merely the listing of evidence without a guiding framework to evaluate, prioritise, or debate their merits. This is akin to holding a courtroom trial while only knowing how to organise the evidence, but not knowing how the argument should be structured, who will evaluate the argument, nor how they will evaluate it. We contend that it is vital for HPE to develop a deeper understanding of argumentation theory to support our current understandings and uses of validity.

이것은 타당성에 대한 중요한 통찰이 HPE 학자들에 의해 이미 생성되지 않았다는 것을 말하는 것이 아니다. 아직 멀었지요. 우리 분야의 타당성에 대한 이해는 많은 HPE 연구자들의 연구 덕분에 발전했다. 예를 들어, 

  • 쿡, 하탈라, 그리고 다우닝은 Messick과 Kane의 것과 같은 논증 기반 타당성 프레임워크를 HPE 평가 영역으로 가져오는 데 도움을 주었다. 
  • St. Onge와 Young은 우리 분야의 타당성에 대한 이해의 현재 상태를 파악하는 데 도움을 주었다. 
  • Govaerts, Schwirth, Van der Vleuten 및 다른 사람들은 프로그램적 평가의 맥락에서 타당성에 대한 우리의 현장 관점을 발전시켰다. 

HPE가 [타당성을 주장으로 개념화하도록 진화한 것]은 이들과 다른 학자들 덕분이다. 그럼에도 불구하고, HPE의 현대 타당성 프레임워크의 사용은 타당성 주장에 대한 청중, 구조 및 평가 표준에 대한 명시적인 설명이 부족하다. 따라서 다음과 같은 중요한 질문에 대한 답이 없습니다. 이러한 질문에 대한 답을 알지 못하면 우리 분야는 주장으로서의 타당성 패러다임을 완전히 수용하기에 적합하지 않다.

  • 타당성 주장은 어떻게 그리고 누가 평가해야 하는가? 
  • 타당성 주장은 어떻게 구성되어야 하는가? 

This is not to say that important insights into validity have not already been generated by HPE scholars. Far from it. Our field's understanding of validity has progressed thanks to the work of many HPE researchers.

  • For instance, Cook, Hatala, and Downing have helped bring argument-based validity frameworks, such as those of Messick and Kane,56 into the HPE assessment sphere.1-37-14 
  • St. Onge and Young have helped map out the current state of our field's understanding of validity.415-17 
  • Govaerts, Schuwirth, van der Vleuten, and others have progressed our fields view of validity in the context of programmatic assessment.18-26 

It is thanks to scholars like these, and others, that HPE has evolved to conceptualise validity as argument. And yet, HPE's use of contemporary validity frameworks lack an explicit description of the audiences, structures, and evaluation standards for validity arguments. This leaves important questions unanswered:

  • How should validity arguments be evaluated and by whom?
  • How should validity arguments be structured?

Not knowing the answers to these questions leaves our field ill-equipped to fully embrace the validity-as-argument paradigm.

문헌에 대한 이 비판적 리뷰에서, 우리는 HPE 청중에게 맞춤화된 주장 이론에 대한 설명을 제공하고, 그것이 HPE 평가에 제공할 수 있는 고유한 통찰력을 설명하고, 주장의 다른 접근 방식이 어떻게 우리가 생성적인 방식으로 타당성의 본질을 다시 개념화하는 데 도움이 될 수 있는지를 제시한다. 우리는 주장 이론 내에서 두 가지 다른 방향을 제시하고 각각이 어떻게 타당성 주장을 이해하고, 구조화하고, 평가하는 다른 방법을 만드는지에 대해 논의한다. 이러한 추상적인 이론을 보다 구체화하기 위해, 우리는 이러한 접근 방식을 HPE 관련 사례(상자 1)에 적용한다. 이 사례 토론을 통해, 우리는 논쟁 이론이 우리의 평가 노력을 향상시키는 데 어떻게 도움이 될 수 있는지를 강조한다. 검토를 위해, 우리는 먼저 타당성 주장과 주장 이론의 정의를 제공한다.
In this critical review of the literature, we offer a description of argumentation theory—tailored to the HPE audience—articulating the unique insights it can offer to HPE assessment, and presenting how different approaches to argumentation can help us reconceptualize the nature of validity in generative ways. We present two different orientations within argumentation theory and discuss how each creates different ways of understanding, structuring, and evaluating validity arguments. To make these abstract theories more tangible, we apply these approaches to an HPE-relevant case (Box 1). Via this case discussion, we highlight how argumentation theories can help advance our assessment efforts. To frame our review, we first offer definitions of validity arguments and argumentation theory.


상자 1. 이 사례는 HPE 평가 타당성에서 논쟁 패러다임의 중요성에 대한 실제 사례를 나타낸다. 이 사례는 결과 및 토론 섹션에서 다시 언급할 것이다.
Box 1. 
This case represents a real-world example of the importance of argumentation paradigms in HPE assessment validity. The case is referenced throughout the Results and Discussion sections

사례 연구 – 시간 변동에 따른 프로모션 결정으로 전환되는 APGME 프로그램
Case study – A PGME programme transitioning to time-variable promotion decisions

대학원 의학 교육 프로그램(PGME)은 수년 동안 강력한 평가 프로그램을 개발했다. 프로그램 리더는 문헌 검토 및 새로운 검증 연구를 통해 학습자 성과에 대한 종합적 의사결정에 대한 타당성 증거를 수집했으며, 시간-변동time-variable 교육 접근 방식으로 전환하기를 희망하고 있다. 시간-기반 일정에 따라 관리 수준이 낮은 수준으로 승급되기보다는, [총괄적 진급 결정]이 학습자가 프로그램을 진행하는 시기와 방법을 결정하는 데 그칠 것입니다. 이 잠재적 변화에 대해 중요한 이해관계자(예: 학습자, PGME 리더, 부서 리더, 인증 관계자, 인증 기관)를 참여시킬 때, 프로그램은 보편적으로 다음과 같이 요청된다.

  • "총괄적 진급 결정이 방어가능하다는 것을 어떻게 확신하십니까? 
  • 즉, "올바른 진급 결정을 내릴 수 있다는 당신의 주장argument은 무엇입니까?"라는 것이다. 

프로그램이 그들의 주장을 시작하기 전에, 그들은 대답해야 할 몇 가지 질문이 있었다. 

  • 주장argument은 어떻게 구성되어야 하는가?
  • 어떤 기준으로 평가되어야 하는가?
  • 어떤 청중이 판단을 내릴 것인가?

A post-graduate medical education programme (PGME) has developed a robust programme of assessment over several years. Programme leaders have collected validity evidence for summative decisions about learner performance via literature review and new validation studies, and are hoping to transition to a time-variable training approach. Rather than being promoted to lesser degrees of supervision on a time-based schedule, summative promotion decisions will solely determine when and how learners progress through the programme. When engaging important stakeholders (e.g. learners, PGME leaders, departmental leaders, accreditation officials, certifying bodies) about this potential change, the programme is universally asked,

  • “How do you know your summative promotion decisions are defensible?”
  • In other words, “What is your argument that you can make the right promotion decision?”

Before the programme could begin making their argument, they had several questions that needed to be answered.

  • How should their argument be structured?
  • By what standard would it be evaluated?
  • Which audience(s) would levy judgement?

새로운 수사학이 이 사건을 어떻게 알려줄 수 있을까?
How can new rhetoric inform this case?

프로그램 리더들은 그들의 타당성 주장이 각 [이해관계자 그룹]에 반영될 필요가 있다는 것을 인식한다. 따라서 그들의 주장은 많은 다른 기대에 부응해야 한다.

  • 프로그램 리더는 먼저 어떤 이해관계자가 청중으로 봉사하는 것이 가장 중요한지 확인하고, 그들의 가치를 이해하려고 시도하며, 각 이해관계자 집단이 수용할 수 있을 때까지 그들의 타당성 주장을 반복적으로 구성, 평가 및 다듬는다.
  • 인증 및 인증 기관은 이 특정 PGME 프로그램의 성과와 후과에 관심이 있습니다. 따라서 프로그램의 타당성 주장에는 졸업생들이 돌보는 환자들이 양질의 진료를 받는다는 증거가 포함된다.
  • 대조적으로, 학습자들은 평가 관행의 공정성과 형평성에 대해 염려한다. 따라서 프로그램의 타당성 주장에는 다양한 학습자 정체성 그룹(예: 인종, 민족성, 성 정체성, 장애 상태)이 평가되는 방법과 그룹에 대한 편향의 증거가 있는지에 대한 양적 및 질적 데이터가 포함된다.

The programme leaders recognise that their validity arguments needs to resonate with each stakeholder group; therefore, their argument must to respond to many different expectations.

  • The programme leaders first identify which stakeholders are most important to serve as audiences, attempt to understand their values, and iteratively construct, evaluate, and refine their validity argument until it is acceptable to each stakeholder gorup.
  • Accrediting and certifying bodies are interested in the outcomes and consequences of this specific PGME programme. Therefore, the programme's validity argument includes evidence that patients cared for by graduates receive high-quality care.
  • In contrast, learners are concerned about equity and fairness in assessment practices. Therefore, the programme's validity argument includes quantitative and qualitative data on how different learner identity groups (e.g. race, ethnicity, gender identity, disability status) are assessed and whether there is evidence of bias against any groups.

비공식 논리가 어떻게 이 사건을 알릴 수 있을까?
How can informal logic inform this case?

프로그램 리더는 상당한 양의 타당성 증거를 수집하지만, 처음에는 이해관계자가 평가할 수 있는 설득력 있는 주장으로 정리되지 않았다. [툴민의 모델]을 사용하여 프로그램 리더는 주장, 데이터, 영장warrants, 반박 및 기타 중요한 요소를 signpost하여 청중의 분석을 용이하게 한다. 프로그램 리더와 이해관계자는 타당성 주장이 관련성, 수용성 및 충분성의 측면에서 평가될 것이며 툴민의 모델이 부적절하다고 판단되는 주장의 모든 측면을 식별하는데 사용될 것이라는 데 동의한다.
Programme leaders collect significant amounts of validity evidence, but initially do not have it organised into a cogent argument for stakeholders to evaluate. Using Toulmin's model, the programme leaders signpost claims, data, warrants, rebuttals, and other salient elements, facilitating easier analysis by the audience. Programme leaders and stakeholders agree that the validity arguments will be evaluated in terms of relevance, acceptability, and sufficiency, and that Toulmin's model will be used to identify any aspects of the argument that are deemed inadequate.

논쟁은 언제 완료됩니까?
When is an argument complete?

두 이해관계자 그룹은 프로그램의 [최초 타당성 주장]이 부적절하다고 판단하여, 다른 주장 측면에 대한 [추가 증거와 해명]을 요구했다. 프로그램 리더들은 두 그룹 모두 주장이 받아들여질 수 있다는 것을 발견할 때까지 증거를 수집하고 평가하기 위해 이해관계자들과 반복적으로 협력했다. 프로그램 리더는 유사한 타당성 주장 과정에 다른 이해관계자 집단을 참여시키는 데 자원을 집중할 수 있다.

Both stakeholder groups found the programme's initial validity argument to be inadequate, asking for additional evidence and clarification on different argument aspects. Programme leaders worked iteratively with stakeholders to collect and evaluate evidence until both groups found the argument to be acceptable. Programme leaders could then focus resources on engaging other stakeholder groups in similar validity argumentation processes.


 

1.1 HPE 내부 및 외부의 유효성 주장
1.1 Validity arguments within and beyond HPE

  • [타당성validity]은 [평가 점수에 관한 것]이 아니라, 그 [점수의 해석과 사용]에 관한 것이다.
  • [타당화validation]는 그러한 [해석과 사용을 뒷받침하는 주장을 개발하는 과정]이다.
  • [타당성 주장validity argument]은 [방어 가능한 추론 사슬]을 형성하기 위한, 연결되는 주장(즉, 관련된 현상에 대한 주장)으로 구성된다.

예를 들어, 우리는 역량이 어떻게 정의되는지, 어떻게 그것이 관찰될 수 있는지, 그리고 어떻게 평가될 수 있는지에 대한 주장claims을 한다. 그러나, 이러한 주장claims은 사실의 진술이 아니다; 대신에, 논의되고, 받아들여지고, 반박될 수 있는 주장들assertions이다. 만약 타당성 주장validity argument 내의 주장claims을 객관적이고 정적이며 비활동적인 선언으로 본다면, 그것은 그 안에 내재된 주장 전략argumentation strategies이 너무 널리 사용되고 받아들여져서 우리는 더 이상 그것들을 경쟁 가능한 것으로 인식하지 않기 때문이다. HPE 평가 결정이 근거로 하는 타당성 주장 주장validity argument claims은 논쟁argumentation에 몰두한 주장assertion일 뿐이므로 논쟁의 여지가 있다.

  • Validity is not about assessment scores but rather the interpretations and uses of those scores.27-30 
  • Validation is the process of developing an argument to support those interpretations and uses.29 
  • Validity arguments are comprised of claims—i.e. assertions about the phenomena engaged with—that connect to form a defensible chain of reasoning.

For instance, we make claims about how competence is defined,31 how it can be observed,32 and how it can be assessed.33 However, these claims are not statements of fact; instead, they are assertions that can be debated, accepted, or refuted. If the claims within a validity argument are viewed as objective, static, and inactive declarations, it is because the argumentation strategies embedded therein have become so pervasively used and accepted that we no longer recognise them as contestable. The validity argument claims upon which HPE assessment decisions rest are merely assertions steeped in argumentation and so are up for debate.


[주장argument으로서의 타당성validity의 개념]은 수십 년 동안 존재해 왔고 발전해 왔다. 비록 많은 HPE 학자들이 메식스나 케인의 타당성 논증 개념화를 사용하여 활동하지만, HPE 외부의 학자들은 다른 접근법을 제시한다.

  • Bachman은 타당화 작업이 [평가 활용 논증]에 해당하며, 이것은 평가 [수행]을 [해석]에 연결하는 [평가 타당성 논증]과 [해석]과 [결정]을 연결하는 [평가 활용화 논증]로 구성된다고 한다.
  • Kane은 유사하게 평가 점수의 사용에 내재된 추론과 가정을 명시하는 [해석/사용 논증]를 제안한다.
  • Mislevy는 평가를 뒷받침하는 주장들이 평가 시스템의 설계와 구현에 통합되는 검증에 대한 [증거 중심 설계 접근법]을 설명한다.

The concept of validity as argument has existed and evolved for decades.34-36 Although many HPE scholars operate using Messick's or Kane's conceptualization of validity argumentation,1, 3, 26, 37-43 scholars outside HPE present other approaches.44 

  • Bachman advocates validation work should entail an assessment use argument, which is comprised of
    • an assessment validity argument linking assessment performance to an interpretation and
    • an assessment utilisation argument linking interpretations to a decision.4546 
  • Kane similarly proposes an interpretation/use argument that explicitly states the inferences and assumptions ingrained within use of assessment scores.647 
  • Mislevy describes an evidence-centreed design approach to validation in which the arguments underpinning assessment are integrated into the design and implementation of assessment systems.4849 

이 세 명의 비 HPE 학자들은 모두 [스티븐 툴민]이 제시한 주장 구조를 사용하지만, 검증에 사용되는 기초적인 주장 지향만을 표면적으로 다룬다. 불행하게도, 툴민의 구조는 아직 HPE 검증의 담론에 들어가지 않았다. 이러한 누락은 HPE에 문제를 발생시킨다. HPE의 타당성 주장에는 우리가 종종 인식하지도, 비판하지도 못하는 가정과 사고 방식이 포함되어 있다. 이 실패는

  • [타당성 주장이 객관적인 진리]라고 가정하면서,
  • [(특정 이데올로기에 생명을 불어넣는) 추론을 위한 구조가 아니]라고 가정할 위험이 있다.

다시 말해, [우리의 평가 결정]과 그 [타당성에 대한 개념화에 entrench된 주장]은 우리가 각 결정이 언제 그리고 어떻게 타당한지를 의도적으로 고려할 수 있도록 명시되어야 한다. [논증 이론argumentation theory]은 우리가 그 명확성을 성취하는 것을 도울 수 있다.

These three non-HPE scholars all employ argument structures put forth by Stephen Toulmin,27, 29, 45, 48-51 but they only superficially address the underlying argumentation orientation utilised for validation. Unfortunately, Toulmin's structures—much less argument orientations—have yet to enter the discourse of HPE validation. This omission generates problems for HPE. Embedded within HPE's validity arguments are assumptions and ways of thinking that we often fail to recognise and critique. This failure risks assuming that

  • the validity arguments are objective truths and
  • not structures for reasoning that bring certain ideologies to life.

In other words, the arguments entrenched in our assessment decisions and in our conceptualizations of their validity must be made explicit so that we can deliberately consider when and how each decision is valid. Argumentation theory can help us achieve that clarity.

1.2 논증 이론
1.2 Argumentation theory

논증 이론은 논리학, 언어학, 철학, 심리학, 법학과 같은 여러 학문에서 끌어내어 논증적 담론의 생산, 분석, 평가를 다루는 학문이다. 다양한 학문 분야의 학자들이 논쟁 이론의 태피스트리에 독특한 실타래를 추가하는 등 몇 가지 지향점이 존재한다. Van Eemeren 등은 논증 이론의 핵심인 몇 가지 측면을 포함하는 [논증의 정의]를 제공한다.

Argumentation theory is not a single unified theory; instead, it is a field of study that draws from multiple disciplines (e.g. Logic, Speech, Linguistics, Philosophy, Psychology, and Law) to grapple with the production, analysis, and evaluation of argumentative discourse (spoken or written).52, 53 Several orientations exist, with scholars from a wide range of academic disciplines adding unique threads to the tapestry of argumentation theory. Van Eemeren et al. provide a definition of argumentation that includes several aspects that are key to argumentation theories:

논증(論 is)은 이성적인 판사 앞에
논점을 정당화하거나 반박하기 위한 명제들의 집합을 제시함으로써,
청취자나 독자에게 논쟁적인 관점의 수용성을 증가(또는 감소)시키는 것을 목표로 하는
추론의 언어적이고 사회적인 활동이다. 
Argumentation is a verbal and social activity of reason
aimed at increasing (or decreasing) the acceptability of a controversial standpoint for the listener or reader,
by putting forward a constellation of propositions intended to justify or refute the standpoint before a rational judge.52

이러한 개념화는 [논증]이 [사람들(사회) 간에 교환되는 언어(언어)에 의존하는 노력(활동)]임을 강조한다. 이 의사소통은 목표 지향적이다; 목표청중(단일 청취자, 독자 또는 청취자 또는 독자의 그룹)이 특정한 관점이나 해석(관점)에 동의하거나 동의하지 않도록 설득하는 것이다. 중요한 것은, 논쟁은 옹호되는 관점이 청중들에 의해 논쟁의 여지가 있는 사회적 상황에서 존재한다. 따라서, 주장(명제 별자리)청중(합리적 판단자)이 주장자와 일치하도록 설득할 관점에 대한 특정한 해석을 제시하기 위해 만들어진다. 

> This conceptualization highlights that argumentation is an endeavour (activity) that relies on language (verbal) being exchanged between people (social).
> This communication is goal oriented (aimed); the goal is to convince an audience (single listener or reader or groups of listeners or readers) to agree (increase acceptability) or disagree (decrease acceptability) with a particular viewpoint or interpretation (standpoint).
> Importantly, argumentation exists in social situations where the viewpoint being espoused is disputable (controversial) by an audience.
> Therefore, arguments (constellations of propositions) are created to present a particular interpretation of the viewpoint (justify or refute the standpoint) that will convince the audience (rational judge) to align themselves with the arguer.

프로세스와 표준에 대한 공유된 개념이 없다면 논쟁은 헛된 것이다.
Without a shared conception of processes and standards, argumentation is futile.52

많은 다른 논쟁 이론들이 어떻게 주장이 실현될 수 있는지를 제안한다. 어떤 이들은 [연역적 추론]의 사용을 앞에 두는 반면, 다른 이들은 [대화의 힘]을 강조한다. 어떤 것은 [규범적 기준]을 강조하는 반면, 어떤 것은 [수사적 목적]을 강조한다. 게다가, 논쟁 학자들은 이 이론들을 토론하고 수정하며, 다른 해석을 제공한다. 분명히, 이 전체 학술문헌의 검토는 타당성에 대한 HPE의 사고를 발전시키기 위한 실질적인 통찰력을 쉽게 제공하지 못할 것이다. 그러나 HPE의 평가자와 평가 연구자가 활용할 수 있는 중요한 고려사항과 구체적인 응용을 제공할 수 있는 논쟁 이론의 보다 표적화된 검토. 따라서 HPE의 유효성 주장에 유용하게 적용될 수 있는 이론과 학술적 해석을 선택했다.
Many different theories of argumentation propose how arguments could be realised. Some foreground the use of deductive reasoning,54 whereas others accentuate the power of dialogue.55 Some stress normative standards,56 whereas others emphasise rhetorical aims.57 Furthermore, argumentation scholars debate and revise each of these theories, offering different interpretations. Clearly, a review of this entire body of scholarship would not readily offer practical insights for advancing HPE's thinking about validity. However, a more targeted review of argumentation theories that can offer important considerations and concrete applications that could be harnessed by HPE's assessors and assessment researchers. Therefore, we selected theories and scholarly interpretations thereof that could be usefully applied to validity argumentation in HPE.

2 방법
2 METHODS

우리의 조사는 다음과 같이 물었다.

  • 논증 이론은 어떻게 우리가 새롭고 생성적인 방법으로 HPE 평가 타당성의 본질을 개념화하는 데 도움을 줄 수 있는가? 

이 질문에 답하기 위해 우리는 [비판적 검토]를 실시했다. [비판적 검토]는 [체계적 검토]처럼 일반화될 수 있는 진실을 생산하기 위한 것이 아니다.

  • 오히려 [비판적 검토]는 [구성주의적 존재론과 인식론]에 뿌리를 두고 있으며, "문제를 해석하는 현재의 방법을 다시 구상하기 위해 다른 영역의 문학과 이론을 끌어낸다."
  • 연구팀은 [특정 주제에 관련된 모든 지식을 종합하는 것]을 목표로 하는 대신, 문헌에 대한 [비판적 검토와 주관적 해석을 수행]한다. 따라서 연구팀은 "발견된 문헌을 평가하고 해석하기 위해 그들의 관점을 사용하는 [연구 도구의 역할]을 한다." 

Our investigation asked:

  • How can argumentation theory help us conceptualise the nature of HPE assessment validity in new and generative ways?

To answer this question, we conducted a critical review. Critical reviews are not intended to produce generalizable truths58 like systematic reviews.

  • Rather, critical reviews are rooted in a constructivist ontology and epistemology59 and “draw on literature and theory from different domains to re-envision current ways of interpreting the problem.”60 
  • Instead of aiming to synthesise all knowledge relevant to a particular topic, the research team conducts a critical review and subjective interpretation of a body of literature. The research team thus “acts as a research instrument, using their perspective to appraise and interpret the literature uncovered.”60 

이 접근 방식은 평가 타당성에 대한 가정과 선입견을 조사함으로써 HPE를 발전시킬 수 있는 논쟁 이론의 선택을 설명하려는 우리의 목표와 일치한다. 우리는 이론 뭉치를 생성하고 해당 코퍼스를 분석하기 위해 Kahkee 등이 자세히 설명한 5단계 비판 검토 프로세스를 따랐다. 우리는 아래의 반복적 순환에 관여했다. 

  • 집중(즉, 연구 목표의 구성/설정) 
  • 탐색(즉, 논증 이론에서 보초 관점에 대한 표적 탐색) 
  • 평가(즉, 목적과의 관련성을 위한 원고 평가) 
  • 샘플링(즉, 연구에 대한 통찰력을 제공할 수 있는 원고 결정) 
  • 분석(즉, 각 이론의 타당성 주장에 대한 적용 가능성 평가)을 수행합니다.

This approach aligns with our goal of describing a selection of argumentation theories that can advance HPE by examining the assumptions and preconceptions around assessment validity. We followed the five-step critical review process detailed by Kahlke et al to generate a corpus of theories and to analyse that corpus.60 We engaged in iterative cycles of

  • focusing (i.e. constructing/revising the research aims);
  • searching (i.e. targeted exploration for sentinel perspectives in argumentation theory);
  • appraising (i.e. assessing manuscripts for relevance to our aims);
  • sampling (i.e. determining manuscripts potential to offer insights into our research); and
  • analysing (i.e. assessing each theory's applicability to validity argumentation).

우리의 검색 전략(그림 1)은 논쟁 이론 분야의 선두주자로 간주되는 저자에 의해 쓰여진 인용이 높은 동료 검토 저널 기사를 식별함으로써 논쟁 이론 분야의 주요 저작물을 찾는 것으로 시작되었다. 논쟁 이론이 인문학에 자리 잡고 있다는 점을 고려할 때, 우리는 동료 검토 저널 기사가 유익하겠지만, (이 영역에서 매우 가치 있는 보급 형태인) 책과 교과서로 범위를 넓혀야 할 것이라는 것을 인식했다. 우리는 이러한 원고를 검토하고 그 분야의 역사에서 몇 가지 지점에서 논의의 이론적 및 실제적 측면을 다루는 논쟁 이론의 주요 사고 유형을 매핑했다. 
Our search strategy (Figure 1) began by locating seminal works in the field of argumentation theory by identifying highly cited peer-reviewed journal articles that were written by authors considered leaders in the field of argumentation theory. Given that argumentation theory sits in the humanities, we recognised that, although peer-reviewed journal articles would be informative, we would also have to broaden our scope to books and textbooks since these are highly valued forms of dissemination in this domain. We reviewed these manuscripts and mapped the leading strains of thought in argumentation theory that addressed theoretical and/or practical aspects of argumentation from several points in the field's history.

우리는 논증과 HPE 평가 타당성에 대한 우리의 전문 지식을 사용하여 "연구 질문에 대한 출처의 관련성 및 포함된 정보에 의해 추가된 가치에 대한 그들의 감각에 기초하여 포함을 위한 논문을 평가한다". 주요 저작물에 대한 검토와 병행하여 ERIC, Scopus, Web of Science, PubMed 및 Medline 데이터베이스가 인문학적 및 교육 관련 출판물을 다루는 광범위한 문헌을 인덱싱하기 때문에 이를 검색하기 위해 학술 사서들과 함께 ERIC, Scopus, Web of Science, PubMed 및 Medline 데이터베이스를 검색했다. 우리는 원래 말뭉치에 포함되지 않은 인용도가 높은 책과 동료 검토 저널 기사를 검색했다. 우리는 추가적인 핵심 참조를 식별하기 위해 소급적으로 눈덩이 샘플링을 사용했다(즉, 주요 작업에 나열된 참조 조사).

We used our expertise in argumentation and HPE assessment validity to “appraise papers for inclusion based on their sense of a source's relevance to the research question and the value added by the information it contains.”60 In parallel to our review of seminal works, we worked with an academic librarian to search ERIC, Scopus, Web of Science, PubMed, and Medline databases because they index a wide range of literatures—i.e. both journal articles and books—addressing humanities- and education-related publications. We searched for highly cited books and peer-reviewed journal articles that were not included in our original corpus. We used snowball sampling retrospectively (i.e. investigating references listed in seminal works) to identify additional key references.

BK와 LV는 corpus를 검토하여 [논쟁의 분야]을 형성한 저명한 이론과 학자들의 목록을 독립적으로 작성했다. 이 목록들은 포괄적이게 의도된 것이 아니라 논쟁에서 [가장 영향력 있는 목소리와 관점]을 포착하기 위해서였다. 그런 다음 우리는 합의된 토론을 통해 이것들을 [하나의 목록]으로 비교하고 해결했다. 우리는 HPE에 가장 적합한 주장 이론을 결정하기 위해 합의 목록과 정렬된 corpus의 출처를 검토했다. 구체적으로, 우리는 어떤 이론이 실제 검증 작업과 더 광범위한 학술적 노력의 맥락에서 평가 검증에 관여하는 HPE 학자들에게 유익한 통찰력을 제공하는지를 고려했다. 표 1은 우리가 검토했던 논증 이론 내에서 두드러진 방향을 제시하면서 이 연구의 요약을 제공한다.

BK and LV reviewed the corpus to independently create lists of the pre-eminent theories and scholars that have shaped the field of argumentation. These lists were not intended to be comprehensive, but rather to capture the most influential voices and viewpoints within argumentation. We then compared and resolved these into a single list through consensus discussions. We reviewed sources from the corpus that aligned with the consensus list to determine which argumentation theories were most applicable to HPE. Specifically, we considered which theories would provide beneficial insights to HPE scholars engaged in assessment validation, both in the context of practical validation work and broader scholarly endeavours. Table 1 provides a summary of this work, presenting prominent orientations within argumentation theory which we considered, though some we did not fully discuss in our findings.

2.1 반사율
2.1 Reflexivity

비판적 검토 연구팀은 "발견된 문헌을 평가하고 해석하기 위해 그들의 관점을 이용하는 [연구 도구의 역할]을 한다." 
이 목표를 염두에 두고, 우리의 고유한 관점, 전문 분야 및 개인적 배경이 합성 활동에 정보를 제공했다. 우리 팀은 다양한 관심과 경험을 가진 의학교육 학자로 구성되었다. 두 명의 팀 구성원(BK 및 DS)은 HPE 연구에 적극적으로 참여하는 임상의 교육자입니다. 이 연구의 1차 연구자(BK)는 HPE 박사 과정의 일부로 논쟁 이론 문헌에 몰두했다. 그는 또한 역량 기반 의료 교육, 학습자 평가 및 타당성에 대한 전문 지식을 가지고 있다. 다른 임상 교육자(DS)는 CBME 및 평가 타당성에 대한 전문 지식을 보유하고 있습니다. ED는 학습자 평가, 유효성 및 CBME에 대한 전문 지식을 갖춘 PhD 훈련을 받은 연구원입니다. 본 논문의 선임 연구자(LV)는 논증 이론, 수사학, 전문적 커뮤니케이션에 중점을 둔 박사 훈련을 받은 연구원입니다. 그녀의 통찰력은 팀이 논쟁에서 중요한 학자와 이론을 식별하고 이러한 학자와 이론들이 HPE에서 주장된 타당성에 대한 다른 접근법과 어떻게 일치하는지 되돌아보는 데 도움을 주었다. 팀 연구 토론은 종종 HPE의 타당성에 대한 우려에 어떤 주장 이론이 유용하게 적용될 수 있는지에 대한 토론을 포함한다.

The critical review research team “acts as a research instrument, using their perspectives to appraise and interpret the literature uncovered.”60 With this goal in mind, our unique perspectives, areas of expertise, and personal backgrounds informed the synthesis activity. Our team consisted of medical education scholars with diverse interests and experiences. Two team members (BK and DS) are clinician educators who actively engage in HPE research. The study's primary researcher (BK) immersed himself in the argumentation theory literature as part of his PhD in HPE; he also has expertise in competency-based medical education (CBME), learner assessment, and validity. The other clinician educator (DS) has expertise in CBME and assessment validity. ED is a PhD-trained researcher with expertise in learner assessment, validity, and CBME. The senior researcher on this paper (LV) is a PhD-trained researcher whose graduate work focused on argumentation theory, rhetoric, and professional communication. Her insights helped the team to identify significant scholars and theories in argumentation and to reflect on how these scholars and theories aligned with other approaches to validity espoused in HPE. Team research discussions often involved debates about which argumentation theories could be usefully applied to concerns about validity in HPE.

[방법론적 성찰성] 또한 우리의 연구를 이끌었다. [여러 저자의 이론]과 논쟁 이론의 학파 내 및 학파 간에 보유된 [일반적인 가정]을 검토함으로써, 우리는 HPE 평가 타당성을 위해 가장 생성 가능성이 있다고 생각되는 이론을 선택했다. 우리는 논증 이론의 광범위한 표현을 포함하려고 노력했지만, 주로 우리의 선택에 대한 안내 원칙은 다음과 같았다.

  • 이 이론은 우리가 HPE 맥락에서 타당성 주장을 이해하는 데 실질적으로 도움을 줄 수 있는가?

Methodological reflexivity also guided our research. By reviewing the theories from several authors and the common assumptions held within and across schools of argumentation theory, we selected theories we thought held the most generative possibilities for HPE assessment validity. We sought to include a broad representation of argumentation theories, but the guiding principle primarily informing our selections was:

  • Can this theory substantially help us understand validity arguments in the HPE context?

 

3 결과
3 RESULTS

표 1에서, 우리는 HPE의 타당성 주장에 대한 각 이론의 적용 가능성에 대한 우리의 평가와 함께 [다섯 가지 중요한 주장 이론]의 주요 측면을 개략적으로 설명한다. 반복적인 분석 주기를 통해, 우리는 [새로운 수사학]과 [비공식 논리]의 두 가지 방향이 HPE 평가 타당성에 대한 특히 유용한 통찰력을 제공한다는 것을 결정했다. 이것은 다른 주장 지향이 HPE에 대한 가치가 없다고 말하는 것이 아니다. 대신, 우리의 전문 지식을 기반으로, 우리는 [새로운 수사학]과 [비공식 논리]가 우리 분야의 평가 타당성에 특히 적용될 수 있다고 제안한다. 우리는 먼저 이러한 방향을 검토한 다음 HPE의 타당성 주장과 관련이 있다고 믿는 주장의 세 가지 측면, 즉 청중, 주장 구조 및 평가 표준에 초점을 맞춘다.
In Table 1, we outline key aspects of five prominent theories of argumentation, along with our assessments of each theory's applicability to HPE's validity arguments. Through our iterative cycles of analysis, we determined that two orientations—new rhetoric and informal logic—offered particularly useful insights into HPE assessment validity. This is not to say that other argumentation orientations are without value for HPE; instead, based on our expertise, we suggest that new rhetoric and informal logic are especially applicable to assessment validity in our field. We first review these orientations, then focus on three aspects of argumentation that we believe are relevant to validity argumentation in HPE: audience, argument structure, and evaluation standards.

3.1 새로운 수사학
3.1 New rhetoric


20세기 중반에 두 명의 철학자인 하임 페렐만과 루시 올브레히츠-티테카는 경험적 증명보다는 가치 판단에 더 의존하는 논증 이론을 발전시켰다. [새로운 수사학]은 아리스토텔레스의 수사학과의 유사성, 특히 아리스토텔레스가 논쟁에서 [청중]과 [설득]에 중점을 둔 핵심적 중요성 때문에 그렇게 명명되었다. [새로운 수사학]에서 논쟁의 목표는 절대적 진리의 증명보다는, 논쟁자에 의해 제기되는 [주장에 대한 청중의 수용을 얻는 것]이다. 논쟁의 타당성은 청중들의 설득에 달려있다. 논쟁자들은 [청중의 가치와 신념]에 대해 설명하고 적응해야 하며, 따라서 타당성을 [청중을 설득하는 능력]과 연결시켜야 한다. 청중은 논쟁자의 주장에 대해 [부분적으로 설득]될 수 있기 때문에, 타당성은 [정도의 문제]로 존재한다. 이러한 의미에서, 새로운 수사학은 주장의 타당성을 결정하기 위한 외부 규범적 틀을 제공하지 않는다. 대신, 그것은 수용 가능하고 그럴듯한 것을 결정하기 위해 청중에게 그들의 가치와 규범을 사용하도록 한다. 설득이 합리적인 주장 분석의 필요성을 없애지는 않고, 다만 청중의 가치관 맥락에 합리성을 둔다. 중요한 것은, 설득은 속이거나 조작하는 방법이 아니라, 특정 [청중의 원칙과 예상 기준]을 [평가 기준]으로 고려하고 평가하는 것을 의미한다.

In the mid-20th century two philosophers, Chaim Perelman and Lucie Olbrechts-Tyteca, developed a theory of argumentation that relied more on value judgements than empirical proof.67-70 New rhetoric was so named because of similarities to Aristotle's rhetoric, particularly the central importance Aristotle placed on audience and persuasion in argumentation.61, 71 In new rhetoric, the goal of argumentation is not the demonstration of absolute truth but rather to gain an audience's acceptance of a claim being put forth by an arguer.53, 72 Argument validity is dependent upon audience persuasion. Arguers must account for and adapt to an audience's values and beliefs, thereby linking validity to the ability to convince an audience.57 Validity exists as a matter of degree since an audience might be partially persuaded towards an arguer's claim. In this sense, new rhetoric does not provide an external normative framework for determining argument validity; instead, it relies on an audience to use their own values and norms to determine what is acceptable and plausible. Persuasion does not remove the need for rational argument analysis; it places rationality in the context of an audience's values. Importantly, persuasion is not meant as a way to deceive or manipulate,73 but rather to consider and apprize a particular audience's principles and anticipated standards as evaluative criteria.

[청중의 가치와 기준]이 타당성의 중심이므로, 논쟁자들은 그들이 [의도한 청중]을 명시해야 한다. Perelman과 Olbrects-Tyteca는 [특정 청중]과 [보편적인 청중] 사이에서 논쟁하는 것을 구별한다.

  • [특정 청중]은 논쟁자가 그들의 주장을 다룰 수 있는 실제 사람 또는 그룹(또는 그 대표자)으로 구성된다. 비록 특정 청중이 더 큰 청중집단의 부분집합이나 표본일 수 있지만, 논쟁은 여전히 [구체적인 사람 또는 집단의 가치]를 기준으로 하여 발생한다.
  • 대조적으로, [보편적 청중]은 개념적이며, 논쟁자에 의해 유능하고 합리적인 사람들의 가치와 이상을 가진 집단으로 생각됩니다. 따라서, 보편적인 청중을 가지고, 논쟁자는 [합리적 청중]의 개념에 기초하여 타당성의 가치와 기준을 결정하는 역할을 한다.

Given the centrality of an audience's values and standards to validity, arguers must make explicit their intended audience. Perelman and Olbrects-Tyteca distinguish between arguing to a particular audience and a universal audience.

  • A particular audience consists of a real-world person or group (or representative thereof) to whom an arguer can address their argument.74 Although the particular audience may only be a subset or sample of a larger group, the argument still occurs using a concrete person's or group's values as the standard.
  • In contrast, the universal audience is conceptual, conceived by the arguer as a group holding the values and ideals of competent and reasonable people. Thus, with a universal audience, the arguer plays a role in determining the values and standards of validity based on their notion of a reasonable audience.

새로운 수사학에서 [특정 청중] 및 [보편적 청중]의 구체적인 역할에 대한 논쟁이 있다. 그러나, 특정 청중과 보편적 청중 둘 다, 논쟁자의 목표는 청중들의 순응adherence을 확보하는 것이다. 새로운 수사학은 주장자들이 그들의 [청중을 명시적으로 식별]하도록 강요하며, 주장자들이 [자신의 청중에 대한 지식과 이해]를 소유하도록 동기를 부여한다.

There is debate over the specific roles of particular and universal audiences in new rhetoric74-77; however, with both particular and universal audience, the arguer's goal is securing audience adherence. New rhetoric compels arguers to explicitly identify their audience, and incentivizes arguers to possess knowledge and understanding of their audience.

HPE의 평가 관행을 위한 새로운 수사학의 실질적인 함의는 프로그램 리더가 [관여하고자 하는 각 그룹의 요구]를 충족시키기 위해 타당성 주장을 조정해야 한다는 것을 포함한다.

  • 인가 및 인증 기관을 다룰 때, 논쟁은 훈련의 결과와 결과에 초점을 맞춘 타당성 증거를 강조할 수 있다.
  • 학습자를 다룰 때, 논쟁은 평가 관행의 공정성과 형평성을 강조할 수 있다.

Practical implications of new rhetotic for assessment practices in HPE include the need for programme leaders to tailor their validity arguments to meet the needs of each group they are engaging.

  • When addressing accrediting and certifying bodies, arguments might emphasise validity evidence focused on outcomes and consequences of training.
  • When addressing learners, arguments might emphasise equity and fairness in assessment practices.

3.2 비공식 논리
3.2 Informal logic

[비공식 논리]는 [전제와 결론 사이의 논리적 일관성]을 평가하면서 실제, 사회적 환경, 공개 담론에서 발생하는 주장을 (구조를 통해) 식별하고 (규범적 표준을 통해) 평가하기 위한 절차와 표준을 제공한다. [비공식 논리]는 주장의 타당성을 결정하는 다양한 접근법을 포괄하는 광범위한 포괄적 용어이다. 이 이론이 등장하기 전에 [형식 논리formal logic]는 현실 세계의 논쟁에 무균적이고 탈맥락화된 방식으로 적용되었다. 많은 비공식 논리학자들은 탈맥락적 접근법을 거부했는데, 이는 실제 논증을 평가하는 것을 불가능하게 만드는 잠재적인 왜곡으로 가득 차 있었기 때문이다. 비공식 논리는 문맥적 요인이 제거되지 않고, 주장 구조의 식별을 통해 [실제 논쟁의 지저분하고 암묵적이며 불완전한 성격]을 설명하기 위해 개발되었다.

Informal logic provides procedures and standards for identifying (via structures) and evaluating (via normative standards) arguments that occur in real-world, social environments and public discourse while still valuing logical coherence between premises and conclusions.56, 78 Informal logic is a broad umbrella term covering differing approaches to determining argument validity.79, 80 Before the advent of this theory, formal logic was applied to real-world arguments in a sterile, decontextualized way. Many informal logic scholars rejected this context-free approach because it was fraught with potential distortions that rendered evaluating real-world argumentation impossible. Informal logic was developed to account for the messy, implicit, incomplete nature of real-world argumentation through identification of argument structures without removal from contextual factors.

일단 논쟁의 구조가 맥락적으로 이해되면, 비공식 논리는 논쟁에서 추론의 강도를 결정하기 위한 여러 기준을 제공한다. 한 가지 접근 방식은 논점을 평가하기 위한 [관련성, 수용성 및 충분성]의 기준에 의존한다.

  • 관련성은 전제(즉, 클레임 또는 제안), 이러한 전제로부터 추론된 결론 및 전체적인 주장 사이의 적절한 관계를 요구한다.
  • 수용가능성은 논쟁자, 청중, 비판적 공동체에 의해 결정되는 전제의 진실성 또는 타당성과 관련이 있다.
  • 충분성은 주장을 뒷받침하는 증거가 유형, 수량 및 사용에 있어 적절해야 한다.

비공식 논리에서 주장의 강도를 결정하기 위한 다른 접근법에는 오류(즉, 추론의 오류)를 배제하고, 반례를 사용하고, 주장 체계를 공식화하는 것이 포함된다. 어떤 접근법도 주장의 타당성을 판단하는 방법으로 유일하게 정확하지는 않다. 대신에, [비공식 논리]는 [주장의 힘과 설득력]을 주장의 목표로 앞세운다.

Once an argument's structure is contextually understood, informal logic offers multiple standards for determining the strength of inferences in the argument.56 One approach relies on the criteria of relevance, acceptability, and sufficiency to evaluate arguments.81, 82 

  • Relevance demands adequate relationship between premises (i.e. claims or propositions), conclusions inferred from these premises, and the overall argument.
  • Acceptability relates to the truth or plausibility of premises as determined by the arguer, audience, and critical community.
  • Sufficiency requires that evidence supporting an argument be appropriate in type, quantity, and use.

Other approaches for determining the strength of an argument in informal logic include excluding fallacies83, 84 (i.e. errors of reasoning), using counterexamples, and formulating argumentation schemes.85 No one approach is singularly correct for determining an argument's validity; instead, informal logic foregrounds argument strength and cogency as the goal of argumentation.

철학자 스티븐 툴민은 1958년 저서 《논증의 사용》으로 비공식 논리에 깊은 영향을 끼쳤다. 툴민의 모형에서, 인수는 더 큰 응집 단위의 고유한 요소 부분으로 분해된다.

  • 클레임(claim)은 논쟁의 출발점이 되는 논쟁자에 의해 취해지는 특정한 문제에 대한 관점 또는 의견이다.
  • [클레임]은 증거에 의해 뒷받침되어야하고, 툴민은 이를 데이터data라 불렀다.
  • 그러나, 논쟁자는 [왜 또는 어떻게 특정 데이터가 명시된 주장을 뒷받침하는지]를 상세히 설명해야 한다. 이러한 상세한 설명을 영장warrant이라고 하는데, 이는 클레임claim를 입증하기 위해 특정 데이터를 사용할 수 있는 정당성을 제공한다.

다시 말해, [영장]은 [청구]와 그 뒷받침하는 [데이터] 사이의 가교 역할을 한다. [데이터-보증-청구 유닛data-warrant-claim unit]는 툴민의 주장 구조의 근간을 이루지만 다음과 같은 다른 요소들이 있다.

  • 지원backings (영장 발부의 근거), 
  • 한정자qualifiers (청구의 보편성에 대한 제한 또는 제한) 
  • 반론rebuttals (반론에 대한 선제적 또는 사후 대응적 반응).

Philosopher Stephen Toulmin profoundly influenced informal logic with his 1958 book The Uses of Argument86 in which he provided a framework for organising argument structures to facilitate analysis and evaluation.87, 88 In Toulmin's model, arguments are deconstructed into unique component parts of a larger cohesive unit.

  • claim is a standpoint or opinion on a particular matter taken by an arguer which serves as the point of departure for argumentation.
  • Claims are supported by evidence which Toulmin labels data.
  • However, an arguer must elaborate on how or why particular data support the stated claim. This elaboration is known as a warrant, which provides justification for use of particular data to substantiate a claim. In other words, a warrant provides a bridge between a claim and its supporting data.52 

The data-warrant-claim unit forms the backbone of Toulmin's argumentation structure, though there are other components such as 

  • backings (evidence to support a warrant), 
  • qualifiers (limitations or restrictions on the universality of a claim), and 
  • rebuttals (pre-emptive or reactive responses to counterarguments).

Toulmin의 모델에서, 타당성validity은 영장warrant이 데이터data에서 청구claim로의 도약을 적절하게 정당화한다는 것을 증명하는 데 달려 있다. 그는 유사한 주장 구조가 관련 학문이나 분야field에 관계없이 사용될 수 있다고 믿었다. 따라서, 인수 구조와 인수를 분석할 수 있는 일반적인 절차는 [분야-독립적field independent]이다. 그러나 툴민은 타당성의 많은 측면이 [분야 의존적field-dependent]이라고 믿었는데, 이는 논증이 관련 분야의 규범, 가치, 기준을 사용하여 평가되어야 한다는 것을 의미한다. 이를 위해 툴민은 타당성을 설명할 때 방어 가능, 수용 가능, 견실함 등의 용어를 사용한다. 그러한 [결정을 내리는 청중]은 논쟁에 참여하는 특정 개인이나 집단 또는 논쟁에 관여하지 않지만 그럼에도 불구하고 [판단을 내릴 수 있는 구경꾼onlooker]일 수 있다.
In Toulmin's model, validity hinges on demonstrating that the warrant adequately justifies the leap from data to claim. He believed that similar argument structures could be used regardless of the relevant discipline, or field.86 Thus, argument structure and the general procedure by which arguments could be analysed are field independent. However, Toulmin believed that many aspects of validity are field dependent, meaning that arguments should be evaluated using the norms, values, and criteria of the relevant field. To that end, Toulmin uses terms such as defensible, acceptable, and sound when describing validity. The audience who levies such determinations can be a specific person or group participating in the argument or an onlooker who is not involved in the argument but can make a judgement nonetheless.

HPE의 평가 관행에 대한 [비공식 논리]의 실제적 함의는 교육 프로그램 리더가 논증의 [주장, 데이터, 영장 및 후원]을 게시하는 데 명확하게 signposting함으로써, 이해 당사자들이 시간 가변적인 승진 결정의 타당성을 결정하기 위해 [더 정밀한 조사가 필요한 추론을 명확하게 식별할 수 있도록 하는 것]을 포함한다. Claim이 수용되면, 이것이 진급 결정을 알리는 평가 프로그램과 관련된 다른 주장에 대한 [데이터data 또는 보증서warrant]가 됩니다. 따라서, 시간 변수 결정을 지원하기 위해 명확하게 레이블링된 논쟁의 웹이 형성될 수 있다. 이 웹은 현장 의존적일 것이며, 다른 분야에서는 반드시 그렇지는 않지만 HPE와 관련된 허용 가능성과 건전성 기준을 사용하여 평가될 것이다.
Practical implications of informal logic for assessment practices in HPE include training programme leaders clearly signposting the claims, data, warrants, and backings of their argument, allowing stakeholders to more clearly identify the inferences needing scrutiny to determine the validity of time-variable promotion decisions. Accepted claims then become data or warrants for other arguments related to the programme of assessment informing promotion decisions. Thus, a clearly labelled web of argumentation could be formed to support time-variable decisions. This web would be field dependent, meaning that it would be evaluated using acceptability and soundness criteria that are relevant in HPE, though not necessarily in other disciplines.

4 고찰
4 DISCUSSION

우리는 [비공식 논리]와 [새로운 수사학]이 HPE에서 타당성 주장에 대한 우리의 이해를 심화시킬 수 있는 가능성을 가진 주장 이론이라고 주장한다. 두 접근법 모두 [논쟁에서 맥락의 중요성]을 인정하고, [맥락화되고 실용화된 줌보의 타당성 개념화]와 일치한다.89, 90 우리는 HPE의 타당성 관행이 어떤 특정한 방향에 결합되어야 한다고 주장하는 것이 아니다. 대신, 우리는 우리의 분야가 유용하고 상호적인 관계로부터 이익을 얻을 수 있다고 제안한다. HPE 검증 관행과 확립된 논증 이론 사이에서.  예를 들어, Cook과 Hatala는 Kane의 프레임워크를 사용하여 HPE에서 검증 작업을 수행할 수 있는 우수한 실무 지침을 제공한다.

We contend that informal logic and new rhetoric are theories of argumentation that hold promise to deepen our understanding of validity argumentation in HPE. Both approaches acknowledge the importance of context in argumentation and align with Zumbo's conceptualization of validity as contextualised and pragmatic.89, 90 We are not asserting that HPE's validity practices should be wedded to any particular orientation; instead, we propose that our field could benefit from a useful, reciprocal relationship between HPE validation practices and established argumentation theories.91 For example, Cook and Hatala provide an excellent practical guide for undertaking validation work in HPE using Kane's framework.8 

우리는 다음에 대한 고려를 포함함으로써 이 가이드를 강화할 것을 제안한다. 

  • 주장이 누구에게 지시되어야 하는지(청중),
  • 추론(구조) 내에서 그리고 추론(구조) 사이에 주장을 구성하고 서명하는 방법, 또는
  • 주장이 평가되어야 하는 방법(표준)

We suggest enhancing this guide by including considerations of

  • to whom an argument should be directed (audience),
  • how to organise and signpost arguments within and between inferences (structure), and/or
  • how an argument should be evaluated (standards).

후자에 관해서는 쿡과 하탈라는 새로운 수사학과 비공식 논리를 동시에 인용하는 듯한 언어를 사용하며, 타당성 주장은 "다른 사람들을 설득"하려는 시도와 동시에 증거의 "관련성, 품질, 폭"이 중요하다는 점에 주목한다. 논쟁 분야에서 다양한 지향의 의미, 범위 및 효용성에 대해 토론하는 전통 내 및 다른 학자들과 함께 결정적인 경계가 거의 없는 것처럼, 우리는 HPE가 하나의 주장 지향argumentation orientation으로 스스로를 고립시키지 말아야 한다고 제안한다. HPE 연구원들은 다양한 전통에서 어떤 것을 기반으로 하여 타당성에 대한 우리 분야의 이해를 진전시키는 데 가장 도움이 될 수 있다. 따라서, 우리는 HPE가 [새로운 수사학]과 [비공식 논리]의 측면을 모두 사용하여, 타당성 논쟁에서 청중, 주장 구조 및 평가 표준에 대한 이해를 심화함으로써 이익을 얻을 것이라고 믿는다.
With regard to the latter, Cook and Hatala use language that seems to invoke both new rhetoric and informal logic, noting that validity arguments attempt to “persuade others” while also noting that the “relevance, quality, and breadth” of evidence is important. Just as there are few definitive boundaries in the field of argumentation, with scholars within and across traditions debating the meaning, scope, and utility of various orientations, we suggest that HPE should not silo itself into one argumentation orientation. HPE researchers can draw from various traditions based on which will be most helpful to move our field's understanding of validity forward. Therefore, we believe HPE would benefit from using aspects of both new rhetoric and informal logic to deepen our understanding of audience, argument structure, and evaluation standards in validity argumentation.

4.1 HPE 타당성 주장의 대상자를 정의하는 새로운 수사
4.1 New rhetoric to define HPE validity argumentation's audience

HPE의 새롭고 성장하는 담론은 "사회적 필수impretative로서의 타당성"이다. 그것은 사회와 학습자에 대한 책임감을 강조한다. 다시 말해, HPE 타당성 논쟁은 이해당사자의 요구에 집중된다. [비공식 논리]는 논쟁에서 청중의 중요성을 인식하지만, [새로운 수사법]과 같은 정도는 아니다. [새로운 수사학]은 청중 가치를 논쟁의 중심에 두며, 이해 관계자들과 더 넓은 HPE 커뮤니티 모두를 더 잘 참여시킴으로써 HPE가 완수하도록 요청되고 있는 사회적 요구를 더 잘 충족시키는 데 도움이 될 수 있다.
A new and growing discourse in HPE is that of “validity as social imperative,”4, 17 which emphasises accountability to society and learners. In other words, HPE validity arguments centre on the needs of our stakeholder audiences. Informal logic recognises the importance of audience in argumentation, but not to the same degree as new rhetoric.92 New rhetoric places audience values at the centre of argumentation, and may help us better satisfy the social imperative that HPE is being called to fulfil by better engaging both stakeholders and the broader HPE community.

앞에서 언급한 바와 같이, [새로운 수사학적 주장]은 특정 청중 또는 보편적인 청중을 향할 수 있다. HPE가 타당성 주장에 [새로운 수사학적 접근법]을 채택하기 위해서는, 우리는 청중을 더 잘 정의할 필요가 있을 것이다. 현재 많은 공식적인 HPE 타당성 주장은 저널 검토자, 편집자 및 독자가 청중 역할을 하는 동료 검토 출판물의 형태로 만들어진다.

  • [저널 독자]들은 출판계에서 가장 중요한 청중일 것이다. 그러나 독자들은 (편지나 해설을 쓰는 극소수의 경우를 제외하고) 대화식 청중의 형태를 나타낸다. 그것은 그들의 가치를 알 수 있거나 그들의 판단이 공유될 수 있는 정도를 제한한다. 
  • [검토자와 편집자]는 다른 HPE 학자를 대표하는 [특정 청중]의 역할을 할 수도 있고, 정보에 근거한 판단을 부과하기에 충분한 지식을 가진 유능하고 합리적인 사람들을 대표할 가능성이 가장 높기 때문에 [보편적 청중]의 대표자로 간주될 수도 있다. 사실, 그들은 두 가지 역할을 모두 수행할 수 있습니다

As mentioned previously, new rhetoric arguments can be directed towards a particular audience or a universal audience. For HPE to adopt a new rhetoric approach to validity argumentation, we would need to better define our audiences. Currently, many formal HPE validity arguments are made in the form of peer-reviewed publications, with journal reviewers, editors, and readers serving as audiences.

  • Journal readers may be the most important audience in the publication world. However readers represent a form of noninteractive audience93 (with the exception of the very few who write letters or commentaries), which limits the degree to which their values can be known or their judgements shared.
  • Reviewers and editors could serve as a particular audience representing other HPE scholars, or they could be considered a representation of a universal audience because they are most likely to represent competent and reasonable people with sufficient knowledge to levy informed judgements. They could, in fact, serve both roles.

그러나, 현재 검토자와 편집자는 반드시 타당성 주장이 허용 가능한지 또는 그럴듯한지에 대해 명시적인 판단을 내리지 않고 있다. 주어진 기관이나 프로그램의 맥락에서는 확실히 그렇지 않다. 그보다 , 리뷰어와 에디터는 원고가 HPE 커뮤니티에서 더 넓은 학문적 논의를 진전시키는지에 대한 결정을 내리고 있다. 검토자와 편집자는, 타당성 주장이 부적절하다는 것을 발견할 수 있지만, 원고가 아마도 혁신적인 생각, 방법론적 발전 또는 새로운 결론의 측면에서 저널의 독자들에게 약간의 이익을 제공하기 때문에 여전히 출판을 권고할 수 있다. 따라서, [새로운 수사학]은 (특정 청중으로서) 검토자와 편집자가 출판을 위해 제출된 타당성 주장의 타당성을 명시적으로 판단할 것을 강제할 것이다. 이는 아마도 출판 시 독자에게 판단을 signal하는 방법 중 하나이다.

However, currently reviewers and editors are not necessarily making explicit judgements on whether a validity argument is acceptable or plausible, and certainly not within the context of a given institution or programme. Rather, they are making a determination of whether a manuscript, in toto, moves the broader scholarly discussion forward in the HPE community. Reviewers and editors could, in fact, find a validity argument to be inadequate but still recommend publication because the manuscript provides some benefit to the journal's readers, perhaps in terms of innovative thinking, methodological developments, or novel conclusions. Thus, new rhetoric would compel reviewers and editors—were they to be identified as a particular audience—to explicitly judge the plausibility of validity arguments submitted for publication, perhaps with a way to signal their judgement to readers upon publication.

출판과 함께 발생하는 제한된 청중 상호작용은 HPE가 학술지를 넘어 타당성 논쟁을 확장하도록 의무화할 것이다. HPE는 [학습자, 프로그램 리더, 인가자, 인증자, 기관 및 지급인]을 포함한 여러 이해당사자를 보유하고 있다. 이러한 이해관계자 중 다수는 자신의 맥락과 관련된 타당성 증거가 발표된 기사를 결코 읽지 않을 수 있다. 평가 설계자는 동료 검토 출판물을 포함하지 않는 메커니즘을 통해 이러한 특정 청중에게 주장이 타당한지 확인할 필요가 있다. [비공식 논리]가 논증을 생산물로 제시하는 반면, [새로운 수사학]은 논증을 논증자가 청중과 함께 개발하는 활동 또는 서비스라고 설명한다. 이러한 [활동 기반 지향activity-based orientation]은 Cook과 Hatala의 [프로세스로서의 타당화validation]에 대한 설명과 일치하며, HPE에서 점차 관심을 받고 있는 [공동 생산]의 개념과 일치합니다. 공동 생산에서 소비자의 지식, 경험, 의견은 제품의 수동적 소비보다는 서비스의 창출에 영향을 미친다. 새로운 수사학의 렌즈를 채택하면 HPE가 서비스하고자 하는 사람들의 요구를 가장 잘 충족시키기 위해 일하는 타당성 주장자 및 청중(즉, 이해관계자)과 시간이 지남에 따라 논쟁의 공동생산이 이루어질 수 있다.
The limited audience interaction that occurs with publication would oblige HPE to expand validity argumentation beyond the pages of journals. HPE has several stakeholders in assessment decisions including learners, programme leaders, accreditors, certifiers, institutions, and payors. Many of these stakeholders may never read the articles in which validity evidence relevant to their context is published. Assessment designers would need to ensure that arguments are plausible to these particular audiences, likely via mechanisms that do not involve peer-reviewed publication. Whereas informal logic presents argument as a product, new rhetoric entreats argumentation to be an activity, or service, that an arguer develops with an audience.53 This activity-based orientation aligns with Cook and Hatala's description of validation as a process,8 and with the concept of co-production, which is gaining traction HPE.94, 95 In co-production, the consumers' knowledge, experience, and opinions influence the creation of a service rather than passive consumption of a product.96, 97 Adopting a lens of new rhetoric could the coproduction of arguments over time with validity arguers and audiences (i.e. stakeholders) working to best meet the needs of those who HPE aims to serve.

4.2 HPE 유효성 주장 구조를 명확히 하기 위한 비공식 논리
4.2 Informal logic to clarify HPE validity argumentation structure

HPE 학자들은 정기적으로 메시크와 케인의 프레임워크를 사용하여 타당성 증거를 구성하지만, [완전한 주장 구조]를 명시하지는 않는다. 실제로 케인은 툴민의 주장 구조(영장, 데이터, 지원, 반박)를 호출하지만, 이 모델은 언어 테스트와 같은 다른 분야에서 주로 나타났다. Toulmin의 모델은 HPE에 확인되지 않는 존재이며, 말뭉치 내에서 거의 표면화되지 않는다. 케인의 프레임워크는 논쟁자들이 [평가 데이터의 의도된 해석과 사용]을 명확히 진술할 것을 요구하는데, 이것은 주장 주장argument claim의 역할을 한다. 

HPE scholars regularly organise validity evidence using frameworks from Messick and Kane,2, 3 but do not make full argument structure explicit. Indeed, Kane invokes Toulmin's argumentation structure (warrants, data, backings, rebuttals),27, 29, 47, 50 though this model has mostly appeared in other fields such as language testing.98 Toulmin's model exists as a cryptid in HPE, rarely (if ever) surfacing within our corpus. Kane's framework requires arguers to clearly state an intended interpretation and use of assessment data,6, 29 which serves as the argument claim.

그러나, HPE 학자들은 케인의 추론 사슬을 단순히 사용하는 것이 아니라, 특히 상당한 정밀 조사가 필요한 고위험 의사결정의 경우 분석을 강화하기 위해 주장의 전체 구조를 명시적으로 만들 수 있다. 사실 케인의 추론의 사슬에는 몇 가지 주장arguments이 내재되어 있을 가능성이 높지만, 명시적이고 구조적인 보고가 없다면 간과될 수 있다. 프로그램적 평가에서 발견될 가능성이 있는 [복잡한 타당성 주장]은 어떻게 [확립된 주장]이 더 긴 일련의 논쟁에서 [후속 주장에 대한 데이터나 영장warrant이 되는지]를 보여주면서 계획될 수 있다.

However, rather than simply using Kane's chain of inferences, HPE scholars could make explicit the full structure of their arguments to augment analysis, particularly for high-stakes decisions that require significant scrutiny. In fact, there are likely to be several arguments embedded within Kane's chain of inferences,28 which may go overlooked without explicit and structured reporting. Complex validity arguments that are likely to be found in programmatic assessment could be mapped out, showing how an established claim becomes data or a warrant for a subsequent argument in a longer chain of argumentation.

타당화 과정이 얼마나 많은 구조를 가져야 하는지에 대한 타당성 학자들 사이에 논쟁이 있지만, 현재 HPE는 타당성 주장을 구성, 식별 또는 서명 게시하기 위한 명확하거나 합의된 접근법이 없다. 종종 "주장arguments"라고 불리는 것은 명확한 주장 구조는 없는 데이터의 집합이다. Toulmin의 모델은 이해관계자들에게 증거를 제시하고, 해석하고, 우선순위를 정하고, 논쟁하는 데 도움이 될 수 있다.

Though there is debate amongst validity scholars as to how much structure the validation process should have,44 currently HPE has no clear or agreed-upon approach for organising, identifying, or signposting validity arguments. Often what are labelled “arguments” are collections of data that lack an explicit argument structure. Toulmin's model could help to present, interpret, prioritise, and argue the evidence to stakeholders.

 

4.3 타당성 주장을 평가하기 위한 표준을 설명하기 위한 비공식 논리 또는 새로운 수사
4.3 Informal logic or new rhetoric to elucidate standards for evaluating validity arguments

[비공식 논리]나 [새로운 수사학]도 보편적 진실을 제공한다고 주장하지는 않지만, 겉으로 보기에 끝이 없어 보이는 검증 노력이 언제 방어 가능한 정지점stopping point에 도달했는지에 대한 정보를 제공할 수 있다(적어도 새로운 주장이 제기되거나 새로운 청중이 고려되기 전 까지는).

  • [새로운 수사학]은 설득과 청중의 집착을 추구한다.
  • [비공식 논리]는 논증자의 학문이나 분야에 의해 정의되는 관련성, 충분성, 수용성 측면에서 논증적 타당성을 추구한다.

두 렌즈 모두 HPE 내에서 잘 작동합니다. 그러므로, 어떤 것을 사용할 것인가를 선택하는 것은 개인의 철학적 세계관에 달려있을 수 있다. 
Neither informal logic nor new rhetoric claim to provide a universal truth, but they could inform when seemingly unending validation efforts have reached defensible stopping points (at least until new arguments are put forth or new audiences are considered). New rhetoric seeks persuasion and audience adherence. Informal logic seeks argument cogency, often in terms of relevance, sufficiency, and acceptability as defined by the arguer's discipline or field. Both lenses would work well within HPE; therefore, choosing which to use may depend on one's philosophical worldview.

비공식 논리는 [후기 실증주의 세계관]과 잘 일치할 수 있는 반면, 새로운 수사학은 [구성주의나 비판적 현실주의] 관점과 더 잘 일치할 수 있다. 그러나, 비공식 논리와 새로운 수사학은 특정한 세계관에 제한되지 않는다. HPE의 이질적인 철학적 세계관을 고려할 때, 모든 주장자와 청중에게 맞는 하나의 주장 지향성을 기대하는 것이 합리적인가? 아마 아닐 겁니다. 그러나 우리는 타당성 작업을 수행할 때 우리의 주장 패러다임을 분명히 인정해야 하며, 특히 청중들의 주장도 고려해야 한다. 그렇게 하면 HPE 검증 작업에서 충돌을 일으킬 수 있는 세계관과 주장 패러다임의 오해를 피하는 데 도움이 될 수 있다. Tavares 외 연구진은 평가에서 호환성 원칙compatibility principle을 다음과 같이 설명했다. "평가 계획 사이에 또는 평가 계획 내에 서로 다른 철학적 입장이 존재할 수 있으며, 이러한 입장이 평가 설계자에게 특정 아이디어와 가정을 위임한다는 것을 인식할 의무" 우리는 호환성 원칙이 HPE 타당성에 짜여진 논쟁의 철학에도 적용된다고 믿는다.

Informal logic may align well with post-positivist worldviews,99, 100 whereas new rhetoric likely aligns better with constructionist or critical realist views.101, 102 However, informal logic and new rhetoric are not restricted to any specific worldview; each will manifest in different ways when employed with different philosophical beliefs. Given the heterogenous philosophical worldviews in HPE, is it reasonable to expect one argumentation orientation to fit all arguers and audiences? Likely not. But we should explicitly acknowledge our argumentation paradigms when undertaking validity work, and specifically consider our audience's as well. Doing so can help avoid misunderstanding of worldviews and argumentation paradigms that could cause conflict in HPE validation work.103 Tavares et al described a compatibility principle in assessment as “the obligation to recognize that different philosophical positions can exist between and within assessment plans and that these positions commit assessment designers to particular ideas and assumptions.”104 We believe the compatibility principle also applies to the philosophies of argumentation woven into HPE validity.

4.4 HPE 평가 검증에서 논증을 사용하는 나머지 과제
4.4 Remaining challenges of using argumentation in HPE assessment validation

우리는 비공식 논리와 새로운 수사법이 HPE 타당성 주장을 위한 유용한 방향이라고 믿지만, 몇 가지 과제는 여전히 해결되어야 한다.

  • 첫째, 어떤 주장 방향이 학습자, 프로그램 리더, 인가자 및 인증자와 같은 HPE 이해 관계자에게 공명하는지에 대해서는 거의 알려져 있지 않다. 향후 연구는 이러한 그룹들이 가질 수 있는 잠재적인 주장 가정을 발견하기 시작할 수 있다.
  • 둘째, 여러 청중의 가치에 영합하는 것은 타당성 논쟁을 새로운 수사 패러다임에서 벅찬 과제로 만들 수 있다. 각 이해관계자 그룹은 평가와 타당성에 대한 가치 및 이해도가 다를 수 있습니다. 교육자들이 각 집단마다 고유한 타당성 주장이나, 설득력 있고 모두가 받아들일 수 있는 단일 주장을 개발할 수 있을지는 불분명하다.
  • 셋째, 특히 청중 가치와 평가 기준과 관련하여 HPE 내의 헤게모니 및 형평성에 대한 검증에 비공식 논리 또는 새로운 수사학을 주입하는 영향을 고려하고 연구해야 한다.

Though we believe informal logic and new rhetoric are useful orientations for HPE validity argumentation, several challenges must still be addressed.

  • First, little is known about which argumentation orientations resonate with HPE stakeholders such as learners, programme leaders, accreditors, and certifiers. Future research could begin to unearth the latent argumentation assumptions that these groups may carry.
  • Second, catering to the values of multiple audiences could make validity argumentation a daunting task in a new rhetoric paradigm. Each stakeholder group likely has different values and understandings of assessment and validity. It is unclear if educators can develop a validity argument that is unique to each group, or a single argument that is persuasive and acceptable to all.
  • Third, we must consider and study the impact of infusing informal logic or new rhetoric into validation on hegemony and equity within HPE, particularly with regard to audience values and evaluative standards.

Addey 등은 "민주적 공간"을 요구하였으며, 그래야만 "정당하게 다양한 주장과 의도가 인식, 고려, 조립 및 표시될 수 있다." 고 말하였다. 그런 민주적 공간을 만들면 모든 이해관계자들의 목소리가 확실히 들릴 수 있다. 마지막으로, 우리는 Toulmin의 주장 모델이 HPE 유효성 주장의 분석과 평가를 개선할 수 있다고 믿지만, 이 가설을 테스트하기 위해서는 경험적 연구가 필요하다. HPE 커뮤니티가 이러한 한계와 과제를 탐구할 때까지 평가 타당성 주장은 사례 연구의 경우와 같은 프로그램의 블랙박스로 남을 것이다.

Addey et al call for “democratic spaces” in which “legitimately diverse arguments and intentions can be recognized, considered, assembled, and displayed.”105 Creating such democratic spaces can ensure that all stakeholder voices are heard. Finally, although we believe Toulmin's argumentation model could allow for improved analysis and evaluation of HPE validity arguments, empirical studies are needed to test this hypothesis. Until the HPE community explores these limitations and challenges, assessment validity argumentation will remain a black box for programmes such as the one in our case study.

4.5 한계
4.5 Limitations

우리의 저자 그룹은 HPE 타당성 주장에 가장 유용한 비공식 논리와 새로운 수사학을 선택했지만, 우리가 선택하지 않은 몇 가지 다른 주장 지향이 있다(작은 선택 사항은 표 1에 제시됨). 우리는 다른 학자들이 HPE에 이러한 다른 방향들이 특히 이산적 구조(형식 변증법 및 실용적 변증법)를 중시하거나 실증주의 세계관을 가질 경우 더 유용할 수 있다는 것을 인정한다. 우리는 또한 논쟁 이론의 길고 풍부한 역사를 고려할 때, 우리가 모든 방향과 접근방식을 완전히 검토하는 것은 불가능했다는 것을 인정한다.
Though our author group selected informal logic and new rhetoric as most useful for HPE validity argumentation, there are several other argumentation orientations that we did not select (a small selection is presented in Table 1). We acknowledge that other scholars might find these other orientations more useful to HPE, particularly if they value discursive structure (formal dialectics and pragma-dialectics) or have positivist worldviews (formal logic). We also acknowledge that given the long and rich history of argumentation theory, it was impossible for us to fully review every orientation and approach therein.

4.6 결론
4.6 Conclusion


HPE 학자들은 Messick5 또는 Kane의 일반적으로 사용되는 프레임워크 내에서 조직된 다양한 평가 결정에 대한 강력한 타당성 증거를 발표했다. 비록 이것들이 타당성 증거를 구성하는 방법의 훌륭한 예를 제공하지만, 다음의 것들을 명시적으로 설명하지 않는다.

  • 누가 증거를 평가해야 하는가? 
  • (증거뿐만 아니라) 논쟁이 취해야 할 구조는 무엇인가?
  • 평가를 위해 어떤 기준을 사용해야 하는가?

이러한 누락은 [증거]가 [주장]과 동일하고, [증거]를 단순히 배치함으로써 타당성 판단이 내려졌다는 개념을 전파한다. 이 원고에서는 비공식 논리와 새로운 수사법이 평가에서 타당성을 가지고 HPE의 진행 중인 작업을 진전시키는 데 어떻게 도움이 될 수 있는지 자세히 설명하였다. 각 이론은 모호하고 비활성적인 HPE 평가 타당성 증거를 더 명확하고 생동감 있는 타당성 주장으로 변환하기 위한 여지를 제공한다.

HPE scholars have published robust validity evidence13, 38-40, 106 for various assessment decisions organised within the commonly used frameworks of Messick5 or Kane.27 Although these provide excellent examples of how to organise validity evidence, they do not explicitly describe

  • who should evaluate the evidence (audience),
  • what structure the argument (not just the evidence) should take, and
  • what criteria should be used for evaluation.

This omission propagates the notion that evidence equals argument and that a validity judgement has been rendered by simply laying out the evidence. In this manuscript, we have detailed how informal logic and new rhetoric can help advance HPE's ongoing work with validity in assessment. Each theory offers affordances for transforming ambiguous, inert HPE assessment validity evidence into clearer, animate validity arguments.

 


Med Educ. 2022 Jul 19.

 doi: 10.1111/medu.14882. Online ahead of print.

How argumentation theory can inform assessment validity: A critical review

Affiliations collapse

Affiliations

1Department of Pediatrics, University of Cincinnati College of Medicine, Cincinnati, Ohio, USA.

2School of Health Professions Education (SHE), Maastricht University, Maastricht, The Netherlands.

3School of Health Professions Education Faculty of Health, Medicine and Life Sciences of Maastricht University, Maastricht, The Netherlands.

4Uniformed Services University of the Health Sciences, Bethesda, Maryland, USA.

PMID: 35851965

DOI: 10.1111/medu.14882

Abstract

Introduction: Many health professions education (HPE) scholars frame assessment validity as a form of argumentation in which interpretations and uses of assessment scores must be supported by evidence. However, what are purported to be validity arguments are often merely clusters of evidence without a guiding framework to evaluate, prioritise, or debate their merits. Argumentation theory is a field of study dedicated to understanding the production, analysis, and evaluation of arguments (spoken or written). The aim of this study is to describe argumentation theory, articulating the unique insights it can offer to HPE assessment, and presenting how different argumentation orientations can help reconceptualize the nature of validity in generative ways.

Methods: The authors followed a five-step critical review process consisting of iterative cycles of focusing, searching, appraising, sampling, and analysing the argumentation theory literature. The authors generated and synthesised a corpus of manuscripts on argumentation orientations deemed to be most applicable to HPE.

Results: We selected two argumentation orientations that we considered particularly constructive for informing HPE assessment validity: New rhetoric and informal logic. In new rhetoric, the goal of argumentation is to persuade, with a focus on an audience's values and standards. Informal logic centres on identifying, structuring, and evaluating arguments in real-world settings, with a variety of normative standards used to evaluate argument validity.

Discussion: Both new rhetoric and informal logic provide philosophical, theoretical, or practical groundings that can advance HPE validity argumentation. New rhetoric's foregrounding of audience aligns with HPE's social imperative to be accountable to specific stakeholders such as the public and learners. Informal logic provides tools for identifying and structuring validity arguments for analysis and evaluation.

역설적 진실과 사라지지 않는 미신: 팀 역량 대화를 리프레이밍하기(J Contin Educ Health Prof, 2016)
Paradoxical Truths and Persistent Myths: Reframing the Team Competence Conversation 
Lorelei Lingard, PhD

 

 

의학은 매우 개인주의적인 문화이다. 우리는 개인을 선발한다. 우리는 개인을 교육하고 평가합니다. 우리는 개인에게 라이센스를 부여하고, 고용하고, 급여를 지급합니다. 우리는 개인을 규제하고 치료한다. 그렇다면, 의학이 똑똑하고, 숙련되고, 헌신적인 임상의와 같은 유능한 사람들로 가득하다는 것은 놀랄 일이 아니다. 불행히도, 유능한 개인은 양질의 의료 서비스를 제공하지 못한다. 
Medicine is a highly individualist culture. We select individuals. We train and assess individuals. We license, hire, and pay individuals. We regulate and remediate individuals. It should come as no surprise, then, that medicine is full of competent individuals: smart, skilled, dedicated clinicians. Unfortunately, competent individuals do not equal quality health care. 

보건의료의 가장 시급한 문제들 중 일부는 무능한 개인이 아닌 무능한 팀들로 거슬러 올라갈 수 있다. 예를 들어 홈케어를 받는 노인들 사이에서 10-13%의 위험 발생률은 고객의 집을 통과하는 많은 의료 서비스 제공자들 사이의 조정과 의사소통 문제 때문이다. 그것은 개인의 역량의 문제가 아니며, 책임 있는 개인을 찾고 그들을 교정하는 우리의 통상적인 전술로는 해결될 수 없다. 우리는 개인의 능력 이상의 것을 생각할 필요가 있다. 왜냐하면 그것은 필요하지만, 양질의 의료 서비스를 위해 충분하지 않기 때문이다.
Some of health care's most pressing problems can be traced back to incompetent teams rather than incompetent individuals. For instance, the alarming 10–13% adverse event rate among seniors receiving homecare is due to problems of coordination and communication among the many health care providers passing through the client's home.1 That is not a problem of individual competence, and it cannot be solved by our usual tactic of looking for the responsible individual and remediating them. We need to think beyond individual competence because, although it is necessary, it is not sufficient for quality health care.

나는 거의 20년 동안 건강관리 팀워크를 공부해 왔다. 제 연구 그룹은 수술실, 중환자실, 입원환자 의료 및 소아과, 뇌졸중 재활실, 다장기 이식실, 심부전 클리닉, 가족 보건팀 등 직장에서 팀을 관찰하는데 수천 시간을 보냈습니다. 우리는 수백 명의 임상의들과 그들의 팀이 어떻게 소통하고 협력하는지에 대해 이야기를 나누었고, 우리는 어떻게 교육생들이 이러한 팀 관행과 가치를 습득하게 되었는지 탐구했습니다. 그리고 일반적으로 사회과학자가 복잡하고 유동적인 사회세계에서 안정된 진리의 존재를 선언하는 것은 신성불가침으로 여겨지지만, 저는 그것을 하려고 합니다. 우리가 연구한 모든 팀에게 다음과 같은 진술이 들어맞기 때문입니다.
I have been studying health care teamwork for almost 20 years. My research group has spent thousands of hours watching teams at work—in operating rooms, critical care units, inpatient medicine and pediatric units, stroke rehabilitation units, multiorgan transplant units, heart failure clinics, family health teams. We have talked with hundreds of clinicians about how their teams communicate and collaborate, and we have explored how trainees come to acquire these team practices and values. And while it is generally deemed sacrilegious for a social scientist to declare the presence of stable truths in a complex and fluid social world, I am about to do just that. Because the following statements hold true across all the teams we have studied:

  • 유능한 개인은 무능한 팀을 구성할 수 있다.
  • 한 팀원이 무능해도 팀은 유능할 수 있다.
  • 한 명의 무능한 팀원이 팀 전체를 좌절시킬 수도 있지만, 어떤 팀은 그러한 팀원과 함께 나아간다.
  • 동일한 팀도 한 상황에서 유능하고, 다른 상황에서 무능력할 수 있다.
  • Competent individuals can form an incompetent team.
  • Teams can be competent even when one team member is incompetent.
  • An incompetent team member can derail one team, but another team carries on around her.
  • The same team can be competent in one situation and incompetent in another.

한편으로, 이러한 사실들은 놀랍지 않다. 모든 임상의는 "드림팀"이었어야 했던 팀이 그저 그런 팀으로 변해버린 시절을 경험한다. 모든 교육자는 임상 환경의 교육이 작동하는 이유는, 부분적으로 초보자의 존재를 나머지 팀이 보상하기 때문임을 알고 있습니다. 모든 유닛 리더는 리소스의 변화가 팀이 성과를 유지하는데 어려움을 겪을 수 있다는 것을 인식하고 있습니다.
On the one hand, these truths are not surprising. Every clinician has experienced those days when what should have been a “dream team” turned sour. Every educator knows that teaching in clinical settings works in part because teams compensate for the presence of novices. Every unit leader recognizes that a change in resources can cause teams to struggle to maintain their performance.

반면에, 이러한 사실들은 놀랍기만 한 것이 아니라 역설적이다. 그들은 우리가 능력에 대해 진실이라고 믿는 것에 도전한다. 우리는 전통적으로 역량이 개인의 자질이라고 믿는다. 선택에서 훈련과 규제를 통해, 의학은 충분한 훈련을 통해 달성될 수 있고 주기적인 업데이트로 유지될 수 있는 상태로서 개인이 소유한 어떤 것으로 역량에 접근한다. 개념적으로, 이 접근법은 역량이 맥락에 구애받지 않는다는 것을 의미한다. 그렇다고 해서 우리가 맥락이 중요하다는 것을 인식하지 못한다는 것은 아니다. 

  • 현실적으로 말해서, 우리는 역량이 임상의, 환자, 조직 환경 및 기타 요인들 사이의 복잡한 상호작용을 수반한다는 것을 알고 있다. 
  • 그러나 개념적인 수준에서, 역량에 대한 우리의 전통적인 개별적인 접근법은 한 환경에서 유능한 의사가 다른 환경에서 유능할 것이라고 가정한다. 

어느 정도, 역량에 대한 이러한 믿음은 개인에게 전제된 [허가와 규제 시스템에 대한 믿음]을 갖기 위해 필요하다.

On the other hand, these truths are not just surprising, they are paradoxical. They fly in the face of what we believe to be true about competence. We conventionally believe that competence is a quality of the individual. From selection, through training and regulation, medicine approaches competence as something individuals possess, as a state that can be achieved through sufficient training and maintained with periodic updates. Conceptually, this approach also implies that competence is context-free. That is not to say that we do not recognize that context matters:

  • practically-speaking, we know that competence involves a complex interaction among clinician, patient, organizational setting, and other factors.
  • But at a conceptual level, our conventional, individual approach to competence assumes that a physician competent in one setting will be competent in another.

To some degree, these beliefs about competence are necessary in order to have faith in a system of licensing and regulation that is predicated on the individual.

위에서 요약한 네 가지 진리는 개인의 역량에 대한 전통적인 개념화에 도전한다. 사실, 이 역설적인 진리는 [집단적 역량]을 참고해야만 설명할 수 있습니다. [집단적 역량]은 시스템의 분산된 능력으로, 개인에게 쉽게 환원될 수 없다. 
그것은 역동적이고 문맥과 강하게 연관되어 있다.

  • 그래서 유능한 개인들은 무능한 팀을 구성할 수 있는데, 왜냐하면 팀워크는 그 부분의 합보다 더 중요하기 때문이다; 그것은 사회적 상호작용, 공유된 경험, 그리고 암묵적인 지식을 필요로 한다.
  • 마찬가지로, 팀워크는 공동의 인지적 성취이기 때문에 한 구성원이 무능력하더라도 팀은 유능할 수 있다.
  • 무능한 팀원이 어떤 팀을 마비시킬 수 있지만, 다른 팀은 마비시킬 수 없다. 왜냐하면 그 개인에 대한 집단적 대응이 관건이지 개인 자신이 아니기 때문이다.
  • 그리고 마지막으로, 한 팀은 다음이 아닌 한 상황에서 유능할 수 있습니다. 왜냐하면 집단적 역량은 진화하고, 불안정하며, 그들의 다양한 사회적 관계와 그 순간에 팀워크를 지원하거나 구속할 수 있는 물질적 조건을 가진 상황에 기반을 두고 있기 때문입니다.
    • [사회적 관계]는 갈등, 권력, 존중, 신뢰와 같은 이슈들에 의해 형성되는 복잡하고 미묘한 것이다.4-6
    • [물질적 조건material condition]도 중요하다: 교대 근무 시간표부터 "자료" 변경과 같은 프라이버시 법률까지 팀의 집단적 역량도 중요하다.7

The four truths outlined above challenge this conventional conceptualization of individual competence. In fact, we can explain these paradoxical truths only by reference to collective competence. Collective competence is a distributed capacity of a system, not easily reducible to an individual; it is dynamic and strongly tied to context.2 

  • So competent individuals can form incompetent teams because teamwork is more than the sum of the parts; it requires social interaction, shared experience, and tacit knowledge.
  • Similarly, a team can be competent even if one member is incompetent because teamwork is a joint cognitive accomplishment.3
  • An incompetent team member can paralyze one team but not another because how the collective responds to that individual is the key, not the individual him/herself.
  • And finally, a team can be competent in one situation and not the next because collective competence is evolving, unstable and based in situations with their varying social relations and material conditions that can support or constrain teamwork in the moment. Social relations on teams are complex and nuanced, shaped by issues such as conflict, power, respect, and trust.4–6 And material conditions matter too: from shift schedules to privacy legislation as such “materials” change so does the collective competence of the team.7

비록 우리가 집단 역량의 개념을 통해 이러한 역설적인 진리를 인정하고 설명할 수 있지만, 몇몇 강력한 신화는 팀워크에 대한 일상적인 대화에서 지속된다.
Even while we can acknowledge and, through the concept of collective competence, we can explain these paradoxical truths, some powerful myths persist in everyday conversations about teamwork:

  • 우리가 각자 맡은 일을 제대로 해낸다면, 이 팀은 효과적일 것이다.
  • 만약 우리가 서로의 역할을 이해한다면, 이 팀은 유능할 것이다.
  • 만약 우리가 분명한 리더십과 책임감이 있다면, 이 팀은 잘 기능할 것이다.
  • 우리 모두가 환자에게만 집중한다면, 이 팀은 부드럽게 작동할 거예요.
  • If we each did our job properly, then this team would be effective.
  • If we understood each other's roles, then this team would be competent.
  • If we had clear leadership and accountability, then this team would function well.
  • If we all just focused on the patient, then this team would work smoothly.

이러한 미신은 우리 모두가 "좋은 것"이라고 동의할 수 있는 것에 중점을 두고 있다. 그것은 바로 개인의 우수성, 역할 이해, 명확한 리더십 및 환자 중심성. 그럼 왜 이것을 "미신"라고 불러야 할까요? 왜냐하면 선의 핵심에도 불구하고, 그것들은 팀이 어떻게 일하는지에 대한 잘못된 믿음이기 때문입니다. 사실, 이 미신은 너무 단순해서 위험하다.

Each of these myths centers on something we would all agree is a “good”: individual excellence, role understanding, clear leadership, and patient centeredness. Why, then, do I call them “myths?” Because, notwithstanding the kernels of good, they are false beliefs about how teams work. In fact, I would argue that they are dangerous oversimplifications.

  • 첫 번째 신화는 - 우리가 각자 맡은 일을 제대로 했다면 - 이라는 말은 [협소한 개인주의]이다. 그것은 능력의 개별적인 차원을 반영하고 위에서 설명한 집단적 차원을 무시한다. 
  • 두 번째는, 만약 우리가 서로의 역할을 이해했다면, 이라는 말은 [고정적]이라는 문제가 있다. 이는 보건 전문가의 역할이 안정적이고 뚜렷하다는 것을 암시하는 반면, 팀워크에 대한 민족학 연구는 역할이 유동적이고 중복될 수 있다는 것을 입증했다.
  • 세 번째는, 만약 우리가 분명한 리더십을 가지고 있다면, 이라는 말은 [낭만적으로 향수를 불러일으키는 것]이다. 그것은 의사들이 의료 서비스 제공의 "리더"였던 시대로 거슬러 올라가지만, 최근의 연구는 의료 팀에서의 리더십은 복잡한 협상이며 "가장 책임 있는 의사"는 명확하게 식별되지 않을 수 있다고 주장한다.
  • 네 번째는, 우리 모두가 환자에게만 초점을 맞춘다면, 이라는 말은 [천진난만한 이상주의]입니다. 나는 환자 중심주의를 공유된 핵심 가치로 반대하는 것이 아니다. 그러나 의료 팀워크는 종종 경쟁적인 많은 동기들에 의해 형성됩니다.
    • 적시에 환자 치료를 제공하려는 욕구,
    • 부족한 자원을 보존해야 하는 필요성,
    • 환자 안전을 보장해야 하는 요구 사항,
    • 교육생이 자신의 기술을 연습할 수 있도록 해야 하는 의무  
      • ...등 모든 것이 팀이 임상 상황의 진화에 따라 협상하고 우선순위를 다시 정해야 하는 정당한 동기이다. 그리고 의료팀의 개인들은 이러한 동기를 다르게 해석하고 제정할 수 있다.

 

  • The first myth—if we each did our job properly—is narrowly individualistic. It reflects the individual dimensions of competence and ignores the collective dimensions described above.
  • The second—if we understood each other's roles—is problematically static. It implies that health professional roles are stable and distinct, while ethnographic studies of teamwork have demonstrated that roles can be fluid and overlapping.8 
  • The third—if we had clear leadership—is romantically nostalgic. It harkens back to a time when physicians were the unchallenged “leaders” of health care delivery, but recent research argues that leadership on health care teams is a complex negotiation9 and the “most responsible physician” may not be clearly identifiable.4 
  • And the fourth—if we all just focused on the patient—is naively idealistic. I am not arguing against patient-centeredness as a shared, core value. But health care teamwork is shaped by many, and often competing, motivations. The desire to provide timely patient care, the need to conserve scarce resources, the requirement to ensure patient safety, the mandate to allow trainees to practice their skills—all are legitimate motivations that teams must negotiate and reprioritize as a clinical situation evolves. And individuals in the health care team may interpret and enact these motivations differently.10,11

이러한 신화는 의도하지 않은 방법으로 보건 전문가 교육에 영향을 미칠 수 있다. 예를 들어, 전문가 간 협업 및 전문가 간 교육(IPE)을 지원하기 위해 강력한 프레임워크가 개발되었지만, 제한된 교육 시간과 참여로 인해 이러한 프레임워크는 종종 단순화된 방식으로 구현된다. 이 경우, 강력한 모델은 "팀에서 전문적인 역할을 이해하는" 학습 목표로 축소될 수 있습니다. 역할에 대해 배우는 것이 중요하지만, 연구 결과 역할이 종종 유동적이고 중복되는 것으로 나타남에도, 이같은 접근법은 보건 전문가 역할이 실제로 안정적이고 뚜렷하다는 암묵적인 메시지를 전달할 수 있다. 임상 전 IPE 커리큘럼은 [역할을 명확하게 설명하는] "기본" 시나리오[역할 유동성과 모호성을 설명하여 인위적으로 구분하지 않게 하는] "고급" 시나리오를 모두 제시하여 의도하지 않은 메시지로부터 보호할 수 있다. 학생과 전문가를 위한 실무 기반 IPE 이니셔티브는 실제 임상 상황에서 의료 제공자와 환자 간의 역할 복잡성과 역할 교차점을 가르치는 강력한 방법이 될 수 있다.
These myths can influence health professional education in unintended ways. For instance, while robust frameworks have been developed to support interprofessional collaboration and interprofessional education (IPE),12 these are often implemented in simplified ways due to limited curricular time and engagement. When this happens, the robust model can be reduced to the learning objective to “understand professional roles on the team.” While learning about roles is important, this approach can send the implicit message that health professional roles are stable and distinct in practice, when research has shown that roles are often fluid and overlapping.4 Preclinical IPE curricula can guard against this unintended message by presenting both “basic” scenarios that illustrate roles distinctly and more “advanced” scenarios that trouble artificial distinctions by illustrating role fluidity and ambiguity. Practice-based IPE initiatives, for students and for experts, may also be a powerful way to teach both role complexity and role intersection among health care providers and patients in real clinical situations.13

우리가 북미에서 역량 기반 의학교육으로 전환함에 따라, 우리는 이러한 신화가 그러한 노력에 미치는 영향에도 주의를 기울여야 한다. 예를 들어, 리더십은 지속적인 전문 개발 환경에서처럼 대학원 교육을 위한 역량 프레임워크에서 두드러지게 나타납니다. 리더십도 중요하지만 연구 결과에서 알 수 있듯이 팀 협업과의 관계는 복잡하다. 만약 이 미묘한 관계가 주의 깊게 지켜지지 않는다면, 우리는 "강한 리더십"이 팀워크를 해치는 만병통치약이라는 신화를 영속시킬 위험이 있다. "강력한 리더십"이 수반하는 것은 임상적 맥락에 따라 달라질 것이지만, 기존의 지식은 주로 "행동팀action teams"이라 불리는 것을 작업하는 중환자 치료, 외과, 소생 및 외상 팀에서 파생된다. 이러한 지식을 오늘날의 만성적이고 복잡한 질병 시대에 더 분산된 팀의 리더십의 특성에 비판적으로 적응시키기 위해 주의를 기울여야 한다. 행동 팀에서 효과적인 것으로 밝혀진 [지시적 또는 적응적 리더십]과 같은 전략은, "리더"가 팀에서 덜 안정적이고 가시적인 실체entity가 될 수 있는 [만성적인 치료 상황]에서 효과적이려면 신중한 번역translation을 요구할 수 있다.
As we shift to competency-based medical education in North America, we must also attend to the influence of these myths on those efforts. For instance, leadership features prominently in competency frameworks for postgraduate training14 as it does in the continuing professional development landscape.15 Leadership is important, but it is in complex relation to team collaboration, as research has shown.5 If this nuanced relation is not carefully attended to, we risk perpetuating the myth that “strong leadership” is the panacea for what ails teamwork. What “strong leadership” entails will vary according to clinical context, yet existing knowledge is derived largely from critical care, surgical, resuscitation and trauma teams, whose members work on what are called “action teams,” collocated space and time.16 Care must be taken to critically adapt such knowledge to the nature of leadership on more distributed teams in today's chronic, complex disease era.17,18 Strategies such as directive or adaptive leadership, found to be effective in action teams,16 may require careful translation to be effective in chronic care contexts where “leader” may be a less stable, visible entity on the team.

이러한 진실과 신화는 우리의 가정이 의료 팀워크의 복잡한 현실과 맞지 않을 수 있는 곳으로 우리의 관심을 끈다. 이러한 가정에 대한 비판적 탐구는 개인과 집단적 역량을 인식하고 촉진하는 교육 관행에 더 가까이 다가갈 것이다.

These truths and myths draw our attention to places where our assumptions may not fit the complex realities of health care teamwork. Critical exploration of these assumptions will bring us closer to educational practices that recognize and promote both individual and collective competence.

 


J Contin Educ Health Prof. Summer 2016;36 Suppl 1:S19-21. doi: 10.1097/CEH.0000000000000078.

Paradoxical Truths and Persistent Myths: Reframing the Team Competence Conversation

Affiliations collapse

Affiliation

1Dr. Lingard: Director, Centre for Education Research and Innovation Professor, Department of Medicine, Schulich School of Medicine and Dentistry, University of Western Ontario, London, Ontario, Canada.

PMID: 27584064

DOI: 10.1097/CEH.0000000000000078

Abstract

Medicine has conventionally had an individualist orientation to competence. Individual competence is conceptualized as a stable possession that, once acquired, holds across contexts. Individual competence is necessary; however, it is insufficient for quality health care. We also need to attend to collective competence in order to grapple with paradoxical truths about teamwork, such as: competent individuals can form incompetent teams. Collective competence is conceptualized as a distributed capacity of a system, an evolving, relational phenomenon that emerges from the resources and constraints of particular contexts. This article outlines a set of paradoxical truths about teamwork in health care and uses the concept of collective competence to explain how they can hold true. It then considers a set of persistent myths about teamwork which have their roots in an individualist orientation, exploring how they hold us back from meaningful change in how we educate for, and practice as, health care teams. Finally, the article briefly considers the implications of these truths and myths for educational issues such as interprofessional education and competency-based health professional education.

성찰은 비누와 같은 것인가? 의학교육연구에서 성찰에 대한 비판적 엄브렐라 리뷰(Adv Health Sci Educ Theory Pract. 2022)
Is reflection like soap? a critical narrative umbrella review of approaches to reflection in medical education research
Sven P. C. Schaepkens1 · M. Veen1 · A. de la Croix2

 

서론
Introduction

성찰의 개념은 유능한 전문가가 되기 위해 무엇이 중요한지에 대한 새로운 통찰력을 바탕으로 의학 교육에 들어갔다(Sandars, 2009). 많은 학부 및 전문 의료 교육 프로그램에는 의료 교육생들이 유능한 전문 인력으로 발전할 수 있도록 돕는 성찰이 포함되어 있다. 또한 학습에 대한 다양한 이론은 모델에 성찰을 통합하는데, 그 중 콜브의 경험적 학습이 두드러진 예이다(Caty et al., 2015; Coffield et al., 2004; Roessger, 2014). 의학교육에 대한 성찰 연구의 주된 목적은 실천과 실천자를 지원하는 것이다. 그럼에도 불구하고 이론과 실제 사이에는 긴장감이 존재한다(van Enk & Regehr, 2018).
The concept of reflection entered medical education based on new insights about what matters for becoming a competent professional (Sandars, 2009). Many undergraduate and specialty medical education programs include reflection to help medical trainees develop into competent professionals. Additionally, various theories about learning integrate reflection in their models, of which Kolb’s experiential learning is a prominent example (Caty et al., 2015; Coffield et al., 2004; Roessger, 2014). The main purpose of research on reflection in medical education is to support practice and its practitioners. Nonetheless, there is tension between theory and practice (van Enk & Regehr, 2018).

전문성으로 가는 성찰적 길reflective path은 비누처럼 미끄럽다. 성찰은 이론적으로 통일된 개념이 결여된 복잡한 현상이다. 반사에 대한 경험적 연구는 다양한 방법론적 접근 방식을 보여준다(Fragkos, 2016; Mann et al., 2007). 일부는 이것이 "반성 자체의 복잡성, 합의의 결여, 그리고 교육자들의 반성과정에 대한 이해의 다양성" 때문이라고 제안한다(Uygur et al., 2019, 페이지 13). 현재 존재하는 다수의 정의와 반사 모델은 "반사의 다중 의미 발생"에 기여한다(Nguyen et al., 2014, 페이지 1184; Chapey et al., 2012; Koole et al., 2011; Marshall, 2019; Roessger, 2014).
The reflective path towards professionalism is slippery like soap. Reflection is a complex phenomenon that lacks a theoretically unified concept. Empirical research on reflection shows a wide variety of methodological approaches (Fragkos, 2016; Mann et al., 2007). Some suggest that this is “due to the complexity of reflection itself, lack of consensus, and variability in educators’ understanding of the reflective process” (Uygur et al., 2019, p. 13). The multitude of definitions and models of reflection that currently exist contribute “to the accrual of multiple meanings of reflection” (Nguyen et al., 2014, p. 1184; Chaffey et al., 2012; Koole et al., 2011; Marshall, 2019; Roessger, 2014).

근본적인 과학적 문제는 유추analogy로 포착할 수 있다.

  • 만약 어른들에게 비누를 정의하라고 한다면, 그들은 비누가 기름, 잿물, 물, 그리고 향기로 구성되어 있다고 대답할 것이다.
  • 만약 우리가 아이에게 같은 질문을 한다면, 그녀는 더러운 손을 닦는 것은 미끄러운 것이라고 말할 수 있습니다.
  • 세 번째 대답은 Francis Pongge의 Soap처럼 그것이 개구리와 물고기처럼 행동한다는 시적인 것일 수 있다. (Pongge, 2015)
  • 화학자는 C17H35COO- + Na + 또는 K +로 응답한다(Brenntag, 2021).

다음 중 비누의 본질을 포착한 것은 무엇인가? 화학자의 정의가 아이의 정의보다 더 근본적인가? 아니면 다 합칠까요? 간단히 말해서, 어떤 제형이 비누에 대한 우리의 이해를 통합시키는가?
The underlying scientific problem can be captured in an analogy.

  • If we ask adults to define soap, they might reply that soap consists of oil, lye, water and fragrance.
  • If we ask a child the same question, she could say that it is a slippery thing that cleans dirty hands.
  • A third reply might be poetic, like Francis Ponge’s Soap, that it behaves like a frog and a fish (Ponge, 2015).
  • A chemist replies with C17H35COO- plus Na + or K + (Brenntag, 2021).

Which of these descriptions captures the essence of soap? Is the chemist’s definition more fundamental than the child’s? Or should we combine them all? In short, what formulation unifies our understanding of soap?

의학 교육 연구는 종종 [정확한 예측과 '개념적 우아함'을 지닌 이론의 생성]이라는 [과학적 이상]을 위해 노력한다(van Enk & Regehr, 2018). 그러나 성찰이 복잡한 관행이고, 비누처럼 동작하는 경우, 광범위한 설명을 지원할 수 있다. 바로 그 본성으로 인해 [예측가능성과 개념적 우아함]이 동일시되는 [과학적 엄격함]의 이상에 저항할 수 있다. (하이데거, 2002) 의학교육에 성찰과 같은 개념이 중요할 때, 우리가 그것을 과학적으로 측정하거나 평가할 수 있다는 것은 자동적으로 뒤따르지 않는다. (Veen & Cianciolo, 2020) 이것은 의학 교육에 대한 성찰에 대한 연구에 무엇을 의미합니까?
Medical education research often strives for the scientific ideal of producing theory that can predict accurately and has ‘conceptual elegance’ (van Enk & Regehr, 2018). However, if reflection is a complex practice and behaves like soap, it might support a wide range of descriptions. Its very nature might resist the ideal of scientific rigor that equates to predictability and conceptual elegance (Heidegger, 2002). When a concept like reflection is important for medical education, it does not automatically follow that we can scientifically measure or assess it (Veen & Cianciolo, 2020). What does this imply for research on reflection in medical education?

[회의론자들]은 성찰을 연구하는 것은 겸손함을 필요로 한다고 주장할 수 있다. 왜냐하면 그것은 인간으로서 매우 기본적이기 때문이다. 이 개념은 "너무 크고, 너무 일반적이고, 모호하며, 효과적인 실제 적용에 적합하지 않다"입니다(Cornford, 2002, 페이지 226). 한편, 회의론자들과는 달리, 우리는 개념을 운용하는 다른 방법이 연구에 어떻게 영향을 미치는지 이해한다면 성찰에 대한 의학 교육 연구가 합리적이라고 주장한다. 이를 위해서는 한 걸음 물러서서, 의학교육 연구가 어떻게 하면 개념적, 방법론적 무결성을 잃지 않고 성찰적 실천에 정의를 내릴 수 있는지 명확히 해야 한다.
A skeptic could argue that researching reflection requires modesty because it is so fundamental to being human. The concept is “just too big, that is, too general and vague, for effective, real world application” (Cornford, 2002, p. 226). Contrary to such skeptics, we argue that medical education research on reflection is sensible, provided we understand how different ways of operationalizing the concept affect the research. This requires us to take a step back, and clarify how medical education research can do justice to reflective practice without losing its conceptual and methodological integrity.

본 연구에서는 성찰의 개념 자체에 대한 이질적인 이해로 인해 어려움을 겪고 있는 성찰에 대한 학술적 논쟁에 대한 철학적 분석을 수행한다. 우리는 미래의 개념 개발이 어떻게 형성될 수 있는지에 대한 제안을 제공하는 것을 목표로 한다(Grant & Booth, 2009). 따라서 우리는 '성찰을 개념화하고 조작화하기 위하여 가능한 과학적 접근법은 무엇이며, 이러한 접근법이 실제로 성찰에 대한 지식 생산에 어떻게 영향을 미치는가?'라는 질문을 다룬다.
In this study, we conduct a philosophical analysis of the scholarly debate on reflection, which is challenged by its heterogeneous understanding of the concept of reflection itself. We aim to provide suggestions on how future conceptual development can take shape (Grant & Booth, 2009). Therefore, we address the questions, ‘what are the possible scientific approaches to conceptualizing and operationalizing reflection, and how do these influence knowledge production on reflection in practice?’.

방법들
Methods

연구설계
Study design

우리는 반사에 대한 연구에 대한 비판적인 서술적 우산 검토를 수행했다(Ng et al., 2015). 이는 리뷰의 검토였으며, 이전 작업을 '재고'하고 평가하기 위한 분석이 포함되었다(Grant & Booth, 2009). 우리는 많은 체계적인 검토가 이미 개념적 합의를 도출하지 않고 수행되었기 때문에 이 비체계적인 검토를 선택했다.

We conducted a critical narrative umbrella review of research on reflection (Ng et al., 2015). This was a review of reviews, and included an analysis to ‘take stock’ and evaluate the previous body of work (Grant & Booth, 2009). We opted for this non-systematic review since many systematic reviews have already been performed without resulting in conceptual consensus.

데이터 수집
Data collection

우리는 체계적 검토에서 영어로 된 서술적 검토에 이르기까지 가장 넓은 의미의 반사에 대한 연구 리뷰를 분석했다. SS는 2000년부터 2020년 7월 6일까지 데이터베이스, 웹메디드, 과학, 출판에 이어 2020년 7월 6일까지 검색 문자열('반사' 또는 '리플렉스'), '리플렉스' 및 '리플렉스' 및 '리플렉스' 및 '리플렉스'로 검색을 수행했다. 본 연구에 포함할 수 있는 검토는 의료 교육 및/또는 의료 보건 직업에 대한 (의 특정 측면) 반영에 대한 경험적 연구를 보고해야 하거나, 또는 그들의 규율 초점과 관계없이, 반사 개념에 대한 상당한 이론적 토론을 제공해야 한다(브라운 외, 2019). 반성에 대한 학제간 이론적 논의를 다룰 때 교원교육 분야 등 의학교육 이외의 분야의 리뷰를 포함했다. 우리는 비의학 교육 맥락에서 성찰에 대한 경험적 연구만을 다룬 연구를 제외했다. 이러한 내부 및 제외 기준은 우리가 분석한 47개의 기사를 낳았다(cf. references with *).
We analyzed reviews of research on reflection in the broadest sense, ranging from systematic to narrative reviews in English. SS conducted a search with the search string (‘REFLECTION’ OR ‘REFLEXIVE’) AND (‘REVIEW’), and (‘REFLECTION’ OR ‘REFLEXIVE’) AND (‘SYSTEMATIC REVIEW’ OR ‘LITERATURE REVIEW’ OR ‘NARRATIVE REVIEW’ OR ‘CRITICAL REVIEW’) from 2000 until 6 July 2020 in the following databases: EMBASE, PubMed, Scopus, and Web of Science. Reviews eligible for inclusion in this study either had to report empirical research on (certain aspects of) reflection in medical education and/or medical health professions, or alternatively, regardless of their disciplinary focus, provide a substantial theoretical discussion on the concept of reflection (Brown et al., 2019). We included reviews from fields other than medical education, such as the teacher education field, when they dealt with cross-disciplinary theoretical discussions on reflection. We excluded studies that solely dealt with empirical research on reflection in non-medical education contexts. These in- and exclusion criteria resulted in 47 articles that we analyzed (cf. references with *).

분석.
Analysis

종종 검토의 목적은 경험적 데이터를 수집하고 평가하거나 모델 또는 이론적 프레임워크의 현상에 대한 문헌을 합성하는 것이다. 그러나 우리 연구의 경우, 검토 자체에서 연구와 합성된 프레임워크에 대한 평가가 철학적 분석의 대상이었다. [철학]은 넓은 분야이지만, 우리는 그것을 "이론 구성의 더 넓은 과정을 분석하고 이해하고, 그것의 숨겨진 배경 전제에 의문을 제기하고, 인간의 관행에 영향을 미치는 (…) 가치를 밝히고 조사하는 데 특화된 학문 분야"로 이해한다(Ruitenberg, 2009, 페이지 325; Holma, 2009). 철학은 어떤 접근법이 적절한지 즉시 명확하지 않기 때문에 성찰에 대한 다른 이론적 방향을 식별하고 그들 사이에서의 "브로커 또는 협상가 역할"을 도울 수 있다. (Veen & Cianciolo, 2020, 페이지 5).

Often, the purpose of reviews is to pool and assess empirical data, or synthesize literature about a phenomenon in a model or theoretical framework. For our study, however, the assessment of research and synthesized frameworks in the reviews themselves were the object of philosophical analysis. Philosophy is a broad field, but we understand it as “an academic discipline specialized in analyzing and understanding the wider processes of the constructing of theories, questioning their hidden background premises, and revealing and examining the values affecting (…) human practices” (Ruitenberg, 2009, p. 325; Holma, 2009). Philosophy can help identify different theoretical orientations on reflection, and “act as a broker or negotiator” between them, because it is not immediately obvious which approach is appropriate (Veen & Cianciolo, 2020, p. 5).

우리는 리뷰를 뒷받침하는 기초적인 철학적 연구와 그들의 성찰 연구에 대한 평가를 대조하여 성찰 연구에 대한 문헌 리뷰를 분석했다. 이 연구에서, 우리는 트렌드가 무엇인지 설명하는 것이 아니라, 연구가 어떻게 성찰의 이론적 토대와 일치하여 성찰에 대한 과학적 지식을 생산하는지 분석한다. 이 연구에서 기초 문헌을 사용하는 것은 '주관론 렌즈'와 같은 기능을 한다(Varpio et al., 2020). 렌즈는 개념적 문제를 강조하기 위한 분석 병렬 배치에 중요한 분야의 주요 경향을 인식하는 데 도움이 된다(Biesta, 2009; Davis, 2009).

We analyzed literature reviews on reflection research by contrasting the foundational philosophical work that underpins the reviews with their assessments of reflection research. In this study, we do not describe what the trends are, but analyze how research produces scientific knowledge on reflection in alignment with reflection’s theoretical underpinnings. Using the foundational literature in this study functions like a ‘subjectivist lens’ (Varpio et al., 2020). The lens helps us recognize the field’s main tendencies that are valuable for analytical juxtaposition to highlight conceptual problems (Biesta, 2009; Davis, 2009).

결과.
Results

우리는 이제 [성찰 연구에 대한 두 가지 뚜렷한 접근 방식]을 먼저 설명함으로써 분석 결과를 제시한다. 그런 다음 각 접근 방식을 더 자세히 설명하고, 분석 렌즈를 기반으로 각 접근 방식이 서로 어떻게 관련되어 있는지 논의하고, 추가 권장 사항을 제공한다.
We now present the results of our analysis by first describing the two distinct approaches to reflection research. We then describe each approach in more detail, discuss how they relate to each other based on our analytical lens, and provide further recommendations.

두 가지 접근 방식
Two approaches

우리는 성찰의 '퍼지 개념'을 연구하는 두 가지 주요 접근법을 구분했다.

  • 첫 번째 접근법은 [개념적 모호성을 해소하는 것]을 목표로 한다(Nguyen et al., 2014). 이 접근 방식은 이론과 반사에 대한 경험적 연구 사이에 통합된 개념적 토대가 절실한 필요성을 보여준다(Koole et al., 2011; Kuiper & Pesut, 2004; Kurt, 2018; Marshall, 2019; Nguyen et al., 2014). 대조적으로,
  • 두 번째 접근법은 성찰의 모든 개념을 포함하는 모호성을 해소하는 것을 목표로 하지 않는다. 대신 [성찰에 대한 이질적인 이해]를 성찰에 대한 연구가 갖춰야 할 [필수적인 특질vital quality]로 통합한다(Mantzoukas, 2008; Ng, 2012; Ng 등, 2015; Ng 등, 2015; Norrie 등, 2012; Platt, 2014; Ven 등, 2018).

We distinguished two main approaches to studying the ‘fuzzy concept’ of reflection.

  • The first approach aims to dissolve conceptual ambiguity (Nguyen et al., 2014). This approach portrays a pressing need for unified conceptual ground between theories and empirical studies on reflection (Koole et al., 2011; Kuiper & Pesut, 2004; Kurt, 2018; Marshall, 2019; Nguyen et al., 2014).
  • The second approach, in contrast, does not aim at dissolving ambiguity with an all-encompassing concept of reflection; instead, it incorporates the heterogeneous understanding of reflection as a vital quality in research on reflection (Mantzoukas, 2008; Ng, 2012; Ng et al., 2015; Norrie et al., 2012; Platt, 2014; van Beveren et al., 2018).

검토된 연구는 이 분야에서 영향력 있는 하버마스나 콜바와 같은 다양한 학자들을 언급하지만, 분명히 대다수는 듀이 및 쇤의 연구를 근간으로 언급하고 있다(얼랜슨 & 비치, 2008; 펜들러, 2003; 프래그코스, 2016; 쿨 외, 2011; 미라글리아, 2015; 리처드 외, 2018; 반, 2018). 듀이와 쇤의 연구는 성찰 연구에 대한 두 가지 접근방식을 뒷받침한다. 비록 쇤이 듀이에 비판적으로 반응하지만, 그들 사이에는 뚜렷한 공통점이 있다. 성찰에 대한 연구를 통해, 그들은 [이론과 실제 사이의 관계를 재고]하고, [실천을 무대의 중심]에 둔다(Erlandson & Beach, 2008; Farrell, 2012). 일부 연구는 듀이와 쇤이 얼마나 성공했는지에 대해 의문을 제기한다. 그럼에도 불구하고, 그들의 반성에 대한 연구는 이 논의의 중추적인 지점을 나타낸다(Hébert, 2015; Newman, 1999). 따라서 철학적 분석에서 우리의 '움직임'은 듀이와 쇤의 사상을 우리의 분석 렌즈로 채택하는 것이었다. 그들의 연구에서 우리는 이론-실천 논쟁과 일치하는 기술자적 rationale역동성적 rationale의 특징을 도출했다. 우리는 이 두 가지 이유를 성찰에 대한 현대 과학 지식 생산에 적용했다. 
The reviewed studies mention various scholars such as Habermas or Kolb as influential in this field, but a clear majority refer to the work of Dewey and/or Schön as foundational (Erlandson & Beach, 2008; Fendler, 2003; Fragkos, 2016; Koole et al., 2011; Miraglia, 2015; Ng et al., 2015; Richard et al., 2019; van Beveren et al., 2018). Dewey’s and Schön’s work underpin both approaches to studying reflection. Although Schön responds critically to Dewey, there is a distinct commonality between them. With their study of reflection, they rethink the relation between theory and practice, and grant practice center stage (Erlandson & Beach, 2008; Farrell, 2012). Some studies question how far Dewey and Schön succeed; nevertheless, their work on reflection marks a pivotal point in this discussion (Hébert, 2015; Newman, 1999). Our ‘move’ in the philosophical analysis was, therefore, to adopt Dewey’s and Schön’s ideas as our analytical lens. From their work, we drew the qualities of a technicist and a dynamic rationale, that tie in with the theory–practice debate. We applied these two rationales to the contemporary scientific knowledge production on reflection. 


우리가 [기술자]라는 용어를 사용하는 것은, 쇤이 '기술적 합리성'이라고 설명한 것에서 비롯됩니다(킨셀라, 2007; 쇤, 1983). [기술자]는 [전문적 문제]가 명확히 구분된 다음, [이론과 기술을 엄격하게 적용함]으로써 문제를 해결함을 나타낸다. '적용applying'은 규범적 위계질서를 의미하며, 여기서 "일반 원칙은 가장 높은 수준을 차지하고, 가장 낮은 수준을 해결하는 구체적인 문제"를 의미한다(Schön, 1983, 페이지 24; Garison et al., 2012). 이론과 실제는 대부분 서로 분리된 것으로 인식되는데, 여기서 [이론]은 [현실의 혼돈에 질서를 가져다주는 체계적인 도구]이다. (킨셀라, 2007) 듀이와 쇤은 모두 합리성실천 사이의 이 이원론에 도전한다(Garrison et al., 2012).

Our use of the term technicist stems from what Schön describes as ‘Technical Rationality’ (Kinsella, 2007; Schön, 1983). Technicist indicates that professional problems are clearly demarcated and then solved by rigorously applying (scientific) theory and techniques in practice. ‘Applying’ implies a normative hierarchy, wherein “general principles occupy the highest level and concrete problem solving the lowest” (Schön, 1983, p. 24; Garrison et al., 2012). Theory and practice are mostly perceived as separated from each other, wherein theory is the systematic instrument bringing order to reality’s chaos (Kinsella, 2007). Both Dewey and Schön challenge this dualism between rationality and practice (Garrison et al., 2012).

우리가 [역동적dynamic] 이라는 용어를 사용하는 것은 듀이와 쇤이 [경험과 실습]을 제공한다는 설명에서 비롯된다. [실천 속의 문제]들이 [칼로 나누듯 구분되는 것이 아니라 상호 연관되어 있다는 점]에서, 그것들은 역동적이다. 실천은 혼란스럽고 혼란스러우며, 실천을 불확정상태로 만드는 규범적 긴장, 무질서 및 갈등으로 가득 차 있다(킨셀라, 2007; Ng et al., 2020; 쇤, 1983). 게다가, "시간이 지남에 따라 경험에서 합리성이 나타난다" (Garrison et al., 2012, 페이지 42). 논리logic는 변하지 않고 맥락에 무관심한 반면, 사고는 항상 "어떤 맥락에 대한 참조"를 가지고 있기 때문에 (사고는) 계속해서 변화하는 과정이다. (Dewey, 1933, 페이지 72) 다음 섹션에서는 두 가지 접근 방식에 대해 자세히 설명합니다. 
Our use of the term dynamic originates with the description that Dewey and Schön give of experience and practice. They are dynamic, in the sense that problems in practice are not clear-cut but interconnected. Practice is messy, turbulent, filled with normative tensions, disorder, and conflict which make practice indeterminate (Kinsella, 2007; Ng et al., 2020; Schön, 1983). Furthermore, “rationality emerges over time in experience” (Garrison et al., 2012, p. 42). Whereas logic is unchanging and indifferent to context, “thinking is a process” that continuously changes because thinking always “has reference to some context” (Dewey, 1933, p. 72). In the next section, we will discuss the two approaches in detail.

성찰에 대한 기술자적 접근 방식
The technicist approach to reflection

의학교육 연구 분야에 걸친 학문은 성찰이 복잡한 현상임을 강조한다. 성찰은 교육생이 켜거나 끌 수 있는 스위치처럼 단일하고 1차원으로 보이지 않는다. 대신, 성찰은 시간이 지남에 따라 발생하는 연속체를 따라 움직인다(Koole et al., 2011; Marshall, 2019; Nguyen et al., 2014; Uygur et al., 2019). 이러한 해석은 [성찰적 실천]이 [명확한 순서가 없다는 것]을 인정하기 때문에, 성찰에 대한 [역동적 해석]과 잘 일치한다. 그럼에도 불구하고, 더 자세히 살펴보면, [성찰이 복잡하다고 주장하는 연구]는 여전히 특정 기술자 연구 문제와 방법론적 해결책으로 이어지는 기술자적 전제를 지지하고 있다.
Scholarship across the field of medical education research emphasizes that reflection is a complex phenomenon. Reflection is not seen as monolithic and one-dimensional like a switch that trainees can turn on or off. Instead, reflection moves along a continuum that happens over time (Koole et al., 2011; Marshall, 2019; Nguyen et al., 2014; Uygur et al., 2019). Such interpretations align well with a dynamic interpretation of reflection because it acknowledges that reflective practice has no clear-cut order. Nonetheless, upon closer scrutiny, studies that claim reflection is complex can still uphold technicist presuppositions that lead to particular technicist research problems and methodological solutions.


많은 리뷰는 성찰을 연구하는 데 사용되는 [광범위한 방법론이 문제가 있다]고 결론짓는다. 그들은 다수의 프레임워크가 사용되고 있기 때문에 성찰의 효과를 정량화하고 측정하기 어렵다고 주장한다. 강력한 증거를 수집하기 위한 교차 비교 연구 결과는 제한된 결과를 산출한다(Anderson et al., 2019; Bjerkik & Hilli, 2019; Buckley et al., 2009; Chen & Forbes, 2014; Choperena et al., 2019; Contreras et al., 2020; Mann et al., 2007; 2015; Roess Gurel, 2014; 2014; 2014; 2014). [성찰의 정의]에 대한 지속적인 이론적 불일치는 타당성과 증거 기반 관행에 해로운 것으로 인식된다(Marshall, 2019). (성찰의 정의에 대한) 합의의 부재는 "[반성]을 가장 잘 육성하는 방법에 대한 상당한 불확실성"을 영속화 시키거나, 성찰이 효과적인지 알 수 없게 한다(Roessger, 2014; Winkel et al., 2017). 따라서, "더 명확한 성과를 가진, 보다 명확한 성찰의 구조는 학생들의 진도progress를 추적하거나, 연구 성과를 측정하는 데 유용한 벤치마크를 개발할 수 있다." (Chaffey et al., 2012, 페이지 202).

Many reviews conclude that the wide range of methodologies used to study reflection is problematic. They claim that effects of reflection are difficult to quantify and measure because multiple frameworks are in use. Cross-comparing research outcomes to harvest strong evidence yields limited results (Anderson et al., 2019; Bjerkvik & Hilli, 2019; Buckley et al., 2009; Chen & Forbes, 2014; Choperena et al., 2019; Contreras et al., 2020; Mann et al., 2007; McGillivray et al, 2015; Roessger, 2014; Uygur et al., 2019; Winkel et al., 2017). Ongoing theoretical disagreement over the definition of reflection is perceived as detrimental to validity and evidence-based practice (Marshall, 2019). The lack of consensus is seen as perpetuating “considerable uncertainty about how to best foster [reflection]” (Koole et al., 2011, p. 7), or prevents us from knowing if reflection is effective (Roessger, 2014; Winkel et al., 2017). Therefore, “a more defined construct of reflection, with clear outcomes, could lead to the development of benchmarks useful in tracking student progress and as research outcome measures” (Chaffey et al., 2012, p. 202).

[방법론적 과제]를 해결하기 위해, 기술자 지향의 연구는 모델과 정의에서 [성찰의 일반적인 특성을 합성synthesize]한다. 그들은 개념을 검증하는 합의를 도출하기 위해 "성찰에 대한 포괄적이면서도 정확한 이해"를 목표로 한다(Marshall, 2019, 페이지 397; Koole et al., 2011; Kuiper & Pesut, 2004; Nguyen et al., 2014). 연구는 일반적인 용어로 성찰을 정의하여, 개념을 자급자족하고 조작화가 용이하도록 외적 요소에 결합시키는 경향이 있다. "따라서 성찰은 맥락에 관계없이 보편적으로 적용 가능하고 이해할 수 있다." (응우옌 외, 2014, 페이지 1185) 다양한 리뷰는 개념적 양면성을 완화하기 위해 경계를 명확히 정의하는, 이러한 [체계화된, 비맥락화된 모델의 추구]를 환영한다(Uygur et al., 2019).
To address the methodological challenges, studies with a technicist orientation synthesize common traits of reflection in models and definitions. They aim for “a comprehensive yet precise understanding of reflection” to accrue consensus that validates the concept (Marshall, 2019, p. 397; Koole et al., 2011; Kuiper & Pesut, 2004; Nguyen et al., 2014). Research tends to define reflection in generic terms to make the concept self-contained and untied to extrinsic elements for easier operationalization. “Reflection thus remains universally applicable and understandable independent of context” (Nguyen et al., 2014, p. 1185). Various reviews welcome such pursuits of systematized, de-contextualized models that clearly demarcate boundaries to mitigate conceptual ambivalence (Uygur et al., 2019).

[기술자 지향]의 문헌고찰은 [개념의 명확성과 동질성]에 대한 교육의 필요성을 강조한다.

  • 첫째, [실용적인 지침과 검증된 평가 및 피드백 도구]를 찾는 커리큘럼 리더를 대상으로 합니다. 이러한 도구는 교육생이 필요한 기술, 지식 및 태도를 습득하고, 보다 집중적이고 구조적이며 효과적인 피드백을 제공하는지 여부를 보여준다(Chaffey et al., 2012; Kool et al., 2011; Nguyen et al., 2014). 또한 표준화된 모델과 도구는 교육자가 반영 결과를 균일하고 공정하게 평가하는 데 도움이 된다.
  • 둘째, 이 접근법은 훈련생들이 [숙달될 수 있는, 차원이 다른 특정 단계를 거치는 과정]으로서 [성찰에 대한 절차적 이해]를 얻는 데 도움이 된다.

Reviews with a technicist orientation stress the educational need for conceptual clarity and homogeneity. First, it caters to curriculum leaders who seek practical guidelines and validated assessment and feedback instruments. Such tools show whether trainees obtained the required skills, knowledge and attitudes and allow for more focused, structured and effective feedback (Chaffey et al., 2012; Koole et al., 2011; Nguyen et al., 2014). Moreover, standardized models and instruments help educators assess reflection outcomes uniformly and thus fairly. Second, this approach helps trainees gain a procedural understanding of reflection as a process that goes through certain phases with different dimensions that can be mastered.


앞서 언급한 [실천에 대한 이점]은 매우 큽니다. 그러나, 이 시점까지, 현장 자체는 효과를 정확하게 측정하거나 연구를 효과적으로 교차 비교하여 일반화할 수 있는 [증거를 생성하지 못한 체계적인 실패]를 인정한다. 기술적 관점에서, 해결책은 [과학적 표준화를 허용하는 개념적 동질성과 합의]에 있다. 따라서, 성찰의 문제는 복잡하지만, "좋은 이론만큼 실용적인 것이 없기 때문에" 시간이 지나면 성찰의 복잡성은 도구적으로 길들여질 수 있다. (응우옌 외, 2014, 페이지 1187) 좌절에도 불구하고, 성찰의 진실은 방법론적 엄격함, 정확한 모델 및 엄격한 정의에 기초한 사실을 참조하여 [궁극적으로 시험할 수 있는 것]으로 인식된다. (Schön, 1983)
The aforementioned benefits to practice are significant. However, up to this point, the field itself acknowledges its systematic failure to accurately measure effects or validly cross-compare studies to produce generalizable evidence. From the technical perspective, the solution lies with conceptual homogeneity and consensus that allows scientific standardization. Thus, the problem of reflection is complex, but in time its complexity can be instrumentally tamed because “there is nothing as practical as good theory” (Nguyen et al., 2014, p. 1187). Despite setbacks, the truth of reflection is ultimately perceived as testable in reference to the facts based on methodological rigor, accurate models and strict definitions (Schön, 1983).

성찰에 대한 동적 접근
The dynamic approach to reflection

[기술자 중심의 연구]처럼, 성찰 연구에 [역동적 접근 방식을 채택하는 연구]도 성찰의 복잡성을 강조한다. 그러나 기술주의자들의 연구와는 달리, 그들은 이론적으로 [실천의 지저분한 본성에 중점]을 두고, 이것을 [개념적 합의와 보편적인 정의]보다 우선시한다. "실천은 불확실성, 불안정성, 고유성, 가치 충돌로 특징지어지며, (…) 여기서 실천의 중요한 질문이 논의된다." (킨셀라, 2009, 페이지 6; 만주카스, 2008; Ng et al., 2015) 따라서 성찰적 실천은 "[고정된 특질trait]으로서가 아니라, 개인의 경험과 지식의 원천에서 발생하는 [역동적 상태state]"이다(Ng et al., 2020, 페이지 6). 이러한 관점은 성찰이 [복잡]할 뿐만 아니라, 더 중요하게는 [개방적open]이라는 주장을 뒷받침한다. "다양한 사고 방식과 형태가 성찰로 간주될 수 있으며, 성찰을 가르친다는 것은 광범위한 교육적 가치와 목적의 다양성 덕분이다." (van Beveren et al., 2018, 페이지 7; Beauchamp, 2015) [반성적 실천에 대한 미묘한nuanced 관점]을 개발하는 것은 "'진짜' (…) 성찰을 촉진한다고 주장하는 단일한 솔루션"을 거부합니다(Platt, 2014, 페이지 50).

Like technicist oriented studies, those that adopt a dynamic approach to studying reflection also emphasize its complexity. Contrary to techniscist studies, however, they place theoretical emphasis on the messy nature of practice, and prioritize this over conceptual consensus and a universal definition. “Practice is characterized by uncertainty, instability, uniqueness, and value conflict, and (…) this is where the important questions of practice are negotiated” (Kinsella, 2009, p. 6; Mantzoukas, 2008; Ng et al., 2015). Reflective practice is thus “not as a fixed trait, but, rather, a dynamic state arising out of personal experience and sources of knowledge” (Ng et al., 2020, p. 6). This view supports the argument that reflection is not only complex, but more importantly, open. “Different practices and forms of thinking are considered reflective and the teaching of reflection is attributed to a broad diversity of educational values and purposes” (van Beveren et al., 2018, p. 7; Beauchamp, 2015). Developing a nuanced view on reflective practice rejects “a one-sized solution for facilitating ‘real’ (…) reflection” (Platt, 2014, p. 50).

성찰에 대한 다양한 견해는 현장에서 경험적으로 식별할 수 있다. 노리 외 연구진(2012)은 리뷰에서 의료 전문가들 간의 성찰 이해에 상당한 차이가 있다고 결론짓는다. "의료적 맥락에서 볼 때, 전문적 관행(…)을 개선하는 데 초점을 맞추고 있습니다. 대조적으로, 다른 전문직[예: 간호학]에서는, 반사적 실천이 각 집단의 자율적인 전문적 정체성을 주장하는 방법으로 더 접근된다." (노리 외, 2012, 페이지 573). 의료 분야의 연구는 [평가와 기술 습득에 중점]을 두고, [성과 지향적인 현실적이고 실용적인 접근 방식]을 선호하는 경향이 있다. 간호학은 [보다 가치 지향적이고 건설적인 접근법]을 채택한다. 이처럼 다양한 성찰 연구가 생산되는 것은 "전문직 내 역사와 전통뿐만 아니라, 국가적인 논쟁과 정책적 의무의 발전과도 관련이 있다" (Norrie et al., 2012, 페이지 574). 따라서 [역동적 접근법의 요점]은 [널리 채택된 성찰 이론을 하나의 중요한 객관적 개념으로 합성하는 것]이 아니라, [반성의 의미]는 자신의 전통과 역사를 가진 실천에서 비롯된, 전문적 가치에 단단히 자리잡고entrench] 있다. 성찰의 개념은 [보편적]이 아니라, [개방적이고 사회적으로 의존적contingent]이다(Beauchamp, 2015).

Divergent views on reflection are empirically identifiable across the field. In their review, Norrie et al. (2012) conclude that there are significant variations in understanding reflection between healthcare professions. “In the medical context, the focus is on improving professional practice (…). In contrast, in other professions [e.g. nursing], reflective practice is approached more as a way of asserting each group’s autonomous professional identity” (Norrie et al., 2012, p. 573). Research in the medical field tends to favor a realist and pragmatic approach that is outcome oriented, with an emphasis on assessment and skill acquisition. Nursing adopts a more constructivist approach that is value-oriented. This varied production of reflection literature “is related to the history and traditions within the professions as well as to evolving national debates and policy imperatives” (Norrie et al., 2012, p. 574). Thus, the point of dynamic approaches is not synthesizing widely adopted reflective theories into one overarching, objective concept; rather, the meaning of reflection is entrenched in professional values stemming from practice with its own traditions and history. The concept of reflection is not universal, but open and socially contingent (Beauchamp, 2015).

[역동적 접근법]은 [일반화가능한 증거의 재평가]를 제안한다. 예를 들어, 만주카스(Mantzoukas, 2008)는 성찰을 위한 증거 기반 관행의 황금 표준이 항상 RCT는 아니라고 주장한다. 반대로, 간호사들은 "성찰이 실천을 위한 유효한 증거를 제공할 수 있을 뿐만 아니라, 보다 실질적이고 유용하며 효과적인 증거를 제공할 수 있는 더 나은 위치에 그들을 배치할 수 있도록 허용한다"는 것을 깨닫게 된다(Mantzoukas, 2008, 페이지 221). 롤프는 "필요한 것은 [큰 수의 과학]이 아니라 [유일성unique의 과학]이다. (…)  간호 과학은 [개인에 대한 이론]이 필요하다"고 주장하는데, 이는 개인 실무자들로부터도 나올 수 있다. (롤프, 2006, 페이지 40)
Dynamic approaches suggest a revaluation of generalizable evidence. For instance, Mantzoukas (Mantzoukas, 2008) argues that the gold standard in Evidence Based Practice for reflection is not always a Randomized Control Trial. On the contrary, nurses “come to realize that reflection can provide not only valid evidences for practice, but possibly [allows them to be] positioned in a better place to provide more practical, useful and effective evidences” (Mantzoukas, 2008, p. 221). Rolfe argues that “what is required is not a science of large numbers, but a science of the unique. (…) [N]ursing science requires theories about individual persons,” that can also come from individual practitioners (Rolfe, 2006, p. 40).

[역동적 성찰]이라는 관점을 채택하는 학문의 중심 메시지는 "이 분야는 [성찰이 무엇인지, 성찰이 어떤 철학적 맥락에서 도출되는지, 그리고 현재 의학교육의 사회정치적 맥락에서 그 목적이 무엇인지]에 대한 [개념화를 확장하고, 이해를 심화시켜야] 한다"는 것이다(Ng et al., 2015, 페이지 469). [정확한 모델]을 가지고 성찰의 [개방성을 축소]시키는 대신, 다양한 실천에 의해 주입되는 [개방성을 수용]해야 한다. 또한, 맥락특이적인 사회-정치적 차원을 다루는 것이 논쟁을 불러일으키며, "의학 교육의 복잡한 과제에 대한 다양한 사고 방식"을 촉발한다(Ng et al., 2015, 페이지 469).
The central message of scholarship that adopts a dynamic view of reflection is that “the field must broaden its conceptualization and deepen its understanding of what reflection is, from what philosophical contexts it derives, and what its purposes in the current socio-political context of medical education can be” (Ng et al., 2015, p. 469). Instead of diminishing reflection’s openness with precise models, scholarship should embrace openness that is infused by divergent practices. Furthermore, addressing context-specific socio-political dimensions incites debate, instigating “multiple ways of thinking about complex challenges in medical education” (Ng et al., 2015, p. 469).

논의
Discussion

역설
A paradox

지금까지, 우리는 기술자적 렌즈와 역동적 렌즈의 접근법을 통해 내러티브로 성찰에 대한 연구를 구성했다. 이러한 접근 방식은 성찰의 복잡성을 해결하는 두 가지 다른 방법을 구현한다. 성찰 연구에 대한 [기술자 접근법]은 예를 들어 교육 개발자, 교육생 및 실무자에게 일반화되고 검증된 지침을 제공함으로써 [실무에 장점]이 있다. 그러나 이 장점은 [성찰의 개념에 대한 합의]에 기반하여, 이를 [견고한 경험적 검증]를 받게 한다. [역동적 관점]에서 이 합의는 여전히 (지나치게) 이상적이거나, 혹은 불가능한 것으로 남아있다. 두 위치에 대한 이해를 높이기 위해 기술자와 동적 접근 방식을 병치한다.

Thus far, we have organized the research on reflection in a narrative, perceived through the lens of technicist and dynamic approaches. These approaches embody two different ways of tackling reflection’s complexity. A technicist approach to studying reflection has merit for practice, for instance by offering generalized and validated guidelines for education developers, trainees and practitioners. However, this merit is based on a consensus on the concept of reflection in order to subject it to solid empirical testing. From the dynamic perspective, this consensus still remains an ideal (Williams et al., 2019)–or rather, an impossibility. To further our understanding of both positions, we juxtapose the technicist and dynamic approaches.

우리는 특히 연구가 언제 어디서든 개념이 기능하기를 원할 때, 우리는 성찰의 연구자들이 실천과 이론 사이의 상호적인 긴장과 씨름하는 것을 볼 수 있다. [기술자적 관점]에서, [성찰을 필수요소essence로 환원]시키는 [자기충족적self-contained 개념]은 어떤 맥락에서든 적용될 수 있다. [역동적 관점]에서, 그러한 환원주의적 정의는 '이중 구속'으로 끝날 수 있다(Ng et al., 2015). 즉, 자기충족적 개념은 필연적으로 무수한 대안을 배제하기 위해 [현상의 핵심 요소]를 일반화하지만, 그 과정에서 [전달하고자 하는 복잡성과 타협]하고 마는 것이다(Kinsella, 2009). "실제로 발생하는 많은 것들에 대해 사용하지 못하게 되는 단점"이 생긴다(Sacks, 1985, 페이지 25). [현실]이 [추상화된 처방]과 완전히 일치하는 경우는 드물기 때문이다.
We can see researchers of reflection struggle with a reciprocal tension between practice and theory, especially when research wants concepts to function anywhere, at any time and any place. From a technicist perspective, self-contained concepts that reduce reflection to its essence can be applied in any context. From a dynamic perspective, such reductionist definitions can end up in a ‘double bind’ (Ng et al., 2015): a self-contained concept that necessarily generalizes key components of the phenomenon to exclude alternatives, but in the process compromises the complexity which it wishes to convey (Kinsella, 2009). The disadvantage is that “many things that actually occur are debarred from use” (Sacks, 1985, p. 25). Conversely, reality rarely fully corresponds with abstracted prescriptions (Nofke & Brennan, 2005).

일반적으로 복잡한 개념은 이론과 실제 사이의 긴장을 보인다. 연구가 성찰와 같은 연구 대상을 [자기충족적 개념으로 공허하게 외삽]할 때 긴장이 겉으로 드러난다. 비트겐슈타인의 저작을 차용하여, 개념은 그 위치에 있는 사용에서 실질과 중요성을 얻는다(Newman, 1999; 비트겐슈타인, 1958).

  • 예를 들어, 'soap'은 손을 씻는다는 맥락 속에서 구체적인 의미를 얻는다.
  • 시인 Ponge와 이야기 하자면, 비누는 자연에서 발견된 어떤 돌과도 같지 않다. 그것은 물과 결혼한 후에 거의 무진장 여러분에게 주어집니다. (Ponge, 2015)
  • 비누는 순수하게 화학적 맥락에서 친수성이며 소수성이며, '물을 좋아하는' 또는 '물을 두려워하는' 것일 수 있다.

Generally, complex concepts show tensions between theory and practice. Tensions become tangible when research extrapolates the research object, like reflection, in a void as a self-contained concept. Borrowing from Wittgenstein’s work, concepts gain substance and significance in their situated use (Newman, 1999; Wittgenstein, 1958).

  • For example, ‘soap’ gains concrete meaning within the context of washing your hands.
  • To speak with the poet Ponge, soap is like no other stone found in nature. It gifts itself to you almost inexhaustibly after you marry it with water (Ponge, 2015).
  • From a purely chemical context, soap is hydrophilic and hydrophobic; it can be ‘water-loving’ or ‘water-fearing’.

간단히 말해서, 어떤 현상도 중복되는 것을 보여주는 뚜렷한 관행에서 다르게 나타나지만, 그것들은 결코 완전히 동일하지는 않다. 마찬가지로, 각각의 성찰은 "같은 가족에 속한 사람들의 얼굴처럼 많은 다른 방식으로 다른 사람들과 닮았다"지만 그들 사이의 [필수적 본질vital essence을 정의하는 것은 거의 불가능]하다. (Pears, 1970, 페이지 108; Wittgenstein, 1958) 복잡한 개념의 의미는 "사건과 과정의 미세한 입자"에 있습니다(Davis, 2009, 페이지 372).
In short, any phenomenon appears differently in distinct practices that show some overlap, but they are never completely identical. Likewise, each instance of reflection “resemble[s] others in many different ways, like the faces of people belonging to the same family,” but defining the vital essence between them is nigh impossible (Pears, 1970, p. 108; Wittgenstein, 1958). Meaning of complex concepts is in “the fine grain of events and processes” (Davis, 2009, p. 372).

[성찰을 모든 것을 포괄하는 개념으로 포착]하고자 시도함과 동시에 [성찰의 복잡성과 풍부함을 보존하는 것]역설을 수반한 연구를 제공한다. 우리가 어떤 개념을 생각할 때마다, 우리는 [일상 속에서 사용하는 특정한 적용]으로부터 그 [개념의 의미를 추론하고 재구성]한다. 반대로, 모든 다양한 용도를 염두에 두는 것은 불가능하다. (Newman, 1999)

  • 가능한 한 모든 다양한 용도를 포괄해야 하는 개념은 너무 광범위해지고 그 과정에서 힘을 잃게 될 것이다(거의 모든 것을 반영이라고 할 수 있다).
  • 동시에, 그 개념은 너무 좁고 정확해질 수 있고, 반사적으로 보일 수도 있는 것들을 잘라낼 수 있다.

역설이 학자들이 성찰이 정의하기 어렵기로 악명높다고 주장하는 이유를 설명한다. 그럼에도 불구하고, "맥락이 없다면, 개념의 생명은 산소 없이 남겨둔 것과 같다." (Nauta, 1984, 페이지 364; Boud & Walker, 1998; Flyvbjerg, 2006) 이것은 의문을 제기한다: 성찰에 대한 연구에서 그 역설은 왜 그렇게도 흔하게 나타날 수 있는가?
To preserve the complexity and richness of reflection while trying to capture it in an all-encompassing concept provides research with a paradox. Each time we think of concepts, we deduce and reconstitute their meaning from their specific application in everyday use. Conversely, it is impossible to bring all varied uses to mind (Newman, 1999). A concept that needs to encompass all varied uses as much as possible will become too broad and will lose its power in the process (nearly everything can be called reflection). Simultaneously, the concept can become too narrow and precise, and cut away things that can also be seen as reflection. This paradox explains why scholars claim that reflection is notoriously difficult to define. Nonetheless, “without a context, the life of a concept is left without oxygen” (Nauta, 1984, p. 364; Boud & Walker, 1998; Flyvbjerg, 2006). This raises the question: why can the paradox manifest itself so prevalently in research on reflection?

두꺼운 개념으로 반영
Reflection as a thick concept

우리는 [너무 좁거나 너무 넓게 개념을 공식화하는 역설]은 성찰를 [두꺼운 개념thick concept]으로 생각함으로써 풀 수 있다고 제안한다(Kirchin, 2013; Kroes & Meijers, 2016).

  • [얇은 개념]들은 평가적인 차원evaluative dimension을 가지고 있다. 가장 간단한 예는 'pro'와 'con'으로, 어떤 것을 좋아하거나 싫어하는 가장 단순한 형태를 나타낸다.
  • [두꺼운 개념]들도 이러한 평가적 기능을 가지고 있지만, 여기에 더해서 우리에게 어떤 현상에 대해 무언가를 말해준다. 예를 들어, 어떤 것은 그것이 <a, b, c >의 특징을 가지고 있을 때 성찰이고, < d, e >일 때 성찰이 아니다. "여기서 중요한 문제는 우리가 [현상]의 모든 사례를 포착할 것이라고 확신할 수 있느냐 하는 것입니다." (Kirchin, 2013, 페이지 9)

We suggest that the paradox of formulating concepts too narrowly and too broadly, can be unpacked by thinking of reflection as a thick concept (Kirchin, 2013; Kroes & Meijers, 2016).

  • On the one hand, thin concepts have an evaluative dimension. The barest examples are the words ‘pro’ and ‘con’, that indicate the simplest form of favoring or disfavoring something.
  • On the other hand, thick concepts also have this evaluative function, but in addition they tell us something about a phenomenon. For instance, something is reflection when it has features of < a, b, c > , and is not reflection when < d, and e > . “The key problem here is whether we can be certain that we will ever capture all of [the phenomenon’s] instances” (Kirchin, 2013, p. 9). 

개념이 두꺼울수록 더 국소적local으로 변한다.

  • 찬성-반대는 거의 보편적으로 사용될 수 있으며, 관행과 의미의 별개의 웹을 넘어 이동할 수 있습니다(Harcourt & Thomas, 2013, 페이지 24).
  • 그러나, [두꺼운 개념]본질적으로 [참여자들 사이에서 실행 중인 특정한 형태의 합의로부터 자라나는thrive 실천에 구속bound to]된다(Medina, 2004). 문제의 핵심은 [사회적으로 복잡한 현상들]이 [상호 연관된 수많은 요소]들을 포함하기 때문에 [끊임없이 해석되고 있다]는 것이다; 그 의미는 "직접 관찰로 단순히 '읽어낼 수' 수 없다." (Davis, 2017, 페이지 293).

The thicker the concept the more local it becomes.

  • ‘Pro’ and ‘con’ can be used almost universally, and can be transported beyond a distinct web of practices and meanings (Harcourt & Thomas, 2013, p. 24).
  • Thicker concepts, however, are inherently bound to practice that thrives on some form of agreement in action among its participants (Medina, 2004). The crux of the matter is that socially complex phenomena are under constant interpretation because they involve countless interrelated elements; their meaning “cannot be simply ‘read off’ by direct observation” (Davis, 2017, p. 293).

우리는 의학교육에 대한 성찰이 [성찰 그 자체를 위한 것이 아니라는 것]을 잊어서는 안 된다. 성찰의 목적이나 지점은 항상 있지만, 성찰적 실천은 (규범적인) 해석이 필요하기 때문에 결코 완전히 안정적이지 않다. 이 점은 전통에 달려 있으며, 사회 문화적 역사와 진행 중인 논쟁에서 발전한다(Norrie et al., 2012). 예를 들어, 실제 성찰의 경우 대체로 두 가지 반대되는 점이 있습니다.

  • 한 쪽에서, 성찰은 [새로운 상황과의 조정alignment]을 의미할 수 있으며, 이 때 요점은 [진행 중인 사회화]이다. 이러한 유형의 성찰은 어느 정도까지 측정 및 평가될 수 있다. 예를 들어, 연습생 측의 '효과적이고 숙련된 성찰'은 [잠재적인 지식 격차를 성찰적 포트폴리오에서 식별]하여, 학습 목표로 다루어야 한다. [지식 격차를 성공적으로 식별한 것]은 성찰이 효과적이었음을 나타낸다.
  • 다른 한 쪽으로는, 성찰은 [현재의 관행에 대한 명시적 비판자가 되게 함]으로써 [제도적 규범으로부터 일탈deviation]을 유발한다고 주장할 수도 있다. 따라서 [비판적 성찰의 측정과 평가]는 무의미한데nonsensical, 평가가 비판적 성찰이 의문을 던져야 할 바로 그 제도적 이상을 보호하기 때문이다(Hodges, 2015; Ng et al., 2020; Procee, 2006).

We should not forget that reflection in medical education is not there for its own sake. There is always a purpose or point to reflection, but reflective practice is never fully stable because it needs (normative) interpretation. The point hinges on traditions and evolves from its socio-cultural history and ongoing debates (Norrie et al., 2012). For example, in the case of reflection in practice, there are broadly speaking two opposing points.

  • On the one hand, reflection could imply alignment with new situations, and the point is ongoing socialization. This type of reflection could be, up to some degree, measured and assessed. ‘Effective and skilled reflection’ on the part of the trainee entails that potential gaps of knowledge are identified, for example, in reflective portfolios and subsequently addressed as learning goals. Successful identification of knowledge gaps indicates that reflection was effective.
  • On the other hand, one could argue that reflection instigates deviation from institutional norms by becoming explicitly critical of current practice. Measuring and assessing critical reflection is nonsensical, because assessment safeguards the very institutional ideals that critical reflection is supposed to question (Hodges, 2015; Ng et al., 2020; Procee, 2006).

다른 논쟁점은 다음과 같다:

  • 성찰은 감정에 관한 것이어야 하는가, 또는 그것이 이성적이어야 한다면 감정과는 거리가 멀어야 하는가?(Birden & Usherwood, 2013; Nguyen et al., 2014; Wald, 2015),
  • 성찰은 혼자하는 활동인가 또는 대인관계 활동인가? (Kotzee, 2012),
  • 성찰이 유해한 반추로 이어질 수 있는가? (Lengelle et al., 2016).
  • 성찰을 측정할 수 있는가? (Aukees et al., 2007; de la Croix & Veen, 2018; Veen et al., 2020)

이러한 영역을 비롯하여 수많은 다른 논쟁적 영역들이 있어, 성찰적 실천은 언제나 부담을 지니고 있다at stake. 다양한 측면에서 일치하지 않기에, 성찰에 대한 보편적인 설명이 구체화되는 것은 어려워진다. [얇은 개념]보다 [두꺼운 개념]은 그 개념이 기능하는 사회적 상황을 설명하는데 더 많은 요구를 하는 반면, 어떤 개념이든 사용자에게 일을 해야 하는 이유를 제공한다(Harcourt & Thomas, 2013). 각 개념화 및 실제 반영 적용은 학계와 교육기관의 규범적 논쟁을 임시로 묘사한 것이다(Gu-Ze'ev et al., 2001; Norrie et al., 2012). 이것은 연구를 도전으로 남깁니다: 어떻게 우리가 성찰과 같은 논쟁적인 개념을 연구할 수 있을까요? 

Other points of contention are:

  • should reflection be about emotions, or if it should be rational, debar from emoting (Birden & Usherwood, 2013; Nguyen et al., 2014; Wald, 2015),
  • is reflection a solitary or interpersonal activity (Kotzee, 2012),
  • can reflection lead to harmful rumination (Lengelle et al., 2016), and
  • can we measure reflection (Aukes et al., 2007; de la Croix & Veen, 2018; Veen et al., 2020)?

With each of these and other contested areas, the point of reflective practice is always at stake. Various points are incongruent and prevent a universal description of reflection from materializing. Thicker concepts place more demands on explaining the social situation they function in than thin concepts, while any concept equips the user with reasons for doing things (Harcourt & Thomas, 2013). Each conceptualization and application of reflection in practice is a temporary depiction of the normative debate in academia and educational institutes (Gu-Ze'ev et al., 2001; Norrie et al., 2012). This leaves research with the challenge: how can we study a debated concept like reflection?

우리는 어떻게 성찰을 연구할 수 있을까?
How can we study reflection?

성찰의 경합 상태를 고려할 때, 우리는 그것을 어떻게 연구해야 하는가? 우리의 접근 방식의 핵심 한계는 철학적 토대를 가능한 일관되고 일관성 있게 해석하지만, [결정적인 해석은 존재하지 않는다]는 것이다. 그럼에도 불구하고, 의학 교육은 종종 학제 간 분야를 제공하지만, 현실은 대부분의 의학 교육 연구가 여전히 의학 연구의 관점에서 이루어지고 있다는 것이다(Albert et al., 2020). 아마도 우리는 기술자적 접근과 역동적 접근 방식 사이의 유익한 대화를 통해 '다학제적 에지 효과'(Varpio & MacLeod, 2020)를 달성할 수 있을 것이다.
Given the contested state of reflection, how should we study it? The key limitation of our approach is that we interpret the philosophical underpinnings as coherently and consistently as possible, but that no conclusive interpretation exists. Nonetheless, medical education often proffers to be an interdisciplinary field, but the reality is that most medical education research is still done from the perspective of medical research (Albert et al., 2020). Perhaps we can achieve a ‘multidisciplinary edge effect’ (Varpio & MacLeod, 2020) through fruitful dialogue between technicist and dynamic approaches.

[기술자 접근법]을 채택하는 연구자들은 [과학에 대한 그들의 관점]이 [의학 연구의 인식론적 문화]와 더 일치하며, 대부분 [방법론적으로 연역적]이라는 것을 알아야 한다(Varpio & MacLeod, 2020). 이는 성찰을 [사전에 개념화하고 다양한 환경에서 테스트한다는 것]을 의미한다. 이 접근 방식의 가치는 설문지, 포트폴리오, 러브릭 또는 학습 결과의 (통계적) 분석과 같은 데이터 세트를 사용하여 선택한 변수가 특정 관행에서 결과로 나타나는지 확인하는 데 있다. 일반적으로 이 접근법은 [초기 개념화에서 채택된 성찰의 특징]이 반드시 성과에 나타날 것임을 받아들인다. 즉, '미리 계획한 것을 발견할 것이다'. 마찬가지로 사전에 개념화되지 않은 특징은 결과에 나타나지 않는다(Sacks, 1985; Uygur et al., 2019). 그 연구는 대부분 규범적이다. 

  • 첫째, 연구는 규범적인 의미에서 [처방적]인데, 개념화는 실제로 일어나야 할 일을 규정하기 때문이다(van Enk & Regehr, 2018). 단순하게 말하면, 성찰을 순전히 '사건들의 이성적인 해부'로 개념화한다면, 감정적인 순간은 반성으로 표시되지 않는다.  
  • 둘째, 듀이와 일맥상통하듯, 연구는 방법론적인 의미에서 [처방적]이다. 왜냐하면 모든 탐구는 개념을 담고 있기 때문이다concept-laden. 개념이 [관찰을 지시]하고, 무관한 정보와 관련성있는 정보를 가른다(Garrison et al., 2012). 만약 우리가 (두꺼운) 개념의 선택이 일시적이고 제한적이라는 것을 명심한다면, 이것은 문제가 될 필요가 없다. 개념은 우발적이며 지속적인 재구성의 대상이 된다. 이용 가능한 모든 이론을 종합하여 개념적 보편성을 주장하는 것은 우리가 보기에 이상주의적인 것으로 남을 것이다.

Researchers who adopt a technicist approach should be aware that their outlook on science is more in alignment with the epistemic culture from medical research, and mostly methodologically deductive in nature (Varpio & MacLeod, 2020). This means that reflection is usually conceptualized upfront and tested in diverse circumstances. The value of this approach is in checking if the chosen variables appear as outcomes in specific practices by using datasets like questionnaires, portfolios, rubrics or (statistical) analyses of learning outcomes. In general, this approach accepts that only features of reflection in practice that are adopted in the initial conceptualization will necessarily appear in the outcomes–‘you will find what you formulate upfront’. Those features that have not been conceptualized upfront will likewise not appear in the results (Sacks, 1985; Uygur et al., 2019). The research is mostly prescriptive.

  • First, research is prescriptive in a normative sense, because the conceptualization prescribes what should happen in practice (van Enk & Regehr, 2018). Simplified, if one were to conceptualize reflection as a purely ‘rational dissection of events,’ then emotional moments are not flagged as reflective.
  • Second, and in line with Dewey, research is prescriptive in a methodological sense because all inquiry is concept-laden. Concepts direct observation and demarcate relevant from irrelevant information (Garrison et al., 2012). This need not be a problem, if we keep in mind that the selection of a (thick) concept is temporary and limited. Concepts are contingent and subject to continuous reconstruction. Claiming conceptual universality by aggregating all available theories will remain, in our view, idealistic.



[기술적 접근방식]은 조작화를 촉진하기 위해 일반적인 표현으로 말하면 [자급자족 개념self-contained concept]을 목표로 한다. "예를 들어, 쇤의 모델과 달리, 쇤의 저작에 대한 긴 탐구 없이는 쉽게 파악할 수 없습니다." 예를 들어, 마셜의 성찰에 대한 개념은 다른 전문적 맥락에 걸쳐 이론들을 종합한 후 다음과 같이 정리된다: "성찰은 표현과 재/평가의 지속적인 순환을 통해 새로운 통찰력을 창출하기 위한 세심한 검토와 아이디어의 집합입니다." (Marshall, 2019, 페이지 411) 이론적으로만 보자면, 이
개념은 '올바른' 개념이며, 연구가 첫 발을 내딛는 데 도움이 된다. 하지만 역동적 접근법 또는 비트겐슈타인의 관점에서 보면, 그것은 거의 의미가 없을 정도로 추상적인 것으로 남아 있다. '주의 깊은 검토', '아이디어의 결합', '진행 중인 표현 주기', '재/평가'는 어떤 모습입니까? 실무자들은 어떻게 그러한 업적을 성취할 것인가? 그들은 무엇을 하고, 말하고, 침묵을 지키고 있는가? 그 개념은 여전히 실천과 밀접하게 일치함으로써 살아날 필요가 있다.

Technical approaches aim for self-contained concepts in generic wording to facilitate operationalization, “unlike, for example, Schön’s model, which is not easy to grasp without lengthy exploration of his writing” (Nguyen et al., 2014, p. 1185; Koole et al., 2011). For example, Marshall’s concept of reflection, after synthesizing theories across different professional contexts, reads as follows: “Reflection is a careful examination and bringing together of ideas to create new insight through ongoing cycles of expression and re/evaluation” (Marshall, 2019, p. 411). This concept is theoretically ‘correct’ and helps research gain a first footing, but from a dynamic and Wittgensteinian perspective, it remains abstract, up to the point that it means very little. What do ‘careful examination,’ ‘bringing together ideas,’ ‘ongoing cycles of expression’ and ‘re/evaluation’ look like? How do practitioners go about accomplishing such feats? What do they do, say or remain silent on? The concept still needs to come alive by aligning it closely with practice.

[역동적 접근 방식]에서 [(단일) 사례 연구의 가치]를 본다(Flyvbjerg, 2006; Newman, 1999; Rolfe, 2002, 2006). 사례 연구는 추상적 개념에 산소를 제공한다. 역동적 관점에서 사례 연구는 모든 사람에게 동일한 의미를 가지도록 설계되지 않았습니다. 사례 연구는 연습 자체를 모방한 매우 많은 측면들로 충분히 풍부해야 하며, "서로 다른 독자마다 사례의 서로 다른 것들에 의해 끌리거나 반발할 수 있다. 독자들은 어떤 [하나의 이론적 경로]를 가리키거나, [마지막엔 진실이 놓여있을 것]이라는 인상을 받지 않는다." (Flyvbjerg, 2006, 페이지 238) 사례 연구는 "'성찰적 실천'이라는 단일 용어에 의해 암시되는 어떤 하나의 의미에 대한 확실성"을 거부한다(Newman, 1999, 페이지 160). 현재 연구 분야에서, 우리는 [기술자적 추상]에 더 많은 [역동성]을 제공하기 위해 현장에서 성찰적 실천을 연구하는 것은 여전히 잘 표현되지 않고underrepresent 있음을 알 수 있다. 예를 들어, 성찰 그룹 세션의 대화 분석(van Braak et al., 2018; Veen & de la Croix, 2016) 또는 현상학적 접근(Rietmeijer et al., 2021)을 통해 '실제로 성찰이 일어나는 순간'에 그것을 조사하는 연구는 추가적인 역동성을 제공할 수 있다.

From the dynamic approach, we take the value of (single) case studies (Flyvbjerg, 2006; Newman, 1999; Rolfe, 2002, 2006). Case studies give abstract concepts oxygen. From the dynamic perspective, case studies are not designed to mean the same thing to all people. The case study should be sufficiently rich with so many facets, mimicking practice itself, that “different readers may be attracted, or repelled, by different things in the case. Readers are not pointed down any one theoretical path or given the impression that truth might lie at the end” (Flyvbjerg, 2006, p. 238). The case studies reject “the certainty of any one meaning implied by the single term ‘reflective practice’” (Newman, 1999, p. 160). In the current research field, we see that researching reflective practice in situ to provide more dynamism to technicist abstractions is still underrepresented. Studies that examine reflection ‘as it occurs in practice,’ for instance with conversation analysis of reflection group sessions (van Braak et al., 2018; Veen & de la Croix, 2016), or phenomenological approaches (Rietmeijer et al., 2021) can provide additional dynamism.

결론
Conclusion

우리는 성찰을 개념화하고 조작화하기 위한 가능한 과학적 접근법은 무엇이며, 이것들이 실제로 성찰에 대한 지식 생산에 어떤 영향을 미치는지 물었다. 성찰에 대한 의학 교육 문헌의 분석은 성찰의 개념적 비결정성에 대해 두 가지 주요 반응이 있다는 것을 보여주었다.

  • [기술자 접근법]과 [역동적 접근법]은 둘 다 성찰이 복잡하다는 것에 동의하지만, [기술자 접근법]은 성찰에 대한 개념적 합의를 추구함으로써 그것의 복잡성을 길들이려고 시도한다. 컨센서스는 연구를 표준화 및 교차 비교하고 성찰이 어떻게 효과적인지를 이해하는 데 도움이 됩니다.
  • 반대로 [역동적 접근법]은 성찰의 개념적 개방성을 수용하고 지역local 관행의 중요성을 강조한다. 관행은 역사적으로 우발적이며, 지속적으로 진화하고 있으며, 따라서 성찰은 이론적으로 가변적이다. 우리는 성찰을 두꺼운 개념으로 해석했고, 현재 연구는 [성찰을 어떻게 개념화하더라도 너무 광범위하거나 너무 협소해지는 패러독스]에 얽매여 있다고 주장했다. 우발적 실천은 어떤 이론의 도달 범위를 제한하며, 보편적 성찰의 공식formulation은 강한 한계를 갖는다.
  • 또한, 두 가지 접근법은 [상호 보완적]일 수 있다. 일반화된 기술자 이론은 (단일) 사례 연구 증거를 제공함으로써 살아날 수 있다.

We asked what the possible scientific approaches to conceptualizing and operationalizing reflection are, and how these influence knowledge production on reflection in practice. Our analysis of medical educational literature on reflection showed that there are two main responses to reflection’s conceptual indeterminacy.

  • The technicist and dynamic approaches both agree that reflection is complex, but technicists attempt to tame its complexity by seeking conceptual consensus on reflection. Consensus is beneficial to standardize and cross-compare research and understand how reflection is effective.
  • Conversely, the dynamic approach embraces reflection’s conceptual openness, and emphasizes the importance of local practice. Practices are historically contingent and evolving, and thus reflection is theoretically variable. We interpreted reflection as a thick concept, and argued that research is bound to the paradox that any conceptualization is either too broad or too narrow. Contingent practice limits the reach of any theory, and universal formulations of reflection have strong limitations.
  • Furthermore, the two approaches can be complementary; generalized technicist theory can come alive by providing (single) case study evidence of practice.

마지막으로, 우리는 비누를 묘사하려고 했던 시인 친구 폰게에게 돌아왔습니다. 폰지는 비누를 묘사하려고 했지만, 너무 많은 말이 있어서 비누를 접시 위에 되돌려 놓았습니다. 폰지가 패배한 것처럼 보인다. 그러나 우리는 이 문제에 대한 그의 시의 마지막 말이 매우 중요하다고 생각한다. "… 엄밀한 외관, 엄격한 타원형, 건조한 인내력, 그리고 다시 서브할 수 있는 힘을 가진 접시로 되돌려 놓을 필요가 있다." (Ponge, 2015) 비누를 이해하고 묘사하려는 노력처럼, 성찰을 개념화하는 것의 핵심은 그것의 사용과 목적에 있고, 이것이 어떤 묘사에든 영감을 줄 것이다. 비누에 대한 어린이의 정의가 화학자의 정의와 다르다는 것을 고려하는 것은 중요하다. 비누나 성찰에 대한 각각의 정의는 서로 다른 일을 할 것이다. 모든 사건을 결합하여 확정적이고 보편적인 정의를 찾는 것은 우리에게 이상주의적인 것으로 남을 것입니다. 하지만, 우리가 (과소평가해서는 안 되는) 실천으로 돌아간다면, 비누와 같이, 성찰은 다시 한번 도움이 될 것이다.

Finally, we come back to our poet friend, Ponge, who tried to describe soap, but there was so much to say that he returned it to its saucer. It appears as if Ponge is defeated. However, we feel that his poem’s last words on the matter are of key importance: “… it is necessary to return it to its saucer, to its strict appearance, its austere oval, its dry patience, and its power to serve again” (Ponge, 2015). Like an effort to understand and describe soap, the key to conceptualizing reflection lies in its use and purpose that inspires any description. Taking into account that a child’s definition of soap is different from that of a chemist is crucial. Each definition of soap or reflection will do different work. Combining all occurrences to find that definitive, universal definition will remain, for us, idealistic. However, reflection, like soap, will serve again if we return to its practice, which should not be underestimated.

 

 


Adv Health Sci Educ Theory Pract. 2022 May;27(2):537-551.

 doi: 10.1007/s10459-021-10082-7. Epub 2021 Nov 12.

Is reflection like soap? a critical narrative umbrella review of approaches to reflection in medical education research

Affiliations collapse

Affiliations

1Department of General Practice, Erasmus University Medical Center, Postbus 2040, 3000 CA, Rotterdam, The Netherlands. s.schaepkens@erasmusmc.nl.

2Department of General Practice, Erasmus University Medical Center, Postbus 2040, 3000 CA, Rotterdam, The Netherlands.

3Faculty of Medicine, Vrije Universiteit Amsterdam, Postbus 7057, 1007 MB, Amsterdam, The Netherlands.

PMID: 34767115

PMCID: PMC9117338

DOI: 10.1007/s10459-021-10082-7

Free PMC article

Abstract

Reflection is a complex concept in medical education research. No consensus exists on what reflection exactly entails; thus far, cross-comparing empirical findings has not resulted in definite evidence on how to foster reflection. The concept is as slippery as soap. This leaves the research field with the question, 'how can research approach the conceptual indeterminacy of reflection to produce knowledge?'. The authors conducted a critical narrative umbrella review of research on reflection in medical education. Forty-seven review studies on reflection research from 2000 onwards were reviewed. The authors used the foundational literature on reflection from Dewey and Schön as an analytical lens to identify and critically juxtapose common approaches in reflection research that tackle the conceptual complexity. Research on reflection must deal with the paradox that every conceptualization of reflection is either too sharp or too broad because it is entrenched in practice. The key to conceptualizing reflection lies in its use and purpose, which can be provided by in situ research of reflective practices.

Keywords: Critical narrative umbrella review; Philosophy; Reflection; Technicist and dynamic; Theory and practice.

안쓰러운 늘어진 여성: 의과대학생을 위한 골반진찰 학습자료의 상황분석(Med Educ, 2022)
‘Poorly relaxed women’: A situational analysis of pelvic examination learning materials for medical students
Sarah Towle

 

1 소개
1 INTRODUCTION

[환자 중심적이고 문화적으로 역량있는 의료]는 환자 경험을 개선하고 건강 격차를 최소화하는 중복된 방법으로 의학교육에서 옹호된다. 논란의 여지 없이, 이러한 접근법은 골반 검사(PE)와 같은 민감한 절차에서 추가적인 중요성을 가진다. 환자 취약성에 대한 검사의 성향과 관련 건강 차이(상세히 아래에 나와 있음)는 모두 검사가 임상적으로 시행될 때 이러한 접근법의 필요성을 강조한다. 
Patient-centred and culturally competent care are championed in medical education as overlapping methods of improving patient experiences and minimising health disparities.1-4 Arguably, these approaches hold added significance in sensitive procedures such as the pelvic examination (PE). Both the examination's proclivity for patient vulnerability and its associated health disparities (detailed below) highlight the necessity of these approaches when the examination is clinically administered.5-10

[환자 중심 진료]는 20세기 중반에 시작되었다. 여성 건강 운동의 영향을 받아, 그것은 부분적으로 '질병 중심의 의학'과 [의학적 가부장주의]에 대한 반발로 나타났다. 임상 의사, 의료 교육자 및 의료 기관의 실천 모델로 채택되었지만 [환자 중심 진료]의 [정의]를 둘러싼 논란은 여전하다.  기본적으로 환자 중심의 치료는 환자를 정확하게 진단하는 것 외에도, 임상의가 환자를 [한 명의 사람으로 알고 있다]는 생각을 중심으로 이루어진다. 이 접근법의 가치와 원칙에는 사회 세계의 맥락에서 환자를 인정하고, 정확하고 시의 적절한 의료 정보를 제공하며, 환자 선호도를 존중하며, 정보에 입각한 의사 결정에 환자를 참여시키는 것이 포함된다. 
Patient-centred care has origins in the mid-20th century. Influenced by the women's health movement, it emerged partly as backlash to both ‘illness-oriented medicine’ and medical paternalism.11 Though it has been adopted as a model of practice by clinicians, medical educators and healthcare institutions, debate remains surrounding the definition of patient-centred care.11 Fundamentally, patient-centred care revolves around the idea of the clinician knowing the patient as a person, in addition to accurately diagnosing disease.12 Values and tenets of this approach include

  • acknowledging the patient in the context of their social worlds,
  • providing accurate and timely medical information,
  • respecting patient preferences and
  • engaging patients in informed decision making.1-4

[환자 중심 진료]와 맞물려, 의학에서 [문화적 역량]은 다양한 사회적 문화적 배경을 가진 환자들을 치료하는 능력을 의미한다. 문화적 역량을 갖춘 진료를 운영하려면, [환자 배경에 대한 인식]과 [그 배경이 임상적 만남에서 권력의 차이에 어떻게 영향]을 미치는지, 그리고 [잠재적인 문화적 수용을 제공하는 것]이 모두 필요하다. 비록 의과대학 커리큘럼에 문화적 역량을 통합하려는 상당한 움직임이 있었지만, 그 틀과 학습자의 저항에는 여전히 과제가 남아 있다. 종종 임상 기술이 커리큘럼에서 우선시되고, 학생에게 문화적 역량이란 '소프트 사이언스'보다 학생들이 선호된다고 한다.
Aligned with patient-centred care, cultural competence in medicine refers to the ability to treat patients of diverse social and cultural backgrounds.13 Administering culturally competent care involves having both an awareness of patient background and how that background affects power differentials in clinical encounters, as well as providing potential cultural accommodations.3, 14 Though there have been considerable moves to incorporate cultural competence into the medical school curriculum,13 challenges remain in its framing and learner resistance; it is said that clinical skills are often prioritised in the curricula and favoured by students over the ‘soft-science’ of cultural competence.13, 15

PE는 다음과 같은 것들로 구성된다.

  • 외부 생식기 검사. 
  • 질 및 자궁경부 검체검사(샘플 채취가 가능한 경우) 
  • 부속지, 자궁, 난소 및 방광의 양면 검사 
  • 때로는 직장이나 직장-질 검진

PE가 비록 외래 환자 시술이지만 신체적, 심리적 의원성iatrogenic 효과를 일으키는 것으로 유명하다. 여기에는 출혈, 경련, 불편함, 고통, 두려움, 불안, 취약성, 수치심, 당혹감, 타락, 통제력 및 존엄성 상실 등의 느낌도 포함된다. 젊은 환자, 성폭행 생존자, LGBTQ+ 커뮤니티 회원, 흑인 여성 등에서 부정적 반응이 높아지는 것으로 나타났다. 이러한 집단에서 산부인과학적 건강 격차는 지속되며, 이는 과거에 검사에서 겪은 부정적인 경험과 관련이 있다. 

The PE consists of

  • an inspection of the external genitalia;
  • a speculum examination of the vagina and cervix (where samples may be taken);
  • a bimanual examination of the adnexa, uterus, ovaries and bladder; and
  • sometimes a rectal or rectovaginal examination.1617 

Though an out-patient procedure, it is noted for causing physical and psychological iatrogenic effects: bleeding,18-20 cramping,20 discomfort or pain,6, 17, 18, 21, 22 as well as feelings of fear,6, 17 anxiety,17 vulnerability,17 shame,23 embarrassment,5, 6 degradation,5 and loss of control and dignity.24, 25 Negative reactions have been shown to be heightened in young patients,6, 22, 26, 27 survivors of sexual assault,28-30 members of the LGBTQ+ community31, 32 and Black women.28 Gynaecological health disparities persist in these populations and have been linked to previous negative experiences with the examination.7, 10, 33


페미니스트 연구 결과에 의해 뒷받침된 학자들과 제공자들은 골반 건강 관리pelvic health care에 있어, [환자 중심주의와 문화적 역량]의 중요성을 오랫동안 지적해 왔다. 일반적으로 환자 경험을 개선하는 것으로 알려진 수정사항에는 다음이 포함된다.

  • 샤페론 허용,
  • 사용 발 받침대 포기,
  • 일상적인 양면 검사 중단(일부에서는 의학적으로 불필요하다고 간주)
  • 검체 자가 삽입 제공

특정 모집단에 대해서는 다른 변형이 유용할 수 있습니다.

  • 신체 부위에 대한 선호 용어 체크(성별 다양성 환자)
  • 환자(생존 환자 및 불안 환자)에게 검사 통제권이 유지되게끔 확인

Feminist scholars and providers—backed by research findings—have long noted the importance of patient-centeredness and cultural competence in pelvic health care.2434-38 Modifications known to generally improve patient experience include

  • allowing for chaperones,39 
  • forgoing the use footrests,38 
  • ceasing the routine bimanual examination (deemed by some to be medically unnecessary)1617 and
  • offering speculum self-insertion.2435 

Other modifications may be of value for specific populations:

  • checking in on preferred terminology for body parts (gender diverse patients),24 as well as
  • ensuring control of the examination remains with the patient (survivors and/or anxious patients).2435 

최근 개발된 인간유두종 바이러스에 대한 [환자 자가 샘플링]은 자궁경부암 검진에 대한 환자 참여를 개선하며, 트랜스 및 원주민 환자 사이에서 선호된다. 그 결과 양성 소견이 발견되었을 때 과소 선별된 모집단에 대한 후속 조치가 증가한다. 임상적 수용이 부족하기 때문에, 이러한 접근법의 일부와 관련하여 의료 훈련에서 보다 효과적인 인식 전략이 필요하다는 의견이 제시되었다. 

Patient self-sampling for human-papilloma virus—a recent development—improves patient participation in cervical cancer screening, is preferred among trans and Indigenous patients, and results in increased follow-up in under-screened populations when a positive result is found.40-43 It has been suggested that more effective awareness strategies are needed in medical training regarding some of these approaches, given their lack of clinical uptake.44

[산부인과 교육 협력자(GTA) — 교육 목적으로 PE를 받고, 의대생에게 피드백을 제공하는 여성 자원봉사자]의 도입을 포함하여, 이러한 접근 방식의 교리를 바탕으로 [PE 학습 practice]을 추가로 주입하기 위한 의료 커리큘럼의 진전이 이루어졌다. 그러나 커리큘럼의 단점은 여전히 존재한다. GTA 프로그램은 주로 백인 자원봉사자 46명으로 구성되며, 경우에 따라서는 어떤 행위는 자원봉사자들에게 부정적인 영향을 미치는 것으로 비판을 받아왔다.1 또 다른 흔하지만 문제가 되는 PE 학습 방법은 의료 교육생들이 [사전 동의 없이 마취 하에 환자를 대상으로 검사를 수행]할 때 발생한다. 이러한 관행이 대중에게 [환자 자율성 위반]으로 특징지어지며, 이를 [금지하려는 입법 움직임]이 있음에도, 학생들과 임상의사들 사이에서 받아들여지고 있다. 이 모든 것은 학생들이 환자 커뮤니티와 상호 작용하기 전에 환자 중심적이고 문화적으로 적합한 PE 접근법에 대한 개선된 노출이 필요할 수 있음을 시사한다. — 궁극적으로 사전 교육, 즉, 강의실 환경에서 이뤄져야 한다.
Strides have been made in the medical curriculum to further instil PE learning practices with the tenets of these approaches, including the introduction of gynaecological teaching associates (GTAs)—female volunteers who undergo PEs for educational purposes and provide feedback to medical students.45-47 However, curriculum shortcomings still exist. GTA programmes have been criticised for both consisting of predominantly White volunteers46 and, in some cases, maintaining practices that negatively impact volunteers.1 Another common yet problematic PE learning method occurs when medical trainees perform exams on patients under anaesthesia without prior consent.1-4, 47, 56 This practice has garnered acceptance among students and clinicians despite its public characterisation as a violation of patient autonomy and legislative moves to ban the practice.57-59 All this suggests that students may need improved exposure to patient-centred and culturally competent approaches to the PE before they interact with patient communities—ultimately in pre-clinical, classroom settings.

이 연구는 학부 의과대학 커리큘럼에서 PE를 수행하는 방법에 대한 텍스트 및 시각 기반 학습 자료를 조사한다. 이러한 자료들은 학생들이 체육을 처음 접하고 나중에 그 과정을 수행할 수 있는 기초를 형성한다. 그러한 자료의 분석은 수천 명의 의료 전문가에게 주어진 기술 정보에 대한 중요한 통찰력을 제공하며, 그 안의 메시지는 학생들의 의학에 대한 장기적인 믿음과 인식에 영향을 미칠 수 있다. 비판적으로 샘플링된 문서의 상황 분석을 통해, 본 연구는 의료 교육의 지식 격차를 메우고 텍스트 및 시각 기반 PE 학습 자료를 개선하여, 이후의 임상 학습에서 부족할 수 있는, 보다 [환자 중심적이고 문화적으로 적합한 접근 방식]을 포함할 수 있는지 여부 및 그 방법에 대한 정보를 제공하는 것을 목표로 한다.
This study investigates text- and visual-based learning materials on how to perform the PE in undergraduate medical school curricula. Materials such as these serve as the first introduction students have to the PE and form the foundation through which they later perform the procedure. Analyses of such materials provide important insight into the technical information given to thousands of medical professionals,60 and messages therein may impact students' long-term beliefs and perceptions in medicine.60, 61 Through a situational analysis of critically sampled documents, this study aims to fill a knowledge gap in medical education and provide information on if and/or how text- and visual-based PE learning materials could be improved upon to include more patient-centred and culturally competent approaches that may be lacking in later clinical learning.

2 방법
2 METHODS

저는 캐나다 대학 의과대학에서 체육에 필요한 필수 텍스트 기반 학습 자료에 대한 상황 분석을 수행했습니다. [상황 분석]은 'theory/methods package'로 묘사되며, 페미니스트 보건 연구에서 강한 역사를 가지고 있으며, 종종 [근거이론이라는 정성적 방법론의 확장]으로 간주된다. [근거 이론]이 데이터 내에서 발생하는 기본적인 사회적 프로세스를 밝히는 것을 목표로 한다면, [상황 분석]은 [전반적인 관심 상황에 대한 인식]을 통합한다. 연구자들은 사회적 구조, 집단, 제도 및 역사/현재의 현실 내에서 주제를 정하기 위해 [하드 데이터]를 뛰어넘는다. 
I conducted a situational analysis of required text-based learning materials on the PE from undergraduate Canadian medical schools. Described as a ‘theory/methods package’, situational analysis has a strong history in feminist health research and is often considered an extension of the qualitative methodology of grounded theory.62 Where grounded theory aims to uncover basic social processes occurring within the data, a situational analysis incorporates an awareness of the overall situation of concern; researchers go beyond the hard data to situate their topic within social structures, collectives, institutions and histories/present-day realities.63

[상황 분석]은 또한 [지배적인 담론이 개인, 집단, 지식 및 관점을 배제하거나 삭제할 수 있는 권력을 가지고 있다]는 [푸코의 담론적 권력의 후기 구조주의 이론]에 근거한다. 기존의 정성적 분석이 이러한 학습 자료의 내용에 대한 설명을 초래하는 반면, 상황 분석은 환자와 연습생에 대한 PE의 현실에 내 데이터를 배치하고, 이러한 문서의 지배적인 담론이 학생들의 관점과 미래의 임상적 만남을 형성할 수 있는 방법을 밝혀준다. 

Situational analyses also draw on Foucault's post-structuralist theories of discursive power—that dominant discourses have the power to exclude or erase individuals, groups, knowledges and perspectives.62, 64 Whereas conventional qualitative analyses would result in descriptions of the content in these learning materials, a situational analysis situates my data in the realities of the PE for patients and trainees and brings to light how dominant discourses in these documents can shape students' perspectives and future clinical encounters.65, 66

내 데이터는 캐나다에서 가장 큰 5개 학부 의과대학에서 의도적으로 샘플링되었고 학생들에게 PE를 수행하는 방법을 보여주는 모든 필수 교과서, 임상 기술 가이드 및 PowerPoint 프레젠테이션으로 구성되었다. 이 학교들은 캐나다에서 가장 많은 수의 의사들을 훈련시키기 때문에 선택되었습니다. 캐나다에 위치한 연구원으로서, 나의 목표는 국가 차원의 의료 교육자들에게 PE에 대한 전반적인 커리큘럼 피드백을 제공하는 것이었다. 이 연구는 캐나다 의대에 초점을 맞추고 있지만, 북미 의과대학에는 특정한 형태의 학습 표준화가 존재하며, 이 연구의 결과는 캐나다와 미국 전역의 의과대학에 일반화될 수 있다.
My data were purposively sampled67 from the five largest undergraduate medical schools in Canada and composed of all required textbooks, clinical skills guides and PowerPoint presentations that demonstrated to students how to perform the PE. These schools were selected because they train the largest number of doctors in Canada. As a researcher situated in Canada, my goal was to provide overall curricula feedback on the PE for medical educators at a national level. Though this study focuses on Canadian medical schools, certain forms of standardisation in learning exist in North American medical schools, and the results of this study could be generalised to medical schools across Canada and the United States.

공공 웹사이트 검색은 물론, 의과대학의 관리자, 교수진 및/또는 개인 정보 보호 담당자들에게 연락하고 요청하는 것을 포함했다. 

  • (i) 학부 의대생을 위한 필수 교과서 목록 
  • (ii) 임상 기술 및/또는 PE의 교육에 사용되는 내부 자료 

학생들이 여전히 교과서를 참조하는지 여부에 대한 의문이 있었지만, 필수 구매 및 필수 읽기로 지정된 내용만 포함되었다. 이를 통해 가능한 한 포괄적인 PE 학습 자료를 검사할 수 있었습니다. PE의 묘사를 포함할 수 있는 재료의 총 수는 28개였다. 이 28개에서 PE의 묘사가 포함되지 않은 자료를 제거하고 중복 자료를 제거한 후, 10개의 교육 자료 샘플이 남아 있었다(표 1에 나열). 특정 교과서는 맥길 대학교 도서관을 통해 온라인 또는 실제 사본으로 접근되었다. 내부 자료는 공개적으로 사용할 수 없는 경우 익명으로 나열됩니다.

Data collection involved searching public websites as well as reaching out to administrators, faculty and/or privacy officers at the medical schools and requesting

  • (i) a list of any required textbooks for undergraduate medical students and
  • (ii) any internal materials used for learning clinical skills and/or the teaching of the PE.

Though questions arise as to whether students still refer to textbooks, only those that were specified as required purchases and/or required reading were included. This allowed for an examination of PE learning materials that was as comprehensive as possible. The total number of materials that could contain depictions of PEs was 28.2 After eliminating materials within this 28 that did not contain depictions of the PE and removing duplicates, a sample of 10 educational materials remained (listed in Table 1). Specific textbooks were accessed via McGill University Library, either online or in physical copy. Internal materials are listed anonymously given that they are not publicly available.

 

데이터를 분석하기 위해, 나는 discursive data와 관련하여 일반적으로 사용되는 상황 분석의 분석 도구 중 하나인 [위치 매핑positional mapping]을 사용했다. [위치 맵position map]을 사용하면 데이터가 질적으로 코딩되지만, [취해진 위치와 담론에서의 침묵]에도 주의를 기울인다. 그런 다음 이러한 결과는 [좌표 지도]에 표시되며, [축]은 [논쟁 중인 문제]를 나타내고, [플롯 점]의 위치는 [위치의 prevalence]을 나타냅니다. 이론으로 정점을 찍기 보다는, 지도는 데이터 내의 모순과 부재는 물론 여러 위치를 완전히 표현할 수 있게 해준다. 

To analyse the data, I employed positional mapping, one of the analytic tools of situational analysis commonly used in relation to discursive data.62, 63 With position maps, data are qualitatively coded, but attention is paid to positions taken and silences in the discourses. These results are then plotted on coordinate maps, with the axes representing contested issues and the location of the plot point representing the position's prevalence. Rather than culminating in a theory, the maps allow for multiple positions as well as contradictions and absences within the data to be fully articulated.62, 63

샘플의 초기 판독은 세트에 익숙해지도록 수행되었다. 이후 10개의 샘플을 정성 데이터 소프트웨어 NVivo(NVivo 12, QSR International, USA)로 가져오고, 프로그램의 코딩('노드'라고도 함) 프레임워크를 사용하여 콘텐츠(담화 및 이미지)를 귀납적으로 코딩하는 수동 프로세스가 수행되었다. 분석은 다음 질문에 의해 유도되었다.

  • 환자 중심성 및 문화적 역량과 관련하여 의대생이 사용하는 PE 학습 자료에서 환자를 어떻게 대표하고 있는가?

이 심층적인 프로세스에는 데이터의 반복적 검토, 기본 및 최종 보조 코드/노드 적용, 세부 메모가 포함되었습니다. '데이터에서 취한 위치'는 코드에서 나온 반면, '침묵silences'은 메모 작성 과정에서 구체화되었다. 예를 들어, 메모를 하면서, 나는 더 광범위한 관심 상황(환자 중심적이고 문화적으로 유능한 PE) 중에서 [어떤 개념이 데이터에 제한되거나 누락되어있는지limited or absent] 주목했다.

An initial reading of the samples was undertaken to become familiar with the set. The 10 samples were then imported into the qualitative data software NVivo (NVivo 12, QSR International, USA), and the manual process of inductively coding the content (discourse and images) was carried out using the program's coding (also called ‘nodes’) framework. The analysis was guided by the following question:

  • How are patients represented in PE learning materials used by medical students with respect to patient-centeredness and cultural competencies?

This in-depth process involved multiple passes of the data, applying primary and eventual secondary codes/nodes, and the taking of detailed memos. The ‘positions taken in the data’ emerged from the codes, whereas the ‘silences’ materialised during the memo-making process. For instance, while making memos, I noted which concepts of the broader situation of concern (a patient-centred and culturally competent PE) may be limited or absent in the data.


몇 번의 검토passes 후 코딩 및 메모 작성 프로세스에서 [새로운 위치와 새로운 침묵]이 더 이상 나타나지 않을 때(이 방법을 '분석적 충분성' 62라 칭함), 결과는 스프레드시트로 내보내고 주제와 관련된 그룹으로 정리되었다. 여기서부터 지도 축은 데이터의 일반적인 긴장 영역을 식별하여 개발되었다. 

  • (i) 환자 불편과 피할 수 없는 장애에 대한 PE 과제와 그에 대한 임상적 인식 
  • (ii) 임상 의사의 행동 대 환자의 목소리 

그 다음 이 방법에 의해 제안된 템플릿을 사용하여 마이크로소프트 워드의 지도에 해당하는 위치와 정적을 표시하였다.

After several passes and when new positions and silences were no longer emerging from the coding and memo-making process (what this method refers to as ‘analytic sufficiency62), the results were exported into a spreadsheet and organised into thematically related groups. From here, map axes were developed by identifying common areas of tension in the data:

  • (i) a clinical awareness of PE challenges versus the inescapability of patient discomfort and
  • (ii) the clinician's actions versus the patient's voice.

Corresponding positions and silences were then plotted onto maps in Microsoft Word using templates suggested by this method.

이 연구는 문서 분석에 초점을 맞추고 인간 참여자들에 대한 연구나 실험을 포함하지 않았기 때문에, 맥길 대학 의학부의 맥길 기관 검토 위원회의 규정에 따라 윤리 승인이 필요하지 않았다.
Because this study focused on analysing documents and did not involve research or experimentation with human participants, ethics approval was not required as per the rules of the McGill Institutional Review Board in the Faculty of Medicine at McGill University.

 

3 결과 
3 RESULTS

상황 분석 결과는 두 개의 위치 지도에 표시된다(그림 S1 및 S2). 아래에서는 이 분석의 세 가지 중요한 주제에 대해 논의합니다.
Results of the situational analysis are depicted in two positional maps (Figs S1 and S2). Below, I discuss three overarching themes from this analysis.

3.1 균질하고 규범적인 신체: 시대에 뒤떨어진 언어
3.1 Homogeneous and normative bodies: Outdated language

자료에서 나타난 가장 일반적인 주제는 [신체에 대한 동질적이고 규범적인 개념]이었다. 시각적으로나 담론적으로, 대부분의 문서(80%)에서 환자들은 [백인의, 시스젠더의, 장애가 없는, 가임 연령의, 이전 외상 이력이 없는 것]으로 구성되었다. 규범적이거나 '표준화된' 신체는 기초 기술을 배우기 위한 의료 훈련에서 선호되는 경우가 많으며, 이는 부분적으로 이러한 동질성을 설명할 수 있다.
The most prevalent theme that emerged from the data was a homogeneous and normative notion of the body. Both visually and discursively, patients were constructed as White, cis-gendered, abled-bodied, of child-bearing age and without a previous history of trauma in most (80%) of the documents. Normative or ‘standardised’ bodies are often preferred in medical training for learning foundational skills, which may partially explain this homogeneity.

신체 변화가 언급되더라도, 그것은 [심지어 이 표준 구조 내에서조차, 특정 신체들이 어떻게 임상의에게 PE를 더 도전적으로 만들 수 있는지]에 대한 언급이었다.
When bodily variation was mentioned, it was in reference to how, even within this normative construct, certain bodies can make the PE more challenging for the clinician:

 

많은 처녀질 오리피스는 하나의 검사 손가락을 인정한다…
만약 introitus이 위축되고 타이트해진다면, 나이 든 여성에게도 유사한 기술이 나타날 수 있다.

Many virginal vaginal orifices admit a single examining finger … Similar techniques may be indicated in elderly women if the introitus has become atrophied and tight. (Bickley and Szilagyi, p. 30, emphasis added)

그레이브스 경첩은 옆쪽이 더 넓고, 더 높고, 구부러진 날을 가지고 있다. 대부분의 경산부 여성에게 가장 적합하다.
그것의 넓고 구부러진 날들은 시각화를 위해 경산부 여성의 느슨한 질벽을 유지한다.
The Graves speculum has blades that are wider, higher, and curved on the sides; it is more appropriate for most parous women. Its wider, curved blades keep the looser vaginal walls of multiparous women separated for visualization. (Beckmann, p. 13, emphasis added)

난소는 비만이나 잘 이완되지 않은 여성에게서 촉진되기 어렵다
Ovaries are difficult to palpate in obese or poorly relaxed women. (Clinical Skills Guide 3, p. 8, emphasis added)


여기서의 언어 선택은 성차별적이고 불필요하게 성차별화된 담론을 나타낸다. 예를 들어, 여성 순결의 사회적 구조는 유지되고, 경산 여성은 질적으로 '느슨한' 것으로 묘사된다. 또한, 프로시져가 참아내기 어려운 것이 아니라, (PEs의 유일한 수용자로 생각되는) 여성이 '잘 이완되지 않은 것'으로 묘사된다. 여기서, 우리는 환자의 동질적(비다양적) 묘사와 여성 신체와 관련된 [시대에 뒤떨어지고, 종종 낙인적인 용어와 개념]의 사용과 관련하여 자료에서 문화적 역량이 부족하다는 것을 주목할 수 있다. 이러한 강연들은 의학 및 사회에서 성별과 성 고정관념을 영속시키는 역할을 한다.

The language choices here are indicative of sexist and unnecessarily sexualised discourse. The social construct of female virginity is upheld, multiparous women are described as vaginally ‘loose,’ and women (suggested to be the sole receiver of PEs) are ‘poorly relaxed’ rather than the procedure being challenging to tolerate, for instance. Here, one can note a lack of cultural competency in the materials both with respect to homogeneous (non-diverse) depictions of patients and with the use of outdated and often stigmatising terms and concepts related to the female body. These discourses serve to perpetuate gender and sexuality stereotypes in medicine and in society more broadly.

대부분의 문서가 신체에 대한 규범적 개념을 설명했지만, 두 개의 내부 가이드는 분명히 다양한 환자를 언급하였다. 하나는 퀴어 및 트랜스 환자를 위한 성별을 포함하는 접근 방식을 강조하고 다른 하나는 원주민과 LGBTQ+ 관점을 포함하는 외상 정보 치료의 원칙에 대한 두 페이지를 할애하였다.

Though most of the documents depicted normative notions of the body, two internal guides did overtly refer to diverse patients: one emphasising a gender-inclusive approach for queer and trans patients and the other dedicating two pages to the principles of trauma-informed care inclusive of Indigenous and LGBTQ+ perspectives (Clinical Skills Guide 3, pp. 11–12; PowerPoint Presentation 2, pp. 20–23).

 

3.2 환자의 주체성과 선호도가 제한된다.
3.2 Limited patient agency and preferences

모든 문서에서 강조된 것은 [환자가 PE 수행 여부를 결정할 수 없다]는 개념이었다. 임상의가 PE가 표시된 것으로 판단한 경우, PE가 발생하게 됩니다. 두 개의 교과서 및 한 개의 내부 가이드의 다음 예는 이러한 권한을 보여줍니다.

Underscored in all documents was the notion that patients were not in control of deciding whether the PE was to be performed. If the clinician had determined that a PE was indicated, it was to occur. The following examples from two textbooks and one internal guide demonstrate this authority:

 

환자에게 당신의 시험 계획을 설명하시오. (Smith 등, 페이지 328; 강조 추가)
Explain to the patient your plans for the exam. (Smith et al., p. 328; emphasis added)

내진을 할 때 앞으로 일어날 모든 것을 그것이 일어나기 전에 설명해야 합니다. 
Everything that is going to happen during the pelvic examination should be explained before it occurs. (Beckmann, p. 11; emphasis added)

환자로부터 진행 허가를 받습니다. 
[Obtain] permission from the patient to proceed. (Clinical Skills Guide 2, p. 3)


여기서는 환자의 의사input과 관계없이, 이미 검사가 결정되었습니다. 환자 동의(또는 때때로 표현된 '허락')가 언급되지만, [이미 검사가 진행 중이거나 결정된 것]이라는 구성 내에 있다. [임상적 권위]는 문서 내에 너무나도 팽배해서, [환자가 검사를 거부할 경우] 어떻게 해야 할지 아무도 제안하지 않았고, [우려를 하는 환자에 대한 대안적인 행동 방침]이 제시되지 않았다.

Here, the examination has been decided upon before, independent of patient input. Though patient consent—or ‘permission’ as it was sometimes phrased—is mentioned, it is within the construct of the examination already being in motion or decided on. Clinical authority was so prevalent in the documents that none suggested what to do if a patient declined an examination; no alternative courses of actions were suggested for apprehensive patients.

환자의 주체성agency가 문서에 나타나 있을 경우에는(40%), [이미 하고 있는 프로시져]를 환자에게 맞춤화할 수 있는 방법과 관련하여 다음이 언급된다.

  • 거울 사용(임상 기술 가이드 2 및 PowerPoint 프레젠테이션 2) 
  • 시술 중 신발 착용(비클리와 실라지) 또는 
  • 산만함을 위한 기술 장치 사용(임상 기술 가이드 3) 

When patient agency was represented in the documents (40%), it occurred with respect to how the patient could customise an already occurring procedure:

  • use of a mirror (Clinical Skills Guide 2 and PowerPoint Presentation 2),
  • wearing shoes during the procedure (Bickley and Szilagyi) or
  • using technological devices for distraction (Clinical Skills Guide 3).

PE 경험을 개선하는 것으로 알려진 최근 및 거의 틀림없이 더 효과적인 아래와 같은 옵션들은 없었다. 

  • 일상적인 상황에서 bimanual examination을 포기한다. (딱 하나에만 있었음)
  • 발판 사용 금지,
  • 스페큘럼의 자가 삽입 또는 자기 스왑 테크닉

Recent and arguably more effective options known to improve the PE experience were absent:

  • forgoing the bimanual examination in routine circumstances (excluded from all but one),
  • disuse of footrests,
  • self-insertion of speculum and/or self-swabbing techniques.

이러한 측면에서 자료는 환자 중심의 치료 원칙(일부 환자의 선호도 존중)을 지지했지만, [특정 모집단에 대한 검사를 개선하는 것으로 알려진 것을 포함하여], 모든 가능한 옵션에 대해 학생들에게 경고하기에는alerting 불충분했다. 이전 연구의 결론은, [의료 훈련단계에서 학생은 아직 임상행위를 습득하기 전이므로, 새로운 PE 옵션을 도입하기에 이상적인 시기]인 것으로 확인되었다. 그렇지 않으면 학생들은 이러한 원천 자료에 노출되지 않을 수도 있다.

In this regard, although the materials upheld a tenet of patient-centred care—respect for (some) patient preferences—they were inadequate in alerting students to all options, including those known to improve the examination for specific populations. Conclusions from previous studies have identified medical training as the ideal introduction to novel PE options given their current lack of uptake in clinical practice.44 Students may otherwise never be exposed to these techniques if not in these source materials.

3.3 환자는 [PE가 이뤄지는 도중]이라는 특정 단계에서 [취약성과 제한된 능력]을 경험한다.
3.3 Patients are vulnerable and experience limited capacity at specific stages during the PE

데이터에서 나타난 분명한 주제는, PE의 임상 부분 동안 (임상의사 및 연습생에 대한) 환자의 상대적 취약성이었다. 데이터의 담화는 PE에는 두 가지 뚜렷한 사회적 요소인 [PE 전후]와 [PE 중]이 있음을 보여주었다. 다음 예제는 환자 참여(질문할 능력, 동의할 능력, 결과 수신 능력 등) [전후 구성 요소에서 얼마나 강하게 indicate되는지], 그리고 [옷을 벗은 것]이 환자의 능력capacity에 대한 취약성과 중단을 어떻게 의미하는지 보여줍니다.

A clear theme that emerged from the data was patient vulnerability relatively to the clinician and/or trainee during the clinical portion of the PE. Discourses in the data demonstrated that there were two distinct social components of the PE: the before/after and the during. The following example demonstrates how patient engagement—such as the ability to ask questions, give permission and receive results—is heavily indicated in the before/after component and how being unclothed signifies both a vulnerability and a disruption to the capacity of the patient:

 

[프로시져 중의 취약성]이라는 주제는 임상의에게도 적용된다. 몇몇 문서에서는 임상의사(특히 교육생 및/또는 남성)가 '의료법적 보호'를 위해 환자가 알지 못하는 [샤프롱chaperones]을 병실에 배치해야 하는 방법을 강조하였다(임상기술지침서 1, 페이지 1).

Themes of vulnerability during the procedure also applied to the clinicians; several documents highlighted how clinicians—specifically trainees and/or males—must have chaperones unknown to the patient in the room for ‘medico-legal protection’ (Clinical Skills Guide 1, p. 1).

검사의 두 번째 구성 요소(프로시져 자체)에서, 담론은 [환자의 편안함]에서 벗어나, [PE의 임상적 스텝]으로 이동했습니다. 학습 목적을 위한 절차를 묘사하는 동안 임상적 초점을 어느 정도 맞출 것으로 예상된다. 비록 본문들이 [프로시져가 이뤄지는 동안 환자와의 의사소통의 필요성]을 일찍이 강조했지만, 종종 이 개념은

  • (i) 임상 단계 동안 전혀 언급되지 않거나 
  • (ii) 허가를 구하는 질문이나 이의 제기 기회가 아닌. [진술]로 표현된다.
    • '만지는 느낌이 날거에요',
    • '경경을 삽입하려고 한다는 것을 환자에게 말한다',
    • '불편한 환자에게 긁는 느낌이 들 수 있다고 알려준다'

이러한 재료는 PE의 두 구성 요소 사이에서 접근 방식이 달랐다고 할 수 있다. [환자와 환자 참여]는 프로시져 전후에, [임상 스킬]은 프로시져 동안에 중요하게 다뤄졌다.

In the second component of the examination (the procedure itself), discourses shifted away from patient comfort and towards the clinical steps of the PE. An amount of clinical focus during depictions of any procedure for learning purposes is to be expected. Though texts had earlier highlighted the need for patient communication during the procedure, often, this concept was either

  • (i) not referenced at all during the clinical steps or
  • (ii) expressed as statements rather than permission-seeking questions or opportunities for dissent (i.e. ‘you are going to feel touch’, ‘let the patient know you are about to insert the speculum’ and ‘inform patient she may feel an uncomfortable scraping sensation’).

It could be said that these materials diverged in their approach between the two components of the PE: patients and patient engagement were centred in the before/after, whereas clinical skills were centred during.

4 토론
4 DISCUSSION

내 분석은 캐나다 학부 의과대학에서 샘플링된 PE를 수행하는 방법에 대한 텍스트 및 시각 기반 학습 자료가 이 연구의 프레임워크에 명시된 [환자 중심 치료 및 문화적 역량의 원칙]에 대해 환자를 적절하게 나타내지 못한다는 것을 보여준다. 환자의 다양성, (언어를 통한) 존중, 환자의 선호와 주체성agency는 모두 다 프로시져를 묘사할 때 결여되어 있었다. 하지만 이러한 개념은 부가적인 비중을 가지고 있으며, 다른 형태의 학습에서 학생들에게 소개되지 않을 수도 있다. 이와 같은 강의실 자료는 의학 교육에서 하나의 요소에 불과할지 모르지만, 그러나, 나는 이러한 묘사가 여전히 여기서 그리고 의학 교육과정에 더 광범위하게 중요하다고 주장한다.

My analysis demonstrates that text- and visual-based learning materials on how to perform the PE sampled from Canadian undergraduate medical schools inadequately represent patients with respect to the tenets of patient-centred care and cultural competence set out in this study's framework. Patient diversity, respect (via language), preferences and agency were all limited in depictions of a procedure where these concepts arguably carry added weight and may not be introduced to students in other forms of learning. Classroom materials such as these may illustrate a single component of medical education; however, I argue that these depictions still matter here and for the medical curriculum more broadly.

[환자 중심성]과 관련하여, [환자 관점에 대한 노출]이 [의대생의 자신감과 정보 보유를 크게 향상시킨다]는 연구 결과가 나오면서, 이 치료 모델은 전체 의료 커리큘럼의 중요한 측면으로 반복적으로 확인되었다. 앞서 언급한 바와 같이, PE는 환자와 학생 모두에게 예외적인 절차입니다. 프로시져 학습 자료에서 환자 중심의 접근 방식을 강조한다면, PE가 적어도 하나의 우선 순위가 되어야 한다고 추정할 수 있다. 
With respect to patient-centeredness, this model of care has repeatedly been identified as an important aspect of the entire medical curriculum,11, 68 with research demonstrating that exposure to the patient perspective significantly improves medical students' confidence and retention of information.69 As mentioned, the PE is an exceptional procedure for both patients and students.70 If patient-centred approaches were to be emphasised in procedural learning materials, it could be presumed that the PE should be at least one priority.

이 사례들에서 환자중심적 접근방식이 배제되었음을 확인하며 배운 것이, [환자 중심주의가 필수적이라고 여겨지는 다른 분야의 결함]도 말해 줄 수 있다. 예를 들어 만성 통증, 장애 또는 말기 질환을 앓고 있는 환자 또는 산부인과 환자가 있다. 학생들은 교육과정 전반에 걸쳐 환자 중심주의를 보다 명시적으로 가르칠 필요가 있다고 보고했고, 학부 커리큘럼은 환자 중심적인 관점보다 '질병 기반 관점'에 더 치우친 것으로 나타났다. 이 연구의 결과는 교실 학습 자료가 환자 중심주의를 개선할 수 있는 의료 교육의 한 측면이 될 수 있음을 보여준다.

What we learn from their exclusion in these cases may speak to deficiencies in other fields where patient-centeredness has been identified as imperative: patients with chronic pain,71 disabilities72 or terminal illness,73 or in obstetrics,74-76 for instance. Students have reported that patient-centeredness needs to be more explicitly taught throughout the curriculum,77 and undergraduate curricula have been shown to be more inclined towards ‘disease-based perspectives’ over patient-centred ones.78 The results of this study demonstrate that classroom learning materials could be one aspect of medical education where patient-centeredness could be improved upon.

문화적 역량과 관련하여, 본 연구의 분석은 의료 커리큘럼에서 환자 묘사를 다양화하기 위해 추가 작업이 필요할 수 있음을 보여준다. 이는 이 주제에 대한 다른 조사 결과와 일치합니다. 피부과와 같은 다른 의학 분야의 학습 자료에서 인종적 동질성은 예를 들어 학생들의 진단 기술을 저해하는 것으로 알려져 왔다. 또한 특정 모집단의 부재(심지어 술기 장비technical material 수준의 부재조차)는 의사들이 [인종과 질병 위험 사이의 연관성]이 있게 만듦으로써, 기존 건강 격차를 유지하거나 악화시킬 수 있다는 점에 주목했다. 북미 의대생들은 [성소수자(LGBTQ+) 환자와 관련된 주제]에 대해 학부 커리큘럼에 적은 시간을 할애하고 있으며, 이 모집단에 적절한 상담을 제공할 준비가 되어 있지 않다고 느낀다고 보고한다. 페미니스트 이론가들에 따르면, 의학교육에서 [환자를 동질적으로 묘사하는 것]은 [신-식민지주의neo-colonialism의 한 형태]로 간주되며, 모든 신체가 아니라 [일부 신체에만 복무하도록 설계된 '우생학의 논리']를 영속시킨다. 강의실 자료를 포함한 포괄적인 리소스는 다양한 환자 그룹과 상호작용하는 데 있어 학생들의 문화적 역량을 향상시키기 위한 중요한 방법으로 확인되었습니다. 본 연구의 결과는 환자 표현이 개선되어야 하는 커리큘럼의 한 측면(PE 강의실 자료)을 드러내지만, 또한 의료 훈련의 모든 단계에서 문화적 역량 기술이 얼마나 더 강조되어야 하는지에 대한 더 광범위한 예시로도 작용한다.
With respect to cultural competency, the analysis from this study demonstrates that further work may be needed to diversify patient depictions in the medical curriculum. This aligns with other findings on this topic. Racial homogeneity in learning materials from other fields of medicine—such as dermatology—has been noted to impede diagnostic skills of students,79 for instance. It has also been noted that the absence of certain populations—even at the level of technical materials—may inform the association doctors make between race and disease risk, thereby maintaining or exacerbating existing health disparities.60, 61 North American medical students report that a small amount of time is dedicated in the undergraduate curriculum to topics related to LGBTQ+ patients80 and that they feel unprepared to provide appropriate counselling to this population.81 According to feminist theorists, homogeneous depictions of patients in medical education are considered a form of neo-colonialism82 and perpetuate a ‘logic of eugenics’ designed to serve some bodies instead of all.83 Comprehensive resources—including classroom materials—have been identified as a critical method for improving cultural competency in students by heightening their awareness of and comfort in interacting with diverse patient groups.84 The results of this study reveal one aspect of the curriculum where patient representation needs to be improved (PE classroom materials) but also serve as a broader example of how cultural competency skills may need further emphasis across all stages of medical training.


본 연구의 한계 측면에서, 이 프로젝트의 범위는 중요한 사례 표본을 추출할 수 있도록 허용되었으며, 학교 커리큘럼에 따른 차이가 존재한다는 점에 유의해야 한다. 앞서 언급한 바와 같이, 이 난해한 데이터에 존재하는 특정 결함은 의료 훈련의 다른 곳에서 다루어질 수 있다. 이 주제에 대한 추가 연구는 학습 자료를 더 광범위하게 조사할 수 있다. 

  • 넓은 관점(즉, 강의실 및 표준화된 환자 세션에서 학습에 대한 더 많은 문서 또는 민족지학적 관찰)
  • 샘플 관점(즉, 더 많은 학교)

미래의 연구는 또한 다른 '예외적' 절차 또는 일반적으로 PE를 통한 환자 관점에 대한 지식과 인식과 관련하여 의대생들의 학습 경험에 대해 인터뷰할 수 있다.

In terms of limitations of this study, the scope of this project allowed for a critical-case sampling, and it must be noted that jurisdictional variations across school curricula do exist. As previously mentioned, certain deficiencies present in this discursive data may be addressed elsewhere in medical training. Further research into this subject could examine learning materials more extensively, from both

  • a breadth perspective (i.e. more documents and/or ethnographic observations of learning in classroom and standardised patient sessions) and
  • a sample perspective (i.e. more schools).

Future studies could also interview medical students about their learning experiences with respect to their knowledge and awareness of patient perspectives with the PE, with other ‘exceptional’ procedures or in general.

5 결론
5 CONCLUSION

PE의 가르침은 의학 교육의 문제를 제기했으며, 계속해서 그러하고 있다. 텍스트 및 시각 기반 커리큘럼은 의대생들이 배우는 방법의 한 측면을 나타내지만, 이러한 자료에서 담론은 중요하고, 그들의 해석은 다양한 환자 커뮤니티의 경험과 건강 결과에 영향을 미칠 수 있다. 이러한 이유로 교과서와 기술 기술 지침서의 기본 수준에서도 환자 중심적이고 문화적으로 유능한 접근법이 의료 커리큘럼뿐만 아니라 PE의 사례 연구에서도 더욱 강조되어야 한다. PE 훈련은 큰 진전을 이뤘고, 이 연구의 특이치 사례에서 볼 수 있듯이, 여전히 그것의 교육을 개선하기 위한 노력이 이루어지고 있다. 그러나 보다 [다양하고 포용적인 의료행위를 향한 진전]은 결코 유한하지 않으며, 바이오메디컬도 예외가 아니다. 커리큘럼은 지속적인 분석과 개선이 필요하며, PE와 다른 '예외' 절차에 대한 묘사는 특정한 주의를 필요로 할 수 있다.

The teaching of the PE has posed and continues to pose challenges in medical education. Text and visual-based curricula represent one facet of how medical students learn, but discourses in these materials matter, and their interpretations can impact the experiences and health outcomes of various patient communities. It is for these reasons that—even at the basic level of textbooks and technical skills guides—patient-centred and culturally competent approaches must be further emphasised both here in this case study of the PE as well as in the medical curriculum more broadly. PE training has come a long way, and efforts are still being made to improve its teaching, as reflected in this study's outlier cases. But progress towards more diverse and inclusive practices is never finite, and biomedicine is no exception. Curricula need constant analysis and improvement, and depictions of the PE and other ‘exceptional’ procedures may require specific attention.

 


Med Educ. 2022 Jan 27. doi: 10.1111/medu.14737. Online ahead of print.

'Poorly relaxed women': A situational analysis of pelvic examination learning materials for medical students

Affiliations collapse

Affiliation

1Faculty of Medicine, McGill University, Montreal, Quebec, Canada.

PMID: 35086164

DOI: 10.1111/medu.14737

Abstract

Background: Certain clinical pelvic examination (PE) teaching methods have been critiqued for prioritising student learning over patient autonomy and for not accurately representing diverse patient communities. As such, patient-centred and culturally competent approaches to the PE may need further emphasis in the medical curriculum-in particular, in content delivered to students before patient interaction. Classroom materials serve as students' first exposure to the sensitive procedure. This research explores how patients are represented in these materials.

Methods: A situational analysis was conducted on 10 purposively sampled PE learning materials for the 2019/20 academic year from five undergraduate medical schools in Canada. Situational analysis focuses on analysing discourse but is epistemically aligned with post-structuralism (most notably Foucault's theories involving discursive power) and allows for specific consideration of 'silences' in the data. Collected data were analysed using cartographic approaches according to this methodology, with particular attention paid to the tenets and frameworks of patient-centred and culturally competent care.

Results: Overall, content in these materials misrepresented and under-represented patients. Materials contained both outdated and unnecessarily sexualised language, in addition to a lack of patient diversity. Clinical authority was often centred over patient agency, and several updated PE techniques known to improve patient experience were absent. Patient-centred and culturally competent approaches were therefore inadequately highlighted in most of the materials.

Conclusions: Depictions contained in these materials may be perpetuating stereotypes and biases in medicine and may be working to maintain teaching practices that cause harm to patients (standardised and regular) who students interact with in both clinical and educational settings. Efforts may be needed to improve classroom materials on the PE so that they more adequately centre patients and provide opportunities to discuss culturally competent approaches to the procedure that (i) may not be covered in other parts of the PE curriculum and (ii) can reduce known health disparities.

의학적 실천과 학습에서 사회물질성: 중요한 것에 조음하기(Med Educ, 2014)
Sociomateriality in medical practice and learning: attuning to what matters
Tara Fenwick

 

'과학뿐 아니라 의학에도 예술이 있고, 따뜻함, 동정심, 이해력이 
외과의사의 칼이나 화학자의 약보다 더 클 수 있다는 것을 기억할 것이다.

‘I will remember that there is art to medicine as well as science, and that warmth, sympathy, and understanding may outweigh the surgeon's knife or the chemist's drug’.

서론
Introduction


히포크라테스의 이 말은 이상적이고 확률적인 의료 관행을 제시하고 있으며, 이타적인 환자 중심성에 지나치게 초점을 맞추고 있고, 현대 기술 과학의 복잡성과는 크게 관련이 없다는 것으로 잘못 해석될 수 있다. 그러나 이 발췌문에서는 환자가 중심 초점으로 고립되어 있지 않다. 분명한 것은 나이프와 화학 물질에 더하여, 지식 그 자체, 감정과 의미와 의료행위에는 [광범위한 사회적 힘뿐만 아니라 물질적 힘]이 발동한다는 것이다. 예술과 과학에 대한 매력은 [이성적 확실성과 학문discipline]만큼이나 [창조적인 불확실성과 즉흥성에 의존하는 광대한 세계]를 불러일으킨다. 또한 히포크라테스는 이러한 힘들, 사회적, 물질적 관계들, 그리고 이러한 관계들 속에서 의사의 함축적 의미들 사이의 상호작용을 지적한다. 실제로 히포크라테스는 의사에게 이러한 광범위한 관계 속에서의 참여자로 행동할 윤리적 책임을 부과하고 있다(I will remember 이라는 표현).

Hippocrates may be misinterpreted as presenting an idealised and probabilistic medical practice, overly focused on altruistic patient-centredness and not terribly relevant to the complexities of contemporary technoscientific medicine. Yet in this excerpt the patient is not isolated as the central focus. What is clear is the invocation of broad social as well as material forces in medical practice and knowledge per se, emotion and meaning alongside the knife and the chemical. The appeal to art and science evokes vast worlds that rely upon creative uncertainty and improvisation as much as rational certainty and discipline. Further, Hippocrates points to interplay among these forces, the relationships among the social and material, and the implication of the doctor amidst these relations. Indeed, Hippocrates clearly imposes an ethical responsibility on the doctor – ‘I will remember’ – to act as a participant within these broad relations.

전문적 실천과 학습에 대한 연구에서는 일상 업무의 이러한 사회적 물질적 관계를 왜 중요한가, 그리고 일상적 실천에 영향을 미치는 미시적 역학에 대해 우리를 맹목적으로 볼 수 있는 추상적 개념들이 어떻게 선택될 수 있는가 하는 측면에서 더 정확하게 이해하는 것에 대한 관심이 증가하고 있다. 사회 물질적 접근 방식에서 일하는 교육자들은 의료종사자에게 [실무, 지식 및 환경]을 한데 묶는 이 [일상적인quotidian 물질적 디테일]을 유의하도록 권고한다. – 단순히 연결고리에 매우 가깝게 조율하는 것뿐만 아니라, 조정하고 즉흥적으로, 끼어들고, 새로운 가능성을 포착하는 것도 가능합니다.

In studies of professional practice and learning more generally, there is growing interest in understanding these sociomaterial relations of everyday work more precisely in terms of why matter matters, and how the abstractions that can blind us to the microdynamics that influence everyday practices can be unpicked. Educators working from sociomaterial approaches are encouraging new practitioners to attend to these quotidian material details that stitch together their practice, knowledge and environments – not just to attune very closely to the connections, but also to tinker and improvise, to interrupt, and to seize emerging possibilities.

 

현재 문제
Current Issues

Mann1이 주장했듯이, [맥락]은 의료 실습과 실제 학습에서 중요하다. Mann은 학습이 개인의 인지 처리의 관점에서만 고려될 수 없다는 것을 보여 온 광범위한 연구자들에 합류한다. [학습의 내용과 과정]은 [특정 상황과 환자, 사용 가능한 도구, 기술, 사회적 관계 및 기타 환경적 역동]에 따라 크게 변화한다. [지식 '획득'과 전이transfer]라는 전통적인 은유는 ['참여'와 공동체에서의 적극적인 관여]라는 이해로 대체되고 있다. Mann은 '실천 공동체'에 초점을 맞춘 전문 교육, 경험적 학습 및 위치된 학습 환경에서의 어포던스가 널리 보급된 것을 정확하게 기록한다. 그녀는 이러한 ['사회 문화적' 학습] 관점이 의학 교육에 특히 유익하다고 결론짓는다.
As Mann1 has argued, context is critical in medical practice and learning in practice. Mann joins a broad river of researchers who have been showing that learning cannot be considered solely in terms of individual cognitive processing. The content and process of learning change dramatically with particular situations and patients, the tools available, technologies, social relations and other environmental dynamics. Conventional metaphors of knowledge ‘acquisition’ and transfer are being replaced with understandings of ‘participation’ and active engagement in communities. Mann2 accurately documents the widespread uptake in professional education of focus on ‘communities of practice’,3 experiential learning and affordances in situated learning environments. She concludes that these ‘socio-cultural’ learning perspectives are particularly fruitful for medical education.2

실제로, [사회문화적 지향]은 [지식은 [과학에 의해 개발되고, 실무자에 의해 구현]되는 것이라는 [고정된 개념]]을 가로막는 것으로서, 전문직 연구 전반에 걸쳐 중요하게 여겨졌다. 그러나, 실천적 접근은 보수주의, 관리주의, 직장에서의 권력 관계의 제한된 분석뿐만 아니라, '공동체'와 전문적 업무에서의 실천에 대한 일반적이고 거의 낭만적인 개념으로 비판을 받아왔다.
Indeed, socio-cultural orientations have been important across professional studies for interrupting fixed notions of knowledge as developed by science and implemented by practitioners. However, the community of practice approach has been critiqued not only for its conservatism, managerialism and limited analysis of power relations in workplaces, but also for its generalised and almost romantic notions of both ‘community’ and practice in professional work.4, 5

추가 이슈는 더 자세히 개발될 것입니다.

  • 첫째, 연구자들은 재료들이 능동적으로 실천과 지식을 구성하는 방법에 대해 훨씬 더 많은 인식을 요구해 왔다. 
  • 둘째로, 학생을 포함한 의료 종사자들이 직면하고 있는 실질적인 도전은 단지 다른 관점이나 의미뿐만 아니라 서로 다른 온톨로지, 즉 서로 다른 사회 물질 '세계'가 수행되고 있다는 측면에서 점점 더 이해되고 있다. 
  • 셋째, 증거 기반 프로토콜과 일상적인 실습 사이의 단절에 대한 구체적인 문제가 소개되어 의료 학습에서 이러한 일반 모델의 역할과 실습의 복잡성에서 정확히 무슨 일이 일어나고 있는지에 대한 의문이 제기된다. 

이 절을 통해 알 수 있듯이, 이러한 문제를 해결하기 위해 고군분투하는 연구자들은 새로운 이론에 도달했다. 이것들은 여기서 사회 물질적 접근이라고 널리 언급되며, 다음 절에서 설명될 것이다. 먼저, 이러한 접근법으로 이어지는 현재 문제의 예를 살펴보자.

Further issues will be developed in more detail.

  • Firstly, researchers have pressed for much more recognition of the ways that materials actively configure practice and knowing.
  • Secondly, practical challenges facing medical practitioners including students are increasingly being understood in terms of different ontologies – different sociomaterial ‘worlds’ being performed – not just different perspectives or meanings.
  • Thirdly, specific challenges about the disconnection between evidence-based protocols and everyday practice are introduced, raising questions about the roles of these general models in medical learning, as well as about what exactly is happening in the complexities of practice.

As we see throughout this section, researchers grappling with these issues have reached for new theories. These are broadly referred to here as sociomaterial approaches, and will be explained in the subsequent section. First, let us examine examples of current issues leading to these approaches.

놓치고 있는 것
Missing matter

물질matrerial(things that matter)은 종종 학습을 설명할 때 누락된다. 물질은 [인간 행동의 배경의 일부로 무시]되거나, [의식과 인식에 대한 선입견에서 무시]되거나, [인간의 의도와 설계에 종속된 그저그런brute 도구의 지위]로 밀려나는 경향이 있다. 그러나 의료 실무에서 항생제 및 진통제, 기관지 확장제 및 심전도, 카테터 및 복강경, 정책, 데이터베이스 및 프로토콜 등 특정 환경에서 사용할 수 있는 특정 종류의 재료와 그에 따른 권한의 가중치는 의료 지식뿐만 아니라 의료 지식도 근본적으로 형성한다. 맥락이 중요할 수는 있지만, 단순히 맥락을 [추상적인 컨테이너]로 이해하는 것은, 이 무수한 [비인간적 요소들]뿐만 아니라 맥락의 특정한 역학을 형성하는 [인간 요소들] 사이의 관계의 소란을 놓치는 것이다. 스톨리 박사는 환자의 안전이 종종 물질성에 대한 주의 부족으로 인해 위험에 처한다고 주장한다. 복강 내부에 밸브가 거의 남겨둘 뻔한 프로시져나, 가파른 기울기에서 마찰이 없는 테이블 매트를 가로질러 미끄러질 때 환자가 거의 떨어질 뻔한 사건을 포함하여, [환자, 보건의료인, 루틴과 함께 작용하는 물체 사이의 관계에서, 어떤 방식으로 서로를 변형시켜 위험한 상황을 만드는지]를 보여준다. 스들리는 의사들이 물질들이 실제로 어떻게 작용하는지에 대한 미시적인 세부사항들에 훨씬 더 익숙해지는 법을 배워야 한다고 주장한다.

Materials – things that matter – are often missing from accounts of learning. Materials tend to be ignored as part of the backdrop for human action, dismissed in a preoccupation with consciousness and cognition, or relegated to the status of brute tools subordinated to human intention and design. Yet clearly in medical practice, the particular kinds of materials available and the weight of authority ascribed to them in certain settings – antibiotics and analgesics, bronchodilators and electrocardiograms, catheters and laparoscopes, policies, databases and protocols – fundamentally shape practice as well as medical knowledge. Context may be critical, but to understand context simply as an abstract container is to miss the turmoil of relationships among these myriad non-human as well as human elements that shape, moment to moment, particular dynamics of context. Bleakley6 contends that patient safety is frequently put at risk precisely by lack of attention to materiality. His examples, which include that of a procedure in which a valve was almost left inside an abdominal cavity, and that of an incident in which a patient almost fell when a gel mat slid across a frictionless table mattress in a steep tilt, show how it is the relationships among objects acting together with patients, health personnel and routines that transform one another to create risky situations. Bleakley argues that doctors must learn to become much more attuned to the micro-details of how materials act in practice.6

'물질적 퍼포먼스'로서의 실질적인 과제
Practical challenges as material performances

의학교육의 주요 과제 중, 의과대학에서 의과대학으로의 주니어 의사들의 문제적 전환과 이러한 전환에 수반되는 오류에 대한 일반적인 위험은 친숙한 논의 주제이다.7 그러나, 최근의 연구는 물질적 세계가 어떻게 과도기를 수행하는 의사들의 학습에 관여하는지에 대해 더 가까이서 관찰했다. 예를 들어, Kilminster 등은 기존의 학습 모델들이 의대생들이 접하는 [일상적인 물질적 장벽]이나 [이러한 문제를 해결하기 위해 배우는 즉흥성]을 설명하지 않는다는 것을 발견했다. Orlikowski에 따라, 우리는 학생들의 정체성과 활동이 [특정한 행위를 구성하는데 작용하는 물질적 대상과 테크놀로지]와 관련하여 수행된다고 말할 수 있다.
Among the major challenges in medical education, the problematic transition of junior doctors from medical schools to wards and the general risks for error that accompany these transitions are a familiar topic of discussion.7 However, recent studies have attended more closely to how material worlds are involved in the learning of doctors undertaking transition. Kilminster et al.,8 for example, have found that conventional models of learning do not explain the everyday material barriers that medical students encounter or the improvisations they learn to work around these problems. We could say, following Orlikowski,9 that students’ identities and activities are performed into being, in relation with the material objects and technologies that act to configure particular practices.

[새로운 테크놀로지]는 (초보자들에게 뿐만 아니라) 지속적인 실질적인 도전을 제기한다. 이러한 구현은 여전히 합리주의적인 [습득-및-전이 모델]에서 진행되며, 종종 직원 워크숍(인쇄된 정보의 큰 바인더로 완성됨)에 이어 실제 구현을 모니터링하기 위한 평가까지 이어진다. 그러나 연구자들은 [구현의 실패]는 많은 물질적 요인에 달려 있으나, 그것은 거의 인식되지 못한다는 것을 발견했다. Allan은 환자 안전과 같은 새로운 통합 치료 경로가 종종 다른 논리를 따르고 다른 실천의 세계를 수행하는 기록 보관 공예품과 같은 기존의 물질적 인프라를 어떻게 방해하는지를 보여준다(범용화된 시스템이 아닌 개별화된 환자 기록). [새로운 시스템]은 말 그대로 [새로운 실천의 세계]를 도입하여, 상충되는 일련의 퍼포먼스를 생산한다. 그러나 임상의사들은 여러 퍼포먼스를 동시에 저글링하는 데 능숙하기 때문에, 앨런이 기록한 바와 같이, [서로 연결되지 않는 문서 기록물]이 쏟아져 나온다.
New technologies also pose continual practical challenges, and not only to novices. The implementation of these still tends to proceed from a rationalist acquire-and-transfer model, often through staff workshops (complete with large binders of printed information) followed up with appraisals to monitor implementation in practice. Yet researchers are finding that failure to implement relies on a host of material factors that are rarely acknowledged. Allan shows how new integrated care pathways, such as for patient safety, often interfere with existing material infrastructures such as record-keeping artefacts that follow a different logic and perform a different world of practice (individualised patient records rather than a universalised system).10 New systems literally introduce a new world of practice, producing a conflicting set of performances. Clinicians, however, are adept at juggling multiple performances simultaneously, and thus results the flurry of paper records that don't connect, as Allan10 documents.

또한, 전문직군 간 의료행위IPP는 의료 분야에서 주요 과제를 계속 제시하는데, 이는 [임상의사들 사이의 우선순위 및 언어, 중복되지만 결합되지 않은 서비스, 상호 신뢰 문제] 등과 관련이 있다. 이러한 문제에 대한 사회적, 문화적 해석을 넘어, 연구자들은 [전문 분야 간 실무에서 물질적 협상]에 점점 더 초점을 맞추고 있다. 그들은 특정 임상의사 그룹에게 특히 중요한 [기구나 텍스트]가, 어떻게 독특한 접근방식을 중개하거나, 심지어는 고정anchor시키는지 추적한다. 그들은 또한 서로 다른 실무자들이 서로 다른 방법, 다른 구체화된 관행 및 다른 인프라로 서로 다른, 심지어 상충되는 사회 물질 세계를 실제로 어떻게 수행하는지 보여준다. 이러한 연구는 현재 [서로 다른 물질적 '온톨로지'] 및 [의료종사자는 그 안에서 그리고 그것들 사이에서 일하는 법을 어떻게 배우는지]에 대해 중요한 질문을 제기하고 있으며, 그 내용은 나중에 더 언급될 것이다.

In addition, interprofessional practice continues to present major challenges in health care, which concern conflict in the priorities and languages of different clinicians, services that overlap but are not joined up, issues of mutual trust, and so forth. Moving beyond social and cultural interpretations of these issues, researchers have increasingly focused on material negotiations in interprofessional practice.11, 12 They trace how instruments or texts that have particular importance for different groups of clinicians mediate and even anchor their unique approaches. They also show how different practitioners actually perform different, even conflicting, sociomaterial worlds with different methods, different embodied practices and different infrastructures. These studies are now raising significant questions about different material ‘ontologies’ and how practitioners learn to work within and across them, about which more will be said later.

증거 기반 관행은 어디에서 왔는가?
Whence Evidence-Based Practice?

근거 기반 관행은 [통제, 즉 바람직한 결과를 도출하리라고 신뢰할 수 있는 표준화된 프로토콜]의 이상을 가정한다. 그러나 프로토콜은 [실천의 중요한 세부 사항을 추적]해보면, [종이에 나타나는 것보다, 또는 대부분의 실무자들이 인정하는 것보다] 훨씬 더 조건에 따라 달라짐contingent이 입증되었다. 실제로, [표준화된 관행]은 종종 일부 환경에서 문제가 있을 뿐만 아니라, 비판적이고 유연한 사고를 억제하는 퇴적된sedimented 패턴을 나타낸다. 예를 들어, 그루프먼은 이러한 퇴적된 패턴에서 얼마나 많은 의학적 진단 오류가 발생하는지 보여줍니다.

  • 가용성 진단(자신의 물질적 현실에서 가장 빈번한 것으로부터 해결책을 제시함)
  • 앵커링(물질적 현실을 가장 친숙하거나 바로 보이는 하나의 강력한 세부 사항과 결합한다), 
  • 또는 확증 편향(선입견이나 희망적 사고에 맞는 물질적 현실을 제시함)

Evidence-based practice presumes an ideal of control, of standardised protocols that can be relied upon to produce desirable results. Yet protocols have proven to be far more contingent when one traces the material details of practice than they ever appear on paper, or than most practitioners are prepared to admit.13, 14 Indeed, standardised practices often represent sedimented patterns that are not only problematic in some settings, but also stifle critical and flexible thinking. For example, Groopman15 shows how many patterns of medical diagnostic error accrue from these sedimented patterns, referring to

  • availability diagnosis (selecting a solution from those most frequent in one's material reality),
  • anchoring (framing material reality with one powerful detail that is most familiar or immediately visible), or
  • confirmation bias (wanting material reality to fit one's preconceptions or wishful thinking).

슈베르트와 같은 다른 사람들은 [의료행위의 우발성contingency과 부분적 해결책]을 조사하여 [신체, 기구, 기타 상충되는 프로토콜, 조직 환경의 특정 물질적 제한]에 의해 [프로토콜이 어떻게 수정되는지]를 보여주었다. 네덜란드의 한 병원에서 당뇨병 관리를 관찰하는 그녀의 오랜 연구에서, Mol17은 임상 실습이 형태를 만들고 변화하는 것을 지켜봤고, 그것들이 '끝없이 구체적이고 놀랍다endlessly specific and surprising'고 결론지었다. 깔끔하고 체계적인 치료 계획 및 프로토콜에도 불구하고 일상적인 치료는 [다루기 힘든 물질에 지속적으로 적응]해야 합니다. 

  • 기술과 신체는 행동하지 않을 수 있다;
    환자들은 실수하고 싶은 유혹을 받을 수 있다.
    그리고 모든 종류의 지저분하고, 냄새나고, 피비린내 나고, 무섭고, 지루한 활동들은 하기 어렵다.

Others, like Schubert,16 have examined the contingency and partial solutions of medical practice, showing how any protocol becomes modified by particular material limitations of bodies, instruments, other conflicting protocols, and organisational settings. In her lengthy study observing diabetes care in a Dutch hospital, Mol17 watched clinical practices taking shape and shifting, and concluded that they were ‘endlessly specific and surprising’. Despite neat and systematic treatment plans and protocols, daily care must continually adjust to unruly materialities:

  • technologies and bodies may not behave;
    patients may be tempted to err,
    and all sorts of messy, smelly, bloody, frightening and tedious activities are difficult to do.

Mol은 '과제를 숙달했더라도, 통제는 착각이다Control is an illusion even if you master the tasks'라고 결론짓는다. 거의 같은 방식으로 그루프만의 의사들은, 이용할 수 있는 의학 지식의 한계와 만일의 사태에 대한 불확실성이 있어서, 대부분 '그냥 만들어낸 것'이라고 주장한다. 그렇다면 지식, 기술, 증거 기반 프로토콜에 대한 숙달이 아니라면, 의료 관행이란 무엇일까요? 분명히, 물질은 중요하지만, 정확히 사회물질적 관점이 무엇이며, 이것들이 학습과 어떻게 관련이 있는가?

Mol concludes that ‘Control is an illusion even if you master the tasks’.17 In much the same way, Groopman's doctors claim they are, mostly, ‘just making it up’, given the limitations in available medical knowledge and the uncertainties of contingency.15 So if it is not mastery of knowledge, skill and evidence-based protocols, what then is medical practice? Clearly, materials matter, but what exactly are sociomaterial perspectives and how are these relevant to learning?

사회 물질적 관점
Sociomaterial Perspectives

사실, 다양한 이론들은 각각 다른 관점과 목적을 가진 '사회물질적(인 것)'이라고 기술될 수 있다. 이 간략한 기사의 목적은 이러한 이론에 걸쳐 공유된 특정 약속과 접근 방식에 대한 매우 일반적인 소개를 제공하는 것이다. 물론 이 전술의 위험은 유용한 이론적 세부사항과 토론이 불가피하게 모호해지고, 지나치게 단순화되거나 생략될 것이라는 점이다. 그러나 이러한 새로운 이론적 지형의 다른 지역에서 열린 의료 실무와 교육에 대한 기여의 범위와 질문을 지적하는 데 있어 얻을 수 있는 이점이 있다. 여기서는 특히 어떤 하나의 이론을 유일한 또는 '최고의' 사회 물질적 접근법으로 홍보하는 것은 피할 것이다.
In fact, a range of theories can be described as sociomaterial, each with distinct perspectives and purposes. The objective of this brief article is to provide a very general introduction to certain shared commitments and approaches across these theories. The danger of this tactic, of course, is that useful theoretical details and debates necessarily will be obscured, over-simplified or omitted. However, there are advantages to be gained in pointing to the range of contributions and questions for medical practice and education that are opened in different regions of this new theoretical landscape. This also avoids promoting any one theory in particular as the only or ‘best’ sociomaterial approach.

이 모든 관점이 공유하는 첫 번째는, [일상 업무에서 인간 활동과 맞물려 있는 역동적인 물질에 초점]을 맞추는 것이다. 이것은 Orlikowski9가 '사회와 물질의 구성적 얽힘'이라고 표현한 것이다.

'물질'은 유기적이고 무기적이며, 테크놀로지적, 자연적으로 존재하는 우리 삶의 모든 일상적 물질들을 말합니다:

  • 살과 피, 형태와 체크리스트, 진단 기계와 데이터베이스, 가구와 패스워드, 눈보라, 죽은 세포 구역 등.

'사회적'은 상징과 의미, 욕망과 두려움, 문화적 담론을 의미한다. 물질적 힘과 사회적 힘 모두 일상적 활동을 이끌어내는 데 상호 연관되어 있다. 

What all of these perspectives tend to share, first, is a focus on materials as dynamic and enmeshed with human activity in everyday practices. This is what Orlikowski9 describes as ‘the constitutive entanglement of the social and material’.

‘Material’ refers to all the everyday stuff of our lives that is both organic and inorganic, technological and natural:

  • flesh and blood; forms and checklists; diagnostic machines and databases; furniture and passcodes; snowstorms and dead cell zones, and so forth.

‘Social’ refers to symbols and meanings, desires and fears, and cultural discourses. Both material and social forces are mutually implicated in bringing forth everyday activities.

이것은 [(비록 객체와 연결을 발달시키는 분리된 주체이지만) 객체와 주체가 [상호 작용inter-act]한다]는 가정을 넘어서는 관계에 대한 이해이다. 대신에, [사회 물질적 설명]은 물리학자 바라드가 자연, 기술, 인간성, 모든 종류의 물질의 이기종 요소들의 [내부 작용intra-action]이라고 설명하는 것을 조사한다. 이러한 [요소들과 힘들은 서로 [침투]하여 (그럼으로써 함께 작용하여)], 일상 생활의 [견고한, 분리된, 불변의 물체처럼 보이는 것]을 이끌어낸다. 파동이나 입자와 같은 것들은 우리가 일상적인 물질들을 관찰하고, 일하고, 의미를 만들기 위해 사용하는 바라드가 말하는 'apparatuses'에 따라 특별한 방식으로 나타난다. 우리가 apparatuses를 관찰하고 작업하면서, 우리는 주체와 객체를 정의하는 범주를 만듭니다. 물질의 이러한 '절단'은 (주체와 물체, 활동 및 현상)을 정의하는 경계를 만들지만 [새로운 가능성]을 열어준다. 인과관계를 [원인과 결과 사이의 선형적 관계]가 아니라, [놀라운 효과를 만들어내는 얽힘]을 지칭하는 것으로 다시 생각하는 것이다.

This is an understanding of relationships that pushes beyond assumptions that objects and subjects inter-act, as though they are separate entities that develop connections. Instead, sociomaterial accounts examine what the physicist Barad18 describes as the intra-actions of heterogeneous elements of nature, technologies, humanity and materials of all kinds. These elements and forces penetrate one another – they act together – to bring forth what appear to be the solid, separate, immutable objects of everyday life. Things like waves or particles emerge in particular ways according to what Barad18 calls the ‘apparatuses’ that we use to observe, work with, and make meaning of everyday materials. As we observe and work with them, we create categories that define subjects and objects. These ‘cuts’ in matter create boundaries that define (subjects and objects, activity and phenomena) but also open new possibilities. This is a rethinking of causality as referring to entanglements with surprising effects, not linear relations between causes and effects.

여러 이론이 공유하는 두 번째 이해는 이것이다. [모든 물질 또는 더 정확히 말하면, 모든 [사회물질적 객체objects]는 사실 [이질적인 집합체]라는 것입니다. 그것들은 자연적, 기술적, 인지적 요소들의 이질적인 모임이다. 모든 개체는 도구, 장비, 프로토콜 또는 증거에 관계없이 이러한 모임의 역사history를 [설계와 축적된 사용]을 협상할 때 포함시킨다. 의학이나 의학교육의 특정한 관행을 연구할 때, 연구자들은 특정한 요소들이 어떻게 그리고 왜 조립되는가, 왜 어떤 요소들은 포함되고 다른 요소들은 제외되는가, 그리고 가장 중요한 것은 요소들이 그들이 활동할 때 어떻게 변화하는지 묻는다. 스들리는 행위자-네트워크 이론(ANT)과 같은 분석을 위한 사회 물질적 프레임워크가, 의학 교육에 명백하게 유용함에도 불구하고, 사람과 사물 사이의 관계를 강조하는데 일반적으로 사용되지 않는 것에 놀랐다고 선언한다. 이러한 관계를 통해, 사람과 사물은 새로운 문제나 가능성을 만들기 위해 서로를 번역한다.
This is a second shared understanding: that all materials or, more accurately, all sociomaterial objects, are in fact heterogeneous assemblages. They are gatherings of heterogeneous natural, technical and cognitive elements. All objects embed a history of these gatherings in the negotiation of their design and accumulated uses, whether they are instruments, equipment, protocols or evidence. In examining particular practices of medicine or medical education, researchers ask how and why particular elements become assembled, why some elements are included and others excluded, and, most importantly, how elements change as they come together, as they intra-act. Bleakley6 declares that sociomaterial frameworks for analysis, such as actor–network theory (ANT), are so obviously useful to medical education he is surprised they aren't commonly used to highlight the relationships among people and objects. Through these relationships, people and objects translate one another to create new problems or possibilities.


셋째, 사회 물질적 관점은 인간과 비인간, 하이브리드 및 부품, 지식과 시스템 등 [모든 것을 연결과 활동의 효과]로 본다. 모든 것은 [관계의 거미줄]에서 수행된다. '행위자agents, 그들의 차원, 그들의 존재와 행동은 모두 그들이 관여하는 관계의 형태에 달려 있다.' 물질은 inert한 것이 아니라 enacted된다. Materials은 물질matter이며, 중요하다matter. 다른 유형의 사물 및 힘과 함께, [물질materials는 활동activity을 배제하고, 초대하고, 규제하기 위해 행동act]한다. 이것은 물체에 에이전시가 있다고 주장하는 것이 아니다. 바늘은 정맥에 저절로 들어가지 않는다. 그러나, 캐뉼러에서, 많은 것들이 의사의 손과 함께 결합되어 작용한다: 정맥 직경 및 벽 구성, 흐름, 바늘 크기, 이전 캐뉼러 부위, 박테리아, 환자 상태, 경쟁 병동 요구 등. 어떤 의료 행위도, 개인의 능력만의 문제가 아니며, 집합적 사회물질적으로 집행된다.

Thirdly, a sociomaterial perspective views all things – human and non-human, hybrids and parts, knowledge and systems – as effects of connections and activity. Everything is performed into existence in webs of relations: ‘the agents, their dimensions and what they are and do, all depend on the morphology of the relations in which they are involved’.19 Materials are enacted, not inert; they are matter and they matter. They act, together with other types of things and forces, to exclude, invite and regulate activity. This is not to argue that objects have agency: a needle does not hop into a vein by itself. Yet, in cannulation, many things act in assemblage with the doctor's hands: vein diameter and wall composition; flow; needle size; previous cannulation sites; bacteria; the patient's condition; competing ward demands, and so on. Any medical practice is a collective sociomaterial enactment, not a question solely of an individual's skills.

 

서로 다른 관심사와 접근 방식
Different interests, different approaches

보다 심층적인 탐구에 관심이 있는 사람들을 위해, 이러한 사회 물질적 관점에 대한 완전한 입문서는 다른 곳에서 이용할 수 있다. 전문적 실천과 학습에 대한 현대 연구에서 가장 자주 나타나는 것은 ANT와 '애프터 ANT', 실천 이론, 복잡성 이론, 새로운 지리학, '새로운 유물론' 및 활동 이론이다. 행위자-네트워크 이론은 후기구조주의 지향에서 등장하며, 라투르와 몰과 같은 주요 저자들 사이의 많은 내부적 경쟁을 감안할 때, 이론이라기보다는 감성의 확산 구름에 가깝다. '관계적 중요성', '물질적 기호학', STS(과학기술 연구), '사회-기술' 연구와 같은 문헌의 많은 용어들은 ANT와 core commitment을 공유한다. 그것의 지속적인 영향력은 네트워크화된 현실관이며, 특정한 활동, 사물 및 지식을 생성하기 위해 지속적으로 조립하고 재조립하는 '네트워크'의 동등한 기여자로서 인간과 비인간 요소를 급진적으로 다루는 것이다. 교육에 대한 ANT와 '애프터 ANT' 연구에 대한 장문의 토론을 이용할 수 있다. 
For those who are interested in more in-depth exploration, a full primer to these sociomaterial perspectives is available elsewhere.20 Those that appear most frequently in contemporary research of professional practice and learning include ANT and ‘after-ANT’ approaches, practice theory, complexity theory, new geographies, ‘new materialisms’, and activity theory. Actor–network theory emerges from post-structural orientations, and is more of a diffuse cloud of sensibilities than a theory given its many internal contestations among key writers such as Latour21 and Mol.11, 17 Many terms in the literature, such as ‘relational materiality’, ‘material semiotics’, STS (science and technology studies) and ‘socio-technical’ studies share core commitments with ANT. Its lasting influences are a networked view of reality, and a radical treatment of human and non-human elements as equal contributors to the ‘networks’ that continually assemble and reassemble to generate particular activities, objects and knowledge. A lengthy discussion of ANT and ‘after-ANT’ studies in education is available.22

[복잡성 이론]은 상당히 다른 지향을 가지고 있다. 그것은 사회학에서가 아니라 주로 진화생물학과 물리학(사이버네틱스 및 일반 시스템 이론)에서 나타나는 또 다른 범위의 경쟁적 접근을 수용한다. Barad와 같은 복잡성 이론가들은 전문직 교육에 대한 연구에서 특히 영향력을 갖게 되었고, 우리가 아는 실천에서 '발현emergence', 회절 및 연결성의 역학을 연구할 것을 제안한다. 새로운 인간과 문화적 지형에 눈을 돌리면, 이 이론들은 그들이 어떻게 사회적 생산을 돕는지 보여주기 위해 전문적 실천의 물질적 공간과 장소를 조사하지만, 또한 인간의 활동과 의미에 의해 생산된다. 펜윅 등에서는 도린 매시, 데이비드 하비, 나이젤 트리프트, 앙리 르페브르와 같은 지리학자들이 널리 인용되고 있다. 그러나 교육에서 많은 관심을 끌고 있는 또 다른 연구 분야는 스스로를 '새로운 유물론new materialisms'을 언급하는 것으로 묘사하고 있다. 이들은 종종 특정 사회적, 물질적 힘이 어떻게 매우 다른 존재의 방식을 만들어내는지 조사하기 위해 immanence, 창의성, 집합성의 아이디어와 같은 철학자 질 들뢰즈의 아이디어에서 작업한다.

Complexity theory is quite different in orientation; it embraces another range of competing approaches emerging not from sociology, but chiefly from evolutionary biology and physics (as well as cybernetics and general systems theories). Complexity theorists such as Barad18 have become particularly influential in studies of professional education, and suggest that we examine dynamics of ‘emergence’, diffraction and connectivity in practices of knowing. Turning to new human and cultural geographies, these theories examine the material spaces and places of professional practice to show how they help produce the social, but are also produced by human activity and meaning. In professional education research as explained in Fenwick et al.20, geographers such as Doreen Massey, David Harvey, Nigel Thrift and Henri Lefebvre are widely cited. Yet another branch of studies that is gaining much traction in education describes itself as referring to the ‘new materialisms’.23, 24 These often work from the ideas of the philosopher Gilles Deleuze, such as those of immanence, creativity and assemblage, to examine how particular social and material forces bring forth very different ways of being.

분명히 이 짧은 기사는 전문 학습 연구에서 점점 더 중요해지고 있는 'practice theory'을 홍보하는 것을 포함하여 사회 물질적 초점과 관련된 많은 추가적인 관점을 다룰 수 없다. 이 모든 이론의 한계에 대한 논의도 여기서 생략한다. 예상대로 비판과 반론자들이 넘쳐나고, 다른 곳에서 발견될 수도 있다. 그러나 배제된 한 가지 특히 두드러진 관점은 어느 정도 설명할 가치가 있다. 바로 [문화-역사 활동 이론, CHAT]으로, 엥게스트룀의 전문적인 연구에 가장 많이 관련되어 있다. 이 이론은 건강관리 연구에서 널리 채택되었고 방법론적으로 철저히 개발되었다. 그러나, 그것의 세계관과 지식의 본질은 여기서 설명하는 다른 이론 분야에서 채택된 입장과 질적으로 다르다. 

  • 첫째, 다른 것들은 본질적으로 후기구조주의적이고 비규범적인 반면, CHAT는 자본주의 생산의 관계와 활동 시스템의 내부 모순에 대한 구조적인 마르크스주의 설명에 뿌리를 두고 있다. 
  • 둘째로, CHAT는 인간 활동 시스템을 중재하는 데 도움이 되는 물질적 유물의 중요성을 인정하지만, 이것은 인간 활동(예: 노동, 문화적 규칙과 언어, 시스템에서 인간의 목적과 의미 등)에 대해 가지는 중심적 관심사에 이어 부수적인 것secondary이다. 

Obviously this short article cannot address the many additional perspectives relevant to a sociomaterial focus, including those promoting ‘practice theory’, which are increasingly important in studies of professional learning.25, 26 Also omitted here are discussions of all these theories’ limitations. Critique and rejoinders abound, as one might expect, and may be found elsewhere.20 However, one particularly prominent perspective that has been excluded deserves some explanation: this is cultural–historical activity theory or CHAT, most associated in professional studies with Engeström.5 This theory has been widely taken up in health care research and is thoroughly developed methodologically. However, its views of the world and the nature of knowledge arguably differ qualitatively from the positions adopted by the other theory fields described here.

  • Firstly, whereas the others are essentially post-structural and non-normative, CHAT is rooted in a structural Marxist explanation of the relations of capitalist production and the internal contradictions of activity systems.
  • Secondly, whereas CHAT acknowledges the importance of material artefacts that help mediate human activity systems, this is secondary to its central concern for human activity, which encompasses the division of labour, cultural rules and languages, and the human purposes and meanings in the system. 

따라서, CHAT는 의학 교육 연구자들에게 분명히 중요하지만, 그것의 다른 지향의 결과로, 그것은 이 기사를 위해 남겨지고 있다. 여기서 '사회 물질' 이론이 의미하는 것은 ANT, 복잡성 이론, 새로운 지리 및 새로운 물질주의에서 발생하거나 영향을 받는 이론이다. 이것들은 [실천]이란 [인간 이상의 것]이며, 활동과 학습을 이해하기 위해서는 [인간의 의미와 인간 에이전시에 대한 선입견을 넘어설 필요가 있다]는 가정으로부터 시작된다.

Thus, CHAT is clearly important for medical education researchers, but, as a consequence of its different orientation, it is being set aside for this article. Here, what is meant by ‘sociomaterial’ theories are those accruing from or influenced by ANT, complexity theory, new geographies and new materialisms. These begin with the assumption that practice is more than human, and that to understand activity and learning we need to move beyond preoccupations with human meanings and human agency.

 

물질이 어떻게 실무 및 프로토콜에 중요한가
How matter matters in practices and protocols

Barad는 다음과 같이 쓰고 있다: '앎을 실천하는 것은 세상을 재구성하는 [특정한 물질적 참여]에의 관여이다.' 
Barad writes: ‘Practices of knowing are specific material engagements that participate in (re)configuring the world’.18

물질적 참여와 얽힘entanglement로서의 건강 관리 관행에 대한 면밀한 검토는 실제로 [실천이 고유한 사회 물질적 세계를 형성한다]는 것을 보여주었다. Mol11의 고전적인 연구는 실험실, 의사-환자 진료소, 방사선과, 수술실에서 제정된 이후, 하퇴부 동맥경화증의 치료법을 조사했다. Mol은 죽상동맥 경화증이 이러한 각각의 연습 환경에서 매우 다른 것으로 구체화되었다고 결론지었다. [방법, 담론, 기구의 고유한 집합]마다 서로 다른 세상을 만들었을 뿐만 아니라, 각 환경에서 다른 대상(즉 서로 다른 죽상동맥 경화증)을, 서로 다른 진단 및 치료와 함께 만들었다. 그런 다음 실용적인 질문은 우리가 어떻게 서로 다른 실천 속 앎(knowing-in-practice)세계를 결합할 수 있는지 언급하는데, 비록 그들이 그들 나름의 방법으로 [사회물질적 구성]을 통해 [다른 대상]을 생산하지만, 각각은 [같은 대상]에 관여하는 것처럼 보인다. 증거 기반 관행은 각 환경에서 기능하는 것은 의심의 여지가 없지만, 우리가 근본적인 차이를 이해하고 그들 사이에서 협상하려면 더 광범위하고 유연한 조정이 필요할 수 있다.
Close examination of health care practice as (socio) material engagement and entanglement has shown that, in fact, practices form unique sociomaterial worlds. A classic study by Mol11 examined the treatment of lower-limb atherosclerosis, following its enactment in the laboratory, doctor–patient clinic, radiology department and operating theatre. Mol11 concluded that atherosclerosis materialised as a very different thing in each of these practice settings. A unique assemblage of methods, discourses and instruments not only created a different world, but also produced a different object – a different atherosclerosis – in each setting, with different diagnostics and treatments. The practical question then refers to how we might patch together these different worlds of knowing-in-practice, which each appear to be engaging with the same object, even though they are producing a different object through the sociomaterial configurations of their own methods. Evidence-based practices are no doubt functioning in each setting, but a broader, more flexible attunement may be necessary if we are to appreciate fundamental differences and negotiate among them.

표준화된 프로토콜의 실제 사회 물질적 관행에 대한 연구는 사실, 엄격한 프로토콜조차도 항상 일종의 유연한 팅커링과 함께 독특한 방식으로 수행된다는 것을 발견했다. 급성 치료 환경에서 심폐소생술을 시행한 한 연구에서, 티머먼스와 버그는 80건 대부분의 경우에서 [프로토콜이 의도한 대로 지켜지지 않는다는 것]을 발견했다. 명시되지 않은 약물이 도입되었고, 절망적인 환자, 불안한 가족 또는 사용할 수 없는 장비의 경우 엄격한 지침이 변경되었다. 다시 말해서, 소위 표준이라고 불리는 것은, 실제로는 상호 작용interplay이며, 저자들이 '지역적 보편성local univerality'이라고 부르는 것에서 항상 새롭게 수행된다. 

Research into the actual sociomaterial practice of standardised protocols has found that, in fact, even strict protocols are always performed in unique ways with a sort of flexible tinkering. In one study of cardiopulmonary resuscitation practice in acute care settings, Timmermans and Berg27 found that in most of 80 cases protocol was not followed as intended. Drugs not specified were introduced, strict directives were altered in instances of hopeless patients, anxious families or non-available equipment. In other words, so-called standards are actually interplays, always performed anew in what the authors call ‘local universality’.27

더욱이, 의료 행위 표준의 사회적 중요성을 더 광범위하게 조사하여, 티머먼스와 버그는 [프로토콜이란 것이 어떤 방식으로 일시적인 성취인지] 보여준다. 프로토콜 설계자, 기금 기관, 관련된 의사들의 다양한 그룹, 환자의 희망과 욕망, 조직 시설, 실험실 능력, 제약 회사 및 환자 자신의 장기 탄력성을 포함한 [여러 가지 궤적이 한 순간에 함께 모인다]. 실제로 이러한 [궤적은 수행 순간의 연속적인 내부 작용intra-actions을 통해 '결정화crystallised']된다. 연구에서, 우리는 인간과 인간이 아닌 다양한 에이전트들이 상호 작용하여 문제가 되는 것들을 포함한 특정한 결정화를 만들어내는 것에 전체적으로 주의를 기울일 필요가 있다. 이에 대한 한 가지 예는 수술 체크리스트의 사용 관행에서 찾을 수 있다. 이러한 프로토콜에 대한 논쟁에서 수술 오류의 53-70%가 수술실 밖에서 발생한다는 것이 지적되었다. 

Furthermore, examining the sociomateriality of medical practice standards more broadly, Timmermans and Berg14 show how a protocol is a temporary achievement. Multiple trajectories come together in a moment, including protocol designers, funding agencies, the different groups of doctors involved, patients’ hopes and desires, organisational facilities, laboratory capabilities, drug companies, and the patients’ organs’ own resilience. In practice, these trajectories are ‘crystallised’ through continuous intra-actions in the moment of performance. In research, we need to attend holistically to the diverse agents, human and non-human, that interact to produce particular crystallisations, including those that are problematic. One example of this may be found in the practice of surgical checklist use. Among the debates around these protocols, it has been noted that 53–70% of surgical errors occur outside the operating room.28 

환자 안전 결과를 개선하기 위해, 이러한 연구자들은 체크리스트에 대한 다학제적 입력(병동 의사, 간호사, 외과의사, 마취과 의사, 수술 보조)과 다양한 수술 관리 단계(수술 전, 수술 전, 회복 또는 집중 치료, 수술 후, 수술 후)에 대한 주의를 촉구했다. 이러한 단계에 걸쳐 연구자들은 다음과 같은 [체크리스트에 포함되어야 하는 다양한 물질적 네트워크]를 보여준다. 

  • 영상 연구 검토, 필요한 모든 장비 및 재료의 설명, 환자의 수술 측면의 표시, 수술 후 지침의 인도 및 퇴원 시 환자에게 약물 처방의 제공

To improve patient safety outcomes, these researchers have urged attention to the multidisciplinary inputs into the checklist (ward doctor, nurse, surgeon, anaesthesiologist, operating assistant) and the different stages of operative care (preoperative, operative, recovery or intensive care, postoperative). Across these stages, the researchers show the diverse material networks that should be included on the checklist:

  • a review of imaging studies; an accounting of all necessary equipment and materials; the marking of the patient's operative side; the hand-off of postoperative instructions, and the provision of medication prescriptions to the patient at discharge.

사회물질적 접근법은 이처럼 [자연, 문화, 테크놀로지 사이의 미시적 관계]를 따르는 데 초점을 맞춘다. 중요한 가정은 이것들이 [우발적이고, 계속적이며, 항상 재연되고re-enact 있다]는 것이다. 사회물질적 접근법의 목표는 [무엇을 정의]하거나 [무엇이 되어야 하는지 규정]하기 위한 것이 아니라, '물질화matter-ing'의 과정, 즉 [사물과 가능성]이 지속적으로 [존재와 관계] 속으로 유입되는 과정을 면밀히 추적하는 것이다. 바라드의 용어로, '세계는 서로 다른 주권적agential 가능성의 실현에 있어서 의미와 형태를 획득하는 "mattering" 그 자체를 통해 지속적으로 열린 문제의 과정이다.

Sociomaterial approaches to practice focus on following these microdynamic relations among nature, culture and technology. The critical assumption is that these are contingent, ongoing and are always being re-enacted. The aim is not to define what is or to prescribe what should be, but to follow closely what emerges through processes of ‘matter-ing’, that is, processes by which things and possibilities are continually brought into being and into relationships. In Barad's terms, ‘the world is an ongoing open process of mattering through which “mattering” itself acquires meaning and form in the realisation of different agential possibilities’.29

이것의 한 가지 예는 기술이 새로운 형태의 의료 행위를 형성하는 방식에 있다.

  • 샌델로프스키 박사는 환자의 신체에 대한 온정적 관리와 함께 환자의 신체에 대한 영상기술과 디지털 표현이 확산되면서, 간호 실습에서 터치의 중요성이 사라지고 있다고 주장한다.
  • Johnson은 어떻게 특정한 테크놀로지가 다른 [의료 관행]뿐만 아니라 다른 [지식]을 불러일으키는지를evoke 보여준다. 그녀는 사회 물질 분석을 사용하여 실제로 미국과 스웨덴의 산부인과 시뮬레이터를 비교하며, 이러한 [시뮬레이터가 서로 다른 목적으로 구상되고 구성된다는conceived and constructed 점]에 주목한다. 존슨에게 이것은 모델 타당성이 무엇을 의미하는지에 대한 의문을 제기한다.
    • 학생 의사와 시뮬레이터 사이의 '내부 작용'에 관하여
    • 시뮬레이터 설계자와 의료 행위 사이의 '내부 작용'에 관하여
    • (더 넓게는) 이렇게 구성된 관행을 통해 [여성의 신체가 어떻게 생산되는지]에 관하여
  • 오를리코프스키가 전문적인 일에서 기술에 대한 그녀의 많은 연구를 통해 주장하듯이, 이 모든 논의의 요점은 [테크놀로지의 고유한 힘]이 아니라, [사람들이 실제로 테크놀로지에 관여할 때 수행되는 다양한 효과와 정체성]이다. 기술은 선험적으로 주어지지 않는 결과를 가진 물질이지만, 항상 실제에서 인간과의 상호작용을 통해 수행된다. 연구자는 사람과 테크놀로지 사이의 관계에서 일어나는 일에 집중해야 한다.

One example of this is in the ways that technologies are shaping new forms of medical practice.

  • Sandelowski30 argues that the importance of touch in nursing practice is vanishing, along with compassionate care for patients’ material bodies, with the proliferation of imaging technologies and digital representations of patient bodies.
  • Johnson31 shows how particular technologies evoke different knowledges as well as different medical practices. She uses a sociomaterial analysis to compare US and Swedish gynaecological simulators in practice, noting that these are conceived and constructed differently and for different purposes: each reflects and produces a different approach to bimanual pelvic examinations. For Johnson,31 this raises questions about what model validity means,
    • about the ‘intra-actions’
      • between student doctors and simulators, as well as
      • between simulator designers and medical practice, as well as
    • broader issues about how the female body is being produced through the practices configured here.
  • The point in all of these discussions, as Orlikowski9 argues through her many studies of technology in professional work, is not the inherent power of technology, but the different effects and identities that become performed when people engage with technology in practice. Technologies are materials with outcomes that are not given a priori, but are always performed through interaction with humans in practice.9 The researcher must focus on what goes on in the relationships among people and technologies.

그러나 어떠한 방식으로 이러한 효과 중에서 [일부 관행과 객체]는 표준화된 프로토콜과 같은 강력한 어셈블리로 안정되고 정착되는, 반면 다른 것들은 눈에 띄지 않게 되는가? 라투르는 [사실의 문제matter of fact]와 [우려의 문제matter of concern]를 구분한다.

  • [사실의 문제]는 결정되고, 확실하고, 해결되었다고 가정되는 모든 것들이다. [어떻게 작동하는지 제대로 알지 못한 채 운전하는 자동차]처럼, 이런 것들은 [어떻게, 왜 만들어졌는지에 대한 비판적인 질문의 대상이 되지 못한 채]로 실제로 사용되는 '블랙박스'입니다. 블랙박스는 '사실들facts'일 수도 있지만, 일상 업무에서 [관행, 정책, 텍스트, 도구]일 수도 있다.
  • [우려의 문제]는 이슈, 논란, 불확실성이다. 그러나 라투르와 다른 사회 유물론자들이 주장하듯이, [확정된 사실로 받아들여지는 관행]의 대부분의 것들은 [논쟁이 은폐되거나 가려져 있는, 실제로는 정말 관심을 가져야 할 문제]이다. 

But how, among these effects, do some practices and objects become stabilised and entrenched as powerful assemblages – such as standardised protocols – while others go unnoticed? Latour21 delineates matters of fact from matters of concern.

  • Matters of fact are all those things that are assumed to be decided, certain and settled. Like a car that we drive without really knowing how it works, these things are ‘black boxes’ that are used in practice without being subject to critical questioning about how and why they were constructed. Black boxes can be ‘facts’, but they can also be practices, policies, texts and tools in everyday work.
  • Matters of concern are issues, controversies, uncertainties. Yet as Latour21 and other sociomaterialists12 contend, most things that are accepted as settled facts of practice are really matters of concern on which debate has been foreclosed or obscured. 

사회-물질주의자의 목표는, 논쟁을 풀어내어, 마치 사실의 문제인 것처럼 가장하는 블랙박스를 여는 것이다. 이것은 우리가 학습을 [준비와 역량의 획득으로 인식하는 것]에서, 학습을 [조정, 반응 그리고 심지어 중단으로 보는 것]으로 전환해야 한다는 것을 암시한다.

The socio-materialist aim is to unpick the controversies and open the black boxes that masquerade as matters of fact. This suggests that we should turn from perceiving learning as preparation and the acquisition of competency, to seeing learning as attunement, response and even interruption.

실천과 학습에 대한 시사점
Implications for Practice and Learning

사회 물질적 관점에서는, [학습과 지식은 집행enactment]이며, 단순한 정신 활동이나 수용한 지식이 아니다. 결국, 정신mind라는 것은 [수많은 환경적 물질과의 지속적인 신경학적 연결의 역동]입니다. 사회 물질적 관점은 개인 학습에서 더 큰 사회 물질 집단으로, 그리고 젠슨이 설명하듯이 '인식론과 표현에서 실질적인 존재론과 성과주의로' 이동한다.
In sociomaterial perspectives, learning and knowing are also enactments, not simply mental activity or received knowledge. Mind, after all, is a dynamic of continuous neurological connections with the myriad matter of environments. Sociomaterial perspectives shift from an individual learning subject to the larger sociomaterial collective, and ‘from epistemology and representation to practical ontology and performativity’, as Jensen32 explains.

우리가 에이전시로 가득 찬 세상을 받아들일 때, 무언가를 할 때, 배움은 오로지 [지식적 표상을 습득함으로써 이 세상을 준비하는 것]만 강조하기보다, [그 자리in situ에서 현명하게 참여하는 과정]으로 바뀐다. 학습에서의 이슈는 다음과 같은 것이다.

  • 어떻게 작은 변동과 놀라움에 적응할 수 있는지,
  • 어떻게 해결된 것처럼 보이는 문제를 중단하고, [우려의 문제]에 대해 공개적인 논쟁을 벌이는지,
  • 어떻게 자신과 타인이 창발하는 사회물질적 상황에 미치는 영향을 추적할지
  • 어떻게 해결책을 즉흥적으로 만드는지

When we accept a view of the world full of agency, doing things, learning shifts from its sole emphasis on preparing for this world by acquiring knowledge representations, to a process of participating wisely in situ. Learning issues concern

  • how to attune to minor fluctuations and surprises,
  • how to interrupt matters that seem settled and hold open controversies for matters of concern,
  • how to track one's own and others’ effects on the emerging sociomaterial situation, and
  • how to improvise solutions.

알츠하이머병 치료법에 대한 그녀의 연구에서, 모저는 의료에서 물질적 집행을 알츠하이머병의 생의학 과학과 비교하는데, 우리는 그것의 특징적인 병리학적 변화로 대표되는 것에 대해 제한된 이해를 가지고 있다. (신경섬유 엉킴, 시냅스 손실, 세포사, 뇌수축 등이 질병 자체의 원인, 결과 또는 징후인지 알 수 없다.) 임상 실습용 교과서에서 인용한 모서는 하나의 긴장tension을 보여준다: 여기서 치료에서 알츠하이머 병의 '문제matter'는 개별 뇌의 병리학적 변화로 표현되는 것이 아니라, (보호자, 친척, 의료 종사자 및 환경을 포함하는) 인간 및 비인간 참여자 집단 간의 애착attachment으로 표현된다

In her study of treatments for Alzheimer's disease, Moser12 compares the material enactments of medical practice with the biomedical science of Alzheimer's disease, in which we have limited understanding of what is represented by its characteristic pathological changes (we do not know if neurofibrillary tangles, synapse loss, cell death, brain shrinkage and so forth are causes, consequences or manifestations of the disease itself). Citing from textbooks for clinical practice, Moser12 shows a tension: here the ‘matter’ of Alzheimer's disease in treatment is not represented biomedically as pathological changes in individual brains, but as attachments among a collective of human and non-human participants that include carers, relatives, health practitioners and the environment. 

그녀는 계속해서 다른 임상실천을 탐구합니다. 이 모든 것들이 [관계의 시스템]에 전제되어 있습니다. 관계에는 제약적인 관계도 있고(아세틸콜린에스테라아제 억제제 등) 또는 상호작용적 관계도 있다(네덜란드에서 개발된 마르테메오 커뮤니케이션 기반 치료제 등). 이러한 각각의 개입에서, 알츠하이머 병은 다르게 프레임화되고 제정된다. 모저의 핵심 질문은 어떤 방법이 가장 좋은가, 또는 어떤 알츠하이머 병의 제정이 가장 진실하거나 유효한가에 대한 것이 아니다. 대신, 그녀의 관심은 이렇나 것이다.

  • 어떻게 서로 다른 [물질적 집행]들이 어떻게 서로 영향을 주고 간섭하는지,
  • 무엇이 더 또는 덜 가시화되고 무엇이 더 또는 덜 현실적이 되는지,
  • 어떻게 임상 실습의 일부로서 생물의학의 역할이 작용하는지

She goes on to explore other clinical practices, all of which are premised on a system of relationships, whether pharmaceutical (such as acetylcholinesterase inhibitors) or interactional (such as the so-called Marte Meo communication-based treatment developed in the Netherlands).12 In each of these interventions, Alzheimer's disease is framed and enacted – materialised – differently. Moser's key question is not about which method is best, or which enactment of Alzheimer's disease is the most true or valid.12 Instead, she is interested in

  • how these different material enactments influence and interfere with one another,
  • what becomes more or less visible and what becomes more or less real, and
  • how the role of biomedicine works as part of the reality of clinical practice.12

아마도 의학 교육자들에게 특별한 관심사는 환자와 이용 가능한 기관의 치료와 함께 이러한 경쟁적인 버전과 그들의 토론을 중재해야 하는 일반 의사의 입장에 대한 모저의 강조이다. 이러한 중재mediation은 정치적 행위political practice이다. 즉, 논리적이고 분명한 방향의 의미라면, [진정한 선택real choice이란 없다]. 의사는 [각 결정에 수반되는 집행enactment의 일부]가 되고, [돌봄은 진화에 따라 집단에 지속적으로 조정되고 적응하는 과정]이다. 몰은 당뇨병 치료에 대한 연구에서도 비슷한 결론을 내립니다. '통제란 환상이며, 모든 요소들은 변덕스럽다'. 주요 업무는 '모든 것을 다른 모든 것에 맞추는 것이다. 무엇을 만지작거리고, 무엇을 고쳐야 할지가 명백한 경우는 거의 없다. 하려고 하는 일은 잘 안 될 수도 있다. 그러면 다른 것을 해봐야 한다. 계속 땜질을 해야 한다. 닥터링, 그리고 캐어링.' 그루프먼은 심장 생리학에서도 진단과 치료의 전체 사회 물질적 과정에서 나타나는 [예상치 못한 작은 신호에 밀접하게 지속적으로 주의를 기울이는 연습]이 연역적 추론보다 더 생산적일 수 있음을 보여준다.

Perhaps of particular interest for medical educators is Moser's highlighting of the position of the general practitioner, who must mediate these competing versions and their debates, alongside the unique contingencies of the patient and the available institutional care.12 This mediation is a political practice – there is no real choice in the sense of a logical and clear direction here. The doctor becomes part of the enactment with each decision, and care is a process of continuous attunement and adjustment to and with the assemblage as it evolves. Mol17 comes to a similar conclusion in her study of diabetes treatment, in which ‘control is illusionary and all the elements … capricious’. The main task, Mol17 learns, involves ‘attuning everything to everything else, one way or another. What to fiddle with and what to keep fixed, is rarely obvious. What you try to do may not work out. Try something else. Keep on tinkering. Doctoring. Caring’. Groopman15 shows that even in cardiac physiology, practices of attending closely and continuously to unexpected tiny signals emerging in the whole sociomaterial process of diagnosis and treatment can be more productive than deductive reasoning.

의학을 배우는 것은 [땜질의 기술art of tinkering]을 배우는 것을 포함할 수 있다. 의학은 [국지화된 사회물질적 실천, 즉흥작업, 우발적 협상의 집합]으로 간주될 수 있다. 의학교육은 다음을 더 자세히 살펴볼 수 있다.

  • 특정 장소에서 전문가들이 일을 하는 방식에 가장 영향을 미치는 물질적 요소
  • 어떻게 물질이 실천의 가능성을 제한하거나 향상시키는가
  • 왜 특정 실천이 안정되고 강력해지며, 이러한 블랙박스가 문제를 일으킬 때는 언제인가

Learning to do medicine may then include learning the art of tinkering. Medicine can be appreciated as a set of localised sociomaterial practices, improvisations and contingent negotiations. Medical education can look more closely at

  • the material elements that most influence the ways professionals in a particular place do their work,
  • how materials limit or enhance possibilities for practice,
  • why particular practices become stabilised and powerful and when these black boxes create problems.

학습, 특히 직장 학습은 다음 사항에 집중할 수 있습니다.

  • 사소한 것, 심지어 일상적인 것, 요동, 기이한 실수를 다루는 것,
  • 새로운 아이디어와 행동 가능성에 조음attuning하기 - 즉, 진행중인 물질 과정mattering process의 intra-action
  • [창발하는 것]에 자신과 다른 사람이 미치는 영향을 알아차리기
  • 불확실성 속에서 땜질하기,
  • 논쟁과 소동을 막기 위해 실천의 블랙박스를 중단시키기

Learning, particularly workplace learning, can focus on:

  • attending to minor, even mundane, fluctuations and uncanny slips;
  • attuning to emerging ideas and action possibilities – the intra-actions of ongoing mattering processes;
  • noticing one's own and others’ effects on what is emerging;
  • tinkering amidst uncertainty, and
  • interrupting black boxes of practice to hold open their controversies and disturbances.


전반적으로 사회 물질적 관점은 바라드의 말에 따르면 

  • '앎이란 직접적인 물질적 관여이며, 모여있는 것을 절단하는 것으로, 절단은 폭력을 가하지만, 가능성의 행위적agential 조건을 열어주어, 재작업한다.'

Overall, sociomaterial perspectives help to illuminate how, in Barad's words,

  • ‘knowing is a direct material engagement, a cutting together-apart, where cuts do violence but also open up and rework the agential conditions of possibility’.33

 

결론들
Conclusions

[가능성을 여는 동시에, 무언가를 정의]하는 이 [절단의 역설paradox of the cut], [언제나 물질적으로 불확실한 이성적 확실성]은 의학에서 예술을 감상하는 우리의 출발점을 상기시킨다. 히포크라테스는 의료 윤리와 책임에 관심이 있었다. 이해와 공감을 촉진하는 데 있어서, 그는 분명히 [관계의 중요성]을 주장하고 있었다. 물론, 후속 토론은 환자의 요구에 더 민감하게 반응하도록 의사를 훈련시키는 것이 생물의학에서 역량의 핵심 가치를 위협하는지 여부에 대해 의문을 제기해 왔다. 그러나 히포크라테스의 경구는 [한 사람의 물질적 실천]에 있어서 [인간적 연결과 비인간적 연결 둘 다에 감사하는 것]으로 해석할 수도 있다. 히포크라테스는 과학과 예술을 함께 호출하면서, [이성적인 프로토콜]뿐만 아니라 [불확실성과 즉흥성을 위한 공간]을 허용하는 것의 중요성을 열어준다. 여기에는 작업 중인 수많은 시스템에 대한 조정과 이러한 시스템에 대한 의사 자신의 개입이 절개, 약물 치료, 측정 및 카테터화 시 필요하다.
This paradox of the cut that defines while opening possibilities, the rational certainty that is always materially uncertain, recalls our starting point of appreciating the art in the science of medicine. Hippocrates was concerned with medical ethics and responsibility. In promoting understanding and sympathy, he was clearly arguing for the importance of relationships. Of course, subsequent debates have wondered whether training doctors to be more responsive to patient needs threatens core values of competence in biomedical science. Yet it may also be possible to interpret Hippocrates as appreciating both the human and the non-human connections of one's material practice. His invocation of art alongside science opens the importance of allowing space for uncertainty and improvisation, as well as rational protocols. Here lies a call for attunement to the myriad systems at work, and practitioners’ own enmeshment within these systems when they cut open, drug, measure and catheterise bodies.

이것은 미래의 의학 교육을 옹호하는 사람들에게 반향을 불러일으키며, 그들은 [폭넓은 글로벌 감각]뿐만 아니라, 즉각적인 [국지적 사회물질적 관계]에 대한 조정을 강조한다. Hodges 등이 밝힌 의료 교육의 10가지 우선순위 중 많은 것은 지역 사회의 요구를 해결하면서 더 넓은 시스템에서 자신의 영향을 이해하는 것, 다양한 행위자와 환경과의 관계 조정, 학습 맥락의 다양화, 전문 분야 간 및 인트라 프랙티스의 진전에 초점을 맞추고 있다. [사회적 책임]은, 쿠퍼와 디온이 [기술과학]과 [환자의 높은 기대]라는 세계 속에서 실천이 이뤄지는 [의학교육의 '재민주화']를 요구하는 주요 주제이기도 하다. 
This resonates with advocates for future medical education, who emphasise attunement to socio-material relations in immediate local as well as broader global senses. Among the 10 priorities for medical education articulated by Hodges et al.34 are many focused on understanding one's effects in wider systems while addressing local community needs, attuning to relationships with diverse actors and environments, diversifying learning contexts and advancing inter- and intraprofessional practice. Social responsibility is a major theme too in Kuper and D'Eon's call for a ‘re-democratisation’ of medical education that humanises practice in a world of technoscience and patients’ high expectations.35

이러한 주장이 [예술과 과학], [생물의학과 환자의 이해], 또는 [증거에 기반한 연습과 일상적인 즉흥 연주 사이]의 [이분법]을 만들거나 재현하자는 것이 아니다. 콘토스가 보여주었듯이, '환자 중심의' 공감형 바이오소셜 의학에 '환원론자' 바이오의학을 반대하는 것은 거짓 전쟁을 일으키고, 더 풍부한 가능성을 닫아버리는 것이다. 여기서 개략적으로 설명한 의료 관행과 학습의 현재 이슈는, [다양한 힘 사이의 상호 작용]과 [이것들이 함께 만들어내는 실천의 집행을 검토]하는 데 관심을 두고 있다. [사회물질적 관점]은 실제와 학습에서 특정 현실을 이끌어내는 [인간 및 비인간 관계의 모세혈관]을 추적하는, 동시에 [변화의 기회와 진입점]을 강조하는 방법을 제공한다. 그러한 관점에서, 실무자들은 모든 만남에서 이용할 수 있는 알려지지 않은 급진적인 미래 가능성뿐만 아니라 물질적 참여의 폭력성을 충분히 인식하도록 장려된다.

The argument is not about creating or recreating dichotomies between art and science, biomedicine and patient understanding, or evidence-based practice and everyday improvisation. As Kontos36 has shown, to pitch ‘reductionist’ biomedicine against ‘patient-centred’ empathic biosocial medicine is to create a false war and shut down richer possibilities. The current issues of medical practice and learning outlined here point instead to an interest in examining the interplay among these diverse forces, and the enactments of practice they produce together. Sociomaterial perspectives offer a way to trace the capillaries of human and non-human relationships that bring forth particular realities in practice and learning, while highlighting opportunities and entry points for change. With such a perspective, practitioners are encouraged to appreciate fully the violence of their material engagements as well as the unknown radical future possibilities that are available in every encounter.

 


Med Educ. 2014 Jan;48(1):44-52. doi: 10.1111/medu.12295.

Sociomateriality in medical practice and learning: attuning to what matters

Affiliations collapse

1School of Education, University of Stirling, Stirling, UK.

PMID: 24330116

DOI: 10.1111/medu.12295

Abstract

Context: In current debates about professional practice and education, increasing emphasis is placed on understanding learning as a process of ongoing participation rather than one of acquiring knowledge and skills. However, although this socio-cultural view is important and useful, issues have emerged in studies of practice-based learning that point to certain oversights.

Methods: Three issues are described here: (i) the limited attention paid to the importance of materiality - objects, technologies, nature, etc.-- in questions of learning; (ii) the human-centric view of practice that fails to note the relations among social and material forces, and (iii) the conflicts between ideals of evidence-based standardised models and the sociomaterial contingencies of clinical practice.

Discussion: It is argued here that a socio-material approach to practice and learning offers important insights for medical education. This view is in line with a growing field of research in the materiality of everyday life, which embraces wide-ranging families of theory that can be only briefly mentioned in this short paper. The main premise they share is that social and material forces, culture, nature and technology, are enmeshed in everyday practice. Objects and humans act upon one another in ways that mutually transform their characteristics and activity. Examples from research in medical practice show how materials actively influence clinical practice, how learning itself is a material matter, how protocols are in fact temporary sociomaterial achievements, and how practices form unique and sometimes conflicting sociomaterial worlds, with diverse diagnostic and treatment approaches for the same thing.

Conclusions: This discussion concludes with implications for learning in practice. What is required is a shift from an emphasis on acquiring knowledge to participating more wisely in particular situations. This focus is on learning how to attune to minor material fluctuations and surprises, how to track one's own and others' effects on 'intra-actions' and emerging effects, and how to improvise solutions.

고약한 문제 씨름하기: 어떻게 행위자의 이론이 새로운 통찰을 줄 수 있는가(Med Educ, 2017)
Tackling wicked problems: how theories of agency can provide new insights
Lara Varpio,1 Carol Aschenbrener2 & Joanna Bates3,4

 

 

 

서론
Introduction

보건 직업 교육(HPE)이 직면하고 있는 일부 도전은 너무 복잡하고 다루기 힘들어서, 우리의 집단적인 해결책에 대한 조각에도 불구하고, 그들은 해결책을 무시한다. 이러한 도전은 '유순한tame 문제'와 구별되는 '사악한 문제'로 정의할 수 있다. 유순한 문제는 다음과 같다.

  • (i) 명확한 문제 진술을 식별할 수 있다. 
  • (ii) 기존의 과학적 또는 분석적 수단을 사용하여 실행 가능한 솔루션을 개발할 수 있다. 
  • (iii) 전문가는 옳고 그름을 객관적으로 평가할 수 있는 솔루션을 생성할 수 있다.

Some of the challenges facing health professions education (HPE) are so complex and unwieldy that, despite our collective chipping away at solutions, they defy resolution. These challenges can be defined as ‘wicked problems’, which are distinct from ‘tame problems’.1 Tame problems are those for which:

  • (i) a clear problem statement can be identified;
  • (ii) workable solutions can be developed using traditional scientific or analytical means, and
  • (iii) experts can generate solutions that can be objectively evaluated as being right or wrong.1 

사악한 문제는 유순한 문제의 반대이다.

  • 사악한 문제들은 잘 정의된 문제 진술에 저항한다. 그것들은 너무 '사회적으로 지저분해서' 모든 참여자와 이해관계자들이 문제의 근원을 다르게 설명한다.
  • 사악한 문제는 또한 [전통적인 선형적 분석 접근 방식]을 통한 해결에도 저항한다. 그들은 문제가 해결되는 동안 변할 수 있는 많은 사회적, 정치적 요소들을 포함한다. 이러한 비선형적이고 끊임없이 변화하는 풍경은 사악한 문제를 해결하는 데 전통적인 분석 수단을 적합하지 않게 만든다.
  • 사악한 문제는 참 또는 거짓 결론으로 해결되지 않는다. 대신 해결책은 현재 특정 상황에서 작동하지만 반드시 장기적으로 작동하지는 않을 수 있으며, 이해관계자마다 좋은지 나쁜지에 따른 판단이 다를 수 있다.

요컨대, 사악한 문제들은 명확한 문제 진술에 저항하고, 전통적인 분석 접근 방식을 무시하고, 결정적인 해결책을 거부한다.
Wicked problems are the opposite of tame problems. Wicked problems resist well-defined problem statements; they are so ‘socially messy’
2 that every participant and stakeholder describes different roots to the problem.3 Wicked problems also resist resolution through traditional linear analysis approaches.1 They involve many social and political factors that can change while the problem is being addressed.4 This non-linear and everchanging landscape makes traditional means of analysis ill suited for addressing wicked problems. Wicked problems are not resolved with true-or-false conclusions; instead, solutions are stakeholder-dependent judgements of better-or-worse alternatives that work in a specific context for the moment but not necessarily in the long term.3 In sum, wicked problems resist clear problem statements, defy traditional analysis approaches, and refuse definitive resolution.


우리는 정기적으로 HPE에서 사악한 문제에 부딪친다. 다양성과 포용력 격차를 해소하고, 효과적인 학생 교정조치를 달성하고, 전문성을 가르치는 것은 사악한 문제들이 우리 공동체에 직면하는 맥락의 일부일 뿐이다. 보건 전문 교육자들은 정의상, 그들이 각 맥락에서 그들 자신을 독특하게 드러내고, 해결책을 회피하고, '최고의 관행' 요약으로 단순화되기를 거부할 때, 어떻게 그러한 문제와 씨름할 수 있는가?

We regularly come up against wicked problems in HPE. Addressing diversity and inclusion disparities, achieving effective student remediation and teaching professionalism are just some of the contexts in which wicked problems confront our community. How can health professions educators contend with such problems when, by definition, they manifest themselves uniquely in each context, eschew resolution, and refuse to be simplified into ‘best practice’ summaries?

우리는 [theory-informed 연구]가 학자들이 복잡한 HPE 문제와 싸우는 데 도움이 될 수 있다고 제안한 다른 사람들의 권고에 공명한다. 우리는 이론이 사악한 문제를 해결하는 데 도움을 줄 수 있다고 제안함으로써 그 주장을 확장한다. 이론에 정통한 연구를 통해 학자들은 '왜 사물이 작용하고 어떤 조건에서 작용하는지'를 이해하기 위한 국지적 개입과 전략을 검토할 수 있다. 이러한 명확화 연구는 HPE 커뮤니티가 사악한 문제를 해결하고 문맥을 통해 이전 가능한 학습 교훈을 설명하는 데 도움이 된다. HPE 학자들이 연구에 광범위한 이론(예: 장르 이론, 인지 부하 이론, 행위자 네트워크 이론, 문화 역사 활동 이론, 자기 결정 이론)을 사용했지만, 많은 이론들이 아직 우리의 영역을 괴롭히는 다루기 힘든 문제에 적용되지 않았다. HPE 학자들이 공통의 근본적인 문제와 사악한 문제에 대한 잠재적 해결책을 식별하기 위해 활용할 수 있는 한 가지 개념은 [에이전시 agency, 행위자성]이다.
We echo the recommendations of others who have suggested that theory-informed research can help scholars contend with complex HPE problems.5, 6 We extend that argument by suggesting that theory can help us address wicked problems. Theory-informed research enables scholars to examine local interventions and strategies to ‘understand why things work and under which conditions’.5 Such clarification research7 helps the HPE community to tackle wicked problems and to describe lessons learned that are transferable across contexts. Although HPE scholars have used a wide range of theories in their research (including, for example, genre theory,8, 9 cognitive load theory,10, 11 actor-network theory,12 cultural historical activity theory [CHAT]13, 14 and self-determination theory15), many theories have yet to be applied to the intractable problems plaguing our domain. One concept that might be harnessed by HPE scholars to identify common underlying issues and potential solutions to wicked problems is agency.

에이전시에 대한 많은 이론적인 치료법이 있지만, 에이전시의 핵심은 [개인이 개인과 사회 생활에서 통제력을 행사할 수 있는 정도]에 관한 것이다. 다시 말해서, 개개인에게 Agency은 다음과 관련된다

  • (i) 무언가 할 수 있는 능력capacity
  • (ii) 무엇인게에 대한 조건condition
  • (iii) 의도성과 권력을 가지고 행동하는 상태 

HPE의 많은 사악한 문제들은 본질적으로 사회적인 것이다. 예를 들어 교육생과 교직원, 환자와 가족, 관리자 및 전문 간 팀을 포함한다. [에이전시 이론]들은 그러한 대인관계적 도전들을 검토하는데 도움이 된다.

There are many theoretical treatments of agency, but, at its core, agency is concerned with the extent to which individuals are able to exert control in their personal and social lives. In other words, agency is concerned with an individual’s

  • (i) capacity to,
  • (ii) conditions for, and
  • (iii) state of acting with intentionality and power.16 

Many of HPE's wicked problems are social in nature: they involve, for example, trainees and faculty members, patients and families, administrators and interprofessional teams. Theories of agency lend themselves to the examination of such interpersonal challenges.

기관의 개념은 HPE 연구에서 아직 널리 채택되지 않았지만, 더 넓은 교육 분야는 교육 관련 문제를 해결하기 위한 수단으로 기관을 사용했다. 예를 들어, 기관은 과학의 가르침과 학습을 개선하고, 학생의 목소리를 키우고, 학습 활동 동안 학생들의 참여를 증가시키는 것에 대한 문의에 대해 알려왔다. 이러한 발전은 HPE로 확대될 수 있다.
Although conceptions of agency have yet to be widely adopted in HPE research, the broader field of education has used agency as a means of addressing education-related problems. For example, agency has informed inquiry into improving the teaching and learning of science,17, 18 cultivating the student's voice,19, 20 and increasing student engagement during learning activities.21 These advances could be extended to HPE.

[개인들이 서로 다른 상황마다 어떻게 행위자성을 주장하는지(또는 주장하지 않는지)] 설명하지 않는 것은 HPE 학술연구에서 중요한 누락이다. 행위자성은 본질적으로 HPE의 개입, 평가 구조 및 광범위한 개념화에 관여한다. 우리는 에이전시의 렌즈를 통해 HPE가 직면하고 있는 문제를 조사하는 것이 우리 사회의 장학금에 의미 있게 기여할 수 있다고 제안한다. 이 제안을 뒷받침하기 위해,

  • 우리는 먼저 네 가지 다른 대리 이론을 확인하고 설명할 것이다. 
  • 둘째로, 대리인의 각 이론이 어떻게 사악한 문제에 대한 새로운 사고방식을 지원할 수 있는지를 설명하기 위해 IPE의 예를 사용한다. 
  • 셋째, 이러한 틀에 의해 명백해진 연구와 혁신을 위한 방향을 제안하라.

Failing to account for how individuals assert (or fail to assert) agency in different situations is a significant omission in HPE scholarship. Agency is inherently involved in HPE's interventions, evaluation structures and broad conceptualisations. We suggest that examining problems facing HPE through the lens of agency can meaningfully contribute to our community's scholarship. To support this proposal,

  • we will firstly identify and describe four different theories of agency,
  • secondly, use the example of interprofessional education (IPE) to illustrate how each theory of agency can support new ways of thinking about a wicked problem, and,
  • thirdly, suggest directions for research and innovations that are made evident by these framings.

방법들
Methods

HPE의 사악한 문제를 해결하는 데 도움이 될 수 있는 기관의 일부 이론에 대한 개요를 구성하기 위해, 우리는 HPE 공동체 구성원으로서 우리의 역할에서 다루기 힘들다고 느낀 문제의 유형을 식별하는 것으로 시작했다. 그 과정을 알리기 위해, 우리는 HPE에 대한 경험과 전문지식을 이용했습니다. 우리의 협업 팀은 PhD로 훈련된 HPE 연구 과학자(LV)와 의료 교육 리더십 경험(JB 및 CA)을 가진 두 명의 의사로 구성된다. 그 연구 과학자는 인문학과 사회과학의 이론들을 연구하는데 있어서 광범위한 훈련과 경험을 가지고 있다. 의사들은 입학처장, 과정장, 커리큘럼장, 학부 프로그램장, 대학원 프로그램장, 학술 보건 센터의 최고 책임자를 포함한 여러 의학 교육 지도자의 역할을 수행했다. 우리는 에이전시 이론이 HPE의 더 복잡한 문제를 보는 데 유용한 렌즈를 나타낼 수 있는지 함께 고려했다. 우리는 Agency를 고려하는 것이 사악한 문제를 다르게 볼 수 있게 해준다는 것에 빠르게 동의했다.

To construct an overview of some theories of agency that could help us to tackle HPE's wicked problems, we began by identifying the types of problems that we found intractable in our roles as HPE community members. To inform that process, we relied on our experience and expertise in HPE. Our collaborative team consists of a PhD-trained HPE research scientist (LV) and two physicians with medical education leadership experience (JB and CA). The research scientist has extensive training and experience in working with theories from the humanities and social sciences. The physicians have served in multiple medical education leadership roles, including as admissions dean, course director, curriculum dean, undergraduate programme dean, postgraduate programme director, and chief executive officer of an academic health centre. Together we considered whether theories of agency might represent lenses through which it would be useful to view HPE's more complex problems. We quickly agreed that considering agency allowed us to view wicked problems differently.

그런 다음 에이전시 이론이 다루기 어려운 문제를 검토하거나 해결하기 위한 노력을 알려 주었는지 확인하기 위해 HPE 문헌을 검색했다. 의학 교육 문헌을 찾아본 결과 theories of agency 이 거의 주목을 받지 못했다는 것을 발견했다. 이것은 우리가 의학 교육 문헌을 넘어 연구를 확장하도록 자극했다. 공식적인 체계적 검토는 검색 범위를 제한하기 위해 일련의 결과, 측정 또는 포함 및 제외 기준을 정의하도록 했지만, 우리의 의도는 공식적인 문헌 검토를 수행하지 않았다. 오히려, 우리는 어떤 theories of agency가 HPE의 사악한 문제에 유용하게 적용될 수 있는지 이해하고, 이 적용에 대해 개발할 수 있는 후속 통찰력을 고려하려고 노력했다. 

We then searched the HPE literature to establish whether theories of agency had informed efforts to examine or contend with intractable problems. Our search of the medical education literature found that theories of agency had received little attention. This spurred us to extend our search beyond the medical education literature. Although a formal systematic review would have had us define a set of outcomes, measures, or inclusion and exclusion criteria to limit the scope of our search, our intention was not to conduct a formal literature review. Rather, we sought to understand which theories of agency might be usefully applied to HPE's wicked problems and to consider subsequent insights that we might develop about this application.

우리는 출판된 문헌의 특정 부분집합에서 대리 이론의 사용을 검토하거나, 대리 이론을 사용한 문헌을 비판하거나, 서로 다른 인식론적 또는 존재론적 근거에서 대리 이론에 대한 논쟁을 검토하려고 하지 않았다. 우리는 이론들을 서로 비교하거나, 그것들을 공통의 원리의 목록으로 합성하거나, 어떤 특정한 이론이 개별적인 사악한 문제들을 가장 잘 다룰 수 있는지를 결정하는 것을 추구하지 않았다. 비록 이 모든 것이 훌륭한 학문적 목표이지만, 우리는 먼저 theories of agency가 HPE 공동체가 직면하고 있는 사악한 문제에 가치 있게 적용될 수 있는지 확인할 필요가 있다고 느꼈다. 따라서, 우리는 에이전시의 어떤 이론을 탐구하기 시작했습니다. 

  • (i) 다른 영역의 학자들에 의해 일반적으로 사용되었습니다. 
  • (ii) HPE의 사악한 문제를 분석하는 데 도움이 될 수 있다.

We were not seeking to examine the use of theories of agency in a specific subset of the published literature, to critique the literature that used different theories of agency, or to examine debates about theories of agency from different epistemological or ontological grounds. We did not seek to compare the theories against each other, to synthesise them into a list of common principles, or to determine which specific theory might best address individual wicked problems. Although these are all laudable scholarly goals, we felt it was necessary to first ascertain if theories of agency were valuably applicable to the wicked problems facing the HPE community. Therefore, we set out to explore which theories of agency:

  • (i) were commonly used by scholars in different domains, and
  • (ii) might help inform the analysis of HPE's wicked problems.

이러한 초점을 감안할 때, 우리는 [내러티브 리뷰]에서 기술을 빌려 우리의 검색 프로세스를 개발했는데, [내러티브 리뷰]는 광범위한 연구 영역을 매핑하고, 한 분야의 기존 과제에 대한 새로운 통찰력을 제시하기 위해 문헌과 이론을 합성하는 것으로 기념되었기 때문이다. 또한, [내러티브 리뷰]는 검토 과정에서 광범위한 출판 장르를 통합한다. theories of agency은 종종 데이터 기반 연구 보고서가 아닌 철학 논문에서 보고되기 때문에 이러한 광범위한 포함은 우리의 목적을 위해 필요했다. 우리는 검색 범위를 제한하기 위해 정의된 결과, 측정 또는 포함 및 제외 기준을 사용하지 않았다. 대신, 우리는 1994년부터 2014년까지 발행된 간행물에 대해 광범위한 분야(특히 ERIC [교육 자원 정보 센터], Web of Science, Scopus, MEDLINE 및 PubMed)를 색인화하는 데이터베이스를 검색했다. 
(검색어: [대리점, 대리점] 및 [이론 또는 이론] 및 [교육]).

Given this focus, we borrowed techniques from narrative literature reviews to develop our search processes because narrative reviews have been celebrated for mapping out broad areas of research22 and for synthesising literatures and theories in order to present new insights into a field's existing challenges.23, 24 Furthermore, narrative reviews incorporate a broad scope of publication genres in the review process.25 Such broad inclusion was necessary for our purposes because theories of agency are often reported in philosophical treatises, and not in data-based research reports. We did not use a defined set of outcomes, measures, or inclusion and exclusion criteria to limit the scope of our search. Instead, we searched databases indexing a broad scope of disciplines (specifically: ERIC [Educational Resources Information Centre], Web of Science, Scopus, MEDLINE and PubMed) for publications published from 1994 to 2014 that examined agency or incorporated an agency-informed perspective in their research (search terms: [agency, agentic OR agent] AND [theory or theoretical] AND [education]).

한 저자(LV)는 이 검색에서 발견된 모든 출판물을 검토하여 각 기사에 사용된 기관의 이론을 확인하고 기술했다. 그 후 이 저자는 각 기관의 이론을 설명하는 원문(예: 철학 논문, 사회과학 이론 출판물)뿐만 아니라 이들 출판물에 인용된 문헌을 읽음으로써 이들 출판물에 기술된 기관의 이론을 연구했다. 상호 참조를 용이하게 하기 위해, 본 저자는 이러한 검색 과정에서 발견된 서로 다른 theories of agency의 목록을 만들고 각 이론의 핵심 원리, 연구 초점 및 원본 저자들을 식별했다. 표 1은 이 목록의 약식 버전을 보여줍니다.

One author (LV) reviewed all the publications found in this search to identify and describe the theory(ies) of agency used in each article. This author then studied the theories of agency described in these publications by reading the literature cited in these publications, as well as the original texts describing each theory of agency (e.g. philosophical treatises, social science theory publications). To facilitate cross-referencing, this author created a list of the different theories of agency found during these searches, and identified some of each theory's key principles, research foci and original authors. Table 1 presents an abbreviated version of this list.

이 과정을 통해 HPE의 복잡한 문제에 적용할 수 있다고 판단한 10가지 에이전시 이론을 확인하였다. 이것들은 (여기서는 이론을 옹호하는 핵심 이론가의 성이나 기관이 언급되는 이론적 틀의 이름으로 식별된다.) 아헨, 아처, 반두라, 빌렛, 불터, 수다, 클레그, 기든스, 맥나이, 로스. 본 논문에서 발표를 위한 이론을 선택하기 위해, 우리는 우리가 사악한 문제의 기준을 충족한다고 느꼈고, 그리고 우리 세 그룹 모두가 어떤식으로든 경험했다고 느낀 (예: 행정 지도자로서, 연구 주제 등으로) 세 가지 HPE 문제와 관련하여 각 기관의 이론을 조사했다

  • 커리큘럼 개혁, 
  • IPE,
  • 역량 기반 교육.

Through this process, we identified 10 theories of agency that we considered applicable to HPE's complex problems. These were (identified here by the last name of the key theorist championing the theory or the name of the theoretical framework within which agency is addressed): Ahearn; Archer; Bandura; Billett; Bulter; CHAT; Clegg; Giddens; McNay, and Roth. To select theories for presentation in this paper, we examined each theory of agency in relation to three HPE problems that we felt met the criteria of wicked problems, and that all three of our group had experienced in some capacity (e.g. as an administrative leader, as a topic of research, etc.): curriculum reform; IPE, and competency-based education.

그런 다음 HPE 분야의 집단 경험을 활용하여 HPE의 특정 난치성 문제에 대한 새로운 통찰력을 제공하는 능력 측면에서 각 이론을 논의, 반성 및 고려하였다. 팀으로서, 우리는 각 theory of agency가 이 세 가지 HPE 문제에 대한 우리의 이해를 어떻게 재구성할 수 있는지, 그리고 그 문제를 해결하기 위한 원인과 잠재적 수단을 분석하기 위한 각 이론의 잠재력을 탐구했다. 두 명의 저자(LV, JB)는 또한 서로 다른 사악한 문제에 대해 연구하고 있는 다른 HPE 동료들과 이러한 이론들을 논의함으로써 에이전시 이론이 다른 복잡한 문제들을 어떻게 알릴 수 있는지 확인했다. (구체적으로는,

  • 전문 간 진료에 대한 환자 경험,
  • 커리큘럼 개편에서 모듈 디렉터의 업무,
  • 학부 의학 교육에서 학생 자율 학습.

2년 동안 이러한 논의와 성찰에 참여함으로써, 우리는 만장일치로 HPE의 사악한 문제와 특히 관련이 있다고 결정한 네 가지 이론을 확인했다. 이 네 가지 이론의 다양성은 팀 내 논의뿐만 아니라 특히 복잡한 문제를 연구하는 다른 HPE 학자들과의 논의에서도 매우 다른 아이디어를 낼 수 있게 해주었다.

We then drew on our collective experience in the HPE field to discuss, reflect on and consider each theory in terms of its ability to provide new insights into specific intractable problems in HPE. As a team, we explored how each theory of agency might reshape our understanding of these three HPE problems, and then each theory's potential to inform analysis of causes and potential means for addressing those problems. Two authors (LV, JB) also checked how theories of agency might inform other complex problems by discussing these theories with other HPE colleagues working on different wicked problems (specifically,

  • patient experiences of interprofessional team care,
  • the work of module directors in a reformed curriculum, and
  • student self-regulated learning in undergraduate medical education).

By engaging in these discussions and reflections over a 2-year period, we identified four theories that we unanimously decided were particularly relevant to HPE's wicked problems. The diversity of these four theories enabled very different ideas to emerge not only in discussion within the team, but also in discussions with other HPE scholars examining particularly complex problems.

본 논문에서, 우리는 이 네 가지 이론 각각에 대한 소개 개요를 제공하고, Agency가 IPE에 성공적으로 관여하는 과제에 각 theory of agency을 적용하여 [사악한 문제에 새로운 빛을 비추는 방법]을 설명한다. IPE는 전문가 간 협업 관행(ICP)에 대한 이해에 기초하므로, IPE의 기관 정보 검사는 ICP의 일부 측면을 검사하는 것을 포함한다. 우리는 에이전시 이론을 IPE의 도전(및 관련될 경우 ICP)에 적용하기로 선택했는데, 이는 그들이 명백히 사악한 문제일 뿐만 아니라 우리 팀이 이러한 도전들에 대한 상당한 경험을 가지고 있기 때문이다. (즉, 

  • 한 저자[CA]는 IPE를 개발하고 IPE에 초점을 맞춘 보건 전문 교육에 관한 의학 연구소의 글로벌 포럼에 참여한 여러 학교와 상담했다. 
  • 두 명의 저자[LV]와 [JB]는 IPE와 ICP에 발표된 연구자이며, 두 명의 임상의 저자[CA]와 [JB]는 의료 경력을 전문가 간 팀에서 실습하는 데 보냈다.

In this paper, we offer an introductory overview of each of these four theories, and illustrate how agency can shed new light on wicked problems by applying each theory of agency to the challenges of successfully engaging in IPE. As IPE rests on an understanding of interprofessional collaborative practice (ICP), our agency-informed examinations of IPE involve the examination of some aspects of ICP. We chose to apply theories of agency to the challenges of IPE (and, when relevant, ICP) not only because they are clearly wicked problems, but also because our team has considerable experience with these challenges (i.e.

  • one author [CA] consulted with a number of schools that developed IPE and served on the Institute of Medicine Global Forum on Health Professions Education, which focused on IPE;
  • two authors [LV and JB] are published researchers in IPE and ICP, and both clinician authors [CA and JB] have spent their medical careers practising in interprofessional teams).

 

IPE에 에이전시 이론 적용
Applying theories of agency to IPE

기관이 HPE의 사악한 문제를 어떻게 새롭게 조명할 수 있는지를 설명하기 위해, 우리는 IPE와 관련된 경우 ICP에 성공적으로 관여하는 몇 가지 과제에 네 가지 에이전시 이론을 적용한다. 우리는 먼저 IPE가 사악한 문제의 정의에 어떻게 부합하는지 설명한다. 다음으로, 우리는 네 가지 다른 관점에서 에이전시 이론을 제시한다.

  • (i) 주디스 버틀러의 후기구조주의적 지향; 
  • (ii) 앤서니 기든스의 사회학적 지향
  • (iii) CHAT의 지향
  • (iv) 알버트 반두라의 사회적 인지 심리학적 지향

우리는 에이전시에 대한 각 접근 방식을 설명하고 IPE의 문제 중 하나에 적용한다. 이 이론과 설명 조직을 통해 (다른 기관 이론가들이 효과적으로 사용한 접근방식), 우리는 각각의 에이전시의 각 공식화가 기존 HPE 문제에 대한 새로운 통찰력을 어떻게 제공할 수 있는지 보여준다.

To illustrate how agency can shed new light on HPE's wicked problems, we apply four theories of agency to some of the challenges of successfully engaging in IPE and, when relevant, ICP. We first describe how IPE fits the definition of a wicked problem. Next, we present theories of agency from four distinct perspectives:

  • (i) Judith Butler's post-structural orientation;
  • (ii) Anthony Giddens’ sociological orientation;
  • (iii) CHAT's orientation, and
  • (iv) Albert Bandura's social cognitive psychology orientation.

We describe each approach to agency and apply it to one of the problems of IPE. Through this theory-and-illustration organisation (an approach that has been effectively used by other agency theorists26, 27), we demonstrate how each formulation of agency can provide new insights into existing HPE problems.

버틀러, 기든스, 챗 학자, 반두라 모두 theories of agency을 구성하지만, 그들은 서로 다른 방식으로 그리고 매우 다른 언어를 사용한다는 것을 주목할 필요가 있다. 이 논문의 초점은 에이전시 이론이 사악한 문제에 대한 새로운 통찰력을 제공할 수 있는 방식으로 제한된다. 우리는 이러한 방향들 중 어느 하나에서든 전체 작업에 대한 완전한 설명과 적용을 제공하지 않으며, 우리는 다른 이론 자체에 대한 논쟁에 관여하지도 않는다. 오히려, 우리는 이러한 이론에서 도출된 individual agency의 개념에 특히 초점을 맞춘다.

It is important to note that although Butler, Giddens, CHAT scholars and Bandura all construct theories of agency, they do so in different ways and using very different language. The focus of this paper is limited to the way in which theories of agency can provide new insights into wicked problems; we do not offer full explanations and applications of the complete body of work from any of these orientations, nor do we engage in debate about the different theories themselves. Rather, we focus specifically on concepts of individual agency drawn from these theories.

직업 간 교육과 실습: 사악한 문제
Interprofessional education and practice: a wicked problem

IPE에 대한 관심과 요구는 수십 년 동안 꾸준히 증가하고 있다. 오늘날, IPE에 대한 지지는 널리 퍼져 있다. 최근의 검토에서 명확히 요약한 바와 같이: 

  • '만약 우리가 학생들이 팀워크와 전문적인 역할에 대해 배우고, 협력적인 연습을 할 준비가 되기를 바란다면, 우리가 건강 전문 교육과정에 팀워크를 포함시켜야 하며, 결정적으로, 미래의 협업을 촉진하기 위해 학습 활동을 제공하는 가장 효과적인 방법을 탐구하는 것이, 논리적일 뿐만 아니라 교육적으로도 필요할 것이다.’ 

Interest in and calls for IPE have been growing steadily for decades.28, 29 Today, support for IPE is widespread. As a recent review clearly summarises:

  • ‘If we expect students to learn about teamwork and professional roles, and to be ready for collaborative practice, it seems both logical and educationally necessary that we include teamwork in health professional curricula and, critically, that we also explore the most effective way of delivering learning activities to promote future collaboration.’30

IPE의 필요성을 일반적으로 수용함에도 불구하고, IPE 이니셔티브의 구현, 유지 및 평가는 여러 가지 이유로 복잡하고 이해하기 어려운 목표로 남아있다. 
Despite the general acceptance of the need for IPE, the implementing, sustaining and evaluating of IPE initiatives remain complex and elusive goals for multiple reasons.

첫째, IPE 이니셔티브를 개발, 시작 및 유지하는 것은, [사회적으로 혼란]스럽고, [일반적으로 합의된 문제 진술을 무시]하는 일련의 어려움을 유발한다. IPE 이니셔티브를 개발, 개시 및 평가하는 데 필요한 시간을 감안할 때, 구현 환경의 사회적, 정치적 지형은 자주 변경될 수 있다. IPE의 성공에 중요한 챔피언들은 그 기관을 떠날 수도 있다. 세션을 수행하는 교수진이 변경될 수 있으므로 지속 가능성을 위해 지속적인 교수진 개발이 필요합니다. 이러한 사회적 역동적인 맥락에서 IPE 이니셔티브에 참여하는 각 개인은 상호 전문적으로 일하고 IPE 프로젝트를 구현하는 데 필요한 전문적 기술에 대해 고유한 관점을 가질 수 있다. 결과적으로, 각 개개인마다 IPE 이니셔티브가 성공 또는 실패하는 이유에 대해 고유한 관점을 가집니다. 행정 구조(예: 프로그램 운영 비용, 학술 정책), 개별 교수진 및 보건 전문직 학생들은 모두 IPE 이니셔티브의 결과에 영향을 미치는 중요한 요인이다. 간단히 말해서, IPE의 성공 또는 실패에 대한 근본적인 이유를 확정적으로 식별할 수 없다. 각 이해관계자의 개별 관점은 IPE 이니셔티브의 다른 측면을 장애 또는 촉진자로 강조한다. 그러므로 [IPE 문제의 단일하고 확정적 공식을 합의하기 위해 노력하는 것]은 헛된 일이다.

First, developing, launching and maintaining an IPE initiative poses a set of challenges that are socially messy and defy commonly agreed-upon problem statements. Given the time needed to develop, launch and evaluate an IPE initiative, the social and political landscape of the implementing context is subject to frequent change. Champions of IPE, who are critical to its success,31, 32 may leave the institution. The faculty staff who deliver the sessions may change, requiring continuous faculty development for sustainability. In such socially dynamic contexts, each individual involved in the IPE initiative may hold a unique perspective on the profession-specific skills required to work interprofessionally and to implement the IPE project. Consequently, each individual has a unique perspective on the reasons why IPE initiatives are successful or fail. Administrative structures (e.g. the cost of running programmes, academic policies),33 individual faculty members34 and the health professions students are all critical factors impacting the outcomes of an IPE initiative. In short, the foundational reasons for the success or failure of IPE cannot be conclusively identified; each stakeholder's individual point of view highlights a different facet of the IPE initiative as an impediment or facilitator. Thus, striving for consensus on a single, definitive formulation of the IPE problem is futile.

둘째로, IPE 혁신의 효과를 분석하는 것이 문헌에서 뜨겁게 논의되고 있다. 이는 부분적으로 표준 분석 접근법이 IPE 구조에 맞지 않기 때문이다. 예를 들어, 대부분의 보건 전문가들이 교육생을 개별적으로 평가하지만, 최근의 보고서에 따르면 교육생에서 IPE 역량을 평가하는 데 사용할 수 있는 몇 가지 검증된 도구는 팀 성과에 초점을 맞춘다.35 또한 전문 인증 기관은 종종 '동일한 직업의 자격을 갖춘 직원이 학생을 평가한다'고 요구한다. 다만 IPE가 전문 간 학습과 협업을 육성하려면, 연수생이나 심사원의 직업에 관계없이, 모든 전문가가 개별 연수생 평가에 발언권을 가져야 하지 않을까? 실제로, IPE를 커리큘럼에 통합하여 [전문직 간 팀]의 파워를 활용하려고 하다보면, 우리는 전통적인 분석 및 평가 시스템이 과제에 적합하지 않다는 것을 인정해야 한다.
Secondly, analysing the effectiveness of an IPE innovation is hotly debated in the literature. This is in part because standard analysis approaches do not fit the IPE construct. For instance, although most health professions assess their trainees individually, recent reports indicate that the few validated tools available for assessing IPE competency in trainees focus on team performance.35 Further, professional accreditation bodies often require that ‘qualified personnel from the same profession assess students’.30 However, if IPE is to foster interprofessional learning and collaboration, shouldn't all professionals have a say in the assessment of individual trainees, regardless of the trainee's or assessor's profession? Indeed, if we are to harness the power of interprofessional teams by incorporating IPE into our curricula, we need to acknowledge that traditional analysis and assessment systems are ill suited to the challenge.


마지막으로, 보건 전문직 인가 기관이 거의 만장일치로 보건 전문 학교에 훈련생 팀워크 준비를 구현하고 강화하도록 요구했지만, 개별 기관에서 IPE를 어떻게 구현해야 하는지에 대한 합의된 접근법은 없다. 2005년과 2010년 사이에 동료 검토 문헌에서 보고된 IPE 활동의 최근 검토에서는 광범위한 이니셔티브 설계를 설명한다.

  • 개입 기간은 6시간에서 1년 사이였다.
  • 빈도의 관점에서 상호작용은 일회성 활동일 수도 있고, 1년에 걸쳐 여러 번 발생하거나 연간 사건일 수도 있다.
  • 교육 전략이 다양하다.
    • 소규모 그룹 토론에서부터 대규모 그룹 강의에 이르기까지,
    • e-러닝 기회에서 직접 대면하는 직업 쉐이딩에 이르기까지,
    • 시뮬레이션 기반 교육에서 환자 상호 작용에 이르기까지 

Finally, although health professions accreditation bodies have almost unanimously required health professions schools to implement and strengthen trainee teamwork preparation,36-40 there is no agreed-upon approach as to how IPE should be implemented at individual institutions. A recent review of the IPE activities reported in peer-reviewed literature between 2005 and 2010 describes a wide range of initiative designs:

  • the duration of interventions ranged from 6 hours to 1 year;
  • in terms of frequency, interactions might be one-time activities, or occurr multiple times over a year, or be annual events; and
  • educational strategies ranged
    • from small-group discussions to large-group lectures,
    • from e-learning opportunities to face-to-face job shadowing, and
    • from simulation-based training to direct patient interactions.41 

이러한 가변성을 감안할 때, 모든 경우에 통용될 수 있는 IPE나, '딱 이렇게 되어야 하는' IPE란 없다. IPE의 이니셔티브는 지역적으로 구성되며, 그러한 맥락에서 이해관계자와 관련이 있으며, 반드시 다른 학교로 전이transfer할 수 있는 것은 아니다.

Given this variability, it is clear that there is no one-size-fits-all,42 this-not-that IPE solution. Initiatives in IPE are locally constructed, relevant to the stakeholders in that context, and are not necessarily transferable to other schools.

요컨대, IPE는 사악한 문제의 정의에 부합한다. 우리는 다음과 같이 묻는다. IPE 이니셔티브와 성공 가능성을 개선하기 위해 어떻게 서로의 경험을 통해 배울 수 있을까요? 우리는 에이전시 이론이 IPE의 도전과 우리가 서로 배울 수 있는 잠재적으로 이전 가능한 솔루션에 대한 새로운 통찰력을 얻는 데 도움이 될 수 있다고 제안한다.

In sum, IPE fits the definition of a wicked problem. We are left to ask: How can we learn from each other's experiences in order to improve our IPE initiatives and their likelihood of success? We suggest that theories of agency can help us gain new insights into the challenges of IPE and the potentially transferable solutions we can learn from one another.

 

주디스 버틀러의 에이전시에 대한 후기구조주의적 접근 방식
Judith Butler's post-structural approach to agency


IPE은 '양질의 의료를 효율적으로 전달하기 위한 효과적인 협업을 촉진하는 통찰력, 공유 지식 및 팀워크 기술'의 개발을 지원하는 것으로 홍보되어 왔다.  효과적인 전문가 간 팀 간 협업이 환자 치료에 긍정적으로 기여하는 것으로 크게 인식되지만, 효과적인 전문가 간 팀을 위한 구축과 교육은 많은 해결되지 않은 문제의 대상이 된다. 주요 질문은 다음과 같습니다.

  • 왜 유능한 개인 실무자로 구성된 팀이 반드시 유능한 팀을 대표하지 않는가? 
  • 왜 어떤 사람이 한 팀에서는 유능한 팀원이 될 수 있지만 다른 팀에서는 그럴 수 없는가? 

Interprofessional education has been touted as supporting the development of ‘insights, shared knowledge and teamwork skills that promote effective collaboration to deliver high-quality care efficiently’.43 Although effective interprofessional team collaboration is largely recognised as positively contributing to patient care, building and educating for effective interprofessional teams remain subject to many unresolved issues. Dominant questions include:

  • Why does a team made up of competent individual practitioners not necessarily represent a competent team?44 
  • Why can an individual be a competent team member in one team, but not in another?44

규제 기관, 전문 조직 및 HPE 학자들은 [전문 간 협업 역량interprofessional collaborative competence]을 이해하고 정의하기 위해 노력하고 있습니다. 능력의 문제를 검토하면서, Hodges와 Lingard는 [역량 담론의 건설적인 힘]에 관심을 끈다. (즉, 특정 장소와 시간에 유능한 전문가가 되는 것이 무엇인지 이해하는 데 있어 언어, 행동 및 자료에 내재된 힘). 
이러한 관점에서,

  • [전문 간 협업 역량]의 담론은 [전문직 간 팀에서 유능한 임상의가 되는 것]이 무엇인지에 대한 각 제공자의 이해를 형성한다.
  • 그런 다음 이러한 담론은 IPE 이니셔티브에 정보를 제공합니다.
  • 담론은 IPE 이니셔티브에 구체화되어 있으며, 담론에서 제공된 정의에 따라 trainees를 유능한 팀 구성원이 되도록 교육한다.

Regulatory bodies, professional organisations and HPE scholars are working to understand and define interprofessional collaborative competence. In examining the question of competence, Hodges and Lingard draw attention to the constructive power of the discourses of competence (i.e. the power embedded in the language, behaviours and materials that shape understanding of what it is to be a competent professional in a specific place and time).44 From this perspective,

  • the discourses of interprofessional collaborative competence shape and build each provider's understanding of what it is to be a competent clinician in an interprofessional team.
  • These discourses then inform IPE initiatives.
  • The discourses are embodied in IPE initiatives, educating trainees to be competent team members according to the definitions provided in the discourses.

[전문가 간 협업 역량의 담론]이 [개별 임상의의 Agency]와 어떻게 불가분의 관계에 있는지 조사하면 효과적인 IPE 개입의 구성에 대한 이해를 높일 수 있다. [임상의가 교육을 받는 담론]이 [개인적 힘power에 대한 이해]를 형성한다. 이러한 담론은 [행동하고, 상호작용하고, 전문가들 간의 팀을 포함한 특정한 맥락에서 반응해야 하는 힘power]을 형성한다. IPE를 통한 전문 간 협업 역량 구축의 에이전시의 종류를 이해하기 위해, Butler의 에이전시에 대한 사후 구조 개념은 특히 도움이 된다.
Examining how discourses of interprofessional collaborative competence are inextricably linked to an individual clinician's agency can enhance our understanding of the construction of effective IPE interventions. The discourses with which and through which clinicians are educated shape each individual's understanding of his or her personal power. These discourses shape the power he or she has to act, to interact and to react in specific contexts, including that of the interprofessional team. To understand the kind of agency our discourses of interprofessional collaborative competency construct via IPE, Butler's post-structural conception of agency is particularly helpful.

Butler가 설명한 Agency
Agency as described by Butler

후기구조주의자들은 일반적으로 [Agency을 Discourse과 분리할 수 없는 것]으로 생각한다. [담론]은 [특정 시점에 합법적이라고 간주되는 관행(예: 언어, 행동 및 물질적 관행)과 관련 표현(예: 언어 및 언어, 성과 및 외모, 건축 및 제도)]으로 이해될 수 있다.

  • 후기구조주의 이론가들이 흔히 조사하는 문제는 [개인적 경험의 현실을 구성하고, 의미를 부여하는 데 있어서, 담론의 역할]에 관한 것이다.
  • 많은 포스트 구조주의 학자들에게 있어서 담론은 [조직적인 사고방식]으로 생각되며, 이는 곧 [행동방식]이 된다.
  • 이러한 관점에서 담론은 Agency와 불가분의 관계에 있다. 담론은 [개인이 되는 것이 의미하는 것]과 [개인이 취할 수 있는(또는 취할 수 없는) 행동의 종류]에 대한 바로 그 개념을 구성한다.

Post-structuralists generally conceive of agency as inseparable from discourse. Discourse can be understood as the practices (e.g. the linguistic, behavioural and material practices44) and their associated representations (e.g. speech and language, performance and appearance, architecture and institution44) that, at a given point in time, are considered legitimate.

  • An issue commonly investigated by post-structural theorists concerns the role of discourse in constructing and giving meaning to the reality of personal experiences.
  • For many post-structuralist scholars, discourse is conceived of as organising ways of thinking, which, in turn, become ways of acting.
  • From this perspective, discourse is inextricably joined with agency: discourse constructs the very idea of what it means to be an individual and the kinds of actions that an individual can (or cannot) take.


이러한 관점과 관련된 저명한 후기구조주의 학자는 주디스 버틀러이다. 버틀러는 [담론]이 [개인이 점유할 수 있는 특정한 사회적, 개인적 역할을 구성한다]고 주장한다. 버틀러에게 이러한 역할은 개인에 의해 사용되고 개인을 둘러싸고 있는 담론에 의해 구성된다. 이런 관점에서 볼 때, 개인은 단순히 태어날 때부터 그곳에 있는 것이 아니다. 개인은 사용하는 담론을 통해 자기자신을 존재하게 한다. 개인이 사용하는 담론은 개인을 구속하거나 권한을 부여empower한다.

  • 예를 들어, 버틀러는 젠더는 개인의 타고난 내적 특성이 아니라고 제안한다. 대신 담론을 통해 개인이 수행하는 것이다. 반복적인 공연을 통해, 개인은 그 혹은 자신을 [젠더화된 사람gendered person]으로 만든다.
  • 비슷하게, 개인은 전문직의 담론에 참여함으로써 그 또는 자신을 의사로 만든다.

개인은 어떤 담론을 사용할지 선택할 때 agency를 갖는다. 개인은 이용 가능한 담론과 그 안에서 구성되는 역할을 맡음으로써 자기자신을 구성, 해체, 재구성할 수 있다. 이런 관점에서 Agency는 담론의 수준에서 존재한다. 연습 기관은 개인이 performance을 선택할 것을 요구하고, 따라서 그 또는 자신을 창조할 담론을 선택할 것을 요구한다. 

An eminent post-structuralist scholar associated with this perspective is Judith Butler.45, 46 Butler argues that discourse constructs specific social and personal roles (which Butler labels ‘subject positions’) for individuals to occupy.46 For Butler, these roles are constructed by the discourses that are used by and that surround an individual. From this perspective, an individual isn't simply there from birth. An individual brings him or herself into being through the discourses he or she uses. The discourses an individual uses both constrain and empower that individual.

  • For instance, Butler proposes that gender is not a natural, internal quality of an individual. Instead, it is something that is performed by an individual through discourse. Through repeated performances, the individual makes him or herself into a gendered person.
  • Similarly, an individual makes him or herself into a physician by engaging with the discourses of the profession.

The individual has agency when he or she chooses which discourses to use. An individual can construct, deconstruct and reconstruct him or herself by taking up an available discourse and the roles constructed therein.47 Agency exists, in this perspective, at the level of discourse.27 To exercise agency requires the individual to choose a performance, and thus to choose a discourse through which to create him or herself.46, 48

Butler의 에이전시 개념을 프로페셔널 간 협업 역량에 적용
Applying Butler's conceptions of agency to interprofessional collaborative competency

버틀러의 관점을 이용하여 전문 간 협업 역량의 담론을 조사함으로써, 우리는 임상의들이 활발하게 수행하고 있는 기관을 식별할 수 있다. 우리는 의사와 관련된 [전문 간 협업 능력]의 담론을 통해 이 적용사례를 설명한다. [전문 간 협업 역량]의 담론은 [의료 팀에서 유능한 의사로 인정받기 위해 개별 의사가 특정한 방식으로 생각하고 행동하도록] 한다. 예를 들어 소아과 마일스톤 프로젝트 보고서는 소아과 의사와 관련된 각 역량에 대한 지식, 기술 및 태도의 진행 상황을 설명한다. 이 보고서는 다음과 같은 전문 분야 간 협업 역량을 설명합니다. '팀 구성원은 팀에서 효과적으로 기능하기 위해 필요한 팀 기술, 적절한 팀 행동, 팀 환경에서 이러한 기술과 행동을 수행하는 방법을 알아야 합니다.' 

By examining the discourses of interprofessional collaborative competence using Butler's perspective, we can discern the agency that clinicians are actively performing. We illustrate this application via the discourses of interprofessional collaborative competence related to physicians. The discourses of interprofessional collaborative competence have individual physicians thinking and acting in specific ways in order to be recognised as competent physicians in health care teams.44 To illustrate, the Pediatrics Milestone Project report49 describes the set of competencies, and the progression of knowledge, skills and attitudes for each competency as they pertain to paediatricians. This report describes interprofessional collaborative competence with the following: ‘To function effectively in a team, a team member must know what team skills are required, what team behaviours are appropriate, and how to perform these skills and behaviours in a team setting.’49

이 담론에서는 의사가 의료 팀의 유능한 구성원으로 간주되기 위해 [특정한 수행performance에 참여할 것]을 요구한다. 개별 의사는 이 설명과 일치하는(또는 다른) 방법으로 수행하기로 선택함으로써 Agency를 행사한다. 다시 말해서, 의사는 [진료 팀에서 '효과적'이고 '유능한' 의사의 역할을 위해 선택한 '적절한 행동']에 대해 [어떤 담론으로부터 정보를 얻을지를 결정해야] 합니다.

  • 의사는 환자를 팀의 능동적인 구성원으로 포함시키는 것을 지원하기 위해 [환자 중심 진료 담론]을 사용할 수 있다. 환자 중심의 치료 담론을 사용할 때, 의사는 환자가 치료 팀의 활동적인 일원이라고 결정하고 그에 따라 행동한다.
  • 반대로 의사는 [객관적인 환자 자율성이 진정으로 달성될 수 있는지 여부]에 의문을 가짐으로써, 환자 중심의 치료 개념을 불안정하게 하는 담론을 포함하여 다른 담론을 선택할 수 있다. [환자 중심 치료 개념을 거부하는 담론]을 사용하여 의사는 환자를 팀의 능동적인 구성원으로 인식하지 않으며 그에 따라 행동할 것이다.

우리는 한 선택이 다른 선택보다 낫다고 제안하지 않는다. 대신, 우리는 어떤 담론에 engage할지를 선택함으로써, 의사가 agency를 발위한다는 사실을 강조하는 것이다.

This discourse requires the physician to engage in specific performances in order to be deemed a competent member of a health care team. The individual physician exerts agency by choosing to perform in a way that is congruent (or divergent) with this description. In other words, the physician must decide what discourses will inform his or her choice of ‘appropriate behaviours’ for the role of an ‘effective’ and ‘competent’ physician in a care team.

  • The physician may draw on the discourses of patient-centred care5051 to support the inclusion of the patient as an active member of the team. In using the patient-centred care discourse, the physician decides that the patient is an active member of the care team and acts accordingly.
  • Conversely, the physician may choose a different discourse including, for example, one that destabilises the concept of patient-centred care by questioning whether objective patient autonomy can ever be truly achieved.52 Using a discourse that rejects concepts of patient-centred care, the physician will not recognise the patient as an active member of the team, and will act accordingly.

We do not suggest that one choice is better than another. Instead, we highlight the fact that it is by choosing which discourses to engage with that a physician exercises agency.

버틀러의 에이전시 개념은 IPE 이니셔티브가 [의사가 고려할 수 있는 일련의 담론을 제공해야 함]을 시사한다. (예: 전문 팀 간 관리 책임의 재배포 또는 팀 리더십을 간호사 관리자에게 이전하는 것과 관련된 담론) 의사를 둘러싼 담론이 많을수록, 의사는 더 많은 수행performance 옵션을 선택할 수 있습니다. 개인의 에이전시를 지원하기 위해, IPE는 [전문 간 협업 역량에 대한 여러 개의 담론을 통합]할 수 있으며, 이를 통해 trainee는 [특정 유형의 협력적 구성원으로 자신을 만들어갈 수 있을 것이다.

Butler's conception of agency suggests that IPE initiatives should provide an array of discourses for the physician to consider (e.g. discourses relating to the redistribution of care responsibilities across the interprofessional team, or to the transfer of team leadership to a nurse manager). The more discourses that surround the physician, the more performance options the physician has available to choose from. To support the individual's agency, IPE can incorporate multiple discourses of interprofessional collaborative competence through which the trainee can create him or herself as a specific kind of collaborative team member.

전문적이고 사회적인 기대와 배치되는 담론을 선택하는 것은 복잡하고 힘든 행동이다. 실제로, 버틀러는 [개인이 담론을 선택하는 행위]가 [얼마나 사회적으로 제약을 받는지]를 논하는 데 자신의 본문의 상당한 부분을 소비한다. 분명히, 이 고려사항은 분석에도 알려야 한다. 그럼에도 불구하고, 버틀러의 Theory of agency은 전문직 간 협력 관행에서 담론의 영향력 있는 역할에 대한 귀중한 통찰력을 제공한다.

Choosing a discourse that runs counter to professional and social expectations is a complicated and laborious act. Indeed, Butler spends a considerable portion of her body of work examining just how socially constrained the act of choosing a discourse (perhaps especially a non-dominant discourse) is for the individual. Clearly, this consideration should also inform analysis. This notwithstanding, Butler's theory of agency offers valuable insights into the influential role of discourses on interprofessional collaborative practices.

에이전시에 대한 앤서니 기든스의 사회학적 접근
Anthony Giddens’ sociological approach to agency

IPE의 성공을 방해하는 것으로 식별되는 또 다른 어려운 영역은 [스케줄링]이다. 단일 IPE 이니셔티브를 실시하기 위해 스케줄링 고려사항은 다음을 포함할 수 있다.

  • (i) 서로 다른 전문학교의 여러 학생 단체를 함께 모이게 하는 것, 
  • (ii) 모든 교육생이 서로 또는 서로 간에 중요한 교류를 할 수 있도록 하는 방법 
  • (iii) 모든 교육생이 교육 활동에 의미 있게 기여할 수 있도록 유사한 수준의 전문지식을 가진 주제에 대해 
  • (iv) 교육을 받고 IPE 이니셔티브에서 일할 의사가 있는 교육자와 함께. 

이러한 모든 고려사항을 일치시키는 것이 어렵다는 것이, [IPE 구현에 대한 가장 빈번하게 보고된 장벽 중 하나로 스케줄링]이 인용된 이유 중 하나이다. 따라서 IPE 스케줄링은 종종 개별 Agency의 영향이 없는 순수한 구조적 문제로 간주된다.

Another difficult area often identified as impeding the success of IPE is that of scheduling.41, 53 To have a single IPE initiative take place, scheduling considerations may include:

  • (i) getting multiple student bodies from different professional schools together;
  • (ii) in a way that enables all the trainees to engage in significant exchanges with, from and about one another;
  • (iii) on a topic in which all trainees have similar levels of expertise so they can all contribute meaningfully in an educational exercise, and
  • (iv) with educators who are trained and willing to work in an IPE initiative.

The difficulty of making all these considerations align is one of the reasons why scheduling has been cited as among the most frequently reported barriers to IPE implementation.41 As such, IPE scheduling is often considered a purely structural issue, devoid of implications of individual agency.


IPE 문제의 이러한 측면을 조사하는 다른 방법은 앤서니 기든스가 개발한 에이전트의 이론적 렌즈를 통해서이다.[Agency과 함께 행동하는 개인의 역량], 그리고 [개별 Agency와 더 큰 사회 구조 사이의 관계]를 검토하기 위하여 [분석을 리프레이밍 하는 것]은 IPE 스케줄링의 장애물을 이해하는 새로운 방법을 제시할 수 있다. 즉, IPE 스케줄링이 어떻게 순전히 구조적인 문제가 아닌지에 대한 통찰력을 제공한다. 

A different way to examine this aspect of the IPE problem is through the theoretical lens of agency developed by Anthony Giddens. Reframing analyses to examine the individual's capacity to act with agency, and the relationships between individual agency and larger social structures can suggest new ways of understanding the obstacles to IPE scheduling – ways that offer insights into how IPE scheduling is not purely a structural problem.

기든스가 설명한 기관
Agency as described by Giddens

사회과학에서 근본적인 논쟁의 포인트는 [개인의 Personal agency와 주변 사회 구조 사이의 관계]를 포함한다. 사회학자들은 일반적으로 [개인의 agency와 사회적 맥락] 사이에 엄격한 분리가 없다는 데 동의하게 되었다. 대신, 이러한 학자들은 개별 agency가 어떤 방식으로든 사회 구조에 의해 형성되고, 촉진되며, 또는 제약을 받는다고 제안한다. 그러나, 동시에, 사회 구조는 개인과 개인의 행동에 의해 형성된다.
A foundational point of debate in the social sciences involves the relationship between an individual's personal agency and his or her surrounding social structures.54 Sociologists have generally come to agree that there is no strict separation between an individual's agency and his or her social context.54 Instead, these scholars propose that individual agency is shaped, facilitated in some ways and constrained in other ways by social structures.27, 54, 55 However, simultaneously, social structures are shaped by individuals and their actions.

개인과 주변 사회구조 사이의 관계를 연구하는 학자는 앤서니 기든스(Anthony Giddens)로, 개별 Agency의 역할과 기능, 요구 사항을 검토한다. 기든스는 [개인의 행동이 Agency이 되기 위해서]는 특정한 조건이 있어야 한다고 제안한다.

  • 첫째, 개인은 [의도성]을 가지고 행동해야 한다.
  • 둘째로, 개인은 자신의 의도에 따라 행동할 수 있는 [능력capacity]이 있어야 한다.
  • 셋째, 개인은 새로운 사건을 만들거나 기존 사건에 개입할 수 있는 [힘power]을 가져야 한다.

A scholar examining the relationship between the individual and the surrounding social structures is Anthony Giddens, who examines the roles, functions and requirements for individual agency.56 For an individual's actions to have agency, Giddens proposes that certain conditions must be present.56 

  • Firstly, the individual must act intentionally.56 
  • Secondly, the individual must have the capacity to act on his or her intentions.56 
  • Thirdly, the individual must have the power to create a new event or to intervene in an existing event.56

기든스는 [사회 구조와 개별 Agency가 밀접하게 연관되어 있다]고 주장한다.

  • 개인이 특정한 방식으로 반복적으로 행동함에 따라, 그들은 사회적 구조(예: 전통, 도덕 규범, 정부 등)를 만들고 재창조한다.
  • 개인이 다르게 행동할 때 사회 구조는 바뀔 수 있다(예: 그들은 전통을 따르는 것을 멈추고, 다른 도덕 규범을 수용하거나, 새로운 정치 권력에 투표한다). 
  • 그러나, 비록 사회 구조가 개인에 의해 활발하게 생산되고 재생산되지만, 그러한 개인의 행동은 사회 구조의 규칙과 자원에 의존한다. 즉, 개인들은 일을 완수하기 위해 사회 시스템을 사용한다. 
  • 그러나, 동시에, 사회 시스템은 개인의 행동이 그것들을 창조하고 재생시키기 때문에 존재한다.

Giddens argues that social structures and individual agency are intimately related.56 

  • As individuals repeatedly act in specific ways, they create and recreate social structures (e.g. traditions, moral codes, governments, etc.).
  • Social structures can be changed when individuals act differently (e.g. they stop following traditions, embrace different moral codes or vote for new political powers).
  • However, although social structures are actively produced and reproduced by individuals, those same individuals rely on the rules and resources of social structures to act. That is, individuals use social systems to get things done.
  • Yet, at the same time, social systems exist because the actions of individuals create and regenerate them.

IPE 스케줄에 Giddens의 에이전시 개념
Applying Giddens’ conception of agency to IPE scheduling

기든스의 대리점 공식을 통해 IPE 스케줄링의 경험을 검토하면 그러한 이니셔티브의 성공과 실패에 대한 고유한 통찰력을 제공할 수 있다. 다양한 보건 전문학교의 커리큘럼의 사회 시스템과 관련하여 개별 교수진의 Agency를 이해하면 IPE 이니셔티브가 어떻게 그리고 왜 흔들리는지에 대해 새로운 조명을 받을 수 있다.

Examining the experiences of IPE scheduling through Giddens’ formulation of agency can provide unique insights into the successes and failures of such initiatives. Understanding the agency of individual faculty members in relation to the social systems of the curricula of the different health professions schools can shed new light on how and why IPE initiatives falter.

이를 설명하기 위해 IPE 이니셔티브를 구현하기 위해 교육 관행을 변경해야 하는 여러 professional schools의 교직원을 생각해 보십시오. 성공하기 위해서는, 이러한 교수진들이 에이전시에 필요한 조건을 갖추어야 한다. 

  • (i) IPE에 참여하도록 교육 관행을 바꾸려는 의도intention
  • (ii) 그러한 변화를 실현하는 방식으로 행동하는 능력capacity
  • (iii) IPE 이니셔티브를 실현하기 위해 professional school에 걸쳐 과목의 내용을 align시키는 힘power 

To illustrate this, consider the faculty members from different professional schools who are required to change their teaching practices to implement an IPE initiative. To be successful, these faculty members must have the necessary conditions for agency:

  • (i) the intention to change their teaching practices to engage in IPE;
  • (ii) the capacity to act in ways that will bring those changes into being, and
  • (iii) the power to bring the content of their courses into alignment across professional schools to realise the IPE initiative.

이러한 조건이 충족되면, 이러한 교육자들은 IPE를 지원하기 위한 다양한 보건 직업 커리큘럼의 사회 구조와 과정을 바꾸기 위해 그들의 행동을 사용할 수 있다. 단, 이러한 조건이 충족되지 않는다면, 개별 교직원은 IPE 이니셔티브에 참여할 수 있는 충분한 Agency가 없을 것이다.

  • 교수진이 IPE에 참여할 의사가 없는 경우,
  • IPE 맥락에서 가르치는 방법을 배울 수 있는 교수개발 지원이 없는 경우,
  • 다른 보건 전문가 과정의 내용을 반영하도록 교육 과정의 내용을 변경할 힘이 없는 경우

When these conditions are met, these educators can use their actions to change their courses and the social structures of the different health professions curricula to support IPE. However, if these conditions are not met (e.g.

  • if the faculty members don't have the intention to engage in IPE,
  • if they don't have the faculty development support to learn how to teach in an IPE context, or
  • if they don't have the power to change the content of their courses to mirror the content of the other health professions courses),

individual faculty members will not have sufficient agency to engage in IPE initiatives.

교수들은 다른 보건의료전문직 단과대학의 커리큘럼 안에서 근무하기에, 그들이 일하는 사회 구조도 서로 다르다. 이러한 사회 시스템은 IPE 이니셔티브에 참여하려는 교수진의 노력을 방해할 수 있습니다. 커리큘럼은 '지역 정치, 문화, 전문적, 사회적 맥락에서 도출되는 가치'를 반영한다. 이러한 가치가 특정한 커리큘럼 설계방식을 inform하고 create한다. 커리큘럼 디자인은 주어진 학교에서 매우 광범위하게 채택되고 받아들여질 수 있기 때문에, 커리큘럼 변화에 참여하는 것은 이념의 변화를 가져오는 것과 비슷하다. 그러한 커리큘럼의 변경이 불가능한 것은 아니지만, 그러한 변화가 실현되려면 커리큘럼에 내재된 가치가 변화해야 한다. 

These faculty members work inside the curricula of different health professions schools and hence they work within different social structures. These social systems can obstruct the faculty members’ efforts to engage in IPE initiatives. A curriculum reflects the ‘values deriving from the local political, cultural, professional and social context’.57 These values inform and create specific curriculum designs. Curriculum designs can become so broadly adopted and accepted at a given school that to engage in curriculum change is akin to bringing about a change in ideology.57 Such curriculum changes are not impossible, but, if such changes are to be realised, the values embodied in the curriculum need to shift.57 

IPE 이니셔티브를 지원하기 위해 커리큘럼 일정을 변경하려면 커리큘럼 일정을 수정하는 동기를 부여할 수 있도록 IPE가 충분히 가치있게 여겨져야 한다. 다른 전문학교의 교수진들이 IPE 이니셔티브에 참여할 의향, 역량 및 힘을 가지고 있다고 하더라도, 그들은 [사회적 수준]에서 [IPE를 충분히 가치있게 여겨서, 커리큘럼을 재조정하는 작업에 동기를 부여할 힘]이 부족할 수 있다. 이 예에서 우리는 특정 사회 구조(예: 보건 전문 학교의 커리큘럼)가 개인의 Agency(예: IPE 이니셔티브에 참여하는 교수진의 작업)을 방해할 수 있는 방법에 대한 통찰력을 얻는다.

To change curricula schedules in support of IPE initiatives requires that IPE be sufficiently valued to motivate modifying the curricula schedules. Given that, even if faculty members at different professional schools have the intention, capacity and power to participate in an IPE initiative, they can lack the power to have IPE sufficiently valued at a social level to motivate the task of rescheduling curricula. In this example, we gain insight into how specific social structures (e.g. curricula of health professions schools) can obstruct the individual's agency (e.g. the faculty member's work to engage in an IPE initiative).

이 그림에서 알 수 있듯이, 기든스의 에이전시 개념을 이용한 HPE 연구는 유익한 방식으로 IPE의 문제를 이해하는 데 도움이 될 수 있다. IPE 스케줄링의 도전에 맞서기 위해 기든스의 에이전시 이론은 다음과 같은 노력을 목표로 삼을 것을 제안합니다. 

  • (i) IPE 이니셔티브에 참여할 수 있도록 개별 교직원을 지원한다(즉, 그들의 의도, 역량 및 힘에 초점을 맞춘다)
  • (ii) 동시에 개별 health professions school에 의해 매우 가치 있게 여겨지는 전문 간 협업을 만들기 위해 작업하는 동시에, IPE를 지원하는 커리큘럼 스케줄링을 수정하는 작업이 정당화된다.

As this illustration demonstrates, HPE research using Giddens’ conception of agency can help us understand the problem of IPE in informative ways. To confront the challenges of IPE scheduling, Giddens’ theory of agency would suggest we target efforts at:

  • (i) assisting individual faculty staff to engage in an IPE initiative (i.e. focusing on their intention, capacity and power), and
  • (ii) simultaneously working to make interprofessional collaboration so deeply valued by individual health professions schools that the work of modifying curricula scheduling in support of IPE is justified.

 

CHAT과 반두라의 에이전시 접근 방식
CHAT's and Bandura's approaches to agency

IPE를 방해하는 또 다른 과제는 [의료팀의 각 개인이 어떻게 고유한unique 개인인지]를 인식하는 것이다. [각 진료팀 구성원]은 [어떻게 진료팀이 상호 작용할지]에 대해, [선호하는 협업 방법 및 고유한 아이디어]를 가져옵니다. 마찬가지로, 각 의과대학과 임상 맥락에는 전문가 간 협업을 형성하는 [고유한 사회적, 물리적 조직]이 있다. 의사가 전문 간 팀의 효과적인 구성원이 되도록 훈련 받는 방법을 이해하기 위해서는, [개인이 목표를 달성하기 위해, 이러한 많은 컨텍스트를 통해, 자신의 방식을 협상하는 방법]을 검토해야 한다. 다시 말해서, 우리는 이러한 교훈을 IPE 이니셔티브에 통합할 수 있도록 개별 임상의들이 끊임없이 변화하는 치료 팀의 일원으로서 어떻게 에이전시를 행사하는지 이해할 필요가 있다.
Another challenge impeding IPE concerns the recognition of how each person in the care team is a unique individual. Each care team member brings his or her own preferred ways of collaborating and unique ideas of how the care team should interact. Similarly, each medical school and clinical context has its own social and physical organisation that shapes interprofessional collaborations. To understand how physicians can be trained to be effective members of interprofessional teams requires that we examine how individuals negotiate their way through these many contexts to achieve their goals.58 In other words, we need to understand how individual clinicians exercise agency as members of everchanging care teams so that we can incorporate these lessons into our IPE initiatives.

CAT 및 Bandura가 설명한 기관
Agency as described by CHAT and Bandura


이 도전에 대한 통찰력은 [끊임없이 변화하는 사회 문화적 맥락에서 일하는 개인의 문제]로 재구성함으로써 얻을 수 있다. 이를 위해, 우리는 CHAT(문화사 활동 이론)와 알버트 반두라가 맥락(도구, 언어, 문화적 기대와 제도적 규정 포함)이 인간의 경험에 어떻게 영향을 미치는지 조사하는 방식으로 눈을 돌릴 수 있다. 
우리는 각 이론이 개인과 사회 사이의 분리의 다른 측면을 어떻게 강조하는지를 강조하기 위해 Agency에 대한 이 두 가지 formulation을 결합한다. 비록 개인과 사회가 어떻게 서로 협력하는지를 검토하지만, Agency에 대한 CHAT접근은 [개인의 Agency에 의해 물질적인 사회적 과정이 어떻게 형성되는지]를 강조하는 반면, 반두라의 접근은 [Agency의 핵심 요소를 개인 안에 있는 것]으로 강조한다.

Insights into this challenge can be gained by reframing it as a problem of individuals working in changing social and cultural contexts. To do this, we can turn to the ways in which CHAT (cultural historical activity theory) and Albert Bandura examine how contexts (including tools, language, cultural expectations and institutional regulations) influence human experiences. We pair these two formulations of agency together to highlight how each theory emphasises a different aspect of the divide between the individual and the social. Although both examine how the individual and the social co-construct one another, CHAT's approach to agency emphasises how material social processes shape by an individual's agency, whereas Bandura's approach accentuates the core elements of agency as resting within the individual.


챗은 비고츠키와 레온티예프의 작품에서 성장한다. 채팅은 개인과 사회 사이의 복잡한 상호 작용과 관계에 대한 분석을 지원합니다. CHAT에 근거한 Agency 분석은 [개인이 어떻게 활동 시스템의 일부인지]를 연구한다. 활동 시스템은 다음과 같은 상호 작용으로 구성됩니다. 

  • (i) 개별 주제 
  • (ii) 목표(즉, 목표) 
  • (iii) 해당 기관이 위치한 업무 공동체 
  • (iv) 노동의 분배 
  • (v) 그 안의 규칙들
  • (vi) 사용할 수 있는 도구

CHAT grows out of the work of Vygotsky59 and Leontiev.60 CHAT supports analysis of complex interactions and relationships between the individual and the social.61 A CHAT-informed analysis of agency studies how an individual is part of an activity system. An activity system is comprised of the interactions among:

  • (i) the individual subject;
  • (ii) his or her object (i.e. goal);
  • (iii) the communities of practice in which he or she is located;
  • (iv) the divisions of labour therein;
  • (v) the rules therein, and
  • (vi) the instruments available for use.

[개인의 Agency]는 [활동 시스템의 이러한 요소들]에 의해 [강력하게 형성되고 구속]된다. 이런 관점에서 개인의 Agency는 완전히 자신의 Agency가 아니다. [CHAT에 대한 보다 고전적 해석]은, [개인과 개인의 Agency는 '사회적 과정의 집단적 역학관계에서 용해'되어 있다]고 가정한다. 그러나 [CHAT에 대한 다른 해석]은, [개인이 활동 시스템 내의 Agent라는 것]을 암시한다. CHAT 연구의 이러한 Branch에서는, 개인이 물질적인 사회적 프로세스에 뿌리를 두고 있으며, 동시에 이러한 프로세스를 형성하는 것으로 간주한다. 다시 말해서, 개인의 Agency는 '사회적 환경 속의 다른 것들과 암시적 또는 명시적으로 협력하고 있다'는 것이다. 개인의 Agency는 활동 시스템의 사회적, 물질적, 개인적 요소가 변화함에 따라 변화할 수 있다. 이러한 방향에서, Agency에 대한 CHAT의 관점은, Agency가 어떻게 개인에만 머물러seated 있지 않고, 특정 목표를 달성하기 위해 [다른 사람들과 사회적 물질적 현실과 관계적으로 협상되는지]를 강조한다. 
An individual's agency is powerfully shaped and constrained by these elements of the activity system. From this perspective, an individual's agency is not fully his or her own. The more canonical interpretations of CHAT have posited that the individual and his or her agency are ‘dissolved in the collective dynamics of social processes’.62 However, other interpretations of CHAT suggest that the individual is an agent within the activity system.62 This branch of CHAT research conceives of the individual as both rooted in material social processes and simultaneously shaping those processes.62 In other words, the individual's agency is ‘co-constructed and implicitly or explicitly negotiated with others in a social setting’.63 An individual's agency is open to change as the social, material and personal elements of the activity system change. From this orientation, CHAT's perspective of agency highlights how agency is not seated solely in an individual, but is instead negotiated relationally with others and the social material reality to achieve specific goals.64

에이전시의 또 다른 개념은 반두라(Bandura)에서 나왔는데, 반두라(Bandura)는 [자율적인 개체]도 없고, [개인의 행동이 사회 구조에 의해서만 결정되는 것]도 아니라고 주장한다. 대신, 인간의 행동은 [개인적 요인, 행동, 환경적 결정 요소들 사이의 상호 작용의 산물]이다. 반두라는 에이전시의 네 가지 핵심 특징을 파악한다.

  • 첫째는 의도성, 즉 미래의 행동 방침에 대한 사전 예방적 표현입니다.
  • 두 번째는 개인의 시각화된 목표와 활동을 안내하고 동기를 부여하는 결과예상 이다.
  • 세 번째는 의도성과 사전 생각에 따라 행동하는 자기 반응성이다.
  • 마지막은 자기반성입니다. 자기자신의 행동, 생각, 동기, 감정을 처리하는 메타인지 능력입니다.

Another conception of agency comes from Bandura, who argues that there is no autonomous individual nor is an individual's behaviours determined solely by social structures.65 Instead, human action is a product of the mutual interaction among personal factors, behaviour and environmental determinants.66 Bandura identifies four core features of agency.

  • First is intentionality, a proactive representation of a future course of action.67 
  • The second is forethought, the individual's visualised goals and anticipated outcomes that guide and motivate activities.65 
  • Third is self-reactiveness, which involves acting on intentionality and forethought.65 
  • Last is self-reflectiveness, a meta-cognitive ability of processing one's own actions, thoughts, motivations and feelings that allows for course corrections.65

CHAT와 Bandura의 에이전시 개념을 전문가 간 협업 연습에 적용
Applying CHAT's and Bandura's conceptions of agency to interprofessional collaborative practice

전문가 간 협업 관행에 대한 우리 커뮤니티의 이해는 Agency에 대한 CHAT와 Bandura의 접근 방식을 통해 크게 알 수 있다. CHAT에 근거한 한 가지 가능한 분석은 [팀 내 또는 외부로 개별 팀 구성원의 로테이션]이 협업 업무에 어떤 영향을 미치는지 강조할 것이다. 각 팀 구성원은 [각자의 고유한 활동 시스템]을 가지고 협업을 한다. 이 시스템이 협력 노력에 어떤 행동과 태도를 가져올지 결정합니다. 예를 들어, [업무 분업에 대한 전공의의 이해]는 [간호 직원들과 상호작용하는 방식]을 형성할 것이다. 다른 전공의가 팀에 들어오면, 새로운 전공의가 분업을 어떻게 이해하는지가 팀 상호 작용을 변화시킬 수 있다. 활동 전반에 걸쳐 Agency가 협상되기 때문에, 팀 구성원이 팀에 합류하거나 탈퇴할 때마다 각 팀 구성원의 Agency는 불안정해지고, 재협상이 이루어진다. 이러한 고려사항은 IPE 이니셔티브에 유용한 정보를 제공할 수 있다. CHAT에 정통한 IPE를 통해 교육생의 상황 인식을 높이면 이러한 학습자들이 보다 숙련된 전문가 간 협력자가 될 수 있다.

Our community's understanding of interprofessional collaborative practice can be greatly informed by CHAT's and Bandura's approaches to agency. One possible CHAT-informed analysis would underscore how the rotation of individual team members in or out of the team impacts collaborative practice.58, 68 Each individual team member comes to the collaboration from his or her own unique activity system, which shapes the kinds of actions and attitudes that person brings to the collaborative effort. For instance, the resident's understanding of division of labour will shape the way he or she interacts with nursing staff. When another resident rotates into the team, the new resident's understanding of division of labour may change those team interactions. As agency is negotiated across the activity, each time a team member joins or leaves the team, each team member's agency is destabilised and renegotiated. These considerations could usefully inform IPE initiatives. Increasing trainees’ situational awareness69 through CHAT-informed IPE could help these learners be more savvy interprofessional collaborators.

반두라의 이론은 어떻게 각 팀 구성원의 소속사가 자신의 [의도성, 사전 생각, 자기 반응성, 자기 성찰]에 의해 잠재적으로 위협받을 수 있는지 조사하도록 할 것이다. 예를 들어, 주니어 전공의는 입원 환자 팀의 적극적인 기여자가 되려는 [의도]를 완전히 개발했을 수 있으며, 이를 위한 방법에 대해 충분한 [사전 고려]를 할 수 있다. 하지만, 이 후배 레지던트들은 그들이 협력하는 방식이 부적절하다는 것을 이해하기 위해 [자기 반응성과 자기 성찰력]을 충분히 발달시키지 못했을 수도 있습니다. 이런 식으로, Agency의 이 네 가지 요소 중 어떤 것이 개별 팀 구성원에 의해 효과적으로 또는 비효과적으로 초래되고 있는지를 이해함으로써 팀 협업의 강점과 약점을 이해할 수 있을 것이다. 고군분투하는 교육생에게 교정조치 노력은 그러한 고려사항에 의해 통보될 수 있다.

Bandura's theory would have us investigate how each team member's agency could be conceived of as potentially threatened (or supported) by his or her intentionality, forethought, self-reactiveness and self-reflectiveness. For instance, a junior resident may have fully developed intentions of being an active contributor to the in-patient team, and may have sufficient forethought of how to go about doing that. However, this junior resident may have insufficiently developed self-reactiveness and self-reflectiveness to understand that the ways in which he or she is going about collaborating are inappropriate. In this way, it may be possible to understand strengths and weaknesses in team collaborations by understanding which of these four elements of agency are being effectively or ineffectively brought to bear by individual team members. For struggling trainees, remediation efforts could be informed by such considerations.

논의
Discussion

사악한 문제는 완전하게 해결될 수 없다. 그런 식으로 작동하지 않는다. 그러나, 그러한 복잡한 문제에 대한 우리의 분석을 알리기 위해 이론과 심지어 매우 다른 이론을 사용하는 것은 우리가 도전에 대처하고 맥락에 걸쳐 대처 전략을 공유하는 새로운 방법을 찾는 데 도움이 될 수 있다. 우리는 에이전시 이론이 HPE의 가장 위압적인 도전에 대해 생각하고 맞서는 새로운 방법을 제공할 수 있다고 믿는다. 우리는 IPE를 조사함으로써 이 힘을 설명했지만, 다른 HPE 과제를 해결하기 위해 똑같이 잘 활용될 수 있다.
Wicked problems cannot be definitively resolved. They just don't work that way. However, using theory, and even wildly different theories, to inform our analyses of such complex problems can help us find new ways of contending with the challenges and of sharing coping strategies across contexts. We believe that theories of agency can provide new ways of thinking about and confronting HPE's most daunting challenges. We have illustrated this power by examining IPE, but it could equally well be harnessed to address other HPE challenges.

[Agency의 후기구조주의 개념]은 연구자들에게 개인이 이용할 수 있는 담론과, 그 담론 안에서 만들어진 역할과 Agency를 분석하도록 지시함으로써, 다른 HPE 문제에 대한 분석을 알려줄 수 있다. 이러한 분석은 다음과 같은 질문을 할 수 있다.

  • 개개 임상의가 어떻게 적극적으로 자신의 담론을 선택하도록 하고 있는가? 
  • 개인이 선택하거나 기피하는 [역할 및 관련 Agency의 종류]는 무엇인가?

Butler's post-structuralist conception of agency could inform analysis of other HPE problems by directing researchers to analyse the discourses available to individuals, and the roles and agency created therein. Such analysis might ask:

  • How is the individual clinician actively making him or herself through his or her choice of discourse?
  • What roles and associated kinds of agency is the individual selecting or eschewing?

[기든스의 Agency]에 대한 관점은 HPE 연구원들이 [개인의 포부와 의도에 따라 행동하는 한 명 또는 여러 명의 개인들의 능력]을 조사하도록 할 것이다. 개인의 행동을 분석하면 다음과 같이 묻는다.

  • 개인이 Agency를 가지고 행동하는 데 필요한 조건(즉, 의도, 역량 및 힘)을 충족하였는가?

또한, 이 분석은 개인이 어떻게 사회 구조를 재창조하거나 변화시키고 있는지를 조사할 것이다. 그것은 또한 사회 구조가 특정 행동을 촉진하고 방해하는 방법에 대한 통찰력을 제공할 것이다.

Giddens’ perspective on agency would have HPE researchers examining one or multiple individuals’ ability to act in line with their personal aspirations and intentions. Analysis of individuals’ actions would ask:

  • Has the individual(s) met the conditions necessary to act with agency (i.e. intention, capacity and power)?

Further, this analysis would examine how individuals are recreating or changing social structures. It would also give insights into how social structures both facilitate and obstruct specific actions.

[CHAT에 기반한 지향]은 개인이 위치한located 활동 시스템을 통해, 개인의 Agency가 어떻게 구성되고 협상되는지를 연구할 수 있다. 이 관점은 학자에게 다음과 같이 묻게 할 것이다.

  • Agency는 [이러한 맥락]에서 [이 개인]에 대해 어떻게 실현되는가?

A CHAT-informed orientation could study how an individual's agency is constructed by and negotiated through the activity system in which that individual is located. This perspective would have the scholar ask:

  • How is agency realised for this individual in this context?

반두리아적 관점에서 학자들은 개인의 행동의 의도성, 사전 생각, 자기 반응성, 자기 성찰성을 조사할 수 있었다.
From a Bandurian perspective, scholars could examine the intentionality, forethought, self-reactiveness and self-reflectiveness of an individual's actions.

우리는 theories of agency이 수백 년 동안 뜨겁게 논의되어 온 추상적이고 다면적인 구조라는 것을 인정한다.

  • 예를 들어, 사회학의 역사를 통틀어 Agency은 중심적이지만 논쟁적인 개념이었다.
  • 마찬가지로, 철학에서, 아리스토텔레스가 의도성을 가지고 행동하는 개인의 능력을 숙고했듯이, 현대 철학자들은 컴퓨터 기반의 인공지능이 에이전시를 소유한다고 말할 수 있는지를 숙고한다.
  • 예를 들어, 이러한 영역과 다른 영역의 이론가들은 이런 의문을 제기한다.
    • [개인의 시간적 지평에서의 변동성을 설명하기 위해 Agency가 재인식되어야 하는지](즉, 순간순간과 시간적으로 멀리 떨어진 순간에 초점을 맞춘다) 
    • 오늘날의 인간은 종종 컴퓨터 기술의 적극적인 사용자이기 때문에 기관이 비선택적 요소를 포함하도록 재구성되어야 하는지 여부. 

We acknowledge that theories of agency are abstract, multifaceted constructs that have been hotly debated for hundreds of years.

  • For instance, throughout sociology's history, agency has been a central, but contested, concept.54 
  • Similarly, in philosophy, just as Aristotle pondered an individual's ability to act with intentionality, modern philosophers contemplate whether computer-based artificial intelligence can be said to possess agency.
  • Theorists from these domains and others question, for example,
    • whether agency should be reconceptualised to account for variability in an individual's time horizon54 (i.e. a focus on the immediate moment versus a long-range temporally distant moment), or
    • whether agency should be reconfigured to include non-humans as today's humans are often active users of computer technologies.70 

분명히, 에이전시에 대한 그러한 오랜 논쟁과 관련하여 방대한 양의 문학이 생성되었다. 이 리뷰에서는 에이전시의 일부 개념만 다룬다. 우리는 이것이 에이전시의 개념이나 우리가 논의하는 이론과 저자에 대한 완전하거나 포괄적인 검토가 아니라는 것을 인정한다. 대신, 우리는 HPE 학자들을 Agency 이론과 이러한 formulation들이 HPE 학술활동을 어떻게 알릴 수 있는지에 대해 소개한다. 이러한 이론을 접근 가능한 방식으로 요약하기 위해, 우리는 각 이론의 복잡하고 추상적인 구조를 일련의 주요 특징과 개념으로 요약했다. 우리는 접근성을 위해 각 이론의 강력한 구성의 일부인 많은 중요한 고려 사항을 얼버무렸다는 것을 인정한다. 자신의 질문에 inform하기 위해 Agency 이론을 사용하는 데 관심이 있는 보건 전문 교육 학자들은 이 검토를 도입 참고 자료로 사용해야 한다. 이러한 이론을 능숙하게 적용하기 위해, 학자들은 이론을 최대한 효과적으로 적용할 수 있도록 추가 독서에 몰두해야 한다.

Clearly, a massive body of literature has been generated in relation to such long-standing debates about agency. In this review, we attend to only some conceptions of agency. We acknowledge that this is neither a complete nor a comprehensive review of the concepts of agency, nor of the theories and authors we discuss. Instead, we introduce HPE scholars to some theories of agency and to how these formulations might inform HPE scholarship. To summarise these theories in an accessible manner, we have distilled each theory's complex and abstract constructs down to a series of key features and concepts. We acknowledge that, in the interest of accessibility, we have glossed over many important considerations that are part of each theory's robust construction. Health professions education scholars interested in using theories of agency to inform their inquiry should use this review as an introductory reference. To skilfully apply any of these theories, scholars should immerse themselves in additional readings so that they can apply the theories to their fullest effect.

우리는 보건직 종사자들에게 있어서, 교육자들이 해결해야 할 과제는 [어떤 Agency 이론이 그들의 특정한 학문적 노력에 inform하는지 결정하는 것]이 되리라고 예상한다. 이 검토를 통해, 우리는 학자들이 그들의 특정한 사악한 문제와 싸우는 데 어떤 Agency 이론을 도울 수 있는지를 결정하는 데 도움이 되는 기관의 네 가지 공식을 제시한다. 이러한 formulation을 구분하는 선은 투과성이 있다permeable는 점에 유의해야 한다. 일부 공통적인 특징과 철학적 기초는 에이전시에 대한 이러한 접근법에 걸쳐 공유된다.
The challenge, we expect, for health professions educators will be to decide which theory of agency can help inform their particular scholarly efforts. Through this review, we present four formulations of agency to help scholars decide which theory of agency might help them contend with their particular wicked problem. It is important to note that the lines that divide these formulations are permeable. Some common characteristics and philosophical foundations are shared across these approaches to agency.


HPE 학술연구에서 이론의 역할과 가치는 오랫동안 인정되어 왔다. 그러나, 특히 특정 이론 작업이 지역사회에 익숙하지 않을 때, 우리의 학문적 추구에 이론을 통합하는 것은 어렵다. 이 리뷰에서는 사악한 문제에 유용하게 적용될 수 있는 네 가지 다른 Agency 이론을 소개한다. IPE를 통해 응용 프로그램을 설명했지만 에이전시 이론이 HPE의 다른 사악한 문제를 동등하게 알릴 수 있음을 제안한다. 표 2는 기관 정보 연구 질문을 다른 복잡한 문제에 적용하는 추가적인 예를 보여준다. 우리의 의도는 에이전시의 개념을 HPE 학자들과 교사들이 직면한 모든 도전에 대한 만병통치약으로 제시하는 것이 아니다. 대신에, 우리는 이 검토가 학자들에게 HPE 분야에 도전하는 사악한 문제에 대해 생각하고 연구하는 새로운 방법을 제공할 것이라고 믿는다.

The role and value of theory in HPE scholarship has long been acknowledged.6, 71, 72 However, incorporating theory into our scholarly pursuits is difficult,73 especially when particular theoretical works are unfamiliar to the community. In this review, we introduce four different theories of agency that can usefully be applied to wicked problems. Although we have illustrated the application via IPE, we suggest that theories of agency can equally inform other wicked problems in HPE. Table 2 shows additional examples of the application of agency-informed research questions to other complex problems. Our intention is not to present the concept of agency as a panacea for all the challenges faced by HPE scholars and teachers. Instead, we believe that this review will offer scholars new ways of thinking about and studying the wicked problems challenging the HPE field.


 

Med Educ. 2017 Apr;51(4):353-365. doi: 10.1111/medu.13160. Epub 2017 Feb 6.

Tackling wicked problems: how theories of agency can provide new insights

Affiliations collapse

Affiliations

1Department of Medicine, Uniformed Services University of the Health Sciences, Bethesda, Maryland, USA.

2Association of American Medical Colleges (retired), Washington, District of Columbia, USA.

3Department of Family Practice, University of British Columbia, Vancouver, British Columbia, Canada.

4Centre for Health Education Scholarship, University of British Columbia, Vancouver, British Columbia, Canada.

PMID: 28164372

DOI: 10.1111/medu.13160

Abstract

Objectives: This paper reviews why and how theories of agency can be used as analytical lenses to help health professions education (HPE) scholars address our community's wicked problems. Wicked problems are those that resist clear problem statements, defy traditional analysis approaches, and refuse definitive resolution (e.g. student remediation, assessments of professionalism, etc.). We illustrate how theories of agency can provide new insights into such challenges by examining the application of these theories to one particular wicked problem in HPE: interprofessional education (IPE).

Methods: After searching the HPE literature and finding that theories of agency had received little attention, we borrowed techniques from narrative literature reviews to search databases indexing a broad scope of disciplines (i.e. ERIC, Web of Science, Scopus, MEDLINE and PubMed) for publications (1994-2014) that: (i) examined agency, or (ii) incorporated an agency-informed analytical perspective. The lead author identified the theories of agency used in these articles, and reviewed the texts on agency cited therein and the original sources of each theory. We identified 10 theories of agency that we considered to be applicable to HPE's wicked problems. To select a subset of theories for presentation in this paper, we discussed each theory in relation to some of HPE's wicked problems. Through debate and reflection, we unanimously agreed on the applicability of a subset of theories for illuminating HPE's wicked problems. This subset is described in this paper.

Results: We present four theories of agency: Butler's post-structural formulation; Giddens' sociological formulation; cultural historical activity theory's formulation, and Bandura's social cognitive psychology formulation. We introduce each theory and apply each to the challenges of engaging in IPE.

Conclusions: Theories of agency can inform HPE scholarship in novel and generative ways. Each theory offers new insights into the roots of wicked problems and means for contending with them.

임상추론 평가방법: 스코핑 리뷰와 실용적 가이드(Acad Med, 2019)
Clinical Reasoning Assessment Methods: A Scoping Review and Practical Guidance

Michelle Daniel, MD, MHPE, Joseph Rencic, MD, Steven J. Durning, MD, PhD, Eric Holmboe, MD, Sally A. Santen, MD, PhD, Valerie Lang, MD, MHPE, Temple Ratcliffe, MD, David Gordon, MD, Brian Heist, MD, MSc, Stuart Lubarsky, MD, MHPE, Carlos A. Estrada, MD, MS, Tiffany Ballard, MD, Anthony R. Artino Jr, PhD, Ana Sergio Da Silva, PhD, Timothy Cleary, PhD, Jennifer Stojan, MD, MHPE, and Larry D. Gruppen, PhD 

 

 

임상적 추론의 정의는 매우 다양하다.1 이 논문의 목적상 [임상 추론]은 '임상 의사가 환자를 진단하고 치료하기 위해 데이터를 관찰, 수집 및 해석하는 기술, 프로세스 또는 결과로 정의]된다. 임상 추론은 맥락적 요소와 상호작용하는 [의식적 및 무의식적 인지 작업]을 모두 수반한다. 맥락적 요인에는 [환자의 고유한 상황과 선호도, 그리고 진료 환경의 특성이 포함]되며 이 밖에도 많은 것들이 있다. 임상 추론의 여러 구성 요소를 식별할 수 있다1:

  • 정보 수집, 
  • 가설 생성, 
  • 문제 표현 형성, 
  • 감별 진단 생성,
  • 우선적 또는 작업 진단 선택,
  • 진단 정당성 제공,
  • 관리 또는 치료 계획 개발.

Definitions of clinical reasoning vary widely.1 For the purposes of this paper, clinical reasoning is defined as a skill, process, or outcome wherein clinicians observe, collect, and interpret data to diagnose and treat patients.2,3 Clinical reasoning entails both conscious and unconscious cognitive operations interacting with contextual factors.4,5 Contextual factors include, but are not limited to, the patient’s unique circumstances and preferences and the characteristics of the practice environment. Multiple components of clinical reasoning can be identified1:

  • information gathering,
  • hypothesis generation,
  • forming a problem representation,
  • generating a differential diagnosis,
  • selecting a leading or working diagnosis,
  • providing a diagnostic justification, and
  • developing a management or treatment plan.6 

다양한 분야(예: 인지 심리학, 사회학, 교육)의 많은 이론(예: 스크립트, 이중 과정 및 인지 부하 이론)이 임상 추론에 대한 연구를 제공한다. 이러한 임상 추론의 정의와 이러한 다중 이론은 현재 연구의 기초를 제공한다.

A number of theories (e.g., script, dual process, and cognitive load theories) from diverse fields (e.g., cognitive psychology, sociology, education) inform research on clinical reasoning.7,8 This definition of clinical reasoning and these multiple theories provide the foundation for the current work.

효과적인 임상 추론은 임상 역량의 핵심이다. 대학원 의학 교육 인증 위원회, 9개의 CanMED 프레임워크 및 유럽의 조정 프로젝트(의학)는 모두 임상 추론을 핵심 역량으로 설명한다. 의료 교육 연속체에 걸쳐 임상 역량(임상 추론 포함)의 개발을 보장하려면 평가에 대한 증거 기반 접근법이 필요하다. 현재 임상추론에 대한 광범위한 평가가 있으며, 이러한 도구의 기반이 되는 문헌은 광범위하게 분산되어 있으며, 다양한 분야와 여러 의학 전문 분야를 넘나들고 있어서 [특정한 목표, 요구 및 자원에 맞는 평가를 선택 및 구현]하려는 교수자를 어렵게 만든다. 또한 여러 평가들이 서로 다른 맥락(예: 직장 기반 및 비직장 기반 환경)에서 사용하도록 설계된다. 임상추론 평가방법은 수와 다양성이 많아서 목적에 적합한 평가를 선택하는 데 어려움이 있고, 임상추론 평가가 진보하려면 현재 근거의 통합이 필요하다.

Effective clinical reasoning is central to clinical competence. The Accreditation Council for Graduate Medical Education,9 the CanMEDS framework,10 and the Tuning Project (Medicine) in Europe11 all describe clinical reasoning as a core competency. Ensuring the development of clinical competence (including clinical reasoning) across the medical education continuum requires an evidence-based approach to assessment. There is currently a wide array of clinical reasoning assessments, and the literature on which these tools are based is widely dispersed, crossing different fields and multiple medical specialties, which presents a challenge for medical educators attempting to select and implement assessments aligned with their particular goals, needs, and resources. These assessments are often designed for use in different contexts (e.g., workplace- and non-workplace-based environments).12 The sheer number and diversity of clinical reasoning assessment methods create challenges for selecting assessments fit for the purpose, so a synthesis of the current evidence is needed to advance assessment practices for this core competency.

우리의 목표는 의료 교육자에게 참고가 되는 평가 방법의 실용적인 개요를 만드는 것이었다. 임상 추리 평가 문헌의 풍부함과 복잡성을 고려하여 다음 질문을 탐구하기 위해 범위 검토를 수행하기로 결정했다. 어떤 임상적 추론 평가 방법을 사용할 수 있습니까? 이러한 평가 방법의 정의 기능은 무엇이며, 일반적으로 어떻게 사용됩니까? 각 방법에 대한 타당성 고려사항(내용, 대응 프로세스, 내부 구조, 다른 변수와의 관계, 임상 실무 성과에 대한 결과 또는 결과)은 무엇입니까? 각 방법의 실현 가능성 문제, 장점 및 단점은 무엇입니까? 각 방법의 상대적 강점과 약점을 임상 추론 평가 프로그램을 구축하는 데 어떻게 사용할 수 있는가?

Our aim was to create a practical compendium of assessment methods to serve as a reference for medical educators. Given the richness and complexity of the clinical reasoning assessment literature, we chose to perform a scoping review to explore the following questions: What clinical reasoning assessment methods are available? What are the defining features of these assessment methods, and how are they typically used? What are the validity considerations (content, response process, internal structure, relationships to other variables, and consequences or outcomes on clinical practice performance) for each method? What are the feasibility issues, advantages, and disadvantages of each method? How might the relative strengths and weaknesses of each method be used to construct a clinical reasoning assessment program?

방법
Method

방법론 검토
Review methodology

우리는 이 검토를 수행함에 있어 구성주의적 연구 패러다임을 채택했다. 우리는 우리의 질문이 탐색적이었고 예비 검색에서 복잡하고 이질적인 문학의 본체가 밝혀졌기 때문에 scoping methodology 을 선택했다. 우리는 임상 추리 평가 방법의 광범위한 분야를 설명하기를 원했지만, 의학 교육자에 대한 관련성을 보장하기 위해 실용적인 적용에 초점을 맞추고 싶었다. 우리는 가장 일반적으로 사용되는 방법에 대해 보고하지만, 모든 것을 망라하려고 하지는 않습니다. 이 검토는 STORES(Structured Approach to Reporting in Healthcare Education of Previdence Compositation) 스테이트먼트에 따라 제시된다. 
We adopted a constructivist research paradigm in conducting this review. We chose a scoping methodology because our questions were exploratory and because preliminary searches had revealed a complex and heterogeneous body of literature.13 We wanted to describe the broad field of clinical reasoning assessment methods,14 yet remain focused on practical applications to ensure relevance for medical educators. We report on the most commonly used methods, but we do not seek to be exhaustive. This review is presented in accordance with the STORIES (Structured Approach to the Reporting in Healthcare Education of Evidence Synthesis) statement.15

검색 전략
Search strategy

초기 검색 및 기사 선택 프로세스에서 확립된 PRISMA(Preferred Reporting Items for Systematic Reviews and Meta-Analyses) 가이드라인을 따랐습니다. 경험이 풍부한 연구 사서가 검색 전략을 설계하는 데 도움을 주었습니다(보조 디지털 부록 1 참조). 임상 추론을 위한 수많은 동의어는 잘 알려진 임상 추리 평가 방법뿐만 아니라 광범위한 평가 용어와 결합되었다. 검색일로부터 2016년 2월 29일까지 Ovid MEDLINE, CINAHL, ERIC, PsycINFO, Scopus, Google Scholar, New York Academy of Medicine Grey Literature Report에서 검색을 실행했습니다. 검색된 인용문은 체계적인 검토를 수행하기 위한 온라인 데이터 관리 시스템인 DistillerSR(캐나다 온타리오주 오타와)에 업로드되었습니다.

We followed established PRISMA (Preferred Reporting Items for Systematic Reviews and Meta-Analyses) guidelines16 for our initial search and article selection process. An experienced research librarian helped design the search strategy (see Supplemental Digital Appendix 1 at https://links.lww.com/ACADMED/A631). Numerous synonyms for clinical reasoning were combined with a broad range of assessment terms, as well as well-known clinical reasoning assessment methods. We ran the search in Ovid MEDLINE, CINAHL, ERIC, PsycINFO, Scopus, Google Scholar, and the New York Academy of Medicine Grey Literature Report from each database’s inception through February 29, 2016, the date of our search. Retrieved citations were uploaded in DistillerSR (Evidence Partners, Ottawa, Ontario, Canada), an online data management system for performing systematic reviews.

기사 심사 및 리뷰
Screening and review of articles

임상 추론 평가 문헌의 초기 탐구를 위한 광범위한 포함 기준에서 시작했다.

  • (1) 훈련 또는 실습의 모든 단계에서 건강 전문직(예: 의학, 간호, 치과, 물리 또는 직업 치료), 
  • (2) 모든 연구 설계 유형, 
  • (3) 임상 추론 평가 방법(또는 도구)을 명시적으로 연구한 모든 기사 (또는 동의어(예: 임상, 진단, 치료, 예후 의사결정 또는 문제 해결). 보충 디지털 부록 1 참조).

We began with broad inclusion criteria for our initial exploration of the clinical reasoning assessment literature:

  • (1) any health profession (e.g., medicine, nursing, dentistry, physical or occupational therapy) at any stage of training or practice;
  • (2) all study design types; and
  • (3) any article that explicitly studied a method (or tool) of clinical reasoning assessment (or synonymous terms—e.g., clinical, diagnostic, therapeutic, or prognostic decision making or problem solving; see Supplemental Digital Appendix 1 at https://links.lww.com/ACADMED/A631).

영어로 된 기사가 아닌 경우, 의사결정을 임상 추론의 더 큰 인지 과정 대신 특정 임상 문제(예: 심방 세동의 경우)에만 적용한 경우 또는 기사가 연구를 구성하지 않는 논문 또는 해설인 경우 기사는 제외되었다. 리뷰 기사는 데이터 추출에서 제외되었지만 눈덩이 확대를 통해 추가 기사를 식별하는 데 사용되었다. 최종 합성에 앞서, 우리는 의대생, 레지던트 또는 의사에 관한 연구에 초점을 맞추기로 결정했고, 검토를 위한 총 기사 수를 줄이고, 임상 추론에 초점을 맞추도록 다른 보건 직업에 대한 강조를 제거하기로 했다. (또한 비판적 사고와 같은 다른 건강 직업의 관련성이 있는 것이 아니라 별개의 구조에 대해서도 마찬가지입니다.)

Articles were excluded if they were not in English, if decision making was applied only to a specific clinical problem (e.g., a case of atrial fibrillation) instead of the larger cognitive processes of clinical reasoning, or if the article was an essay or commentary that did not constitute research. Review articles were excluded from data extraction but were used to identify additional articles via snowballing. Prior to the final synthesis, we decided to focus on medical student, resident, or physician studies and de-emphasized the other health professions to both reduce the total number of articles for review and ensure that the focus was on clinical reasoning (and not on related but distinct constructs in the other health professions, such as critical thinking).17

다양한 작가 조합이 여러 단계로 기사를 검토했다. 잠재적으로 관련된 제목과 요약은 작가 쌍에 의해 선별되었다. 전문 기사는 포함 및 제외 기준에 따라 다양한 작가 쌍에 의해 적격성을 평가받았다. 적격성 평가를 위한 전문 기사의 평가에 앞서, 우리는 우리 팀의 요약과 집합적 전문지식에 대한 예비 분석을 바탕으로 평가 방법별로 그것들을 분류했습니다. 우리는 염두에 두고 있었다.

  • 오래된 방법이 출판된 기사(예: 객관식 질문[MCQ])에 더 자주 표시될 수 있다.
  • 일반적인 교육 관행은 자주 작성되지 않을 수 있다(예: 구술 사례 프레젠테이션(OCP)).
  • 실현 가능성이 구현 및 사용에 영향을 미칠 수 있다(예: fMRI).

Different combinations of authors (M.D., J.R., S.J.D., E.H., S.A.S., V.L., T.R., D.G., B.H., S.L., C.A.E., T.B., A.R.A., A.S.D.S., T.C., J.S., L.D.G.) reviewed the articles in multiple stages. Potentially relevant titles and abstracts were screened by pairs of authors. Full-text articles were then assessed by different pairs of authors for eligibility based on the inclusion and exclusion criteria. Prior to the assessment of full-text articles for eligibility, we sorted them by assessment methods based on our preliminary analyses of the abstracts and the collective expertise of our team. We were mindful

  • that older methods may be more frequently represented in published articles (e.g., multiple-choice questions [MCQs]),
  • that common educational practices may not necessarily be written about often (e.g., oral case presentations [OCPs]), and
  • that feasibility may affect implementation and use (e.g., functional magnetic resonance imaging).

각 평가 방법은 해당 기사를 추가로 검토하고 합성한 두 명의 저자에게 할당되었다. 어느 단계에서든 의견 불일치는 논의를 통해 해결되었으며, 필요한 경우 제3의 저자가 참여하였다. 데이터 추출 수준에서 코헨 카파 통계량을 사용하여 기준 간 합의를 평가했다.

Each assessment method was assigned to a pair of authors who further reviewed and synthesized those articles. Disagreements at any stage were resolved through discussion to reach consensus, with involvement of a third author if needed. Interrater agreement was assessed using Cohen kappa statistic at the data extraction level.


데이터 추출 양식을 사용하여 다음을 포함한 평가 방법의 특성에 대한 정보를 수집했다.

  • 자극(예: 서면 Vignette, 표준화된 환자(SP), 실제 환자)
  • 응답 형식(예: 선택된 응답, 작성된 자유 텍스트, 성능)
  • 채점(예: 고정 답안, 체크리스트, 글로벌 등급 척도)
  • 일반적인 용도(예: 낮은, 중간, 높은 수준의 의사결정)

A data extraction form (see Supplemental Digital Appendix 2 at https://links.lww.com/ACADMED/A632) was used to capture information on the characteristics of assessment methods, including

  • the stimulus (e.g., written vignette, standardized patients [SPs], real patients);
  • response format (e.g., selected response, constructed free text, performance);
  • scoring (e.g., fixed answer, checklist, global rating scale); and
  • common uses (e.g., low-, medium-, or high-stakes decisions).

이 양식은 도구의 타당성 및 타당성뿐만 아니라 방법과 관련된 주제(예: 맥락의 영향)에 관한 정보도 포착했다. 이 검토의 목적상, 우리는 타당성을 복수의 근거 소스(예: 내용, 대응 프로세스)가 있는 통합된 구성으로 보았다.18 이것은 scoping review였기 때문에 article의 품질은 공식적으로 평가되지 않았다. 추출은 평가 방법에 대한 모든 기사를 완전히 검토하거나 새로운 평가 통찰력을 제공하지 않을 때까지 진행되었습니다.

The form also captured information regarding a tool’s feasibility and validity, as well as any themes (e.g., the influence of context) related to the method. For the purposes of this review, we viewed validity as a unified construct with multiple sources of evidence (e.g., content, response process).18 Because this was a scoping review, the quality of articles was not formally assessed. Extraction proceeded until all articles for an assessment method had been fully reviewed or no new assessment insights were forthcoming.

Data 합성
Data synthesis

추출된 데이터를 사용하여 각 평가 방법을 요약하고 일반적인 자극, 대응 형식, 점수, 일반적인 용도, 타당성 고려 사항, 타당성 문제, 장점 및 단점을 설명하는 설명적 부록을 구성했다. 타당성 고려사항은 교육 및 심리 테스트 표준에 설명된 메시의 5개 영역에 따라 제시된다. 이 부록에는 텍스트를 뒷받침하는 참고문헌이 몇 가지 나열되어 있지만, 일부 방법에서는 60개가 넘는 기사가 있었기 때문에 검토한 기사 전체 목록은 포함되어 있지 않습니다. 일부 경우, 우리는 이러한 부록과 결과의 핵심 사항을 뒷받침하기 위해 (검토에 포함된 목록 외의) 추가적인 seminal references 자료를 사용했다. 이러한 참고 자료는 포함 기준을 충족하지 못했기 때문에 검토에 포함되지 않았다.
We used the extracted data to construct descriptive appendixes that summarize each assessment method, describing common stimuli, response formats, scoring, typical uses, validity considerations, feasibility issues, advantages, and disadvantages. Validity considerations are presented according to Messick’s five domains as described in Standards for Educational and Psychological Testing.19 These appendixes list some references to support the text, but they do not include the full list of the articles reviewed because, for some methods, there were over 60 articles. In some cases, we used additional seminal references (outside of those included in the review) to support key points in these appendixes and in the Results below; these references were not included in the review because they did not meet the inclusion criteria.

검토 과정에서 특정 평가 방법이 임상 추론의 다른 구성 요소를 측정하는 데 다른 방법보다 더 적합하다는 것이 명백해졌다(위 참조). [임상추론 평가 방법 선택을 위한 실용적 가이드 제작]을 목표로 했기 때문에, 우리는 집단적 판단을 사용하여, 임상추론의 다양한 구성 요소를 측정할 수 있는 평가 방법을 식별했다. 

Over the course of the review, it became apparent that certain assessment methods were better suited than others to measure different components of clinical reasoning (see above). Because we aimed to produce a practical guide for medical educators to select clinical reasoning assessment methods, we used our collective judgments to identify assessment methods more or less capable of measuring the different components of clinical reasoning.

우선, 각 컴포넌트의 작업 정의에 합의했습니다(표 1). 다음으로 Qualtrics(2018년 버전, Qualtrics, Provo, Utah, Provo)를 통해 전체 작성자 그룹에 설문조사를 보내 각 평가 방법을 다양한 구성 요소를 평가할 수 있는 능력 측면에서 평가하도록 요청했습니다. (0 = 주소 미지정, 1 = 2차 또는 주변기기, 2 = 1차 초점, NA = 응답 불가). 결과의 평균을 산출하여 다음과 같은 척도로 보고했습니다. 0.0~0.5 = 불량, 0.6~1.0 = 평균, 1.1~1.5 = 양호, 1.6~2.0 = 매우 양호.

First, we agreed on working definitions for each of the different components (Table 1). Next, we sent a survey via Qualtrics (version from 2018, Qualtrics, Provo, Utah) to the full author group, asking them to rate each assessment method in terms of its ability to assess the different components (0 = not addressed, 1 = secondary or peripheral, 2 = primary focus, NA = cannot answer). We averaged the results and reported them on the following scale: 0.0–0.5 = poor, 0.6–1.0 = average, 1.1–1.5 = good, and 1.6–2.0 = very good.

 


표 1 임상 추론의 다양한 구성 요소에 대한 작업 정의
Table 1 Working Definitions for the Different Components of Clinical Reasoning

정보 수집 Information gathering72,73

  • 가설을 생성하거나 구체화하는 데 필요한 데이터를 얻는 과정입니다. 이 과정은 일반적으로 기록 작성, 물리적 수행, 실험실 또는 방사선 데이터 획득, 의료 기록 검토 등을 포함하는 능동적active 프로세스이지만, (관찰을 통한 것처럼) 암묵적일 수도 있습니다. 수집할 정보의 선택은 질병의 지식 표현(예: 스크립트, 스키마)에 의해 결정됩니다.
  • The process of acquiring the data needed to generate or refine hypotheses. This is usually an active process that includes taking a history, performing a physical, acquiring lab or radiographic data, reviewing the medical record, etc., but may be implicit (through observation) as well. The selection of information to gather is driven by knowledge representations of disease (i.e., scripts, schema).

가설 생성 Hypothesis generation74,75

  • 의사가 환자의 임상 소견을 설명할 수 있는 질병을 찾는 초기 비분석적 또는 분석적 과정입니다. 가설 생성은 정보 수집을 피드백하는 반복 프로세스에서 질병의 지식 표현을 활성화하는 것을 포함한다(예: 가설 생성은 더 많은 정보 수집으로 이어지고, 더 많은 가설 생성 및/또는 개선으로 이어진다).
  • An early nonanalytic or analytic process by which a physician tries to find diseases that can explain a patient’s clinical findings. Hypothesis generation involves activation of knowledge representations of disease in an iterative process that feeds back on information gathering and vice versa (e.g., hypothesis generation leads to more information gathering, which leads to more hypothesis generation and/or refinement).

문제 표현 Problem representation74,76

  • [의미적 한정자]와 [주요 발견]을 포함하는 요약으로 전달될 수 있는, 사례의 모든 관련 측면(환자의 임상 소견, 생체 심리학적 차원 등)의 역동적 정신적 표현.
  • A dynamic mental representation of all the relevant aspects of the case (including the patient’s clinical findings, biopsychosocial dimensions, etc.) that can be communicated in a summary that includes semantic qualifiers and key findings.

감별 진단 Differential diagnosis77,78

  • 문제 표현의 최선의 요약 범주를 나타내는 진단 가설의 목록(참고: 전공이 달라지면 감별진단의 우선 순위가 달라질 수 있다. 예를 들어, EM에서는 생명을 위협하는 질병이 먼저 나열되는 경우가 많은 반면 IM에서는 일반적으로 가장 가능성이 높은 질병이 먼저 나열된다.) [자신감의 강도]와 [표현에 대한 증거가 변화함]에 따라 우선적 진단leading diagnosis이 나타난다.
  • A list of diagnostic hypotheses that represent the best summary categorizations of the problem representation (Note: Different specialties may have different priorities when it comes to ordering the differential; e.g., in EM, life-threatening diseases are often listed first, whereas in IM, the most likely diseases are usually listed first). As the strength of confidence and evidence for these representations change, a leading diagnosis emerges.

선행 진단 또는 실제 진단 Leading or working diagnosis79

  • 비록 확정적이지 않더라도, 추가 검사를 진행하거나 치료를 시작하기 위해, 특정 질병일 확률이 의사 자신의 임계값을 초과한 진단입니다
  • A diagnosis for which a physician’s probability of a given disease has crossed his or her threshold to pursue additional testing or to initiate treatment, even if the diagnosis is not definitive.

진단의 정당성 Diagnostic justification77,80

  • 정보 수집의 증거(핵심 임상 소견)를 사용하여, 가능한 한 하나 이상의 진단을 선택하고, 다른 가능한 진단을 비교 및 대조하면서 그 선택을 옹호하려는 시도. 정당화는 사회적으로 필요할 때 의사소통(구술 또는 서면)을 수반하는 경우가 많으며, 선행 임상 추론 과정의 일부가 아닐 수도 있습니다.
  • The attempt to use the evidence (key clinical findings) from information gathering to choose one or more diagnoses as most likely and to defend that choice, comparing and contrasting other possible diagnoses. Justification often involves communication (orally or in writing) when socially required and may not be part of the a priori clinical reasoning process.

관리 및 치료 
Management and treatment79,81

  • 임상추론 뒤에 따라오는 행동으로서, 예측, 관리, 치료, 예방 전략, 증상완화(삶의 질 향상 포함) 및 그러한 행동의 정당화를 포함한다.
  • The actions that follow the clinical reasoning process, including prognostication, management, treatment, prevention strategies, and palliation of symptoms (including improvement of quality of life) and justification for such actions.

 

결과.
Results

초기 데이터베이스 검색과 눈덩이 확장으로 14,709개의 레코드가 생성되었습니다. 중복으로 1,849장을 삭제하고, 12,860장의 레코드는 제목과 추상별로 심사했습니다. 이 심사 후, 11,421개의 기사는 임상 추론의 평가와 관련이 없다는 이유로 제외되었다. 나머지 1,439개 기사는 포함 및 제외 기준에 따라 전문 평가를 받았다. 이 단계에서 901개 기사는 분석에서 제외되었으며, 주된 이유는 임상 추론 평가 방법을 명시적으로 연구하지 않았기 때문이다. 결국, 검토 대상에는 538개 조항(1966년부터 2016년까지)이 포함되었다(그림 1 및 보충 디지털 부록 3 참조). 이 기사들 중 161개는 다른 건강 직업에 초점을 맞췄다. 최종 종합에서는 의대생, 레지던트, 의사 관련 기사 377건만을 중점적으로 다루었다. 이 방법에 대해 계산된 측정기 간 합치도 0.83에서 0.86 사이의 범위에서 높았다.

The initial database search and snowballing yielded 14,709 records. We removed 1,849 as duplicates, leaving 12,860 records to be screened by title and abstract. After this screening, 11,421 articles were excluded because they did not pertain to the assessment of clinical reasoning. The 1,439 remaining articles underwent full-text evaluation based on inclusion and exclusion criteria. At this stage, 901 articles were excluded from the analysis, with the main reason being that they did not explicitly study a clinical reasoning assessment method. In the end, 538 articles (from 1966 to 2016) were included in the review (see Figure 1 and Supplemental Digital Appendix 3 at https://links.lww.com/ACADMED/A633). Of these articles, 161 focused on other health professions. In the final synthesis, we focused exclusively on the 377 articles related to medical students, residents, and physicians. The interrater agreement calculated for the methods was high, ranging from 0.83 to 0.86.

 

포함된 기사에는 임상 전 의대생부터 임상 의대생, 레지던트 및 개업의에 이르기까지 광범위한 학습자가 포함되었습니다. 기사에 실린 작품들은 많은 다른 나라들에서 나왔지만, 대부분은 미국, 유럽, 캐나다에서 왔다. 우리는 기사를 20개의 다른 평가 방법(실험적 또는 참신한 범주 및 19가지 방법)으로 묶었다.

  • 일부 방법에는 다수의 기사가 있었다(예: 스크립트 일치 테스트 및 기술 강화 시뮬레이션 각각 60개 이상).
  • 일부 방법들은 매우 적은 수의 논문만이 검색되었다(예: 임상 또는 종합 통합 퍼즐(CIPs)과 차트 자극 리콜(CSR)은 각각 3개였다.)

보충 디지털 부록 4는 공통 자극, 대응 형식, 점수 매기기, 일반적인 사용, 타당성 고려사항, 타당성 문제, 장점 및 단점을 포함하여 각 평가 방법을 요약하는 설명 부록을 제공하고 있으며, 이를 뒷받침하는 참고 자료를 제공한다.

The included articles encompassed a broad array of learners from preclinical medical students to clinical medical students, residents, and practicing physicians. The work in the articles came from many different countries; however, the majority came from the United States, Europe, and Canada. We clustered the articles into 20 different assessment methods (an experimental or novel category and 19 methods; see below).

  • Some methods had a large number of articles (e.g., script concordance testing and technology-enhanced simulation each had over 60).
  • Others had very small numbers of articles (e.g., clinical or comprehensive integrative puzzles [CIPs] and chart-stimulated recall [CSR] each had 3).

Supplemental Digital Appendix 4 (at https://links.lww.com/ACADMED/A634) shows the descriptive appendixes we constructed that summarize each assessment method, including common stimuli, response formats, scoring, typical uses, validity considerations, feasibility issues, advantages, and disadvantages, as well as supporting references.

방법은 매우 이질적이었지만, 우리는 신뢰성의 연속체를 따라 세 가지 광범위한 범주를 식별했다. 

  • 비작업장 기반 평가(Non-WBAs),
  • 시뮬레이션 임상 환경 평가
  • 작업장 기반 평가(WBAs)

Although the methods were quite heterogeneous, we identified three broad categories, along a continuum of authenticity:

  • non-workplace-based assessments (non-WBAs),
  • assessments in simulated clinical environments, and
  • workplace-based assessments (WBAs).

우리는 이러한 범주에 예외가 있으며 일부 방법이 현실적으로 여러 범주에 배치될 수 있다는 것을 인식한다(예: 자체 조절 학습 미세 분석(SRL-M)). 독특하거나 참신하거나 탐색적인 평가는 실험적이거나 참신한 방법 그룹에 배치되었다. 중요한 방법들이 결국 이 작업 본체에서 나올 수 있지만, 이러한 방법들에 대해 상세히 보고하는 것은 가능하지 않았으며, 이러한 방법들은 보충 디지털 부록 4에서만 다루어진다.

We recognize that these categories have exceptions and that some methods could realistically be placed in multiple categories (e.g., self-regulated learning microanalysis [SRL-M]). Assessments that were unique, novel, or exploratory were placed into an experimental or novel methods group. Although important methods may ultimately emerge from this body of work, it was not feasible to report on all of these methods in depth, and they are only addressed in Supplemental Digital Appendix 4 (at https://links.lww.com/ACADMED/A634).

비WBA
Non-WBAs

우리는 주로 "교실" 평가 또는 비 WBA에 초점을 맞춘 10가지 방법을 식별했다.
We identified 10 methods that largely focused on “classroom” assessments or non-WBAs.

MCQ는 최대 5개의 잠재적 답변 또는 대안이 뒤따르는 임상적 답변으로 구성되며, 단일 최선의 답변, 대안 조합, 각 대안에 대한 참 또는 거짓 또는 매칭을 요구하도록 구성될 수 있다. 

  1. MCQs consist of a clinical vignette followed by up to five potential answers or alternatives and may be structured as to require a single best answer, a combination of alternatives, true or false for each alternative, or matching.20

확장 매칭 질문(EMQ)은 대안 목록에서 선택된 단일 최선의 답변과 함께 임상적 질문을 사용하는 MCQ와 유사하지만, 여러 질문에 적용되는 더 긴 잠재적 답변 목록(5개 이상)을 포함하고 있다. 

  1. Extended matching questions (EMQs) resemble MCQs in their use of a clinical vignette with a single best answer selected from a list of alternatives, but they contain longer lists of potential answers (more than five) that are applied to multiple questions.21,22

단답형 또는 장답형(메세지) 질문은 임상적 질문에 이어 몇 단어에서 여러 문장에 이르는 길이의 구성된 자유 텍스트 응답을 사용하여 하나 이상의 질문에 답하는 방법을 설명한다. 

  1. Short- or long-answer (essay) questions describe a method wherein a clinical vignette is followed by one or more questions answered using constructed free-text responses that range in length from a few words to several sentences.23,24

변형에세이문제(MEQ)은 사례의 일련 정보를 시간순으로 제공하는 방법입니다. 한 문항이 제시되면, 학습자는 작성된 자유 텍스트(에세이) 형식으로 결정을 문서화해야, 그 다음 문항을 볼 수 있습니다.

  1. Modified essay questions (MEQs) are a method wherein serial information is provided about a case chronologically.25,26 After each item, learners must document a decision in a constructed free-text (essay) format before they can view subsequent items.

환자 관리 문제(PMP)는 진단 및 관리에 특정 리소스를 사용할 수 있는 컨텍스트가 풍부한 임상 시나리오로 구성됩니다. 학습자는 조치를 위한 여러 대안 중에서 선택해야 하며, 사례를 계속 진행하면서 그러한 조치의 결과(예: 심전도[ECG] 결과)가 제공됩니다.

  1. Patient management problems (PMPs) consist of context-rich clinical scenarios, where specific resources are available for diagnosis and management.27,28 The learner must select among multiple alternatives for action, and the results of those actions are then provided (e.g., electrocardiogram [ECG] findings) as they continue working through the case.

주요 기능 검사(KFE)에는 임상 의사 결정의 중요한 단계에 초점을 맞춘 2~3개의 질문이 뒤따른다. 주요 특징은 사례별로 다르다(예: 벼락 두통은 지주막하 출혈 진단의 핵심 특징이다).

  1. Key feature examinations (KFEs) contain clinical vignettes followed by two to three questions focused on the critical steps in clinical decision making.29,30 Key features are case specific (e.g., a thunderclap headache is a key feature in the diagnosis of subarachnoid hemorrhage).

스크립트 일치 테스트(SCT)는 임상 추론 중에 새로운 정보가 처리되는 방법을 나타내도록 설계된 불확실성과 관련된 짧은 임상 시나리오로 구성된다. 학습자는 일련의 질문에 답해야 합니다(예: X를 고려하고 있었는데, Y를 찾은 경우, 이 답은 가능성이 더 높아지거나 가능성이 낮아지거나 변경되지 않습니다). 응답은 "전문가"의 참조 패널에서 얻은 응답과 비교되며, 이는 임상 상황에 따라 임상의의 응답의 가변성을 설명한다.

  1. Script concordance tests (SCTs) comprise short clinical scenarios associated with uncertainty that are designed to represent the way new information is processed during clinical reasoning.31,32 Learners must answer a series of questions (e.g., if you were thinking X and then you found Y, this answer would become more likely, less likely, or no change). Responses are compared with those acquired from a reference panel of “experts,” accounting for the variability of clinicians’ responses in different clinical situations.

CIP는 그리드 형태를 취하며, 종종 확장된 매칭 크로스워드 퍼즐과 유사합니다. 많은 발견이 컬럼(예: 이력, 물리, 심전도, 실험실, 병태생리학, 약리학)에 배치되고 관련 진단은 행에 배치된다(예: 심근경색, 폐색전증, 대동맥 박리). 학습자는 열 내 항목과 행 간 항목(소견에 가장 적합한 "일치" 선택)을 비교 및 대조하여 각 진단에 대한 기본적인 질병 스크립트를 작성하도록 요청받습니다.

  1. CIPs take the form of a grid, often analogized to an extended matching crossword puzzle.33,34 A number of findings are placed in columns (e.g., history, physical, ECG, labs, pathophysiology, pharmacology), and related diagnoses are placed in rows (e.g., myocardial infarction, pulmonary embolism, aortic dissection). The learner is asked to compare and contrast items within a column as well as across the rows (selecting the best “match” for the finding), building basic illness scripts for each diagnosis.

개념 지도는 학습자가 그래픽 일러스트를 작성함으로써 영역에 대한 지식 및 지식의 구성을 나타내는 개략적인 평가 방법입니다. 맵은 자유 형식 또는 위계형일 수 있으며, 개념과 개념 간의 관계를 모두 나타냅니다.

  1. Concept maps are a schematic assessment method wherein learners represent their knowledge of a domain, as well as the organization of that knowledge, by creating a graphical illustration.35,36 Maps may be free-form or hierarchical, outlining both concepts and the relationships between the concepts.

구술시험은 한 명 이상의 교직원이 임상적 추론 및 의사결정 능력 및 직업적 가치를 평가하기 위해, 대본이 없거나 반대본semiscripted 방식으로 실시하는 구두평가입니다. 

  1. Oral examinations are verbal assessments conducted by one or more faculty member in either an unscripted or semiscripted fashion to assess clinical reasoning and decision-making abilities, as well as professional values.37,38

영상, 비디오 및 기타 형식은 서면 시험 자료를 보완하거나 보완하는 데 사용될 수 있지만, 대부분의 비 WBA는 [서면] 임상 실험 자료, 또는 [시나리오]를 [자극]으로 사용한다. 비 WBA 방법 중 하나만 언어 자극(구강 검사)을 사용합니다.

The majority of non-WBAs use written clinical vignettes or scenarios as the stimuli, though images, videos, and other formats may be used to supplement or complement the written testing materials. Only one non-WBA method uses a verbal stimulus (oral examinations).

[응답 형식]은 주로 '쓰기written'이지만, 유형(예: 선택된 답변, 구성된 자유 텍스트)은 다양합니다.

The response formats are predominately written, though there is variability in type (e.g., selected answers, constructed free text).

[스코어링 프로세스]는 다양합니다. [단일 정답, 합계 방식]이 일반적입니다(MCQ, EMQ, PMP, KFE 등). 채점은 가중치 부여(즉, 특정 항목이 다른 항목보다 많이 반영됨) 또는 가중치 부여되지 않음(즉, 모든 항목이 동등하게 계산됨), 보상적(즉, 일부 백분율을 틀리고도 합격할 수 있음) 또는 비보상적(즉, 합격하려면 100% 점수가 필요함)될 수 있다. 문항별 채점 또는 전반적 등급 척도는 [단문형 또는 장문형 주관식 응답 및 MEQ]에 사용되며, [규범-기준 또는 준거-기준]으로 채점할 수 있다. CIP 그리드 및 컨셉 맵에는 보다 복잡한 스코어링 시스템이 있습니다. SCT 응답은 "골드 스탠다드"(즉, 전문가 패널의 응답)와 적합성을 비교하여, 그 응답을 선택한 전문가 패널의 비율에 따라 각 항목에 대해 부분적 또는 완전한 점수를 받는다.

Scoring processes vary. Aggregated, fixed-answer responses are common (e.g., MCQs, EMQs, PMPs, KFEs). Scoring can be weighted (i.e., certain items count more than others) or unweighted (i.e., all items count equally) and compensatory (i.e., can get some percentage wrong and still pass) or noncompensatory (i.e., a score of 100% is required to pass). Itemized and global rating scales are used for short- or long-answer constructed free-text responses and MEQs, and they can be norm- or criterion-referenced. CIP grids and concept maps have more complex scoring systems. SCT responses are compared for fit to a “gold standard” (i.e., the expert panel’s responses), and the examinee receives partial to full credit for each item depending on the proportion of the expert panel that chose that response.

중부담 및 고부담 시험에서는 여러 가지 비 WBA 방법이 사용된다(예: MCQ와 KFE는 종합 과정 종료 평가 및 의료 면허 검사에 일반적으로 사용된다). 다른 방법(예: CIP, 개념도)은 충분히 조사되지 않았으며 현재 형성적 평가 또는 연구에 가장 적합하다.

Several non-WBA methods are used for medium- to high-stakes examinations (e.g., MCQs and KFEs are commonly used for summative end-of-course assessments and medical licensing examinations). Other methods (e.g., CIPs, concept maps) are less well explored and are currently most suitable for formative assessments or research.


타당성 고려사항, 실현가능성 문제, 장점 및 단점은 각 방법마다 매우 고유하다. 보충 디지털 부록 4에서는 이러한 차이점에 대해 자세히 설명하지만, WBA 이외를 위한 몇 가지 테마는 여기에서 언급됩니다.

  • MCQ, EMQ 및 KFE는 가장 자주 사용되는 비WBA이며, 맥락 특이성을 최소화하는 광범위한 샘플링의 이점을 가지고 있습니다.
  • 이러한 방법은 높은 내적 일관성을 제공할 수 있는 최고의 기회를 제공하므로, 고부담 평가에 가장 큰 효용성이 있습니다.
  • 전문가 합의 및 블루프린트 덕분에 이러한 방법은 내용 타당성 증거가 강력할 수 있습니다. 이러한 방법은 내용의 통제와 일관성이라는 이점도 있으며, 각 문제에 대한 "정답"이 있다. "정답"이 있다는 것은 WBA에서 항상 가능한 것은 아닙니다.

Validity considerations, feasibility issues, advantages, and disadvantages are highly specific to each method. Supplemental Digital Appendix 4 (at https://links.lww.com/ACADMED/A634) details these differences, but a few themes for non-WBAs warrant mention here.

  • MCQs, EMQs, and KFEs are the most frequently used non-WBAs, and they have the advantage of broad sampling that helps minimize context specificity.
  • They offer the best chance of high internal consistency and thus have the greatest utility for high-stakes assessments.
  • Content validity evidence for these methods can be strong because of expert consensus and blueprinting. These methods also offer the advantage of content control and consistency; there is a “right” answer to each problem, a feature not always possible in WBAs, which allows a measurement of accuracy.

 

또한, 모든 비 WBA 방법은 표준화된 일련의 문제에 걸쳐 학생을 평가할 수 있습니다. 이는 WBA에서는 불가능한 것입니다. 비 WBA 방법에 대한 가장 큰 타당성 문제는 [응답 프로세스 증거]에 있다. 많은 가능성에서 정답을 선택하거나 지식 조직의 그래픽 표현을 개발하거나 사전 정의된 목록에서 정보를 선택하는 것은 일반적으로 실제 임상 추론 활동을 대표하지 않습니다. 이러한 방법의 대부분은 [전체 태스크 평가]보다 [파트 태스크 평가]에 중점을 두고 있습니다. 
(즉, WBA 방법보다 임상 추론의 구성 요소를 더 적게 측정한다. 그림 1 참조). 

Further, all non-WBA methods allow students to be assessed across a standardized set of problems, something that is not possible in the workplace. The greatest validity challenge for non-WBA methods is in response process evidence. Selecting a correct answer from a number of possibilities, developing a graphic representation of knowledge organization, or even selecting information from a predefined list are not generally representative of authentic clinical reasoning activities in practice. Many of these methods emphasize part-task, rather than whole-task assessment (i.e., they measure fewer components of clinical reasoning than WBA methods; see Chart 1).

부분 과제 평가는 임상 실습으로 기술을 성공적으로 이전할 수 없기 때문에 임상 추론 역량을 결정하기 위해 비 WBA에 크게 의존하는 [방어가능성]에 의문이 있다. 이러한 방법 중 일부는 [내부 구조 증거]뿐만 아니라 [다른 변수와의 관계에 대한 증거]를 광범위하게 가지고 있지만, 다른 방법은 이러한 형태의 타당성 증거가 부족하다. 비 WBA는 [종종 면허, 인증 및 자격 증명 결정뿐만 아니라 총괄적 합격 또는 불합격 판단]을 내리는 데 사용되기 때문에 임상 실무 성과에 대한 결과 또는 결과는 중요하다. 학습에 대한 형성 평가는 비 WBA가 진행 테스트 및 임상 추론의 개발에 미치는 영향을 위해 사용될 때 발생할 수 있다(예: 인지 네트워크 개발에 도움이 되는 개념도 사용).

The defensibility of relying heavily on non-WBAs to determine clinical reasoning competence is questionable because part-task assessments cannot ensure successful transfer of skills into clinical practice. Several of these methods have extensive evidence of their relationship to other variables, as well as internal structure evidence, but others lack these forms of validity evidence. Consequences or outcomes on clinical practice performance are significant because non-WBAs are often used to make summative pass or fail judgments as well as licensing, certification, and credentialing decisions. Formative assessment for learning can occur when non-WBAs are used as progress tests and for the effect they have on the development of clinical reasoning (e.g., using concept maps to help develop cognitive networks).

시뮬레이션된 임상 환경에서의 평가
Assessments in simulated clinical environments

시뮬레이션된 임상 환경에서 발생하는 두 가지 방법이 확인되었다.
Two methods were identified that occur in simulated clinical environments.

객관적 구조화 임상검사(OSCE)는 임상추론을 포함하여 학생의 임상능력에 대한 성과 기반 평가입니다. OSCE는 종합 평가를 제공하기 위해 SP, 관찰자 등급, 서면 노트 및 기타 방법을 포함하는 다양한 임상 태스크를 수험자가 실행하는 여러 스테이션으로 구성됩니다.

  1. Objective structured clinical examinations (OSCEs) are performance-based evaluations of students’ clinical skills including, but not exclusively focused on, clinical reasoning.39,40 OSCEs comprise multiple stations where examinees execute different clinical tasks, incorporating SPs, observer ratings, written notes, and other methods, to provide a comprehensive assessment.

기술 강화 시뮬레이션은 학습자가 임상 치료를 모방하는 도구 또는 장치와 물리적으로 상호작용하는 다양한 평가 방법을 설명합니다. 여기에는 학습자 입력에 따라 변경될 수 있는 정적 고충실도 마네킹에서 가상 현실 환자 아바타까지 다양한 계측기가 포함될 수 있습니다.

  1. Technology-enhanced simulation describes a variety of assessment methods wherein learners physically interact with a tool or device that mimics clinical care.41,42 These can encompass a range of instruments from static high-fidelity mannequins to virtual reality patient avatars that can change in response to learner input.

 

  • 시뮬레이션 임상 환경에서 평가는 일반적으로 SP, 고충실도 마네킹 또는 가상 환자 아바타를 [자극]으로 사용한다.
  • OSCE 및 기술 강화 시뮬레이션의 [응답 형식]은 일반적으로 작업 수행 또는 구성된 구두 또는 서면 응답입니다.
  • [채점]은 종종 이분법적(즉, 완료 여부) 또는 행동적으로 고정된 항목별 체크리스트를 통해 이루어집니다. 글로벌 평가 척도가 흔하다.
  • [용도]를 보면, OSCE는 형성적 평가와 높은 단계의 종합 평가에 모두 사용됩니다. (예: 미국 의료 면허 시험 2단계 임상 기술 및 캐나다 의료 위원회 자격 시험 파트 2) 반면 기술 혁신 시뮬레이션은 주로 조형 평가에 사용된다.

 

  • Assessments in simulated clinical environments typically use SPs, high-fidelity mannequins, or virtual patient avatars as stimuli.
  • The response format for OSCEs and technology-enhanced simulations is usually task performance or constructed verbal or written responses.
  • Scoring is often via itemized checklists that may be dichotomous (i.e., done or not done) or behaviorally anchored. Global rating scales are also common.
  • OSCEs are used for both formative and high-stakes summative assessments (e.g., the United States Medical Licensing Examination Step 2 Clinical Skills and the Medical Council of Canada’s Qualifying Examination Part 2), whereas technology-enhanced simulations are mainly used for formative assessments.

 

타당성 고려 사항, 실현 가능성 문제, 장점 및 단점은 보충 디지털 부록 4에 자세히 설명되어 있지만, 몇 가지 주제는 강조되어야 합니다. [내용 타당성] 측면에서 이러한 방법을 블루프린트 할 수 있으며, 이럴 경우 임상 실무와의 연계가 합리적이다(이러한 평가의 authenticity는 대부분의 비 WBA보다는 높지만, 실제 WBA보다는 낮다). 고도로 구성되고 표준화된 재현 가능한 스테이션은 SP 및 평가자 교육에 주의를 기울여야 합니다. 이러한 표준화된 환경에서는 실제 임상 실습 중에 발생하는 평가보다 [맥락적 요인을 제어할 수 있는 능력]이 더 크다. 평가의 블루프린트는 내용특이성을 고려하여 합격에 필요한 필수적 기능feature을 식별해야 합니다(글로벌 평가 척도의 명확한 앵커 포함). 다른 평가 척도(즉, 비 WBA 및/또는 WBA)와의 성과 상관관계는 낮은 수준부터 중간 수준까지이며, 이는 형성 평가에는 허용되지만 높은 단계의 최종 결정에는 바람직하지 않다. 시뮬레이션 환경에서 평가는 여러 임상 추론 구성 요소를 측정하는 능력(그림 1)으로 평가되지만, 실제적인 주요 문제는 [개발 및 관리]가 자원 집약적이라는 것이다.

Validity considerations, feasibility issues, advantages, and disadvantages are detailed in Supplemental Digital Appendix 4 (at https://links.lww.com/ACADMED/A634), but a few themes warrant highlighting. In terms of content validity, these methods can be blueprinted, and their alignment with clinical practice is reasonable (higher than most non-WBAs, yet less authentic than true WBAs). Highly organized, standardized, reproducible stations require attention to SP and rater training. There is greater ability to control contextual factors in these standardized environments than in assessments that occur during actual clinical practice. Blueprinting for these assessments must attend to content specificity and distinguish what essential features are required to pass (with clear anchors for global rating scales). Performance correlations with other assessment measures (i.e., non-WBAs and/or WBAs) are only low to moderate, which is acceptable for formative assessments but is less than desirable for high-stakes summative decisions. Assessments in simulated environments are valued for their ability to measure multiple clinical reasoning components (Chart 1), but a major practical problem is that they are resource-intensive to both develop and administer.

WBA
WBAs

인증된 임상 환경 또는 WBA의 평가에 초점을 맞춘 7가지 방법이 확인되었다.
Seven methods were identified that focus on assessments in authentic clinical environments or WBAs.

직접 관찰(direct observation)은 성능 또는 임상 관찰이라고도 하며, 실제 임상 상황에서 학습자에 대한 데이터를 수집하는 관찰자(일반적으로 교수진)의 존재를 나타냅니다. 다양한 평가 도구가 직접 관찰을 위해 사용되었지만(예: 미니 임상 평가 연습[mini-CEX]) 임상 추론을 평가하도록 명시적으로 설계된 것은 아니다.

  1. Direct observation, also known as performance or clinical observation, describes the presence of an observer (typically a faculty member) who collects data about learners in authentic clinical contexts.43 A variety of assessment tools have been used for direct observation43 (e.g., the mini-clinical evaluation exercise [mini-CEX]),44 though they are not all explicitly designed to assess clinical reasoning.

글로벌 평가는 교직원 평가 양식의 공통 컴포넌트입니다. 직접 또는 간접 관찰에 기초한 임상 추론 성과에 대한 개별 판단 또는 게슈탈트 교사를 포착합니다.

  1. Global assessments are common components of faculty evaluation forms.45,46 They capture individual judgments or preceptor gestalt about clinical reasoning performance based on direct or indirect observations.

OCP는 임상 사례에 대한 체계적인 구두 보고입니다. 학습자가 무엇을 포함하거나 제외할 것인지, 데이터 구성, 평가와 계획의 구조와 내용에 대해 신중하게 선택할 때 학습자의 진단 및 치료 추론의 증거가 평가된다. 평가자는 학습자의 이해와 추가 정보를 탐색할 수 있습니다.

  1. OCPs are structured verbal reports of clinical cases.47,48 Evidence of a learner’s diagnostic and therapeutic reasoning is assessed as the learner makes deliberate choices about what to include or exclude, data organization, and the structure and content of the assessment and plan. Raters can probe learners for understanding and additional information.

서면 메모는 사례에 대한 임상 정보를 체계적인 방식으로 전달하는 또 다른 수단이다. 이 경우 서면 보고서를 통해. 다양한 도구 중 하나(예: 사후 메모, IDEA[해석 요약, 차등 진단, 추론 설명 및 대안] 평가 도구51)를 사용하여 평가할 수 있다. OCP와 마찬가지로 임상 추론은 메모의 여러 특징, 특히 요약문(주요 특징과 의미 한정자를 포함하는 사례의 캡슐화), 문제 목록, 차등 진단의 우선순위 부여, 정당성 및 관리 계획에서 평가할 수 있다.

  1. Written notes are another means of communicating clinical information about a case in a structured way—in this case, via a written report.49 They may be assessed by using one of a variety of tools (e.g., postencounter notes,50 the IDEA [interpretive summary, differential diagnosis, explanation of reasoning, and alternatives] assessment tool51). Similar to OCPs, clinical reasoning may be assessed from multiple features of a note, particularly the summary statement (an encapsulation of the case containing key features and semantic qualifiers), problem list, prioritization of the differential diagnosis, justification, and management plan.

CSR은 실제 임상 조우로부터의 [임상 문서 검토], 평가자가 근본적인 사고 과정을 조사하는 [구두 검사], 향후 진단 의사 결정을 개선하기 위한 [행동 계획]을 포함한 [피드백]으로 구성된 하이브리드 형식입니다. 

  1. CSR is a hybrid format consisting of clinical documentation review from an actual clinical encounter, an oral examination where an evaluator probes underlying thought processes, and feedback that may include action plans to improve future diagnostic decision making.52,53

Think aloud(TA)는 학습자에게 개별 과제를 부여하고 작업을 수행하는 동안 자신이 가졌거나 가졌던 여과되지 않은 생각을 음성으로 표현하도록 하는 기술입니다. TA는 일반적으로 작업을 완료하는 동안(동시) 관리되지만, 작업 완료 직후(지연) 수행될 수도 있습니다.

  1. Think aloud (TA) is a technique where learners are given a discrete task and asked to voice the unfiltered thoughts they have or had while performing the work.54,55 TAs are typically administered while completing the task (simultaneous) but may also be performed immediately following task completion (delayed).

SRL-M학습자가 [시작, 중간, 끝이 있는 임상 활동]에 [접근, 수행, 성찰]할 때, 학습자의 [생각, 행동, 느낌]에 대한 즉각적인 [태스크 수준 정보를 수집]하도록 설계된, [구조화된 인터뷰 프로토콜]이다. TA의 특징과 조합하여 메타인식을 평가할 수 있습니다.

  1. SRL-M describes a structured interview protocol designed to gather in-the-moment, task-level information about learners’ thoughts, actions, and feelings as they approach, perform, and reflect on a clinical activity that has a beginning, middle, and end.56,57 Combined with features of the TA, it can assess metacognition.


WBA 방법은 실제 환자를 [자극]으로 의존한다. 이러한 방법의 [응답 형식]에는 환자와의 임상 성과(직접 관찰, 글로벌 평가) 또는 작성된 구두 또는 서면 자유 텍스트(OCP, 서면 노트, CSR, TA, SRL-M)가 포함된다. [채점] 메커니즘은 매우 다양하며 다양한 유형의 항목별 또는 글로벌 등급 척도를 포함한다 (표준 참조, 기준 참조, 위탁 척도, 감독 척도), 체크리스트 등. WBA는 임상 사무직 및 레지던트 기간 동안 형성 평가에 가장 일반적으로 [사용]됩니다. 이러한 정보를 총괄적 의사결정에 사용할 경우, 일반적으로 [다수의 관측값 또는 글로벌 평가]를 합산한다. 일반적으로 사용되는 WBA는 [형성 평가에 사용되는 직접 관찰(예: 미니 CEX)]과 [임상 사무직 및 레지던트 로테이션 종료 총괄 평가에 사용되는 글로벌 평가]이다. 구두 발표와 서면 메모는 교수진의 최종 글로벌 평가에 영향을 미칠 수 있지만 고부담 평가에는 거의 사용되지 않습니다. TA와 SRL-M은 일반적으로 연구 맥락에 더 많이 관여하지만 어려움을 겪고 있는 학습자의 교정조치에 사용되어 왔다. 

WBA methods rely on real patients as stimuli. Response formats for these methods include clinical performance with patients (direct observation, global assessment) or constructed verbal or written free text (OCPs, written notes, CSR, TA, SRL-M). Scoring mechanisms vary widely and include itemized or global rating scales of various types (norm referenced, criterion referenced, entrustment scales, supervision scales), as well as checklists, etc. WBAs are most commonly used for formative assessment during clinical clerkships and residency. When they are used to make summative decisions, multiple observations or global assessments are typically aggregated. The workhorses of WBAs are direct observation (e.g., mini-CEX), which is typically used for formative assessments; and global assessments, which are typically used for end-of-rotation summative assessments during clinical clerkships and residency rotations. Oral presentations and written notes may influence a faculty rater’s final global assessment but are infrequently used for high-stakes assessments. TA and SRL-M are typically more involved in research contexts but have been used for the remediation of struggling learners.58,59

WBA 방법의 타당성 고려 사항, 실현 가능성 문제, 장점 및 단점에 대한 자세한 내용은 보충 디지털 부록 4에 요약되어 있지만, 여기서는 몇 가지 주제를 강조합니다. WBA의 큰 강점은 [임상 추론의 여러 구성 요소를 측정하는 능력]이다(그림 1). 이러한 방법은 실제 임상 환경에서 이뤄지므로 [내용 타당도 증거]와 [응답 프로세스 타당성 증거]가 합당하다. 그러나 임상 실무의 비체계적 성격은 [특정 임상 문제의 내용 적용 범위와 과다 또는 과소 표현]과 관련하여 문제를 제기할 수 있다. [내부 구조 증거(예: 항목 분석 데이터, 점수 척도 신뢰성, 표준 측정 오류)]는 이러한 방법 중 많은 수가 복잡한 행동의 관찰을 소수의 평가 결과로 정량화할 관찰자(시설 구성원)를 필요로 한다는 점에서 문제가 있다. 판단 과정에 편견과 불일치가 내재되어 있다. 이러한 타당도 위협을 줄이기 위한 핵심 전략은 [여러 평가자에 의한 다양한 임상 문제 집합에 대한 적절한 수의 관찰시간 경과에 따라 보장하는 것]이다. 일반화 이론의 관점에서 판단을 위해 허용 가능한 신뢰성에 도달하기 위해 12 - 14개의 미니 CEX가 필요하기 때문에, 이 정도가 되지 않는다면 WBAs를 사용하는 방어가능성에 의문이 있다. WBA의 도입에는 시간, 교수개발, 책무성, 평가에 참여하는 교수에 대한 인정 등이 과제가 되고 있습니다. 이는 임상환경이 [수련생의 감독이나 평가]보다 [생산성]을 중시하는 경우가 많기 때문입니다.

The details of validity considerations, feasibility issues, advantages, and disadvantages of WBA methods are summarized in Supplemental Digital Appendix 4 (at https://links.lww.com/ACADMED/A634), but we will highlight a few themes here. A great strength of WBAs is their ability to measure multiple components of clinical reasoning (Chart 1). Because these methods are embedded in authentic clinical environments, there is reasonable content and response process validity evidence. The nonsystematic nature of clinical practice, however, can present challenges with regard to content coverage and over- or underrepresentation of certain clinical problems. Internal structure evidence (e.g., item analysis data, score scale reliability, standard errors of measurement) is problematic in that many of these methods require an observer (faculty member) to quantify their observation of a complex behavior into a small number of assessment outcomes. Biases and inconsistencies are inherent in this judgment process.60–62 A key strategy to reduce these threats to validity is to ensure an adequate number of observations across a diverse set of clinical problems by multiple raters over time. The defensibility of using WBAs for summative pass/fail and remediation decisions is questionable without this because, from a generalizability theory perspective, 12 to 14 mini-CEXs are needed to reach acceptable reliability for judgments. Challenges to implementing WBAs include time, faculty development, accountability, and recognition for faculty who engage in these assessments, as clinical environments often value productivity over the supervision and evaluation of trainees.

 

논의
Discussion

이 검토는 현재 이용 가능한 임상 추론 평가 방법의 메뉴를 요약하고 타당성 고려사항, 타당성 문제, 장점 및 단점을 각각 강조한다. 특히 차트 1과 보충 디지털 부록 4는 평가 프로그램의 구축에 도움이 됩니다. 교육자는 각기 다른 타당성 고려사항을 가진 서로 다르지만 상호 보완적인 여러 임상 추론 평가 방법 중에서 선택할 수 있다. 조사 결과에 근거한 실용적인 가이던스는 리스트 1에 기재되어 있습니다.
This review summarizes the currently available menu of clinical reasoning assessment methods and highlights validity considerations, feasibility issues, advantages, and disadvantages for each. Chart 1 and Supplemental Digital Appendix 4 (at https://links.lww.com/ACADMED/A634) in particular can help inform the construction of programs of assessment.63 Educators can select from a number of different but complementary clinical reasoning assessment methods, each with different validity considerations. Practical guidance based on our findings is given in List 1.

임상 추론 평가 방법의 기존 메뉴의 가치는 역량 기반 교육의 렌즈를 통해 가장 잘 이해할 수 있다. 의학 교육자가 학습자가 임상 추론의 역량을 ensure하려면 임상 추론의 모든 구성요소에 대한 강력한 평가를 제공해야 한다12(표 1 참조). 또한 적절한 샘플링을 준비해야 한다. 이는 여러 평가 방법을 사용해야만 달성할 수 있습니다. 
The value of the existing menu of clinical reasoning assessment methods can perhaps best be understood through the lens of competency-based education. If medical educators want to ensure that learners are competent in clinical reasoning, they must provide robust assessment of all components of clinical reasoning12 (see Table 1). Further, they must also arrange for adequate sampling. This can only be accomplished by employing multiple assessment methods.63

차트 1을 자세히 살펴보면 일반적으로 사용되는 [많은 형태(MCQ, EMQ, KFE, SCT)의 비 WBA]는 [정보 수집, 가설 생성 및 문제 표현 평가]에서 [평균에 불과하다]는 것을 알 수 있습니다. 이들의 강점은 감별 진단 평가, 선도 진단, 관리 및 치료에 있습니다. 시뮬레이션된 임상 환경과 WBA에서의 평가는 정보 수집을 평가하는 데 더 우수하며, 직접 관찰과 OSCE가 이 영역에서 가장 강력하다. SRL-M 및 TA 전략은 학습자가 추론 과정에서 숨겨진 이러한 단계를 명확하게 설명하도록 하기 때문에 가설 생성 및 문제 표현을 측정하기 위한 효과적인 도구입니다. 교육자는 임상 추론의 다양한 구성요소를 평가하는 데 강한 전략을 신중하게 조합함으로써(예를 들어 MCQ + SRL-M + OSCE) 더 큰 역량의 모든 구성요소에 대한 평가를 확실하게 시작할 수 있습니다.
A close look at Chart 1 demonstrates that many forms of non-WBAs in common use (MCQs, EMQs, KFEs, SCTs) are only poor to average at assessing information gathering, hypothesis generation, and problem representation. Their strengths lie more in assessing differential diagnosis, leading diagnosis, and management and treatment. Assessments in simulated clinical environments and WBAs are better at assessing information gathering, with direct observation and OSCEs being the strongest in this domain. SRL-M and TA strategies are effective tools for measuring hypothesis generation and problem representation because they force learners to articulate these otherwise hidden steps in the reasoning process.64 By carefully combining strategies that are strong at assessing the different components of clinical reasoning (e.g., MCQs + SRL-M + OSCEs), educators can begin to ensure assessment of all components of the larger competency.

물론 "전체"로서의 임상적 추론 능력은 "부분"의 합보다 더 크다. 평가 프로그램을 구성할 때 [임상 추론의 모든 구성 요소를 평가하는 것]은 필요하지만 충분하지는 않다. 학습자가 기술을 임상 실습으로 이전할 수 있도록 보장하기 위해 전체 작업 평가(즉, 전체 임상 추론을 다루는 평가)가 필요하며, 광범위한 표본 추출을 위해 부분 작업 평가가 필요하다. 전체 및 파트 태스크 평가(예: 직접 관찰, OSCE 및 MCQ, KFE 및 EMQ와 결합된 글로벌 평가)의 조합은 평가 프로그램의 기초를 형성할 수 있다.
Of course, clinical reasoning competence as a “whole” is more than the sum of its “parts.”65 When constructing an assessment program, it is necessary, but not sufficient, to ensure assessment of all components of clinical reasoning. Whole-task assessments (i.e., those that cover the full range of clinical reasoning) are needed to ensure that learners can transfer skills into clinical practice,66 while part-task assessments are needed to achieve broad sampling. Combinations of whole- and part-task assessments (e.g., direct observations, OSCEs, and global assessments combined with MCQs, KFEs, and EMQs) can form a foundation for a program of assessment.

교육자는 또한 방법 중에서 선택할 때 평가의 [타당성, 사용가능성, 방어가능성]을 고려해야 합니다. 차트 1을 보면, 평가자가 주로 WBA를 사용하는 경우, 실제 임상 환경에서 임상 추론의 모든 구성 요소에 대한 강력한 적용 범위를 확보하고 학습자가 유능하다고 쉽게 간주할 수 있다고 결론지을 수 있다. WBA는 매우 중요하며 현재의 역량 기반 교육 프로그램에서 더욱 강조할 가치가 있지만, 실현 가능성과 비용(교직원의 시간과 비용에 관한)이 종종 [표본으로 삼을 수 있는 사례의 수와 다양성을 제한]하기 때문에, 임상 추론을 평가하기 위하여 배타적으로 WBA만 사용하게 되면 내용특이성과 맥락특이성에 의해 제약을 받을 것이다. 이러한 관점에서 볼 때, 비 WBA(예: MCQ, EMQ, KFE)를 활용하여 맥락특이성의 문제를 줄이고, [블루프린트, 통제, 일관성 및 정확성]을 확보하는 동시에, 광범위한 표본을 확보함으로써, 임상 추론 평가 프로그램에 중요한 가치를 더할 수 있다. 따라서 타당성과 실현가능성을 모두 고려한다면, 모든 평가 프로그램에서는 [비 WBA, 시뮬레이션 환경의 평가, WBA의 균형]을 유지하는 것이 중요하다.

Educators must also consider the validity, feasibility, and defensibility of assessments when choosing among methods. Looking at Chart 1, one might conclude that if assessors predominately used WBAs, they would obtain robust coverage of all components of clinical reasoning in authentic clinical environments and easily be able to deem a learner competent. Although WBAs are critically important and deserve greater emphasis in current competency-based educational programs,67,68 the limitations of an exclusively WBA approach to assessing clinical reasoning rest in the problem of content and context specificity because feasibility and cost (with regard to faculty time and money) often limit the number and variety of cases that can be sampled. Seen in this light, non-WBAs (e.g., MCQs, EMQs, KFEs) add important value to a program of clinical reasoning assessment by ensuring broad sampling, while lessening issues of context specificity and providing opportunities for blueprinting, control, consistency, and accuracy. Thus, for validity and feasibility reasons, it is critical to have a balance of non-WBAs, assessments in simulated clinical environments, and WBAs in any assessment program.

이러한 균형을 잡는 것이 교육적 맥락에 따라 어려울 수 있습니다. 예를 들어,

  • [학부 의학교육 프로그램]은 종종 MCQ, OSCE, 글로벌 평가, 구두 발표 및 서면 메모의 조합을 사용하여 추론을 평가합니다. 이러한 프로그램은 [직접 관찰]과 같은 특정 방법의 사용을 개선하는 동시에 현재 충분히 평가되지 않을 수 있는 임상 추론의 구성 요소를 얻기 위해 TA 또는 SRL-M과 같은 새로운 방법을 통합하기를 원할 수 있다.
  • [졸업후 의학 교육]에서 학습과 평가의 대부분은 임상 환경에서 이루어지며, 종종 MCQ로 구성된 기술 강화 시뮬레이션과 훈련 중인 검사를 통해 강화된다. 광범위한 평가 방법을 통합하고, 현재 사용 중인 평가 방법을 개선하며, 바쁜 임상 환경에서 도구에 대한 평가자를 교육하는 것은 쉽지 않을 것입니다.

WBA가 개선되면, 이러한 보다 전체적인holistic 평가가 우세할 수 있으며, 비 WBA는 주로 [불확실성과 재교육 상황]에서 주로 사용될 수 있다. 그러나 이러한 전환을 효과적으로 하기 위해서는 여전히 많은 연구가 필요하다.

Creating such a balance can be challenging depending on the educational context.

  • For example, undergraduate medical education programs often use a combination of MCQs, OSCEs, global assessments, oral presentations, and written notes to assess reasoning. These programs may wish to improve the use of certain methods, such as direct observation, while also incorporating novel methods, such as TA or SRL-M to get at components of clinical reasoning that may be currently underassessed.
  • In graduate medical education, the bulk of learning and assessment happens in the clinical environment, augmented occasionally by technology-enhanced simulation and in-training examinations, which are largely comprised of MCQs. Incorporating a wider range of assessment methods, improving on assessment methods currently in use, and training raters on tools in busy clinical settings will be daunting.

As WBAs improve, it may be possible that these more holistic assessments can predominate, and non-WBAs can be used largely for situations of uncertainty and remediation; however, much research is still needed to make this transition effectively.

궁극적으로, 기관은 평가 프로그램이 임상 추론의 구성요소에 대한 완전한 적용 범위를 제공하는지 확인해야 한다(표 1과 차트 1). 프로그램은 [전체 태스크 방법]과 [부분 태스크 방법]을 모두 사용할 필요가 있을 뿐만 아니라, [타당성]에 대한 다양한 위협과 관련하여 방법에 대한 균형 잡힌 표현을 제공해야 한다(보조 디지털 부록 4 참조). 임상 추론을 위한 프로그램적 평가는 여전히 많은 기관에서 초기 개념이지만, 이 리뷰는 이 분야가 미래에 이동해야 한다는 것을 시사한다. 의료기관은 임상 추론의 빈번한 평가를 수행하여 여러 출처에서 여러 방법을 사용하여 다양한 맥락 또는 환경에 걸쳐 세로 방향으로 정보를 수집해야 한다. 이는 시간과 교직원 육성의 필요성 때문에 현실에서 어려운 일이지만, 높은 수준의 종합적 결정이나 역량 결정을 내릴 때 평가 프로그램의 방어성에 매우 중요합니다. 또한 환자 안전을 보장하는 것도 중요하다.69 현재 평가 관행이 비 WBA, 시뮬레이션 임상 환경의 평가 및 WBA의 적절한 균형을 이루는지 여부는 논란의 여지가 있지만 이 검토의 범위를 완전히 벗어나 있다.
Ultimately, institutions must ensure that their programs of assessment offer complete coverage of the components of clinical reasoning (Table 1 and Chart 1). Programs will need to use both whole- and part-task methods as well as provide a balanced representation of methods with regard to various threats to validity (see Supplemental Digital Appendix 4 at https://links.lww.com/ACADMED/A634). Programmatic assessment for clinical reasoning is still a nascent concept at many institutions, yet this is where this review suggests the field needs to move in the future. Institutions need to conduct frequent assessments of clinical reasoning, gathering information longitudinally from multiple sources, using multiple methods, across various contexts or settings. This is challenging in the real world because of time and the necessity of faculty development, yet it is critical for the defensibility of an assessment program when making high-stakes summative decisions or competency determinations. It is also critical to ensure patient safety.69 Whether our current assessment practices strike the right balance of non-WBAs, assessments in simulated clinical environments, and WBAs is debatable but beyond the scope of this review to fully address.

우리의 논의는 주로 임상추론역량과 [학습의 평가AoL]에 초점을 맞췄지만, [학습을 위한 평가AfL]를 고려하는 것도 중요하다. 많은 동일한 원칙이 적용되지만, 학습을 위한 평가는 보다 형성적이며, 임상 추론 과정을 학습하고 가르치는 데 높은 가치가 있기 때문에, [다른 범위의 타당성 증거]를 사용할 수 있다(즉, 방법이 목적에 적합해야 한다). 예를 들어, CIP와 개념 지도는 학생들이 질병 스크립트를 개발하고 연결을 형성하도록 돕는다는 점에서 학습에 큰 효용을 가지고 있으며, 진단 전문지식의 기초라고 생각되는 코딩 및 검색 네트워크의 개발을 촉진한다. 직접 관찰 및 기술 강화 시뮬레이션과 같은 전체 작업 임상추론 평가는 다수의 관찰 없이 총괄적 판단을 하는 데 적합하지 않더라도 형성적 피드백을 얻는 데 필수적인 수단이다.

Although our discussion has largely focused on determining clinical reasoning competency and assessment of learning, it is also important to consider assessment for learning. While many of the same principles apply, assessment for learning is more formative and may employ methods that have a different range of validity evidence because of their high value for learning and teaching the clinical reasoning process (i.e., the method is fit for the purpose). For example, CIPs and concept maps have great utility for learning in that they help students develop illness scripts and form connections, facilitating the development of coding and retrieval networks, which are thought to be the basis of diagnostic expertise.70,71 Whole-task clinical reasoning assessments, such as direct observations and technology-enhanced simulations, are essential means of obtaining formative feedback, even if they are not well suited for making summative judgments without large numbers of observations. 


의사의 역량으로서의 임상 추론의 중요성은 평가의 엄격함과 혁신을 요구한다. 이 검토는 임상 추론 평가 방법에 상당한 혁신이 있었음을 보여주지만, 아직 해야 할 일이 많이 남아 있다. 우리는 이 집계된 자료가 교육자들이 임상 추론 평가 방법의 기존 메뉴와 그 중에서 선택하는 방법에 대해 더 잘 알 수 있도록 돕기를 바란다. 우리는 이 방법들의 개선을 이끌기 위해 지속적이고 엄격한 타당성 증거 수집의 필요성을 강조한다. 의대, 레지던트 프로그램 및 면허 위원회가 학습자의 역량을 자신 있게 결정할 수 있도록 다양한 방법을 임상 추리 평가의 유효한 프로그램에 가장 잘 결합하는 방법을 결정하기 위한 미래 연구도 필요하다.

The importance of clinical reasoning as a physician competency mandates rigor and innovation in the assessment of it. This review demonstrates that there has been considerable innovation in clinical reasoning assessment methods, but there remains much work to be done. We hope this collated resource will help educators become more aware of the existing menu of clinical reasoning assessment methods and how to choose among them. We emphasize the need for ongoing and rigorous gathering of validity evidence to guide improvements in each of these methods. Future research is also needed to determine how to best combine various methods into valid programs of clinical reasoning assessment to allow medical schools, residency programs, and licensing boards to confidently determine the competence of their learners.

 

220402 Clinical Reasoning Clinical_Reasoning Supplementary acadmed_2019_01_24_daniel_acadmed-d-18-00787_sdc4.pdf
0.41MB

List 1 2016년 임상추론평가방법 범위 검토의 임상추론평가를 위한 실무지침
List 1 
Practical Guidance for Clinical Reasoning Assessment From a 2016 Scoping Review of Clinical Reasoning Assessment Methods

  • 임상 추론 평가 프로그램의 일부로 다양한 평가 방법(즉, 비 WBA, 시뮬레이션 임상 환경의 평가 및 WBA)을 사용해야 한다.
  • Multiple assessment methods (i.e., non-WBAs, assessments in simulated clinical environments, and WBAs) should be used as part of a clinical reasoning assessment program.
  • 많은 개별 평가 방법은 적절한 항목 또는 사례의 수, 광범위한 표본 추출 및 충분한 시험 시간으로 높은 단계 평가( 0 >= 0.8)에 대한 적절한 [신뢰성]을 얻을 수 있다.
  • Many individual assessment methods can obtain adequate reliability for high-stakes assessment (≥ 0.8) with an adequate number of items or cases, broad sampling, and sufficient testing time.
  • 역량을 확신ensure하려면, 내용 및 상황 특이성을 수용하기 위한 다양한 환경에서 다양한 임상 문제를 다루는 많은 평가가 종적으로 필요하다.
  • To ensure competence, a large number of assessments are needed, administered longitudinally, that cover a variety of clinical problems in diverse settings to accommodate content and context specificity.
  • 평가방법은 임상 추론, 타당성, 실현가능성, 방어가능성, 목적적합성 등 다양한 구성 요소의 적용범위에 기초하여 선택해야 한다.
  • Methods should be chosen based on coverage of the different components of clinical reasoning, validity, feasibility, defensibility, and fit for the purpose of the assessment.
  • 전체작업평가 및 부분작업평가 방법을 함께 사용하면(즉, 임상 추론의 모든 구성 요소와 일부 구성 요소를 포괄하는 방법)은 전체 구조의 측정과 적절한 표본 추출을 보장할 수 있다.
  • Whole- and part-task assessment methods (i.e., those that cover all versus a few components of clinical reasoning) used together can ensure measurement of the whole construct and adequate sampling.
  • 비 WBA(예: MCQ, EMQ, KFE)는 광범위한 샘플링, 블루프린팅, 통제, 일관성이라는 장점이 있다. 정확성도 평가할 수 있습니다.
  • Non-WBAs (e.g., MCQs, EMQs, KFEs) have the advantage of broad sampling, blueprinting, control, and consistency. They can also assess accuracy.
  • MCQ와 KFE[내용, 내부 구조, 임상 수행능력에 대한 성과 또는 후과]에 관한 최선의 타당성 증거를 가지고 있다. 그러나 [응답 프로세스]에 관한 경우, 그들은 중요한 문제를 안고 있다.
  • MCQs and KFEs have the best validity evidence regarding content, internal structure, and consequences or outcomes on clinical practice performance; however, they have significant issues with cueing when it comes to response process.
  • [비 WBA]는 [전체 과제를 더 많이 측정하는 경향이 있는 시뮬레이션과 WBA]에 비해, 임상 추론의 구성요소의 수가 더 제한적이다.
  • Non-WBAs measure a more limited number of components of clinical reasoning compared with simulations and WBAs, which tend to measure more of the whole task.
  • WBA는 실제 임상 프랙티스에 포함되기에, [내용 및 응답 프로세스의 타당성]에 대한 신뢰성을 제공합니다.단, 내용 커버리지가 체계적이지 않습니다.
  • WBAs are embedded in actual clinical practice, lending authenticity to content and response process validity; however, content coverage is not systematic.
  • 일반화 이론의 관점에서 판단의 허용 가능한 신뢰성에 도달하기 위해서는 다수의 측정이 필요하기 때문에 요약 의사결정에 WBA를 사용하는 것의 방어가능성은 의문을 갖게 만들 수 있다. WBA의 경우 [장기간에 걸쳐 복수의 평가자에 의한 평가]가 필수적입니다.
  • The defensibility of using WBAs for summative decisions is questionable because, from a generalizability theory perspective, a large number of measurements are needed to reach acceptable reliability for judgments. Ensuring evaluation by multiple raters over time is also essential for WBAs.
  • [전체 과제 임상 추론 평가](즉, 정보 수집에서 차등 진단, 관리 및 치료까지 모든 작업을 포괄하는 평가)는 형성적 피드백과 학습을 위한 평가에 필수적이다.
  • Whole-task clinical reasoning assessments (i.e., those that cover the full range of tasks from information gathering to differential diagnosis to management and treatment) are essential for formative feedback and assessment for learning.
  • [시뮬레이션된 임상 환경과 WBA의 평가]는 학습자가 개발 및 관리에 시간과 자원이 많이 소요되지만 전체 과제에 대해 평가되도록 하기 때문에 모든 포괄적인 평가 전략의 필수적인 부분이다.
  • Assessments in simulated clinical environments and WBAs are essential parts of any comprehensive assessment strategy because they ensure that learners are assessed on the whole task, though they are time- and resource-intensive to develop and administer.

Abbreviations: WBAs indicates workplace-based assessments; MCQs, multiple-choice questions; EMQs, extended matching questions; KFEs, key feature examinations.

 


Acad Med2019 Jun;94(6):902-912.  doi: 10.1097/ACM.0000000000002618.

Clinical Reasoning Assessment Methods: A Scoping Review and Practical Guidance

Affiliations collapse

Affiliation

1M. Daniel is assistant dean for curriculum and associate professor of emergency medicine and learning health sciences, University of Michigan Medical School, Ann Arbor, Michigan; ORCID: http://orcid.org/0000-0001-8961-7119. J. Rencic is associate program director of the internal medicine residency program and associate professor of medicine, Tufts University School of Medicine, Boston, Massachusetts; ORCID: http://orcid.org/0000-0002-2598-3299. S.J. Durning is director of graduate programs in health professions education and professor of medicine and pathology, Uniformed Services University of the Health Sciences, Bethesda, Maryland. E. Holmboe is senior vice president of milestone development and evaluation, Accreditation Council for Graduate Medical Education, and adjunct professor of medicine, Northwestern Feinberg School of Medicine, Chicago, Illinois; ORCID: http://orcid.org/0000-0003-0108-6021. S.A. Santen is senior associate dean and professor of emergency medicine, Virginia Commonwealth University, Richmond, Virginia; ORCID: http://orcid.org/0000-0002-8327-8002. V. Lang is associate professor of medicine, University of Rochester School of Medicine and Dentistry, Rochester, New York; ORCID: http://orcid.org/0000-0002-2157-7613. T. Ratcliffe is associate professor of medicine, University of Texas Long School of Medicine at San Antonio, San Antonio, Texas. D. Gordon is medical undergraduate education director, associate residency program director of emergency medicine, and associate professor of surgery, Duke University School of Medicine, Durham, North Carolina. B. Heist is clerkship codirector and assistant professor of medicine, University of Pittsburgh School of Medicine, Pittsburgh, Pennsylvania. S. Lubarsky is assistant professor of neurology, McGill University, and faculty of medicine and core member, McGill Center for Medical Education, Montreal, Quebec, Canada; ORCID: http://orcid.org/0000-0001-5692-1771. C.A. Estrada is staff physician, Birmingham Veterans Affairs Medical Center, and director, Division of General Internal Medicine, and professor of medicine, University of Alabama, Birmingham, Alabama; ORCID: https://orcid.org/0000-0001-6262-7421. T. Ballard is plastic surgeon, Ann Arbor Plastic Surgery, Ann Arbor, Michigan. A.R. Artino Jr is deputy director for graduate programs in health professions education and professor of medicine, preventive medicine, and biometrics pathology, Uniformed Services University of the Health Sciences, Bethesda, Maryland; ORCID: http://orcid.org/0000-0003-2661-7853. A. Sergio Da Silva is senior lecturer in medical education and director of the masters in medical education program, Swansea University Medical School, Swansea, United Kingdom; ORCID: http://orcid.org/0000-0001-7262-0215. T. Cleary is chair, Applied Psychology Department, CUNY Graduate School and University Center, New York, New York, and associate professor of applied and professional psychology, Rutgers University, New Brunswick, New Jersey. J. Stojan is associate professor of internal medicine and pediatrics, University of Michigan Medical School, Ann Arbor, Michigan. L.D. Gruppen is director of the master of health professions education program and professor of learning health sciences, University of Michigan Medical School, Ann Arbor, Michigan; ORCID: http://orcid.org/0000-0002-2107-0126.

PMID: 30720527

DOI: 10.1097/ACM.0000000000002618

Abstract

Purpose: An evidence-based approach to assessment is critical for ensuring the development of clinical reasoning (CR) competence. The wide array of CR assessment methods creates challenges for selecting assessments fit for the purpose; thus, a synthesis of the current evidence is needed to guide practice. A scoping review was performed to explore the existing menu of CR assessments.

Method: Multiple databases were searched from their inception to 2016 following PRISMA guidelines. Articles of all study design types were included if they studied a CR assessment method. The articles were sorted by assessment methods and reviewed by pairs of authors. Extracted data were used to construct descriptive appendixes, summarizing each method, including common stimuli, response formats, scoring, typical uses, validity considerations, feasibility issues, advantages, and disadvantages.

Results: A total of 377 articles were included in the final synthesis. The articles broadly fell into three categories: non-workplace-based assessments (e.g., multiple-choice questions, extended matching questions, key feature examinations, script concordance tests); assessments in simulated clinical environments (objective structured clinical examinations and technology-enhanced simulation); and workplace-based assessments (e.g., direct observations, global assessments, oral case presentations, written notes). Validity considerations, feasibility issues, advantages, and disadvantages differed by method.

Conclusions: There are numerous assessment methods that align with different components of the complex construct of CR. Ensuring competency requires the development of programs of assessment that address all components of CR. Such programs are ideally constructed of complementary assessment methods to account for each method's validity and feasibility issues, advantages, and disadvantages.

 

성격은 무엇인가? 두 개의 미신과 하나의 정의(New Ideas in Psychology, 2020)
What is personality? Two myths and a definition

Raymond M.Bergner1

 

"어떤 것들은 결코 당연하게 여겨져서는 안 됩니다. 그 중에서도 여러분 분야의 핵심에 있는 말의 정확한 의미입니다."
“Certain things should never be taken for granted, among them … the precise meaning of words that are at the heart of your discipline.”

-N. Angier, 2009, p. D1.

"저는 명확하고 합의된 정의를 사용하는 것이 우리의 학문(성격심리학)을 더욱 재생시키는 하나의 열쇠라고 생각합니다."
“I see the use of clear and consensual definitions as one key to the further regeneration of our discipline (personality psychology).”

-J.D. Mayer, 2007, p. 1.


수년 동안 저는 성격 심리학 수업을 해왔습니다. 그렇게 함으로써, 저는 수업 첫날에 들어와서 학생들에게 다음과 같이 연설했을지도 모릅니다. "성격심리학에 오신 것을 환영합니다. 이번 시간에는 성격이라는 매우 중요한 주제에 대해 알아보겠습니다. 그러나 시작하기 전에 면책 사항disclaimer을 발표해야 합니다. 우리는 성격이 무엇인지 잘 모릅니다. 안타깝게도, 아시다시피, 우리 분야는 '성격'을 어떻게 정의해야 하는지에 대한 의견 일치를 보지 못했습니다. 그래서 본질적으로, 우리는 여러분에게 우리의 주제의 본질을 정확하고 확실하게 말할 수 없습니다. 기본적으로 성격이 무엇인지 말할 수 없습니다. 따라서 절차적으로 이 분야의 다른 권위자들의 이론과 연구 결과를 연구할 때, 우리는 각각의 경우에 대해 제안했다는 개념에 따를 것이다. 비록 서로 다르겠지만, 그 결과는 모두 같은 것, 그러니까 '성격'을 연구한다고 주장하지만, 실제로 다른 것을 공부하고 있을지도 모릅니다. 우리 분야의 몇몇 사람들은 이 문제에 대해 고민하는 것 같지만, 대부분은 그렇지 않습니다.
For many years, I taught a class in the psychology of personality. In doing so, I might have (but never did) walked in on the opening day of class and addressed my students as follows: “Welcome to personality psychology. In this class, we will be investigating the very important topic of human personality. Before we begin, however, I must issue a disclaimer. We're not sure what personality is. Unfortunately, you see, our field has so far come to no consensus in the matter of how to define ‘personality’. So, in essence, we cannot state for you precisely and definitively the nature of our subject matter-- cannot tell you basically what personality is. Procedurally, then, as we study the theories and research findings of different authorities in this area, we will in each case just go along with the conception that each of them has proposed, even though these will differ one from another, and even though the result may be that, although they all claim to be studying the same thing, “personality”, they may actually be studying different things. A few people in our field seem bothered by this problem, but most of us are not.”

현재의 성격 텍스트로 눈을 돌리면, 그 분야의 모든 주요 전문가인 저자들은 방금 언급한 거부권을 발행한다: 성격 심리학 분야는 지금까지 "성격"이라는 용어의 어떤 합의된 정의에도 도달할 수 없었다. 예를 들어

  • Feist, Feist 및 Roberts(2013)는 "모든 성격 이론가들이 하나의 정의를 받아들일 수는 없다"고 주장한다.
  • Mischel, Shoda, and Ayduk (2007)는 "인격이라는 용어는 많은 정의를 가지고 있지만, 보편적으로 받아들여지는 것은 아니다"라고 말하는 반면,
  • Engler (2009)는 "이론가들은 각자 성격이라는 용어의 이해를 우리에게 제시한다"고 주장한다.

전형적으로, 이러한 저자들은 정의적인 문제에 대해 조금 더 논의한 후, 그리고 그들의 주제에 대한 합의된 공식화의 부재가 중요한 문제를 나타낸다고 주장하지 않고, 성격에 대한 다른 이론적 접근법의 발표로 넘어간다. 

If one turns to virtually any current personality text, the authors, all leading experts in the field, issue (if less polemically) the disclaimer just stated: the field of personality psychology has not to date been able to come to any consensus definition of the term “personality”.

Typically, these authors, after little further discussion of definitional matters, and without asserting that the absence of a consensus formulation of their subject matter represents a significant problem, move on to presentations of different theoretical approaches to personality.


이 문서에서 제안하는 성격의 개념화는 이 상황을 해결하기 위한 시도를 나타냅니다. 

  • 이 논문의 파트 1은 과학에서 경험 이전의 개념에 대한 몇 가지 전통적인 기억을 제시한다. 
  • 파트 2는 널리 받아들여지고 있지만 그럼에도 불구하고 성격의 본질에 대해 의문스러운 두 가지 제안을 소개하고 질문한다. 
    • (a) 그 용어가 개인 내부의 근본적인 원인 실체를 가리키는 것. 
    • (b) 성격에 대한 연구는 전체 사람을 위한 연구라고 생각합니다. 
  • 제3부에서는 "개성"의 정의, 이 정의를 상세하게 설명하고 명확히 하는 몇 가지 논의 및 이전의 모든 정의와 다른 방법에 대해 설명합니다. 
  • 제4부에서는 "그래서?"에 대해 설명합니다. 일반적으로 합의된 정의를 갖는 것과 제안된 정의를 수용하는 것 모두 어떤 이점이 있는가? 

The proposed conceptualization of personality in this paper represents an attempt to address this situation.

  • Part 1 of the paper presents some traditional reminders about the pre-empirical status of concepts in science.
  • Part 2 introduces and calls into question two widely accepted but nonetheless questionable propositions about the nature of personality: (a) that the term refers to an underlying causal entity within a person, and (b) that the study of personality is the study of the whole person.
  • Part 3 presents a definition of “personality”, some discussion elaborating and clarifying this definition, and an explication of the ways in which it differs from all previous definitions.
  • Part 4 discusses the “so what?” question: what benefits accrue both to having a consensus definition in general and to acceptance of the proposed definition in particular?

현재의 분석은 비트겐슈타인(1953)의 일반적인 언어 철학에 크게 힘입은 프레임워크인 기술심리학(Descriptive Psychology)의 개념적 프레임워크 내에서 생성되었다. 바라건대, 현재의 빅5와 성격에 대한 다른 특성 접근과 잘 조화를 이루고 그들을 위한 개념적 기초가 될 수 있는 이 공식은 성격 심리학에서 현재의 개념적 혼란을 개선하는 데 도움이 될 것이다. 

The present analysis was generated within the conceptual framework of Descriptive Psychology (Ossorio, 2006; see also; Bergner, 2010; Schwartz, 2019; Shideler, 1988), a framework heavily indebted to the ordinary language philosophy of Wittgenstein (1953). Hopefully, this formulation, one that coordinates well with current Big 5 and other trait approaches to personality, and which might serve as a conceptual underpinning for them, will prove helpful in ameliorating the current conceptual confusion in personality psychology.

1. 개념에 대한 몇 가지 주의사항
1. Some reminders about concepts

내가 동료들에게 정의(및 파라메트릭 분석과 같은 기타 개념적 공식)를 제시할 때, 종종 발생하는 질문은 제시된 공식에 경험적 뒷받침이 있는지 여부이다. 이 질문에 답하면서, 전통적인 과학 관행에서 몇 가지 상기시켜주는 것이 순서입니다. [개념concepts은 이론이 아닙니다]. 이론과 달리, 개념concepts은 경험적 명제로 구성되어 있지 않다. 개념을 정의할 때 정확하거나 부정확할 수 있지만 개념 자체는 참도 거짓도 아닙니다. 예를 들어 "척추동물", "힘" 및 "아이소토프"라는 개념은 참(또는 "검증 가능") 또는 거짓(또는 "falsable")이 아닙니다. 만약 생물학 교수가 "척추동물은 등뼈나 척추를 가진 생물"이라고 말하거나 물리학 교수가 "힘은 신체를 가속시키는 어떤 영향"이라고 말한다면, 우리는 그러한 주장에 대한 경험적 뒷받침이 있었는지 묻지 않을 것이다. 독신남에게 아내가 있는지 없는지를 경험적으로 판단하는 것보다 힘이 신체를 가속시키는 것을 경험적으로 결정하는 실험을 더 이상 하지 않을 것이다.

When I have presented definitions (and other conceptual formulations such as parametric analyses) to colleagues, a question that often arises is that of whether or not the formulation presented has any empirical support behind it. In responding to this question, some reminders from traditional scientific practice are in order. Concepts are not theories. Unlike theories, they are not comprised of empirical propositions. While one might be correct or incorrect in defining a concept, concepts themselves are neither true nor false (Bergner, 2010; Harré & Tissaw, 2005; Ossorio, 1981, 2006; Schwartz, 2019). The concepts “vertebrate”, “force”, and “isotope”, for example, are not true (or “verifiable”) or false (or “falsifiable”). If the biology lecturer states, “A ‘vertebrate’ is a creature that possesses a backbone or spinal column”, or the physics professor states, “A ‘force’ is ‘any influence that causes a body to be accelerated,” we would not ask if there was empirical support for such claims. One would no more do an experiment to empirically determine if forces accelerate bodies than one would to empirically determine whether bachelors have wives.

과학에서 개념의 위치는 오히려 필수불가결한 사전 경험적pre-empirical 요소이다. Lyons(1980)는 개념의 필수불가결성에 대해 언급하면서 그 점을 잘 지적하고 있다. "감정"을 정의할 필요성을 부인했던 동료 감정 연구자에 대해 라이언스는 "어떤 이는 토끼로 간주되는 것에 대해 전혀 알지 못한 채 토끼를 연구하기 위해 돌진하는 것과 같은 상황이 되어야 한다고 말하고 싶다"고 답했다. 예를 들어 물리학자가 먼저 "힘", "역비례성", "점질량"의 개념(경험적으로 확립되지 않은 의미의 규정)을 가지고 있지 않다면, "힘은 두 점 사이의 거리에 반비례한다"는 경험적 주장을 공식화할 수 없었을 것이다. 만약 어떤 경험적 현상을 구별하기 위한 적절한 개념을 먼저 가지고 있지 않다면, 그 현상에 대해 어떤 것을 엄격하게 말하는데 매우 불리할 것이다(예를 들어, 이론을 공식화하거나, 연구 가설을 말하는 것).

The place of concepts in science, rather, is that of being indispensable pre-empirical elements (Bergner, 2010; Harré & Tissaw, 2005; Ossorio, 1981, 2006; Schwartz, 2019). Lyons (1980), in commenting on their indispensability, puts the point well. Objecting to a fellow emotion researcher who had denied the necessity of defining “emotion”, Lyons responded that, “One is tempted to say that the resulting situation must be like that of sallying forth to study rabbits while having no idea of what is to count as a rabbit” (p. xi). If the physicist, for example, did not first have the concepts of “force,” “inverse proportionality”, and “point mass” -- all of which have stipulated, not empirically established, meanings -- he or she could not even have formulated, much less tested, the empirical claim that “a force is inversely proportional to the distance between two point masses?” If one did not first have an adequate concept for distinguishing any empirical phenomenon, one would be at great disadvantage in saying anything rigorously (e.g., formulating a theory or stating a research hypothesis) about that phenomenon.


[정의](용어의 올바른 적용을 위해 필요하고 충분한 조건의 사양)는 물론 정확/부정확 하나 적절/부적절 할 수 있다. 역사적으로, 과학에서, 정의에 대해서 제기되는 적정성의 기준은 다음과 같은 것이다. 

  • 첫째, 그리고 특히 오랜 공통 사용 역사를 가진 개념에 관해, 그 정의는 직관적으로 받아들여질 수 있는가, 아니면 우리의 언어적 직관에 위배되는가? 후자의 예로는 "나는 '사랑'을 상호 강화로 정의한다" 또는 "나는 '정신적 질환'을 자기 나라의 정부 당국에 대한 불복종으로 정의한다"와 같은 말이 있을 것이다. 
  • 둘째, 그것들이 유용한가? 예를 들어, 역사적으로, 뉴턴의 "힘"과 "질량"의 개념에 대한 새로운 공식은 그의 만유인력 이론의 창조에 필수적이었다. 

Definitions -- specifications of the necessary and sufficient conditions for correct application of a term (Gupta, 2015; Ossorio, 1981, 2006) -- can of course be correct or incorrect, and more or less adequate. Historically, in science, the criteria of adequacy to be posed of them, very different in nature than those for theories, are ones such as the following.

  • First, and especially with respect to concepts with a long history of common usage, is the definition intuitively acceptable, or does it so violate our linguistic intuitions that language seems to be used anarchically (Ossorio, 19812006)? Examples of the latter might occur were I to say such things as, “I define ‘love’ as mutual reinforcement”, or “I define ‘mental disorder’ as disobedience to the governmental authorities in one's country”.
  • Second, are they useful (Ossorio, 19812006)? Historically, for example, Newton's novel formulations of the concepts of “force” and “mass” were indispensable to the creation of his theory of universal gravitation (Gleick, 2003). 

따라서, 이 기사에서 제안하는 성격의 정의와 성격 문헌의 모든 경쟁자들은 [직관적인 수용성]과 [유용성]이라는 기준을 적절히 갖추고 있다.
Thus, the standards that the definition of personality proposed in this article, as well as all of its competitors in the personality literature, are appropriately held to are those regarding their intuitive acceptability and their usefulness.

2. 성격에 관한 두 가지 신화
2. Two myths about personality

2.1. 신화 #1: "인격"이란 근본 원인 실체를 말한다.
2.1. Myth #1: The term “personality” refers to an underlying causal entity

많은 사람들은, [성격]은 전체 또는 부분적으로 행동의 기초가 되고 영향의 원인으로 그것과 관련된 어떤 실체(예: 구조 또는 메커니즘)로 보인다. 예를 들어, 아마도 가장 유명하고 여전히 널리 인용되는 정의에서,

  • Allport(1961)는 성격은 "한 사람의 특징적인 행동과 사고를 결정하는 정신-물리 시스템의 개인 내의 역동적인 조직"이라고 말했다.
  • 보다 최근에, 라센과 버스(2017)는 성격을 "개인의 심리적 특징과 메커니즘의 집합으로, 조직화되어있고, 비교적 지속적이며, 정신 내, 신체적, 사회적 환경과의 상호작용과 적응에 영향을 미치는 것"으로 개념화했다.
  • Funder(2016)는 부분적으로 인과관계를 나타내는 공식에서 성격은 "개인의 생각, 감정, 행동의 특징적인 패턴을 지칭하며refer, 이것이 모여서 그 패턴 뒤의 (숨겨지거나 숨겨지지 않은) 심리적 메커니즘을 만드는 것"고 주장한다.

On many accounts, personality is seen, in whole or in part, as some entity (e.g., a structure or mechanism) that underlies behavior and is related to it as cause to effect. For example, in perhaps the most famous and still widely cited (e.g., Funder, 2016, p. 340) definition,

  • Allport (1961) stated that personality is “the dynamic organization within the individual of those psycho-physical systems that determine his characteristic behavior and thought” (p. 28).
  • More recently, Larsen and Buss (2017) conceptualized personality as “the set of psychological traits and mechanisms within the individual that are organized and relatively enduring and that influence his or her interactions with, and adaptations to, the intrapsychic, physical, and social environments” (p. 4).
  • Finally, Funder (2016), in a partially causal formulation, contends that personality “refers to a person's characteristic patterns of thought, emotion, and behavior, together with the psychological mechanisms -- hidden or not -- behind these patterns” (p. 5).

이 관점의 문제점. 이 관점의 가장 큰 어려움은 직관적인 [수용가능성]에 관한 것입니다. 이러한 우려는 다음 가설에서 포착되었습니다. Jill을 잘 아는 Jack은 어느 날 Susie에게 Jill을 "주장스럽다assertive"고 표현합니다. 수지는 잭에게 그 성격 용어를 사용할 때, [그녀가 자주 하는 방식으로 행동하게 만드는 메커니즘이나 구조, 정신-신체 체계와 같은 질 내부의 무언가]를 말하는 것이냐고 묻습니다. 잭의 답변은 이렇다.

  • "아뇨, 저는 그녀가 이렇게 행동하게 될 수 있는 내부 메커니즘이나 구조, 시스템을 말하는 것이 아닙니다. 내가 그런 걸 어떻게 알아요? 제 말은 질은 다른 사람과의 관계에서 자신의 권리와 욕구를 표현하고 강하게 추구하는 경향이 있다는 것입니다. 저는 오랫동안 그녀가 이것을 꽤 꾸준히 하는 것을 봐왔고, 제가 볼 때, 그녀는 연극을 하지 않았고, 아무도 그녀에게 강요하거나 돈을 주거나 그녀의 의사에 반해서 이런 행동을 하도록 영향을 주지 않았기 때문에, 그것은 단지 그녀의 개인적인 성향인 것 같습니다. 그게 바로 그 용어입니다. 

Problems with this view. The central difficulty with this view concerns its intuitive acceptability. This concern is captured in the following hypothetical. Jack, who knows Jill very well, one day describes her to Susie as “assertive”. Susie asks Jack if in using that personality term he is referring to an inner something within Jill -- for example, a mechanism or structure or psycho-physical system -- that is causing her to behave in the way that she often does. Jack replies:

  • “No, I'm not referring to an inner mechanism or structure or system that might be causing her to behave this way. How would I even know about such a thing? I mean only that Jill is a person who tends to express and to pursue strongly her personal rights and desires in her relationships with others. I have observed her doing this pretty consistently for a long time and, as far as I can see, she is not play-acting and no one is forcing her, paying her, or in any other way influencing her to behave this way against her will, so it seems like it is just her own personal inclination. That's what I mean by the term.”

여기서 잭은 "민속" 또는 "보통 언어" 개념으로 여겨지는 것을 제시하고 있다; 나의 궁극적인 공식은 그의 것과 모든 면에서 동일하지는 않지만, 직관적인 수용성의 기준은 내가 그것에서 너무 멀리 벗어나지 않도록 요구한다. (NB: Jack이 Jill의 성격 특성에 대해 [동료 평가]를 할 경우, 이것이 그가 채택할 개념이라는 것을 알 수 있습니다. 만약 연구자가 사람 내면의 "정신-신체psycho-physical 시스템"과 같은 다른 것을 측정하고 있다고 믿는다면, 이는 잘못된 것이다.)

Here, Jack is giving what would be considered a “folk” or an “ordinary language” conception; while my ultimate formulation will not be identical in every particular with his, the criterion of intuitive acceptability requires that I not stray too far from it. (NB: It might be noted that, if Jack were to do a peer rating of Jill's personality traits in the context of a research study, this is the conception he would be employing. If the researcher believed that he or she was measuring something else such as an inner “psycho-physical system”, this would be mistaken.)

잭의 분석과 일관되게, 기술 심리학 체계 내의 저자들은 "성격"이라는 용어가 사람에 대한 특정한 사실을 의미한다고 주장해 왔다. 행동, 사고 및 감정에 대한 인과 관계에 있는 기본 메커니즘, 구조 또는 시스템을 지정하지 않으며, 이러한 메커니즘과 구별됩니다. 이 개념에서 [(관찰할 수 없는 내적 원인 실체에 대한) 추론]이 아니라 [관찰]을 통해 질이 자기주장이간함(또는 외향적, 관대함 또는 우울함 등)임을 알게 된다. 이러한 특성이 추가 설명에 적합하다는 주장에는 문제가 없겠지만 -- 예를 들어, 질의 어린 시절 경험, 특정 신념의 보유, 유전적으로 획득된 소인 보유 등을 언급함으로써-- 우리는 ["주장이 강함"과 같은 단어]와 [겉으로 보이는 행동을 야기하는 "메커니즘"이나 "심리-신체 시스템"]과 같은 관찰할 수 없는 [내적 실체]를 혼동하지 않는다. 이 모든 것은 매우 공적인public 특성이 있는 "성격"이라는 용어의 [라틴어 어원]과 일치한다: "마스크"를 뜻하는 페르소나.


Consistent with Jack's analysis, authors within the framework of Descriptive Psychology (Bergner, 2017; Ossorio, 1978, 2006; Schwartz, 2019) have maintained that the term “personality” designates certain facts about persons. It does not designate any underlying mechanisms, structures, or systems that stand in a causal relationship to behavior, thought, and emotion, and as such are distinct from them. On this conception, we learn that Jill is assertive (or extraverted or generous or depressive, etc.) primarily through observation, not inference to an unobservable inner causal entity. While there would be no problem with the contention that such characteristics are amenable to further explanation -- for example, by reference to Jill's childhood experiences, her holding of certain beliefs, or her possession of genetically acquired predispositions -- we do not confuse words like “assertiveness” with unobservable inner entities such as “mechanisms” or “psycho-physical systems” that are causing her overt behavior. All of this is in keeping with the very public Latin etymology of the term “personality”: persona, meaning “mask”.

마지막으로, 어떠한 대상물 X를 설명하는 것과 달리, 「X」의 올바른 사용에 필요한 충분한 조건을 기재하는 것으로, 종래에는 대상물 X가 무엇인지를 특정하는 사업을 하고 있습니다. 우리는 인과관계나 다른 설명적 주장을 하는 사업을 하고 있지 않다. [사전]은 [요약된 단어의 의미]이지, 그 단어들이 언급하는 [현상의 원인]이 아니다. 총각은 미혼 성인 남성이다; 무엇이 여러 총각들로 하여금 그러한 상태에 있게 만드는지는 별개의, 정의와는 무관한, 경험적인 문제이다.

Finally, in defining, as opposed to explaining, any given subject matter X, we are traditionally in the business of identifying what subject matter X is by stating the necessary and sufficient conditions for correct usage of the term “X” (Gupta, 2015; Ossorio, 1981). We are not in the business of making causal or other explanatory claims. A dictionary is a compendium of word meanings, not of the causes of phenomena referred to by those words. A bachelor is an unmarried adult male; what might cause many bachelors to have that status is a separate, non-definitional, empirical matter.

 

2.2. 제안 #2: 성격을 연구하는 것은 전인whole person을 연구하는 것이다.
2.2. Proposition #2: The study of personality is the study of the whole person

심리학 문헌에서는 성격을 사람 전체와 동일시하고, 그 연구는 사람 전체와 동일시하는 경향이 널리 퍼져 있다.

  • 예를 들어 McAdams(2009)는 다음과 같이 기술했다. 성격심리학은 전인에 관한 과학적 연구다. 심리학은 많은 것에 관한 것이다. 지각과 주의력, 인식과 기억, 뉴런과 뇌회로…우리 (성격심리학자들)는 개개의 인간을 복잡한 전체로서 이해하려고 노력한다…그리고 인간의 개개인성individuality에 대한 과학적으로 신뢰할 수 있는 설명을 구축하려고 한다.
  • 유사한 맥락에서 세르본과 퍼빈(2013)은 다음과 같이 주장한다. " …성격의 개념은 포괄적입니다. 이는 개인의 모든 측면을 의미한다." (p.8); 
  • 옥스퍼드 심리학 사전은 그것이 "개인의 특징적인 행동적, 정신적 특징의 총합"이라고 주장하는 반면,
  • 마지막으로, 펀더(2016)는 다음과 같이 선언했다. "이 정의(즉, "개성"의 정의)는 성격 심리학자들에게 전체 인물을 연구해야 하는 독특한 사명을 부여한다." (p.5)

In the psychological literature, there is a widespread tendency to equate personality with the whole person, and its study correspondingly with the study of the whole person.

  • For example, McAdams (2009) has stated that “Personality psychology is the scientific study of the whole person … psychology is about many things: perception and attention, cognition and memory, neurons and brain circuitry … We (personality psychologists) try to understand the individual human being as a complex whole … (and) to construct a scientifically credible account of human individuality” (p. 2).
  • In a similar vein, Cervone and Pervin (2013) assert that “ … the notion of personality is comprehensive. It refers to all aspects of persons” (p. 8); while
  • the Oxford Dictionary of Psychology maintains that it is “the sum total of the behavioural and mental characteristics that are distinctive of an individual” (Colman, 2006, p. 564; cf.; APA Dictionary of Psychology, 2007, p. 689).
  • Finally, Funder (2016) has declared that, “This definition (i.e., of “personality”) gives personality psychologists their unique mission to study whole persons ” (p. 5).


이 입장을 다루기 위한 비공식적인 시작으로서, 다시 한 번 직감적인 수용 가능성의 관점에서, "전체 인물"에 대한 다음과 같은 설명을 고려한다. "사라"는 56세의 이혼한 백인 여성이다. 그녀는 현재 대학에 다니고 있는 두 아이의 헌신적인 엄마로 그들의 삶에 매우 관여하고 있다. 그녀는 무엇보다도 적극적이고, 외향적이며, 배려심이 있고, 모험심이 강하고, 사회적으로 의식이 있는 사람으로 친구들에 의해 묘사된다. Sarah는 컴퓨터 공학의 고급 학위를 가지고 있으며, 그 분야의 실무자로 일하고 있으며, 일에 전념하고 있으며, 동료들에게 상당한 전문 지식을 가지고 있는 것으로 여겨지고 있습니다. 그녀는 시민 문제에 적극적이며 때때로 지역 시민 단체에서 리더 역할을 맡기도 했다. 그녀의 관심사는 자전거 타기, 정원 가꾸기, 정치, 연극, 오페라 등이다. 열성적인 여행자인 그녀는 비교적 쉽게 외국어를 습득할 수 있는 능력이 있다. 비록 종교적으로 매우 적극적이지는 않지만, 그럼에도 불구하고 그녀는 그녀의 종교적 유산과 강하게 동일시하고 있으며, 이것은 그녀의 개인적 정체성의 매우 중요한 부분이다. 현재 사라에게 큰 부담이 되고 있는 두 사건은 2년 전 어머니의 죽음과 26년 동안 살아온 남편과의 고통스러운 이혼이다. 최근 그녀는 은퇴에 대해 점점 더 많이 생각하고, 은퇴 후 어떻게 보내고 싶은지에 대한 목표를 세웠습니다. 즉, 가까운 두 명의 여자 친구와 함께 해외 여행을 하는 것입니다.

As an informal beginning to addressing this position, again primarily from the point of view of its intuitive acceptability, consider the following description of a “whole person”. “Sarah” is a 56-year-old divorced Caucasian woman. She is the devoted mother of two children, both currently attending college, and remains very involved in their lives. She is described by her friends, among other things, as an assertive, extraverted, caring, adventurous, socially conscious individual. Sarah has an advanced degree in computer science, works as a practitioner in that field, is dedicated to her work, and is regarded by her colleagues as having considerable expertise. She is active in civic affairs and at times has assumed leadership roles in local civic organizations. Her interests include cycling (she is in excellent physical condition), gardening, politics, theatre, and opera. An enthusiastic traveler, she has a capacity to pick up foreign languages with relative ease. Although not very active religiously, she nonetheless identifies strongly with her religious heritage, and this is a very important part of her personal identity. Two events that weigh heavily on Sarah at the present time are the death of her mother two years ago and a painful divorce the subsequent year from her husband of 26 years. Lately, she thinks more and more of retirement and has set some goals for herself regarding how she would like to spend it; essentially, traveling abroad with two close female friends.

사라에 대해 더 많은 것을 말할 수 있다. 하지만 핵심을 밝히기에 충분하다고 합니다. 성격 특성이 전체 개인의 특성을 모두 이해하는 것은 아니다. 성격은 그러한 특성의 하위 집합만을 구성한다. 사라의 전체적인 모습을 보여주려면, 그녀의 성격에 관한 사실들을 뛰어넘는 많은 말들이 필요하다. 따라서, 일부는 그녀의 성격 특성에 관한 것이지만(외향적이고, 적극적), 지위(어머니, 이혼한 사람, 고급 학위 보유자), 핵심 관계, 직업, 능력, 목표, 종교적 정체성, 관심사, 능력, 나이, 인종, 건강, 현재 개인적인 불행의 근원 등과 같이 많은 직관적으로 보더라도 [성격과는 관련 없는 사실에 대한 정보]가 추가적으로 제시되었다. 직감적으로, 사실상 아무도 "사라는 컴퓨터 프로그래머" 혹은 "두 아이의 부모" 혹은 "현재 불행하다"는 그녀의 성격에 대한 진술이라고 말하지 않을 것이다. 분명히 사라의 사례에서 알 수 있듯이, 한 사람 전체를 묘사하려는 합리적인 시도에는 개인의 성격 특성을 암송하는 것을 훨씬 뛰어넘는 정보가 포함될 것이다. [그 사람 전체whole person]에는 [그 사람의 성격]보다 훨씬 더 많은 것이 있습니다.

More could be said about Sarah. But enough has been said to make the key point: personality characteristics do not comprehend all of the characteristics of the whole person; they comprise only a subset of such characteristics. To provide a picture of Sarah as a whole person, many things needed to be said that go beyond facts about her personality. Thus, while noting some of her personality traits (extraverted, assertive), further information was presented about many intuitively non-personality facts such as her statuses (mother, divorced person, advanced degree holder), core relationships, occupation, competencies, goals, religious identity, interests, capacities, age, race, health, current sources of personal unhappiness, and more. Intuitively, virtually no one would say that “Sarah is a computer programmer” or “a parent of two” or “is currently unhappy” are statements about her personality. Clearly, as illustrated by the case of Sarah, any reasonable attempt to describe a whole person is going to include information that goes well beyond the recitation of an individual's personality characteristics. There is much more to any “whole person” than his or her personality.

인물의 파라메트릭 분석. 이 점을 보다 공식적이고 체계적으로 만들기 위해 다음과 같은 개인 특성 모수 분석이 도움이 될 수 있습니다. 이 분석은 원래 오소리오에 의해 책정된 것으로, 한 사람이 다른 사람과 같거나 다를 수 있는 다양하고 다양한 방법(단순한 성격 방식이 아니라)을 포착할 수 있는 다양한 종류의 사람 특성을 명료하게 표현한 것이다(비교: 색채 과학에서 색상, 포화도 및 밝기는 한 색이 다른 색과 같거나 다를 수 있는 모든 방법을 명확하게 표현하기 위해 필요한 개념적 자원을 제공합니다.) <PC> = <Ds, P, Dr> 이며, 각각은 다음과 같다. 

A parametric analysis of persons. To make this point more formally and systematically, the following parametric analysis of Person Characteristics may be helpful. This analysis, originally formulated by Ossorio (1985; 2006), is an articulation of the various kinds of person characteristics whose specification enables us to capture the many and various ways (as opposed to just the personality ways) in which one person can be the same as, or different from, another person. (Compare: in color science, hue, saturations, and brilliance provide the conceptual resources necessary to articulate all of the ways in which one color can be the same as or different from another color.)<PC> = <Ds, P, Dr>where

PC = 인물 특성
PC = Person Characteristics

Ds = 기질, 개인의 다양한 개인적 경향 또는 성향으로, 일반적으로 행동 빈도의 지속적 패턴에 의해 관찰된다. 여기에는 다음이 포함됩니다. 

  • 특질 (특정 종류의 행동(예: 외향적, 공격적 또는 자기 비판적 행동) 또는 특정 감정 상태(예: 우울하거나 불안한 행동)를 경험하는 성질) 
  • 스타일 (사람이 하는 일이 아니라 그것을 하는 방법(예: 세련되고 화려하거나 우아한 방식으로)으로 해야 하는 배치) 
  • 태도 (예: 기후과학 또는 종교적 신념) 또는 특정 등급의 객체(예: 여성 또는 소수민족)를 특정 특징적인 방식으로(예: 찬성 또는 반대) 보고 다루는 처분) 
  • 흥미 (특정 주제(예: 정치 또는 패션) 또는 활동(예: 체스 또는 춤)을 찾아 마음을 사로잡는 것)

Ds = Dispositions, the various personal inclinations or tendencies of an individual, ordinarily observable by virtue of an enduring pattern of frequency in their behavior. These include 

  • Traits (dispositions to engage in a certain kind of behavior [e.g., extraverted, aggressive, or self-critical behavior]) or to experience certain emotional states [e.g., depressive or anxious ones]);
  • Styles (dispositions having to do, not with what a person does, but with how he or she does it [e.g., in a sophisticated, flamboyant, or gracious fashion]); 
  • Attitudes (dispositions to regard and treat different objects [e.g., climate science or religious belief] or certain classes of object [e.g., women or ethnic minorities] in certain characteristic ways [e.g., approvingly or disapprovingly]); and 
  • Interests (dispositions to find certain topics [e.g., politics or fashion] or activities [e.g., playing chess or dancing] absorbing and captivating).

P = 능력, 주어진 사람에게 가능한 것과 불가능한 것과 관련된 개념. 여기에는 다음이 포함됩니다. 

  • 실력 (피아노 연주, 농구 슛, 외국어 말하기 등 어떤 종류의 성과에 관한 능력) 
  • 지식/신념 (법적 추진에 관한 법률 지식이나 신의 존재에 관한 신념 등 당사자가 행동할 수 있는 사실 및 신념의 집합) 
  • 가치 (성실성, 부의 축적, 모험적인 삶의 방식 등 사람이 일상적으로 행동할 수 있는 동기 부여 우선 사항의 집합).

P = Powers, concepts having to do with what is possible and not possible for a given person. These include the person's 

  • Abilities (i.e., capabilities with reference to some kind of achievement such as playing the piano, shooting a basketball, or speaking a foreign language); 
  • Knowledge/beliefs (the set of facts and beliefs the person has the ability to act on, such as knowledge of the laws governing legal driving or beliefs about the existence of a deity); and 
  • Values (the set of motivational priorities that the person is routinely able to act on, such as a value for integrity, for accumulating wealth, or for an adventurous way of life).

Dr = 파생물, 이전의 두 범주와 달리 행동과 직접적인 관련이 없지만, 기질Disposition과 능력Power을 참조하여 정의되는 개념입니다. 여기에는 다음이 포함됩니다. 

  • 상태 (병들거나 격분하거나 술에 취하거나 하는 등 개인의 통상적인 권력이나 성향에 조직적인 차이가 있는 상태) 
  • 카파시티 (음악 기술을 습득하거나 언어를 배우는 능력 등 개인 특성을 습득할 수 있는 가능성) 
  • 신체화 (신장 6피트, 체중 175파운드, 면역체계 저하 등 사람의 신체적 특징)

Dr = Derivatives, concepts which, unlike the two previous categories, do not have a direct connection to behavior but are defined instead by their reference to Dispositions and Powers. These include 

  • States (states of affairs in which there is a systematic difference in the ordinary powers or dispositions of a person, such as being sick or enraged or drunk); 
  • Capacities (the potential to acquire personal characteristics, such as ones to acquire musical skills or to learn languages); and 
  • Embodiment (the physical characteristics of a person, such as being six feet tall, weighing 175 pounds, or having a compromised immune system) (adapted from Ossorio, 2006, pp. 70–71).

사라와 같은 사람 전체를 묘사하기 위해서는, 그녀의 성격 특성을 구성하는 중요한 부분집합뿐만 아니라 이 모든 범위의 사람 특성이 요구될 것이다. 이 분석에서 성격 특성은 세 가지 [일반적인 파라미터] 중 하나인 기질Disposition과, 네 가지 [하위 파라미터] 중 두 개인 특성Trait 및 스타일Styles로만 구성된다는 것을 알 수 있습니다. (여러 해 동안 성격 강좌에서 학생들에게 '어머니의 성격을 묘사해 달라'고 부탁하는 첫 번째 연습을 했습니다. 응답을 보면, 생성된 설명의 93% 이상이 엄마의 특성 및 스타일과 관련되어 있습니다. 엄마의 능력, 지식/신념, 카파시티, 흥미 및 태도와 관련된 정보는 드물었습니다.) 그러나 이 목록조차도 단순히 성격의 특징을 파악하는 것보다 훨씬 포괄적이기는 하지만, 여전히 전체 인물을 포착하는 데 있어 완전한 것은 아니다. 우리는 사라가 인생에서 중대한 신체적 핸디캡을 일찍 극복한 것, 중요한 시기에 친구를 잃은 것에 죄책감을 느꼈던 것, 또는 그녀가 심한 공공의 굴욕을 겪은 시간을 극복하지 못한 것에 대해 항상 강한 만족감을 가지고 살아왔다고 말할 수 있을 것이다. "전체 인물 팔레트whole person palette"는 개인의 성격 특성을 묘사하는 것보다 훨씬 더 광범위하며, (우리가 소설을 쓰지 않는 한) 사람에 대해 매우 포괄적인 설명을 할 필요가 있을 경우에, 매우 드물게만, 사용하는 팔레트이다.

In order to fully describe a whole person such as Sarah, this entire range of person characteristics would be required, not just that important subset comprising her personality characteristics. On this analysis, it may be noted, personality characteristics comprise items falling under only one of the three general parameters, Dispositions, and under this category only two of the four sub-parameters, Traits and Styles. (Anecdotally, for many years in my personality course, I did an initial exercise in which I asked students simply to “describe your mother's personality”; in response, over 93% of the descriptions generated pertained to the mother's Traits and Styles; information pertaining to her Abilities, Knowledge/Beliefs, Capacities, Interests, and Attitudes was rare.) Even this listing, however, though far more comprehensive than just identifying personality characteristics, is still not exhaustive with respect to capturing the whole person. We might still say of Sarah such things as that she has always lived with a strong sense of satisfaction that she overcame a significant physical handicap early in life, felt guilty that she once failed a friend at a critical time, or never gotten over the time she suffered a severe public humiliation. The “whole person palette” -- the palette which (unless we are novelists) we use only on those very rare occasions where there is a need to give extremely comprehensive descriptions of a person -- is far more extensive than the delineation of an individual's personality characteristics.

 

3. 성격의 정의
3. A definition of personality

이 섹션에서는 "성격"에 대한 새로운 정의를 제안하고, 그 정의를 구성하는 여러 요소에 대한 분석을 실시한다. 이러한 요소 중 일부는 개념의 이전 공식에 나타나며 익숙할 것이고, 다른 요소들은 새로운 것이어서 현재의 공식은 이전 개념과 전반적으로 다르다. 이 섹션에서는 이러한 차이에 대한 설명으로 마무리합니다.
In this section, a new definition of “personality” is proposed, followed by an analysis of the different elements comprising it. Some of these elements appear in previous formulations of the concept and will be familiar, while others are new and thus render the present formulation different overall from its predecessors. The section concludes with a discussion of these differences.

3.1 정의
3.1. The definition

개인의 성격은 그 혹은 그녀가 보여주는 지속적 특질과 스타일의 집합이며, 그 특성은 다음을 나타낸다. 
(a) 이 사람의 기질 (즉, 타고난 성향 또는 개인적 경향) 및 
(b) 이 사람 자신이 속한 사회의 "표준적인 일반 사람"과 어떤 식으로 다른지. 
An individual's personality is the enduring set of Traits and Styles that he or she exhibits, which characteristics represent
(a) dispositions (i.e., natural tendencies or personal inclinations) of this person, and
(b) ways in which this person differs from the “standard normal person” in his or her society

개인의 성격은 파라메트릭 분석에서 위에서 지정한 모든 성격 특성 집합의 하위 집합으로 여기에 공식화됩니다. 그것은 위에서 나열된 10가지 특성 중 두 가지로 구성된 하위 집합이다.

  • 특질([특정 종류의 행동]에 관여하거나 [특정한 감정 상태]를 경험하는 것에 관한 기질)과
  • 스타일(사람이 [무엇을 하는지]가 아니라, [어떻게 하는지]에 관한 기질)

다음에서는 이 정의의 각 특징을 차례로 설명합니다. 
(NB: "행동"은 예를 들어, 개인적으로 자신을 비난하거나, "머리로" 요약하거나, 정신적으로 하루 일정을 계획하는 것과 같은 정신적인 행동을 포함하도록 의도되어 있습니다.)

An individual's personality is formulated here as a subset of the set of all the Person Characteristics specified above in the parametric analysis. It is the subset comprising two of the ten characteristics listed there, 
> Traits (dispositions to engage in a certain kind of behavior or to experience certain emotional states), and 
> Styles (dispositions having to do, not with what a person does, but with how he or she does it).

In the following, each of the features of this definition is discussed in turn. (NB: “Behavior” is intended here to include mental acts such as, for example, privately criticizing oneself, doing a sum “in one's head”, or mentally planning one's daily schedule.)

'지속적'. 이것은 대부분의 성격 정의에서 반복되는 특징입니다. 외향성, 공격성, 불안과 같은 특성은 [상당한 기간에 걸쳐 관찰되는 조건]에서만 성격적 특성으로 단정할 수 있다. 같은 성질을 나타내는 행동이나 감정이 단 한 번만 또는 단기간 동안만 일어난다면, 우리는 그 특성을 보인 "에피소드" 또는 "상태"라고 말한다. 예를 들어, 극심한 불안이나 불안한 상태의 일화이다.

Enduring”. This is a recurring feature in most definitions of personality (e.g., Feist et al., 2013; Larsen & Buss, 2017; Mischel et al., 2007). Characteristics such as extraversion, aggressiveness, and anxiety are aptly predicated as personality characteristics only under conditions where they are observed over a significant period of time. If behaviors or emotions exhibiting the same qualities occur only once or only over a brief period of time, we speak of “episodes” or “states” exhibiting the relevant quality -- for example, an episode of intense anxiety or an anxious state.

NB: 이것은 또한 일반적으로, 사람에 대한 같은 개념[예: "공격적", "적대적", 또는 "부끄러운"]이 다른 종류의 특성을 지칭하기 위해 다른 맥락에서 사용된다는 것을 보여준다. 예를 들어, 다양한 맥락에서 "적대적"이라는 단어는 특성, 상태, 스타일, 태도, 행동 또는 위의 조합을 나타내기 위해 사용됩니다. [예: "성격적인 적대감은 적대적인 대인관계 스타일로 나타난다"]
(NB: This also illustrates the general point that the same person concept [e.g., “aggressive”, “hostile”, or “shy”] is used in different contexts to designate different kinds of person characteristics. The word “hostile”, for example, in various contexts is used to designate a trait, a state, a style, an attitude, a behavior, or some combination of the above [e.g., “His characterological hostility shows up in his hostile interpersonal style.”])

"의미있는" 기간은 무엇입니까? 여기서 통용되는 일반적으로 정해진 규칙은 없다. 그 개념은 모호함에 대한 공통적이고 많은 논란이 되고 있는 특성을 가지고 있다. 즉, 일회성과 비일회성 사이에 명확한 경계가 없습니다. 이러한 이유로, 자신의 연구 목적을 위해 정확하고 확실한 시간 경계를 필요로 하는 성격 연구자는 조작적 정의를 결정할 필요가 있다. 
(예: "이 연구의 목적상, '지속적enduring'이란 3년 이상을 의미합니다.")
What is a “significant” period of time? There is no generally established hard and fast rule to go by here. The concept possesses the common and much-discussed quality of vagueness (Chaplin, John, & Goldberg, 1988; Sorenson, 2018). That is, it lacks a clear boundary between its instances and non-instances. For this reason, any personality researcher requiring a precise, determinate time boundary for his or her research purposes would need to decide upon an operational definition (e.g., “for purposes of this research, by ‘enduring’ we mean three years or more”).

기질. 지속성과 마찬가지로, 기질은 여러가지 성격의 정의에서 반복되는 특징이다. 사실, 그것의 연구에 대한 하나의 두드러진 접근법인 특질 이론trait theory은 종종 "기질적dispositional 접근법"으로 언급된다. 그러나 이 용어의 의미는 철학자들에 의해 충분히 논의되고 있지만, 심리학 문헌에서는 전혀 논의되지 않는다. 예를 들어, 이 단어는 옥스퍼드 심리학 사전에도 나오지 않는 반면, APA 심리학 사전(2007)은 "개인을 다른 사람과 구별하는 반복적인 행동 또는 감정적 경향"이라고 명시할 때 동의어에 해당하는 것 이상을 제공하지 않는다. 기질disposition은 성격 특성의 중요한 측면이기 때문에, 이러한 부재는 심리학 내에서 성격에 대한 전반적인 개념을 완전히 발달시키지 못한 상태로 남긴다.
Disposition. Like enduringness, disposition is a recurring feature in other definitions of personality (e.g., Allport, 1961; McAdams, 2009). Indeed, one prominent approach to its study, trait theory, is often referred to as the “dispositional approach”. However, while the meaning of this term is amply discussed by philosophers (e.g., Choi & Fara, 2016; Romero & Craver, 2015), it is discussed hardly at all in the psychological literature. The word, for example, does not even appear in the Oxford Dictionary of Psychology (Colman, 2006), while the APA Dictionary of Psychology (2007) provides little more than what amounts to a synonym when it states that it is “a recurrent behavioral or affective tendency that distinguishes an individual from others” (p. 90). Since disposition is a critical aspect of personality characteristics, this absence leaves the overall conception of personality within psychology less than fully developed.

[기질disposition]이란 무엇인가? 이러한 개념을 포착하기 위해 사용되는 일반적인 용어는 개인적인 "경향", "성향", "추세"를 포함한다. 어떤 것이 '기질적'이려면, 그 행동 패턴(예: 수줍음 또는 공격적인 행동)은 개인의 개인적 성향을 표현해야 한다. 그러나 이 단순히 동의어의 반복을 넘어서려면, 무엇을 의미해야 하는가? 이는 그 행동 패턴이 (가치관, 지식/신념, 태도 및 관심사와 같은 개인의 행동의 진행 방향과 관련된) [사람의 특성]에 기초해야 한다는 것을 의미합니다. 패턴이 (1) 이것들(가치관, 지식/신념, 태도, 관심사)과 일치하지 않거나, (2) 일관된 것처럼 보이지만 사실은 개인이 어떤 식으로든 행동하도록 압력을 받거나 강요당하거나 동기를 부여받는 등의 영향에 의해 야기되는 것이라면, 그 패턴을 본질적으로 [기질적이지 않고], 성격과 관련이 없는 것으로 간주하는 근거가 된다. "그 영업사원은 사실 유쾌한 사람이 아닙니다. 그가 기분 좋게 행동하는 유일한 이유는 그렇게 하지 않으면 해고될 것이기 때문입니다." 이러한 의미에서, 즉, 개인의 다른 [지속성있는 성격 특징enduring Person Characteristics]을 보여준다는 점에서, 종종 성격 특성은 ('우리가 무슨 일을 하는가' 뿐만 아니라) "우리가 누구인가"에 대한 것이라고 말한다.

What is a “disposition”? Common terms used to capture this notion include personal “inclination”, “proclivity”, and “tendency”; to qualify as dispositional, the pattern of behavior in question (e.g., shy or aggressive behavior) must be expressive of the individual's personal inclinations. However, if we are to take this matter beyond the mere recitation of synonyms, what does this mean? It means that the pattern must be grounded in -- must be expressive of -- other Person Characteristics that pertain to the ongoing direction of the individual's behavior such as his or her Values, Knowledge/Beliefs, Attitudes, and Interests. If the pattern is seen as (1) inconsistent with these or, (2) though seeming consistent, actually brought about by influences such as the individual being pressured, forced, or incentivized to behave in some way, these are grounds for counting the pattern as not dispositional in nature, and so not pertaining to his or her personality: “The salesperson is not actually an agreeable person; the only reason he is behaving agreeably is because he would be fired if he did not do so.” It is in this sense, i.e., of their close relationship to -- their being expressive of -- the individual's other enduring Person Characteristics, that we often say of personality characteristics that they are not just about what we do, but about “who we are”.

성격 용어들은 본질적으로 상대적이다. "빅 5" 성격 특성(외향성, 호감성, 양심성, 신경증, 개방성)에 대한 현재 유비쿼터스 문헌에서는 친숙한 [상대성]이 발전되어 있다. 그것은 현재의 시각과 양립할 수 있는 동시에 일상에서의 관찰과도 일관성이 있는 것입니다. 구체적으로, 이 다섯 가지 특징들을 [차원적인 것]으로 취급한다: 사람들은 다소 외향적이고, 호감도가 높거나 낮으며, 많거나 적거나 신경질적인 정도를 보인다. 예를 들어, 이 변수가 하나의 값만 갖는 것처럼 "그저 원만한" 것은 결코 아니며, 이 차원에서는 항상 상대적으로 높거나 낮습니다.
Personality terms inherently relativistic.
 In the currently ubiquitous literature on the “big five” personality traits (extraversion, agreeableness, conscientiousness, neuroticism, and openness), a familiar kind of relativity is advanced (Digman, 1990; Goldberg, 1990, 1993; John, Naumann, & Soto, 2008). It is one that is both compatible with the present view and consistent with everyday observation. Specifically, this literature treats these five traits as being dimensional: persons are more or less extraverted, high or low on agreeableness, exhibit greater or lesser degrees of neuroticism, and so forth. They are never, for example, “just agreeable”, as if this variable had only one value, but always relatively high or low on this dimension.

하지만, 성격 개념을 규정하는 것에 관한 한, 두 번째 종류의 상대성이 증거이다. 이는 모두 오소리오에 의해 "표준 정상인"으로 지정된 사회적 규범(SNP)에 상대화되어 있다는 것이다. 이 사람은 [한 사회에서 항상 보통 사람들이 하는 것과 똑같이 행동하는 가상의 사람]이다. 예를 들어, 그 혹은 그녀의 행동에 있어서, 이 개인은 "내향적"도 "외향적"도 아니고, "동의적"도 아니고 "불동의적"도 아니며, "시기적"도 "적극적"도 아닌, 어느 정도 그 사이의 센터이다. 사회적 규범에 대한 이러한 상대성 논쟁을 방어하기 위해, 특정 개인이 어떤 차원(예: 내향적-외향적)에 매우 중심적일 때, 우리 언어는 이 차원에 관해 그 또는 그녀에 대한 특정한 성격 설명자를 포함하지 않는다는 것을 주목할 수 있다. 잭이 내성적이지도 않고 외향적이지도 않은 경우(예를 들어, 큰 5개 기준의 중간 정도일 수 있음), "그 점에 있어서는 그저 평균"이라는 일반적인 비특정 표현을 사용하거나 "글쎄요, 그는 정말 수줍음을 타는 것은 아니지만 정말 외향적이지도 않습니다."와 같은 말을 할 수 있는 경우, 이러한 중간수준을 잡아내는 특별한 용어가 없다.

However, when it comes to predicating personality concepts, a second kind of relativity is in evidence. This is that they are all relativized to a societal norm, one designated by Ossorio (1983; Schwartz, 2019; Shideler, 1988) as a “standard normal person” (“SNP”). This is a hypothetical person who always behaves just as the average person in his or her society does. In his or her behavior, for example, this individual is neither “introverted” nor “extraverted”, neither “agreeable” nor “disagreeable”, neither “timid” nor “aggressive”, but more or less dead center in between. In defense of this contention of relativity to a societal norm, it may be noted that when a given individual is very central on some dimension (e.g., introversion-extraversion), our language contains no specific personality descriptors for him or her with respect to this dimension. If Jack is neither introverted nor extraverted (e.g., he might be right in the middle on a big 5-based scale), while we can use a general, nonspecific expression such as that he is “just average in that regard”, or say something like, “well, he's not really shy but he's not really outgoing either”, there is no specific personality term that captures just this intermediate level of social engagement.


이러한 관점에서, 우리가 한 개인의 성격을 개인에게 귀속시킬 때, 우리는 암묵적으로 다른 사람에 대한 개인적 차이뿐만 아니라, 그 사람이 사회의 표준적인 정상인(그리고 사회 내의 하위 공동체)에서 어떻게 벗어나는지도 구분하고 있다. 사회화를 통해 [우리 각자는 우리 사회의 SNP가 어떻게 생겼는지에 대한 개념]을 가지고 있습니다. 그래서 처음 사람을 만났을 때, 우리 사회의 사람들은 보통 예의범절의 기준을 지키고, 우리와 눈을 마주치고, 말할 때 말을 걸고, 듣고, 원치 않는 성적, 공격적 진보를 하지 않는 등의 행동을 하는 것이 사회적 본보기였다. 어떤 사람에 대한 경험이 더 많아지면, 우리는 이를 바탕으로 [한 사람의 행동이 SNP에서 어떻게 벗어나는지]를 나타나는 방향으로 그 사람에 대한 인상을 조정한다. 개인은 자기 자신에 대해 끊임없이 이야기하고 우리가 말하는 어떤 것에 대해서도 전혀 관심이 없는 것처럼 보이며, 우리는 "자기애적" 혹은 "자기 중심적"이라고 생각하기 시작한다. 그 사람은 고개를 숙이고, 말을 적게 하고, 눈을 마주치지 못하는 것처럼 보이고, 우리는 "소심하다"고 생각하기 시작합니다. SNP에서 얼마나 벗어났는지에 대한 관찰에 기초해서, [관찰된 행동이 사회적 규범에서 어떻게 벗어나는지에 의해 나타나는 방향]으로 [성격 속성]을 만든다. 어떤 SNP에 근접할 경우, 그 사람의 성격을 특징짓기 위한 특성이나 스타일 용어를 제공하는 것은 매우 어렵습니다. 그들을 묘사해 달라고 하면, 우리는 다음과 같은 말을 합니다. "글쎄요, 어떤 이유에선지, 나는 그를 묘사하기가 어려워요. 그는 그저, 음, 좀 평범해요."

On this view, then, when we attribute a personality characteristic to an individual, we are marking off, however implicitly, not only her individual differences vis-à-vis other persons, but also how she deviates from the standard normal person in her society (and possibly even a subcommunity within her society) (Ossorio, 1983; Schwartz, 2019). Each of us, by virtue of our socialization, has a conception of what a SNP in our society looks like. Thus, upon first meeting a person, we carry as it were a societal template with us that persons in our society will ordinarily do such things as observe certain standards of politeness, maintain eye contact with us, both speak to us and listen when we speak, not make unwanted sexual or aggressive advances, and much more. Upon further experience with this person, then, in a quasi-Bayesian way, we adjust our impression of them in directions indicated by how their behavior deviates from the SNP. The individual talks non-stop about himself or herself and seems utterly uninterested in anything we say, and we begin to think “narcissistic” or “self-centered”. The individual looks down, says little, and seems unable to make eye contact, and we begin to think “shy”. It is on the basis of these observed deviations from the SNP, then, that we make personality attributions in a direction indicated by how the behavior observed deviates from the societal norm (Ossorio, 1983; Schwartz, 2019; Shideler, 1988). In those rare cases where actual persons closely approximate the SNP, we find it very difficult to provide trait or style terms to characterize their personality. Asked to describe them, we say things like “Well, for some reason, I find it hard to describe him; he's just, well, sort of average.”

사회적 기준에 대한 고유한 상대성을 갖는 성격 특성을 더욱 방어하기 위해, 그들 중 많은 수가 [(행동적 또는 감정적) 누락omission]으로 인한 것으로 간주할 수 있다. 예를 들어, 우리는 존이 "무책임하다", "신뢰할 수 없다" 또는 "무감정적"이라고 말한다. 이러한 경우에 관찰할 수 있는 것은 [무엇의 존재]가 아니라 [예상되는 행동이나 감정의 반복적인 부재]입니다(예: 존은 자주 다른 사람과의 약속을 지키지 않는다). 긍정적인 공공연한 행동이나 감정이 관찰되지 않는다. 대신 관찰자는 [일반적으로 존재하는 것]에 대한 문화적 기준을 가지고 있으며, [그것의 반복적인 부재]할 때 성격 속성으로 나타낸다.
In further defense of personality characteristics possessing an inherent relativity to a societal standard, it may be noted that many of them impute behavioral or emotional omission. We say, for example, that John is “irresponsible”, “unreliable” or “unemotional”. What is observable in such cases is not the presence, but the recurrent absence of expected behaviors or emotions (e.g., John routinely fails to fulfill made commitments to others). No positive overt behavior or emotion is observed. Instead, the observer possesses a cultural standard of what is ordinarily present and marks its recurrent absence with a personality attribution.

성격 특성이 [사회적 규범에 대한 상대적인 것]이자 [그 규범과의 차이의 구별이라는 것]이라는 개념은 다음에도 도움이 된다. 이것은 성격 특성의 속성이 [절대적인 것]이 아니라 [상대적인 빈도]에 근거한다는 사실이다. 다음과 같은 고정 빈도기반 표준은 없습니다. "P가 Y개월 이상 일주일에 N번 이상 행동 X를 하면, 그것은 성격 특성 행동으로 간주될 수 있고, 그렇지 않으면 그렇지 않습니다." 오히려 (성격에 대한) 판단은 SNP 규범에 상대적이며, [특성 속성 행동]의 실제 빈도 자체는 매우 낮을 수 있습니다. 예를 들어, 한 사람은 장기적으로 다른 사람들에게 매우 신뢰할 수 있고, 정당하게 "충성" 특성을 부여할 수 있지만, 그 혹은 그녀는 일년에 한두 번 이상 충성으로 특징지어지는 행동을 할 수 있다. "자기희생", "너그럽다", "용감하다" 등으로 특징지어지는 행동도 마찬가지라고 할 수 있다. 어떤 행동의 주목할 만한 사례의 수가 적더라도, 사회적 규범에서 벗어난 것으로 보일 때, 그 사람이 이러한 특성을 가진 것으로 인식될 수 있다.

The notion of personality characteristics being relative to a societal norm and marking off divergences from that norm helps to clarify something further. This is the fact that the attribution of personality characteristics is not based on absolute but on relative frequency. There are no fixed, frequency-based standards to the effect that, “if P engages in behavior X more than N times per week for over Y months, it may be counted as personality trait behavior, and otherwise not”. Rather, the judgment is relative to the SNP norm and indeed the frequency of trait-attributed behavior may actually be quite low. A person might, for example, be very reliably loyal to others on a long-term basis, and justifiably assigned the trait “loyal”, yet he or she might engage in behavior marked by loyalty no more than once or twice a year. The same can be said for behavior characterized as “self-sacrificing”, “generous”, “brave”, and more. A relatively low number of notable instances of such behavior may cause the person to be perceived as possessing these traits when this is seen as deviating from the societal norm.

마지막으로 SNP template이 문화마다 다르기에, 이 개념은 [문화 간 상대성]이 내재되어 있음을 수반한다는 것을 알 수 있다. 그것은 동일한 행동 패턴일지라도 한 문화(또는 하위 문화)에서는 성격 귀속(예: "공격적")의 근거로 간주될 수 있는 반면, 다른 문화에서는 그렇게 간주되지 않는 익숙한 현상을 설명한다.

Finally, insofar as SNP templates will vary from culture to culture (and, while space does not permit its discussion here, subculture to subculture), it may be noted that this notion carries with it a built-in cross-cultural relativity. It explains the familiar phenomenon that the same pattern of behavior in one culture (or subculture) might be counted as grounds for a personality attribution (e.g., “aggressive”), while in another culture it would not be so counted.

 

3.2. 기존 정의와의 차이점
3.2. Differences from previous definitions

위에서 설명한 바와 같이, 본 정의는 성격 문헌의 다른 정의와 몇 가지 특징을 공유한다. 예를 들어, 개념의 다른 공식에서 나타나는 [지속성][기질성]과 같은 요소를 포함한다. 이러한 중복은 현재의 공식에 대해 무엇이 다른지에 대한 의문을 제기한다. 이 질문에 대한 답변에는 다음과 같은 차이점이 제시되어야 한다.
As noted above, the present definition shares some features with other definitions in the personality literature. For example, it includes elements such as enduringness and dispositionality that appear in other formulations of the concept. These overlaps raise the question of what, if anything, is different about the present formulation. The following articulation of differences should serve to answer this question.

(1) 현재의 정의는 성격의 개념이 "표준 정상인"(SNP)으로 지정된 사회적 템플릿에 대한 내재적 상대성을 수반한다는 주장에서 다른 모든 것과 다르다.
(1) The present definition differs from all others in its claim that the concept of personality carries with it an inherent relativity to a societal template, one designated as a “standard normal person” (SNP).

(2) 현재의 정의는 성격을 행동 및 감정과 분리되어있거나, 행동 및 감정과 인과관계를 이루는 [기저 실체(예: 메커니즘, 시스템 또는 구조)]로 간주하는 일군의 정의와 다르다.
(2) The present definition differs from all those in that group of definitions that regard personality as an underlying entity (e.g., a mechanism, system, or structure) that is separate from, and stands in causal relationship to, behavior and emotion.

(3) 현재의 정의는 [성격이 전인whole person을 지칭한다]고 주장하는 큰 정의 그룹의 모든 정의와 다릅니다. 즉, "개인의 모든 측면을 지칭합니다."
(3) The present definition differs from all those in the large group of definitions that maintain that personality refers to the whole person -- that it “refers to all aspects of persons” (Cervone & Pervin, 2013, p. 8).

(4) 특성을 포함하는 다른 많은 정의와 달리, 현재의 정의에는 [스타일]도 포함됩니다. 즉, 어떤 사람이 [무엇을 하는가]가 아니라 [어떻게 하는가]에 관련된 그 사람의 특성 (예: Susie는 화려하거나 세련되거나 어색합니다).
(4) The present definition, unlike the many others that include Traits, also includes Styles; i.e., person characteristics that pertain not to what a person does, but to how he or she does it (e.g., Susie is flamboyant, sophisticated, or awkward).

(5) 현재의 정의는 이 작가가 성격 특성이 "기질적"인 것이 무엇을 의미하는지 비판적으로 설명하면서 발견할 수 있었다는 점에서 다른 모든 것과 다르다. (가치관이나 태도와 같은) 다른 인간 특징person characteristics에 대한 필요성과 함께 이 표현은, 성격 특징이 단지 [우리가 하는 일]이 아니라, [인간으로서의 우리가 누구인지]에 대한 명제를 이해할 수 있게 한다.
(5) The present definition differs from all others that this author could discover in providing a critical explication of what it means for a personality characteristic to be “dispositional”. This articulation, in turn, with its necessary connection to other person characteristics such as values beliefs, and attitudes, renders intelligible the proposition that personality characteristics are not just about what we do, but about who we are as persons.

여기서 제안된 것과 가장 유사하고, 따라서 그것과 혼동될 가능성이 가장 높은 정의의 그룹은 미국 심리학 협회의 다음 예에 의해 예시된다: "성격은 생각, 느낌, 그리고 행동의 특징적인 패턴의 개인 차이를 말한다." 문헌의 다른 정의와 유사한 이 정의는 현재 정의와 가장 가깝고 따라서 후자가 이전 정의와 실제로 다르지 않다는 인상을 줄 가능성이 가장 높다. APA의 정의는 여기서 설명한 것과 유사하지만 다음과 같은 점에서 다릅니다.

The group of definitions most similar to that proposed in this article, and thus most likely to be confused with it, is exemplified by the following one from the American Psychological Association: “Personality refers to individual differences in characteristic patterns of thinking, feeling and behaving” (https://www.apa.org/topics/personality/). It is this definition, similar to others in the literature (e.g., Funder, 2016 [part one]; Johnson, 1997; McCrae & Costa, 1995), that comes closest to the present one and is thus most likely to create the impression that the latter is not really different from its predecessors. While APA's formulation does have similarities with that presented in this article, it is different in the following ways:

(a) APA의 정의는 모호하며, 그 모호함 속에서 지나치게 포괄적이라는 것을 읽을 수 있다. 개성을 개인의 특징과 스타일에 더 정확하게 제한하는 것과 달리, APA는 널리 사용되는 "생각, 느낌, 행동 패턴의 특징"이라는 문구를 사용하는 것은 개인에 대해 다음의 항목도 포함하는데,

  • 버릇 ("Kathy는 매일 아침 9시에 집을 나서는 버릇이 있다"),
  • 루틴 ("Joe는 매일 아침 9시에 집을 나선다"),
  • 관심사 ("Amy는 콜럼버스 이전의 예술에 관심이 있다."),
  • 태도 ("Sam은 그가 비과학적이라고 생각하는 모든 것에 부정적인 태도를 가지고 있다.") 

이것들은 전형적으로도, 직관적으로도 성격 특성으로 간주되지 않는 개인적 특징입니다.

(a) APA's definition is ambiguous and, in its ambiguity, open to a reading of being overinclusive. In contrast to limiting personality more precisely to an individual's Traits and Styles, APA'S use of the widely employed phrase, “characteristic patterns of thinking, feeling and behaving”, could be taken to include such items as an individual's 

  • habits (“Kathy has a habit of being late.”), 
  • routines (“Joe leaves the house at 9 each morning and parks in the same space at work.”), 
  • Interests (“Amy is interested in pre-Columbian art.”), and 
  • Attitudes (“Sam has a negative attitude toward anything he deems unscientific.”),

personal features that are not typically, or intuitively, regarded as personality characteristics.

(b) 여기서 제안된 정의와 달리, APA 정의는 [기질성, 지속성, 문화적 표준에 대한 내재적 상대성]이라는 중요한 특징이 결여되어 있다.

(b) Unlike the definition proposed in this article, the APA definition lacks the critical features of dispositionality, enduringness, and inherent relativity to a cultural standard.

(c) 여기서 정의한 성격은, [개인이 보여주는 특징과 스타일의 집합]이다. 즉, APA가 ['개인의 차이']라고 말한 것이 아니다. 후자와 같은 주장은 마치 코커 스패니얼이 '개의 한 종류'라기보다는, '개인의 차이'라고 말하는 것과 같으며, "가톨릭은 특정 종파의 하나"가 아니라 '가톨릭은 개인의 차이'라고 말하는 것과 같다. 만약 "코커 스패니얼"을 정의해달라고 요구한다면, 사실상 아무도 "개인적인 차이"라고 말하지 않을 것이다. 또한, 여러 사전의 검사는 이러한 효과에 대한 단일 정의를 제시하지 않았다. [성격 특질 및 스타일]의 개념은 [한 사람이 다른 사람과 어떻게 다른지]를 구분하는 데 사용될 수 있습니다. (같은 이유로, 「잭과 질은 둘 다 매우 부끄러움을 많이 탄다」와 같이 「개인의 동일성individual sameness」이라고 불릴 수 있는, 한 사람이 다른 사람과 같은 것을 나타내는 데도 사용됩니다). 그러나 특질이 그 자체로 "차이"인 것은 아니다. 성격이 무엇인지 아직 알지 못하는 사람에게(따라서 정의를 필요로 하지 않는) 그것을 "차이"로 정의하는 것은 상당히 명확하지 않다. 생각, 느낌, 행동에서 어떤 차이가 있을까? 이런 사람은 우리가 무슨 말을 하고 있는 걸까?라고 생각할 수 있습니다. APA의 정의에서는 이런 것이 전혀 명확하지 않다.

(c) On the present definition, personality is the set of Traits and Styles a person exhibits; it is not, contra APA, “individual differences”. Claiming the latter is like saying “a cocker spaniel is an individual difference” rather than “a type of dog”, or “a Catholic is an individual difference”, rather than “a member of a certain religious denomination”. If asked to define “cocker spaniel”, virtually no one would say, “It is an individual difference”. Further, a check of several dictionaries did not yield a single definition to this effect. Personality trait and style concepts can be and are used to mark off the ways in which one person differs from another person. (For that matter, they are also used to designate the way in which one person is the same as another person [“Jack and Jill are both very shy”], what might be termed “individual samenesses”.) But a trait is not, per se, a “difference”. For someone who does not already know what personality is (and thus does not require a definition), defining it for them as a “difference” carries with it a considerable lack of clarity. What sort of difference in thinking, feeling, and behaving, such a person might wonder, are we talking about?” This is not at all clear from APA's definition.

전반적으로 APA의 정의는 현재보다 더 유사하다. 또한 현재 제안보다 훨씬 덜 정확하고, 더 모호하며, 오해를 불러일으킬 수 있는 개념적 특성을 보여줍니다.
Overall, APA's definition is more unlike than like the present one. Further, it exhibits conceptual qualities that render it considerably less precise, more ambiguous, and possibly misleading than the current proposal.

 

4. 토론: 그래서?
4. Discussion: so what?


"그래서?" 비평가라면 이의를 제기할 수 있다. "왜 우리가 이 모든 것을 신경써야 합니까? 그것은 무슨 소용이 있는가? 성격 개념화 문제에 대해 오랫동안 합의를 이루지 못한 채 아주 잘 지내지 않았습니까? 이 절에서는 지금까지의 반대에 대한 답변을 간략하게 정리하고, 그 외에 두 가지를 소개한다.

“So what?”, a critic might object. “Why should we care about all this? Of what use is it? Haven't we gotten along perfectly fine with our long-term failure to arrive at a consensus in the matter of conceptualizing personality?” In this section, I will briefly recount the answers given to these objections thus far in this article, and then introduce two additional ones.

나는 우리가 충분한 합의의 정의에 도달하지 못한 채, 사실상 '완벽하게 잘 지내지 못했다'고 믿고 있다. 심리학은 과학이고, 우리는 심리학이 그렇다는 것에 자부심을 느낀다. 그러나 수십 년 전 Sigmund Koch(1959)가 개탄한 것처럼 우리는 핵심 주제의 본질에 대해 명확하지 않은 채 이 과학을 계속 추진하고 있다. - "행동", "사람", "자기" 또는 "인격"과 같은 중심 개념을 명확히 하지 않고 있다. 이 상황은 화학자가 동위원소로 계산할 대상을 먼저 결정하지 않고 동위원소 연구에 착수하는 상황과 유사하다. 그 결과 무수히 많은 다른 개념들이 생겨났다.

  • 앞서 언급한 바와 같이, 많은 사람들은 성격을 근본적인 원인 메커니즘, 구조 또는 시스템으로 본다.
  • 다른 사람들은 그것을 전체로 본다.
  • 아직까지도, 가장 주목할 만한 특질 이론가trait theoriests들은, 어휘 가설에 따르면, 대체로 직관적이지만, 개념적으로 성격 특징에 대한 명확하지 않은 개념에 의존합니다.

I believe, and have argued above, that we have not in fact “gotten along perfectly fine” with our failure to arrive at an adequate consensus definition. Psychology is a science, and we pride ourselves on its being such. However, as lamented famously by Sigmund Koch (1959) many decades ago, we continue to push forward with this science without being clear on the nature of its core subject matter -- without articulating such central concepts as “behavior”, “person”, “self”, or, in the present instance, “personality” (Bergner, 2017:; Schwartz, 2019). The situation is comparable to one in which a chemist would set out to study isotopes without first determining what was to count as an isotope. The result has been a myriad of different conceptions. As noted,

일반적으로 이 분야는 직관적으로 받아들일 수 없고 모호하며 오해를 일으킬 수 있는 수많은 정의로 인해 어려움을 겪고 있습니다. 그 결과는 전체적으로 다소 도움이 되지 않고 혼란스러우며 혼란스러운 과학 풍경이다. 앞에서 언급한 것 외에, 본 견해의 이점인 두 가지 추가적 의미는 다음과 같다.

In general, the field suffers from a myriad of definitions that are intuitively unacceptable, ambiguous, and/or potentially misleading. The result overall is a rather unhelpful, confused, and confusing scientific landscape. In addition to the foregoing, two additional implications, both benefits of the present view, are the following.

 

4.1. 특성 기반 설명이 얼마나 진정한 설명인지를 명확히 한다.
4.1. Clarifies how trait-based explanations are genuinely explanatory

많은 작가들은 성격 특성 속성personality trait attributions 이 단지 행동의 규칙성에 대한 서술적인 언급에 불과하다고 주장해 왔고, 따라서 예를 들어, 누군가가 수줍음을 탄다고 말하는 것은 그 혹은 그녀가 동시에 조용하고 내성적이라는 것에 지나지 않는다고 주장해 왔다. 이런 점에서 성격적 특성personality traits에 근거한 설명은 반복과 같다. "아만다는 조용하고 부끄러워서 파티에서 내성적이었다"는 말은, "조용하고 내성적이어서 조용하고 내성적이라는 말"에 불과할 뿐이다. (cf. 몰리에르의 유명한 의사 풍자는 아편이 "숙면적인 미덕을 가지고 있기 때문에" 수면을 유도한다고 설명했습니다.그것은 아편을 섭취하는 것 이상의 의미가 없고, 규칙적으로 수면이 뒤따른다는 것을 의미합니다.) 

A number of authors have claimed that personality trait attributions are nothing more than the merely descriptive noting of regularities in behavior, and thus that saying that someone is, for example, “shy” means nothing more than that he or she is recurrently quiet and withdrawn (Boag, 2011; Holt, 1969; Saucier & Goldberg, 1998). On this account, explanations based on personality traits are tantamount to tautologies. Saying that “Amanda was quiet and withdrawn at the party way because she is shy” would be saying only “she was quiet and withdrawn because she is recurrently quiet and withdrawn”, and so would not be explanatory (cf. Moliere's famous lampoon of the doctor who “explained” that opium induced sleep “because it has a dormitive virtue” -- meaning nothing more than that ingesting it is regularly followed by sleep).

그러나, 현재의 분석에서는, 성격 베이스의 설명을 제공하는 것은, 동조를 말하는 것과 같지 않고, 정말로 설명적이다(익숙한 효율적인 인과관계에서는 아니지만). 우리는 제3자의 행동에 대해 명백하고 수행적으로 묘사된 사실에 전적으로 동의하는 두 사람이 그럼에도 불구하고 그들의 성격 속성에 동의하지 않는 경우에서 이것을 명확하게 볼 수 있다. 예를 들어, [파티에서 아만다의 조용하고 내성적인 행동]에 주목하면서 [윌은 "부끄러워서"라고 주장]하는 반면, [질은 "아니, 그녀가 냉담해서"라고 반대 의견]을 내뱉는다. 그들의 "특징 X가 있기 때문"이라는 설명은 아만다의 행동이 다른 무언가를 표현하고 있다고 생각한다는 것입니다. 즉, 누군가는 다른 곳에서 온 것이라고 말할 수도 있고, 이것이 그들의 속성을 단순히 서술적인 것이 아니라 설명적인 것으로 만드는 것입니다. 본 분석에서는 위에서 언급한 바와 같이 아만다의 다른 인물 특성에서 이와 다른 점을 찾을 수 있습니다. "아만다가 수줍음을 타서"라고 말함으로써, 그들은 그녀가 "조용하고 내성적인"과 같은 노골적인 행동에 영속적으로 관여하고 있다는 것 이상의 것을 말하고 있다. 그들은, 그녀가 가치관, 신념, 태도 등 다른 성격에 기반을 둔 성향을 가지고 행동하고 있다는 점에서 이해되고 있는, [그런 종류의 사람이기 때문에 그렇게 하고 있다]고 말한다. 예를 들어, Amanda의 경우, 이것들은 다른 사람들과 함께 자신을 내세울 때 평가된 사회적 위험과 관련된 지식/신앙 매개 변수 요소를 포함할 수 있습니다.

However, on the present analysis, providing personality-based explanations is not tantamount to uttering tautologies, and is genuinely explanatory (although not in the familiar efficient causal sense) (cf. Nilsson, 2015). We see this clearly in cases where two people who agree entirely on the overt, performatively described facts of a third person's behavior nonetheless disagree in their personality attributions. For example, noting Amanda's quiet and withdrawn behavior at the party, Wil maintains that it is “because she is shy”, while Gil issues a dissenting “no, it's because she is aloof”. Their “because she has trait X” explanations are saying that each thinks Amanda's behavior is expressive of something different -- that it is, one might say, “coming from a different place” -- and it is this that renders their attributions explanatory and not merely descriptive. On the present analysis, as noted above, this something different is to be found in Amanda's other Person Characteristics. In saying “because Amanda is shy”, they are saying more than that she is engaging enduringly in some performatively described overt behavior such as “she is being quiet and withdrawn”. They are saying that she is doing so because this is the kind of person she is, understood in the sense that she is acting on inclinations that are grounded in other of her person characteristics such as her values, beliefs, and attitudes. In Amanda's case, for example, these might include, among other things, Knowledge/Belief parameter factors having to do with appraised social dangers attendant upon putting herself forward with others.

「부끄럼을 타서」와 같이 성격특성-기반의 설명에 대해서, 그것이 최상위 수준의 설명이라고 하는 사람은 거의 없을 것이다. 즉 그 이상의 설명은 할 수 없다고 하는 사람은 거의 없다. 만약 "근데 왜 수줍음을 타느냐"고 묻는다면, 대부분은 아만다의 행동에 대한 완전한 설명을 하지 못한 것을 쉽게 이해할 수 있을 것이고, 다른 요인들에 대한 추가 정보가 있어야 보다 포괄적인 그림을 제공할 수 있을 것이다(예를 들어, 그녀 자신의 개인적 욕구에 대한 평가나 난처한 말을 하는 것에 대한 지속적인 우려). 하지만, 그들은 암시적으로 그녀의 행동이 단지 변덕스러운 반복이 아니며, 강요, 금전적 유인, 또는 그녀가 어떤 사람인지 일관되지 않게 행동하게 하는 다른 영향력에 의해 발생하지 않는다고 보았다. 즉, 위에서 정의한 대로 그녀의 개인적인 성향에 의해 그렇게 행동하는 것이다.

In issuing personality characteristic-based explanations such as “because she is shy”, few people would maintain that they have given final order explanations; i.e., ones beyond which no further explanation can be given. If another person were to ask, “but why is she shy?”, most would readily understand that they have not provided a complete explanation of Amanda's behavior, and that further information about other factors (e.g., her appraisal of her own personal desirability or ongoing concerns about saying something embarrassing) could provide a more comprehensive picture. However, they have by implication indicated that they see her behavior as not just a willy-nilly repetition and as not arising through coercion, monetary inducement, or any other influence that is causing her to behave inconsistently who she is; i.e., with her own personal dispositions as defined above.

위에서 논의한 우리의 신화와 관련하여, 두 가지 점에 주목해야 한다. 

  • 첫째, [성격특성]과 다른 인간특성Person Characteristics과의 관련성을 가정할 때, 우리는 개인의 신념, 가치관, 태도 및 관심사와 같은 비근거적, 비원인적, 비신비한 특징에 대한 효율적인 인과적 메커니즘을 거래해 왔다. 
  • 둘째, 신화 #2에서 표현된 것과 상당히 다른 방식으로, 우리는 개인의 성격과 관련된 (그들 자신이 아닌) 전체 사람의 중요한 요소들을 다시 그림 속으로 끌어들였다.

Relating back to our myths discussed above, two things may be noted.

First, in positing the relatedness of personality traits to other Person Characteristics, we have traded in underlying efficiently causal mechanisms for non-underlying, non-causal, and non-mysterious characteristics such as an individual's beliefs, values, attitudes, and interests.

Second, in a way quite different than that expressed in myth #2, we have brought important elements of the whole person back into the picture as being related to (but not themselves aspects of) an individual's personality.

4.2. 성격사실의 과학적 관찰가능성 합리화
4.2. Rationalizes scientific observability of personality facts

현재의 공식에서 [성격 사실personality facts]은 항상 직접 관찰되는 것은 아니지만, 원칙적으로는 관찰할 수 있는 개인에 관한 사실로 나타난다. 따라서, 특히 기저의 인과관계 실체 설명causal entity accounts과 비교하여, 그들은 과학적 정밀 조사에 도움이 된다. 존의 특징에 관해 우리는 다양한 종류와 각각의 관찰 가능성을 구별할 수 있다. 

  • 그의 명백한 행동과 관련된 특징의 경우(예: 그가 외향적이거나, 적극적이거나, 적대적임), 이러한 특징들은 관련 행동을 [직접 관찰함]으로써 확인할 수 있다.
  • 행동 누락과 관련된 특성(예: John은 무책임하거나 게으르거나 신뢰할 수 없음)의 경우, 관찰할 수 있는 것은 예상되는 [행동이 반복적으로 부재]하는 것이다(예: 그는 일상적으로 다른 사람에 대한 약속을 이행하지 못한다).
  • 사적인 행동이나 정신적인 행동과 관련된 특성(예: 존은 매우 자기 비판적이거나 강박적인 사고를 하는 경향이 있다)의 경우, 이러한 특성은 외부화되어 다른 사람들에게 공개될 수 있다는 점에서 원칙적으로 [관찰할 수 있다](예: 그는 연구자나 치료사에게 자기 비판의 성격을 보고한다).
  • 감정 상태와 관련된 특성(예: 존은 불안하거나 우울함)의 경우, 다른 사람들은 [관찰을 통해] 이러한 특징에 대해 배운다. 예를 들어, 그들은 그의 말에서 두려움을 감지하고, 겁먹은 표정으로 그것을 보거나, 그의 구두 진술에서 그것을 관찰한다.
  • 그러나 다른 경우, 그들은 [추론을 통해] 이러한 상태에 대해 알게 될 수도 있다. 예를 들어, 그들은 존이 사회적 모임을 오랫동안 회피한 것에 근거하여 사회적으로 불안하다고 추론할 수 있다.
  • 마지막으로, 존의 Styles에 관해서(예를 들어, 그는 화려하고, 세련되고, 어색하다), 그러한 특징은 본질적으로 공공연하며, 다른 사람들은 [직접적인 관찰]을 통해 그것을 확인한다.


On the present formulation, personality facts emerge as ones about individuals that, while not always directly observable, are observable in principle. As such, particularly in comparison with underlying causal entity accounts, they lend themselves well to scientific scrutiny. With respect to John's traits, we may distinguish various kinds and the observability of each.

  • In the case of traits having to do with his overt behavior (e.g., that he is extraverted, assertive, or hostile), these can be ascertained through direct observation of the relevant behavior.
  • In the case of traits involving behavioral omission (e.g., John is irresponsible, lazy, or unreliable), what is observable is the recurrent absence of expected behaviors (e.g., he routinely fails to fulfill made commitments to others).
  • In the case of traits having to do with private or mental behavior (e.g., John is very self-critical or prone to obsessive thinking), these are observable in principle in the sense that they can be externalized and thus made public to others (e.g., he reports the nature of his self-criticisms to a researcher or a therapist).
  • In the case of traits having to do with emotional states (e.g., John is anxious or depressive), again others learn about these primarily through observation; e.g., they detect fear in his speech, see it in his frightened expression, and/or observe it in his verbal statements.
  • On other occasions, however, they may learn of these states via inference; e.g., they might infer that John is socially anxious on the basis of his consistent longstanding avoidance of social gatherings.
  • Finally, with respect to John's Styles (e.g., he is flamboyant, sophisticated or awkward), such characteristics are inherently public and others ascertain them through straightforward observation.

여기서 "원칙적으로" 관찰 가능한 것은 이러한 [모든 상황이 본질적으로 관찰 가능한 상태]라는 것을 의미합니다. 이는 실제로 항상 존재하거나 관찰에 의해 항상 입증되어야 한다는 것을 의미하지는 않습니다. 즉, 직접 관찰할 수 있든(예: 외향) 나의 시야에서 보이지 않든(예: 자기 임계성), 그러한 현상은 본질적으로 다른 사람에게 정밀히 조사될 수 있는 현상이다.
Observable “in principle” here is intended to mean that all of these states of affairs are inherently observable ones. It does not mean that they always are in fact or always must be established by observation. It does mean that, whether directly observable (e.g., extraversion) or hidden from view (e.g., self-criticalness), they are phenomena that are, or that by their nature can be rendered available for the scrutiny of others.


이와 관련하여, [성격에 대한 이번 연구의 개념]은, [그 자체로는 관찰할 수 없는 것(기저의 인과 메커니즘이나 구조)이면서, 오로지 추론을 통해서만 확립될 수 있는 무언가]에 비해서 더 선호된다. 게다가 이러한 점에서 추리공제의 종점은 다소 수수께끼처럼 보인다. 명백한 동작을 일으키는 기본 메커니즘이나 구조를 찾고 있다면 정확히 무엇을 찾아야 합니까? 그런 메커니즘은 어떻게 생겼을까요? 내가 그걸 찾으면 어떻게 알아? 이 질문들에 대한 답은 명확하지 않고, 내가 아는 지식에 대한 답변은 그러한 실체를 주장하는 사람들에 의해 만족스럽게 답한 적이 없다.

In this regard, the present conception of personality is scientifically preferable to definitions that render personality something that is itself unobservable (e.g., underlying causal mechanisms or structures) and could only be established by inference. Further, on such accounts, the end point of the inferential deduction would seem to be something rather mysterious. If I am searching for an underlying mechanism or structure that causes overt behavior, what exactly am I looking for? What would such a mechanism look like? How would I know it if I found it? The answers to these questions are far from clear and to my knowledge have never been answered satisfactorily by those positing such entities.

5. 결론
5. Conclusion

이 기사의 첫머리에서, 나는 나탈리 앤지에의 진술을 인용했다. "어떤 것들은 결코 당연하게 여겨져서는 안 된다. 그 중에서도 당신의 훈련의 핵심에 있는 단어들의 정확한 의미이다." 이 기사는 이 분야의 핵심 단어인 "개성"이 합의에 도달하는 어떤 것을 성취하는 방식으로 지금까지 설명되지 않은 성격 심리학의 오랜 상황을 다루었다. 현재 빅5 및 성격에 대한 다른 특성 접근과 잘 조화를 이루며 그들에게 개념적인 기초가 될 수 있는 이 공식은 이 상황을 개선하는 데 도움이 되기를 바랍니다.

At the outset of this article, I quoted Natalie Angier's statement that, “Certain things should never be taken for granted, among them … the precise meaning of words that are at the heart of your discipline” (2009, p. D1). This article has addressed the longstanding situation in personality psychology that the very word at the heart of the discipline, “personality”, has not to date been explicated in a way that has achieved anything approaching a consensus. Hopefully, the formulation presented here, one that coordinates well with current Big 5 and other trait approaches to personality, and which might serve as a conceptual underpinning for them, will prove helpful in ameliorating this situation.

 


Abstract

This article addresses the longstanding problem that the field of personality psychology remains in need of a consensus formulation of its core subject matter, that of the nature of “personality” itself. Part 1 of the article presents some reminders about the traditional pre-empirical status of concepts in science. Part 2 introduces and calls into question two widely accepted but nonetheless questionable propositions about the nature of personality: (a) that the term refers to an underlying causal entity within a person, and (b) that the study of personality is the study of the whole person. Part 3 presents a definition of “personality”, discussion elaborating and clarifying this definition, and an explication of the ways in which it differs from previous definitions. Part 4 discusses some benefits that accrue both to having a consensus definition in general, and to acceptance of the present definition in particular.

학습 대 수행: 통합적 문헌고찰 (Perspectives on Psychological Science, 2015)
Learning Versus Performance: An Integrative Review
Nicholas C. Soderstrom and Robert A. Bjork

 

 

강의실에서든 현장에서든 교육의 주요 목표는 학습자에게 내구성과 유연성을 모두 갖춘 지식 또는 기술을 갖추게 하는 것입니다. 우리는 지식과 기술이 사용하지 않는 기간 동안에도 계속 사용할 수 있고, 단순히 교육 중에 경험하는 것과 일치하는 컨텍스트에서뿐만 아니라 관련성이 있는 다양한 컨텍스트에서 접근할 수 있다는 점에서 유연하기를 원합니다. 즉, 교육은 [학습]을 촉진하기 위해 노력해야 하며, 이는 [장기적인 유지와 전이를 지원하는 행동이나 지식의 비교적 영구적인 변화]를 의미한다. 그러나 역설적으로 이러한 학습은 획득 과정 중 또는 직후에 관찰되고 측정될 수 있는 행동 또는 지식의 일시적인 변동을 의미하는 [수행]와 구별되어야 한다.

Whether in the classroom or on the field, the major goal of instruction is, or at least should be, to equip learners with knowledge or skills that are both durable and flexible. We want knowledge and skills to be durable in the sense of remaining accessible across periods of disuse and to be flexible in the sense of being accessible in the various contexts in which they are relevant, not simply in contexts that match those experienced during instruction. In other words, instruction should endeavor to facilitate learning, which refers to the relatively permanent changes in behavior or knowledge that support long-term retention and transfer. Paradoxically, however, such learning needs to be distinguished from performance, which refers to the temporary fluctuations in behavior or knowledge that can be observed and measured during or immediately after the acquisition process.

학습과 수행의 구별은 중요한데, 이는 현재 상당한 학습이 수행이 향상되지 않은 상태에서 발생할 수 있고, 반대로 수행의 상당한 변화가 종종 해당 학습의 변화로 변환되지 않는다는 것을 보여주는 압도적 경험적 증거가 존재하기 때문이다. 아마도 훨씬 더 설득력 있는, 특정 실험 조작은 학습과 성과에 반대 효과를 주는 것으로 보여져, 획득 중에 가장 많은 오류를 생성하는 조건이 종종 가장 많은 학습을 생성하는 바로 그 조건이다. 그러한 결과는 사람들이 자신의 학습에 대해 판단을 내리도록 요구받거나 연구원, 교육자, 학생들과의 비공식 대화 중에 정기적으로 불신에 직면한다. 그러나 실제와 이론적 관점 모두에서 흥미롭고 중요한 것은 학습과 수행의 구별에 대한 [반직관적인 특성]입니다.
The distinction between learning and performance is crucial because there now exists overwhelming empirical evidence showing that considerable learning can occur in the absence of any performance gains and, conversely, that substantial changes in performance often fail to translate into corresponding changes in learning. Perhaps even more compelling, certain experimental manipulations have been shown to confer opposite effects on learning and performance, such that the conditions that produce the most errors during acquisition are often the very conditions that produce the most learning. Such results are regularly met with incredulity, whether in the context of metacognitive research in which people are asked to make judgments about their own learning or during informal conversations with researchers, educators, and students. It is, however, the counterintuitive nature of the learning–performance distinction that makes it so interesting and important from both practical and theoretical perspectives.

우리는 [장기 보존 또는 이전으로 측정되는 학습]과 [획득 중 측정되는 성과] 사이의 중요한 차이와 관련된 증거에 대한 첫 번째 통합 검토를 제공한다. 우리는 메타인지 관련 작업과 함께 운동 및 언어 학습 영역의 연구를 통합하려고 시도한다. 그러나 다른 많은 기사에서 학습과 성능의 차이를 소개하고 그 차이를 설명하는 주요 결과를 요약하고 있습니다. 또한, 우리(Soderstrom & Bjork, 2013)는 매년 갱신될 예정인 주석 첨부 참고 문헌 목록을 발행하여 연구자, 교육자 및 기타 연구자들이 주제와 관련된 최신 연구에 보조를 맞출 수 있도록 하고 있습니다.

We provide the first integrative review of the evidence that bears on the critical distinction between learning, as measured by long-term retention or transfer, and performance, as measured during acquisition. We attempt to synthesize research from both the motor- and verbal-learning domains, as well as relevant work in metacognition. We note, however, that a number of other articles provide an introduction to the learning versus performance distinction and summarize key findings that illustrate the distinction (e.g., R. A. Bjork, 1999; Christina & Bjork, 1991; Jacoby, Bjork, & Kelley, 1994; Kantak & Winstein, 2012; Lee, 2012; Lee & Genovese, 1988; Schmidt & Bjork, 1992; Schmidt & Lee, 2011; Wulf & Shea, 2002). As well, we (Soderstrom & Bjork, 2013) have published an annotated bibliography that is slated to be updated annually so as to keep researchers, educators, and others abreast of the newest research relevant to the topic.

 

기초 연구
Foundational Studies

수십 년 전에 수행된 연구는 [수행에 변화가 없으면서도 상당한 학습이 발생할 수 있다는 것]을 보여줌으로써 학습과 성과 사이의 구별을 필요로 했다. 예를 들어, 쥐의 미로 학습은 그들의 행동이 목적이 없는 것처럼 보이는 자유 탐험 기간을 허용함으로써 향상될 수 있다(즉, 성과가 불규칙하다). 수행이 점근선("오버러닝")에 도달한 후 제공되는 추가 연습 시험 결과 망각 속도가 느려지고 재학습 속도가 빨라졌다. 그리고 피로가 앞으로 해야 할 운동 작업의 수행을 방해할 때, 학습은 여전히 진행될 수 있습니다. 이 섹션에서는 이러한 기초 연구를 검토합니다.
Studies conducted decades ago necessitated the distinction between learning and performance by showing that considerable learning could occur in the absence of changes in performance. For example, rats’ learning of a maze could be enhanced by permitting a period of free exploration in which their behavior seemed aimless (i.e., performance was irregular); additional practice trials provided after performance was at asymptote (“overlearning”) resulted in slowed forgetting and more rapid relearning; and when fatigue stalled performance of to-be-learned motor tasks, learning could still transpire. This section reviews these foundational studies.

잠복 학습
Latent learning

[잠복 학습]은 [명백한 강화나 눈에 띄는 행동 변화 없이 발생하는 학습]으로 정의된다. 학습은 '잠재적' 또는 '숨김'이라고 하는데, 그 이유는 그것을 드러내기 위해 어떤 종류의 강화가 도입되지 않는 한 전시되지 않기 때문이다. 예를 들어, 최근 새로운 도시로 이사한 사람이 운전에 대해 우려하여 매일 시내버스를 타고 출근한다고 가정해 보자. 매일 버스를 타고 다니면서, 그 경로는 관찰을 통해 학습될 것이지만, 그러한 학습은 그러한 동기가 필요한 경우에만(예를 들어, 그 사람이 스스로 운전해서 일할 필요가 있을 때) 명확해질 것이다. 잠복 학습의 초기 발견은 흥미롭고 논란이 많았는데, 이는 학습이 강화가 있을 때만 일어날 수 있다는 널리 알려진 가정에 도전했기 때문이다. 초기 잠복학습 연구의 고전적인 리뷰를 위해, 우리는 "인지적 지도cognitive map"의 개념이 도입된 톨만(1948년)을 추천한다. 이 용어는 [자신의 공간 환경의 정신적 표현]을 가리킨다.

Latent learning is defined as learning that occurs in the absence of any obvious reinforcement or noticeable behavioral changes. Learning is said to be “latent,” or hidden, because it is not exhibited unless a reinforcement of some kind is introduced to reveal it. Consider, for example, a person who recently moved to a new city and, apprehensive about driving, decides to ride the city bus each day to work. Riding the bus day after day, the route would be learned through observation, but such learning would only be evident if an incentive was present that required it—say, when it was necessary for the person to drive to work on his or her own. The early findings of latent learning were intriguing and controversial because they challenged the widely held assumption that learning could occur only in the presence of reinforcement. For a classic review of the early latent learning studies, we recommend Tolman (1948), in which the concept of “cognitive maps” was introduced, a term that refers to the mental representation of one’s spatial environment.

Blodgett(1929년), Tolman(1930년)과 Honzik(1930년)에 의해 처음 입증되었지만, 그 결과는 학습과 기억력에 관한 대부분의 교과서에 보고되어 있는 잠복 학습에 대한 고전적인 실험으로 여겨지고 있다. 본질적으로 Blodgett의 복제인 그들의 실험에서, 세 그룹의 쥐들은 총 17일 동안 매일 복잡한 T-maze에 놓였습니다. 한 그룹의 쥐는 골 박스에 도달하기 위해 강화되지 않았습니다.골 박스에 도달할 때마다 다른 그룹은 음식으로 강화되었습니다. 세 번째 그룹은 11일째까지 골대에 도달한 것에 대해 보상을 받지 못했으며, 그 후 정기적으로 보상을 받았다. 이 실험의 결과는 그림 1과 같다. 당연하게도 17일 동안 골박스 찾기에서 오류가 가장 적은 그룹은 정규 강화 그룹이었고, 강화되지 않은 그룹은 오류가 가장 많았다. 잠재 학습의 개념과 일관되게, 지연 강화 그룹은 즉각적인 개선이 발생한 11일째(식품이 도입된 날)까지 단 한 번도 강화하지 않은 그룹과 동일한 오류 수를 보였으며, 오류율은 정규 강화 그룹과 비슷한 수준으로 떨어졌다. 따라서, 보강을 늦추는 것은 쥐들이 실제로 보강이 이루어지지 않은 상태에서 미로를 배운다는 것을 드러냈고 그들의 행동은 오히려 목적 없는 것처럼 보였다. 수행은 정체된 상태로 학습이 이뤄졌다는 얘기다.
Although first demonstrated by Blodgett (1929), Tolman and Honzik (1930) are credited for providing what is now considered the classic experiment on latent learning, the results of which are reported in most textbooks on learning and memory. In their experiment, which is essentially a replication of Blodgett’s, three groups of rats were placed in a complex T-maze every day for a total of 17 days. One group of rats was never reinforced for reaching the goal box—they were simply taken out of the maze when they found it—whereas another group was reinforced with food every time the goal box was reached. A third group was not rewarded for reaching the goal box until Day 11, after which time they were regularly rewarded. The results of this experiment are presented in Figure 1. Unsurprisingly, the group that made the fewest errors in finding the goal box over the 17-day period was the regularly reinforced group, and the group that was never reinforced made the most errors. Consistent with the notion of latent learning, the delayed-reinforcement group showed the same number of errors as the never-reinforced group until Day 11—the day the food was introduced—when an immediate improvement occurred, dropping their error rate to a level comparable to that of the regularly reinforced group. Thus, delaying reinforcement revealed that the rats did, indeed, learn the maze while no reinforcement was provided and their behavior seemed rather aimless. In other words, learning occurred when performance was stagnant.

 

Blodgett(1929)와 Tolman and Honzik(1930)의 연구는 쥐의 잠복학습에 대한 수많은 후속 실험을 촉진하여 이 현상에 대한 우리의 이해를 더욱 향상시켰다. 예를 들어, Seward(1949)는 잠복학습이 30분간의 자유탐험 후에 일어날 수 있으며, 나아가 강화 없이 미로에서 보내는 시간(따라서 성능의 변화가 식별되지 않는 시간)이 미로 학습과 긍정적인 관련이 있음을 보여주었다(Bendig, 1952; 레이놀즈, 1945 참조).
The studies by Blodgett (1929) and Tolman and Honzik (1930) spurred numerous follow-up experiments on latent learning in rats, further refining our understanding of this phenomenon (see Buxton, 1940; Spence & Lippitt, 1946). Seward (1949), for example, showed that latent learning could occur after just 30 min of free exploration and, furthermore, that the amount of time spent in the maze with no reinforcement—and thus during a time when no changes in performance were discernible—was positively related to learning the maze (see also Bendig, 1952; Reynolds, 1945).

잠복학습이 쥐에게만 국한된 것이 아니라는 것도 수십 년 전에 분명해졌다. 그들의 영향력 있는 연구에서, Postman and Tuma(1954)와 Stevenson(1954)은 잠복 학습이 인간에서도 경험적으로 입증될 수 있다는 것을 보여주었다. Stevenson의 실험에서, 3살 정도의 어린 아이들은 상자를 열 수 있는 열쇠를 찾기 위해 일련의 물체를 탐험했습니다. 중요한 것은 탐색된 환경에는 키 이외의 오브젝트 또는 태스크와 무관한 오브젝트도 포함되어 있다는 것입니다. 문제는 핵심 관련 물체를 탐색하는 동안 아이들이 이러한 주변 물체의 위치를 학습할 것인지 여부였다. 즉, 아이들이 잠재 학습을 보일 것인지 여부였다. 실제로 아이들에게 중요하지 않은 물건을 찾으라고 했을 때, 아이들은 그 물건들이 탐색된 환경에 있을 때 상대적으로 더 빨리 찾을 수 있었습니다. 스티븐슨은 또한 아이들에게서 관찰된 잠복 학습의 양이 나이가 들수록 증가한다는 것을 발견했다. 
It was also made clear decades ago that latent learning is not limited to rats. In their influential studies, Postman and Tuma (1954) and Stevenson (1954) showed that latent learning is also empirically demonstrable in humans. In Stevenson’s experiment, children—some as young as 3 years old—explored a series of objects to find a key that would open a box. Critically, the explored environment also contained nonkey objects, or those that were irrelevant to the task. The question was whether the children would learn the locations of these peripheral objects during the exploration of the key-relevant objects—that is, whether the children would show latent learning. Indeed, when the children were asked to find the irrelevant, nonkey objects, they were relatively faster in doing so when those objects had been contained in the explored environment. Stevenson also found that the amount of latent learning observed in the children increased with age.

과잉학습과 피로
Overlearning and fatigue

이미 연주할 수 있음에도 불구하고 계속 연습하는 바이올리니스트, 즉 획득한 퍼포먼스가 이미 점근점에 도달한 바이올리니스트를 생각해 보십시오. 작업에 대한 숙달 기준이 달성된 후에도 작업에 대한 이러한 지속적인 연습은 "[오버러닝]"이라고 하며, 포스트마스터리 시행 횟수를 숙달에 필요한 시행 횟수로 나눈 것으로 나타낼 수 있습니다. 예를 들어 바이올리니스트가 한 곡을 마스터하기 위해 10번의 연습시험이 필요한 후에 추가로 5번 연습했다면, 오버러닝의 정도는 50%가 될 것이다. 난센스 음절을 사용한 에빙하우스(1885/1964)의 유명한 연구로 시작된 과잉학습의 많은 초기 연구는 정보와 기술의 장기적 학습을 향상시키는 방법으로서 과잉학습의 힘을 증명했다. Fitts(1965)는 이러한 발견을 언급하며, "일부... 기준에 도달한 시점을 넘어서까지의 지속적인 연습의 중요성은 아무리 강조해도 지나치지 않다"고 말했다(p.195).

Consider a violinist who continues to practice a musical piece despite already being able to perform it—that is, after acquisition performance is already at asymptote. Such continued practice on a task after some criterion of mastery on that task has been achieved is referred to as “overlearning” and can be expressed by the number of postmastery trials divided by the number of trials needed to reach mastery. For example, if the violinist practiced a piece 5 additional times after needing 10 practice trials to master it, then the degree of overlearning would be 50%. Many early studies of overlearning—starting with Ebbinghaus’s (1885/1964) famous study using nonsense syllables—demonstrated the power of overlearning as a method for enhancing the long-term learning of information and skills. Referencing these findings, Fitts (1965) stated, “The importance of continuing practice beyond the point in time where some . . . criterion is reached cannot be overemphasized” (p. 195).

크루거(1929)는 오버러닝에 대해 가장 많이 인용된 연구를 수행했다. 그의 중요한 실험에서, 두 그룹의 참가자들은 모든 단어를 기억할 수 있을 때까지 반복적으로 단어 목록을 연구했다. 이 시점에서, 대조군은 연구 단계를 끝낸 반면, 오버러닝 그룹의 참가자들은 자료를 계속 연구했습니다. 사실, 그들은 자료를 100% 더 많이 학습했습니다. 즉, 대조군보다 두 배 더 많은 연구 실험에 노출되었습니다. 최대 28일 후에 수행된 보존 테스트에서, 오버러닝 그룹의 참가자들은 연구 단계에서 자료를 습득했지만 오버러닝하지 않은 대조 그룹의 참가자보다 더 많은 항목을 리콜했습니다. 또한 과잉학습의 정도에 따라 보유율이 증가하였다. 후속 연구에 따르면, 오버러닝(과잉학습)은 산문 구절과 같은 보다 복잡한 구두 자료를 유지하는 데 도움이 되며, 재학습relearning 속도, 즉 다소 지연된 후 해당 자료를 다시 학습하는 데 필요한 시간을 단축하는 것으로 나타났습니다.
Krueger (1929) carried out the most frequently cited study on overlearning. In his seminal experiment, two groups of participants repeatedly studied lists of words until all of the words could be recalled. At that point, the control group was finished with the study phase, whereas participants in the overlearning group continued studying the material—in fact, they overlearned the material by 100%, meaning that they were exposed to twice as many study trials as the control group. On a retention test administered up to 28 days later, the participants in the overlearning group recalled more items than participants in the control group, who had mastered the material during the study phase but had not overlearned it. Additionally, retention increased as a function of the degree of overlearning. Subsequent research showed that overlearning aids in the retention of more complex verbal materials, such as prose passages, and accelerates the rate of relearning—that is, the amount of time required to learn the material again after some delay (e.g., Gilbert, 1957; Postman, 1962; see also Ebbinghaus, 1885/1964).

오버러닝(과잉학습)은 또한 운동 기술을 배우는 데 도움이 된다. 크루거(1929)가 단어에 대한 과도한 학습을 보여준 다음 해, 그는(크루거, 1930) 미로 추적 작업에 대해 비슷한 이점을 보였다. 참가자들은 처음에 100% 정확도에 도달할 때까지 과제를 수행했고, 그 후 50%, 100% 또는 200% 더 많이 학습했습니다. 언어 자료와 마찬가지로, 과잉 학습의 양은 장기 보존과 긍정적으로 관련되었습니다. 이후 작업은 M60 기관총의 조립 및 분해(Schendel & Hagman, 1982)를 포함하여 단순하고 복잡한 운동 기술에 대한 오버러닝의 이점을 재현했다(예: Chasey & Knowles, 1973; Melnick, 1971; Melnick, Lersten, Lockhart, 1972). 오버러닝은 다양한 업무에 효과적인 학습 도구인 것 같습니다.

Overlearning also benefits the learning of motor skills. The year after Krueger (1929) demonstrated overlearning for words, he (Krueger, 1930) showed similar benefits for a maze-tracing task. Participants first performed the task until they reached 100% accuracy, after which they overlearned it by 50%, 100%, or 200%. As with the verbal materials, the amount of overlearning was positively related to long-term retention. Later work replicated the benefits of overlearning for simple and more complex motor skills (e.g., Chasey & Knowles, 1973; Melnick, 1971; Melnick, Lersten, & Lockhart, 1972), including the assembly and disassembly of an M60 machine gun (Schendel & Hagman, 1982). Overlearning seems to be an effective learning tool for a wide range of tasks (for a meta-analytic review, see Driskell, Willis, & Cooper, 1992).


과잉학습에 대한 연구와 유사하게, 피로에 대한 초기 연구는 피로가 획득 중에 성능의 추가적인 향상을 방해한 후에도 학습이 발생할 수 있음을 시사했다. 예를 들어 애덤스와 레이놀즈(1954년)는 공군 기초 훈련병들에게 회전바퀴에 달린 목표물을 지팡이로 수동으로 추적해야 하는 회전 추격 임무를 배우게 했다. 시험 사이의 휴식 간격을 바꾸면 피로가 성능 향상을 제한하거나 제거했을 때, 피로가 사라진 후 과제에 대한 후속 테스트에서 드러났듯이 그럼에도 불구하고 학습이 발생하는 것으로 나타났다. 15년 후, Stelmach(1969)는 다양한 훈련 일정이 사다리 오르기 과제의 학습과 수행에 어떻게 영향을 미치는지 조사했다. 한 그룹의 참가자들은 그들이 쉬었던 것보다 더 많이 연습했고, 다른 그룹은 그들이 연습한 것보다 더 많이 쉬었습니다. 훈련 중 성과는 주어진 시험에서 상승한 단의 수로 정의되며, 더 많은 보간 휴식이 허용된 그룹에 유리했다. 다른 그룹은 시험 사이에 휴식을 거의 받지 못했기 때문에 훈련 중에 점점 더 피곤해진다는 것을 고려하면 이 결과는 놀라운 일이 아니다. 그러나 지연된 후, 유지 테스트에서 휴식을 거의 받지 못한 그룹이 잘 쉬었던 그룹을 따라잡은 것으로 밝혀졌는데, 표면적으로는 피로가 단기 성과에서 이득을 억제했을 때, 상당한 학습이 일어났다는 것을 증명했다.

Similar to research on overlearning, early work on fatigue suggested that learning could occur even after fatigue prevented any further gains in performance during acquisition. Adams and Reynolds (1954), for example, had basic trainees from the Air Force learn a rotary pursuit task, which requires one to manually track a target on a revolving wheel with a wand. Varying the length of rest intervals between trials showed that when fatigue limited or eliminated gains in performance, learning nonetheless occurred, as revealed by a subsequent test on the task after the fatigue had dissipated. Fifteen years later, Stelmach (1969) examined how different training schedules affect learning and performance on a ladder-climbing task. One group of participants practiced more than they rested; another group rested more than they practiced. Performance during training, which was defined as the number of rungs climbed on a given trial, favored the group that was permitted more interpolated rest. This finding is not surprising given that the other group, as a result of receiving little rest between trials, became increasingly fatigued during the training. After a delay, however, a retention test revealed that the group that received little rest caught up to the well-rested group, ostensibly demonstrating that substantial learning had occurred when fatigue had stifled any gains in short-term performance.

대응하는 개념상의 차이
Corresponding conceptual distinctions

잠재 학습, 과잉 학습, 피로 및 기타 고려사항에 대한 초기 실험은 훈련 또는 획득 중 관찰할 수 있는 행동(즉, 성과)을 구별하기 위해 초기 학습 이론가(예: Estes, 1955a; Guthrie, 1952; Hull, 1943; Skinner, 1938; Tolman, 1932)를 주도했고 상대적으로 영구적인 변화를 가져왔다. 향후 그러한 행동을 나타낼 수 있는 능력(즉, 학습)에서 발생한다.

  • 헐은 반응의 습관 강도와 반응의 순간적인 반응 잠재력이라는 용어를 사용했고,
  • 에스테스는 그의 변동 모델에서 습관 강도와 반응 강도를 언급했고,
  • 스키너는 반사 예비력과 반사 강도를 구별했다.

경험적으로, 습관 강도 또는 반사 예비력(즉, 학습)은 소멸 또는 망각에 대한 저항성 또는 재학습 속도에 의해 지수화되는 것으로 가정한 반면, 순간 반응 잠재력, 반응 강도 또는 반사 강도(즉, 성과)는 반응의 현재 확률, 속도 또는 대기 시간에 의해 지수화되는 것으로 가정했다.
The early experiments on latent learning, overlearning, and fatigue, plus other considerations, led early learning theorists (e.g., Estes, 1955a; Guthrie, 1952; Hull, 1943; Skinner, 1938; Tolman, 1932) to distinguish between behaviors that can be observed during training, or acquisition (i.e., performance), and the relatively permanent changes that occur in the capability for exhibiting those behaviors in the future (i.e., learning).

> Hull used the terms habit strength of a response and the momentary reaction potential of that response;
> Estes, in his fluctuation model, referred to habit strength and response strength; and
> Skinner differentiated between reflex reserve and reflex strength.

Empirically, habit strength, or reflex reserve (i.e., learning), was assumed to be indexed by resistance to extinction or forgetting, or by the rapidity of relearning, whereas momentary reaction potential, response strength, or reflex strength (i.e., performance) was assumed to be indexed by the current probability, rate, or latency of a response.


인간의 언어 학습 분야에서, Tulving과 Pearlstone의 구분(1966)은 각각 "이용 가능성"(즉, 메모리에 저장된 것)과 "접근가능성"(즉, 주어진 시간에 검색 가능한 것)을 학습과 성과에 완벽하게 매핑한다. 마지막으로, R. A. Bjork와 Bjork(1992)는 인간의 언어 및 운동 학습에 대한 연구의 광범위한 발견을 설명하기 위해 학습과 수행의 구별이 각각 저장 강도와 검색 강도에 의해 색인화되는 새로운 학습 이론을 공식화했다. 이 설명과 학습-성과 구별에 관한 다른 현대의 이론적 관점은 나중에 논의한다.

In the domain of human verbal learning, Tulving and Pearlstone’s (1966) distinction between “availability” (i.e., what is stored in memory) and “accessibility” (i.e., what is retrievable at any given time) also maps, albeit not perfectly, onto learning and performance, respectively. Finally, R. A. Bjork and Bjork (1992), in an effort to account for a wide range of findings in research on human verbal and motor learning, formulated a new theory of learning in which the distinction between learning and performance is indexed by storage strength and retrieval strength, respectively. This account, as well as other contemporary theoretical perspectives regarding the learning–performance distinction, is discussed later.

 

요약
Summary

학습 대 수행의 차이는 잠재 학습, 과잉 학습 및 피로를 연구한 연구자들이 [실제로 학습이 이루어지고 있다는 징후가 없는 상태에서도 훈련 또는 수행의 습득 중에 장기간 학습이 발생할 수 있다는 것을 증명]한 수십 년 전으로 거슬러 올라갈 수 있다. 특히 잠복학습의 결과는 당시 설득력 있고 논란이 많았는데, 이는 학습을 드러내기 위해서는 강화가 필요하지만 학습을 유도할 필요는 없다는 것을 입증했기 때문이다. 요약하자면, 이 초기 작업은 [수행 없는 학습]을 보여주었다. 다음 몇 절에서는 그 반대가 사실임을 보여주는 보다 최근의 증거를 검토한다. 특히, 성능의 향상은 더 많은 성능 오류를 유발하는 조건에 비해 종종 사후 훈련 학습을 방해한다.

The learning versus performance distinction can be traced back decades when researchers of latent learning, overlearning, and fatigue demonstrated that long-lasting learning could occur while training or acquisition performance provided no indication that learning was actually taking place. The results of latent learning studies, in particular, were both compelling and controversial at the time because they verified that, although reinforcement is necessary to reveal learning, it is not required to induce learning. In sum, this early work showed learning without performance. In the next several sections, we review more recent evidence showing that the converse is also true—specifically, that gains in performance often impede posttraining learning compared with those conditions that induce more performance errors.

 

프랙티스의 분산
Distribution of Practice

학습과 수행의 상관관계는 학습해야 할 기술이나 정보의 학습일정을 조작함으로써 반복적으로 발견되어 왔다. 연습 또는 스터디 세션을 몰아치기(즉, 같은 것을 반복해서 연습하거나 공부하는 것)하는 것은 일반적으로 단기 성과에 도움이 되는 반면, 연습 또는 스터디 세션을 시간 또는 다른 활동과 분리하는 것은 일반적으로 장기적인 학습을 촉진합니다. 이 절에서는 실습의 분포가 학습과 성과에 다른 영향을 미치는 것으로 나타난 운동 및 구두 학습 영역의 실험을 차례로 제시한다.
The dissociation between learning and performance has been repeatedly found by manipulating the study schedules of to-be-learned skills or information. Massing practice or study sessions—that is, practicing or studying the same thing over and over again—usually benefits short-term performance, whereas distributing practice or study—that is, separating practice or study sessions with time or other activities—usually facilitates long-term learning. This section presents, in turn, experiments from the motor- and verbal-learning domains in which the distribution of practice was shown to have differential influences on learning and performance.

 

운동 학습
Motor learning

수영하는 사람이 앞, 뒤, 접영을 개선하려고 한다고 가정합니다. 수영 선수의 훈련이 하루에 1시간으로 제한된다고 가정해 보자. 한 가지 훈련 옵션은 다른 스트로크를 20분씩 연습한 후 다음 훈련 세션에서 이전에 연습한 스트로크로 돌아가지 않고 매스(또는 차단)하는 것입니다. 또는 각 스트로크가 다음 스트로크로 넘어가기 전에 10분 동안 연습하도록 연습 일정을 분배(또는 무작위화)할 수 있습니다. 이 일정에 따라 훈련 세션 동안 각 스트로크를 한 번 더 재방문할 수 있습니다. 이 섹션에서는 매스 연습이 훈련 중 빠른 성과 향상을 촉진할 수 있지만, 연습을 분산하면 해당 기술을 장기간 유지할 수 있음을 시사하는 연구를 검토한다.

Suppose a swimmer wishes to improve his or her front, back, and butterfly strokes. Suppose further that the swimmer’s training is restricted to 1 hr per day. One training option would be to mass (or block) the different strokes by practicing each for 20 min before moving on to the next, never returning to the previously practiced strokes during that training session. Alternatively, he or she might distribute (or randomize) the practice schedule such that each stroke is practiced for 10 min before moving on to the next stroke. This schedule would permit each stroke to be revisited one more time during the training session. In this section, we review research that suggests that, whereas massing practice might promote rapid performance gains during training, distributing practice facilitates long-term retention of that skill.

배들리와 롱맨(1978년)과 J.B. Shea와 Morgan(1979)은 연습을 분배하는 것이 단순한 운동 기술의 학습과 수행에 차별적인 영향을 미친다는 것을 보여주는 두 가지 고전 연구를 발표했다. 영국 우체국의 의뢰를 받아, Baddelley와 Longman은 새로 도입된 우편 번호를 키보드에 입력하는 우체국 직원들의 능력을 최적화하는 방법을 조사했다. 문제는 우체국 직원들이 하루 몇 시간씩 연습하면서 가능한 한 빨리 새로운 시스템을 배워야 하는지, 아니면 연습이 더 많이 보급되면 학습이 가장 이득이 될 것인가 하는 것이었다. 매일 연습량과 연습이 발생한 일수를 변화시키면서, 더 분산된 연습은 타자기의 키 입력의 보다 효과적인 학습을 촉진했다. 그러나, 기준에 도달하는 일수 대 시간 수로 측정되는 기술 습득의 효율성에 관해서는 그 반대였다.기준에 도달하기 위해서: 즉, 분산 그룹은 매스 그룹에 대해 특정 수준의 퍼포먼스에 도달하기 위해 더 많은 일수가 필요했습니다. 요약하면, 몰아치기massed 연습은 키 입력의 신속한 습득을 지원했지만, 분산 연습은 기술의 장기 보유를 향상시켰다(Simon & Bjork, 2001 참조). 

Baddeley and Longman (1978) and J. B. Shea and Morgan (1979) published two classic studies that showed that distributing practice has differential effects on learning and performance of a simple motor skill. Commissioned by the British Postal Service, Baddeley and Longman investigated how to optimize postal workers’ ability to type newly introduced postcodes on the keyboard. The question was whether the postal workers should learn the new system as rapidly as possible, practicing several hours per day, or whether learning would profit most if practice was more distributed. Varying the amount of practice per day and the number of days in which practice occurred, more distributed practice fostered more effective learning of the typewriter keystrokes; however, the opposite was true in regard to the efficiency in which the skill was acquired, as measured by the number of days to reach criterion versus the number of hours to reach criterion—that is, the distributed group required more days to reach any given level of performance relative to the massed group. In sum, massed practice supported quicker acquisition of the keystrokes, but distributed practice led to better long-term retention of the skill (see also Simon & Bjork, 2001).

J. B. Shea와 Morgan(1979)은 또한 운동 기술을 장기간 유지하는 데 도움이 된다는 것을 보여주었다. 그들의 중요한 실험에서, 참가자들은 세 가지 다른 움직임 패턴을 배웠는데, 각각의 움직임에는 정해진 순서에 따라 세 개의 작은 나무 장벽(6개 중 한 개)을 넘어뜨리는 것이 포함되었습니다. 두 가지 다른 연습 일정, 즉 차단과 랜덤이 구현되었습니다. 블록 프랙티스 조건에서는 3가지 동작 패턴 각각이 18회 연속적으로 연습된 반면 랜덤 프랙티스 조건에서는 참가자의 입장에서 예측할 수 없는 방식으로 각 패턴의 18회 동작이 다른 패턴에 대한 시험 사이에 혼재되었다. 따라서 중요한 것은 세 가지 작업에 대한 연습 시간이 두 가지 다른 연습 조건에 걸쳐 동일하다는 것이다. 관심사는 서로 다른 연습 일정이 팔 움직임이 실행되는 속도에 어떻게 영향을 주느냐였다. 

J. B. Shea and Morgan (1979) also showed that distributing practice benefits the long-term retention of a motor skill. In their seminal experiment, participants learned three different movement patterns, each of which involved knocking over three (of six) small wooden barriers in a prescribed order. Two different practice schedules were implemented: blocked and random. In the blocked-practice condition, each of the three movement patterns was practiced for 18 trials in succession, whereas in the random-practice condition, the 18 trials of each pattern were intermingled among the trials on the other patterns in a way that was unpredictable from a participant’s standpoint. Importantly, therefore, practice time for the three tasks was equated across the two different practice conditions. Of interest was how the different practice schedules affected the rapidity in which the arm movements were executed.

J.B.의 결과. Shea와 Morgan(1979)은 그림 2에 나와 있다. 첫째, 획득 중에 팔 움직임을 수행하는 데 필요한 짧은 시간에서 알 수 있듯이, 차단된 연습 조건에 할당된 참가자가 무작위 연습 조건의 참가자들보다 더 나은 성과를 보였다. 하지만 각 그룹이 습득한 기술을 얼마나 잘 유지할 수 있을까요? 10분 및 10일 후에 실시되는 유지 테스트에서는 참가자는 블록(B) 또는 랜덤(R) 방식으로 각 스킬에 대해 테스트를 실시하여 참가자의 4개의 서브그룹(B-B, B-R, R-B 및 R-R)을 생성했습니다. 쌍의 첫 번째 문자는 획득 중에 실습이 어떻게 스케줄 되었는지를 나타내며, 두 번째 문자는 각 그룹이 어떻게 테스트되었는지를 나타낸다. 그림 2에서 볼 수 있듯이, 인수 시 차단된 관행의 이점은 지연 후 더 이상 명확하지 않습니다. 실제로 10분 및 10일 후에 학습이 평가될 때 패턴이 역전되었습니다. 즉, 전반적으로 무작위 순서로 기술을 처음 연습한 사람들이 가장 많은 학습을 보였습니다. 블록 방식으로 테스트된 그룹(B-B 대 R-B)을 비교한 결과, 이 연구는 획득 중 [무작위 실행]이 획득 중 [블록식 실행]보다 더 낫다는 것을 보여주었다. 이러한 패턴은 연구자들이 지연된 테스트에서 무작위 순서(B-R 대 R-R)로 테스트된 그룹을 비교했을 때 극적으로 입증되었다. 따라서 Baddeley와 Longman(1978년)과 마찬가지로, Shea와 Morgan은 여러 가지 학습된 이동 패턴의 블록식 관행이 획득 성과를 촉진하는 반면, 동일한 이동 패턴의 인터리빙 관행이 장기 보존을 촉진한다는 것을 보여주었다(이 발견의 복제 및 연장은 Lee & Magill, 1983 참조). 그림 2에는 나타나지 않았지만 Shea와 Morgan은 인터리빙의 전송 이점도 발견했기 때문에 처음에 랜덤 방식으로 스킬을 연습한 참가자들은 새로운 응답 패턴, 즉 연습하지 않은 응답 패턴을 비교적 잘 수행할 수 있었습니다. 

The results of J. B. Shea and Morgan (1979) are shown in Figure 2. First, it is clear that during acquisition, participants assigned to the blocked-practice condition performed better than those in the random-practice condition, as evidenced by shorter times required to perform the arm movements. But how well would each group retain the acquired skills? On retention tests given after 10 min and 10 days, participants were tested on each skill in either a blocked (B) or random (R) fashion, which produced four subgroups of participants: B-B, B-R, R-B, and R-R. The first letter in the pair denotes how practice was scheduled during acquisition; likewise, the second letter denotes how each group was tested. As can be seen in Figure 2, the advantage of blocked practice during acquisition was no longer evident after a delay. In fact, the pattern reversed when learning was assessed after 10 min and 10 days—that is, overall, those who initially practiced the skills in a random order exhibited the most learning. Comparing the groups that were tested in a blocked fashion (B-B vs. R-B), the study showed that random practice during acquisition was better than blocked practice during acquisition. This pattern was dramatically demonstrated when researchers compared the groups that were tested in a random order (B-R vs. R-R) on the delayed test. Thus, similar to Baddeley and Longman (1978), Shea and Morgan showed that blocking practice of several to-be-learned movement patterns facilitated acquisition performance, whereas interleaving practice of those same movements promoted long-term retention (see Lee & Magill, 1983, for a replication and extension of these findings). Although not shown in Figure 2, Shea and Morgan also found a transfer advantage of interleaving, such that participants who initially practiced the skill in a random fashion were relatively better in executing a new response pattern—that is, one that had not been practiced.

J. B. Shea와 Morgan(1979)의 결과는 별도의 학습 과제를 인터리빙하면 장기적인 보존을 강화할 수 있다는 여러 후속 시연과 함께 Battig(1979)가 상황 간섭 효과로 언급한 광범위한 발견의 한 예로 작용한다. 주로 구두 쌍으로 구성된 학습 과제(Battig, 1962, 1972 참조)의 발견에 기초하여, Battig는 습득 중 별도의 학습 과제 간의 가능한 [간섭]을 증가시키는 조건은 습득 프로세스 중 장기 보존과 전이를 향상시킬 수 있다고 제안했다. 예를 들어 테니스에서 포핸드, 백핸드, 서브 스트로크와 같이 학습해야 할 개별 태스크에 무작위로 트라이얼을 혼합하면 스트로크의 구성 요소 간의 간섭이 증가하지만 이러한 기술의 장기 보유를 향상시킬 수 있습니다.

J. B. Shea and Morgan’s (1979) results, together with the multiple subsequent demonstrations that interleaving separate to-be-learned tasks can enhance long-term retention, serve as one example of a broader finding, referred to by Battig (1979) as contextual interference effects. Primarily on the basis of findings from verbal paired-associate learning tasks (see Battig, 1962, 1972), Battig proposed that conditions during acquisition that act to increase the possible interference between separate to-be-learned tasks can enhance long-term retention and transfer, despite their depressing effects on performance during the acquisition process. Randomly intermixing the trials on separate to-be-learned tasks, such as, say, the forehand, backhand, and serve strokes in tennis, increases the interference between the components of those strokes but then can enhance long-term retention of those skills.

J.B.의 결과. Shea와 Morgan(1979)은 많은 후속 연구를 촉진시켰으며, 그 중 다수는 현장 기반이었고 더 복잡한 운동 기술을 조사했다. 그러한 연구에서, 배드민턴 선수들은 차단되거나 무작위로 인터리빙된 연습 일정에 따라 코트 한쪽에서 세 가지 다른 종류의 서브를 배웠다. 유지 간격 후, 선수들은 서브가 연습된 코트의 같은 쪽과 반대쪽에서 서브 테스트를 받았다. 차단된 그룹은 훈련 중에 더 잘 수행했지만, 인터리브 그룹은 코트의 같은 면이든 반대 면이든 상관없이 더 나은 장기 보존을 보였다(S. Goode & Magill, 1986). 따라서 연습을 배포하면 연습한 특정 스킬의 보유가 강화될 뿐만 아니라 그 스킬의 보다 나은 이전(즉, 다른 컨텍스트에서의 스킬 적용)이 촉진됩니다. 분산 연습에 의해 촉진되는 학습 혜택은 또한 야구와 피아노 곡에서 다른 종류의 공을 치는 것을 배우는 것과 어린이와 나이 든 성인 모두에게 증명되었습니다. 단순하고 복잡한 운동 기술에 대한 분산 연습의 영향에 대 한 검토는 Lee(2012)와 Merbah and Meulemans(2011)를 추천한다.

The results of J. B. Shea and Morgan (1979) spurred many follow-up studies, many of which were field based and examined more complex motor skills. In one such study, badminton players learned three different types of serves from one side of the court under blocked or randomly interleaved practice schedules. After a retention interval, the players were tested on the serves from both the same and opposite side of the court from which the serves were practiced. The blocked group performed better during training, but the interleaved group showed better long-term retention, whether tested on the same or opposite side of the court (S. Goode & Magill, 1986). Thus, not only does distributing practice enhance the retention of the specific skill that is practiced, but it also fosters better transfer of that skill—that is, the application of the skill in a different context. The learning benefits promoted by distributed practice have also been demonstrated for learning to hit pitches of different types in baseball (Hall, Domingues, & Cavazos, 1994) and piano pieces (Abushanab & Bishara, 2013) and for both children (e.g., Ste-Marie, Clark, Findlay, & Latimer, 2004) and older adults (e.g., Lin, Wu, Udompholkul, & Knowlton, 2010). For reviews of the effects of distributed practice on motor skills, both simple and complex, we recommend Lee (2012) and Merbah and Meulemans (2011).

 

구두 학습
Verbal learning

운동 영역에서와 같이, 언어 과제의 경험적 증거는 학습 기회를 분산(또는 띄어쓰기)하는 것이 매스하는 것에 비해 학습에 도움이 된다는 것을 시사한다, 언어 문헌에서 발견한 것을 간격두기 효과라고 한다. 간격두기 효과를 최초로 입증한 에빙하우스(1885/1964)는 공간 연구 기회가 질량이 아닌 재료를 망각하기 더 쉽게 만든다는 것을 보여주었다. 수십 년 후, 이 주제에 관한 고전적인 기사가 발표되었습니다(예: Battig, 1966; Madigan, 1969; Melton, 1970). 예를 들어, 현재 검토와 특히 관련이 있으며, 피터슨, 윔플러, 커크패트릭, 솔츠만(1963)은 매스 항목이 종종 단기적으로 더 잘 유지되는 반면(즉, 간격두기가 수행을 손상시킴), 간격이 있는 항목은 장기간에 걸쳐 더 잘 유지된다는 것을 최초로 관찰했다(즉, 간격두기가 학습을 강화시킴). 그 이후 수백 개의 실험에서 간격 효과가 매우 견고하고 신뢰할 수 있음을 입증했다(검토는 Cepeda, Pashler, Vul, Wixted, 2006; Dempster, 1988 참조). 이제 간격 효과의 증거와 이 실험 조작이 학습-성과 구별에 어떤 영향을 미치는지 선택적으로 검토한다. 다음 두 가지 방법으로 간격이 확보되는 상황을 그룹화했습니다. (a) 필요한 정보 또는 절차의 반복 사이에 휴식 또는 관련 없는 활동 기간을 삽입한다. (b) 여러 가지 다른 (아마도 방해될 수 있는) 작업이나 구두 자료의 연구 또는 연습 시험을 인터리브함으로써. 그러나 현재 인터리빙의 이점이 이러한 인터리빙이 도입된 공간의 이점을 넘어서는가 하는 것이 현재 활성 문제이다(예: Birnbaum, Kornell, Bjork, 2013; Kang & Pashler, 2012 참조).

As in the motor domain, empirical evidence from verbal tasks suggests that distributing (or spacing) study opportunities benefits learning relative to massing them, a finding in the verbal literature termed the spacing effect. The first to demonstrate the spacing effect, Ebbinghaus (1885/1964) showed that spacing study opportunities, as opposed to massing them, rendered the material more resistant to forgetting. Decades later, now-classic articles were published on the topic (e.g., Battig, 1966; Madigan, 1969; Melton, 1970). For example, and particularly relevant to the current review, Peterson, Wampler, Kirkpatrick, and Saltzman (1963) were the first to observe that massed items are often retained better in the short term (i.e., spacing impairs performance), whereas spaced items are retained better over the long term (i.e., spacing enhances learning; see also Glenberg, 1977). Since then, hundreds of experiments have demonstrated the spacing effect to be highly robust and reliable (for reviews, see Cepeda, Pashler, Vul, Wixted, & Rohrer, 2006; Dempster, 1988). We now selectively review evidence of the spacing effect and how this experimental manipulation bears on the learning–performance distinction. We note that we have grouped together situations in which spacing is achieved in two different ways: (a) by inserting periods of rest or unrelated activity between repetitions of to-be-learned information or procedures; and (b) by interleaving the study or practice trials of several different—and possibly interfering—to-be-learned tasks or verbal materials. A currently active issue, however, is whether the benefits of interleaving go beyond the benefits of the spacing such interleaving introduces (see, e.g., Birnbaum, Kornell, Bjork, & Bjork, 2013; Kang & Pashler, 2012).

간격두기 효과를 검토하는 대부분의 연구는 단일 단어 또는 짝을 이룬 동료와 같은 비교적 단순한 학습 자료를 사용하여 수행했다. 예를 들어, 한 연구에서 고등학생들은 프랑스어-영어 단어 쌍(예: l'avocat-변호사)을 하루에 30분씩 연속적으로 학습하는 집단 연습 또는 3일마다 10분씩 학습하는 간격(분산) 연습 조건 하에서 배웠다. 각 연습 일정 직후에 투여된 초기 테스트(매스 그룹에 대한 30분 연구 세션 후와 간격 그룹에 대한 세 번째 10분 연구 세션 후)에서 실질적으로 동일한 단기 성과가 관찰되었다. 그러나 7일 후에 투여된 장기 보존 테스트에서, 연구 간격을 둔 참가자들은 연구를 집결한 참가자보다 더 많은 쌍을 회상했다(Bloom & Shuell, 1981년). 마찬가지로, 간격두기 학습 세션은 외국어 단어 쌍의 습득을 실제로 늦출 수 있지만, 몇 년의 기간 동안에도 여전히 우수한 유지로 이어질 수 있다(Bahrick, Bahrick, Bahrick, 1993).
The majority of studies examining the spacing effect have done so using relatively simple to-be-learned materials, such as single words or paired associates. In one study, for example, high school students learned French–English vocabulary pairs (e.g., l’avocat—lawyer) under conditions of either massed practiced, in which the pairs were studied for 30 consecutive minutes on one day, or spaced (distributed) practice, in which the pairs were studied for 10 min on each of three consecutive days. On an initial test that was administered immediately following each practice schedule—after the 30-min study session for the massed group and after the third 10-min study session for the spaced group—virtually identical short-term performance was observed. However, on a long-term retention test administered 7 days later, participants who had spaced their study recalled more pairs than participants who had massed their study (Bloom & Shuell, 1981). Similarly, spacing study sessions, relative to massing them, can actually slow down the acquisition of foreign language vocabulary pairs but can still lead to superior retention—even over a span of several years (Bahrick, Bahrick, Bahrick, & Bahrick, 1993).

간격두기 효과의 나이와 관련된 차이도 조사되었다. 예를 들어, 젊은 성인(18~25세)과 나이 든 성인(61~76세) 모두 미사일이 있거나 간격을 둔 프레젠테이션 일정에 따라 관련이 없는 짝을 이룬 동료(예: 키튼-다임)를 여러 번 연구했다. 연속 큐드-리콜 패러다임을 사용하여 각 항목은 항목의 마지막 프레젠테이션 이후에 2개(단기 보존) 또는 20개(장기 보존)의 개입 항목이 제시된 후 테스트되었다. 놀라운 사실은 나이 든 성인들이 젊은 성인에 비해 전반적으로 더 나쁜 성과를 보인다는 것이다. 보다 흥미롭고 학습-성과 구별과 관련이 있는 두 연령대는 간격별 상호 작용을 보였다. 즉, 단기 보존(즉, 성과)은 [대량 보존 항목]을 선호한 반면, 장기 보존(즉, 학습)은 [간격 있는 항목]을 선호했다. (바로타, 듀첵, 1989년) 

Age-related differences in the spacing effect have also been examined. For example, both younger (ages 18–25) and older (ages 61–76) adults studied unrelated paired associates (e.g., kitten–dime) multiple times according to either a massed or spaced presentation schedule. Using a continuous cued-recall paradigm, each item was tested after either 2 (short retention) or 20 (long retention) intervening items were presented following the item’s last presentation. An unsurprising finding was that older adults performed worse, overall, compared with their younger counterparts. More interesting, and relevant to the learning–performance distinction, both age groups exhibited a spacing-by-retention-interval interaction—that is, short-term retention (i.e., performance) favored the massed items, whereas long-term retention (i.e., learning) favored the spaced items (Balota, Duchek, & Paullin, 1989).

간격은 단순한 자료의 보존성을 높일 뿐만 아니라 산문 구절(예: Rawson & Kintsch, 2005)과 논리(Carlson & Yaure, 1990)와 귀납적 추론과 같은 보다 복잡한 자료의 학습도 개선한다. 특히 눈에 띄는 예는 다양한 유형의 수학 문제를 묶는 것이 아니라 띄어쓰기가 학습을 용이하게 한다는 것을 보여주었다. 참가자들의 과제는 네 개의 다른 모양의 물체의 기하학적 부피를 찾는 방법을 배우는 것이었다. 한 그룹은 한 개체에 대해 4개의 문제를 시도한 후 다음 개체에 대해 4개의 문제로 넘어가는 등 정해진 일정에 따라 연습 문제를 풀었고, 다른 그룹은 무작위로 혼합된 순서로 다양한 모양의 문제를 풀었습니다. 참가자들은 일주일 후에 그 문제에 대해 테스트를 받았다. 연습 단계 동안 참가자들은 이러한 문제를 블록 방식으로, 즉 성능 향상을 대량으로 연습하면 더 많은 문제를 해결할 수 있었습니다. 그러나 장기 보존 테스트에서는 이 패턴이 반대로 나타났다.참가자는 이러한 문제를 1주일 전에 혼합 형식(즉, 공간 활용 학습 강화)으로 연습하면 문제를 해결할 수 있는 능력을 더 잘 유지할 수 있었다(Rohrer & Taylor, 2007). 이러한 결과는 학습과 성과 간의 차이를 예시한다(Rohrer, Dedrick, & Burgess, 2014; Taylor & Rohrer, 2010 참조).

In addition to fostering better retention of simple materials, spacing also improves the learning of more complex materials, such as prose passages (e.g., Rawson & Kintsch, 2005), and the learning of higher-level concepts, such as logic (Carlson & Yaure, 1990) and inductive reasoning (e.g., Kang & Pashler, 2012; Kornell & Bjork, 2008; Kornell, Castel, Eich, & Bjork, 2010). A particularly striking example showed that spacing various types of math problems, as opposed to massing them, facilitates learning. Participants’ task was to learn how to find the geometric volume of four differently shaped objects. One group worked through the practice problems according to a blocked schedule, such that four problems for one object were attempted before moving on to four problems for the next object, and so on; the other group worked through the problems for various shapes in a randomly mixed order. Participants were then tested on the problems 1 week later. During the practice phase, participants were able to solve more of the problems if those problems were practiced in a blocked fashion—that is, massing improved performance. This pattern reversed, however, on the long-term retention test: Participants better retained the ability to solve the problems if those problems were practiced 1 week earlier in a mixed format—that is, spacing enhanced learning (Rohrer & Taylor, 2007). These results exemplify the distinction between learning and performance (see also Rohrer, Dedrick, & Burgess, 2014; Taylor & Rohrer, 2010).

요약
Summary

운동 및 언어 학습 영역의 증거는 장기 학습이 학습해야 할 기술 또는 정보를 시간 또는 기타 개입 활동과 함께 분산(간격두기)함으로써 이익을 얻는다는 것을 보여준다. 그러나 단기적으로는 몰아치기massed 연습이 더 나은 경우가 많다. 따라서, 타이핑, 배드민턴, 외국어 말하기 또는 기하학 문제를 배우고 싶은 경우, 그러한 일정이 연습이나 습득 중에 더 많은 오류를 유발할 수 있더라도 분산 연습 일정을 시행하는 것을 고려해야 한다.

Evidence from the motor- and verbal-learning domains demonstrates that long-term learning profits from distributing (spacing) the practice of to-be-learned skills or information with time or other intervening activities. In the short term, however, massed practice is often better. Thus, whether one wishes to learn how to type, play badminton, speak a foreign language, or solve geometry problems, one should consider implementing a distributed practice schedule, even if such a schedule might induce more errors during practice or acquisition.

 

연습의 변화주기
Variability of Practice

예를 들어 목표 스킬과 관련이 있지만 다른 연습 스킬을 갖는 등 연습이나 학습 세션의 조건을 분산시키는 것은 습득 중 성과에 악영향을 미칠 수 있지만 장기적인 학습과 이전을 촉진할 수 있습니다. 이러한 맥락에서 대부분의 연구는 운동 학습에 초점을 맞췄지만, 언어 학습에 대한 소수의 연구들 또한 연습의 [가변성]의 장기적인 이점을 보여주었다. 우리는 이제 학습과 성과에 대한 연습의 가변성이 분리할 수 없는 영향을 보여준 운동과 언어 학습 전통 모두의 연구를 검토한다.
Similar to distributing practice, varying the conditions of practice or study sessions—for example, by having a trainee practice skills related to but different from the target skill—can also have detrimental effects on performance during acquisition but then foster long-term learning and transfer. Most of the research in this vein has focused on motor learning, although a handful of studies on verbal learning have also demonstrated the long-term benefits of practice variability. We now review research from both the motor- and verbal-learning traditions that has shown dissociable effects of practice variability on learning and performance.

 

운동 학습
Motor learning

운동 학습과 연습의 가변성에 대한 연구는 예를 들어 농구 선수가 정확한 자유투를 하고 싶다면, 파울 라인 자체뿐만 아니라 파울 라인 근처의 다양한 위치에서 연습해야 한다고 제안한다. 이러한 가변 연습은 연습 중에 효과적이지 않은 것처럼 보일 수 있다. 특히 파울 라인에서만 슈팅하는 것에 비해 더 많은 성능 오류가 유발될 가능성이 높지만 장기적인 학습을 촉진할 수 있다. 나중에 자세히 논의하는 바와 같이, 연습 조건을 변경하는 것은 농구 슈팅과 같은 기술의 기초가 되는 일반적인 운동 프로그램에 익숙해지고 매개 변수를 조작하는 것을 배울 수 있기 때문에 학습에 효과적인 것으로 보인다(Schmidt, 1975). 이제 우리는 연습의 가변성을 증가시키는 것이 훈련 또는 획득 중에 더 많은 오류를 야기하는 동시에 장기적인 학습 혜택을 줄 수 있다는 것을 시사하는 모터 러닝 영역의 몇 가지 발견에 대해 논의한다(검토는 Guadnoli & Lee, 2004 참조).
Research on motor learning and practice variability suggests that if a basketball player, for example, wants to shoot accurate free throws, he or she should not only practice from the foul line itself but also from various positions neighboring the foul line. Such variable practice might not appear to be effective during practice—specifically, more performance errors would likely be induced relative to shooting only from the foul line—but would facilitate long-term learning. As discussed in more detail later, varying the conditions of practice seems to be effective for learning because it enables one to become familiar with, and learn to manipulate the parameters of, the general motor program underlying some skill, like shooting a basketball (Schmidt, 1975). We now discuss several findings from the motor-learning domain suggesting that increasing practice variability, while potentially inducing more errors during training, or acquisition, also has the potential to confer long-term learning benefits (for a review, see Guadagnoli & Lee, 2004).


커와 부스(1978)는 연습 조건을 고정시키는 것이 아니라 [바꾸는 것]이 운동 기술에 대한 장기적인 학습을 촉진할 수 있다는 설득력 있는 증거를 제공했다. 연구에서 아이들은 2피트, 4피트(다양한 연습) 또는 3피트(고정 연습) 거리에서 바닥에 있는 목표물을 향해 빈백을 던졌다. 잠시 후, 모든 참가자들은 고정 연습 그룹의 참가자들이 연습한 유일한 거리인 3피트 거리에서 테스트를 받았다. 직감적으로 테스트된 거리에서만 연습한 고정 연습 그룹의 참가자가 테스트된 거리에서 연습한 적이 없는 다양한 연습 그룹의 참가자들보다 더 잘할 수 있다. 그러나 결과는 정반대 패턴을 보였다. 연습 거리를 변경하면 최종 테스트에서 3피트 떨어진 곳에서 보다 정확한 토스가 이루어졌으며, 이는 반복되고 확장된 결과인 Pigott & Shapiro, 1984; Roller, Cohen, Kimball & Bloomberg, 200과 같은 다양한 연습의 이점을 보여준다.1; Wulf, 1991).

In their important article, Kerr and Booth (1978) provided compelling evidence that varying the conditions of practice, as opposed to keeping them fixed, can boost long-term learning of a motor skill. In their study, children tossed beanbags at a target on the floor from distances of 2 and 4 feet (varied practice) or only 3 feet (fixed practice). After a delay, all participants were tested from a distance of 3 feet, the sole distance practiced by participants in the fixed-practice group. Intuition would suggest that participants in the fixed-practice group, who exclusively practiced from the tested distance, would do better than those in the varied-practice group, who never practiced at the tested distance. The results, however, showed the opposite pattern: Varying the practice distances led to more accurate tosses from 3 feet away on the final test, showcasing the benefits of variable practice in producing transfer of a motor skill, a result that has been replicated and extended (e.g., Pigott & Shapiro, 1984; Roller, Cohen, Kimball, & Bloomberg, 2001; Wulf, 1991).

[변화주기 연습]은 농구 슈팅(Landin, Hebert, & Fairweather, 1993)과 포핸드 라켓 기술 습득(Green, Whitehead, Sugden, 1995)과 같은 다른 복잡한 운동 기술의 학습을 촉진할 수 있다. 농구 연구에서, 두 그룹의 참가자들은 3일 동안 농구 자유투를 쏘는 연습을 했다. 고정 연습 조건에서는 참가자들이 기준 거리인 12피트에서만 자유투를 쏜 반면 가변 연습 조건의 참가자들은 기준 거리뿐만 아니라 다른 두 거리(8피트와 15피트)에서도 쐈다. 중요한 것은 두 그룹이 연습한 총 자유투 횟수(120개)가 동일하다는 것이다. 연습 단계로부터 72시간 후에 시행된 유지 테스트는 참가자들이 기준 거리(12피트)에서 10개의 자유투를 쏘는 것으로 구성되었다. 상식적인 예측은 고정 연습 조건의 참가자들이 가변 연습 조건의 참가자들에 비해 그 거리에서 더 많은 자유투를 연습했기 때문에 최종 시험에서 더 많은 자유투를 할 것이라는 것이다. 그러나 직관에 반하는 연구 결과는 가변 연습 조건의 참가자들이 지연 유지 테스트에서 더 많은 자유투를 성공시켰다는 것이다. 여러 위치에서 연습하면 기술의 기초가 되는 일반 운동 프로그램에 더 익숙해질 수 있음을 시사했다.
Subsequent research found that variable practice can foster the learning of other complex motor skills, such as shooting a basketball (Landin, Hebert, & Fairweather, 1993) and mastering a forehand racket skill (Green, Whitehead, & Sugden, 1995). In the basketball study, two groups of participants practiced shooting basketball free throws over a period of 3 days. In the fixed-practice condition, participants shot the free throws exclusively from the criterion distance of 12 feet, whereas participants in the variable-practice condition shot from the criterion distance as well as from two other distances (8 feet and 15 feet). It is important to note that the total number of free throws (120) practiced by both groups was equated. The retention test, administered 72 hr after the practice phase, consisted of participants shooting 10 free throws from the criterion distance (12 feet). Again, the commonsense prediction would be that participants in the fixed-practice condition would make more free throws on the final test because they practiced more free throws from that distance compared with participants in the variable-practice condition. The counterintuitive finding, however, was that participants in the variable-practice condition made more free throws on the delayed-retention test, suggesting that practicing from multiple locations engendered more familiarity with the general motor program underlying the skill.


단순한 [운동 기술의 학습]은 그러한 연습이 [획득 성능acquisition performance]에 해로운 영향을 미치는 경우에도 연습 조건의 변화로부터 이익을 얻는 것으로 반복적으로 나타났다. 이러한 학습-성과 상호작용 효과를 창출한 많은 연구는 타이밍 기술을 조사했다(예: Catalano & Kleiner, 1984; Hall & Magill, 1995; Lee, Magill, & Weeks, 1985; Wrisberg & Mead, 1983; Wulf & Schmidt, 1988). 예를 들어, 한 연구에서, 참가자들은 정확히 200ms 안에 그렇게 하는 것을 목표로 주어진 시작 지점에서 팔로 장벽을 넘어뜨리려고 시도했다. 변수 그룹은 4개의 다른 출발 지점(15, 35, 60, 65cm)에서 연습하는 반면, 상수 그룹은 항상 같은 출발 지점(예: 60cm)에서 연습한다. 그림 3에 표시된 것처럼, 변수 그룹은 획득 중에 일정한 그룹보다 더 나쁜 성능을 보였으며, 목표 시간 200ms 내에 암 이동을 시도할 때 더 많은 절대 오류를 발생시켰지만, 이후 새로운 시작 지점(50cm)을 테스트한 즉시 및 지연(1일) 전달 테스트에서 더 나은 학습을 보였다(McC).Racken & Stelmach, 1977). 유사한 학습-성과 상호작용은 기준 손잡이 힘을 학습하는 데 있어 가변 연습의 영향을 조사한 연구에서 나타났다. 기준력에 도달하기 위해 연습한 참가자와 비교했을 때, 추가 손잡이 힘을 연습한 참가자는 [획득 중에 기준력]에 도달하는 데 더 나쁜 성과를 보였지만 [지연 후 기준력]을 생성하는 데 더 정확했다(C. H. Shea & Kohl, 1991년). 또한 C를 참조한다. H. Shea & Kohl, 1990).

The learning of simpler motor skills has also been repeatedly shown to benefit from varying the conditions of practice, even in cases when such practice has detrimental effects on acquisition performance. Many of the studies that have produced this learning–performance interaction effect have examined timing skills (e.g., Catalano & Kleiner, 1984; Hall & Magill, 1995; Lee, Magill, & Weeks, 1985; Wrisberg & Mead, 1983; Wulf & Schmidt, 1988). For example, in one study, participants attempted to knock over a barrier with their arm from a given starting point, with the goal of doing so in precisely 200 ms. A variable group practiced from four different starting points (15, 35, 60, and 65 cm), whereas a constant group always practiced from the same starting point (e.g., 60 cm). As displayed in Figure 3, the variable group performed worse than the constant group during acquisition, producing more absolute errors when attempting to execute the arm movement in the target time of 200 ms, yet showed better learning on subsequent immediate and delayed (1 day) transfer tests in which a new starting point (50 cm) was tested (McCracken & Stelmach, 1977). A similar learning–performance interaction was shown in a study that examined the effects of variable practice in learning a criterion handgrip force. Compared with those who practiced solely to reach the criterion force, participants who practiced additional handgrip forces performed worse during acquisition at reaching the criterion force but were more accurate in producing the criterion force after a delay (C. H. Shea & Kohl, 1991; see also C. H. Shea & Kohl, 1990).

 

구두 학습
Verbal learning

학생들에게 정기적으로 제공되는 오래되고 널리 알려진 조언 중 하나는 조용한 장소(예를 들어 도서관의 단골 코너)를 찾아 그곳에서 꾸준히 공부하라는 것입니다. 학습 조건을 일정하게 유지하는 것이 학습에 도움이 된다고 생각된다. 그러나 운동 영역의 발견과 유사하게, 연구 결과에 따르면, 연구 세션 중 변화를 유도하는 것(예: 기억해야 할 자료가 연구되는 환경적 맥락의 변화 또는 해결해야 할 문제의 변화 증가)도 언어 학습에 도움이 될 수 있다. 그러한 변화를 유도하는 것은 종종 획득 성능에 무시해도 될 정도의 영향을 미치거나 심지어 이를 방해할 수도 있지만, 소재가 나중에 해당 소재에 쉽게 접근할 수 있는 광범위한 기억 신호와 연관되기 때문에 장기적인 학습을 향상시킬 수 있다. 언어 학습 전통의 여러 연구들이 이것을 경험적으로 증명해 왔다.
One long-standing and widespread piece of advice regularly given to students is to find a quiet location—say, a favorite corner of the library—and to study there on a consistent basis. Keeping study conditions constant, it is thought, benefits learning. However, analogous to findings in the motor domain, studies have shown that inducing variation during study sessions—for example, by varying the environmental context in which to-be-remembered material is studied or increasing the variation of to-be-solved problems—can also benefit verbal learning. Inducing such variation often has negligible effects on acquisition performance, or may even impede it, but it can enhance long-term learning because the material becomes associated with a greater range of memory cues that serve to facilitate access to that material later. Several studies in the verbal-learning tradition have demonstrated this empirically.


한 연구는 자료를 학습하는 물리적 맥락 또는 환경을 변경하는 것이 새로운 맥락에서 해당 자료를 시험볼 때 학습을 강화할 수 있는지 여부를 조사했다. 이는 현대의 표준화된 테스트(예: SAT, GRE)가 종종 낯선 위치에서 시행된다는 점을 고려할 때 여전히 관련성이 있는 문제이다. 참가자들은 먼저 40개의 단어 목록을 연구했다. 참가자의 절반은 미시간 대학 캠퍼스의 특정 장소인 A룸에서, 다른 참가자는 미시건 캠퍼스의 다른 장소인 B룸에서 목록을 연구했습니다. 3시간 후, 각 그룹의 참가자 중 절반은 같은 방에서 단어를 다시 읽었고, 다른 참가자들은 다른 장소에서 목록을 다시 살펴보았다. 두 번째 스터디 세션 후 3시간 후에 시행된 최종 테스트에서 모든 참가자는 중립 위치인 C실에서 단어에 대한 테스트를 받았다. 놀랍게도, 다른 방에서 공부한 참가자들은 같은 방에서 공부한 참가자보다 약 21% 더 많은 단어를 기억했으며, 가변 연습의 기억력 이점을 보여주었다(Smith, Glenberg, Bjork, 1978). 따라서, 참가자들이 새로운 장소에서 물리적 연구 환경을 변화시키면서 시험을 치른 경우, 나중에 동일하거나 유사한 자료를 사용하여 복제한 결과인 학습을 강화했다(Glenberg, 1979; Smith, 1982). 또 다른 연구는 모든 강의가 같은 장소에서 진행되는 것에 비해 4개의 다른 장소에서 연속적으로 4개의 강의를 한 후 참가자들이 통계 개념을 5일 동안 유지하는 것이 더 낫다는 것을 보여줌으로써 보다 복잡한 학습 자료로 이 연구 결과를 복제했다. 그러나 각 통계 강의 직후에 시행된 단기 보존 테스트의 성과는 두 그룹 모두에서 유사했다(Smith & Rothkopf, 1984).
One study examined whether varying the physical context, or environment, in which material is studied can bolster learning when that material is tested in a new context, an issue that remains relevant given that modern standardized tests (e.g., SAT, GRE) are often administered in unfamiliar locations. The participants first studied a list of 40 words. Half the participants studied the list in Room A, a particular location on the University of Michigan campus; the other participants studied the list in Room B, a different location on the Michigan campus. Three hours later, half of the participants in each group restudied the words again in the same room, whereas the other participants studied the list again in the other location. On the final test, administered 3 hr after the second study session, all participants were tested on the words in a neutral location, Room C. Strikingly, participants who studied in different rooms recalled approximately 21% more of the words than participants who studied in the same room, demonstrating the mnemonic benefit of variable practice (Smith, Glenberg, & Bjork, 1978). Thus, if participants were tested in a novel location, varying the physical study environments bolstered learning, a finding that was later replicated using the same or similar materials (Glenberg, 1979; Smith, 1982). Another study replicated this finding with more complex learning material by showing that participants’ 5-day retention of statistical concepts was better when it occurred after four successive lectures given in four different locations as opposed to when all of the lectures were given in the same location. Performance on short-term retention tests administered immediately after each statistics lecture, however, was similar for both groups (Smith & Rothkopf, 1984).

환경 컨텍스트의 변동을 증가시킬 뿐만 아니라, 반드시 단기적인 성과는 아니지만 장기적인 학습과 이전도 획득 단계에서 문제의 변동을 증가시킴으로써 이익을 얻을 수 있다. 예를 들어, 화학 공정 공장의 컴퓨터 기반 시뮬레이션 문제 해결과 관련된 과제에 대한 가변 관행의 영향을 조사한 연구에서, 참가자들은 "전이 역설"을 나타내는 결과 패턴을 생성했다. 특히, [낮은 가변성 문제]와 비교하여 [매우 가변적인 연습 문제]는 연습 중에 더 많은 [수행] 오류를 유발했지만, 이후 테스트에서 해결된 새로운 문제 수에서 입증되었듯이 [학습]에 긍정적인 영향을 미쳤다(Van Merrienboer, de Crook, & Jelsma, 1997). 이러한 부호화의 가변성은 또한 유추적 추론(Gick & Holyoak, 1983)과 기하학적 문제 해결(Paas & Van Merrienboer, 1994), 텍스트 자료(Mannes & Kintsch, 1987)와 얼굴-이름 쌍의 보존(Smith & Handy, 2014)을 강화하는 것으로 나타났다. 

In addition to increasing the variation of the environmental context, long-term learning and transfer but not necessarily short-term performance can also profit from increasing the variation of problems during an acquisition phase. For example, in a study that examined the effects of variable practice on a task that involved troubleshooting a computer-based simulation of a chemical process plant, participants produced a pattern of results indicative of a “transfer paradox.” Specifically, highly variable practice problems, relative to low-variability problems, induced more performance errors during practice but had positive effects on learning, as evidenced by the number of new problems solved on a later test (Van Merrienboer, de Croock, & Jelsma, 1997). Such encoding variability has also been shown to enhance analogical reasoning (Gick & Holyoak, 1983) and geometrical problem solving (Paas & Van Merrienboer, 1994), as well as the retention of text material (Mannes & Kintsch, 1987) and face–name pairs (Smith & Handy, 2014).

언어 자료로 가변 연습의 학습 이점을 입증한 또 다른 연구에서, 참가자들은 나중에 테스트된 아나그램을 반복적으로 풀거나(예: 연습 단계에서 LDOOF가 세 번 풀리고 테스트에 나타났음) 테스트된 아나그램의 여러 버전을 풀어서 아나그램을 푸는 연습을 했다.d나중에 (예를 들어 DOLOF, FOLOD 및 OOFLD가 실행되었고 LDOF가 테스트에 나타났다.) 관심사는 아나그램의 여러 변형을 해결하는 것, 즉 문제의 가변성을 높이는 것이 나중에 아나그램을 푸는 참가자들의 능력을 향상시킬 수 있는가 하는 것이었다. 실제로 가변 연습 조건의 참가자들은 연습 단계에서 아나그램을 해결하는 데 비교적 오랜 시간이 걸리고 단기적인 수행 저하가 드러났지만, 그들은 이후 테스트에서 상대적으로 더 많은 아나그램을 풀었다(M. K. Goode, Geraci, & Roediger, 2008). 운동 학습에 대한 이전 섹션에서 검토한 결과 중 몇 가지와 마찬가지로, 이 결과는 직관적이지 않다. 왜냐하면 가변 실습 그룹은 나중에 테스트된 특정 아나그램을 해결하려고 시도하지 않은 반면, 다른 그룹은 연습 단계에서 세 번 풀었기 때문이다. 따라서 이러한 결과는 [테스트 받지 않을 다양한 거리에서 목표물]을 던지는 것이 [테스트 받을 거리]에서만 그러한 연습하는 것보다 학습에 더 낫다는 커와 부스의 운동 학습 실험의 결과를 개념적으로 복제한다.

In yet another study that demonstrated learning benefits of variable practice with verbal materials, participants practiced solving anagrams by either repeatedly solving the anagram that was tested later (e.g., LDOOF was solved three times during the practice phase and appeared on the test) or solving multiple versions of the anagram that was tested later (e.g., DOLOF, FOLOD, and OOFLD were practiced and LDOOF appeared on the test). Of interest was whether solving multiple variants of the anagram—that is, increasing the variability of the problems—would enhance participants’ ability to solve the anagrams later. Indeed, despite participants in the variable practice condition taking relatively longer to solve the anagrams during the practice phase, revealing a short-term performance decrement, they solved relatively more of the anagrams on a later test (M. K. Goode, Geraci, & Roediger, 2008). Like several of the results reviewed in the previous section on motor learning, this result is counterintuitive because the variable practice group never attempted to solve the specific anagram that was later tested, whereas the other group solved it three times during the practice phase. Thus, these results conceptually replicate the outcome of Kerr and Booth’s (1978) motor-learning experiment, in which tossing beanbags at a target from various nontested distances was better for learning than practicing those tosses from the tested distance.

요약
Summary

단순하고 복잡한 운동 기술의 장기 보존 및 이전은 훈련 중 수행에 무시할 수 있거나 부정적인 영향을 미칠 수 있는 연습에도 불구하고, 그러한 운동 기술의 단일 반복보다는 여러 번 반복을 수행하는 연습 유형에서 종종 이익을 얻습니다. 언어 학습 실험에서도 같은 것이 밝혀졌는데, 이는 해결해야 할 문제의 변화를 증가시키거나 기억해야 할 자료가 연구되는 환경적 맥락을 변화시켰다. [변화주기 연습variable practice]은 작업을 성공적으로 수행하는 데 필요한 일반적인 기초 운동 기술 또는 지식 기반에 대한 친숙함을 넓히는 것으로 보입니다.
The long-term retention and transfer of motor skills—both simple and complex—often profit from the type of practice that entails one to perform multiple iterations, rather than a single iteration, of those motor skills, despite such practice potentially having negligible or even negative effects on performance during training. The same has been revealed in verbal-learning experiments that have increased the variation of to-be-solved problems or varied the environmental context in which to-be-remembered material was studied. Variable practice, it seems, broadens one’s familiarity with the general underlying motor skill or knowledge base needed to successfully perform a task.

인출 연습
Retrieval Practice


수십 년에 걸친 연구에 따르면 테스트에 의해 촉발된 인출 프로세스는 실제로 인출된 정보를 중요한 방식으로 변화킨다. 즉, 테스트는 [메모리에 저장된 내용에 대한 수동적 평가]일 뿐만 아니라(종종 교육에서 전통적인 관점처럼), [메모리에 저장된 내용을 수정하는 매개체]로서도 작용한다. 본 절에서는 이러한 결론을 도출하는 운동 및 언어 학습 영역의 증거를 검토한다. 예를 들어, 모터 스킬 문헌에서는, 스스로 학습한 움직임이, 외부로부터 유도되거나 단순히 관찰된 움직임보다 일반적으로 더 잘 학습된다. 마찬가지로, 언어 정보에 대한 기억을 테스트하거나 참가자들이 직접 정보를 생성하도록 하는 것은 수정 피드백이 제공되지 않는 경우에도 반복해서 읽는 것에 비해 해당 자료의 장기 보존을 향상시킵니다. 학습-수행 구별과 관련된 중요한 발견은 [종종 장기 보존을 촉진하는 인출 연습 조건]이 반대 조건과 비교하여 [단기적으로 도움이 되지 않는 것으로 보일 수 있다]는 것이다.

Decades of research suggest that the retrieval processes triggered by testing actually changes the retrieved information in important ways. That is, tests act not only as passive assessments of what is stored in memory (as is often the traditional perspective in education) but also as vehicles that modify what is stored in memory. This section reviews evidence from both the motor- and verbal-learning domains that lead to such a conclusion. In the motor-skills literature, for example, to-be-learned movements that are self-produced are typically better learned than those that are externally guided or simply observed. Likewise, testing one’s memory for verbal information, or having participants generate the information themselves, enhances long-term retention of that material compared with reading it over and over, even in cases when corrective feedback is not provided. A critical finding, relevant to the learning–performance distinction, is that conditions of retrieval practice that often facilitate long-term retention frequently may appear unhelpful in the short term compared with their counterpart conditions.

운동 학습
Motor learning

체조 플립이나 골프 스윙과 같은 운동 기술을 가르칠 때 강사가 원하는 동작을 통해 학습자를 물리적으로 지도하는 것은 흔한 일입니다. 직관적으로 이러한 유형의 지도가 유익해야 한다는 것을 알 수 있습니다. 실제로 연구 결과에 따르면 학습자가 지도 없이 기술을 생산하려고 시도할 때보다, 습득 중 수행 오류를 줄이는 것으로 나타났습니다(즉, 학습자가 스스로 기술을 습득하도록 권장됨). 문제는 지도guidance에 더 이상 의존할 수 없는 장기 학습 평가에서는 그 반대의 경우가 많다는 점이다. 즉, 가이드 없이 기술을 자주 연습하면 습득 중에 가이드를 받는 것보다 더 나은 학습을 할 수 있다(자동차 관련 작업의 지침 연구에 대한 검토는 Hodges & Campagnaro, 2012 참조). 운동 기술에 대한 장기적인 학습(반드시 단기적인 성과는 아님)은 테스트와 학습자가 기억해야 할 운동 기술을 직접 생성할 수 있는 경우(스킬을 선택하는 경우와는 달리)에서도 이익을 얻는다.
When teaching a motor skill, such as a gymnastics flip or a golf swing, it is commonplace for instructors to physically guide the learner through the desired motions. Intuition suggests that this type of instruction should be beneficial; indeed, research has shown that guiding learners reduces performance errors during acquisition compared with when learners attempt to produce the skill without guidance (i.e., are encouraged to retrieve the skill on their own). The problem is that on assessments of long-term learning when guidance can no longer be relied on, the reverse is often true—that is, practicing a skill without guidance frequently produces better learning than does being guided during acquisition (for a review on guidance research in motor-related tasks, see Hodges & Campagnaro, 2012). The long-term learning of motor skills, but not necessarily short-term performance, also profits from a test (as opposed to a restudy opportunity) and when learners are permitted to generate their own to-be-remembered motor skills (as opposed to when the skills are chosen for them).


가이드의 효과에 대한 초기 연구는 참가자들이 나중에 그러한 동작을 스스로 수행하도록 요청받았을 때 물리적 지원을 제공하는 것이 긍정적인 영향을 미쳤으며, 이는 초기의 가이드는 학습에 이득을 준다는 것을 시사한다. 그러나, 이러한 연구에서 유지 간격은 특히 짧았고, 따라서 장기 학습에 대한 주장은 미약했다. 수십 년이 지난 후에야 지침의 장기적 영향을 검토하는 첫 번째 연구가 등장했다. 그러한 연구에서, 참가자들은 다른 사람에 의해 신체적으로 이끌리든 그렇지 않든 간에 조이스틱 추적 과제를 연습했다. 가이드가 있는 그룹은 훈련 중 및 초기 단기 성과 테스트에서 가이드가 없는 그룹을 능가했지만, 6주 후에 실시된 후기 보존 테스트에서는 가이드가 없는 그룹이 가이드가 없는 그룹보다 더 나은 학습을 보여주었다. 또한, 유도 그룹은 과제를 수행한 적이 없고 단순히 지켜본 참가자 그룹보다 더 잘 유지되는 것을 보여주지 못했다(Baker, 1968; 암스트롱, 1970 참조).

Early research on the effects of guidance (e.g., Melcher, 1934; Waters, 1930) showed that providing physical assistance during the acquisition of simple to-be-learned movements had positive effects when participants were subsequently asked to perform those movements on their own, suggesting that learning profits from initial guidance. However, the retention intervals in these studies were particularly short, and thus any claims of long-term learning were tenuous. It was not until decades later that the first studies to examine the long-term effects of guidance emerged. In one such study, participants practiced a joystick pursuit-tracking task while either being physically guided by another person or not. The guided group outperformed the unguided group during training and on initial short-term performance tests, but on a later retention test administered 6 weeks later, the unguided group demonstrated better learning than the guided group. Furthermore, the guided group failed to show better retention than a group of participants who had never performed the task but simply watched (Baker, 1968; see also Armstrong, 1970).

후속 연구는 가이드의 학습 및 성과 효과를 복제하고 확장했습니다. 예를 들어, 레버를 다양한 위치로 조작하는 작업과 관련하여, 물리적으로 유도된 그룹은 획득 중에 더 잘 수행했지만(즉, 성능 오류를 줄였다) 유지 간격 후에는 안내되지 않은 그룹에 비해 더 악화되었다(Winstein, Pohl, & Lewthwaite, 1994). 마찬가지로, 암 확장이 포함된 격월별 조정 작업 훈련 중 안내 연습은 성과 오류를 방지했다. 그러나 부분 지침이 제공되거나 지침이 제공되지 않은 조건에 비해 장기 학습이 덜 이루어졌다(Feijen, Hodges, & Beeek, 2010; Tsutsui & Imanaka, 2003 참조). 마지막으로, 하네스(harness)가 크리켓 스포츠와 관련된 볼링 기술을 적절히 수정하는 데 도움이 될 수 있는지 여부를 조사한 연구에서, 하네스(harness)가 적용된 제한은 단기적으로는 기술을 개선했지만, 하네스(harness)를 사용하지 않았을 때와 비교하여 어떠한 장기적 학습 이익도 창출하지 못한 것으로 밝혀졌다. 명백히, 훈련 중 가이드가 학습에 미치는 영향과 수행에 미치는 영향은 다를 수 있다.

Subsequent research has replicated and extended the learning and performance effects of guidance. For example, on a task that involved manipulating a lever to various positions, a physically guided group performed better during acquisition (i.e., made fewer performance errors) but worse after a retention interval, relative to an unguided group (Winstein, Pohl, & Lewthwaite, 1994). Likewise, during training of a bimanual coordination task that involved arm extensions, guided practice prevented performance errors; however, it also yielded less long-term learning compared with conditions in which partial guidance or no guidance was provided (Feijen, Hodges, & Beek, 2010; see also Tsutsui & Imanaka, 2003). Finally, in a study that examined whether a harness could serve as an aid to properly modify the bowling technique involved in the sport of cricket, it was found that the restriction applied by the harness improved techniques in the short term but failed to yield any long-term learning benefits, compared with when no harness was used (Wallis, Elliot, & Koh, 2002). Clearly, guidance during training can have differential effects on learning and performance.

[인출 연습]이 학습과 성과에 미치는 영향을 검토하는 또 다른 간단한 방법은 학습자가 먼저 학습한 기술을 관찰한 후 학습자를 테스트(즉, 스스로 기술을 복제하거나 검색하도록 요구함)하거나 재현할 필요 없이 기술을 다시 제시할 수 있도록 하는 것입니다. 그 후 시행된 테스트는 재표현 시험과 관련하여 검색 관행이 학습을 향상시키는지 여부를 밝혀낼 수 있다. 모터러닝 영역의 경험적 연구가 검색 관행의 잠재적인 이점을 더 잘 이해하기 위해 이러한 방법을 사용했다는 것은 놀라운 일이다. 주목할 만한 예외로, 한 연구는 팔 위치 결정 작업을 학습하는 데 인출 연습의 영향을 조사했다. 학습한 자세에 대한 초기 프레젠테이션 후, 참가자들은 그 위치에서 여러 번 테스트를 받았거나 테스트를 거치지 않고 반복적으로 재제시되었다. 인출 연습을 한 참가자는 단순히 여러 번 관찰한 참가자에 비해 팔 자세를 장기간 유지하는 것이 더 좋았다. 그러나 습득acquisition 과정에서 수행을 평가할 때는 그 반대였다(Hagman, 1983). 후속 모터 기술 연구는 이러한 유형의 [인출 연습이 제공하는 장기적 학습 이점]을 재현했다(즉, 테스트 대 재학습; Boutin et al., 2012; Boutin, Panzer, & Blandin, 2013).

Another, rather simple way to examine the effects of retrieval practice on learning and performance is to allow learners to first observe the to-be-learned skill and then either test the learners (i.e., require them to reproduce, or retrieve, the skill on their own) or present the skill again without the requirement to reproduce it. A subsequently administered test could then reveal whether retrieval practice, relative to re-presentation trials, enhances learning. It is surprising that scant empirical work in the motor-learning domain has used this sort of method to better understand the potential benefits of retrieval practice. Representing a notable exception, one study examined the effects of retrieval practice on learning an arm-positioning task. After an initial presentation of to-be-learned positions, participants either were tested on the positions several times or were simply re-presented with them over and over without being tested. Participants who engaged in retrieval practice showed better long-term retention of the arm positions than those who simply observed the positions multiple times. The opposite was true, however, when performance was assessed during acquisition (Hagman, 1983). Subsequent motor-skills research replicated the long-term learning benefits conferred by this type of retrieval practice (i.e., testing vs. restudying; Boutin et al., 2012; Boutin, Panzer, & Blandin, 2013).

마지막으로, 운동 기술의 학습은 다른 형태의 인출 연습으로부터 이익을 얻습니다. 즉, 학습자에게 동작을 선택해주기보다, [학습자가 자신의 동작을 생성할 수 있도록] 합니다. 이 사전 선택 효과에 대한 가장 초기적이고 가장 설득력 있는 시연 중 하나에서, 참가자들은 이전에 스스로 선택했거나 실험자가 부과한 빠른 팔 움직임을 재현했다. 획득 단계에서 그러한 장기 학습의 지표를 수집할 수 없음에도 불구하고, 신속성과 정밀도 측면에서 팔 움직임을 유지하는 것은 선택 그룹에 유리하다. (Stelmach, Kelso, Wallace, 1975) 사전 선택 효과는 모터 학습 문헌에서 가장 강력하고 신뢰할 수 있는 효과 중 하나로 빠르게 나타났다(Martenuik, 1973 참조, 조기 검토는 Kelso & Wallace, 1978 참조).

Finally, the learning of motor skills profits from another form of retrieval practice—namely, permitting learners to generate their own to-be-learned movements as opposed to the movements being selected for them. In one of the earliest and most convincing demonstrations of this preselection effect, participants reproduced rapid arm movements that were either previously selected by themselves or imposed by the experimenter. Retention of the arm movements—in terms of both rapidity and precision—favored the selection group, even though no indicators of such long-term learning could be gleaned from the acquisition phase (Stelmach, Kelso, & Wallace, 1975). The preselection effect quickly emerged as one of the most robust and reliable effects in the motor-learning literature (see also Martenuik, 1973; for an early review, see Kelso & Wallace, 1978).

 

구두 학습
Verbal learning

운동 학습 영역의 연구와 마찬가지로, 언어 자료의 인출 연습(또는 테스트)을 조사하는 경험적 작업은 수십 년 전으로 거슬러 올라가며, 그 중에서 기억에서 정보를 인출하는 것은 단순히 정보가 기억 속에 존재한다는 것을 드러내는 것 이상을 한다는 공감대가 형성되었다. 실제로 검색 행위는 성공적으로 검색된 정보를 미래에 더 기억하기 쉽게 만든다는 점에서 "기억 수정자memory modifier"(R. A. Bjork, 1975)이며, 광범위한 소재와 결과를 사용하여 수명 전체에 걸쳐 입증된 [테스트 효과]라고 불리는 발견이다. 측정(검토 내용은 Carpenter, 2012; Roediger & Butler, 2011; Roediger & Karpicke, 2006a 참조). 다시 말해, 인출 연습은 그 자체로 [강력한 학습 사건]입니다. 그러나 단기적으로, 인출 연습은 종종 테스트 대신 재료가 재처리되는 조건에 비해 기억의 이점을 제공하지 못하는 것으로 보인다. 우리는 이제 학습과 수행의 구별을 필요로 하는 언어 학습 영역의 인출 연습에 대한 작업을 고려합니다.

Similar to the research in the motor-learning domain, empirical work investigating retrieval practice (or testing) of verbal material dates back decades, out of which has emerged the consensus that retrieving information from memory does more than simply reveal that the information exists in memory. In fact, the act of retrieval is a “memory modifier” (R. A. Bjork, 1975) in the sense that it renders the successfully retrieved information more recallable in the future than it would have been otherwise, a finding that has been termed the testing effect, which has been demonstrated across the life span using a wide range of materials and outcome measures (for reviews, see Carpenter, 2012; Roediger & Butler, 2011; Roediger & Karpicke, 2006a). In other words, retrieval practice is itself a potent learning event. In the short term, however, retrieval practice often appears to fail to confer any mnemonic benefits compared with conditions in which the material is restudied instead of tested. We now consider work on retrieval practice in the verbal-learning domain that has necessitated the distinction between learning and performance.

테스트 효과에 대한 최초의 대규모 연구는 게이츠(1917년)와 스피처(1939년)로 거슬러 올라갈 수 있지만, 1970년대에 이르러서야 연구자들은 검색 연습이 학습과 성과에 차이를 가져올 수 있다는 설득력 있는 증거를 제공했다. 예를 들어, 한 연구에서 참가자들은 40개의 단일 단어를 세 번 공부한 후 SSST(자유 리콜 테스트)를 치르거나 세 번 프리 리콜 테스트(STT)를 치렀습니다. 두 그룹이 모두 테스트된 이 절차의 네 번째 단계에서 SST 조건에 할당된 참가자들은 STTT 조건의 참가자들보다 더 큰 단기 호출 성능을 보였다. 즉, 반복 연구가 반복 테스트보다 더 좋았다. 그러나 이틀 후 평가된 장기 리콜은 STTT 조건을 선호했다(Hogan & Kintsch, 1971). 이 연구결과는 나중에 반복 연구가 5분 후 반복 테스트보다 더 나은 리콜로 이어졌지만(50% 대 28%), 2일 후 실시된 지연 리콜 테스트에서 반복 테스트가 비록 미미하지만 반복 연구를 능가한다는 연구 결과에서 반복 테스트보다 더 잘 재현되고 확장되었다(25% 대 23%; Thompson, Wenger, & Bartling, 1978). 같은 해, 확장된 간격 테스트 스케줄은 동등한 간격 테스트 스케줄보다 학습된 이름을 더 잘 기억하는 것으로 확인되었지만, 이 두 조건 모두 주어진 프레젠테이션 직후에 여러 테스트를 연속적으로 시행하는 대량 테스트 조건보다 더 나은 장기 학습으로 이어졌다. 이름, 획득 단계에서 거의 오류 없는 성능을 보인 조건입니다(Landauer & Bjork, 1978).
Although the first large-scale studies on the testing effect can be traced back to Gates (1917) and Spitzer (1939), it was not until the 1970s that researchers provided compelling evidence that retrieval practice can have differential effects on learning and performance. In one study, for example, participants studied 40 single words either three times before taking a free-recall test (SSST) or once before taking three free-recall tests (STTT). During the fourth phase of this procedure in which both groups were tested, participants assigned to the SSST condition showed greater short-term recall performance than those in the STTT condition—in other words, repeated studying was better than repeated testing. Long-term recall assessed 2 days later, however, favored the STTT condition (Hogan & Kintsch, 1971). These findings were later replicated and extended in a study that found that repeated studying led to better recall than repeated testing after 5 min (50% vs. 28%) but that repeated testing trumped repeated studying, albeit only slightly, on a delayed recall test administered 2 days later (25% vs. 23%; Thompson, Wenger, & Bartling, 1978). That same year, expanded-interval testing schedules were found to produce better recall of to-be-learned names than equal-interval testing schedules, but both of these conditions led to better long-term learning than did a massed-testing condition, in which several tests were administered in succession immediately after the presentation of a given name, a condition that showed nearly errorless performance during the acquisition phase (Landauer & Bjork, 1978).

[인출 연습]과 관련하여 학습 성과 상호 작용에 대한 설득력 있는 데모를 제공한 다른 연구에서, 한 그룹의 참가자(반복 연구)는 40단어 목록을 5회 연속(SSSS) 학습한 반면, 다른 그룹(반복 테스트)은 4회 연속 리콜 테스트(STTT) 전에 목록을 한 번 학습했다. 최종 리콜 테스트는 5분 또는 1주일 후에 (각 그룹의) 다른 그룹의 참가자들에게 시행되었다. 반복 스터디 그룹은 즉시(5분) 테스트에서 반복 테스트 그룹을 큰 폭으로 앞섰지만, 지연된 (1주일) 테스트에서는 반대 패턴이 관찰되었다. 구체적으로는 반복 테스트가 반복 연구보다 더 나은 장기 보존으로 이어졌다. 또한 시간이 지남에 따라 잊어버리는 것이 반복 학습 그룹에서 반복 실험 그룹보다 훨씬 더 두드러졌기 때문에 시험이 기억을 안정시키는 데 도움이 된다는 것이 분명했다. 1주일 리콜을 5분 리콜의 백분율로 구체적으로 고려할 때, 반복 학습과 반복 테스트가 각각 약 75%, 30%의 망각과 관련이 있다는 것을 발견했다(Wheeler, Ewers, & Buonanno, 2003).

In another study that provided a convincing demonstration of a learning-performance interaction as it relates to retrieval practice, one group of participants (repeated study) studied a 40-word list five consecutive times (SSSSS), whereas another group (repeated test) studied the list once before four consecutive recall tests (STTTT). Final recall tests were then administered to different groups of participants (from each group) after 5 min or 1 week. The repeated-study group outperformed the repeated-test group by a large margin on the immediate (5 min) test, but on the delayed (1 week) test, the opposite pattern was observed—specifically, repeated testing led to better long-term retention than did repeated studying. It was also clear that testing helped stabilize memory, as forgetting over time was far more pronounced in the repeated-study group than the repeated-test group. When specifically considering 1-week recall as a percentage of 5-min recall, researchers found that repeated studying and repeated testing were associated with approximately 75% and 30% forgetting, respectively (Wheeler, Ewers, & Buonanno, 2003).

지금까지 우리는 비교적 단순한 학습 자료(예: 단일 단어, 단어 쌍)를 사용한 테스트 효과에 대한 연구를 검토했다. 그러나 교육적으로 관련된 자료를 더 많이 사용할 경우 검색 연습이 학습과 성과에 차이를 줄 수 있다는 것도 분명하다. 그러한 연구 중 하나는 참가자들이 태양과 해달과 같은 일반적인 주제를 다루는 산문 구절을 처음 연구하는 것이었다. 한 가지 조건에서는 참가자들이 전체 지문을 다시 공부한 반면, 다른 조건에서는 참가자들이 피드백 없이 연구된 자료를 기억하는 능력에 대해 테스트를 받았다. 그런 다음 5분, 2일 또는 1주일 후에 각 조건의 다른 참가자 그룹에 최종 리콜 테스트를 시행했다. 그림 4와 같이 결과는 명확합니다. 5분 후, 지문을 다시 공부한 참가자들은 피드백 없이 중재 시험을 치른 참가자들보다 기억력이 더 좋았다. 그러나 지연된 보존 테스트에서는 테스트 그룹이 restudy 그룹보다 2일 1주 후에 더 많은 자료를 인출하는 등 상당한 반전이 있었으며, 이 결과는 이후 연구의 두 번째 실험에서 복제되고 확장되었다(Roediger & Karpicke, 2006b). 이 연구(및 이와 유사한 다른 연구)의 결과가 특히 인상적인 것은 최초 테스트 중에 테스트 조건의 참가자에게 피드백이 제공되지 않았다는 것이다. 즉, 시험 조건의 참가자는 처음에 기억할 수 있는 소재(약 70%)에만 재노출되었다. 반면, restudy 상태의 참가자들은 최종 보존 테스트 전에 전체 통로에 다시 노출되었다. 이러한 단점에도 불구하고, 테스트 그룹의 참가자들은 장기적으로 더 많은 정보를 보유했다.

Thus far, we have reviewed studies on the testing effect that have used relatively simple learning materials (e.g., single words, word pairs); however, it is also clear that retrieval practice can have differential effects on learning and performance when more educationally relevant materials are used. One such study involved participants first studying prose passages covering general topics, such as the sun and sea otters. In one condition, participants then restudied the passage in its entirety, whereas in another condition, participants were tested, without feedback, for their ability to recall the studied material. Final recall tests were then administered to different groups of participants from each condition after 5 min, 2 days, or 1 week. The results, which are shown in Figure 4, are clear. After 5 min, participants who restudied the passage showed better recall performance than did participants who took an intervening test without feedback. On the delayed retention tests, however, there was a significant reversal such that the tested group recalled more of the material after 2 days and 1 week than the restudy group, a finding that was subsequently replicated and extended in the study’s second experiment (Roediger & Karpicke, 2006b). What makes the results of this study (and others like it) particularly impressive is that no feedback was given to participants in the tested condition during the initial test, which means that participants in the test condition were reexposed only to the material they were initially able to recall—approximately 70% of the passage—whereas participants in the restudy condition were reexposed to the entire passage before the final retention tests. Despite this disadvantage, participants in the tested group retained more information over the long term.

 

테스트 효과와 밀접하게 관련된 현상인 생성 효과generation effect에 대한 연구도 검색 관행의 장기적 학습 이점을 지적한다. 전형적인 생성 실험에서 참가자들은 학습해야 할 항목을 직접 생성하도록 요구받습니다. 예를 들어, 단어를 제시했을 때 반대되는 항목을 생성함으로써(예: hot-)--?)—또는 단순히 항목을 읽습니다(예: 긴-짧은). 그 후, 일반적으로 단서 제시(hot---)로 구성된 나중에 유지 시험이 시행된다.?, 긴----?) 및 참가자에게 대응하는 목표(콜드, 쇼트)를 상기하도록 요구합니다. Slamecka와 Graf(1978; Jacoby, 1978 참조)는 의미 기억에서 [항목을 생성하는 것]이 [단순히 읽는 것]보다 학습에 더 낫다는 것을 최초로 입증한 것으로 종종 인정된다. 이 발견은 다양한 재료, 절차 및 결과 측정을 사용하여 수백 번 반복되었다. 현재 목적에서는 참가자들이 학습 단계(거의 발생하지 않음)에서 모든 생성 항목을 성공적으로 생성할 수 없는 한 생성된 항목은 각 항목 직후에 테스트를 수행한 경우 항상 판독 항목보다 획득 성능이 떨어집니다. 이는 테스트 효과 연구에서 실패한 인출 시도와 마찬가지로, 생성 시도가 실패하면 나중에 테스트될 재료에 노출되지 않기 때문입니다. 이러한 단기적인 [수행] 측면의 장애에도 불구하고, 생성(연습)은 여전히 장기 [학습]을 강화한다.

Research on the generation effect, a closely related phenomenon to the testing effect, also points to the long-term learning benefits of retrieval practice (for important differences between the generation effect and the testing effect, see Karpicke & Zaromb, 2010). In a typical generation experiment, participants are asked to either generate the to-be-learned items themselves—for example, by producing opposites when presented with a word (e.g., hot–???)—or to simply read the items (e.g., long–short). A later retention test is then administered, which usually consists of presenting the cues (hot–???, long–???) and asking participants to recall their corresponding targets (cold, short). Slamecka and Graf (1978; see also Jacoby, 1978) are often credited as the first to demonstrate that generating items from semantic memory is better for learning than simply reading them, a finding that has been replicated hundreds of times using various materials, procedures, and outcome measures (for a review, see Bertsch, Pesta, Wiscott, & McDaniel, 2007). For current purposes, it is important to note that unless participants can successfully generate every to-be-generated item during the study phase (which almost never happens), generated items will always be associated with worse acquisition performance than read items if a test was given immediately after each item. This is because, similar to unsuccessful retrieval attempts in testing-effect studies, unsuccessful generation attempts prevent exposure to the material that will be tested later. Despite this short-term performance hindrance, generation still enhances long-term learning.

학습-수행의 차이를 지지하는 더욱 설득력 있는 증거는 습득 중에 부정확할 것이 확실시되는 생성 시도로부터 학습이 이익을 얻을 수 있다는 연구로부터 나온 것이다(Kane & Anderson, 1978; Slamecka & Fevreiski, 1983).다시 한번 경험적인 관심을 가질 수 있습니다.
Even more compelling evidence in favor of the learning–performance distinction comes from research that has revealed that learning can profit from generation attempts that are assured to be incorrect during acquisition, a phenomenon that was demonstrated some time ago (Kane & Anderson, 1978; Slamecka & Fevreiski, 1983) and is now garnering considerable empirical attention once again (Grimaldi & Karpicke, 2012; Hays, Kornell, & Bjork, 2013; Huelser & Metcalfe, 2012; Knight, Ball, Brewer, DeWitt, & Marsh, 2012; Kornell, Hays, & Bjork, 2009; Potts & Shanks, 2014; Yan, Yu, Garcia, & Bjork, 2014).

[실패한 생성의 잠재적 편익]에 대한 이러한 관심의 부활은 참가자들이 약하게 연관된 단어 쌍을 연구하는 패러다임을 사용한 연구에 의해 촉발되었다. 그 중 일부는 연구를 위해 온전하게(예: 고래-동물) 제시되는 반면, 다른 일부는 참가자들에게 그 자체로 큐를 기반으로(예: 고래---)를 요구한다.?) 먼저 예측해야 할 반응을 예측합니다. 결정적으로, 실험자들은 약하게 연관된 쌍을 재료로 선택함으로써 참가자들이 거의 항상 정확한 표적을 추측하지 못하게 할 수 있습니다. 즉, 고래를 제시하면 참가자들은 거의 항상 포유류가 아닌 다른 것(예: 큰 것, 바다, 파란색)을 생성하게 된다. 그럼에도 불구하고, 이 패러다임을 사용하는 여러 실험 설계에 걸쳐, 인코딩 전에 실패한 인출 시도가 학습을 향상시키는 것으로 밝혀졌다(Kornell 등, 2009). 이 효과에 대한 한 가지 가능한 설명은, 학습된 응답을 예측하려고 하면 큐 워드(단서 단어)와 관련된 광범위한 의미 네트워크가 활성화되고, 큐에 대한 응답을 쉽게 연관시킬 수 있다는 것입니다. 보다 일반적으로, 본 연구는 반직관적으로 보일 수 있지만, 일부 상황에서는 [습득 중 오류가 발생하면 실제로 장기 보존이 촉진될 수 있다]는 것을 보여줍니다.

This resurgence in interest in the potential benefits of failed generation was spurred by research using a paradigm in which participants study weakly related word pairs, some of which are presented intact (e.g., whale–mammal) for study, whereas the others require that the participants, on the basis of the cue by itself (e.g., whale–???), first try to predict the to-be-learned response. Critically, by choosing weakly related pairs as the materials, experimenters can ensure that participants almost always fail to guess the correct target. That is, when presented with whale, participants will almost always generate something other than mammal (e.g., big, ocean, blue). Nevertheless, across multiple experimental designs using this paradigm, failed retrieval attempts prior to encoding were found to enhance learning (Kornell et al., 2009). One possible explanation for this effect is that attempting to predict the to-be-learned response activates the broad semantic network associated with the cue word, which, in turn, may facilitate associating the response to the cue (Grimaldi & Karpicke, 2012; Hays et al., 2013; Huelser & Metcalfe, 2012; but see Potts & Shanks, 2014). More generally, this research indicates—as counterintuitive as it may seem—that the production of errors during acquisition can, under some circumstances, actually boost long-term retention.

요약
Summary

운동 및 구두 학습 영역의 증거는 [인출 연습]이 [학습]과 [수행]에 반대되는 영향을 미칠 수 있다는 것을 보여준다. 운동 학습 연구에 따르면 전반적으로 [신체적 가이드는 훈련 중 수행 오류를 감소시키지만, 가이드 없는 능동적 참여는 더 나은 장기 기술 유지를 촉진한다는 것]이 밝혀졌다. 마찬가지로, 언어 자료의 검색을 연습하는 것은 획득 중이나 즉각적인 기억 테스트에 도움이 되지 않는 것처럼 보일 수 있지만, 장기 기억을 보존하거나 안정시키는 데 상당한 이점을 제공합니다. 따라서 트레이너와 강사가 인출 연습을 커리큘럼에 포함시키고 학생들이 자신의 학습을 최적화하기 위한 수단으로 자신을 테스트하는 것은 신중해 보일 것이다.
Evidence from both the motor- and verbal-learning domains shows that retrieval practice can have opposing effects on learning and performance. Motor-learning studies have revealed that, on the whole, physical guidance often reduces performance errors during training but that unguided, active involvement promotes better long-term retention of skills. Likewise, practicing retrieval of verbal materials may appear unhelpful during acquisition and on immediate memory tests, but it provides substantial benefits in preserving or stabilizing long-term memory. It would seem prudent, therefore, that trainers and instructors incorporate retrieval practice into their curriculum and that students test themselves as a means to optimize their own learning.

 

메타인지
Metacognition

교육자와 학생은 어떤 활동이 오래 지속되는 학습에 도움이 되는지 어느 정도 알고 있습니까? 특히, 학습자가 자신의 자율 학습을 최적의 방법으로 관리하기 위해 알아야 할 것은 무엇인가? 이러한 중요한 질문은 [메타인지]와 관련이 있으며, 이는 넓게 해석하면 사고에 대해 생각하는 것을 의미한다(Nelson, 1996 참조). 학습과 기억의 영역에서, 구체적으로 다음을 나타낸다.

  • (a) 학습과 기억의 작동 방식에 대한 지식과 이해
  • (b) 자신의 지속적인 학습과 기억 또는 타인의 학습과 기억의 모니터링과 통제 사이의 상호작용

To what extent are educators and students aware of what activities are beneficial for long-lasting learning? In particular, what does a learner need to know to manage his or her own self-regulated learning in an optimal way? These important questions concern metacognition, which, broadly construed, refers to thinking about thinking (see Nelson, 1996). In the domain of learning and memory, it denotes more specifically

주관적 경험이 후속 행동을 결정하는 데 인과적 역할을 하기 때문에, 사람들이 자신의 학습에 대해 어떻게 생각하고 감시하는지를 설명하는 것이 가장 중요하다. (예를 들어, 어떤 자료를 재보존해야 하는지, 그리고 얼마 동안 재보존해야 하는지를 결정하는 것). 또한, 그래서 그러한 행동의 적절성은 [학습자의 주관적 경험의 의미와 타당성]에 따라 결정된다(Nelson & Narens, 1990 참조).

Elucidating how people think about and monitor their own learning is paramount because subjective experience plays a causal role in determining subsequent behavior (e.g., deciding what material should be restudied and for what duration), and thus the appropriateness of such behavior will necessarily depend on the meaning and validity of learners’ subjective experiences (see Nelson & Narens, 1990).

학습과 수행이 분리될 수 있다는 압도적인 경험적 증거에도 불구하고, [습득 중 성과]가 [장기 학습]의 [매우 불완전한 지표]라는 것은 교수자와 학습자 모두에게 이해하기 어려운 것으로 보인다. 그 결과 학습에 효과적인 것은 학습에 효과적이라고 생각하는 것에 대한 메타인지 평가와 종종 잘못 조정된다(리뷰는 R. A. Bjork, 1999 참조). 이러한 단절은 학습에 대한 학생들의 믿음 조사에서 명확히 입증되었다. 예를 들어, 한 연구에서는 경험적으로 지원되는 6가지 학습 전략에 대한 학부생의 인식을 조사했는데, 이 중 3가지(스페이스 대 매스, 테스트 대 리스터디, 생성 대 리딩)는 이 리뷰의 이전 섹션에서 논의했습니다. 압도적으로 학생들은 [단기 수행성과]를 향상시키는 것으로 알려진 전략을 가장 효과적이라고 지지했다. 이는 학생들이 집중 학습과 간격 학습 중 하나를 선택할 때 두드러지게 나타나는 패턴이다. 조사 대상 학생의 93.33%가 간격 학습보다 집중 학습에 더 효과적이라고 잘못 지지했다(J. McCa).be, 2011). 연구 관점에서 볼 때, 간격두기 효과는 지난 세기에 수백 번 입증되었으며 모든 기억 연구에서 가장 강력하고 신뢰할 수 있는 효과 중 하나로 부상했다는 점을 고려하면 이는 상당히 주목할 만한(그리고 놀라운) 것입니다. 다행히도, 이 같은 연구는 인지 과정이나 효과적인 학습 기법에 대한 표적 지도와 같은 교육 개입이 이러한 오해를 개선하는 데 도움이 된다는 사실도 밝혀냈다.

Although there is overwhelming empirical evidence that learning and performance are dissociable, there appears to be a lack of understanding on the part of instructors and learners alike that performance during acquisition is a highly imperfect index of long-term learning. As a consequence, what is effective for learning is often misaligned with our metacognitive assessments of what we think is effective for learning (for a review, see R. A. Bjork, 1999). This disconnect has been clearly demonstrated in surveys of students’ beliefs about learning. For example, one study investigated undergraduates’ awareness of six empirically supported learning strategies, three of which—spacing versus massing, testing versus restudying, and generating versus reading—we have discussed in earlier sections of this review. Overwhelmingly, students endorsed as most effective those strategies known to enhance short-term performance, a pattern that was strikingly evident when students were confronted with choosing between massed or spaced study: 93.33% of surveyed students incorrectly endorsed massed study as being more effective for learning than spaced study (J. McCabe, 2011). From a research perspective, this is quite remarkable (and alarming) considering that the spacing effect has been demonstrated hundreds of times in the past century and has emerged as one of the most robust and reliable effects in all of memory research. Fortunately, this same study also found that educational interventions—for example, a cognition course or targeted instruction on effective learning techniques—helped ameliorate these misconceptions.

다른 설문조사는 학생들이 어떻게 스스로 공부하는지 조사했다. 예를 들어, 대학생 472명을 대상으로 한 설문조사에서 대부분의 학생들이 재독서rereading 전략을 사용하여 보고한 것으로 나타났다. 또한, 90%의 학생이 자가 테스트를 사용한다고 보고했지만, 대부분의 학생은 자가 테스트가 직접적인 학습 이점을 제공한다고 믿기 보다는 지식의 차이를 식별하기 위해 그렇게 보고했습니다. 또, 64%의 학생이, 한번 습득했다고 느끼면, 그 자료를 재검토하지 않는다고 응답한 반면, 36%의 학생만이, 그 정보에 대해 재검증 또는 테스트한다고 응답했습니다(Kornell & Bjork, 2007년, 같은 결과에 대해서는, Hartwig & Dunlosky, 2012 참조). 또 다른 설문조사는 학생들이 재독서에 비해 검색 연습의 이점을 일반적으로 알지 못하는 것으로 나타났다. 자신의 학습 전략을 보고하고 순위를 매기도록 요구받았을 때, 84%의 학생이 재독서를 선택한 전략 중 하나로 꼽은 반면, 11%의 학생들만이 검색 연습을 전혀 사용하지 않는다고 보고했습니다(Karpicke, Butler, & Roediger, 2009). 학생들은 재독서가 학습의 지표로 잘못 해석되는 자료에 대한 높은 유창함이나 친숙함을 만들어 내기 때문에 재독서를 선호한다는 주장이 있었다. 다시 말해, 학생들은 재독서가 상대적으로 더 큰 성과로 이어지기 때문에 재독서를 선호하는 것처럼 보인다.

Other surveys have investigated how students study on their own. For example, a survey of 472 college students found that most students reported using a rereading strategy. Additionally, although 90% of students reported using self-testing, most them reported doing so in order to identify gaps in their knowledge, rather than because they believed that self-testing conferred a direct learning benefit. Moreover, 64% of students reported not revisiting material once they felt like they had mastered it, while only 36% of students reported that they would restudy or test themselves later on that information (Kornell & Bjork, 2007; for similar results, see Hartwig & Dunlosky, 2012). Another survey showed that students are generally unaware of the benefits of retrieval practice compared with rereading. When asked to report and rank their own study strategies, 84% of students ranked rereading as one of their strategies of choice, whereas only 11% of students reported using retrieval practice at all (Karpicke, Butler, & Roediger, 2009). It was argued that students prefer rereading because it produces a heightened sense of fluency or familiarity with the material, which students misinterpret as an index of learning. In other words, students seem to favor rereading because it leads to relatively greater perceived gains in performance.

능력에 대한 유사한 환상은 사람들이 자신의 학습을 모니터링하거나 평가할 수 있는 방법과 정도를 조사한 연구에서 입증되었다. 그러한 실험 연구는 후향적 판단retrospective judgments과 전향적 판단prospective judgments을 모두 사용해 왔다. 후향적 판단, 즉 과거의 경험을 평가해야 하는 학습의 주관적 평가와 관련하여, 사람들은 종종 상대적으로 비효율적인 학습 조건을 지지하는 잘못을 범한다. 예를 들어 영국 우체국 직원을 대상으로 한 Baddeley와 Longman의 연구(1978)에서는 데이터 입력(즉, 키 입력) 기술의 장기 보유를 위해 분산 연습이 매스하는 것보다 더 나았다. 그러나 분산 연습 그룹의 학습자는 자신이 몰아치기 연습 그룹에 비해서 실패했다고 느꼈기 때문에 상대적으로 훈련에 덜 만족한다고 보고했다. 사실 이는 획득 단계에서 사실이었다. 따라서 학습자들은 [단기 수행성과]를 [장기 학습]에 대한 신뢰할 수 있는 가이드로 해석하는 것으로 보인다.

Similar illusions of competence have been demonstrated in research that has examined how and to what degree of accuracy people can monitor or evaluate their own learning. Such experimental research has used both retrospective and prospective judgments. With respect to retrospective judgments—that is, subjective evaluations of learning that require the learner to assess some past experience—people often erroneously endorse relatively ineffective conditions of learning. In Baddeley and Longman’s (1978) study involving British postal workers, for example, distributing practice was better than massing it for the long-term retention of data entry (i.e., keystroke) skills; however, learners in the distributed-practice group reported being relatively less satisfied with their training because they felt they were falling behind the massed-practice group, which, in fact, was true during the acquisition phase. Thus, learners appear to interpret short-term performance as a reliable guide to long-term learning.


이러한 편향된 루향적 판단은 귀납적 학습 테스트 후에도 나타났다. 예를 들어, 한 연구에서 참가자들은 학습 일정에 따라 화가의 그림 스타일을 학습했습니다. 즉, 화가의 모든 그림은 새로운 화가의 그림으로 넘어가기 전에 연속적으로 제시되었습니다. 즉, 여러 화가의 그림이 함께 섞였습니다. 마지막 유도 테스트에서, 참가자들은 새로운 그림을 제시받았고 이전에 공부했던 화가들 중 누가 그 그림을 그렸는지 확인하도록 요구받았다. 이러한 테스트는 귀납적 학습의 테스트로 간주되는데, 이러한 테스트에서 성공하려면 일련의 예시로부터 화가의 일반적인 그림 스타일을 추출해야 하기 때문이다. 그 결과 귀납적 학습은 집중적인 학습 스케줄에 비해 간격이 있는 학습 스케줄에 의해 향상되는 것으로 나타났다. 그러나 흥미로운 점은 인덕션 테스트 후에 어떤 학습 일정이 학습에 도움이 되었는지를 물었을 때 압도적 다수의 참가자가 '몰아치기'를 지지한다는 것이다(Kornell & Bjork, 2008). 이 결과는 참가자들이 인터리빙을 통해 학습에 도움이 되는 테스트를 이미 경험했다는 점을 고려하면 더욱 주목할 만하다. 귀납적 학습에 대한 후속 연구는 학습자가 자신의 학습 일정을 선택할 수 있는 경우 매스매싱을 선호하는 것으로 나타났다(Tauber, Dunlosky, Rawson, Wahlheim, 2013). 따라서 몰아치기massing는 [학습]이라고 잘못 해석되는 [습득 수행 중의 유창함]을 만들어 낼 뿐만 아니라, 학습자들은 학습을 몰아치기massing하는 것이 효과적인 학습 방법이라는 잘못된 이론을 가지고 있는 것 같다.
Such biased retrospective judgments have also been shown after tests of inductive learning. In one study, for example, participants learned artists’ painting styles according to a study schedule that was either massed (blocked)—that is, every painting from an artist was presented successively before moving on to the paintings from a new artist—or spaced (interleaved)—that is, paintings from several artists were mixed together. On a final induction test, participants were presented with new paintings and were asked to identify which of the previously studied artists painted them. Such a test is considered a test of inductive learning because success on such a test requires one to have extracted the artists’ general painting styles from sets of exemplars. The results clearly showed that inductive learning was enhanced by the spaced study schedule compared with the massed schedule. It is interesting to note, however, that when asked after the induction test which study schedule helped them learn better, an overwhelming majority of participants endorsed massing (Kornell & Bjork, 2008). This finding is all the more remarkable given that participants had already experienced the test in which their learning profited from interleaving. Subsequent research on inductive learning has demonstrated that learners, when permitted to choose their own study schedule, also prefer massing (Tauber, Dunlosky, Rawson, Wahlheim, & Jacoby, 2013). Thus, not only does massing produce a sense of fluency during acquisition performance that is misinterpreted as learning, but learners also seem to hold the misguided theory that massing one’s study is an effective way to learn.

회고적 판단처럼, [전향적 메타인지 판단]도 단기 성과에 의해 큰 영향을 받을 수 있습니다. 현재 목적에서 가장 관련성이 높은 사전 판단은 그리고 현대 메타인지 연구에서 가장 경험적인 관심을 끄는 판단은 [학습의 판단judgment of learning (JOL)]이며, 일반적으로 획득 또는 인코딩 단계에서 요청된다. 여기서 학습자는 일부 정보가 나중에 기억될 가능성을 (보통 0%~100% 규모로) 예측해야 합니다. 즉, JOL은 학습자가 자신의 학습을 예측하는 것이다. 이러한 예측을 수집하면 학습자가 학습한 정보와 학습하지 않은 정보를 결정하는 방법과 이러한 예측이 이후의 테스트에서 실제 학습과 얼마나 잘 일치하는지를 조사할 수 있습니다. 언어 학습에 대한 일부 초기 연구는 JOL이 실제 학습을 비교적 잘 예측했다는 것을 보여주었지만, 이 영역의 보다 최근의 JOL 문헌은 [사람들의 즉각적인 JOL은 미래 학습에 대해 진단하지 않으며, 역량에 대한 놀라운 환상을 드러내고 JOL이 기억력이 아닌 단서에 기초하는, 본질적으로 추론적인 것]이라는 설득력 있는 증거를 드러낸다. 이제 학습자의 JOL이 학습에 대한 오해를 드러낸 몇 가지 예에 대해 논의합니다(자세한 내용은 Schwartz & Efklides, 2012 참조).

Prospective metacognitive judgments, like retrospective ones, can also be heavily influenced by short-term performance. For current purposes, the most relevant prospective judgment—and the one that garners the most empirical attention in contemporary metacognitive research—is the judgment of learning (JOL), which is typically solicited during an acquisition, or encoding, phase. Here, learners are asked to predict—usually on a 0%–100% scale—the likelihood that some information will be remembered later. In other words, JOLs involve learners predicting their own learning. Collecting such predictions permits an examination of how learners decide which information has been learned and which has not and how well those predictions correspond to actual learning on a later test. Although some early work on verbal learning showed that JOLs predicted actual learning relatively well (e.g., Arbuckle & Cuddy, 1969), the more recent JOL literature in this domain is rife with examples in which people’s immediate JOLs are not diagnostic of future learning (e.g., Benjamin, Bjork, & Schwartz, 1998; Castel, McCabe, & Roediger, 2007; Koriat & Bjork, 2005; Koriat, Bjork, Sheffer, & Bar, 2004; Mazzoni & Nelson, 1995; Rhodes & Castel, 2008; Roediger & Karpicke, 2006b; Soderstrom & McCabe, 2011; Yue, Castel, & Bjork, 2013), revealing striking illusions of competence and compelling evidence that JOLs are inferential in nature, based on cues rather than on memory strength (see Koriat, 1997). We now discuss several examples in which learners’ JOLs have exposed misconceptions about learning (for a more comprehensive review, see Schwartz & Efklides, 2012).

일반적으로, 학습자는 자신의 학습을 예측하는 데 과신하는 경향이 있으며, 안정성 편향stability bias이라고 불리는 것을 정기적으로 보여주는 경향이 있다. 이것은 검색된 정보(즉, 성과)의 현재 접근성이 시간에 걸쳐 안정되어 있을 것이라고 믿는 경향이 있다. 나중의 학습을 강화하다 안정성 편향의 특히 두드러진 예를 보여준 연구에서 참가자들은 관련 단어 쌍과 관련 없는 단어 쌍을 연구하여 각 항목 뒤에 JOL을 만들었다. 다른 그룹의 참가자들에게 즉시 테스트, 1일 후 테스트 또는 1주일 후 테스트를 통해 쌍을 얼마나 잘 기억하는지 예측하도록 요청했습니다. 그림 5에서 볼 수 있듯이, 참가자들은 보존 간격에 대한 명백한 무감각함을 나타내는 결과 패턴을 만들었습니다. 구체적으로는, 3개의 보존 간격에 걸쳐 동등한 JOL이 주어졌습니다. 그러나, 예상대로, 실제 리콜은 보존 간격의 함수로 감소하였다. 또한 그림 5에서는 JOL이 단어 쌍의 관련성에 매우 민감했기 때문에 저자들은 JOL의 유창성, 즉 연구 중에 정보가 얼마나 쉽게 처리되는지에 대한 결론을 내릴 수 있었습니다. 다른 매우 관련성이 높은 정보를 희생하더라도 JOL을 크게 촉진할 수 있습니다. 이 경우에는 보존 간격입니다.

Generally speaking, learners tend to be overconfident in predicting their own learning and regularly exhibit what has been termed the stability bias, which refers to the tendency to believe that current accessibility of retrieved information (i.e., performance) will remain stable across time, rather than appreciating those factors that may impair or enhance later learning (Kornell & Bjork, 2009; see also Ariel, Hines, & Hertzog, 2014; Kornell, 2011). In a study that demonstrated a particularly striking example of a stability bias, participants studied related and unrelated word pairs, making JOLs after each item. Separate groups of participants were asked to base their predictions on how well they would remember the pairs on an immediate test, a test after 1 day, or a test after 1 week. As illustrated in Figure 5, participants produced a pattern of results demonstrating apparent insensitivity to retention interval—specifically, equivalent JOLs were given across the three retention intervals. However, and as expected, actual recall decreased as a function of retention interval. Also evident in Figure 5 is that JOLs were highly sensitivity to the relatedness of the word pairs, which led the authors to conclude that encoding fluency, or how easily information is processed during study, can largely drive JOLs (Koriat et al., 2004; see also Begg, Duft, Lalonde, Melnick, & Sanvito, 1989; Koriat, 2008; Undorf & Erdfelder, 2011; for an alternative account, see Mueller, Tauber, & Dunlosky, 2013), even at the expense of other extremely relevant information—in this case, retention interval.

 

다른 연구에서는 [인코딩 유창성]과 같이 [인출 유창성retrieval fluency] (즉, 획득 단계에서 기억되는 정보가 얼마나 쉽게 검색되는지)이 JOL 크기에 영향을 미칠 수 있다는 추측을 뒷받침한다(예: Benjamin 등, 1998; Hertzog, Dunlosky, Robinson, & Kidder, 2003 참조). 이에 대한 한 시연에서, 참가자들은 비교적 쉬운 일반 지식 질문에 답했고, 그 후 항목별로 그들이 나중에 무료 호출 테스트에서 주어진 답을 기억해 낼 수 있을 가능성, 즉 그들이 쿼 없이 특정 답을 제시했을 가능성을 예측했다.스틱이 다시 제공되고 있습니다. 그 결과 생성에 가장 짧은 시간이 걸린 응답은 느리게 생성된 응답에 비해 더 높은 JOL이 주어졌습니다. 다시 말해, 참가자들은 단기적인 수행성능(이 경우, 검색 대기 시간)에 따라 JOL을 작성했습니다. 그러나 나중에 리콜을 실시한 결과 반대의 양상을 보였다. 생성에 더 오랜 시간이 걸린 답변은 생성된 답변보다 더 빠른 속도로 리콜되었다. 아마도 답변 생성에 관련된 노력이 후속 리콜과 긍정적으로 관련되어 있기 때문이다(Benjamin et al., 1998). 따라서 [인출 유창성]이 JOL 및나중의 리콜과 관련이 있지만, 이 관계의 방향은 주관적으로 평가(JOL을 통해)되거나 객관적으로 평가(최종 리콜을 통해)되었는지에 따라 달랐으며, 이는 무엇보다도 학습자는 [단기 수행성과에 대한 이득]에 빠져 있으며, 그러한 이득을 [장기 학습의 이득]과 그릇되게 혼동할 수 있음을 보여준다.

Other research supports the conjecture that retrieval fluency (i.e., how easily to-be-remembered information is retrieved during an acquisition phase), like encoding fluency, can also influence JOL magnitude (see, e.g., Benjamin et al., 1998; Hertzog, Dunlosky, Robinson, & Kidder, 2003). In one demonstration of this, participants answered relatively easy general-knowledge questions, after which time they predicted, on an item-by-item basis, the likelihood that they would be able to recall a given answer on a later free-recall test—that is, the likelihood they would be able to recall having given a particular answer without the question being provided again. The results indicated that answers that took the shortest time to generate were given higher JOLs compared with those answers that were generated slowly. In other words, participants based their JOLs on short-term performance—in this case, retrieval latency. Later recall, however, showed the opposite pattern: Answers that took a longer time to generate were recalled at a higher rate than were answers generated more quickly, presumably because the effort involved in generating an answer is positively related with its subsequent recall (Benjamin et al., 1998). Thus, while retrieval fluency was related to both JOLs and later recall, the direction of this relationship differed whether it was assessed subjectively (via JOLs) or objectively (via final recall), demonstrating, among other things, that learners are captured by gains in short-term performance and can mistakenly conflate such gains with long-term learning.

일반적으로, 학습자에게는 인출의 이득도 인식되지 않는다(예: Karpicke, 2009; Kornell & Son, 2009 참조). 앞에서 설명한 바와 같이 테스트 효과는 [인출 연습이 학습 이벤트로 작용하여, 인출된 정보를 (그렇지 않은 경우보다) 미래에 더 기억하기 쉽게 만든다는 것]을 의미한다(Roediger & Karpicke, 2006a 참조). 참가자들이 산문 구절을 연구한 후 해당 구절에 대한 테스트를 받았거나 다시 수행한 Roediger와 Karpicke(2006b) 연구에서, 장기 보존을 학습 단계로부터 1주일 후에 측정했을 때, [획득 시 테스트 기회의 함수]로 증가했다. 그러나 참가자들은 반대 패턴, 특히 1주일 후에, 시험 없이 여러 번 지문을 학습했을 때 가장 좋을 것이라고 예측했다. 이는 사실상 단기(5분 이후)적으로 확인되는 수행의 패턴이다. 학습자들은 (단기)수행성능을 향상시키는 것이 무엇이든 장기적인 유지에도 도움이 된다고 생각하는 것 같습니다.
The benefits of retrieval, more generally, are not appreciated by learners either (see, e.g., Karpicke, 2009; Kornell & Son, 2009). As discussed previously, the testing effect refers to the finding that retrieval practice acts as a learning event, rendering retrieved information more recallable in the future than it would have been otherwise (see Roediger & Karpicke, 2006a). In Roediger and Karpicke’s (2006b) study in which participants studied prose passages and then were either tested on those passages or restudied them, long-term retention, measured 1 week after the study phase, increased as a function of testing opportunities during acquisition. However, participants predicted the opposite pattern—specifically, that learning after 1 week would be best when the passages were studied multiple times without being tested, a pattern of performance that was, in fact, demonstrated in the short term (after 5 min). Again, learners seem to assume that whatever boosts performance will also profit long-term retention.

마지막으로, [간격 있는(분산된) 일정]에 비해 [집중된(블록된) 일정]으로 학습하거나 연습된 자료 및 기술에 더 높은 JOL이 부여된다. 한 가지 예에서 참가자들은 기억해야 할 단어 목록을 제공받았다. 목록 내에서 각 항목의 두 번째 반복은 첫 번째 프레젠테이션 직후(대량화) 또는 여러 다른 항목 뒤에(스페이스화) 발생하였다. 참가자들은 집적된 항목이 간격 있는 항목보다 더 잘 기억될 것이라고 예상했지만, 실제 리콜은 그 반대 패턴을 보였다(Zechmeister & Shaughnessy, 1980). 이후 간단한 키 입력 패턴 학습에서도 유사한 결과가 발견되었습니다. 분산된 연습이 키 입력 학습에서 상대적으로 더 큰 장기적 이익으로 이어졌음에도 불구하고, 참가자들은 단기 성능을 향상시킨 연습 블록이 지연 후에 더 나을 것이라고 예측했다(Simon & Bjork, 2001). JOL과 실제 학습의 불일치(사람의 JOL은 집단 연습을 선호하지만 실제 학습은 분산 연습을 통해 더 많은 이익을 얻는다는 점)는 피아노 선율을 학습하기 위해 재현되었습니다(Abushanab & Bishara, 2013). 
Finally, as is the case with retrospective judgments, higher JOLs are given to material or skills that are studied or practiced in a massed (blocked) schedule compared with a spaced (distributed) schedule. In one example, participants were presented with a list of to-be-remembered words. Within the list, a second repetition of each item occurred either immediately after its first presentation (massed) or following a number of other items (spaced). Participants predicted that the massed items would be better remembered than the spaced items, whereas actual recall showed the opposite pattern (Zechmeister & Shaughnessy, 1980). An analogous result was subsequently found for the learning of simple keystroke patterns: Despite the fact that distributed practice led to relatively greater long-term gains in learning the keystrokes, participants predicted that blocked practice—which did boost short-term performance—would be better after a delay (Simon & Bjork, 2001). This mismatch between JOLs and actual learning—that people’s JOLs favor massed practice, whereas actual learning profits more from distributed practice—has also been replicated for the learning of piano melodies (Abushanab & Bishara, 2013).

일반적으로 사람들은 어떤 활동이 장기 보존에 도움이 되는지 알지 못하고, 학습자가 자신의 지속적인 학습을 정확하게 모니터링하는 데 어려움을 겪는다는 점을 고려할 때, 자기조절학습을 최적화하기 위해 메타인지적 정교함을 촉진하는 방법을 식별하는 것이 중요하다(R. A. Bjork 등, 2013 참조). 예를 들어, 강사와 학생은 장기 학습을 촉진하는 학습 전략의 유형을 숙지해야 합니다(이 중 일부는 현재 리뷰에서 이미 논의한 내용입니다). 교사들이 그러한 전략의 사용을 장려하거나, 학생들이 그러한 전략을 채택 할 것으로 기대하기는 쉽지 않다. 또한 메타인지 연구는 학습자가 [정확한 예측]을 할 수 있고, 그 결과로 효과적인 관리자가 될 수 있도록, [사람들의 모니터링 능력을 향상시키는 방법]을 찾기 위해 노력해야 한다. 다행히도, 이 주제에 대한 연구의 수는 증가하고 있으며, 이러한 작업의 중요성을 고려할 때 우리가 바라는 추세는 계속된다.

Given that people are generally unaware of what activities are beneficial for long-term retention and that learners, by and large, have trouble accurately monitoring their own ongoing learning, it is important to identify ways to foster metacognitive sophistication in order to optimize self-regulated learning (see R. A. Bjork et al., 2013). Instructors and students, for example, need to become familiar with the types of learning strategies that promote long-term learning—some of which we have already discussed in the present review—before we can expect the use of such strategies to be encouraged by teachers or adopted by their pupils (for a review of the utility of various study strategies, see Dunlosky, Rawson, Marsh, Nathan, & Willingham, 2013). As well, research in metacognition should endeavor to find methods of improving people’s monitoring capabilities such that learners become accurate forecasters and, as a result, effective managers, of their own ongoing learning. Fortunately, the number of studies on this topic is mounting (e.g., Castel, 2008; DeWinstanley & Bjork, 2004; Koriat & Bjork, 2006; D. P. McCabe & Soderstrom, 2011; Nelson & Dunlosky, 1991; Soderstrom & Bjork, 2014; Soderstrom & Rhodes, 2014; Thiede & Anderson, 2003; Tullis, Finley, & Benjamin, 2013), a trend that we hope continues given the importance of such work.

 

요약
Summary

메타인식에 대한 조사와 실험 연구 모두 학습자들은 [단기 수행성과]를 [장기 학습]과 혼동하고, 표면적으로는 "지금 도움이 된다면 나중에 도움이 될 것이다."라고 생각한다는 것을 밝혀냈다. 학습에 대한 믿음에 대한 현존하는 조사 문헌은 대체로 학생들이 [단기적인 성과 향상을 가져올 수 있지만] [장기적인 학습을 촉진하지는 않는 전략]을 지지하고 사용한다는 것을 시사한다. 마찬가지로, 사람들이 자신의 진행 중인 학습을 어떻게 감시하는지를 조사한 연구는 소급적 판단과 전향적 판단 모두 종종 역량에 대한 두드러진 환상을 낳는 편견인 획득 요인에 의해 크게 영향을 받는다는 것을 밝혀냈다. 사람들은 그들의 주관적인 경험에 따라 행동하기 때문에, 효과적인 학습이 수반되는 것을 알고 배우는 방법을 배우는 것이 필수적이다. 그러한 메타인지적 정교함은 교육 초기에 길러지는 것도 중요하다.
Both survey and experimental research in metacognition have revealed that learners often mistakenly conflate short-term performance with long-term learning, ostensibly thinking, “If it’s helping me now, it will help me later.” The extant survey literature on beliefs about learning suggests that students, by and large, endorse and use strategies that may confer short-term performance gains but do not foster long-term learning. Likewise, research that has examined how people monitor their own ongoing learning has revealed that both retrospective and prospective judgments are heavily influenced by acquisition factors, a bias that often produces striking illusions of competence. Given that people act on their subjective experiences, it is imperative that people learn how to learn by becoming knowledgeable of what effective learning entails. It is important, too, that such metacognitive sophistication is fostered early on in one’s education.

 

현대 이론의 관점
Contemporary Theoretical Perspectives

앞서 논의한 바와 같이, 수십 년 전의 학습 이론가들(예: Estes, 1955a; Guthrie, 1952; Hull, 1943; Skinner, 1938; Tolman, 1932; Tulving & Pearlstone, 1966)은 학습과 수행성과를 구별하는 그들 자신의 이론에서 용어를 사용했다. 잠복학습, 과잉학습, 피로에 대한 초기 연구를 고려할 때, 이러한 구별은 필요했습니다. 운동 및 언어 학습 영역에서 보다 최근의 경험적 작업을 설명하기 위해, 현대 학습 이론가들은 또한 [장기 학습을 특징짓는, 행동과 지식의 비교적 영구적인 변화와 훈련] 또는 [획득 과정에서 발생하는 성과에 대한 일시적인 변동]을 구별한다. 이 검토의 이전 섹션에서 보고된 여러 경험적 발견 중 몇 가지에 대한 가능한 설명을 간략히 언급했지만, 이제 학습과 수행의 차이를 다루는 지배적인 현대 학습 이론에 대해 더 자세히 논의한다.
As discussed earlier, learning theorists from decades ago (e.g., Estes, 1955a; Guthrie, 1952; Hull, 1943; Skinner, 1938; Tolman, 1932; Tulving & Pearlstone, 1966) used terms in their own theories that distinguished between learning and performance. Given the early research on latent learning, overlearning, and fatigue, this distinction was necessary. To account for more recent empirical work in the motor- and verbal-learning domains, contemporary learning theorists also differentiate between the relatively permanent changes in behavior and knowledge that characterize long-term learning and the temporary fluctuations in performance that occur across the training or acquisition process. Although we briefly mentioned possible explanations of several of the various empirical findings reported in previous sections of this review, we now discuss in more detail the dominant contemporary learning theories that address the distinction between learning and performance.

R. A. 비요크와 비요크(1992)는 광범위한 기본적인 인간 학습 현상에 대한 설명을 공식화하기 위해 [저장 강도]와 [인출 강도]의 용어를 도입하여 새로운 불용 이론theory of disuse에서 학습-수행 차이를 부활시켰다.

  • [저장 강도]는 기억 표상(지식 및 절차)이 다른 기억 표상과 [통합되거나 확립되는 정도]를 의미하며,
  • [인출 강도]는 [현재의 정신적 및 환경적 단서]가 주어졌을 때, 현재 [기억 표상]에 대한 접근 또는 활성화가 얼마나 용이한지를 의미한다.

R. A. Bjork and Bjork (1992), in an attempt to formulate an account of a wide range of fundamental human learning phenomena, resurrected the learning–performance distinction in their new theory of disuse by introducing the terms storage strength and retrieval strength.

  • Storage strength refers to the degree to which memory representations (i.e., knowledge and procedures) are integrated or entrenched with other memory representations, whereas
  • retrieval strength represents the current ease of access or activation of those memory representations given current mental and environmental cues.

[현재 수행성능]은 관찰할 수 있으며, [인출 강도]에 따라 지수화됩니다. [장기 학습]은 [저장 강도]에 따라 색인화되며, 
이는 [학습 또는 실습 기회 동안 검색 강도의 이득을 향상]시키거나, [시간 및 개입 및 간섭 사건에 따른 인출 강도의 손실을 막음]으로써 [잠재 변수]로 작용한다.
또한 [인출 용량]과 달리 [저장 용량]은 무한하며 한 번 축적되면 손실되지 않는 것으로 간주됩니다. 기억의 [저장 강도]가 영구적이라는 후자의 가정은 Bjork와 Bjork의 새로운 불용 이론이 Thorndike의 본래 불용 법칙(1914)과 다른 점이다. Thorndike는 [기억]은 계속 사용하지 않으면 시간이 지남에 따라 기억은 부패하고 결국 완전히 사라질 수 있다고 주장했다.

Current performance, which can be observed, is indexed by retrieval strength, whereas long-term learning is indexed by storage strength, which acts as a latent variable by enhancing the gain of retrieval strength during opportunities for study or practice and impeding the loss of retrieval strength across time and intervening or interfering events. Furthermore, storage capacity, unlike retrieval capacity, is assumed to be limitless and, once accumulated, never lost. This latter assumption—that the storage strength of memories are permanent—distinguishes Bjork and Bjork’s new theory of disuse from Thorndike’s (1914) original law of disuse, which asserted that memories, without continued use, will decay over time and can eventually disappear entirely.

[새로운 불용 이론]에 따르면, [저장 강도]의 증가는 현재 [인출 강도]의 음의 가속 함수로 표현됩니다. 즉, 스터디 또는 테스트 이벤트가 발생할 때 메모리에 더 쉽게 액세스할 수 있는 표현이 많을수록 이러한 표현에 대한 [저장 강도]의 이득을 덜 얻을 수 있습니다.

  • 따라서 현재의 [인출 강도]를 높이는 조건은 [단기적으로는 성과에 도움]이 될 수 있지만, [장기 학습]을 특징짓는 [영구적 유형의 변화]를 생성하지는 못할 것이다.
  • 이와는 대조적으로 현재의 [인출 강도]를 감소시키는 상황(즉, 잊어버리는 것을 발생시키는 상황)은 예를 들어 학습 또는 연습 세션을 분산하고, 학습 조건을 변화시키며(일정성을 유지하는 것이 아니라), 인출 연습을 장려하는(재학습에 비해) 것은 [저장 강도]에서 상대적으로 더 큰 이득을 가져오고, 장기 보존 및 전이가 강화됩니다.

According to the new theory of disuse, gains in storage strength are expressed as a negatively accelerated function of current retrieval strength—that is, the more accessible representations are in memory when study or test events occur, the less gains in storage strength can be achieved for those representations.

  • Consequently, conditions that increase current retrieval strength might benefit performance in the short term but will fail to produce the type of permanent changes that characterize long-term learning.
  • In contrast, situations that reduce current retrieval strength (i.e., produce forgetting)—for example, distributing study or practice sessions (as opposed to massing them), varying the conditions of learning (as opposed to keeping them constant), and encouraging retrieval practice (as opposed to restudy)—yield relatively greater gains in storage strength and thus lead to enhanced long-term retention and transfer.

R. A. Bjork(2011)가 주장한 바와 같이, 이러한 [인출 강도]와 [저장 강도]의 상호작용(즉, 망각으로 학습이 촉진될 수 있음)은 적응적이면서도 반직관적이며 치료 및 훈련에 광범위한 영향을 미칩니다(R. A. Bjork & Bjork, 2006; Lang, Craske, & Bjork, 1999 참조).

As argued by R. A. Bjork (2011), this interplay between retrieval strength and storage strength—namely, that forgetting can foster learning—is adaptive, yet counterintuitive, and has broad implications for treatment (see R. A. Bjork & Bjork, 2006; Lang, Craske, & Bjork, 1999) as well as training.

공식적 모델의 관점에서, [새로운 불용 이론]은 [맥락적-변동성 모델]과 많은 속성을 공유한다(예: Estes, 1955a, 1955b에 의해 제안된 영향력 있는 [자극-변동 모델]로 거슬러 올라가는 Mensink & Raaijmakers, 1988 참조). 기본적인 생각은 수행-학습 유기체는 시간과 사건이 진행되면서 외부 및 내부 환경의 다른 측면이 "표본화"됨에 따라 점진적으로 변화하거나 변동하는 현재의 단서에 의해 크게 영향을 받는다는 것이다. 예를 들어, 대량 실행에서와 같이 신호가 변화하지 않거나 천천히 변화할 경우 성능은 빠르게 향상되지만, 유지 간격에 따라 신호가 변화함에 따라 망각도 빨라집니다. 획득 시험 전반에 걸쳐 맥락 변동이 도입되거나 자발적으로 발생함에 따라, 성능은 더 느리게 개선될 것이지만, 지연 후 또는 변경된 컨텍스트에서 측정되는 것처럼 학습이 향상되는 학습 응답과 더 많은 총 단서가 관련될 것이다. 기본적으로 Estes의 초기 언어를 차용하자면, 응답 강도response strength (성과)는 일부 목표 응답이 현재 단서에 얼마나 관련되어 있는지에 따라 지수화되는 반면, 습관 강도habit strength (학습)는 일부 목표 응답이 일부 과제와 상황을 특징짓는 전체 단서의 범위에 얼마나 관련되어 있는지에 따라 지수화된다.

From a formal-modeling standpoint, the new theory of disuse shares a number of properties with contextual-fluctuation models (see, e.g., Mensink & Raaijmakers, 1988, whose model traces back to the influential stimulus-fluctuation model proposed by Estes, 1955a, 1955b). The basic idea is that the performing–learning organism is heavily influenced by current cues, which gradually change or fluctuate as time and events go on and different aspects of the external and internal environments are “sampled.” When cues are not changing, or are changing slowly, as in massed practice, for example, performance will increase rapidly, but forgetting will be rapid as well, as cues change across a retention interval. As contextual variation across acquisition trials either is introduced or occurs spontaneously, performance will improve more slowly, but more total cues will become associated with to-be-learned responses, which will enhance learning, as measured after a delay or in an altered context. Basically, to borrow Estes’s initial language, response strength (performance) is indexed by how associated some target response is to the current cues, whereas habit strength (learning) is indexed by how much some target response is associated to the whole range of cues that characterize some task and situation.

특히 운동기술 문헌에서 [운동제어 스키마 이론]과 [다시 불러오기reloading 가설]은 각각 [변화주기 연습 및 분산 연습]에 의해 생성된 학습 및 성과 효과에 대한 설명을 제공한다. 원래 슈미트(1975)에 의해 가정된 [운동 제어 스키마 이론]은 변화주기 연습(즉, 목표 기술과 관련이 있지만 조금은 다른 기술을 반복 연습하는 것을 의미함)이 [한 기술의 기초가 되는 일반적 모터 프로그램 또는 스키마]에 영향을 미치기 때문에 장기 학습을 촉진한다고 주장한다(슈미트, 2003 참조). 이 개념을 구체화하기 위해 개별 운동 기술(예: 농구 슈팅, 테니스 공 서브, 골프 클럽 스윙)은 타이밍, 속도 및 힘과 같은 고유한 파라미터와 관련된 단순한 동작 클래스의 조정과 구현을 수반한다는 점을 고려한다. 주어진 기술을 실행하는 데 필요한 움직임의 파라미터를 성공적으로 재구성하기 위해, 학습자는 한 움직임 클래스를 지배하는 다양한 규칙이 다른 관련 움직임 클래스를 지배하는 규칙과 어떻게 관련이 있는지 그리고 그러한 상호의존성이 결과에 어떻게 영향을 미치는지 이해할 필요가 있다. 스키마 이론에 따르면, 이것을 하는 효과적인 방법은 연습된 기술의 변화를 증가시켜 원하는 목표를 달성하기 위해 필요한 움직임 매개변수를 조정하는 방법을 배우는 것이다. 본 리뷰에서 이미 논의한 바와 같이, [연습 시의 변화주기]는 취득 시에 고정 연습 조건보다 더 많은 오류를 유발할 수 있는 가능성을 가지면서도, 장기 보유 및 이전에서 상당한 이득을 가져오는 경우가 많다.

In the motor skills literature, specifically, the schema theory of motor control and the reloading hypothesis offer highly cited explanations for the learning and performance effects produced by variable and distributed practice, respectively. Originally postulated by Schmidt (1975), the schema theory of motor control claims that variable practice—that is, practicing iterations of a skill that are related to but different from the target skill—fosters long-term learning because it sensitizes one to the general motor program, or schema, underlying a skill (see also Schmidt, 2003). To flesh out this notion, consider that discrete motor skills (e.g., shooting a basketball, serving a tennis ball, swinging a golf club) involve the coordination and implementation of classes of simpler movements, each associated with unique parameters, such as its timing, speed, and force. In order to successfully reconstruct the parameters of the movements required to execute a given skill, learners need to become familiar with how the various rules that govern one class of movements are related to the rules that govern the other relevant classes of movements and how such interdependencies affect outcomes. An effective way of doing this, according to schema theory, is to increase the variation of the practiced skill such that one is required to learn how to adjust the necessary movement parameters to achieve desired goals. As we have already discussed in this review, practice variability, while having the potential to induce more errors during acquisition compared with fixed practice conditions, often leads to substantial gains in long-term retention and transfer.

[분산 연습]과 관련된 학습 이익 측면에서, [다시 불러오기reloading 가설]은 연습 세션을 시간 또는 다른 활동으로 공백으로 두는 것이 학습된 기술을 실행하는 데 필요한 모터 프로그램의 "새로고침" 또는 재생을 장려한다고 주장한다(Lee & Magill, 1983, 1985). 이는 연습 세션 사이에 삽입된 간격이 관련 모터 명령에 일시적으로 액세스할 수 없게 되기 때문입니다. [분산 연습] 중에 [명령어를 새로고침하기 위해 요구되는 어려운 처리]는 스킬이 반복적으로 수행되는 [블록된(대량) 연습]에 비해 학습을 용이하게 하지만, [단기적인 수행을 저해]하는 것으로 보인다. 

In terms of the learning benefits associated with distributed practice, the reloading hypothesis asserts that spacing out practice sessions with time or other activities encourages the “reloading,” or reproducing, of the motor programs needed to execute to-be-learned skills (Lee & Magill, 1983, 1985). This is because the spacing inserted between practice sessions results in a temporary loss of access to the relevant motor commands. The effortful processing required to reload the commands during distributed practice appears to facilitate learning but impede short-term performance, compared with blocked (massed) practice in which skills are performed over and over again.

마지막으로, 성과를 해칠 수 있는 것이 학습에 도움이 될 수 있다는 일반적인 생각은 [바람직한 어려움 프레임워크]에 담겨 있다(R. A. Bjork, 1994; E. L. Bjork & Bjork, 2011; R. A. Bjork, 2013 참조). 분산 연습, 가변 연습, 인출 연습와 같은 조작은 상대 조건에 비해 뛰어난 [장기 보존 및 전이]를 지원하므로 "바람직하다desireable"고 할 수 있습니다. 그러나 이러한 효과적인 학습 조작은 습득이나 훈련 중에 성과를 저하시킬 수 있고, 결과적으로 (강사와 학생 모두에게) 효과적이지 못한 것으로 해석될 수 있다는 점에서 "어렵다difficult"고도 할 수 있다. 비직관적으로 보일지 모르지만, 습득하는 동안 어려움에 직면하고 해결함으로써 생겨난 [능동적 인지 과정]은, [기억 속에 이미 존재하는 지식]과 [새로운 정보]를 효과적으로 연결하거나 정착시키는 역할을 한다

Last, the general idea that what can hurt performance can help learning is captured in the desirable difficulties framework (R. A. Bjork, 1994; see also, E. L. Bjork & Bjork, 2011; R. A. Bjork, 2013). Manipulations such as distributed practice, variable practice, and retrieval practice are “desirable” because they support better long-term retention and transfer compared with their counterpart conditions. Such effective learning manipulations are also “difficult,” however, in the sense that they can degrade performance during acquisition or training and, consequently, are likely to be interpreted as ineffective by instructors and students alike. As unintuitive as it may seem, the active cognitive processes engendered by confronting and resolving difficulties during acquisition serves to effectively link or entrench new information with knowledge that already exists in memory.

또한 이러한 활성 프로세스는 장기 보유에 대한 추후 평가에서도 채용될 가능성이 높기 때문에, [바람직한 어려움]의 개념은 일반적으로 [전이-적합 처리 원칙] 및 이와 관련된 [부호화 특수성 원칙]과 일치한다. 이 두 가지는 모두 기억력이 향상될 것이라고 주장하는데, 즉, 관련된 연구와 테스트 과정이 겹칠 정도이다. 그러나 학습자가 어려움을 극복할 수 없는 경우(예: 이전에 접한 정보를 검색 연습 중에 성공적으로 검색할 수 없는 경우) 바람직하지 않게 된다는 점에 유의해야 합니다. 따라서 연구자들에게 있어 지속적인 과제는 학습에 어려움이 바람직한 시기와 바람직하지 않은 시점을 식별하여 강사의 교육 관행과 학생들의 학습 행동을 적절히 알리는 것이었다.

Furthermore, given that these active processes are also likely recruited during later assessments of long-term retention, the notion of desirable difficulties generally accords with the principle of transfer-appropriate processing (Morris, Bransford, & Franks, 1977) and the related encoding specificity principle (Tulving & Thomson, 1973), both of which contend that memory will improve to the extent that the engaged study and test processes overlap. It is important to note, however, that when the difficulties cannot be overcome by the learner—for example, when previously encountered information cannot be successfully retrieved during retrieval practice—they become undesirable (see McDaniel & Butler, 2010). Thus, an ongoing challenge for researchers has been to identify when difficulties are desirable for learning and when they are not, so as to appropriately inform the instructional practices of instructors and the study behaviors of students.

 

요약
Summary

현재의 몇 가지 이론적 관점은 [단기 수행성과]와 [장기 학습]의 중요한 차이를 만든다. 새로운 불용 이론에 따르면, [학습과 수행성과]에 대한 분리 가능한dissociable 효과는, [저장 강도(새로운 지식과 이전 지식이 통합되는 정도)][검색 강도(어떤 정보 접근이 상대적으로 쉬운지)] 사이의 적응적 상호작용의 결과로 발생합니다.

  • [운동 제어의 스키마 이론]은 [변동 연습]이 학습자에게 [운동 기술의 기초가 되는 일반적인 운동 프로그램을 숙지]시킴으로써 장기 보존과 전이를 촉진한다고 주장한다.
  • [다시 불러오기 가설]은 [분산 연습]이 학습자가 습득 중에 [학습한 운동 기술을 재로드하거나 재생산하도록 장려]한다고 주장한다. 이는 획득 도중에는 학습하지 않은 것처럼 보일지라도, [잠재적인 학습 사건]이다.
  • [바람직한 어려움 프레임워크]는 획득 또는 훈련 중에 (객관적으로나 주관적으로나) 어려울 것으로 보이는 조작이 [능동적 부호화 프로세스]를 발생시키기 때문에 장기 보존 및 전이를 위해 바람직할 수 있다고 제안합니다.

Several current theoretical perspectives make the crucial distinction between short-term performance and long-term learning. According to the new theory of disuse, dissociable effects of learning and performance arise as a result of the adaptive interplay between storage strength—the extent to which new and prior knowledge is integrated—and retrieval strength—the relative ease with which information can be accessed.

  • The schema theory of motor control claims that variable practice promotes long-term retention and transfer by familiarizing learners with the general motor programs that underlie motor skills.
  • Likewise, the reloading hypothesis asserts that distributed practice encourages learners to reload or reproduce the to-be-learned motor skills during acquisition, which is a potent learning event, despite appearing not to be during acquisition.
  • Finally, the desirable difficulties framework proposes that manipulations that appear to be difficult—both objectively and subjectively—during acquisition or training can be desirable for long-term retention and transfer because they engender active encoding processes.

 

결론
Concluding Comments


우리는 학습 간의 중요한 차이를 필요로 하는 압도적 경험적 증거에 대한 첫 번째 통합 리뷰를 제공했다.

  • [학습]은 장기 보존 및 전이를 지원하는 행동 또는 지식의 상대적 영구적 변화이며,
  • [수행]은 트레이닝이나 교습instruction 중간 또는 직후에 관찰되거나 측정되는 행동 또는 지식의 일시적 변동이다.링 .

We have provided the first integrative review of the overwhelming empirical evidence that necessitates the critical distinction between

  • learning—the relatively permanent changes in behavior or knowledge that support long-term retention and transfer—and
  • performance—the temporary fluctuations in behavior or knowledge that are observed and measured during training or instruction or immediately thereafter.

 

▶[거의 한 세기 전으로 거슬러 올라가서, 잠재 학습, 오버러닝 및 피로에 대한 초기 연구]는 [눈에 띄는 수행의 변화가 없을 때에도 실질적인 학습이 발생할 수 있다는 것]을 보여줌으로써 학습-수행 구분에 대한 첫 번째 통찰력을 제공했습니다. 인간과 비인간 동물 모두와 함께 수행된 이 연구는 그 당시 학습 이론가들을 그들의 학습 이론과 기억 이론에서 상응하는 개념적 차이를 만들었다.

[모터 스킬과 언어 학습 문헌에 대한 보다 최근의 연구]는 그 반대의 경우도 사실임을 입증했다. 특히 단기 성과에 변화가 종종 장기 학습과 아무런 관련이 없다는 것이다. 실제로 분산 프랙티스, 가변 프랙티스 및 검색 프랙티스에 대한 다양한 연구 결과에 따르면 학습과 성과는 상충될 수 있으며, 따라서 획득 성능을 저하시키는 것으로 보이는 조건이 가장 지속적이고 유연한 학습을 제공하는 바로 그 조건인 경우가 많습니다.

마지막으로, [메타인지 연구]는 [습득 중 일시적인 이득]은 지도자와 학생들을 속여서, 영구적인 학습이 이루어졌다고 생각하게 하고, 능력에 대한 강력한 환상을 만들어 낼 수 있다는 것을 암시한다.

Dating back nearly a century ago, early research on latent learning, overlearning, and fatigue provided the first insights into the learning–performance distinction by showing that substantial learning could occur in the absence of any discernible changes in performance. This work—conducted with both humans and nonhuman animals—compelled learning theorists at that time to make corresponding conceptual distinctions in their own theories of learning and memory.

More recent research in the motor-skills and verbal-learning literatures have demonstrated the converse to also be true—specifically, that changes in short-term performance often bear no relationship to long-term learning. In fact, the results of various studies on distributed practice, variable practice, and retrieval practice suggest that learning and performance can be at odds, such that conditions that appear to degrade acquisition performance are often the very conditions that yield the most durable and flexible learning.

Finally, research in metacognition suggests that fleeting gains during acquisition are likely to fool instructors and students into thinking that permanent learning has taken place, creating powerful illusions of competence.

학습과 성과는 분리될 수 없다는 것은 이론, 연구, 그리고 실천에 광범위한 영향을 미칩니다. 학습과 기억의 현재(또는 미래) 포괄적인 이론은 [장기적인 학습과 전달을 특징짓는 행동과 지식의 비교적 영구적인 변화]와 [그러한 행동과 지식의 습득 중에 발생하는 수행의 순간적인 변화]를 어떤 식으로든 구별할 필요가 있다. 마찬가지로, 학습을 최적화하는 요소를 설명하는 데 관심이 있는 연구원들은 주어진 변수를 조작하는 효과가 보존 간격과 매우 잘 상호작용할 수 있다는 가능성을 인지해야 한다. 즉, 변수variable는 학습과 성과에 차등적인 영향을 미칠 수 있다. 따라서 실험자는 연구에 단기 및 장기 측정값을 모두 포함할 것을 권장합니다.
That learning and performance are dissociable has widespread implications for theory, research, and practice. Any present (or future) comprehensive theory of learning and memory needs to distinguish, in some way, between the relatively permanent changes in behavior and knowledge that characterize long-term learning and transfer and the momentary changes in performance that occur during the acquisition of such behavior and knowledge. Likewise, researchers interested in elucidating factors that optimize learning should be cognizant of the possibility that the effects of manipulating a given variable might very well interact with retention interval—in other words, the variable might have differential influences on learning and performance. As such, we recommend that experimenters include both short- and long-term measures in their studies.

마지막으로 강의실에서든 현장에서든 지도instruction와 연습의 목표는 [학습을 촉진하는 것]이어야 하기 때문에, 강사와 학생은 [학습과 수행의 차이]를 이해하고, 현재의 수행 습득acquisition performance를 촉진한다고 해서 반드시 미래에 명확해질 유형의 학습이 이뤄지는 것은 아님을 이해할 필요가 있다. 오히려, 교육 중에 더 느려지거나 더 많은 오류를 유발하는 조건은 종종 더 나은 장기적 학습 성과로 이어지기 때문에, 강사와 학생들은 아무리 그렇게 하고 싶지 않더라도, 자신의 교육 및 학습 전략에 대해 가장 저항이 적은 길을 포기하는 것을 고려해야 한다. 결국, 교육 개입은 과거에 사용된 방식이나 직관이 아니라, 증거에 근거해야 한다.

Finally, given that the goal of instruction and practice—whether in the classroom or on the field—should be to facilitate learning, instructors and students need to appreciate the distinction between learning and performance and understand that expediting acquisition performance today does not necessarily translate into the type of learning that will be evident tomorrow. On the contrary, conditions that slow or induce more errors during instruction often lead to better long-term learning outcomes, and thus instructors and students, however disinclined to do so, should consider abandoning the path of least resistance with respect to their own teaching and study strategies. After all, educational interventions should be based on evidence, not on historical use or intuition.

 


Perspect Psychol Sci. 2015 Mar;10(2):176-99.

 doi: 10.1177/1745691615569000.

Learning versus performance: an integrative review

Affiliations collapse

 

Affiliations

1Department of Psychology, University of California, Los Angeles nsoderstrom@psych.ucla.edu.

2Department of Psychology, University of California, Los Angeles.

PMID: 25910388

DOI: 10.1177/1745691615569000

 

Abstract

The primary goal of instruction should be to facilitate long-term learning-that is, to create relatively permanent changes in comprehension, understanding, and skills of the types that will support long-term retention and transfer. During the instruction or training process, however, what we can observe and measure is performance, which is often an unreliable index of whether the relatively long-term changes that constitute learning have taken place. The time-honored distinction between learning and performance dates back decades, spurred by early animal and motor-skills research that revealed that learning can occur even when no discernible changes in performance are observed. More recently, the converse has also been shown-specifically, that improvements in performance can fail to yield significant learning-and, in fact, that certain manipulations can have opposite effects on learning and performance. We review the extant literature in the motor- and verbal-learning domains that necessitates the distinction between learning and performance. In addition, we examine research in metacognition that suggests that people often mistakenly interpret their performance during acquisition as a reliable guide to long-term learning. These and other considerations suggest that the learning-performance distinction is critical and has vast practical and theoretical implications.

Keywords: instruction; learning; memory; motor learning; performance; training; verbal learning.

비판적 성찰과 비판적 반영의 발산과 수렴: 보건의료전문직교육에의 함의(Acad Med, 2019)
The Divergence and Convergence of Critical Reflection and Critical Reflexivity: Implications for Health Professions Education 
Stella L. Ng, PhD, Sarah R. Wright, PhD, and Ayelet Kuper, MD, DPhil


보건전문교육(HPE)은 사회과학 및 인문과학(SS&H)을 교과 내용, 디자인, 교육학에 활용해야 한다는 요구에 부응하기 시작했다. 보건 전문가는 역량 프레임워크에 의해 증명된 바와 같이 사회적, 인문학적 역할과 활동을 수행해야 한다. 따라서 SS&H는 HPE에 분명한 이점을 제공한다. 그러나 정보에 입각한 방법으로 HPE에 SS&H 방법을 적용하는 것은 어려울 수 있다. 한편으로 SS&H 접근방식은 HPE에서 의미 있고 효과적이려면 신중한 적응이 필요하다. 한편, SS&H의 내용과 방법을 보건 전문직 훈련 프로그램에 적용하려는 의도는 좋지만 정보에 입각하지 않은 많은 사례들이 있다. HPE에 SS&H의 도입이 두드러지고, SS&H와 관련된 목표, 역할, 환자 중심의 관리, 건강 옹호, 포트폴리오 코스 등의 활동의 인기가 높아짐에 따라 잘못된 적용은 더욱 확산될 위험이 있다. 잘못 적용하면 잠재적으로 유용한 개념이 배제되고 더 많은 정보를 가진 애플리케이션을 통해 실현될 수 있는 것보다 더 낮은 교육 결과가 초래될 수 있습니다.

Health professions education (HPE) has begun to answer calls to draw on the social sciences and humanities (SS&H) for curricular content, design, and pedagogy.1–8 Health professionals must—as evidenced by competency frameworks—perform social and humanistic roles and activities9,10; thus, SS&H offers clear benefits to HPE. However, applying SS&H methods in HPE in an informed manner can prove challenging.11 On the one hand, SS&H approaches often require thoughtful adaptation if they are to be meaningful and effective in HPE.11,12 On the other hand, many examples abound of well-intentioned yet ill-informed attempts at applying SS&H content and methods to health professions training programs.13–16 As incorporation of SS&H rises in prominence in HPE,17 and as the popularity of SS&H-related goals, roles, and activities such as patient-centered care, health advocacy, and portfolio courses surges, misapplication risks becoming even more widespread. Misapplication may result in dismissal of potentially useful concepts and in poorer educational outcomes than could be realized with more informed applications.

HPE에서 일반적으로 오해되고 잘못 적용된 SS&H 접근법 두 가지는 비판적 성찰과 비판적 성찰성이다. 겹치지만 다른 지적 전통에서 비롯된 이러한 개념은 유사점을 공유하지만 교육학 및 평가에 대해 뚜렷한 의미, 사용 및 시사점을 가지고 있습니다. 하지만, 우리는 그들이 공통적인 몇 가지 기본적인 생각을 가지고 있거나, 아마도 비슷하게 들리기 때문에, 종종 혼동되거나 서로 결합된다는 것을 알아차렸다. HPE에서 SS&H 지식과 접근법의 잠재력을 실현하기 위해서는 기초 지식과 방법의 견고한 기반이 필요하기 때문에 이러한 혼란은 교육자에게도 영향을 미칠 수 있다.


Two commonly misunderstood and misapplied SS&H approaches in HPE are critical reflection14,18,19 and critical reflexivity.20–23 Arising from overlapping yet different intellectual traditions, these concepts share similarities but have distinct meanings, uses, and implications for pedagogy and assessment. However, we have noticed that, perhaps because they have some foundational ideas in common, or perhaps because they sound similar, they are often confused and/or conflated with each other. This confusion should concern educators because a solid foundation in the underlying knowledge and methods is required to realize the potential of SS&H knowledge and approaches in HPE.


학자들은 (성찰의 감시로서 사용하는 것을 포함하여) 성찰과 성찰성의 서투른 적용으로 인한 부정적인 결과에 주목하고 있으며, 우리는 '성찰 피로reflection fatigue'를 초래할 정도로 성찰이 남용되는 것에 주목하고 있다. 이러한 결과는 자금과 자원의 감소와 함께 설명 책임과 복잡성이 증가하는 시기에 심각합니다. 우리는 교육 접근방식의 부실하거나 비효율적인 구현에 시간과 자원을 낭비하거나 낭비할 수 없습니다. 그러나 우리는 "아기를 목욕물과 함께 내던져서는 안 된다" 즉, 성찰적 접근의 실행 실패가 성찰과 성찰성의 실패로 오해되어서는 안 된다. 우리는 비판적 성찰과 성찰성의 세부사항을 이해하는 것이 그들의 더 미묘한, 따라서 효과적인 연구와 응용을 지원할 수 있다고 주장한다.

Scholars have noted negative consequences from clumsy applications of reflection and reflexivity in medical education, including the use of reflection as surveillance,24,25 and we have noticed its overuse to the point of driving “reflection fatigue.” These consequences are serious at a time of increased accountability and complexity alongside decreased funding and resources. We cannot spend or waste time and resources on poor or ineffective implementations of education approaches. Yet we should not “throw the baby out with the bathwater”; that is, the failings of implementations of reflective approaches should not be mistaken for the failings of reflection and reflexivity. We argue that understanding the details of both critical reflection and reflexivity can support their more nuanced and thus effective study and application.

이 기사에서는 HPE 분야의 비판적 성찰과 비판적 반사성을 위한 견고한 기반을 명확히 하기 시작한다. 우선 각 항목을 차례로 정의하는 것부터 시작합니다(정의의 개요는 표 1 참조). 우리는 독자들이 그들의 지향과 목표를 이해하도록 돕기 위해 각각의 지적 맥락 안에 위치를 정하고, 그들 사이의 유사점과 차이점을 명확히 한다. 그런 다음 비판적 성찰과 비판적 반사성에 적합한 교육 및 평가 방법의 유형을 설명합니다. 공간 제약으로 인해 기술자 "critical"에 포함된 개념을 상세하게 검토하지 않습니다(본 문서에서 사용되는 이 용어 및 기타 용어의 간단한 정의는 박스 1 참조). 
간단히 말해서, 성찰 또는 성찰성이라는 단어를 앞에서 한정하는qualifier "비판적critical"이라는 단어는 관련된 성찰적reflective 또는 성찰성적reflexive 활동이 특히 가정, 권력 관계, 구조, 시스템적 효과와 실천에 대한 제약에 도전/질문하는 것을 의미한다.

In this article, we begin to articulate a solid base for both critical reflection and critical reflexivity for the HPE field. We start with defining each in turn (see Table 1 for a summary of their definitions). We locate each in their intellectual contexts to help readers make sense of their orientations and goals, and we clarify the similarities and differences between them. We then delineate the types of teaching and assessment methods that fit with critical reflection versus critical reflexivity. Because of space constraints, we do not explore in depth the concepts embedded in the descriptor “critical” (see Box 1 for a brief definition of this and other terms used in this article); put simply, as a qualifier before reflection or reflexivity, “critical” means that the associated reflective or reflexive activities specifically challenge/question assumptions, power relations, and structural or systemic effects and constraints on practice.26–28

크리티컬 리플렉션/비판적 성찰
Critical Reflection

비판적 성찰은 [가정(즉, 개인 및 사회적 신념과 가치)과 권력 관계, 그리고 이러한 가정과 관계가 어떻게 실천을 형성하는지를 조사하는 프로세스]로 정의할 수 있다. 가정이 [유해한 실천]으로 이어질 경우, 비판적으로 성찰하는 실천자practitioner는 가정과 관행에 도전하고 변경하는 것을 목표로 합니다. 따라서 비판적 성찰의 목표는 프락시스이다: 사회 개선을 이끄는 [비판적 이론과 실천]의 균형잡힌 융합을 말한다. 

Critical reflection can be defined as a process of examining assumptions (i.e., individual and societal beliefs and values) and power relations, and how these assumptions and relations shape practice. When assumptions lead to harmful practices, the critically reflective practitioner aims to challenge and change assumptions and practices. The goal of critical reflection is thus praxis: a balanced fusion of critical theory and practice that leads to social improvement.29


[비판적 성찰]은 practitioner로 하여금 [유해한 가정이 갖는 물질적 영향(박스 1 참조)에 대해 의문을 갖고 이에 대해 행동]하도록 지시합니다. 예를 들어, 가정의사는 장애인이 지원이나 자원에 접근할 수 있도록 작성하는 서류 등 [실제로 사용되는 일부 물질material object]에 내장된 [유해한 효과]를 발견할 수 있습니다. 환자의 특정 지원을 받기 위해 환자의 장애 정도를 "평가"해야 하는 경우가 많습니다. [장애를 평가하는 과정]은 보통 지나치게 단순하고, 사람을 잘못 표현하기 쉬우며, 제대로 논의하지 않으면 환자의 자기 이미지와 환자와의 관계에 해를 끼칠 수 있다. 만약 주치의가 비판적 성찰을 통해 이러한 잠재적 위해를 인식한다면, 환자와의 관계에서 [자신이 수행하는 평가의 필요성과 한계]를 인식할 것이다. 비판적 성찰이 이끄는 행동을 함으로써, 이 가정의사는 Praxis를 보여주고 있다. 또한 시간이 지남에 따라 정책 및 프로토콜 형성 관행을 개선하기 위해 노력할 수도 있습니다. 그녀는 정규 교육 및/또는 연습과 개인적 경험을 통해 이러한 방식으로 연습하는 법을 배웠을 수 있습니다.
Critical reflection orients practitioners to question and act on the material (see Box 1) effects of harmful assumptions. For example, a family doctor may notice harmful effects built into some of the material objects used in practice, such as the paperwork she completes for persons with disabilities to access supports and resources.30 To garner access to certain supports for her patients, she is often required to “rate” their level of disability. The process of rating disability is usually overly simplistic and prone to misrepresenting the person31 and can be damaging to the self-image of patients and to her relationship with them if left undiscussed.31 Because she recognizes this potential harm—through critical reflection—the family doctor ensures that in the relationship she builds with her patients, they appreciate the necessity and limitations of the rating she has to conduct. By engaging in action informed by critical reflection, this family doctor is demonstrating praxis. She may also work to improve the policies and protocols shaping practice, over time. She may have learned to practice this way through formal education and/or learning in and through practice and personal experience.


박스 1
Box 1

이 문서에서 사용된 용어집(중요한 반사 및 반사성 관련 용어집)
Glossary of Terms Used in This Article as They Relate to Critical Reflection and Reflexivity

행위자성사회에 대한 행동 능력.사회 규범과 가치관이 사회의 구조에 의해 어떻게 형성되어 왔는지를 알 수 있는 능력을 필요로 한다. 
Agency:
 The capacity to act on the world, requiring the ability to see how social norms and values have come to be shaped by the structures of society.45

비판적: 성찰, 반사성 또는 이론보다 앞선 한정자 또는 형용사로서, '비판적'이란 의미는 가정, 이념, 시스템, 구조 및 권력 관계를 포함한 현재의 사회 규범에 대한 비판에 초점을 맞춘다는 것을 의미합니다. 
Critical:
 As a qualifier or adjective preceding reflection, reflexivity, or theory, critical means that there is a focus on a critique of current societal norms including assumptions, ideology, systems, structures, and power relations.28,34,62

담론(형용사: 담론적): 사회적 구성 및 영속적인 언어 기반 의미 체계로서, 이것은 어떤 생각, 말, 행동 방식이 (불)가능한지를 형성한다. 예:

  • [한 사람 내에 존재하는 기능 손상으로서의 장애]라는 지배적 담론은 사람들이 "기능"을 회복하도록 돕기 위해 재활을 생각하고 실천한다. 반면
  • [사회가 부과하는 한계로서의 장애]라는 대안적 담론은 변화에 대한 부담의 일부를 사회에 이전시키고, 우리가 세상을 기능하고 살 수 있는 다양한 방법에 대한 개념을 넓힐 것을 간청한다.  

Discourse (as an adjective: discursive): A socially-constructed and perpetuated, language-based system of meaning shaping (im)possible ways of thinking, speaking, and acting; e.g.

  • the dominant discourse of disability as impairment of function within an individual means we think about and practice rehabilitation to help people regain “typical” function.
  • An alternative discourse of disability as limitations imposed by society would move some of the burden of change to society, and implore us to broaden our conceptions of different ways of being able to function and live in the world.73–75

인식론: 우리가 알고 있는 것을 어떻게 알게 되는가에 대한 철학. (의견이 아니라) 지식을 개발하거나 습득하는 타당한 방법을 포함한다.
Epistemology:
 The philosophy of how we come to know what we know, including the methods considered to be valid ways of developing or gaining knowledge (as opposed to opinion).8,12,76–78

형평성Equity: 무엇이 정의롭고 공정한지에 대한 사고방식이며, 종종 평등equality과 대조된다.

  • [평등]은 모든 사람이 같거나 동등한 기회와 지원을 받을 수 있는 것을 말한다(예: 의대에 입학하는 모든 학생이 동일한 수업료를 지불한다)
  • [형평]은 누군가를 애초에 기회에서 배제시킬 수 있는 낮은 사회경제적 지위의 영향과 같은 장벽을 제거하는 것을 목표로 할 수 있다(예: 의대 진학에 필요한 학업기준에 부합하지만 등록금 재원이 부족한 학생에게 학비보조금을 제공한다.)

Equity: A way of thinking about what is just and fair, often contrasted with equality. Rather than

  • equality in which all people would be given the same, or equal, opportunities and supports (e.g., all students entering into medical school pay the same tuition fee), an
  • equitable approach might aim to remove barriers such as the effects of the lower socioeconomic status of a student that might preclude them from an opportunity (e.g., offering bursaries to students who meet the academic standards for entry to the medical school but lack the economic resources for tuition).79

물질: 사회와 문화가 구성하고, 사회와 문화를 구성하는 물리적 대상 및 측면과 관련된다. 예: 의료 차트, 증거 기반 진료 지침.
Material:
 Relating to the physical objects and aspects constituting and constituted by society and culture,80 e.g., medical charts, evidence-based practice guidelines.

교육학: 가르침의 이론과 실제.
Pedagogy: The theory and practice of teaching.

프락시스: 비판적으로 성찰하는 생각과 행동의 융합. 
Praxis:
 The fusion of critically reflective thought and action.29


교육에서 [성찰]은 일반적으로 "어떤 믿음이나 가정된 형태의 지식에 대한 적극적이고 지속적이며 신중한 고려이다. [믿음이나 가정을 뒷받침하는 근거]와 [그것이 궁극적으로 지향하는 결론]에 비추어 고려하는 것이다"로 정의된다. 종종 성찰에 [비판적 차원]을 추가하는 것으로 알려진 하버마스는, 여기에 [성찰 과정에 비판적 렌즈를 적용하지 않는 한, 지식은 지식이 창조된 사회적 조건에 의해 제약을 받는다]는 것을 추가했다.

  • 위의 예에서, 만약 가정의사가 장애 서류 작업을 하는 동안 성찰적인 태도를 보였다면, 그녀는 실제로 환자 자신의 희망에 대한 자신의 가정에 의문을 제기했을 수 있으며, 그녀가 인간 중심적이고 사려 깊은 방식으로 연습하고 있는지 확인할 수 있습니다.
  • 하지만, 그녀는 비판적인 성찰을 통해 드러난 서류 처리 과정의 잠재적인, 더 음흉한 피해를 인식하지 못했거나 완화하려고 노력하지 않았을 수 있습니다. 또한, (서류에 서명함으로써 궁극적으로 환자의 자원 접근을 허가 또는 불허하게 만드는) 자신의 위치와 더 큰 기관 복합체 내에서의 상대적인 위치에 대해 덜 의식했을 수도 있다. 

[비판적 성찰]은 (이 경우 의사의 관점을 변화시킴으로써) 기존의 관점과 권력 관계를 영속화하기보다는 변화를 목표로 하기 때문에, 따라서 [해방적 지식]을 생산할 수 있다. 
In education, reflection is commonly defined as “active, persistent, and careful consideration of any belief or supposed form of knowledge in the light of the grounds that support it and further conclusions to which it tends.”32(p6) Habermas,33 often credited with adding a critical dimension to reflection, added to this definition that knowledge remains constrained by the social conditions in which it was created, unless a critical lens is applied to the reflective process.

  • In the example above, if the family doctor was reflective while working on the disability paperwork, she may indeed have questioned her own assumptions about the patient’s wishes, to ensure that she was practicing in a person-centered and thoughtful manner.
  • However, she may not have recognized or tried to mitigate the potential, more insidious harms of the paperwork process, which were brought to light through critical reflection. She would also be less aware of the position she holds by virtue of being the signatory on this paperwork, which ultimately grants/denies the patient’s access to resources, and her position relative to the larger institutional complex.

Critical reflection can thus produce emancipatory knowledge, as it aims to transform rather than perpetuate existing perspectives and power relations (in this case, by transforming the perspective of the physician).33


비판적 성찰 이론을 발전시킨 현대 작가로는 브룩필드, 켐미스, 킨셀라, 그린 등이 있다. 의학 교육에서 비판적 성찰에 관한 이론을 도입한 학자는 프리레와 하버마스의 작품과 그 적용 방법에 특히 초점을 맞춘 쿠마가이이다. Kumagai와 Lypson은 이러한 지식에 대한 이해를 학생들을 문화적 역량 밖으로 이동시키기 위한 노력과 같은 교육 혁신에 적용했습니다. 그들은 학생들이 특정 환자와 상호작용하는 ["올바른" 또는 "최상의" 방법을 기억하는 체크리스트 접근법]에서 벗어나서, [권력 관계에 대한 더 넓은 인식과 사회적 불평등을 완화하려는 욕구]로 옮겨갈 필요성을 분명히 강조한다. 따라서, 이 접근방식에 따르면, 모든 환자에게 좋은 돌봄을 제공하기 위해서는 [바람직한 기술을 수행하는 특정 방법을 습득할 때 [존재의 방식에 대한 비판적 성찰]이 동반되어야 한다. [존재의 방식]이란 관점과 덕성virtue를 체화하고, 집행하고, 문화화하는 방식을 의미한다. 이렇듯, [
비판적 성찰]은 [사고 과정]이다. 비판적 성찰의 실천은 이 과정에 자주 또는 항상 관여engage하는 존재와 실천의 한 방법이다. 
Contemporary authors who advance theories of critical reflection include Brookfield, Kemmis, Kinsella, and Greene26–28,34–37 (see Table 1). In medical education, a scholar who has taken up theories related to critical reflection is Kumagai,4,38 who has focused particularly on the works of Freire and Habermas and how they can be applied in medical education. Kumagai and Lypson4 have applied these understandings of knowledge to educational innovations such as efforts to move students beyond cultural competence. They articulate a need to move from checklist approaches, wherein students memorize the “right” or “best” way to interact with a particular patient, toward a broader awareness of power relations and a desire to mitigate social inequity.4 This approach thus suggests that, to provide good care for all patients, acquiring particular ways of performing desired skills must be accompanied by critically reflective ways of being—by which we mean embodied, enacted, enculturated views and virtues. Critical reflection is a thought process; critically reflective practice is a way of being and practicing that engages this process often or always.26,39

(비판적) 성찰성
(Critical) Reflexivity

[성찰성]은 [[자기의 지식의 한계를 더 잘 이해]하고 [다른 사람들의 사회적 현실을 더 잘 인식]하기 위해, 세상world 내에서 자신의 위치position를 인식하는 것]으로 정의될 수 있다. 따라서 모든 성찰성은, 무엇보다 [권력관계]에 주의를 기울이는 것을 포함하기에, 정의상 비판적이다. 그러나 일부 저자들은 [권력에 대한 주의를 명시적으로 우선시]하고자, "비판적 성찰성critical reflexivity"이라는 더 긴 용어를 사용하기로 선택한다. [성찰성적reflexive 실천가]는 그녀의 인식론적 가정과 합법적인 지식, 사회적 규범, 그리고 가치의 개념에 영향을 미치는 [사회적, 담론적 요소]에 도전할 것입니다. [성찰성]과 [비판적 성찰]은 사회적 개선이라는 목표를 공유하지만, [성찰성]은 [담론적으로 이해contrued 사회적 세계가 누가, 어떻게, 어떤 지식과 사회적 규범의 구축에 어떻게 영향을 미치는지] 강조한다.36. 따라서 성찰성적 접근으로 제시된 해결책은 종종 [구조와 제도를 바꾸는 것]을 포함할 것이다. 예를 들어, 장애에 대한 성찰성적 접근법은 

  • 현재의 정의에 의문을 제기하다. (예: 장애를 개인 안의 것으로 보는 정의)
  • 정의에 따른 실천에서 누가 권력을 얻거나 유지할지(예: 현재 장애가 없는 자, 재활 전문가 등), 이 담론에 의해 권력적 약자가 되는 사람은 누구인지(예: 장애인 등)에 대한 인식을 높인다. 
  • 이러한 권력 불균형을 만들고 유지하는 구조와 프로세스의 변화를 모색한다.

Reflexivity can be defined as recognizing one’s own position in the world both to better understand the limitations of one’s own knowing and to better appreciate the social realities of others. All reflexivity is thus by definition critical, as it specifically involves paying heed to power relations; however, some authors choose to use the longer term “critical reflexivity,” which explicitly foregrounds their attentiveness to power. A reflexive practitioner would challenge her epistemological assumptions (how we know what we know) and the social and discursive factors that influence conceptions of legitimate knowledge, social norms, and values. Although reflexivity and critical reflection share goals of social improvement, reflexivity emphasizes how the discursively construed social world influences what, how, and by whom knowledge and social norms are constructed,36 and so the solutions put forward in a reflexive approach will often involve changing structures and institutions. For example, a reflexive approach to disability may

  • call into question its current definition (e.g., as an impairment within an individual),
  • raise awareness of who stands to gain or maintain power from the ensuing practices of this definition (e.g., people currently without disabilities, rehabilitation professionals) and who is rendered less powerful by this discourse (e.g., people with disabilities), and
  • seek to change the structures and processes that create and maintain this power imbalance.40

[자신의 사회적 지위를 인식하는 것]은 [다른 사람들의 경험에 대한 이해]를 넓힐 수 있다. 성찰성에 참여하려면, 먼저 이러한 믿음과 가정이 [우리가 자라나고 훈련받거나 현재 살고 일하는 사회문화 구조에 어떻게 내재되어 있는지]를 인식함으로써, [무엇이 진실되고 정상적인지에 대한 우리 자신의 믿음과 가정에 도전]해야 합니다. 예를 들어, 성찰성적 가정의사는 자신이 [장애인이 아닌 사람을 "정상"이라고 가정하는 건강 시스템] 내에서 기능하고 있다는 것을 알게 될 것이다. 
그렇게 함으로써 그 의사는 [장애에 대한 현재의 담론]을 문제 삼을 것이다. 왜냐하면 이 담론에서는 "문제"는 '장애를 가진 사람'에게 존재하는 것이지, 장애를 가진 사람이 적응하고자 노력하고 있는 '시스템'에 존재하는 것이 아니기 때문이다.

Recognizing one’s own social position may broaden one’s understanding of the experiences of others. Engaging in reflexivity requires challenging our own beliefs and assumptions about what is true and normal by first recognizing how these beliefs and assumptions are embedded in the social and cultural structures in which we were raised and trained and/or currently live and work. Continuing our example, a reflexive family doctor would, for example, notice that she was functioning within a health system that assumes that people who are not disabled are “normal”; in so doing she would problematize the current discourse of disability, in which the “problem” is located with the “disabled” patient rather than with the system to which they have to try to fit in.40 

이와 같은 (현재의) 문제적 담론은 [포용적인 환경을 만들려는 사회의 책임]을 회피하고, 대신 [인식된 규범에서 벗어난 사람들]에게 "적합해지기 위해 노력하라fit in"는 부담을 전가한다. [우리 모두가 억압적인 권력의 당사자]라는 성찰성의 내재적 의미는, 자신의 [특권적 지위]가 [지배적인 문화 또는 사회 집단]에 속함으로써 얻어지는 것임에 주의하게 만들기 때문에, 성찰성을 상당히 어렵게 만들 수 있다.  예를 들어, Rowland와 Kuper가 환자 경험을 하게 된 의료 전문가들을 대상으로 실시한 연구에서, 참가자들은 그들의 경험 중 [가장 고통스러웠던 부분] 중 하나는 환자의 입장에서 부정적으로 경험했던 [구조와 과정에 자기 자신이 (보건의료제공자로서) 어떻게 기여하고 있었는지에 대한 성찰적인 깨달음]이었다고 언급했다. 

This problematic discourse defers responsibility from society to create an environment that is inclusive, instead shifting the burden onto those who fall outside the perceived norm to “fit in.” An inherent implication of reflexivity—that we are all (as part of society) party to oppressive forces—can make reflexivity quite difficult, particularly when it calls attention to one’s own privileged position derived from belonging to a dominant cultural or social group.41 For example, in Rowland and Kuper’s42 study of health care professionals who have also been patients, participants noted that one of the most painful parts of their experience was their reflexive realization of the ways in which they themselves (as health care providers) had contributed to the structures and processes that they then experienced so negatively as patients.

머튼은 성찰성을 [옳든 그르든, 상황의 결과와 그 믿음을 실현하기 위해 개인이나 집단이 어떻게 행동하는지에 영향을 미치는 자기충족적 예언]으로 묘사했다. 논쟁의 여지가 있지만, 그와 다른 초기 이론가들은 성찰성을 문제가 있다고 생각했다. 즉, 사회적 세계에 영향을 받지 않는 어떠한 행동도 취할 수 없고, 이는 다시 사회적 세계에 영향을 준다. 하지만, 더 최근에는 이론가들은 성찰성을 구조(사회가 개인의 신념과 행동에 영향을 주는가?) 대 개인(개인의 신념과 행동과 행위가 사회에 영향을 주는가?) 이라는 오랜 인식론적 문제를 극복하는 해결책으로 제시한다. 
In one of the earliest uses of the term, Merton43 described reflexivity as a self-fulfilling prophecy, in which a belief or expectation, whether correct or incorrect, affects the outcome of the situation and how individuals or groups behave to make that belief come true. Arguably, he and other early theorists conceived of reflexivity as problematic: that no action can be taken that is not influenced by the social world, which in turn influences the social world. More recent theorists, however, present reflexivity as the solution to overcoming the long-standing epistemological problem of structure (does society influence individual beliefs and behaviors?) versus agency (do individual beliefs, behaviors, and actions influence society?).44

예를 들어,

  • Bourdieu는 사회과학은 본질적으로 우리의 선입견preconception에 의해 제약을 받는다고 주장했다; 이러한 한계를 극복하기 위해, 우리는 우리의 사회적, 문화적 기원, 현장에서의 우리의 위치, 그리고 우리의 지식 주장을 질문함으로써 우리 자신의 입장을 더 잘 이해하려고 노력해야 한다.
  • 비슷하게, Foucault46은 역사가 현재 지식을 구조화하고 체계화한다고 제안했다; 무엇을 생각할 수 있고 알 수 있는지는 우리가 사용하는 담론을 통해 형성되며, 담론이 우리의 사고를 어떻게 제약하는지를 고려하는 것이 반드시 필요하다.
  • Bourdieu, for example, argued that the social sciences are inherently constrained by our preconceptions; to overcome these limitations, we should seek to better understand our own positions by interrogating our social and cultural origins, our position in the field, and our knowledge claims.45 
  • Similarly, Foucault46 proposed that history structures and organizes knowledge in the present; what is thinkable and knowable is shaped through the discourses we use, making it imperative that we consider the ways in which this constrains our thinking.

부르디우와 푸코는 둘 다 보통 당연하게 여겨졌던 사회의 특성, 어떻게 그러한 특성을 갖게 되었고, 결과적으로 누가 이득을 보고 손해를 보는지에 대해 이의를 제기했다. 또, 다음과 같은 권력의 문제에 초점을 맞췄습니다. 푸코는 [담론]이 우리의 사고와 실천을 함정에 빠뜨린다고 보았고, 부르디우는 [사회 구조]가 사회적 불평등을 재현한다고 보았. [비판적 성찰성]은 이렇게 ["자연스러워" 보이는 힘forces]을 인식하는 것이다. 즉, 우리가 힘forces을 어떻게 생산하고 재생산하는지, 힘forces이 우리에게 어떻게 영향을 미치는지, 우리가 힘forces에 어떻게 영향을 미치는지를 인식하는 것이고, 이것이 변화하는 역동적인 과정이라는 것을 인식하는 것이다.

Bourdieu and Foucault both challenged the properties of society normally taken for granted, how they came to be, how they were naturalized, and who ends up benefiting and losing as a result. They also focused on issues of power: Foucault46 sees discourses as trapping our thinking and practice, and Bourdieu44 sees social structures as reproductive of social inequities. Critical reflexivity is about recognizing these “natural”-seeming forces, how we are implicated in producing and reproducing them, how they affect us, how we affect them, and that this is a dynamic process subject to change.

더 많은 현대 학자들이 (성별, 인종, 식민지 경험, 능력과 같은) 특정한 사회적 구조(및 이들의 교차점)와 관련하여 [비판적 성찰성]의 개념을 탐구해 왔다. 예를 들어,

  • 패트리샤 힐 콜린스는 아카데미에서 흑인 여성으로서의 그녀의 "외계인" 지위가 그녀가 정상적이고 자연스러워 보이는 "내부인"들에게 주목받지 못하는 현상을 알아차릴 수 있도록 하는 방법을 탐구했다.
  • 마찬가지로, 사이드는 유럽과 북미의 학자들이 아시아, 중동, 그리고 아프리카에서 온 사람들을 "미스터리한 다른 사람"으로 구성하면서 그들의 목소리와 힘을 식민지화의 더 큰 현상의 일부로서 감소시키는 방식을 문제화했다.
  • Crenshaw58은 이러한 다른 사회적 범주가 중복될 수 있는 방법의 복잡성과 권력과 지식에 미치는 영향을 강조하기 위해 "교차성"이라는 용어를 도입했습니다.

이 저자들은 각기 다른 사회 집단의 경험을 강조하고 있지만, 집합적으로 우리가 ["자연적"이고 "정상적"으로 보이지만 실제로 변화하기 쉬운 구조와 과정을 유지하는 우리의 역할]을 깨닫는 데 도움이 되며, 따라서 우리가 공유된 사회 세계를 개선하기 위해 행동하도록 영감을 준다.
More contemporary scholars have explored the notion of critical reflexivity in relation to specific social constructs such as gender,47–50 race,51,52 experience of colonization,53–55 and ability40,56,57 (among others), as well as to the intersections between them.

  • Patricia Hill Collins,52 for example, has explored the ways in which her “outsider” status as a black woman in the academy enables her to notice (and seek to address) phenomena that go unremarked to those “insiders” for whom they seem normal and natural.
  • Similarly, Said53 has problematized the ways in which European and North American academics constructed people from Asia, the Middle East, and Africa as a “mysterious other,” diminishing their voices and their power as part of the larger phenomenon of colonization.
  • Crenshaw58 introduced the term “intersectionality” to highlight the complexity of the ways in which these different social categories can overlap and the implications that has for power and knowledge.

Although the experiences of the social groups highlighted by these writers differ, collectively their work helps us to identify our roles in maintaining structures and processes that seem “natural” and “normal” but may actually be amenable to change, and thus inspires us to act to improve our shared social world.

교육 및 평가에 미치는 영향
Implications for Teaching and Assessment

교육적 접근 방식을 알려주는 학문적 전통을 사용하는 교육 및 평가 방법에 맞추는 것은 교육 노력의 질과 의미에 있어 중요합니다. 비판적 성찰과 비판적 성찰성은 특정한 약속을 공유한다. 둘 다 [사회 개선을 위해 노력]하고 [기존의 권력 구조에 도전]합니다. 따라서 우리는 차이점뿐만 아니라 비판적 성찰과 반사성을 교육, 평가 및 평가하기 위한 공통 과제와 전략도 탐구할 것이다.

Aligning the academic traditions informing an educational approach with the teaching and assessment methods used is key to the quality and meaning of the educational efforts being employed.59 Critical reflection and critical reflexivity share certain commitments; they both strive for social improvement and challenge existing power structures. We will thus explore not only the differences but also the common challenges and strategies for teaching, assessing, and evaluating critical reflection and reflexivity.

비판적 성찰에 대한 교육 및 평가
Teaching and assessing for critical reflection

HPE에서 비판적 성찰을 가르치는 사람들의 경우, 이론 문헌과 일치하는 전반적인 목표는 학생들이 임상 작업에 대해 일종의 [프락시스]로서 접근하는 것을 가르치는 것이다. 위의 장애 정책과 관련하여 일하는 가정의사의 예에서 언급한 바와 같이, Praxis는 [비판적 이론에 입각한 행동]이다. 그것은 [성찰]과 [행동], 특히 [비판적 성찰]과 [행동]의 융합이다.

  • 조직 차원에서는 [비판적으로 성찰하는 의대]라면, [이론적인 조사에 근거해, 불평등하다고 보여지는 척도를 제거하는 방향으로 입학 기준을 바꿀 수]도 있다.
  • [비판적으로 성찰하는 교수와 프로그램]은 학생들을 프락시스 지향의 문화(프락시스 지향의 입학은 좋은 시작이다)속에서 사회화하고, 학생들이 실천과 환자에 대해 자신이 가지고 있는 가정에 대해 지속적으로 의문을 던지도록 하는 것을 목표로 할 것이다.
  • [(비판적으로 성찰하는) 학생들]은 자신의 실천과 프로토콜에 포함된 가정과 유해한 관계에 적극적으로 도전함으로써 자신의 실천 컨텍스트에서 점진적으로 매일 개선을 도모하는 것을 목표로 할 것이다.

Baker 등, Halman 등, Kumagai 및 Lypson에 의해, 이러한 목표에 맞춘 교육 관행의 개요가 설명되고 있으며, 표 2에 몇 가지 예가 있다.

For those teaching critical reflection in HPE, the overall goal congruent with the theoretical literature would be to teach students to approach their clinical work as a form of praxis. As noted above in our example of the family doctor working in relation to disability policies, praxis is critical theory–informed action. It is a fusion of reflection and action, specifically critical reflection and action.29 

  • At the organizational level, a critically reflective medical school might change its admissions criteria by removing a measure shown to be inequitable, based on theory-informed investigation.
  • Critically reflective faculty and programs would aim to socialize students in a praxis-oriented culture (a praxis-oriented admissions process being a good start) and to orient them toward continually questioning their own assumptions about their practices and about their patients.
  • Students would also be oriented toward creating incremental everyday improvements in their own practice contexts by actively challenging the assumptions and harmful relations embedded in their practices and protocols.

Pedagogical practices aligned with these goals have been outlined by Baker et al,59 Halman et al,60 and Kumagai and Lypson,4 and we share some examples in Table 2.

 

비판적 성찰의 커리큘럼 목표는 [합의된 "콘텐츠" 지식 기반]을 구축하는 것이 아니라, [특정한(지속적으로 질문하는) 시각과 존재 방식]을 학생들에게 고취하는 데 초점을 맞추고 있습니다. 따라서 비판적 성찰의 핵심 개념(예: 확립된 권력관계를 인식하고 때로는 도전하는 것)은 단순히 특정 강의나 과목에서 가르치는 것이 아니라, 공식적이고 숨겨진 커리큘럼 전체에 통합될 필요가 있다. 마찬가지로 교수는 내용지식을 주로 전달하는 교사가 아니라, 학생들과 함께 배우고 도전하는 역할 모델 및 멘토 역할을 합니다. 구체적인 커리큘럼 내용은 사고와 존재 방식을 형성하는 수단이 될 것이다. 

Curricular objectives for critical reflection focus on imbuing students with a particular, constantly questioning, way of seeing and being, rather than on building an agreed-upon “content” knowledge base. As such, notions that are key to critical reflection (such as recognizing and, at times, challenging established power relations) would need to be integrated throughout the formal and hidden curricula rather than simply taught in a particular lecture or course.29 Similarly, faculty members would serve as role models and mentors who learn with and challenge students rather than as teachers who primarily transmit content knowledge; the specific curriculum content would be a vehicle for shaping ways of thinking and being.4,38,61

비판적 성찰의 평가는 또한 그것의 철학적, 이론적 기원과 일치해야 한다. 성찰 학자들은 성찰 활동을 평가하거나 의무화할 때 잠재적 위험에 주목했다. 일부에서는 성찰적 사고의 표현을 서면으로 의무적으로 제출하게 만들면, 성찰이 [일종의 감시]가 된다고 주장한다. 다른 이들은 성찰을 지나치게 환원주의적으로 평가하는 접근법은 [핵심point을 놓치고], 대신 [토큰주의적이거나 조작된 반성을 유도한다]고 주장한다. 이러한 크리틱은 일반적으로 (비판적 성찰이 아니라) 성찰에 대한 것이다. 성찰과 반사성에 대한 [비판성criticality]를 더할 때 [사회적 가정, 규범 및 가치가 강조된다는 점]을 고려할 때, 우리는 주의를 기울여야 할 이유를 더 확장할 수 있다.

Assessment of critical reflection must also align with its philosophical and theoretical origins. Scholars of reflection have noted potential dangers in assessing or mandating reflective activities. Some have argued that through mandated submission of written representations of reflective thought, reflection becomes a form of surveillance; others argue that overly reductionistic approaches to assessing reflection miss the point and instead drive tokenistic or fabricated reflection.14,24,62 These critiques have typically been levied at reflection (not critical reflection); given the emphasis on societal assumptions, norms, and values that adding criticality to reflection and reflexivity brings, we extend the cause for caution even further.

[모든 평가는 통제의 한 형태]라는 주장이 종종 제기되어 왔지만, [점수grading]을 통해 사회 세계를 바라보는 특정한 방식을 명시적으로 강요하는 것은 현대 교육자들 사이에서 불편함을 야기할 것임을 쉽게 상상할 수 있다. 그러나 윤리적으로 덜 까다로울 수 있는 다른 옵션이 적어도 두 가지가 있다.

  • 의료 분야에서는 실무 환경에서 직업의 일원으로 일하는 모든 실무자에게 요구되는 가치와 규범(종종 전문직 윤리강령으로 기술됨)이라는 오랜 역사가 있습니다. 그러한 가치의 현대적 예는 [동정심과 정직성]을 포함할 수 있습니다. 따라서 직장 내에서 이러한 직업별, 합의된 가치를 집행enact하거나 수행하는 학생들의 능력을 평가할 수 있다.
  • 또한 비판적 성찰이 [환자 치료를 개선할 것으로 기대되는 특정 가치]를 옹호하고 모델링하는 [기관적 전환shift]의 일부로 받아들여진다면, [그러한 가치들을 기관적 차원에서 집행enact하는 학교의 성공]과 [환자 치료에 대한 그러한 조치의 효과]를 둘 다 평가하는 것이 적절할 것이다. 그러나 이러한 영향은 비판적 성찰과 일치하는 방식으로 평가해야 한다.

Although it has often been argued that all assessment is a form of control,63 one could easily imagine that explicitly enforcing—through grading—particular ways of viewing the social world might cause discomfort amongst contemporary educators. However, there are at least two other options that might be less ethically fraught.

  • There is a long history in the health professions of identifying values and norms (often delineated in codes of professional ethics) required of all practitioners while working as a member of the profession in the practice setting; contemporary examples of such values might include compassion and honesty. One could, therefore, assess students’ abilities to enact or perform these profession-specific, agreed-upon values within the workplace.
  • In addition, if critical reflection is taken up as part of an institutional shift to espousing and modeling particular values that are thought to improve patient care, then it would be appropriate to evaluate both the success of the school in enacting those values at the institutional level and the effect of those actions on patient care. However, these effects would need to be assessed in ways aligned with critical reflection.

비판적 성찰과 연계된 평가는 주로 추가 연구의 영역으로 남아있지만, 관점과 가치의 변화를 측정하기 위한 [체크리스트 접근방식]은 비판적 성찰의 기본 원칙과 일치하지 않을 수 있다. 대신 시뮬레이션 디브리핑 중 대화 분석을 포함하여 개인의 시프트된 관점을 평가하기 위한 접근방식을 모색하기 시작했습니다. 학자들은 최근 성찰성에 대한 학습을 평가하기 위해 담론 분석 접근법을 사용했으며, 우리는 비판적 성찰에도 같은 것이 이루어질 수 있다고 제안한다. 

Although assessment aligned with critical reflection largely remains an area for further research,59 a checklist approach to measuring a shift in perspective and values would likely not be congruent with the underlying principles of critical reflection. Instead, we have begun to explore approaches to assessing a person’s shifted perspective, including, for example, analyzing conversations during simulation debriefings. Scholars have recently used discursive analysis approaches to assess learning about reflexivity, and we suggest that the same could be done for critical reflection.64

비판적 성찰성 교육 및 평가
Teaching and assessing for critical reflexivity

[비판적 성찰]을 가르치는 전반적인 목표가 [프락시스Praxis를 자극하는 것]이라면, [비판적 성찰성]을 가르치는 전반적인 목표는 [갱신된 행위자성renewed agency을 자극하는 것]이다. 행위자성은 [사회에 대해 행동할 수 있는 것]을 의미하며, 그것은 우리의 현재 행동 방식의 한계를 벗어나 더 나은, 더 윤리적 세상을 생각하는 것으로 시작해야 한다. [현재의 사고방식과 지식의 한계를 넘어 생각]할 수 있어야 하기 때문에, 진정한 에이전시를 갖기 위해서는 성찰성적이어야 한다. 위의 예를 계속하여, 만약 우리가 개인의 수준에서 [비판적 반성]을 평가하고 싶다면, 우리는 먼저 현재의 평가 정의를 재고하는 사람들을 반사적으로 생각하고 평가하는 방법을 제정할 필요가 있을 것이다. (즉, 평가의 다른 전제조건/이해에 의해 통지되는 새로운 평가 개념을 만드는 것). 여기서 우리는 [비판적 성찰과 비판적 성찰성 사이의 중첩]을 발견합니다. 즉, 평가를 완전히 다르게 상상함으로써 새로운 재료 평가 접근법을 만듭니다.

While the overall goal of teaching critical reflection is to stimulate praxis, the overall goal for teaching critical reflexivity in HPE is to stimulate renewed agency. Agency means being able to act on society, which must begin with thinking of a better, more ethical world, outside the confines of our current ways of doing things.44 One must be reflexive to have true agency as one must be able to think beyond the confines of current ways of thinking and knowing.44 Continuing with the example above, if we wanted to assess critical reflection at the individual level, we would need to first reflexively conceive of and enact a way of assessing people that rethinks current definitions of assessment (i.e., creating a new conception of assessment informed by different assumptions/understandings of assessment). Here we see a point of overlap between critical reflection and reflexivity—creating new material assessment approaches by imagining assessment completely differently.


[성찰성]을 가르치기 위해서는, 학생들에게 [자기 자신]뿐만 아니라, [자신의 위치나 존재 방식] 등에 대해서도 암묵적인 가정을 보다 폭넓게 질문하는 방법을 가르쳐야 합니다. 학생들은 [(일상적으로 정상으로 보이지만) 실제로는 역사와 우연의 산물인 사회적 현상을 "낯설게make strange" 만드는 방법]을 배울 필요가 있을 것이다.65 이러한 사고방식은 사회과학 전공에서 일상적으로 가르치고 있으며, HPE는 이러한 접근법에서 차용될 수 있다.8 예를 들어,

  • 학생들은 특정한 개념(즉, 형평성, 권력)을 정의하도록, 그리고 중요한 이론적 프레임워크를 선택해서 작업하도록 배울 필요가 있을 것이다.
  • 그들은 또한 식민주의, 동성애 혐오증, 인종차별, 또는 환자들이 직면할 수 있는 다른 유사한 형태의 차별과 같은 주제에 대해 교육받을 필요가 있을 것이다.
  • 교수들은 학생들이 이 지식을 습득할 수 있도록 하고 모든 지식 주장의 기초가 되는 가정에 대한 추가 질문의 기초로 사용할 수 있도록 해야 합니다.

To teach reflexivity, students would need to be shown how to question their tacit assumptions not only about themselves—their own position and ways of being—but also about societal norms more broadly. They would need to learn how to “make strange” social phenomena that are routinely seen as normal but are actually socially constructed products of history and happenstance (e.g., definitions of family, competence, or disability).65 These ways of thinking are routinely taught in social science faculties; HPE could borrow from these approaches.8 For example,

  • students would need to be taught to define specific concepts (i.e., equity, power) and work with a selection of important theoretical frameworks.
  • They would also need to be educated about such topics as colonialism, homophobia, racism, and/or other similar forms of discrimination that might be faced by their patients.
  • Faculty members would need to enable students both to acquire this knowledge and to use it as the basis for further questioning the assumptions underlying all knowledge claims.

이 사회과학 지식에 대한 평가는 학생들이 토론, 서면, 그리고 실제에서 어떻게 주요 개념을 적용하는지에 초점을 맞출 수 있다. 여기서 중요하지만 미묘한 차이점에 주목하십시오.

  • [비판적 성찰]은 프락시스 지향의 전통에서 비롯됩니다. 그것은 [보는 방법과 존재하는 방법ways of seeing and being]에 더 초점을 맞추고 있기 때문에, 학습과 성과를 평가하는 [전통적인 학문적 방식]에 덜 적합합니다. 따라서 비판적 반성은 평가에 대한 더 실무에 기초한 접근법practice-based에 도움이 될 수 있다.
  • 한편, [비판적 성찰성]은 학습자가 기억력, 이해력 및 적용 측면에서 시험할 수 있는 [사회과학 이론 세트]를 명확하게 포함하고 있다는 점에서, 약간 더 "전통적인" 것으로 생각될 수 있다. 즉, [비판적 성찰성적 이론의 이해]가 아니라, [비판적 반사성의 집행enact]에 대한 평가는 위에서 언급한 것처럼 [비판적 성찰]과 유사한 평가 접근법을 필요로 할 것이다.

비판적 성찰과 반사성의 궁극적인 목표는 겹치므로, 평가 접근법은 결국 관점과 관행이 어떻게 변화했는지를 결정하는 데 수렴될 수 있다. 

Assessment of this social scientific knowledge could focus on how students apply key concepts in discussion, in writing, and in practice. Note here a key, yet subtle, difference.

  • Critical reflection derives from praxis-oriented traditions; it is more focused on ways of seeing and being and thus fits less neatly into our traditional academic ways of assessing learning and performance. Critical reflection may therefore lend itself to more practice-based approaches to assessment.
  • Meanwhile, critical reflexivity could be conceived of as being slightly more “traditional” in that it contains clearly agreed-upon sets of social science theory that learners could be tested on in terms of memory, understanding, and application. This said, the enactment of critical reflexivity as opposed to the understanding of critically reflexive bodies of theory would require similar assessment approaches to critical reflection such as those mentioned above.

The ultimate goals of critical reflection and reflexivity overlap, so the assessment approaches might eventually converge around determining how perspectives and practices have shifted.59

비판성을 위한 공간 확보
Making Space for Criticality

비판적 성찰과 반사성을 가르치고, 평가하고, 평가하는 위의 어떤 제안도 생명과학에서 일반적인 것 이상의 것을 알 수 있는 철학적, 물리적 공간 없이는 가능하지 않습니다. 다른 학자들이 이를 탐구했고, 우리는 독자들에게 이 작품들을 살펴보라고 권한다. 
None of the above suggestions for teaching, assessing, and evaluating critical reflection and reflexivity are possible without a philosophical and physical space for ways of knowing beyond those common in bioscience. Other scholarship has explored this, and we direct readers to these works.38,61,66,67

이 기사에서는 비판적 성찰과 비판적 성찰성의 개념을 보다 정밀하고 뉘앙스로 도입하고, 사회과학이나 인문학의 개념을 HPE에 적용하는 이 접근방식을 채택할 기회를 제시한다. 그러나 우리는 비판적 성찰 및 비판적 성찰성을 (지속적으로 적용하는 과정에서 진화하지 않는) 완전하거나 정적인 개념으로 포지셔닝할 의도가 없다. 사실, 브룩필드는 우리가 궁극적으로 비판적 성찰의 과정을 그 자체로 되돌릴 것을 옹호한다. 우리는 비판적 성찰과 비판적 성찰성 자체를 문제화해야 한다고 주장한다. 이러한 개념이 더 대중화되면, 그것들은 또한 더 희석되어 의미가 "증발"되고, 궁극적으로 물화reified된다. 그렇게 되면, 이 개념은 [원래 그것이 기원한 맥락]을 훨씬 넘어, [담론의 수준]으로 올라감을 의미한다. 우리는 이미 비판적 성찰에서 피난evacuation의 징후를 볼 수 있다(비판적 성찰을 가르치고 육성한다고 주장하는 수많은 과제와 포트폴리오). 

This article sets forth an opportunity to engage the concepts of critical reflection and reflexivity with more precision and nuance, and to take this approach to applying any social science or humanities concept to HPE. However, we do not intend to position critical reflection and reflexivity as infallible or static concepts, unable to evolve as they are continually applied. In fact, Brookfield26 advocates that we ultimately turn the critically reflective process back on itself. We argue that we must problematize both critical reflection and reflexivity themselves. As these concepts become more popular, they also become more diluted, becoming “evacuated” of meaning (wherein the concepts mean everything and thus nothing) and ultimately reified, which means the concepts can become raised to a level of discourse well beyond their original contexts of origin. We can already see signs of evacuation of critical reflection (with countless assignments and portfolios claiming to teach and foster critical reflection but meaning vastly different things).

브룩필드는 또한 우리가 비판적 성찰을 홍보하는 것에 너무 빠져든 나머지, 그것을 [배제의 메커니즘]으로 사용하고, [권력을 얻기 위한 수단]으로 사용할 수 있다고 경고한다. 우리는 (마치 비판적 성찰을 위해 사용하고 가르치는 교육자들이 점점 더 나은 교육자가 되어 억압을 뿌리뽑을 수 있다는 것과 같은) "선형적인 진보"를 목격할 것이며, 또 그래야만 한다는 생각을 버려야 한다. 브룩필드는 "지배적 문화적 가치가 다수보다 소수의 이익에 기여하는 방식을 분석하는 데 적용한 것과 동일한 [합리적 회의론]을 우리 자신의 입장에 적용해야 한다"고 결론지었다. 또한, 우리 자신의 실천에 대해 비판적으로 성찰하는 입장은 [건강한 아이러니]이다. 이것은 우리가 좋은 관행에 대한 하나의 보편적인 진실을 포착했다는 믿음에 대한 필요한 대비책hedge이다. 또한 [비판적 성찰 프로토콜]을 [무비판적 개발하고 물화하는 것]을 방지하는 데에도 도움이 된다."라고 말하였다.  

Brookfield further cautions that we can get so caught up in our own promotion of critical reflection that we use it as a mechanism of exclusion and means to gain power. We also need to let go of the notion that we can and should see “linear progress,” as if educators using and teaching for critical reflection become increasingly better educators, eradicating oppression one day at a time. Brookfield concludes that we must “apply the same rational skepticism to our own position that we apply to analyzing how dominant cultural values serve the interests of the few over the many. A critically reflective stance towards our practice is healthily ironic, a necessary hedge against the belief that we have captured the one universal truth about good practice. It also works against uncritical development, and reification, of protocols of critical reflection.”26(p47) 

우리는 Brookfield의 현명한 말을 반복하고, 모든 과학적이고 SS&H의 개념과 방법은 원래 분야와 HPE 양쪽에서 지속적인 정밀 조사를 받아야 한다고 강조한다. 비판적 성찰과 비판적 성찰성의 경우, 지속적인 연구는 학습 방법, 학습 방법 및 학습 방법, 평가 방법 및 평가 방법, 결정적 성찰 또는 반사성의 교육 및 평가가 정렬되고 의미 있는 영향에 대해 어떻게 평가될 수 있는지에 초점을 맞출 필요가 있다. [비판적 성찰과 비판적 성찰성]의 목적은 (유일하고 고정적이며 올바른 존재, 시각, 사고방식으로 이어지는 것이 아니라), 자신의 존재, 시각, 사고방식의 기초가 되는 가정에 대한 지속적인 의문을 불러일으키는 것이다. 이러한 접근방식을 보다 신중하게 실장하는 방향으로 나아가면 평가 접근방식도 조정되고 적절해야 합니다. 이러한 지속적 질문과 일치된 평가는 HPE 분야의 지속적인 발전과 보건 전문가의 사고 및 실천의 핵심이다.

We echo Brookfield’s wise words, and stress that all scientific and SS&H concepts and methods be subject to continued scrutiny both from within their originating disciplines and in HPE. For critical reflection and reflexivity, continued research needs to focus on how they are learned, how they can and should be taught, how they can and should be assessed, and how the teaching and assessing of critical reflection or reflexivity might be evaluated for aligned and meaningful impacts. The purposes of critical reflection and reflexivity are not to lead to a singular, fixed, right way of being, seeing, and thinking but, rather, to inspire continual questioning of the assumptions underlying one’s ways of being, seeing, and thinking. As we move toward implementing these approaches more thoughtfully, evaluation approaches must also be aligned and appropriate. This continued questioning and aligned evaluation are core to both the ongoing development of the HPE field and that of health professionals’ thinking and practice.

 


 

Acad Med. 2019 Aug;94(8):1122-1128.

 doi: 10.1097/ACM.0000000000002724.

The Divergence and Convergence of Critical Reflection and Critical Reflexivity: Implications for Health Professions Education

Affiliations collapse

Affiliation

1S.L. Ng is director of research, Centre for Faculty Development, and Arrell Family Chair in Health Professions Teaching, St. Michael's Hospital, scientist, Centre for Ambulatory Care Education and the Wilson Centre, and assistant professor, Department of Speech-Language Pathology, University of Toronto, Toronto, Ontario, Canada. S.R. Wright is scientist, Michael Garron Hospital, Centre for Ambulatory Care Education and the Wilson Centre, and assistant professor, Department of Family and Community Medicine, University of Toronto, Toronto, Ontario, Canada. A. Kuper is associate professor of medicine and faculty co-lead in person-centred care, Department of Medicine, scientist and associate director, Wilson Centre for Research in Education, University Health Network, University of Toronto, and staff physician, Division of General Internal Medicine, Sunnybrook Health Sciences Centre, Toronto, Ontario, Canada.

PMID: 30920447

DOI: 10.1097/ACM.0000000000002724

Abstract

As a field, health professions education (HPE) has begun to answer calls to draw on social sciences and humanities (SS&H) knowledge and approaches for curricular content, design, and pedagogy. Two commonly used SS&H concepts in HPE are critical reflection and critical reflexivity. But these are often conflated, misunderstood, and misapplied. Improved clarity of these concepts may positively affect both the education and practice of health professionals. Thus, the authors seek to clarify the origins of each, identify the similarities and differences between them, and delineate the types of teaching and assessment methods that fit with critical reflection and/or critical reflexivity. Common to both concepts is an ultimate goal of social improvement. Key differences include the material emphasis of critical reflection and the discursive emphasis of critical reflexivity. These similarities and differences result in some different and some similar teaching and assessment approaches, which are highlighted through examples. The authors stress that all scientific and social scientific concepts and methods imported into HPE must be subject to continued scrutiny both from within their originating disciplines and in HPE. This continued questioning is core to the ongoing development of the HPE field and also to health professionals' thinking and practice.

HPE연구의 네러티브 분석의 잠재력: 다섯 개의 분석적 렌즈(Med Educ, 2021)
The potential of narrative analysis for HPE research: Highlighting five analytic lenses
Abigail Konopasky1,2 | Lara Varpio1 | Renée E. Stalmeijer3

 

1 소개
1 INTRODUCTION

현대 보건의료전문직교육(HPE) 연구자들은 [여러 가지 고약한wicked 문제]에 직면해 있다1. 몇 가지만 열거하더라도, 전문가간 협력, 의학 학습에서의 수치심 경험, 소수자 의사와 훈련생에게 인종차별이 어떤 영향을 미치는지 등등이다. 이러한 문제들을 고약하게 만드는 이유 중 일부는 그것들이 사회적 특성social nature을 가지기 때문이다; 이러한 도전들에 관련된 개개인의 특별한 경험, 믿음, 선택은 그들이 그들 자신의 주관적인 해석이 수반되기 때문에, [확정적인definitive 공식이나 설명을 거부한다]는 것을 의미한다. 이러한 사회적 뿌리를 고려할 때, 질적 연구 방법은 HPE의 고약한 문제를 이해하고, 부분적으로는 맥락을 고려한context-bound 해결책을 만드는 데 도움이 될 수 있다. 

Contemporary health professions education (HPE) researchers are faced with a number of wicked problems1: interprofessional collaboration, experiences of shame in medical learning and how racism affects minoritised physicians and trainees, to note a few.2-12 Part of what makes these problems wicked is their social nature; the particular experiences, beliefs and choices of individuals involved in these challenges mean that they defy definitive formulation or explanation since the multiple people involved all bring their own subjective interpretations. Given these social roots, qualitative research methods can be helpful in understanding HPE's wicked problems and constructing some partial, context-bound solutions.13 

이러한 문제를 다루는 질적 분석은 가치 있는 통찰력을 만들어냈지만, 다수는 [유사한 질적 방법과 방법론]에 의존해 왔다.

  • 전문가간 협력에 대한 연구는 일반적으로 관찰, 인터뷰 및 포커스 그룹 방법의 조합을 사용하여 전문가간 협업을 가능하게 하거나 방해하는 요소를 푸는 정성적 접근법을 사용해 왔다. 
  • 수치심 조사는 일대일 인터뷰를 통해 수집된 데이터로 현상학을 활용했다. 
  • 의사와 훈련생에게 미치는 인종차별의 영향에 대한 탐구는 종종 비판적 이론의 관점에서 데이터를 수집하기 위해 일대일 인터뷰를 이용했다. 

분석적 측면에서 살펴보면, 이러한 고약한 문제에 대한 접근법은 [지속적인 비교 및 주제적 내용 분석]을 포함한다. 

Qualitative analyses addressing these problems have generated valuable insights, but many of them have relied on a similar set of qualitative methods and methodologies:

  • studies of interprofessional collaboration have generally used qualitative approaches using a combination of observation, interview and focus group methods to unpack what enables or hinders interprofessional collaboration.41214-16 
  • Investigations of shame have harnessed phenomenology with data collected via one-on-one interviews.67 
  • Explorations of racism's effects on physicians and trainees have also used one-on-one interviews to collect data, often from a critical theory perspective.8-101718 

Analytically, approaches to these wicked problems have included constant comparative and thematic content analysis, among others.

추가적이고 보완적인 통찰력을 제공하는 데 도움이 될 수 있는 분석 접근법의 또 다른 세트는, 사람들이 자신의 세계를 이해하기 위해 사용하는 [핵심적 도구]에 의존한다. 바로 네러티브(서사)이다. 브루너는 이야기는 개인이 '삶의 바로 그 사건들을 목적적으로 만드는' 원칙적인 수단이라고 주장했다. 그는 [사람들이 그들의 경험에 대해 가지고 있는 이야기]가 [인간이 의미를 만드는 기본적 과정에 대한 통찰력]을 제공한다고 믿었다.

Another set of analytic approaches that may help provide additional, complementary insights relies on a central tool many individuals use to make sense of their world: narrative.1920 Bruner argued that stories are a principle means by which individuals ‘purpose-build the very events of a life’1915; he believed the stories people have of their experiences offer insight into humans' basic meaning-making processes.

[내러티브 분석 방법(NA)]은 HPE 연구원들이 임상의 교육자와 HPE 학습자가 자신의 삶을 이해할 수 있는 내러티브 방법을 활용하고자 하기 때문에 귀중한 자산이 될 수 있다. 이러한 자산을 활용하려면 다양한 [NA 렌즈]가 제공할 수 있는 가능성을 검토하는 것이 도움이 될 수 있습니다. 분석적 렌즈analytic lenses는 질적 연구를 하는 특별한 '스타일'이다. 이론과는 달리, 그것들은 우리가 보는 것을 규정하지 않지만, Blumer의 [민감 개념sensitising concept]처럼, '어떤 방향에서 볼지를 제안'함으로써 질문과 주장을 형성한다.22

Methods of narrative analysis (NA) can be valuable assets as HPE researchers seek to tap into the narrative ways of knowing19 by which clinician educators and HPE learners may understand their lives. To harness these assets, it may be helpful to review the possibilities different NA lenses can provide. Analytic lenses are particular ‘styles’ of doing qualitative research21; unlike theories, they do not prescribe what we see but, like Blumer's sensitising concepts, ‘suggest directions along which to look’, shaping the questions asked and the claims made.22

이 연구 접근 논문은 NA 방법이 연구자들에게 제공할 수 있는 다섯 가지 분석 렌즈(전체론, 위치론, 언어론, 대리인, 순차론)를 강조한다. 우리는 사회과학 연구의 '서사적 전환narrative turn'을 검토함으로써 이 설명을 시작합니다. 그런 다음 HPE에서의 사용(과거 및 잠재력)과 한계에 대해 논의하는 다섯 가지 렌즈(홀리스틱, 위치, 언어, 대리 및 순차)를 각각 설명한다. 또한 렌즈에 액세스하는 데 사용할 수 있는 특정 NA 방법을 이해하기 위한 두 가지 접근 방식을 논의한다. 우리는 우리의 렌즈와 경험을 되새기며 NA의 약속과 편파성을 탐구함으로써 결론을 내린다.
This Research Approaches article highlights five analytic lenses NA methods can offer researchers: holistic, situated, linguistic, agentive and sequential. We preface this description by reviewing the ‘narrative turn’ in social science research.23, 24 We then describe each of the five lenses—holistic, situated, linguistic, agentive and sequential—discussing their use (past and potential) in HPE and limitations. We also discuss two approaches to understanding specific NA methods that can be used to access the lenses. We conclude by exploring the both the promise and partiality of NA, reflecting on our own lenses and experiences.

 

2 배경: '서사적 전환'
2 BACKGROUND: THE ‘NARRATIVE TURN’


1980년대 중반 제롬 브루너와 다른 사람들이 내러티브 연구의 정당성을 확고히 확립한 사회과학 연구의 '사서적 전환'을 이루었다. 그렇게 함으로써, 그들은 실증주의에 도전했고 (패러다임이나 범주적 방식 대신) 내러티브 방식의 지식을 장려했다. 학자들은 [내러티브에 대한of 연구]뿐만 아니라, [실천과 사건을 내러티브로as 해석하는 연구를 포함하는 서사적 탐구narrative inquiry]를 통해 이러한 지식을 탐구했다. 이후 학자들은 여러 연구 패러다임, 학문 분야, 방법론에 걸쳐 서사적 탐구를 사용해오면서, 사고의 서사적 모드의 가치를 인정하고 이용해왔다. 연구참여자들이 자신의 경험담을 어떻게 구성하는지를 연구하거나, 연구자들의 스토리텔링으로부터 전개drawing를 통해 참가자들을 더 잘 이해하게 된 것이다.
The mid-1980s marked the ‘narrative turn’ in social science research, when Jerome Bruner and others firmly established the legitimacy of narrative inquiry.23, 24 In so doing, they challenged positivism and promoted narrative—versus paradigmatic or categorical—ways of knowing.19, 23, 25, 26 Scholars explored these ways of knowing through narrative inquiry, which encompasses any study of narrative (or collections of narratives) as well as studies interpreting practices and events as narratives.20, 26, 27 Scholars have used narrative inquiry across multiple research paradigms, academic disciplines and methodologies, but they all value and harness this narrative mode of thinking, either studying how participants construct the stories of their experiences or drawing on researchers' storytelling to better understand participants.28-31

학자들이 서사적 분석(NA)에 대한 접근 방식을 개발한 것은 바로 이러한 방향에서이며, 서사적 탐구를 해나갈 지향orientation을 의미한다. NA 방법은 광범위하고 유연하게 해석하고 적용할 수 있으므로, 우리가 도출하거나 가리키려고 하는 [NA 방법의 목록]이란 존재하지 않는다. 대신 아래는 NA 문헌과 우리의 경험을 바탕으로 NA가 HPE 연구자에게 제공할 수 있는 렌즈 5개를 제공합니다. 각 렌즈는 데이터와 연구 맥락의 일부 측면을 강조하는 동시에 다른 부분을 강조하므로 연구 설계자는 그 중에서 신중하게 선택해야 한다.

It is from within this orientation that scholars develop their approach to narrative analysis (NA), that is, orientations through which they carry out a narrative inquiry. NA methods are wide-ranging and can be flexibly interpreted and applied, so there is no single list of NA methods we draw from or point to. Instead, below, based on the NA literature and our own experiences,23, 25, 26, 32 we offer five lenses NA can offer HPE researchers. Each lens highlights some aspects of the data and research context while deemphasising others, so research designers must carefully select from among them.

3 과정: 5개의 렌즈 장착
3 PROCESS: FIVE LENSES ON NA

NA의 [전체론적 렌즈holistic lens] 는 이야기의 지위를 복잡하고 통합된 단위로서 보존한다. 이 렌즈는 데이터를 별도의 청크나 테마로 분류하기 보다는 [하나의 이야기, 하나의 사건, 심지어 하나의 이야기와 사건의 시리즈 내에서의 연결]에 초점을 맞춘다. 내러티브에 대한 이 조감도 렌즈는 연구자에게 [데이터를 하나의 (또는 소수의) 해석으로 합성]하도록 요청하며, 아마도 [전체적인 주제, 도덕 또는 스타일]을 생성할 것이다. 이것은 프라이스와 동료들이 그들의 직업 선택에 대한 밀레니얼 간호사들의 설명에 대해 연구한 것과 같이 이야기 간 비교를 가능하게 한다(표 1 참조). 전체론적 렌즈는 각 [참가자의 이야기를 복잡하고 일관되게 이해]할 수 있게 해주었고, 프라이스와 동료들이 말하는 '참가자 이야기의 전체성과의 연결'을 유지했습니다.34 이 렌즈는 참가자의 이야기를 일관성 있게coherent 설명할 수 있게 해준다. [하나의 사건이나 순간이 네레이터에게 어떻게 영향을 미쳤는지]를 조사할 뿐만 아니라, [이야기의 모든 사건과 순간들이 어떻게 의미를 창조하기 위해 함께 작용하는지]를 보여준다.

The holistic lens on NA preserves the status of a story as a complex and integrated unit.23 Rather than categorising data into separate chunks or themes, this lens focuses on connections within a story, an event or even a series of stories and events that build a systematic whole.33 This bird's eye lens on narrative asks the researcher to synthesise data into a single (or small number of) interpretation(s), perhaps generating an overall theme, moral or style. This allows comparison across stories, as Price and colleagues34 did in their study of millennial nurses' accounts of their career choice (see Table 1). The holistic lens provided an understanding of each participant's story that was both complex and coherent, maintaining what Price and colleagues call, ‘ongoing connection to the wholeness of the participants' stories’.34 This lens allows for a coherent account of participants' stories, examining not just how one event or moment may have affected the narrator but how all the events and moments of a story work together to create meaning.

NA의 전체론적 접근법을 사용하는 연구자들이 해결해야 할 근본적인 과제는 '전체' 단위, 즉 '전체' 이야기를 기술하는 것이다. 즉, 전체론적인 NA 렌즈를 사용하는 학자들은 [분석해야 할 '전체'가 어느 정도인지 결정]해야 한다. 이 결정은 [길고 다부진 인생 이야기]부터, [단 몇 구절의 '작은 이야기']까지 매우 다양할 수 있다. 그리고, 미슬러의 주장처럼, 무엇이 이야기이고 무엇이 이야기가 아닌지를 묘사하는 선line과, 그 이야기를 어떻게 표현하는지는 해석 과정의 일부이다. 게다가, [연구자의 전체론적 관점]은 [참가자들이 그들의 이야기 전체를 보는 방식]과 일치하지 않을 수 있다. 따라서 전체론적 렌즈를 사용하는 학자들은 자신의 해석의 잠재적 우위에 대해 인식하고 NA 과정에 참여자를 포함하기 위해 노력해야 한다.
A foundational challenge that researchers using NA's holistic approach must contend with is delineating what is a ‘whole’ unit, a ‘whole’ story. In other words, scholars using the holistic NA lens must decide how much of a person's story is the ‘whole’ to be analysed. This decision can be highly variable, ranging from a long and multi-part life story down to ‘small stories’ of just a few phrases or sentences.32, 38 And, as Mishler argued, the lines delineating what is and is not a story and how to represent that story are part of the interpretative process.39 Moreover, a holistic researcher perspective may not align with the ways participants see the whole of their stories. Scholars using the holistic lens, then, must be aware of the potential primacy of their interpretations and work to include participants in the NA process.

NA의 [상황적 렌즈situated lens]는 개인이 내러티브를 형성하는 [특정 문화적 맥락]을 전경foregrounds으로 한다. 이 렌즈는 청중, 서술의 목적 또는 기능, 그리고 해설자들이 끌어 들이는 문화적 자원을 고려하여, 이러한 맥락에서 무엇이 논쟁되고 정규화되거나 '표준화'되는지를 이해하고자 한다. 이러한 관점에서, 이야기는 [그 문화에서 이용할 수 있는 서사적 자원을 사용하여, 화자와 청자에 의해 공동 구성된 것]으로 볼 수 있다; 연구자들은 네러티브가 그것이 말해지거나 집행되는 맥락context어떻게 연결되는지 완전히 탐구한다.41 예를 들어, 연구자들은 언제 그리고 어떻게 청자가 긍정하고, 이의를 제기하고, 심지어 이야기를 이어받는지 보기 위해 [화자와 청자 사이의 상호작용]에 초점을 맞출 수 있다. 이러한 상호작용을 추적하면서 연구자들은 공동 창작자들이 이야기를 그리는 [사회적 구성](예: 성별, 인종 또는 민족 정체성)과 [문화적 구성](예: 과로한 레지던트, 보조 간호사, 영웅적 외과의)에 관심을 기울인다.

The situated lens on NA foregrounds the particular cultural context(s) in which individuals create narratives.23, 40 This lens seeks to understand what is contested and what is normalized or ‘typified’31 in these contexts, considering audience, the purpose(s) or function(s) of the narrative and the cultural resources narrators draw upon.23, 40 From this perspective, stories can be seen as co-constructed by the teller and hearer using the narrative resources available in the culture; researchers fully explore how the narrative connects with the context in which it is told or enacted.41 For instance, researchers might focus on the interactions between teller and hearers to see when and how hearers affirm, contest or even take over the story.41 As they trace these interactions, researchers attend to social constructs (e.g., gender, racial or ethnic identity) and cultural constructs (e.g., the overworked resident, the supportive nurse and the heroic surgeon) on which story co-creators draw.23, 42 

Sargeant 등에 의한 연구는 상황적 렌즈를 사용하여 모의 환자들이 그들의 일에 대한 서사에서 의대생과 비교해서 자신들을 어떻게 위치시키는지position 탐구했다(표 1 참조). 이 위치 렌즈는 사회적, 문화적 신념과 구조가 그들의 세계에 대한 화자의 이해를 형성하는 방법에 대한 연구자들의 통찰력을 뒷받침했다. 이 연구에서 모의 환자들은 [가족]이라는 문화적 개념을 활용하여 [자신을 의대생들의 부모상parental figures]으로 이해했다.

A study by Sargeant and colleagues35 used a situated lens to explore how simulated patients position themselves vis-a-vis medical learners in their narratives about their work (see Table 1). This situated lens supported researchers' insights into the ways social and cultural beliefs and structures shape a narrator's understanding of their world. In this35 study, simulated patients drew on the cultural notion of family (among others) to understand themselves as parental figures to the medical learners.

그러나, 상황적 렌즈situated lens를 사용하는 다른 학문과 마찬가지로, 연구자들은 궁극적으로 분석, 해석, 그리고 궁극적인 연구 네러티브에서 [어떤 지역적, 문화적 맥락의 요소들을 전경에 둘지foreground]를 선택한다. 연구자는 자신의 경험, 문화적 배경, 이론적, 개념적 프레임워크에 영향을 받아 특정 서술이 수행하는 작업에 대한 연구자의 해석은 맥락의 [일부 측면을 지나치게 강조하여 다른 측면을 모호하게] 할 수 있다. 미슐러가 지적했듯이, 내러티브 학자들은 연구참가자들처럼 스토리텔러이다: '우리가 이야기를 발견하는 것이 아니라 이야기를 만드는 것이 분명하다. 우리는 분석적인 재설명을 통해 응답자들의 설명을 다시 말한다. 우리도 역시 스토리텔러이다….25
As with any scholarship using a situated lens, however, researchers ultimately choose which elements of the local and cultural context to foreground in the analysis, interpretation and eventual research narrative. Influenced by their own experiences, cultural background and theoretical and conceptual frameworks, researchers' interpretation of the work a particular narrative is doing may overemphasise some aspects of the context and obscure others. As Mishler noted, narrative scholars are, like their participants, storytellers: ‘It is clear that we do not find stories; we make stories. We retell our respondents' accounts through our analytic redescriptions. We, too, are storytellers …’.25

NA의 [언어적 렌즈linguistic lens]는 내러티브의 형식과 구조, 내용 모두를 질문한다. 인간 언어는 스토리텔링을 위한 단어, 구, 융통성, 의미의 무한한 잠재적 조합을 제공하는 문법적 자원을 제공하며, 이 렌즈는 화자들이 그 자원들에 대해 하는 선택을 조사한다.

  • 예를 들어, 거의 틀림없이 같은 정신 상태를 서술하더라도, '모른다'(즉, 나는 당신의 질문에 대답하는 데 필요한 지식이 없다)는 '당신[일반]은 알 수 없다'는 말과 다른 함축적 의미를 갖는다. (즉, 누구도 미래를 예측할 수 있는 지식을 가지고 있지 않다.)


NA's linguistic lens interrogates both the form and structure of a narrative as well as its content.40, 42 Human languages offer grammatical resources that provide an infinite number of potential combinations of words, phrases, inflexions and meanings for storytelling,43 and this lens examines the choices narrators make about those resources.40, 42, 44, 45 

  • For instance, while narrating what is arguably the same mental state, ‘I don't know’ (i.e., I haven't the knowledge required to answer your question) has different connotations from the statement ‘you [generic] just can't know’ (i.e., nobody has the knowledge to predict the future).46 

이러한 차이는 NA의 [언어적 렌즈]에 초점을 맞춘다. 언어적 렌즈의 중심적인 이점은 전문적인 딜레마의 의대생 내러티브에 대한 리스, 몬루제, 맥도날드 47의 연구에서 증명된 바와 같이 서술자narrator의 정체성에 대해 드러낼 수 있는 것이다. 한 학생의 딜레마에 대한 한 줄 한 줄 분석에서, 연구원들은 그녀가 괴롭힘의 피해자임에도 불구하고, 자신을 '매우 강한 여성'으로 구성하기 위해 어떻게 언어를 사용했는지를 보여주었다.47 이 언어 렌즈는 참가자가 그녀의 부정적인 경험에 대한 '통제'를 얻고' 그녀를 의사 커리어를 지속하게 하는 [정체성 작업identity work]을 하는데 어떻게 내러티브를 사용했는지를 강조하였다. 

These differences are brought into focus with NA's linguistic lens. A central benefit of the linguistic lens is what it can reveal about narrator identity,32, 40, 42 as demonstrated in Rees, Monrouxe, and McDonald's47 study of medical student narratives of professional dilemmas (See Table 1). In a line-by-line analysis of one student's dilemma, the researchers showed how she used language to construct herself as a ‘VERY strong woman’, despite being a victim of bullying.47 This linguistic lens highlighted how this participant used narrative to do the identity work of ‘gain[ing] control over her negative experience’ and persisting in her medical career.47

모든 연구 방향과 마찬가지로 NA의 언어 렌즈에도 한계가 있다. 

  • 첫째, 단어에만 집중하는 것은 다른 방법, 즉 억양, 몸짓, 또는 신체 위치 결정과 같은 부언어적 단서들로 전달되는 중요한 메시지들을 놓칠 수 있다. 전사된 단어에 대한 분석적인 집중은 '말하는' 다른 것들을 모호하게 할 수 있다.
  • 둘째, 데이터를 이산적discrete 언어 범주(예: 언어적 망설임 표식)로 분할함으로써, 연구자들은 내러티브의 전체적인overall 목적을 상실할 수 있다. 예를 들어 [전체론적 렌즈]또는 [상황적 렌즈]가 제공하는 잠재력을 포기하게 되는 것이다. 스털리 교수는 언어 렌즈와 같은 분석적이고 패러다임적인 접근은 '이상화의 경향에 있으며, 연구자들이 이야기를 사전 설정된 범주로 강제하도록 장려하고… [특정한 사회적 사건]에서 [구체적인 서술]이 어떻게 작용work하는지를 놓치고 있다'고 주장했다.

Like all research orientations, NA's linguistic lens has limitations.

  • First, a focus on the words alone can miss the important messages communicated in other ways, i.e., paralinguistic cues like intonation, gesture or body positioning. An analytic focus on the transcribed word can obscure the other things being ‘said’.
  • Second, by fragmenting the data into discrete linguistic categories (e.g., linguistic markers of hesitation), researchers may lose the overall purpose of the narrative, abandoning the potential that, for instance, a holistic or situated lens offers. Bleakley argued that analytical, paradigmatic approaches like that of the linguistic lens, ‘tend to idealisation, encouraging researchers to force stories into preset categories … missing how specific narratives work for specific social occasions’.20

NA의 [행위자적 렌즈agentive lens]행위자성agency, 즉 제약 조건 속에서 행동을 선택하고 실행할 때 인간의 의도적인 활동을 강조한다. 많은 학자들은 이야기를 하는 것을 [행위자적 행위agentic act]로 간주한다: 내레이터는 청자를 위하여, 그리고 청자와 함께 경험을 해석하고 평가한다. 이 렌즈는 이야기의 목적을 이해하기 위해 화자의 선택에 부분적으로 주의를 기울인다: 지금 이 서사적 행위자(또는 에이전트 그룹)는 무엇을 달성하려고 하는가? 
An agentive lens on NA highlights agency—i.e., the intentional activity of humans as they choose and execute actions amidst constraints.48, 49 Many scholars position telling a story as an agentive act: narrators interpret and evaluate experiences for and with the listener.23, 28, 29, 50 This lens attends to the narrator's choices in part to understand the purposes of a story: what is this narrative agent (or group of agents) trying to accomplish?23, 42, 50 

예를 들어, Caps와 Ochs는 고소공포증을 가진 참가자에 대한 그들의 분석을 어떤 객관적인 진실과의 일치보다는 서술자로서 그녀가 했던 해석적 작업에 초점을 맞췄다. 이 행위자적 렌즈는 [서술자 자신의 의도와 행동]뿐만 아니라 [그들이 타인의 의도와 행동을 어떻게 보는지]에 대한 이해를 지원한다. 예를 들어, Warmington과 McColl의 의대생들이 환자 치료 경험을 설명하는 방법에 대한 연구는 '행위자agency'이라는 단어를 명시적으로 사용하지 않았지만, 학생들을 행위자적 스토리텔러로 만들어 환자와 강사에 대한 '위치positioning'를 지정했다(표 1 참조). Warmington과 McColl의 참가자들은 일부 동의 절차를 무시한 것을 정당화하기 위해, 조건부로 자신의 스토리를 사용했다. 이 렌즈는 나레이터들이 이야기를 통해 만드는 수사적인 움직임rhetorical moves 을 강조합니다.

For example, Capps and Ochs42 focused their analysis of the participant with agoraphobia on her ‘struggle to achieve coherence and continuity’, on the interpretative work she did as a narrative agent rather than on her story's alignment with some ‘objective truth’. This agentive lens supports understanding not only of narrators' own intentions and actions, but also of how they see the intentions and actions of others. For example, Warmington and McColl's49 study of the ways medical students narrate patient care experiences, while not using the word ‘agency’ explicitly, framed the students as agentive storytellers, ‘positioning’ themselves vis-a-vis patients and instructors (see Table 1). Warmington and McColl's49 participants used their stories to justify, with reservations, ignoring some consent procedures (e.g., getting full consent for a medical student to practice rather than just implying it is not a choice). This lens highlights the rhetorical moves narrators make with their stories.

[행위자적 렌즈]는 참가자들의 의도적인 활동에 대한 통찰력을 제공할 수 있지만, 이러한 전략들은 또한 화자가 [기존의 규범과 담론에 의해 어떻게 위치지어지는지positioned by]를 반영한다. 서술형 에이전트는 그들이 자신을 발견하는 [상황과 구조에 의해 제약]을 받으므로, [행위자적 렌즈]를 사용하는 사람들은 또한 이러한 제약을 설명해야 한다. 게다가, 연구 내러티브를 구성할 때, 연구자도 자신의 행위자성을 행사한다는 사실이, 행위자적 렌즈를 더욱 복잡하게 만든다. 참여자의 내러티브를 분석하든, 사건과 경험에서 내러티브를 생성하든, 연구자들은 자신의 이야기에서 일부 내러티브 에이전시를 [공동 선택co-opt]한다.

While the agentive lens can provide insights into participants' intentional activities, these strategies also reflect how the narrator is positioned by existing norms and discourses (recalling the situated lens above).41 Narrative agents are constrained by situations and structures in which they find themselves, so those using an agentive lens must also account for these constraints.48, 49 Moreover, in constructing research narratives, scholars exercise their own agency, further complicating an agentive lens. Whether analysing participant narratives or creating narratives from events and experiences, researchers co-opt some narrative agency in their own telling.

마지막 렌즈 NA는 [순차적sequential 렌즈]이다: 이야기 세계(즉, 이야기 세계)와 경험 세계(즉, 삶의 세계)에서 사건의 순서를 의미한다. Riessman은 내러티브의 기본 정의에 [스토리 세계]와 [삶의 세계]의 순서를 모두 포함시켰다

  • '일시적으로 순서가 매겨지고 일련의 사건들을 요약하는 대화의 경계지어진 세그먼트'와 
    NA의 구별되는 특징인 '행동 순서에 대한 주의'를 취하는 것

The final lens NA offers is sequential: the ordering of events in a story (i.e., the story world) and in experience (i.e., the life world).41 Riessman included both story world and life world ordering in her basic definition of narrative:

  • ‘a bounded segment of talk that is temporally ordered and recapitulates a sequence of events’23 and took ‘attention to sequences of action’ to be the distinguishing feature of NA.23 

행동의 순서는 많은 사람들이 그들의 [세계를 이해하는 한 가지 방법]이며, 종종 시간적 순서로부터 [인과관계를 귀속]시킨다이야기 세계나 삶의 세계에서 [사건의 시퀀스]에 집중하는 것은 다음의 이해를 뒷받침한다.

  • 참가자들이 그들의 삶에서 다양한 사건과 개인을 어떻게 이해하는지,
  • 그들이 서로 어떻게 상호작용하는지, 그리고
  • 그들이 다른 사람들을 야기시키는 어떤 사건과 행동을 어떻게 경험하는지 . 

Sequencing of actions is one way many people make sense of their world, often imputing causality from temporal ordering.31, 40 Attending to the sequence of events—either in the story world or the life world—supports an understanding of

  • how participants understand the different events and individuals in their lives,
  • how they interact with each other and
  • how they experience some events and actions causing others.3140 

예를 들어, 신경외과 의사들의 이야기에서 질병 위신에 대한 요한네센의 연구에서, 그는 이러한 이야기들 - 파단, 진단, 치료 그리고 정상으로의 복귀 - 의 일련의 사건들이 [서양 문화에서 강한 남성적 영웅과 함께 영웅적 스토리]를 미러링한다고 주장했다. 이 경우, [순차적 렌즈]는 어떻게 신경외과의사들이 그들의 행동과 결과에 대해 상상하는지, 그리고신경외과의사로서의 정체성을 구축하는지에 대한 통찰력을 제공하면서 [특정한 유형type]의 이야기 구조를 드러낸다.37

For example, in Johannessen's study of disease prestige in neurosurgeons' narratives, he argued that the sequence of events in these narratives—rupture, diagnostics, treatment and return to normality—mirrored heroic stories with a strong masculine hero in Western culture (see Table 1).37 In this case, the sequential lens revealed a particular type of story structure, offering insight into how those neurosurgeons conceived of their actions and consequences, building prestige for their identity as neurosurgeons.37

[언어적 렌즈]와 마찬가지로 [순차적 렌즈]는 단편화를 초래할 수 있고, 내러티브의 전체적인 목적을 보는 데 어려움을 초래할 수 있다. 또한, [행위자적 렌즈]와 마찬가지로, 이 렌즈는 순서 선택에 있어 서술자narrator의 행위자성을 지나치게 강조할 수 있다. 게다가, 철학자 게일런 스트로슨은 과거와 현재 그리고 미래를 가로지르는 사람으로서의 자아를 기본적으로 직교적으로 이해하는 것은 모든 사람에게 선천적인 것은 아니라고 주장했다. 어떤 이들은 그들의 시간적 자아를 삽화episodic로 생각하기 때문에, 자신의 삶을 내러티브로 인식하지 못한다. 그러한 개인에게 순차적 선택은 근본적인 인과적 이해나 감각 형성 방법을 반영하지 못할 가능성이 높다.
Like the linguistic lens, the sequential lens can lead to fragmentation and difficulty seeing the overall narrative purposes. Also, like the agentive lens, this lens can overemphasise the agency of the narrator in making sequencing choices. Moreover, the philosopher, Galen Strawson,51 argued that the basic diachronic understanding of the self as someone who stretches across past, present and future is not innate to everyone. Some conceive of their temporal selves as episodic and, therefore, have no sense of their lives as narratives.51 For such individuals, sequential choices are likely not reflective of underlying causal understandings or ways of sense-making.


위의 설명에서 알 수 있듯이, 우리가 논의하는 5개의 NA 렌즈는 HPE 연구원들이 얻을 수 있는 다양한 종류의 잠재력을 가지고 있다. 이러한 잠재력을 설명하기 위해 분석적 접근법이 이 다섯 개의 렌즈에 해당한다고 믿는 다섯 개의 HPE 논문으로부터 위의 예를 제공했다. 우리는 표 1에 이것들을 요약한다. 독자에게 NA에 대한 다양한 접근방식을 제공하기 위해 다양한 방법론과 방법을 사용하는 다양한 국가에서 왔다.

As the descriptions above illustrate, the five NA lenses we discuss hold different kinds of potential that HPE researchers can harvest. In order to illustrate this potential, we offered examples above from five HPE articles whose analytic approaches, we believe, correspond to these five lenses. We summarise these in Table 1. They are from a variety of countries, using a variety of methodologies and methods to give the reader a diversity of approaches to NA.

4 렌즈에서 방법으로: 내러티브 분석 유형
4 FROM LENSES TO METHODS: NARRATIVE ANALYSIS TYPOLOGIES

우리가 위에서 사용한 예에서 알 수 있듯이, 전체론적, 위치적, 언어적, 행위자적 및 순차적 렌즈는 각각 잠재적인 이점과 한계를 제공한다. 그러나 이 렌즈들은 그 자체로 방법methods이 아니다. 플롯 분석, 대화식 서술 분석, 내러티브 분석에 대한 브라운 교육 가이드(BEGAN) 그리고 아마도 가장 널리 사용되는 접근법인 라보프와 왈레츠키의 구조 분석 등, 연구자들은 다양한 연구 질문을 다루기 위해 다양한 방법을 사용해 왔다

As the examples we use above demonstrate, the holistic, situated, linguistic, agentive and sequential lenses each offer potential benefits and limitations. But these lenses are not, themselves, methods: researchers have used various methods to address their research questions like plot analysis,52 dialogic narrative analysis,36 the Brown Educational Guide to the Analysis of Narrative (BEGAN)53 and, perhaps, the most widely used approach, Labov and Waletzky's structural analysis.35, 47, 54-56 Scholars have described different typologies to try to make sense of this variety of methods.20, 25, 26, 32, 41 

학자들은 이러한 다양한 방법을 이해하기 위해 다양한 유형학을 설명해왔다. 한 가지 접근방식은 NA 방법이 다루는 [내러티브의 '수준level']에 따라 분류하는 것이다. 

  • 예를 들어, 밤버그는 이야기 자체의 실제 텍스트, 텔러와 청자 사이의 상호작용적 공동 구성, 텔러와 청자가 각각 어떻게 자기 자신에 대한 특정한 개념을 별도의 분석 수준으로 '설립하고 보여주는'지에 접근했다. 밤베리는 각 수준에서 내용과 맥락을 단계적으로 해석함으로써 내러티브를 이해하게 된다.
  • 예를 들어, Warmington과 McColl은 '대화적 서술 분석'을 사용하여 밤버그의 세 가지 수준을 모두 조사했으며, 이야기 자체, 내레이터와 인터뷰 진행자 간의 상호작용, 그리고 전문적 정체성 내레이터가 스스로 만들어 내는 것을 조사하였다.

One approach is to classify NA methods according to which ‘level’ of the narrative they attend to.25, 41 

  • For instance, Bamberg41 approached the actual text of the narrative itself, the interactional co-construction of the narrative between teller and hearer, and how teller and hearer ‘establish and display particular notions of selves’ each as separate levels of analysis. Bamberg comes to understand narratives through stepwise interpretation of the content and context at each level.
  • Warmington and McColl,36 for instance, used ‘dialogic narrative analysis’ to examine all three of Bamberg's levels, examining the stories themselves, the interactions between narrators and interviewers, and the professional identities narrators were creating for themselves.

약간 다른 접근법으로 폴킹혼과 스털리(Starlyley)는 각각 역할 서사극에 기초하여 NA를 비슷하게 입력했다.

  • 내러티브가 연구자들이 생각think about하는 [패러다임적 분석]의 대상인지 여부  (예: 범주 분석 및 기사 정리)
  • 내러티브가 연구자들이 생각think with하는 [합성적 분석]의 산물인지 여부 (즉, 스토리 분석 및 새로운 스토리 작성)

In a slightly different approach, Polkinghorne26 and Bleakley20 each typologised NA similarly, based on the role narrative plays:

  • whether narratives are the object of paradigmatic analysis (i.e., categorical analysis and chunking up stories) that researchers think about or, instead,
  • whether narratives are the product of synthetic analysis (i.e., narrative analysis and creating a new story) that researchers think with.

이 접근법에서 NA의 일부 방법은 이야기를 데이터로 가져다가 분해break down한다. 반면 다른 사람들은 경험과 사건의 데이터를 사용하여 스토리를 만들어create 더 잘 이해한다. 지금까지 HPE 학자들은 (위에서 논의한 5개의 HPE 연구와 마찬가지로) 참가자들의 이야기를 이해하기 위해 NA 방법을 사용할 때 주로 전자의 접근법을 취했다. [이야기를 가지고 생각하는 것Thinking with stories]은, 패러다임적 접근법과 달리, 이야기를 단순 데이터로 환원하지 않으면서, 내러티브의 잠재적인 '감정적 영향'을 희생시키기 때문에 잠재적으로 강력하지만 개발되지 않은 방법론적인 도구이다.20

Within this approach, some methods of NA take stories as data and break them down, while others use the data of experiences and events to create stories to better understand them. Thus far, HPE scholars have mainly taken the former approach, using NA methods to make sense of participants' stories,20 as with the five HPE studies we discussed above (see Table 1).34-37, 47 Thinking with stories is a potentially powerful, but untapped, methodological tool for tackling HPE's wicked problems because, unlike a paradigmatic approach, it does not threaten to reduce stories to mere data, sacrificing the potential ‘affective impact’ of narrative.20

5 진주: 서사의 약속과 편파성
5 PEARLS: THE PROMISE AND PARTIALITY OF NARRATIVE

NA 렌즈(그리고 각 렌즈에 따르는 잠재적인 이점 및 제한 사항)를 선택할 때, 연구자들은 다양한 분석 방법(즉, 분석 및 합성 대 패러다임 분석의 수준)이 해당 렌즈를 어떻게 형성하는지 고려해야 합니다.

  • 예를 들어, 연구자들은 밤베르크의 상호작용적 수준의 분석을 통해 [상황적 렌즈]의 잠재적인 통찰력, 즉 사회 문화적 맥락이 어떻게 세계에 대한 나레이터의 이해를 형성하는가에 접근할 수 있다.
  • 또는, 학자들은 밤베르크의 스키마의 한 단계 아래로 내려가 [순차적 렌즈]에 대한 잠재적인 통찰력을 얻을 수 있으며, 텍스트 자체에서 어떤 사건의 시퀀스가 원인과 결과의 내레이터 구성에 대해 드러내는지를 이해할 수 있다.
  • 대조적으로, 정체성에 초점을 맞춘 한 단계 '상위' 분석은 [행위자적 렌즈]와 참가자들이 자신과 타인의 의도와 행동을 표현하기 위해 하는 수사적 움직임을 뒷받침할 수 있다. 

In choosing an NA lens—as well as the potential benefits and limitations that come with it—researchers must consider how various analytic methods (i.e., the level of analysis and synthetic versus paradigmatic analysis) shape that lens.

  • For instance, researchers could access the potential insights of a situated lens—an understanding of how social and cultural contexts shape narrators' understandings of the world—through Bamberg's41 interactional level of analysis.
  • Alternatively, scholars could go one level ‘down’ in Bamberg's schema to the textual level to gain the potential insights of the sequential lens, understanding what particular sequences of events in the text itself reveal about narrators' constructions of cause and effect.41 
  • In contrast, an analysis one level ‘up’, with its focus on identity, could support the agentive lens and the rhetorical moves participants make to represent their own and others' intentions and actions.41

 

  • 폴킹혼의 분석적 유형론을 본다면, [전체론적 렌즈]를 가지고 전체 스토리에 대한 복잡하고 일관성 있는 이해를 추구하는 사람들은 [참가자들의 경험을 재-스토리restorying하는 합성적 접근법]을 사용할 수 있다.
  • 반대로, [언어적 렌즈]를 통해 서술자들이 그들 자신과 그들의 세계를 표현하는데 있어서 내리는 선택들을 더 잘 이해하고자 하는 연구자들은 [패러다임적 분석]을 사용할 수 있다.

분석적 접근의 범위와 NA 렌즈의 다양성은 HPE 학자들의 연구 실습을 풍부하게 할 가능성이 있다.

  • Working from Polkinghorne's26 analytic typology, those seeking a complex and coherent understanding of a full story through the holistic lens might use a synthetic approach, restorying participants' experiences.
  • In contrast, researchers who want to better understand the choices narrators make in representing themselves, and their world through the linguistic lens might use paradigmatic analysis.26 

The range of analytic approaches and the variety of NA lenses hold the promise to enrich the research practices of HPE scholars.

그러나 여기서 설명하는 5개의 렌즈 중 어떤 것도 어떤 분석적 접근법에도 완벽하게 매핑되지 않으며, HPE의 고약한 문제에 대한 '기성품' 솔루션을 제공하지도 않습니다. NA 렌즈는 개념적 프레임워크, 특정 연구 질문, 수집된 데이터 및 수집 방법 및 대상과 일치하는 연구 설계로 의도적으로 짜여져야 한다. 또한 선택된 NA 렌즈는 연구자가 해결하고자 하는 문제 또는 질문과 일치해야 하며, 연구자가 설명하고자 하는 청중에게 말해야 한다. NA를 하는 것은 연구 조건에 특정한 [특정한 노력particularistic endeavour]이다. 스토리는 일종의 [상식적인 현실]을 창조하는 힘을 가지고 있는데, 린드는 이를 '보편적 사실성의 문제로 위장한 도덕성의 문제'라고 불렀다.

Yet, none of the five lenses we outline here map perfectly onto any analytic approach, nor do they offer ‘off the shelf’ solutions to HPE's wicked problems. The NA lenses must be deliberately woven into a study design, concordant with the conceptual framework, the specific research questions, the data collected and how and by whom it is collected. Furthermore, the NA lens selected must be congruent with the problem or question the researcher is trying to address, speaking to the audience for whom she is trying to address it. Doing NA is a particularistic endeavour, specific to the conditions of research.13 Stories have the power to create a kind of commonsense reality, what Linde40 called ‘an issue of morality disguised as an issue of universal factuality’. 

우리는 NA 방법과 렌즈도 이러한 힘을 가질 수 있다고 주장합니다. 방법과 렌즈를 선택했으니, '등장'하는 진리가 유일한 진실the truth이라고 믿기 쉽다. 예를 들어, 인종 차별 치료에 대한 흑인 의사의 이야기에 대한 [순차적 렌즈]는 반복된 경험들이 서로에게 쌓이는 방식을 강조할 수 있지만, 이것은 [행위자적 렌즈]로 더 명확해질 수 있는 인종 차별적 권력 구조에 대한 저항을 가릴 수 있다. 게다가, 이 렌즈들 중 어느 것도 참가자들이 경험하는 것을 진실로 드러내지 않을 것이고, 애초에 이야기를 하는 그들의 행위자성을 잠재적으로 감소시킬 것이다. 즉, 각각의 NA 렌즈는 무언가를 가리면서, 무언가를 드러낸다. 리스만은 이렇게 모함했다. '이야기적 진실은 항상 편파적이다- 어딘가에 열성적이고, 불완전하다'

We maintain that NA methods and lenses can also have this power. Having chosen a method and a lens, it is easy to believe that the truth that ‘emerges’ is the truth. For instance, a sequential lens on a Black physician's stories of racist treatment might highlight the ways repeated experiences build on each other, but this may mask the resistance to racist power structures that might be clearer with an agentive lens. Moreover, neither of these lenses may reveal what participants experience as truth, potentially diminishing their agency in telling the story in the first place. In other words, each NA lens both obscures and reveals. Riessman23 framed it this way: ‘Narrative truths are always partial—committed and incomplete’.

이 편파성은 이 작품의 작가로서 우리 각자에게도 적용됩니다. 우리는 우리의 이론적이고 방법론적이며 개인적인 렌즈를 이 작업에 가져옵니다.

  • 아비게일은 언어학자이자 교육심리학자이며 질적, 혼합적 방법 연구자이다. 연구자, 교사, 학부모로서, 그녀는 자신의 이야기 전달 기관인 개인적이고 전문적인 것을 받아들이는 법을 배우고 있다.
  • 라라는 이론가이자 질적 방법론자로 HPE의 다양한 주제를 탐구해 왔으며, 대부분은 개인이 집단과 함께 참여하는 근본적인 전제에 초점을 맞추고 있다. 그녀는 이야기를 연구를 공유하고, 행동에 영향을 미치며, 가정에 도전하는 강력한 수단으로 본다.
  • 르네는 교육학자, 이론가, 질적 방법론자이다. 그녀는 직장 학습, 직장 지도, 그리고 직장 내에서의 직업 간 학습과 교육 역학에 대해 글을 쓴다. 그녀는 깊고 의미 있는 학습과 이해를 제공하기 위해 가르치고 연구하는 이야기의 힘을 믿습니다.

This partiality holds for each of us as authors of this piece as well. We bring to this work our own theoretical, methodological and personal lenses.

  • Abigail is a linguist, educational psychologist and qualitative and mixed methods researcher who writes about experiences of agency. As a researcher, teacher and parent who has moved across fields and across the country, she is learning to embrace the agency of her own storytelling—personal and professional.
  • Lara is a theorist and qualitative methodologist who has explored a range of topics in HPE, most of which focus on the foundational premises through which individuals engage with groups and vice versa. She sees stories as powerful means of sharing research, of impacting actions and challenging assumptions.
  • Renee is an educationist, a theorist and qualitative methodologist. She writes about workplace learning, workplace guidance and the interprofessional learning and teaching dynamic within the workplace. She believes in the power of stories in teaching and research to provide deep and meaningful learning and understanding.

이런 경험들을 볼 때, 우리는 모두에게 있지 않을 수도 있는 이야기들에 힘과 효용을 돌릴 수 있고, 다른 사람들과는 다르게 NA의 렌즈를 볼 수도 있다. 우리가 제시하는 5개의 NA 렌즈와 마찬가지로, 우리만의 렌즈는 어떤 부분은 비추고 어떤 부분은 가립니다. NA에 대한 우리의 이야기는 모든 이야기와 마찬가지로 '경험된 현실 속에서 승리를 거둔 구성자'이다. 우리는 NA 렌즈를 사용하는 다른 사람들의 구성을 기다리고 있는데, 그들이 우리의 연구 문제를 가지고 우리의 분야로 나아가는 데 도움을 줄 수 있기를 바란다.

Given these experiences, we may attribute power and utility to stories that may not be there for everyone, and we may see the lenses of NA differently than others would. Just like the five NA lenses we present, our own lenses illuminate some areas and conceal others. Our story about NA, like all stories, is ‘a triumphant configurer of experienced reality’.42 We await others' configurations using NA lenses, with the hope that they can help us move forward as a field with our research problems, wicked or otherwise.


Med Educ. 2021 Dec;55(12):1369-1375.

 doi: 10.1111/medu.14597. Epub 2021 Aug 29.

The potential of narrative analysis for HPE research: Highlighting five analytic lenses

Affiliations collapse

Affiliations

1Center for Health Professions Education, Uniformed Services University, Bethesda, Maryland, USA.

2Center for Health Professions Education, Henry M. Jackson Foundation for the Advancement of Military Medicine, Bethesda, Maryland, USA.

3School of Health Professions Education, Department for Educational Development & Research, Faculty of Health, Medicine and Life Sciences, Maastricht University, Maastricht, The Netherlands.

PMID: 34291492

DOI: 10.1111/medu.14597

Abstract

Context: Health professions education (HPE) has increasingly turned to qualitative methodology to address a number of the field's difficult research problems. While several different methodologies have been widely accepted and used in HPE research (e.g., Grounded Theory), others remain largely unknown. In this methodology paper, we discuss the value of narrative analysis (NA) as a set of analytic approaches that offer several lenses that can support HPE scholars' research.

Methods: After briefly discussing the 'narrative turn' in research, we highlight five NA lenses: holistic, situated, linguistic, agentive and sequential. We explore what each lens can offer HPE scholars-highlighting certain aspects of the data-and how each lens is limited-obscuring other aspects. To support these observations, we offer an example of each lens from contemporary HPE scholarship. The manuscript also describes methods that can be employed in NA research and offers two different typologies of NA methods that can be used to access these lenses.

Conclusions: We conclude with a discussion of how different analytic methods can be used to harness each of the lenses. We urge the deliberate selection and use of NA methods and point to the inherent partiality of any NA approach. Reflecting on our position as narrative scholars, we acknowledge how our own lenses illuminate some areas and conceal others as we tell the story of NA. In conclusion, we invite other researchers to benefit from the potential NA promises.

+ Recent posts