Cronbach's alpha 이해하기 (IJME, 2011)

Making sense of Cronbach’s alpha

Mohsen Tavakol, Reg Dennick

International Journal of Medical Education






Reliable하지 않은 도구는 valid할 수 없다.

An instrument cannot be valid unless it is reliable. However, the reliability of an instrument does not depend on its validity.2



What is Cronbach alpha?

1951년 개발되었음. 0과 1사이의 값을 가진다.

Alpha was developed by Lee Cronbach in 195111 to provide a measure of the internal consistency of a test or scale; it is expressed as a number between 0 and 1.


내적일관성은 검사를 수행하기 전에 결정되어야 한다. 신뢰도는 한 검사에서 측정오차의 양이 어느정도인지를 보여주는 것이다. 상관관계를 제곱해서 1에서 빼면 측정오차의 index가 된다. 즉, 신뢰도가 0.80이라면 무작위오차가 0.36이라는 의미이다.

Internal consistency should be determined before a test can be employed for research or examination purposes to ensure validity. In addition, reliability estimates show the amount of measurement error in a test. Put simply, this interpretation of reliability is the correlation of test with itself. Squaring this correlation and subtracting from 1.00 produces the index of measurement error. For example, if a test has a reliability of 0.80, there is 0.36 error variance (random error) in the scores (0.80×0.80 = 0.64; 1.00 – 0.64 = 0.36).12


검사에 포함된 문항이 서로 연관되어있다면, alpha는 올라간다. 그러나 alpha가 높은 것이 언제나 높은 내적일관성을 보장하는 것은 아니다. 왜냐면 이는 alpha가 검사지의 길이에 의해서도 영향을 받기 때문이다. 검사 문항이 너무 적으면 alpha는 떨어진다. 따라서 alpha를 높이기 위해서 더 많은 문항을 포함시킬 수 있다. 또한 alpha는 특정 검사자 표본에 대한 것이다. 따라서 다른 문헌에서 제시된 alpha에만 의존해서는 안되며 검사를 하면 alpha를 매번 새로 구해야 한다.

If the items in a test are correlated to each other, the value of alpha is increased. However, a high coefficient alpha does not always mean a high degree of internal consistency. This is because alpha is also affected by the length of the test. If the test length is too short, the value of alpha is reduced.2, 14 Thus, to increase alpha, more related items testing the same concept should be added to the test. It is also important to note that alpha is a property of the scores on a test from a specific sample of testees. Therefore investigators should not rely on published alpha estimates and should measure alpha each time the test is administered. 14


homogeneity이 '단차원성'을 의미하는 것과 비교해서, 내적일관성은 문항들의 상호연관성과도 관련이 있다. 한 척도가 '단차원적'이라는 것은 모든 문항이 하나의 특성 혹은 구인을 측정한다는 의미이다. 내적일관성은 균일성/단차원성 측정의 필요조건이지만 충분조건은 아니다. 근본적으로 신뢰도라는 개념은 검사문항의 단차원성을 가정하고 있으며, 만약 이 가정이 위배된다면 신뢰도를 과소평가하는 주요 원인이 될 수 있다. 다차원성을 갖는 검사지가 단차원성을 갖는 검사지에 비해서 alpha가 반드시 낮지는 않다는 점은 잘 알려져 있다. 따라서 검사의 '내적일관성'에 대한 index라고 보는 것이 alpha를 좀더 정확히 해석하는 것이다.

Internal consistency is concerned with the interrelatedness of a sample of test items, whereas homogeneity refers to unidimensionality. A measure is said to be unidimensional if its items measure a single latent trait or construct. Internal consistency is a necessary but not sufficient condition for measuring homogeneity or unidimensionality in a sample of test items.5, 15 Fundamentally, the concept of reliability assumes that unidimensionality exists in a sample of test items16 and if this assumption is violated it does cause a major underestimate of reliability. It has been well documented that a multidimensional test does not necessary have a lower alpha than a unidimensional test. Thus a more rigorous view of alpha is that it cannot simply be interpreted as an index for the internal consistency of a test. 5, 15, 17


alpha는 단순이 검사 문항의 단차원성을 측정하는 것이 아니지만, 문항들이 단차원적인지 확인하는 용도로 활용될 수는 있다. 반대로 한 검사가 두 개 이상의 개념(구인)을 검사하고 있다면, 전체 검사지의 alpha를 보고하는 것은 문항의 숫자를 늘리는 것과 같아서 결과적으로 alpha를 inflation시키는 것이다. 따라서 원칙적으로 alpha는 각각의 개념에 대해서 계산되어야 한다. 비균질한, 다양한 사례 바탕으로 한 문항들로 구성된 총괄평가에서 alpha는 각 사례별로 계산되어야 한다.

Alpha, therefore, does not simply measure the unidimensionality of a set of items, but can be used to confirm whether or not a sample of items is actually unidimensional. 5 On the other hand if a test has more than one concept or construct, it may not make sense to report alpha for the test as a whole as the larger number of questions will inevitable inflate the value of alpha. In principle therefore, alpha should be calculated for each of the concepts rather than for the entire test or scale. 2, 3 The implication for a summative examination containing heterogeneous, casebased questions is that alpha should be calculated for each case.


더 중요한 것은 alpha가 'tau equivalent model'에 근거하고 있다는 것이다. 이 모델은 각각의 문항이 같은 scale로 같은 latent trait를 측정하고 있음을 가정한다. 따라서 factor analysis를 통해서 밝힐 수 있듯, 다수의 trait을 다루고 있다면 이 가정에 위배되는 것이며 alpha는 검사의 reliability를 과소평가하게 된다. 검사문항의 숫자가 너무 작다면 이 역시 tau-equivalence 가정을 위배하는 것이고, 신뢰도를 과소추정할 수 있다. 현실에서 alpha는 신뢰도의 하한추정값(lower-bound estimate)이며, 왜냐하면 비균질한 검사문항이 tau-equivalent model의 가정을 위배하는 것이기 때문이다. SPSS에서 'standardised item alpha'가 'Cronbach's alpha'보다 높다면 tau equivalent measurement에 대한 추가 검사가 필요하다.

More importantly, alpha is grounded in the ‘tau equivalent model’ which assumes that each test item measures the same latent trait on the same scale. Therefore, if multiple factors/traits underlie the items on a scale, as revealed by Factor Analysis, this assumption is violated and alpha underestimates the reliability of the test.17 If the number of test items is too small it will also violate the assumption of tau-equivalence and will underestimate reliability.20 When test items meet the assumptions of the tau-equivalent model, alpha approaches a better estimate of reliability. In practice, Cronbach’s alpha is a lower-bound estimate of reliability because heterogeneous test items would violate the assumptions of the tau-equivalent model.5 If the calculation of “standardised item alpha” in SPSS is higher than “Cronbach’s alpha”, a further examination of the tauequivalent measurement in the data may be essential.


Numerical values of alpha

검사문항의 숫자, 상호연관성, 차원성 등이 alpha값에 영향을 준다. 수용가능한 alpha값에 대한 보고는 0.7에서 0.95까지의 범위에 이른다. alpha값이 낮은 것은 문항 수가 작거나, 상호연관성이 적거나, 비균질한 구인때문일 수 있다. 만약 낮은 alpha값이 문항간 낮은 상관관계에 기인한 것이라면 일부 문항을 수정하거나 버려야 한다. 가장 쉬운 방법은 각 문항과 총점의 상관관계를 구해보는 것이다. 상관관계가 낮은 문항을 버리면 된다. 만약 alpha가 너무 높다면, 이는 일부 문항은 서로 다른 문항인 척 위장하고 있지만 사실상 같은 문제임을 보여주는 것이다. alpha의 최대값은 0.90정도가 추천된다.

As pointed out earlier, the number of test items, item interrelatedness and dimensionality affect the value of alpha.5 There are different reports about the acceptable values of alpha, ranging from 0.70 to 0.95. 2, 21, 22 A low value of alpha could be due to a low number of questions, poor interrelatedness between items or heterogeneous constructs. For example if a low alpha is due to poor correlation between items then some should be revised or discarded. The easiest method to find them is to compute the correlation of each test item with the total score test; items with low correlations (approaching zero) are deleted. If alpha is too high it may suggest that some items are redundant as they are testing the same question but in a different guise. A maximum alpha value of 0.90 has been recommended.14




Making sense of Cronbach's alpha

Mohsen Tavakol, Reg Dennick
Int J Med Educ. 2011; 2: 53–55. Published online 2011 June 27. doi: 10.5116/ijme.4dfb.8dfd
PMCID: 
PMC4205511


+ Recent posts