Откуда берутся дескрипторы альфа-значений Кронбаха (например, плохо, отлично)?

14

Кажется довольно распространенным, чтобы описать альфа-значения Кронбаха следующим образом:

  • α ≥ 0,9 Отлично
  • 0,7 ≤ α <0,9 Хорошо
  • 0,6 ≤ α <0,7 Приемлемо
  • 0,5 ≤ α <0,6 Плохо
  • α <0,5 Недопустимо

Откуда эти ценности? Я не могу найти оригинальную исследовательскую статью, описывающую их.

Редактировать: я на 90% уверен, что это просто на основе соглашения, и нет классической исследовательской статьи с изложением их.

Behacad
источник
4
Nunnally в значительной степени популяризировал эти пороги (подчеркивая различие между индивидуальным и групповым решением, хотя); но в его современных исследованиях есть так много недостатков, что о них, вероятно, не стоит беспокоиться :-)
chl

Ответы:

13

В следующих двух статьях обсуждаются предельные значения для показателей надежности:

  • Lance, CE, Butts, MM, & Michels, LC (2006). Источники четырех обычно сообщаемых критериев отсечения: что они действительно сказали? Организационные методы исследования, 9 (2), 202-220.
  • Хенсон, РК (2001). Понимание оценки надежности внутренней согласованности: концептуальный учебник по коэффициенту альфа. Измерение и оценка в консультировании и развитии, 34 (3), 177-189.

Строго говоря, ни один из них не поддерживает конкретную шкалу, которую вы описываете - первая, в частности, довольно критична ко всей идее традиционных предельных значений - но они указывают на многие ключевые публикации по этой теме, поэтому выкапывание этих ссылок может принести Вы к первоисточникам.

Клайн (в издании « Справочника» 1993 года, цитируемом Гэвином в своем ответе) прослеживает свою предельную ценность для Гилфорда и Нанналли. IIRC, Nunnally никогда не давал много оправданий для своей рекомендации и фактически изменил ее от одного издания к следующему в своей Психометрической Теории, но его работы были очень влиятельными, поэтому он вполне мог быть наиболее ответственным за популярность понятия, что .7 приемлемо и .9 отлично.

α часто неверно истолковывается и подвергается серьезной критике. Даже сама идея стремления к более высокой внутренней согласованности была поставлена ​​под сомнение (прежде всего Кэттелл, ср. «Раздутая специфика»). Все это говорит о том, что поиск первоисточника того или иного соглашения может представлять некоторый исторический интерес, но ничто из этого не является чрезвычайно полезным для обоснования психологического измерения.

гала
источник
Спасибо. Действительно, меня интересует исторический интерес. Меня попросили привести слово «отлично», и мне не хотелось цитировать руководство по SPSS. Я посмотрел дальше, без особой удачи.
Behacad
1
Я бы посмотрел на более поздний выпуск книги Нанналли, я думаю.
Гала-концерт
3
(+1) У меня есть другие ссылки в этих личных заметках .
ЧЛ
1
Нанналли и Бернштейн довольно долго обсуждают, когда разные значения альфа могут быть приемлемы. Поколения психологов суммируют это как «выше 0,7 - это нормально».
Джереми Майлз
1

Википедия цитирует источники как

  • George, D. & Mallery, P. (2003). SPSS для Windows шаг за шагом: простое руководство и справочник. 11.0 обновление (4-е изд.). Бостон: Аллин и Бэкон.
  • Клайн П. (1999). Пособие по психологическому тестированию (2-е изд.). Лондон: Routledge

Я бы проследил за этими ссылками, чтобы увидеть, ссылаются ли они на дополнительные первоисточники. Однако, как правило, эти описания значений могут не иметь первоисточника.

Восстановить Монику - Дж. Симпсон
источник
Да, я видел это в Википедии. Я ищу любые оригинальные исследования. Я полагаю, что ответ - просто "соглашение", но я надеялся на что-то более конкретное.
Behacad
Кроме того, мне кажется, что собрание где-то началось ...
Behacad
@ Behacad правильно, но это где-то не должно быть основной исследовательской статьей. Возможно, он был в программном обеспечении или решен в рабочей группе или на семинаре, например, для конкретного проекта и просто застрял.
Восстановить Монику - Г. Симпсон
Да, и мне интересно, что это был за конкретный проект, если таковой был. В какой-то момент кто-то сказал, что .90 отлично (или похоже), и он застрял. Кто это был?
Behacad
1

Lance, CE, Butts, MM, & Michels, LC (2006). Источники четырех обычно сообщаемых критериев отсечения, что они действительно говорили? Организационные методы исследования, 9 (2), 202-220.

«Сравнивая этот раздел с цитатами к нему, мы отмечаем несколько вещей. Во-первых, мы подозреваем, что большинство авторов, которые ссылаются на критерий надежности Nunnally .70, не согласятся с тем, что они пытаются сэкономить время и энергию на ранней стадии исследования, используя меры, которые имеют лишь скромную надежность. Скорее, мы подозреваем, что большинство исследователей будут утверждать, что проводят фундаментальные (или, возможно, прикладные) исследования, для которых Nunnally однозначно рекомендовал стандарт надежности 0,80. Carmines and Zeller (1979) дали аналогичную рекомендацию: « Как правило, мы считаем, что достоверность не должна быть ниже .80 для широко используемых шкал »(стр. 51). Таким образом, наш второй момент заключается в том, что .80, а не 0,70, как это было приписано, кажется, рекомендуется Nunnally Стандарт надежности для большинства целей, указанных в организационных исследованиях ».

Роб Хартман
источник