Разница между d Коэна и g Хеджеса для показателей размера эффекта

19

Что касается анализа величины эффекта, я заметил, что существуют различия между d Коэна, g Хеджеса и g * Хеджеса.

  • Эти три показателя обычно очень похожи?
  • В каком случае они будут давать разные результаты?
  • Кроме того, это вопрос предпочтения, с которым я использую или сообщаю?
Elpezmuerto
источник
1
В случае, если это полезно для потенциального ответчика, формулы перечислены здесь: en.wikipedia.org/wiki/Effect_size
Jeromy Anglim
Моделирование в R с различными n1, n2, s1, s2 и разницей в населении было бы хорошим упражнением. Кто-нибудь?
Джером Энглим
1
Этот материал также освещен здесь: В чем разница между g Хеджеса и d Коэна .
gung - Восстановить Монику

Ответы:

18

Г-дисперсии пула Коэна d и Хеджеса в предположении равных дисперсий совокупности, но г-пулы используют n - 1 для каждой выборки вместо n, что обеспечивает лучшую оценку, особенно при меньших размерах выборки. Как d, так и g в некоторой степени положительно смещены, но пренебрежимо мало для средних или больших размеров выборки. Смещение уменьшается с помощью g *. Параметр d by Glass не допускает равных отклонений, поэтому он использует sd контрольной группы или базовой группы сравнения в качестве стандартизатора для разницы между двумя средними значениями.

Эти размеры эффектов и величины непараметрического эффекта Клиффа подробно обсуждаются в моей книге:

Grissom, RJ & Kim, J, J. (2005). Размеры эффекта для исследования: широкий практический подход. Махва, Нью-Джерси: Эрлбаум.

Роберт Дж. Гриссом
источник
8

Насколько я понимаю, g Хеджеса является несколько более точной версией d Коэна (с объединенным SD) в том смысле, что мы добавляем поправочный коэффициент для небольшой выборки. Обе меры в целом согласуются, когда предположение о гомоскедастичности не нарушается, но мы можем обнаружить ситуации, когда это не так, см., Например, McGrath & Meyer, Psychological Methods 2006, 11 (4) : 386-401 ( pdf ). Другие документы перечислены в конце моего ответа.

Как правило, я обнаружил, что почти во всех психологических или биомедицинских исследованиях это d Коэна, о котором сообщается; это, вероятно, следует из известного эмпирического правила для интерпретации его величины (Cohen, 1988). Я не знаю ни о какой недавней работе, рассматривающей g Хеджеса (или дельту Клиффа как непараметрическую альтернативу). У Брюса Томпсона есть пересмотренная версия раздела APA о величине эффекта.

Погуглив об исследованиях Монте-Карло, посвященных измерениям величины эффекта, я нашел эту статью, которая может быть интересной (я только прочитал реферат и настройку моделирования): Надежные доверительные интервалы для размеров эффекта: сравнительное исследование d Коэна и дельты Клиффа при ненормальности и гетерогенные вариации (pdf).

Что MBESSкасается вашего второго комментария, пакет R включает в себя различные утилиты для расчета ES (например, smdи связанные функции).

Другие ссылки

  1. Закзанис К.К. (2001). Статистика говорит правду, всю правду и только правду: формулы, иллюстративные числовые примеры и эвристическая интерпретация анализа величины эффекта для нейропсихологических исследователей. Архивы клинической нейропсихологии , 16 (7), 653-667. ( pdf )
  2. Дурлак, JA (2009). Как выбрать, рассчитать и интерпретировать размеры эффекта. Журнал детской психологии ( pdf )
хл
источник
2
Анонимный пользователь хотел добавить следующее определение гомоскедастичности для тех, кто может быть незнаком, с термином: «свойство набора случайных величин, где каждая переменная имеет одинаковую конечную дисперсию».
gung - Восстановить Монику
5

Кажется, когда люди говорят, что Коэн сказал, что они в основном имеют в виду:

dзнак равноИкс¯1-Икс¯2s

s

sзнак равноΣ(Икс1-Икс¯1)2+(Икс2-Икс¯2)2N1+N2-2

Существуют и другие оценки для стандартного отклонения в пуле, вероятно, наиболее распространенное, кроме вышеперечисленного:

s*знак равноΣ(Икс1-Икс¯1)2+(Икс2-Икс¯2)2N1+N2

s*N1+N2dграммss

В других случаях g Хеджа зарезервирован для ссылки на любую из исправленных смещением версий стандартизированного среднего значения, разработанного Хеджем. Хеджес (1981) показал, что d Коэна был смещен вверх (т. Е. Его ожидаемое значение выше, чем истинное значение параметра совокупности), особенно в небольших выборках, и предложил поправочный коэффициент для корректировки смещения d Коэна:

G Хеджеса (непредвзятая оценка):

граммзнак равноd*(Γ(dе/2)dе/2Γ((dе-1)/2))
dезнак равноN1+N2-2Γ

Тем не менее, этот поправочный коэффициент довольно сложен в вычислительном отношении, поэтому Хеджес также предоставил вычислительно тривиальное приближение, которое, хотя и слегка смещено, подходит почти для всех мыслимых целей:

грамм*

грамм*знак равноd*(1-34(dе)-1)
dезнак равноN1+N2-2

(Первоначально из Хеджеса, 1981, эта версия от Боренштейна, Хеджеса, Хиггинса и Ротштейна, 2011, стр. 27)

грамм*грамм*

N>20

Ссылки:

Боренштейн М., Хеджес Л.В., Хиггинс Дж.П. и Ротштейн Г.Р. (2011). Введение в метаанализ. Западный Суссекс, Соединенное Королевство: John Wiley & Sons.

Коэн, J. (1977). Статистический анализ силы для поведенческих наук (2-е изд.). Хиллсдейл, Нью-Джерси, США: Лоуренс Эрлбаум Ассошиэйтс, Инк.

Хеджес, LV (1981). Теория распределения для оценки эффекта стекла Гласса и связанные с ней оценки. Журнал образовательной статистики, 6 (2), 107-128. DOI: 10,3102 / 10769986006002107

Хеджес Л.В., Олькин И. (1985). Статистические методы метаанализа. Сан-Диего, Калифорния: Академическая пресса

FelixST
источник
3

Если вы просто пытаетесь понять основной смысл слова Хеджеса, как и я, вы также можете найти это полезным:

Величину Хеджеса g можно интерпретировать, используя конвенцию Коэна (1988 [2]), как малую (0,2), среднюю (0,5) и большую (0,8). [1]

Их определение короткое и ясное:

G Хеджеса - это вариант d Коэна, который корректирует смещения из-за небольших размеров выборки (Hedges & Olkin, 1985). [1] сноска

Я был бы признателен экспертам по статистике, редактирующим это для добавления любых важных предостережений к малому (0,2) среднему (0,5) и большому (0,8) утверждению, чтобы помочь неопытным избежать неправильной интерпретации чисел Хеджеса, используемых в исследованиях в области социальных наук и психологии.

[1] http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2848393/ Влияние основанной на осознанности терапии на тревожность и депрессию: мета-аналитический обзор Стефан Г. Хофманн, Алиса Т. Сойер, Эшли А. Витт и Диана Ох. J Проконсультируйтесь с Clin Psychol. Апрель 2010 года; 78 (2): 169–183. doi: 10.1037 / a0018555

[2] Коэн Дж. Статистический анализ силы для поведенческих наук. 2-е изд. Erlbaum; Хиллсдейл, Нью-Джерси: 1988 (цитируется в [1])

joshoff
источник
4
+1. Re: small-medium-large, в качестве 1-го прохода, если у вас нет соответствующих знаний или контекста, эти «размеры футболки» в порядке, но в действительности то, что малый или большой эффект, будет варьироваться в зависимости от дисциплины или темы , Более того, тот факт, что эффект является «большим», не обязательно означает, что он практически важен или теоретически значим.
gung - Восстановить Монику
1

Другие постеры освещали проблему сходства и различия между g и d. Просто чтобы добавить к этому, некоторые ученые считают, что значения размера эффекта, предлагаемые Коэном, слишком великодушны, что приводит к чрезмерной интерпретации слабых эффектов. Они также не привязаны к r, что приводит к тому, что ученые могут переходить туда и обратно, чтобы получить более благоприятные интерпретируемые величины эффекта. Фергюсон (2009, Профессиональная психология: исследование и практика) предложил использовать следующие значения для интерпретации для g:

.41, как рекомендуемый минимум для «практической значимости». 1.15, умеренный эффект 2.70, сильный эффект

Они, очевидно, более строгие / труднодостижимые, и не многие общественно-научные эксперименты получат сильный эффект ... что, вероятно, так и должно быть.

Путешествие во времени
источник
0

Брюс Томпсон предупредил об использовании коэффициента Коэна (0,2) как малого (0,5), среднего и (0,8) большого. Коэн никогда не хотел, чтобы они использовались как жесткие интерпретации. Все величины эффекта должны быть интерпретированы на основе контекста соответствующей литературы. Если вы анализируете соответствующие величины эффекта, о которых сообщается по вашей теме, и они равны (0,1) (0,3) (0,24), и вы производите эффект (0,4), то это может быть «большим». И наоборот, если вся связанная литература имеет эффекты (0,5) (0,6) (0,7), а у вас есть эффект (0,4), его можно считать небольшим. Я знаю, что это тривиальный пример, но крайне важный. Я полагаю, что Томпсон однажды заявил в статье: «Мы были бы просто глупы в другой метрике», сравнивая интерпретации величин эффекта с тем, как социологи интерпретировали значения p в то время.

user136666
источник