Что касается анализа величины эффекта, я заметил, что существуют различия между d Коэна, g Хеджеса и g * Хеджеса.
- Эти три показателя обычно очень похожи?
- В каком случае они будут давать разные результаты?
- Кроме того, это вопрос предпочтения, с которым я использую или сообщаю?
effect-size
cohens-d
Elpezmuerto
источник
источник
Ответы:
Г-дисперсии пула Коэна d и Хеджеса в предположении равных дисперсий совокупности, но г-пулы используют n - 1 для каждой выборки вместо n, что обеспечивает лучшую оценку, особенно при меньших размерах выборки. Как d, так и g в некоторой степени положительно смещены, но пренебрежимо мало для средних или больших размеров выборки. Смещение уменьшается с помощью g *. Параметр d by Glass не допускает равных отклонений, поэтому он использует sd контрольной группы или базовой группы сравнения в качестве стандартизатора для разницы между двумя средними значениями.
Эти размеры эффектов и величины непараметрического эффекта Клиффа подробно обсуждаются в моей книге:
Grissom, RJ & Kim, J, J. (2005). Размеры эффекта для исследования: широкий практический подход. Махва, Нью-Джерси: Эрлбаум.
источник
Насколько я понимаю, g Хеджеса является несколько более точной версией d Коэна (с объединенным SD) в том смысле, что мы добавляем поправочный коэффициент для небольшой выборки. Обе меры в целом согласуются, когда предположение о гомоскедастичности не нарушается, но мы можем обнаружить ситуации, когда это не так, см., Например, McGrath & Meyer, Psychological Methods 2006, 11 (4) : 386-401 ( pdf ). Другие документы перечислены в конце моего ответа.
Как правило, я обнаружил, что почти во всех психологических или биомедицинских исследованиях это d Коэна, о котором сообщается; это, вероятно, следует из известного эмпирического правила для интерпретации его величины (Cohen, 1988). Я не знаю ни о какой недавней работе, рассматривающей g Хеджеса (или дельту Клиффа как непараметрическую альтернативу). У Брюса Томпсона есть пересмотренная версия раздела APA о величине эффекта.
Погуглив об исследованиях Монте-Карло, посвященных измерениям величины эффекта, я нашел эту статью, которая может быть интересной (я только прочитал реферат и настройку моделирования): Надежные доверительные интервалы для размеров эффекта: сравнительное исследование d Коэна и дельты Клиффа при ненормальности и гетерогенные вариации (pdf).
Что
MBESS
касается вашего второго комментария, пакет R включает в себя различные утилиты для расчета ES (например,smd
и связанные функции).Другие ссылки
источник
Кажется, когда люди говорят, что Коэн сказал, что они в основном имеют в виду:
Существуют и другие оценки для стандартного отклонения в пуле, вероятно, наиболее распространенное, кроме вышеперечисленного:
В других случаях g Хеджа зарезервирован для ссылки на любую из исправленных смещением версий стандартизированного среднего значения, разработанного Хеджем. Хеджес (1981) показал, что d Коэна был смещен вверх (т. Е. Его ожидаемое значение выше, чем истинное значение параметра совокупности), особенно в небольших выборках, и предложил поправочный коэффициент для корректировки смещения d Коэна:
G Хеджеса (непредвзятая оценка):
Тем не менее, этот поправочный коэффициент довольно сложен в вычислительном отношении, поэтому Хеджес также предоставил вычислительно тривиальное приближение, которое, хотя и слегка смещено, подходит почти для всех мыслимых целей:
(Первоначально из Хеджеса, 1981, эта версия от Боренштейна, Хеджеса, Хиггинса и Ротштейна, 2011, стр. 27)
Ссылки:
Боренштейн М., Хеджес Л.В., Хиггинс Дж.П. и Ротштейн Г.Р. (2011). Введение в метаанализ. Западный Суссекс, Соединенное Королевство: John Wiley & Sons.
Коэн, J. (1977). Статистический анализ силы для поведенческих наук (2-е изд.). Хиллсдейл, Нью-Джерси, США: Лоуренс Эрлбаум Ассошиэйтс, Инк.
Хеджес, LV (1981). Теория распределения для оценки эффекта стекла Гласса и связанные с ней оценки. Журнал образовательной статистики, 6 (2), 107-128. DOI: 10,3102 / 10769986006002107
Хеджес Л.В., Олькин И. (1985). Статистические методы метаанализа. Сан-Диего, Калифорния: Академическая пресса
источник
Если вы просто пытаетесь понять основной смысл слова Хеджеса, как и я, вы также можете найти это полезным:
Их определение короткое и ясное:
Я был бы признателен экспертам по статистике, редактирующим это для добавления любых важных предостережений к малому (0,2) среднему (0,5) и большому (0,8) утверждению, чтобы помочь неопытным избежать неправильной интерпретации чисел Хеджеса, используемых в исследованиях в области социальных наук и психологии.
[1] http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2848393/ Влияние основанной на осознанности терапии на тревожность и депрессию: мета-аналитический обзор Стефан Г. Хофманн, Алиса Т. Сойер, Эшли А. Витт и Диана Ох. J Проконсультируйтесь с Clin Psychol. Апрель 2010 года; 78 (2): 169–183. doi: 10.1037 / a0018555
[2] Коэн Дж. Статистический анализ силы для поведенческих наук. 2-е изд. Erlbaum; Хиллсдейл, Нью-Джерси: 1988 (цитируется в [1])
источник
Другие постеры освещали проблему сходства и различия между g и d. Просто чтобы добавить к этому, некоторые ученые считают, что значения размера эффекта, предлагаемые Коэном, слишком великодушны, что приводит к чрезмерной интерпретации слабых эффектов. Они также не привязаны к r, что приводит к тому, что ученые могут переходить туда и обратно, чтобы получить более благоприятные интерпретируемые величины эффекта. Фергюсон (2009, Профессиональная психология: исследование и практика) предложил использовать следующие значения для интерпретации для g:
.41, как рекомендуемый минимум для «практической значимости». 1.15, умеренный эффект 2.70, сильный эффект
Они, очевидно, более строгие / труднодостижимые, и не многие общественно-научные эксперименты получат сильный эффект ... что, вероятно, так и должно быть.
источник
Брюс Томпсон предупредил об использовании коэффициента Коэна (0,2) как малого (0,5), среднего и (0,8) большого. Коэн никогда не хотел, чтобы они использовались как жесткие интерпретации. Все величины эффекта должны быть интерпретированы на основе контекста соответствующей литературы. Если вы анализируете соответствующие величины эффекта, о которых сообщается по вашей теме, и они равны (0,1) (0,3) (0,24), и вы производите эффект (0,4), то это может быть «большим». И наоборот, если вся связанная литература имеет эффекты (0,5) (0,6) (0,7), а у вас есть эффект (0,4), его можно считать небольшим. Я знаю, что это тривиальный пример, но крайне важный. Я полагаю, что Томпсон однажды заявил в статье: «Мы были бы просто глупы в другой метрике», сравнивая интерпретации величин эффекта с тем, как социологи интерпретировали значения p в то время.
источник