Дисперсия Коэна статистики

12

Коэна является одним из наиболее распространенных способов измерения размера эффекта ( см. Википедия ). Он просто измеряет расстояние между двумя средними значениями в единицах стандартного отклонения. Как мы можем получить математическую формулу оценки дисперсии Коэна ? дdd

Декабрь 2015 г. edit: С этим вопросом связана идея вычисления доверительных интервалов вокруг . В этой статье говорится, чтоd

σd2=n+n×+d22n+

где - сумма двух размеров выборки, а - произведение двух размеров выборки.n+n×

Как получается эта формула?

JRK
источник
@Clarinetist: Это несколько спорно редактировать вопрос другого человека , чтобы добавить больше вещества и больше вопросов к нему (в отличие от улучшения формулировки). Я позволил себе одобрить ваше редактирование (учитывая, что вы поместили щедрое вознаграждение и я думаю, что ваше редактирование действительно улучшит вопрос), но другие могут решить откатиться назад.
говорит амеба, восстанови Монику
1
@amoeba Нет проблем. Пока есть формула для (которой раньше не было) и ясно, что мы ищем математический вывод формулы, это нормально. σd2
Кларнетист
Я думаю, что знаменатель второй дроби должен быть . Смотрите мой ответ ниже. 2(n+2)

Ответы:

15

Обратите внимание, что выражение дисперсии в вопросе является приближенным. Хеджес (1981) вывел большую выборочную дисперсию и аппроксимации в общей обстановке (т. Е. Множественные эксперименты / исследования), и мой ответ в значительной степени идет по выводам в статье.d

Во-первых, мы будем использовать следующие предположения:

Давайте предположим, что у нас есть две независимые группы лечения, (лечение) и (контроль). Пусть и будут баллами / ответами / кем бы то ни было от субъекта в группе и субъекта в группе соответственно.C Y T i Y C j i T j CTCYTiYCjiTjC

Мы предполагаем, что ответы обычно распределены, а группы лечения и контроля имеют общую разницу, т.е.

YTiN(μT,σ2),i=1,nTYCjN(μC,σ2),j=1,nC

Размер эффекта, который мы хотим оценить в каждом исследовании, равен . Оценка размера эффекта, который мы будем использовать: где - несмещенная выборочная дисперсия для группы . д= ˉ Y T- ˉ Y Cδ=μTμCσ S2kk

d=Y¯TY¯C(nT1)ST2+(nC1)SC2nT+nC2
Sk2k

Давайте рассмотрим свойства большой выборки . d

Во-первых, обратите внимание: и (не совпадают с моими обозначениями): и

Y¯TY¯CN(μTμC,σ2nT+nCnTnC)
(1)(nT1)ST2σ2(nT+nC2)=1nT+nC2(nT1)ST2σ21nT+nC2χnT12
(2)(nC1)SC2σ2(nT+nC2)=1nT+nC2(nC1)SC2σ21nT+nC2χnC12

Уравнения (1) и (2) приводят к тому, что (опять же, с моими обозначениями):

1σ2(nT1)ST2+(nC1)SC2nT+nC21nT+nC2χnT+nC22

Теперь немного умной алгебры: где

d=Y¯TY¯C(nT1)ST2+(nC1)SC2nT+nC2=(σnT+nCnTnC)1(Y¯TY¯C)(σnT+nCnTnC)1(nT1)ST2+(nC1)SC2nT+nC2=(Y¯TY¯C)(μTμC)σnT+nCnTnC+μTμCσnT+nCnTnC(nT+nCnTnC)1(nT1)ST2+(nC1)SC2σ2(nT+nC2)=nT+nCnTnC(θ+δnTnCnT+nCVν)
θN(0,1), и . Таким образом, равно раз переменной, которая следует за нецентральным t-распределением с степенями свободы и параметром нецентральности .Vχν2ν=nT+nC2dnT+nCnTnCnT+nC2δnTnCnT+nC

Используя моментные свойства нецентрального распределенияt , следует: где

(3)Var(d)=(nT+nC2)(nT+nC4)(nT+nC)nTnC(1+δ2nTnCnT+nC)δ2b2
b=Γ(nT+nC22)nT+nC22Γ(nT+nC32)134(nT+nC2)1

Таким образом, уравнение (3) обеспечивает точную дисперсию большой выборки. Обратите внимание, что несмещенной оценкой для является с дисперсией:δbd

Var(bd)=b2(nT+nC2)(nT+nC4)(nT+nC)nTnC(1+δ2nTnCnT+nC)δ2

Для больших степеней свободы (т.е. больших ) дисперсия нецентрального изменяющегося с степенями свободы и параметром нецентральности может быть аппроксимирована как ( Джонсон, Коц, Балакришнан, 1995 ). Таким образом, мы имеем: nT+nC2tνp1+p22ν

Var(d)nT+nCnTnC(1+δ2(nTnCnT+nC)2(nT+nC2))=nT+nCnTnC+δ22(nT+nC2)

Подключите наш оценщик для и все готово.δ


источник
Очень, очень хороший вывод. Всего лишь несколько вопросов: 1) не могли бы вы уточнить, что означает запись (я знаю, что это связано с разницей выборки означает, но как они могут иметь одинаковый индекс?)? 2) Не могли бы вы уточнить, как выполняется приближение для (мне не нужны все детали, источник в порядке и, возможно, краткое объяснение)? В остальном я вполне доволен этим. (+1) Это также согласуется с наблюдением, которое я сделал, что не следует нормальному распределению, вопреки объяснению в связанной статье в OP. bdY¯iTY¯iCbd
Кларнетист
@ Clarinetist Спасибо! 1) Как они могут иметь одинаковый индекс? Опечатка, вот как! : P Они - артефакт моего первого варианта ответа. Я исправлю это. 2) Я вытащил его из газеты «Хедж» - пока не знаю, откуда он, но еще подумаю.
вывод, но, к вашему сведению, числитель должен быть . Γ ( n T + n C - 2bΓ(nT+nC22)
Кларнетист
Деривация предоставлена ​​для справки: math.stackexchange.com/questions/1564587/… . Оказывается, есть вероятность ошибки знака.
Кларнетист
@mike: очень впечатляющий ответ. Спасибо, что нашли время, чтобы поделиться с нами.
Дени Кузино