Это дополнительный вопрос к тому, что Фрэнк Харрелл написал здесь :
По моему опыту, требуемый размер выборки для точного распределения t часто больше, чем размер выборки под рукой. Тест на звание ранга Уилкоксона чрезвычайно эффективен, как вы сказали, и он надежен, поэтому я почти всегда предпочитаю его тесту t
Если я правильно понимаю - при сравнении местоположения двух несопоставленных выборок мы предпочли бы использовать критерий суммы рангов Уилкоксона по сравнению с непарным t-тестом, если размеры наших выборок невелики.
Существует ли теоретическая ситуация, когда мы предпочли бы критерий суммы рангов Уилкоксона, а не непарный t-критерий, даже если размеры выборки в наших двух группах относительно велики?
Моя мотивация для этого вопроса проистекает из наблюдения, что для одного выборочного t-критерия использование его для не очень малой выборки асимметричного распределения приведет к неправильной ошибке типа I:
n1 <- 100
mean1 <- 50
R <- 100000
P_y1 <- numeric(R)
for(i in seq_len(R))
{
y1 <- rexp(n1, 1/mean1)
P_y1[i] <- t.test(y1 , mu = mean1)$p.value
}
sum(P_y1<.05) / R # for n1=n2=100 -> 0.0572 # "wrong" type I error
источник
Ответы:
Да, есть. Например, любая выборка из распределений с бесконечной дисперсией разрушит t-критерий, но не Вилкоксон. Ссылаясь на непараметрические статистические методы (Холландер и Вулф), я вижу, что асимптотическая относительная эффективность (ARE) Уилкоксона относительно t-критерия составляет 1,0 для равномерного распределения, 1,097 (т. Е. Уилкоксон лучше) для логистики, 1,5 для двойной экспоненциальный (Лаплас) и 3,0 для экспоненциального.
Ходжес и Леманн показали, что минимальная ARE Уилкоксона по сравнению с любым другим тестом составляет 0,864, поэтому вы никогда не сможете потерять эффективность более чем на 14%, используя ее по сравнению с чем-либо еще. (Конечно, это асимптотический результат.) Следовательно, использование Уилкоксоном Фрэнка Харрелла в качестве дефолта, вероятно, должно быть принято почти всеми, включая меня.
Редактировать: Отвечая на последующий вопрос в комментариях, для тех, кто предпочитает доверительные интервалы, оценка Ходжеса-Лемана является оценкой, которая «соответствует» критерию Уилкоксона, и доверительные интервалы могут быть построены вокруг этого.
источник
Позвольте мне вернуться к нашей дискуссии в комментариях к этому вашему вопросу. Критерий суммы Уилкоксона эквивалентен U-критерию Манна-Уитни (и его прямое расширение для более чем двух выборок называется тестом Крускала-Уоллиса). В Википедии, а также в этом тексте вы можете видеть, что Манн-Уитни (или Крускал-Уоллис) обычно сравнивает не средние и не средние значения. Он сравнивает общую распространенность значений: какой из образцов «стохастически больше». Тест распространяется бесплатно. Т-тест сравнивает средства. Это предполагает нормальное распределение. Итак, тесты предполагают разные гипотезы, В большинстве случаев мы не планируем конкретно сравнивать средства, а хотим знать, какая выборка больше по значениям, и это делает тест Манна-Уитни для нас тестом по умолчанию. С другой стороны, когда оба распределения симметричны, задача проверки, является ли один образец «большим», чем другой, вырождается в задачу сравнения двух средних, а затем, если распределения нормальные с равными дисперсиями, t-критерий становится несколько более могущественный.
источник