После некоторого обсуждения (ниже) у меня теперь есть более четкая картина сфокусированного вопроса, так что здесь есть пересмотренный вопрос, хотя некоторые комментарии теперь могут показаться не связанными с первоначальным вопросом.
Кажется, что t-тесты быстро сходятся для симметричных распределений , что тест со знаком ранга предполагает симметрию , и что для симметричного распределения нет разницы между средними / псевдомедианцами / медианами. Если да, то при каких обстоятельствах сравнительно неопытный статистик сочтет полезным тест со знаком ранга, когда у него есть и t-критерий, и критерий знака? Если один из моих студентов (например, по общественным наукам) пытается проверить, работает ли одно лечение лучше, чем другое (с помощью некоторой относительно легко интерпретируемой меры, например, некоторого понятия «средней» разницы), я пытаюсь найти место для подписанного. ранговый тест, хотя его, кажется, обычно преподают, а знак теста игнорируют в моем университете.
Ответы:
Рассмотрим распределение парных различий, которое несколько тяжелее хвостового, чем обычно, но не особенно «пиковое»; тогда часто подписанный критерий ранга будет иметь тенденцию быть более мощным, чем критерий Стьюдента, но также более мощным, чем критерий знака.
Например, при логистическом распределении относительная асимптотическая эффективность теста рангов со знаком относительно t-теста составляет 1,097, поэтому тест рангов со знаком должен быть более мощным, чем t (по крайней мере, в больших выборках), но асимптотическая относительная эффективность критерия знака относительно критерия Стьюдента составляет 0,822, поэтому критерий знака будет менее мощным, чем критерий С (опять же, по крайней мере, в больших выборках).
По мере того, как мы переходим к распределениям с более тяжелыми хвостами (хотя по-прежнему избегаем чрезмерно пиковых), t будет стремиться работать относительно хуже, в то время как тест знака должен несколько улучшиться, и знак, и знак ранга будут превосходить t при обнаружении небольших эффекты с существенным запасом (т. е. для определения эффекта потребуется гораздо меньший размер выборки). Будет большой класс дистрибутивов, для которых тест со знаком ранга является лучшим из трех.
Вот один пример - распределение . Мощность была смоделирована при n = 100 для трех тестов, для уровня значимости 5%. Сила для теста отмечена черным, а для знака Вилкоксона - красным, а для теста - зеленым. Доступные уровни значимости в знаковом тесте не включали особенно 5%, поэтому в этом случае был использован рандомизированный тест, чтобы приблизиться к правильному уровню значимости. Ось X является параметром который представляет сдвиг от нулевого случая (все тесты были двусторонними, поэтому кривая фактической мощности была бы симметричной относительно 0). t δT3 T δ
Как мы видим из графика, тест со знаком ранга имеет большую мощность, чем тест знака, который, в свою очередь, имеет большую мощность, чем критерий Стьюдента.
источник