Как выбрать между тестом знака и тестом Вилкоксона?

11

Я пытаюсь выбрать один из этих двух тестов для анализа парных данных. Кто-нибудь знает эмпирические правила о том, какой из них выбрать в целом?

Шелдон
источник
Ответ Серебряной рыбы там только (едва) затрагивает это. Этот вопрос довольно общий, интересно, можем ли мы допустить более конкретный вопрос?
Glen_b
Шелдон - критерий знакового ранга содержит предположение о симметрии различий, чего нет в знаковом тесте. С другой стороны, если есть почти симметрия, а хвост не очень тяжелый, знаковый ранг должен иметь большую мощность.
Glen_b
Согласен. В моем случае критерий суммы рангов имеет наибольшее значение p, критерий знака - средний, знак ранга - наименьший. Следовательно, он обладает большей силой.
Шелдон
@ Шелдон Нет, это не то, как вы решаете, что тест имеет большую мощность - более низкое значение p в отношении одной выборки может быть просто связано с капризами этой выборки, тогда как мощность зависит от поведения всех случайных выборок, взятых из одной и той же выборки. Население. Мне лучше написать ответ, который расширяет предыдущие комментарии, объясняет, что значит иметь больше власти, и объясняет некоторые обстоятельства, при которых каждый из них может добиться большего успеха.
Glen_b
3
@Glen_b, я бы сказал, что в настоящее время наиболее важным фактором является то, что будет наиболее полезным для будущих читателей. Я думаю, что тот, кто ищет тест знака по сравнению с тестом Уилкоксона и находит эту ветку, получит гораздо больше пользы от прочтения вашего конкретного ответа здесь, чем от перенаправления в тот мега-поток, где они могут потеряться и никогда не найдут никакого ответа.
амеба

Ответы:

9

Я пытаюсь выбрать один из этих двух тестов для анализа парных данных. Кто-нибудь знает эмпирические правила о том, какой из них выбрать в целом?

Тест со знаком ранга несет в себе предположение о симметрии различий под нулевым значением, которое в тесте знака не требуется. (Это предположение необходимо для того, чтобы перестановки знаков, прикрепленных к разряду без знака, были одинаково вероятны.)

С другой стороны, если в популяции существует почти симметрия, а хвост не очень тяжелый, знаковый ранг должен иметь большую силу.

[Это не должно восприниматься как совет выбирать между ними на основе выборки ; в общем, это приводит к тому, что свойства теста отличаются от номинальных (тесты могут быть смещены, фактические уровни значимости больше не являются такими, какими они кажутся, вычисленные значения p не представляют истинных значений p и т. д.). Вместо этого, где это возможно, характеристики должны оцениваться на основе знаний, внешних по отношению к образцу, к которому применяется тест - будь то по предметной области, знакомству с другими наборами данных, такими как этот, разделение выборки, ...]

В моем случае критерий суммы рангов имеет наибольшее значение p, критерий знака - средний, знак ранга - наименьший. Следовательно, он обладает большей силой.

Это не то, как вы решаете, что тест имеет большую мощность - более низкое значение p в отношении одной выборки может быть просто связано с капризами этой выборки, тогда как мощность зависит от поведения всех случайных выборок, взятых из одной и той же популяции.

ЧАС0

Аналогичным образом мы могли бы рассчитать коэффициент отторжения для последовательности популяций с различным расположением * парных различий и получить полную кривую мощности. Тогда «более высокая мощность» будет соответствовать всей кривой мощности (или почти всей ее, отмечая, что оба должны быть на одном уровне значимости) для одного теста, лежащего над другим.

* Вы могли бы принять это как медиану для настоящего обсуждения - в то время как оценщик для теста рангов со знаком является медианой парных средних парных разностей, в предположении симметрии оценщик местоположения также должен быть подходящей оценкой медианной пары разница.


Вот связанный вопрос Как выбрать между t-тестом или непараметрическим тестом, например, Уилкоксоном в небольших выборках . Один из ответов включает (краткое) обсуждение данного вопроса.

Glen_b - Восстановить Монику
источник
Спасибо за ваше разъяснение. Я думаю, что самое важное сообщение о возвращении домой - это предположение о симметрии различий для теста рангового ранга, которое нарушается в моем случае. У меня есть ощущение, что кроме проверки соответствия критериям симметрии, нет никакого способа определить, какой тест является неправильным. Скорее, разумно сказать, какой из них более уместен.
Шелдон
1
@Sheldon Если вы не уверены, что условия теста близки к истинным, вы, как правило, не должны предполагать, что это так. То есть, возможно, лучше было бы провести тест знака. Я надеюсь добавить дополнительную информацию в мой ответ, когда у меня будет возможность.
Glen_b