Многократные сравнения в непараметрическом тесте

11

Я работаю с набором данных, который является непараметрическим и имеет 12 обработок. Я выполнил тест Крускала-Уоллиса и получил значительное значение, и теперь я хотел бы провести процедуру множественных сравнений, чтобы увидеть, какие из обработок значительно различаются. По этой теме имеется много информации, но я не нашел ничего, что бы конкретно решало эту проблему. Любые идеи?? п

Jesse
источник

Ответы:

10

Вы ищете тест Данна (или, скажем, тест Коновера-Имана). Это очень похоже на набор тестов попарной суммы рангов , но версии Данна (1) учитывают объединенную дисперсию, подразумеваемую нулевой гипотезой, и (2) сохраняет ранжирование, используемое для проведения теста Крускала-Уоллиса. Проведение испытаний сорта рангов Уилкоксона / Манна-Уитни с этими проблемами игнорируется. Можно, конечно, выполнить коррекцию по частоте ошибок по семьям или по ложным показателям обнаружения для множественных сравнений с тестом Данна.

Тест Данна реализован для Stata в пакете dunntest (из типа Stata net describe dunntest, from(https://alexisdinno.com/stata)при подключении к Интернету) и для R в пакете dunn.test ; Оба пакета включают в себя множество вариантов настройки множественного сравнения. Можно также выполнить тест Данна в SAS, используя макрос Эллиотта и Хайнана, KW_MC .

Как я уже писал в связанном с CV вопросе : есть несколько менее известных поп-тестов по принципу hoc, которые следуют за отклоненным Крускалом-Уоллисом, включая Conover-Iman (например, Dunn, но основанный на распределении t , а не распределении z , строго более мощный, чем тест Данна, а также реализованный для Stata в пакете conovertest и для R в пакете conover.test ) и тестов Dwass-Steel-Citchlow-Fligner.


Ссылки
Dunn, OJ (1964). Многократные сравнения с использованием ранговых сумм. Technometrics , 6 (3): 241–252.

Alexis
источник
Можете ли вы объяснить, почему не использовать мягкие методы, такие как "FDR"?
user4581
@ user4581 Я не уверен, что понимаю ваш вопрос. Во-первых, что вы подразумеваете под "мягким"? Во-вторых, что вы подразумеваете под «почему бы и нет», конечно, можно использовать ложные методы определения частоты обнаружения, чтобы скорректировать множественные сравнения с тестом Данна или тестом Коновера-Имана.
Алексис