Я немного покопался в архивах Cross Validated и, похоже, не нашел ответа на свой вопрос. Мой вопрос заключается в следующем: Википедия дает три предположения, которые необходимо придерживаться для теста рангов Вилкоксона (слегка измененного для моих вопросов):
Пусть Zi = Xi-Yi для i = 1, ..., n.
Различия Zi предполагаются независимыми.
(а.) Каждый Zi происходит из одной и той же непрерывной популяции, и (б.) каждый Zi симметричен относительно общей медианы;
Значения, которые представляют Xi и Yi, упорядочены ... поэтому сравнения «больше чем», «меньше чем» и «равно» полезны.
Однако документация для? Wilcox.test в R, похоже, указывает на то, что (2.b) на самом деле то, что проверено процедурой:
«... если и x, и y заданы, а спарено - ИСТИНА, выполняется проверка ранговых значений Вилкоксона с нулем, что распределение ... x - y (в случае двух спаренных примеров) симметрично относительно mu».
Для меня это звучит так, как будто тест проводится для нулевой гипотезы о том, что "Z распределен симметрично вокруг медианы mu = SomeMu", так что отклонение от нуля может быть либо отклонением симметрии, либо отклонением того, что мю, вокруг которого Z симметрична - SomeMu.
Это правильное понимание документации R для wilcox.test? Конечно, это важно по той причине, что я провожу ряд парных разностных тестов для некоторых данных до и после («X» и «Y» выше). Данные «до» и «после» по отдельности сильно искажены, но различия не так сильно искажены (хотя все же несколько искажены). Под этим я подразумеваю, что данные «до» или «после», рассматриваемые отдельно, имеют асимметрию ~ 7–21 (в зависимости от рассматриваемой выборки), в то время как данные «различий» имеют асимметрию ~ = 0,5–5. но не так сильно.
Если наличие асимметрии в моих данных «различий» приведет к тому, что тест Уилкоксона даст мне ложные / предвзятые результаты (как показывает статья в Википедии), тогда асимметрия может быть большой проблемой. Однако, если тесты Уилкоксона фактически проверяют, является ли распределение различий "симметричным вокруг mu = SomeMu" (как, по-видимому, указывает? Wilcox.test), то это не представляет особой проблемы.
Таким образом, мои вопросы:
Какая интерпретация выше верна? Не влияет ли асимметрия в моем распределении "различий" на мой тест Уилкоксона?
Если асимметрия вызывает беспокойство: «Насколько асимметрия вызывает беспокойство?»
Если подписанные ранговые тесты Уилкоксона кажутся здесь совершенно неуместными, какие-либо предложения по поводу того, что мне следует использовать?
Спасибо. Если у вас есть какие-либо дополнительные предложения о том, как я могу провести этот анализ, я буду очень рад их услышать (хотя я также могу открыть другую ветку для этой цели). Кроме того, это мой первый вопрос о перекрестной проверке; если у вас есть предложения / комментарии о том, как я задал этот вопрос, я тоже открыт для этого!
Немного предыстории: я анализирую набор данных, который содержит наблюдения о том, что я назову «ошибками в производстве». У меня есть наблюдение за ошибками, происходящими в производственном процессе до и после внезапной проверки, и одна из целей анализа состоит в том, чтобы ответить на вопрос: «Проверяет ли разница в выявленном количестве ошибок?»
Набор данных выглядит примерно так:
ID, errorsBefore, errorsAfter, size_large, size_medium, typeA, typeB, typeC, typeD
0123,1,1,1,0,1,1,1,0
2345,1,0,0,0,0,1,1,0
6789,2,1,0,1,0,1,0,0
1234,8,8,0,0,1,0,0,0
Есть около 4000 наблюдений. Другими переменными являются катагорические наблюдения, которые описывают характеристики фирм. Размер может быть маленьким, средним или большим, и каждая фирма является одной и только одной из них. Фирмы могут быть любого или всех «типов».
Меня попросили провести несколько простых тестов, чтобы увидеть, были ли статистически значимые различия в наблюдаемой частоте ошибок до и после проверок для всех фирм и различных подгрупп (в зависимости от размера и типа). T-тесты вышли, потому что данные были сильно искажены как до, так и после, например, в R данные до выглядели примерно так:
summary(errorsBefore)
# Min. 1st Qu. Median Mean 3rd Qu. Max
# 0.000 0.000 4.000 12.00 13.00 470.0
(Они составлены - я боюсь, что не могу публиковать реальные данные или какие-либо фактические манипуляции с ними из-за проблем собственности / конфиденциальности - мои извинения!)
Парные различия были более централизованными, но все еще не очень хорошо соответствовали нормальному распределению - слишком пиковому. Различия данных выглядели примерно так:
summary(errorsBefore-errorsAfter)
# Min. 1st Qu. Median Mean 3rd Qu. Max
# -110.0 -2.000 0.000 0.005 2.000 140.0
Было предложено, чтобы я использовал тест рангов со знаком Уилкоксона, и после краткого ознакомления с? Wilcox.test и Wikipedia, и здесь это похоже на использование теста. Учитывая вышеизложенные предположения, я считаю, что (1) хорошо, учитывая процесс генерирования данных. Предположение (2.a) не совсем верно для моих данных, но обсуждение здесь: Альтернатива тесту Уилкоксона, когда распределение не является непрерывным? казалось, указывало, что это не было слишком большой проблемой. Предположение (3) в порядке. Мое единственное беспокойство (я полагаю) - Предположение (2.b).
Еще одно замечание , сделанное несколько лет спустя: в конечном итоге я прошел отличный непараметрический курс статистики и потратил много времени на тесты с ранговыми суммами. В предположении (2.a) «Каждый Zi происходит из одной и той же непрерывной популяции» заложена идея, что обе выборки могут происходить из популяций с одинаковой дисперсией - это оказывается чрезвычайно важным, практически говоря. Если у вас есть опасения по поводу различий в ваших популяциях (из которых вы берете образцы), вы должны быть обеспокоены использованием WMW.
источник
Ответы:
Википедия ввела вас в заблуждение, заявив, что "... если заданы оба значения x и y, а парные значения - ИСТИНА, ранговый критерий Уилкоксона с нулевым признаком того, что распределение ... x - y (в случае двух спаренных примеров) симметрично о му выполняется ".
Тест определяет, являются ли значения RANK-TRANSFORMED для симметричными относительно медианы, указанной вами в нулевой гипотезе (я предполагаю, что вы будете использовать ноль). Асимметрия не является проблемой, поскольку тест со знаком ранга, как и большинство непараметрических тестов, является «бесплатным при распространении». Ценой, которую вы платите за эти тесты, часто является снижение энергопотребления, но, похоже, у вас достаточно большой образец, чтобы преодолеть это.Zя= хя- уя
Альтернативой «что, черт возьми», альтернативой критерию суммы рангов может быть попытка простого преобразования, такого как и при вероятности того, что эти измерения могут приблизительно следовать логнормальному распределению - так что значения должны выглядеть "криво колокол". Тогда вы могли бы использовать на тесте и убедить себя (и своего босса, который только взял Business Stats), что тест ранга суммы работает. Если это работает, есть бонус: t-критерий средних значений для логнормальных данных - это сравнение медиан для исходных, не преобразованных измерений.пер( хя) пер( уя)
Мне? Я бы сделал и то, и другое, что смогу приготовить (проверка отношения правдоподобия по Пуассону по размеру фирмы?). Проверка гипотез - все о том, чтобы определить, являются ли доказательства убедительными, и некоторые люди берут кучу убедительности.
источник
И Википедия, и страница справки R в некотором роде верны и пытаются сформулировать одно и то же, они просто формулируют это по-разному.
В статье Википедии высказываются гипотезы как (медиана = 0) против (медиана! = 0), и говорится, что вы можете сделать вывод из теста, если различия имеют симметричное распределение (+ другие предположения).
Страница справки R более конкретна, она содержит гипотезы (медиана = 0 и различия имеют симметричное распределение) против (по крайней мере, одна из них является ложной). Так что это перевело предположение в нулевую гипотезу. Я думаю, что они сделали это, чтобы подчеркнуть необходимость симметричности: при искаженных различиях критерий со знаком будет отвергать нулевую гипотезу, даже если медиана не работает. Если вы читаете учебник, он также может сказать вам, что проверяется нулевая гипотеза P (X> Y) = 0,5 - остальное фактически просто следует из этого.
С точки зрения применения, вопрос, конечно, заключается в том, заботишься ли ты конкретно о медиане (и тогда асимметрия - это проблема, а медианный тест - возможная альтернатива), или о том, заботишься ли ты обо всем распределении, а затем P (X> y)! = 0.5 свидетельствует об изменениях.
источник