Вывод статистики W с помощью wilcox.test () в R совпадает со статистикой U?

22

Я недавно читал о U-тесте Манна-Уитни. Оказывается, что для проведения этого теста в R вам действительно нужно запустить тест Уилкоксона!

Мой вопрос: wilcox.testидентична ли статистика W в R статистике U?

Лучиано
источник

Ответы:

25

Уилкоксону обычно приписывают то, что он был первым изобретателем теста *, хотя подход Манна и Уитни был большим шагом вперед, и они расширили случаи, для которых статистика была сведена в таблицу. Я предпочитаю называть тест Уилкоксоном-Манном-Уитни, чтобы признать оба вклада (также виден Манн-Уитни-Уилкоксон; я тоже не против).

* Тем не менее, реальная картина немного более мутная, поскольку некоторые другие авторы также придумывают те же или аналогичные статистические данные об этом времени или ранее, или в некоторых случаях делают вклады, которые тесно связаны с тестом. По крайней мере, часть кредита должна идти в другом месте.

Тест Уилкоксона и U-критерий Манна-Уитни эквивалентны (и справка утверждает, что они есть) в том, что они всегда отклоняют одни и те же случаи при одинаковых обстоятельствах; в большинстве случаев их тестовая статистика будет отличаться только на смену (а в некоторых случаях просто возможно изменение знака).

В литературе критерий Уилкоксона определяется более чем одним способом (и эта неоднозначность восходит к первоначальной табуляции статистики теста, более чем на мгновение), поэтому необходимо позаботиться о том, с каким обсуждается критерий Уилкоксона.

Две наиболее распространенные формы определения обсуждаются в этой паре постов:

Тест суммы рангов Уилкоксона в R

Различные способы расчета статистики теста для критерия суммы рангов Уилкоксона

Чтобы решить, что конкретно происходит в R:

Статистика, используемая wilcox.testв R, определяется в help ( ?wilcox.test), и там объясняется вопрос об отношении к статистике Манна-Уитни U:

Литература не единодушна в отношении определений суммы рангов Уилкоксона и тестов Манна-Уитни.

Два наиболее распространенных определения соответствуют сумме рангов первой выборки с вычитанным минимальным значением или нет: R вычитает, а S-PLUS - нет, давая значение, большее на m (m + 1) / 2 для первый образец размером м. (Кажется, в оригинальной статье Уилкоксона использовалась нескорректированная сумма рангов, но последующие таблицы вычитали минимум.)

Значение R также можно рассчитать как число всех пар, (x[i], y[j])для которых y[j]не больше, чем x[i]наиболее распространенное определение критерия Манна-Уитни.

Последнее предложение полностью отвечает на этот аспект вашего вопроса - версия W, которую выдает R *, также является значением U.

N1(N1+1)2

Glen_b - Восстановить Монику
источник
7

И критерий суммы рангов Уилкоксона, и критерий Манна-Уитни являются непараметрическими эквивалентами независимого t-критерия . В некоторых случаях версия W, которую дает R, также является значением U. Но не во всех случаях.

Когда вы используете: wilcox.test(df$var1 ~ df$var2, paired=FALSE)данный W такой же, как U. Таким образом, вы можете сообщить о нем как статистику Манна-Уитни U.

Однако, когда вы используете:, wilcox.test(df$var1 ~ df$var2, paired=TRUE)вы фактически выполняете тест ранга Вилкоксона. Знаковый ранговый критерий Уилкоксона является эквивалентом зависимого t-критерия .

Источник: «Отклонение статистики с использованием R» Энди Филда (2013)

Яап
источник
1
Хорошая идея - указать, что если вы используете аргумент, paired=TRUEто это не Уилкоксон-Манн-Уитни, а подписанное звание.
Glen_b
1

Обратите внимание, что код: wilcox.test(df$var1 ~ df$var2, paired=FALSE)(используя '~')

будет производить статистику W, отличную от: wilcox.test(df$var1, df$var2, paired=FALSE)(используя ',')

Tilen
источник
Добро пожаловать на сайт, @Tilen. Было ли это предназначено как ответ на вопрос ОП, комментарий с просьбой дать разъяснения от ОП или одного из ответчиков, или как ваш новый вопрос? Пожалуйста, используйте только поле «Ваш ответ», чтобы ответить на исходный вопрос. Вы сможете комментировать в любом месте, когда ваша репутация> 50. Если у вас есть новый вопрос, нажмите на серый ASK QUESTION в верхней части страницы и задайте его там, тогда мы сможем вам помочь. Поскольку вы новичок здесь, вы можете посетить наш тур , в котором есть информация для новых пользователей.
gung - Восстановить Монику
Большое спасибо @gung. На самом деле, это был своего рода ответ и вопрос. Спасибо за советы. Я с нетерпением жду, чтобы стать частью этого.
Tilen
«Ответы» предназначены только для прямых ответов на вопрос. Можете ли вы отредактировать это, чтобы сделать его более чисто ответом?
gung - Восстановить Монику
Прости за это. Я редактировал это сейчас. Теперь это выглядит лучше?
Tilen
1
Не надо извиняться. Я думаю, что ваш ответ подразумевается в том, что вы положили здесь, но люди должны будут читать между строк. Вы можете сделать это явным и связать все это в поклоне? Однако я не уверен, что это правильно. Чтобы использовать версию формулы, вам нужен вектор значений и индикатор группировки. Например, wilcox.test(values~ind, with(df, stack(var1=var1, var2=var2)), paired=FALSE). Когда я делаю это, я получаю то же самое в Wобоих направлениях.
gung - Восстановить Монику