В чем разница между wilcox.test и coin :: wilcox_test в R?

13

Эти две функции существуют в R, но я не знаю их различий. Кажется, что они возвращают одинаковые p-значения только при вызове wilcox.testс correct=FALSE, и wilcox_test(в пакете для монет) с distribution="aymptotic". Для других значений они возвращают разные p-значения. Также wilcox.testвсегда возвращает W = 0 для моего набора данных, независимо от настроек его параметров:

x = c(1, 1, 1, 3, 3, 3, 3) и y = c(4, 4, 6, 7, 7, 8, 10)

Кроме того, когда я пытаюсь использовать другие инструменты, кроме R (некоторые доступны онлайн, другие как надстройки Excel), иногда они сообщают о различных значениях p.

Итак, как я могу узнать, какой инструмент дает «правильное» p-значение?

Есть ли «правильное» значение р, или если несколько инструментов дают значение р <0,05, я должен быть счастлив? (Иногда эти инструменты не предлагают так много возможностей параметризации, как R.)

Что мне здесь не хватает?

mljrg
источник

Ответы:

18

Ключ к вашему вопросу находится в? Wilcox.test в разделе «Примечания»:

Литература не единодушна в отношении определений суммы рангов Уилкоксона и тестов Манна-Уитни.

Так что это означает, что существует несколько способов провести непараметрическую проверку изменения местоположения между двумя выборками. Кроме того, учитывая каждое определение, существует более одного способа получить значение ap. «точный» означает, что он абсолютно правильный, в то время как «приблизительный» или «асимптотический» являются приближениями к истине. Вот почему есть несколько опций wilcox.test()и wilcox_test(), и только некоторые из них точно совпадают - когда обе функции выполняют одно и то же. Похоже, wilcox_test()можно получить точные p-значения, даже когда есть связанные значения, в то время как wilcox.test()возвращается к асимптотическому приближению, когда есть связанные значения. Я не знаю, какую комбинацию статистических и р-значений вычисляет надстройка Excel,

Ваш следующий вопрос - почему wilcox.test()все время возвращает 0. Для созданного вами набора данных значение тестовой статистики равно 0, когда вы делаете wilcox.test (x, y), но это будет 49, когда вы делаете wilcox.test (y, x), хотя значение p будет одна и та же. Смотрите страницу википедии по причинам. wilcox_test()возвращает Z-преобразование возвращаемой статистики wilcox.test(), поэтому они имеют разные значения тестовой статистики.

Есть ли правильное значение p? Да, но иногда это слишком сложно для вычисления, и поэтому нам нужно использовать приблизительные методы (см.? Wilcox_test для описания того, как точный расчет может потерпеть неудачу из-за недостатка памяти). Различия между аппроксимацией и точным значением в большинстве случаев не будут иметь значения, если только истинная разница в расположении этих двух групп не очень мала.

atiretoo - восстановить монику
источник
(+1) Добро пожаловать на наш сайт, Дрю!
whuber