Как вы сообщаете об испытании Манна-Уитни?

10

Я делаю свою диссертацию, и я провожу ряд тестов. После использования теста Крускала-Уоллиса я обычно сообщаю результат:

Существует значительное различие между средствами ...(χ(2)2=7.448,p=.024)

Но сейчас я провел тест Манна-Уитни, и я не уверен, какие ценности представить. SPSS дает мне Манна-Уитни , Уилкоксона , и -Value. Я представляю все эти 4 значения? Или какие-то неактуальные?W Z PUWZP

dissertationhelp
источник

Ответы:

12

В Википедии, похоже, есть ваши ответы. Вот выдержка из примера утверждения результатов:

Сообщая о результатах теста Манна – Уитни, важно заявить:

  • Мера центральных тенденций двух групп (средние значения или медианы; так как критерий Манна-Уитни является порядковым тестом, медианы обычно рекомендуются)
  • Значение U
  • Размеры выборки
  • Уровень значимости.

На практике часть этой информации, возможно, уже была предоставлена, и при принятии решения о ее повторении следует использовать здравый смысл. Типичный отчет может работать,

«Средняя латентность в группах E и C составляла 153 и 247 мс; распределения в двух группах значительно различались (Манн-Уитни U = 10,5, n 1 = n 2 = 8, P <0,05 двусторонний)».

Тест зарегистрированны ранга Вилкоксона подходит для парных выборок, в то время как тест Манна-Уитни предполагает независимых выборок. Однако, согласно Field (2000) , Wilcoxon в вашем выводе SPSS является «другой версией этой статистики, которую можно преобразовать в оценку Z и, следовательно, можно сравнить с критическими значениями нормального распределения». Это тоже объясняет твою оценку z !Wz

К вашему сведению, Википедия добавляет, что для больших выборок приблизительно нормально распределен. Учитывая все эти значения, можно также рассчитать величину эффекта , которая в случае примера из Википедии равна 0,319 (калькулятор реализован в разделе 11 здесь ). Однако это преобразование статистики теста зависит от приблизительной нормальности , поэтому оно может быть неточным при n s = 8 ( Fritz et al., 2012 ) .U Uη2U

PS Результаты теста Крускала-Уоллиса не следует интерпретировать как выявление различий между средствами, за исключением особых обстоятельств. Подробности смотрите в ответе @ Glen_b на другой вопрос «Разница между тестом ANOVA и тестом Крускала-Уоллиса» .

Ссылки

Field, A. (2000). 3.1. Тест Манна-Уитни. Методы исследования 1: SPSS для Windows, часть 3: Непараметрические тесты. Получено с http://www.statisticshell.com/docs/nonparametric.pdf .
Fritz, CO, Morris, PE, & Richler, JJ (2012). Оценка величины эффекта: текущее использование, расчеты и интерпретация. Журнал экспериментальной психологии: общее , 141 (1), 2–18. PDF доступен через ResearchGate .

Ник Стаунер
источник
3
Какой смысл сообщать значение U в приведенном выше примере? Что я, как читатель, получу, узнав, что U было 10,5?
амеба
4
В приведенном выше примере вы получаете возможность рассчитать точное значение , которое не задано и может быть полезно для оценки размера эффекта, мета-анализа или проверки на взлом. Мой друг и коллега @rpierce также посоветовал мне сообщать статистику тестов, чтобы убедиться, что читатели в целом все делают правильно, поскольку он поймал много опубликованных статей, делающих это неправильно, из-за искаженной статистики тестов и связанных с ними . р д фppdf
Ник Стаунер
Интересно. Я думаю, что этот вопрос может быть достоин отдельного вопроса, который я мог бы задать здесь в какой-то момент. Тем не менее: если кто-то хочет получить точные значения p, он может сообщить точные значения p! На самом деле, обычный совет - сообщать точные значения p, если они не очень малы, например, p <0,0001; но в этом случае p-хакерство маловероятно. В любом случае размер эффекта следует указывать отдельно, например, «медианные задержки в группах E и C составляли 153 и 247 мс» в вашей цитате из вики.
амеба
1
Секретная (то есть, не доступная для поиска) группа в Фейсбуке для психологов выпускников нашей альма-матер; примеры не включены. Мне тоже любопытно, хотя. Может быть, вы можете заставить его поделиться некоторыми, если вы пометите его в отдельном вопросе :) Бьюсь об заклад, у других здесь было бы много примеров, чтобы присоединиться к ним - то есть, если вопрос не будет закрыт как-то не по теме ! Конечно, более простой вопрос, такой как: «Почему важно сообщать статистику теста в дополнение к и размеру эффекта?» хотя я думаю, что было бы по теме ... Сначала проверьте наличие дубликатов под тегом отчетности , если вы действительно хотите быть в безопасности ...p
Ник Стаунер,
1
Там, где размеры выборки не так малы, чтобы их можно было неправильно интерпретировать, я бы склонялся к тому, чтобы сообщать о стандартизированном U или W (стандартизированном, они идентичны) как Z-значении ( скажем ), потому что читатели будут иметь интуитивный смысл о том, что это значит - хотя тогда становится необходимым выяснить, когда у вас есть точное значение p, если оно у вас есть, а не одно, основанное на Z-значении для статистики. ZU
Glen_b