Может ли начальная загрузка использоваться для замены непараметрических тестов?

15

Я довольно плохо знаком со статистикой. Концепция начальной загрузки меня смутила.

Я знаю, что для нормального распределения выборки необходимо использовать определенные тесты, такие как t-критерий. В случаях, когда данные обычно не распространяются, запрос «начальной загрузки» в t-тестах в SPSS обойдёт ли это проблему ненормальности? Если да, то является ли t-статистика, сообщаемая в выходных данных, основанной на загрузочном распределении выборки?

Кроме того, будет ли это лучший тест по сравнению с использованием непараметрических тестов, таких как Манн-Уитни или Крускал-Уоллис, в случаях, когда у меня есть ненормальные данные? В ситуациях, когда данные не являются нормальными, и я использую начальную загрузку, я не сообщал бы t-статистику: правильно?

JC22
источник

Ответы:

16

Бутстрап работает, не требуя допущений, таких как нормальность, но он может сильно варьироваться, когда размер выборки невелик и популяция не нормальна. Так что это может быть лучше в смысле удержания допущений, но это не лучше во всех отношениях.

Образцы начальной загрузки с заменой, образец перестановочных испытаний без замены. Манн-Уитни и другие непараметрические тесты на самом деле являются частными случаями теста перестановки. Я на самом деле предпочитаю тест перестановки здесь, потому что вы можете указать значимую статистику теста.

Решение о том, какой тест использовать, должно основываться на ответе на вопрос и знании науки, ведущей к получению данных. Центральная предельная теорема говорит нам, что мы все еще можем получить очень хорошие приближения из t-тестов, даже когда совокупность не является нормальной. Насколько хороши аппроксимации, зависит от формы распределения населения (не выборки) и размера выборки. Во многих случаях t-критерий все еще приемлем для небольших выборок (и в некоторых случаях он недостаточно хорош для очень больших выборок).

Грег Сноу
источник
Спасибо, что полезно. Так что, если я использую самозагрузку, тогда я сообщу только о p-значении и CI без какой-либо статистики теста, это правильно?
JC22
(+1) Будете ли вы случайно иметь ссылку или ссылку на тесты Манна-Уитни и перестановки? Это очень интересно, но не очевидно для меня!
Гала
4
@ JC22 Вы должны сообщить тестовую статистику (какую бы статистику вы ни загрузили); Например, тест начальной загрузки, основанный на среднем значении, будет отличаться от теста, основанного на усеченном среднем значении.
Glen_b
2
@ GaëlLaurans Пример генерации точного (перестановочного) распределения тестовой статистики по ранговой сумме Уилкоксона (эквивалентной критерию Манна-Уитни) и тестовой статистики Крускала-Уоллиса см. В этом ответе .
Каракал
2
@ GaëlLaurans, по ссылке: Различные результаты теста Уилкоксона-Манна-Уитни из разных пакетов статистики Рейнхард Бергманн, Джон Лудбрук и Уилл PJM Spooren Journal: Американский статистик, том 54, выпуск 1, февраль 2000 г., страницы 72-77
Грег Сноу