Тест Шарипо-Вилка, согласно википедии , проверяет нулевую гипотезу ( ) «Население обычно распределено».
Я ищу похожий тест на нормальность с «Население обычно не распределено».
Имея такой тест, я хочу вычислить значение, чтобы отклонить H 0 на уровне значимости α тогда и только тогда, когда p < α ; доказывая, что мое население нормально распределено.
Обратите внимание, что использование теста Шарипо-Уилка и принятие если p > α, является неправильным подходом, поскольку буквально означает «у нас недостаточно доказательств, чтобы доказать, что H0 не имеет места».
Связанные темы - значение значения , бесполезно ли тестирование нормальности? , но я не вижу решения моей проблемы.
Вопросы: Какой тест я должен использовать? Это реализовано в R?
Ответы:
Там нет такого понятия , как тест , что ваши данные будут нормально распределены. Есть только тесты, что ваши данные обычно не распространяются. Таким образом, есть такие тесты, как Шапиро-Вилк, где (есть многие другие), но никаких тестовгде нуль является точто население не является нормальным и альтернативная гипотеза состоитчто население является нормальным.ЧАС0: П о р м а л
Все, что вы можете сделать, - это выяснить, какое отклонение от нормы вам небезразлично (например, асимметрия), и насколько большим должно быть это отклонение, прежде чем оно вас обеспокоит. Затем вы можете проверить, было ли отклонение от идеальной нормальности в ваших данных меньше критического значения. Для получения дополнительной информации об общей идее это может помочь прочитать мой ответ здесь: почему статистики говорят, что незначительный результат означает «вы не можете отвергнуть ноль», а не принять нулевую гипотезу?
источник
Нормальное распределение возникает, когда данные генерируются серией аддитивных событий iid (см. Изображение quincunx ниже). Это означает отсутствие обратной связи и никакой корреляции. Похоже ли это на процесс, который приводит ваши данные? Если нет, то это, вероятно, не нормально.
Существует вероятность того, что тип процесса может происходить в вашем случае. Самое близкое к тому, что вы можете «доказать», это собрать достаточно данных, чтобы исключить любые другие дистрибутивы, которые могут придумать люди (что, вероятно, не практично). Другой способ состоит в том, чтобы вывести нормальное распределение из некоторой теории наряду с некоторыми другими предсказаниями. Если данные соответствуют всем им, и никто не может придумать другого объяснения, то это было бы хорошим доказательством в пользу нормального распределения.
https://en.wikipedia.org/wiki/Bean_machine
Теперь, если вы не ожидаете какого-либо конкретного распространения априори, все же может быть разумно использовать нормальное распределение для обобщения данных, но признайте, что это по сути выбор из-за незнания ( https://en.wikipedia.org/wiki/ Principle_of_maximum_entropy ). В этом случае вы не хотите знать, нормально ли распределено население, скорее вы хотите знать, является ли нормальное распределение разумным приближением для вашего следующего шага.
В этом случае вы должны предоставить свои данные (или сгенерированные данные, которые похожи) вместе с описанием того, что вы планируете делать с ними, а затем спросить: «Каким образом допущение нормальности в этом случае может ввести меня в заблуждение?»
источник
Вы никогда не сможете «доказать» предположение о нормальности в ваших данных. Только предлагайте доказательства против этого как предположение. Тест Шапиро-Уилка является одним из способов сделать это и используется все время, чтобы оправдать предположение о нормальности. Причина заключается в том, что вы начинаете с принятия нормальности. Вы тогда спросите, мои данные предполагают, что я делаю глупое предположение? Таким образом, вы идете вперед и проверить это с Шапиро-Уилком. Если вам не удастся отвергнуть нулевую гипотезу, то данные не предполагают, что вы делаете глупое предположение.
источник