Я довольно плохо знаком со статистикой, и мне нужна ваша помощь.
У меня есть небольшой образец, как показано ниже:
H4U
0.269
0.357
0.2
0.221
0.275
0.277
0.253
0.127
0.246
Я выполнил тест Шапиро-Уилка, используя R:
shapiro.test(precisionH4U$H4U)
и я получил следующий результат:
W = 0.9502, p-value = 0.6921
Теперь, если я предполагаю, что уровень значимости 0,05, чем значение р, больше, чем альфа (0,6921> 0,05), и я не могу отвергнуть нулевую гипотезу о нормальном распределении, но позволяет ли я сказать, что выборка имеет нормальное распределение ?
Благодарность!
qqnorm(rnorm(9))
несколько раз ...qqnorm(runif(9))
может дать аналогичный результат. Так что мы не можем ничего сказать ...Неспособность отклонить нулевую гипотезу является признаком того, что у вас слишком малая выборка для того, чтобы уловить любые отклонения от нормы, которые у вас есть, но ваша выборка настолько мала, что даже весьма существенные отклонения от нормальности, вероятно, не будут обнаружены.
Тем не менее, проверка гипотезы в значительной степени не подходит для большинства случаев, когда люди используют критерий нормальности - вы на самом деле знаете ответ на вопрос, который вы проверяете - распределение населения по вашим данным не будет нормальным , (Это может быть довольно близко иногда, но на самом деле нормально?)
Вопрос, который вас должен волновать, заключается не в том, является ли распределение, из которого они взяты, нормальным (это не будет). Вопрос, который вас действительно должен волновать, больше напоминает «Отклонение от нормальности, которое я имею, окажет существенное влияние на мои результаты?». Если это потенциально проблема, вы можете рассмотреть анализ, который с меньшей вероятностью будет иметь эту проблему.
источник
Учитывая, что вы довольно плохо знакомы со статистикой, я подозреваю, что вы думаете об этом, потому что это остатки от оценки среднего значения, и вы хотите знать, является ли допущение нормальности для оценок достоверности с использованием распределения.T
Я также полагаю, что вы смотрите на пропорции, и в этом случае вы можете использовать биномиальное распределение, если вас беспокоит нарушение допущений.
Если вас заинтересовали тесты Шапиро, вы можете игнорировать все, что я только что сказал.
источник
Как уже сказал Генри, нельзя сказать, что это нормально. Просто попробуйте выполнить следующую команду в R несколько раз:
Это позволит проверить выборку из 9 чисел из равномерного распределения. Много раз значение p будет намного больше, чем 0,05 - это означает, что вы не можете сделать вывод, что распределение нормальное.
источник
Я также смотрел на то, как правильно интерпретировать значение W в тесте Шапиро-Вилка, и в соответствии со статьей Эмиля О.В. Киркегарда « Значения W из теста Шапиро-Вилка, визуализированной с различными наборами данных », очень сложно что-либо сказать о нормальности распределение смотрит только на значение W
Как он заявляет в заключение:
Смотрите оригинальную статью для получения дополнительной информации.
источник
Одним из важных вопросов, не упомянутых в предыдущем ответе, являются ограничения теста:
Чтобы ответить на исходный вопрос (очень маленький размер выборки): см. Следующие статьи о лучших альтернативах, таких как график QQ и гистограмма для этого конкретного случая.
источник