Я собираюсь использовать тест Колмогорова-Смирнова, чтобы проверить нормальность MYDATA в R. Это пример того, что я делаю
ks.test(MYDATA,"pnorm",mean(MYDATA),sd(MYDATA))
Вот результат, который дает мне R:
data: MYDATA
D = 0.13527, p-value = 0.1721
alternative hypothesis: two-sided
Warning message:
In ks.test(MYDATA, "pnorm", mean(MYDATA), sd(MYDATA)) :
ties should not be present for the Kolmogorov-Smirnov test
Я думаю, что есть проблема, что означает «связи» в этом предупреждении?
Ответы:
У вас есть две проблемы здесь:
Тест KS предназначен для непрерывного распределения, поэтому MYDATA не должен содержать никаких связей (повторяющиеся значения).
Теория, лежащая в основе теста KS, не позволяет вам оценить параметры распределения по данным, как вы это сделали. Помощь для ks.test объясняет это.
источник
ks.test
в случае с двумя примерами связи должны быть удалены из обоихx
иy
? Я имею в виду, у меня нет связей вx
иy
(unique(x)
иunique(y)
), но эти два вектора имеют общее значение. Разве связи не должны рассматриваться только между ценностями вx
и вy
?Как объяснил @mdewey, тест KS не подходит для оценки параметров по данным. Вы можете использовать следующий код, который основывается на тесте Андерсона-Дарлинга для нормальности и не требует, чтобы вы указывали среднее и стандартное значение. Этот тест сильнее по точности, чем тест Лиллифорса.
источник