Почему работает тест Колмогорова-Смирнова?

25

Читая о тесте KS с двумя образцами, я точно понимаю, что он делает, но я не понимаю, почему он работает .

Другими словами, я могу выполнить все шаги для вычисления эмпирических функций распределения, найти максимальную разницу между ними, чтобы найти D-статистику, вычислить критические значения, преобразовать D-статистику в p-значение и т. Д.

Но я понятия не имею, почему что-то из этого на самом деле говорит мне что-нибудь о двух дистрибутивах.

Кто-то мог бы так же легко сказать мне, что мне нужно перепрыгнуть через осла и посчитать, как быстро он убегает, и если скорость меньше 2 км / ч, я отвергаю нулевую гипотезу. Конечно, я могу сделать то, что вы мне сказали, но какое отношение это имеет к нулевой гипотезе?

Почему тест KS с двумя образцами работает? Как вычисление максимальной разницы между ECDF связано с тем, насколько различны эти два распределения?

Любая помощь приветствуется. Я не статистика, поэтому предположим, что я идиот, если это возможно.

Darcy
источник
4
Добро пожаловать в резюме, Дарси! Отличный вопрос!
Алексис
1
Перепрыгнуть через осла ... :)
Ричард Харди

Ответы:

9

По сути, тест является непротиворечивым как прямой результат теоремы Гливенко Кантелли, одного из наиболее важных результатов эмпирических процессов и, возможно, статистики.

n

Сколько? Ммееаа я не знаю. Сила теста довольно сомнительна. Я бы никогда не использовал это в реальности.

http://www.math.utah.edu/~davar/ps-pdf-files/Kolmogorov-Smirnov.pdf

Adamo
источник
2
+1 Привет, АдамО! Получил одно-два предложения, чтобы взять власть, являющуюся "сомнительным?" Мне бы очень понравилась эта точка зрения (я понял, что тест считается легко "одолеть").
Алексис
1
F1F2p>0.05p<0.05F1=F2
1
F1F2
2
@ Алексис нет, у меня нет проблем с математикой теста. На самом деле, я думаю, что это довольно элегантно, и результат теоремы предела очень впечатляет.
AdamO
2
F1F2
9

У нас есть два независимых, одномерных образца:

X1,X2,...,XNiidFY1,Y2,...,YMiidG,
GF
H0:F(x)=G(x)for all xRH1:F(x)G(x)for some xR.
{Xi}i=1N{Yj}j=1MXiYjFGxFGF(x)G(x)xR

JCZ
источник
8

Интуитивный дубль:

Тест Колмогорова-Смирнова в значительной степени основан на упорядочении наблюдений по распределению. Логика заключается в том, что если два базовых распределения одинаковы, то - в зависимости от размеров выборки - порядок должен быть довольно хорошо перемешан между ними.

YXD

DXY

Alexis
источник