Я пытаюсь понять, как получить для одностороннего теста Колмогорова-Смирнова , и пытаюсь найти CDF для и в случае двух выборок. Ниже приводится в нескольких местах как CDF для в случае с одним примером:
Кроме того, в силу того, что существует несколько иная формулировка этого CDF с одним образцом (я заменяю на в его цитате для соответствия моей записи здесь):
Используя интегральное преобразование вероятности, Дональд Кнут выводит их (общее) распределение на p. 57 и упражнение 17 из TAoCP Том 2. Я цитирую:
Это применимо к односторонним гипотезам в случае одной выборки, например: H , где - эмпирический CDF из , и является некоторым CDF.
Я думаю, что в этом случае является значением в выборке, и что является наибольшим целым числом в . (Это правильно?)
Но что такое CDF для (или ), когда у одного есть два образца? Например, когда H для эмпирических CDF и ? Как получить ? D - n 1 , n 2 0 : F A ( x ) - F B ( x ) ≤ 0 A B p + n 1 , n 2
источник
Ответы:
Хорошо, я собираюсь нанести удар в этом. Критические идеи приветствуются.
На странице 192 Gibbons and Chakraborti (1992), ссылаясь на Ходжеса, 1958, начнем с CDF с малой выборкой (точной?) Для двустороннего теста (я поменяю местами их нотации и для и соответственно):д н 1 , н 2 хм , н d N1, н2 Икс
Где создается путем перечисления путей (монотонно возрастающих в и ) от начала координат до точки через граф с заменой на - значения x- осей и y -осей равны и . Кроме того, пути должны подчиняться ограничению нахождения внутри границ (где - значение статистики теста Колмогорова-Смирнова): n 1 n 2 ( n 1 , n 2 ) S m ( x ) F n 1 ( x ) n 1 FА (n1,n2) N1 N2 ( н1, н2) Sм( х ) FN1( х ) n 2 F 2 ( x ) xN1F1( х ) N2F2( х ) Икс
Ниже на их рисунке Рисунок 3.2 представлен пример для с 12 такими путями:А ( 3 , 4 )
Далее Гиббонс и Чакаборти говорят, что одностороннее значение получается с использованием того же графического метода, но только с нижней границей для и только верхний для .D + n 1 , n 2п D+N1, н2 D-N1, н2
Эти небольшие выборочные подходы влекут за собой алгоритмы перечисления путей и / или рекуррентные соотношения, которые, несомненно, делают асимптотические вычисления желательными. Гиббонс и Чакраборти также отмечают ограничивающие CDF как и приближающиеся к бесконечности, из :N1 D n 1 , n 2N2 DN1, н2
И они дают ограничительный CDF (или ) как:D+N1, н2 D-N1, н2
Поскольку и строго неотрицательны, CDF может принимать ненулевые значения только в течение :D+ D- [ 0 , ∞ )
Ссылки
Gibbons, JD и Chakraborti, S. (1992). Непараметрический статистический вывод . Marcel Decker, Inc., 3-е издание, переработанное и расширенное издание.
Ходжес, JL (1958). Вероятность значимости критерия Смирнова с двумя образцами. Arkiv for the matematik . 3 (5): 469--486.
источник