Оставляя в стороне очевидную проблему малой мощности хи-квадрата в подобных обстоятельствах, представьте себе, что вы проводите проверку качества хи-квадрата для некоторой плотности с неопределенными параметрами путем объединения данных.
Для конкретности, скажем, экспоненциальное распределение с неизвестным средним и размером выборки, скажем, 100.
Чтобы получить разумное количество ожидаемых наблюдений на одну ячейку, необходимо принять во внимание некоторые данные (например, если мы решили поместить 6 столбцов ниже среднего значения и 4 над ним, то при этом все равно будут использоваться границы бинов на основе данных) ,
Но такое использование бинов, основанное на просмотре данных, предположительно повлияет на распределение тестовой статистики при нулевом значении.
Я видел много дискуссий о том факте, что - если параметры оцениваются по максимальной вероятности из бин- данных - вы теряете 1 df на расчетный параметр (проблема, относящаяся ко времени Фишера против Карла Пирсона) - но я не помню читать что-нибудь о поиске самих границ бункера на основе данных. (Если вы оцениваете их по незавершенным данным, то с помощью бинов распределение тестовой статистики лежит где-то между и .)χ 2 k χ 2 k - p
Влияет ли этот выбор корзин на основе данных существенным образом на уровень значимости или мощность? Есть ли какие-то подходы, которые важнее других? Если есть большой эффект, это что-то, что исчезает в больших выборках?
Если бы это оказало существенное влияние, это, похоже, использовало бы критерий хи-квадрат, когда параметры неизвестны, почти бесполезны во многих случаях (несмотря на то, что их все еще пропагандируют в нескольких текстах), если только у вас не было хорошего -приорная оценка параметра.
Обсуждение вопросов или указателей на ссылки (желательно с упоминанием их выводов) было бы полезно.
Отредактируйте, в основном, в сторону основного вопроса:
Мне приходит в голову, что есть потенциальные решения для конкретного случая экспоненциального * (и об этом придет в форму), но я все еще интересуюсь более общей проблемой влияния выбора границ бина.
* Например, для экспоненты можно использовать наименьшее наблюдение (скажем, оно равно ), чтобы получить очень грубое представление о том, где разместить ячейки (поскольку наименьшее наблюдение экспоненциально со средним значением µ / n ), а затем проверить оставшиеся n - 1 различия ( x i - m ) на экспоненциальность. Конечно, это может дать очень плохую оценку μи, следовательно, неудачный выбор бинов, хотя я полагаю, что можно использовать рекурсивный аргумент для того, чтобы взять два или три самых низких наблюдения, из которых можно выбрать разумные блоки, а затем проверить различия оставшихся наблюдений над самой большой из этих статистик наименьшего порядка для экспоненциальность)
источник
Ответы:
Основные результаты проверки на соответствие критерия хи-квадрат можно понять иерархически .
Уровень 0 . Классическая статистика критерия хи-квадрат Пирсона для проверки полиномиальной выборки с фиксированным вектором вероятности равна X 2 ( p ) = kp
Где Х ( п ) я обозначает число исходов в I - ю ячейку из выборки размера п . Это можно плодотворно рассматривать как квадратную норму вектора Y n = ( Y ( n ) 1 , … , Y ( n ) k ), где Y ( n
Уровень 1 . На следующем уровне иерархии мы рассматриваем сложные гипотезы с многочленными выборками. Поскольку интересующий нас точный неизвестен при нулевой гипотезе, мы должны оценить его. Если нулевая гипотеза является составной и состоит из линейного подпространства измерения m , то оценки максимального правдоподобия (или другие эффективные оценки) p i могут использоваться в качестве «подключаемых» оценок. Тогда статистика X 2 1 = k ∑ i = 1 (p m pi
При нулевой гипотезе.
Уровень 2 . Рассмотрим случай проверки пригодности параметрической модели, когда ячейки фиксированы и известны заранее: например, у нас есть выборка из экспоненциального распределения со скоростью и из этого мы получаем многочленовую выборку, разбивая ее на k ячеек, тогда вышеупомянутый результат остается в силе при условии, что мы используем эффективные оценки (например, MLE) самих вероятностей бина, используя только наблюдаемые частоты .λ k
Примерами могут служить статистика Рао-Робсон-Никулин и статистики Джапаридзе-Никулин .
References
A W. van der Vaart (1998), Asymptotic Statistics, Cambridge University Press. Chapter 17: Chi-Square Tests.
H. Chernoff and E. L. Lehmann (1954), The use of maximum likelihood estimates inχ2 tests for goodness of fit, Ann. Math. Statist., vol. 25, no. 3, 579–586.
F. C. Drost (1989), Generalized chi-square goodness-of-fit tests for location-scale models when the number of classes tends to infinity, Ann. Stat, vol. 17, no. 3, 1285–1300.
M. S. Nikulin, M.S. (1973), Chi-square test for continuous distribution with shift and scale parameters, Theory of Probability and its Application, vol. 19, no. 3, 559–568.
K. O. Dzaparidze and M. S. Nikulin (1973), On a modification of the standard statistics of Pearson, Theory of Probability and its Application, vol. 19, no. 4, 851–853.
K. C. Rao and D. S. Robson (1974), A chi-square statistic for goodness of fit tests within exponential family, Comm. Statist., vol 3., no. 12, 1139–1153.
N. Balakrishnan, V. Voinov and M. S. Nikulin (2013), Chi-Squared Goodness of Fit Tests With Applications, Academic Press.
источник
I've found at least partial answers to my question, below. (I'd still like to give someone that bonus, so any further information appreciated.)
Moore (1971) said that Roy (1956) and Watson (1957,58,59) showed that when the cell boundaries for a chi-square statistic are functions of best asymptotic normal estimated parameter values, then under certain conditions, the asymptotic null distribution of the chi-square statistic is still that of a sum of aχ2k−p−1 and a weighted
sum of p χ21 variables (for k cells, p parameters)
where the weights are between 0 and 1 (making the cdf of the
distribution between that of a χ2k−p and a χ2k , as alluded to in my question for the distribution when using ML estimation), and the weights on those last p terms are unaffected by that estimation.
References
Moore D.S. (1971), A Chi-Square Statistic with Random Cell Boundaries, Ann. Math. Stat., Vol 42, No 1, 147–156.
Roy A.R. (1956), Onχ2 statistics with variable intervals,
Technical Report No. 1, Dept of Statistics, Stanford University.
Watson, G.S. (1957), Theχ2 goodness-of-fit test for normal
distributions, Biometrika, 44, 336–348.
Watson, G.S. (1958), Onχ2 goodness-of-fit tests for
continuous distributions, J. Royal Statist. Soc. B, 20, 44–61.
Watson, G.S. (1959), Some recent results inχ2 goodness-of-
fit tests, Biometrics, 15, 440-468
источник