У меня есть выборка данных, которые были сгенерированы из непрерывной случайной величины X. И из гистограммы, которую я рисую с использованием R, я предполагаю, что, возможно, распределение X подчиняется определенному гамма-распределению. Но я не знаю точных параметров этого гамма-распределения.
Мой вопрос заключается в том, как проверить, принадлежит ли распределение X к семейству гамма-распределений? Существуют некоторые критерии соответствия, такие как критерий Колмогорова-Смирнова, критерий Андерсона-Дарлинга и т. Д., Но одним из ограничений при использовании этих критериев является то, что параметры теоретического распределения должны быть известны заранее. Кто-нибудь, пожалуйста, скажите мне, как решить эту проблему?
Ответы:
Я думаю, что вопрос требует точного статистического теста, а не сравнения гистограмм. При использовании теста Колмогорова-Смирнова с оценочными параметрами распределение статистики теста при нулевом значении зависит от тестируемого распределения, в отличие от случая без оцениваемого параметра. Например, используя (в R)
приводит к
пока мы получаем
для того же образца х. Таким образом, уровень значимости или значение p должны быть определены с помощью моделирования Монте-Карло при нулевом значении, что дает распределение статистики Колмогорова-Смирнова по выборкам, моделируемым при расчетном распределении (с небольшим приближением в результате, учитывая, что наблюдаемая выборка приходит из другого дистрибутива, даже под нулевым).
источник
Вычислите MLE параметров, принимая гамма-распределение для ваших данных, и сравните теоретическую плотность с гистограммой ваших данных. Если они сильно различаются, распределение гаммы является плохим приближением ваших данных. Для формального теста вы можете вычислить, например, статистику теста Колмогорова-Смирнова, сравнивая наиболее подходящее гамма-распределение с эмпирическим распределением и проверкой на значимость.
источник