Пуассон с нулевым усечением и основной Пуассон являются вложенными или не вложенными?

9

Я видел множество статей, в которых обсуждается, является ли базовая регрессия Пуассона вложенной версией регрессии Пуассона с нулевым уровнем инфляции. Например, этот сайт утверждает, что это так, поскольку последний включает дополнительные параметры для моделирования дополнительных нулей, но в остальном включает те же параметры регрессии Пуассона, что и первый, хотя на странице есть ссылка, которая не согласна.

Я не могу найти информацию о том, являются ли вложенные Пуассоном с нулевым усечением и базовым Пуассоном. Если усеченный до нуля Пуассон - это всего лишь Пуассон с дополнительным условием, что вероятность нулевого счета равна нулю, то я думаю, это звучит так, как они могли бы быть, но я надеялся на более определенный ответ.

Мне интересно, что это повлияет на то, должен ли я использовать тест Вуонга (для не вложенных моделей) или более базовый критерий хи-квадрат, основанный на разнице в вероятности логарифмирования (для вложенных моделей).

Уилсон (2015) говорит о том, подходит ли тест Вуонга для сравнения регрессии с нулевой раздувкой с базовой, но я не могу найти источник, который обсуждает данные с нулевой усечением.

Джастин
источник

Ответы:

4

Просто столкнись с этим сейчас. Чтобы избежать путаницы, на меня ссылается Wilson of Wilson (2015) в исходном вопросе, который спрашивает, являются ли модели Пуассона и усеченного Пуассона вложенными, не вложенными и т. Д. Слегка упрощая, меньшая модель вкладывается в большую модель, если она больше модель сводится к меньшему, если подмножество ее параметров зафиксировано на заданных значениях; две модели перекрываются, если обе они сводятся к одной и той же модели, когда подмножества их соответствующих параметров фиксируются к определенным значениям, они не являются вложенными, если независимо от того, как фиксированы параметры, одно не может быть сведено к другому. Согласно этому определению усеченный Пуассон и стандартный Пуассон не являются вложенными. ОДНАКО, и это вопрос, который, как кажется, многие упускают из виду, теория распределения Вуонга относится к СТРОГО вложенным, СТРОГО не вложенным, и СТРОГО перекрытия. «СТРОГО» относится к добавлению шести ограничений к базовому определению вложенности и т. Д. Эти ограничения не совсем простые, но они, среди прочего, означают, что результаты Вуонга о распределении логарифмических правдоподобий неприменимы в случаях, когда модели / распределения вложены на границе пространства параметров (как в случае Пуассона / Пуассона с нулевым надуванием и тождественной связью для параметра с нулевой инфляцией) или когда одна модель стремится к другой, когда параметр стремится к бесконечности, как это случай Пуассона / Пуассона с нулевым надуванием, когда для моделирования параметра нулевого уровня используется ссылка логита. Vuong не выдвигает теорию о распределении логарифмических отношений правдоподобия в этих обстоятельствах. К сожалению, здесь

Следующий код R будет имитировать распределение коэффициентов логарифмического вероятности Пуассона и усеченного Пуассона. Требуется VGAMпакет.

n<-30   
lambda1<-1
H<-rep(999,10000)
for(i in 1:10000){
  print(i)
  y<-rpospois(n, lambda1)
  fit1 <- vglm(y ~ 1, pospoisson)
  fit2<-glm(y~1, family=poisson(link="log"))
  H[i]<-logLik(fit1)-logLik(fit2)
}

hist(H,col="lemonchiffon")
Pauljw11
источник
4

Основной Пуассон может рассматриваться как вложенный в более общую форму:

п(Икс)знак равно(1-п)е-λλИксИкс!+п1(Иксзнак равно0)

Когда , мы имеем основной Пуассон. Когда , мы имеем усеченный до нуля Пуассон. Когда , мы имеем Пуассона с нулевым приведением. Когда , мы имеем Пуассона, накаченного нулями, и мы имеем вырожденное распределение при .пзнак равно0пзнак равно-ехр{-λ}/(1-ехр{-λ})-ехр{-λ}/(1-ехр{-λ})<п<00<п<1пзнак равно1

Поэтому мне кажется, что вложенная версия теста Вуонга или хи-квадрат, как вы предлагаете, была бы уместна в вашем случае. Обратите внимание, однако, что хи-квадрат может иметь проблемы из-за малых вероятностей "больших" (относительно ) наблюдений. Вы, вероятно, захотите использовать загрузчик, чтобы получить значение p для статистики хи-квадрат, вместо того, чтобы полагаться на асимптотику, если у вас не достаточно много данных.λ

jbowman
источник
Спасибо @jbowman - вот такой более строгий ответ, на который я надеялся. Мне неясно, хотя: я думал, что весь смысл теста Vuong был для не вложенных моделей, поэтому, даже если он выходит за рамки моего первоначального поста, не могли бы вы предоставить немного больше информации о «вложенной версии теста Vuong». Чтобы прояснить источник моей путаницы: до этого момента я знал только о vuongфункции в пакете psclв R, которая говорит, что она предназначена для не вложенных моделей. Я только что гуглил и нашел функцию vuongtestв пакете, nonnest2которая включает в себя аргумент «вложенный». Это оно?
Джастин
Да, это так. На самом деле, страница Википедии en.wikipedia.org/wiki/Vuong%27s_closeness_test, посвященная тесту Vuong, в некоторой степени полезна (часто не так сильно) для описания различий.
jbowman
1
NB. И Пуассон, и Пуассон с нулевым усечением являются особыми случаями распределения, которое вы определили. Одно не вложено в другое. Таким образом, вы не можете использовать теорему Уилкса, чтобы получить асимптотическое распределение хи-квадрат для двойного логарифмического отношения правдоподобия, что бы вы ни считали нулевой гипотезой. (Я думаю, что есть некоторые условия регулярности для теста
Вуонга
3
пзнак равно0пп
2
@whuber, я собирался прокомментировать / дать ответ на ту же тему. Ссылка ссылка делает примечание: «... хотя распределению хи-квадрат может потребоваться некоторая корректировка , поскольку ограничение на границе пространства параметров»
Бен Bolker