При моделировании данных подсчета претензий в страховой среде я начал с Пуассона, но затем заметил чрезмерную дисперсию. Квази-Пуассон лучше моделировал большее отношение средней дисперсии, чем основной Пуассон, но я заметил, что коэффициенты были идентичны как в модели Пуассона, так и в модели Квази-Пуассона.
Если это не ошибка, почему это происходит? В чем преимущество использования квази-пуассона над пуассоном?
Что следует отметить:
- Основные потери превышены, что (я считаю) не позволило работать Tweedie - но это был первый дистрибутив, который я попробовал. Я также исследовал модели NB, ZIP, ZINB и Hurdle, но все же обнаружил, что Quasi-Poisson обеспечивает наилучшее соответствие.
- Я проверил на чрезмерную дисперсию через дисперсию в пакете AER. Мой дисперсионный параметр составлял примерно 8,4 с p-величиной в 10 ^ -16 величины.
- Я использую glm () с family = poisson или quasipoisson и ссылку на журнал для кода.
- При запуске кода Пуассона я получаю предупреждения «In dpois (y, mu, log = TRUE): нецелое число x = ...».
Полезные темы SE в соответствии с руководством Бена:
counts/exposure
. Скорее, вы должны добавить смещение (offset(log(exposure))
) термин для ваших моделей.Ответы:
источник