Можно ли использовать распределение Пуассона для анализа как непрерывных, так и дискретных данных?
У меня есть несколько наборов данных, в которых переменные ответа являются непрерывными, но напоминают распределение Пуассона, а не нормальное распределение. Однако распределение Пуассона является дискретным распределением и обычно связано с числами или счетами.
Ответы:
Ключевым допущением обобщенной линейной модели, которая здесь уместна, является связь между дисперсией и средним значением отклика, учитывая значения предикторов. Когда вы указываете распределение Пуассона, это означает, что вы предполагаете, что условная дисперсия равна условному среднему значению. * Фактическая форма распределения не имеет большого значения: это может быть Пуассон, или гамма, или нормальное, или что-нибудь еще, пока эти отношения средней дисперсии сохраняются.
* Вы можете ослабить предположение, что дисперсия равна среднему значению пропорциональности, и все же обычно получать хорошие результаты.
источник
Если вы говорите об использовании отклика Пуассона в обобщенной линейной модели, то да, если вы хотите сделать предположение, что дисперсия каждого наблюдения равна его среднему значению.
Если вы не хотите этого делать, другой альтернативой может быть преобразование ответа (например, регистрация логов).
источник
quasipoisson
семью вglm
.log
преобразование работало бы, зачем дискретизировать ваши данные? Использованиеglm
работает, но каждый результат основан на асимптотике (которая может или не может иметь место)