Пуассон против логистической регрессии

13

У меня есть когорта пациентов с разной продолжительностью наблюдения. Пока что я не обращаю внимания на временной аспект, и мне просто нужно смоделировать бинарный исход - болезнь / нет болезни. Я обычно делаю логистическую регрессию в этих исследованиях, но другой мой коллега спросил, будет ли регрессия Пуассона такой же уместной. Я не настолько увлечен пуассоном и оставался неуверенным относительно того, какие преимущества и недостатки выполнения пуассона в этой ситуации будут сравниваться с логистической регрессией. Я прочитал регрессию Пуассона, чтобы оценить относительный риск для бинарных исходов, и я все еще не уверен относительно преимуществ регрессии Пуассона в этой ситуации.

Миша
источник

Ответы:

8

Одним из решений этой проблемы является допущение, что количество событий (например, вспышек) пропорционально времени. Если вы обозначите индивидуальный уровень воздействия (продолжительность наблюдения в вашем случае) через , то E [ y | х ]tЗдесь последующее наблюдение, которое вдвое длиннее, удвоит ожидаемый счет, при прочих равных условиях. Это может быть алгебраически эквивалентно модели, гдеE[y| x]=exp{xβ+logt},которая является просто моделью Пуассона с коэффициентом наlogt,ограниченным1. Вы также можете проверить предположение о пропорциональности, ослабив ограничение и проверив гипотезу, чтоβlogE[y|x]t=exp{xβ}.E[y|x]=exp{xβ+logt},logt1.βlog(t)=1

Однако это не похоже на то, что вы наблюдаете количество событий, поскольку ваш результат является двоичным (или, возможно, он не имеет смысла, учитывая вашу болезнь). Это заставляет меня полагать, что логистическая модель с логарифмическим смещением была бы более подходящей здесь.

Димитрий Васильевич Мастеров
источник
0

Этот набор данных звучит как набор данных человеко-лет, результатом является событие (это правильно?) И неравномерное отслеживание до события. В этом случае это звучит как когортное исследование какого-то рода (при условии, что я понял, что именно исследуется), и, таким образом, может быть оправдана либо регрессия Пуассона, либо анализ выживания (регрессия пропорционально-пропорциональных рисков Каплана-Мейера и Кокса).

никола
источник
Разве ответ не будет больше похож на биномиальный, чем Пуассона?
Секст Эмпирик
Верно, но набор данных ответа 0/1 (биномиальный) можно превратить в набор данных подсчета. По сути, вы разбиваетесь на группы / слои по предикторам, а затем суммируете количество событий и отдельно количество человеко-лет. Время до события (данные о выживаемости) можно анализировать как данные о выживаемости или подсчете. Более простым вариантом часто является анализ выживаемости.
Николас
Разве это не похоже на превращение набора данных ответа 0/1 (Бернулли) в набор данных подсчета. В итоге вы получите только распределение / процесс Пуассона путем аппроксимации биномиального распределения (для конечного размера когорты).
Секст Эмпирик
@NicolasSmoll "Верно, но набор данных ответа 0/1 (биномиальный) можно превратить в набор данных подсчета." Как это сделать?
vasili111