Почему именно бета-регрессия не может иметь дело с 0 и 1 в переменной ответа?

17

Бета-регрессия (т. Е. GLM с бета-распределением и, как правило, функцией логит-линка) часто рекомендуется для работы с зависимостью, называемой зависимой переменной, принимающей значения от 0 до 1, такие как дроби, соотношения или вероятности: регрессия для результата (соотношение или дробь) между 0 и 1 .

Однако всегда утверждается, что бета-регрессия не может использоваться, как только переменная отклика равна 0 или 1 хотя бы один раз. Если это так, нужно либо использовать бета-модель с нулевым / единичным инфляцией, либо провести некоторую трансформацию ответа и т. Д. Бета-регрессия данных о пропорциях, включая 1 и 0 .

Мой вопрос: какое свойство бета-распределения не позволяет бета-регрессии иметь дело с точными нулями и единицами и почему?

Я предполагаю, что и не поддерживают бета-дистрибутив. Но для всех параметров формы и , как ноль и один находятся в поддержке бета - распределения, это только для небольших параметров формы , что распределение обращается в бесконечность в одной или обеих сторон. И, возможно, пример данных таков, что и обеспечивающие наилучшее соответствие, окажутся выше01α>1β>1αβ1 .

Означает ли это, что в некоторых случаях один можно использовать бета-регрессию даже с нулями / единицами?

Конечно, даже когда 0 и 1 поддерживают бета-распределение, вероятность наблюдения точно 0 или 1 равна нулю. Но так же как и вероятность наблюдать любой другой заданный счетный набор значений, так что это не может быть проблемой, не так ли? (См. Этот комментарий @Glen_b).

бета-распределение

В контексте бета-регрессии бета-распределение параметризовано по-разному, но при оно все равно должно быть четко определено на [ 0 , 1 ] для всех μ .ϕ=α+β>2[0,1]μ

введите описание изображения здесь

амеба говорит восстановить монику
источник
2
Интересный вопрос! У меня нет ответа, кроме того, что уже высказал Кевин Райт. Я предполагаю, что точные нули и единицы в вероятностях являются патологическими случаями (как в логистической регрессии), поэтому не так интересны, так как они не должны происходить.
Тим
1
@Tim Ну, я не знаю, должно ли это происходить или не должно происходить, но это случается довольно часто, иначе люди не задавали бы вопросы о том, как обращаться с 0 и 1 в бета-регрессии, не писали бы статьи о 0- и-1 завышенные бета-модели и т. д. В любом случае, я все еще надеюсь на более подробный ответ, чем на Кевина. Следует хотя бы объяснить, как возникают эти термины в логарифмической вероятности.
говорит амеба, восстанови Монику
1
Обновление: это возможно потому, что если 0 и 1 находятся в поддержке, то PDF в этих точках равен нулю, что означает, что вероятность наблюдения этих значений равна нулю. Я все еще хотел бы видеть ответ, объясняющий это тщательно.
говорит амеба, восстанови Монику
Итак, какое распределение следует использовать тогда, когда переменная ответа принимает значения, скажем, в ? [0,)
Смущен

Ответы:

16

Потому что логоподобие содержит как и log ( 1 - x ) , которые не ограничены, когда x = 0 или x = 1 . См. Уравнение (4) Smithson & Verkuilen, « Лучшая соковыжималка для лимона? Регрессия максимального правдоподобия с бета-распределенными зависимыми переменными » (прямая ссылка на PDF ).log(x)log(1x)x=0x=1

Кевин Райт
источник
3
Благодарю. Вот прямая PDF-ссылка на статью . Я вижу, что уравнение (4) сломается, как только или y i = 1 , но я все еще не понимаю, почему это происходит в общей схеме вещей. yi=0yi=1
говорит амеба, восстанови Монику
3
(+1) Амеба, просто посмотрите в pdf: для каждого бета-распределения плотности в и 1 равны 0 или + . В любом случае вероятность регистрации будет неопределенной. Эквивалентно, как только есть один ответ 0 или 1 , все значения вероятности могут быть только нулем, бесконечностью или неопределенными, и будет нетривиальный набор бета-параметров, для которых реализуется минимальное значение вероятности. Таким образом, практический расчет исключается, и модель не может быть идентифицирована (в строгом смысле). 010+01
uuber
1
01
1
00.5α=β=20.500.50
3
@amoeba Вероятность зависит от плотности вероятности , а не от самой вероятности. Иногда можно избежать этой проблемы, рассматривая каждое наблюдение как включающее вероятность крошечного, но конечного (не бесконечно малого) интервала (определяемого, например , точностью измерения), или сворачивая бета-распределения с очень узким гауссианом ( который устраняет нулевую и бесконечную плотности).
whuber
2

log(x)log(1x) , я постараюсь дополнить ответ на вопрос, пытаясь сформулировать основную причину, по которой это происходит.

pN

В результате, в моем понимании бета-регрессии, 0 и 1 будут интуитивно соответствовать (бесконечным) точным результатам.

meduz
источник