Бета-регрессия (т. Е. GLM с бета-распределением и, как правило, функцией логит-линка) часто рекомендуется для работы с зависимостью, называемой зависимой переменной, принимающей значения от 0 до 1, такие как дроби, соотношения или вероятности: регрессия для результата (соотношение или дробь) между 0 и 1 .
Однако всегда утверждается, что бета-регрессия не может использоваться, как только переменная отклика равна 0 или 1 хотя бы один раз. Если это так, нужно либо использовать бета-модель с нулевым / единичным инфляцией, либо провести некоторую трансформацию ответа и т. Д. Бета-регрессия данных о пропорциях, включая 1 и 0 .
Мой вопрос: какое свойство бета-распределения не позволяет бета-регрессии иметь дело с точными нулями и единицами и почему?
Я предполагаю, что и не поддерживают бета-дистрибутив. Но для всех параметров формы и , как ноль и один находятся в поддержке бета - распределения, это только для небольших параметров формы , что распределение обращается в бесконечность в одной или обеих сторон. И, возможно, пример данных таков, что и обеспечивающие наилучшее соответствие, окажутся выше .
Означает ли это, что в некоторых случаях один можно использовать бета-регрессию даже с нулями / единицами?
Конечно, даже когда 0 и 1 поддерживают бета-распределение, вероятность наблюдения точно 0 или 1 равна нулю. Но так же как и вероятность наблюдать любой другой заданный счетный набор значений, так что это не может быть проблемой, не так ли? (См. Этот комментарий @Glen_b).
В контексте бета-регрессии бета-распределение параметризовано по-разному, но при оно все равно должно быть четко определено на [ 0 , 1 ] для всех μ .
источник
Ответы:
Потому что логоподобие содержит как и log ( 1 - x ) , которые не ограничены, когда x = 0 или x = 1 . См. Уравнение (4) Smithson & Verkuilen, « Лучшая соковыжималка для лимона? Регрессия максимального правдоподобия с бета-распределенными зависимыми переменными » (прямая ссылка на PDF ).log(x) log(1−x) x=0 x=1
источник
В результате, в моем понимании бета-регрессии, 0 и 1 будут интуитивно соответствовать (бесконечным) точным результатам.
источник