У меня есть проблема регрессии, когда результаты не строго 0, 1, а скорее в диапазоне всех действительных чисел от 0 до 1, включая .
Эта проблема уже обсуждалась в этой теме , хотя мой вопрос немного отличается.
Я не могу использовать линейную регрессию по тем же причинам, что обычно используется логистическая регрессия. В линейной регрессии A) очень большие значения IV сместят прогнозируемый результат до 1 и B) результат линейной регрессии не ограничен пределами 0,1.
Глядя на эту функцию логистической стоимости из моего учебника я понимаю, что уравнение предназначено для расчета стоимость больше 0, только если и x не имеют одинаковое значение 0 или 1.
Можно ли использовать логистическую регрессию, изменив функцию стоимости для измерения всех ошибок гипотез?
источник
glm()
функция в R делает, когда он получает непрерывный ответ иfamily=quasibinomial
? Т.е. он будет оценивать коэффициенты с,family=binomial
а затем, на дополнительном этапе, вычислять стандартные ошибки с учетом чрезмерной дисперсии? Если да, это то же самое, что вычисление «устойчивых стандартных ошибок»? У меня есть некоторые соответствующие данные, и я попробовал обе семьи сglm
; Я получаю одинаковые коэффициенты, но разные стандартные ошибки. Спасибо.Когда Y ограничен, бета-регрессия часто имеет смысл; см. статью «Лучшая соковыжималка для лимона»
Это учитывает эффекты пола и потолка; это также позволяет моделировать дисперсию и среднее значение.
источник
Поскольку у не строго ноль или одна (как вы сказали) стоимость всегда должна быть больше нуля. Так что я не думаю, что вам нужна модификация в модели.
источник
Я предлагаю две альтернативные модели:
Если ваши результаты (переменные y) упорядочены, попробуйте модель Ordered Probit.
Если ваши результаты (переменные y) не упорядочены, попробуйте модель Multinomial Logit.
источник