Интерпретация логрансформированных предикторов в логистической регрессии
15
Один из предикторов в моей логистической модели был преобразован в лог. Как вы интерпретируете оценочный коэффициент логарифмического предиктора и как рассчитываете влияние этого предиктора на отношение шансов?
Очень четкое и всестороннее рассмотрение этого вопроса - ответ Джтезел
rolando2
Спасибо за вашу помощь. Дальнейшее уточнение. На самом деле, если я преобразую в лог-базу 2 - тогда, как и в предыдущем ответе, интуитивно понятно, что удвоение предиктора приводит к изменению на 10% в результате.
mp77
Ответы:
16
Если вы возведете в степень предполагаемый коэффициент, вы получите коэффициент шансов, связанный с кратным увеличениемb предиктора, где - это основание логарифма, который вы использовали при лог-преобразовании предиктора.b
В этой ситуации я обычно выбираю логарифмы для основания 2, поэтому я могу интерпретировать возведенный в степень коэффициент как отношение шансов, связанных с удвоением предиктора.
Интересный. Я всегда использую натуральные логарифмы, потому что многие коэффициенты имеют тенденцию быть близкими к нулю, а затем могут быть интерпретированы как пропорциональные (относительные) различия. Это невозможно в любой другой базе логарифма. Я вижу некоторые преимущества в использовании других основ, но я думаю, что вам нужно уточнить ваш ответ, потому что prima facie ваша интерпретация не использует значение коэффициента вообще!
whuber
@whuber извините, что означает prima facie ? Первое лицо ??
@gung совершенно правильно, но, в случае , если вы действительно решили сохранить его, вы можете интерпретировать коэффициент имеет оказывает влияние на каждом кратном на IV, а не каждое добавление в IV.
Один IV, который часто должен быть преобразован, является доходом. Если вы включите его без преобразования, то каждое (скажем) увеличение дохода на 1000 долларов будет влиять на коэффициент шансов, как указано в коэффициенте шансов. С другой стороны, если вы взяли log (10) дохода, то каждое 10-кратное увеличение дохода будет влиять на коэффициент шансов, указанный в коэффициенте шансов.
Имеет смысл сделать это ради дохода, потому что во многих случаях увеличение дохода на 1000 долларов намного больше для того, кто зарабатывает 10000 долларов в год, чем для того, кто зарабатывает 100 тысяч долларов .
Последнее замечание - хотя логистическая регрессия не делает предположений о нормальности, даже регрессия OLS не делает предположений о переменных, она делает предположения об ошибке, оцениваемой по остаточным значениям.
+1, хорошие очки. Я полагаю, я мог бы быть более полным. Кроме того, я отключил непреднамеренный mathjax, поставив обратную косую черту "\" непосредственно перед знаками доллара. Надеюсь, ты не против.
gung - Восстановить Монику
Что вы подразумеваете под «логистической регрессией, делающей предположение об ошибках»?
Нет, регрессия OLS делает предположения об ошибках. Это то, что я сказал.
Питер Флом - Восстановить Монику
3
Этот ответ адаптирован из «Статистической сыпи» Фреда Л. Рамси и Даниэля В. Шафера.
Если ваше модельное уравнение имеет вид:
л о г( p / ( 1 - p ) ) = β0+ βл о г( Х)
Тогда каждый Ккратное увеличение Икс связано с изменением коэффициентов мультипликативным коэффициентом Кβ,
Например, у меня есть следующая модель присутствия пролежней, регрессированных по продолжительности пребывания в больнице.
л о г( о дdS O Fб е ды о т е ) = - 0,44 + 0,45 ( л е н гт ч о еstay)
So my β=0.45.
You can choose any k, based on what's works best for your model's interpretability.
I decide that k=2 and get the following:
kβ=20.45=1.37
Each doubling (k=2) of the length of stay is associated with a change in the odds of getting a bedsore by a factor of 1.37. Or if you double my length of stay, my odds of getting a bedsore will be 137% what they would have been otherwise.
Or if you decide k=0.5.
kβ=0.50.45=0.73
Each halving (k=0.5) of the length of stay is associated with a change in the odds of getting a bedsore by a factor of .73. Or if you cut my length of stay in half, my odds of getting a bedsore will only 73% of what they would have been otherwise.
Ответы:
Если вы возведете в степень предполагаемый коэффициент, вы получите коэффициент шансов, связанный с кратным увеличениемb предиктора, где - это основание логарифма, который вы использовали при лог-преобразовании предиктора.b
В этой ситуации я обычно выбираю логарифмы для основания 2, поэтому я могу интерпретировать возведенный в степень коэффициент как отношение шансов, связанных с удвоением предиктора.
источник
@gung совершенно правильно, но, в случае , если вы действительно решили сохранить его, вы можете интерпретировать коэффициент имеет оказывает влияние на каждом кратном на IV, а не каждое добавление в IV.
Один IV, который часто должен быть преобразован, является доходом. Если вы включите его без преобразования, то каждое (скажем) увеличение дохода на 1000 долларов будет влиять на коэффициент шансов, как указано в коэффициенте шансов. С другой стороны, если вы взяли log (10) дохода, то каждое 10-кратное увеличение дохода будет влиять на коэффициент шансов, указанный в коэффициенте шансов.
Имеет смысл сделать это ради дохода, потому что во многих случаях увеличение дохода на 1000 долларов намного больше для того, кто зарабатывает 10000 долларов в год, чем для того, кто зарабатывает 100 тысяч долларов .
Последнее замечание - хотя логистическая регрессия не делает предположений о нормальности, даже регрессия OLS не делает предположений о переменных, она делает предположения об ошибке, оцениваемой по остаточным значениям.
источник
Этот ответ адаптирован из «Статистической сыпи» Фреда Л. Рамси и Даниэля В. Шафера.
Если ваше модельное уравнение имеет вид:
Тогда каждыйК кратное увеличение Икс связано с изменением коэффициентов мультипликативным коэффициентом Кβ ,
Например, у меня есть следующая модель присутствия пролежней, регрессированных по продолжительности пребывания в больнице.
So myβ=0.45 .
You can choose anyk , based on what's works best for your model's interpretability.
I decide thatk=2 and get the following:
Each doubling (k=2 ) of the length of stay is associated with a change in the odds of getting a bedsore by a factor of 1.37. Or if you double my length of stay, my odds of getting a bedsore will be 137% what they would have been otherwise.
Or if you decidek=0.5 .
Each halving (k=0.5 ) of the length of stay is associated with a change in the odds of getting a bedsore by a factor of .73. Or if you cut my length of stay in half, my odds of getting a bedsore will only 73% of what they would have been otherwise.
источник