Я провел эту порядковую логистическую регрессию в R:
mtcars_ordinal <- polr(as.factor(carb) ~ mpg, mtcars)
Я получил это резюме модели:
summary(mtcars_ordinal)
Re-fitting to get Hessian
Call:
polr(formula = as.factor(carb) ~ mpg, data = mtcars)
Coefficients:
Value Std. Error t value
mpg -0.2335 0.06855 -3.406
Intercepts:
Value Std. Error t value
1|2 -6.4706 1.6443 -3.9352
2|3 -4.4158 1.3634 -3.2388
3|4 -3.8508 1.3087 -2.9425
4|6 -1.2829 1.3254 -0.9679
6|8 -0.5544 1.5018 -0.3692
Residual Deviance: 81.36633
AIC: 93.36633
Я могу получить логарифм коэффициента для mpg
этого:
exp(coef(mtcars_ordinal))
mpg
0.7917679
А логарифмические шансы на пороги:
exp(mtcars_ordinal$zeta)
1|2 2|3 3|4 4|6 6|8
0.001548286 0.012084834 0.021262900 0.277242397 0.574406353
Может ли кто-нибудь сказать мне, если моя интерпретация этой модели верна:
При
mpg
увеличении на одну единицу вероятность перехода из категории 1carb
в любую из других 5 категорий уменьшается на -0,23. Если логарифм пересекает порог 0,0015, то прогнозируемое значение для автомобиля будет категории 2 изcarb
. Если логарифм пересекает порог 0,0121, то прогнозируемое значение для автомобиля будет категории 3carb
и так далее.
mpg
polr
определяет модель какlogit P(Y <= k | x) = zeta_k - eta
, если интерпретация @ StasK не гласит: «Приmpg
увеличении на одну единицу шансы наблюдения категории 1carb
против других 5 категорий возрастут на 26% (exp(-(-0.2335)) = 1.26
)».В упорядоченной логит-модели шансы формируют отношение вероятности нахождения в любой категории ниже определенного порога к вероятности нахождения в категории выше того же порога (например, с тремя категориями: вероятность нахождения в категории A или B против .C, а также вероятность быть в категории A против B или C).
Это приводит к модели,
logit P(Y <= k | x) = zeta_k - eta
как указано в описанииpolr()
. Следовательно, отношения шансов могут быть построены либо для разных категорий, либо для разных регрессоров. Последний, более распространенный, сравнивает шансы для тех же категорий, но разных регрессоров и равенСоотношение шансов для разных категорий определяется как
при этом отношение не зависит от регрессоров. Это свойство приводит к альтернативному названию модели пропорциональных шансов.
В этом простом, но, возможно, не очень интуитивном примере вы могли бы сформулировать: для увеличения регрессора на одну единицу
mpg
шансы наблюдения категории 1 по сравнению с наблюдением любой более высокой категории (или шансы наблюдения любой категории ниже определенного порога по сравнению с соблюдение любой категории выше того же порога) умножается на 1,26 или увеличивается на 26% (exp(-(-0.233 - 0)) = 1.263
). Если вы хотите сформулировать соотношение шансов для разных категорий, вы можете, например, сказать, что шансы на то, чтобы быть в категории 1, против любой категории выше, по сравнению с шансами на то, чтобы быть в категории 1 или 2, против любой категории выше, равныexp((-6.470) - (-4.415)) = 0.128
. При этом последняя интерпретация не очень полезна в этой конкретной ситуации. Примером отношения шансов для разных категорий могут быть шансы на поступление в колледж по сравнению с шансами на поступление в старшую школу.источник