Сюжет и интерпретация порядковой логистической регрессии

19

У меня есть порядковая зависимая переменная, легкость, которая варьируется от 1 (не просто) до 5 (очень легко). Увеличение значений независимых факторов связано с повышением рейтинга легкости.

Две из моих независимых переменных ( condAи condB) являются категориальными, каждая с 2 уровнями, а 2 ( abilityA, abilityB) - непрерывными.

Я использую порядковый пакет в R, где он использует то, что я считаю

logit(p(Yg))=lnp(Yg)p(Y>g)=β0g(β1X1++βpXp)(g=1,,k1)

(из ответа @ caracal здесь )

Я изучал это независимо и был бы признателен за любую возможную помощь, поскольку я все еще борюсь с этим. В дополнение к учебным пособиям, прилагаемым к порядковому пакету, я также считаю полезным следующее:

Но я пытаюсь интерпретировать результаты, соединяю разные ресурсы и застреваю.

  1. Я прочитал много разных объяснений, как абстрактных, так и прикладных, но мне все еще трудно понять, что значит сказать:

    При увеличении condB на 1 единицу (т. Е. При переходе от одного уровня к следующему категориального предиктора) прогнозируемые шансы наблюдения Y = 5 по сравнению с Y = 1–4 (а также прогнозируемые шансы наблюдаемого Y = 4 по сравнению с Y = от 1 до 3) изменяется с коэффициентом exp (бета), который для диаграммы равен exp (0,457) = 1,58.

    а. Отличается ли это для категориальных и непрерывных независимых переменных?
    б. Часть моих трудностей может быть связана с идеей кумулятивных шансов и этими сравнениями. ... Справедливо ли говорить, что переход от condA = отсутствует (референтный уровень) к condA = присутствует в 1,58 раза больше шансов получить более высокий уровень легкости? Я почти уверен, что это НЕ правильно, но я не уверен, как правильно это сформулировать.

Графически:
1. Реализуя код в этом посте , я не понимаю, почему результирующие значения «вероятности» так велики.
2. График p (Y = g) в этом посте имеет наибольшее значение для меня ... с интерпретацией вероятности наблюдения определенной категории Y при определенном значении X. Причину, по которой я пытаюсь получить график в первую очередь предназначен для лучшего понимания результатов в целом.

Вот вывод из моей модели:

m1c2 <- clmm (easiness ~ condA + condB + abilityA + abilityB + (1|content) + (1|ID), 
              data = d, na.action = na.omit)
summary(m1c2)
Cumulative Link Mixed Model fitted with the Laplace approximation

formula: 
easiness ~ illus2 + dx2 + abilEM_obli + valueEM_obli + (1 | content) +  (1 | ID)
data:    d

link  threshold nobs logLik  AIC    niter     max.grad
logit flexible  366  -468.44 956.88 729(3615) 4.36e-04
cond.H 
4.5e+01

Random effects:
 Groups  Name        Variance Std.Dev.
 ID      (Intercept) 2.90     1.70    
 content  (Intercept) 0.24     0.49    
Number of groups:  ID 92,  content 4 

Coefficients:
                Estimate Std. Error z value Pr(>|z|)    
condA              0.681      0.213    3.20   0.0014 ** 
condB              0.457      0.211    2.17   0.0303 *  
abilityA           1.148      0.255    4.51  6.5e-06 ***
abilityB           0.577      0.247    2.34   0.0195 *  

Threshold coefficients:
    Estimate Std. Error z value
1|2   -3.500      0.438   -7.99
2|3   -1.545      0.378   -4.08
3|4    0.193      0.366    0.53
4|5    2.121      0.385    5.50
JC7
источник
4
+1, приятно видеть такой хорошо проработанный и сформулированный вопрос. Добро пожаловать в резюме.
gung - Восстановить Монику

Ответы:

2

В примечаниях к курсу « Мои стратегии регрессионного моделирования» есть две главы, посвященные порядковой регрессии, которые могут помочь. Смотрите также этот урок.

В заметках курса подробно рассказывается о том, что означают предположения модели, как они проверяются и как интерпретировать подобранную модель.

Фрэнк Харрелл
источник
Готово - спасибо за предупреждение
Фрэнк Харрелл