У меня есть порядковая зависимая переменная, легкость, которая варьируется от 1 (не просто) до 5 (очень легко). Увеличение значений независимых факторов связано с повышением рейтинга легкости.
Две из моих независимых переменных ( condA
и condB
) являются категориальными, каждая с 2 уровнями, а 2 ( abilityA
, abilityB
) - непрерывными.
Я использую порядковый пакет в R, где он использует то, что я считаю
(из ответа @ caracal здесь )
Я изучал это независимо и был бы признателен за любую возможную помощь, поскольку я все еще борюсь с этим. В дополнение к учебным пособиям, прилагаемым к порядковому пакету, я также считаю полезным следующее:
- Интерпретация порядковой логистической регрессии
- Отрицательный коэффициент в упорядоченной логистической регрессии
Но я пытаюсь интерпретировать результаты, соединяю разные ресурсы и застреваю.
Я прочитал много разных объяснений, как абстрактных, так и прикладных, но мне все еще трудно понять, что значит сказать:
При увеличении condB на 1 единицу (т. Е. При переходе от одного уровня к следующему категориального предиктора) прогнозируемые шансы наблюдения Y = 5 по сравнению с Y = 1–4 (а также прогнозируемые шансы наблюдаемого Y = 4 по сравнению с Y = от 1 до 3) изменяется с коэффициентом exp (бета), который для диаграммы равен exp (0,457) = 1,58.
а. Отличается ли это для категориальных и непрерывных независимых переменных?
б. Часть моих трудностей может быть связана с идеей кумулятивных шансов и этими сравнениями. ... Справедливо ли говорить, что переход от condA = отсутствует (референтный уровень) к condA = присутствует в 1,58 раза больше шансов получить более высокий уровень легкости? Я почти уверен, что это НЕ правильно, но я не уверен, как правильно это сформулировать.
Графически:
1. Реализуя код в этом посте , я не понимаю, почему результирующие значения «вероятности» так велики.
2. График p (Y = g) в этом посте имеет наибольшее значение для меня ... с интерпретацией вероятности наблюдения определенной категории Y при определенном значении X. Причину, по которой я пытаюсь получить график в первую очередь предназначен для лучшего понимания результатов в целом.
Вот вывод из моей модели:
m1c2 <- clmm (easiness ~ condA + condB + abilityA + abilityB + (1|content) + (1|ID),
data = d, na.action = na.omit)
summary(m1c2)
Cumulative Link Mixed Model fitted with the Laplace approximation
formula:
easiness ~ illus2 + dx2 + abilEM_obli + valueEM_obli + (1 | content) + (1 | ID)
data: d
link threshold nobs logLik AIC niter max.grad
logit flexible 366 -468.44 956.88 729(3615) 4.36e-04
cond.H
4.5e+01
Random effects:
Groups Name Variance Std.Dev.
ID (Intercept) 2.90 1.70
content (Intercept) 0.24 0.49
Number of groups: ID 92, content 4
Coefficients:
Estimate Std. Error z value Pr(>|z|)
condA 0.681 0.213 3.20 0.0014 **
condB 0.457 0.211 2.17 0.0303 *
abilityA 1.148 0.255 4.51 6.5e-06 ***
abilityB 0.577 0.247 2.34 0.0195 *
Threshold coefficients:
Estimate Std. Error z value
1|2 -3.500 0.438 -7.99
2|3 -1.545 0.378 -4.08
3|4 0.193 0.366 0.53
4|5 2.121 0.385 5.50
Ответы:
В примечаниях к курсу « Мои стратегии регрессионного моделирования» есть две главы, посвященные порядковой регрессии, которые могут помочь. Смотрите также этот урок.
В заметках курса подробно рассказывается о том, что означают предположения модели, как они проверяются и как интерпретировать подобранную модель.
источник