У меня есть следующие модели m_plot
снабжены lme4::lmer
со скрещенными случайными эффектами для участников ( lfdn
) и элементов ( content
):
Random effects:
Groups Name Variance Std.Dev. Corr
lfdn (Intercept) 172.173 13.121
role1 62.351 7.896 0.03
inference1 24.640 4.964 0.08 -0.30
inference2 52.366 7.236 -0.05 0.17 -0.83
inference3 21.295 4.615 -0.03 0.22 0.86 -0.77
content (Intercept) 23.872 4.886
role1 2.497 1.580 -1.00
inference1 18.929 4.351 0.52 -0.52
inference2 14.716 3.836 -0.16 0.16 -0.08
inference3 17.782 4.217 -0.17 0.17 0.25 -0.79
role1:inference1 9.041 3.007 0.10 -0.10 -0.10 -0.21 0.16
role1:inference2 5.968 2.443 -0.60 0.60 -0.11 0.78 -0.48 -0.50
role1:inference3 4.420 2.102 0.30 -0.30 0.05 -0.97 0.71 0.37 -0.90
Residual 553.987 23.537
Number of obs: 3480, groups: lfdn, 435 content, 20
Я хочу знать внутриклассные коэффициенты корреляции (ICC) для участников и предметов. Благодаря этому отличному ответу я в принципе знаю, как получить ICC для моей модели. Тем не менее, я не уверен, стоит ли включать случайные наклоны или нет:
vars <- lapply(summary(m_plot)$varcor, diag)
resid_var <- attr(summary(m_plot)$varcor, "sc")^2
total_var <- sum(sapply(vars, sum), resid_var)
# with random slopes
sapply(vars, sum)/total_var
## lfdn content
## 0.33822396 0.09880349
# only random intercepts:
sapply(vars, function(x) x[1]) / total_var
## lfdn.(Intercept) content.(Intercept)
## 0.17496587 0.02425948
Какова соответствующая мера для корреляции между двумя ответами одного и того же участника, относящимися к одному и тому же элементу?
Ответы:
По сути, нет единого числа или оценки, которые могли бы суммировать степень кластеризации в модели случайных уклонов.
Внутриклассовая корреляция (ICC) может быть записана только как простая пропорция отклонений в моделях только со случайными перехватами. Чтобы понять, почему, эскиз получения выражения ICC можно найти здесь .
Когда вы добавляете случайные наклоны в уравнение модели, выполнение тех же шагов приводит к выражению ICC на странице 5 этого документа . Как вы можете видеть, это сложное выражение является функцией предиктора X. Чтобы более интуитивно понять, почему var (Y) зависит от X при наличии случайных наклонов, ознакомьтесь со страницей 30 этих слайдов («Почему дисперсия зависит от x ? ") .
Поскольку ICC является функцией предикторов (значений x), он может быть вычислен только для определенных наборов значений x. Возможно, вы могли бы попробовать что-то вроде отчета ICC по общему среднему из значений x, но эта оценка будет явно неточной для большинства наблюдений.
Все, что я сказал, до сих пор относится только к случаям, когда есть один случайный фактор. С несколькими случайными факторами это становится еще сложнее. Например, в многосайтовом проекте, где участники на каждом сайте отвечают на выборку стимулов (т.е. 3 случайных фактора: сайт, участник, стимул), мы могли бы спросить о множестве различных ICC: какова ожидаемая корреляция между двумя ответами на том же сайте, к тому же стимулу, от разных участников? Как насчет разных сайтов, одинаковых стимулов и разных участников? И так далее. @rvl упоминает об этих сложностях в ответе, с которым связывается ОП.
Итак, как вы можете видеть, единственный случай, когда мы можем суммировать степень кластеризации с одним значением, это случай с случайным перехватом с одним случайным фактором. Поскольку это небольшая доля реальных случаев, ICC не так полезны большую часть времени. Поэтому моя общая рекомендация - не беспокоиться о них. Вместо этого я рекомендую просто сообщать о компонентах отклонения (предпочтительно в форме стандартного отклонения).
источник