Коэффициент внутриклассовой корреляции в смешанной модели со случайными наклонами

10

У меня есть следующие модели m_plotснабжены lme4::lmerсо скрещенными случайными эффектами для участников ( lfdn) и элементов ( content):

Random effects:
 Groups   Name             Variance Std.Dev. Corr                                     
 lfdn     (Intercept)      172.173  13.121                                            
          role1             62.351   7.896    0.03                                    
          inference1        24.640   4.964    0.08 -0.30                              
          inference2        52.366   7.236   -0.05  0.17 -0.83                        
          inference3        21.295   4.615   -0.03  0.22  0.86 -0.77                  
 content  (Intercept)       23.872   4.886                                            
          role1              2.497   1.580   -1.00                                    
          inference1        18.929   4.351    0.52 -0.52                              
          inference2        14.716   3.836   -0.16  0.16 -0.08                        
          inference3        17.782   4.217   -0.17  0.17  0.25 -0.79                  
          role1:inference1   9.041   3.007    0.10 -0.10 -0.10 -0.21  0.16            
          role1:inference2   5.968   2.443   -0.60  0.60 -0.11  0.78 -0.48 -0.50      
          role1:inference3   4.420   2.102    0.30 -0.30  0.05 -0.97  0.71  0.37 -0.90
 Residual                  553.987  23.537                                            
Number of obs: 3480, groups:  lfdn, 435 content, 20

Я хочу знать внутриклассные коэффициенты корреляции (ICC) для участников и предметов. Благодаря этому отличному ответу я в принципе знаю, как получить ICC для моей модели. Тем не менее, я не уверен, стоит ли включать случайные наклоны или нет:

vars <- lapply(summary(m_plot)$varcor, diag)
resid_var <- attr(summary(m_plot)$varcor, "sc")^2
total_var <- sum(sapply(vars, sum), resid_var)

# with random slopes
sapply(vars, sum)/total_var
##       lfdn    content 
## 0.33822396 0.09880349

# only random intercepts:
sapply(vars, function(x) x[1]) / total_var
##   lfdn.(Intercept) content.(Intercept) 
##         0.17496587          0.02425948 

Какова соответствующая мера для корреляции между двумя ответами одного и того же участника, относящимися к одному и тому же элементу?

Хенрик
источник
1
Merlo et al 2005 «Краткий концептуальный учебник по многоуровневому анализу в социальной эпидемиологии: исследование контекстуальных явлений в разных группах людей» может быть полезным справочным материалом.
N Brouwer
@ Хенрик, ты когда-нибудь нашел ответ на этот вопрос? Мне тоже интересно.
Патрик С.
2
@ PatrickS.Forscher Насколько я понимаю, ICC не имеет смысла со случайными уклонами. Я узнал об этом от Джейка Вестфолла.
Хенрик
Получили ссылку на чтение соответствующего чтения случайно?
Патрик С.
1
@ PatrickS.Forscher Как вы можете видеть, Джейк Уэстфолл теперь дал отличный ответ.
Хенрик

Ответы:

8

По сути, нет единого числа или оценки, которые могли бы суммировать степень кластеризации в модели случайных уклонов.

Внутриклассовая корреляция (ICC) может быть записана только как простая пропорция отклонений в моделях только со случайными перехватами. Чтобы понять, почему, эскиз получения выражения ICC можно найти здесь .

Когда вы добавляете случайные наклоны в уравнение модели, выполнение тех же шагов приводит к выражению ICC на странице 5 этого документа . Как вы можете видеть, это сложное выражение является функцией предиктора X. Чтобы более интуитивно понять, почему var (Y) зависит от X при наличии случайных наклонов, ознакомьтесь со страницей 30 этих слайдов («Почему дисперсия зависит от x ? ") .

Поскольку ICC является функцией предикторов (значений x), он может быть вычислен только для определенных наборов значений x. Возможно, вы могли бы попробовать что-то вроде отчета ICC по общему среднему из значений x, но эта оценка будет явно неточной для большинства наблюдений.

Все, что я сказал, до сих пор относится только к случаям, когда есть один случайный фактор. С несколькими случайными факторами это становится еще сложнее. Например, в многосайтовом проекте, где участники на каждом сайте отвечают на выборку стимулов (т.е. 3 случайных фактора: сайт, участник, стимул), мы могли бы спросить о множестве различных ICC: какова ожидаемая корреляция между двумя ответами на том же сайте, к тому же стимулу, от разных участников? Как насчет разных сайтов, одинаковых стимулов и разных участников? И так далее. @rvl упоминает об этих сложностях в ответе, с которым связывается ОП.

Итак, как вы можете видеть, единственный случай, когда мы можем суммировать степень кластеризации с одним значением, это случай с случайным перехватом с одним случайным фактором. Поскольку это небольшая доля реальных случаев, ICC не так полезны большую часть времени. Поэтому моя общая рекомендация - не беспокоиться о них. Вместо этого я рекомендую просто сообщать о компонентах отклонения (предпочтительно в форме стандартного отклонения).

Джейк Уэстфолл
источник