Как интерпретировать дисперсию случайного эффекта в обобщенной линейной смешанной модели

9

В логистической обобщенной линейной смешанной модели (семейство = бином) я не знаю, как интерпретировать дисперсию случайных эффектов:

Random effects:
 Groups   Name        Variance Std.Dev.
 HOSPITAL (Intercept) 0.4295   0.6554  
Number of obs: 2275, groups: HOSPITAL, 14

Как мне интерпретировать этот числовой результат?

У меня есть много пациентов с трансплантированной почкой в ​​многоцентровом исследовании. Я проверял, одинакова ли вероятность того, что пациент получит специфическое антигипертензивное лечение среди центров. Доля пациентов, которых лечат, сильно различается между центрами, но это может быть связано с различиями в основных характеристиках пациентов. Таким образом, я оценил обобщенную линейную смешанную модель (логистическую) с учетом основных особенностей пациентов. Вот результаты:

Generalized linear mixed model fit by maximum likelihood ['glmerMod']
 Family: binomial ( logit )
Formula: HTATTO ~ AGE + SEX + BMI + INMUNOTTO + log(SCR) + log(PROTEINUR) + (1 | CENTER) 
   Data: DATOS 

     AIC      BIC   logLik deviance 
1815.888 1867.456 -898.944 1797.888 

Random effects:
 Groups   Name        Variance Std.Dev.
 CENTER (Intercept) 0.4295   0.6554  
Number of obs: 2275, groups: HOSPITAL, 14

Fixed effects:
                           Estimate Std. Error z value Pr(>|z|)    
(Intercept)               -1.804469   0.216661  -8.329  < 2e-16 ***
AGE                       -0.007282   0.004773  -1.526  0.12712    
SEXFemale                 -0.127849   0.134732  -0.949  0.34267    
BMI                        0.015358   0.014521   1.058  0.29021    
INMUNOTTOB                 0.031134   0.142988   0.218  0.82763    
INMUNOTTOC                -0.152468   0.317454  -0.480  0.63102    
log(SCR)                   0.001744   0.195482   0.009  0.99288    
log(PROTEINUR)             0.253084   0.088111   2.872  0.00407 ** 

Количественные переменные центрированы. Я знаю, что стандартное отклонение перехвата между больницами составляет 0,6554 в логарифмическом масштабе. Поскольку перехват составляет -1,804469, по шкале логарифмических шансов, то вероятность лечения антигипертензивным средством мужчины среднего возраста со средним значением по всем переменным и иммунотерапией А для «среднего» центра составляет 14,1%. , И теперь начинается интерпретация: в предположении, что случайные эффекты следуют за нормальным распределением, мы ожидаем, что приблизительно 95% центров будут иметь значение в пределах 2 стандартных отклонений от среднего значения нуля, поэтому вероятность лечения для среднего человека будет варьироваться между центрами с интервалом покрытия:

exp(-1.804469-2*0.6554)/(1+exp(-1.804469-2*0.6554))

exp(-1.804469+2*0.6554)/(1+exp(-1.804469+2*0.6554))

Это правильно?

Кроме того, как я могу проверить на блеске, если различия между центрами статистически значимы? Раньше я работал с MIXNO, отличным программным обеспечением Дональда Хедекера, и там у меня есть стандартная ошибка дисперсии оценки, которой у меня нет в glmer. Как я могу получить вероятность лечения «среднего» человека в каждом центре с доверительным интервалом?

Спасибо

user2310909
источник

Ответы:

10

Вероятно, это будет наиболее полезно, если вы покажете нам больше информации о своей модели, но: базовое значение логарифмов того, каким будет ваш ответ (например, смертность), варьируется в зависимости от больницы. Базовое значение (термин перехвата для каждой больницы) представляет собой лог-шансы смертности (или чего-либо еще) в базовой категории (например, «необработанный») при нулевом значении любых непрерывных предикторов. Предполагается, что это изменение обычно распределено по шкале логарифмов. Межбольничное стандартное отклонение перехвата составляет 0,6554; дисперсия (только квадрат стандартного отклонения, а не мера неопределенности стандартного отклонения) составляет .0,65542знак равно0,4295

(Если вы уточните свой вопрос / добавите более подробную информацию о своей модели, я могу попытаться сказать больше.)

Обновление : ваша интерпретация изменения кажется правильной. Точнее,

cc <- fixef(fitted_model)[1] ## intercept
ss <- sqrt(unlist(VarCorr(fitted_model))) ## random effects SD
plogis(qnorm(c(0.025,0.975),mean=cc,sd=ss))

должен дать вам 95% интервал (не совсем доверительные интервалы, но очень похожие) для вероятностей базового (мужской / средний возраст / и т. д.) человека, получающего лечение в больницах.

Для проверки значимости случайного эффекта у вас есть несколько вариантов (см. Http://bbolker.github.io/mixedmodels-misc/glmmFAQ.html для получения дополнительной информации). (Обратите внимание, что стандартная ошибка дисперсии RE, как правило, не является надежным способом проверки значимости, поскольку распределение выборки часто искажено / ненормально.) Самый простой подход заключается в проведении теста отношения правдоподобия, например

pchisq(2*(logLik(fitted_model)-logLik(fitted_model_without_RE)),
       df=1,lower.tail=FALSE)/2

Окончательное деление на 2 корректирует тот факт, что тест отношения правдоподобия является консервативным, когда нулевое значение (т. Е. Дисперсия RE = 0) находится на границе допустимого пространства (т. Е. Дисперсия RE не может быть <0).

Бен Болкер
источник
Я отредактировал вопрос
user2310909
1
Спасибо, приятно читать тому, кто хорошо знает предмет.
user2310909