У меня есть GLMM с биномиальным распределением и функцией logit link, и у меня есть ощущение, что важный аспект данных недостаточно хорошо представлен в модели.
Чтобы проверить это, я хотел бы знать, хорошо ли данные описываются линейной функцией на шкале логита. Следовательно, я хотел бы знать, хорошо ли ведут себя остатки. Тем не менее, я не могу узнать, на каком участке остатки построить, и как интерпретировать сюжет.
Обратите внимание, что я использую новую версию lme4 ( версия для разработчиков от GitHub ):
packageVersion("lme4")
## [1] ‘1.1.0’
Мой вопрос: как я могу проверить и интерпретировать остатки биномиальных обобщенных линейных смешанных моделей с функцией логит-линка?
Следующие данные представляют только 17% моих реальных данных, но процесс подгонки уже занимает около 30 секунд на моей машине, поэтому я оставляю это так:
require(lme4)
options(contrasts=c('contr.sum', 'contr.poly'))
dat <- read.table("http://pastebin.com/raw.php?i=vRy66Bif")
dat$V1 <- factor(dat$V1)
m1 <- glmer(true ~ distance*(consequent+direction+dist)^2 + (direction+dist|V1), dat, family = binomial)
Простейший plot ( ?plot.merMod
) производит следующее:
plot(m1)
Это уже говорит мне что-то?
type=c("p","smooth")
вplot.merMod
, или перемещении ,ggplot
если вы хотите , доверительные интервалы) в том , что она выглядит как есть небольшой , но важный шаблон, который вам может быть в состоянии исправить, приняв другую функцию ссылки. Вот и все ...true ~ distance*(consequent+direction+dist)^2 + (direction+dist|V1)
? Буду ли оценка отдавания модели взаимодействияdistance*consequent
,distance*direction
,distance*dist
и наклонаdirection
иdist
которая изменяется в зависимостиV1
? Что(consequent+direction+dist)^2
обозначает квадрат в ?Warning message: In checkConv(attr(opt, "derivs"), opt$par, ctrl = control$checkConv, : Model failed to converge with max|grad| = 0.123941 (tol = 0.001, component 1)
. Почему ?Ответы:
Короткий ответ, так как у меня нет времени на лучшее: это сложная проблема; Бинарные данные почти всегда требуют некоторого биннинга или сглаживания для оценки соответствия. Было несколько полезно использовать
fortify.lmerMod
(изlme4
экспериментального) в сочетании сggplot2
и, в частности,geom_smooth()
рисовать, по существу, тот же график, построенный по сравнению с остаточным, как у вас выше, но с доверительными интервалами (я также немного сузил пределы y для увеличения ( -5,5) регион). Это наводит на мысль о некотором систематическом изменении, которое можно улучшить путем настройки функции связи. (Я также попытался построить остатки против других предикторов, но это было не слишком полезно.)Я попытался согласовать модель со всеми 3-сторонними взаимодействиями, но это не сильно улучшило ни отклонение, ни форму сглаженной остаточной кривой.
Смотрите также: http://freakonometrics.hypotheses.org/8210
источник
Это очень распространенная тема на курсах по биостатистике / эпидемиологии, и для нее не очень удачные решения, в основном из-за характера модели. Часто решением было избежать детальной диагностики с использованием остатков.
Бен уже писал, что для диагностики часто требуется либо биннинг, либо сглаживание. Объединение остатков доступно (или было) в пакете R, см., Например, эту нить . Кроме того, проделана определенная работа, в которой используются предсказанные вероятности; одна возможность - это разделительный участок, который обсуждался ранее в этой теме . Это может или не может напрямую помочь в вашем случае, но может помочь интерпретации.
источник
Вы можете использовать AIC вместо остаточных участков для проверки соответствия модели. Команда в R: AIC (model1) даст вам число ... так что вам нужно сравнить это с другой моделью (например, с большим количеством предикторов) - AIC (model2), которая выдаст другое число. Сравните два выхода, и вы захотите модель с более низким значением AIC.
Кстати, такие вещи, как AIC и отношение правдоподобия журналов, уже перечислены, когда вы получите сводную информацию о своей модели блеска, и обе они дадут вам полезную информацию о соответствии модели. Требуется большое отрицательное число для логарифмического отношения правдоподобия, чтобы отклонить нулевую гипотезу.
источник
График «Выровненный против остатков» не должен показывать какой-либо (четкий) рисунок. График показывает, что модель плохо работает с данными. См. Http://www.r-bloggers.com/model-validation-interpreting-residual-plots/
источник