Я выполнил повторный проект, в ходе которого я протестировал 30 мужчин и 30 женщин в трех разных заданиях. Я хочу понять, как поведение мужчин и женщин отличается и как это зависит от задачи. Я использовал оба пакета lmer и lme4, чтобы исследовать это, однако я застрял при попытке проверить предположения для любого из этих методов. Код, который я запускаю
lm.full <- lmer(behaviour ~ task*sex + (1|ID/task), REML=FALSE, data=dat)
lm.full2 <-lme(behaviour ~ task*sex, random = ~ 1|ID/task, method="ML", data=dat)
Я проверил, было ли взаимодействие лучшей моделью, сравнив его с более простой моделью без взаимодействия и выполнив анову:
lm.base1 <- lmer(behaviour ~ task+sex+(1|ID/task), REML=FALSE, data=dat)
lm.base2 <- lme(behaviour ~ task+sex, random= ~1|ID/task), method="ML", data=dat)
anova(lm.base1, lm.full)
anova(lm.base2, lm.full2)
В1: Можно ли использовать эти категориальные предикторы в линейной смешанной модели?
В2: Правильно ли я понимаю, что нормально, переменная результата («поведение») не должна распределяться сама по себе (по полу / задачам)?
Q3: Как я могу проверить однородность дисперсии? Для простой линейной модели я использую plot(LM$fitted.values,rstandard(LM))
. plot(reside(lm.base1))
Достаточно ли использования ?
Q4: для проверки нормальности используется следующий код, хорошо?
hist((resid(lm.base1) - mean(resid(lm.base1))) / sd(resid(lm.base1)), freq = FALSE); curve(dnorm, add = TRUE)
источник
Ответы:
Q1: Да, как и любая регрессионная модель.
Q2: Как и обычные линейные модели, ваша исходная переменная не должна нормально распределяться как одномерная переменная. Тем не менее, модели LME предполагают, что остатки модели обычно распределены. Таким образом, преобразование или добавление весов к модели будет способом позаботиться об этом (и, конечно, проверить с помощью диагностических графиков).
Q3:
plot(myModel.lme)
Q4:
qqnorm(myModel.lme, ~ranef(., level=2))
. Этот код позволит вам создавать QQ графики для каждого уровня случайных эффектов. Модели LME предполагают, что обычно распределяются не только остатки внутри кластера, но и каждый уровень случайных эффектов. Измените значенияlevel
от 0, 1 до 2, чтобы вы могли проверить остатки крысы, задачи и внутри объекта.РЕДАКТИРОВАТЬ: Я должен также добавить, что, хотя нормальность предполагается и что преобразование, вероятно, помогает уменьшить проблемы с ненормальными ошибками / случайными эффектами, не ясно, что все проблемы на самом деле решены или что смещение не введено. Если ваши данные требуют преобразования, будьте осторожны с оценкой случайных эффектов. Вот документ, посвященный этому .
источник
Вы, кажется, вводите в заблуждение относительно предположений, касающихся многоуровневых моделей. В данных нет предположения об однородности дисперсии, просто остатки должны быть приблизительно нормально распределены. И категориальные предикторы все время используются в регрессии (основная функция в R, которая выполняет ANOVA, является командой линейной регрессии).
Подробнее о проверке предположений см. В книге Пиньейру и Бейтса (стр. 174, раздел 4.3.1). Кроме того, если вы планируете использовать lme4 (о чем книга не написана), вы можете копировать их графики, используя plot с
lmer
моделью (?plot.merMod
).Быстро проверить нормальность это было бы просто так
qqnorm(resid(myModel))
.источник
Что касается Q2:
Согласно книге Пиньейру и Бейтса, вы можете использовать следующий подход:
Если вы хотите проверить наличие одинаковых отклонений между собой,
sex
вы можете использовать этот подход:Если отклонения отличаются, вы можете обновить свою модель следующим образом:
Более того, вы можете взглянуть на
robustlmm
упаковку, в которой также используется взвешивание. Докторская диссертация Коллера об этой концепции доступна в открытом доступе («Робастная оценка линейных смешанных моделей»). Аннотация гласит:Мне не хватает очков за комментарии. Однако я вижу необходимость прояснить некоторые аспекты ответа @John выше. Пиньейру и Бейтс заявляют на с. 174:
В этом утверждении действительно не ясно об однородных отклонениях, и я недостаточно глубоко разбираюсь в статистике, чтобы знать все математические основы концепции LME. Однако на с. 175, §4.3.1, раздел, касающийся предположения 1, они пишут:
Кроме того, в следующих примерах « постоянные отклонения » действительно важны. Таким образом, можно предположить, подразумевают ли они однородные отклонения, когда пишут « одинаково нормально распределенные» на p. 174, не обращаясь к нему более прямо.
источник
Q1: да, почему нет?
Q2: я думаю, что требование состоит в том, чтобы ошибки были нормально распределены.
Q3: Может быть проверен с помощью теста Левена, например.
источник