Что легко интерпретировать, добротность мер соответствия для линейных моделей со смешанными эффектами?

37

Я в настоящее время использую пакет R lme4 .

Я использую линейные модели смешанных эффектов со случайными эффектами:

library(lme4)
mod1 <- lmer(r1 ~ (1 | site), data = sample_set) #Only random effects
mod2 <- lmer(r1 ~ p1 + (1 | site), data = sample_set) #One fixed effect + 
            # random effects
mod3 <- lmer(r1 ~ p1 + p2 + (1 | site), data = sample_set) #Two fixed effects + 
            # random effects

Для сравнения моделей я использую anovaфункцию и смотрю на различия в AIC относительно самой низкой модели AIC:

anova(mod1, mod2, mod3)

Вышесказанное отлично подходит для сравнения моделей.

Тем не менее, мне также нужен какой-то простой способ интерпретации правильности подходящих мер для каждой модели. У кого-нибудь есть опыт с такими мерами? Я провел некоторое исследование, и есть журнальные статьи по квадрату R для фиксированных эффектов моделей смешанных эффектов:

  • Cheng, J., Edwards, LJ, Maldonado-Molina, MM, Komro, KA & Muller, KE (2010). Реальный продольный анализ данных для реальных людей: Построение достаточно хорошей смешанной модели. Статистика в медицине, 29 (4), 504-520. doi: 10.1002 / sim.3775
  • Edwards, LJ, Muller, KE, Wolfinger, RD, Qaqish, BF, & Schabenberger, O. (2008). Статистика R2 для фиксированных эффектов в линейной смешанной модели. Статистика в медицине, 27 (29), 6137-6157. doi: 10.1002 / sim.3429

Однако представляется, что существует некоторая критика в отношении использования мер, подобных тем, которые предложены в вышеуказанных документах.

Может ли кто-нибудь предложить несколько простых для понимания, подходящих мер, которые могут применяться к моим моделям?

mjburns
источник
2
Мне действительно нравится этот вопрос, но использование тестов отношения правдоподобия для определения необходимости фиксированных эффектов не является рекомендуемой стратегией, см. FAQ . Таким образом, вышесказанное не подходит для сравнения моделей.
Хенрик
Спасибо Хенрик. Часто задаваемые вопросы, которые вы перечислили, очень полезны. Похоже, что выборка по методу Маркова в цепочке Монте-Карло может быть хорошей стратегией для сравнения моих моделей.
Mjburns
1
Проблема с MCMC в том, что вы можете иметь только простые случайные эффекты (как в вашем примере). Я бы пошел с приближением Кенворда-Роджерса к степеням свободы, поскольку это также относится к более сложным моделям. Посмотрите на функцию mixed()в моем пакете afex ( версия для разработки также имеет параметрическую загрузку ). Смотрите здесь для некоторых ссылок .
Хенрик
ОК, Хенрик. Мне удалось заставить вашу функцию mixed () работать из пакета afex. Не могли бы вы посоветовать, как можно использовать afex для сравнения моделей? Какие меры я могу использовать, чтобы решить, является ли одна модель более правдоподобной, чем другая? Спасибо.
mjburns
На этот вопрос нелегко ответить, возможно, вы зададите отдельный вопрос, предоставив более подробную информацию. Но вкратце, afex пытается помочь вам оценить, значительны ли определенные эффекты (или лучшие модели, включая этот эффект). Для этого он использует KRmodcompиз пакета pbkrtest. Вы также можете использовать KRmodcompнепосредственно для сравнения моделей.
Хенрик

Ответы:

3

Для линейных смешанных моделей нет ничего проще, чем просто оценить меру соответствия.

Случайный эффект подходит (mod1) могут быть измерены ICCи ICC2(соотношение между дисперсией учитывается случайными эффектами и остаточной дисперсией). психометрический пакет R включает в себя функцию для извлечения их образуют объект LME.

Можно использовать R2для оценки фиксированного эффекта (mod2, mod3), но это может быть непросто: когда две модели демонстрируют похожий R2, может оказаться, что одна более «точна», но замаскирована ее фиксированным коэффициентом » вычитая «больший компонент дисперсии к случайному эффекту. С другой стороны, легко интерпретировать больший R2 модели высшего порядка (например, mod3). В главе Баайена о смешанных моделях есть хорошая дискуссия по этому поводу. Кроме того, это руководство очень ясно.

Возможным решением является рассмотрение каждого variance componentнезависимо, а затем использовать их для сравнения моделей.

ajeje
источник
1
Можете ли вы сказать нам, на какую ссылку вы ссылаетесь, когда произносите главу Баайена?
КХ Ким,
да, ссылка не работает!
любопытно
Я нашел эту цитату, не уверен, что это так, но нигде не могу получить PDF: BaayenR. H. Анализ лингвистических данных: практическое введение в статистику с использованием R. Cambridge: Cambridge University Press, 2008. Pp. 368. ISBN-13: 978-0-521-70918-7. - Том 37 Выпуск 2 - Гжегож Краевский, Даниэль Мэтьюз
Любопытно
1
Давайте, ребята. Где твой гугл-фу? Выполните поиск по запросу "baayenCUPstats.pdf: первое попадание: sfs.uni-tuebingen.de/~hbaayen/publications/baayenCUPstats.pdf
DWin