Я смотрел на моделирование смешанных эффектов с использованием пакета lme4 в R. Я в основном использую lmer
команду, поэтому я задам свой вопрос через код, который использует этот синтаксис. Я предполагаю, что общий простой вопрос может состоять в том, можно ли сравнивать любые две модели, построенные с lmer
использованием отношений правдоподобия на основе идентичных наборов данных? Я считаю, что ответ на этот вопрос должен быть «нет», но я могу быть неверным. Я прочитал противоречивую информацию о том, должны ли случайные эффекты быть одинаковыми или нет, и какой компонент случайных эффектов подразумевается под этим? Итак, я приведу несколько примеров. Я возьму их из данных повторных измерений, используя слово стимулы, возможно, что-то вроде Baayen (2008) будет полезно для интерпретации.
Допустим, у меня есть модель, в которой есть два предиктора с фиксированными эффектами, мы будем называть их A и B, и некоторые случайные эффекты ... слова и субъекты, которые их воспринимали. Я мог бы построить модель, как показано ниже.
m <- lmer( y ~ A + B + (1|words) + (1|subjects) )
(обратите внимание, что я намеренно пропустил, data =
и мы будем предполагать, что я всегда имею в виду REML = FALSE
для ясности)
Теперь о следующих моделях, которые можно сравнить с отношением правдоподобия к приведенному выше, а какие нет?
m1 <- lmer( y ~ A + B + (A+B|words) + (1|subjects) )
m2 <- lmer( y ~ A + B + (1|subjects) )
m3 <- lmer( y ~ A + B + (C|words) + (A+B|subjects) )
m4 <- lmer( y ~ A + B + (1|words) )
m5 <- lmer( y ~ A * B + (1|subjects) )
Я признаю, что интерпретация некоторых из этих различий может быть трудной или невозможной. Но давайте отложим это на секунду. Я просто хочу знать, есть ли в изменениях что-то фундаментальное, что исключает возможность сравнения. Я также хочу знать, если LRs в порядке, и сравнения AIC, а также.
Ответы:
Используя максимальную вероятность, любой из них можно сравнить с AIC; если фиксированные эффекты одинаковы (
m1
доm4
), то лучше использовать REML или ML, обычно предпочтительнее REML, но если они различаются, можно использовать только ML. Однако интерпретация обычно затруднительна, когда меняются как фиксированные, так и случайные эффекты, поэтому на практике большинство рекомендует менять только одно или другое за один раз.Использование теста отношения правдоподобия возможно, но грязно, потому что обычное приближение хи-квадрат не выполняется при тестировании, если компонент дисперсии равен нулю. Смотрите ответ Анико для деталей. (Благодарю Анико за то, что он прочитал вопрос более внимательно, чем я, и достаточно внимательно прочитал мой первоначальный ответ, чтобы заметить, что он упустил этот момент. Спасибо!)
Pinhiero / Bates - это классическая ссылка; это описывает
nlme
пакет, но теория та же самая. Ну, в основном то же самое; С момента написания этой книги Даг Бейтс изменил свои рекомендации по выводу, и новые рекомендации отражены вlme4
пакете. Но это больше, чем я хочу здесь. Более читаемая ссылка - Weiss (2005), Моделирование продольных данных.источник
m
m
m4
m
m2
Однако, как заявил @Aaron, многие эксперты не рекомендуют проводить такой тест отношения правдоподобия, как этот. Потенциальными альтернативами являются информационные критерии (AIC, BIC и т. Д.) Или начальная загрузка LRT.
[1] Self, SG & Liang, K. Асимптотические свойства оценок максимального правдоподобия и тесты отношения правдоподобия в нестандартных условиях J. Amer. Statist. Доц., 1987, 82, 605-610.
источник