На этом форуме много обсуждается вопрос о том, как правильно указать различные иерархические модели lmer
.
Я думал, что было бы здорово иметь всю информацию в одном месте. Пара вопросов для начала:
- Как указать несколько уровней, где одна группа вложена в другую: это
(1|group1:group2)
или нет(1+group1|group2)
? - В чем разница между
(~1 + ....)
и(1 | ...)
и(0 | ...)
т. Д.? - Как определить взаимодействия на уровне группы?
lme4
пакета можно найти на CRANlmer
представляет общий статистический интерес и, следовательно, не является исключительно вопросом программирования. Поэтому я голосую, чтобы оставить эту тему открытой.Ответы:
Скажем, у вас есть переменная V1, предсказанная категориальной переменной V2, которая рассматривается как случайный эффект, и непрерывная переменная V3, которая рассматривается как линейный фиксированный эффект. Используя синтаксис lmer, простейшая модель (M1):
Эта модель будет оценивать:
P1: глобальный перехват
P2: Случайный эффект перехватывает для V2 (то есть для каждого уровня V2 отклонение перехвата этого уровня от глобального перехвата)
P3: единая глобальная оценка эффекта (наклона) V3
Следующая наиболее сложная модель (M2):
Эта модель оценивает все параметры из M1, но дополнительно оценит:
P4: Эффект V3 в каждом уровне V2 (более конкретно, степень, в которой эффект V3 в пределах данного уровня отклоняется от общего эффекта V3), в то же время обеспечивая нулевую корреляцию между отклонениями перехвата и отклонениями эффекта V3 по уровням из V2 .
Это последнее ограничение ослаблено в последней самой сложной модели (M3):
В котором оцениваются все параметры из M2, в то же время допускается корреляция между отклонениями перехвата и отклонениями эффекта V3 в пределах уровней V2. Таким образом, в M3 оценивается дополнительный параметр:
P5: корреляция между отклонениями перехвата и отклонениями V3 по уровням V2
Обычно пары моделей, такие как M2 и M3, вычисляются, а затем сравниваются для оценки доказательств корреляции между фиксированными эффектами (включая глобальный перехват).
Теперь рассмотрите возможность добавления другого предиктора с фиксированным эффектом, V4. Модель:
оценил бы:
P1: глобальный перехват
P2: единая глобальная оценка эффекта V3
P3: единая глобальная оценка эффекта V4
P4: единая глобальная оценка взаимодействия между V3 и V4
P5: отклонения перехвата от P1 на каждом уровне V2
P6: отклонения эффекта V3 от P2 на каждом уровне V2
P7: отклонения эффекта V4 от P3 на каждом уровне V2
P8: отклонения взаимодействия V3 от V4 от P4 на каждом уровне V2
P9 Корреляция между P5 и P6 по уровням V2
P10 Корреляция между P5 и P7 по уровням V2
P11 Корреляция между P5 и P8 по уровням V2
P12 Корреляция между P6 и P7 по уровням V2
P13 Корреляция между P6 и P8 по уровням V2
P14 Корреляция между P7 и P8 по уровням V2
Фу , это много параметров! И я даже не удосужился перечислить параметры дисперсии, оцененные моделью. Более того, если у вас есть категориальная переменная с более чем 2 уровнями, которую вы хотите смоделировать как фиксированный эффект, вместо одного эффекта для этой переменной вы всегда будете оценивать k-1 эффекты (где k - количество уровней) , тем самым взорвав количество параметров, которые будут оцениваться моделью, еще дальше.
источник
lmer
Y~X+Z+(1|group)+(0+X|Z)
group
Общая хитрость, как уже упоминалось в другом ответе , заключается в том, что формула следует форме
dependent ~ independent | grouping
.grouping
, Как правило , случайный фактор, вы можете включать в себя фиксированные факторы , без какой - либо группировки , и вы можете иметь дополнительные случайные факторы без какого - либо фиксированного фактора (перехват только модель). А+
между факторами указывает на отсутствие взаимодействия, а*
указывает на взаимодействие.Для случайных факторов у вас есть три основных варианта:
(1 | random.factor)
(0 + fixed.factor | random.factor)
(1 + fixed.factor | random.factor)
Обратите внимание, что вариант 3 имеет наклон и точку пересечения, рассчитанные в одной и той же группе, то есть в одно и то же время. Если мы хотим, чтобы наклон и пересечение вычислялись независимо, т.е. без какой-либо предполагаемой корреляции между ними, нам нужен четвертый вариант:
(1 | random.factor) + (0 + fixed.factor | random.factor)
. Альтернативный способ написать это - использовать двойную нотациюfixed.factor + (fixed.factor || random.factor)
.В другом ответе на этот вопрос есть также хорошее резюме, на которое вы должны обратить внимание.
Если вы хотите немного углубиться в математику, Barr et al. (2013)
lmer
довольно хорошо суммировали синтаксис в своей таблице 1, адаптированной здесь для соответствия ограничениям безбумажной уценки. Эта статья имела дело с психолингвистическими данными, поэтому два случайных эффекта -Subject
иItem
.Модели и
lme4
синтаксис эквивалентной формулы:Y ∼ X+(1∣Subject)
Y ∼ X+(1 + X∣Subject)
Y ∼ X+(1 + X∣Subject)+(1∣Item)
Y ∼ X+(1∣Subject)+(1∣Item)
Y ∼ X+(1∣Subject)+(0 + X∣ Subject)+(1∣Item)
Y ∼ X+(0 + X∣Subject)+(1∣Item)
Рекомендации:
Barr, Dale J, R. Levy, C. Scheepers und HJ Tily (2013). Структура случайных эффектов для проверки подтверждающей гипотезы: Сохраняйте ее максимальной . Журнал памяти и языка, 68: 255–278.
источник
|
Символ указывает на группировку фактора в смешанных методов.Согласно Пиньейру и Бейтсу:
В зависимости от того, какой метод вы используете для анализа смешанных методов
R
, вам может потребоваться создатьgroupedData
объект, чтобы иметь возможность использовать группировку в анализе (подробности см. Вnlme
пакете,lme4
кажется, в этом нет необходимости). Я не могу говорить с тем, как вы указали своиlmer
модельные высказывания, потому что я не знаю ваших данных. Однако наличие множества(1|foo)
в модельном ряду необычно из того, что я видел. Что вы пытаетесь смоделировать?источник