Правильно ли я указываю свою модель lmer?

9

Я искал Google и этот сайт, и я все еще не понимаю функцию lmer в библиотеке lme4.

У меня есть некоторые данные, собранные в разных психиатрических отделениях, которые имеют многоуровневую структуру. Для упрощения я выберу две переменные уровня 2 и две переменные уровня 1, хотя на самом деле у меня есть еще несколько.

Уровень 2 - WardSize [это количество людей в приходе] и WAS [это показатель того, насколько «хорош» приход]

Группирующая переменная, которая сообщает R, кто в каком отделении называется «Отделение»

Первый уровень - пол [это пол, очевидно] и BSITotal [это мера тяжести симптомов]

Результатом является Selfreject, который снова звучит так.

У меня есть эта формула:

помощь = lmer (формула = Selfreject ~ WardSize + WAS + Пол + BSITotal + (1 | Ward))

Я надеюсь, что это означает, что «у каждого человека есть оценка, связанная с его собственным Полом и серьезностью симптома, а также эффект уровня отделения, относящийся к размеру отделения и тому, насколько он хорош»

Это правильно? Меня смущает то, что я не вижу, как R может определить, какие из них являются уровнем 1, а какие переменными уровня 2, за исключением перехвата уровня отделения, который был дан в конце.

Если бы кто-нибудь мог объяснить обозначения, чтобы такой идиот, как я, мог понять, было бы еще лучше.

Большое спасибо!

Крис Били
источник

Ответы:

11

Ваша спецификация модели в порядке.

Различный перехват для Ward, указанный в lmer, как вы сделали с (1 | Ward), говорит о том, что предметы в каждом отделении могут быть более похожи друг на друга в Selfreject по причинам, отличным от WardSize или Gender, поэтому вы контролируете межведомственная неоднородность.

Вы можете думать о «1» как о столбце 1 с (т. Е. О константе) в данных, которым соответствует перехват. Обычно «1» подразумевается автоматически в лм, например

lm(Y ~ X1 + X2)

на самом деле указывает

lm(Y ~ 1 + X1 + X2)

Теперь, когда у вас есть базовая модель, вы можете начать задавать дополнительные вопросы, такие как «Различаются ли отношения между BSItotal и Selfreject между подопечными?»

lmer(formula=Selfreject ~ WardSize + WAS + Gender + BSITotal + (1 + BSITotal | Ward))

То есть как точка пересечения, так и наклон BSITotal могут различаться в зависимости от района.

Если вы еще этого не поняли, « Анализ данных Gelman & Hill с использованием регрессионных и многоуровневых моделей / иерархических моделей» - это отличная книга, в которой объясняется, как подобрать модели с помощью lmer.

М Адамс
источник
1

Вот ссылка на объяснение Дугласа Бейтса (который написал lme4) о том, почему нет необходимости указывать уровень для фиксированных эффектов.

Брейер
источник
2
Добро пожаловать на сайт, @Breyer. Я подозреваю, что это полезный вклад. Не могли бы вы дать краткое изложение аргументов там, чтобы читатели могли решить, будет ли это то, что они ищут, или в случае будущего linkrot?
gung - Восстановить Монику
2
Спасибо за добро пожаловать @gung. Конечно, Бейтс объясняет, что нет необходимости указывать уровни для фиксированных эффектов, поскольку пакет lme4 написан для смешанных моделей, включая, но не ограничиваясь, многоуровневые / иерархические модели. Это означает, что вычислительные методы не опираются на спецификацию уровней, как в случае специализированного многоуровневого регрессионного программного обеспечения (HLM и т. Д.), Которое использует вложенную структуру данных в вычислениях.
Брейер