Интерпретация трех форм «смешанной модели»

19

Есть различие, которое сбивает меня с толку смешанными моделями, и мне интересно, смогу ли я получить некоторую ясность в этом. Предположим, у вас смешанная модель данных подсчета. Есть переменная с фиксированным эффектом (A) и другая переменная времени (T), сгруппированные, скажем, в переменную «Site».

Как я понимаю:

glmer(counts ~ A + T, data=data, family="Poisson") модель с фиксированными эффектами

glmer(counts ~ (A + T | Site), data=data, family="Poisson") модель со случайным эффектом

Мой вопрос, когда у вас есть что-то вроде:

glmer(counts ~ A + T + (T | Site), data=data, family="Poisson")что такое Т? Это случайный эффект? Фиксированный эффект? Что на самом деле достигается путем размещения Т в обоих местах?

Когда что-то должно появляться только в разделе случайных эффектов формулы модели?

фомиты
источник

Ответы:

22

Это может стать более понятным, если выписать формулу модели для каждой из этих трех моделей. Пусть будет наблюдением для человека на сайте в каждой модели и определим аналогично для ссылки на переменные в вашей модели. i j A i j , T i jYijijAij,Tij

glmer(counts ~ A + T, data=data, family="Poisson") это модель

log(E(Yij))=β0+β1Aij+β2Tij

которая является обычной моделью пуассоновской регрессии.

glmer(counts ~ (A + T|Site), data=data, family="Poisson") это модель

log(E(Yij))=α0+ηj0+ηj1Aij+ηj2Tij

где - это случайные эффекты, которые разделяются каждым наблюдением, сделанным людьми с сайта , Этим случайным эффектам разрешено свободно коррелировать (т. Е. На не накладываются никакие ограничения ) в указанной вами модели. Чтобы навязать независимость, вы должны поместить их в разные скобки, например , сделайте это. Эта модель предполагает, что равен для всех сайтов, но каждый сайт имеет случайное смещение ( ) и имеет случайную линейную связь с обоими .j Σ log ( E ( Y i j ) ) α 0 η j 0 A i j , T i jηj=(ηj0,ηj1,ηj2)N(0,Σ)jΣ(A-1|Site) + (T-1|Site) + (1|Site)log(E(Yij))α0ηj0Aij,Tij

glmer(counts ~ A + T + (T|Site), data=data, family="Poisson") это модель

log(E(Yij))=(θ0+γj0)+θ1Aij+(θ2+γj1)Tij

Так что теперь имеет некоторые «средние» отношения с , заданные фиксированными эффектами но эти отношения отличается для каждого сайта, и эти различия фиксируются случайными эффектами, . Таким образом, базовая линия смещена случайным образом, а наклоны двух переменных смещены случайным образом, и все с одного и того же сайта имеют одинаковое случайное смещение. A i j , T i j θ 0 , θ 1 , θ 2 γ j 0 , γ j 1 , γ j 2log(E(Yij))Aij,Tijθ0,θ1,θ2γj0,γj1,γj2

что такое Т? Это случайный эффект? Фиксированный эффект? Что на самом деле достигается путем размещения Т в обоих местах?

T γ j 1 T log ( E ( Y i j ) )T является одним из ваших ковариат. Это не случайный эффект - Siteэто случайный эффект. Существует фиксированный эффект который отличается в зависимости от случайного эффекта, предоставляемого параметром - в приведенной выше модели. То, что достигается путем включения этого случайного эффекта, состоит в том, чтобы учесть неоднородность между сайтами в отношениях между и .TSiteγj1Tlog(E(Yij))

Когда что-то должно появляться только в разделе случайных эффектов формулы модели?

Это вопрос того, что имеет смысл в контексте приложения.

Что касается перехвата - вы должны держать фиксированный перехват там по многим причинам (см., Например, здесь ); re: случайный перехват, , это в первую очередь действует, чтобы вызвать корреляцию между наблюдениями, сделанными в том же месте. Если такая корреляция не имеет смысла, случайный эффект следует исключить.γj0

Что касается случайных уклонов, модель с только случайными уклонами и без фиксированных уклонов отражает убеждение, что для каждого сайта существует некоторая связь между и вашими ковариатами для каждого сайта , но если вы усредните эти эффекты по всем сайтам, то нет никакой связи. Например, если у вас был случайный наклон в но нет фиксированного наклона, это все равно, что сказать, что время в среднем не имеет никакого эффекта (например, нет светских трендов в данных), но каждый движется со случайным направлением во времени, что может иметь смысл. Опять же, это зависит от приложения. Tlog(E(Yij))TSite

Обратите внимание, что вы можете подобрать модель со случайными эффектами и без них, чтобы увидеть, происходит ли это - вы должны увидеть не эффект в фиксированной модели, а значительные случайные эффекты в последующей модели. Я должен предупредить вас, что подобные решения часто лучше принимать на основе понимания приложения, а не путем выбора модели.

макрос
источник
2
(+1): выписывание формулы модели для каждой модели - действительно лучший способ сделать R-нотацию более прозрачной; Молодец!
ocram
@Macro Один вопрос по уравнениям выше (спасибо им, кстати) - у них также есть обычный термин ошибки в них? Если да, то каков этот термин?
Fomite
2
Привет - один из способов написать GLM - это модель для (или «связанной» версии), как я это сделал здесь. Для ожидаемого значения нет условия ошибки, если модель указана правильно. Чтобы ответить на ваш вопрос, в GLMS мы с указанием распределения по . «Остаток» случайности в линейной модели проявляется нормально распределенным членом ошибки. Но в нелинейных GLM (например, пуассоновском, логистическом) есть «встроенная» случайность, поскольку знание скорости пуассона или вероятности успеха испытания Бернулли не позволяет предсказать реализацию без ошибки. Надеюсь это поможет. Y i j | ИксE(Yij|X)Yij|X
Макро
11

Вы должны заметить, что Tэто не термины случайных эффектов, а фиксированный эффект. Случайные эффекты - это только те эффекты, которые появляются |в lmerформуле после!

Более подробное обсуждение того, что делает эта спецификация, вы можете найти в этом вопросе lmer faq .

Из этих вопросов ваша модель должна дать следующее (для вашего фиксированного эффекта T):

  • Глобальный уклон
  • Термин случайный уклон, указывающий отклонение от общего уклона для каждого уровня Site
  • Корреляция между случайными наклонами.

И, как сказал @ mark999, это действительно общая спецификация. В схемах с повторными измерениями вы обычно хотите иметь случайные уклоны и корреляции для всех факторов повторных измерений (внутри субъектов).

См. Следующую статью для некоторых примеров (которые я обычно привожу здесь):

Джадд, CM, Westfall, J. & Kenny, DA (2012). Рассмотрение стимулов как случайного фактора в социальной психологии: новое и всеобъемлющее решение широко распространенной, но в значительной степени игнорируемой проблемы. Журнал личности и социальной психологии , 103 (1), 54–69. DOI: 10,1037 / a0028347

Хенрик
источник
2
Аналогичная ссылка из экологии: Шильцет, Хольгер и Вольфганг Форстмайер. 2009. «Выводы, выходящие за рамки поддержки: чрезмерно уверенные оценки в смешанных моделях». Поведенческая экология 20 (2) (1 марта): 416–420. DOI: 10.1093 / beheco / arn145. beheco.oxfordjournals.org/content/20/2/416 .
Бен Болкер
1

Что-то должно появляться только в случайной части, когда вы не особо заинтересованы в его параметре как таковом, но должны включать его, чтобы избежать зависимых данных. Например, если дети вложены в классы, вы обычно хотите, чтобы дети были случайным эффектом.

Питер Флом - Восстановить Монику
источник
1
Возможно, я вас неправильно понимаю, но я бы подумал, что фиксированные и случайные эффекты для одной и той же переменной встречаются чаще, чем переменные, имеющие только случайный эффект. Наличие фиксированных и случайных эффектов для одной и той же переменной не редкость в книге Пиньейру и Бейтса.
mark999
2
@MichaelChernick, насколько я понимаю, если у вас есть фиксированный эффект и случайный эффект для одной и той же переменной, то фиксированный эффект - это общий эффект в популяции, в то время как случайный эффект позволяет по-разному влиять на переменную для каждого субъекта. Есть несколько примеров в Pinheiro & Bates.
mark999
2
@PeterFlom, re: «если дети вложены в классы, вы обычно хотите, чтобы дети были случайным эффектом». Я думаю, вы имеете в виду, что класс - это случайный эффект. Если в данных нет дальнейшего вложения (например, повторные измерения на детях), то случайные эффекты на уровне детей не идентифицируются.
Макро
1
@Macro Да, это то, что я имел в виду, извините. Терминология становится очень запутанной! Возможно, именно поэтому Гельман избегает терминов «фиксированный» и «случайный»
Питер Флом - Восстановить Монику
2
@ Майкл, я согласен с тобой. В иерархических моделях такого типа случайные эффекты определяются группирующей переменной (в отличие от других многомерных моделей, таких как пространственно индексируемые наборы данных, где переменная «группировка» постоянно меняется). В вопросе OP, Siteбудет упоминаться как случайный эффект, а не Tили Aили что-либо еще. Думая об этом таким образом, Siteэффект явно не может быть как фиксированным, так и случайным, поскольку эти два не будут отождествляться друг с другом. Вы можете иметь фиксированные и случайные коэффициенты для переменной, но это другой вопрос.
Макро