В чем разница между обобщенными оценочными уравнениями и GLMM?

27

Я запускаю GEE на 3-уровневых несбалансированных данных, используя ссылку logit. Как это отличается (с точки зрения выводов, которые я могу сделать, и значения коэффициентов) от GLM со смешанными эффектами (GLMM) и логит-связью?

Более подробно: наблюдения представляют собой одиночные испытания Бернулли. Они сгруппированы в классы и школы. Используя R. Casewise, опущение NA. 6 предикторов и условия взаимодействия.

(Я не подбрасываю детей, чтобы увидеть, приземляются ли они один на один.)

Я склонен возводить в степень коэффициенты отношения шансов. Имеет ли это одинаковое значение в обоих?

В глубине моего сознания скрывается нечто о «предельных средствах» в моделях GEE. Мне нужно это немного объяснить мне.

Спасибо.

Rosser
источник

Ответы:

44

С точки зрения интерпретации коэффициентов, существует разница в двоичном случае (среди прочих). Что отличается между GEE и GLMM, так это цель вывода: средняя по населению или предметная .

YniNi=1NniYij=1jiYij=0xij=1ji

Чтобы ввести терминологию, которую я использовал в первом абзаце, вы можете думать о школе как о населении, а о классных комнатах - как о предметах .

bi

log(P(Yij=1)P(Yij=0)xij,bi)=β0+β1xij+bi

bi

GEE, с другой стороны, соответствует маргинальной модели. Эти модели населения в среднем . Вы моделируете ожидание, условное только на вашей фиксированной матрице дизайна.

log(P(Yij=1)P(Yij=0)xij)=β0+β1xij

Это в отличие от моделей со смешанным эффектом, как объяснено выше, которые влияют как на матрицу с фиксированным дизайном, так и на случайные эффекты. Итак, в приведенной выше маржинальной модели вы говорите: «Забудьте о разнице между классами, я просто хочу, чтобы уровень неудач среди населения (в школах) и его связь с полом». Вы подходите к модели и получаете отношение шансов, которое является усредненным для населения отношением шансов неудачи, связанной с полом.

Таким образом, вы можете обнаружить, что ваши оценки по вашей модели GEE могут отличаться от ваших оценок по модели GLMM, и это потому, что они не оценивают одно и то же.

(Что касается преобразования логарифмического отношения шансов в отношение шансов путем возведения в степень, да, вы делаете это, будь то оценка на уровне населения или предметная оценка)

Некоторые заметки / литература:

Для линейного случая средние по населению и предметные оценки одинаковы.

Zeger et al. 1988 показал, что для логистической регрессии,

βM[(16315π)2V+1]1/2βRE

βMβREV

В Molenberghs, Verbeke 2005 есть целая глава о моделях предельных и случайных эффектов.

Я узнал об этом и связанном с ним материале в курсе, основанном на материалах Diggle, Heagerty, Liang, Zeger 2002 , отличная ссылка.


источник
1
Майк: Не слишком ли легко сказать, что GEE усредняет случайные эффекты?
B_Miner
3
@B_Miner Не слишком просто, это именно то, что вы делаете :)
3
@Mike Wierzbicki: Хороший и чистый ответ, Майк! Одна небольшая деталь, которую я мог бы добавить в ваши «Некоторые заметки / литература»: GEE и GLMM одинаковы в линейном случае (гауссовский ответ, идентификационная ссылка), только когда вы указываете сменную матрицу корреляции для GEE.
Разве нет предметного GEE тоже?
Джордано
@MikeWierzbicki Итак, если я правильно вас понимаю, GEE - это не более чем простая модель со смешанным эффектом без случайных эффектов (что делает ее простой нелинейной линией регрессии)?
Робин Крамер