Я довольно долго использовал модели смешанных эффектов с продольными данными. Хотелось бы, чтобы я соответствовал отношениям AR в lmer (думаю, я прав, что не могу этого сделать?), Но я не думаю, что это отчаянно важно, поэтому я не слишком беспокоюсь.
Я только что натолкнулся на обобщенные оценочные уравнения (GEE), и они, кажется, предлагают гораздо большую гибкость, чем модели ME.
Есть риск задать более общий вопрос, есть ли какой-нибудь совет относительно того, что лучше для разных задач? Я видел несколько работ, сравнивающих их, и они, как правило, имеют вид:
«В этой узкоспециализированной области не используйте GEE для X, не используйте модели ME для Y».
Я не нашел более общего совета. Кто-нибудь может просветить меня?
Спасибо!
mixed-model
gee
Крис Били
источник
источник
glmmPQL
также могут подходить корреляционные структуры ARОтветы:
Используйте GEE, когда вы заинтересованы в раскрытии среднего для населения эффекта ковариаты по сравнению с индивидуальным специфическим эффектом. Эти две вещи эквивалентны только в линейных моделях, но не в нелинейных (например, логистических). Чтобы увидеть это, возьмите, например, логистическую модель случайных эффектов -го наблюдения -го субъекта, ;j i Yij
где - случайный эффект для субъекта а .ηi∼N(0,σ2) i pij=P(Yij=1|ηi)
Если бы вы использовали модель случайных эффектов для этих данных, то вы бы получили оценку которая учитывает тот факт, что среднее ноль нормально распределенного возмущения было применено к каждому индивидууму, что делает его индивидуальным для каждого конкретного человека.μ
Если бы вы использовали GEE на этих данных, вы бы оценили средние шансы населения. В этом случае это будет
Редактировать: в общем, модель смешанных эффектов без предикторов может быть записана как
где - это функция связи. Когда бы ниψ
будет разница между средними коэффициентами населения (GEE) и индивидуальными конкретными коэффициентами (модели случайных эффектов). То есть средние значения изменяются путем преобразования данных, интегрирования случайных эффектов в преобразованном масштабе, а затем преобразования обратно. Обратите внимание, что в линейной модели (то есть ) равенство действительно выполняется, поэтому они эквивалентны.ψ(x)=x
Редактировать 2: Стоит также отметить, что «надежные» стандартные ошибки типа сэндвича, создаваемые моделью GEE, обеспечивают действительные асимптотические доверительные интервалы (например, они фактически покрывают 95% времени), даже если структура корреляции, указанная в модели, не верный.
Изменить 3: Если вы заинтересованы в понимании структуры ассоциаций в данных, оценки ассоциаций GEE общеизвестно неэффективны (а иногда и противоречивы). Я видел ссылку на это, но не могу разместить ее прямо сейчас.
источник
GEE, на мой взгляд, наиболее полезен, когда мы не используем байесовское моделирование и когда полное правдоподобное решение недоступно. Кроме того, GEE может требовать больших размеров выборки, чтобы быть достаточно точными, и это очень ненадежно, чтобы не случайно пропустить продольные данные. GEE предполагает, что пропущено полностью случайно, в то время как методы правдоподобия (например, модели со смешанным эффектом или обобщенные наименьшие квадраты) предполагают, что пропущены только случайно.
источник
Вы можете найти подробное обсуждение и конкретные примеры в Fitzmaurice, Laird and Ware, Прикладной продольный анализ , John Wiley & Sons, 2011, 2-е издание, главы 11-16.
Что касается примеров, вы можете найти наборы данных и программы SAS / Stata / R на сопутствующем веб-сайте .
источник