Как я могу оценить соответствие модели GEE / логистической модели, если у ковариат есть недостающие данные?

9

Я приспособил две модели обобщенных оценочных уравнений (GEE) к моим данным:

1) Модель 1. Результат - продольная переменная Да / Нет (A) (год 1,2,3,4,5) с продольным непрерывным предиктором (B) для лет 1,2,3,4,5.

2) Модель 2: Результат - та же самая продольная переменная Да / Нет (A), но теперь с моим предиктором, установленным на его значение года 1, то есть вынуждено быть неизменным по времени (B)

Из-за отсутствия измерений в моем продольном предикторе в нескольких временных точках для разных случаев количество точек данных в модели 2 выше, чем в модели 1.

Я хотел бы знать о том, какие сравнения я могу достоверно сделать между коэффициентами шансов, p-значениями и соответствием двух моделей, например:

  • Если OR для предиктора B больше в модели 1, могу ли я достоверно сказать, что связь между A и B сильнее в модели1?

  • Как я могу оценить, какая модель лучше подходит для моих данных. Правильно ли я считаю, что псевдо-квадраты QIC / AIC не следует сравнивать между моделями, если число наблюдений не одинаково?

Любая помощь будет принята с благодарностью.

N26
источник
Поскольку модель 2 на самом деле не считается «вложенной» из модели 1, я не знаю, насколько обоснованным будет использование QIC для оценки сравнительного соответствия. Одна мысль, которую я имел, состояла в том, чтобы использовать несколько методов вменения для выравнивания количества наблюдений, а затем можно было бы сравнить значения QIC для этих моделей. Тем не менее, некоторые литературные источники, например, «Прикладной продольный анализ данных для эпидемиологии» от Twisk, показали действительно противоречивые результаты, используя методы МИ на моделях, которые имеют дихотомические переменные реакции. Я хотел бы помочь больше.
Ирис Цуй
1
Почему значения отсутствуют? Является ли их упущение систематическим, что делает пропущенные значения принципиально отличными от пропущенных значений?
Макрос

Ответы:

1

Я бы определенно попробовал множественное вменение (например, с мышами или Амелией в R), возможно, с несколькими альтернативными методами для вменения пропущенных значений.

В худшем случае вы можете считать это анализом чувствительности.

Joe_74
источник