Дисперсионно-ковариационная матрица в лмер

18

Я знаю, что одним из преимуществ смешанных моделей является то, что они позволяют задавать дисперсионно-ковариационную матрицу для данных (составная симметрия, авторегрессия, неструктурированная и т. Д.). Однако lmerфункция в R не позволяет легко определить эту матрицу. Кто-нибудь знает, какую структуру lmerиспользует по умолчанию и почему нет способа ее легко указать?

Никита Кузнецов
источник

Ответы:

9

Смешанные модели - это (обобщенные версии) модели компонентов дисперсии. Вы записываете часть с фиксированными эффектами, добавляете термины ошибок, которые могут быть общими для некоторых групп наблюдений, добавляете функцию связи, если это необходимо, и помещаете ее в максимизатор вероятности.

Однако различные структуры дисперсии, которые вы описываете, являются рабочими корреляционными моделями для обобщенных уравнений оценки, которые компенсируют некоторую гибкость смешанных / многоуровневых моделей для надежности вывода. С GEE вы заинтересованы только в проведении вывода для фиксированной части, и вы в порядке, не оценивая компоненты отклонения, как в смешанной модели. Для этих фиксированных эффектов вы получите надежную / сэндвич-оценку, которая подходит даже в том случае, если ваша структура корреляции имеет неправильный вид. Тем не менее, вывод для смешанной модели будет нарушен, если модель будет неправильно определена.

Таким образом, несмотря на то, что они имеют много общего (многоуровневая структура и способность решать остаточные корреляции), смешанные модели и GEE все еще являются несколько различными процедурами. Пакет R, который имеет дело с GEE, соответствующим образом вызывается gee, и в списке возможных значений corstroption вы найдете упомянутые вами структуры.

С точки зрения GEE, lmerработает с взаимозаменяемыми корреляциями ... по крайней мере, когда модель имеет два уровня иерархии и указаны только случайные перехваты.

Stask
источник
Спасибо, Стас. Раньше я не слышал о GEE и просто пытался научиться смешанному моделированию (что сложно, а также усиливается из-за различий в реализации программного обеспечения). Я дам GEE попытку. У меня действительно есть простой эксперимент с повторными измерениями с биомедицинскими зависимыми измерениями. Я заинтересован в фиксированной части в основном. Моя предыдущая тренировка в основном посвящена стандартным ANOVA с фиксированными эффектами, так что это может быть более простой переход.
Никита Кузнецов
Мне нравится идея оценки фиксированных параметров и я попробовал библиотеку Gee. Есть и другие библиотеки (например, geepack). По какой-то причине они хуже? В моей области люди должны сообщить р-значения. Есть ли способ получить их из оценок, а также провести парные сравнения с учетом кластеризации?
Никита Кузнецов
Парные сравнения чего? Разнообразие библиотек R всегда сводило меня с ума, и я не исследую различия между пакетами, если у меня нет реальной необходимости работать над конкретной моделью.
StasK
StatsK, это действительно правильно? Я новичок в многоуровневом моделировании, но Hox (2010) или Rabe-Hesketh & Skrondal (2013) четко различают различные оценщики дисперсии с помощью MLE и GEE. Например, при вычислении «надежной» стандартной ошибки сэндвича, Хокс (стр. 260) говорит, что вы можете либо вычислить их с помощью многоуровневого моделирования, используя Информационную матрицу / инверсию матрицы Гессе (с учетом многоуровневой структуры), либо путем оценки отклонения от сырые остатки и последующее использование GLS для расчета коэффициентов (подход GEE)
Арне Йонас Варнке
1
Я не уверен, что различие, предлагаемое StasK, действительно верно здесь. Хотя эти альтернативные корреляционные структуры действительно используются GEE, вполне возможно совместить (полностью параметрические) смешанные модели с более сложными структурами для ковариации либо случайных эффектов, либо остаточных ошибок, а также пакета nlme в R, SAS Proc Mixed или Смешанные команды Stata делают это.
Джонатан Бартлетт
4

Филиал FlexLamba lmer предоставляет такую ​​функциональность.

См. Https://github.com/lme4/lme4/issues/224 для примеров того, как реализовать конкретную структуру ошибок или случайных эффектов.

majom
источник
Можно ли одновременно установить обычную ветку и ветку FlexLambda? Как?
Скан
3

Насколько мне известно, у lmer нет «простого» способа решения этой проблемы. Кроме того, учитывая, что в большинстве случаев lmer интенсивно использует разреженные матрицы для факторизации Холецкого, я считаю маловероятным, что он допускает полностью неструктурированные VCV.

(1|RandEff1)+(1|RandEff2)

R=[σRE12000000σRE12000000σRE12000000σRE22000000σRE22000000σRE22]

Однако не все потеряно с LME: Вы можете легко указать эти атрибуты матрицы VCV, если используете R-пакет MCMCglmm. Посмотрите на CourseNotes.pdf , стр.70. На этой странице приведены некоторые аналоги того, как будет определена структура случайных эффектов lme4, но, как вы увидите, lmer менее гибок, чем MCMCglmm в этом вопросе.

На полпути есть проблемные классы lme corStruct, например. corCompSymm , corAR1 и т. д. и т. д . Ответ Фабиана в этом шаге дает несколько более кратких примеров для спецификации VCV на основе lme4, но, как упоминалось ранее, они не так явно, как в MCMCglmm или nlme.

usεr11852 говорит восстановить Monic
источник
Я не «доверяю» MCMCglmm из-за наивного выбора предыдущих дистрибутивов.
Стефан Лоран
О. Я не думаю, что это "наивно"; они могут отражать действительные предположения. Вы даже можете определить неподходящие приоры, если вы сильно к этому относитесь. Б. Это была только часть моего ответа, в нем не говорилось, что это единственный путь; Я привел пример для lme4. C. Если вам нужно делать многомерные смешанные эффекты, это практически единственный доступный пакет вместе с sabreR ...
говорит usεr11852 Reinstate Monic
Извините, мой комментарий не был критикой вашего ответа. Говоря «наивные приоры», я говорил о неинформативных приорах.
Стефан Лоран
Маловероятно, что эта R-матрица верна. Даже «классические» повторные измерения ANOVA допускают ненулевые корреляции между условиями (я имею в виду матрицу составной симметрии). Мне кажется, что эта матрица будет действительна только для дизайна между субъектами со случайным назначением с двумя кластерами.
Никита Кузнецов
(1|RandEff1)+(1|RandEff2)