В многоуровневой модели, каковы практические и связанные с интерпретацией последствия оценки, а не оценки параметров корреляции случайных эффектов? Практическая причина спрашивать это состоит в том, что в структуре Лмера в R нет реализованного метода для оценки p-значений с помощью методов MCMC, когда оценки делаются в модели корреляций между параметрами.
Например, взглянув на этот пример (приведенные ниже части), каковы практические последствия М2 по сравнению с М3. Очевидно, что в одном случае P5 не будет оцениваться, а в другом - будет.
Вопросов
- По практическим соображениям (стремление получить значение p с помощью методов MCMC) может потребоваться подгонка модели без корреляции между случайными эффектами, даже если P5 по существу не равен нулю. Если это сделать, а затем оценить p-значения с помощью метода MCMC, интерпретируются ли результаты? (Я знаю, что @Ben Bolker ранее упоминал, что «комбинирование тестирования значимости с MCMC немного статистически непоследовательно, хотя я понимаю необходимость сделать это (получение доверительных интервалов более приемлемо)» , так что если это заставит вас спать лучше ночью притворяюсь, я сказал доверительные интервалы.)
- Если не удается оценить P5, это то же самое, что утверждать, что оно равно 0?
- Если P5 действительно ненулевой, то каким образом влияют оценочные значения P1-P4?
- Если P5 действительно ненулевой, то каким образом влияют оценки ошибки для P1-P4?
- Если P5 действительно не равен нулю, то каким образом интерпретации модели не могут содержать ошибки в P5?
Заимствуя из ответа @Mike Lawrence (те, кто более осведомлен, чем я, могут заменить его полной нотацией модели, я не совсем уверен, что смогу сделать это с разумной точностью):
M2: V1 ~ (1|V2) + V3 + (0+V3|V2)
(оценки P1 - P4)
М3: V1 ~ (1+V3|V2) + V3
(оценки P1-P5)
Параметры, которые могут быть оценены:
P1 : глобальный перехват
P2 : Случайный эффект перехватывает для V2 (то есть для каждого уровня V2 отклонение перехвата этого уровня от глобального перехвата)
P3 : единая глобальная оценка эффекта (наклона) V3
P4 : Эффект V3 в каждом уровне V2 (более конкретно, степень, в которой эффект V3 в пределах данного уровня отклоняется от общего эффекта V3), обеспечивая при этом нулевую корреляцию между отклонениями перехвата и отклонениями эффекта V3 по уровням из V2.
P5 : корреляция между отклонениями перехвата и отклонениями V3 по уровням V2
Ответы, полученные из достаточно большого и широкого моделирования вместе с сопровождающим кодом на R с использованием lmer, будут приемлемыми.
источник
Ответы:
Рассмотрим данные сна, включенные в lme4. Бейтс обсуждает это в своей онлайн- книге о lme4. В главе 3 он рассматривает две модели данных.
а также
В исследовании приняли участие 18 субъектов, изученных в течение 10 дней без сна. Время реакции рассчитывали в начале и в последующие дни. Существует четкий эффект между временем реакции и продолжительностью лишения сна. Есть также значительные различия между предметами. Модель А допускает возможность взаимодействия между случайным перехватом и эффектами наклона: представьте, скажем, что люди с плохим временем реакции более остро страдают от последствий лишения сна. Это предполагает положительную корреляцию в случайных эффектах.
В примере Бейтса не было очевидной корреляции с графиком решетки и не было существенного различия между моделями. Однако, чтобы исследовать вопрос, поставленный выше, я решил взять подходящие значения сна, изучить корреляцию и посмотреть на производительность двух моделей.
Как видно из изображения, длительное время реакции связано с большей потерей производительности. Корреляция, использованная для моделирования, составила 0,58.
Я смоделировал 1000 образцов, используя метод имитации в Ime4, на основе установленных значений моих искусственных данных. Я подгоняю M0 и Ma к каждому и смотрю на результаты. Исходный набор данных содержал 180 наблюдений (по 10 для каждого из 18 субъектов), и моделируемые данные имеют такую же структуру.
Суть в том, что разница очень мала.
Так почему это происходит? @ Ганг обоснованно предположил, что отсутствие возможности корреляции приводит к некоррелированию случайных эффектов. Возможно, так и должно быть; но в этой реализации допускается корреляция случайных эффектов, а это означает, что данные могут выводить параметры в правильном направлении, независимо от модели. Неправильность неправильной модели проявляется в вероятности, поэтому вы можете (иногда) различать две модели на этом уровне. Модель смешанных эффектов в основном подгоняет линейные регрессии к каждому субъекту под влиянием того, что, по мнению модели, должно быть. Неправильная модель приводит к подгонке менее вероятных значений, чем при правильной модели. Но параметры, в конце концов, зависят от соответствия фактическим данным.
Вот мой несколько неуклюжий код. Идея заключалась в том, чтобы подогнать данные исследования сна, а затем создать имитированный набор данных с теми же параметрами, но с большей корреляцией для случайных эффектов. Этот набор данных был передан в simulate.lmer () для имитации 1000 образцов, каждый из которых подходил в обоих направлениях. После того, как я соединил подгоненные объекты, я мог извлечь различные особенности подгонки и сравнить их, используя t-тесты или что-то еще.
источник
Плацидия уже предоставила подробный ответ, используя смоделированные данные, основанные на
sleepstudy
наборе данных. Вот еще один (менее строгий) ответ, который также используетsleepstudy
данные.Мы видим, что можно повлиять на предполагаемую корреляцию между случайным пересечением и случайным наклоном, «сдвигая» случайную переменную предиктора. Посмотрите на результаты моделей
fm1
иfm2
ниже:Из результатов модели мы видим, что корреляция случайных отклонений изменилась. Однако наклоны (фиксированные и случайные) остались прежними, как и оценка остаточной дисперсии. Оценки перехватов (фиксированные и случайные) изменились в ответ на сдвинутую переменную.
Де-соотнесение случайной перехватывать-наклонную ковариацию для LMMS обсуждаются в конспектах доктора Джека Вайса здесь . Вайс отмечает, что уменьшение дисперсионной корреляции таким образом иногда может помочь сходимости моделей, между прочим.
В приведенном выше примере изменяется случайная корреляция (параметр «P5»). Частично обращаясь к Q3 ОП, мы видим из вышеприведенного вывода, что:
источник