Вопрос CV
Я пытаюсь дать (а) подробное и краткое математическое представление (я) модели смешанных эффектов. Я использую lme4
пакет в R. Каково правильное математическое представление для моей модели?
Данные, научный вопрос и код R
Мой набор данных состоит из видов в разных регионах. Я проверяю, изменяется ли распространенность вида во время, ведущее к вымиранию (вымирание не обязательно является постоянным; оно может быть повторно заселено), или после колонизации.
lmer(prevalence ~ time + time:type + (1 + time + type:time | reg) + (1 + time + type:time | reg:spp))
- Распространенность - это доля страт, занимаемых видом в регионе-году
- Время - это непрерывная переменная, которая указывает время до исчезновения или колонизации; это всегда позитивно
- Тип - это категориальная переменная с двумя уровнями. Эти два уровня - «-» и «+». Когда тип - - это колонизация (уровень по умолчанию). Когда тип +, это вымирание.
- Reg - это категориальная переменная с девятью уровнями, указывающая регион
- Spp - категориальная переменная; количество уровней варьируется между регионами и варьируется между 48 уровнями и 144 уровнями.
На словах: переменная ответа - распространенность (доля занятых слоев). Фиксированные эффекты включали 1) и перехват, 2) время от события и 3) взаимодействие между временем события и типом события (колонизация или вымирание). Каждый из этих 3 фиксированных эффектов варьировался случайным образом в разных регионах. Внутри региона каждый эффект варьировался случайным образом среди видов.
Я пытаюсь понять, как написать математическое уравнение для модели. Я думаю, что понимаю, что происходит в коде R (хотя, я уверен, у меня есть некоторые пробелы в знаниях, и, надеюсь, выписывание формального математического выражения улучшит мое понимание).
Я немного искал в Интернете и на этих форумах. Конечно, я нашел тонны полезной информации (и, возможно, я добавлю ссылки на некоторые из них в редактировании этого вопроса). Тем не менее, я не мог найти тот «Rosetta Stone» из R-кода, переведенный в математику (мне удобнее с кодом), который действительно помог бы мне подтвердить, что я правильно понял эти уравнения. На самом деле, я знаю, что уже есть некоторые пробелы, но мы вернемся к этому.
Моя попытка
Базовая форма модели смешанных эффектов в матричной записи (на мой взгляд):
β
- Δ t Δ t + - матрица дизайна для фиксированных эффектов, - время после колонизации ( ), а - время после исчезновения ( )
time
time:type
- - матрица дизайна для случайных эффектов (уровень 1?), I () - функция индикатора, дающая 1, если выборка принадлежит назначенной области, и 0, в противном случае r индексируется, чтобы указать одну из девяти областей.
- γ и содержат параметры
- Е - это ошибки; Я не совсем уверен, как объяснить , хотя я понимаю, что одна из этих матриц дисперсии / ковариации будет выражать ковариации между наклонами и перехватами, например
Предполагая, что все пока что ~ правильно, это означает, что я хорошо на высшем уровне. Однако объяснение видоспецифического изменения параметров, вложенного в каждый регион, поставило меня в тупик еще больше.
Но я взломал что-то, что может иметь смысл ...
Каждый из параметров в получен из линейной комбинации видоспецифичных предикторов и параметров в пределах региона. Для каждого региона есть 3 строки, соответствующие 3 переменным предиктора. Каждая может быть индивидуально выражена какγ
-
- где является расчетной матрицей, специфичной для области а предиктор , является матрицей 1 на S параметров для региона (богатство в области = , например, 48 или 144), и является матрицей ошибок
В частности, для данного региона каждый из будет:
Это будет повторяться для каждого региона. Затем , например . Хотя, возможно, вместо , есть еще одна буква, например , которая обычно используется.
Редактировать: другие вопросы и ответы, которые были несколько полезны
Ответы:
Если я правильно понял код, почему бы просто не написать что-то вроде
источник