На практике, как рассчитывается ковариационная матрица случайных эффектов в модели смешанных эффектов?

19

В основном меня интересует, как применяются различные ковариационные структуры и как рассчитываются значения внутри этих матриц. Такие функции, как lme (), позволяют нам выбирать, какую структуру мы бы хотели, но я бы хотел знать, как они оцениваются.

Рассмотрим модель линейных смешанных эффектов .Y=Xβ+Zu+ϵ

Где и . Более того:ε d ~ N ( 0 , R )udN(0,D)ϵdN(0,R)

Var(Y|X,Z,β,u)=R

Var(Y|X,β)=ZDZ+R=V

Для простоты примем .R=σ2In

В основном мой вопрос: как точно оценивается по данным для различных параметризаций? Скажем, если мы предположим, что диагонально (случайные эффекты независимы) или полностью параметризовано (в случае, если я больше интересуюсь в данный момент), или какая-либо другая параметризация? Существуют ли простые оценки / уравнения для них? (Это, без сомнения, будет итеративно оценено.)D DDDD

РЕДАКТИРОВАТЬ: Из книги Variance Components (Searle, Casella, McCulloch 2006) мне удалось высветить следующее:

Если тогда компоненты дисперсии обновляются и рассчитываются следующим образом:D=σu2Iq

σu2(k+1)=u^Tu^σu2(k)trace(V1ZTZ)

σe2(k+1)=Y(YXβ^(k)Zu^(k))/n

Где и - это е обновления соответственно.β^(k)кu^(k)k

Существуют ли общие формулы, когда является диагональю блока или полностью параметризован? Я предполагаю, что в полностью параметризованном случае разложение Холецкого используется для обеспечения положительной определенности и симметрии.D

DCL
источник
2
arxiv.org/pdf/1406.5823 (в прессе в журнале статистического программного обеспечения ) может быть полезным ...
Бен Болкер

Ответы:

8

Goldstein .pdf @probabilityislogic - отличный документ. Вот список некоторых ссылок, которые обсуждают ваш конкретный вопрос:

Harville, 1976: расширение теоремы Гаусса-Маркова для оценки случайных эффектов .

Harville, 1977: Подходы с максимальным правдоподобием для оценки компонент дисперсии и связанных с этим проблем .

Laird and Ware, 1982: модели случайных эффектов для продольных данных .

McCulloch, 1997: алгоритмы максимального правдоподобия для обобщенных линейных смешанных моделей .

Руководство SAS пользователя Отрывок для смешанной процедуры имеет много информации о оценке ковариации и многих источниках более (начиная со стр 3968).

Существует множество качественных учебников по анализу данных по продольным / повторным измерениям, но вот один, который подробно описывает реализацию в R (от авторов lme4and nlme):

Пинейро и Бейтс, 2000: Модели со смешанными эффектами в S и S-PLUS .

РЕДАКТИРОВАТЬ : еще одна соответствующая статья: Линдстрем и Бейтс, 1988: Ньютон-Рафсон и EM Алгоритмы для линейных моделей смешанных эффектов для данных повторных измерений .

РЕДАКТИРОВАТЬ 2 : И еще: Дженрич и Шлухтер, 1986: Несбалансированные модели с повторными измерениями со структурированными ковариационными матрицами .


источник
Я взглянул на Пиньейру и Бейтса, в частности главу 2 (по теории и вычислениям), но я, кажется, ничего не сказал о том, как обеспечивается и оценивается ковариационная структура? Я пойду через это снова в ближайшее время. У меня есть несколько таких бумаг, которые я просто сижу здесь, и мне определенно придется прочитать их снова. Приветствия.
DCL
1
@dcl Оглядываясь на главу 2 P & B, я вижу, что они могут затмевать некоторые интересующие вас шаги (они упоминают оптимизацию логарифмического правдоподобия с помощью параметров ковариации, но не говорят как ). При этом раздел 2.2.8 может быть разделом, который лучше всего отвечает на ваш вопрос.
1
@dcl Добавлен еще один источник, который может помочь.
спасибо за ссылки. В прошлом я просматривал эти статьи, некоторые из них были довольно техническими для меня. Сейчас я еще раз просмотрю их, но, на первый взгляд, я не могу понять, чего хочу от них.
DCL
1
@dcl Извините за стену ссылок, но ваш вопрос заключается в том, что человек может провести пару полных лекций, обсуждая (это очень хороший вопрос, который как бы подметен, когда впервые узнаете о моделях со смешанными эффектами). Помимо плавания по литературе, вы могли бы взглянуть на исходный код lme4и посмотреть, как он справляется с этой оценкой.
7

Харви Гольдштейн неплохое место для старта.

Как и в случае наиболее сложных методов оценки, это зависит от программного пакета. Однако часто то, что делается, состоит из следующих шагов:

  1. DD0RR0i=1
  2. D=Di1R=Ri1βuϵβiuiϵi
  3. β=βiu=uiϵ=ϵiDRDiRi
  4. язнак равноя+1

Одним простым и быстрым методом является IGLS, который основан на итерации между двумя процедурами наименьших квадратов и подробно описан во второй главе. Недостатком является то, что он не работает хорошо для компонентов дисперсии, близких к нулю.

probabilityislogic
источник
Я знаю, что это общий метод, но как оцениваются D и R, какие уравнения используются для различных структур? Каковы хорошие начальные значения? Я проверю PDF сейчас, ура.
DCL