Линейное моделирование смешанных эффектов с данными двойниковых исследований

14

Предположим, у меня есть некоторая переменная ответа которая была измерена от го брата в м семействе. Кроме того, некоторые поведенческие данные были собраны в то же время от каждого субъекта. Я пытаюсь проанализировать ситуацию с помощью следующей линейной модели смешанных эффектов: j i x i jyijjixij

yij=α0+α1xij+δ1ixij+εij

где и - фиксированный перехват и наклон соответственно, - случайный наклон, а - остаток.α 1 δ 1 i ε i jα0α1δ1iεij

Предположения для случайных эффектов и residual : (при условии, что в каждом семействе только два родных брата) ε i jδ1iεij

δ1idN(0,τ2)(εi1,εi2)TdN((0,0)T,R)

где - неизвестный параметр дисперсии, а дисперсионно-ковариационная структура - симметричная матрица формы 2 x 2τ2R

(r12r122r122r22)

это моделирует корреляцию между двумя братьями и сестрами.

  1. Это подходящая модель для такого исследования родного брата?

  2. Данные немного сложнее. Среди 50 семей около 90% из них - близнецы-дизиготы. Для остальных семей,

    1. двое имеют только одного родного брата;
    2. двое имеют одну пару DZ плюс один родной брат; и
    3. у двух есть одна пара DZ плюс два дополнительных родных брата.


    Я верю, lmeчто пакет R nlmeможет легко справиться (1) с отсутствующей или несбалансированной ситуацией. Моя проблема в том, как бороться с (2) и (3)? Одна возможность, которую я могу придумать, состоит в том, чтобы разбить каждое из этих четырех семейств в (2) и (3) на два, чтобы каждое подсемейство имело одного или двух братьев и сестер, чтобы вышеупомянутая модель все еще могла применяться. Это нормально? Другим вариантом было бы просто выбросить данные из дополнительных одного или двух братьев и сестер в (2) и (3), что кажется пустой тратой. Есть ли подходы лучше?

  3. Кажется, что это lmeпозволяет зафиксировать значения в остаточной дисперсионно-ковариационной матрице , например, = 0,5. Имеет ли смысл навязывать структуру корреляции, или я должен просто оценить ее на основе данных?rRr122

bluepole
источник
1
Что обозначает ? xj
Макро
@Macro: Спасибо, что заметили это. Просто изменили OP, чтобы указать, что является пояснительной переменной, поведенческой мерой для каждого брата. xij
bluepole
1
Очень интересный вопрос и приложение. Я мог что-то упустить, но мне кажется, что эта модель слишком параметризована. Коррелированных ошибки & может быть эффективно разложены на «неразделенная» компонент и «общий» компонент, последний из которых имеет ту же функцию, что и б 0 я . Вы должны либо удалить б 0 я , сделать е независимые одинаково распределенные ошибки с, или наложить ограничения , как г - 12 = .5 для идентифицируемости - вы делаете , что с целью разъединить окружающую среду / генетические компоненты к родственным корреляции?ϵi1,ϵi2δ0iδ0iϵr122=.5
Макрос
@Macro: Вы правы: не нужен в модели. Спасибо за указание на это! Странно не жалуется на такую ​​избыточность. δ0ilme
bluepole
Вы все еще работаете с этой сверхпараметрической моделью (эта часть вашего вопроса не была отредактирована)?
Макро

Ответы:

10

Вы можете включить двойников и не двойников в унифицированную модель, используя фиктивную переменную и включив случайные наклоны в эту фиктивную переменную. Поскольку все семьи имеют не более одного набора близнецов, это будет относительно просто:

Пусть если родной брат j в семье i является близнецом, и 0 в противном случае. Я предполагаю, что вы также хотите, чтобы случайный наклон отличался для близнецов по сравнению с обычными братьями и сестрами - если нет, не включайте член η i 3 в модель ниже.Aij=1jiηi3

Затем подойдет модель:

yij=α0+α1xij+ηi0+ηi1Aij+ηi2xij+ηi3xijAij+εij
  • - фиксированный эффект, как в вашей спецификацииα0,α1

  • - это «случайный» базовый случайный эффект, а η i 1 - дополнительный случайный эффект, который позволяет близнецам быть более похожими, чем обычные братья и сестры. Размеры соответствующих случайных отклонений дают количественную оценку того, насколько похожи братья и сестры и насколько больше близнецов больше, чем у обычных братьев и сестер. Обратите внимание, что как близнецовые, так и не близнецовые корреляции характеризуются этой моделью - двойные корреляции рассчитываются путем соответствующего суммирования случайных эффектов (подключите A i j = 1 ).ηi0ηi1Aij=1

  • и η i 3 имеют аналогичные роли, только они действуют как случайные наклоны x i jηi2ηi3xij

  • - термины ошибок iid - обратите внимание, что я написал вашу модель немного по-другому с точки зрения случайных перехватов, а не коррелированных остаточных ошибок.εij

Вы можете соответствовать модели, используя Rпакет lme4. В приведенном ниже коде зависимая переменная: yфиктивная переменная A, предиктор x, произведение фиктивной переменной, и предиктор - это Axи famIDесть номер идентификатора для семейства. Предполагается, что ваши данные хранятся во фрейме данных Dс этими переменными в виде столбцов.

library(lme4) 
g <- lmer(y ~ x + (1+A+x+Ax|famID), data=D) 

Переменные случайных эффектов и оценки фиксированных эффектов можно просмотреть, набрав summary(g). Обратите внимание, что эта модель позволяет свободно коррелировать случайные эффекты друг с другом.

Во многих случаях может иметь больше смысла (или быть более легко интерпретируемым) предполагать независимость между случайными эффектами (например, это предположение часто делается для разложения генетической корреляции и семейной корреляции между окружающей средой), и в этом случае вы вместо этого напечатаете

g <- lmer(y ~ x + (1|famID) + (A-1|famID) + (x-1|famID) +(Ax-1|famID), data=D) 
макрос
источник
Это действительно хорошее решение, и мне это нравится! Скоро попробую, и посмотрим, что получится ... Большое спасибо!
bluepole
Пожалуйста. Если вы нашли это решение полезным, рассмотрите возможность принятия ответа :)
Макрос
Две проблемы: 1) Поскольку большинство предметов - близнецы-дизиготы, ваш подход, по-видимому, не моделирует корреляцию между парой близнецов DZ. 2) Только 4 семьи имеют дополнительных братьев и сестер. Я боюсь, что было бы трудно оценить случайные эффекты для братьев и сестер, основываясь только на этих 4 семьях. Поскольку разница между парой близнецов DZ и другим родным братом относительно невелика (в основном экологическая, а не генетическая), возможно, я могу просто проигнорировать тонкую разницу между близнецом и родным братом и рассматривать этих нескольких братьев и сестер как близнецов со случайными эффектами, как в вашей модели или с коррелированными остатками, как в моем ОП.
bluepole
σ02+σ12σ02+σ12+σε2
σ02,σ12ηi0,ηi1σε2
ηi0ηi2