Я выполнил эксперимент, в котором я воспитывал разные семьи из двух разных групп населения. Каждой семье был назначен один из двух видов лечения. После эксперимента я измерил несколько признаков на каждого человека. Чтобы проверить эффект лечения или источника, а также их взаимодействие, я использовал линейную модель смешанного эффекта с семейством в качестве случайного фактора, т.е.
lme(fixed=Trait~Treatment*Source,random=~1|Family,method="ML")
пока все хорошо, теперь я должен вычислить относительные компоненты дисперсии, то есть процент изменения, который объясняется либо обработкой или источником, а также взаимодействием.
Без случайного эффекта я мог бы легко использовать суммы квадратов (SS) для вычисления дисперсии, объясняемой каждым фактором. Но для смешанной модели (с оценкой ML) SS не существует, поэтому я подумал, что мог бы использовать Лечение и Источник в качестве случайных эффектов для оценки дисперсии, т.е.
lme(fixed=Trait~1,random=~(Treatment*Source)|Family, method="REML")
Однако в некоторых случаях lme не сходится, поэтому я использовал lmer из пакета lme4:
lmer(Trait~1+(Treatment*Source|Family),data=DATA)
Где я извлекаю отклонения из модели, используя функцию итога:
model<-lmer(Trait~1+(Treatment*Source|Family),data=regrexpdat)
results<-VarCorr(model)
variances<-results[,3]
Я получаю те же значения, что и с функцией VarCorr. Затем я использую эти значения для вычисления фактического процента отклонения, принимая сумму в качестве общего отклонения.
Я борюсь с интерпретацией результатов исходной модели Ime (с обработкой и источником в качестве фиксированных эффектов) и случайной моделью для оценки компонентов дисперсии (с обработкой и источником в качестве случайного эффекта). Я нахожу в большинстве случаев, что процент дисперсии, объясняемый каждым фактором, не соответствует значению фиксированного эффекта.
Например, для признака HD, Первоначальное время предполагает тенденцию к взаимодействию, а также значимость для лечения. Используя обратную процедуру, я обнаружил, что лечение имеет тенденцию, близкую к значительной. Однако, оценивая компоненты дисперсии, я обнаружил, что источник имеет наибольшую дисперсию, составляя до 26,7% от общей дисперсии.
Lme:
anova(lme(fixed=HD~as.factor(Treatment)*as.factor(Source),random=~1|as.factor(Family),method="ML",data=test),type="m")
numDF denDF F-value p-value
(Intercept) 1 426 0.044523 0.8330
as.factor(Treatment) 1 426 5.935189 0.0153
as.factor(Source) 1 11 0.042662 0.8401
as.factor(Treatment):as.factor(Source) 1 426 3.754112 0.0533
И лмер
summary(lmer(HD~1+(as.factor(Treatment)*as.factor(Source)|Family),data=regrexpdat))
Linear mixed model fit by REML
Formula: HD ~ 1 + (as.factor(Treatment) * as.factor(Source) | Family)
Data: regrexpdat
AIC BIC logLik deviance REMLdev
-103.5 -54.43 63.75 -132.5 -127.5
Random effects:
Groups Name Variance Std.Dev. Corr
Family (Intercept) 0.0113276 0.106431
as.factor(Treatment) 0.0063710 0.079819 0.405
as.factor(Source) 0.0235294 0.153393 -0.134 -0.157
as.factor(Treatment)L:as.factor(Source) 0.0076353 0.087380 -0.578 -0.589 -0.585
Residual 0.0394610 0.198648
Number of obs: 441, groups: Family, 13
Fixed effects:
Estimate Std. Error t value
(Intercept) -0.02740 0.03237 -0.846
Отсюда мой вопрос: правильно ли я делаю? Или я должен использовать другой способ оценить количество отклонений, объясняемых каждым фактором (то есть Лечение, Источник и их взаимодействие). Например, будут ли размеры эффекта более подходящим способом?
Ответы:
Одним из распространенных способов определения относительного вклада каждого фактора в модель является удаление фактора и сравнение относительной вероятности с чем-то вроде теста хи-квадрат:
Поскольку способ вычисления вероятностей между функциями может немного отличаться, я обычно сравниваю их только для одного и того же метода.
источник
1-pchisq(logLik(model1) - logLik(model2), 1)
?