Мы знаем, что парное t- тестирование - это всего лишь частный случай одностороннего повторного измерения (или внутри субъекта) ANOVA, а также линейной модели смешанного эффекта, которую можно продемонстрировать с помощью функции lme () пакета nlme в R как показано ниже.
#response data from 10 subjects under two conditions
x1<-rnorm(10)
x2<-1+rnorm(10)
# Now create a dataframe for lme
myDat <- data.frame(c(x1,x2), c(rep("x1", 10), rep("x2", 10)), rep(paste("S", seq(1,10), sep=""), 2))
names(myDat) <- c("y", "x", "subj")
Когда я запускаю следующий парный t-тест:
t.test(x1, x2, paired = TRUE)
Я получил этот результат (вы получите другой результат из-за генератора случайных чисел):
t = -2.3056, df = 9, p-value = 0.04657
С помощью подхода ANOVA мы можем получить тот же результат:
summary(aov(y ~ x + Error(subj/x), myDat))
# the F-value below is just the square of the t-value from paired t-test:
Df F value Pr(>F)
x 1 5.3158 0.04657
Теперь я могу получить тот же результат в IME со следующей моделью, предполагая положительно определенную симметричную корреляционную матрицу для двух условий:
summary(fm1 <- lme(y ~ x, random=list(subj=pdSymm(form=~x-1)), data=myDat))
# the 2nd row in the following agrees with the paired t-test
# (Intercept) -0.2488202 0.3142115 9 -0.7918878 0.4488
# xx2 1.3325786 0.5779727 9 2.3056084 0.0466
Или другая модель, предполагающая составную симметрию для корреляционной матрицы двух условий:
summary(fm2 <- lme(y ~ x, random=list(subj=pdCompSymm(form=~x-1)), data=myDat))
# the 2nd row in the following agrees with the paired t-test
# (Intercept) -0.2488202 0.4023431 9 -0.618428 0.5516
# xx2 1.3325786 0.5779727 9 2.305608 0.0466
С парным t-тестом и односторонним повторным измерением ANOVA я могу записать традиционную модель среднего значения ячейки как
Yij = μ + αi + βj + εij, i = 1, 2; j = 1, ..., 10
где i индексирует условие, j индексирует субъект, Y ij - переменная отклика, µ - постоянная для фиксированного эффекта для общего среднего значения, α i - фиксированный эффект для условия, β j - случайный эффект для субъекта, следующего за N (0, σ p 2 ) (σ p 2 - дисперсия совокупности), а ε ij - остаточное число после N (0, σ 2 ) (σ 2 - дисперсия внутри объекта).
Я думал, что приведенная выше модель среднего значения ячейки не подходит для моделей Ime, но проблема в том, что я не могу придумать разумную модель для двух подходов Ime () с предположением о структуре корреляции. Причина в том, что модель Ime, кажется, имеет больше параметров для случайных компонентов, чем предложенная выше модель среднего значения ячейки. По крайней мере, модель lme обеспечивает точно такое же значение F, степени свободы и значение p, что не может сделать gls. Более конкретно, gls дает неправильные DFs из-за того, что он не учитывает тот факт, что у каждого субъекта есть два наблюдения, что приводит к сильно раздутым DFs. Скорее всего, модель lme чрезмерно параметризована при определении случайных эффектов, но я не знаю, что это за модель и каковы параметры. Так что проблема до сих пор не решена для меня.
источник
Ответы:
Эквивалентность моделей можно наблюдать, рассчитав корреляцию между двумя наблюдениями от одного и того же человека следующим образом:
Обратите внимание, что модели, однако, не совсем эквивалентны, так как модель случайного эффекта заставляет корреляцию быть положительной. Модель CS и модель t-test / anova - нет.
РЕДАКТИРОВАТЬ: Есть два других различия, а также. Во-первых, модели CS и случайного эффекта предполагают нормальность для случайного эффекта, а модель t-test / anova - нет. Во-вторых, модели CS и случайного эффекта подбираются с использованием максимального правдоподобия, в то время как анова подбирается с использованием средних квадратов; когда все сбалансировано, они согласятся, но не обязательно в более сложных ситуациях. Наконец, я бы с осторожностью использовал значения F / df / p из различных подгонок в качестве показателей того, насколько модели согласуются; см. знаменитую стяжку Дуга Бейтса на df's для более подробной информации. (КОНЕЦ РЕДАКТИРОВАНИЯ)
Проблема с вашим
R
кодом заключается в том, что вы не указали структуру корреляции должным образом. Вам нужно использоватьgls
сcorCompSymm
корреляционной структурой.Создайте данные, чтобы получить эффект объекта:
Тогда вот как бы вы подходили к случайным эффектам и моделям составной симметрии.
Стандартные ошибки из модели случайных эффектов:
И корреляция и остаточное отклонение от модели CS:
И они равны тому, что ожидается:
Другие корреляционные структуры обычно не соответствуют случайным эффектам, а просто указывают желаемую структуру; Одним из распространенных исключений является модель случайного эффекта AR (1) +, которая имеет случайный эффект и корреляцию AR (1) между наблюдениями одного и того же случайного эффекта.
РЕДАКТИРОВАТЬ 2: Когда я подхожу к трем вариантам, я получаю точно такие же результаты, за исключением того, что gls не пытается угадать df для рассматриваемого срока.
(Перехват здесь другой, потому что при кодировании по умолчанию это не среднее значение для всех предметов, а среднее значение для первого предмета.)
Также интересно отметить, что более новый
lme4
пакет дает те же результаты, но даже не пытается вычислить p-значение.источник
Вы также можете рассмотреть возможность использования функции
mixed
в пакетеafex
для возврата значений p с приближением Кенварда-Роджера df, которое возвращает идентичные значения p в виде парного t-теста:Или
источник