Я анализирую результаты эксперимента времени реакции в R.
Я провел повторные измерения ANOVA (1 внутри-субъектный фактор с 2 уровнями и 1 между субъектный фактор с 2 уровнями). Я запустил аналогичную линейную смешанную модель, и я хотел обобщить результаты lmer в виде таблицы ANOVA с использованием lmerTest::anova
.
Не поймите меня неправильно: я не ожидал идентичных результатов, однако я не уверен в степени свободы в lmerTest::anova
результатах. Мне кажется, это скорее отражает ANOVA без агрегации на предметном уровне.
Мне известно о том, что вычисление степеней свободы в моделях со смешанными эффектами является сложным, но lmerTest::anova
упоминается как одно из возможных решений в обновленной ?pvalues
теме ( lme4
пакете).
Является ли этот расчет правильным? Есть ли результаты lmerTest::anova
правильно отражают указанную модель?
Обновление: я сделал индивидуальные различия больше. Степени свободы в lmerTest::anova
большей степени отличаются от простой ановой, но я все еще не уверен, почему они так велики для внутрисубъектного фактора / взаимодействия.
# mini example with ANT dataset from ez package
library(ez); library(lme4); library(lmerTest)
# repeated measures ANOVA with ez package
data(ANT)
ANT.2 <- subset(ANT, !error)
# update: make individual differences larger
baseline.shift <- rnorm(length(unique(ANT.2$subnum)), 0, 50)
ANT.2$rt <- ANT.2$rt + baseline.shift[as.numeric(ANT.2$subnum)]
anova.ez <- ezANOVA(data = ANT.2, dv = .(rt), wid = .(subnum),
within = .(direction), between = .(group))
anova.ez
# similarly with lmer and lmerTest::anova
model <- lmer(rt ~ group * direction + (1 | subnum), data = ANT.2)
lmerTest::anova(model)
# simple ANOVA on all available data
m <- lm(rt ~ group * direction, data = ANT.2)
anova(m)
Результаты кода выше [ обновлено ]:
anova.ez
$ ANOVA
Effect DFn DFd F p p<.05 ges
2 group 1 18 2.6854464 0.11862957 0.1294475137
3 direction 1 18 0.9160571 0.35119193 0.0001690471
4 group:direction 1 18 4.9169156 0.03970473 * 0.0009066868
lmerTest :: ANOVA (модель)
Analysis of Variance Table of type 3 with Satterthwaite
approximation for degrees of freedom
Df Sum Sq Mean Sq F value Denom Pr(>F)
group 1 13293 13293 2.6830 18 0.1188
direction 1 1946 1946 0.3935 5169 0.5305
group:direction 1 11563 11563 2.3321 5169 0.1268
ANOVA (м)
Analysis of Variance Table
Response: rt
Df Sum Sq Mean Sq F value Pr(>F)
group 1 1791568 1791568 242.3094 <2e-16 ***
direction 1 728 728 0.0985 0.7537
group:direction 1 12024 12024 1.6262 0.2023
Residuals 5187 38351225 7394
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
источник
ezAnova
предупреждение, поскольку вы не должны запускать 2x2 anova, если на самом деле ваши данные взяты из дизайна 2x2x2.ez
может быть переформулировано; на самом деле он имеет две важные части: (1) агрегирование данных и (2) материал о частичном проектировании. № 1 больше всего относится к несоответствию, поскольку объясняет, что для проведения традиционной ановы, не связанной со смешанными эффектами, необходимо объединить данные в одно наблюдение для каждой ячейки проекта. В этом случае нам нужно одно наблюдение для каждого субъекта на уровень переменной «направление» (при сохранении групповых меток для субъектов). ezANOVA вычисляет это автоматически.summary(aov(rt ~ group*direction + Error(subnum/direction), data=ANT.2))
и это дает 16 (?) DFS дляgroup
и 18 дляdirection
иgroup:direction
. Тот факт, что существует около 125 наблюдений на комбинацию «группа / направление», в значительной степени не имеет значения для RM-ANOVA, см., Например, мой собственный вопрос stats.stackexchange.com/questions/286280 : направление проверяется, так сказать, против субъекта. Направление взаимодействия.lmerTest
этими оценками ~ 125 dfs.lmerTest::anova(model2, ddf="Kenward-Roger")
возвращает 18.000 df дляgroup
и17.987
df для двух других факторов, что находится в отличном согласии с RM-ANOVA (согласно ezAnova). Мой вывод таков, что приближение Саттервейтаmodel2
почему-то не удается .Я в целом согласен с анализом Бена, но позвольте мне добавить пару замечаний и немного интуиции.
Во-первых, общие результаты:
Бен обрисовывает в общих чертах проект, в который
subnum
вложен вgroup
то время какdirection
иgroup:direction
пересеченsubnum
. Это означает, что естественный термин ошибки (т. Е. Так называемый "уровень ошибок включения") дляgroup
является, вsubnum
то время как уровень ошибок включения для других терминов (включаяsubnum
) является остатками.Эта структура может быть представлена в так называемой диаграмме фактор-структуры:
Здесь случайные термины заключены в квадратные скобки,
0
представляют общее среднее значение (или точку пересечения),[I]
представляют термин ошибки, числа суперскриптов представляют собой количество уровней, а числа подскриптов представляют собой количество степеней свободы, предполагающих сбалансированный дизайн. Диаграмма показывает, что естественный член ошибки (включающий в себя уровень ошибок) дляgroup
issubnum
и что числитель df дляsubnum
, который равен знаменателю dfgroup
, равен 18: 20 минус 1 df дляgroup
и 1 df для общего среднего. Более полное введение в диаграммы факторной структуры доступно в главе 2 здесь: https://02429.compute.dtu.dk/eBook .Если бы данные были точно сбалансированы, мы могли бы построить F-тесты из SSQ-декомпозиции, как указано в
anova.lm
. Поскольку набор данных очень близко сбалансирован, мы можем получить приблизительные F-тесты следующим образом:Здесь все значения F и p вычисляются в предположении, что все слагаемые имеют остаточные значения в качестве страты ошибок, и это верно для всех, кроме «группы». Вместо этого «сбалансированный-правильный» F- тест для группы:
где мы используем
subnum
MS вместоResiduals
MS в знаменателе F- значения.Обратите внимание, что эти значения довольно хорошо совпадают с результатами Satterthwaite:
Остальные различия связаны с тем, что данные не являются точно сбалансированными.
ОП сравнивается
anova.lm
сanova.lmerModLmerTest
, что нормально, но для сравнения с тем, как мы должны использовать те же контрасты. В этом случае есть разница междуanova.lm
и,anova.lmerModLmerTest
поскольку они производят тесты типа I и III по умолчанию соответственно, и для этого набора данных есть (небольшая) разница между контрастами типов I и III:Если бы набор данных был полностью сбалансирован, контрасты типа I были бы такими же, как контрасты типа III (на которые не влияет наблюдаемое количество образцов).
Последнее замечание заключается в том, что «медлительность» метода Кенварда-Роджера не связана с повторной подгонкой модели, а связана с тем, что она включает вычисления с предельной дисперсионно-ковариационной матрицей наблюдений / невязок (5191x5191 в данном случае), которая не является случай для метода Satterthwaite.
По поводу модели2
Что касается model2, ситуация становится более сложной, и я думаю, что легче начать обсуждение с другой моделью, где я включил «классическое» взаимодействие между
subnum
иdirection
:Поскольку дисперсия, связанная с взаимодействием, по существу равна нулю (при наличии
subnum
случайного основного эффекта) член взаимодействия не влияет на вычисление степеней свободы знаменателя, F- значений и p- значений:Тем не менее,
subnum:direction
является ли это ошибочной стратой для ошибки,subnum
поэтому, если мы удалимsubnum
все связанные SSQ, снова перейдем вsubnum:direction
Теперь естественным условием ошибки для
group
,direction
аgroup:direction
являетсяsubnum:direction
и сnlevels(with(ANT.2, subnum:direction))
= 40 и четырьмя параметрами знаменателя степени свободы для этих терминов должно быть около 36:Эти F- тесты также могут быть аппроксимированы «сбалансированно-корректными» F- тестами:
Теперь переходим к model2:
Эта модель описывает довольно сложную ковариационную структуру со случайным эффектом с дисперсионно-ковариационной матрицей 2x2. С параметризацией по умолчанию нелегко иметь дело, и нам лучше перенастроить модель:
Если мы сравним
model2
сmodel4
, у них одинаково много случайных эффектов; 2 для каждогоsubnum
, то есть 2 * 20 = 40 в общей сложности. В то время какmodel4
оговаривается один параметр дисперсии для всех 40 случайных эффектов,model2
оговаривается, что каждаяsubnum
пара случайных эффектов имеет нормальное распределение с двумя вариациями с матрицей дисперсии-ковариации 2x2, параметры которой определяютсяЭто указывает на переоснащение, но давайте сохраним это на другой день. Важным моментом здесь является то , что
model4
это особый случай,model2
и чтоmodel
это также особый случайmodel2
. Свободно (и интуитивно) говоря,(direction | subnum)
содержит или фиксирует изменения, связанные с основным эффектом,subnum
а также взаимодействиеdirection:subnum
. С точки зрения случайных эффектов мы можем думать об этих двух эффектах или структурах как о захвате изменений между строками и строками по столбцам соответственно:В этом случае эти оценки случайного эффекта, а также оценки параметров дисперсии показывают, что мы действительно имеем только случайный основной эффект
subnum
(вариация между строками), присутствующий здесь. К чему все это приводит, так это к тому, что знаменательные степени свободы Satterthwaite вявляется компромиссом между этими структурами основного эффекта и взаимодействия: группа DenDF остается в 18 (вложенная в
subnum
дизайн), ноdirection
иgroup:direction
DenDF являются компромиссами между 36 (model4
) и 5169 (model
).Я не думаю, что здесь что-то указывает, что приближение Satterthwaite (или его реализация в lmerTest ) является ошибочным.
Эквивалентная таблица с методом Кенварда-Роджера дает
Неудивительно, что KR и Satterthwaite могут различаться, но для всех практических целей разница в p-значениях незначительна. Мой анализ выше показывает, что
DenDF
fordirection
иgroup:direction
не должны быть меньше, чем ~ 36 и, вероятно, больше, чем тот, что у нас есть только случайный основной эффектdirection
присутствия, так что, если что-то мне кажется, это показатель того, что метод KR становитсяDenDF
слишком низким в этом случае. Но имейте в виду, что данные на самом деле не поддерживают(group | direction)
структуру, поэтому сравнение немного искусственное - было бы более интересно, если бы модель действительно поддерживалась.источник
model3
. Тем не менее, он используетsubnum:direction
в качестве термина ошибки для тестированияdirection
. Тогда как здесь вы можете заставить это произойти, только исключив,(1|subnum)
как вmodel4
. Почему? (2b) Кроме того, RM-ANOVA дает df = 18 дляdirection
, а не 36, как вы входитеmodel4
. Почему?summary(aov(rt ~ group*direction + Error(subnum/direction), data=ANT.2))
.subnum
иsubnum:direction
ненулевые, тоanova(lm(rt2 ~ group * direction + subnum + subnum:direction, data = ANT.2))
дает 18 df для всех трех факторов, и это то, что поднимает KR-метод. Это можно увидеть уже в том случае,model3
когда KR дает основанный на дизайне 18 df для всех терминов, даже когда дисперсия взаимодействия равна нулю, в то время как Satterthwaite распознает исчезающий дисперсионный член и соответствующим образом корректирует df ...