Мой вопрос очень тесно связан с предыдущим постом указания срока Error () в повторных измерениях ANOVA в R . Тем не менее, я хотел бы получить более полное представление о том, как определить термин ошибки.
Предположим, у меня есть двухсторонний повторный ANOVA. Фактором межгруппового эффекта является лечение (контроль по сравнению с плацебо), в то время как время является внутригрупповым эффектом, измеренным многократно более 4 раз (T1 ~ T4). Идентификатор пациента записывается как субъект. Здесь я позаимствовал данные из примера из учебника в http://gjkerns.github.io/R/2012/01/20/power-sample-size.html, чтобы данные выглядели так
Time Subject Method NDI
0min 1 Treat 51.01078
15min 1 Treat 47.12314
48hrs 1 Treat 26.63542
96hrs 1 Treat 20.78196
0min 2 Treat 42.61345
15min 2 Treat 32.77171
Чтобы применить ANOVA:
aovComp <- aov(NDI ~ Time*Method + Error(Subject/Time), theData)
summary(aovComp)
Error: Subject
Df Sum Sq Mean Sq F value Pr(>F)
Method 1 113 112.7 0.481 0.491
Residuals 58 13579 234.1
Error: Subject:Time
Df Sum Sq Mean Sq F value Pr(>F)
Time 3 13963 4654 103.789 < 2e-16 ***
Time:Method 3 1221 407 9.074 1.3e-05 ***
Residuals 174 7803 45
Я также попробовал другой термин ошибки:
aovComp1 <- aov(NDI ~ Time*Method + Error(Subject), theData)
summary(aovComp1)
Error: Subject
Df Sum Sq Mean Sq F value Pr(>F)
Method 1 113 112.7 0.481 0.491
Residuals 58 13579 234.1
Error: Within
Df Sum Sq Mean Sq F value Pr(>F)
Time 3 13963 4654 103.789 < 2e-16 ***
Time:Method 3 1221 407 9.074 1.3e-05 ***
Residuals 174 7803 45
Может ли кто-нибудь помочь мне объяснить разницу между этими двумя терминами ошибок? Если первый член является правильным, что означают результаты второго термина ошибки?
Обновление от @amoeba: два выхода одинаковы, поэтому кажется, что в этом случае нет никакой разницы, но остается вопрос, в чем заключается принципиальная разница . Есть Error(subject)
и Error(subject/time)
всегда одно и то же?
источник
time
), тоError(subject)
иError(subject/time)
будут давать различные значения F и p дляtime
.Ответы:
Во-первых,
subject/time
это обозначение дляtime
вложенныхsubject
, и поэтому расширяется до двух частей,subject
иsubject:time
взаимодействие. Таким образом, более уместным становится вопрос: когда следует указыватьsubject:time
взаимодействие и какую разницу оно имеет?Прежде чем ответить на этот вопрос, еще одна важная вещь, которую нужно осознать, - это то, что все модели включают в себя один дополнительный термин ошибки, который не нужно указывать, - это термин ошибки, связанный с отдельными измерениями (самый низкий уровень, если вы думаете об этом иерархически).
В этом случае
subject:time
взаимодействие - это тот самый низкий уровень, который всегда включен в модель. Таким образом, используяError(subject)
иError(subject/time)
дать тот же результат; единственное отличие состоит в том, что в выходных данных этот уровень результатов вызываетсяWithin
для первого и вызываетсяsubject:time
для второго.Однако в тех случаях, когда в каждой
subject/time
комбинации имеется несколько измерений , необходимо указатьsubject:time
взаимодействие, поскольку тогда это взаимодействие не находится на самом низком уровне.источник
subject/time
комбинации, почему мы обязательно Хотите проверить эффект поtime
отношению кsubject:time
взаимодействию? Это, по сути, содержание моего вопроса здесь stats.stackexchange.com/questions/286280 , поэтому я бы пригласил всех будущих читателей этой темы искать там концептуальное обоснование.