Как записать термин ошибки в повторных измерениях ANOVA в R: Ошибка (субъект) vs Ошибка (субъект / время)

Мой вопрос очень тесно связан с предыдущим постом указания срока Error () в повторных измерениях ANOVA в R . Тем не менее, я хотел бы получить более полное представление о том, как определить термин ошибки.

Предположим, у меня есть двухсторонний повторный ANOVA. Фактором межгруппового эффекта является лечение (контроль по сравнению с плацебо), в то время как время является внутригрупповым эффектом, измеренным многократно более 4 раз (T1 ~ T4). Идентификатор пациента записывается как субъект. Здесь я позаимствовал данные из примера из учебника в http://gjkerns.github.io/R/2012/01/20/power-sample-size.html, чтобы данные выглядели так

 Time Subject Method      NDI
 0min    1     Treat 51.01078
 15min   1     Treat 47.12314
 48hrs   1     Treat 26.63542
 96hrs   1     Treat 20.78196
 0min    2     Treat 42.61345
 15min   2     Treat 32.77171

Чтобы применить ANOVA:

aovComp <- aov(NDI ~ Time*Method + Error(Subject/Time), theData)
summary(aovComp)
Error: Subject
          Df Sum Sq Mean Sq F value Pr(>F)
Method     1    113   112.7   0.481  0.491
Residuals 58  13579   234.1              

Error: Subject:Time        
            Df Sum Sq Mean Sq F value  Pr(>F)    
Time          3  13963    4654 103.789 < 2e-16 ***
Time:Method   3   1221     407   9.074 1.3e-05 ***
Residuals   174   7803      45

Я также попробовал другой термин ошибки:

aovComp1 <- aov(NDI ~ Time*Method + Error(Subject), theData)
summary(aovComp1)

Error: Subject      
          Df Sum Sq Mean Sq F value Pr(>F)
Method     1    113   112.7   0.481  0.491
Residuals 58  13579   234.1               

Error: Within
             Df Sum Sq Mean Sq F value  Pr(>F)    
Time          3  13963    4654 103.789 < 2e-16 ***
Time:Method   3   1221     407   9.074 1.3e-05 ***
Residuals   174   7803      45

Может ли кто-нибудь помочь мне объяснить разницу между этими двумя терминами ошибок? Если первый член является правильным, что означают результаты второго термина ошибки?

Обновление от @amoeba: два выхода одинаковы, поэтому кажется, что в этом случае нет никакой разницы, но остается вопрос, в чем заключается принципиальная разница . Есть Error(subject)и Error(subject/time)всегда одно и то же?

r anova repeated-measures tiantianchen
источник

извините, я только что понял, что эти два термина дают одинаковые результаты. Так что я думаю, они одинаковы :-)

tiantianchen

Я надеялся на объяснение этого: /

vipin8169

Все, что я могу собрать о термине ошибки, это >> ». В схеме повторяющихся измерений нам нужно указать термин ошибки, который учитывает естественное изменение от участника к участнику. (Например, я мог бы немного иначе отреагировать на страшную музыку, чем вы делаю, потому что я люблю фильмы про зомби, а вы их ненавидите!) Мы делаем это с помощью функции Error (): в частности, мы говорим, что хотим контролировать это изменение между участниками по всем нашим переменным внутри субъекта ».

vipin8169

(+1) Они эквивалентны только в том случае, если для каждой комбинации субъект / время существует ровно 1 измерение. Если на комбинацию субъект / время имеется больше измерений (либо просто потому, что измерения были повторены, либо потому, что в дополнение к фактору B существует другой фактор внутри субъекта time), то Error(subject)и Error(subject/time)будут давать различные значения F и p для time.

амеба

Тот же вопрос на SO: stackoverflow.com/questions/37497948 - к сожалению, без полностью удовлетворительных ответов либо (imho).

амеба

Во-первых, subject/timeэто обозначение для timeвложенных subject, и поэтому расширяется до двух частей, subjectи subject:timeвзаимодействие. Таким образом, более уместным становится вопрос: когда следует указывать subject:timeвзаимодействие и какую разницу оно имеет?

Прежде чем ответить на этот вопрос, еще одна важная вещь, которую нужно осознать, - это то, что все модели включают в себя один дополнительный термин ошибки, который не нужно указывать, - это термин ошибки, связанный с отдельными измерениями (самый низкий уровень, если вы думаете об этом иерархически).

В этом случае subject:timeвзаимодействие - это тот самый низкий уровень, который всегда включен в модель. Таким образом, используя Error(subject)и Error(subject/time)дать тот же результат; единственное отличие состоит в том, что в выходных данных этот уровень результатов вызывается Withinдля первого и вызывается subject:timeдля второго.

Однако в тех случаях, когда в каждой subject/timeкомбинации имеется несколько измерений , необходимо указать subject:timeвзаимодействие, поскольку тогда это взаимодействие не находится на самом низком уровне.

Аарон оставил переполнение стека
источник

(У меня была открытая награда за этот вопрос, но она, к сожалению, закончилась вчера ...) +1, но я думаю, что этот ответ обходит стороной, что может быть главной проблемой здесь: при наличии нескольких измерений для каждой subject/timeкомбинации, почему мы обязательно Хотите проверить эффект по timeотношению к subject:timeвзаимодействию? Это, по сути, содержание моего вопроса здесь stats.stackexchange.com/questions/286280 , поэтому я бы пригласил всех будущих читателей этой темы искать там концептуальное обоснование.

амеба

Кроме того, здесь очень похожи вопросы и ответы: stats.stackexchange.com/questions/247582 .

амеба

Как записать термин ошибки в повторных измерениях ANOVA в R: Ошибка (субъект) vs Ошибка (субъект / время)

Ответы: