Почему повторные измерения ANOVA предполагают сферичность?
Под сферичностью я подразумеваю предположение, что дисперсия всех парных различий между группами должна быть одинаковой.
В частности, я не понимаю, почему это должно быть предположение, а не то, что отклонения наблюдаемых групповых оценок сами по себе одинаковы.
anova
repeated-measures
assumptions
sphericity
user1205901 - Восстановить Монику
источник
источник
Ответы:
Интуиция за предположением сферичности
Одним из предположений об общих, не повторяющихся показателях ANOVA является одинаковая дисперсия во всех группах.
(Мы можем понять это, потому что равная дисперсия, также известная как гомоскедастичность , необходима, чтобы оценка OLS в линейной регрессии была СИНИЙ и чтобы соответствующие t-тесты были действительными, см. Теорему Гаусса – Маркова . А ANOVA может быть реализован как линейный регрессия) .
Итак, давайте попробуем свести случай RM-ANOVA к случаю не-RM. Для простоты я буду иметь дело с однофакторным RM-ANOVA (без каких-либо межсубъектных эффектов), в котором субъектов записаны в условиях k RM.n k
У каждого субъекта может быть свое смещение или перехват. Если мы вычтем значения в одной группе из значений во всех других группах, мы отменим эти перехваты и придем к ситуации, когда мы сможем использовать не-RM-ANOVA, чтобы проверить, все ли эти различия групп равны нулю. Для того чтобы этот тест был действительным, нам нужно допустить равные дисперсии этих разностей k - 1 .k−1 k−1
Теперь мы можем вычесть группу № 2 из всех других групп, снова получая различий, которые также должны иметь равные дисперсии. Для каждой группы из k дисперсии соответствующих разностей k - 1 должны быть равны. Из этого сразу следует, что все k ( k - 1 ) / 2 возможных различий должны быть равны.k−1 k k−1 k(k−1)/2
Что и есть предположение о сферичности.
Почему групповые отклонения не должны быть равны самим себе?
Когда мы думаем о RM-ANOVA, мы обычно думаем о простой аддитивной модели в смешанном стиле в форме где α i - субъектные эффекты, β j - состояние эффектов, а & epsi ; ~ N ( 0 , σ 2 ) .
Для этой модели групповые различия будут следовать , т.е. все они будут иметь одинаковую дисперсию 2 σ 2 , поэтому сферичность сохраняется. Но каждая группа будет следовать смеси из n гауссиан со средними значениями при α i и дисперсиями σ 2 , что является некоторым сложным распределением с дисперсией V ( → α , σ 2 ), которая постоянна по группам.N(βj1−βj2,2σ2) 2σ2 n αi σ2 В( α⃗ , σ2)
Так что в этой модели, действительно, групповые дисперсии тоже одинаковы. Групповые ковариации также одинаковы, что означает, что эта модель подразумевает составную симметрию . Это более жесткое условие по сравнению со сферичностью. Как показывает мой интуитивный аргумент выше, RM-ANOVA может нормально работать в более общей ситуации, когда аддитивная модель, написанная выше , не выполняется .
Точное математическое утверждение
Я собираюсь добавить сюда кое-что из Huynh & Feldt, 1970, «Условия, при которых среднеквадратичные отношения в схемах повторных измерений имеют точные распределения»F .
Что происходит, когда нарушается сферичность?
Когда сферичность не сохраняется, мы можем ожидать, что RM-ANOVA (i) будет иметь увеличенный размер (больше ошибок типа I), (ii) уменьшит мощность (больше ошибок типа II). Можно исследовать это с помощью моделирования, но я не собираюсь делать это здесь.
источник
Оказывается, что эффект нарушения сферичности - это потеря мощности (т. Е. Повышенная вероятность ошибки типа II) и тестовая статистика (F-коэффициент), которую просто нельзя сравнить с табличными значениями F-распределения. F-тест становится слишком либеральным (т. Е. Доля отклонений нулевой гипотезы больше, чем альфа-уровень, когда нулевая гипотеза верна).
Точное изучение этого вопроса очень сложно, но, к счастью, Box и соавторы написали статью об этом: https://projecteuclid.org/download/pdf_1/euclid.aoms/1177728786
Одним словом, ситуация такова. Во-первых, скажем, у нас есть однофакторный дизайн повторных измерений с S-субъектами и A-экспериментальными обработками. В этом случае эффект независимой переменной проверяется путем вычисления F-статистики, которая вычисляется как отношение среднего квадрата эффекта к среднему квадрату. взаимодействия между предметным фактором и независимой переменной. Когда сферичность выполняется, эта статистика имеет распределение Фишера с и υ 2 = ( A - 1 ) ( S - 1 ) степеней свободы.υ1= A - 1 υ2= ( A - 1 ) ( S- 1 )
В вышеприведенной статье Box показано, что при сбое сферичности правильное число степеней свободы становится от коэффициента F, зависит от сферичности ϵ следующим образом: υ 1 = ϵ ( A - 1 ) υ 2 = ϵ ( A - 1 ) ( S - 1 )υ1 ε
Также Бокс представил индекс сферичности, который применяется к ковариационной матрице населения . Если мы назовем элементами этой таблицы AxA, то индексξа , а
Индекс сферичности Бокса лучше всего понять в отношении собственных значений ковариационной матрицы. Напомним, что ковариационные матрицы принадлежат к классу положительных полуопределенных матриц и поэтому всегда имеют положительные нулевые собственные значения. Таким образом, условие сферичности эквивалентно наличию всех собственных значений, равных постоянной.
Таким образом, когда сферичность нарушается, мы должны применить некоторую поправку к нашей F-статистике, и наиболее яркими примерами таких поправок являются, например, Greenhouse-Geisser и Huynh-Feldt
Без каких-либо исправлений ваши результаты будут предвзятыми и поэтому ненадежными. Надеюсь это поможет!
источник
Среднее значение выборки i-й группы
и что из ij-го субъекта
При условии независимости между субъектами, разница различий между двумя групповыми средствами
Теперь к вопросу о сферичности, который был поднят.
Следовательно, допущение о постоянной дисперсии всех парных разностей делает возможным выполнение t-критерия после оценки общей дисперсии. Это предположение вместе с постоянной дисперсией каждого наблюдения подразумевает, что ковариация между любой парой измерений постоянна для всех пар - Серджиоимеет отличный пост на эту тему. Таким образом, допущения отображают дисперсионно-ковариационную структуру для повторных измерений каждого субъекта в виде матрицы с константой по диагонали и другой константой вне диагонали. Когда все недиагональные записи равны нулю, это сводится к полностью независимой модели (которая может быть неприемлемой для многих повторных исследований измерений). Когда недиагональные записи совпадают с диагональными, повторные измерения идеально коррелируют для объекта, что означает, что любое отдельное измерение так же хорошо, как и все измерения для каждого объекта. Последнее замечание - когда K = 2 в нашем простом сплит-дизайне, условие сферичности автоматически выполняется.
источник