Почему повторные измерения ANOVA предполагают сферичность?

Под сферичностью я подразумеваю предположение, что дисперсия всех парных различий между группами должна быть одинаковой.

В частности, я не понимаю, почему это должно быть предположение, а не то, что отклонения наблюдаемых групповых оценок сами по себе одинаковы.

anova repeated-measures assumptions sphericity user1205901 - Восстановить Монику
источник

Как я здесь прокомментировал , поскольку разностные переменные между уровнями RM связаны по своему происхождению со сферичностью, то это подразумевает, что они имеют одинаковые отклонения.

ttnphns

Прежде чем ответить, было бы полезно узнать, понимаете ли вы, почему независимые показатели ANOVA предполагают однородность дисперсии.

Джон

@ Джон Насколько я понимаю, ответ на stats.stackexchange.com/questions/81914/… правильно отвечает на этот вопрос.

user1205901 - Восстановить Монику

@ttnphns К сожалению, я не совсем понимаю ваш ответ. Вы или какой-либо другой постер были бы заинтересованы в том, чтобы изложить это в более подробном ответе?

user1205901 - Восстановить Монику

Ответы:

Интуиция за предположением сферичности

Одним из предположений об общих, не повторяющихся показателях ANOVA является одинаковая дисперсия во всех группах.

(Мы можем понять это, потому что равная дисперсия, также известная как гомоскедастичность , необходима, чтобы оценка OLS в линейной регрессии была СИНИЙ и чтобы соответствующие t-тесты были действительными, см. Теорему Гаусса – Маркова . А ANOVA может быть реализован как линейный регрессия) .

Итак, давайте попробуем свести случай RM-ANOVA к случаю не-RM. Для простоты я буду иметь дело с однофакторным RM-ANOVA (без каких-либо межсубъектных эффектов), в котором субъектов записаны в условиях RM. $n$ $k$

У каждого субъекта может быть свое смещение или перехват. Если мы вычтем значения в одной группе из значений во всех других группах, мы отменим эти перехваты и придем к ситуации, когда мы сможем использовать не-RM-ANOVA, чтобы проверить, все ли эти различия групп равны нулю. Для того чтобы этот тест был действительным, нам нужно допустить равные дисперсии этих разностей . $k-1$ $k-1$

Теперь мы можем вычесть группу № 2 из всех других групп, снова получая различий, которые также должны иметь равные дисперсии. Для каждой группы из дисперсии соответствующих разностей должны быть равны. Из этого сразу следует, что все возможных различий должны быть равны. $k-1$ $k$ $k-1$ $k(k-1)/2$

Что и есть предположение о сферичности.

Почему групповые отклонения не должны быть равны самим себе?

Когда мы думаем о RM-ANOVA, мы обычно думаем о простой аддитивной модели в смешанном стиле в форме где - субъектные эффекты, - состояние эффектов, а & .

y_{i j} = μ + α_{i} + β_{j} + ϵ_{i j},

$y_{ij}=\mu+\alpha_i + \beta_j + \epsilon_{ij},$

α_{i}

$\alpha_i$

β_{j}

$\beta_j$

ϵ \sim N (0, σ^{2})

$\epsilon\sim\mathcal N(0,\sigma^2)$

Для этой модели групповые различия будут следовать , т.е. все они будут иметь одинаковую дисперсию , поэтому сферичность сохраняется. Но каждая группа будет следовать смеси из гауссиан со средними значениями при и дисперсиями , что является некоторым сложным распределением с дисперсией которая постоянна по группам. $\mathcal N(\beta_{j_1} - \beta_{j_2}, 2\sigma^2)$ $2\sigma^2$ $n$ $\alpha_i$ $\sigma^2$ $V(\vec \alpha, \sigma^2)$

Так что в этой модели, действительно, групповые дисперсии тоже одинаковы. Групповые ковариации также одинаковы, что означает, что эта модель подразумевает составную симметрию . Это более жесткое условие по сравнению со сферичностью. Как показывает мой интуитивный аргумент выше, RM-ANOVA может нормально работать в более общей ситуации, когда аддитивная модель, написанная выше , не выполняется .

Точное математическое утверждение

Я собираюсь добавить сюда кое-что из Huynh & Feldt, 1970, «Условия, при которых среднеквадратичные отношения в схемах повторных измерений имеют точные распределения» $F$ .

Что происходит, когда нарушается сферичность?

Когда сферичность не сохраняется, мы можем ожидать, что RM-ANOVA (i) будет иметь увеличенный размер (больше ошибок типа I), (ii) уменьшит мощность (больше ошибок типа II). Можно исследовать это с помощью моделирования, но я не собираюсь делать это здесь.

амеба
источник

Оказывается, что эффект нарушения сферичности - это потеря мощности (т. Е. Повышенная вероятность ошибки типа II) и тестовая статистика (F-коэффициент), которую просто нельзя сравнить с табличными значениями F-распределения. F-тест становится слишком либеральным (т. Е. Доля отклонений нулевой гипотезы больше, чем альфа-уровень, когда нулевая гипотеза верна).

Точное изучение этого вопроса очень сложно, но, к счастью, Box и соавторы написали статью об этом: https://projecteuclid.org/download/pdf_1/euclid.aoms/1177728786

Одним словом, ситуация такова. Во-первых, скажем, у нас есть однофакторный дизайн повторных измерений с S-субъектами и A-экспериментальными обработками. В этом случае эффект независимой переменной проверяется путем вычисления F-статистики, которая вычисляется как отношение среднего квадрата эффекта к среднему квадрату. взаимодействия между предметным фактором и независимой переменной. Когда сферичность выполняется, эта статистика имеет распределение Фишера с и степеней свободы. $\upsilon_{1}=A-1$ $\upsilon_{2}=(A-1)(S-1)$

В вышеприведенной статье Box показано, что при сбое сферичности правильное число степеней свободы становится от коэффициента F, зависит от сферичности следующим образом: $\upsilon_{1}$ $\epsilon$

υ_{1} знак равно ε (A - 1)

$\upsilon_{1} = \epsilon(A-1)$

υ_{2} знак равно ε (A - 1) (S - 1)

$\upsilon_{2} = \epsilon(A-1)(S-1)$

Также Бокс представил индекс сферичности, который применяется к ковариационной матрице населения . Если мы назовем элементами этой таблицы AxA, то индекс $\xi_{a,a}$

ε знак равно \frac{{(Σ_{a}^{} ξ_{a, a})}^{2}}{(A - 1) Σ_{a, a^{'}}^{} ξ_{a, a^{'}}^{2}}

$\epsilon = \frac{\left ( \sum_{a}^{ }\xi_{a,a} \right )^{2}}{\left ( A-1 \right )\sum_{a,a'}^{ }\xi_{a,a'}^{2}}$

Индекс сферичности Бокса лучше всего понять в отношении собственных значений ковариационной матрицы. Напомним, что ковариационные матрицы принадлежат к классу положительных полуопределенных матриц и поэтому всегда имеют положительные нулевые собственные значения. Таким образом, условие сферичности эквивалентно наличию всех собственных значений, равных постоянной.

Таким образом, когда сферичность нарушается, мы должны применить некоторую поправку к нашей F-статистике, и наиболее яркими примерами таких поправок являются, например, Greenhouse-Geisser и Huynh-Feldt

Без каких-либо исправлений ваши результаты будут предвзятыми и поэтому ненадежными. Надеюсь это поможет!

Академик
источник

+1. Я прокомментирую позже, но пока ваш первый абзац смешивает мощь и размер теста. Что нарушается при нарушении сферичности? Тип ошибки I типа под нулевым? Или сила? Или оба? Вы, вероятно, имеете в виду и то и другое, но формулировка не очень понятна (я думаю). Кроме того, это не «Box et al», это только Box :)

амеба

Я думаю, что сила будет в основном ухудшена, потому что, как показал Бокс, когда сферичность нарушается, мы должны полагаться на совершенно другую статистику (с другими степенями свободы). Если мы не будем полагаться на это, то в зависимости от того, насколько сильным будет наше нарушение, мы получим большую долю отклонений от нулевой гипотезы.

Большой академик

Извините, все еще растерян, теперь ваш комментарий: «большая доля отклонений нулевого значения» - вы имеете в виду, когда нулевое значение действительно истинно? Но это не имеет ничего общего с мощностью, это тип ошибок I типа.

амеба

+10. Я присуждаю награду за этот ответ: это хорошо, а также это единственный ответ, который появился в период вознаграждения. Я не полностью удовлетворен вашим ответом (пока?), И я начал писать свой собственный ответ (в настоящее время неполный, но уже опубликованный), но у меня есть только частичное понимание основной математики. Ваш ответ определенно помог, и ссылка на Box 1954 также очень полезна.

амеба

ϵ

$\epsilon$

ϵ

$\epsilon$

ξ

$\xi$

A \times A

$A\times A$

$y_{ijk}$ $i=1, ..., I; j = 1, ..., J; k = 1, ..., K.$

Среднее значение выборки i-й группы

{\bar{Y}}_{я,,} знак равно \frac{1}{J К} Σ_{J знак равно 1}^{J} Σ_{К знак равно 1}^{К} Y_{я J К}

$\bar{y}_{i..} = \frac{1}{JK}\sum_{j=1}^{J}\sum_{k=1}^{K}{y_{ijk}}$

и что из ij-го субъекта

{\bar{Y}}_{я J,} знак равно \frac{1}{К} Σ_{К знак равно 1}^{К} Y_{я J К}

$\bar{y}_{ij.} = \frac{1}{K}\sum_{k=1}^{K}{y_{ijk}}$

При условии независимости между субъектами, разница различий между двумя групповыми средствами

В a р ({\bar{Y}}_{я,,} - {\bar{Y}}_{я^{'},,}) знак равно \frac{1}{J^{2}} Σ_{J знак равно 1}^{J} В a р ({\bar{Y}}_{я J,}) + \frac{1}{J^{2}} Σ_{J^{'} знак равно 1}^{J} В a р ({\bar{Y}}_{я^{'} J^{'},})

$Var(\bar{y}_{i..} - \bar{y}_{i'..}) = \frac{1}{J^2}\sum_{j=1}^JVar(\bar{y}_{ij.}) + \frac{1}{J^2}\sum_{j'=1}^JVar(\bar{y}_{i'j'.})$

$Var(\bar{y}_{ij.})$ $\sigma^{2}/K$ $\sigma^{2}$ $Var(\bar{y}_{ij.})$

Теперь к вопросу о сферичности, который был поднят.

$\bar{y}_{..k} - \bar{y}_{..k'}$

{\bar{Y}}_{,, К} знак равно \frac{1}{я J} Σ_{я знак равно 1}^{я} Σ_{J знак равно 1}^{J} Y_{я J К},

$\bar{y}_{..k} = \frac{1}{IJ}\sum_{i=1}^{I}\sum_{j=1}^{J}{y_{ijk}}.$

y_{i j k}

$y_{ijk}$

y_{i j k^{'}}

$y_{ijk'}$

В a р ({\bar{Y}}_{,, К} - {\bar{Y}}_{,, К^{'}}) знак равно \frac{1}{(я J)^{2}} Σ_{я знак равно 1}^{я} Σ_{J знак равно 1}^{J} В a р (Y_{я J К} - Y_{я J К^{'}})

$Var(\bar{y}_{..k} - \bar{y}_{..k'}) = \frac{1}{(IJ)^2}\sum_{i=1}^I\sum_{j=1}^JVar(y_{ijk} - y_{ijk'})$

Следовательно, допущение о постоянной дисперсии всех парных разностей делает возможным выполнение t-критерия после оценки общей дисперсии. Это предположение вместе с постоянной дисперсией каждого наблюдения подразумевает, что ковариация между любой парой измерений постоянна для всех пар - Серджиоимеет отличный пост на эту тему. Таким образом, допущения отображают дисперсионно-ковариационную структуру для повторных измерений каждого субъекта в виде матрицы с константой по диагонали и другой константой вне диагонали. Когда все недиагональные записи равны нулю, это сводится к полностью независимой модели (которая может быть неприемлемой для многих повторных исследований измерений). Когда недиагональные записи совпадают с диагональными, повторные измерения идеально коррелируют для объекта, что означает, что любое отдельное измерение так же хорошо, как и все измерения для каждого объекта. Последнее замечание - когда K = 2 в нашем простом сплит-дизайне, условие сферичности автоматически выполняется.

Т Лин
источник