Фон
Чтобы проанализировать различия в некоторой непрерывной переменной между различными группами (заданной категориальной переменной), можно выполнить одностороннюю ANOVA. Если имеется несколько объяснительных (категориальных) переменных, можно выполнить факториальную ANOVA. Если кто-то хочет проанализировать различия между группами по нескольким непрерывным переменным (т. Е. По нескольким переменным отклика), необходимо выполнить многомерное ANOVA (MANOVA).
Вопрос
Я с трудом понимаю, как можно выполнить ANOVA-подобный тест для нескольких переменных ответа, и что более важно, я не понимаю, какой может быть нулевая гипотеза. Является ли нулевая гипотеза:
- «Для каждой переменной ответа средства всех групп равны»,
или это
- «По крайней мере для одной переменной ответа средства всех групп равны»,
или что-то еще?
hypothesis-testing
anova
manova
Remi.b
источник
источник
H0
MANOVA в том, что нет разницы в многомерном пространстве . Многомерный случай значительно сложнее, чем одномерный, потому что мы имеем дело с ковариациями, а не только с дисперсиями. Существует несколько способов сформулироватьH0-H1
гипотезы в MANOVA. Читайте Википедию.For each response variable
. Для меня это звучит как (или я читаю это как) «тестирование проводится по одному» (и затем как-то объединено).Ответы:
Нулевая гипотеза одностороннего ANOVA состоит в том, что средние значения всех групп равны: H 0 : μ 1 = μ 2 = . , , = μ к . Нулевая гипотеза H 0 односторонней MANOVA состоит в том, что [многовариантные] средние значения всех групп равны:Это равносильно тому, что средние значения равны для каждой переменной ответа, т. Е. Ваш первый вариант верен .H0
В обоих случаях альтернативной гипотезой является отрицание нуля. В обоих случаях допущениями являются: (а) гауссово распределение внутри группы и (б) равные дисперсии (для ANOVA) / ковариационные матрицы (для MANOVA) по группам.H1
Разница между МАНОВОЙ и АНОВОЙ
Это может показаться немного запутанным: нулевая гипотеза MANOVA в точности совпадает с комбинацией нулевых гипотез для набора одномерных ANOVA, но в то же время мы знаем, что выполнение MANOVA не эквивалентно выполнению одномерных ANOVA, а затем каким-то образом " объединение »результатов (можно придумать разные способы объединения). Почему бы и нет?
Ответ заключается в том, что выполнение всех одномерных ANOVA, даже если бы проверялась одна и та же нулевая гипотеза, будет иметь меньшую мощность. Смотрите мой ответ здесь для иллюстрации: Как MANOVA может сообщить о существенной разнице, когда ни один из одномерных ANOVA не достигает значимости? Наивный метод «объединения» (отклонение глобального нуля, если хотя бы один ANOVA отклоняет нулевое значение) также приведет к огромной инфляции уровня ошибок типа I; но даже если кто-то выберет какой-нибудь умный способ «объединения» для поддержания правильного уровня ошибок, он потеряет силу.
Как работает тестирование
Дисперсионный анализ разлагает общую сумму-квадратов в между группами сумм квадратов и в пределах-группы сумм квадратов , так что . Затем он вычисляет отношение . Согласно нулевой гипотезе, это соотношение должно быть небольшим (около ); Можно рассчитать точное распределение этого соотношения, ожидаемое по нулевой гипотезе (оно будет зависеть от и количества групп). Сравнение наблюдаемого значения с этим распределением дает p-значение.B W T = B + W B / W 1 n B / WT B W T=B+W B/W 1 n B/W
Дисперсионный разлагает общий разброс матрицы в между группами рассеяния матрица и внутри-группы Разброс матрица , так что . Затем он вычисляет матрицу . Согласно нулевой гипотезе, эта матрица должна быть «маленькой» (около ); но как количественно определить, насколько он «маленький»? MANOVA смотрит на собственные значения этой матрицы (все они положительные). Опять же, согласно нулевой гипотезе, эти собственные значения должны быть «маленькими» (всего околоB W T = B + W W - 1 B I λ i 1 ∑ λ i max { λ i }T B W T=B+W W−1B I λi 1 ). Но чтобы вычислить p-значение, нам нужно одно число (называемое «статистикой»), чтобы можно было сравнить его с ожидаемым распределением по нулю. Есть несколько способов сделать это: взять сумму всех собственных значений ; принять максимальное собственное значение и т. д. В каждом случае это число сравнивается с распределением этой величины, ожидаемым при нулевом значении, в результате чего получается p-значение.∑λi max{λi}
Различный выбор тестовой статистики приводит к немного отличающимся p-значениям, но важно понимать, что в каждом случае проверяется одна и та же нулевая гипотеза.
источник
SSdifference/SSerror
скалярным. В MANOVA многомерный эффект являетсяSSCPerror^(-1)SSCPdifference
матричным (учитываются ковариации всего и внутри групп). Но поскольку в нем есть несколько собственных значений, которые можно «объединить» не одним способом в статистике теста, существует несколько возможных альтернативных гипотез. Больше силы - больше теоретической сложности.Это первое.
Однако способ, которым это происходит, не означает буквального сравнения средств каждой из исходных переменных по очереди. Вместо этого переменные ответа линейно преобразуются таким образом, который очень похож на анализ основных компонентов . (Здесь есть отличная нить в PCA: понимание основного компонента, собственных векторов и собственных значений .) Разница в том, что PCA ориентирует ваши оси так, чтобы выровняться с направлениями максимального отклонения, тогда как MANOVA вращает ваши оси в направлениях, которые максимизировать разделение ваших групп.
Чтобы было ясно, хотя, ни один из тестов, связанных с MANOVA, не проверяет все средства один за другим в прямом смысле, ни со средствами в исходном пространстве или в преобразованном пространстве. Есть несколько различных тестовых статистик, каждая из которых работает немного по-другому, тем не менее, они имеют тенденцию работать над собственными значениями разложения, которое трансформирует пространство. Но что касается природы нулевой гипотезы, это то, что все средства всех групп одинаковы для каждой переменной ответа, а не то, что они могут различаться по некоторым переменным, но одинаковы по крайней мере по одной.
источник