В настоящее время я пытаюсь устранить нарушения в предположениях ANOVA. Я использовал Шапиро-Уилка для проверки нормальности и баловался как с тестом Левена, так и с тестом Бартлетта на дисперсионное равенство. С тех пор журнал преобразовал мои данные, чтобы попытаться исправить неравные отклонения. Я перезапустил тест Бартлетта на преобразованных логарифмических данных, и все еще получил значительное значение p, и из любопытства также выполнил тест Левена и получил незначительное значение p. На какой тест мне положиться?
Наверное, нет. Было бы лучше взглянуть на ваши данные и увидеть, насколько серьезны нарушения. Линейные модели (например, ANOVA) достаточно устойчивы к незначительным нарушениям, когда группы s равны. Практическое правило гетероскедастичности заключается в том, что максимальная групповая дисперсия может в 4 раза превышать минимальную групповую дисперсию без слишком большого ущерба для вашего анализа. Если вы обеспокоены возможными нарушениями, то еще лучше использовать простой анализ, который с самого начала учитывает возможные нарушения, а не пытаться выявлять нарушения, а затем принимать решения на основе этого 1 . N
Что бы ни стоило, Википедия говорит, что тест Бартлетта более чувствителен к нарушениям нормальности, чем тест Левена. Таким образом, вы можете иметь ненормальные данные вместо гетероскедастических данных. Опять же, более надежный анализ может быть предпочтительным 2 .
... довольно устойчивый к незначительным нарушениям с равными N.
Джон
И еще есть проблема, по которой у вас могут быть веские основания полагать, что выборки получены из популяций с примерно одинаковыми отклонениями ... На этом основаны тесты устойчивости.
Джон
Могу ли я визуально проверить диапазон отклонений, используя диагностические графики?
Клариса
Конечно, @Clarice. Любое количество участков поможет с этим. Вы можете создать диаграмму рассеяния с точками, расположенными вертикально на уровнях категорий, отмеченных на оси X, и затем вы сможете увидеть, как они сравниваются. Вы также можете попробовать коробочные графики, например.
gung - Восстановить Монику
4
Для менее чувствительного теста для ненормальных условий, чем тест Левена, по крайней мере, иногда используют тест Коновера , квадрат АКА занимает непараметрический критерий. Я обнаружил, что это, по крайней мере, иногда предпочтительнее теста Бартлетта в реализации Mathematica VarianceEquivalenceTest .
Вот список методов и допущений в тестах на дисперсию, скопированных из ссылки на эквивалентность дисперсии выше.
Bartlett normality modified likelihood ratio test
BrownForsythe robust robust Levene test
Conover symmetry Conover's squared ranks test
FisherRatio normality based on variance ratio
Levene robust,symmetry compares individual and group variances
Из этого списка должно быть очевидно, что нарушения допущений являются тестируемыми, хотя документация Mathematica не содержит конкретных указаний относительно того, как, например, выполняется тест симметрии Коновера или даже почему проводится тест на симметрию. И до сих пор никто не ответил на этот вопрос .
Таким образом, ответ на вопрос OP заключается в том, что только проверка условий может предложить, какой метод предпочтителен в каждом конкретном случае. Более того, если все 5 тестов предпринимаются и не исключаются из-за нарушения допущений, тогда обычно можно различить лучшие и худшие ответы с тем, какие ответы получены.
В худшем случае можно выполнить моделирование по методу Монте-Карло, используя известные значения истинности, чтобы выяснить, какие условия приводят к каким вероятностям. Но без дополнительной информации о самой проблеме на этот вопрос нельзя ответить с точки зрения набора данных ОП. Если ФП хочет получить конкретный ответ, ориентированный на данные, предоставьте данные.
Тест Коновера является разумным предложением здесь. Но вам не следует смешивать ответ на этот вопрос с новым собственным вопросом и запросом обратной связи (от кого?) Относительно частей вашего ответа или с просьбой одобрить предлагаемое вами изменение.
gung - Восстановить Монику
@ Gung Да, хорошо, изменил его, чтобы быть более полезным сразу.
Для менее чувствительного теста для ненормальных условий, чем тест Левена, по крайней мере, иногда используют тест Коновера , квадрат АКА занимает непараметрический критерий. Я обнаружил, что это, по крайней мере, иногда предпочтительнее теста Бартлетта в реализации Mathematica VarianceEquivalenceTest .
Вот список методов и допущений в тестах на дисперсию, скопированных из ссылки на эквивалентность дисперсии выше.
Из этого списка должно быть очевидно, что нарушения допущений являются тестируемыми, хотя документация Mathematica не содержит конкретных указаний относительно того, как, например, выполняется тест симметрии Коновера или даже почему проводится тест на симметрию. И до сих пор никто не ответил на этот вопрос .
Таким образом, ответ на вопрос OP заключается в том, что только проверка условий может предложить, какой метод предпочтителен в каждом конкретном случае. Более того, если все 5 тестов предпринимаются и не исключаются из-за нарушения допущений, тогда обычно можно различить лучшие и худшие ответы с тем, какие ответы получены.
В худшем случае можно выполнить моделирование по методу Монте-Карло, используя известные значения истинности, чтобы выяснить, какие условия приводят к каким вероятностям. Но без дополнительной информации о самой проблеме на этот вопрос нельзя ответить с точки зрения набора данных ОП. Если ФП хочет получить конкретный ответ, ориентированный на данные, предоставьте данные.
источник