Несколько месяцев назад я опубликовал вопрос о тестах гомоскедастичности в R на SO, и Ян Феллоуз ответил на это (я перефразирую его ответ очень свободно):
Тесты на гомоскедастичность не являются хорошим инструментом при проверке соответствия вашей модели. С небольшими выборками у вас недостаточно мощности, чтобы обнаружить отклонения от гомоскедастичности, в то время как с большими выборками у вас есть «достаточно мощности», так что вы с большей вероятностью сможете отследить даже тривиальные отклонения от равенства.
Его великий ответ прозвучал как пощечина. Раньше я проверял предположения о нормальности и гомоскедастичности при каждом запуске ANOVA.
Какова, на ваш взгляд, лучшая практика при проверке допущений ANOVA?
Пара графиков, как правило, будет гораздо более информативной, чем значение p из теста нормальности или гомоскедастичности. График наблюдаемых зависимых переменных против независимых переменных. Сюжетные наблюдения против приступов. График остатков от независимых переменных. Исследуйте все, что выглядит странно на этих графиках. Если что-то не выглядит странным, я не стал бы беспокоиться о значительном тесте предположения.
источник
Вот несколько очень хороших веб-руководств для проверки предположений ANOVA и того, что делать в случае неудачи. Вот один. Это другое.
По сути, ваш глаз - лучший судья, поэтому проведите некоторый предварительный анализ данных . Это означает, что график данных - гистограммы и коробчатые графики - хороший способ оценить нормальность и однородность. И помните, что ANOVA устойчив к незначительным нарушениям этих правил.
источник
Графики QQ - довольно хороший способ обнаружить ненормальность.
Для гомоскедастичности попробуйте тест Левена или тест Брауна-Форсайта. Оба похожи, хотя BF немного более устойчивый. Они менее чувствительны к ненормальности, чем тест Бартлетта, но, тем не менее, я обнаружил, что они не самые надежные при малых размерах выборки.
Сюжет QQ
Тест Брауна-Форсайта
Тест Левена
источник
Я согласен с другими, что проверка значимости для предположений проблематична.
Мне нравится иметь дело с этой проблемой, составляя единый график, который раскрывает все допущения модели, необходимые для точной ошибки типа I и низкой ошибки типа II (высокая мощность). Для случая ANOVA с 2 группами (две выборки t-критерия) этот график является нормальной инверсией эмпирической кумулятивной функции распределения (ECDF), стратифицированной по группам (см. Комментарий к графику QQ в предыдущем посте). Для того, чтобы t-тест показал хорошие результаты, две кривые должны быть параллельными прямыми. ДляК Пример проблемы ANOVA в целом вы бы имели К параллельные прямые.
Полупараметрические (ранговые) методы, такие как критерии Уилкоксона и Крускала-Уоллиса, делают гораздо меньше предположений. Логит ECDF должен быть параллельным, чтобы тесты Уилкоксона-Крускала-Уоллиса имели максимальную мощность (ошибка типа I никогда не является для них проблемой). Линейность не требуется. Ранговые тесты делают предположения о том, как распределения разных групп связаны с другими, но не делают предположений о форме какого-либо одного распределения.
источник