Существуют различия в допущениях и гипотезах, которые проверяются.
ANOVA (и t-критерий) - это явно критерий равенства средних значений. Крускал-Уоллис (и Манн-Уитни) технически можно рассматривать как сравнение средних рангов .
Следовательно, с точки зрения исходных значений, Крускал-Уоллис является более общим, чем сравнение средних: он проверяет, будет ли вероятность того, что случайное наблюдение из каждой группы в равной степени будет выше или ниже случайного наблюдения из другой группы. Реальное количество данных, которое лежит в основе этого сравнения, не является ни разницей в средних значениях, ни разницей в медианах (в случае двух выборок), это фактически медиана всех парных различий - разницы Ходжеса-Лемана между выборками.
Однако, если вы решите сделать некоторые ограничительные предположения, то Крускал-Уоллис можно рассматривать как критерий равенства средств населения, а также квантилей (например, медиан) и, действительно, широкого спектра других мер. То есть, если вы предполагаете, что групповые распределения по нулевой гипотезе одинаковы и что при альтернативе единственным изменением является сдвиг распределения (так называемая « альтернатива смещения местоположения »), то это также тест равенство населения означает (и одновременно медианы, нижние квартили и т. д.).
[Если вы сделаете это предположение, вы можете получить оценки и интервалы для относительных сдвигов, как вы можете с ANOVA. Ну, также возможно получить интервалы без этого предположения, но их труднее интерпретировать.]
Если вы посмотрите на ответ здесь , особенно в конце, он обсуждает сравнение между t-тестом и Уилкоксоном-Манном-Уитни, которые (по крайней мере, при проведении двусторонних тестов) эквивалентны ANOVA и Kruskal-Wallis применяется для сравнения только два образца; это дает немного больше деталей, и большая часть этого обсуждения переносится на Крускал-Уоллис против ANOVA.
Не совсем понятно, что вы подразумеваете под практической разницей. Вы используете их в целом аналогичным образом. Когда применяются оба набора допущений, они, как правило, дают довольно похожие результаты, но в некоторых ситуациях они, безусловно, могут давать довольно разные p-значения.
Редактировать: Вот пример сходства вывода даже для небольших выборок - вот область совместного принятия для сдвигов местоположений между тремя группами (вторая и третья по сравнению с первой), выбранными из нормальных распределений (с небольшими размерами выборки) для определенного набора данных на уровне 5%:
Могут быть обнаружены многочисленные интересные особенности - в этом случае немного большая область приема для KW с его границей, состоящей из вертикальных, горизонтальных и диагональных отрезков прямых линий (нетрудно понять, почему). Эти два региона говорят нам очень похожие вещи о параметрах, представляющих интерес здесь.
Да, есть.
anova
Является параметрическим подходом , аkruskal.test
не является параметрическим подходом. Такkruskal.test
что не нужно никаких предположений о распределении.С практической точки зрения, когда ваши данные искажены,
anova
это не будет хорошим подходом для использования. Посмотрите на этот вопрос, например.источник
Как я утверждал в начале, я не уверен насчет точной конструкции KW. Может быть, мой ответ более правильный для другого непараметрического теста (Манн-Уитни? ..), но подход должен быть похожим.
источник
Kruskal-Wallis test is constructed in order to detect a difference between two distributions having the same shape and the same dispersion
Как упоминалось в ответе Глена, в комментариях и во многих других местах на этом сайте, это правда, но это ограниченное понимание того, что делает тест.same shape/dispersion
на самом деле не является внутренним, но является дополнительным предположением, которое используется в некоторых и не используется в других ситуациях.distributions are equal
, так думать ошибочно. H0 состоит только в том, что две точки «сгущения гравитаций», как показано на рисунке, не отклоняются друг от друга.krusal.test()
the equality of the location parameters of the distribution
является правильной формулировкой (хотя «местоположение» не следует рассматривать как среднее значение или медиану, в общем случае). Если вы принимаете одинаковые формы, то, естественно, этот же H0 становится «идентичным распределением».Крускал-Уоллис основан на ранге, а не на ценности. Это может иметь большое значение, если есть перекос дистрибутивов или если есть крайние случаи
источник