Могу ли я доверять результатам ANOVA для ненормально распределенного DV?

22

Я проанализировал эксперимент с повторными измерениями ANOVA. ANOVA - это 3x2x2x2x3 с 2 факторами между субъектами и 3 внутри (N = 189). Уровень ошибок является зависимой переменной. Распределение коэффициентов ошибок имеет перекос 3,64 и эксцесс 15,75. Наклон и куртоз являются результатом того, что 90% от среднего значения ошибок равняется 0. Чтение некоторых из предыдущих потоков по тестам нормальности здесь меня немного смущает. Я подумал, что если у вас есть данные, которые обычно не распространялись, в ваших интересах было бы преобразовать их, если это возможно, но кажется, что многие люди считают, что анализ ненормальных данных с помощью ANOVA или T-теста является приемлемым. Могу ли я доверять результатам ANOVA?

(К вашему сведению, в будущем я намерен проанализировать этот тип данных в R со смешанными моделями с биномиальным распределением)

Matt
источник
1
Не могли бы вы дать ссылку на некоторые из этих тем? Мой инстинкт инстинкта - «НООО, нет, нет, нет», но я вряд ли эксперт, и мне было бы интересно прочитать некоторые из этих аргументов.
Мэтт Паркер
4
Вы точно не можете доверять никаким p-значениям, полученным из F-распределений, с такими видами данных!
whuber
3
Многие ссылаются на надежность ANOVA как на обоснование использования его с ненормальными данными. ИМХО, робастность не является общим атрибутом теста, но вы должны точно указать, а) в отношении каких нарушений его допущений тест является устойчивым (нормальность, сферичность, ...), б) в какой степени эти нарушения не имеют большого значения эффект, в) каковы предпосылки для теста, чтобы показать надежность (большой и равный размер ячейки ...). В вашем дизайне сплит-графиков я бы хотел, чтобы кто-то изложил точные предположения о сферичности и равенстве ковариационных матриц. Это уже ошеломляет в 2-факторном случае.
Каракал
3
@ Matt Похоже, 90% остатков равны нулю. Если это так, никакие преобразования не позволят сделать остатки удаленно близкими к нормальным. Имитационные исследования показали, что значения р из F-тестов очень чувствительны к отклонениям от нормы. (В вашем случае вполне вероятно, что некоторые знаменатели в F-тестах будут равны нулю: яркий показатель того, как далеко все может пойти не так.) Вам нужен другой подход. Что делать, зависит от того, почему так много остатков равны нулю. Отсутствие достаточной точности в измерениях?
whuber
2
@Matt это звучит более уместно, если предположить, что ваши данные считаются. Еще одно привлекательное соображение - отрицательный биномиальный ответ с нулевым завышением ( ats.ucla.edu/stat/r/dae/zinbreg.htm ).
whuber

Ответы:

20

Как и другие параметрические тесты, анализ отклонений предполагает, что данные соответствуют нормальному распределению. Если ваша переменная измерения обычно не распределена, вы можете увеличить свой шанс ложного положительного результата, если вы проанализируете данные с помощью ановы или другого теста, который предполагает нормальность. К счастью, анова не очень чувствительна к умеренным отклонениям от нормы; Имитационные исследования с использованием различных ненормальных распределений показали, что это ложное положительное влияние на уровень ложноположительных результатов не сильно влияет (Glass et al. 1972, Harwell et al. 1992, Lix et al. 1996). Это связано с тем, что когда вы берете большое количество случайных выборок из совокупности, средние значения этих выборок приблизительно нормально распределяются, даже если совокупность не является нормальной.

Можно проверить соответствие набора данных нормальному распределению. Я не советую вам делать это, потому что многие наборы данных, которые являются значительно ненормальными, будут идеально подходить для ановы.

Вместо этого, если у вас достаточно большой набор данных, я предлагаю вам взглянуть на частотную гистограмму. Если это выглядит более-менее нормально, сделайте анову. Если это выглядит как нормальное распределение, которое было перенесено в одну сторону, как, например, сульфатные данные выше, вы должны попробовать различные преобразования данных и посмотреть, не сделает ли какое-либо из них гистограмму более нормальной. Если это не сработает, и данные по-прежнему выглядят совершенно ненормальными, вероятно, все еще можно анализировать данные с использованием anova. Однако вы можете проанализировать его с помощью непараметрического теста. Почти в каждом параметрическом статистическом тесте есть непараметрический заменитель, такой как критерий Крускала-Уоллиса вместо односторонней ановы, тест рангового ранга Уилкоксона вместо парного t-теста и ранговая корреляция Спирмена вместо линейной регрессии. Эти непараметрические тесты не предполагают, что данные соответствуют нормальному распределению. Однако они предполагают, что данные в разных группах имеют одинаковое распределение; если разные группы имеют разные формы распределения (например, одна перекошена влево, другая перекошена вправо), непараметрический критерий может быть не лучше параметрического.

Ссылки

  1. Гласс Г.В., П.Д. Пекхэм и Дж.Р. Сандерс. 1972. Последствия несоблюдения допущений, лежащих в основе анализа постоянных эффектов дисперсии и ковариации. Преподобный Местожительство 42: 237-288.
  2. Harwell, MR, EN Rubinstein, WS Hayes и CC Olds. 1992. Подведение итогов Монте-Карло приводит к методологическим исследованиям: однофакторные и двухфакторные фиксированные эффекты, случаи ANOVA. J. Educ. Стат. 17: 315-339.
  3. Lix, LM, JC Keselman и HJ Keselman. 1996. Последствия нарушений допущений: количественный обзор альтернатив одностороннему анализу дисперсионного F-критерия. Преподобный Местожительство 66: 579-619.
rolando2
источник
7
Я мог бы просто показать свое невежество здесь, но разве предположение ANOVA о том, что остатки нормальные? В этом случае действительно не имеет значения, является ли сама переменная ненормальной, пока остатки соответствуют шаблону.
richiemorrisroe
5
Возможно, вопрос был отредактирован, но я действительно не понимаю, почему этот ответ был одобрен и принят. Это неплохой общий совет, но он почти не имеет ничего общего с этим конкретным случаем: «Наклон и эксцесс являются результатом того, что 90% ошибок составляют 0». В этом случае ответ должен быть нет, нет и нет.
Эрик
8

В частности, в отношении частоты появления ошибок как DV, Диксон (2008) очень убедительно демонстрирует, что проверка нулевой гипотезы с помощью ANOVA может привести как к увеличению частоты ложных тревог (вызывающие эффекты «значительны», когда они отсутствуют), так и к увеличению частоты промахов (пропуская реальные эффекты). Он также показывает, что моделирование смешанных эффектов, определяющее биномиально распределенную ошибку, является более подходящим подходом к анализу данных о скорости.

Майк Лоуренс
источник
4

Вы не можете доверять своей ANOVA с таким большим перекосом и большим количеством нулей. Более подходящим методом было бы использовать количество ошибок в качестве вашего DV (таким образом, превращая ваше DV в данные подсчета) и выполнять анализ Пуассона. Этот подход потребует использования смешанного анализа эффектов и определения семейства ошибок в качестве Пуассона. В статье Диксона (2008) *, упомянутой Майком Лоуренсом, используется анализ смешанных эффектов в R, но с биномиальными результатами. Я полностью перешел на выполнение R для большинства моих повторных анализов измерений, потому что многие из моих переменных результата являются биномиальными. Соответствующий пакет R есть lme4.

*Диксон, П. (2008). Модели точности в конструкциях с повторными измерениями. Журнал памяти и языка , 59 (4), 447-456.

Майк Янг
источник
2

Хуан многое предложил, хотя я повторю другим и повторю, что для лучшей точности сами переменные могут быть ненормальными, если их остатки - нет. Кроме того, упрощенный и немного более структурированный ответ (с помощью аннотированной блок-схемы) доступен на yellowbrickstats.com .

rolando2
источник
1
Извините, но -1 от меня. В целом это верно, но остатков не будет, если у нас будет инфляция нулей. Я думаю, что ответы должны не только охватывать общие положения, но и затрагивать конкретную проблему.
Эрик
1

Потолочные эффекты являются проблемой здесь. Непараметрический тест - ваша самая безопасная ставка, хотя ANOVA устойчивы к этому нарушению нормальности, если n большое. Обычно люди просто используют гистограмму для проверки этого, но если проблема связана с остатками, она может быть более сложной, чем эта. Также имейте в виду, КАК это влияет на ваши результаты (не только, что это делает). Pallant (2007), вероятно, сказал бы, что это увеличивает вероятность возникновения ошибки первого типа, поэтому, если вы уменьшите критическую альфа, вы уменьшите ее.

Джеймс
источник