Разве неправильно использовать ANOVA вместо t-критерия для сравнения двух средних?

11

У меня есть распределение зарплат, и я хочу сравнить разницу в средствах для мужчин и женщин. Я знаю, что есть T-тест студента для сравнения двух средств, но после предложения ANOVA я получил некоторую критику, говоря, что ANOVA предназначен для сравнения более чем двух средств.

Что (если что-то) неправильно в использовании его для сравнения только 2-х средств?

Пабло Фернандес
источник
9
Кто сказал, что это неправильно?
gung - Восстановить Монику
1
Почему бы вам не перефразировать вопрос, подавляющий какие-либо предположения? Что-то вроде «ANOVA эквивалентно t-критерию при сравнении двух групп?» Просто идея ... Я не буду брать на себя ответственность за то, как приветствуется вопрос, так или иначе :-)
Антони Пареллада
4
Или измените ваш вопрос, чтобы показать, что кто-то говорит, что это неправильно ... чтобы мы могли объяснить, что они ошибаются. Трудность здесь заключается в том, что предпосылка вопроса (что он неправильный) ошибочна.
Glen_b
1
Несмотря на то, что предпосылка ошибочна, этот вопрос, кажется, не является не по теме или настолько неясен, что на него нельзя ответить (на самом деле, на него был дан ответ). Я думаю, что это может остаться открытым.
gung - Восстановить Монику
1
Согласен, @ gung. Я думаю, что вопрос отражает недостаток знаний по теме. Если бы он был сформулирован иначе (или «лучше»), то вопрос, вероятно, не задавался бы, потому что тогда они уже знали бы ответ.
D_Williams

Ответы:

20

Это не неправильно и будет эквивалентно при тестировании, которое предполагает равные отклонения. Более того, для двух групп sqrt (f-статистика) равна (абсолютному значению) t-статистики. Я несколько уверен, что t-критерий с неравными отклонениями не эквивалентен. Поскольку вы можете получить соответствующие оценки, когда отклонения неравны (отклонения обычно всегда не равны некоторому десятичному разряду), возможно, имеет смысл использовать t-критерий, поскольку он более гибкий, чем ANOVA (при условии, что у вас есть только две группы).

Обновить:

Вот код, показывающий, что t-статистика ^ 2 для t-критерия с равной дисперсией, но не для неравного t-критерия, такая же, как f-статистика.

dat_mtcars <- mtcars

# unequal variance model
 t_unequal <- t.test(mpg ~ factor(vs), data = dat_mtcars)
 t_stat_unequal <-  t_unequal$statistic

# assume equal variance
 t_equal <- t.test(mpg ~ factor(vs), var.equal = TRUE, data = dat_mtcars)
 t_stat_equal <- t_equal$statistic

# anova
 a_equal <- aov(mpg ~ factor(vs), data = dat_mtcars)
 f_stat <- anova(a_equal)
 f_stat$`F value`[1]

# compare by dividing (1 = equivalence)
 (t_stat_unequal^2) / f_stat$`F value`[1] 
 (t_stat_equal^2) / f_stat$`F value`[1] # (t-stat with equal var^2) = F
D_Williams
источник
3
+1, обратите внимание, что можно настроить односторонний ANOVA / F-тест для неравных отклонений (ср. Альтернативы одностороннему ANOVA для гетероскедастических данных ).
gung - Восстановить Монику
@ Gung ОК. Я не был уверен в этом, так как я не использовал ANOVA когда-то (занимался байесовским делом).
D_Williams
Есть еще одно преимущество выполнения тестов: если у вас есть направленная гипотеза, вы можете выполнить односторонний тест; ANOVA, с другой стороны, всегда проверяет ненаправленные гипотезы. тTT
Ср
4

Они эквивалентны. ANOVA только с двумя группами эквивалентна t-критерию. Разница в том, что если у вас несколько групп, то ошибка типа I будет увеличиваться для t-тестов, поскольку вы не сможете совместно проверить гипотезу. ANOVA не страдает от этой проблемы, поскольку вы совместно тестируете их с помощью F-теста.

robinsa
источник
1
Я не думаю, что это теряет силу, я думаю, что это больше связано с ошибками типа I. В общем, чем больше тестов у вас, тем выше мощность, которую вы должны получить.
HelloWorld
Я полагаю (как говорит @StudentT), что это связано с ошибками I типа. В ходе курса я заставляю нас использовать «Исправление Бонферрони» именно для этого. en.wikipedia.org/wiki/Bonferroni_correction
Пабло Фернандес,
Да, вы правы. Это должно быть не питание (тип II), а ошибки типа I. Я считаю, что рассуждения верны, но по какой-то причине я написал power, а не type 1 error. Я буду редактировать, чтобы убедиться, что я никого не обманываю.
Робинса