У меня есть распределение зарплат, и я хочу сравнить разницу в средствах для мужчин и женщин. Я знаю, что есть T-тест студента для сравнения двух средств, но после предложения ANOVA я получил некоторую критику, говоря, что ANOVA предназначен для сравнения более чем двух средств.
Что (если что-то) неправильно в использовании его для сравнения только 2-х средств?
hypothesis-testing
anova
t-test
Пабло Фернандес
источник
источник
Ответы:
Это не неправильно и будет эквивалентно при тестировании, которое предполагает равные отклонения. Более того, для двух групп sqrt (f-статистика) равна (абсолютному значению) t-статистики. Я несколько уверен, что t-критерий с неравными отклонениями не эквивалентен. Поскольку вы можете получить соответствующие оценки, когда отклонения неравны (отклонения обычно всегда не равны некоторому десятичному разряду), возможно, имеет смысл использовать t-критерий, поскольку он более гибкий, чем ANOVA (при условии, что у вас есть только две группы).
Обновить:
Вот код, показывающий, что t-статистика ^ 2 для t-критерия с равной дисперсией, но не для неравного t-критерия, такая же, как f-статистика.
источник
Они эквивалентны. ANOVA только с двумя группами эквивалентна t-критерию. Разница в том, что если у вас несколько групп, то ошибка типа I будет увеличиваться для t-тестов, поскольку вы не сможете совместно проверить гипотезу. ANOVA не страдает от этой проблемы, поскольку вы совместно тестируете их с помощью F-теста.
источник