Я уверен, что у меня это полностью обернуто вокруг моей головы, но я просто не могу понять это.
T-критерий сравнивает два нормальных распределения, используя Z-распределение. Вот почему в ДАННЫХ есть предположение о нормальности.
ANOVA эквивалентен линейной регрессии с фиктивными переменными и использует суммы квадратов, как и OLS. Вот почему существует предположение о нормальных остатках.
Это заняло у меня несколько лет, но я думаю, что наконец понял эти основные факты. Так почему же t-критерий эквивалентен ANOVA с двумя группами? Как они могут быть эквивалентны, если они даже не принимают те же данные о данных?
Ответы:
T-критерий с двумя группами предполагает, что каждая группа обычно распределена с одинаковой дисперсией (хотя средние значения могут отличаться в соответствии с альтернативной гипотезой). Это эквивалентно регрессии с фиктивной переменной, поскольку регрессия позволяет среднему значению каждой группы различаться, но не дисперсию. Следовательно, остатки (равные данным с вычтенными значениями групп) имеют одинаковое распределение, то есть они обычно распределяются с нулевым средним.
T-критерий с неравными отклонениями не эквивалентен одностороннему ANOVA.
источник
T-критерий просто частный случай F-критерия, где сравниваются только две группы. Результат любого из них будет точно таким же с точки зрения p-значения, и между F и t-статистикой также есть простая связь. F = t ^ 2. Два теста алгебраически эквивалентны, и их предположения совпадают.
Фактически, эти эквивалентности распространяются на весь класс ANOVA, t-тестов и моделей линейной регрессии. Т-тест является частным случаем ANOVA. ANOVA - это особый случай регрессии. Все эти процедуры включены в общую линейную модель и основаны на одних и тех же допущениях.
Вы можете думать об этом как о нормальности в данных, но вы проверяете нормальность в каждой группе - что фактически совпадает с проверкой на нормальность в остатках, когда единственным предиктором в модели является индикатор группы. Аналогично с равными дисперсиями.
Кроме того, R не имеет отдельных процедур для ANOVA. Функции anova в R являются просто обертками для функции lm () - то же самое, что используется для подгонки моделей линейной регрессии - упакованы немного по-другому, чтобы обеспечить то, что обычно находится в сводке ANOVA, а не в сводке регрессии.
источник
lm()
, если вы не перейдете к смешанным моделям с пакетомnlme
илиlme4
, но есть удобный способ обработки повторных измерений посредством соответствующей спецификацииError
термина вaov()
, см. Более подробную информацию в учебнике Baron & Li, §6.9, j.mp/ c5ME4uaov()
построен поверхlm()
функции, но содержит дополнительный аргумент, называемый специальными терминами, напримерError
.Я полностью согласен с ответом Роба, но позвольте мне сказать по-другому (используя википедию):
Предположения ANOVA :
Допущения t-критерия :
Следовательно, я бы опроверг вопрос, поскольку они, очевидно, имеют одни и те же предположения (хотя и в другом порядке :-)).
источник
Один очевидный момент, который все упускают из виду: с помощью ANOVA вы проверяете нулевое значение, что среднее значение одинаково независимо от значений ваших объясняющих переменных. С помощью T-критерия вы также можете проверить односторонний случай, когда среднее значение определенно больше при одном значении вашей объясняющей переменной, чем при другом.
источник
Я предпочитаю использовать t-критерий для сравнения двух групп и по разным причинам буду использовать ANOVA для более чем двух групп. Важной причиной является предположение о равных отклонениях.
источник