Как они все версии одного и того же базового статистического метода?
regression
self-study
anova
generalized-linear-model
t-test
Amahabirsingh
источник
источник
Ответы:
Учтите, что все они могут быть записаны как уравнение регрессии (возможно, с немного отличающимися интерпретациями, чем их традиционные формы).
Регрессия:
t-тест:
ANOVA:
Прототип регрессии концептуализируется с помощью как непрерывной переменной. Тем не менее, единственное предположение, которое фактически делается в отношении X, состоит в том, что это вектор известных констант. Это может быть непрерывная переменная, но это также может быть фиктивный код (т. Е. Вектор с 0 и 1 , который указывает, является ли наблюдение членом указанной группы - например, группой лечения). Таким образом, во втором уравнении X может быть таким фиктивным кодом, а значение p будет таким же, как в t-тесте в его более традиционной форме.Икс Икс 0 1 Икс
Однако смысл бета-версий здесь будет другим. В этом случае будет средним значением контрольной группы (для которой значения в фиктивной переменной будут равны 0 ), а β 1 будет разницей между средним значением для группы лечения и средним значением для контроля. группа.β0 0 β1
Теперь помните, что совершенно разумно иметь / запускать ANOVA только с двумя группами (хотя t-тест будет более распространенным), и у вас есть все три подключенных. Если вы предпочитаете посмотреть, как это будет работать, если у вас есть ANOVA с 3 группами; это будет: Обратите внимание, что когда у вас есть g групп, у вас есть g - 1 фиктивных кодов для их представления. Эталонная группа (обычно контрольная группа) указывается наличием 0 длявсехфиктивных кодов (в этом случае и фиктивный код 1 и фиктивный код 2). В этом случае вы не хотели бы интерпретировать p-значения t-тестов для этих бета-версий, которые поставляются со стандартным статистическим выводом - они только показывают, отличается ли указанная группа от контрольной группыпри оценке в изоляции
В свете комментариев @ whuber ниже, они также могут быть представлены с помощью матричных уравнений:
Представленные таким образом, Y & ε - векторы длины N , а β - вектор длины p + 1 . Теперь X - это матрица с N строками и ( p + 1 ) столбцами. В прототипной регрессии у вас есть p непрерывных переменных X и перехват. Таким образом, ваш X
Если вы представляющий ANOVA с группами таким образом, помните , что вы бы г - 1 фиктивные переменные , указывающие на группы, с контрольной группой показано с помощью наблюдения , имеющего 0 «S в каждой переменной фиктивным. Как и выше, у вас все равно будет перехват. Таким образом, p = g - 1 .грамм грамм- 1 0 р = г- 1
источник
Все они могут быть записаны как частные случаи общей линейной модели.
Модель ANOVA - это просто модель регрессии, в которой уровни факторов представлены фиктивными (или индикаторными ) переменными .
Обратите внимание на значение р 0,079 выше. Вот один из способов анова:
Теперь для регрессии:
(некоторые данные удалены)
Сравните значение p в строке 'group2', а также значение p для F-теста в последней строке. Для двустороннего теста они одинаковы и оба соответствуют результатам t-теста.
Кроме того, коэффициент для «group2» представляет разницу в средних для двух групп.
источник
Этот ответ, который я опубликовал ранее, несколько уместен, но этот вопрос несколько другой.
Возможно, вы захотите подумать о различиях и сходствах между следующими линейными моделями:
источник
Anova похожа на t-критерий равенства средств в предположении неизвестных, но равных различий между обработками. Это связано с тем, что в ANOVA MSE идентично объединенной дисперсии, используемой в t-тесте. Существуют и другие версии t-критерия, например, для неравных отклонений и попарного t-критерия. С этой точки зрения t-критерий может быть более гибким.
источник