Как использовать anova для сравнения двух моделей?

Как понимать anovaрезультат при сравнении двух моделей?

Пример:

  Res.Df    RSS Df Sum of Sq      F    Pr(>F)    
1      9 54.032                                  
2      7  4.632  2      49.4 37.329 0.0001844 ***

На странице руководства указано: «Вычислить таблицы отклонений (или отклонений) для одного или нескольких подходящих объектов модели». Однако наш профессор отметил, что это может быть использовано для сравнения моделей - это то, что я намерен сделать.

Следовательно, я предполагаю, что мог бы использовать anova(model1, model2)и получить значение p, которое говорит мне, следует ли мне отвергать нулевую гипотезу: «модели одинаковы».

Могу ли я заявить, что если значение p меньше (скажем) 0,05, модели значительно различаются?

r regression anova petrbel
источник

В вашем примере, модели1 и модель2 вложены? То есть, имеют ли обе модели общий набор переменных-предикторов и одну и ту же переменную результата, но одна модель имеет одну или несколько дополнительных переменных-предикторов?

EdM

Один похож, Y ~ X + X^2а второйY ~ X + X^2 + X^3

petrbel

Ответы:

Если предположить, что ваши модели являются вложенными (то есть одна и та же переменная результата, а модель 2 содержит все переменные модели 1 плюс 2 дополнительные переменные), то результаты ANOVA утверждают, что две дополнительные переменные совместно учитывают достаточную дисперсию, что вы можете отклонить нулевую гипотезу о том, что Коэффициенты для обеих переменных равны 0. Это эффективно то, что вы сказали. Если оба коэффициента равны 0, то модели совпадают.

$Model 1: y=a+bx_1+cx_2+dx_3; Model 2: y=a+bx_1+cx_2$ $x_3$ car::Anovaanova

le_andrew
источник

Если я вас правильно понял, значение р менее 0,05 доказывает, что модели отличаются, плотно?

petrbel

Я бы не использовал эти слова (то есть «доказать» и «модели отличаются»), но мы имеем в виду одно и то же. Я бы сказал, что ваши данные не поддерживают нулевую гипотезу о том, что оба коэффициента равны 0, или что данные поддерживают альтернативную гипотезу о том, что оба коэффициента не равны 0.

le_andrew

Прежде чем утверждать, что модели оказались разными или нулевая гипотеза не поддерживается, убедитесь, что данные разумно соответствуют предположениям ANOVA, которые лежат в основе расчета и интерпретации р-значений.

EdM

Просто чтобы быть уверенным, последняя часть о сумме квадратов типа I относится только к ситуации, когда anova()используется на одной модели?

Джаспер