Как использовать anova для сравнения двух моделей?

9

Как понимать anovaрезультат при сравнении двух моделей?

Пример:

  Res.Df    RSS Df Sum of Sq      F    Pr(>F)    
1      9 54.032                                  
2      7  4.632  2      49.4 37.329 0.0001844 ***

На странице руководства указано: «Вычислить таблицы отклонений (или отклонений) для одного или нескольких подходящих объектов модели». Однако наш профессор отметил, что это может быть использовано для сравнения моделей - это то, что я намерен сделать.

Следовательно, я предполагаю, что мог бы использовать anova(model1, model2)и получить значение p, которое говорит мне, следует ли мне отвергать нулевую гипотезу: «модели одинаковы».

Могу ли я заявить, что если значение p меньше (скажем) 0,05, модели значительно различаются?

petrbel
источник
В вашем примере, модели1 и модель2 вложены? То есть, имеют ли обе модели общий набор переменных-предикторов и одну и ту же переменную результата, но одна модель имеет одну или несколько дополнительных переменных-предикторов?
EdM
Один похож, Y ~ X + X^2а второйY ~ X + X^2 + X^3
petrbel

Ответы:

13

Если предположить, что ваши модели являются вложенными (то есть одна и та же переменная результата, а модель 2 содержит все переменные модели 1 плюс 2 дополнительные переменные), то результаты ANOVA утверждают, что две дополнительные переменные совместно учитывают достаточную дисперсию, что вы можете отклонить нулевую гипотезу о том, что Коэффициенты для обеих переменных равны 0. Это эффективно то, что вы сказали. Если оба коэффициента равны 0, то модели совпадают.

MоdеL1:Yзнак равноa+бИкс1+сИкс2+dИкс3;MоdеL2:Yзнак равноa+бИкс1+сИкс2Икс3car::Anovaanova

le_andrew
источник
Если я вас правильно понял, значение р менее 0,05 доказывает, что модели отличаются, плотно?
petrbel
3
Я бы не использовал эти слова (то есть «доказать» и «модели отличаются»), но мы имеем в виду одно и то же. Я бы сказал, что ваши данные не поддерживают нулевую гипотезу о том, что оба коэффициента равны 0, или что данные поддерживают альтернативную гипотезу о том, что оба коэффициента не равны 0.
le_andrew
1
Прежде чем утверждать, что модели оказались разными или нулевая гипотеза не поддерживается, убедитесь, что данные разумно соответствуют предположениям ANOVA, которые лежат в основе расчета и интерпретации р-значений.
EdM
Просто чтобы быть уверенным, последняя часть о сумме квадратов типа I относится только к ситуации, когда anova()используется на одной модели?
Джаспер