Что такое нулевая модель в регрессии и как она связана с нулевой гипотезой?

16

Что такое нулевая модель в регрессии и какова связь между нулевой моделью и нулевой гипотезой?

Насколько я понимаю, это значит

  • Используя «среднее значение переменной отклика» для прогнозирования переменной непрерывного отклика?
  • Использование «распределения меток» при прогнозировании дискретных переменных ответа?

Если это так, то, похоже, отсутствует связь между нулевой гипотезой.

Haitao Du
источник
4
Обратите внимание, что в R вы можете попробовать, fit = lm(formula = y ~ 1, data) и вы должны увидеть среднее значение y. Также смотрите ответ MorganBall. Я бы согласился с его ответом больше всего. Кроме того, нулевая модель может быть моделью с предикторами, альтернативной моделью является модель с p + k , где k может быть 1,2, ... дополнительными ковариатами. pp+k
Jon
3
Вот ссылка для вас: onlinecourses.science.psu.edu/stat501/node/295
Jon

Ответы:

11

Нет, я бы сказал, что «нулевая модель» по сути имеет то же значение, что и «нулевая гипотеза»: модель, если нулевая гипотеза верна. Что это означает, в конкретном случае, конечно, зависит от конкретной нулевой гипотезы.

Ваша интерпретация как «среднее значение» (вы, вероятно, хотите сказать «предельное распределение по переменной ответа») без учета каких-либо предикторов - это одна возможность, соответствующая нулевой гипотезе «омнибусного теста», тестирование всех параметров (кроме перехвата) одновременно.

Но интерес вполне может быть сосредоточен на модели вида где x 1 содержит предикторы, которые, как вы знаете, влияют на результат, поэтому не хотят для тестирования, в то время как x 2 содержит предикторы, которые вы тестируете.

yi=β0+β1Tx1i+β2Tx2i+ϵi
x1x2

Таким образом, нулевой гипотезой будет а нулевой моделью будет y i = β 0 + β T 1 x 1 i + ϵ i . Так что это зависит.β2=0yi=β0+β1Tx1i+ϵi

Къетил б Халворсен
источник
2
Нулевая гипотеза обычно является чем-то конкретным в значениях параметров; Я бы сказал, что нулевая модель будет нулевой гипотезой плюс все сопутствующие предположения, при которых будет получено нулевое распределение тестовой статистики - это предположения, которые содержат большую часть модели. Например, нулевая гипотеза не упоминает независимость, но я бы определенно сказал, что это часть нулевой модели.
Glen_b
18

Нулевая модель связана с нулевой гипотезой. Возьмите следующую одномерную модель:

Y=α+β1X+ϵ

β1

H0:β1=0

HA:β10

β1X

Y=α+ϵ

Y

Морган Болл
источник
1
К последнему пункту, да, это правильно. В R вы можете увидеть это, сравнив перехват lm(y ~ 1, data)и mean(y).
Jon
2
+1 Хороший ответ, Морган! Я позволил себе немного отредактировать вашу запись, потому что она выглядела странно.
Алексис
9

В регрессии, как описано частично в двух других ответах, нулевая модель является нулевой гипотезой, что все параметры регрессии равны 0. Таким образом, вы можете интерпретировать это как высказывание, что в нулевой гипотезе нет тренда и лучшая оценка / предиктор нового наблюдение - это среднее значение, равное 0 в случае отсутствия перехвата.

Майкл Р. Черник
источник
1
Этот ответ помог мне понять нулевые = 0 в коэффициентах (кроме перехвата), спасибо!
Haitao Du
1
Кроме того, модель может быть моделью только для перехвата, по сравнению с другой моделью.
D_Williams
1
+1, это полезное дополнение к теме. Однако я бы сказал, что это конкретное и очень ограничительное использование термина «нулевая модель». Термин часто (по моему мнению, чаще всего) используется более свободно.
gung - Восстановить Монику