Ожидаемое значение , коэффициент детерминации, при нулевой гипотезе

12

Мне любопытно заявление, сделанное внизу первой страницы в этом тексте относительно настройкиRadjusted2

Radjusted2=1(1R2)(n1nm1).

Текст гласит:

Логика корректировки заключается в следующем: в обычной множественной регрессии случайный предиктор объясняет в среднем пропорцию 1/(n1) вариации ответа, так что m случайных предикторов объясняют вместе, в среднем, m/(n1) вариации ответа; другими словами, ожидаемое значение R2 равно E(R2)=m/(n1) . Применение формулы [ Radjusted2 ] к этому значению, где все предикторы являются случайными, дает Radjusted2=0 "

Кажется, это очень простая и понятная мотивация для Radjusted2 . Однако я не смог выяснить, что E(R2)=1/(n1) для одного случайного (т.е. некоррелированного) предиктора.

Может ли кто-нибудь указать мне правильное направление здесь?

gregory_britten
источник
Если ссылка в будущем прекратит работу, не могли бы вы предоставить полную ссылку? Спасибо.
Ричард Харди

Ответы:

10

Это точная математическая статистика. См. Этот пост для получения распределения в предположении, что все регрессоры (за исключением постоянного члена) не связаны с зависимой переменной («случайные предикторы»).R2

Это распределение является бета, где - это число предикторов без учета постоянного члена, а - размер выборки,mn

R2Beta(m2,nm12)

и так

E(R2)=m/2(m/2)+[(nm1)/2]=mn1

Это представляется разумным способом «обосновать» логику скорректированного : если действительно все регрессоры не коррелированы, то скорректированный равен «в среднем» нулю.R2R2

Алекос Пападопулос
источник
2
Просто немного информации мне нужно! Спасибо! И да здравствует стек обмена!
gregory_britten
1
Я был бы заинтересован в случае, когда не все регрессоры не связаны с зависимой переменной. Не могли бы вы упомянуть об этом?
Оливье
@ Оливье Нет, боюсь, что нет. Посмотрите в разделе «F-критерий значимости регрессии, распределение по альтернативе» или что-то в этом роде.
Алекос Пападопулос