Мне любопытно заявление, сделанное внизу первой страницы в этом тексте относительно настройки
Текст гласит:
Логика корректировки заключается в следующем: в обычной множественной регрессии случайный предиктор объясняет в среднем пропорцию вариации ответа, так что случайных предикторов объясняют вместе, в среднем, вариации ответа; другими словами, ожидаемое значение равно . Применение формулы [ ] к этому значению, где все предикторы являются случайными, дает "
Кажется, это очень простая и понятная мотивация для . Однако я не смог выяснить, что для одного случайного (т.е. некоррелированного) предиктора.
Может ли кто-нибудь указать мне правильное направление здесь?
regression
expected-value
goodness-of-fit
r-squared
gregory_britten
источник
источник
Ответы:
Это точная математическая статистика. См. Этот пост для получения распределения в предположении, что все регрессоры (за исключением постоянного члена) не связаны с зависимой переменной («случайные предикторы»).R2
Это распределение является бета, где - это число предикторов без учета постоянного члена, а - размер выборки,m n
и так
Это представляется разумным способом «обосновать» логику скорректированного : если действительно все регрессоры не коррелированы, то скорректированный равен «в среднем» нулю.R2 R2
источник