Я пытаюсь интерпретировать результаты статьи, где они применили множественную регрессию, чтобы предсказать различные результаты. Однако 's (стандартизированные коэффициенты B определены как β x 1 = B x 1 ⋅ S D x 1 гдеy- зависимая переменная, аx1- предиктор), по-видимому, не соответствует сообщенномуR2:
Несмотря на то, что -0,83, -0,29, -0,16, -0,43, 0,25 и -0,29, R 2 составляет всего 0,20.
Кроме того, три предиктора: вес, ИМТ и% жира являются мультиколлинеарными, коррелируют в пределах r = 0,8-0,9 друг с другом в полах.
Является ли значение вероятным с этими β или нет прямой связи между β и R 2 ?
Кроме того, могут ли проблемы с мультиколлинеарными предикторами повлиять на четвертого предиктора (VO2max), который коррелирует около r = 0,4 с вышеупомянутыми тремя переменными?
источник
Ответы:
Геометрическая интерпретация обычной регрессии наименьших квадратов дает необходимое представление.
Большую часть того, что нам нужно знать, можно увидеть в случае двух регрессоров и x 2 с ответом y . В стандартизованных коэффициентах, или «бета,» возникают тогда , когда все три вектора стандартизированы к общей длине (который можно взять равную единицу). Таким образом, x 1 и x 2 являются единичными векторами в плоскости E 2 - они расположены на единичной окружности - и y является единичным вектором в трехмерном евклидовом пространстве E 3, содержащем эту плоскость. Встроено значение у является ортогональной (перпендикулярным) проекциейx1 x2 y x1 x2 E2 y E3 y^ на Е 2 . Поскольку R 2 просто квадрат длины у , мы даже не нужно визуализировать все три измерения: вся необходимая нам информация может быть нарисованы в этой плоскости.y E2 R2 y^
Ортогональные регрессоры
Самая хорошая ситуация, когда регрессоры ортогональны, как на первом рисунке.
На этой и остальных фигурах я последовательно нарисую диск блока белым цветом, а регрессоры - черными стрелками. всегда будет указывать прямо вправо. Толстые красные стрелки изображают компоненты у в х 1 и х 2 направлениях: то есть, β 1 х 1 и β 2 х 2 . Длина у радиус серой окружности , на которой он лежит , - но помните , что R 2 представляет собойx1 y^ x1 x2 β1x1 β2x2 y^ R2 квадрат этой длины.
Теорема Пифагора утверждает
Поскольку теорема Пифагора справедлива в любом количестве измерений, это рассуждение обобщается на любое число регрессоров, что дает наш первый результат:
Сопоставленная
Отрицательно коррелированные регрессоры встречаются под углами, превышающими прямой угол.
Давайте запомним этот очевидный результат, нашу вторую общность:
Однако это не универсальное отношение, как показано на следующем рисунке.
Я оставляю на ваше воображение создание подобных примеров с положительно коррелированными регрессорами, которые, таким образом, встречаются под острыми углами.
Алгебраические результаты
Кроме того, по определению, подходит
Неравенство Коши-Шварца подразумевает
Выводы
источник