При выполнении полиномиальной регрессии для на люди иногда используют необработанные полиномы, иногда ортогональные полиномы. Но когда они используют то, что кажется совершенно произвольным.
Здесь и здесь используются сырые полиномы. Но здесь и здесь ортогональные полиномы, кажется, дают правильные результаты. Что, как, почему ?!
В противоположность этому, когда вы узнаете о полиномиальной регрессии из учебника (например, ISLR ), в нем даже не упоминаются необработанные или ортогональные полиномы - дается только подходящая модель.
Итак, когда мы должны использовать что?
И почему отдельные значения p для , и т. Д. Сильно отличаются между этими двумя значениями?
regression
polynomial
l7ll7
источник
источник
Ответы:
Переменные и X 2 не являются линейно независимыми. Таким образом , даже если не существует квадратичный эффект, добавление X 2 модели будет изменять оценочную эффект X .Икс Икс2 Икс2 Икс
Давайте посмотрим на очень простую симуляцию.
Теперь с квадратичным членом в модели, чтобы соответствовать.
Конечно, комплексный тест все еще важен, но я думаю, что результат, который мы ищем, не этот. Решение состоит в том, чтобы использовать ортогональные полиномы.
Обратите внимание, что коэффициенты
x
в первой модели иpoly(x,2)1
во второй модели не равны, и даже точки пересечения различны. Это потому, чтоpoly
доставляет ортонормированные векторы, которые также ортогональны к векторуrep(1, length(x))
. Такpoly(x,2)1
нет,x
а скорее(x -mean(x))/sqrt(sum((x-mean(x))**2))
...Важным моментом является то, что тесты Вальда в этой последней модели независимы. Вы можете использовать ортогональные полиномы, чтобы решить, до какой степени вы хотите пойти, просто взглянув на тест Вальда: здесь вы решаете оставить а не X 2 . Конечно, вы могли бы найти ту же модель, сравнив первые две подходящие модели, но так проще - если вы решите подняться на более высокие ступени, это действительно намного проще.Икс Икс2
После того, как вы решили, какие термины сохранить, вы можете вернуться к необработанным полиномам и X 2 для интерпретации или прогнозирования.Икс Икс2
источник
Чтобы дать наивную оценку ситуации:
Следовательно, с точки зрения предсказания нет (в этом случае) никакой разницы.
Естественный вопрос возникает, если существует лучшая усеченная базисная система. Однако ответ на вопрос не является ни простым, ни уникальным и зависит, например, от определения слова «лучший», то есть того, что вы пытаетесь архивировать.
источник