Преобразование стандартизированных бета-версий обратно в исходные переменные

14

Я понимаю, что это, вероятно, очень простой вопрос, но после поиска я не могу найти ответ, который ищу.

У меня есть проблема, когда мне нужно стандартизировать переменные, запустить (регрессия гребня), чтобы вычислить оценки гребня бета-версий.

Затем мне нужно преобразовать их обратно в исходную шкалу переменных.

Но как мне это сделать?

Я нашел формулу для двумерного случая, что

β=β^SxSy.

Это было дано в D. Gujarati, Basic Econometrics , стр. 175, формула (6.3.8).

Где - это оценки из регрессионного прогона по стандартизированным переменным, а - это тот же оценщик, преобразованный обратно в исходную шкалу, - стандартное отклонение выборки регрессии, а - стандартное отклонение выборки.ββ^SySx

К сожалению, книга не охватывает аналогичный результат для множественной регрессии.

Также я не уверен, что понимаю двумерный случай? Простая алгебраическая манипуляция дает формулу для в исходном масштабе:β^

β^=βSySx

Мне кажется странным, что которые были рассчитаны на переменные, которые уже спущены с помощью , должны быть снова спущены с помощью для преобразования обратно? (Плюс, почему средние значения не добавляются обратно?)β^SxSx

Итак, может кто-нибудь объяснить, как это сделать для многомерного случая в идеале с деривацией, чтобы я мог понять результат?

Baz
источник

Ответы:

26

Для модели регрессии, использующей стандартизированные переменные, мы принимаем следующую форму для линии регрессии

E[Y]=β0+j=1kβjzj,

где - это j-й (стандартизированный) регрессор, сгенерированный из путем вычитания среднего значения выборки и деления на стандартное отклонение выборки : zjxjx¯jSj

zj=xjx¯jSj

Выполняя регрессию с помощью стандартизированных регрессоров, мы получаем подогнанную линию регрессии:

Y^=β^0+j=1kβ^jzj

Теперь мы хотим найти коэффициенты регрессии для нестандартизированных предикторов. У нас есть

Y^=β^0+j=1kβ^j(xjx¯jSj)

Переупорядочив, это выражение можно записать как

Y^=(β^0j=1kβ^jx¯jSj)+j=1k(β^jSj)xj

Как мы видим, перехват для регрессии с использованием нетрансформированных переменных задается как . Коэффициент регрессии предиктора равен .β^0j=1kβ^jx¯jSjjβ^jSj

В представленном случае я предположил, что только предикторы были стандартизированы. Если кто-то также стандартизирует переменную отклика, преобразование ковариатных коэффициентов обратно в исходную шкалу выполняется с использованием формулы из ссылки, которую вы дали. У нас есть:

E[Y]y^Sy=β0+j=1kβjzj

Выполняя регрессию, получим подогнанное уравнение регрессии

Y^scaled=Y^unscaledy¯Sy=β^0+j=1kβ^j(xjx¯jSj),

где установленные значения находятся на шкале стандартизированного ответа. Чтобы их масштабировать и восстановить оценки коэффициентов для нетрансформированной модели, мы умножим уравнение на и среднее значение для другой стороны:Syy

Y^unscaled=β^0Sy+y¯+j=1kβ^j(SySj)(xjx¯j).

Следовательно, соответствующая модели, в которой ни ответ, ни предикторы не были стандартизированы, определяется как , в то время как ковариатные коэффициенты для интересующей модели могут быть получены путем умножения каждого коэффициента на .Sy/Sjβ^0Sy+y¯j=1kβ^jSySjx¯jSy/Sj

Филипп Буркхардт
источник