Как преобразовать стандартизированные коэффициенты в нестандартные коэффициенты?

11

Моя цель состоит в том, чтобы использовать коэффициенты, полученные в ходе предыдущих исследований по этому вопросу, для прогнозирования фактических результатов с учетом набора независимых переменных. Тем не менее, в исследовательской работе перечислены только бета-коэффициенты и t-значение. Я хотел бы знать, возможно ли преобразовать стандартизированные коэффициенты в нестандартные.

Было бы полезно преобразовать мои нестандартные независимые переменные в стандартизированные, чтобы вычислить прогнозируемое значение? Как бы я вернулся к нестандартному прогнозируемому значению (если это вообще возможно ...)

Добавлен образец строки из бумаги:

Номер автобусного маршрута (buslines) | 0,275 (бета) | 5,70 *** (т-значение)

Мне также дают это относительно независимых переменных:

Номер автобусного маршрута (buslines) | 12,56 (средняя) | 9.02 (Стандарт) | 1 (мин) | 53 (макс)


источник
Как были стандартизированы коэффициенты? В общем, у есть единица, которая является единицей деленной на единицу , какова их единица в статье? Y XβYИкс
gui11aume
1
Я не уверен, что понимаю ваш вопрос. Вот пример строки независимой переменной после регрессионного анализа из статьи. Характеристика транзитных поставок: Количество автобусных маршрутов (buslines) | 0,275 (бета) | 5,70 *** (t-значение)
Сам коэффициент не стандартизирован, как указано выше. Но t статистика это оценочный коэффициент, деленный на его расчетное стандартное отклонение. Учитывая t и степени свободы, вы можете рассчитать значение p и расчетное стандартное отклонение, потому что Beta = t-значение x расчетное стандартное отклонение. Но я не уверен, что это то, что вы ищете. Бета-оценка не стандартизирована. Статистика t является стандартизированной формой оценки биений. Таким образом, у вас уже есть стандартизированный коэффициент.
Майкл Р. Черник

Ответы:

14

Похоже, что бумага использует модель множественной регрессии в форме

Yзнак равноβ0+Σяβяξя+ε

где - стандартизированные версии независимых переменных; а именно ,ξя

ξязнак равноИкся-мяsя

лозы средний (например, 12.56 в примере) и стандартного отклонения (например, 9.02 в примере) значений переменной ( «Шинопроводов» в данном примере). - это перехват (если есть). Подсоединение этого выражения к подогнанной модели с его «бета-версиями», записанными как (0.275 в примере), и выполнение некоторой алгебры дает оценкиы я я й х я β 0 ^ β ямяsяягоИксяβ0βя^

Y^знак равноβ0^+Σяβя^Икся-мяsязнак равно(β0^-(Σяβямя^sя))+Σя(βя^sя)Икся,

Это показывает, что коэффициенты в модели (кроме постоянного члена) получаются путем деления бета на стандартные отклонения независимых переменных, и что пересечение корректируется путем вычитания подходящей линейной комбинации бета.Икся

Это дает вам два способа предсказать новое значение из вектора независимых значений:(Икс1,...,Иксп)

  1. Используя средствамя и стандартные отклонения представленные в статье (не пересчитанные по каким-либо новым данным!), Рассчитайте и их в формулу регрессии в соответствии с бета-версиями или, что эквивалентно,sя (ξ1,...,ξп)знак равно((Икс1-м1)/s1,...,(Иксп-мп)/sп)

  2. Вставьте в алгебраически эквивалентную формулу, полученную выше.(Икс1,...,Иксп)

Если в статье используется обобщенная линейная модель , вам может потребоваться выполнить это вычисление, применив обратную функцию «ссылка» для . Например, при логистической регрессии необходимо применять логистическую функцию чтобы получить прогнозируемую вероятностьY^1/(1+ехр(-Y^)) ( - прогнозируемые шансы журнала).Y^

Whuber
источник
Отлично спасибо! Получил некоторую помощь от коллеги. Еще один вопрос: мое новое значение (Y-шляпа) очень низкое. Автор использует логарифмически преобразованную зависимую переменную в своей регрессии. Означает ли это, что я должен exp (Y-шляпа), чтобы расширить обратно до нетрансформированной единицы измерения.
Кроме того, в статье нет Y-перехвата, и тестирование метода exp (Y-hat), кажется, указывает на то, что должно быть значение для Y-перехвата, которое представляет некоторую дисперсию, не объясненную моделью, в порядке поднять прогнозируемый результат до разумного уровня.
Тогда это не коэффициенты, которые стандартизированы. Это переменные.
Майкл Р. Черник
1
ехр(Y^)
Если вы хотите сделать то, что просит заголовок, посмотрите здесь: www3.nd.edu/~rwilliam/stats1/x92.pdf, если y также стандартизирован. Также см. Stats.stackexchange.com/questions/235057/…
Крис
1

Взнак равноп×sYsИкс
  • Икс
  • Y
  • s
  • п
  • В
копье
источник
2
Я не уверен, что такое коэффициент пути. Похоже, что B - это коэффициент регрессии, который не был бы безразмерным. Это будет в у единиц на 1 единицу. Однако p = B sx / sy, где sx - расчетное стандартное отклонение по x, деленное на расчетное стандартное отклонение по y, а p безразмерно. Это представляет приблизительную корреляцию между x и y. Ланс, если это то, что вы хотели, внесите изменения, отредактировав свой пост.
Михаил Р. Черник