Как интерпретировать коэффициенты регрессии, когда ответ был преобразован 4-м корнем?

20

Я использую четвертое 1/4преобразование степени root ( ) в моей переменной ответа в результате гетероскедастичности. Но сейчас я не знаю, как интерпретировать мои коэффициенты регрессии.

Я предполагаю, что мне понадобится взять коэффициенты до четвертой степени при обратном преобразовании (см. Ниже результат регрессии). Все переменные выражены в долларах в миллионах, но я хотел бы знать, как меняется доллар в миллиардах.

Сохраняя другую независимую переменную постоянной, изменение сборов в размере миллиарда долларов в среднем приводит к изменению 32(или 32 000 долларов) сборов. Я беру 0.000075223 * 1000(чтобы добраться до миллиардов) ^ 4 = 0.000032. Теперь я умножу это число на 1 миллион или 1 миллиард (исходная единица зависимой переменной в миллионах)?

lm(formula = (Collections^(1/4)) ~ Fees + DIR)

                 Estimate      Std. Error  t value            Pr(>|t|)
(Intercept)   2.094573355     0.112292375   18.653  0.0000000000000151
Fees        **0.000075223   **0.000008411    8.943  0.0000000131878713
DIR           0.000022279     0.000004107    5.425  0.0000221138881913
user13968
источник
4
Вы можете прочитать это: коэффициенты обратной трансформации-регрессии .
gung - Восстановить Монику

Ответы:

24

Лучшее решение состоит в том, чтобы с самого начала выбрать повторное выражение, которое имеет значение в области изучения.

(Например, при регрессии веса тела на независимые факторы, вероятно, будет указан либо кубический корень ( степени), либо квадратный корень ( степени). Отмечая, что вес является хорошим показателем объема, куб Корень - это длина, представляющая характерный линейный размер. Это наделяет его интуитивным, потенциально интерпретируемым значением. Хотя сам квадратный корень не имеет такой четкой интерпретации, он близок к степени , которая имеет размеры площади поверхности : может соответствовать общей площади кожи.)1/31/22/3

Четвертая степень достаточно близка к логарифму, который вы должны рассмотреть вместо этого , используя лог , чьи значения хорошо понятны. Но иногда мы действительно обнаруживаем, что кубический корень или квадратный корень или какая-то такая дробная сила делает большую работу, и у нее нет очевидной интерпретации. Затем мы должны сделать небольшую арифметику.

Модель регрессии, показанная в вопросе, включает в себя зависимую переменную («Коллекции») и две независимые переменные («Сборы») и («DIR»). Это означает, чтоX 1 X 2YX1Икс2

Y1/4знак равноβ0+β1Икс1+β2Икс2+ε,

Код оценивает как , как и как . Также предполагается, что нормальны с нулевым средним и оценивает их общую дисперсию (не показана). С помощью этих оценок, насаженное значение являетсяб 0 = 2,094573355 β 1 б 1 = 0,000075223 β 2 б 2 = 0,000022279 ε Y 1 / 4β0б0знак равно2,094573355β1б1знак равно0,000075223β2б2знак равно0,000022279εY1/4

Y1/4^знак равноб0+б1Икс1+б2Икс2,

«Интерпретация» коэффициентов регрессии обычно означает определение того, какое изменение в зависимой переменной предложено данным изменением в каждой независимой переменной. Эти изменения являются производными , которые, как говорит нам Цепное правило, равны . Затем мы включили бы оценки и сказали бы что-то вроде 4 β i Y 3dY/dИкся4βяY3

Регрессия оценивает, что изменение единицы в будет связано с изменением в = . Y 4 б я Y 3 4 б я ( б 0 + б 1 Х 1 + Ь 2 Х 2 ) 3ИксяY4бяY^34бя(б0+б1Икс1+б2Икс2)3

Зависимость интерпретации от и не просто выражается словами, вX 2Икс1Икс2 отличие от ситуаций без преобразования (одно изменение единицы в связано с изменением в ) или с логарифмом (одно процентное изменение в ассоциируется с процентным изменением ). Однако, сохраняя первую форму интерпретации и вычисляя = = , мы можем утверждать что-то вроде X i b i Y X i b i Y4 b 1 4×0,0000752230,000301YИксябяYИксябяY4б14×0,0000752230.000301

Единица изменения сборов связана с изменением сборов в раз больше куба текущих сборов; например, если текущие сборы составляют , то увеличение сборов за единицу связано с увеличением на а если текущие сборы составляют , то такое же увеличение сборов за единицу связано с увеличением сборов на .10 0,301 20 2,410.000301100,301202,41


При получении корней, отличных от четвертого, скажем, при использовании в качестве ответа, а не самого , с отличным от нуля, - просто замените все появления « » в этом анализе на « ». Y p 4 1 / pYпYп41/п

Whuber
источник
12

Альтернативой преобразованию здесь является использование обобщенной линейной модели с мощностью и мощностью функции связи 1/4. Какое семейство ошибок открыто, что дает вам больше гибкости, чем у вас с линейной регрессией и предположением условной нормальности. Одним из основных преимуществ этой процедуры является то, что прогнозы автоматически создаются на исходной шкале измерений, поэтому нет вопроса о обратном преобразовании.

Ник Кокс
источник
4

Я видел работы, в которых использовались коэффициенты регрессии четвертого корня для размышлений об изменениях в процентах, избегая при этом записи логов (и отбрасывания наблюдений).

Если мы заинтересованы в использовании квартальных корней для расчета процентных изменений, мы знаем, что:

Y^знак равно(α+β^1Икс1+β^2Икс2)4dY^dИкс1знак равно4β^1(α+β^1Икс1+β^2Икс2)3

Для эквивалента регрессии на уровне журнала, в которой нас интересует процентное изменение результате изменения единицы в , мы должны знать уровни всех переменных :YИксИкс

dY^/dИкс1Yзнак равно4β^1α+β^1Икс1+β^2Икс2

Для эквивалента регрессии log-log, в которой нас интересует процентное отношение результате процентного изменения , мы должны иметь:YИкс

dY^dИкс1Икс1Y^знак равно4β^1Икс1α+β^1Икс1+β^2Икс2

Это не кажется особенно удобным (я предпочитаю преобразование логарифмов), но это можно сделать, оценивая значения по среднему показателю или по гипотетическим значениям. Икс

Я полагаю, что на самом деле вы могли бы заменить знаменатель на среднее значение выборки , и это было бы немного более удобно.Y1/4

user68005
источник