Я использую четвертое 1/4
преобразование степени root ( ) в моей переменной ответа в результате гетероскедастичности. Но сейчас я не знаю, как интерпретировать мои коэффициенты регрессии.
Я предполагаю, что мне понадобится взять коэффициенты до четвертой степени при обратном преобразовании (см. Ниже результат регрессии). Все переменные выражены в долларах в миллионах, но я хотел бы знать, как меняется доллар в миллиардах.
Сохраняя другую независимую переменную постоянной, изменение сборов в размере миллиарда долларов в среднем приводит к изменению 32
(или 32 000 долларов) сборов. Я беру 0.000075223 * 1000
(чтобы добраться до миллиардов) ^ 4 = 0.000032
. Теперь я умножу это число на 1 миллион или 1 миллиард (исходная единица зависимой переменной в миллионах)?
lm(formula = (Collections^(1/4)) ~ Fees + DIR)
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2.094573355 0.112292375 18.653 0.0000000000000151
Fees **0.000075223 **0.000008411 8.943 0.0000000131878713
DIR 0.000022279 0.000004107 5.425 0.0000221138881913
источник
Ответы:
Лучшее решение состоит в том, чтобы с самого начала выбрать повторное выражение, которое имеет значение в области изучения.
(Например, при регрессии веса тела на независимые факторы, вероятно, будет указан либо кубический корень ( степени), либо квадратный корень ( степени). Отмечая, что вес является хорошим показателем объема, куб Корень - это длина, представляющая характерный линейный размер. Это наделяет его интуитивным, потенциально интерпретируемым значением. Хотя сам квадратный корень не имеет такой четкой интерпретации, он близок к степени , которая имеет размеры площади поверхности : может соответствовать общей площади кожи.)1/3 1/2 2/3
Четвертая степень достаточно близка к логарифму, который вы должны рассмотреть вместо этого , используя лог , чьи значения хорошо понятны. Но иногда мы действительно обнаруживаем, что кубический корень или квадратный корень или какая-то такая дробная сила делает большую работу, и у нее нет очевидной интерпретации. Затем мы должны сделать небольшую арифметику.
Модель регрессии, показанная в вопросе, включает в себя зависимую переменную («Коллекции») и две независимые переменные («Сборы») и («DIR»). Это означает, чтоX 1 X 2Y X1 Икс2
Код оценивает как , как и как . Также предполагается, что нормальны с нулевым средним и оценивает их общую дисперсию (не показана). С помощью этих оценок, насаженное значение являетсяб 0 = 2,094573355 β 1 б 1 = 0,000075223 β 2 б 2 = 0,000022279 ε Y 1 / 4β0 б0= 2.094573355 β1 б1= 0,000075223 β2 б2= 0.000022279 ε Y1 / 4
«Интерпретация» коэффициентов регрессии обычно означает определение того, какое изменение в зависимой переменной предложено данным изменением в каждой независимой переменной. Эти изменения являются производными , которые, как говорит нам Цепное правило, равны . Затем мы включили бы оценки и сказали бы что-то вроде 4 β i Y 3dY/ дИкся 4 βяY3
Зависимость интерпретации от и не просто выражается словами, вX 2Икс1 Икс2 отличие от ситуаций без преобразования (одно изменение единицы в связано с изменением в ) или с логарифмом (одно процентное изменение в ассоциируется с процентным изменением ). Однако, сохраняя первую форму интерпретации и вычисляя = = , мы можем утверждать что-то вроде X i b i Y X i b i Y4 b 1 4×0,0000752230,000301Y Икся бя Y Икся бя Y 4 б1 4 × 0,000075223 0.000301
При получении корней, отличных от четвертого, скажем, при использовании в качестве ответа, а не самого , с отличным от нуля, - просто замените все появления « » в этом анализе на « ». Y p 4 1 / pYп Y п 4 1 / р
источник
Альтернативой преобразованию здесь является использование обобщенной линейной модели с мощностью и мощностью функции связи 1/4. Какое семейство ошибок открыто, что дает вам больше гибкости, чем у вас с линейной регрессией и предположением условной нормальности. Одним из основных преимуществ этой процедуры является то, что прогнозы автоматически создаются на исходной шкале измерений, поэтому нет вопроса о обратном преобразовании.
источник
Я видел работы, в которых использовались коэффициенты регрессии четвертого корня для размышлений об изменениях в процентах, избегая при этом записи логов (и отбрасывания наблюдений).
Если мы заинтересованы в использовании квартальных корней для расчета процентных изменений, мы знаем, что:
Для эквивалента регрессии на уровне журнала, в которой нас интересует процентное изменение результате изменения единицы в , мы должны знать уровни всех переменных :Y Икс Икс
Для эквивалента регрессии log-log, в которой нас интересует процентное отношение результате процентного изменения , мы должны иметь:Y Икс
Это не кажется особенно удобным (я предпочитаю преобразование логарифмов), но это можно сделать, оценивая значения по среднему показателю или по гипотетическим значениям.Икс
Я полагаю, что на самом деле вы могли бы заменить знаменатель на среднее значение выборки , и это было бы немного более удобно.Y1 / 4
источник