Какова твоя цель? Мы знаем, что гетероскедастичность не влияет на наши оценки коэффициентов; это только делает наши стандартные ошибки неправильными. Следовательно, если вы заботитесь только о соответствии модели, то гетероскедастичность не имеет значения.
Вы можете получить более эффективную модель ( то есть модель с меньшими стандартными ошибками), если используете взвешенные наименьшие квадраты. В этом случае вам необходимо оценить дисперсию для каждого наблюдения и взвесить каждое наблюдение с помощью инверсии этой дисперсии, специфичной для наблюдения (в случае weights
аргумента lm
). Эта процедура оценки меняет ваши оценки.
В качестве альтернативы, чтобы исправить стандартные ошибки гетероскедастичности без изменения ваших оценок, вы можете использовать надежные стандартные ошибки. Для R
приложения, смотрите пакет sandwich
.
Использование преобразования журнала может быть хорошим подходом для исправления гетероскедастичности, но только в том случае, если все ваши значения положительны и новая модель обеспечивает разумную интерпретацию относительно вопроса, который вы задаете.
Вы хотели бы попробовать преобразование Бокса-Кокса . Это версия преобразования власти:
Some earlier discussions include What other normalizing transformations are commonly used beyond the common ones like square root, log, etc.? and How should I transform non-negative data including zeros?. You can find R code following How to search for a statistical procedure in R?
Econometricians stopped bothering about heteroskedasticity after seminal work of Halbert White (1980) on setting up inferential procedures robust to heteroskedasticity (which in fact just retold the earlier story by a statistician F. Eicker (1967)). See Wikipedia page that I just rewrote.
источник
There is a very simple solution to heteroskedasticity issue associated with dependent variables within time series data. I don't know if this is applicable to your dependent variable. Assuming it is, instead of using nominal Y change it to % change in Y from the current period over the prior period. For instance, let's say your nominal Y is GDP of $14 trillion in the most current period. Instead, compute the change in GDP over the most recent period (let's say 2.5%).
A nominal time series always grows and is always heteroskedastic (the variance of the error grows over time because the values grow). A % change series is typically homoskedastic because the dependent variable is pretty much stationary.
источник