Википедия и виньетка R-сэндвич-пакетов дают хорошую информацию о допущениях, подтверждающих стандартные ошибки коэффициента OLS, и математических основах сэндвич-оценок. Мне все еще неясно, как решается проблема гетероскедастичности остатков, возможно потому, что я не совсем понимаю стандартную оценку дисперсии коэффициентов OLS.
Какова интуиция за сэндвич-оценщиком?
Ответы:
Для OLS вы можете себе представить, что вы используете расчетную дисперсию невязок (в предположении независимости и гомоскедастичности) в качестве оценки условной дисперсии s. В оценщике на основе сэндвича вы используете наблюдаемые квадратичные невязки в качестве плагина для оценки той же самой дисперсии, которая может варьироваться между наблюдениями.Yя
В обычной оценке стандартной ошибки наименьших квадратов для оценки коэффициента регрессии условная дисперсия результата рассматривается как постоянная и независимая, так что ее можно оценить последовательно.
Для сэндвича мы отказываемся от согласованной оценки условной дисперсии и вместо этого используем плагиновую оценку дисперсии каждого компонента с использованием квадрата остатка
Используя оценку дисперсии плагина, мы получаем непротиворечивые оценки дисперсии по центральной предельной теореме Ляпунова.β^
Интуитивно понятно, что эти наблюдаемые квадратные остатки уничтожат любую необъяснимую ошибку из-за гетероскедастичности, которая в противном случае была бы неожиданной в предположении постоянной дисперсии.
источник