Как определить, что остатки автокоррелированы из графики

12

Когда вы делаете регрессию OLS и строите результирующие остатки, как вы можете определить, являются ли эти остатки автокоррелированными? Я знаю, что есть тесты для этого (Durbin, Breusch-Godfrey), но мне было интересно, можете ли вы просто посмотреть на график, чтобы оценить, может ли автокорреляция быть проблемой (потому что для гетероскедастичности это довольно легко сделать).

Джон Доу
источник

Ответы:

12

Мало того, что вы можете посмотреть на сюжет, я думаю, что это вообще лучший вариант. Проверка гипотезы в этой ситуации дает неверный ответ.

Обычный график, на который нужно смотреть, - это автокорреляционная функция (ACF) остатков.

Автокорреляционная функция является соотношение остатков (как временной ряд) со своими лагами.

Вот, например, ACF остатков из небольшого примера от Montgomery et al.

ACF остатков для продаж безалкогольных напитков

Некоторые из выборочных корреляций (например, с лагом 1,2 и 8) не особенно малы (и поэтому могут существенно влиять на вещи), но их также нельзя отличить от воздействия шума (выборка очень мала).

Изменить: Вот график, чтобы проиллюстрировать разницу между некоррелированной и сильно коррелированной серией (на самом деле, нестационарной)

Белый шум и случайная прогулка

Верхний участок - белый шум (независимый). Нижняя - это случайная прогулка (отличия которой от оригинальной серии) - она ​​имеет очень сильную автокорреляцию.

Glen_b - Восстановить Монику
источник
1
Спасибо за ответ. Когда вы смотрите на графики в вики ( en.wikipedia.org/wiki/File:Acf_new.svg ), можете ли вы по верхнему графику (не графику ACF) сказать, что остатки автокоррелированы?
Джон Доу
Я бы сказал: "Хм, выглядит неопределенно циклично ... может быть автокорреляция, не так ли. Как выглядит ACF?"
Glen_b
1
Хорошо, но не могли бы вы уточнить это: например, я нашел этот вопрос: stats.stackexchange.com/questions/14914/… По-видимому, существует автокорреляция. Что конкретно я ищу, чтобы прийти к такому выводу?
Джон Доу
Конечно, это показывает что-то, что приведет к положительной автокорреляции (хотя я бы, вероятно, отнес это к тренду, а также к зависимости от тренда). Подумайте - если наблюдения независимы, то подумайте о вероятности того, что в долгосрочной перспективе их будет на одной стороне от среднего или другого, а на противоположной стороне нет. Я думаю, что лучший первый вариант - это моделировать данные, которые автокоррелированы на разных уровнях, и смотреть на них.
Glen_b
1
Я понимаю, что у вас нет автокорреляции, когда данные распределяются случайным образом. Но как индикатор автокорреляции, достаточно ли этого, когда данные не распределены случайным образом или вы представляете собой некий образец (например, за точкой данных с высоким значением следуют несколько точек данных с высоким значением)?
Джон Доу
2

Это не является необычным, если 5% или менее значений автокорреляции выходят за пределы интервалов, поскольку это может быть связано с изменением выборки. Один из методов - создать график автокорреляции для первых 20 значений и проверить, выходит ли более одного значения за допустимые интервалы.

Лео
источник