Как интерпретировать эти графики acf и pacf

20

Ниже приведены графики acf и pacf ежемесячного ряда данных. Второй график - это acf с ci.type = 'ma':

введите описание изображения здесь

Сохранение высоких значений на графике acf, вероятно, представляет долгосрочную положительную тенденцию. Вопрос в том, представляют ли это сезонные колебания?

Я пытался увидеть разные сайты на эту тему, но я не уверен, что эти графики показывают сезонность.

Анализ участков ACF и PACF

Помогите интерпретировать ACF- и PACF-графики

Помогите понять следующую картину ACF

Автокорреляционная и частичная автокорреляционная интерпретация

Изменить: следующий график для отставания до 60:

введите описание изображения здесь

Ниже приведены графики diff (my_series):

введите описание изображения здесь

И до отставания 60:

введите описание изображения здесь

Изменить: Эти данные из: Является ли это подходящим методом для проверки сезонных эффектов в данных подсчета самоубийств? Здесь авторы не посчитали заслуживающими упоминания сюжеты оригинальных или разностных серий acf и pacf (поэтому это не должно быть важно). Только acf / pacf графики остатков были упомянуты в нескольких местах.

rnso
источник
1
Можете ли вы добавить что-нибудь о своих данных (например, основной сюжет)? Вы пробовали что-нибудь подобное stl()?
gung - Восстановить Монику
Я пытаюсь понять, как определить сезонность по участкам acf и pacf. Для этого необходим обзор основного сюжета или stl? Разве мы не можем определить что-то из этих графиков?
rnso
1
Это было бы хорошо. Для ясности, ваш вопрос на самом деле не о том, что происходит с вашими данными, а о том, что можно понять из этих графиков изолированно, верно?
gung - Восстановить Монику
1
Да. Мне часто нужно определить, присутствует ли сезонность в моих данных, поэтому я хочу понять, какую информацию я могу получить из графиков acf и pacf. Графики функции STL довольно легко понять, но не эти графики.
Рнсо
Ваши данные действительно имеют некоторую сезонность. Пожалуйста, смотрите мой ответ на @javlacalle.
IrishStat

Ответы:

9

просмотр графиков для того, чтобы попытаться объединить данные в предполагаемую модель аримы, работает хорошо, когда 1: в данных отсутствуют выбросы / импульсы / сдвиги уровней, локальные тренды времени и сезонные детерминированные импульсы И 2) когда модель аримы имеет постоянные параметры во времени И 3) когда отклонение ошибки от модели арима имеет постоянное отклонение во времени. Когда эти три вещи имеют место ... в большинстве наборов данных учебника, представляющих легкость моделирования аримы. Когда 1 или более из 3 не держатся .... в каждом наборе данных реального мира, который я когда-либо видел. Простой ответ на ваш вопрос требует доступа к исходным фактам (историческим данным), а не к дополнительной описательной информации на ваших графиках. Но это только мое мнение!

ИЗДАНО ПОСЛЕ ПОЛУЧЕНИЯ ДАННЫХ:

Я был в греческом отпуске (на самом деле занимался чем-то другим, кроме анализа временных рядов) и не смог проанализировать ДАННЫЕ О самоубийстве, но вместе с этим постом. Теперь уместно и правильно, что я представляю анализ, чтобы проконтролировать / подтвердить на примере мои комментарии о многоэтапных стратегиях идентификации моделей и неудачах простого визуального анализа простых корреляционных графиков как «доказательство в пудинге».

Вот ACF оригинальных данных введите описание изображения здесьPACF оригинальной серии введите описание изображения здесь. AUTOBOX http://www.autobox.com/cms/ В программном обеспечении, которое я разработал, используется эвристика для определения исходной модели. В этом случае первоначально идентифицированная модель была найдена введите описание изображения здесь. Диагностическая проверка остатков этой модели позволила предположить некоторое увеличение модели с использованием сдвига уровня, импульсов и сезонного импульса. Обратите внимание, что сдвиг уровня обнаруживается в периоде 164 или около него, что почти идентично более раннему заключению о периоде 176 из @forecaster. Все дороги не ведут в Рим, но некоторые могут приблизить вас!введите описание изображения здесь, Проверка на постоянство параметров отклоняла изменения параметров во времени. Проверка на детерминированные изменения в дисперсии ошибок пришла к выводу, что детерминированные изменения не были обнаружены в дисперсии ошибок. введите описание изображения здесь, Тест Бокса-Кокса на необходимость преобразования мощности был положительным, и был сделан вывод о необходимости логарифмического преобразования. введите описание изображения здесь, Окончательная модель здесь введите описание изображения здесь. Остатки от окончательной модели, кажется, свободны от какой-либо автокорреляции введите описание изображения здесь. График остатков окончательных моделей, по-видимому, свободен от любых гауссовых нарушений введите описание изображения здесь. Сюжет Actual / Fit / Forecasts здесь введите описание изображения здесьс прогнозами здесьвведите описание изображения здесь

IrishStat
источник
Спасибо за Ваш ответ. Являются ли эти допущения настолько важными и всегда настолько проигнорированными в реальных данных, что графики acf и pacf почти никогда не могут интерпретироваться изолированно?
Рнсо
Я не хочу говорить никогда, НО предположения, которые я изложил, сильно усложнили бы процесс визуальной идентификации в случае их нарушения. Ваш набор данных ясно (для моих старых глаз) является примером этого. Идентификация исходной модели, оценка и повторная идентификация на основе остаточной диагностики - это многоэтапный процесс, а не один, и он выполняется, КРОМЕ в тривиальных случаях.
IrishStat
Чтобы повторить, следуя моему другу stats.stackexchange.com/users/48766/javlacalle : Проверка на наличие импульсов и сдвигов уровней И сезонных импульсов И локальных временных трендов И постоянства дисперсии ошибок также необходима.
IrishStat
(+1) Хороший анализ данных. Однако как насчет первоначального вопроса? можно ли определить сезонность в данных? Может быть, это может быть выведено из вывода, который вы показываете, но я не мог понять это.
Javlacalle
сезонность присутствует в выражении AR (12) в модели ARIMA и в сезонном импульсе, начинающемся в период 98 (2003/2)
IrishStat,
10

Интерпретация ACF и PACF

Медленное затухание функции автокорреляции предполагает, что данные следуют процессу с долгой памятью. Продолжительность шоков относительно постоянна и влияет на данные нескольких наблюдений впереди. Это, вероятно, отражается в плавной тенденции тенденции в данных.

ACF и PACF порядка 12 выходят за пределы достоверности значимости. Однако это не обязательно означает наличие идентифицируемой сезонной модели. ACF и PACF других сезонных заказов (24, 36, 48, 60) находятся в пределах доверительных интервалов. Из графика невозможно сделать вывод о том, является ли значение ACF и PACF порядка 12 обусловлено сезонностью или временными колебаниями.

Постоянство ACF, упомянутого ранее, предполагает, что могут потребоваться первые различия, чтобы сделать данные стационарными. Тем не менее, ACF / PACF разностного ряда выглядят подозрительно, разностный фильтр может вызывать отрицательную корреляцию и может не соответствовать действительности. Смотрите этот пост для некоторых деталей.

Определите, присутствует ли сезонность

Анализ ACF и PACF должен быть дополнен другими инструментами, например:

  • Спектр (вид АКФ в частотной области) может выявить периодичность циклов, которые объясняют большую часть изменчивости данных.
  • Установите базовую модель структурного временного ряда и проверьте, близка ли дисперсия сезонного компонента к нулю относительно других параметров (в функции R stats::StructTSи пакете STSM ).
  • Тесты на сезонность, основанные на сезонных манекенах, сезонных циклах или описанных и реализованных в X-12 .
  • Проверка на наличие импульсов и сдвигов уровней, как упомянуто IrishStat, также необходима, поскольку они могут исказить выводы из предыдущих методов (в R пакетные значения могут быть полезны для этой цели).
javlacalle
источник
Я добавил заговор до отставания 60. Какой будет команда R для получения «разностного ряда»? Я добавлю графики для diff (my_series).
15:16
@mso Я добавил серьезные изменения в свой предыдущий ответ. Команда для разностного ряда - это функция, diffкоторую вы использовали.
Javlacalle
javlacalle - было два очень похожих абзаца, и @rnso попытался помочь, удалив один. Я удалил то, что считаю нужным заменить. Не могли бы вы проверить, что правильный абзац был удален?
Glen_b
@Glen_b спасибо за редактирование, я внес некоторые изменения.
Javlacalle
@ javlacalle, @IrishStat: пожалуйста, смотрите редактирование в моем вопросе относительно оригинальных данных.
rnso