Оценить коэффициенты ARMA путем проверки ACF и PACF

Как вы оцениваете подходящую модель прогноза для временного ряда путем визуального осмотра графиков ACF и PACF? Какой из них (например, ACF или PACF) сообщает AR или MA (или они оба)? Какая часть графиков показывает вам сезонную и несезонную часть для сезонной ARIMA?

Рассмотрим функции ACF и PCF, показанные ниже. Они относятся к логарифмически преобразованным сериям, которые были дифференцированы дважды: одна простая разница и одна сезонная ( исходные данные , трансформированные в журнал данные ). Как бы вы охарактеризовали сериал? Какая модель лучше всего подходит для него?

введите описание изображения здесь

r time-series forecasting acf-pacf 4everlearning
источник

Ответы:

Мой ответ на самом деле ограничен ответом javlacelle, но он слишком длинный для простого комментария, но не слишком короткий, чтобы быть бесполезным.

Хотя ответ jvlacelle технически верен на одном уровне, он «чрезмерно упрощает», поскольку в нем содержатся определенные «вещи», которые обычно никогда не бывают правдивыми. Предполагается, что не требуется никакой детерминированной структуры, такой как один или несколько временных трендов ИЛИ один или несколько сдвигов уровня или один или несколько сезонных импульсов или один или несколько одноразовых импульсов. Кроме того, предполагается, что параметры идентифицированной модели инвариантны во времени, а процесс ошибки, лежащий в основе предварительно идентифицированной модели, также инвариантен во времени. Игнорирование любого из вышеперечисленного часто является (всегда, на мой взгляд!) Рецептом катастрофы или, точнее, «плохо идентифицированной моделью». Классическим случаем этого является ненужное логарифмическое преобразование, предложенное для ряда авиакомпаний и для ряда, которое ОП представляет в своем пересмотренном вопросе. Нет необходимости в каком-либо логарифмическом преобразовании для его данных, так как в периоды 198, 207, 219, 219 и 256, которые остались необработанными, существует лишь несколько «необычных» значений, создающих ложное впечатление, что существует более высокая дисперсия ошибок с более высокими уровнями. Обратите внимание, что «необычные значения» идентифицируются с учетом любой необходимой структуры ARIMA, которая часто ускользает от человеческого глаза. Преобразования необходимы, когда дисперсия ошибки не постоянна во времени, НЕ, когда дисперсия наблюдаемого Y не постоянна во времени , Примитивные процедуры по-прежнему допускают тактическую ошибку при преждевременном выборе трансформации до любого из вышеупомянутых средств защиты. Следует помнить, что простая стратегия идентификации моделей ARIMA была разработана в начале 60-х годов, НО с тех пор произошло много изменений / улучшений. 219 и 256, которые остались необработанными, создают ложное впечатление, что существует более высокая дисперсия ошибок с более высокими уровнями. Обратите внимание, что «необычные значения» идентифицируются с учетом любой необходимой структуры ARIMA, которая часто ускользает от человеческого глаза. Преобразования необходимы, когда дисперсия ошибки не постоянна во времени, НЕ, когда дисперсия наблюдаемого Y не постоянна во времени , Примитивные процедуры по-прежнему допускают тактическую ошибку при преждевременном выборе трансформации до любого из вышеупомянутых средств защиты. Следует помнить, что простая стратегия идентификации моделей ARIMA была разработана в начале 60-х годов, НО с тех пор произошло много изменений / улучшений. 219 и 256, которые остались необработанными, создают ложное впечатление, что существует более высокая дисперсия ошибок с более высокими уровнями. Обратите внимание, что «необычные значения» идентифицируются с учетом любой необходимой структуры ARIMA, которая часто ускользает от человеческого глаза. Преобразования необходимы, когда дисперсия ошибки не постоянна во времени, НЕ, когда дисперсия наблюдаемого Y не постоянна во времени , Примитивные процедуры по-прежнему допускают тактическую ошибку при преждевременном выборе трансформации до любого из вышеупомянутых средств защиты. Следует помнить, что простая стратегия идентификации моделей ARIMA была разработана в начале 60-х годов, НО с тех пор произошло много изменений / улучшений. идентифицируются с учетом любой необходимой структуры ARIMA, которая часто ускользает от человеческого глаза. Преобразования необходимы, когда дисперсия ошибки не постоянна во времени, а НЕ когда дисперсия наблюдаемого Y не является постоянной во времени. Примитивные процедуры по-прежнему допускают тактическую ошибку при преждевременном выборе трансформации до любого из вышеупомянутых средств защиты. Следует помнить, что простая стратегия идентификации моделей ARIMA была разработана в начале 60-х годов, НО с тех пор произошло много изменений / улучшений. идентифицируются с учетом любой необходимой структуры ARIMA, которая часто ускользает от человеческого глаза. Преобразования необходимы, когда дисперсия ошибки не постоянна во времени, а НЕ когда дисперсия наблюдаемого Y не является постоянной во времени. Примитивные процедуры по-прежнему допускают тактическую ошибку при преждевременном выборе трансформации до любого из вышеупомянутых средств защиты. Следует помнить, что простая стратегия идентификации моделей ARIMA была разработана в начале 60-х годов, НО с тех пор произошло много изменений / улучшений. Примитивные процедуры по-прежнему допускают тактическую ошибку при преждевременном выборе трансформации до любого из вышеупомянутых средств защиты. Следует помнить, что простая стратегия идентификации моделей ARIMA была разработана в начале 60-х годов, НО с тех пор произошло много изменений / улучшений. Примитивные процедуры по-прежнему допускают тактическую ошибку при преждевременном выборе трансформации до любого из вышеупомянутых средств защиты. Следует помнить, что простая стратегия идентификации моделей ARIMA была разработана в начале 60-х годов, НО с тех пор произошло много изменений / улучшений.

Отредактировано после публикации данных:

Разумная модель была определена с использованием http://www.autobox.com/cms/, которая представляет собой часть программного обеспечения, которая включает в себя некоторые из моих вышеупомянутых идей, когда я помогал в ее разработке. введите описание изображения здесь Тест Чоу на постоянство параметров предложил сегментировать данные и использовать последние 94 наблюдения в качестве параметров модели, которые со временем менялись. введите описание изображения здесь . Эти последние 94 значения дали уравнение со всеми значимыми коэффициентами. , График остатков предполагает разумный разброс со следующей АКФ, предполагающей случайность введите описание изображения здесь . График фактического и очищенного освещения является ярким, поскольку он показывает незначительные НО значимые выбросы. , Наконец, график фактического соответствия и прогноза подводит итог нашей работы ВСЕ БЕЗ ПРИНЯТИЯ ЛОГАРИТМ введите описание изображения здесь , Хорошо известно, но часто забывают, что трансформации власти подобны наркотикам ... необоснованное использование может причинить вам вред. Наконец, обратите внимание, что модель имеет AR (2), НО не структуру AR (1).

IrishStat
источник

почему мы не можем взять преобразование журнала? Пожалуйста, посмотрите набор данных AirPassengers в R, который имеет мультипликативную сезонность. Взяв журнал, преобразует его в аддитивную сезонность. Также, если мы не берем журналы, набор данных будет иметь возрастающую дисперсию, то есть он не будет стационарным. Как я могу иметь дело с таким набором данных без преобразования журнала? Можете ли вы объяснить, пожалуйста?

user2338823

«Нет необходимости в каком-либо логарифмическом преобразовании для его данных, поскольку есть только несколько« необычных »значений в периоды, которые не обрабатываются, создают ложное впечатление, что существует более высокая дисперсия ошибок с более высокими уровнями». предположение о постоянстве дисперсии стационарности связано с дисперсией ошибки, а не с дисперсией исходного ряда. Программное обеспечение R не позволяет автоматически идентифицировать и включать аномалии. см. обсуждение серии autobox.com/cms/index.php/blog . И autobox.com/pdfs/vegas_ibf_09a.pdf

IrishStat

Тест Бокса-Кокса для степенного преобразования НЕ ПРЕДПОЛАГАЕТСЯ, таким образом, он может ошибочно / непреднамеренно связать изменяющуюся дисперсию с ожидаемым значением, что неверно указывает на необходимость преобразования. См. Статью Цая docplayer.net/… от одного из учеников Бокса как вступление к работе с необработанной скрытой детерминированной структурой. Кстати, если вы не можете / не можете справиться с нарушением первого момента, тогда вы можете неправильно отрегулировать для изменение дисперсии либо посредством силового преобразования, либо GLS, как указывает Цай.

IrishStat

Просто чтобы прояснить концепцию, путем визуальной проверки ACF или PACF вы можете выбрать (не оценить) предварительную модель ARMA. После выбора модели вы можете оценить модель, максимизировав функцию правдоподобия, минимизировав сумму квадратов или, в случае модели AR, с помощью метода моментов.

Модель ARMA может быть выбрана после проверки ACF и PACF. Этот подход основан на следующих фактах: 1) ACF стационарного процесса AR порядка p сходит на ноль с экспоненциальной скоростью, в то время как PACF становится равным нулю после отставания p. 2) Для процесса МА порядка q теоретические ACF и PACF демонстрируют обратное поведение (ACF усекается после отставания q и PACF относительно быстро стремится к нулю).

Обычно ясно определить порядок модели AR или MA. Однако в процессах, которые включают в себя как AR, так и MA, отставание, при котором они усекаются, может быть размытым, поскольку как ACF, так и PACF уменьшатся до нуля.

Один из способов - сначала установить модель AR или MA (ту, которая кажется более понятной в ACF и PACF) низкого порядка. Затем, если есть какая-то дополнительная структура, она будет отображаться в остатках, поэтому проверяется ACF и PACF остатков, чтобы определить, необходимы ли дополнительные термины AR или MA.

Обычно вам приходится пытаться диагностировать более одной модели. Вы также можете сравнить их, посмотрев на AIC.

ACF и PACF, которые вы опубликовали вначале, предложили ARMA (2,0,0) (0,0,1), то есть обычный AR (2) и сезонный MA (1). Сезонная часть модели определяется аналогично регулярной части, но с учетом лагов сезонного порядка (например, 12, 24, 36, ... в ежемесячных данных). Если вы используете R рекомендуется увеличить количество по умолчанию лагов, которые отображаются, acf(x, lag.max = 60).

Сюжет, который вы показываете сейчас, обнаруживает подозрительную отрицательную корреляцию. Если этот график основан на том же графике, что и предыдущий, возможно, вы приняли слишком много различий. Смотрите также этот пост .

Вы можете получить более подробную информацию, среди других источников, здесь: Глава 3 во Временных рядах: теория и методы Питера Дж. Броквелла и Ричарда А. Дэвиса и здесь .

javlacalle
источник

Ты прав. Возможно, я взял одну разницу слишком много. У меня есть одно сомнение, хотя. Я сделал простую разницу ( i.imgur.com/1MjLzlX.png ) и сезонную (12) одну ( i.imgur.com/E64Sd7p.png ) в данных журнала. Который я должен смотреть, сезонный правильно?

@ 4everlearning Верно, после учета сезонных различий ACF и PACF выглядят ближе к тому, что мы могли ожидать от стационарного процесса. Вы можете начать с подгонки ARIMA (2,0,0) (0,1,1) в R arima(x, order = c(2,0,0), seasonal = list(order = c(0,1,1)))и отображения ACF и PACF остатков. Также будьте в курсе дальнейших вопросов, поднятых IrishStat, которые вам следует учитывать при анализе.

Javlacalle

Благодарю. Как мне найти эти заказы AR и MA? Кроме того, информационный критерий Акаике дает отрицательное значение для моей модели. Я понимаю, что это не важно, хотя я не совсем уверен, как сравнить его с другими моделями, скажем, AIC = -797.74 и AIC = -800.00. Что предпочтительнее?

Вы можете определить заказы, следуя идее, приведенной в ответе выше. Если вы видите, что ACF относительно быстро обнуляется и PACF усекается после задержки 2, вероятно, в данных присутствует структура AR (2). Обратная идея применима для обнаружения МА. Как общая рекомендация, начните с модели низкого порядка и осмотрите остатки, ища структуры AR или MA, которые будут добавлены к исходной модели.

Javlacalle

Как правило, чем ниже AIC, тем лучше модель (при условии, что вы используете данные в одном и том же масштабе в обеих моделях, т. Е. Ряды должны находиться либо в уровнях, либо во всех сравниваемых моделях). ).

Javlacalle