В поисках определенного типа объяснения ARIMA

25

Это может быть трудно найти, но я хотел бы прочитать хорошо объясненный пример ARIMA, который

  • использует минимальную математику

  • расширяет обсуждение за пределы построения модели на использование этой модели для прогнозирования конкретных случаев

  • использует графику, а также числовые результаты для характеристики соответствия прогнозных и фактических значений.

rolando2
источник

Ответы:

7

Мое рекомендуемое чтение для введения в моделирование ARIMA было бы

Прикладной анализ временных рядов для социальных наук 1980 г. Мак-Клири; RA Hay; Э. Мейдингер; D McDowall

Это нацелено на социологов, поэтому математические требования не слишком строгие. Также для более коротких процедур я бы предложил две «Зеленые книги мудреца» (хотя они полностью излишни с книгой МакКлири),

Текст Острома является только моделированием ARMA и не обсуждает прогнозирование. Я не думаю, что они будут соответствовать вашему требованию для отображения ошибки прогноза либо. Я уверен, что вы могли бы найти больше полезных ресурсов, изучив также вопросы, отмеченные временными рядами на этом форуме.

Энди У
источник
Книга МакКлири чудесно написана, краткая и действительно хорошее введение. В последней главе также есть замечательный непреднамеренный юмор, в котором говорится о языках высокого уровня, таких как фортран.
richiemorrisroe
31

Я постараюсь ответить на мягкое побуждение whuber просто «ответить на вопрос» и остаться в теме. Нам дают 144 ежемесячных чтения серии под названием «Серия авиакомпаний». Бокс и Дженкинс были широко раскритикованы за то, что они предоставили прогноз, который был дико на высокой стороне из-за "взрывной природы" обратного зарегистрированного преобразования.введите описание изображения здесь

Визуально у нас создается впечатление, что дисперсия исходного ряда увеличивается с уровнем ряда, что указывает на необходимость преобразования. Однако мы знаем, что одним из требований для полезной модели является то, что дисперсия «ошибок модели» должна быть однородной. Не требуется никаких предположений относительно дисперсии исходного ряда. Они идентичны, если модель является просто константой, т. Е. Y (t) = u. Как /stats//users/2392/probabilityislogic так ясно заявил в своем ответе на Совет по объяснению гетерогенности / гетероскедастичности «одна вещь, которую я всегда нахожу забавной, - это« ненормальность данных », которую люди волнуются около. Данные не должны быть нормально распределены, но термин ошибки делает »

Ранние работы во временных рядах часто ошибочно приводили к выводам о необоснованных преобразованиях. Здесь мы обнаружим, что исправительным преобразованием для этих данных является просто добавление трех фиктивных рядов индикаторов в модель ARIMA, отражающих корректировку для трех необычных точек данных. Ниже приведен график функции автокорреляции, предполагающий сильную автокорреляцию при лаге 12 (0,76) и лаге 1 (0,948). Автокорреляции - это просто коэффициенты регрессии в модели, где y - это зависимая переменная, прогнозируемая с запаздыванием y.

введите описание изображения здесь! введите описание изображения здесь

Вышеприведенный анализ предполагает, что одна модель моделирует первые различия серии и изучает эту «остаточную серию», которая идентична первым различиям в первую очередь по своим свойствам. введите описание изображения здесь

Этот анализ подтверждает идею о том, что в данных существует сильная сезонная картина, которую можно исправить или смоделировать с помощью модели, содержащей два оператора дифференцирования.

введите описание изображения здесь введите описание изображения здесь

Эта простая двойная разность дает набор невязок, то есть скорректированных рядов или, если говорить в произвольной форме, преобразованный ряд, который свидетельствует о непостоянной дисперсии, но причиной непостоянной дисперсии является непостоянное среднее значение невязки. Вот график дважды дифференцированный ряд, предполагающий три аномалии в конце ряда. Автокорреляция этой серии ложно указывает, что «все хорошо», и может потребоваться любая настройка Ma (1). Следует проявлять осторожность, поскольку в данных есть предположения об аномалиях, поэтому акф смещен вниз. Это известно как «Эффект Алисы в Стране Чудес», т. Е. Принятие нулевой гипотезы об отсутствии доказанной структуры, когда эта структура маскируется нарушением одного из предположений.

введите описание изображения здесь введите описание изображения здесь

Мы визуально обнаруживаем три необычные точки (117 135 136)

введите описание изображения здесь

Этот этап обнаружения выбросов называется обнаружением вмешательства и может быть легко или не так легко запрограммирован в соответствии с работой Цая.

введите описание изображения здесьвведите описание изображения здесь

Если мы добавим три показателя в модель, мы получим введите описание изображения здесь

Затем мы можем оценить

введите описание изображения здесь

И получить участок остатков и акф

введите описание изображения здесь

введите описание изображения здесь

Это позволяет предположить, что мы добавляем в модель потенциально два коэффициента скользящего среднего. Таким образом, следующая оценочная модель может быть.

введите описание изображения здесь

Уступая

введите описание изображения здесь

введите описание изображения здесь

введите описание изображения здесь введите описание изображения здесь введите описание изображения здесь Затем можно удалить несущественную константу и получить уточненную модель: введите описание изображения здесь

Мы отмечаем, что никакие степенные преобразования не требовались вообще, чтобы получить набор невязок с этой постоянной дисперсией. Обратите внимание, что прогнозы не являются взрывоопасными.

введите описание изображения здесь

введите описание изображения здесь

В терминах простой взвешенной суммы мы имеем: 13 весов; 3 ненулевое и равно (1.0.1,0., - 1.0)

введите описание изображения здесь

введите описание изображения здесь

Этот материал был представлен таким образом, что он не был автоматическим и, следовательно, требовал взаимодействия с пользователем при принятии решений по моделированию.

IrishStat
источник
Привет, IrishStat, это снова я. Мне понравился ваш обширный пример, но есть два отрывка, которые немного неясны (по крайней мере для меня): «Автокорреляция этой серии ложно указывает, что« все хорошо », и может возникнуть необходимость в любой корректировке Ma (1)». «и« Этот акф предполагает, что мы можем добавить к модели потенциально два коэффициента скользящего среднего ». Что именно вы видите на этих графиках ACF, что заставляет вас в это верить? Разве они оба не выглядят нормально (почти все значения находятся в «синих линиях»)?
Брудер
: VBruder Я думаю, что я был «не прав» с утверждением «может быть .....». Во втором примере есть свидетельства «плохого acf» в lag1 и lag 12, указывающие на потенциальную потребность в коэффициентах t2o ma , Вы слишком верите в эти пределы, так как acf91) и acf (12) «опасно близки». Вы можете связаться со мной напрямую на мой опубликованный адрес электронной почты, доступный из моей информации.
IrishStat
Ницца пиши. «Модель ARIMA, отражающая корректировку для трех необычных точек данных» Вы говорите, что добавляете три фиктивные переменные для этих трех точек? С точки зрения непрофессионала, как эти три выброса учитываются в будущих прогнозах? (Я уверен, что это просто, я просто не знаком с этим.) Кроме того, похоже, что ваши границы ошибок не увеличиваются с течением времени. (Или, может быть, ошибка зависит от модальности шага?) Заранее спасибо.
Адам
@ Adam три фиктивные переменные не играют никакой роли в прогнозировании, поскольку все будущие значения равны 0. Да, представленные границы ошибок неверны. Мы исправили этот недостаток, и теперь с течением времени AUTOBOX представляет все новые и новые границы ошибок. Я один из разработчиков AUTOBOX. ,
IrishStat
@IrishStat "три фиктивные переменные не играют роли в прогнозировании, поскольку все будущие значения равны 0." Значит ли это, по сути, что они извлекаются из данных? Они должны иметь какое-то влияние на пределы прогнозирования?
Адам
15

Я попытался сделать это в главе 7 моего учебника 1998 года с Макридакисом и Уилрайтом. Удастся мне или нет, я оставлю других судить. Вы можете прочитать некоторые главы онлайн через Amazon (с p311). Ищите «ARIMA» в книге, чтобы убедить Amazon показать вам соответствующие страницы.

Обновление: у меня есть новая книга, которая бесплатна и онлайн. Глава ARIMA здесь .

Роб Хиндман
источник
3

Я бы порекомендовал прогнозирование с помощью однофакторной модели - модели Дженкинса: концепции и случаи от Алана Панкраца. Эта классическая книга имеет все функции, которые вы просили:

  • использует минимальную математику
  • расширяет обсуждение за пределы построения модели на использование этой модели для прогнозирования конкретных случаев
  • использует графику, а также числовые результаты для характеристики соответствия прогнозных и фактических значений.

Единственным недостатком является то, что он был напечатан в 1983 году и может не иметь последних разработок. Издатель выйдет со вторым изданием в январе 2014 года с обновлениями.

предсказатель
источник
Я также рекомендовал бы другую книгу Алана Панкраца: Прогнозирование с использованием моделей динамической регрессии. Очень похожий материал, но покрывает немного больше земли; хотя и менее подробно о стороне Бокса-Дженкинса. Приятно слышать, что второе издание выйдет в январе 2014 года!
Грэм Уолш
-4

Модель ARIMA - это просто средневзвешенное значение. Это отвечает на двойной вопрос;

  1. Сколько период (k) я должен использовать для расчета средневзвешенного

а также

  1. Точно какие веса

Он отвечает на молитву девы, чтобы определить, как приспособиться к предыдущим значениям (и предыдущим значениям ОДНОЗА), чтобы спроецировать серию (которая на самом деле вызвана неопределенными причинными переменными). Таким образом, модель ARIMA является причинно-следственной моделью для бедного человека.

IrishStat
источник
-1 Этот ответ, похоже, не отвечает на вопрос, который ищет «хорошо объясненный ... * пример *».
whuber
@whuber: ОП попросил ответ, который "использует минимальные математические". Мой ответ подробно описывал минимальную математику и был мотивирован для объяснения моделей ARIMA простыми повседневными словами. Это никогда не делается, поскольку ребята из математической теории фокусируются на «высококлассном объяснении» с использованием полиномов, разностных операторов, нелинейной оптимизации и т. Д.
IrishStat,
@ Ирландский Я согласен с мотивацией, чтобы держать математику, особенно по запросу пользователя. Но этот ответ, кажется, отвечает на другой вопрос: «что такое АРИМА». Специфика исходного вопроса также указывает на то, что ОП хорошо знает, что такое ARIMA и для чего он хорош; они хотят увидеть это в действии. Могу поспорить, вы могли бы легко внести такой пример :-).
whuber
: whuber: Это было бы очень легко для меня, и я мог бы просто сделать это.
IrishStat
@ Ирландский, я с нетерпением жду этого. Более того - эта проблема не возникла здесь, но она возникла в других местах - такие вклады являются потенциально более мощными и более ценными способами информирования людей о том, что вы можете сделать, чем многие другие открытые формы маркетинга.
whuber