Как мне включить инновационный выброс при наблюдении 48 в мою модель ARIMA?

10

Я работаю над набором данных. После использования некоторых методов идентификации моделей я разработал модель ARIMA (0,2,1).

Я использовал detectIOфункцию в пакете TSAв R, чтобы обнаружить инновационный выброс (IO) на 48-м наблюдении за моим исходным набором данных.

Как включить этот выброс в мою модель, чтобы я мог использовать его для целей прогнозирования? Я не хочу использовать модель ARIMAX, так как я не смогу сделать какие-либо прогнозы из этого в R. Есть ли другие способы, которыми я мог бы сделать это?

Вот мои значения в порядке:

VALUE <- scan()
  4.6  4.5  4.4  4.5  4.4  4.6  4.7  4.6  4.7  4.7  4.7  5.0  5.0  4.9  5.1  5.0  5.4
  5.6  5.8  6.1  6.1  6.5  6.8  7.3  7.8  8.3  8.7  9.0  9.4  9.5  9.5  9.6  9.8 10.0
  9.9  9.9  9.8  9.8  9.9  9.9  9.6  9.4  9.5  9.5  9.5  9.5  9.8  9.3  9.1  9.0  8.9
  9.0  9.0  9.1  9.0  9.0  9.0  8.9  8.6  8.5  8.3  8.3  8.2  8.1  8.2  8.2  8.2  8.1
  7.8  7.9  7.8  7.8

Это на самом деле мои данные. Это уровень безработицы в течение 6 лет. Есть 72 наблюдения тогда. Каждое значение должно содержать не более одного десятичного знака

b2amen
источник
6
t=48
2
@Gen_b Вы правы, это должно вас беспокоить, так как это, вероятно, из-за разницы, приводящей к отмене MA (1). Неправильная идентификация в результате использования неподходящих инструментов.
IrishStat
2
Во второй разнице у вас есть то, что выглядит как выброс, но это, очевидно, вызвано небольшим аддитивным скачком при наблюдении 47 в исходной серии, которое при двухкратном дифференцировании выглядит как большой отрицательный выброс через один период позже. Если вы сделаете что-то простое, чтобы убрать этот небольшой эффект в наблюдении 47 (почти что-нибудь разумное), во втором разнице не будет никаких выбросов. Я бы сказал, что, возможно, лучше рассматривать ее как АО в первоначальном масштабе.
Glen_b
2
В этом наборе данных много чего происходит, но локальное временное поведение (корреляция, сезонность и т. Д.) Является наименьшим. Когда вы слепо анализируете такие данные как последовательность чисел, вы рискуете получить нелепые результаты (или даже хуже). Что вы можете сказать нам о том, что означают эти данные ? Возможно, они измеряют что-то на станции мониторинга? Экономический временной ряд? Диаграмма биологического роста? Понимание чего-либо о лежащем в основе явлении, как правило, поможет идентифицировать модель гораздо лучше, чем любая другая попытка поиграться со статистическим программным обеспечением.
whuber
2
@whuber: это уровень безработицы в течение 6 лет!
b2amen

Ответы:

3

Y(t)=[θ/ϕ][A(t)+IO(t)]Y*(t)=[θ/ϕ][A(t)]+[θ/ϕ][IO(t)]

θ=1ϕ=[1.5B]
Y*(t)=[1/(1.5B)][A(t)]
+IO(t).5IO(t1)+.25IO(t2).125IO(t3).


Y(t)=[1/(1.5B)][A(t)] +10IO(t)5IO(t1)+2.5IO(t2)1.25IO(t3).
IO

Таким образом, вы можете видеть, что воздействие аномалии не только мгновенно, но имеет память.

t

[w(b)/d(b)][w(b)]

Всякий раз, когда вы включаете память, будь то в результате оператора дифференцирования или структуры ARMA, это молчаливое признание невежества из-за пропущенных причинных рядов. Это также верно в отношении необходимости включения детерминированных серий интервенций, таких как импульсы / сдвиги уровней, сезонные импульсы или тренды местного времени. Эти фиктивные переменные являются обязательным прокси для пропущенных детерминированных причинно-следственных переменных, указанных пользователем. Часто все, что у вас есть, - это интересующий вас ряд, и, учитывая описанные мною квалификаторы, вы можете прогнозировать будущее, основываясь на прошлом, в полном неведении относительно природы анализируемых данных. Единственная проблема в том, что вы используете заднее стекло, чтобы предсказать дорогу впереди ... действительно опасная вещь.

после того, как данные были опубликованы ...

Разумной моделью является (1,1,0) введите описание изображения здесьи аномалии АО были выявлены в периоды 39,41,47,21 и 69 (не период 48). Остатки от этой модели, по-видимому, не имеют видимой структуры. введите описание изображения здесьИ введите описание изображения здесьFice AO оценивает оптимальное представление деятельности, отраженной деятельностью, а не в истории временных рядов. Я бы подумал, что ACF чрезмерно дифференцированной модели OP будет отражать неадекватность модели. Вот модель. введите описание изображения здесь Опять же, R-код не предоставляется, поскольку проблема или возможность находятся в сфере идентификации / пересмотра / проверки модели. Наконец, график фактического / подогнанного и прогнозируемого ряда.! [Введите описание изображения здесь] [6]

IrishStat
источник
1
Спасибо за ответ; но я на самом деле хотел R-код вместо моей модели.
b2amen
1
@ b2amen Да, я недооцениваю, НО Glen_b хотел кое-что ", и я думал, что отвечу на него.
IrishStat
Спасибо за редактирование. Мы с тобой стали бы хорошими партнерами!
IrishStat
@ IrishStat: мои данные включены в исходный вопрос. Надеюсь, что это поможет вам помочь мне. В любом случае, спасибо
b2amen
@IrishStat: мне нравится ваш вывод. Это выглядит довольно опрятно для меня. А какое программное обеспечение вы использовали? Но не могли бы вы объяснить, как вы определили AR (2,1,0)? Спасибо
b2amen