Прогноз временных рядов Arima (auto.arima) с несколькими экзогенными переменными в R

14

Я хотел бы провести прогноз на основе ARIMA-модели с несколькими временными рядами с несколькими экзогенными переменными. Поскольку я не настолько опытен в отношении статистики, которую ни RI хотят сохранить, это настолько просто, насколько это возможно (прогноз тренда на 3 месяца достаточно).

У меня есть 1 зависимый временной ряд и 3-5 временных рядов предикторов, все месячные данные, без пропусков, один и тот же временной горизонт.

Я столкнулся с функцией auto.arima и спросил себя, будет ли это подходящим решением для моей проблемы. У меня разные цены на товары и цены на изделия из них. Все необработанные данные являются нестационарными, но благодаря разности первого порядка все они становятся стационарными данными. ADF, KPSS указывают на это. (Это значит, что я тестировал на интеграцию, верно?).

Теперь у меня вопрос: как мне применить это с функцией auto.arima И является ли ARIMA правильным подходом в любом случае? Некоторые люди уже советовали мне использовать VAR, но возможно ли это и с ARIMA?

В следующей таблице приведены мои данные. На самом деле набор данных увеличивается до 105 наблюдений, но первые 50 сделают. Тенденция, а также сезонность здесь, безусловно, представляют интерес.

введите описание изображения здесь

Спасибо за любые советы и помощь! Georg

Джордж
источник
пожалуйста, опубликуйте свои данные, чтобы их можно было скачать. использовать Excel. Это может быть просто задачей выявления ненужных (возможно, значительно взаимно коррелированных) входных рядов. Я не думаю, что VAR необходим или Принципиальные компоненты полезны для этой проблемы
IrishStat

Ответы:

10

Если внешние регрессоры причинная для , а не наоборот , и не вызывают друг друга, то ARIMA, безусловно , необходимо. VAR имеет смысл, если все ваши разные временные ряды зависят друг от друга.y

Для auto.arima()работы с внешними регрессорами соберите ваши регрессоры в матрицу X, которую вы вводите в xregпараметр auto.arima(). (Конечно, Xколичество строк должно совпадать с временным рядом, который yвы моделируете.)

Для прогнозирования вам понадобятся будущие значения ваших регрессоров, которые вы снова включите в xregпараметр forecast.

Страницы справки ?auto.arimaи ?forecast.Arima(обратите внимание на заглавную букву А - это не опечатка. Не спрашивайте меня ...).

Стефан Коласса
источник
1
(+1) Вы могли бы немного рассказать об идее причинности и о том, как ее проверить. Это может быть полезно для полноты вашего ответа, поскольку вы упоминаете, что решение использовать ARIMA определяется направлением причинности среди переменных. Например, вы думаете о тесте причинности Грейнджера или тесте Хаусмана ? Благодарю.
Javlacalle
3
@javlacalle: я не очень большой поклонник статистических тестов на причинность (из которых тест Грейнджер является самым известным). Я предпочитаю принимать решение о «вероятной причинности» на основе предмета. Например, я бы не использовал тест Грейнджера, чтобы оценить, увеличивает ли снижение цены продажи в супермаркете или наоборот. Не является ли причинно-следственная связь между ВВП, обменными курсами и созданием рабочих мест. В обоих случаях дело кажется достаточно очевидным, и тест в соответствии с теорией нас ничему не научит, тогда как тест, противоречащий теории, будет только сбивать с толку (и, вероятно, не более, чем шум).
Стефан Коласса
1
... Я знаю, что открываюсь перед своим последним комментарием ;-)
Стефан Коласса
@ Стефан: Спасибо за ваш вклад. Хотя мой y определенно вызван моими регрессорами, а не другим способом, но мои регрессоры определенно коррелируют друг с другом и также должны оказывать более или менее прямое влияние друг на друга. Согласно вашему комментарию, это означает, что я должен использовать VAR вместо arima, так как это позволит избежать проблем (?). Здесь я использую набор цен на товары / продукты, которые в основном все связаны друг с другом до определенного момента. «Сырье» - это мой Y, продукты из цепочки создания стоимости, а также побочные продукты и т. Д. - мои предикторы.
Джордж
1
Знание контекста данных всегда полезно, и результаты любого анализа следует сравнивать с нашими априорными знаниями. Тем не менее, рекомендуется соблюдать осторожность. Интуиция иногда терпит неудачу, и теории, которые иногда воспринимаются как должное, полагаются на предположения, которые не подтверждаются фактами. Но я понимаю, что вы имеете в виду, и в целом согласен.
Javlacalle