В настоящее время я работаю над проектом по прогнозированию данных временных рядов (ежемесячных данных). Я использую R для прогнозирования. У меня есть 1 зависимая переменная (у) и 3 независимых переменных (х1, х2, х3). Переменная y имеет 73 наблюдения, также как и остальные 3 переменные (alos 73). С января 2009 года по январь 2015 года. Я проверил корреляции и p-значение, и все это очень важно, чтобы поместить его в модель. Мой вопрос: как я могу сделать хороший прогноз, используя все независимые переменные? У меня нет будущих значений для этих переменных. Допустим, я бы хотел предсказать, какая у меня переменная через 2 года (в 2017 году). Как я могу это сделать?
Я попробовал следующий код:
model = arima(y, order(0,2,0), xreg = externaldata)
Можно ли с помощью этого кода сделать прогноз значения y на 2 года?
Я также попробовал код регрессии:
reg = lm(y ~ x1 + x2 + x3)
Но как мне занять время в этом коде? Как я могу предсказать, какое будет мое значение y, скажем, через 2 года? Я новичок в статистике и прогнозировании. Я провел некоторое чтение и просмотр значения задержки, но как я могу использовать значение задержки в модели для прогнозирования?
На самом деле мой общий вопрос: как я могу прогнозировать данные временного ряда с внешними переменными без будущего значения?
Ответы:
Если вы подходите к модели с использованием внешних переменных и хотите делать прогнозы из этой модели, вам потребуются (прогнозируемые) будущие значения внешних переменных, простые и простые. Обойти это невозможно.
Есть, конечно, разные способы прогнозирования ваших объясняющих переменных. Вы можете использовать последнее наблюдаемое значение (прогноз «наивное случайное блуждание») или общее среднее значение. Вы можете просто установить их на ноль, если это полезно для них (например, особые события, которые произошли в прошлом, например, землетрясение, которое вы не ожидаете повторить). Или вы можете подгонять и прогнозировать модель временных рядов к самим этим объясняющим переменным, например, используя
auto.arima
.xreg
Я рекомендую этот бесплатный учебник по онлайн-прогнозированию , особенно этот раздел о множественной регрессии (к сожалению, там нет ничего про ARIMAX), а также сообщение в блоге Роба Хиндмана "Путаница с моделью ARIMAX" .
источник
Как сказал Йоги Берра: «Трудно делать прогнозы, особенно в отношении будущего».
Многие программные модули статистики будут генерировать прогнозы на основе одномерного потока временных рядов при отсутствии какой-либо будущей информации, например, Proc Forecast в SAS или любом количестве доступных модулей ARIMA. Эти прогнозы являются прогнозами, основанными на историческом поведении ваших данных.
Вы говорите нам, что ваши данные ежемесячны, но не сообщаете нам, сколько периодов у вас есть в наличии. Другой подход состоит в том, чтобы установить ваши три IV назад на 24 месяца относительно DV, чтобы прогнозируемый период был t + 24. Это предполагает, что у вас есть достаточное количество данных как для инициализации модели, так и для калибровки любой соответствующей сезонности, в зависимости от ситуации.
источник
На мой взгляд, у вас есть три варианта:
Каждый подход имеет свои сильные и слабые стороны, поэтому лучшее зависит от конкретного контекста.
источник