Я использую R (3.1.1) и модели ARIMA для прогнозирования. Я хотел бы знать, каким должен быть параметр «частоты», который назначается в ts()
функции , если я использую данные временных рядов, которые:
- разделено минутами и распространяется в течение 180 дней (1440 минут / день)
- отделяется секундами и распространяется на 180 дней (86 400 секунд / день).
Если я правильно помню определение, «частота» в ts в R - это число наблюдений за «сезон».
Вопрос часть 1:
Что такое "сезон" в моем случае?
Если сезон "день", то "частота" для минут = 1440 и 86 400 для секунд?
Вопрос часть 2:
Может ли «частота» также зависеть от того, что я пытаюсь достичь / прогнозировать? например, в моем случае я хотел бы иметь очень краткосрочный прогноз. На шаг впереди на 10 минут каждый раз. Тогда можно будет считать сезон часом, а не днем? В этом случае частота = 60 для минут, частота = 3600 для секунд?
Я, например, пытался использовать частоту = 60 для минутных данных и получил лучшие результаты по сравнению с частотой = 1440 (используется, fourier
см. Ссылку Хиндмана ниже)
http://robjhyndman.com/hyndsight/forecasting-weekly-data/
(Сравнение было сделано с использованием MAPE для измерения точности прогноза)
В случае, если результаты являются полностью произвольными, и частота не может быть изменена. Какова будет интерпретация использования freq = 60 в моих данных?
Я также думаю, что стоит упомянуть, что мои данные содержат сезонность каждый час и каждые два часа (наблюдая необработанные данные и функцию автокорреляции)
источник