Я месяцами работал над краткосрочным прогнозированием нагрузки и использованием климатических / погодных данных для повышения точности. У меня есть опыт работы в области компьютерных наук, и поэтому я стараюсь не делать больших ошибок и несправедливых сравнений, работая с инструментами статистики, такими как модели ARIMA. Я хотел бы знать ваше мнение о нескольких вещах:
Я использую обе модели (S) ARIMA и (S) ARIMAX для исследования влияния данных о погоде на прогнозирование. Как вы думаете, будет ли необходимо использовать также методы экспоненциального сглаживания?
Имея временной ряд из 300 ежедневных выборок, я начинаю с первых двух недель и выполняю прогноз на 5 дней вперед, используя модели, построенные с помощью функции auto.arima R (пакет прогноза). Затем я добавляю еще одну выборку в свой набор данных, снова калибрую модели и выполняю прогноз на 5 дней и так далее до конца доступных данных. Считаете ли вы, что этот способ работает правильно?
Спасибо за ваши предложения, хотя целью нашей работы является статья в инженерном журнале, я хотел бы сделать работу максимально строгой со статистической точки зрения.
источник
Ответы:
Я думаю, что стоило бы изучить и модели экспоненциального сглаживания. Модели экспоненциального сглаживания являются принципиально отличным классом моделей от моделей ARIMA и могут давать разные результаты для ваших данных.
Это звучит как правильный подход и очень похож на метод перекрестной проверки временных рядов, предложенный Робом Хиндманом .
Я бы суммировал ошибку перекрестной проверки для каждого прогноза (экспоненциальное сглаживание, ARIMA, ARMAX) и затем использовал общую ошибку для сравнения трех методов.
Вы также можете рассмотреть «поиск по сетке» для параметров ARIMA, а не использовать auto.arima. При поиске по сетке вы изучаете каждый возможный параметр для модели арима, а затем выбираете «лучшие» с использованием точности прогноза.
источник