У меня есть модель прогнозирования для временного ряда, и я хочу вычислить ошибку прогнозирования вне выборки. На данный момент стратегия, которой я придерживаюсь, - это стратегия, предложенная в блоге Роба Хиндмана (в нижней части страницы), которая выглядит следующим образом (предполагается, что временной ряд и тренировочный набор размера )
- Подгоните модель к данным и пусть будет прогнозом для следующего наблюдения.
- Вычислите ошибку прогноза как .
- Повторите для
- Вычислить среднеквадратичную ошибку как
Мой вопрос заключается в том, насколько я должен беспокоиться о корреляциях из-за моих перекрывающихся тренировочных наборов. В частности, скажем, я хочу прогнозировать не только следующее значение, но и следующие значения , чтобы у меня были прогнозы и ошибки , и я хочу построить временную структуру ошибок предсказания.
Могу ли я все еще поворачивать окно тренировки, установленное вперед, на 1 каждый раз, или я должен свернуть его вперед на ? Как меняются ответы на эти вопросы, если в серии, которую я предсказываю, есть значительная автокорреляция (возможно, это процесс с большой памятью, то есть автокорреляционная функция затухает как степенной закон, а не экспоненциально).
Я был бы признателен либо за объяснение здесь, либо за ссылки на где-нибудь, где я могу найти теоретические результаты о доверительных интервалах вокруг MSE (или другие измерения ошибок).
источник