У меня довольно предсказуемые ежедневные временные ряды с еженедельной сезонностью. Я могу придумать прогнозы, которые кажутся довольно точными (подтвержденными перекрестной проверкой), когда нет выходных. Однако, когда есть праздники, у меня возникают следующие проблемы:
- В моем прогнозе я получаю ненулевые числа для праздников, хотя все исторические праздники равны 0. Это действительно не главная проблема. Вопрос в том ...
- Поскольку обработка, которая не происходит в праздничные дни, «перетекает» в дни, следующие за праздничными днями, простая фиктивная переменная не обрезает ее, поскольку эти выбросы кажутся краткосрочными инновационными. Если бы не было еженедельной сезонности, я, возможно, мог бы дать оценку для распределения необработанных данных о празднике в течение пяти или около того дней после праздника (как предложено в разделе Как создать переменные, отражающие опережающее и запаздывающее влияние праздников / календарные эффекты в анализе временных рядов? ). Однако распределение «переполнения» зависит от дня недели, в который наступает праздник, и от того, является ли праздник Рождеством или Днем благодарения, когда заказы размещаются по более низкой ставке, чем в остальное время года.
Вот несколько снимков из моей перекрестной проверки, которые показывают прогноз (синий) и фактический (красный) результат для праздников, которые появляются в разные дни недели:
Я также беспокоюсь о том, что влияние Рождества зависит от дня недели, когда оно выпадает, и у меня есть только шесть или более лет исторических данных.
Есть ли у кого-нибудь предложения о том, как бороться с этими типами инновационных выбросов в контексте прогнозирования? (К сожалению, я не могу поделиться какими-либо данными)
источник
Ответы:
Не могли бы вы создать фиктивную переменную для выходных, одну для выходных + 1 и одну для выходных + 2, и установить для них только 1, если они приходятся на будний день?
Что касается Дня благодарения и Рождества, введение отдельных фиктивных переменных в эти праздничные дни представляется вам наихудшим вариантом (поскольку у вас есть данные только за шесть лет). В определенной степени это может быть вашим единственным вариантом - люди просто ведут себя иначе в эти праздники, чем, скажем, в четвертое июля (и если вы изучаете, например, модели розничных продаж, то вам определенно придется жить с этими Будучи "особыми" праздниками и определенно хотел бы проанализировать их отдельно). Однако, возможно, следующие идеи полезны для вас:
Надеюсь, это поможет.
источник