Я хочу прогнозировать розничные позиции (по неделям), используя экспоненциальное сглаживание. Я сейчас застрял в том, как рассчитывать, хранить и применять индексы сезонности.
Проблема в том, что все примеры, которые я нашел, имеют дело с некой простой сезонностью. В моем случае у меня есть следующие проблемы: 1. Сезоны не происходят на одной и той же неделе каждый год: они подвижны. Марди-гра, одолжил, пасха и некоторые другие. 2. Есть времена года, которые меняются в зависимости от года. Например, существует сезон национальных праздников. В зависимости от того, близок ли праздник к выходным, клиенты покинут город или не покинут его. Так что это похоже на два сезона: один, когда клиенты покидают город, и другой, когда они не покидают город. 3. Иногда два (или 3) сезона происходят одновременно. Например, у нас был сезон "Марди-Гра", происходящий одновременно с сезоном Валентина.
4. Иногда времена года меняются по продолжительности. Например, «сезон Хэллоуина» начался ранее в этом году. Рождество также является еще одним примером, когда каждый год мы начинаем нести продукты.
Мне кажется, что мне нужно найти способ установить своего рода «сезонные профили», которые затем, в зависимости от конкретного сценария, каким-то образом добавляются для получения правильного сезонного индекса. Имеет ли это смысл?
Кто-нибудь знает, где я могу найти практическую информацию о том, как это сделать?
Спасибо Эдгард
источник
Простым решением будет включение в вашу спецификацию манекенов для событий:
где - показатель, принимающий значение если на неделе есть событие (скажем, Mardi Gras) и 0 в противном случае, для всех событий, которые вы считаете важными. 1 т, м мDт , м 1 T м м
Первая часть спецификации по существу является экспоненциальными сглаживателями, но с весом, меняющимся в зависимости от запаздывания (и оценивается OLS).λ1yt−1+...+λkyt−k
Это предполагает, что у вас есть как минимум 20 наблюдений для каждого события (т.е. 20 «мардигра»). Если это не так, вы можете попробовать связать некоторые события вместе (например, мардигра и трудовой день).
R для fit (1) довольно прост, предполагая, что dlsales стационарен, а D - ваша матрица фиктивных переменных:
Отсюда вы можете задать более конкретные вопросы о той части моего ответа, которая вам не знакома (я не знаю, какой у вас уровень в статистике).
источник