У меня есть некоторые кумулятивные данные о частоте. Линия выглядит так, как будто она очень хорошо вписывается в данные, но в ней есть циклическое / периодическое покачивание. Я хотел бы оценить, когда совокупная частота достигнет определенного значения c . Когда я строю графики остатков и подгоночных значений, я получаю прекрасное синусоидальное поведение.
Теперь, чтобы добавить еще одно осложнение, обратите внимание, что в графиках остатков
Есть два цикла, которые имеют более низкие значения, чем другие, что представляет собой эффект выходного дня, который также должен быть принят во внимание.
Итак, куда мне идти отсюда? Как я могу объединить некоторый косинус, синус или циклический термин в регрессионную модель до прибл. оцените, когда совокупная частота будет равна ?
источник
Давайте начнем с наблюдения, что обычные наименьшие квадраты, подходящие для этих данных, вероятно, неуместны. Если предполагается, что отдельные данные, которые собираются, как обычно, содержат компоненты случайных ошибок, то ошибка в кумулятивных данных (а не в кумулятивных частотах - это нечто отличное от того, что у вас есть) - это кумулятивная сумма всех слагаемых ошибок. Это делает кумулятивные данные гетероскедастичными (они становятся все более и более изменчивыми со временем) и сильно положительно коррелируют. Поскольку эти данные ведут себя так регулярно, и их так много, проблем с подгонкой мало вы получите, но ваши оценки ошибок, ваши прогнозы (о чем идет речь весь вопрос) и особенно ваши стандартные ошибки прогноза могут быть слишком далеки.
Стандартная процедура анализа таких данных начинается с исходных значений. Возьмите ежедневные различия, чтобы удалить высокочастотный синусоидальный компонент. Возьмите еженедельные различия между ними, чтобы исключить возможный недельный цикл. Проанализируйте, что осталось. ARIMA- моделирование - это мощный гибкий подход, но начните с простого: нанесите на график эти разностные данные, чтобы увидеть, что происходит, а затем переходите оттуда. Также обратите внимание, что с данными менее чем за две недели ваши оценки недельного цикла будут плохими, и эта неопределенность будет доминировать в неопределенности в прогнозах.
источник
Очевидно, что доминирующее колебание имеет период один день. Похоже, что есть также низкочастотные компоненты, относящиеся к дню недели, поэтому добавьте компонент с частотой одна неделя (т.е. одна седьмая дня) и его первые несколько гармоник. Это дает модель формы:
- при условииT измеряется в днях. ВотY это необработанные данные, а не их совокупная сумма.
источник
Почему бы просто не использовать GA, чтобы последовательно найти амплитуду, период и фазу ряда синусов (или косинусов), а затем объединить их. Оптимизируйте следующее: (n (n-1) / ((np-1) ^ 2 (np-2))) RSS
источник