Я составил следующий код с функцией stl (Сезонная декомпозиция временных рядов по Лесс):
plot(stl(ts(rnorm(144), frequency=12), s.window="periodic"))
Это показывает значительное сезонное изменение со случайными данными, помещенными в коде выше (функция rnorm). Изменения в значимости видны каждый раз, когда это выполняется, хотя картина иная. Два таких шаблона показаны ниже:
Как мы можем положиться на функцию STL на некоторых данных, когда она показывает сезонные колебания. Нужно ли рассматривать это сезонное изменение с учетом некоторых других параметров? Спасибо за ваше понимание.
Код был взят с этой страницы: Является ли этот метод подходящим для проверки сезонных эффектов в данных о количестве самоубийств?
Ответы:
Разложение Лёсса предназначено для сглаживания ряда, применяя к данным средние значения, так что оно разбивается на составляющие, например, трендовые или сезонные, которые представляют интерес для анализа данных. Но эта методология не предназначена для проведения формальной проверки на наличие сезонности .
Хотя в вашем примере
stl
возвращается сглаженный шаблон сезонной периодичности, этот шаблон не имеет отношения к объяснению динамики ряда. Чтобы увидеть это, мы можем сравнить дисперсию каждого компонента с дисперсией исходного ряда.Мы можем видеть, что именно остаток объясняет большую часть дисперсии в данных (как и следовало ожидать для процесса белого шума).
Если мы возьмем ряд с сезонностью, то относительная дисперсия сезонного компонента будет гораздо более актуальной (хотя у нас нет простого способа проверить это, так как лесс не параметрический).
Относительные отклонения указывают на то, что сезонность является основным компонентом, объясняющим динамику ряда.
Неосторожный взгляд на сюжет
stl
может быть обманчивым. Хороший шаблон, возвращаемый функцией,stl
может заставить нас подумать, что в данных может быть выявлена соответствующая сезонная модель, но при ближайшем рассмотрении можно обнаружить, что на самом деле это не так. Если цель состоит в том, чтобы принять решение о наличии сезонности, разложение лесса может быть полезным в качестве предварительного взгляда, но оно должно быть дополнено другими инструментами.источник
В том же духе я видел использование моделей Фурье для несезонных данных, принуждая сезонную структуру к подгонке и прогнозируемым значениям, вызывая аналогичный (удушье!) Результат. Подход предполагаемой модели дает пользователю то, что он навязывает / предполагает, что не всегда то, что хорошая аналитика предложила бы / предоставила.
источник
stl()
не основано на идеях Фурье. Хотя я еще не видел никого, кто бы защищал «бессмысленный» анализ, заметьте, что любая подходящая модель семьи может рассматриваться как навязанная или предполагаемая. Вопрос состоит в том, насколько далеко любая процедура дает пользователям возможность понять, работает ли она и как она работает для определенного набора данных.