Десезонные данные подсчета

12

Я использовал stl () в R, чтобы разложить данные счетчиков на трендовые, сезонные и нерегулярные компоненты. Результирующие значения тренда больше не являются целыми числами. У меня есть следующие вопросы:

  1. Является ли stl () подходящим способом для десезонализации данных подсчета?
  2. Поскольку результирующий тренд больше не оценивается как целое, могу ли я использовать lm () для моделирования компонентов тренда?
Энн
источник

Ответы:

8

Не существует внутренней проблемы с использованием stl () для десезонализации данных подсчета. Одна проблема , чтобы быть в курсе , однако, что данные счета обычно имеет большее отклонение как среднее значение увеличивается. Это часто наблюдается как в сезонных, так и в случайных элементах разложения. Использование stl () для необработанных данных не учитывает это, и, следовательно, лучше всего сначала взять логарифм (правка - или квадратный корень) ваших данных.

Неважно, что значения тренда больше не являются целыми числами. Их можно рассматривать аналогично параметру в распределении Пуассона. Хотя распределенная переменная Пуассона должна быть целым числом, среднее значение необязательно.

Однако это не обязательно означает, что вы можете использовать lm () для моделирования компонента тренда. Существует много подводных камней при моделировании тенденций во временных рядах, поскольку ложных корреляций будет очень трудно избежать. Чаще всего люди сначала снимают серию, а затем моделируют остаточную часть.

Питер Эллис
источник
1
Как вы определяете, сколько трендов нужно учесть и длину каждого тренда? Различаете ли вы изменения уровня и тренды, и в целом, как вы определяете тенденцию в присутствии выбросов / внутренних факторов?
IrishStat
@IrishStat - да, это все хорошие моменты, и я не пытался решить весь набор проблем, просто обратил внимание на проблемы использования компонента тренда из вывода stl () R в качестве переменной ответа в регрессии , В своей декомпозиции stl () использует локально-взвешенную регрессию, которая обычно дает ощутимые результаты, когда дело доходит до изменения направления тренда и т. д., хотя, конечно, она имеет ограничения по сравнению с модельно-ориентированными методами, особенно для прогнозирования.
Питер Эллис