В общем, изучите расширенный учебник по анализу временных рядов (как правило, вводные книги помогут вам просто доверять своему программному обеспечению), например, анализ временных рядов от Box, Jenkins & Reinsel. Вы также можете найти подробную информацию о процедуре Бокса-Дженкинса, прибегая к помощи Google. Обратите внимание, что существуют другие подходы, кроме Box-Jenkins, например, основанные на AIC.
В R вы сначала конвертируете свои данные в объект ts
(временной ряд) и говорите R, что частота равна 12 (месячные данные):
require(forecast)
sales <- ts(c(99, 58, 52, 83, 94, 73, 97, 83, 86, 63, 77, 70, 87, 84, 60, 105, 87, 93, 110, 71, 158, 52, 33, 68, 82, 88, 84),frequency=12)
Вы можете построить (частичные) функции автокорреляции:
acf(sales)
pacf(sales)
Они не предполагают какого-либо поведения AR или MA.
Затем вы подбираете модель и проверяете ее:
model <- auto.arima(sales)
model
Смотрите ?auto.arima
за помощью. Как видим, auto.arima
выбирает простую (0,0,0) модель, поскольку она не видит ни трендов, ни сезонности, ни AR или MA в ваших данных. Наконец, вы можете прогнозировать и строить временные ряды и прогноз:
plot(forecast(model))
Посмотрите на ?forecast.Arima
(обратите внимание на заглавную A!).
Этот бесплатный онлайн учебник является отличным введением в анализ временных рядов и прогнозирование с использованием R. Очень рекомендуется.
Две вещи. Ваш временной ряд является ежемесячным, для разумной оценки ARIMA вам нужны как минимум данные за 4 года, поскольку отраженные 27 баллов не дают автокорреляционную структуру. Это также может означать, что на ваши продажи влияют некоторые внешние факторы, а не их собственная стоимость. Постарайтесь выяснить, какой фактор влияет на ваши продажи и является ли этот фактор измеряемым. Затем вы можете запустить регрессию или VAR (векторную авторегрессию) для получения прогнозов.
Если у вас нет ничего другого, кроме этих значений, ваш лучший способ - использовать метод экспоненциального сглаживания для получения наивного прогноза. Экспоненциальное сглаживание доступно в R.
Во-вторых, не рассматривайте продажи продукта отдельно, продажи двух продуктов могут быть коррелированы, например, увеличение продаж кофе может отражать снижение продаж чая. используйте другую информацию о продукте, чтобы улучшить свой прогноз.
Обычно это происходит с данными о продажах в розничной торговле или цепочке поставок. Они не показывают большую часть автокорреляционной структуры в серии. С другой стороны, такие методы, как ARIMA или GARCH, обычно работают с данными фондового рынка или экономическими индексами, где у вас обычно есть автокорреляция.
источник
Это действительно комментарий, но он превышает допустимый, поэтому я публикую его как квази-ответ, поскольку он предлагает правильный способ анализа данных временных рядов. ,
Хорошо известный факт, но часто игнорируемый здесь и в других местах, заключается в том, что теоретическая ACF / PACF, которая используется для формулировки предположительной модели модели ARIMA, не содержит импульсов / сдвигов уровней / сезонных импульсов / трендов местного времени. Кроме того, он содержит постоянные параметры и постоянную погрешность во времени. В этом случае 21-е наблюдение (значение = 158) легко помечается как выброс / импульс, и предлагаемая корректировка -80 дает измененное значение 78. Результирующая ACF / PACF модифицированной серии показывает мало или не имеет признаков стохастической (ARIMA) структуры. В этом случае операция прошла успешно, но пациент умер. Выборочная АКФ основана на ковариации / дисперсии, а чрезмерно раздутая / раздутая дисперсия приводит к смещению АКФ вниз. Профессор Кит Орд однажды назвал это «эффектом Алисы в стране чудес»
источник
Как отметил Стефан Коласса, в ваших данных нет особой структуры. Функции автокорреляции не предполагают структуру ARMA (см.
acf(sales)
,pacf(sales)
) Иforecast::auto.arima
не выбирают порядок AR или MA.Тем не менее, обратите внимание, что нулевая норма в остатках отклоняется на уровне значимости 5%.
Примечание:
JarqueBera.test
основано на функции,jarque.bera.test
доступной в пакетеtseries
.Включение аддитивного выброса в наблюдении 21, которое обнаруживается с помощью
tsoutliers
нормальности остатков. Таким образом, отдаленные наблюдения не влияют на оценку перехвата и прогноз.источник