Я работаю над набором данных electricity
доступны в R пакете TSA
. Моя цель состоит в том, чтобы выяснить, arima
подойдет ли модель для этих данных и в конечном итоге соответствовать ей. Итак, я поступил следующим образом:
1-й: нанесите временной ряд, который получился, если бы следующий график:
2-й: я хотел взять журнал electricity
для стабилизации дисперсии, а затем дифференцировал ряды соответствующим образом, но непосредственно перед этим я проверил на стационарность на исходный набор данных с использованием adf
теста (Augmented Dickey Fuller) и, как это ни удивительно, получился следующим образом:
Код и результаты:
adf.test(electricity)
Augmented Dickey-Fuller Test
data: electricity
Dickey-Fuller = -9.6336, Lag order = 7, p-value = 0.01
alternative hypothesis: stationary
Warning message: In adf.test(electricity) : p-value smaller than printed p-value
Что ж, согласно понятию временного ряда моего новичка, я предполагаю, что это означает, что данные являются стационарными (малое значение p, отвергает нулевую гипотезу нестационарности). Но, глядя на сюжет, я не вижу, что это может быть стационарным. У кого-нибудь есть веское объяснение этому?
источник
Ответы:
Так как вы берете значение по умолчанию к вИксT- хт - 1 , Использование электричества имеет сильную сезонность, как показывает ваш график, и, вероятно, будет циклическим после 7-месячного периода. Если вы установите k = 12 и проведете повторное тестирование, ноль корневого модуля не может быть отклонен,
adf.test
, которое в данном случае равно 7, вы в основном проверяете, помогает ли объяснить набор данных за последние 7 месяцев.источник
Предполагая, что «adf.test» действительно происходит из пакета «tseries» (прямо или косвенно), причина в том, что он автоматически включает линейный тренд времени. Из документа tseries (версия 0.10-35): «Используется общее уравнение регрессии, которое включает в себя константу и линейный тренд [...]». Таким образом, результат теста действительно указывает на стационарность тренда (которая, несмотря на название, не является стационарной).
Я также согласен с Pantera, что сезонные эффекты могут исказить результат. В действительности ряд может быть временной тенденцией + детерминированными сезонными колебаниями + стохастическим единичным корневым процессом, но тест ADF может неправильно интерпретировать сезонные колебания как стохастические возвраты к детерминированной тенденции, что подразумевает наличие корней, меньших единицы. (С другой стороны, учитывая, что вы включили достаточно лагов, скорее всего, это должно проявляться как (паразитные) единичные корни на сезонных частотах, а не на нулевой / долгосрочной частоте, на которую смотрит тест ADF. В любом случае, учитывая сезонный характер лучше включать сезонные.)
источник