Путаница с расширенным тестом Дики Фуллера

16

Я работаю над набором данных electricityдоступны в R пакете TSA. Моя цель состоит в том, чтобы выяснить, arimaподойдет ли модель для этих данных и в конечном итоге соответствовать ей. Итак, я поступил следующим образом:

1-й: нанесите временной ряд, который получился, если бы следующий график: Ts plot1

2-й: я хотел взять журнал electricityдля стабилизации дисперсии, а затем дифференцировал ряды соответствующим образом, но непосредственно перед этим я проверил на стационарность на исходный набор данных с использованием adfтеста (Augmented Dickey Fuller) и, как это ни удивительно, получился следующим образом:

Код и результаты:

adf.test(electricity)

             Augmented Dickey-Fuller Test
data:  electricity 
Dickey-Fuller = -9.6336, Lag order = 7, p-value = 0.01 
alternative hypothesis: stationary
Warning message: In adf.test(electricity) : p-value smaller than printed p-value

Что ж, согласно понятию временного ряда моего новичка, я предполагаю, что это означает, что данные являются стационарными (малое значение p, отвергает нулевую гипотезу нестационарности). Но, глядя на сюжет, я не вижу, что это может быть стационарным. У кого-нибудь есть веское объяснение этому?

Вара
источник
5
ADF тестирует только единичный корень стационарный, это может быть тренд стационарный. Поэтому вам следует использовать тест KPSS , см. Stats.stackexchange.com/questions/30569/… В общем, есть разница между моделями DS (разностная стационарная) и TS (трендовая стационарная). KPSS является лучшим тестом для различия между этими моделями, подробности см. По ссылке.
Стат Тистициан
3
Похоже, в сериале есть сезонность и тренд. Включите в ADF-тест детерминистический тренд + сезонные манекены и запустите тест. Проверьте также на наличие автокоррелированных остатков.
Pantera

Ответы:

12

Так как вы берете значение по умолчанию к в adf.test , которое в данном случае равно 7, вы в основном проверяете, помогает ли объяснить набор данных за последние 7 месяцев.ИксT-ИксT-1, Использование электричества имеет сильную сезонность, как показывает ваш график, и, вероятно, будет циклическим после 7-месячного периода. Если вы установите k = 12 и проведете повторное тестирование, ноль корневого модуля не может быть отклонен,

> adf.test(electricity, k=12)

Augmented Dickey-Fuller Test
data:  electricity
Dickey-Fuller = -1.9414, Lag order = 12, p-value = 0.602
alternative hypothesis: stationary
horaceT
источник
2

Предполагая, что «adf.test» действительно происходит из пакета «tseries» (прямо или косвенно), причина в том, что он автоматически включает линейный тренд времени. Из документа tseries (версия 0.10-35): «Используется общее уравнение регрессии, которое включает в себя константу и линейный тренд [...]». Таким образом, результат теста действительно указывает на стационарность тренда (которая, несмотря на название, не является стационарной).

Я также согласен с Pantera, что сезонные эффекты могут исказить результат. В действительности ряд может быть временной тенденцией + детерминированными сезонными колебаниями + стохастическим единичным корневым процессом, но тест ADF может неправильно интерпретировать сезонные колебания как стохастические возвраты к детерминированной тенденции, что подразумевает наличие корней, меньших единицы. (С другой стороны, учитывая, что вы включили достаточно лагов, скорее всего, это должно проявляться как (паразитные) единичные корни на сезонных частотах, а не на нулевой / долгосрочной частоте, на которую смотрит тест ADF. В любом случае, учитывая сезонный характер лучше включать сезонные.)

Свен С.
источник