Укороченная версия:
У меня есть временной ряд климатических данных, которые я проверяю на стационарность. Основываясь на предыдущих исследованиях, я ожидаю, что модель, лежащая в основе (или, так сказать, «генерирующая») данных, будет иметь член перехвата и положительный линейный тренд времени. Чтобы проверить эти данные на стационарность, должен ли я использовать тест Дики-Фуллера, который включает в себя точку пересечения и временной тренд, то есть уравнение № 3 ?
Или я должен использовать тест DF, который включает только перехват, потому что первое отличие уравнения, которое, как я считаю, лежит в основе модели, имеет только перехват?
Длинная версия:
Как указано выше, у меня есть временной ряд климатических данных, которые я проверяю на стационарность. Основываясь на предыдущих исследованиях, я ожидаю, что модель, лежащая в основе данных, будет иметь член перехвата, положительный линейный тренд времени и некоторый нормально распределенный член ошибки. Другими словами, я ожидаю, что базовая модель будет выглядеть примерно так:
где обычно распространяется. Поскольку я предполагаю, что базовая модель имеет как перехват, так и линейный тренд времени, я проверил на единичный корень с помощью уравнения № 3 простого теста Дики-Фуллера, как показано:
Этот тест возвращает критическое значение, которое заставило бы меня отказаться от нулевой гипотезы и сделать вывод, что базовая модель нестационарна. Однако я подвергаю сомнению, правильно ли я применяю это, поскольку, хотя предполагается, что базовая модель имеет перехват и временную тенденцию, это не означает, что первое различие будет. Наоборот, на самом деле, если моя математика верна.
Вычисление первой разности на основе уравнения предполагаемой базовой модели дает:
Следовательно, первое различие имеет только перехват, а не временную тенденцию.
Я думаю, что мой вопрос похож на этот , за исключением того, что я не уверен, как применить этот ответ к моему вопросу.
Образец данных:
Вот некоторые данные о температуре образца, с которыми я работаю.
64.19749
65.19011
64.03281
64.99111
65.43837
65.51817
65.22061
65.43191
65.0221
65.44038
64.41756
64.65764
64.7486
65.11544
64.12437
64.49148
64.89215
64.72688
64.97553
64.6361
64.29038
65.31076
64.2114
65.37864
65.49637
65.3289
65.38394
65.39384
65.0984
65.32695
65.28
64.31041
65.20193
65.78063
65.17604
66.16412
65.85091
65.46718
65.75551
65.39994
66.36175
65.37125
65.77763
65.48623
64.62135
65.77237
65.84289
65.80289
66.78865
65.56931
65.29913
64.85516
65.56866
64.75768
65.95956
65.64745
64.77283
65.64165
66.64309
65.84163
66.2946
66.10482
65.72736
65.56701
65.11096
66.0006
66.71783
65.35595
66.44798
65.74924
65.4501
65.97633
65.32825
65.7741
65.76783
65.88689
65.88939
65.16927
64.95984
66.02226
66.79225
66.75573
65.74074
66.14969
66.15687
65.81199
66.13094
66.13194
65.82172
66.14661
65.32756
66.3979
65.84383
65.55329
65.68398
66.42857
65.82402
66.01003
66.25157
65.82142
66.08791
65.78863
66.2764
66.00948
66.26236
65.40246
65.40166
65.37064
65.73147
65.32708
65.84894
65.82043
64.91447
65.81062
66.42228
66.0316
65.35361
66.46407
66.41045
65.81548
65.06059
66.25414
65.69747
65.15275
65.50985
66.66216
66.88095
65.81281
66.15546
66.40939
65.94115
65.98144
66.13243
66.89761
66.95423
65.63435
66.05837
66.71114
источник
Ответы:
Вам необходимо учесть дрейф и (параметрический / линейный) тренд на уровнях временного ряда, чтобы указать детерминированные члены в расширенной регрессии Дики-Фуллера, которая относится к первым различиям временного ряда. Путаница возникает именно из того, как вы вывели уравнение первых разностей.
(Дополненная) регрессионная модель Дики-Фуллера
Предположим, что уровни ряда включают в себя дрейф и член тренда . Нулевой гипотезой нестационарности в этом случае будет H 0
Одним из уравнений для первых различий, подразумеваемых этим процессом генерирования данных [DGP], является то, которое вы получили Однако это не (расширенная) регрессия Дики-Фуллера, использованная в тесте.
Вместо этого правильная версия может быть получена путем вычитания с обеих сторон первого уравнения, что приводит к Δ Y tYт - 1 Этоявляется (расширенная) Дики-Фуллера регрессии, и эквивалентный вариант нулевой гипотезы нестационарности является тестН0
Еще один момент, на который следует обратить внимание: если вы не уверены в наличии линейного тренда на уровнях временного ряда, вы можете совместно проверить линейный тренд и единичный корень, то есть , что можно проверить с помощью F-теста с соответствующими критическими значениями. Эти тесты и критические значения производятся функцией Rвпакете.ЧАС0:[ β2 , д, β1 , л]'= [ 0 , 0 ]'
ur.df
urca
Давайте рассмотрим некоторые примеры в деталях.
Примеры
1. Использование американской инвестиционной серии
В первом примере используется серия инвестиций США, которая обсуждается в Lutkepohl and Kratzig (2005, pg. 9) . Сюжет сериала и его первое отличие приведены ниже.
Код R для этого приведен ниже:
2. Использование немецкой (лог) серии потребления
Второй пример - использование немецкого квартального сезонно скорректированного временного ряда (log) потребления. Сюжет сериала и его отличия приведены ниже.
Код R, чтобы сделать это
3. Используя данные о температуре
Теперь мы можем оценить свойства ваших данных. Обычные графики уровней и первые различия приведены ниже.
Это означает, что ваши данные имеют перехват и тренд, поэтому мы выполняем тест ADF (без отстающих первых разностей), используя следующий код R
Результаты как t-теста, так и F-теста показывают, что нуль нестационарности может быть отклонен для температурного ряда. Я надеюсь, что это проясняет вопрос несколько.
источник
Нулевая гипотеза в тесте Дики-Фуллера заключается в том, что в процессе есть единичный корень. Поэтому, когда вы отклоняете ноль, вы получаете, что ваш процесс является стационарным (с обычными предостережениями проверки гипотез).
источник
Предыдущие ответы были превосходны.
Обычно вы принимаете решение о том, какой тест проводить на основе сюжета. В этом случае данные, как представляется, имеют перехват и тренд.
Если вы тестируете уровень юнита-корня в уровнях, вы будете использовать модель пересечения и трендов. Если вы запустите тест с разницей, вы будете использовать только модель перехвата.
Я только что ответил на этот вопрос, потому что я должен рекомендовать вам использовать сезонные тесты на этих данных. Эти тесты действительно сложны (работать с сезонностью нелегко). Тем не менее, характер данных (температура) и потому, что в сюжете вы можете наблюдать некоторые сезонные поведения. Затем вам следует изучить тест HEGY и внедрить его, если вы хотите, чтобы ваши оценки были надежными.
источник