Я поигрался с некоторым модульным тестированием корня в R, и я не совсем уверен, что делать с параметром k lag. Я использовал дополненной тест Дики Фуллера и тест Филиппс Перрона из tseries пакета. Очевидно, что параметр по умолчанию (для ) зависит только от длины ряда. Если я выберу разные k-значения, я получу довольно разные результаты. отклоняя нуль:adf.test
Dickey-Fuller = -3.9828, Lag order = 4, p-value = 0.01272
alternative hypothesis: stationary
# 103^(1/3)=k=4
Dickey-Fuller = -2.7776, Lag order = 0, p-value = 0.2543
alternative hypothesis: stationary
# k=0
Dickey-Fuller = -2.5365, Lag order = 6, p-value = 0.3542
alternative hypothesis: stationary
# k=6
плюс результат теста PP:
Dickey-Fuller Z(alpha) = -18.1799, Truncation lag parameter = 4, p-value = 0.08954
alternative hypothesis: stationary
Есть намеки?
r
time-series
trend
hans0l0
источник
источник
Ответы:
Прошло много времени с тех пор, как я посмотрел на тесты ADF, однако я помню, по крайней мере, две версии теста ADF.
http://www.stat.ucl.ac.be/ISdidactique/Rhelp/library/tseries/html/adf.test.html
http://cran.r-project.org/web/packages/fUnitRoots/
В пакете fUnitRoots есть функция adfTest (). Я думаю, что проблема тренда обрабатывается по-разному в этих пакетах.
Редактировать ------ На странице 14 следующей ссылки появилось 4 версии теста uf (прекращено):
http://math.uncc.edu/~zcai/FinTS.pdf
Еще одна ссылка. Прочтите раздел 6.3 по следующей ссылке. Это намного лучше, чем я мог объяснить объяснение термина задержки:
http://www.yats.com/doc/cointegration-en.html
Также я был бы осторожен с любой сезонной моделью. Если вы не уверены, что присутствует некоторая сезонность, я бы не использовал сезонные термины. Почему? Все может быть разбито на сезонные условия, даже если это не так. Вот два примера:
График ниже взят из приведенного выше оператора plot (x.stl). stl () обнаружил небольшой сезонный термин в белом шуме. Вы можете сказать, что этот термин настолько мал, что это действительно не проблема. Проблема в том, что в реальных данных вы не знаете, является ли этот термин проблемой или нет. В приведенном ниже примере обратите внимание, что ряд данных тренда имеет сегменты, в которых он выглядит как отфильтрованная версия необработанных данных, и другие сегменты, в которых он может считаться значительно отличным от необработанных данных.
источник
Параметр k представляет собой набор лагов, добавленных к последовательной корреляции адресов. A в ADF означает, что тест дополняется добавлением лагов. Выбор количества лагов в АПД может быть осуществлен различными способами. Обычный способ - начинать с большого числа лагов, выбранных априори, и последовательно уменьшать количество лагов до тех пор, пока самый длинный лаг не станет статистически значимым.
Вы можете проверить последовательную корреляцию в остатках после применения лагов в АПД.
источник