Понимание запаздывания в расширенном тесте Дики Фуллера R

15

Я поигрался с некоторым модульным тестированием корня в R, и я не совсем уверен, что делать с параметром k lag. Я использовал дополненной тест Дики Фуллера и тест Филиппс Перрона из tseries пакета. Очевидно, что параметр по умолчанию (для ) зависит только от длины ряда. Если я выберу разные k-значения, я получу довольно разные результаты. отклоняя нуль:Кadf.testК

Dickey-Fuller = -3.9828, Lag order = 4, p-value = 0.01272
alternative hypothesis: stationary 
# 103^(1/3)=k=4 


Dickey-Fuller = -2.7776, Lag order = 0, p-value = 0.2543
alternative hypothesis: stationary
# k=0

Dickey-Fuller = -2.5365, Lag order = 6, p-value = 0.3542
alternative hypothesis: stationary
# k=6

плюс результат теста PP:

Dickey-Fuller Z(alpha) = -18.1799, Truncation lag parameter = 4, p-value = 0.08954
alternative hypothesis: stationary 

К

Есть намеки?

hans0l0
источник
3
эта книга должна ответить на все ваши вопросы.
mpiktas
1
Благодарность! Мне нравится серия Springer useR, но я этого не знал ...
hans0l0
хм, iiuc эти тесты только, если phi = 1, а не если phi> 1. Но все же выход R говорит, что альтернатива: стационарность. Так они тоже проверяют фи> 1? Очевидно, что это также будет нестационарным.
hans0l0

Ответы:

5

Прошло много времени с тех пор, как я посмотрел на тесты ADF, однако я помню, по крайней мере, две версии теста ADF.

http://www.stat.ucl.ac.be/ISdidactique/Rhelp/library/tseries/html/adf.test.html

http://cran.r-project.org/web/packages/fUnitRoots/

В пакете fUnitRoots есть функция adfTest (). Я думаю, что проблема тренда обрабатывается по-разному в этих пакетах.

Редактировать ------ На странице 14 следующей ссылки появилось 4 версии теста uf (прекращено):

http://math.uncc.edu/~zcai/FinTS.pdf

Еще одна ссылка. Прочтите раздел 6.3 по следующей ссылке. Это намного лучше, чем я мог объяснить объяснение термина задержки:

http://www.yats.com/doc/cointegration-en.html

Также я был бы осторожен с любой сезонной моделью. Если вы не уверены, что присутствует некоторая сезонность, я бы не использовал сезонные термины. Почему? Все может быть разбито на сезонные условия, даже если это не так. Вот два примера:

#First example: White noise
x <- rnorm(200)

#Use stl() to separate the trend and seasonal term
x.ts <- ts(x, freq=4) 
x.stl <- stl(x.ts, s.window = "periodic")
plot(x.stl)

#Use decompose() to separate the trend and seasonal term
x.dec <- decompose(x.ts)
plot(x.dec)

#===========================================

#Second example, MA process
x1 <- cumsum(x)

#Use stl() to separate the trend and seasonal term
x1.ts <- ts(x1, freq=4)
x1.stl <- stl(x1.ts, s.window = "periodic")
plot(x1.stl)

#Use decompose() to separate the trend and seasonal term
x1.dec <- decompose(x1.ts)
plot(x1.dec)

График ниже взят из приведенного выше оператора plot (x.stl). stl () обнаружил небольшой сезонный термин в белом шуме. Вы можете сказать, что этот термин настолько мал, что это действительно не проблема. Проблема в том, что в реальных данных вы не знаете, является ли этот термин проблемой или нет. В приведенном ниже примере обратите внимание, что ряд данных тренда имеет сегменты, в которых он выглядит как отфильтрованная версия необработанных данных, и другие сегменты, в которых он может считаться значительно отличным от необработанных данных.

введите описание изображения здесь

bill_080
источник
1

Параметр k представляет собой набор лагов, добавленных к последовательной корреляции адресов. A в ADF означает, что тест дополняется добавлением лагов. Выбор количества лагов в АПД может быть осуществлен различными способами. Обычный способ - начинать с большого числа лагов, выбранных априори, и последовательно уменьшать количество лагов до тех пор, пока самый длинный лаг не станет статистически значимым.

Вы можете проверить последовательную корреляцию в остатках после применения лагов в АПД.

RAH
источник