Сколько лагов использовать в тесте Юнга-Бокса временного ряда?

20

После того, как модель ARMA подгоняется к временному ряду, обычно проверяют невязки с помощью теста Portmanteau Ljung-Box (среди других тестов). Тест Льюнга-Бокса возвращает значение ap. У него есть параметр h , который представляет собой количество тестируемых лагов. В некоторых текстах рекомендуется использовать h = 20; другие рекомендуют использовать h = ln (n); большинство из них не говорят , что час использовать.

Вместо того, чтобы использовать одно значение для h , предположим, что я делаю тест Юнга-Бокса для всех h <50, а затем выбираю h, которое дает минимальное значение p. Разумный ли это подход? Какие преимущества и недостатки? (Один очевидный недостаток - увеличение времени вычислений, но здесь это не проблема.) Есть ли литература по этому поводу?

Чтобы немного уточнить .... Если тест дает р> 0,05 для всех h , то, очевидно, временные ряды (остатки) проходят тест. Мой вопрос касается того, как интерпретировать тест, если p <0,05 для некоторых значений h, а не для других значений.

user2875
источник
1
@ user2875, я удалил свой ответ. Дело в том, что для больших тест не надежен. Таким образом, ответ на самом деле зависит, для которого , . Кроме того, каково точное значение ? Если мы снизим порог до , изменится ли результат теста? Лично в случае противоречивых гипотез я ищу другие индикаторы, хороша ли модель или нет. Насколько хорошо подходит модель? Как модель сравнивается с альтернативными моделями? У альтернативной модели те же проблемы? Для каких других нарушений тест отклоняет нуль? ч р < 0,05 р 0,01часчасп<0,05п0,01
mpiktas
1
@mpiktas, тест Льюнга-Бокса основан на статистике, распределение которой асимптотически (когда h становится большим) хи-квадрат. Однако, когда h становится большим относительно n, мощность теста уменьшается до 0. Следовательно, стремление выбрать h достаточно велико, чтобы распределение было близко к хи-квадрату, но достаточно мало, чтобы иметь полезную мощность. (Я не знаю, каков риск ложного отрицания, когда h мало.)
user2875
@ user2875, это третий раз, когда вы меняли вопрос. Сначала вы спрашиваете о стратегии выбора с наименьшим значением, затем как интерпретировать тест, если для некоторых значений , а теперь какой оптимальный выбрать. Все три вопроса имеют разные ответы и могут даже иметь разные ответы в зависимости от контекста конкретной проблемы. р < 0,05 ч ччасп<0,05часчас
mpiktas
@mpiktas, вопросы все одинаковые, просто разные взгляды на это. (Как указывалось, если p> 0,05 для всех h, то мы знаем, как интерпретировать наименьшее p; если бы мы знали оптимальный h - мы не знаем, - тогда мы не были бы обеспокоены выбором наименьшего p.)
user2875

Ответы:

9

Ответ определенно зависит от того: для чего на самом деле пытаются использовать тест?Q

Общая причина заключается в том, чтобы: быть более или менее уверенным в совместной статистической значимости нулевой гипотезы об отсутствии автокорреляции вплоть до запаздывания (альтернативно, предполагая, что у вас есть что-то, близкое к слабому белому шуму ), и построить скупую модель, имея как можно меньше количество параметров, насколько это возможно.час

Обычно данные временных рядов имеют естественную сезонную структуру, поэтому практическим практическим правилом было бы установить чтобы удвоить это значение. Другой - это горизонт прогнозирования, если вы используете модель для прогнозирования потребностей. Наконец, если вы обнаружите некоторые существенные отклонения в более поздних лагах, попробуйте подумать об исправлениях (это может быть связано с некоторыми сезонными эффектами или данные не были скорректированы для выбросов).час

Вместо того, чтобы использовать одно значение для h, предположим, что я делаю тест Юнга-Бокса для всех h <50, а затем выбираю h, которое дает минимальное значение p.

Это совместный тест значимости , поэтому, если выбор основан на данных, то почему я должен заботиться о некоторых небольших (случайных?) Отклонениях с любой задержкой меньше , предполагая, что она, конечно, намного меньше (мощность теста вы упомянули). В поисках простой, но актуальной модели, я предлагаю информационные критерии, как описано ниже.ч н нчасчасN

Мой вопрос касается того, как интерпретировать тест, если для некоторых значений а не для других значений.чп<0,05час

Так что это будет зависеть от того, насколько далеко это произойдет. Недостатки дальних отклонений: больше параметров для оценки, меньше степеней свободы, худшая прогностическая сила модели.

Попробуйте оценить модель, включая части MA и \ или AR, в лаге, где происходит вылет, и дополнительно посмотрите на один из информационных критериев (AIC или BIC, в зависимости от размера выборки), это поможет вам лучше понять, какая модель более экономный. Любые упражнения по прогнозированию вне выборки также приветствуются здесь.

Дмитрий Челов
источник
+1, это то, что я пытался выразить, но не смог :)
mpiktas
8

Предположим, что мы указываем простую модель AR (1) со всеми обычными свойствами,

YTзнак равноβYT-1+UT

Обозначим теоретическую ковариацию ошибки как

γJЕ(UTUT-J)

Если бы мы могли наблюдать член ошибки, то образец автокорреляции члена ошибки определяется как

ρ~Jγ~Jγ~0

где

γ~J1NΣTзнак равноJ+1NUTUT-J,Jзнак равно0,1,2 ...

Но на практике мы не соблюдаем срок ошибки. Таким образом, автокорреляция выборки, относящаяся к члену ошибки, будет оценена с использованием остатков от оценки, как

γ^J1NΣTзнак равноJ+1NU^TU^T-J,Jзнак равно0,1,2 ...

Q-статистика Бокса-Пирса (Ljung-Box Q - это просто асимптотически нейтральная ее масштабированная версия)

QВпзнак равноNΣJзнак равно1пρ^J2знак равноΣJзнак равно1п[Nρ^J]2d???χ2(п)

Наша проблема состоит в том, можно ли сказать , что асимптотически имеет распределение хи-квадрат (при нулевом значении отсутствия автокорреляции в члене ошибки) в этой модели. Чтобы это произошло, каждый из должен быть асимптотически стандартным Normal. Один из способов проверить это - проверить, имеет ли такое же асимптотическое распределение, что и (который построен с использованием истинных ошибок и, следовательно, имеет желаемое асимптотическое поведение при нулевом значении).QВп
Nρ^JNρ^Nρ~

У нас есть это

U^Tзнак равноYT-β^YT-1знак равноUT-(β^-β)YT-1

где - последовательная оценка. Такβ^

γ^J1NΣTзнак равноJ+1N[UT-(β^-β)YT-1][UT-J-(β^-β)YT-J-1]

знак равноγ~J-1NΣTзнак равноJ+1N(β^-β)[UTYT-J-1+UT-JYT-1]+1NΣTзнак равноJ+1N(β^-β)2YT-1YT-J-1

Предполагается, что выборка является стационарной и эргодической, и предполагается, что моменты существуют до желаемого порядка. Поскольку оценка является последовательной, этого достаточно для того, чтобы две суммы обнулились. Итак, мы заключаемβ^

γ^Jпγ~J

Это подразумевает, что

ρ^Jпρ~JпρJ

Но это не гарантирует автоматически, что сходится к Nρ^JNρ~J (в распределении) (думаю, что теорема о непрерывном отображении здесь не применима, поскольку преобразование, применяемое к случайным переменным, зависит от ) , Для того чтобы это произошло, нам нужноN

Nγ^JdNγ~J

(знаменатель -tilde или hat- будет сходиться к дисперсии члена ошибки в обоих случаях, поэтому он нейтрален для нашей проблемы).γ0

У нас есть

nγ^j=nγ~j1nt=j+1nn(β^β)[utytj1+utjyt1]+1nt=j+1nn(β^β)2yt1ytj1

Таким образом, вопрос заключается в следующем: действительно ли эти две суммы, умноженные на , стремятся к нулю с вероятностью, так что мы останемся с асимптотически?nnγ^j=nγ~j

На вторую сумму имеем

1nt=j+1nn(β^β)2yt1ytj1=1nt=j+1n[n(β^β)][(β^β)yt1ytj1]

Так как сходится к случайной переменной, а согласованна, это приведет к нулю. β[n(β^β)]β^

Что касается первой суммы, то и здесь мы имеем, что сходится к случайной переменной, и поэтому имеем [n(β^β)]

1nt=j+1n[utytj1+utjyt1]pE[utytj1]+E[utjyt1]

Первое ожидаемое значение равно нулю в предположениях стандартной модели AR (1). Но второго ожидаемого значения нет , так как зависимая переменная зависит от прошлых ошибок.E[utytj1]

Таким образом, не будет иметь такого же асимптотического распределения, как . Но асимптотическое распределение последнего является стандартным нормальным, которое приводит к распределению хи-квадрат при возведении в квадрат rvnρ^jnρ~J

Поэтому мы приходим к выводу, что в чистой модели временных рядов нельзя сказать, что статистика Бокса-Пирса Q и Льюнга-Бокса Q имеет асимптотическое распределение хи-квадрат, поэтому тест теряет свое асимптотическое обоснование.

Это происходит потому, что правая переменная (здесь отставание зависимой переменной) по конструкции не является строго экзогенной по отношению к члену ошибки, и мы обнаружили, что такая строгая экзогенность необходима для того, чтобы Q-статистика BP / LB имела постулированное асимптотическое распределение.

Здесь правая переменная только «предопределена», и тогда критерий Бреуша-Пагана является действительным. (полный набор условий, необходимых для асимптотически верного теста, см. Hayashi 2000, p. 146-149).

Алекос Пападопулос
источник
1
Вы написали: «Но второго ожидаемого значения нет, поскольку зависимая переменная зависит от прошлых ошибок». Это называется строгой экзогенностью . Я согласен, что это сильное предположение, и вы можете построить AR (p) каркас без него, просто используя слабую экзогенность . Это причина, почему тест Бреуша-Годфри лучше в некотором смысле: если ноль не соответствует действительности, то BL теряет силу. BG основан на слабой экзогенности. Оба теста не подходят для некоторых эконометрических приложений, см., Например , презентацию Stata , с. 4/44.
Аксакал
3
@Aksakal Спасибо за ссылку. Дело в том, что без строгой экзогенности Box-Pierce / Ljung-Box не имеют асимптотического распределения хи-квадрат, это то, что показывают математики выше. Слабой экзогенности (которая имеет место в приведенной выше модели) недостаточно для них. Это именно то, что говорится в презентации, на которую вы ссылаетесь. 3/44.
Алекос Пападопулос
2
@AlecosPapadopoulos, потрясающий пост !!! Среди немногих лучших, с которыми я столкнулся здесь, в Cross Validated. Я просто хотел бы, чтобы это не исчезло в этой длинной ветке, и многие пользователи могли бы извлечь из этого пользу в будущем.
Ричард Харди
3

Перед тем, как сосредоточиться на «правильном» h (который выглядит скорее мнением, чем жестким правилом), убедитесь, что «лаг» определен правильно.

http://www.stat.pitt.edu/stoffer/tsa2/Rissues.htm

Цитирую раздел под номером 4 в приведенной выше ссылке:

«.... p-значения, показанные для статистического графика Льюнга-Бокса, являются неправильными, потому что степени свободы, используемые для вычисления p-значений, являются лагом, а не лагом - (p + q). То есть используемая процедура НЕ принимает во внимание тот факт, что остатки от подобранной модели. И ДА, по крайней мере, один разработчик ядра R знает это .... "

Изменить (23.01.2011): Вот статья Бернса, которая может помочь:

http://lib.stat.cmu.edu/S/Spoetry/Working/ljungbox.pdf

bill_080
источник
@ bil_080, OP не упоминает R, а на странице справки для Box.test в R упоминается исправление и есть аргумент, чтобы разрешить исправление, хотя вам нужно предоставить его вручную.
mpiktas
@mpiktas, ой, ты прав. Я предположил, что это был вопрос R Что касается второй части вашего комментария, есть несколько пакетов R, которые используют статистику Ljung-Box. Таким образом, это хорошая идея, чтобы убедиться, что пользователь понимает, что означает «задержка» пакета.
bill_080
Спасибо - я использую R, но вопрос общий. На всякий случай я проводил тест с функцией LjungBox в пакете portes, а также с Box.test.
user2875
2

Тема «Тестирование на автокорреляцию: метод Юнга-Бокса против Бреуша-Годфри» показывает, что тест Юнга-Бокса по существу неприменим в случае авторегрессионной модели. Это также показывает, что вместо этого следует использовать тест Бреуша-Годфри. Это ограничивает актуальность вашего вопроса и ответов (хотя ответы могут включать в себя, как правило, хорошие моменты).

Ричард Харди
источник
Проблема с тестом LB состоит в том, что у авторегрессионных моделей есть другие регрессоры, то есть ARMAX, а не модели ARM. ОП явно заявляет ARMA, а не ARMAX в вопросе. Следовательно, я думаю, что ваш ответ неверен.
Аксакал
@Aksakal, я ясно вижу из ответа Алекоса Пападопулоса (и комментариев под ним) в вышеупомянутой теме, что тест Льюнга-Бокса неприменим в обоих случаях, то есть в чистом AR / ARMA и ARX ​​/ ARMAX. Поэтому я не могу с вами согласиться.
Ричард Харди
Ответ Алекоса Пападопулоса хороший, но неполный. Это указывает на предположение теста Юнга-Бокса о строгой экзогенности, но в нем не упоминается, что если вы согласны с этим допущением, тогда тест LB можно использовать. Тест BG, который он и я предпочитаем LB, основан на слабой экзогенности. Конечно, лучше использовать тесты с более слабыми предположениями в целом. Тем не менее, даже предположения BG теста слишком сильны во многих случаях.
Аксакал
@Aksakal, Постановка этого вопроса вполне определенная - он учитывает остатки от модели ARMA. Здесь важно то, что LB не работает (как показано явно в посте Alecos в этой, а также вышеупомянутой теме), в то время как тест BG работает. Конечно, что-то может произойти в других условиях ( даже предположения BG-теста во многих случаях слишком сильны ), но это не проблема в этой теме. Кроме того, я не понял, что такое предположение в вашем утверждении, если вы согласны с этим предположением, тогда тест LB можно использовать . Это должно аннулировать точку Алекоса?
Ричард Харди
1

Эсканциано и Лобато сконструировали тест portmanteau с автоматическим выбором запаздывания на основе данных на основе теста Пирса-Бокса и его уточнений (которые включают тест Льюнга-Бокса).

Суть их подхода состоит в том, чтобы объединить критерии AIC и BIC - общие для идентификации и оценки моделей ARMA - для выбора оптимального количества используемых лагов. Во введении они предполагают, что, «интуитивно,« тест, проводимый с использованием критерия BIC, способен должным образом контролировать ошибку типа I и является более мощным, когда последовательная корреляция присутствует в первом порядке ». Вместо этого тесты на основе AIC более эффективны против последовательной корреляции высокого порядка. Таким образом, их процедура выбирает выбор лага BIC-типа в случае, когда автокорреляции кажутся небольшими и присутствуют только в младшем порядке, а секция лага AIC-типа в противном случае.

Тест реализован в Rпакете vrtest(см. Функцию Auto.Q).

Ryogi
источник
1

мин(20,T-1)перTT

Первый должен быть из авторской книги Бокса, Дженкинса и Рейнселя. Анализ временных рядов: прогнозирование и контроль. 3-е изд. Энглвудские Утесы, Нью-Джерси: Прентис Холл, 1994 год. Однако вот что они говорят о лагах на стр.314: введите описание изображения здесь

Это не сильный аргумент или предложение, но люди продолжают повторять его из одного места в другое.

Вторым параметром задержки является Tsay, RS Анализ финансовых временных рядов. 2-е изд. Хобокен, Нью-Джерси: John Wiley & Sons, Inc., 2005, вот что он написал на стр.33:

Несколько значений m часто используются. Симуляционные исследования показывают, что выбор m ≈ ln (T) обеспечивает лучшие показатели мощности.

Это несколько более сильный аргумент, но нет описания того, какое исследование было сделано. Так что я бы не стал принимать это за чистую монету. Он также предупреждает о сезонности:

Это общее правило нуждается в модификации при анализе сезонных временных рядов, для которых автокорреляции с лагами, кратными сезонности, являются более важными.

Подводя итог, если вам просто нужно подключить некоторое время к тесту и двигаться дальше, тогда вы можете использовать любой из этих параметров, и это нормально, потому что именно так поступает большинство практиков. Мы либо ленивы, либо, скорее, у нас нет времени на это. В противном случае вам придется провести собственное исследование силы и свойств статистических данных для рядов, с которыми вы имеете дело.

ОБНОВИТЬ.

Вот мой ответ на комментарий Ричарда Харди и его ответ, который относится к другой теме в CV, начатой ​​им. Вы можете видеть, что изложение в принятом (самим Ричердом Харди) ответе в этой теме явно основано на модели ARMAX, т.е. модели с экзогенными регрессорами :ИксT

YTзнак равноИксT'β+φ(L)YT+UT

Тем не менее, ОП не указал, что он делает ARMAX, напротив, он явно упоминает ARMA:

После того, как модель ARMA подходит для временного ряда, обычно проверяют невязки с помощью теста Portmanteau Ljung-Box

Одной из первых работ, которые указывали на потенциальную проблему с тестом LB, была Dezhbaksh, Hashem (1990). « Неправильное использование тестов последовательной корреляции в динамических линейных моделях », Обзор экономики и статистики, 72, 126–132. Вот выдержка из статьи:

введите описание изображения здесь

Как видите, он не возражает против использования теста LB для моделей с чистыми временными рядами, таких как ARMA. См. Также обсуждение в руководстве стандартного инструмента эконометрики EViews:

Если ряды представляют остатки от оценки ARIMA, соответствующие степени свободы должны быть скорректированы таким образом, чтобы представлять число автокорреляций за вычетом количества ранее оцененных терминов AR и MA. Также обратите внимание, что следует проявлять определенную осторожность при интерпретации результатов теста Льюнга-Бокса, примененного к остаткам из спецификации ARMAX (см. Dezhbaksh, 1990, для доказательства моделирования при конечной выборочной производительности теста в этой настройке)

Да, вы должны быть осторожны с моделями ARMAX и тестом LB, но вы не можете сделать общее заявление о том, что тест LB всегда неверен для всех серий авторегрессии.

ОБНОВЛЕНИЕ 2

Ответ Алекоса Пападопулоса показывает, почему тест Юнга-Бокса требует строгого предположения об экзогенности . Он не показывает это в своем посте, но тест Бреуша-Гпдфри (еще один альтернативный тест) требует только слабой экзогенности , что, конечно, лучше. Это то , что Грин, Эконометрика, 7-е изд. говорит о различиях между тестами, с.923:

Существенным отличием между тестами Годфри-Брейша и Бокса-Пирса является использование частичных корреляций (с учетом X и других переменных) в первых и простых корреляций во втором. Согласно нулевой гипотезе, нет никакой автокорреляции в εt и никакой корреляции между и в любом случае, поэтому оба теста асимптотически эквивалентны. С другой стороны, поскольку это не обуславливает , тест Бокса-Пирса является менее мощным, чем тест LM, когда нулевая гипотеза ложна, как может предположить интуиция.ИксTεsИксT

Аксакал
источник
Я полагаю, что вы решили ответить на вопрос, так как мой недавний ответ поднял его до вершины активных тем. Любопытно, что я утверждаю, что тест неуместен в рассматриваемой обстановке, что делает весь поток проблематичным, а ответы в нем - тем более. Считаете ли вы хорошей практикой публиковать еще один ответ, который игнорирует эту проблему, даже не упоминая ее (как и все предыдущие ответы)? Или вы думаете, что мой ответ не имеет смысла (что оправдывает публикацию такого ответа, как ваш)?
Ричард Харди
Спасибо за обновление! Я не эксперт, но аргументация Алекоса Пападопулоса в «Тестировании на автокорреляцию: Юнг-Бокс против Брейша-Годфри» и в комментариях под его ответом предполагает, что Юнг-Бокс действительно неприменим к остаткам из чистого ARMA (а также к ARMAX) модели. Если формулировка сбивает с толку, проверьте математику там, кажется, хорошо. Я думаю, что это очень интересный и важный вопрос, поэтому я бы очень хотел найти здесь соглашение между всеми нами.
Ричард Харди
0

... h должно быть как можно меньше, чтобы сохранить любую мощность, которую тест LB может иметь в данных обстоятельствах. По мере увеличения h мощность падает. Тест LB - ужасно слабый тест; у вас должно быть много образцов; n должно быть ~> 100, чтобы иметь смысл. К сожалению, я никогда не видел лучшего теста. Но, возможно, один существует. Кто-нибудь знает об этом?

Paul3nt


источник
0

Там нет правильного ответа на этот вопрос, который работает в любой ситуации по причинам, о которых другие говорили, что это будет зависеть от ваших данных.

Тем не менее, после попытки выяснить, как воспроизвести результат в Stata в RI, можно сказать, что по умолчанию реализация Stata использует: . Либо половина числа точек данных минус 2, либо 40, в зависимости от того, что меньше.мяN(N2-2,40)

Все значения по умолчанию, конечно, неверны, и это определенно будет неправильно в некоторых ситуациях. Во многих ситуациях это не может быть плохим местом для начала.

Бенджамин Мако Хилл
источник
0

Позвольте мне предложить вам наш пакет R hwwntest . В нем реализованы тесты белого шума на основе вейвлетов, которые не требуют каких-либо параметров настройки и имеют хороший статистический размер и мощность.

Кроме того, я недавно нашел «Мысли о тесте Юнга-Бокса», которые являются отличным обсуждением этой темы от Роба Хиндмана.

Обновление: учитывая альтернативное обсуждение в этой теме, касающееся ARMAX, еще одним стимулом для рассмотрения hwwntest является наличие теоретической степенной функции для одного из тестов против альтернативной гипотезы модели ARMA (p, q).

Делян Савчев
источник