У меня есть временной ряд, который я пытаюсь прогнозировать, для которого я использовал сезонную модель ARIMA (0,0,0) (0,1,0) [12] (= fit2). Это отличается от того, что R предложил с auto.arima (R-вычисленный ARIMA (0,1,1) (0,1,0) [12] был бы более подходящим, я назвал его fit1). Тем не менее, в последние 12 месяцев моего временного ряда моя модель (fit2) кажется более подходящей при корректировке (она была хронически смещена, я добавил остаточное среднее, и новая подгонка, кажется, более плотно прилегает к исходному временному ряду Вот пример последних 12 месяцев и MAPE за 12 самых последних месяцев для обоих приступов:
Временной ряд выглядит так:
Все идет нормально. Я выполнил остаточный анализ для обеих моделей, и здесь есть путаница.
ACF (остаток (fit1)) выглядит отлично, очень белый шум:
Однако тест Льюнга-Бокса не выглядит хорошим, например, для 20 лагов:
Box.test(resid(fit1),type="Ljung",lag=20,fitdf=1)
Я получаю следующие результаты:
X-squared = 26.8511, df = 19, p-value = 0.1082
Насколько я понимаю, это подтверждение того, что остатки не являются независимыми (значение р слишком велико, чтобы оставаться в гипотезе независимости).
Однако для лаг 1 все отлично:
Box.test(resid(fit1),type="Ljung",lag=1,fitdf=1)
дает мне результат:
X-squared = 0.3512, df = 0, p-value < 2.2e-16
Либо я не понимаю тест, либо это немного противоречит тому, что я вижу на графике acf. Автокорреляция смехотворно низкая.
Затем я проверил fit2. Функция автокорреляции выглядит следующим образом:
Несмотря на такую очевидную автокорреляцию при нескольких первых лагах, тест Льюнга-Бокса дал мне гораздо лучшие результаты при 20 лагах, чем fit1:
Box.test(resid(fit2),type="Ljung",lag=20,fitdf=0)
результаты в:
X-squared = 147.4062, df = 20, p-value < 2.2e-16
тогда как только проверка автокорреляции на lag1 также дает мне подтверждение нулевой гипотезы!
Box.test(resid(arima2.fit),type="Ljung",lag=1,fitdf=0)
X-squared = 30.8958, df = 1, p-value = 2.723e-08
Я правильно понимаю тест? Значение p предпочтительно должно быть меньше 0,05, чтобы подтвердить нулевую гипотезу независимости от остатков. Какую посадку лучше использовать для прогнозирования, fit1 или fit2?
Дополнительная информация: остатки fit1 отображают нормальное распределение, а остатки fit2 - нет.
X-squared
) увеличивается по мере того, как выборочные автокорреляции остатков увеличиваются (см. Его определение), а его значение p представляет собой вероятность получения значения, равного или превышающего значение, наблюдаемое при нулевом значении Гипотеза о том, что истинные инновации являются независимыми. Поэтому небольшое значение р свидетельствует против независимости.fitdf
), поэтому вы проверяли распределение хи-квадрат с нулевыми степенями свободы.Ответы:
Вы неправильно интерпретировали тест. Если значение p больше 0,05, то невязки являются независимыми, и мы хотим, чтобы модель была правильной. Если вы моделируете временной ряд белого шума с помощью приведенного ниже кода и используете для него тот же тест, то значение p будет больше 0,05.
источник
Многие статистические тесты используются, чтобы попытаться отклонить некоторую нулевую гипотезу. В этом конкретном случае тест Льюнга-Бокса пытается отклонить независимость некоторых значений. Что это означает?
Если p-значение <0,05 1 : Вы можете отклонить нулевую гипотезу, предполагая 5% -ную вероятность ошибиться. Таким образом, вы можете предположить, что ваши значения показывают зависимость друг от друга.
Если p-значение> 0,05 1 : у вас недостаточно статистических данных, чтобы отклонить нулевую гипотезу. Таким образом, вы не можете предполагать, что ваши ценности зависят. Это может означать, что ваши значения в любом случае являются зависимыми, или это может означать, что ваши значения являются независимыми. Но вы не доказываете какую-либо конкретную возможность, на самом деле ваш тест сказал, что вы не можете утверждать зависимость значений, а также вы не можете утверждать независимость значений.
В общем, здесь важно помнить, что значение p <0,05 позволяет отклонить нулевую гипотезу, а значение p> 0,05 не позволяет подтвердить нулевую гипотезу.
В частности, вы не можете доказать независимость значений временных рядов с помощью теста Льюнга-Бокса. Вы можете только доказать зависимость.
источник
Согласно графикам ACF очевидно, что подгонка 1 лучше, поскольку коэффициент корреляции при лаге k (k> 1) резко падает и приближается к 0.
источник
Если вы судите с ACF, тогда подходит 1 больше. Вместо того, чтобы запутаться в тесте Юнга, вы все равно можете использовать коррелограмму невязок для определения наилучшего соответствия между fit1 и fit2
источник