Зачем когда-либо использовать Durbin-Watson вместо тестирования автокорреляции?

10

Тест Дурбина-Ватсона проверяет автокорреляцию остатков при лаге 1. Но тестирование автокорреляции при лаге 1 также выполняется напрямую. Кроме того, вы можете проверить автокорреляцию с задержкой 2,3,4, и есть хорошие тесты portmanteau для автокорреляции с несколькими задержками и получить красивые, легко интерпретируемые графики [например, функцию acf () в R]. Дурбин-Ватсон не интуитивно понятен и часто дает неубедительные результаты. Так зачем вообще его использовать?

Это было вдохновлено этим вопросом о неубедительности некоторых тестов Дурбина-Уотсона, но явно отделено от него.

zbicyclist
источник
1
Вы на самом деле можете сделать Дурбин-Уотсон для других лагов. Посмотрите обобщенную статистику Дурбина-Ватсона.
Брэндон Шерман

Ответы:

8

Как указывалось ранее в этой и других темах: (1) тест Дурбина-Ватсона не является окончательным. Только границы, предложенные первоначально Дурбином и Ватсоном, были связаны с тем, что точное распределение зависит от наблюдаемой матрицы регрессоров. Тем не менее, это достаточно легко решить в статистическом / эконометрическом программном обеспечении к настоящему времени. (2) Существуют обобщения теста Дурбина-Ватсона на более высокие лаги. Таким образом, ни неубедительность, ни ограничение лагов не является аргументом против теста Дурбина-Ватсона.

По сравнению с тестом Вальда для зависимой переменной с запаздыванием, тест Дурбина-Ватсона может иметь большую мощность в некоторых моделях. В частности, если модель содержит детерминированные тренды или сезонные модели, может быть лучше проверить автокорреляцию в остатках (как это делает тест Дурбина-Ватсона) по сравнению с включением лагового отклика (который еще не скорректирован для детерминированных моделей) , Я включаю небольшую симуляцию R ниже.

Одним из важных недостатков теста Дурбина-Ватсона является то, что его нельзя применять к моделям, которые уже содержат авторегрессионные эффекты. Таким образом, вы не можете проверить оставшуюся автокорреляцию после частичного захвата в авторегрессионной модели. В этом сценарии сила теста Дурбина-Ватсона может полностью разрушиться, в то время как для теста Бреуша-Годфри, например, это не так. Наша книга «Прикладная эконометрика с R» содержит небольшое исследование, посвященное моделированию, которое показывает это в главе «Программирование собственного анализа», см. Http://eeecon.uibk.ac.at/~zeileis/teaching/AER/ .

Для набора данных с трендом плюс автокоррелированные ошибки мощность теста Дурбина-Ватсона выше, чем для теста Бреуша-Годфри, а также выше, чем для теста авторегрессии Вальда. Я проиллюстрирую это для простого небольшого сценария в R. Я рисую 50 наблюдений из такой модели и вычисляю p-значения для всех трех тестов:

pvals <- function()
{
  ## data with trend and autocorrelated error term
  d <- data.frame(
    x = 1:50,
    err = filter(rnorm(50), 0.25, method = "recursive")
  )

  ## response and corresponding lags
  d$y <- 1 + 1 * d$x + d$err
      d$ylag <- c(NA, d$y[-50])

  ## OLS regressions with/without lags
  m <- lm(y ~ x, data = d)
  mlag <- lm(y ~ x + ylag, data = d)

  ## p-value from Durbin-Watson and Breusch-Godfrey tests
  ## and the Wald test of the lag coefficient
  c(
    "DW" = dwtest(m)$p.value,
        "BG" = bgtest(m)$p.value,
    "Coef-Wald" = coeftest(mlag)[3, 4]
  )
}

Затем мы можем смоделировать 1000 p-значений для всех трех моделей:

set.seed(1)
p <- t(replicate(1000, pvals()))

Тест Дурбина-Ватсона приводит к самым низким средним значениям р

colMeans(p)
##        DW        BG Coef-Wald 
## 0.1220556 0.2812628 0.2892220 

и самая высокая мощность при уровне значимости 5%:

colMeans(p < 0.05)
##        DW        BG Coef-Wald 
##     0.493     0.256     0.248 
Ахим Цейлейс
источник
Итак, еще одно ограничение статистики DW заключается в том, что ее нельзя использовать, если модель уже пытается контролировать автокорреляцию. Я ценю тот факт, что DW обладает большей мощностью, чем Уолд или Брейш-Годфри (ни один из которых я не использовал), но я обычно сравниваю с тестом portmanteau, таким как Ljung-Box, и отдельными автокорреляциями по сравнению с нулевым значением 0. Это типичный режим в прогнозировании учебников.
zbicyclist
2
Это не совсем другое ограничение ИМО, а главное ограничение. Другие вопросы (вычисление p-значений, а не границ и количества лагов) могут быть решены. И будьте осторожны с интерпретацией мощности: я сказал, что в этой конкретной модели - детерминированный тренд с ошибкой AR (1) - тест Дурбина-Ватсона имеет более высокую мощность. Это может быть не так во многих других настройках. А что касается теста Льюнга-Бокса: Да, это классический тест для проверки оставшейся автокорреляции после подгонки модели ARIMA.
Ахим Цейлейс
3

Тест Дурбина-Ватсона - это то, как вы проверяете автокорреляцию. Построение ACF похоже на построение графика QQ для проверки нормальности. Возможность просмотра графика QQ для проверки на нормальность полезна, но тест Колмогорова-Смирнова или Левена дополняет то, что вы видите на графике, потому что проверка гипотезы на нормальность более убедительна.

Что касается множественных задержек, вы можете использовать обобщенную статистику Дурбина-Ватсона, выполнить несколько тестов гипотез и внести поправку Бонферрони, чтобы исправить множественное тестирование. Вы также можете запустить тест Бреуша-Годфри , который проверяет наличие корреляции любого порядка.

Брэндон Шерман
источник