Хорошо известно, по крайней мере среди статистиков более высокого уровня, что модели со значениями статистики AIC в пределах определенного порога минимального значения следует рассматривать как соответствующие модели, минимизирующей статистику AIC. Например, в [1, с.221] находим
Тогда модели с маленьким GCV или AIC будут считаться лучшими. Конечно, нельзя просто слепо минимизировать GCV или AIC. Скорее, все модели с достаточно малыми значениями GCV или AIC следует рассматривать как потенциально подходящие и оценивать в соответствии с их простотой и научной значимостью.
Аналогично, в [2, с.144] мы имеем
Было предложено (Duong, 1984), что модели со значениями AIC в пределах c минимального значения должны считаться конкурентоспособными (с c = 2 в качестве типичного значения). Выбор из конкурирующих моделей может быть основан на таких факторах, как белизна остатков (раздел 5.3) и простота модели.
Рекомендации:
- Ruppert, D .; Wand, MP & Carrol, RJ Semiparametric Regression , Cambridge University Press, 2003
- Броквелл, PJ & Davis, RA Введение в временные ряды и прогнозирование , John Wiley & Sons, 1996
Итак, учитывая вышесказанное, какая из двух моделей ниже должна быть предпочтительной?
print( lh300 <- arima(lh, order=c(3,0,0)) )
# ... sigma^2 estimated as 0.1787: log likelihood = -27.09, aic = 64.18
print( lh100 <- arima(lh, order=c(1,0,0)) )
# ... sigma^2 estimated as 0.1975: log likelihood = -29.38, aic = 64.76
В более общем случае, когда уместно выбирать модели путем слепого минимизации AIC или связанной статистики?
источник
Ответы:
Перефразируя лекционные заметки Космы Шализи о правде о линейной регрессии , вы никогда не должны выбирать модель только потому, что она свела к минимуму статистику, такую как AIC , для
источник
Я бы сказал, что часто целесообразно использовать AIC при выборе модели, но редко можно использовать ее как единственную основу для выбора модели. Мы также должны использовать предметные знания.
В вашем конкретном случае вы сравниваете модель с AR 3-го порядка с моделью с AR 1-го порядка. Помимо AIC (или чего-то подобного) я бы посмотрел графики автокорреляции и частичной автокорреляции. Я также рассмотрел бы, что будет означать модель 3-го порядка . Имеет ли это смысл? Это добавляет к основному знанию? (Или, если вас интересует только прогноз, помогает ли он прогнозировать?)
В целом, иногда бывает интересно найти очень маленький размер эффекта.
источник
auto.arima
, Гайндман и Khandakar (2008) , говорят: -. «Автоматические прогнозы большого количества одномерных временных рядов часто необходимы в бизнесе Распространено иметь более чем одну тысячи производственных линий , что прогнозирование потребности по крайней мере ежемесячно. Даже когда требуется меньшее количество прогнозов, возможно, никто не будет обучен использованию моделей временных рядов для их создания. В этих условиях алгоритм автоматического прогнозирования является важным инструментом ». Обратите внимание на эти обстоятельства .источник