Можете ли вы сравнить значения AIC, если модели основаны на одном и том же наборе данных?

Я делаю некоторые прогнозы в R, используя пакет прогнозов Роба Хиндмана . Бумага, принадлежащая упаковке, может быть найдена здесь .

В статье после объяснения алгоритмов автоматического прогнозирования авторы реализуют алгоритмы на одном и том же наборе данных. Однако, после оценки как экспоненциального сглаживания, так и модели ARIMA, они делают заявление, которое я не понимаю (на странице 17):

Обратите внимание, что информационные критерии не сопоставимы.

Я подумал, что преимущество использования AIC для выбора модели заключается в том, что мы можем сравнивать значения AIC из разных моделей, если они оцениваются с использованием одного и того же набора данных. Это неверно?

Этот вопрос представляет особый интерес для меня, так как я планировал объединить прогнозы из различных классов моделей (например, экспоненциальное сглаживание и ARIMA) с использованием так называемых весов Акаике (см. Burnham and Anderson, 2002, для обсуждения весов Акаике)

Ссылки

Burnham, KP & Anderson, DR (2002). Выбор модели и мультимодельный вывод: практический информационно-теоретический подход. Springer Verlag.

time-series forecasting model-selection aic tfunk
источник

Ответы:

Две модели по-разному относятся к начальным значениям. Например, после различий модель ARIMA вычисляется по меньшему количеству наблюдений, тогда как модель ETS всегда рассчитывается по полному набору данных. Даже когда модели эквивалентны (например, ARIMA (0,1,1) и ETS (A, N, N)), значения AIC будут отличаться.

По сути, вероятность модели ETS зависит от вектора начального состояния, в то время как вероятность нестационарной модели ARIMA зависит от первых нескольких наблюдений, даже если для нестационарных компонентов используется диффузный априор.

Роб Хиндман
источник

Спасибо! Это проясняет больше, чем несколько вещей. Люблю прогнозный пакет кстати!

tfunk