У нас есть две модели, которые используют один и тот же метод для вычисления логарифмической вероятности, и AIC для одной ниже, чем другой. Тем не менее, тот с более низким AIC интерпретировать гораздо сложнее.
У нас возникают проблемы с принятием решения, стоит ли вводить сложность, и мы судили об этом, используя процентную разницу в AIC. Мы обнаружили, что разница между двумя AIC составляла всего 0,7%, а в более сложной модели AIC была на 0,7% ниже.
Является ли низкая процентная разница между двумя причинами, чтобы избежать использования модели с более низким AIC?
Объясняет ли процент разницы, что в менее сложной модели теряется на 0,7% больше информации?
Могут ли две модели иметь очень разные результаты?
model-selection
aic
Али Тураб Лотия
источник
источник
Ответы:
Никто не сравнивает абсолютные значения двух AIC (которые могут быть как но также ∼ 1000000 ), но учитывает их разницу : Δ i = A I C i - A I C m i n , где A I C i - это AIC i-й модели, а A I C m i n - самая низкая AIC, полученная среди множества рассмотренных моделей (т. Е. Предпочтительной модели). Практическое правило, изложенное, например, в~ 100 ~ 1000000
Теперь, что касается 0,7%, упомянутых в вопросе, рассмотрим две ситуации:
Следовательно, утверждение о том, что разница между AIC составляет 0,7%, не дает никакой информации.
Формулировка AIC предусматривает использование чрезмерного количества параметров, что препятствует переоснащению. Он предпочитает модели с меньшим количеством параметров, если другие не обеспечивают существенно лучшего соответствия. AIC пытается выбрать модель (из рассмотренных), которая наиболее адекватно описывает реальность (в форме исследуемых данных). Это означает, что фактически модель, представляющая собой реальное описание данных, никогда не рассматривается. Обратите внимание, что AIC дает вам информацию, какая модель лучше описывает данные, но не дает никакой интерпретации .
Наконец, по поводу формулы для AIC:
TL; DR
источник