Возможно ли, что AIC и BIC дают совершенно разные модели выбора?

Я выполняю модель пуассоновской регрессии с 1 переменной отклика и 6 ковариатами. Выбор модели с использованием AIC приводит к получению модели со всеми ковариатами, а также с 6 терминами взаимодействия. BIC, однако, приводит к модели только с 2 ковариатами и без условий взаимодействия. Возможно ли, что два критерия, которые выглядят очень похожими, дают совершенно разные модели выбора?

model-selection aic poisson-regression bic WBM
источник

Если бы не было возможности получить разные рекомендации по моделям из двух метрик, то не было бы двух метрик, мы бы всегда использовали одну.

Грегор Томас

Слово «совершенно другое» трудно интерпретировать, когда модели являются результатом выбора из набора дискретных параметров.

BallpointBen

Ответы:

Это действительно возможно. Как объяснено по адресу https://methodology.psu.edu/AIC-vs-BIC , «BIC более жестко наказывает сложность модели. Единственный способ, которым они должны не соглашаться, - это когда AIC выбирает модель большего размера, чем BIC».

Если ваша цель - определить хорошую прогностическую модель, вам следует использовать AIC. Если ваша цель - определить хорошую модель объяснения, вам следует использовать BIC. Роб Хиндман хорошо суммирует эту рекомендацию на
https://robjhyndman.com/hyndsight/to-explain-or-predict/ :

«AIC лучше подходит для выбора модели для прогнозирования, поскольку она асимптотически эквивалентна перекрестной проверке с упущением один выход в регрессии или перекрестной проверке в один шаг во временных рядах. С другой стороны, можно утверждать, что BIC лучше подходит для выбора модели для объяснения, так как он последовательный ».

Рекомендация взята из статьи Галита Шмуэли «Объяснить или предсказать?», Статистическая наука, 25 (3), 289-310 ( https://projecteuclid.org/euclid.ss/1294167961 ).

Приложение:

Существует третий тип моделирования - описательное моделирование, но я не знаю каких-либо ссылок, по которым AIC или BIC лучше всего подходят для определения оптимальной описательной модели. Я надеюсь, что другие здесь могут присоединиться к их пониманию.

Изабелла Гемент
источник

« Единственный способ, которым они должны не соглашаться, - это когда AIC выбирает модель большего размера, чем BIC. Технически BIC может выбрать большую модель, если , то есть . Надеемся, что образцы размера 7 не слишком большая проблема, хотя. : p

\ln n < 2

$\ln n < 2$

n \leq 7

$n \le 7$

Дугал,

Хорошая точка зрения! С размером выборки 7 или меньше, я бы предположил, что выбор модели снят со стола. Is

Изабелла Гемент

Субхаш С. Давар

@ subhashc.davar: Ответа пока нет - у меня возникает соблазн написать Галиту Шмуэли и попросить ее высказать свое мнение по этому поводу.

Изабелла Гемент

Если мы понимаем значение слова «описательный» и относимся к нему серьезно, я не уверен, что имеет смысл говорить об определении оптимальной описательной модели.

gung - Восстановить Монику

Краткий ответ: да, это очень возможно. Эти два применяют различные штрафы, основанные на количестве оценочных параметров (2k для AIC против ln (n) xk для BIC, где k - количество оцененных параметров, а n - размер выборки). Таким образом, если выигрыш в вероятности от добавления параметра невелик, BIC может выбирать разные модели для AIC. Однако этот эффект зависит от размера выборки.

NatWH
источник

было бы неплохо сделать явным, что n - это размер выборки в приведенном выше уравнении

fabiob