Можно ли рекомендовать книгу Бернхэма-Андерсона о многомодельном выводе?

14

В связи с недавним изменением статистики выбора модели по умолчанию в пакете прогноза R с AIC на AICc, мне любопытно, действительно ли последнее применимо везде, где первое. У меня есть ряд вопросов на этот счет, и вот первый.

Я знаю, что заменять AIC на AICc везде - это то, что рекомендует хорошо известная книга (1) Бернхэма и Андерсона (не статистиков), которая здесь кратко изложена . На книгу иногда некритически ссылаются молодые статистики, см., Например, комментарии к этому сообщению в блоге Роба Хиндмана , но статистик Брайан Рипли посоветовал совершенно по-другому:

“Burnham and Anderson (2002) is a book I would recommend people NOT read until 
they have read the primary literature. I see no evidence that the authors have 
actually read Akaike’s papers." [quoted from [AIC MYTHS AND MISUNDERSTANDINGS][4] by
Burnham-Anderson]

Из того, что пишет Рипли об АПК и связанной с ним теории, следует, что предупреждение следует воспринимать серьезно. У меня есть и хорошая коллекция работ Акаике, и книга Бернхэма-Андерсона. Со временем у меня будет собственное мнение о качестве книги, но это также поможет узнать, что об этом думает сообщество статистиков, как молодых, так и старых. В частности, есть ли профессора статистики (или другие хорошие ученики статистики), которые явно рекомендовали книгу как полезную сводку знаний об использовании AIC для выбора модели?

Ссылка:

(1) Бернхэм, К.П. и Андерсон, Д.Р. Выбор модели и многомодельный вывод: практический теоретико-информационный подход Springer, 2002

PS. В ответ на недавний «ответ» о том, что «доктор Барнхем является доктором статистики», я хотел бы добавить это разъяснение. Да, он сам является статистиком, членом ASA и обладателем многочисленных профессиональных наград, в том числе медали за выдающиеся достижения от ASA. Но кто сказал, что это не так? Все, что я сказал выше, это то, что как пара авторов они не являются статистиками, и книга отражает этот факт.

Hibernating
источник
2
Документ «Мифы и недоразумения АПК» можно найти здесь . Я этого не видел (хотя раньше видел комментарий Рипли).
Glen_b
3
Вопрос содержит ссылки, но я думаю, что было бы полезно для читателей, если бы сам вопрос давал намек на то, что может быть плохим в содержании книги Бернхэма и Андерсона. (Если то, что они говорят, является точным, ясным, полезным и т. Д., То не имеет значения, читают ли они на самом деле документы Акаике.) Кроме того, мне кажется, что AIC и связанные с ним методы все еще противоречивы; если так, то у любой книги, представляющей их, будут хулители. И предложение о том, что каждый должен прочитать оригинальные статьи, прежде чем читать книгу, которая стремится дать введение в тему, кажется сомнительным.
Марс
7
Я прочитал две основные статьи Акаике, одну Шварца о BIC и книгу Бернхэма и Андерсона (она сейчас у меня на полке), а также (как вы видите) краткую критику Рипли. Мне бы очень хотелось, чтобы Рипли подробно объяснил критику (без всяких намеков на то, кто, возможно, что-то читал) - в нынешних обстоятельствах Бернхэму и Андерсону нечего ответить. Если в этом есть что-то (и, возможно, насколько я знаю), это заслуживает более чем нескольких строк в списке рассылки R-help.
Glen_b
2
@Gleb_b Взгляды Рипли могут быть выведены из его книги 1996 года по распознаванию образов, на которую он ссылался в этом посте списка R, см., Например, главу 2. Математические детали и комментарии по другим аспектам работы Акаике (например, что означает А в АПК для) заставьте меня думать, что он хорошо понимает эту область и прочитал больше, чем просто несколько статей Акаике.
Hibernating
3
Ввод двух разных центов: как часто AIC и AICc дают разные советы? По моему опыту они предлагают одинаковые модели.
Питер Флом - Восстановить Монику

Ответы:

3

ФП, похоже, ищет качественный опрос статистиков высокого качества, чтобы помочь оценить, является ли одна конкретная книга высокого качества, особенно в отношении дебатов AIC против AICc. Этот сайт не особенно предназначен для систематических обследований. Вместо этого я попытаюсь обратиться к основному вопросу напрямую.

AIC и AICc оценивают модели в соответствии с эвристическим компромиссом между подгонкой модели (с точки зрения вероятности) и превышением (с точки зрения количества параметров). В этом компромиссе AICc дает несколько больший штраф за количество параметров. Таким образом, AICc всегда рекомендует в пользу моделей, сложность которых меньше или равна сложности лучшей модели AIC. В этом смысле отношения между ними очень просты, несмотря на ужасно сложные аргументы, лежащие в основе их происхождения.

AIC и AICc - только два из большого поля информационных критериев кандидатов, причем BIC и DIC являются, пожалуй, основными альтернативами. BIC гораздо более консервативен (штрафует большое количество параметров модели), чем AIC или AICc в большинстве случаев. Вопрос о том, какой критерий является лучшим, действительно специфичен для проблемы. Можно законно предпочесть чрезвычайно консервативный критерий в тех случаях, когда необходимо надежное прогнозирование вне выборки.

FWIW, я обнаружил, что уровень консерватизма AICc, как правило, предпочтительнее, чем AIC, в обширных имитационных исследованиях ошибок прогнозирования в моделях захвата-захвата.

zkurtz
источник