Эквивалентность AIC и p-значений при выборе модели

9

В комментарии к ответу на этот вопрос было указано, что использование AIC при выборе модели эквивалентно использованию значения p 0,154.

Я попробовал это в R, где я использовал «обратный» алгоритм выбора подмножества, чтобы выбросить переменные из полной спецификации. Во-первых, путем последовательного выброса переменной с самым высоким значением p и остановки, когда все значения p ниже 0,154, и, во-вторых, путем сброса переменной, которая приводит к наименьшему AIC при удалении до тех пор, пока не будет достигнуто никакого улучшения.

Оказалось, что они дают примерно одинаковые результаты, когда я использую значение р 0,154 в качестве порога.

Это правда? Если да, кто-нибудь знает почему или может ссылаться на источник, который объясняет это?

PS Я не мог попросить человека комментировать или написать комментарий, потому что только что зарегистрировался. Я знаю, что это не самый подходящий подход к выбору и выводу моделей и т. Д.

Нильс
источник
(1) Прогностическое моделирование с логистическим регрессионным анализом: сравнение методов отбора и оценки в небольших наборах данных. Статистика в медицине, 19, 1059-1079 (2) верно для переменных с df1, на основе определения aic. Но может быть ниже, если ваши степени свободы переменных выше
Чарльз

Ответы:

13

χ2χ2αзнак равно0,157αα

Фрэнк Харрелл
источник
+1 Я потратил так много времени на составление своего (теперь удаленного) ответа, я даже не видел, чтобы этот пост был опубликован за это время. Я бы просто проголосовал за это.
Glen_b