Я управляю логистической моделью. Фактический набор данных модели содержит более 100 переменных, но я выбираю набор тестовых данных, в котором имеется около 25 переменных. До этого я также сделал набор данных, который имел 8-9 переменных. Мне говорят, что значения AIC и SC можно использовать для сравнения модели. Я заметил, что модель имела более высокие значения SC, даже когда переменная имела низкие значения p (например, 0053). На мой взгляд, модель с переменными, имеющими хороший уровень значимости, должна приводить к низким значениям SC и AIC. Но этого не происходит. Может кто-нибудь, пожалуйста, уточнить это. Короче хочу задать следующие вопросы:
- Количество переменных имеет какое-либо отношение к SC AIC?
- Должен ли я сосредоточиться на значениях p или низких значениях SC AIC?
- Каковы типичные способы снижения значений SC AIC?
источник
Объединение SC и AIC НЕПРАВИЛЬНО . Это очень разные вещи, хотя люди сильно злоупотребляют ими. AIC имеет смысл, когда вы предсказываете вещи, использование SC в этом сценарии может привести (не всегда) к неправильным результатам. Точно так же, если вы заинтересованы в выборе модели по принципу скупости (Occam's Razor), SC лучше. Я не хочу вдаваться в теоретические детали, но в двух словах: SC - хорошо для экономных моделей, когда вы хотите что-то эквивалентное простейшей модели для объяснения ваших данных, AIC - Когда вы хотите прогнозировать. AIC не предполагает, что ваша истинная модель лежит в пространстве модели, как SC.
Во-вторых, совместное использование значений p и информационных критериев также может вводить в заблуждение, как объяснено гл .
источник