Если Hosmer-Lemeshow указывает на отсутствие соответствия, но AIC является самым низким среди всех моделей .... следует ли вам использовать модель?
Если я удаляю переменную, статистика Хосмера-Лемешоу не будет значимой (это означает, что нет полного отсутствия соответствия). Но АПК увеличивается.
Изменить : Я думаю, в общем, если AIC разных моделей близки (то есть ) друг к другу, то они в основном одинаковы. Но АПК сильно отличаются. Похоже, это указывает на то, что я должен использовать тот, у кого самый низкий AIC, хотя тест Хосмера-Лемешоу показывает иное.
Также, может быть, тест HL применяется только для больших образцов? Он имеет низкую мощность для небольших размеров выборки (мой размер выборки ~ 300). Но если я получаю значительный результат ... Это означает, что даже при низкой мощности я получаю отказ.
Будет ли иметь значение, если я буду использовать AICc против AIC? Как вы получаете AICc в SAS? Я знаю, что могут быть проблемы с множественностью. Но априори я предполагаю, что переменные влияют на результат.
Любые комментарии?
Edit2 : я думаю, что я должен использовать модель с одной меньшей переменной и более высоким AIC с незначительным HL. Причина в том, что две переменные связаны друг с другом. Так что избавиться от одного имеет смысл.
Ответы:
Тест Хосмера-Лемешоу в некоторой степени устарел, поскольку требует произвольного биннирования прогнозируемых вероятностей и не обладает превосходной способностью обнаруживать отсутствие калибровки. Это также не в полной мере наказывает за чрезмерное оснащение модели. Доступны лучшие методы, такие как Hosmer, DW; Хосмер, Т .; Ле Сесси, С. & Лемешоу, С. Сравнение критериев соответствия для модели логистической регрессии. Статистика в медицине , 1997, 16 , 965-980. Их новая мера реализована в Rр2 с
rms
пакет. Что еще более важно, этот вид оценки касается только общей калибровки модели (соответствие между предсказанным и наблюдаемым) и не учитывает отсутствие соответствия, такое как неправильное преобразование предиктора. В этом отношении также не подходит AIC, если вы не используете AIC для сравнения двух моделей, где одна более гибкая, чем другая, которая тестируется. Я думаю, что вас интересует прогностическая дискриминация, для которой более подходящей может быть обобщенная мера , дополненная -индексом (область ROC). cисточник
rms