У меня есть две модели логистической регрессии в R, сделанные с glm()
. Они оба используют одни и те же переменные, но были созданы с использованием разных подмножеств матрицы. Есть ли простой способ получить среднюю модель, которая дает средние значения коэффициентов, а затем использовать ее с функцией предиката ()?
[извините, если этот тип вопроса должен быть размещен на сайте программирования, дайте мне знать, и я опубликую его там]
Спасибо
caret
пакет имеет несколько интересных функций для объединения моделей.Ответы:
Вы хотите взять среднее значение прогнозируемых вероятностей или среднее значение коэффициентов? Они будут давать разные результаты, потому что логистическая регрессия включает в себя нелинейное преобразование линейного предиктора.
Функция для выполнения любого из них будет выглядеть примерно так. Установите,
avg
чтобы"prob"
получить первое, или что-то еще для последнего.источник
glm_2
. Вызовите вышеупомянутую функцию,predict.glm_2
и вы сможете использовать ееpredict()
на своем объекте по мере необходимости.