Я хотел бы знать различия между рандомизированной логистической регрессией (RLR) и простой логистической регрессией (LR), поэтому я читаю статью «Выбор стабильности» , опубликованную Meinshausen et al. ; однако я не понимаю, что такое RLR и каковы различия между RLR и LR.
Может ли кто-нибудь указать, что я должен прочитать, чтобы понять RLR? Или есть простой пример для начала?
machine-learning
logistic
Хендра Буньямин
источник
источник
Ответы:
Вы можете проверить эту ссылку . Sci-kit learn реализует рандомизированную логистическую регрессию, и метод описан там.
Но чтобы ответить на ваш вопрос, эти два метода в значительной степени различаются по своим целям. Логистическая регрессия заключается в подборе модели, а RLR - в поиске переменных, которые входят в модель.
Ванильная логистическая регрессия является обобщенной линейной моделью. Для бинарного ответа мы полагаем, что логарифмические вероятности ответа являются линейной функцией от числа предикторов. Коэффициенты предикторов оцениваются с использованием максимальной вероятности, а затем вывод о параметрах основывается на свойствах большой выборки модели. Для достижения наилучших результатов мы обычно предполагаем, что модель достаточно проста и понятна. Мы знаем, какие независимые переменные влияют на ответ. Мы хотим оценить параметры модели.
Конечно, на практике мы не всегда знаем, какие переменные должны быть включены в модель. Это особенно верно в ситуациях машинного обучения, где число потенциальных объясняющих переменных огромно, а их значения редки.
На протяжении многих лет многие люди пытались использовать методы подбора статистической модели с целью выбора переменных (читай «особенность»). При повышении уровня надежности:
источник