Пытаюсь выучить немного Python и Sklearn, но для своей работы мне нужно запустить регрессии, которые используют распределения ошибок из семейств Пуассона, Гаммы и особенно семейства Твиди.
Я ничего не вижу в документации о них, но они есть в нескольких частях дистрибутива R, поэтому мне было интересно, видел ли кто-нибудь где-нибудь реализации для Python. Было бы здорово, если бы вы указали мне на реализации SGD дистрибутива Tweedie!
Ответы:
В scikit-learn есть движение к реализации обобщенных линейных моделей с распределениями ошибок Пуассона, Гаммы и Твиди.
Statsmodels имеет реализации обобщенных линейных моделей с распределениями Пуассона, Твиди и гамма-ошибок.
В то время как я обновляю этот ответ, Spark ML также (экспериментально) поддерживает распределения Пуассона, Твиди и гаммы.
источник
H2O имеет обобщенную линейную модель с.
Они используют кадры H2O, поэтому вы не можете использовать Pandas / Numpy напрямую.
источник