Логистическая регрессия для данных из распределений Пуассона

11

Из некоторых заметок машинного обучения, говорящих о некоторых дискриминационных методах классификации, в частности о логистической регрессии, где у - метка класса (0 или 1), а х - данные, говорится, что:

если x|y=0Poisson(λ0) и x|y=1Poisson(λ1) , то p(y|x) будет логистическим.

Почему это правда?

sambajetson
источник

Ответы:

16

Y имеет два возможных значения для любого заданного значения X . Согласно предположениям,

Pr(X=x|Y=0)=exp(λ0)λ0xx!

и

Pr(X=x|Y=1)=exp(λ1)λ1xx!.

Поэтому (это тривиальный случай теоремы Байеса) вероятность того, что обусловленная на является относительной вероятностью последнего, а именноY=1X=x

Pr(Y=1|X=x)=exp(λ1)λ1xx!exp(λ1)λ1xx!+exp(λ0)λ0xx!=11+exp(β0+β1x)

где

β0=λ1λ0

и

β1=log(λ1/λ0).

Это действительно стандартная модель логистической регрессии.

Whuber
источник