При непрерывных данных линейная регрессия предполагает, что член ошибки распределен N (0, )
1) Предполагаем ли мы, что Var (Y | x) также ~ N (0, )?
2) Что это за распределение ошибок в логистической регрессии? Когда данные представлены в виде 1 записи на случай, где «Y» равен 1 или 0, это термин ошибки, распределенный Бернулли (т. Е. Дисперсия равна p (1-p))), и когда данные находятся в форме # Успех из # испытаний, считается ли он биномиальным (т. е. дисперсия np (1-p)), где p - вероятность того, что Y равно 1?
logistic
generalized-linear-model
B_Miner
источник
источник
Ответы:
1) Если имеет нормальное распределение, т.е. N ( 0 , σ 2 ), то V a r ( Y | X 2 ) = V a r ( β 1 + β 2 X 2 ) + V a r ( u ) = 0 + σ 2 = σ 2 , так как β 1 + β 2 X 2U N( 0 , σ2) Вa r ( Y| Икс2) = Var(β1+β2X2)+Var(u)=0+σ2=σ2 β1+ β2Икс2 не случайная величина
2) В логистической регрессии предполагается, что ошибки следуют биномиальному распределению, как упомянуто здесь . Лучше записать это как , поскольку эти вероятности зависят от X j , как указаноздесьили вПрикладной логистической регрессии.Вa r ( YJ| ИксJ) = мJ, Е[ YJ| ИксJ] . ( 1 - E[ YJ| ИксJ] ) = мJπ( ХJ) . ( 1 - π( ХJ) ) ИксJ
источник