Термин перехвата в логистической регрессии

14

Предположим, у нас есть следующая модель логистической регрессии:

logit(p)=β0+β1x1+β2x2

Является ли вероятностью события, когда и ? Другими словами, это вероятность события, когда и находятся на самых низких уровнях (даже если это не 0)? Например, если и принимают только значения и мы не можем установить их в 0.x 1 = 0 x 2 = 0 x 1 x 2 x 1 x 2 2 3β0x1=0x2=0x1x2x1x223

logisticgu
источник
3
Я полагаю, что вы найдете ответ по адресу stats.stackexchange.com/questions/91402 откровенным и полезным. С небольшими изменениями это относится непосредственно к вашей ситуации.
whuber
1
@whuber: То есть в моем примере и находятся вне моего диапазона данных? И, таким образом, и никакой осмысленной интерпретации. х 2 = 0 β 0x1=0x2=0β0
логистикгу

Ответы:

24

x 1 = x 2 = 0 x 1 = x 2 = 0β0 - это не шансы события, когда , это журнал шансов . Кроме того, это логарифмические шансы только тогда, когда , а не когда они имеют самые низкие ненулевые значения. x1=x2=0x1=x2=0

Gung - Восстановить Монику
источник
Следовательно, не имеет осмысленной интерпретации в моей ситуации. β0
логистикгу
8
Следовательно, не имеет значимой независимой интерпретации в вашей ситуации. Это часто бывает. Это все еще неотъемлемая часть модели. Если вы удалите его из модели, остальная часть модели (например, оценка ) будет смещена. β 1β0β^1
gung - Восстановить Монику
3
(+1) Существуют различные способы сделать перехват значимым. Например, если вас интересуют шансы журнала, когда и регрессируйте против и . Конечно, вы получите то же значение, подключив и к текущей модели, получив , но в программном обеспечении по умолчанию, скорее всего, автоматически будет включен тест для сравнения этого значения с нулем , x 3 = 3 p x 1 - 2 x 3 - 3 x 1 = 2 x 2 = 3 β 0 + 2 β 1 + 3 β 2x2=2x3=3px12x33x1=2x2=3β0+2β1+3β2
whuber
@gung: Аналогичным образом сравнивает с когда все остальные переменные остаются постоянными? x 1 = 3 x 1 = 2exp(β1)x1=3x1=2
logisticgu
1
Да, - это отношение шансов, связанное с изменением на 1 единицу в (это может быть любой набор значений на расстоянии 1 единица), когда все остальное остается постоянным. x 1exp(β1)x1
gung - Восстановить Монику
4

Также может быть случай, когда и не могут быть равны одновременно. В этом случае не имеет четкой интерпретации.х 2 0 β 0x1x20β0

В противном случае имеет интерпретацию - он смещает журнал шансов к своему фактическому значению, если ни одна переменная не может этого сделать.β0

Сергей Макаревич
источник
Обратите внимание , что вы можете использовать латекс верстку здесь, заключая текст в знаке доллара, например , $x^{2}$производит и производитβ 0x2$\beta_0$β0
серебрянки
0

Я предлагаю посмотреть на это по-другому ...

В логистической регрессии мы предсказываем некоторый двоичный класс {0 или 1}, вычисляя вероятность правдоподобия, которая является фактическим выводом .logit(p)

Это, конечно, предполагает, что лог-шансы могут быть разумно описаны линейной функцией - например,β0+β1x1+β2x2+

... Это большое предположение, и только иногда это верно. Если эти компоненты не имеют независимого, пропорционального влияния на коэффициенты входа, то лучше выбрать другую статистическую структуру. То есть log-odds состоит из некоторого фиксированного компонента и увеличивается с каждым последующим слагаемым .xiβ0βixi

Короче говоря, значение является «фиксированным компонентом» этого компонентного метода для описания лог-шансов любого события / условия, которое вы пытаетесь предсказать. Также помните, что регрессия в конечном итоге описывает некоторое условное среднее, учитывая набор значений . Ни одна из этих вещей не требует, чтобы значения равны 0 в ваших данных или даже возможны в реальности. просто смещается , что линейное выражение вверх или вниз так , что компоненты переменных являются наиболее точными.β0xixiβ0

Может быть, я сказал то же самое в несколько ином мышлении, но я надеюсь, что это поможет ...

Omeed
источник