Я понимаю, что даже регрессия не дает причинности. Он может дать только связь между переменной y и переменными x и, возможно, направление. Я прав? Я часто встречал фразы, похожие на «x предсказывает y», даже в большинстве учебников курса и на различных страницах курса в Интернете. И вы часто называете регрессоры предикторами, а y - ответом.
- Насколько справедливо использовать его для линейной регрессии?
- Как насчет логистической регрессии? (если у меня есть порог t, с которым я могу сравнить вероятность?)
Ответы:
Нет проблем с использованием слова «предсказать».
Важно признать, что предсказания не связаны с причинностью. Рассмотрим случай, когда большинство людей, которые умирают в отделении неотложной помощи больницы, умирают от сердечного приступа. Если вы слышали, что пациент умер, но не знали причину, вы могли бы предсказать, что это, вероятно, от сердечного приступа, потому что вы знаете, что сердечные приступы ответственны за> 50%. Вы делаете прогноз, но вы предсказываете неизвестную причину из известного эффекта. Кроме того, прогноз в этом примере является категоричным, поэтому он аналогичен логистической регрессии. (Аналогия, вероятно, сильнее полиномиальной логистической регрессии, но здесь это не имеет значения.)
Что бы это ни стоило, предсказания не должны быть связаны с какой-либо прямой причинной связью вообще. Вы можете сделать прогноз, основанный на ложной корреляции, при условии, что отношения надежны. Подумайте о том, чтобы предсказать неизвестную высоту идентичного близнеца на основе родного брата. В этом случае обе высоты являются следствиями ряда общих причин (общая генетика и окружающая среда). Рост ни одного близнеца не является причиной или следствием другого. Тем не менее, вы можете сделать очень хорошие прогнозы в этой ситуации.
источник