Регрессия на не должна быть причинной, если есть пропущенные переменные, которые влияют как на и на . Но если не для пропущенных переменных и ошибки измерения, является ли регрессия причиной? То есть, если каждая возможная переменная включена в регрессию?
13
Ответы:
Нет, это не так, я покажу вам некоторые контрпримеры.
Первый - обратная причинно-следственная связь . Рассмотрим причинную модельY→X , где X и Y - стандартные гауссовские случайные величины. Тогда E[Y|do(x)]=0 , так как X не вызывает Y , но E[Y|x] будет зависеть от X .
Второй пример - управление коллайдерами (см. Здесь ). Рассмотрим причинную модельX→Z←Y , то есть X не вызывает Y а Z является общей причиной. Но учтите, что если вы запустите регрессию, включающую Z , коэффициент регрессии X не будет равен нулю, потому что обусловливание общей причины вызовет связь между Y и X (вы можете захотеть увидеть и здесь Path Analysis in Presence условный коллайдер ).
В более общем смысле, регрессияY на X будет причинной, если переменные, включенные в регрессию, удовлетворяют критерию черного хода .
источник
В дополнение к важному ответу Карлоса Синелли на этот вопрос, есть еще несколько причин, по которым коэффициенты регрессии могут не быть причинно-следственными.
Во-первых, неправильная спецификация модели может привести к тому, что параметры не будут причинно-следственными. Тот факт, что в вашей модели есть все соответствующие переменные, еще не означает, что вы правильно настроили их. В качестве очень простого примера рассмотрим переменнуюX которая распределена симметрично относительно 0. Предположим, что на вашу переменную результата Y влияет X так, что E(Y∣X)=X2 . Регрессия Y на X (в отличие от X2 ) даст расчетный коэффициент для X около 0, явно предвзятым, несмотря на вы наладив для всех (единственной) переменной , которая влияет на Y .
Во-вторых, и в связи с темой обратной причинно-следственной связи также существует риск того, что вы можете иметь предвзятость выбора , то есть, что ваша выборка была выбрана таким образом, что она не является репрезентативной для группы населения, к которой вы хотите сделать свой вывод. Кроме того, пропущенные данные могут также привести к смещению, если данные не пропущены полностью случайно.
источник