Я читал, что оценка 2SLS по-прежнему соответствует даже двоичной эндогенной переменной ( http://www.stata.com/statalist/archive/2004-07/msg00699.html ). На первом этапе вместо линейной модели будет запущена пробная модель лечения.
Существуют ли какие-либо формальные доказательства, подтверждающие, что 2SLS по-прежнему непротиворечив, даже если 1-й этап представляет собой модель пробит или логит?
И что делать, если результат также двоичный? Я понимаю, что если у нас есть двоичный результат и двоичная эндогенная переменная (1-й и 2-й этапы представляют собой двоичные модели пробит / логит), то имитация метода 2SLS приведет к противоречивой оценке. Есть ли формальное доказательство этому? В эконометрической книге Вулдриджа есть некоторая дискуссия, но я думаю, что нет строгого доказательства, чтобы показать несоответствие.
data sim;
do i=1 to 500000;
iv=rand("normal",0,1);
x2=rand("normal",0,1);
x3=rand("normal",0,1);
lp=0.5+0.8*iv+0.5*x2-0.2*x3;
T=rand("bernoulli",exp(lp)/(1+exp(lp)));
Y=-0.8+1.2*T-1.3*x2-0.8*x3+rand("normal",0,1);
output;
end;
run;
****1st stage: logit model ****;
****get predicted values ****;
proc logistic data=sim descending;
model T=IV;
output out=pred1 pred=p;
run;
****2nd stage: ols model with predicted values****;
proc reg data=pred1;
model y=p;
run;
коэффициент p = 1.19984
. Я запускаю только одну симуляцию, но с большим размером выборки.
Ответы:
Был подобный вопрос относительно первой стадии пробита и второй стадии OLS. В ответе я предоставил ссылку на заметки, которые содержат формальное доказательство несостоятельности этой регрессии, которая формально известна как «запрещенная регрессия», как ее назвал Джерри Хаусман. Основная причина несогласованности подхода пробная первая стадия / вторая стадия OLS заключается в том, что ни оператор ожиданий, ни оператор линейных проекций не проходят нелинейную первую стадию. Поэтому установленные значения из пробита первой ступени не коррелируют только с ошибкой второй ступени при очень ограничительных допущениях, которые практически никогда не выполняются на практике. Имейте в виду, что формальное доказательство несостоятельности запрещенной регрессии является довольно сложным, если я правильно помню.
Если у вас есть модель где Y i
Для более подробного обсуждения этого взгляните на отличные конспекты лекций Кит Баум по этой теме. На слайде 7 он обсуждает использование линейной вероятностной модели в контексте 2SLS.
Наконец, если вы действительно хотите использовать пробит, потому что вам нужны более эффективные оценки, то есть другой способ, который также упоминается в работе Wooldridge (2010) «Эконометрический анализ данных поперечных сечений и панелей». Приведенный выше ответ включает его, повторяю здесь для полноты. В качестве прикладного примера см. Adams et al. (2009), которые используют трехэтапную процедуру, которая выглядит следующим образом:
Эта процедура не относится к проблеме запрещенной регрессии, но потенциально обеспечивает более эффективные оценки вашего параметра интереса.
источник