Согласованность 2SLS с двоичной эндогенной переменной

10

Я читал, что оценка 2SLS по-прежнему соответствует даже двоичной эндогенной переменной ( http://www.stata.com/statalist/archive/2004-07/msg00699.html ). На первом этапе вместо линейной модели будет запущена пробная модель лечения.

Существуют ли какие-либо формальные доказательства, подтверждающие, что 2SLS по-прежнему непротиворечив, даже если 1-й этап представляет собой модель пробит или логит?

И что делать, если результат также двоичный? Я понимаю, что если у нас есть двоичный результат и двоичная эндогенная переменная (1-й и 2-й этапы представляют собой двоичные модели пробит / логит), то имитация метода 2SLS приведет к противоречивой оценке. Есть ли формальное доказательство этому? В эконометрической книге Вулдриджа есть некоторая дискуссия, но я думаю, что нет строгого доказательства, чтобы показать несоответствие.

data sim;
     do i=1 to 500000;
        iv=rand("normal",0,1);
             x2=rand("normal",0,1);
        x3=rand("normal",0,1);
        lp=0.5+0.8*iv+0.5*x2-0.2*x3;
        T=rand("bernoulli",exp(lp)/(1+exp(lp)));
        Y=-0.8+1.2*T-1.3*x2-0.8*x3+rand("normal",0,1);
        output;
     end;
     run;

****1st stage: logit model ****;
****get predicted values   ****;         
proc logistic data=sim descending;
     model T=IV;
     output out=pred1 pred=p;
     run;

****2nd stage: ols model with predicted values****;
proc reg data=pred1;
     model y=p;
     run;

коэффициент p = 1.19984. Я запускаю только одну симуляцию, но с большим размером выборки.

Винсент
источник
Вам не нужно добавлять ссылку = пробит в оператор модели?
Майк Хантер

Ответы:

10

Был подобный вопрос относительно первой стадии пробита и второй стадии OLS. В ответе я предоставил ссылку на заметки, которые содержат формальное доказательство несостоятельности этой регрессии, которая формально известна как «запрещенная регрессия», как ее назвал Джерри Хаусман. Основная причина несогласованности подхода пробная первая стадия / вторая стадия OLS заключается в том, что ни оператор ожиданий, ни оператор линейных проекций не проходят нелинейную первую стадию. Поэтому установленные значения из пробита первой ступени не коррелируют только с ошибкой второй ступени при очень ограничительных допущениях, которые практически никогда не выполняются на практике. Имейте в виду, что формальное доказательство несостоятельности запрещенной регрессии является довольно сложным, если я правильно помню.

Если у вас есть модель где Y i

Yязнак равноα+βИкся+εя
YяИкся
Иксязнак равноa+Zя'π+ηя
Икс^яИксяИкся


Yя

Для более подробного обсуждения этого взгляните на отличные конспекты лекций Кит Баум по этой теме. На слайде 7 он обсуждает использование линейной вероятностной модели в контексте 2SLS.

Наконец, если вы действительно хотите использовать пробит, потому что вам нужны более эффективные оценки, то есть другой способ, который также упоминается в работе Wooldridge (2010) «Эконометрический анализ данных поперечных сечений и панелей». Приведенный выше ответ включает его, повторяю здесь для полноты. В качестве прикладного примера см. Adams et al. (2009), которые используют трехэтапную процедуру, которая выглядит следующим образом:

  1. использовать пробит для регрессии эндогенной переменной на инструменте (ах) и экзогенных переменных
  2. используйте предсказанные значения из предыдущего шага на первом этапе OLS вместе с экзогенными (но без инструментальных) переменных
  3. сделать второй этап как обычно

Эта процедура не относится к проблеме запрещенной регрессии, но потенциально обеспечивает более эффективные оценки вашего параметра интереса.

Энди
источник
Привет Энди, спасибо за твой ответ. Вы предлагаете "несоответствие подхода первой стадии / второй стадии МНК"? Это не то, что я прочитал в ссылке, которую я дал. Подход Probit first stage / OLS second stage называется последовательным.
Винсент
Это не то, что говорит пост Statalist. Если вы посмотрите на раздел «методы и формулы» для команды Treatreg (который теперь называется etregress) в документации, вы увидите, что двухступенчатый оценщик - это не 2SLS с пробитами первой ступени / OLS второй ступени. Вместо этого пробит сначала используется для получения коэффициентов опасности, которые затем используются в регрессии МНК для получения согласованных оценок.
Энди
Спасибо, Энди. Становится интересно. Похоже, имитирующий 2SLS с пробит-моделью на 1-м этапе не принимается. Я прочитаю «запрещающий регресс» по тем или иным причинам. Кстати, я попробовал симуляцию с использованием SAS, и результаты не выглядят плохо для 2SLS с пробитом 1st / ols 2nd.
Винсент
Я размещаю код в основном вопросе и хотел бы услышать ваши комментарии. Спасибо!
Винсент