(довольно длинный пост, извините. Он включает в себя много дополнительной информации, поэтому не стесняйтесь переходить к вопросу внизу.)
Введение: я работаю над проектом, в котором мы пытаемся определить влияние двоичной эндогенной переменной, , на непрерывный результат, . Мы придумали инструмент , который, по нашему убеждению, назначен случайным образом.
Данные: сами данные представлены в виде панели с около 34 000 наблюдений, распределенных по 1000 единицам и около 56 периодов времени. принимает значение 1 для около 700 (2%) наблюдений, а для около 3000 (9%). 111 (0,33%) наблюдений получают 1 балл как по и по , и для наблюдения в два раза выше вероятность получить 1 балл по если оно также дает 1 к .
Оценка: Мы оцениваем следующую модель 2SLS с помощью процедуры ivreg2 Stata:
Где - вектор других экзогенных переменных, - это прогнозируемое значение на первом этапе, а и - ошибки.
Результаты: Кажется, все работает хорошо; оценка очень на первом этапе, а оценка очень на втором этапе. Все признаки, как и ожидалось, в том числе для других экзогенных переменных. Проблема, однако, в том, что оценка - коэффициента интереса - неправдоподобно велика (или, по крайней мере, согласно тому, как мы его интерпретировали).
колеблется от 2 до 26 со средним значением и медианой 17, но оценка колеблется от 30 до 40 (в зависимости от спецификации)!
Слабая IV: Наша первая мысль состояла в том, что это было из-за слишком слабого инструмента; то есть не очень сильно коррелирует с эндогенной переменной, но на самом деле это не так. Чтобы проверить слабость инструмента, мы используем Finlay, Magnusson и слабый пакет Шаффера, так как он предоставляет тесты, которые устойчивы к нарушениям предположения (что актуально здесь, учитывая, что у нас есть данные панели и кластеризованы наши SE в уровень единицы).
Согласно их AR-тесту, нижняя граница 95% доверительного интервала для коэффициента второй ступени составляет от 16 до 29 (опять же, в зависимости от спецификации). Вероятность отклонения практически равна 1 для всех значений, близких к нулю.
Влиятельные наблюдения. Мы попытались оценить модель, когда каждая единица была удалена отдельно, каждое наблюдение удалено отдельно, а группы единиц удалены. Никаких реальных изменений.
Предлагаемое решение: кто-то предложил, чтобы мы не суммировали предполагаемый эффект инструментального в его исходной метрике (0-1), а в метрике его предсказанной версии. составляет от -0,01 до 0,1 со средним значением и медианой около 0,02 и SD около 0,018. Если бы мы суммировали предполагаемый эффект от , скажем, на увеличение SD на на один SD , то это было бы (другие спецификации дают почти идентичные результаты). Это было бы более разумным (но все же существенным). Похоже, идеальное решение. За исключением того, что я никогда не видел, чтобы кто-нибудь делал это; кажется, что каждый интерпретирует коэффициент второй ступени, используя метрику исходной эндогенной переменной.
Вопрос: Правильно ли в IV-модели суммировать предполагаемый эффект (действительно, ПОЗЖЕ) увеличения эндогенной переменной, используя метрику ее предсказанной версии? В нашем случае эта метрика является прогнозируемой вероятностью.
Примечание: мы используем 2SLS, даже если у нас есть двоичная эндогенная переменная (что делает первый этап LPM). Это следует за Angrist & Krueger (2001): «Инструментальные переменные и поиск идентификации: от предложения и спроса до естественных экспериментов») Мы также попробовали трехэтапную процедуру, используемую в Adams, Almeida & Ferreira (2009): « Понимание взаимоотношений между учредителем – генеральным директором и эффективностью фирмы ». Последний подход, который состоит из пробитной модели, сопровождаемой 2SLS, дает меньшие и более разумные коэффициенты, но они все еще очень велики, если интерпретировать их в метрике 0-1 (около 9-10). Мы получаем те же результаты при ручных вычислениях, что и при использовании опции probit-2sls в ivtreatreg Серулли.
etregress/treatreg
?Ответы:
Это старый вопрос, но для любого, кто наткнется на него в будущем, интуитивно оценка равна из регрессии "уменьшенной формы"β1 α1
делится на от регрессии "первой стадии"π1
Поэтому, если 2SLS-оценки "неправдоподобно велики", проверьте оценки OLS для и .β1 α1 π1
Если оценки «разумны», проблема может заключаться в том, что оценки «очень малы». Разделив на «очень маленький» можно получить «невероятно большой» .α1 π1 α 1 π 1 β 1α^1 π^1 β^1
источник