Мне сказали, что можно провести двухэтапную IV регрессию, где первая стадия - это пробит, а вторая стадия - МНК. Можно ли использовать 2SLS, если первая стадия является пробитом, а вторая - моделью пробита / пуассона?
источник
Мне сказали, что можно провести двухэтапную IV регрессию, где первая стадия - это пробит, а вторая стадия - МНК. Можно ли использовать 2SLS, если первая стадия является пробитом, а вторая - моделью пробита / пуассона?
То, что было предложено вам, иногда называют запрещенной регрессией, и в целом вы не будете последовательно оценивать отношения интересов. Запрещенные регрессии дают непротиворечивые оценки только при очень ограничительных допущениях, которые редко применяются на практике (см., Например, Wooldridge (2010) «Эконометрический анализ поперечного сечения панельных данных», стр. 265-268).
Проблема в том, что ни оператор условных ожиданий, ни линейная проекция не выполняют нелинейных функций. По этой причине гарантируется, что только регрессия OLS на первом этапе приведет к подгонке значений, которые не связаны с остатками. Доказательство этому можно найти в Greene (2008) "Econometric Analysis" или, если вы хотите более подробное (но также и более техническое) доказательство, вы можете взглянуть на заметки Jean-Louis Arcand на стр. 47 до 52.
По той же причине, что и в запрещенной регрессии, эта кажущаяся очевидной двухэтапная процедура имитации 2SLS с пробитом не даст согласованных оценок. Это опять-таки потому, что ожидания и линейные проекции не переносятся через нелинейные функции. Вулдридж (2010) в разделе 15.7.3 на стр. 594 дает подробное объяснение этого. Он также объясняет правильную процедуру оценки пробитных моделей с помощью двоичной эндогенной переменной. Правильный подход - использовать максимальную вероятность, но делать это вручную не совсем тривиально. Поэтому предпочтительно, если у вас есть доступ к некоторому статистическому программному обеспечению, у которого есть готовый пакет для этого. Например, команда Stata может быть ivprobit
(см. Руководство Stata для этой команды, которое также объясняет подход максимального правдоподобия).
Если вам нужны ссылки для теории пробита с инструментальными переменными, смотрите, например:
Наконец, объединение различных методов оценки на первом и втором этапах затруднено, если не существует теоретической основы, которая оправдывает их использование. Это не значит, что это невозможно. Например, Adams et al. (2009) используют трехэтапную процедуру, в которой у них есть пробит «первая стадия» и вторая стадия МНК, не попадая в задачу запрещенной регрессии. Их общий подход:
Аналогичная процедура была применена пользователем Statalist, который хотел использовать первую стадию Tobit и вторую стадию Пуассона (см. Здесь ). Такое же исправление должно быть выполнимым для вашей задачи оценки.
Это не похоже на случай. Обсуждение в Arcand не о функциональной форме; вместо этого речь идет о включении различных ковариатных множеств в модели первой стадии по сравнению с моделями второй стадии. «Словом, правильная процедура 2SLS влечет за собой включение всех экзогенных ковариат, которые фигурируют в структурном уравнении в уменьшенной форме первого этапа. Запрещенная регрессия включает в себя пропуск некоторых или всех из них».
Возвращаясь к первоначальному вопросу, я бы порекомендовал использовать OLS для первого этапа и пробит для второго. Хотя это может быть технически предвзятым, вероятно (при условии, что у вас есть хороший инструмент) быть менее предвзятым, чем не-IV подход.
источник