Несмотря на то, что на этот вопрос уже есть принятый ответ, я думаю, что я все еще могу способствовать этому. Книга Koenker (2005) на самом деле не унесет вас далеко, потому что в это время начали развиваться квантильные регрессии.
Методы ранней IV квантильной регрессии включают каркас причинно-следственной цепочки по Chesher (2003) , который получил дальнейшее развитие в подходе взвешенных средних отклонений (WAD) Ma и Koenker (2006) . В этой статье они также представляют подход управления переменными. Аналогичная идея была использована Ли (2007), который вывел оценку квантильной регрессии IV с использованием контрольных функций.
Все эти оценки используют предполагаемую структуру треугольной ошибки, которая необходима для идентификации. Проблема с этим состоит в том, что эта треугольная структура неправдоподобна для проблем эндогенности, которые возникают из-за одновременности. Например, вы не можете использовать эти оценки для оценки спроса и предложения.
Оценщик Abadie, Angrist and Imbens (2002), о котором упоминал Дмитрий В. Мастеров, предполагает, что у вас есть как двоичная эндогенная переменная, так и бинарный инструмент. В целом, это очень ограничительная структура, но она расширяет подход LATE от линейной регрессии IV к квантильной регрессии. Это хорошо, потому что многие исследователи, особенно в области экономики, знакомы с концепцией ПОЗЖЕ и интерпретацией полученных коэффициентов.
Оригинальная статья Черножукова и Хансена (2005) действительно положила начало этой литературе, и эти два парня проделали большую работу в этой области. Оценщик IV квантильной регрессии (IVQR) обеспечивает естественную связь с оценщиком 2SLS в контексте квантиля. Их оценка реализована через Matlab или Ox, как указал Дмитрий, но вы можете забыть об этой статье Kwak (2010). Эта статья никогда не попала в журнал Stata, и его код не работает должным образом. Я предполагаю, что он отказался от этого проекта.
Вместо этого вы должны рассмотреть сглаженную оценку оценочных уравнений IVQR (SEE-IVQR) по Kaplan and Sun (2012), Это недавняя оценка, которая является улучшением по сравнению с первоначальной оценкой IVQR с точки зрения скорости вычислений (она избегает обременительного алгоритма поиска по сетке) и среднеквадратичной ошибки. Код Matlab доступен здесь .
Работа Фрёлиха и Мелли (2010) хороша тем, что рассматривает разницу между условной и безусловной квантильной регрессией. Проблема с квантильной регрессией в целом заключается в том, что как только вы включаете ковариаты в свою регрессию, интерпретация меняется. В OLS вы всегда можете перейти от условного к безусловному ожиданию по закону повторных ожиданий, но для квантилей это недоступно. Эта проблема была впервые показана Firpo (2007) и Firpo et al. (2009), Он использует повторно центрированную функцию влияния, чтобы маргинализовать коэффициенты условной квантильной регрессии так, чтобы их можно было интерпретировать как обычные коэффициенты OLS. Для вашей цели этот оценщик мало поможет, потому что он допускает только экзогенные переменные. Если вам интересно, Николь Фортин размещает код Stata на своем веб-сайте.
Самая последняя безусловная оценка IV квантильной регрессии, о которой я знаю, - Пауэлл (2013) . Его обобщенная (IV) оценка квантильной регрессии позволяет оценить маргинальные эффекты лечения квантилей при наличии эндогенности. Где-то на сайте RAND он также делает свой код Stata доступным, хотя я не смог найти его сейчас. Поскольку вы просили об этом: в более ранней статье он реализовал этот оценщик в контексте данных панели (см. Пауэлл, 2012 ). Эта оценка хороша тем, что, в отличие от всех предыдущих методов QR-данных на панелях, эта оценка не основана на больших асимптотиках T (которых у вас обычно нет, по крайней мере, в микроэконометрических данных).
Не в последнюю очередь, более экзотический вариант: цензурированная оценка IVQR (CQIV) по Черножукову и соавт. (2011) позволяет позаботиться о цензуре данных - как следует из названия. Это продолжение статьи Черножукова и Хонга (2003), которую я не связываю, потому что это не для контекста IV. Эта оценка сложна в вычислительном отношении, но если у вас есть данные, подвергнутые цензуре, и у вас нет другого пути, это путь. Аманда Ковальски опубликовала код Stata на своем веб-сайте или вы можете скачать его с RePEc, Эта оценка (и, кстати, также IVQR и SEE-IVQR) предполагают, что у вас есть непрерывная эндогенная переменная. Я использовал эти оценки в контексте регрессии заработка, где образование было моей эндогенной переменной, которая принимала от 18 до 20 значений, поэтому не совсем непрерывная. Но в симуляционных упражнениях я всегда мог показать, что это не проблема. Тем не менее, это, вероятно, зависит от приложения, поэтому, если вы решите использовать это, дважды проверьте его.
В новом « Руководстве по квантильной регрессии» есть две прекрасные главы по этим темам:
источник