У меня есть продольные данные о людях, и некоторые из них подвергались лечению, а другие - нет. Все люди находятся в выборке от рождения до 18 лет, и лечение происходит в каком-то возрасте между этими интервалами. Возраст лечения может отличаться в разных случаях. Используя сопоставление баллов предрасположенности, я хотел бы сопоставить обработанные и контрольные единицы в парах с точным сопоставлением по году рождения, чтобы можно было отслеживать каждую пару с момента их рождения до 18 лет. В общей сложности насчитывается около 150 человек, получавших лечение, и 4000 человек, не получавших лечения. После сопоставления идея состоит в том, чтобы использовать стратегию различия в различиях для оценки эффекта лечения.
Проблема, с которой я сталкиваюсь на данный момент, заключается в сопоставлении данных панели. Я использую psmatch2
команду Stata, и я сопоставляю бытовые и индивидуальные характеристики с помощью сопоставления баллов склонности. В целом, с данными панели будут разные оптимальные совпадения в каждом возрасте. В качестве примера: если A лечится, B и C являются контрольными, и все они родились в 1980 году, то A и B могут совпадать в 1980 году в возрасте 0 лет, тогда как A и C сравниваются в 1981 году в возрасте 1 года и т. Д. , Также А может быть сопоставлен с его собственными значениями предварительной обработки за предыдущие годы.
Чтобы обойти эту проблему, я взяла среднее значение всех переменных во времени, так что сопоставление может идентифицировать лиц, которые в среднем наиболее похожи по продолжительности выборки, и я сопоставляю отдельно для каждой возрастной группы от 0 до 18 лет. К сожалению, это по-прежнему соответствует различным единицам управления для каждой единицы лечения в возрастной группе.
Если бы кто-то мог направить меня к методу для парного сопоставления с данными панели в Stata, это было бы очень ценно.
Там нет способа сделать это в Stata или любом другом программном обеспечении о котором я знаю.
Если вы пытаетесь исправить необъективную оценку соответствия с помощью методов панельных данных, вот один из подходов, который может сработать. Если вы можете предположить, что сопоставление учитывает некоторые, но не все смещения выбора, но что смещение в основном остается постоянным во времени, вы можете удалить неизменную во времени часть смещения, создав отдельные оценки соответствия в каждом периоде и приняв различия.
Хекман, Ишимура, Смит и Тодд, 1998, Econometrica, Eichler и Lechner, 2002, Экономические трудовые труды, являются примерами такого подхода. С другой стороны, 150 обработанных наблюдений может быть недостаточно для того, чтобы этот подход работал.
источник
шаги:
Как это было подробно упомянуто Грегом, вы можете использовать набор данных поперечного сечения, либо на средствах предварительной обработки, либо на определенном периоде предварительной обработки, чтобы получить соответствие.
Используя всю панель, вы назначаете переменные индикатора для
a. обработанный индивид
b. срок обработки, последний равен нулю, как только обработка происходит для обработанного индивида.
Так как момент времени, когда лечебный период изменяется от 0 до 1, варьируется у разных людей и никогда не превращается в 1 для необработанного, вы должны назначить одну и ту же начальную точку от обработанного совпадения для необработанного совпадения. Это интуитивно понятно, но я все же хотел бы видеть хорошую ссылку, которая оправдывает такой подход, которого я до сих пор не нашел.
Установка регрессии будет:
где термин взаимодействия дает вам эффект лечения.
источник
Рассматривали ли вы использовать nnmatch ?
Я использую эту команду, и она довольно всеобъемлющая. Он учитывает различные алгоритмы сопоставления, а также случаи, в которых показатель склонности одинаков для некоторых лиц контрольной группы. Конечно, обработка этого случая зависит от алгоритма сопоставления, если вы берете k-ближайшие соседа или ядро или что-то еще.
источник