Как правильно указать разницу в модели различий с данными панели отдельных уровней?
Вот установка: Предположим, что у меня есть данные панели индивидуального уровня, встроенные в города за несколько лет, и обработка варьируется в зависимости от года. Формально, пусть будет результатом для индивида в городе и года а будет фиктивной для того, повлияло ли вмешательство на город в году . Типичная оценка DiD, такая как приведенная в работе Bertrand et al. (2004, p. 250), основана на простой модели OLS с фиксированными условиями воздействия для города и года: я ы т Д ы т ы т
Но игнорирует ли этот оценщик структуру панели на индивидуальном уровне (т. Е. Множественные наблюдения для каждого человека в городах)? Имеет ли смысл расширять эту модель термином фиксированного эффекта индивидуального уровня ? Многие приложения DiD используют повторяющиеся данные поперечного сечения без данных панели индивидуального уровня.
Бертран, Марианна, Эстер Дюфло и Сендхил Малленатан. 2004. «Сколько мы должны доверять оценкам различия в различиях?» Quarterly Journal of Economics 119 (1): 249–75.
Ответы:
Приятной особенностью различия в различиях (DiD) является то, что вам не нужны данные панели. Учитывая, что лечение происходит на некотором уровне агрегации (в вашем случае города), вам нужно только отобрать случайных людей из городов до и после лечения. Это позволяет оценить и получить причинно-следственный эффект от обработки как ожидаемую разницу после исхода для лечили за вычетом ожидаемой разницы в исходах после контрольного теста.
Существует случай, когда люди используют индивидуальные фиксированные эффекты вместо показателя лечения, и это когда у нас нет четко определенного уровня агрегации, при котором происходит лечение. В этом случае вы бы оценили где - показатель периода после лечения для лиц, которые получил лечение (например, программа рынка труда, которая происходит повсюду). Для получения дополнительной информации об этом см. Эти лекционные заметки Стива Пишке. D i t
В ваших настройках добавление отдельных фиксированных эффектов не должно ничего менять по отношению к точечным оценкам. Индикатор лечения будет просто поглощен отдельными фиксированными эффектами. Однако эти фиксированные эффекты могут поглотить некоторые остаточные отклонения и, следовательно, потенциально уменьшить стандартную ошибку вашего коэффициента DiD.Aграмм
Вот пример кода, который показывает, что это так. Я использую Stata, но вы можете повторить это в статистическом пакете по вашему выбору. «Индивидуумы» здесь на самом деле страны, но они по-прежнему сгруппированы по некоторому показателю лечения.
Таким образом, вы видите, что коэффициент DiD остается неизменным, когда включены отдельные фиксированные эффекты (
areg
это одна из доступных команд оценки фиксированных эффектов в Stata). Стандартные ошибки немного короче, и наш первоначальный показатель лечения был поглощен отдельными фиксированными эффектами и поэтому упал в регрессии.В ответ на комментарий
я упомянул пример Пишке, показывающий, когда люди используют отдельные фиксированные эффекты, а не показатель группы лечения. Ваша настройка имеет четко определенную структуру группы, поэтому способ написания вашей модели идеально подходит. Стандартные ошибки должны быть сгруппированы на уровне города, т.е. на уровне агрегации, на котором происходит обработка (я не делал этого в коде примера, но в настройках DiD стандартные ошибки должны быть исправлены, как продемонстрировано в работе Bertrand et al. ).
Что касается грузчиков, они не играют здесь особой роли. Показатель лечения равен 1 для людей, которые живут в обработанном городе в период после лечения . Чтобы вычислить коэффициент DiD, нам просто нужно вычислить четыре условных ожидания, а именно:Dс т s T
Таким образом, если у вас есть 4 периода после лечения для человека, который живет в обработанном городе в течение первых двух лет, а затем переезжает в контрольный город в течение оставшихся двух периодов, первые два из этих наблюдений будут использоваться при вычислении и последние два в . Чтобы было понятно, почему идентификация происходит из-за различий в группах во времени, а не из движителей, вы можете визуализировать это с помощью простого графика. Предположим, что изменение результата действительно только из-за лечения и что оно оказывает одновременный эффект. Если у нас есть человек, который живет в обработанном городе после начала лечения, но затем переезжает в контрольный город, его результаты должны вернуться к тому, что было до лечения. Это показано на стилизованном графике ниже.Е( уI сек т| s=1,t=1) Е( уI сек т| s=0,t=1)
Вы все еще можете подумать о грузчиках по другим причинам. Например, если лечение оказывает длительный эффект (т.е. оно все еще влияет на результат, даже если человек переехал)
источник
Короткий ответ заключается в том, что использование фиксированного эффекта на уровне единицы или на уровне обработанной группы не меняет оценку, а только вывод. Как правило, использование единичного фиксированного эффекта будет поглощать больше вариаций, и, следовательно, вы будете иметь меньшие стандартные ошибки.
То, находятся ли единицы в одной и той же агрегированной группе, не меняет этого результата (это только меняет способ определения уровня обработанной группы и тот факт, что вам нужна панель вместо повторяющихся сечений).
Однако обратите внимание, что эквивалентность имеет место только тогда, когда ковариата X отсутствует. Как только у вас есть X, результаты будут разными, независимо от того, используете ли вы единичные или групповые фиксированные эффекты.
В приведенном ниже примере сравниваются 3 оценщика, в двух случаях, с и без X. Оценщики:
Код:
источник