Зачем использовать контрольные переменные в различиях?

10

У меня есть вопрос о подходе «различия в различиях» со следующим стандартным уравнением: где Treat - фиктивная переменная для группы лечения и post.

y=a+b1treat+b2post+b3treatpost+u

Теперь мой вопрос прост: почему в большинстве статей все еще используются дополнительные контрольные переменные? Я думал, что если предположение о параллельном тренде верное, то нам не нужно беспокоиться о дополнительных элементах управления. Я мог думать только о 2 возможных причинах использования управляющих переменных:

  1. без них тренды не были бы параллельными
  2. потому что спецификация DnD приписывает любые различия в тенденциях между лечением и контрольной группой во время лечения вмешательством (т. е. термин взаимодействия лечить * пост) - когда мы не контролируем другие переменные, коэффициент взаимодействия может быть больше - / занижена

Может ли кто-нибудь пролить свет на этот вопрос? Мои соображения 1) или 2) имеют смысл вообще? Я не до конца понимаю использование управляющих переменных в DnD.

Сэчин
источник
Потребность в дополнительных контрольных переменных может зависеть от того, была ли группа лечения выбрана случайным образом из более крупной группы, а остальная часть стала контрольной, или (как это чаще случается в последующем анализе) из-за некоторых специфических особенностей.
Генри

Ответы:

5

без них [т.е. дополнительных переменных] тренды не были бы параллельными

Да все верно. Могут существовать тренды для отдельных единиц, которые вы не учитываете, если не добавляете изменяющиеся во времени переменные в модель.

Даже если предположение о параллельных тенденциях выполняется без дополнительных переменных, добавление дополнительных переменных может повысить точность ваших оценок, как и в других регрессиях. Я думаю, что это часть того, что имеет в виду Майкл Черник.

В основном безвредная эконометрика имеет хорошее обсуждение, которое может быть полезным. Смотрите особенно страницы 236-37.

user697473
источник
1

Иногда, когда мы смотрим на эффект лечения, вычисляя разницу между реакцией после лечения или предварительной обработкой, мы говорим, что пациент действует как его собственный контроль. Целью предоставления контрольной группы является учет так называемого эффекта плацебо. Иногда могут быть положительные изменения, даже если лечение не применяется. Таким образом, эффект, который мы хотим определить, - это среднее увеличение над «эффектом плацебо».

Майкл Р. Черник
источник
Привет Майкл, спасибо за твой ответ. Я думаю, я понимаю, почему нам нужны контрольные группы. Контрольная группа включена в мое уравнение регрессии как те, у кого нет лечения = 1. Так что это не совсем вопрос здесь. Вопрос в том, почему в некоторых работах используются дополнительные управляющие переменные поверх уравнения, указанного выше. Было бы здорово, если бы вы могли ответить на это или, может быть, кто-то еще. Спасибо, парни!
Сачин
Почему вы называете дополнительные переменные управляющими переменными? Единственная причина, по которой я мог видеть включение дополнительных переменных в модель, заключается в том, что эти переменные могут учитывать некоторые изменения в отклике, которые не были объяснены другими переменными в модели.
Майкл Р. Черник
Ну, это в основном мой вопрос: зачем включать эти переменные (то есть контрольные переменные, которые включены, потому что, как вы говорите, они могли бы объяснить то, что, как мы утверждаем, объясняет обработка), если предположить, что предположение о параллельном тренде выполняется? Я мог бы только предположить, что включение дополнительных контролей означает ослабление этого предположения - то есть увидеть, что лечение может объяснить, даже когда учитываются другие переменные. Это может быть следствием неспособности полностью проверить предположение о параллельном тренде и убедить читателя больше о эффекте лечения. Но не уверен насчет этого
Сачин
Влияние на ответ не должно исходить исключительно от лечения. Я говорю, что другие переменные могут быть в состоянии объяснить различия в ответе, которые не зависят от лечения. Это не имеет ничего общего с лечением, взаимодействующим с чем-либо.
Майкл Р. Черник
1

Продолжая ответ Михаэля, вы хотите предоставить как можно больше доказательств того, что E [u | лечить] = 0. Это предположение и никогда не поддается прямой проверке, но вы хотите предоставить читателям столько доверия, сколько вы думали, почему это может держать. Добавление элементов управления эффективно начинает разлагать вас. И некоторые элементы управления могут не достигать всего, что вы хотели бы, но могут дать вам представление о том, что вам не нужно беспокоиться. Например, если у вас был элемент управления для IQ, это могло бы помочь решить проблемы пропущенных переменных в способности.

user1690130
источник