Я работаю в политической экономии, и многие модели включают в себя «невинные» контрольные переменные, такие как население, неравенство, колониальное наследие и т. Д., Так что автор может претендовать на объективность своей независимой переменной интереса.
Но если какая-либо из этих управляющих переменных является эндогенной для некоторой пропущенной переменной, не загрязняет ли это объективность ВСЕХ независимых переменных?
Если это правда, то что мы можем сделать? Оставьте эти управляющие переменные вне поля, и они сами приведут к отсутствию смещения переменных. Включите их, и они загрязнят все в модели.
Пример: исследователь хочет знать, приводит ли неравенство к насилию, и он контролирует несколько вещей: Видя, что неравенство , вероятно, будет эндогенным ( из-за пропущенной переменной Level of altruism ) он попытается найти инструментальную переменную для неравенства . Но разве рост и развитие не могут быть эндогенными (то есть коррелированными с уровнем альтруизма )?
Этот пример может показаться глупым, но моя точка зрения связана с политической экономикой / разработкой, так как в игре так много факторов (но они опущены), что я боюсь, что многие переменные, включенные в LHS, являются эндогенными. Тем не менее, часто исследователь ищет инструмент только для своей независимой переменной.
Ответы:
«Но если какая-либо из этих контрольных переменных является эндогенной для некоторой пропущенной переменной, разве это не загрязняет объективность ВСЕХ независимых переменных?»
Я не хочу особо подчеркивать это, но стоит упомянуть, что это не так в целом. Надеемся, что следующий вывод даст некоторое представление о «загрязнении», о котором вы упомянули. В качестве простого контрпримера, предположим, что процесс генерирования данных задается как где не наблюдается. Пусть , и . Тогда ясно, что является «эндогенным». Но обратите внимание, что, поскольку , наша оценка все равно будет в порядке: Z C o v ( X 1 , Z ) = 0 C o v ( X 2 , Z ) ≠ 0 C o v ( X 1 , X 2 ) = 0 X 2 C o v ( X 1 ,
"Что мы можем сделать?"
Одной из основных задач создания хорошей эконометрики является продумывание потенциальных стратегий идентификации. В описываемой вами ситуации вы, вероятно, ничего не можете сделать, кроме как попытаться по-другому подойти к проблеме.
источник
Все слишком сильно, но, вероятно, некоторые. Эта проблема называется «размазыванием». Взгляните на доказательство в лекционных заметках Грина на слайде 5.
У Эмили Остер есть хороший рабочий документ (и команда Stata
psacalc
), который может помочь ограничить предвзятость.источник
В контексте оценки наименьших квадратов мы должны (пытаться) справиться с возможной эндогенностью регрессоров через оценку инструментальных переменных. Этот подход не зависит от наличия только одного эндогенного регрессора - у вас их может быть много. В таком случае, конечно, вам нужно найти больше инструментов, которые усложняют ситуацию, но в принципе метод будет работать так же.
Оценка IV не решает проблему смещения, она только обеспечивает последовательность для оценщика. Но ничто не решает проблему строгой экзогенности самого смещения (и тогда есть некоторые методы уменьшения смещения). Но если вы посмотрите на другой сайт SE, Cross Validated , который посвящен статистике, вы увидите, что опытные статистики на самом деле не придают большого значения свойству непредвзятости - они фокусируются на среднеквадратичной эффективности для конечных выборочных свойств, и на согласованность для больших свойств образца.
источник
Это пример того, что статистик Эндрю Гельман называет «ошибкой контроля за промежуточным результатом». Вот его описание этой ошибки, которая появляется, когда исследователи спрашивают, меняет ли ваша дочь больше вашей политики. Решение иметь второго ребенка обязательно зависит от предыдущего решения о рождении первого ребенка, и, таким образом, кажется ясным примером контроля за переменной решения, которая была эндогенной.
Наличие сыновей делает вас более консервативным? Может быть, а может и нет. Проблема с контролем промежуточного результата
Что касается вашего комментария: «Не указывайте эти переменные управления, и они сами приводят к пропускам смещения переменных», похоже, это зависит от того, какой инструмент вы получите. Хороший инструмент, который действительно удовлетворяет требованиям, должен быть независимым от термина ошибки на втором этапе и независимым от всего, что вы контролируете напрямую . То есть инструмент меняет Y только через X. Таким образом, подходящий инструмент для неравенства должен быть независим от роста и развития (удачи в этом!), Если мы считаем, что уравнение насилия является структурным уравнением насилия.
источник
Как отмечали другие посты, эндогенные регрессоры могут загрязнять все оценки параметров в регрессии, когда регрессоры коррелируют.
Рассмотрим следующую модель (аналогичную нотации @ jmbejara)
источник