Я понимаю, что основное определение эндогенности состоит в том, что не выполняется, но что это означает в смысле реального мира? Я прочитал статью в Википедии с примером спроса и предложения, пытаясь понять это, но это не помогло. Я слышал другое описание эндогенного и экзогенного, как находящегося внутри системы и находящегося вне системы, и это все еще не имеет смысла для меня.
regression
causality
instrumental-variables
user25901
источник
источник
R
.Ответы:
Ответ JohnRos очень хороший. Проще говоря, эндогенность означает, что вы неправильно поняли причину. То, что модель, которую вы записали и оценили, неправильно отражает то, как причинная связь работает в реальном мире. Когда вы пишете:
Вы можете думать об этом уравнении несколькими способами. Вы можете думать об этом как об удобном способе предсказания на основе значенийВы можете думать об этом как об удобном способе моделирования . В любом из этих случаев нет такой вещи как эндогенность, и вам не нужно беспокоиться об этом.X E { Y | X }Y X E{Y|X}
Тем не менее, вы также можете думать об уравнении как о воплощении причинно-следственной связи. Вы можете думать о как об ответе на вопрос: «Что случилось бы с если бы я добрался до этой системы и экспериментально увеличил на 1?» Если вы хотите думать об этом таким образом, использование OLS для оценки этого означает, что: Y Xβ1 Y X
Сбой любого из 3-5 обычно приводит к или, что не совсем эквивалентно, . Инструментальные переменные - это способ исправить тот факт, что вы неправильно поняли причину (сделав другое, другое, причинное предположение). Отлично проведенное рандомизированное контролируемое исследование - это способ заставить 3-5 быть правдой. Если вы выберете случайно, то это, безусловно, не вызвано , или чем-то еще. Так называемые методы «естественного эксперимента» - это попытки найти особые обстоятельства в мире, где 3-5 верны, даже если мы не думаем, что 3-5 обычно верны.C o v ( X , ϵ ) ≠ 0 X Y ϵE{ϵ|X}≠0 Cov(X,ϵ)≠0 X Y ϵ
В примере JohnRos для расчета величины заработной платы в сфере образования вам нужна причинно-следственная интерпретация , но есть веские основания полагать, что 3 или 5 неверно.β1
Ваше замешательство понятно, хотя. На курсах по линейной модели очень характерно, чтобы преподаватель использовал причинную интерпретацию я дал выше, делая вид, что не вводит причинно-следственную связь, притворяясь, что «это всего лишь статистика». Это трусливая ложь, но она также очень распространена.β1
На самом деле, это часть более крупного явления в биомедицине и общественных науках. Почти всегда мы пытаемся определить причинное влияние на - в этом и заключается наука. С другой стороны, это также почти всегда тот случай, когда есть какая-то история, которую вы можете рассказать, которая приводит к выводу, что один из 3-5 является ложным. Таким образом, существует некая практичная, двусмысленная недобросовестность, в которой мы отбрасываем возражения, говоря, что мы просто выполняем ассоциативную работу, а затем скрываем причинную интерпретацию в другом месте (обычно в разделах введения и заключения статьи).YX Y
Если вам действительно интересно, читайте парня по имени Иудея Перл. Джеймс Хекман тоже хорош.
источник
Позвольте мне использовать пример:
Скажем, вы хотите количественно оценить (причинный) эффект образования на доход. Вы берете данные об образовательных годах и доходах и регрессируете одно против другого. Ты восстановил то, что хотел? Возможно нет! Это связано с тем, что доход обусловлен не только образованием, но и другими вещами, которые связаны с образованием. Давайте назовем их «навыками». Мы можем с уверенностью предположить, что на «годы обучения» влияет «навык», поскольку, чем более вы квалифицированы, тем легче получить образование. Таким образом, если вы регрессируете годы образования на доход, оценка эффекта образования учитывает эффект «умения», и вы получаете слишком оптимистичную оценку возврата к образованию. Это означает, что влияние образования на доход (в сторону повышения) является предвзятым, поскольку образование не является экзогенным по отношению к доходу.
Эндогенность - это только проблема, если вы хотите восстановить причинные эффекты (в отличие от простых корреляций). Кроме того, если вы можете спланировать эксперимент, вы можете гарантировать, что при случайном назначении. К сожалению, это обычно невозможно в социальных науках.C o v (X, ϵ ) = 0
источник
User25901 ищет простое, простое, реальное объяснение того, что означают термины экзогенный и эндогенный. Отвечая тайными примерами или математическими определениями, на самом деле не отвечает на заданный вопрос.
Как мне понять эти два термина?
Вот что я придумал:
Экзо - внешнее, снаружи эндо - внутреннее, внутри - щедрое - происходящее из
Экзогенный: переменная является экзогенной для модели, если она не определяется другими параметрами и переменными в модели, но устанавливается внешне и любые изменения в ней происходят от внешних сил.
Эндогенный: переменная является эндогенной в модели, если она хотя бы частично зависит от других параметров и переменных в модели.
источник
Это две ступени наименьших квадратов, которые почти совпадают с IV.
источник
В регрессии мы хотим отразить количественное влияние независимой переменной (которая, как мы полагаем, является экзогенной и не зависимой от чего-то другого) от идентифицированной зависимой переменной. Мы хотим знать, какое чистое влияние экзогенная переменная оказывает на зависимую переменную - это означает, что независимая переменная не должна иметь никакого влияния от другой переменной. Быстрый способ выяснить, страдает ли регрессия от проблемы эндогенности, - проверить корреляцию между независимой переменной и остатками. Но это просто грубая проверка, в противном случае необходимо провести формальные тесты эндогенности.
источник