У меня есть теоретическая экономическая модель, которая заключается в следующем,
Таким образом, теория говорит, что есть факторы , и для оценки .х 2 х 3 у
Теперь у меня есть реальные данные, и мне нужно оценить , , . Проблема состоит в том, что реальный набор данных содержит только данные для и ; нет данных для . Таким образом, модель, которую я могу подобрать на самом деле:b 2, b 3 x 1 x 2 x 3
- Можно ли оценивать эту модель?
- Потеряю ли я что-нибудь, оценивая это?
- Если я оцениваю , , то куда термин ?б 2 б 3 х 3
- Это объясняется ошибкой члена ?
И мы хотели бы предположить, что не коррелирует с и .х 1 х 2
Ответы:
Проблема, о которой вам нужно беспокоиться, называется эндогенностью . Более конкретно, это зависит от того , коррелирован ли в популяции с х 1 или х 2 . Если это так, то соответствующая b j s будет смещена. Это связано с тем, что методы регрессии OLS заставляют невязки u i быть некоррелированными с вашими ковариатами s. Тем не менее, ваши остатки состоят из некоторых неприводимой случайности, , и ненаблюдаемых (но соответствующие) переменные, , который по условию являетсяx3 x1 x2 bj ui xj εi x3 коррелирует с и / или . С другой стороны, если оба и нескоррелированные с в популяции, то их ы не будет смещен этим (они вполне могут быть смещены что - то еще, конечно). Один из способов, с помощью которого эконометрики пытаются решить эту проблему, - использование инструментальных переменных . x1 x2 x1 x2 x3 b
Для большей ясности я написал быстрое моделирование в R, которое демонстрирует, что выборочное распределение несмещено / центрировано на истинном значении , когда оно не связано с . Однако во втором запуске обратите внимание, что не коррелирован с , но не с . Не случайно является непредвзятым, но является предвзятым.b2 β2 x3 x3 x1 x2 b1 b2
источник
Давайте подумаем об этом в геометрических терминах. Думайте о "шаре", поверхности шара. Он описывается как . Теперь, если у вас есть значения для x 2 , y 2 , z 2 , и у вас есть измерения r 2, то вы можете определить свои коэффициенты «a», «b» и «c». (Вы можете назвать это эллипсоидом, но назвать его мячом проще.)r2=ax2+by2+cz2+ϵ x2 y2 z2 r2
Если у вас есть только члены и y 2, вы можете сделать круг. Вместо того, чтобы определять поверхность шара, вы будете описывать закрашенный круг. Уравнение, которое вы вместо этого подходите: r 2 ≤ a x 2 + b y 2 + ϵ .x2 y2 r2≤ax2+by2+ϵ
Вы проецируете «шар», какой бы он ни был, в выражение для круга. Это может быть «шар», ориентированный по диагонали, который имеет форму, напоминающую швейную иглу, и поэтому компоненты полностью разрушают оценки двух осей. Это может быть шар, похожий на почти раздавленный м-м, где оси монеты - это «х» и «у», а проекция нулевая. Вы не можете знать, что это без информации " z ".z z
В этом последнем абзаце говорилось о случае «чистой информации» и не было никакого шума. Измерения в реальном мире имеют сигнал с шумом. Шум по периметру, который выровнен по осям, будет оказывать гораздо более сильное влияние на вашу посадку. Даже если у вас одинаковое количество выборок, у вас будет больше неопределенности в оценках параметров. Если это уравнение отличается от этого простого случая, ориентированного на линейную ось, то все может пойти «в форме груши ». Ваши текущие уравнения имеют плоскую форму, поэтому вместо границы (поверхности шара) z-данные могут просто распространяться по всей карте - проекция может быть серьезной проблемой.
Это нормально для модели? Это суждение. На это может ответить эксперт, который понимает детали проблемы. Я не знаю, может ли кто-нибудь дать хороший ответ, если он далек от проблемы.
Вы теряете несколько хороших вещей, включая определенность в оценках параметров и характер преобразуемой модели.
Оценка для исчезает в эпсилоне и в других оценках параметров. Это подчинено целому уравнению, в зависимости от базовой системы.b3
источник
Другие ответы, хотя и не неправильные, несколько усложняют проблему.
Если действительно не коррелирует с x 1 и x 2 (и истинное соотношение соответствует указанному), то вы можете оценить ваше второе уравнение без проблем. Как вы предполагаете, β 3 x 3 будет поглощено (новым) условием ошибки. Оценки OLS будут беспристрастными, пока все остальные предположения OLS верны.x3 x1 x2 β3x3
источник