Я ищу методы, которые можно использовать для оценки модели погрешности измерения "OLS".
Где ошибки независимы, нормальны с неизвестными отклонениями и . «Стандартный» OLS не будет работать в этом случае.
В Википедии есть несколько непривлекательных решений - эти два фактора заставляют вас предполагать, что либо «коэффициент дисперсии» либо " коэффициент надежности " , где \ sigma_ {X} ^ 2 - дисперсия истинного регрессора X_i . Я не удовлетворен этим, потому что как тот, кто не знает отклонений, знает их соотношение? σ 2 X Xi
В любом случае, есть ли другие решения, кроме этих двух, которые не требуют, чтобы я «знал» что-либо о параметрах?
Решения только для пересечения и наклона в порядке.
regression
estimation
errors-in-variables
probabilityislogic
источник
источник
Ответы:
Есть ряд возможностей, описанных Дж. В. Гиллардом в «Историческом обзоре линейной регрессии с ошибками в обеих переменных».
Если вы не заинтересованы в деталях или причины для выбора одного метода над другим, просто идти с самым простым, что нарисовать линию через центр тяжести с угловым коэффициентом р = S у / s х , т.е. отношение наблюдаемых стандартных отклонений (делая знак наклона таким же, как знак ковариации x и y ); как вы , вероятно , можете работать, это дает перехват на у оси Оу из альфа = ··· у - & beta ; ˉ х .(x¯,y¯) β^=sy/sx x y y α^=y¯−β^x¯.
Преимущества этого конкретного подхода
Наклон - это среднее геометрическое наклона двух обычных наклонов линейной регрессии. Это также то, что вы получили бы, если бы вы стандартизировали наблюдения и y , нарисовали линию под углом 45 ° (или 135 °, если есть отрицательная корреляция), а затем отменили стандартизацию линии. Это также можно рассматривать как эквивалентность неявному предположению, что дисперсии двух наборов ошибок пропорциональны дисперсиям двух наборов наблюдений; насколько я могу судить, вы утверждаете, что не знаете, каким образом это неправильно.x y
Вот некоторый код R для иллюстрации: красная линия на графике - это регрессия OLS на X , синяя линия - регрессия OLS X на Y , а зеленая линия - это простой метод. Обратите внимание, что уклон должен быть около 5.Y X X Y
источник