Квантильная формула оценки регрессии

10

Я видел два разных представления оценки квантильной регрессии, которые

Q(βq)=i:yixiβnqyixiβq+i:yi<xiβn(1q)yixiβq

и

Q(βq)=i=1nρq(yixiβq),ρq(u)=ui(q1(ui<0))

где . Может кто-нибудь сказать мне, как показать эквивалентность этих двух выражений? Вот что я попробовал до сих пор, начиная со второго выражения.ui=yixiβq

Q(βq)=i=1nui(q1(ui<0))(yixiβq)=i=1n(yixiβq)(q1(yixiβq<0))(yixiβq)=[i:yixiβn(q(yixiβq))+i:yi<xiβn(q(yixiβq)(yixiβq))](yixiβq)
Но с этого момента я застрял на том, как поступить. Пожалуйста, не говорите, что это не домашнее задание или задание. Большое спасибо.
AlexH
источник

Ответы:

12

Если вы помните, OLS минимизирует сумму квадратов невязок тогда как медианная регрессия минимизирует сумму абсолютных невязок . Оценка медианного или наименьшего абсолютного отклонения (LAD) является частным случаем квантильной регрессии, в которой вы имеете . В квантильной регрессии мы минимизируем сумму абсолютных ошибок, которые получают асимметричные веса для сверхпрогнозирования и для недопрогнозирования. Вы можете начать с представления LAD и расширить его как сумму доли данных, взвешенных по и учетом их значения , и работать с ними следующим образом: Σ я | U я | д = 0,5 ( 1 - д ) д д ( 1 - д ) у яiui2iuiq=.5(1q)qq(1q)ui

ρq(u)=1(ui>0)qui+1(ui0)(1q)ui=1(yixiβq>0)qyixiβq+1(yixiβq0)(1q)yixiβq
Это просто использует тот факт, что а затем вы можете переписать функцию индикатора в виде суммы наблюдений, которые удовлетворяют условиям индикаторов , Это даст первое выражение, которое вы записали для оценки квантильной регрессии.ui=yixiβq

=i:yi>xiβqnqyixiβq+i:yixiβqn(1q)yixiβq=qi:yi>xiβqnyixiβq+(1q)i:yixiβqnyixiβq=qi:yi>xiβqn(yixiβq)(1q)i:yixiβqn(yixiβq)=qi:yi>xiβqn(yixiβq)i:yixiβqn(yixiβq)+qi:yixiβqn(yixiβq)=qi=1n(yixiβq)i=1n1(yixiβq0)(yixiβq)=i=1n(q1(ui0))ui

Вторая строка вынимает веса из сумм. Третья строка избавляет от абсолютных значений и заменяет их фактическими значениями. По определению является отрицательным всякий раз, когда , следовательно, знак меняется в этой строке. Четвертая строка умножается на . Затем вы понимаете, что и замена суммирования среднего слагаемого в четвертой строке соответствующим индикатором Вы прибываете на пятой линии. Факторизация, а затем заменаyixiβqyi<xiβq(1q)y i - x i β q u i

qi:yi>xiβqn(yixiβq)+qi:yixiβqn(yixiβq)=i=1n(yixiβq)
yixiβqui
Это показывает, как два выражения эквивалентны.
Энди
источник