Процентные функции потери

11

Решение проблемы:

minmE[|mX|]

Хорошо известно, что это медиана , но как выглядит функция потерь для других процентилей? Пример: 25-й процентиль X является решением для:X

minmE[L(m,X)]

Что такое L в этом случае?

Cam.Davidson.Pilon
источник

Ответы:

12

Позвольте I быть индикаторной функцией: она равна 1 для истинных аргументов и 0 противном случае. Выберите 0<α<1 и установите

Λα(x)=αxI(x0)(1α)xI(x<0).

фигура

Эта фигура строит Λ1/5 . Он использует точное соотношение сторон, чтобы помочь вам измерить уклоны, которые равны 4/5 на левой стороне и +1/5 на правой. В этом случае экскурсии выше 0 сильно снижены по сравнению с экскурсиями ниже 0 .

Это естественная функция, которую нужно попробовать, потому что она взвешивает значения x которые превышают 0 другому, чем0x , которые меньше . Давайте вычислим связанный убыток и затем оптимизируем его.0

Запись F для функции распределения L α ( m , x ) = Λ α ( x - m )X и установка , вычислитьLα(m,x)=Λα(xm)

EF(Lα(m,X))=RΛα(xm)dF(x)=αRI(xm)(xm)dF(x)(1α)R(xm)I(x<m)dF(x)=αm(xm)dF(x)(1α)m(xm)dF(x).

фигура 2

Поскольку на этой иллюстрации изменяется со стандартным нормальным распределением , общая взвешенная по вероятности область . (Кривая - это график .) Правый график дляF Λ 1 / 5 Λ 1 / 5 ( х - т ) д Р ( х ) м = 0 Е Р ( L 1 / 5 ( м , Х ) )mFΛ1/5Λ1/5(xm)dF(x)m=0 наиболее четко показывает эффект уменьшения положительных значений, поскольку без этого уменьшения график будет быть симметричным относительно происхождения. Средний график показывает оптимальное значение, когда общее количество синих чернил (представляющее ) настолько мало, насколько это возможно.EF(L1/5(m,X)) 

Эта функция дифференцируема, и поэтому ее экстремумы можно найти путем проверки критических точек. Применение правила цепочки и основной теоремы исчисления для получения производной поm дает

mEF(Lα(m,X))=α(0mdF(x))(1α)(0mdF(x))=F(m)α.

Для непрерывных распределений это всегда имеет решение , который, по определению, представляет собой любой - квантиль . Для не непрерывных распределений это может не иметь решения, но будет хотя бы один для которого для всех и для всех : это также (по определению) является квантилемα X m F ( x ) - α < 0 x < m F ( x ) - α 0 x m α XmαXmF(x)α<0x<mF(x)α0xmαX .

Наконец, поскольку и , ясно, что ни ни не уменьшат эту потерю. Это исчерпывает проверку критических точек, показывая, чтоα 1 m - m Λ αα0α1mmΛα отвечает всем требованиям.

Как особый случай, - это потери, проявленные в вопрос.EF(2L1/2(m,X))=EF(|mx|)

Whuber
источник
Я высоко ценю усилия, которые вы приложили, чтобы показать ожидаемые потери, которые минимизированы правильной точкой . Мне было интересно, как сделать это самому для моего собственного ответа, но ваше объяснение хорошо. (+1)m
2
Вы доказали, что картинки стоят 1000 слов. Спасибо @whuber =)
Cam.Davidson.Pilon
8

В этой статье есть ваш ответ. Чтобы быть конкретным, Функция потерь может быть интерпретирована как «уравновешивание» различных областей вероятности массы около посредством вычитания . Для медианы эти массовые области равны: делая функцию потерь пропорциональной (в ожидании, что константа пренебрежимо мала) в что дает желаемое заключение для медианы.0,25 0,25 - 1 { X > м } L 0,5 ( м , Х ) = | ( Х - м ) ( 0,5 - 1 { Х > м } ) |

L0.25(m,X)=|(Xm)(0.251{X>m})|.
0.250.251{X>m}| X - м | ,
L0.5(m,X)=|(Xm)(0.51{X>m})|=|(Xm)×±0.5|,
|Xm|,

источник
(+1) Молодец! - не было очевидно, где искать эту статью в Википедии; Вы должны были думать о квантильной регрессии.
whuber
Спасибо, Матвей, это отличная находка. Мне нравится балансировка интерпретации
Cam.Davidson.Pilon
Я до сих пор не понимаю, Откуда это? Если X выше квантиля, получает вес 0,75, в противном случае 0,25? Просто это? ( Х - м )|(0.25)1X>m)|(Xm)
IcannotFixThis