Я надеюсь получить интуитивное и доступное объяснение квантильной регрессии.
Допустим, у меня есть простой набор данных результата и предикторов .
Если, например, я запускаю квантильную регрессию в .25, .5, .75 и получаю обратно .
Найдены ли значения простым упорядочением значений и выполнением линейной регрессии на основе примеров, которые находятся в / около заданного квантиля?
Или все выборки вносят вклад в оценки с уменьшением веса по мере увеличения расстояния от квантиля?
Или это что-то совершенно другое? Я еще не нашел доступного объяснения.
quantile-regression
Джереми
источник
источник
Ответы:
Я рекомендую Koenker & Hallock (2001, журнал «Экономические перспективы») и одноименный учебник Koenker .
Итак, ваша интуиция совершенно верна: все выборки вносят вклад в оценки , причем асимметричные веса зависят от квантиля τ, к которому мы стремимся.β τ
источник
foo <- sample(x=c(1,2,4,10),size=1e6,prob=c(.4,.2,.2,.2),replace=TRUE); xx <- seq(1,10,by=.1); plot(xx,sapply(xx,FUN=function(yy)mean(abs(yy-foo))),type="l")
Основная идея квантильной регрессии проистекает из того факта, что аналитик заинтересован в распространении данных, а не просто в средстве данных. Начнем со среднего.
Здесь вы допустили небольшую ошибку: Q-регрессия - это не то же самое, что найти квантиль данных, а затем поместить линию в это подмножество (или даже в более сложные границы).
Как видите, эта умная целевая функция - не более чем преобразование квантиля в задачу оптимизации.
источник