Я использую квантильную регрессию, чтобы найти предикторы 90-го процентиля моих данных. Я делаю это в R, используя quantreg
пакет. Как я могу определить для квантильной регрессии, которая укажет, насколько изменчивость объясняется переменными предиктора?
Что я действительно хочу знать: «Любой метод, который я могу использовать, чтобы найти, сколько изменчивости объясняется?». Уровни значимости по значениям P доступны в выходе команды: summary(rq(formula,tau,data))
. Как я могу получить хорошее состояние?
Ответы:
Koenker и Machado описывают , локальную меру качества соответствия в определенном ( ) квантиле. R 1 τ[1] R1 τ
ПустьV(τ)=minb∑ρτ(yi−x′ib)
Пусть и будут оценками коэффициентов для полной модели и ограниченной модели, и пусть и будут соответствующие термины. ~ β (τ) V ~ V Vβ^(τ) β~(τ) V^ V~ V
Они определяют критерий соответствия .R1(τ)=1−V^V~
Кенкер дает код для здесь ,V
Поэтому, если мы вычисляем для модели с использованием только перехвата ( - или в фрагменте кода ниже) и затем неограниченной модели ( ), мы можем вычислить это - по крайней мере, условно - чем-то похож на обычный .~ V V R 2V V~ V^ R2
V0
R1 <- 1-Vhat/V0
Изменить: В вашем случае, конечно, второй аргумент, который будет вставлен в, где
f$tau
находится в вызове во второй строке кода, будет любым значением, котороеtau
вы использовали. Значение в первой строке просто устанавливает значение по умолчанию.«Объяснение отклонения от среднего значения» на самом деле не то, что вы делаете с квантильной регрессией, поэтому не стоит ожидать, что будет действительно эквивалентный показатель.
Я не думаю, что концепция хорошо переводит квантильную регрессию. Вы можете определить различные более или менее аналогичные величины, как здесь, но независимо от того, что вы выберете, у вас не будет большинства свойств, которые имеет в регрессии OLS. Вы должны четко понимать, какие свойства вам нужны, а какие нет - в некоторых случаях может быть возможно иметь показатель, который делает то, что вы хотите.R 2R2 R2
-
Goodness of Fit и связанные процессы вывода для квантильной регрессии,
журнал Американской статистической ассоциации, 94 : 448, 1296-1310.
источник
tau
когда вызываете функцию. Я уточню в посте.Мера псевдо- предложенная Koenker и Machado (1999) в JASA, измеряет степень соответствия, сравнивая сумму взвешенных отклонений для интересующей модели с той же суммой из модели, в которой появляется только пересечение. Рассчитывается какR2
где - подогнанный квантиль th для наблюдения , а - подогнанное значение только для перехвата модель.y^i=ατ+βτx τ i y¯=βτ
Вот пример в R:
Это может быть выполнено более элегантно.
источник
R_1(\tau) = 1 -
последний символ - это какой-то беспорядок. Не могли бы вы проверить это? Может быть, вы вставили какой-то нестандартный символ вместо того, чтобы использовать текст