Как вычислить полосы предсказания для нелинейной регрессии?

16

Страница справки для Prism дает следующее объяснение того, как она вычисляет полосы предсказания для нелинейной регрессии. Пожалуйста, извините за длинную цитату, но я не следую второму абзацу (который объясняет, как определяется и вычисляется d Y / d P ). Любая помощь будет принята с благодарностью.грамм|ИксdY/dп

Расчет доверительных и прогнозирующих полос достаточно стандартен. Читайте дальше о том, как Prism вычисляет предсказание и доверительные интервалы нелинейной регрессии.

Сначала давайте определим G | x, который является градиентом параметров при конкретном значении X и использующим все наиболее подходящие значения параметров. Результатом является вектор с одним элементом на параметр. Для каждого параметра он определяется как dY / dP, где Y - это значение Y кривой, учитывая конкретное значение X и все наиболее подходящие значения параметров, а P - один из параметров.)

G '| x - это транспонированный вектор градиента, поэтому он представляет собой столбец, а не строку значений.

Cov - ковариационная матрица (обратный гессиан из последней итерации). Это квадратная матрица с количеством строк и столбцов, равным количеству параметров. Каждый элемент в матрице представляет собой ковариацию между двумя параметрами.

Теперь вычислим c = G '| x * Cov * G | x. Результатом является одно число для любого значения X.

Полосы достоверности и прогнозирования центрированы на кривой наилучшего соответствия и простираются над и под кривой в равной степени.

Полосы доверия простираются выше и ниже кривой на: = sqrt (c) * sqrt (SS / DF) * CriticalT (Confidence%, DF)

Полосы прогнозирования простираются еще на большее расстояние выше и ниже кривой, равное: = sqrt (c + 1) * sqrt (SS / DF) * CriticalT (Confidence%, DF)

Джо Листер
источник
Надеюсь, что это поможет: stats.stackexchange.com/questions/74334/…
Бипи
Надеюсь, что это поможет: stats.stackexchange.com/questions/74334/…
Бипи
Это действительно известен как дельта-метод и использует приближение Тейлора первого порядка. Для этого лучше использовать для этого приближение Тейлора 2-го порядка - функция предиката NLS в пакете распространения делает это, если вам интересно!
Том Wenseleers

Ответы:

18

Это называется Дельта-метод.

Предположим, что у вас есть некоторая функция ; обратите внимание, что G ( ) является функцией параметров, которые вы оцениваете, β , и значений ваших предикторов, х . Сначала найдите производную этой функции по вашему вектору параметров, β : G ( β , x )y=G(β,x)+ϵG()βxβG(β,x), Это говорит: если вы немного измените параметр, насколько изменится ваша функция? Обратите внимание, что эта производная может зависеть от самих ваших параметров, а также от предикторов. Например, если , то производная равна x exp ( β x ) , которая зависит от значения β и значения x . Чтобы оценить это, вы подключаете в оценке р том , что процедура дает, р , а значение прогнозирующей хG(β,x)=exp(βx)xexp(βx)βxββ^x где вы хотите прогноз.

Дельта Метод, полученный из максимальных процедур правдоподобия, утверждает , что дисперсия будет G ' ( β , х ) Т вар ( β ) G ' ( β , х ) , где вар ( β )G(β^,x)

G(β^,x)TVar(β^)G(β^,x),
Var(β^)является дисперсионно-ковариационной матрицей ваших оценок (она равна обратной величине гессиана --- вторые производные функции правдоподобия при ваших оценках). Функция, используемая вашими пакетами статистики, вычисляет это значение для каждого отдельного значения предиктора . Это просто число, а не вектор, для каждого значения х .xx

Это дает дисперсию значения функции в каждой точке, и это используется так же, как и любая другая дисперсия при расчете доверительных интервалов: взять квадратный корень из этого значения, умножить на критическое значение для нормального или применимого t- распределения, релевантного для конкретный уровень достоверности, и прибавьте и вычтите это значение к оценке в точке.G()

Для интервалов прогнозирования нам необходимо принять во внимание дисперсию результата с учетом предикторов , Var ( y x ) σ 2 . Следовательно, мы должны увеличить нашу дисперсию от метода Delta нашей оценки дисперсии е , σ 2 , чтобы получить дисперсию у , а не дисперсию ожидаемой величины у , которая используется для доверительных интервалов. Заметим , что σ 2 представляет собой сумму квадратов ошибок ( в справочном файле нотации) , разделенная на степеней свободы ( ).xVar(yx)σ2ϵσ^2yyσ^2SSDF

cσ2σ2σc*SS/DF

c(xx)1Var(β^)=σ2(xx)1

Чарли
источник
Можете ли вы объяснить расчет CI? Не похоже на критическую точку t * sqrt (var)
B_Miner
Я думаю, что я понимаю их расчет; Я обновил свой ответ.
Чарли
Чарли, большое спасибо за подробный ответ. Я намереваюсь написать код, чтобы можно было рассчитать диапазон предсказания 95%. Я дам вам знать, как это происходит.
Джо Листер
@ Чарли - очень, очень приятно!
B_Miner
2
@Чарли. Благодарю. Я добавил предложение в наш FAQ по GraphPad Prism, объясняющее, что мы используем cov для обозначения нормализованной ковариационной матрицы (каждое значение находится в диапазоне от -1 до 1). Я также добавил ссылку на эту страницу, которая отлично подходит для тех, кто ищет математические детали.
Харви Мотульский