Я изучаю, как построить 95% доверительный интервал для отношения шансов из коэффициентов, полученных в логистической регрессии. Итак, учитывая модель логистической регрессии,
такой, что для контрольной группы и для группы случаев.
Я уже читал, что самый простой способ - построить 95% -й CI для тогда мы применили экспоненциальную функцию, то есть
Мои вопросы:
Какова теоретическая причина, которая оправдывает эту процедуру? Я знаю, что и оценки максимального правдоподобия инвариантны. Однако я не знаю связи между этими элементами.
Должен ли дельта-метод давать тот же 95% доверительный интервал, что и предыдущая процедура? Используя дельта-метод,
Потом,
Если нет, то какая процедура лучше?
logistic
confidence-interval
odds-ratio
delta-method
Марсио Аугусто Диниз
источник
источник
Ответы:
Обоснованием процедуры является асимптотическая нормальность MLE для и результат аргументов, включающих центральную предельную теорему.β
Дельта-метод исходит из линейного (т. Е. Первого порядка) разложения функции вокруг MLE. Впоследствии мы обращаемся к асимптотической нормальности и непредвзятости MLE.
Оба асимптотически дают одинаковый ответ. Но практически вы бы предпочли тот, который выглядит более нормально. В этом примере я предпочел бы первый, потому что последний, вероятно, будет менее симметричным.
источник
Сравнение методов доверительных интервалов на примере из ISL
В книге «Введение в статистическое обучение» Тибширани, Джеймса, Хасти приведен пример на странице 267 доверительных интервалов для полиномиальной логистической регрессии степени 4 по данным о заработной плате . Цитирую книгу:
Ниже приведен краткий обзор двух методов построения таких интервалов, а также комментарии о том, как их реализовать с нуля.
Интервалы преобразования Wald / Endpoint
Поскольку является монотонным преобразованиемx T βPr(xTβ)=F(xTβ) xTβ
Конкретно это означает вычисление и затем применение преобразования логита к результату, чтобы получить нижнюю и верхнюю границы:βTx±z∗SE(βTx)
Вычисление стандартной ошибки
Теория максимального правдоподобия говорит нам, что приблизительная дисперсия может быть вычислена с использованием ковариационной матрицы коэффициентов регрессии с использованиемxTβ Σ
Определить расчетную матрицу и матрицу какX V
где - значение й переменной для х наблюдений, а - прогнозируемая вероятность для наблюдения .xi,j j i π^i i
Тогда ковариационная матрица может быть найдена как: и стандартной ошибкой какΣ=(XTVX)−1 SE(xTβ)=Var(xTβ)−−−−−−−−√
95% доверительные интервалы для прогнозируемой вероятности могут быть затем нанесены на график как
Доверительные интервалы дельта-метода
Подход заключается в том, чтобы вычислить дисперсию линейного приближения функции и использовать ее для построения больших выборочных доверительных интервалов.F
Где - градиент, а - предполагаемая ковариационная матрица. Обратите внимание, что в одном измерении:∇ Σ
Где является производной . Это обобщает в многомерном случаеf F
В нашем случае F - это логистическая функция (которую мы будем обозначать ), чья производнаяπ(xTβ)
Теперь мы можем построить доверительный интервал, используя дисперсию, вычисленную выше.
В векторной форме для многомерного случая
Открытое заключение
Изучение графиков нормального QQ как для вероятностей, так и для отрицательных логарифмических шансов показывает, что ни один из них не распределен нормально. Может ли это объяснить разницу?
Источник:
источник
Для большинства целей самый простой способ, вероятно, является лучшим, как обсуждалось в контексте преобразования журнала на этой странице . Представьте, что ваша зависимая переменная анализируется в логитовой шкале с проведенными статистическими тестами и доверительными интервалами (CI), определенными для этой логитовой шкалы. Обратное преобразование в отношение шансов просто помещает эти результаты в шкалу, которую читатель мог бы легче понять. Это также делается, например, в анализе выживаемости по Коксу, где коэффициенты регрессии (и 95% -й ДИ) экспоненциально определяются для получения коэффициентов опасности и их ДИ.
источник