Я заинтересован в оценке скорректированного коэффициента риска, аналогичного тому, как оценивается скорректированный коэффициент шансов с использованием логистической регрессии. Некоторая литература (например, это ) указывает на то, что использование регрессии Пуассона со стандартными ошибками Губер-Уайта является основанным на модели способом сделать это
Я не нашел литературы о том, как регулировка для непрерывных ковариат влияет на это. Следующая простая симуляция демонстрирует, что эта проблема не так проста:
arr <- function(BLR,RR,p,n,nr,ce)
{
B = rep(0,nr)
for(i in 1:nr){
b <- runif(n)<p
x <- rnorm(n)
pr <- exp( log(BLR) + log(RR)*b + ce*x)
y <- runif(n)<pr
model <- glm(y ~ b + x, family=poisson)
B[i] <- coef(model)[2]
}
return( mean( exp(B), na.rm=TRUE ) )
}
set.seed(1234)
arr(.3, 2, .5, 200, 100, 0)
[1] 1.992103
arr(.3, 2, .5, 200, 100, .1)
[1] 1.980366
arr(.3, 2, .5, 200, 100, 1)
[1] 1.566326
В этом случае истинный коэффициент риска равен 2, который надежно восстанавливается, когда ковариатный эффект невелик. Но когда ковариатный эффект велик, это искажается. Я предполагаю, что это происходит потому, что ковариатный эффект может подтолкнуть верхнюю границу (1), и это загрязняет оценку.
Я посмотрел, но не нашел никакой литературы по корректировке для непрерывных ковариат в оценке скорректированного отношения риска. Мне известны следующие сообщения на этом сайте:
- Регрессия Пуассона для оценки относительного риска бинарных исходов
- Пуассоновская регрессия для двоичных данных
но они не отвечают на мой вопрос. Есть ли какие-либо документы по этому поводу? Есть ли какие-либо известные предостережения, которые следует соблюдать?
источник
Ответы:
Я не знаю, нужен ли вам еще ответ на этот вопрос, но у меня есть похожая проблема, в которой я хотел бы использовать регрессию Пуассона. При запуске вашего кода я обнаружил, что если я настрою модель как
а не как ваша модель регрессии Пуассона, получается тот же результат: предполагаемое ИЛИ составляет ~ 1,5 при приближении к 1. Итак, я не уверен, что ваш пример предоставляет информацию о возможной проблеме с использованием регрессии Пуассона для бинарных результатов.
источник
binomial(link=log)
фактическую модель относительного риска, но она редко сходится из-за непредсказуемого результата.Я считаю, что использование прямого максимального правдоподобия с надлежащей функцией вероятности значительно улучшает оценку относительного риска. Вы можете напрямую указать усеченную функцию риска в качестве прогнозируемой скорости процесса.
Обычно мы используем гессиан для создания КИ для оценки. Я не исследовал возможность использования этого в качестве матрицы «B» (мясо) в ошибке Хубера Уайта и использования установленных рисков для получения матрицы «A» (хлеб) ... но я подозреваю, что это может сработать! Более вероятно, что вы можете использовать начальную загрузку для получения ошибок модели, которые устойчивы к неверно заданному отношению средней дисперсии.
дает:
Средний коэффициент дает вам то, что вы хотите.
источник