Я заинтересован в моделировании данных бинарных ответов в парных наблюдениях. Мы стремимся сделать вывод об эффективности предварительного вмешательства в группе, потенциально адаптируясь к нескольким ковариатам и определяя, есть ли изменение эффекта в группе, которая получила особенно различную подготовку в рамках вмешательства.
Приведены данные следующего вида:
id phase resp
1 pre 1
1 post 0
2 pre 0
2 post 0
3 pre 1
3 post 0
И таблица сопряженности сопряженной информации ответа:
Нас интересует проверка гипотезы: .
Тест Макнемара дает: при (асимптотически). Это интуитивно понятно, поскольку при нулевом значении мы ожидаем, что равная доля дискордантных пар ( и ) будет благоприятствовать положительному эффекту ( ) или отрицательному эффекту ( ). С вероятностью положительного определения случая определены и . Вероятность наблюдения положительной дискордантной пары равна . H0bcbcp=b n=b+cp
С другой стороны, условная логистическая регрессия использует другой подход для проверки той же гипотезы, максимизируя условную вероятность:
где .
Итак, какова связь между этими тестами? Как можно провести простую проверку таблицы сопряженности, представленной ранее? Глядя на калибровку значений p из подходов Клогита и Макнемара под нулевым значением, можно подумать, что они совершенно не связаны!
library(survival)
n <- 100
do.one <- function(n) {
id <- rep(1:n, each=2)
ph <- rep(0:1, times=n)
rs <- rbinom(n*2, 1, 0.5)
c(
'pclogit' = coef(summary(clogit(rs ~ ph + strata(id))))[5],
'pmctest' = mcnemar.test(table(ph,rs))$p.value
)
}
out <- replicate(1000, do.one(n))
plot(t(out), main='Calibration plot of pvalues for McNemar and Clogit tests',
xlab='p-value McNemar', ylab='p-value conditional logistic regression')
источник
exact2x2
могут быть ссылками.Ответы:
Извините, это старая проблема, я с этим столкнулся случайно.
В вашем коде есть ошибка для теста mcnemar. Попробуйте с:
источник
Есть 2 конкурирующих статистических модели. Модель № 1 (нулевая гипотеза, Макнемар): вероятность от правильного до неправильного = вероятность от неправильного до правильного = 0,5 или эквивалентного b = c. Модель № 2: вероятность от правильного к неправильному <вероятность неправильного к правильному или эквивалентному b> c. Для модели № 2 мы используем метод максимального правдоподобия и логистическую регрессию для определения параметров модели, представляющих модель 2. Статистические методы выглядят по-разному, потому что каждый метод отражает свою модель.
источник