Я проверяю независимость двух переменных, A и B, стратифицированных по C. A и B являются двоичными переменными, а C является категориальным (5 значений). Выполняя точный тест Фишера для A и B (все слои объединены), я получаю:
## (B)
## (A) FALSE TRUE
## FALSE 1841 85
## TRUE 915 74
OR: 1.75 (1.25 -- 2.44), p = 0.0007 *
где ИЛИ - отношение шансов (оценка и 95% доверительный интервал), и *
означает, что р <0,05.
Запустив один и тот же тест для каждого слоя (C), я получаю:
C=1, OR: 2.31 (0.78 -- 6.13), p = 0.0815
C=2, OR: 2.75 (1.21 -- 6.15), p = 0.0088 *
C=3, OR: 0.94 (0.50 -- 1.74), p = 0.8839
C=4, OR: 1.48 (0.77 -- 2.89), p = 0.2196
C=5, OR: 3.38 (0.62 -- 34.11), p = 0.1731
Наконец, запустив тест Cochran-Mantel-Haenszel (CMH), используя A, B и C, я получаю:
OR: 1.56 (1.12 -- 2.18), p = 0.0089 *
Результат теста CMH позволяет предположить, что А и В не являются независимыми в каждом слое (р <0,05); тем не менее, большинство внутрипластовых тестов были несущественными, что предполагает, что у нас нет достаточных доказательств, чтобы отказаться от того, что А и В независимы в каждом слое.
Итак, какой вывод правильный? Как сообщить о заключении с учетом этих результатов? Можно ли считать C смешанной переменной или нет?
РЕДАКТИРОВАТЬ: я выполнил тест Breslow-Day для нулевой гипотезы, что отношение шансов является одинаковым для всех слоев, и р-значение было 0,1424.
Ответы:
Первый тест говорит вам, что отношение шансов между A и B, игнорируя C, отличается от 1. Глядя на стратифицированный анализ, вы можете решить, можно ли игнорировать C.
Тест CMH показывает, что отношение шансов между A и B с поправкой на C отличается от единицы. Он возвращает средневзвешенное значение коэффициентов шансов, характерных для страты, поэтому, если они равны в одних слоях и в других, они могут отменить и ошибочно сказать, что между А и В нет никакой связи. Поэтому мы должны проверить, разумно предположить, что отношения шансов одинаковы (на уровне популяции) на всех уровнях C. Тест взаимодействия Бреслоу-Дэй делает именно это, с нулевой гипотезой, что все страты имеют одинаковое отношение шансов, что требует не быть равным одному. Этот тест реализован в пакете EpiR R. Значение p по Бреслоу-Дню, равное .14, означает, что мы можем сделать это предположение, поэтому скорректированное соотношение шансов является законным.<1 >1
Но это не помогает нам выбирать между CMH и точными (или ) тестами Фишера . Если бы критерий Бреслоу-Дей был значительным, вам нужно было бы сообщить коэффициенты шансов для конкретного слоя. Поскольку это не так, вам нужно спросить, нужно ли настраивать на C. С "смешивает" ли C связь между A и B? Эвристика, которую я выучил (не статистический тест), состояла в том, чтобы проверить, превышает ли пропорциональная разница между нескорректированным и скорректированным коэффициентами шансов более 10%. Здесь поэтому CMH подходит.χ2 1.75−1.561.75=0.108
источник