На днях у меня была консультация с эпидемиологом. Она является доктором медицины, имеет степень общественного здравоохранения в области эпидемиологии и обладает большим статистическим опытом. Она наставляет своих научных сотрудников и жителей и помогает им в статистических вопросах. Она хорошо понимает проверку гипотез. У нее была типичная проблема сравнения двух групп, чтобы увидеть, есть ли разница в риске, связанном с застойной сердечной недостаточностью (ЗСН). Она проверила среднюю разницу в пропорции субъектов, получающих ЗСН. Значение р было 0,08. Затем она также решила посмотреть на относительный риск и получила значение р 0,027. Поэтому она спросила, почему одно значимо, а другое нет. Посмотрев на 95% двусторонние доверительные интервалы для разности и для отношения, она увидела, что средний интервал разности содержал 0, но верхний доверительный предел для отношения был меньше 1. Так почему же мы получаем противоречивые результаты. Мой ответ, хотя технически правильный, был не очень удовлетворительным. Я сказал: «Это разные статистические данные, которые могут давать разные результаты. Значения р находятся в области незначительного значения. Это может легко произойти». Я думаю, что должны быть лучшие способы ответить на этот вопрос с точки зрения неспециалистов врачам, чтобы помочь им понять разницу между тестированием относительного риска и абсолютного риска. В исследованиях epi эта проблема часто возникает, потому что они часто смотрят на редкие события, в которых показатели заболеваемости для обеих групп очень малы, а размеры выборки не очень велики. Я немного подумал об этом и у меня есть некоторые идеи, которыми я поделюсь. Но сначала я хотел бы услышать, как некоторые из вас справятся с этим. Я знаю, что многие из вас работают или консультируются в области медицины и, вероятно, сталкивались с этой проблемой. Что бы вы сделали?
источник
Ответы:
Ну, из того, что вы уже сказали, я думаю, что вы охватили большую часть этого, но просто нужно изложить это на ее языке: один - это разница рисков, другой - соотношение. Таким образом, один тест гипотезы спрашивает, если а другой спрашивает, если . Иногда это "близко", иногда нет. (Закрыть в кавычках, потому что они явно не близки в обычном арифметическом смысле). Если риск редок, они, как правило, "далеко друг от друга". например (далеко от 1), а (близко к 0); но если риск высок, то это «близко»: (далеко от 0) и (также далеко от 0, по крайней мере по сравнению с редким случаем.п2- р1= 0 п2п1= 1 .002/.001=2 .002−.001=.001 .2/.1=2 .2−.1=.1
источник
Помните, что в обоих тестах вы проверяете совершенно разные гипотезы с разными предположениями. Результаты несопоставимы, и это слишком распространенная ошибка.
В абсолютном риске вы проверяете, отличается ли (средняя) разница в пропорции от нуля. Основная гипотеза в стандартном тесте для этого предполагает, что различия в пропорции обычно распределяются. Это может иметь место для небольших пропорций, но не для больших. Технически вы рассчитываете следующую условную вероятность:
с и две пропорции, а ваша объясняющая переменная. Это эквивалентно тестированию наклона следующей модели:p1 p2 X b
где вы предполагаете, что .ϵ∼N(0,σ)
В относительном риске вы делаете что-то совершенно другое. Вы проверить шансы иметь положительный результат , основанный на объясняющей переменной . Итак, вы рассчитываетеX
что эквивалентно тестированию наклона в следующей логистической модели:
с является журналом шансов. Обратите внимание, что эта гипотеза сформулирована в терминах шансов, а не пропорций! Таким образом, предположения модели также сформулированы в терминах шансов (или, точнее, логарифм шансов). Вы проверяете другую гипотезу.log(p1−p)
Причина, по которой это имеет значение, приведена в ответе Питера Флома: небольшая разница в абсолютных рисках может привести к большому значению шансов. Таким образом, в вашем случае это означает, что доля людей, заболевших этим заболеванием, существенно не отличается, но шансы оказаться в одной группе значительно выше, чем шансы оказаться в другой группе. Это совершенно разумно.
источник
prop.test
(или,chisq.test
как это эквивалентно в случае 2x2) иfisher.test
быть более 0,005 друг от друга. Поэтому мне интересно, какие тесты она использовала ...