Как вы объясните разницу между относительным риском и абсолютным риском?

На днях у меня была консультация с эпидемиологом. Она является доктором медицины, имеет степень общественного здравоохранения в области эпидемиологии и обладает большим статистическим опытом. Она наставляет своих научных сотрудников и жителей и помогает им в статистических вопросах. Она хорошо понимает проверку гипотез. У нее была типичная проблема сравнения двух групп, чтобы увидеть, есть ли разница в риске, связанном с застойной сердечной недостаточностью (ЗСН). Она проверила среднюю разницу в пропорции субъектов, получающих ЗСН. Значение р было 0,08. Затем она также решила посмотреть на относительный риск и получила значение р 0,027. Поэтому она спросила, почему одно значимо, а другое нет. Посмотрев на 95% двусторонние доверительные интервалы для разности и для отношения, она увидела, что средний интервал разности содержал 0, но верхний доверительный предел для отношения был меньше 1. Так почему же мы получаем противоречивые результаты. Мой ответ, хотя технически правильный, был не очень удовлетворительным. Я сказал: «Это разные статистические данные, которые могут давать разные результаты. Значения р находятся в области незначительного значения. Это может легко произойти». Я думаю, что должны быть лучшие способы ответить на этот вопрос с точки зрения неспециалистов врачам, чтобы помочь им понять разницу между тестированием относительного риска и абсолютного риска. В исследованиях epi эта проблема часто возникает, потому что они часто смотрят на редкие события, в которых показатели заболеваемости для обеих групп очень малы, а размеры выборки не очень велики. Я немного подумал об этом и у меня есть некоторые идеи, которыми я поделюсь. Но сначала я хотел бы услышать, как некоторые из вас справятся с этим. Я знаю, что многие из вас работают или консультируются в области медицины и, вероятно, сталкивались с этой проблемой. Что бы вы сделали?

relative-risk absolute-risk rare-events Майкл Р. Черник
источник

Включают ли модели другие ковариаты помимо группового эффекта?

OneStop

@onestop Есть ковариаты, которые они интересуются, но фактический тест сравнивал только основной эффект. Если вы хотите прокомментировать, предположив, что тест был основан на регрессионной модели или событии, предположим, что у нас было время собрать данные события, чтобы соответствовать регрессионной модели Кокса, не стесняйтесь комментировать. Я хотел бы услышать ваши идеи. Мой вопрос адресован общей проблеме, а не только конкретному примеру.

Майкл Р. Черник

Я имел в виду, был ли тест, сравнивающий основной (групповой) эффект с поправкой на ковариаты, или нескорректированным? Если они не скорректированы, то может быть полезно дать нам таблицу 2 × 2 или аналогичную, чтобы сосредоточить идеи.

Одна остановка

Не скорректированы для этих конкретных испытаний.

Майкл Р. Черник

Ответы:

Ну, из того, что вы уже сказали, я думаю, что вы охватили большую часть этого, но просто нужно изложить это на ее языке: один - это разница рисков, другой - соотношение. Таким образом, один тест гипотезы спрашивает, если а другой спрашивает, если . Иногда это "близко", иногда нет. (Закрыть в кавычках, потому что они явно не близки в обычном арифметическом смысле). Если риск редок, они, как правило, "далеко друг от друга". например (далеко от 1), а (близко к 0); но если риск высок, то это «близко»: (далеко от 0) и (также далеко от 0, по крайней мере по сравнению с редким случаем. $p_2 - p_1 = 0$ $\frac{p_2}{p_1} = 1$ $.002/.001 = 2$ $.002-.001 = .001$ $.2/.1 = 2$ $.2 - .1 = .1$

Питер Флом - Восстановить Монику
источник

У вас есть одна из моих идей, когда число невелико, что характерно для изучения различий с низким уровнем заболеваемости, но они выглядят небольшими, а коэффициенты все еще выглядят большими. Ваш числовой пример очень убедителен. Я испытываю желание добавить кое-что о стабильности оценок при нулевой гипотезе. Для некоторых это может быть слишком техническим, но на ее уровне сложности, возможно, нет. Предположим, что две популяции имеют номинальное распределение, означающее ноль и известную общую дисперсию. Тогда нормализованная разница N (0,1) при нулевой гипотезе дает очень стабильную статистику теста.

Майкл Р. Черник

Но при этих допущениях отношение имеет распределение Коши и может быть очень большим. Возможно, этот аргумент нуждается в модификации, поскольку показатели заболеваемости должны быть положительными и, возможно, распределение очень искажено. Я предполагаю, что мне нужен пример, показывающий, что разница имеет очень стабильное распределение, а соотношение не особенно, потому что размер выборки мал, а знаменатель может быть очень близок к 0. У кого-нибудь есть хороший иллюстративный пример?

Майкл Р. Черник

@Peter вы имели в виду , чтобы написать три ы не два? Если да, то можете ли вы определить свою запись?

p_{i}

$p_i$

августа

Я думаю, что он имел в виду p1, когда писал p0. Просто основная ошибка. Наличие трех пс в этом контексте не имеет смысла.

Майкл Р. Черник

Я сделал изменения для Питера. Кричи на меня, если я сделал что-то не так!

Майкл Р. Черник

Помните, что в обоих тестах вы проверяете совершенно разные гипотезы с разными предположениями. Результаты несопоставимы, и это слишком распространенная ошибка.

В абсолютном риске вы проверяете, отличается ли (средняя) разница в пропорции от нуля. Основная гипотеза в стандартном тесте для этого предполагает, что различия в пропорции обычно распределяются. Это может иметь место для небольших пропорций, но не для больших. Технически вы рассчитываете следующую условную вероятность:

$P( p1 - p2 = 0 | X )$

с и две пропорции, а ваша объясняющая переменная. Это эквивалентно тестированию наклона следующей модели: $p1$ $p2$ $X$ $b$

$p = a + b*X + \epsilon$

где вы предполагаете, что . $\epsilon \sim N(0,\sigma)$

В относительном риске вы делаете что-то совершенно другое. Вы проверить шансы иметь положительный результат , основанный на объясняющей переменной . Итак, вы рассчитываете $X$

$P( log(\frac{p1}{p2}) = 0 | X )$

что эквивалентно тестированию наклона в следующей логистической модели:

$log(\frac{p}{1-p}) = a + b*X + \epsilon$

с является журналом шансов. Обратите внимание, что эта гипотеза сформулирована в терминах шансов, а не пропорций! Таким образом, предположения модели также сформулированы в терминах шансов (или, точнее, логарифм шансов). Вы проверяете другую гипотезу. $log(\frac{p}{1-p})$

Причина, по которой это имеет значение, приведена в ответе Питера Флома: небольшая разница в абсолютных рисках может привести к большому значению шансов. Таким образом, в вашем случае это означает, что доля людей, заболевших этим заболеванием, существенно не отличается, но шансы оказаться в одной группе значительно выше, чем шансы оказаться в другой группе. Это совершенно разумно.

Йорис Мейс
источник

Я думаю, что все мы до сих пор согласны с тем, что главная причина проблемы заключается в том, что небольшие различия в абсолютном риске могут привести к большим различиям в относительном риске. В конце концов .2 к 1 имеет тот же относительный риск как 0,0002 к 0,0001. Я думаю, что это послание, которое мы можем донести до мирянина. Ваше объяснение отлично подходит для статистиков, но я не уверен, что это может быть легко понято непрофессионалом, и можно сказать: «А что, если вы проверяете другую гипотезу?»

Майкл Р. Черник,

Вы все еще пытаетесь определить, где тарифы отличаются. Таким образом, даже если гипотезы разные, результаты должны быть последовательными. В конце концов, p1-p2 = 0 - это то же самое, что и p1 / p2 = 1. «Поэтому я думаю, что тот факт, что гипотезы разные, не соответствует действительности и не является удовлетворительным объяснением.

Michael R. Chernick

@MichaelChernick Я собирался сказать, что различия в пропорциях условны, а соотношение шансов - нет. Но это не так, оба дают точно такой же результат после транспонирования таблицы (в случае таблицы 2X2). Я проводил некоторые симуляции, но я не могу форсировать p-значения prop.test(или, chisq.testкак это эквивалентно в случае 2x2) и fisher.testбыть более 0,005 друг от друга. Поэтому мне интересно, какие тесты она использовала ...

Йорис Мейс

Это будет либо ци чери, либо тест Фишера. Скорее всего, тест Фишера, потому что она знает в небольших выборках, что аппроксимация хи-квадрат не является хорошей. Когда я делаю статистику для них, я использую SAS. Она сделала свою работу с использованием STATA. Я, вероятно, могу выкопать фактическую таблицу.

Майкл Р. Черник

Еще одно соображение, так как мы входим в это: который явно отличается от и более точно отличается, когда p малы, то есть риск невелик Но я пытался сохранить свой первый ответ как можно скорее (это настолько просто, насколько это возможно!)

l o g (\frac{p_{1}}{p_{0}}) = l o g (p_{1}) - l o g (p_{0})

$log(\frac{p_1}{p_0}) = log(p_1)-log(p_0)$

p_{1} - p_{0}

$p_1 - p_0$

Питер Флом - Восстановить Монику