Интерпретация теоремы Байеса применительно к положительным результатам маммографии

11

Я пытаюсь обернуть голову вокруг результата теоремы Байеса, примененного к классическому примеру маммографии, с идеальным поворотом маммограммы.

Это,

Заболеваемость раком:.01

Вероятность положительной маммографии у пациента с раком:1

Вероятность положительной маммографии, учитывая, что пациент не имеет рака:.01

Байес:

P (рак | маммография +) =1.01(1.01)+(.091.99)

=.5025

Таким образом, если случайный человек из популяции забирает маммографию и получает положительный результат, есть ли 50% вероятность того, что у него рак? Мне не удается интуитивно понять, как крошечный 1% шанс ложного срабатывания у 1% населения может вызвать 50% результат. Логично, что я думаю, что абсолютно истинно положительная маммография с крошечным ложным положительным показателем была бы намного более точной.

user2666425
источник
2
Ложноположительный показатель составляет не 1%, а 99% населения. Вот почему вы получаете вероятность, которая может показаться низкой из-за очень высокой вероятности того, что кто-то здоров. Также имейте в виду, что это только один тест, что произойдет, если вы пройдете тест более одного раза? Тогда точность теста начинает иметь большее значение.
dsaxton
Если это совершенная маммограмма, то частота ложных срабатываний будет равна нулю, а затем p (C | M) = 1 * 0,01 / (1 * 0,01 + 0 * 0,99) = 1,0. При приближении ложных положительных результатов маммографии perfection (0), тогда второй член снизу приближается к нулю. «Крошечный» уровень ложных срабатываний в сочетании с такой же крошечной базовой ставкой дает противоречивый результат.
Дэйв Икс
Между тем, мой опыт показывает, что логика формального дедуктивного типа - это замечательная вещь, но она порождает крайне плохие представления о вероятностном выводе. Инструменты здесь bmj.com/content/343/bmj.d6386 могут помочь вашей интуиции.
сопряженный
В моем понимании вопрос состоит в том, чтобы спросить интуицию о том, как условная вероятность может быть настолько низкой, учитывая предположения; не о реальной статистике маммографии в реальной жизни (о чем, кажется, ответы).
Юхо Коккала
Я думаю, что в знаменателе есть опечатка (2-й член должен быть (0,01 * 0,99)? Результат правильный, хотя. Не совсем интуиция, но упрощение у вас есть P (C | +) = P (C) / (P (C)) + (P (+ |! C) P (! C)) и P (C) очень низок. Поэтому P (C | +) чрезвычайно чувствителен к P (+ |! C), то есть вам понадобится P ( + |! C) << P (C), чтобы P (C | +) приблизился к 1
Дэвид Уотерворт

Ответы:

11

Я отвечу на этот вопрос как с медицинской, так и с статистической точки зрения. Он привлек много внимания в светской прессе, особенно после бестселлера «Сигнал и шум Нейта Сильвера», а также в ряде статей в таких публикациях, как «Нью-Йорк Таймс», в которых объясняется эта концепция. Поэтому я очень рад, что @ user2666425 открыл эту тему в резюме.

Прежде всего, позвольте мне уточнить, что не является точным. Я могу вам сказать, что эта цифра станет мечтой. К сожалению, существует многоложноотрицательныхмаммограмм, особенно у женщин с плотной тканью молочной железы. Расчетная цифра может составлять 20 % или выше, в зависимости от того, объединяете ли вы все различные виды рака молочной железы в один (инвазивный и DCIS), и другие факторы. Это причина, по которой также применяются другие методы, основанные на технологии сонографии или МРТ. Разница между 0,8 и 1 является критической в ​​скрининговом тесте.п(+|С)знак равно120%0.81

Теорема Байеса говорит нам, что , и в последнее время большое внимание уделяется маммографииу молодых женщин с низким риском. Я понимаю, что это не совсем то, о чем вы спрашиваете, о чем я говорю в последних параграфах, но это самая обсуждаемая тема. Вот вкус вопросов:п(С|+)знак равноп(+|С)п(+)*п(С)

  1. До (или вероятность наличия рака , основанный на распространенности) в более молодых пациентов, скажем , от 40 - 50 лет , довольно мало. В соответствии с NCI было бы можно окружить его вверх на (смотри таблицу ниже). Эта относительно низкая вероятность до теста сама по себе снижает условную вероятность возникновения рака после теста, учитывая, что маммография была положительной, независимо от вероятности или собранных данных.~1,5%

  2. Вероятность ложного срабатывания становится очень важной проблемой при процедуре скрининга, которая будет применяться к тысячам и тысячам априори здоровых женщин. Таким образом, хотя уровень ложных срабатываний составляет (что намного выше, если сосредоточиться на совокупном риске7-10% ) может показаться не так уж плохо, это на самом деле вопрос о колоссальных психологических и экономических затрат, особенно учитывая низкий предварительный тест вероятность у молодых пациентов с низким риском. Ваша цифра в совершенно не соответствует действительности - реальность такова, что «паники» невероятно распространены из-за многих факторов, включая судебно-медицинские проблемы.1%

Итак, пересчитываем и очень важно, для молодых женщин без факторов риска :

п(С|+)знак равноп(+|С)п(+)*п(С)знак равно

.знак равноп(+|С)п(+|С)*п(С)+п(+|С¯)*п(С¯)*п(С)знак равно0.80.8*0,015+0,07*0,985*0,015знак равно0,148

Вероятность заболеть раком, если скрининговая маммография считалась положительной, может быть такой низкой, как у молодых женщин с низким риском. Кроме того, маммографические показания идут с косвенной оценкой достоверности диагноза, который есть у рентгенолога (он называется BI-RADS), и этот байесовский анализ радикально изменится, когда мы перейдем от BI-RADS 3 к BI-RADS. 5 - все они «положительные» тесты в широком смысле.15%

Эта цифра логически может быть изменена в зависимости от того, какие оценки вы учитываете в своих расчетах, но правда в том, что рекомендации для начального возраста для участия в программе скрининговой маммографии недавно были повышены с до 45 лет4045 .

У пожилых женщин распространенность (и, следовательно, вероятность до теста) линейно увеличивается с возрастом. Согласно текущему отчету, риск того, что женщина будет диагностирована с раком молочной железы в течение следующих 10 лет , начиная с следующих возрастов, является следующим:

Age 30 . . . . . . 0.44 percent (or 1 in 227)
Age 40 . . . . . . 1.47 percent (or 1 in 68)
Age 50 . . . . . . 2.38 percent (or 1 in 42)
Age 60 . . . . . . 3.56 percent (or 1 in 28)
Age 70 . . . . . . 3.82 percent (or 1 in 26)

Это приводит к совокупному риску в течение жизни примерно :10%

Расчет для пожилых женщин с распространенностью будет:4%

п(С|+)знак равно0.80.8*0.04+0,07*0,96*0.04знак равно0,32~32% ниже, чем вы рассчитывали.

п(С|+)

Конкретный ответ на ваш вопрос:

п(+|С¯)7-10%1%п(С¯) ) особенно у более молодых женщин, что объясняет эту более низкую вероятность после теста в возрасте.Обратите внимание, что эта «частота ложных тревог» умножается на гораздо большую долю случаев без рака (по сравнению с больными раком) в знаменателе, а не на «крошечный 1% шанс ложного срабатывания в 1% населения», который вы упомянуть. Я считаю, что это ответ на ваш вопрос. Подчеркнем, что, хотя это было бы неприемлемо в диагностическом тесте, оно все же стоит в процедуре скрининга.

Проблема с интуицией : @Juho Kokkala поднял вопрос, который ОП спрашивал об интуиции . Я думал, что это подразумевалось в расчетах и ​​заключительных параграфах, но достаточно справедливо ... Вот как я объясню это другу ... Давайте представим, что мы собираемся охотиться на фрагменты метеоров с помощью металлоискателя в Уинслоу, Аризона. Прямо здесь:

Изображение с meteorcrater.com

... и металлоискатель гаснет. Ну, если бы вы сказали, что есть вероятность, что из монеты, которую выпал турист, вы, вероятно, были бы правы. Но вы понимаете, в чем суть: если бы место не было подвергнуто такой тщательной проверке, было бы гораздо более вероятно, что звуковой сигнал от детектора в таком месте раздался из фрагмента метеора, чем если бы мы были на улицах Нью-Йорка.

То, что мы делаем с маммографией, направлено на здоровую популяцию, которая ищет тихую болезнь, которая, если ее не поймать рано, может быть смертельной. К счастью, распространенность (хотя и очень высокая по сравнению с другими менее излечимыми формами рака) достаточно низка, чтобы вероятность случайного столкновения с раком была низкой, даже если результаты были «положительными» , особенно среди молодых женщин.

п(С¯|+)знак равно0

п(+|С)п(+|С)*п(С)+п(+|С¯)*п(С¯)*п(С)знак равноп(+|С)п(+|С)*п(С)*п(С)знак равно1100% детектор издаст звуковой сигнал, мы узнаем, что нашли метеор.

Поскольку у нас никогда не было абсолютно точного измерительного устройства или системы, фракциивероятностьбезусловное р (+)знак равноп(+|С)п(+|С)*п(С)+п(+|С¯)*п(С¯)<1п(С)заднийзнак равноα*предшествующийзадний<предшествующий распространенности из : вероятность того, что субъекты с положительным скрининговым тестом действительно имеют заболевание.

Антони Пареллада
источник
5

Ключевой проблемой маммографии, которая не была должным образом рассмотрена в дискурсе, является ошибочное определение «положительного». Это описано в главе « Диагностика» в http://biostat.mc.vanderbilt.edu/ClinStat - см. Ссылку на Биостатистику в биомедицинских исследованиях .

Одна из наиболее широко используемых диагностических систем кодирования в маммографии - это оценка BI-RADS, а оценка 4 является частым «положительным» результатом. Определение категории 4: «Не характерно для рака молочной железы, но разумная вероятность быть злокачественной (от 3 до 94%); биопсия должна быть рассмотрена». С диапазоном риска от 0,03 до 0,94 для одной категории , то есть невероятной неоднородности в том, что на самом деле означает «позитивный», неудивительно, что у нас в руках беспорядок.

Это также признак неясного мнения о том, что в системе BI-RADS нет категории для человека с предполагаемым риском 0,945.

Как красноречиво утверждает Нейт Сильвер в «Сигнале и шуме» , если бы мы могли мыслить вероятностно, мы бы приняли более правильные решения. Удаление таких терминов, как «положительный» и «отрицательный» для медицинских тестов, удаляло бы ложные положительные и ложные отрицательные значения и передавало неопределенность (и оправдание для дополнительных испытаний перед постановкой диагноза) оптимальным образом.

Фрэнк Харрелл
источник
Мы писали в практической синхронизации - проверьте мои комментарии ниже о BI-RADS. Я не мог согласиться больше (тонны личного опыта по этому вопросу в качестве радиолога).
Антони Пареллада
3

Это хорошее обсуждение в книге Расчетные риски».

Большая часть книги посвящена поиску более ясных способов говорить и думать о вероятности и риске. Пример:

Вероятность того, что женщина в возрасте 40 лет имеет рак молочной железы, составляет около 1 процента. Если у нее рак молочной железы, вероятность того, что она получит положительный результат на маммограмме, составляет около 90 процентов. Если у нее нет рака молочной железы, вероятность того, что она тем не менее даст положительный результат, составляет 9 процентов. Каковы шансы, что у женщины с положительным тестом на самом деле рак молочной железы?

Так книга представляет решение, используя «собственные частоты». Рассмотрим 10000 женщин, 1% имеют рак, то есть 100 женщин. Из них 90% дадут положительные результаты теста (т.е. 90 женщин с раком получат положительный результат). Из 9900 без рака 9% вернут положительный тест или 891 женщина. Таким образом, есть 891 + 90 = 981 женщина с положительными пробами, из которых 90 имеют рак. Таким образом, вероятность того, что у женщины с положительным тестом рак, составляет 90/981 = 0,092.

Если у 100% женщин с диагнозом рак положительный, то просто немного меняет цифры на 100 / (100 + 891) = 0,1

Естественный частотный подход к пониманию ложных срабатываний

Тони Ладсон
источник
1

Возможно, такое мышление правильно?

+0,01*1 вероятность что маммограмма случайного человека будет положительной. Если у них нет рака, есть вероятность 1%, что маммография будет положительной.

0,0025

user2666425
источник
1

Вот упрощенный, но интуитивно понятный способ взглянуть на это. Рассмотрим 100 человек. Один имеет рак и будет положительный результат. Из 99, кто этого не делает, один из них получит ложный положительный тест. Итак, из двух положительных результатов у одного будет рак, а у другого нет.

Эмиль Фридман
источник