Я пытаюсь обернуть голову вокруг результата теоремы Байеса, примененного к классическому примеру маммографии, с идеальным поворотом маммограммы.
Это,
Заболеваемость раком:
Вероятность положительной маммографии у пациента с раком:
Вероятность положительной маммографии, учитывая, что пациент не имеет рака:
Байес:
P (рак | маммография +) =
Таким образом, если случайный человек из популяции забирает маммографию и получает положительный результат, есть ли 50% вероятность того, что у него рак? Мне не удается интуитивно понять, как крошечный 1% шанс ложного срабатывания у 1% населения может вызвать 50% результат. Логично, что я думаю, что абсолютно истинно положительная маммография с крошечным ложным положительным показателем была бы намного более точной.
Ответы:
Я отвечу на этот вопрос как с медицинской, так и с статистической точки зрения. Он привлек много внимания в светской прессе, особенно после бестселлера «Сигнал и шум Нейта Сильвера», а также в ряде статей в таких публикациях, как «Нью-Йорк Таймс», в которых объясняется эта концепция. Поэтому я очень рад, что @ user2666425 открыл эту тему в резюме.
Прежде всего, позвольте мне уточнить, что не является точным. Я могу вам сказать, что эта цифра станет мечтой. К сожалению, существует многоложноотрицательныхмаммограмм, особенно у женщин с плотной тканью молочной железы. Расчетная цифра может составлять 20 % или выше, в зависимости от того, объединяете ли вы все различные виды рака молочной железы в один (инвазивный и DCIS), и другие факторы. Это причина, по которой также применяются другие методы, основанные на технологии сонографии или МРТ. Разница между 0,8 и 1 является критической в скрининговом тесте.п( + | C) = 1 20 % 0.8 1
Теорема Байеса говорит нам, что , и в последнее время большое внимание уделяется маммографииу молодых женщин с низким риском. Я понимаю, что это не совсем то, о чем вы спрашиваете, о чем я говорю в последних параграфах, но это самая обсуждаемая тема. Вот вкус вопросов:p ( C| +)= p ( + | C)р ( + )∗ p ( C)
До (или вероятность наличия рака , основанный на распространенности) в более молодых пациентов, скажем , от 40 - 50 лет , довольно мало. В соответствии с NCI было бы можно окружить его вверх на (смотри таблицу ниже). Эта относительно низкая вероятность до теста сама по себе снижает условную вероятность возникновения рака после теста, учитывая, что маммография была положительной, независимо от вероятности или собранных данных.∼ 1,5 %
Вероятность ложного срабатывания становится очень важной проблемой при процедуре скрининга, которая будет применяться к тысячам и тысячам априори здоровых женщин. Таким образом, хотя уровень ложных срабатываний составляет (что намного выше, если сосредоточиться на совокупном риске7 - 10 % ) может показаться не так уж плохо, это на самом деле вопрос о колоссальных психологических и экономических затрат, особенно учитывая низкий предварительный тест вероятность у молодых пациентов с низким риском. Ваша цифра в совершенно не соответствует действительности - реальность такова, что «паники» невероятно распространены из-за многих факторов, включая судебно-медицинские проблемы.1 %
Итак, пересчитываем и очень важно, для молодых женщин без факторов риска :
.= p ( + | C)p ( + | C)*p ( C)+p ( + | C¯)*p ( C¯)∗ p ( C) = 0,80,8 ∗ 0,015+0,07 * 0,985*0,015 = 0,148
Вероятность заболеть раком, если скрининговая маммография считалась положительной, может быть такой низкой, как у молодых женщин с низким риском. Кроме того, маммографические показания идут с косвенной оценкой достоверности диагноза, который есть у рентгенолога (он называется BI-RADS), и этот байесовский анализ радикально изменится, когда мы перейдем от BI-RADS 3 к BI-RADS. 5 - все они «положительные» тесты в широком смысле.15 %
Эта цифра логически может быть изменена в зависимости от того, какие оценки вы учитываете в своих расчетах, но правда в том, что рекомендации для начального возраста для участия в программе скрининговой маммографии недавно были повышены с до 45 лет40 45 .
У пожилых женщин распространенность (и, следовательно, вероятность до теста) линейно увеличивается с возрастом. Согласно текущему отчету, риск того, что женщина будет диагностирована с раком молочной железы в течение следующих 10 лет , начиная с следующих возрастов, является следующим:
Это приводит к совокупному риску в течение жизни примерно :10 %
Расчет для пожилых женщин с распространенностью будет:4 %
Конкретный ответ на ваш вопрос:
Проблема с интуицией : @Juho Kokkala поднял вопрос, который ОП спрашивал об интуиции . Я думал, что это подразумевалось в расчетах и заключительных параграфах, но достаточно справедливо ... Вот как я объясню это другу ... Давайте представим, что мы собираемся охотиться на фрагменты метеоров с помощью металлоискателя в Уинслоу, Аризона. Прямо здесь:
Изображение с meteorcrater.com
... и металлоискатель гаснет. Ну, если бы вы сказали, что есть вероятность, что из монеты, которую выпал турист, вы, вероятно, были бы правы. Но вы понимаете, в чем суть: если бы место не было подвергнуто такой тщательной проверке, было бы гораздо более вероятно, что звуковой сигнал от детектора в таком месте раздался из фрагмента метеора, чем если бы мы были на улицах Нью-Йорка.
То, что мы делаем с маммографией, направлено на здоровую популяцию, которая ищет тихую болезнь, которая, если ее не поймать рано, может быть смертельной. К счастью, распространенность (хотя и очень высокая по сравнению с другими менее излечимыми формами рака) достаточно низка, чтобы вероятность случайного столкновения с раком была низкой, даже если результаты были «положительными» , особенно среди молодых женщин.
Поскольку у нас никогда не было абсолютно точного измерительного устройства или системы, фракциивероятностьбезусловное р (+)= p ( + | C)p ( + | C)*p ( C)+p ( + | C¯)*p ( C¯) < 1 p ( C) задний = α ∗ предыдущий задний < предыдущий распространенности из : вероятность того, что субъекты с положительным скрининговым тестом действительно имеют заболевание.
источник
Ключевой проблемой маммографии, которая не была должным образом рассмотрена в дискурсе, является ошибочное определение «положительного». Это описано в главе « Диагностика» в http://biostat.mc.vanderbilt.edu/ClinStat - см. Ссылку на Биостатистику в биомедицинских исследованиях .
Одна из наиболее широко используемых диагностических систем кодирования в маммографии - это оценка BI-RADS, а оценка 4 является частым «положительным» результатом. Определение категории 4: «Не характерно для рака молочной железы, но разумная вероятность быть злокачественной (от 3 до 94%); биопсия должна быть рассмотрена». С диапазоном риска от 0,03 до 0,94 для одной категории , то есть невероятной неоднородности в том, что на самом деле означает «позитивный», неудивительно, что у нас в руках беспорядок.
Это также признак неясного мнения о том, что в системе BI-RADS нет категории для человека с предполагаемым риском 0,945.
Как красноречиво утверждает Нейт Сильвер в «Сигнале и шуме» , если бы мы могли мыслить вероятностно, мы бы приняли более правильные решения. Удаление таких терминов, как «положительный» и «отрицательный» для медицинских тестов, удаляло бы ложные положительные и ложные отрицательные значения и передавало неопределенность (и оправдание для дополнительных испытаний перед постановкой диагноза) оптимальным образом.
источник
Это хорошее обсуждение в книге Расчетные риски».
Большая часть книги посвящена поиску более ясных способов говорить и думать о вероятности и риске. Пример:
Вероятность того, что женщина в возрасте 40 лет имеет рак молочной железы, составляет около 1 процента. Если у нее рак молочной железы, вероятность того, что она получит положительный результат на маммограмме, составляет около 90 процентов. Если у нее нет рака молочной железы, вероятность того, что она тем не менее даст положительный результат, составляет 9 процентов. Каковы шансы, что у женщины с положительным тестом на самом деле рак молочной железы?
Так книга представляет решение, используя «собственные частоты». Рассмотрим 10000 женщин, 1% имеют рак, то есть 100 женщин. Из них 90% дадут положительные результаты теста (т.е. 90 женщин с раком получат положительный результат). Из 9900 без рака 9% вернут положительный тест или 891 женщина. Таким образом, есть 891 + 90 = 981 женщина с положительными пробами, из которых 90 имеют рак. Таким образом, вероятность того, что у женщины с положительным тестом рак, составляет 90/981 = 0,092.
Если у 100% женщин с диагнозом рак положительный, то просто немного меняет цифры на 100 / (100 + 891) = 0,1
источник
Возможно, такое мышление правильно?
источник
Вот упрощенный, но интуитивно понятный способ взглянуть на это. Рассмотрим 100 человек. Один имеет рак и будет положительный результат. Из 99, кто этого не делает, один из них получит ложный положительный тест. Итак, из двух положительных результатов у одного будет рак, а у другого нет.
источник