Примеры неправильного применения теоремы Байеса

11

Этот вопрос сообщества Math Overflow, заданный для «примеров плохих аргументов, которые включают применение математических теорем в нематематическом контексте», привел к захватывающему списку патологически прикладной математики.

Я задаюсь вопросом о подобных примерах патологического использования байесовского вывода. Кто-нибудь сталкивался с научными статьями, эксцентричными постами в блогах, которые используют байесовские методы, причудливо.

Крис Брент
источник

Ответы:

3

Ага. Недавно я был нанят в качестве статистического консультанта для изучения конкретной (очень ужасной) статьи, авторам которой удалось заставить себя выглядеть еще хуже в письме в редакцию с использованием теоремы Байеса. Они начали с просчитанной положительной прогностической ценности из своей статьи (PPV = 95% предположительно). Они в основном проигнорировали критическое письмо об этом Риччи (2004), который попытался (и не смог) рассказать им, как они должны были его рассчитать (он предложил 82,3%). Затем они нашли учебник по биостатам (Elston & Johnson, 1994) и неверно процитировали его. Мы купили книгу и проверили, но, оглядываясь назад, это было так же ненужно, как я подозревал. Получите груз этого беспорядка (от ответного письма Barsness et al. Редактору):

P=P(S/D1)P(S/D1)+P(S/D2)
[p=95/(95+1.6)]98,3 процента. Используя вышеупомянутый более низкий расчет PPV, равный 82,3 процента, вероятность истинного события составляет 98,1 процента.

Видите что-нибудь странное связное здесь? Я уверен, что нет ...

  1. Это теорема Байеса, поскольку Элстон и Джонсон (1994) применяют ее к примеру наследственности гемофилии:

    P(D1|S)=P(D1)P(S|D1)P(D1)P(S|D1)+P(D2)P(S|D2)

    Расхождения говорят сами за себя, но вот цитата из их обсуждения примера:

    Тот факт, что у нее был один сын, который не пострадал, снижает вероятность того, что она унаследовала ген гемофилии, и, следовательно, вероятность того, что ее второй сын будет затронут.

    Где Барснес и его коллеги пришли к выводу, что низкая распространенность усиливает PPV, я не знаю, но они уверены, что не обращали внимания на свой собственный учебник по выбору.

  2. p1=95/(95+1.6)=98.3p2=98.3/(98.3+1.6)=98.4
    limkpk(pk1,1.6)
  3. При использовании информации об их распространенности и некоторых разумных оценок чувствительности и специфичности из других исследований по этой теме, PPV оказывается намного ниже (возможно, всего 3%). Самое смешное, что я бы даже не подумал использовать теорему Байеса, если бы они не попытались использовать ее для усиления своего довода. Это явно не получится, учитывая распространенность 1,6%.


Список литературы
· Барснесс, К.А., Ча, Е.С., Бенсард, Д.Д., Калкинс, К.М., Партрик, Д.А., Каррер, Ф.М. и Штрейн, Д.Д. (2003). Положительная прогностическая ценность переломов ребер как показатель не случайной травмы у детей. Журнал травмы-травмы, инфекции и интенсивной терапии, 54 (6), 1107–1110.
· Элстон, RC, и Джонсон, WD (1994). Основы биостатистики (2-е изд.). Филадельфия: Ф.А. Дэвис, компания.
· Риччи Л.Р. (2004). Письма в редакцию. Журнал травмы-травмы, инфекции и интенсивной терапии, 56 (3), 721.

Ник Стаунер
источник