Доверительный интервал и вероятность - где ошибка в этом утверждении?

11

Если кто-то делает заявление, как показано ниже:

«В целом, некурящие, подвергшиеся воздействию окружающего дыма, имели относительный риск развития ишемической болезни сердца 1,25 (95-процентный доверительный интервал, 1,17-1,32) по сравнению с некурящими, не подвергавшимися воздействию дыма».

Каков относительный риск для населения в целом? Сколько вещей связано с ишемической болезнью сердца? Из огромного количества вещей, которые можно протестировать, очень немногие на самом деле связаны с ишемической болезнью сердца, поэтому вероятность того, что какая-то конкретная вещь была выбрана случайно, исчезающе мала. Таким образом, мы можем сказать, что относительный риск для населения равен 1. Но указанный интервал не содержит значения 1. Таким образом, либо есть какая-то связь между двумя вещами, вероятность которой исчезающе мала, либо это одно из 5% интервалов, которые не содержат параметр. Поскольку последнее гораздо более вероятно, чем первое, это то, что мы должны предположить. Таким образом, соответствующий вывод заключается в том, что набор данных почти наверняка был нетипичным для населения,

Конечно, если есть основания полагать, что более 5% вещей связано с ишемической болезнью сердца, то в статистике могут быть некоторые доказательства, подтверждающие предположение, что дым из окружающей среды является одним из них. Здравый смысл подсказывает, что это маловероятно.

В чем заключается ошибка в их рассуждениях (поскольку все организации здравоохранения согласны с тем, что существует значительная литература, касающаяся вредных последствий вторичного курения)? Является ли это из-за их предпосылки, что «из огромного количества вещей, которые могут быть проверены, очень немногие на самом деле связаны с ишемической болезнью сердца»? Это предложение может быть верным для любого случайно выбранного фактора (т. Е. Сколько собак принадлежит человеку с риском ишемической болезни сердца), но априорная вероятность намного выше для вторичного курения и ишемической болезни сердца, чем просто «любой случайный фактор» ,

Это правильное рассуждение? Или есть что-то еще?

BYS2
источник
Цитируемый текст выглядит как ... ну, как цитата. Откуда это? :)
MånsT
хаха да это цитата из википедии ... кто-то добавил это в статью для "доверительного интервала". Я пытаюсь удалить его, потому что это явно неверно, но парень отказывается, поэтому мне нужна математически обоснованная причина, а не просто "это явно неправильно" .. хотя у меня есть некоторые идеи, я хотел бы знать, может ли кто-то объяснить именно то, что ошибки здесь делают. Потому что если бы это было правильно, то многие исследования могут быть опровергнуты по аналогичным причинам
BYS2
3
Если это немного затянется, я перееду и попытаюсь помочь. Его аргумент явно ошибочен и сильно указывает на то, что у него есть повестка дня.
Эрик
3
Как физик, который использует много статистики, но не является статистиком, я нахожу этот параграф действительно бесполезным, не говоря уже о том, что он звучит неправильно. Я всегда думал, возможно, неправильно, что 95% кл означает, что если нулевая гипотеза верна, то 1 раз из 20, если я повторю свой эксперимент, я получу значимый результат на уровне 95% (на мой взгляд, это хорошая причина не использовать менее 99,9, но это другое обсуждение). Этот пост, кажется, больше посвящен взаимосвязанным факторам и на самом деле вообще не помогает неспециалистам (или кому-либо еще).
Боулер
@Erik. У пользователя довольно хитрая история с кукольными носками (у него было несколько учетных записей и он использует правки IP), и его заблокировали раньше ... не уверен, в чем заключается его сделка. Но похоже на то, что нарушитель спокойствия
BYS2

Ответы:

10

Здесь много чего не так. Как объясняет @ Néstor, он неявно принимает априорные вероятности для (нет ссылки) и (ссылка).H 1H0H1

Он помещает очень высокий вес (очень близко к 1) на и очень маленький вес на . Это первая сомнительная вещь, которую он делает, поскольку существует механистическая связь между курением и болезнями сердца (рассмотрим активных курильщиков), вопрос в том, достаточно ли воздействия. Это даже не считает предыдущие исследования выполненными. Так что на самом деле это не одно из «огромного количества вещей», которое можно проверить, как, например, носить красные носки. Это означает, что он уже начинает с предвзятого и не совсем оправданного априора.H 1H0H1

Затем он обновляет свои предварительные данные, утверждая, что вероятность получения 95-процентного доверительного интервала, не содержащего истинного значения, имеет вероятность 5%. Хотя это и правда, это не шанс получить этот конкретный интервал в предположении нулевой гипотезы . Обратите внимание, что он бы относился к доверительному интервалу [1.17, 1.32] точно так же, как к доверительному интервалу [100, 200], что явно проблематично.

Это действительно важно для байесовского подхода: в то время как у вас есть полная вероятность 5% не получить интервал, содержащий 1, при условии, что 1 равен нулю, плотность вероятности получения этого конкретного интервала отличается (и меньше).

Третья ошибка заключается в том, что он никогда не указывал свой предшествующий уровень и не указывал, насколько вероятным должен быть по сравнению с чтобы он смог получить такой результат. Это просто "исчезающе маленький".H 1H0H1

Четвертая ошибка состоит в том, чтобы сказать, что соответствующие действия должны были бы отклонить данные. Обратите внимание, что его результат даже не зависит от данных, его аргумент подразумевает, что точно такое же действие было бы сделано для любых данных вообще. Если вы найдете интересную ссылку, но подозреваете, что это может быть просто случайность, правильная научная вещь - попытаться повторить ваш результат!

Erik
источник
Спасибо, что расширили ответ Нестора! Быстрый вопрос, однако, вы заявили, что «... это не шанс получить этот конкретный интервал в предположении нулевой гипотезы». Если бы мы хотели найти шанс получить конкретный интервал в предположении нулевой гипотезы, нам нужно было бы использовать байесовский вывод и правильный вероятный интервал? Частые доверительные интервалы говорят только о «вероятности того, что интервал будет включать истинное значение».
Еще
Частотный доверительный интервал 95% составлен таким образом, чтобы по меньшей мере в 95% случаев этот интервал содержал истинное значение. Все идет нормально. При этом вы также можете вычислить вероятность (или значение плотности) получения определенного доверительного интервала, если нулевая гипотеза верна. Точное местоположение содержит больше «информации», чем просто содержит ли оно нулевую гипотезу. Выбрасывать эту информацию плохо при использовании байесовского вывода, так как оно имеет отношение к вероятности того, что нулевое значение истинно.
Эрик
Примером игрушки может быть такой: байесовский вывод, вы хотите сделать вывод о форме распределения. Предварительно допускает две возможности: H1: Распределение стандартно нормально. H2: Распределение нормальное, среднее = SD = 1. Выборка значений распределений позволяет вам обновить ваш предыдущий. Когда вам дают только знаки ваших значений, вы также можете обновить свое предыдущее, но обновление будет менее информативным, так как вы выбросили соответствующую информацию.
Эрик
6

Это довольно интересная философская проблема, связанная с проверкой гипотез (и, таким образом, в настройке для часто используемых людей также доверительные интервалы, как я здесь объясняю ).

Есть, конечно, много гипотез, которые могут быть исследованы - пассивное курение вызывает ишемическую болезнь сердца, употребление алкоголя вызывает CHD, владение собаками вызывает CHD, а Козерог вызывает CHD ...

Если мы выберем одну из всех этих гипотез случайным образом, вероятность того, что мы выберем гипотезу, которая окажется верной, практически равна нулю. Похоже, это аргумент в цитируемом тексте - очень маловероятно, что нам довелось проверить истинную гипотезу.

Но гипотеза была выбрана не случайно. Это было мотивировано предыдущими эпидемиологическими и медицинскими знаниями о ишемической болезни сердца. Существуют теоретические механизмы, объясняющие, как курение может вызвать ишемическую болезнь сердца, поэтому не кажется надуманным думать, что это сработает и для пассивного курения.

Критика в цитате может быть действительной для поисковых исследований, где набор данных добывается для гипотез. Вот почему мы не принимаем такие «открытия» как факты - вместо этого мы требуем, чтобы результаты могли быть воспроизведены в новых исследованиях. В любом случае, статья, процитированная в цитате, является мета-исследованием, и поэтому эта проблема не затрагивается.

В течение последних столетий мы видели эмпирически, что проверка гипотез, мотивированных теорией, сравнивая предсказанные результаты с наблюдаемыми результатами, работает. Тот факт, что мы верим в эту процедуру, является причиной того, что мы достигли такого большого прогресса в медицине, технике и науке. По этой причине я могу написать это на своем компьютере, а вы - на своем. Утверждать, что эта процедура неправильная, значит утверждать, что научный метод в корне ошибочен - и у нас есть много доказательств, которые говорят об обратном.

Я сомневаюсь, что есть что-то, что на самом деле примет человек, который не желает принимать такие доказательства ...

MånsT
источник
Я действительно не получил ваш абзац до последнего; Вы ссылаетесь на «тестирование значимости» (например, вычисление вероятности данных, по крайней мере, более экстремальные) или действительно «тестирование гипотез» (байесовский параметр)? Кто сказал, что ни один из них не работает, если вы зададите правильный вопрос?
Нестор
@ Нестор: Возможно, я должен был написать это по-другому. Я на самом деле не делал утверждения о статистической проверке гипотез, а скорее делал замечание о том факте, что сравнение предсказаний модели с данными реального мира (т. Е. «Проверка», если гипотеза верна), кажется очень эффективным способом выполнения наука. Я считаю, что в основе этой критики в отношении КИ лежит нежелание принять этот метод. Тип аргументов, приведенных в цитате, применим к любому статистическому методу - с нулевыми априорными вероятностями для всех нулевых гипотез, мы никогда ни во что не верим.
MånsT
6

Я действительно не понимаю, почему автор говорит, что вероятность относительного риска развития ишемической болезни сердца, равного 1, может быть чрезвычайно мала, основываясь на своем анализе исключительно на доверительном интервале; это совершенно неправильно. Мне кажется, что он использует частые настройки, но он рассуждает байесовски (что довольно часто).

Единственное, что связано с КИ, - это классические тесты значимости, но, как мы все знаем, если { Нет связи между курением и ишемической болезнью сердца }, они дают вам (где обозначает " данные, по крайней мере, такие же экстремальные, как и то, что мы наблюдали "), а не (где - данные), о чем он заявляет, и что именно связано с тем, на что вы указываете; Вы должны включить предварительные знания об этой конкретной ссылке! Это связано с тем, что по теореме Байеса : , где - априорная вероятность на .p ( D e | H 0 ) D e p ( H 0 | D ) D p ( H 0 | D ) p ( D | H 0 ) p ( H 0 ) , p ( H 0 ) H 0H0:p(De|H0)Dep(H0|D)D

p(H0|D)p(D|H0)p(H0),
p(H0)H0
Нестора
источник
Не будет ли H0: нет никакой связи между пассивным курением и ИБС? Поскольку нулевая гипотеза обычно является гипотезой, что нет никакого эффекта. Кроме того, спасибо за этот ответ!
BYS2
Да, ты прав! Я не заметил, пока вы не указали :-). Я отредактирую свой ответ.
Нестор
3

Хотя есть что-то в этой байесовской линии рассуждений (очень тщательно разобрано Эриком!), И действительно, эта линия мышления объясняет, почему многие медицинские выводы не могут быть воспроизведены, этот конкретный аргумент применяет это мышление как кувалду.

Автор предполагает две вещи без предоставления доказательств: что воздействие дыма было выбрано случайным образом, и что почти ничто в мире не вызывает сердечные заболевания. В соответствии с этими слабыми стандартами рассуждений автор может отклонить ЛЮБОЙ вывод о том, что что-то вызывает сердечные заболевания. Все, что вам нужно сделать, это утверждать:

  1. Что гипотеза была выбрана случайным образом, и
  2. Эта болезнь сердца имеет очень близкие к нулю причины.

Оба эти утверждения являются спорными (и, насколько мне известно, весьма вероятно, неверны). Но с учетом этих допущений, даже наблюдая, что 100% людей, подвергшихся воздействию пассивного курения, умерли от сердечного приступа в течение года, вы можете утверждать, что эта связь является просто случайной корреляцией со скрытой, единственной, «истинной» причиной ,

Джонатан
источник
Хорошо, спасибо за ваши мысли! Да, автор определенно предположил, что гипотеза была выбрана «случайно», что неверно.
BYS2
-1

Я не вижу ничего явно неправильного с абзацем в цитатах, но я не видел данных и не могу проверить это числа. Однако два параграфа, которые следуют за ним, очень неясны.

Предположим, он сказал: «В целом, некурящие с патологическим ожирением имели относительный риск развития ишемической болезни сердца 1,25 (95% доверительный интервал, 1,17-1,32) по сравнению с некурящими, которые имели нормальную массу тела». У кого-нибудь будет причина сомневаться в нем?

Эмиль Фридман
источник
Ну, первый абзац в цитатах был просто автором, цитирующим выводы эпидемиологического исследования, так что в этом нет ничего плохого. В следующих нескольких абзацах он пытается дискредитировать исследование, в котором он делает некоторые сомнительные заявления.
BYS2