Работают ли работающие статистики о разнице между частыми и байесовскими выводами?

37

Как аутсайдер, кажется, что есть два конкурирующих взгляда на то, как следует выполнять статистический вывод.

Являются ли эти два разных метода приемлемыми для работающих статистиков?

Является ли выбор одного более важным философским вопросом? Или текущая ситуация считается проблематичной и предпринимаются попытки каким-то образом объединить различные подходы?

Джонатан Фишофф
источник
1
Я думаю, что есть много прагматически ориентированных прикладных статистиков, которые считают, что любой из них может быть законно использован, если он используется правильно, и будет идти в зависимости от того, что более практично в данном случае. В этом ключе я задал вопрос ( Список ситуаций, в которых байесовский подход проще, практичнее или удобнее ), пытаясь выявить, когда байесовский подход может быть проще (поскольку, как правило, подход Frequentist, см. Шелби № 3).
gung - Восстановить Монику

Ответы:

21

Я не думаю, что это имеет большое значение, поскольку интерпретация результатов выполняется в тех же рамках, что и анализ. Основная проблема со статистикой часто встречающихся состоит в том, что существует естественная тенденция трактовать значение p критерия значимости часто встречающегося, как если бы это была байесовская апостериорная вероятность того, что нулевая гипотеза верна (и, следовательно, 1-p - это вероятность того, что альтернативная гипотеза верна) или трактовка доверительного интервала для частых лиц как байесовского достоверного интервала (и, следовательно, при условии, что существует 95% вероятность того, что истинное значение находится в пределах 95% доверительного интервала для конкретной выборки данных, которую мы имеем). Такие интерпретации естественны, так как это был бы прямой ответ на вопрос, который мы, естественно, хотели бы задать.

Пока форма ответа приемлема, и мы можем согласиться с сделанными допущениями, нет оснований отдавать предпочтение одному из них - это вопрос лошадей для курсов.

Я все еще байесовский, хотя; о)

Дикран Сумчатый
источник
13
Для примера: часто хочется знать P (модель | данные). Тем не менее, анализ часто дает вам P (модель | модель) (которую затем люди часто читают как P (модель | данные). Предполагая предварительную вероятность P (модель), вы можете получить P (модель | данные) в байесовской статистике. Но тогда вы может обсудить, какой должна быть модель P
Андре Хольцнер,
13

В дополнение к тому, что говорит Шейн, я думаю, что континуум включает в себя:

  1. Твердое философское положение в байесском лагере
  2. Оба считаются действительными, с одним подходом более или менее предпочтительным для данной проблемы
  3. Я бы использовал байесовский подход (вообще или чаще), но у меня нет времени.
  4. Твердое философское положение в лагере для частников
  5. Я делаю это, как я узнал в классе. Что байес?

И да, я знаю работающих статистиков и аналитиков по всем этим вопросам. Большую часть времени я живу в # 3, стараясь проводить больше времени в # 2.

Шелби
источник
1
... и если на этих позициях можно найти равное количество статистиков или практиков, то, очевидно, система настроена на частоту, не так ли? И если байесовские методы становятся все более распространенными, разве это не говорит нам о чем-то уместном? - Просто некоторые правдоподобные рассуждения ... ;-)
GWR
11

Я думаю, что байесовская статистика вступает в игру в двух разных контекстах.

С одной стороны, некоторые исследователи / статистики определенно убеждены в «байесовском духе» и, признавая ограниченность классической основы гипотезы о частоте, решили сконцентрироваться на байесовском мышлении. Исследования в области экспериментальной психологии, подчеркивающие малые величины эффекта или пограничную статистическую значимость, в настоящее время все больше опираются на байесовские рамки. В этом отношении я хотел бы привести некоторые из обширной работы Бруно Лекутра (1-4), который внес вклад в развитие использования фидуциального риска и байесовского (М) ANOVA. Я думаю, что тот факт, что мы можем легко интерпретировать доверительный интервал в терминах вероятностей, применяемых к интересующему параметру (т.е. в зависимости от предшествующего распределения), является радикальным поворотом в статистическом мышлении.Международное общество байесовского анализа использует байесовские модели. Фрэнк Харрелл также предлагает интересные схемы Байесовских методов для клиницистов применительно к РКИ .

С другой стороны, байесовский подход оказался успешным в диагностической медицине (5) и часто используется в качестве окончательной альтернативы, когда традиционная статистика потерпит неудачу, если вообще применима. Я имею в виду психометрическую статью (6), в которой авторам было интересно оценить согласие между рентгенологами в отношении тяжести переломов бедра из очень ограниченного набора данных (12 врачей х 15 рентгенограмм) и использовать модель ответа на предмет для политомных предметов.

Наконец, недавняя 45-страничная статья, опубликованная в « Статистика в медицине», предоставляет интересный обзор «проникновения» байесовского моделирования в биостатистику:

Эшби, Д. (2006). Байесовская статистика в медицине: обзор за 25 лет . Статистика в медицине , 25 (21), 3589-631.

Ссылки

  1. Rouanet H., Lecoutre B. (1983). Конкретный вывод в ANOVA: от значимых тестов до байесовских процедур. Британский журнал математической и статистической психологии , 36 , 252-268.
  2. Lecoutre B., Lecoutre M.-P., Poitevineau J. (2001). Использование, злоупотребления и злоупотребления тестами значимости в научном сообществе: не будет ли неизбежен байесовский выбор? Международный статистический обзор , 69 , 399-418.
  3. Лекутр Б. (2006). Разве не все байесовские? Информационное письмо Индийского Байесовского общества , III , 3-9.
  4. Лекутр Б. (2006). А если бы ты был байесовцем, не зная об этом? В А. Мохаммад-Джафари (ред.): 26-й семинар по методам байесовского вывода и максимальной энтропии в науке и технике . Мелвилл: AIP Conference Proceedings Vol. 872, 15-22.
  5. Broemeling, LD (2007). Байесовская биостатистическая и диагностическая медицина . Чепмен и Холл / КПР.
  6. Болдуин П., Бернштейн Дж. И Вайнер Х. (2009). Психометрия бедра. Статистика в медицине , 28 (17), 2277-92.
chl
источник
5

Я полагаю, что в прикладных областях этому аспекту не уделяется так много внимания, поскольку исследователи / практики имеют тенденцию быть прагматичными в прикладных работах. Вы выбираете инструмент, который работает с учетом контекста.

Тем не менее, дебаты живы и хороши среди тех, кому небезразличны философские проблемы, лежащие в основе этих двух подходов. Смотрите, например, следующие записи в блоге Эндрю Гельмана :

user28
источник
1
Я бы сказал, что «прагматическая» сторона действительно заботится только о том, чтобы метод был осуществим, независимо от того, насколько он философски блестящий. Я считаю, что это главная причина многих компромиссов.
вероятностная
5

Хотя это субъективно, я бы сказал:

Это называется байесовскими / частыми " дебатами " по причине. Существует четкая философская разница между этими двумя подходами.

Но, как и в большинстве случаев, это спектр. Некоторые люди очень много находятся в одном или другом лагере и полностью отвергают альтернативу. Большинство людей, вероятно, падают где-то посередине. Я сам использовал бы любой метод в зависимости от обстоятельств.

Шейн
источник
1
Я хотел бы добавить, что дискуссия носит не только философский характер - определенно бывают моменты, когда важно, какой метод вы выберете, особенно когда речь идет о количественной оценке «ошибки» / «неопределенности» в вашей оценке / заключении.
вероятностная