Почему Байесовская статистика становится все более популярной темой исследований? [закрыто]

Просматривая область исследования 100 лучших статистических программ новостей США, почти все из них являются тяжелыми в байесовской статистике. Тем не менее, если я пойду в школу более низкого уровня, большинство из них по-прежнему будут заниматься статистикой классических / частых исследований. Например, в моей нынешней школе (рейтинг от 150 до 200 в мировом рейтинге QS по статистике, поэтому она не считается школой высшего уровня) есть только один профессор, специализирующийся на байесовской статистике, и почти негодует байесовская статистика. Некоторые аспиранты, с которыми я разговаривал, даже говорят, что Байесовские статистики делают байесовские статистические данные ради этого, с чем я, конечно, категорически не согласен.

Однако мне интересно, почему это так. У меня есть несколько образованных догадок:

(a) не хватает места для продвижения в методологии классической / частой статистики, и единственное жизнеспособное исследование в исследовании классической / частой статистики - это приложения, которые будут в центре внимания школы более низкого уровня, так как школа высшего уровня должна быть больше склонен к теоретическим и методологическим исследованиям.

(б) Это сильно зависит от поля. Определенная ветвь статистики просто больше подходит для байесовской статистики, например, для многих научных применений метода статистики, тогда как другая ветвь больше подходит для классической статистики, такой как финансовая сфера. (поправьте меня, если я ошибаюсь) Учитывая это, мне кажется, что в школах высшего уровня есть много факультетов статистики, делающих заявления в научной области, в то время как отдел статистики школ нижнего уровня главным образом сосредотачивает заявления в финансовой области, так как это помогает им генерировать доход и финансирование.

(c) Существуют огромные проблемы с частым методом, который не может быть решен, например, склонность к переоснащению MLE и т. д. И Байесовский метод, кажется, предлагает блестящие решения.

(г) вычислительная мощность здесь, следовательно, байесовские вычисления больше не являются узким местом, как это было 30 лет назад.

(д) Это может быть наиболее самоуверенным предположением, которое у меня есть. Классик-статистик часто встречает сопротивление, которому просто не нравится новая волна методологии, которая потенциально может превзойти роль классической статистики. Но, как сказал Ларри Вассерман, это зависит от того, что мы пытаемся сделать, и каждый должен сохранять непредвзятость, особенно как исследователь.

bayesian frequentist davidolohowski
источник

В то время как мнения жителей CV будут различаться, и такое мнение считается не по теме, стоит отметить, что именно на этот вопрос дан ответ во вводных главах современных текстов по байесовскому анализу. В частности, глава 1 Гельмана и др. Байесовский анализ данных, 3-е изд. Это сводится к: а) «здравому смыслу» и б) весьма проблематичному доверительному интервалу, который 99% из нас не могут не истолковать неправильно. То, как мы его неверно истолковали, по сути является байесовским, так что мы могли бы также провести байесовский анализ с самого начала.

Питер Леопольд

@ Петр Леопольд Половина серьезно: 99%? а кто такой "мы"? Многие наивные пользователи статистики действительно имеют серьезные неправильные представления о КИ, но если вы обращаетесь к сообществу CV, я надеюсь, что 99% действительно не подходят. Статистики могут быть такими же плохими, как и все остальные, при составлении цифр при отсутствии достоверных данных!

Ник Кокс

\sim 10^{- 2}

$\sim 10^{-2}$

Ответы:

Лично я бы рискнул несколько догадок:

(1) Байесовская статистика увидела огромный рост популярности за последние пару десятилетий. Частично это было связано с достижениями в MCMC и улучшением вычислительных ресурсов. Байесовская статистика превратилась из теоретически действительно хорошей, но применимой только к игрушечным задачам, в подход, который можно было бы применять более универсально. Это означает, что несколько лет назад заявление о том, что вы работали над байесовской статистикой, возможно, сделало вас очень конкурентоспособным работодателем.

Теперь я бы сказал, что байесовская статистика по-прежнему является плюсом, но работает над интересными проблемами без использования байесовских методов. Отсутствие фона в статистике байесовской бы , конечно, минус для большинства нанимающих комитетов, но получить докторскую степень в области статистики без достаточной подготовки в методах байесовской было бы довольно удивительно.

(2) Байесовские статистики упоминают «байесовский» в своем резюме. Частые участники обычно не помещают «Частые» в свое резюме, но гораздо чаще в той области, в которой они работают (например, анализ выживания, прогнозное моделирование, прогнозирование и т. Д.). Например, большая часть моей работы - написание алгоритмов оптимизации, что, как я предполагаю, подразумевает, что вы скажете, что я работаю с Frequentist. Я также написал довольно много байесовских алгоритмов, но это определенно меньшинство моей работы. Байесовская статистика есть в моем резюме, статистика для частых - нет.

(3) В какой-то степени то, что вы сказали в своем вопросе, также содержит истину. Эффективные общие байесовские вычисления имеют больше открытых проблем, чем сфера Frequentist. Например, гамильтониан Монте-Карло недавно стал очень интересным алгоритмом для общей выборки из байесовских моделей. Там не так много места для улучшения общегооптимизация в наши дни; Алгоритмы Ньютона Рафсона, L-BFGS и EM охватывают множество основ. Если вы хотите улучшить эти методы, вы, как правило, должны специализироваться на этой проблеме. Таким образом, вам больше нравится говорить «я работаю над многомерной оптимизацией геопространственных моделей», а не «я работаю над многомерной оценкой максимального правдоподобия». Мир машинного обучения является чем-то вроде исключения из этого, поскольку есть много волнений в поиске новых методов стохастической оптимизации (например, SGD, Адама и т. Д.), Но это несколько другое чудовище по нескольким причинам.

Точно так же есть работа, чтобы придумать хорошие приоры для моделей. Методы частотные сделать есть эквивалент этого (придумывает хорошие штрафы, то есть, лассо, glmnet) , но, вероятно , более благодатная почва для настоятелей над штрафами.

(4) Наконец, и это определенно больше личное мнение, многие люди ассоциируют Frequentist с p-значениями. Учитывая общее злоупотребление p-значениями, наблюдаемое в других областях, многие статистики хотели бы дистанцироваться как можно дальше от текущих злоупотреблений p-значениями.

Клифф AB
источник

Таким образом, ответ на вопрос, почему он стал более популярным, включает (1), что он стал более популярным. Озадаченный этим, но я предполагаю, что это просто вопрос переписывания.

Ник Кокс

@NickCox: моя точка в том , что она является более популярной, но и его популярность может быть несколько завышена. То есть ОП увидела, что Байесовская статистика была в резюме почти каждого профессора в выборке университетов высшего уровня. Но это не значит, что каждый из этих профессоров занимается только байесовской статистикой. Еще один момент, связанный с (1), заключался в том, что, как мне кажется, было время, когда проводилась байесовская статистика, поскольку область вашего исследования была очень важна для получения позиции высшего уровня. Я не уверен, что это более строгое требование, но многие профессора, которых вы видите сейчас, были наняты в это время.

Клифф AB

О, я понимаю вашу точку зрения. Я сосредоточился на обсуждении «Это потому, что недостаточно места для продвижения в классической статистике / статистике?» и не так много на "почему это происходит?"

Клифф АВ