Байесовцы когда-либо утверждают, что есть случаи, в которых их подход обобщает / совпадает с подходом, основанным на частоте?

12

Неужели байесовцы когда-либо утверждают, что их подход обобщает подход, основанный на частоте, потому что можно использовать неинформативные априорные значения и, следовательно, можно восстановить типичную структуру модели частых лиц?

Кто-нибудь может направить меня туда, где я могу прочитать об этом аргументе, если он действительно используется?

РЕДАКТИРОВАТЬ: Этот вопрос, возможно, сформулирован не совсем так, как я хотел сказать. Вопрос заключается в следующем: «есть ли какая-либо ссылка на обсуждение случаев, когда байесовский подход и подход на основе частотности пересекаются / пересекаются / имеют что-то общее через использование определенного априора?» Одним из примеров будет использование неправильного априорного , но я уверен, что это только вершина айсберга.p(θ)=1

singelton
источник
2
Я вспоминаю этот аргумент, приведенный в Гринберге «Введение в байесовскую эконометрику», но я не уверен и не уверен, что есть лучшая ссылка. Кроме того, я считаю, что это не только выбор предшествующего, но и уверенность в предшествующем.
Джон
3
Есть хороший аргумент, что частые специалисты обобщают байесовский подход! Это следует из того, что частые люди с удовольствием используют априоры, когда они оправданы (теорией или данными), но в дополнение используют методы, которые байесовцы не будут касаться. :-)
whuber
3
Это совершенно разные подходы, начиная с того, как интерпретируется Вероятность (см., Например, ссылку ). Кроме того, не существует уникального (даже менее приемлемого) определения неинформативного априора просто потому, что не существует уникального (или принятого) определения информации . Даже если количественные оценки одинаковы, интерпретация оценщика частоты и байесовской оценки различна. Как я упоминал в предыдущем комментарии: «Это все равно, что сказать, что апельсины обобщают яблоки».
1
@Procrastinator Я полностью согласен, что они не всегда пересекаются. Я ищу аргументы в тех случаях, когда они делают. Позвольте мне перефразировать вопрос: «есть ли какая-либо ссылка на дискуссию, в которой байесовская статистика и статистика частых обращений так или иначе пересекаются при использовании априорной информации?» Одним из примеров будет использование неправильного априорного значения . Но это действительно верхушка айсберга, я верю. p(θ)=1
Сингелтон
1
@Procrastinator да, спасибо! это именно то обсуждение, которое я ищу (хотя, полагаю, это все еще верхушка айсберга). Мне просто нужно найти книгу, которая делает это полностью, и я не смог найти одну. Я буду продолжать искать. Спасибо еще раз. (большинство книг посвящено либо частому, либо байесовскому подходам, но не сравнивайте их так, как вы.)
Сингелтон

Ответы:

11

Я видел два выдвинутых аргумента о том, что байесовский анализ является обобщением частотного анализа. Оба были немного насмешливыми, и больше заставляли людей распознавать предположения о регрессионных моделях, используя приоры в качестве контекста.

Аргумент 1: Частотный анализ - это байесовский анализ с чисто неинформативным априорным центром, сосредоточенным на нуле (да, не имеет значения, где он центрирован, но игнорируйте это). Это обеспечивает как контекст, для которого байесовский анализ может извлечь результаты анализа часто используемых данных, так и объясняет, почему вы можете избежать использования некоторых «байесовских» методов, таких как MCMC, для извлечения оценок часто используемых в ситуациях, когда, скажем, сходимость с максимальной вероятностью является сложной, и люди признают, что когда они говорят «данные говорят сами за себя» и тому подобное, они на самом деле говорят, что заранее все значения одинаково вероятны.

Аргумент 2. Любому термину регрессии, который вы не включили в модель, фактически присваивается приоритет с нулевым центром без отклонений. Это не столько аргумент «байесовский анализ - это обобщение», сколько аргумент «Есть априоры повсюду , даже в ваших моделях частых исследований».

фомиты
источник
3
+1 Аргумент 2 интересный. Два комментария к аргументу 1: 1. Я бы сказал, что плоские приоры вместо неинформативных (последний является неправильным, если когда-либо был). 2. Нет необходимости говорить о априорах, чтобы мотивировать использование MCMC в частом анализе - в этом числовом методе нет ничего байесовского по своей сути !
MånsT
спасибо, ЭпиГрад. Есть ли у вас ссылки, которые обсуждают два аргумента, которые вы упомянули?
Сингелтон
1
+1 Хорошо, пока люди понимают, что это - язык в щеке, чтобы передать точку зрения. Но, пожалуйста, не принимайте это всерьез!
Майкл Р. Черник
@ MånsT - Договорились о том, что MCMC не нуждается в обосновании использования, но я считаю, что он существует в сознании людей как нечто в байесовской сфере, а не как чисто числовая техника. Это помогает оттолкнуть их от этого.
Fomite
@bayesianOrFrequentist Не совсем нет.
Fomite
6

Краткий ответ, вероятно, «да - и вам даже не нужен фиксированный априор для этого аргумента».

Например, оценка Maximum A Posteriori (MAP) является обобщением максимальной вероятности, которая включает в себя априор, и существуют частые подходы, которые аналитически эквивалентны нахождению этого значения. Частотист называет «предыдущий» «ограничением» или «штрафом» для функции правдоподобия и получает тот же ответ. Таким образом, частые люди и байесовцы могут указывать на одну и ту же вещь как на лучшую оценку параметров, даже если философии разные. Раздел 5 этой частой статьи является одним из примеров, где они эквивалентны.

Более длинный ответ больше похож на «да, но часто есть другие аспекты анализа, которые различают два подхода. Тем не менее, даже эти различия не обязательно железные во многих случаях».

Например, хотя байесовцы иногда используют оценку MAP (апостериорный режим), когда это удобно, вместо этого они обычно подчеркивают среднее значение апостериорного значения. С другой стороны, заднее среднее также имеет аналог-частоту, называемый «оценкой в ​​мешках» (из «агрегирования начальной загрузки»), которая может быть почти неразличимой (см. Этот pdf для примера этого аргумента). Так что на самом деле это тоже не «жесткое» различие.

На практике все это означает, что даже когда частый человек делает что-то, что байесовец считает абсолютно незаконным (или наоборот), часто (по крайней мере в принципе) существует подход из другого лагеря, который дает почти такой же ответ.

Основное исключение состоит в том, что некоторые модели действительно трудно подобрать с точки зрения частых людей, но это скорее практический вопрос, чем философский.

Дэвид Дж. Харрис
источник
спасибо Дэвид Ваш ответ полезен. Я также ищу ссылку, в которой подробно обсуждается этот момент. Я хочу увидеть, что аргументы байесовцев касаются неинформативных априорных правил и того, как их можно привести к частому подходу. Я прекрасно понимаю техническую мысль, стоящую за этим (например, если вы просто умножите свою вероятность на 1 ... вы получите свою вероятность :-)), но я ищу более достойную дискуссию.
Сингелтон
1
Я обнаружил, что многие молодые люди не знают истории и не понимают сути байесовской парадигмы. Называть это обобщением частичного подхода действительно неверно представляет сравнение этих парадигм. Взяв прокрастинаторские комментарии и изложив их немного по-другому, я бы сказал, что это все равно, что сказать, что яблоко - это просто негабаритный апельсин,
Майкл Р. Черник
@DavidJHarris Мне не понравился твой ответ. Технически отношения, на которые вы указываете, являются законными, но если говорить «да» в коротком ответе, создается неправильное впечатление. Я не думаю, что байесовцы хотели бы назвать свою парадигму обобщением статистики фрикентистов. Термины полностью байесовские, эмпирические байесовские и, возможно, отличают байесовские парадигмы, но я думаю, что байесовцы могут возражать против того, чтобы называть эти ветви байесовской парадигмой.
Майкл Р. Черник
2
@MichaelChernick Точка занята. Я не хотел подразумевать, что у всей байесовской статистики и философии есть близкие частые аналоги и наоборот, только то, что часто можно найти метод, который будет выполнять ту же работу из любого лагеря, и что байесовский подход имеет тенденцию быть более гибкий из двух. Возможно, мне следовало бы подчеркнуть, что даже если оценки параметров, которые вы получаете в двух школах, идентичны, они все равно должны интерпретироваться по-разному, как указывал Прокрастинатор в другом месте.
Дэвид Дж. Харрис
@DavidJHarris. Я согласен со всем, что вы говорите, но исключаю только использование термина обобщение.
Майкл Р. Черник
3

Эдвин Джейнс был одним из лучших в освещении связей между байесовским и частым умозаключениями. Его бумажные доверительные интервалы по сравнению с байесовскими интервалами (поиск в Google выводит их) как очень тщательное сравнение - и я думаю, что это справедливое сравнение.

Оценка малых площадей - это еще одна область, где ответы ML / REML / EB / HB, как правило, близки.

probabilityislogic
источник
2

Многие из этих комментариев предполагают, что «частый» означает «оценка максимального правдоподобия». У некоторых людей есть другое определение: «частый» означает тип анализа долгосрочных выводных свойств любого метода вывода - будь то байесовский метод, или метод моментов, или максимальная вероятность, или что-то, сформулированное в не вероятностном условия (например, SVM) и т. д.

Брендан Оконнор
источник
1

Я хотел бы услышать об этом от Стефана или другого эксперта Байеса. Я бы сказал нет, потому что это другой подход, а не обобщение. В другом контексте это обсуждалось здесь раньше. Не думайте, что только потому, что плоские априорные результаты дают результаты, близкие к максимальной вероятности, что байесовский метод с плоским априором является частым! Я думаю, что это было бы ложной презумпцией, которая заставила бы вас думать, что, делая предыдущий произвольный выбор, вы обобщаете другие возможные приоры. Я так не думаю, и я почти уверен, что большинство байесовцев тоже так не считают.

Так что некоторые люди спорят, но я не думаю, что они должны быть классифицированы как байесовские

хотя Стефан указал на трудности с сильной классификацией. Строго говоря, если слово будет когда-либо, тогда я думаю, что это может зависеть от того, как вы определяете байесовский.

Майкл Р. Черник
источник
(+1) Это совершенно разные подходы. Это как сказать, что апельсины обобщают яблоки.
5
Употребление в пищу большого количества апельсинов и отсутствие яблок заставляет думать так.
Альфред М.
это правда, хотя максимальная вероятность - одна из немногих общих процедур для частых умозаключений. Таким образом, он неизменно будет перепредставлен в общих дискуссиях о частых методах. Я удивлен, что выборка опроса не упоминалась, например, GREG.
вероятностная