Примеры байесовского и частотного подхода, дающего разные ответы

54

Примечание: Я нахожусь в курсе философских различий между Байесом и частотной статистикой.

Например, «какова вероятность того, что монета на столе - это головы» не имеет смысла в статистике частых случаев, поскольку у нее уже есть приземленные головы или хвосты - в этом нет ничего вероятностного. Таким образом, вопрос не имеет ответа в частых терминах.

Но такая разница конкретно не та разница, о которой я спрашиваю.

Скорее, я хотел бы знать, как их предсказания для правильно сформулированных вопросов действительно отличаются в реальном мире, исключая любые теоретические / философские различия, такие как пример, который я упомянул выше.

Итак, другими словами:

Что пример вопроса, подотчетно в обеих частотных и статистике Байесовской, чей ответ отличается между этими двумя?

(Например, возможно, один из них отвечает «1/2» на конкретный вопрос, а другой отвечает «2/3».)

Есть ли такие различия?

  • Если да, то каковы некоторые примеры?

  • Если нет, то когда вообще когда-нибудь будет иметь значение , использую ли я байесовскую или частую статистику при решении конкретной проблемы?
    Почему я должен избегать одного в пользу другого?

Mehrdad
источник
8
Джон Крушке только что выпустил два видео, в которых он сравнивает байесовские и стандартные статистические методы. У него есть много примеров, когда байесовский метод отклоняет, а стандартный метод - нет. Может быть, не совсем то, что вы искали, но в любом случае ... youtu.be/YyohWpjl6KU и youtu.be/IhlSD-lIQ_Y .
Расмус Батх
4
Биномиальное распределение является еще одним примером того, как частый (основанный на вероятности) вывод и байесовский вывод отличаются в некоторых случаях. Вероятность профиля параметра не уменьшается до 0 при N ( см. ) Для некоторых образцов. Это подразумевает, что некоторый доверительный интервал имеет бесконечную длину. С другой стороны, маргинальное апостериорное распределение N всегда уменьшается до 0 при N ∞, учитывая, что оно интегрируемо. N0NN0N
@Procrastinator: Спасибо, я смотрю на слайды, упомянутые прямо сейчас. Это кажется немного более интенсивным, чем моя математическая подготовка, но, надеюсь, я что-то из этого получу. :)
Мердад
2
Возможно, вы захотите взглянуть на пример Стоуна. Я объясняю это в своем блоге здесь: normaldeviate.wordpress.com/2012/12/08/…
Ларри Вассерман
1
@mbq: Просто интересно, почему это было сделано вики сообщества?
Мердад

Ответы:

9

Этот пример взят отсюда . (Я даже думаю, что получил эту ссылку от SO, но больше не могу ее найти.)

Монету подбрасывали раз, поднимая головы k = 10 раз. Если его бросят еще дважды, вы бы сделали ставку на две головы? Предположим, что вы не можете увидеть результат первого броска до второго броска (а также независимо от θ ), так что вы не можете обновить свое мнение о θ между двумя бросками.Nзнак равно14Кзнак равно10θθ

е(Yе,1знак равноруководители,Yе,2знак равноруководители|θ)знак равное(Yе,1знак равноруководители)е(Yе,2знак равноруководители|θ)знак равноθ2,
Бета(α0,β0)
е(Yе,1знак равноруководители,Yе,2знак равноруководители|Y)знак равное(Yе,1знак равноруководители,Yе,2знак равноруководители|θ)π(θ|Y)dθзнак равноΓ(α0+β0+N)Γ(α0+К)Γ(β0+N-К)θ2θα0+К-1(1-θ)β0+N-К-1dθзнак равноΓ(α0+β0+N)Γ(α0+К)Γ(β0+N-К)Γ(α0+К+2)Γ(β0+N-К)Γ(α0+β0+N+2)знак равно(α0+К)(α0+К+1)(α0+β0+N)(α0+β0+N+1)
Бета(1,1)(10/14)20,51
Кристоф Ханк
источник
+1 именно тот ответ, который я искал, спасибо.
Мердад
5
На самом деле произошло обновление поста, на который есть ссылка в ответе… Хотя он оставил пост «вместо того, чтобы использовать равномерное распределение как предыдущее, мы можем быть еще более агностичны. В этом случае мы можем использовать бета-версию ( 0,0) распределение как предшествующее. Такое распределение соответствует случаю, когда любое среднее значение распределения одинаково вероятно. В этом случае два подхода, байесовский и частый, дают одинаковые результаты ». !!! Поэтому нам все еще нужен пример, чтобы ответить на этот вопрос! Следовательно +1 к ответу ниже как верный ответ на этот вопрос.
user1745038
10

См. Мой вопрос здесь , в котором упоминается статья Эдвина Джейнса, в которой приведен пример правильно построенного доверительного интервала, где в выборке достаточно информации, чтобы точно знать, что истинное значение статистики нигде не находится в доверительном интервале ( и, таким образом, доверительный интервал отличается от байесовского вероятного интервала).

Однако причиной этого является различие в определении доверительного интервала и вероятного интервала, что, в свою очередь, является прямым следствием различий в частотных и байесовских определениях вероятности. Если вы попросите байесовский интервал получить байесовский доверительный (а не достоверный) интервал, то я подозреваю, что всегда будет априор, для которого интервалы будут одинаковыми, поэтому различия сводятся к выбору априора.

То, будут ли подходить частые или байесовские методы, зависит от вопроса, который вы хотите задать, и в конечном итоге ответом будет различие в философии (при условии, что требуемые вычислительные и аналитические усилия не рассматриваются).

Будучи немного неуклюжим, можно утверждать, что долгосрочная частота - вполне разумный способ определения относительной правдоподобности суждения, и в этом случае статистика частатиков представляет собой немного странное подмножество субъективного байесовского подхода - так что любой вопрос, на который может ответить частик Субъективист Байесовский также может ответить таким же образом или каким-либо другим образом, если они выберут другие приоры. ; О)

Дикран Сумчатый
источник
4
Использование «субъективного байесовского» - это своего рода саботаж ( см. ). Моделирование в целом полно субъективизма, выбор распределения для моделирования выборки также субъективен. Даже выбор критерия пригодности для проверки обоснованности определенной модели субъективен.
2
Я на самом деле не согласен с этим, если кто-то считает «субъективное» уничижительным, то это его ошибка. Иногда, когда мы имеем в виду вероятность, мы действительно имеем в виду субъективную личную веру - я не вижу причин, чтобы не называть это так, если это то, что на самом деле означает (выбор принимать только долгосрочные частоты, поскольку определение вероятности является чисто субъективным выбором).
Дикран Marsupial
1
+1 спасибо за ссылку, это очень поучительно. А также для заметки о разнице между доверием и достоверными интервалами.
Мердад
8

Я считаю, что этот документ дает более целеустремленное понимание компромиссов в реальных приложениях между ними. Частично это может быть связано с моим предпочтением интервалов, а не тестов.

Густафсон, П. и Гренландия, С. (2009). Оценка интервала для грязных данных наблюдений . Статистическая наука 24: 328–342.

Что касается интервалов, то, возможно, стоит иметь в виду, что доверительные интервалы частых лиц требуют / требуют равномерного покрытия (точно или, по крайней мере, больше, чем x% для каждого значения параметра, которое не имеет нулевой вероятности), и если они этого не делают имейте это - они действительно не доверительные интервалы. (Некоторые пойдут дальше и скажут, что они также должны исключить соответствующие подмножества, которые изменяют покрытие.)

Байесовское покрытие обычно определяется путем смягчения этого значения до «среднего охвата», учитывая, что предполагаемое предварительное значение оказывается точно правильным. Gustafson and Greenland (2009) называют эти всемогущие приоры и считают ошибочные, чтобы обеспечить лучшую оценку.

фанерон
источник
1
+1 Я никогда не знал об этой разнице в ограничениях, спасибо за указание на это.
Мердад
3

Если бы кто-то задал вопрос, который имеет как частый, так и байесовский ответ, я подозреваю, что кто-то другой сможет выявить двусмысленность в вопросе, что сделает его не «правильно сформированным».

Другими словами, если вам нужен ответ для частых, используйте методы для частых. Если вам нужен байесовский ответ, используйте байесовские методы. Если вы не знаете, что вам нужно, то, возможно, вы не определили вопрос однозначно.

Однако в реальном мире часто существует несколько разных способов определить проблему или задать вопрос. Иногда не ясно, какой из этих способов предпочтительнее. Это особенно распространено, когда клиент статистически наивен. В других случаях на один вопрос ответить гораздо сложнее, чем на другой. В этих случаях часто приходится делать все возможное, стараясь убедиться, что его клиенты точно согласны с тем, какой вопрос он задает или какую проблему он решает.

Эмиль Фридман
источник
3

Я рекомендую ознакомиться с Упражнением 3.15 свободно доступной учебной теории информации, выводов и алгоритмов обучения Маккея.

При вращении 250 раз бельгийская монета в один евро поднималась головой 140 раз и хвостом 110. «Мне это кажется очень подозрительным», - говорит Барри Блайт, лектор по статистике Лондонской школы экономики. «Если бы монета была беспристрастной, шанс получить столь же экстремальный результат был бы менее 7%». Но свидетельствуют ли эти данные о том, что монета скорее предвзята, чем справедлива?

п0,076:1

Flounderer
источник