Примечание: Я нахожусь в курсе философских различий между Байесом и частотной статистикой.
Например, «какова вероятность того, что монета на столе - это головы» не имеет смысла в статистике частых случаев, поскольку у нее уже есть приземленные головы или хвосты - в этом нет ничего вероятностного. Таким образом, вопрос не имеет ответа в частых терминах.
Но такая разница конкретно не та разница, о которой я спрашиваю.
Скорее, я хотел бы знать, как их предсказания для правильно сформулированных вопросов действительно отличаются в реальном мире, исключая любые теоретические / философские различия, такие как пример, который я упомянул выше.
Итак, другими словами:
Что пример вопроса, подотчетно в обеих частотных и статистике Байесовской, чей ответ отличается между этими двумя?
(Например, возможно, один из них отвечает «1/2» на конкретный вопрос, а другой отвечает «2/3».)
Есть ли такие различия?
Если да, то каковы некоторые примеры?
Если нет, то когда вообще когда-нибудь будет иметь значение , использую ли я байесовскую или частую статистику при решении конкретной проблемы?
Почему я должен избегать одного в пользу другого?
источник
Ответы:
Этот пример взят отсюда . (Я даже думаю, что получил эту ссылку от SO, но больше не могу ее найти.)
Монету подбрасывали раз, поднимая головы k = 10 раз. Если его бросят еще дважды, вы бы сделали ставку на две головы? Предположим, что вы не можете увидеть результат первого броска до второго броска (а также независимо от θ ), так что вы не можете обновить свое мнение о θ между двумя бросками.n = 14 к = 10 θ θ
источник
См. Мой вопрос здесь , в котором упоминается статья Эдвина Джейнса, в которой приведен пример правильно построенного доверительного интервала, где в выборке достаточно информации, чтобы точно знать, что истинное значение статистики нигде не находится в доверительном интервале ( и, таким образом, доверительный интервал отличается от байесовского вероятного интервала).
Однако причиной этого является различие в определении доверительного интервала и вероятного интервала, что, в свою очередь, является прямым следствием различий в частотных и байесовских определениях вероятности. Если вы попросите байесовский интервал получить байесовский доверительный (а не достоверный) интервал, то я подозреваю, что всегда будет априор, для которого интервалы будут одинаковыми, поэтому различия сводятся к выбору априора.
То, будут ли подходить частые или байесовские методы, зависит от вопроса, который вы хотите задать, и в конечном итоге ответом будет различие в философии (при условии, что требуемые вычислительные и аналитические усилия не рассматриваются).
Будучи немного неуклюжим, можно утверждать, что долгосрочная частота - вполне разумный способ определения относительной правдоподобности суждения, и в этом случае статистика частатиков представляет собой немного странное подмножество субъективного байесовского подхода - так что любой вопрос, на который может ответить частик Субъективист Байесовский также может ответить таким же образом или каким-либо другим образом, если они выберут другие приоры. ; О)
источник
Я считаю, что этот документ дает более целеустремленное понимание компромиссов в реальных приложениях между ними. Частично это может быть связано с моим предпочтением интервалов, а не тестов.
Что касается интервалов, то, возможно, стоит иметь в виду, что доверительные интервалы частых лиц требуют / требуют равномерного покрытия (точно или, по крайней мере, больше, чем x% для каждого значения параметра, которое не имеет нулевой вероятности), и если они этого не делают имейте это - они действительно не доверительные интервалы. (Некоторые пойдут дальше и скажут, что они также должны исключить соответствующие подмножества, которые изменяют покрытие.)
Байесовское покрытие обычно определяется путем смягчения этого значения до «среднего охвата», учитывая, что предполагаемое предварительное значение оказывается точно правильным. Gustafson and Greenland (2009) называют эти всемогущие приоры и считают ошибочные, чтобы обеспечить лучшую оценку.
источник
Если бы кто-то задал вопрос, который имеет как частый, так и байесовский ответ, я подозреваю, что кто-то другой сможет выявить двусмысленность в вопросе, что сделает его не «правильно сформированным».
Другими словами, если вам нужен ответ для частых, используйте методы для частых. Если вам нужен байесовский ответ, используйте байесовские методы. Если вы не знаете, что вам нужно, то, возможно, вы не определили вопрос однозначно.
Однако в реальном мире часто существует несколько разных способов определить проблему или задать вопрос. Иногда не ясно, какой из этих способов предпочтительнее. Это особенно распространено, когда клиент статистически наивен. В других случаях на один вопрос ответить гораздо сложнее, чем на другой. В этих случаях часто приходится делать все возможное, стараясь убедиться, что его клиенты точно согласны с тем, какой вопрос он задает или какую проблему он решает.
источник
Я рекомендую ознакомиться с Упражнением 3.15 свободно доступной учебной теории информации, выводов и алгоритмов обучения Маккея.
источник