Ниже приведен отрывок из «Болстадского введения в байесовскую статистику» .
Для всех вас, экспертов, это может быть тривиально, но я не понимаю, как автор приходит к выводу, что нам не нужно делать какую-либо интеграцию для вычисления апостериорной вероятности для некоторого значения . Я понимаю второе выражение, которое представляет собой пропорциональность и откуда взяты все термины ( вероятность х Приор) . Кроме того, я понимаю, нам не нужно беспокоиться о знаменателе, поскольку только числитель прямо пропорционален. Но переходя к третьему уравнению , не забываем ли мы о знаменателе правила Байеса? Куда это делось? И значение, вычисляемое гамма-функциями, разве это не константа? Не исключают ли константы в теореме Байеса?
distributions
bayesian
beta-distribution
conjugate-prior
Дженна Майз
источник
источник
Ответы:
Дело в том, что мы знаем, что апостериор пропорционален, и так получилось, что нам не нужно делать интегрирование, чтобы получить (постоянный) знаменатель, потому что мы признаем, что распределение с функцией плотности вероятности пропорционально (например, апостериорный) - это бета-версия. Поскольку нормализующая константа для такого бета-файла pdf равна , мы получаем задний pdf без интегрирования. И да, нормализующая константа в теореме Байеса - это константа (с учетом наблюдаемых данных и предполагаемого априора), такая же, как нормализующая константа для апостериорной плотности.Γ ( α + β )xα−1×(1−x)β−1 Γ(α+β)Γ(α)Γ(β)
источник
Настройка
У вас есть эта модель: Плотности, для которых и, в частности, обратите внимание, что
Неявная версия
Теперь. Заднее распределение пропорционально априорному умноженному на вероятность . Мы можем игнорировать константы (то есть вещи, которые не являются ), давая:f g p
Он имеет «форму» бета-распределения с параметрами и , и мы знаем, какой должна быть соответствующая нормализующая константа для бета-распределения с этими параметрами: . Или, с точки зрения гамма-функций, Другими словами, мы можем сделать немного лучше, чем пропорциональное отношение, без лишних усилий и перейти к равенству:α+x β+n−x 1/B(α+x,β+n−x)
Таким образом, можно использовать знания о структуре бета-распределения, чтобы легко восстановить выражение для апостериорного, а не проходить через некоторую грязную интеграцию и тому подобное.
Это как бы обходит полный апостериор, неявно отменяя нормализующие константы совместного распределения, что может сбивать с толку.
Явная версия
Вы могли бы также разобраться с процедурой, которая может быть более ясной.
Это на самом деле не так уж много дольше. Обратите внимание, что мы можем выразить совместное распределение как и предельное распределение как
Таким образом, мы можем выразить апостериор, используя теорему Байеса, через это то же самое, что мы получили ранее.
источник
Основные пометки
Чтобы сделать ответ, данный @ Björn, немного более явным и в то же время более общим, мы должны помнить, что мы пришли к теореме Байеса из
где представляет наблюдаемые данные и наш неизвестный параметр, о котором мы хотели бы сделать вероятностные выводы - в случае вопроса параметр является неизвестной частотой . Давайте не будем сейчас волноваться, говорим ли мы о векторах или скалярах, чтобы все было просто.X θ π
Маргинализация в непрерывном случае приводит к
где совместное распределение равно как мы видели выше. Это постоянная величина, поскольку после «интегрирования» параметра он зависит только от постоянных членов .p(X,θ) likelihood×prior
Поэтому мы можем переформулировать теорему Байеса как
и , таким образом , приходим к обычной форме пропорциональности из байесовской теоремы .
Приложение к проблеме рукой
Теперь мы готовы просто включить то, что мы знаем, поскольку в вопросе имеет видlikelihood×prior
где , и где собирает постоянные члены из вероятности бинома и бета до.a′=a+y b′=b+n−y A=1B(a,b)(ny)
Теперь мы можем использовать ответ, заданный @ Björn, чтобы найти, что это интегрирует с бета-функцией умноженной на совокупность постоянных членов так чтоB(a′,b′) A
Обратите внимание, что любой постоянный член в совместном распределении всегда будет аннулирован, поскольку он будет появляться в знаменателе и знаменателе одновременно (см. Ответ @jtobin), поэтому нам действительно не нужно беспокоиться.
Таким образом, мы признаем, что наше апостериорное распределение на самом деле является бета-распределением, где мы можем просто обновить параметры априора и чтобы прийти к апостериорному. Вот почему бета-версия, предшествующая распространению, называется сопряженной .a′=a+y b′=b+n−y
источник