Почему апостериорная плотность пропорциональна функции вероятности, умноженной на предыдущую плотность?

11

Согласно теореме Байеса, . Но согласно моему эконометрическому тексту говорится, что . Почему это так? Я не понимаю, почему игнорируется.P(y|θ)P(θ)=P(θ|y)P(y)P(θ|y)P(y|θ)P(θ)P(y)

байес-проблема
источник
1
Обратите внимание, что здесь не говорится, что они равны, но пропорциональны (с точностью до множителя, то есть )1/P(y)
jpmuc
4
P(y) не игнорируется, а рассматривается как константа, поскольку она является функцией данных которые зафиксированы для рассматриваемой проблемы. Если где является константой (то есть не зависит от ), то мы можем написать что просто означает, что (неопределенная) константа. Обратите внимание, что экстремумы и происходят в тех же местах, так что такие вещи, как оценки максимальной апостериорной вероятности (MAP или MAPP), могут быть найдены из без необходимости знать (или вычислять) . yA(x)=cB(x)cxA(x)B(x)A(x)B(x)A(x)B(x)P(yθ)P(θ)P(y)
Дилип Сарвейт

Ответы:

14

Pr(y) , предельная вероятность , не «игнорируется». Это просто постоянно. Деление на приводит к «пересчету» вычислений которые должны измеряться как собственные вероятности, то есть на интервале . Без этого масштабирования они по-прежнему являются абсолютно допустимыми относительными мерами, но не ограничиваются интервалом .yPr(y)Pr(y|θ)P(θ)[0,1][0,1]

Pr(y) часто "пропускается", потому что часто трудно оценить, и обычно достаточно удобно косвенно выполнять интегрирование с помощью симуляции.Pr(y)=Pr(y|θ)Pr(θ)dθ

Sycorax говорит восстановить Монику
источник
11

Заметь

P(θ|y)=P(θ,y)P(y)=P(y|θ)P(θ)P(y).

Поскольку вы заинтересованы в вычислении плотности , любая функция, которая не зависит от этого параметра, например может быть отброшена. Это дает вамθP(y)

P(θ|y)P(y|θ)P(θ).

Следствием отбрасывания является то, что теперь плотность утратила некоторые свойства, такие как интегрирование с 1 в области . Это не имеет большого значения, поскольку обычно не заинтересованы в интеграции функций правдоподобия, а в их максимизации. И когда вы максимизируете функцию, умножая эту функцию на некоторую константу (помните, что в байесовском подходе данные фиксированы), это не меняет что соответствует максимальной точке. Это меняет значение максимального правдоподобия, но, опять же, каждый обычно интересуется относительным расположением каждого .P(y)P(θ|y)θyθθ

Вальдир Леонсио
источник