Байесовский фактор определяется в байесовском тестировании гипотезы и выборе байесовской модели соотношением двух предельных правдоподобий: с учетом выборки iid и соответствующих плотностей выборки и , с соответствующими приорами и , для сравнения двух моделей используется байесовский фактор:
книга Я в настоящее время рассматривает имеет странное утверждение , что выше Байеса фактор( х1, … , ХN)е1( х | θ )е2( х | η)π1π2В12( х1, … , ХN) =Защитам1( х1, … , ХN)м2( х1, … , ХN)знак равноЗащита∫ΠNя = 1е1( хя| θ) π1( д θ )∫ΠNя = 1е2( хя| η) π2( д η)
В12( х1, … , ХN) «формируется путем умножения отдельных единиц [факторов Байеса] вместе» (стр.118). Это формально верно, если использовать разложение
но я не вижу вычислительного преимущества в этой декомпозиции как обновления требует таких же вычислительных усилий, что и исходное вычислениеВ12( х1, … , ХN)= м1( х1, … , ХN)м2( х1, … , ХN)= м1( хN| Икс1, … , Хn - 1)м2( хN| Икс1, … , Хn - 1)× м1( хn - 1| Иксп - 2, … , Х1)м2( хn - 1| Иксп - 2, … , Х1)× ⋯⋯ × м1( х1)м2( х1)
м1( хN| Икс1, … , Хn - 1)м2( хN| Икс1, … , Хn - 1)
м1( х1, … , ХN)м2( х1, … , ХN)
за пределами примеров искусственных игрушек.
Вопрос: существует ли общий и эффективный с точки зрения вычислений способ обновления фактора Байеса с до
, который не требует пересчета целых маргиналов и
?В12( х1, … , ХN)В12( х1, … , Хn + 1)м1( х1, … , ХN)м2( х1, … , ХN)
Моя интуиция заключается в том, что, кроме фильтров частиц, которые действительно продолжают оценивать байесовские факторы одному новому наблюдению за один раз, нет естественного способа ответить на этот вопрос ,В12( х1, … , ХN)
Ответы:
Предположительно, цель рекурсивного уравнения для байесовского фактора будет заключаться в том, что вы уже рассчитали байесовский коэффициент для точек данных и хотите иметь возможность обновить его с помощью одной дополнительной точки данных. Кажется, что это можно сделать без пересчета маргиналов предыдущего вектора данных, если известна форма апостериорной функции . Предполагая, что мы знаем форму этой функции (и принимая данные IID, как в вашем вопросе), прогнозирующая плотность может быть записана как:N πN
Следовательно, у вас есть:
Сравнивая два модельных класса с помощью байесовского фактора, мы получаем рекурсивное уравнение:
Это все еще включает в себя интеграцию по диапазону параметров, поэтому я согласен с вашей точкой зрения, что, по-видимому, нет никакого вычислительного преимущества по сравнению с простым пересчетом коэффициента Байеса через исходную формулу, которую вы даете. Тем не менее, вы можете видеть, что это не требует пересчета предельных значений для предыдущего вектора данных. (Вместо этого мы вычисляем прогнозируемую плотность новой точки данных, зависящую от предыдущих данных, для каждого из классов модели.) Как и вы, я не вижу в этом никакого вычислительного преимущества, если только не произойдет, что эта интегральная формула легко упрощается. В любом случае, я полагаю, это дает вам другую формулу для обновления байесовского фактора.
источник