Обновление байесовского фактора

9

Байесовский фактор определяется в байесовском тестировании гипотезы и выборе байесовской модели соотношением двух предельных правдоподобий: с учетом выборки iid и соответствующих плотностей выборки и , с соответствующими приорами и , для сравнения двух моделей используется байесовский фактор: книга Я в настоящее время рассматривает имеет странное утверждение , что выше Байеса фактор(Икс1,...,ИксN)е1(Икс|θ)е2(Икс|η)π1π2

В12(Икс1,...,ИксN)знак равноЗащитам1(Икс1,...,ИксN)м2(Икс1,...,ИксN)знак равноЗащитаΠязнак равно1Nе1(Икся|θ)π1(dθ)Πязнак равно1Nе2(Икся|η)π2(dη)
В12(Икс1,...,ИксN) «формируется путем умножения отдельных единиц [факторов Байеса] вместе» (стр.118). Это формально верно, если использовать разложение но я не вижу вычислительного преимущества в этой декомпозиции как обновления требует таких же вычислительных усилий, что и исходное вычисление
В12(Икс1,...,ИксN)знак равном1(Икс1,...,ИксN)м2(Икс1,...,ИксN)знак равном1(ИксN|Икс1,...,ИксN-1)м2(ИксN|Икс1,...,ИксN-1)×м1(ИксN-1|ИксN-2,...,Икс1)м2(ИксN-1|ИксN-2,...,Икс1)××м1(Икс1)м2(Икс1)
м1(ИксN|Икс1,...,ИксN-1)м2(ИксN|Икс1,...,ИксN-1)
м1(Икс1,...,ИксN)м2(Икс1,...,ИксN)
за пределами примеров искусственных игрушек.

Вопрос: существует ли общий и эффективный с точки зрения вычислений способ обновления фактора Байеса с до , который не требует пересчета целых маргиналов и ?В12(Икс1,...,ИксN)В12(Икс1,...,ИксN+1)м1(Икс1,...,ИксN)м2(Икс1,...,ИксN)

Моя интуиция заключается в том, что, кроме фильтров частиц, которые действительно продолжают оценивать байесовские факторы одному новому наблюдению за один раз, нет естественного способа ответить на этот вопрос ,В12(Икс1,...,ИксN)

Сиань
источник
1
Мне не кажется ясным, что формулировка подразумевает обязательную последовательную факторизацию, так как наблюдения там же. В аспирантуре профессор упомянул, что продукт подразумевает, что можно использовать асимптотические приближения для байесовского анализа, но странным образом это не завоевало популярность (сарказм). Может быть, книга может быть намекает на это?
Клифф AB
@CliffAB: Да, вы можете переписать вероятность как среднее значение отдельных терминов, сходясь к расстоянию Кульбака-Лейблера от истинного распределения. Но я не думаю, что это так, хотя книга недостаточно ясна, чтобы держать все варианты открытыми.
Сиань
1
Я полагаю, что во втором отображаемом уравнении есть опечатка: должно ли быть во втором множителе во второй строке? м1(ИксN-1|ИксN-1,...,Икс1)
Йохен

Ответы:

4

Предположительно, цель рекурсивного уравнения для байесовского фактора будет заключаться в том, что вы уже рассчитали байесовский коэффициент для точек данных и хотите иметь возможность обновить его с помощью одной дополнительной точки данных. Кажется, что это можно сделать без пересчета маргиналов предыдущего вектора данных, если известна форма апостериорной функции . Предполагая, что мы знаем форму этой функции (и принимая данные IID, как в вашем вопросе), прогнозирующая плотность может быть записана как:NπN

м(ИксN+1|Икс1,,,,,ИксN)знак равноΘе(ИксN+1|θ)πN(dθ|Икс1,,,,,ИксN),

Следовательно, у вас есть:

м(Икс1,,,,,ИксN+1)знак равном(Икс1,,,,,ИксN)Θе(ИксN+1|θ)πN(dθ|Икс1,,,,,ИксN),

Сравнивая два модельных класса с помощью байесовского фактора, мы получаем рекурсивное уравнение:

В12(Икс1,,,,,ИксN+1)знак равноВ12(Икс1,,,,,ИксN)Θ1е(ИксN+1|θ)π1,N(dθ|Икс1,,,,,ИксN)Θ2е(ИксN+1|θ)π2,N(dθ|Икс1,,,,,ИксN),

Это все еще включает в себя интеграцию по диапазону параметров, поэтому я согласен с вашей точкой зрения, что, по-видимому, нет никакого вычислительного преимущества по сравнению с простым пересчетом коэффициента Байеса через исходную формулу, которую вы даете. Тем не менее, вы можете видеть, что это не требует пересчета предельных значений для предыдущего вектора данных. (Вместо этого мы вычисляем прогнозируемую плотность новой точки данных, зависящую от предыдущих данных, для каждого из классов модели.) Как и вы, я не вижу в этом никакого вычислительного преимущества, если только не произойдет, что эта интегральная формула легко упрощается. В любом случае, я полагаю, это дает вам другую формулу для обновления байесовского фактора.

Бен - Восстановить Монику
источник
Спасибо. Это правда, что маргинальные значения не нужно пересчитывать, строго говоря , но объем вычислений, как вы заметили, одинаков.
Сиань
N