Конечно. По сути, это наблюдение того, что распределение Дирихле является сопряженным предшествующим для многочленного распределения. Это означает, что они имеют одинаковую функциональную форму. В статье упоминается об этом, но я просто подчеркну, что это следует из модели полиномиальной выборки. Итак, приступим к этому ...
Наблюдение касается апостериорного положения, поэтому давайте введем некоторые данные , которые представляют собой число различных элементов. Мы наблюдаем выборок всего. Предположим, что взят из неизвестного дистрибутива (в который мы поместим перед -симплексом).K N = ∑ K i = 1 x i x π D i r ( α ) KxKN=∑Ki=1xixπDir(α)K
Задняя вероятность заданного и данных равнаα xπαx
p(π|x,α)=p(x|π)p(π|α)
Вероятность, , является полиномиальным распределением. Теперь давайте выпишем PDF:p(x|π)
p(x|π)=N!x1!⋯xk!πx11⋯πxkk
и
p(π|α)=1B(α)∏i=1Kπα−1i
где . Умножая, мы находим это,B(α)=Γ(α)KΓ(Kα)
p(π|α,x)=p(x|π)p(π|α)∝∏i=1Kπxi+α−1i.
Другими словами, задняя часть также является Dirichlet. Вопрос был о среднем значении. Поскольку задним является Дирихле, мы можем применить формулу для среднего Дирихле, чтобы найти это,
E[πi|α,x]=xi+αN+Kα.
Надеюсь это поможет!
Как примечание, я также хотел бы добавить еще один пункт к вышеупомянутому выводу, который на самом деле не касается основного вопроса. Однако, говоря о априорных значениях Дирихле по многочленовому распределению, я подумал, что стоит упомянуть, что будет формой функции правдоподобия, если мы собираемся принять вероятности в качестве переменных неприятности.
Как правильно указал sydeulissie, пропорционально . Теперь здесь я хотел бы вычислить .p(π|α,x) ∏Ki=1πxi+α−1i p(x|α)
Используя интегральное тождество для гамма-функций, мы имеем:
Приведенный выше вывод вероятности для категориальных данных предлагает более надежный способ работы с этими данными для случаев, когда размер выборки не настолько велик.N
источник