Построение распределения Дирихле с гамма-распределением

18

Пусть X1,,Xk+1 - взаимно независимые случайные величины, каждая из которых имеет гамма-распределение с параметрами αi,i=1,2,,k+1 показывают, что Yi=XiX1++Xk+1,i=1,,k, имеют совместное распределение какDirichlet(α1,α2,,αk;αk+1)

Объединенный pdf из (X1,,Xk+1)=ei=1k+1xix1α11xk+1αk+11Γ(α1)Γ(α2)Γ(αk+1) Затем, чтобы найти совместную pdf из(Y1,,Yk+1)я не могу найти якобиан, т. Е.J(x1,,xk+1y1,,yk+1)

Argha
источник
3
Посмотрите на страницы 13-14 этого документа .
@Procrastinator Большое спасибо, ваш документ - лучший ответ на мой вопрос.
Argha
2
@Procrastinator - возможно, вы должны поставить это в качестве ответа, так как ОП доволен этим, и добавить пару предложений, чтобы вы не отключили предупреждение «мы хотим больше, чем одно предложение»?
jbowman
4
Этот документ сейчас без ответа, потому что это 404.
whuber
2
Машина
обратного

Ответы:

30

Якобианы - абсолютные детерминанты изменения функции переменной - кажутся грозными и могут быть сложными. Тем не менее, они являются неотъемлемой и неизбежной частью расчета многомерного изменения переменной. Казалось бы, для этого ничего нет, кроме как записать матрицу производных на k + 1 и выполнить расчет.k+1k+1

Есть лучший способ. Это показано в конце в разделе «Решение». Поскольку цель этого поста - познакомить статистиков с тем, что может быть новым методом для многих, большая часть этого посвящена объяснению механизма, лежащего в основе решения. Это алгебра дифференциальных форм . (Дифференциальные формы - это то, что объединяется в нескольких измерениях.) Приведен подробный, проработанный пример, чтобы помочь сделать его более знакомым.


Фон

Более века назад математики разработали теорию дифференциальной алгебры для работы с «производными высшего порядка», которые встречаются в многомерной геометрии. Определитель является частным случаем базовых объектов, которыми манипулируют такие алгебры, которые обычно представляют собой чередующиеся полилинейные формы . Прелесть этого в том, насколько простыми могут стать вычисления.

Вот все, что вам нужно знать.

  1. Дифференциала является выражением вида « ». Это конкатенация " d " с любым именем переменной.dxid

  2. Единая форма - это линейная комбинация дифференциалов, таких как или даже x 2 d x 1 - exp ( x 2 ) d x 2 . То есть коэффициенты являются функциямиdx1+dx2x2dx1exp(x2)dx2 переменных.

  3. Формы можно «умножить», используя произведение клина , написанное . Это произведение антикоммутативно (также называется чередующимся ): для любых двух одноформных ω и η ,ωη

    ωη=ηω.

    Это умножение является линейным и ассоциативным: другими словами, оно работает в привычной манере. Непосредственным следствием является то, что ωω=ωω , подразумевая, что квадрат любой одной формы всегда равен нулю. Это делает умножение чрезвычайно простым!

  4. Для целей манипулирования подынтегральные , которые появляются в расчетах вероятности, выражение , как может быть понято как | д х 1д х 2д х к + 1 | ,dx1dx2dxk+1|dx1dx2dxk+1|

  5. Когда является функцией, то ее дифференциал задается дифференцированием:y=g(x1,,xn)

    dy=dg(x1,,xn)=gx1(x1,,xn)dx1++gx1(x1,,xn)dxn.

(y1,,yn)=F(x1,,xn)=(f1(x1,,xn),,fn(x1,,xn)) is, up to sign, simply the coefficient of dx1dxn that appears in computing

dy1dyn=df1(x1,,xn)dfn(x1,,xn)

after expanding each of the dfi as a linear combination of the dxj in rule (5).


Example

The simplicity of this definition of a Jacobian is appealing. Not yet convinced it's worthwhile? Consider the well-known problem of converting two-dimensional integrals from Cartesian coordinates (x,y) to polar coordinates (r,θ), where (x,y)=(rcos(θ),rsin(θ)). The following is an utterly mechanical application of the preceding rules, where "()" is used to abbreviate expressions that will obviously disappear by virtue of rule (3), which implies drdr=dθdθ=0.

dxdy=|dxdy|=|d(rcos(θ))d(rsin(θ))|=|(cos(θ)drrsin(θ)dθ)(sin(θ)dr+rcos(θ)dθ|=|()drdr+()dθdθrsin(θ)dθsin(θ)dr+cos(θ)drrcos(θ)dθ|=|0+0+rsin2(θ)drdθ+rcos2(θ)drdθ|=|r(sin2(θ)+cos2(θ))drdθ)|=r drdθ.

The point of this is the ease with which such calculations can be performed, without messing about with matrices, determinants, or other such multi-indicial objects. You just multiply things out, remembering that wedges are anti-commutative. It's easier than what is taught in high school algebra.


Preliminaries

Let's see this differential algebra in action. In this problem, the PDF of the joint distribution of (X1,X2,,Xk+1) is the product of the individual PDFs (because the Xi are assumed to be independent). In order to handle the change to the variables Yi we must be explicit about the differential elements that will be integrated. These form the term dx1dx2dxk+1. Including the PDF gives the probability element

fX(x,α)dx1dxk+1(x1α11exp(x1))(xk+1αk+11exp(xk+1))dx1dxk+1=x1α11xk+1αk+11exp((x1++xk+1))dx1dxk+1.

(The normalizing constant has been ignored; it will be recovered at the end.)

Staring at the definitions of the Yi a few seconds ought to reveal the utility of introducing the new variable

Z=X1+X2++Xk+1,

giving the relationships

Xi=YiZ.

This suggests making the change of variables xiyiz in the probability element. The intention is to retain the first k variables y1,,yk along with z and then integrate out z. To do so, we have to re-express all the dxi in terms of the new variables. This is the heart of the problem. It's where the differential algebra takes place. To begin with,

dxi=d(yiz)=yidz+zdyi.

Note that since Y1+Y2++Yk+1=1, then

0=d(1)=d(y1+y2++yk+1)=dy1+dy2++dyk+1.

Consider the one-form

ω=dx1++dxk=z(dy1++dyk)+(y1++yk)dz.

It appears in the differential of the last variable:

dxk+1=zdyk+1+yk+1dz=z(dy1++dyk)+(1y1yk)dz=dzω.

The value of this lies in the observation that

dx1dxkω=0

because, when you expand this product, there is one term containing dx1dx1=0 as a factor, another containing dx2dx2=0, and so on: they all disappear. Consequently,

dx1dxkdxk+1=dx1dxkzdx1dxkω=dx1dxkz.

Whence (because all products dzdz disappear),

dx1dxk+1=(zdy1+y1dz)(zdyk+ykdz)dz=zkdy1dykdz.

The Jacobian is simply |zk|=zk, the coefficient of the differential product on the right hand side.


Solution

The transformation (x1,,xk,xk+1)(y1,,yk,z) is one-to-one: its inverse is given by xi=yiz for 1ik and xk+1=z(1y1yk). Therefore we don't have to fuss any more about the new probability element; it simply is

(zy1)α11(zyk)αk1(z(1y1yk))αk+11exp(z)|zkdy1dykdz|=(zα1++αk+11exp(z)dz)(y1α11ykαk1(1y1yk)αk+11dy1dyk).

That is manifestly a product of a Gamma(α1++αk+1) distribution (for Z) and a Dirichlet(α) distribution (for (Y1,,Yk)). In fact, since the original normalizing constant must have been a product of Γ(αi), we deduce immediately that the new normalizing constant must be divided by Γ(α1++αk+1), enabling the PDF to be written

fY(y,α)=Γ(α1++αk+1)Γ(α1)Γ(αk+1)(y1α11ykαk1(1y1yk)αk+11).
whuber
источник