MCMC; Можем ли мы быть уверены, что у нас есть «чистый» и «достаточно большой» образец сзади? Как это может работать, если мы не?

12

Обращаясь к этой теме: Как бы вы объяснили Маркову цепь Монте-Карло (MCMC) непрофессионалу? ,

Я могу видеть, что это комбинация цепей Маркова и Монте-Карло: цепь Маркова создается с апостериорным в качестве инвариантного предельного распределения, а затем рисуются монте-карло (зависимые) из предельного распределения (= нашего апостериорного).

Допустим (я знаю, что я здесь упрощаю), что после шагов мы находимся в предельном распределении Π (*).LΠ

Цепь Маркова, являющаяся последовательностью случайных величин, дает последовательность , где X i - случайная величина, а Π - ограничивающая «случайная величина» '' из которого мы хотим попробовать. X1,X2,,XL,Π,Π,Π,ΠXiΠ

MCMC начинается с начального значения, то есть является случайной величиной со всей массой при этом одном значении x 1 . Если я буду использовать заглавные буквы для случайных величин и строчных букв для реализаций случайной величины, то MCMC дает мне последовательность х 1 , х 2 , х 3 , ... х L , П 1 , π 2 , π 3 , . , , , π н . Таким образом, длина цепочки MCMC равна L + n.X1x1x1,x2,x3,xL,π1,π2,π3,....πn

[[* Примечание: заглавные буквы - это случайные величины (т. Е. Целая группа результатов), а маленькие - это результаты, т. Е. Одно конкретное значение. *]]x

Очевидно, только принадлежит моему «заднему» и для аппроксимации заднего «колодца» значение n должно быть «достаточно большим».πin

Если я описываю это , то у меня есть цепь MCMC длины N = L + n , только π 1 , π 2 , , π n имеют отношение к моему апостериорному приближению, и n должно быть достаточно большим.x1,x2,x3,xL,π1,π2,π3,....πnN=L+nπ1,π2,,πnn

Если я включу некоторые из (т.е. реализации до того, как будет достигнуто инвариантное распределение) в вычисление аппроксимации апостериорного значения, то это будет «шумно».xi

Я знаю длину цепи MCMC , но без знания L , т. Е. Шага , на котором я уверен, что произвожу выборку из предельного распределения, я не могу быть уверен, что я не включил шум, и не могу быть уверенным в n = N - L , размере моей выборки из предельного распределения, в частности, я не могу быть уверен, является ли она «достаточно большой». N=L+nLn=NL

Итак, насколько я понял, это значение имеет решающее значение для качества аппроксимации апостериорного (исключение шума и большой выборки из него)L .

Существуют ли способы найти разумную оценку для когда я применяю MCMC?L

(*) Я думаю, что в общем случае будет зависеть от начального значения x 1 .Lx1

Сообщество
источник

Ответы:

6

TL DR; Вы не можете оценить так как L = . Таким образом, упрощающее предположение никогда не может быть действительно возможным. (Там может быть несколько случаев, когда это так, но не в общем мире MCMC). Однако вы можете решить, что N сделает раннее смещение небольшим.LL=N


По сути, ваш вопрос сводится к тому, «как мы можем оценить время выгорания?». Выгорание - это акт выбрасывания начальных образцов, потому что цепь Маркова не сходится. Существует множество диагностических средств MCMC, которые помогут вам оценить время «выгорания», с обзором можно ознакомиться здесь .

LLL

Теперь я перехожу к более техническим деталям вашего вопроса.

LLLL

LL

LNX1,X2,X3,,XNLLθ

θ¯N=1Ni=1NXi.

NL

Nθ

(θ¯Nθ)N

N(θ¯Nθ)dNp(0,Σ),

θRpΣ

Σ/N

Greenparker
источник
LΣ/nθ^N
Σ/Nθ¯N
X1πg¯n
X1ππ