Как получить выборку Гиббса?

11

Я на самом деле стесняюсь спросить об этом, потому что боюсь, что меня будут перенаправлять на другие вопросы или на Википедию о выборке Гиббса, но у меня нет ощущения, что они описывают то, что под рукой.

При заданной условной вероятности : p(x|y)

p(x|y)y=y0y=y1x=x01426x=x13446

И условная вероятность : p(y|x)

p(y|x)y=y0y=y1x=x01323x=x13747

Мы можем однозначно придумать совместную вероятность :funique=p(x,y)

p(x,y)y=y0y=y1p(x)x=x0a0a1c0x=x1a2a3c1p(y)b0b1

Потому что, хотя у нас есть неизвестных, у нас есть больше ( ) линейных уравнений:842+3

a0+a1+a2+a3=1b0+b1=1c0+c1=1

Также как и:

14b0=a034b0=a226(1b0)=a146(1b0)=a313c0=a023c0=a137(1c0)=a247(1c0)=a3

Это быстро решается с помощью , . А именно, приравнивая к . Это дает а остальное следует.c0=34b023c0=a124b0=a126(1b0)=a1b0=25

p(x,y)y=y0y=y1p(x)x=x0110210310x=x1310410710p(y)410610

Итак, теперь мы переходим к непрерывному случаю. Можно вообразить интервалы и держать вышеупомянутую структуру в такте (с большим количеством уравнений, чем неизвестных). Однако что происходит, когда мы переходим к (точечным) экземплярам случайных величин? Как работает выборка

xap(x|y=yb)ybp(y|x=xa)

итеративно, привести к ? Эквивалентно ограничению , как это обеспечивает например? Аналогично с . Можем ли мы записать ограничения и извлечь выборку Гиббса из первых принципов?p(x,y)a0+a1+a2+a3=1XYp(x,y)dydx=1Yp(y|x)dy=1

Итак, меня не интересует, как выполнить выборку Гиббса, что просто, но меня интересует, как ее получить и, предпочтительно, как доказать, что она работает (вероятно, при определенных условиях).

Энн ван Россум
источник

Ответы:

9

Вычисление совместного распределения из условных распределений вообще очень сложно. Если условные распределения выбираются произвольно, общее совместное распределение может даже не существовать. В этом случае даже показать, что условные распределения согласованы, как правило, сложно. Одним из результатов, который можно использовать для получения совместного распределения, является лемма Брука , выбрав фиксированное состояние , хотя я никогда не использовал его самостоятельно для этой цели. Более подробно на эту тему я бы посмотрел на работу Джулиана Бесага.

p(x)p(x)=ip(xix<i,x>i)p(xix<i,x>i),
x

Однако, чтобы доказать, что выборка Гиббса работает, лучше выбрать другой маршрут. Если цепь Маркова, реализованная алгоритмом выборки, имеет распределение качестве инвариантного распределения и является неприводимым и апериодическим , то цепь Маркова будет сходиться к этому распределению (Tierney, 1994) .p

Выборка Гиббса всегда оставляет инвариант совместного распределения, из которого были получены условные распределения: грубо, если и мы производим выборку , тогда(x0,y0)p(x0,y0)x1p(x1y0)

(x1,y0)p(x0,y0)p(x1y0)dx0=p(x1y0)p(y0)=p(x1,y0).

То есть, обновление путем условной выборки не меняет распределение выборки.x

Однако выборка Гиббса не всегда неприводима . Несмотря на то, что мы всегда можем применить его, не нарушая ничего (в том смысле, что если у нас уже есть выборка из желаемого распределения, это не изменит распределение), то от совместного распределения зависит, действительно ли выборка Гиббса сходится к нему (достаточно просто Условием неприводимости является то, что плотность всюду положительна, ).p(x)>0

Лукас
источник
Интересная проблема по совместимости. Сейчас я проверяю «Совместимость конечных дискретных условных распределений» (Song et al.), Которые используют «матрицу отношений» для установления совместимости и уникальности. Таким образом, Гиббс не может быть выведен из этих ограничений, потому что они не применяются с самого начала. Я могу предположить, что это могло бы возвратить некоторое неправильное совместное распределение (сумма> 1), если условные распределения несовместимы, например. Как-то, однако, у меня есть ощущение, что то, что я делаю, является чем-то детерминированным, чем-то похожим на преобразование Радона. Выборка Гиббса выглядит такой ... грязной.
Энн ван Россум