Является ли выборка на основе цепей Маркова «лучшей» для выборки Монте-Карло? Существуют ли альтернативные схемы?

10

Марковская цепь Монте-Карло - это метод, основанный на цепях Маркова, который позволяет нам получать выборки (в условиях Монте-Карло) из нестандартных распределений, из которых мы не можем напрямую брать выборки.

Мой вопрос заключается в том, почему цепь Маркова является «современной» для отбора проб Монте-Карло. Альтернативный вопрос может быть, есть ли другие способы, такие как цепи Маркова, которые могут быть использованы для отбора проб Монте-Карло? Я знаю (по крайней мере, глядя на литературу), что MCMC имеет глубокие теоретические корни (с точки зрения условий, таких как (а) периодичность, однородность и детальное равновесие), но мне интересно, существуют ли какие-либо «сопоставимые» вероятностные модели / методы для Монте Сэмплинг Карло похож на цепи Маркова.

Пожалуйста, помогите мне, если я запутал некоторую часть вопроса (или, если она кажется запутанной в целом).

Икрам Улла
источник

Ответы:

11

Нет оснований утверждать, что выборка MCMC является «лучшим» методом Монте-Карло! Обычно это наоборот хуже, чем выборка iid, по крайней мере, с точки зрения дисперсии итоговых оценок Монте-Карло Действительно, хотя это среднее сходится к ожиданию когда является стационарным и ограничивающим распределением цепи Маркова , при использовании методов MCMC есть как минимум два недостатка:

1TΣTзнак равно1Tчас(ИксT)
Еπ[час(Икс)]π(ИксT)T
  1. Цепочка должна «достичь стационарности», что означает, что ей нужно забыть о своем начальном значении . Другими словами, должно быть «достаточно большим», чтобы распространялся из . Иногда «достаточно большой» может на несколько порядков превышать вычислительный бюджет для эксперимента.Икс0TИксTπ
  2. Значения коррелированы, что приводит к асимптотической дисперсии, которая включает которая обычно превышает и, следовательно, требует более длительного моделирования, чем для образца iid.ИксT
    варπ(Икс)+2ΣTзнак равно1сОУπ(Икс0,ИксT)
    варπ(Икс)

При этом MCMC очень полезен для обработки параметров, в которых регулярная выборка с помощью iid невозможна или слишком затратна, и где выборка по важности довольно трудно откалибровать, в частности, из-за размерности случайной величины, которая должна быть смоделирована.

Однако последовательные методы Монте-Карло, такие как фильтры частиц, могут быть более подходящими в динамических моделях, где данные поступают в виде пакетов, которые требуют немедленного внимания и могут даже исчезнуть (то есть не могут быть сохранены) через короткое время.

В заключение, MCMC - очень полезный (и очень часто используемый) инструмент для обработки сложных настроек, когда обычные решения Монте-Карло дают сбой.

Сиань
источник
8

Существует несколько способов генерирования случайных значений из распределения, McMC является одним из них, но несколько других также могут рассматриваться как методы Монте-Карло (без части цепи Маркова).

Наиболее прямым для одномерной выборки является генерация равномерной случайной величины, а затем ее включение в обратную функцию CDF. Это прекрасно работает, если у вас есть обратный CDF, но хлопотно, когда CDF и / или его обратный трудно вычислить напрямую.

Для многомерных задач вы можете сгенерировать данные из связки, а затем использовать обратный метод CDF для сгенерированных значений, чтобы иметь некоторый уровень корреляции между переменными (хотя для определения правильных параметров связки для получения желаемого уровня корреляции часто требуется немного методом проб и ошибок).

Отклонение выборки - это еще один подход, который можно использовать для генерации данных из распределения (одномерного или многомерного), где вам не нужно знать CDF или его обратное (и вам даже не нужна нормализующая константа для функции плотности), но в некоторых случаях это может быть крайне неэффективно, что занимает много времени.

Если вас интересуют сводки сгенерированных данных, а не случайные точки, то выборка важности - это еще один вариант.

Выборка Гиббса, которая является формой выборки McMC, позволяет выбирать, где вы не знаете точную форму многомерного распределения, если вы знаете условное распределение для каждой переменной с учетом других.

Есть и другие, которые лучше всего зависят от того, что вы знаете и не знаете, а также от других деталей конкретной проблемы. McMC популярен, потому что он хорошо работает во многих ситуациях и обобщает для многих различных случаев.

Грег Сноу
источник