Можно ли доверять адаптивному MCMC?

20

Я читаю об адаптивном MCMC (см., Например, главу 4 « Справочника цепи Маркова Монте-Карло» , изд. Brooks et al., 2011; а также Andrieu & Thoms, 2008 ).

Основной результат Roberts and Rosenthal (2007) состоит в том, что если схема адаптации удовлетворяет исчезающему условию адаптации (плюс некоторая другая техническая специфика), адаптивный MCMC является эргодическим для любой схемы. Например, исчезающая адаптация может быть легко получена путем адаптации оператора перехода на итерации с вероятностью , с .Nп(N)ИтNп(N)знак равно0

Этот результат (апостериорный) интуитивен, асимптотически. Так как степень адаптации стремится к нулю, в конечном итоге она не испортит эргодичность. Меня беспокоит то, что происходит с ограниченным временем.

  • Откуда мы знаем, что адаптация не мешает эргодичности в данный конечный момент времени, и что пробоотборник отбирает выборку из правильного распределения? Если это вообще имеет смысл, то сколько нужно сделать, чтобы ранняя адаптация не смещала цепи?

  • У практиков в области доверия адаптивного MCMC? Причина, по которой я спрашиваю, состоит в том, что я видел много недавних методов, которые пытаются встроить адаптацию другими, более сложными способами, которые, как известно, уважают эргодичность, такими как методы регенерации или ансамбля (то есть, законно выбирать переход оператор, который зависит от состояния других параллельных цепей). В качестве альтернативы, адаптация выполняется только во время выгорания, например, в Stan , но не во время выполнения. Все эти усилия показывают мне, что адаптивный MCMC по Робертсу и Розенталю (что было бы невероятно просто реализовать) не считается надежным; но, возможно, есть и другие причины.

  • Как насчет конкретных реализаций, таких как адаптивный Метрополис-Гастингс ( Haario et al. 2001 )?


Ссылки

lacerbi
источник
1
+1 но есть ли гарантии с ограниченным временем даже для неадаптивных MCMC?
Юхо Коккала
2
@JuhoKokkala: вероятно, нет, но кажется, что с помощью адаптивного MCMC добавляется еще один уровень возможных способов отказа, которые менее понятны и сложнее проверить, чем стандартные проблемы конвергенции (которые уже довольно трудно диагностировать сами по себе). По крайней мере, это мое понимание того, почему практикующие (я, например) будут настороженно относиться к этому.
Lacerbi
1
Я думаю, что адаптация во время прожига - лучший способ справиться с адаптацией. Очевидно, что если у вас есть некоторые области задней поверхности, которые требуют настройки, отличной от других, у вас будут проблемы, но если это так, если вы используете полностью адаптивную MCMC, вам не разрешат сильно адаптироваться из-за исчезающего состояния в любом случае .. .
sega_sai

Ответы:

2

Откуда мы знаем, что адаптация не мешает эргодичности в данный конечный момент времени, и что пробоотборник отбирает выборку из правильного распределения? Если это вообще имеет смысл, то сколько нужно сделать, чтобы ранняя адаптация не смещала цепи?

Эргодичность и предвзятость касаются асимптотических свойств цепи Маркова, они ничего не говорят о поведении и распределении цепи Маркова at a given finite time. Адаптивность не имеет ничего общего с этой проблемой, любой алгоритм MCMC может производить моделирования далеко от цели at a given finite time.

Сиань
источник
1
(+1) Спасибо за разъяснения. Да, я понимаю, что алгоритмы MCMC не имеют никаких гарантий at a given finite time. Однако на практике мы используем их так, как если бы они обеспечивали хорошее / разумное приближение к целевому распределению в заданное конечное время, даже если в большинстве случаев теоретические гарантии отсутствуют (AFAIK математически понимается только несколько случаев). Может быть, я должен сказать "испортить время смешивания "? Это ближе к тому, что я имел в виду. Если у вас есть предложения о том, как исправить язык, пожалуйста, дайте мне знать.
Lacerbi