Мое понимание алгоритма следующее:
Пробоотборник без разворота (NUTS) - это метод Гамильтона Монте-Карло. Это означает, что это не метод цепей Маркова, и, таким образом, этот алгоритм избегает части случайного блуждания, которая часто считается неэффективной и медленно сходится.
Вместо случайного блуждания NUTS делает прыжки длиной x. Каждый прыжок удваивается, поскольку алгоритм продолжает выполняться. Это происходит до тех пор, пока траектория не достигнет точки, в которой она хочет вернуться к начальной точке.
Мои вопросы: что такого особенного в развороте? Как удвоение траектории не пропускает оптимизированную точку? Правильно ли мое приведенное выше описание?
bayesian
monte-carlo
markov-process
user3007270
источник
источник
Ответы:
Бит без разворота - это то, как создаются предложения. HMC генерирует гипотетическую физическую систему: представьте шар с определенной кинетической энергией, катящийся по ландшафту с долинами и холмами (аналогия разбивается на более чем 2 измерения), заданную апостериором, из которого вы хотите произвести выборку. Каждый раз, когда вы хотите взять новый образец MCMC, вы случайным образом выбираете кинетическую энергию и начинаете катиться оттуда, где вы находитесь. Вы симулируете с дискретными временными шагами, и чтобы убедиться, что вы правильно исследуете пространство параметров, вы симулируете шаги в одном направлении и вдвое больше в другом направлении, снова поворачиваетесь и т. Д. В какой-то момент вы хотите остановить это и хороший способ делать это, когда вы сделали разворот (то есть, кажется, повсюду).
В этот момент предлагаемый следующий шаг вашей цепи Маркова выбирается (с некоторыми ограничениями) из посещенных вами пунктов. То есть, что вся симуляция гипотетической физической системы была «просто», чтобы получить предложение, которое затем принимается (следующий образец MCMC является предложенным пунктом) или отклоняется (следующий образец MCMC является отправной точкой).
Самое умное в том, что предложения делаются на основе формы апостериора и могут быть на другом конце распределения. В отличие от Metropolis-Hastings, делающего предложения в пределах (возможно, искаженного) шара, выборка Гиббса перемещается только по одному (или, по крайней мере, очень немногим) измерениям за один раз.
источник
Вы ошибаетесь, что HMC не является методом цепочки Маркова. В Википедии :
Для большей ясности прочтите статью arXiv от Betancourt , в которой упоминаются критерии завершения NUTS:
Приложение A.3 говорит о чем-то вроде траектории удвоения, которую вы упоминаете:
и расширяет это в A.4, где говорится о динамической реализации (раздел A.3 говорит о статической реализации):
Я думаю, что ключ в том, что он не делает двойные прыжки, он рассчитывает свой следующий прыжок, используя технику, которая удваивает длину предлагаемого прыжка до тех пор, пока критерий не будет удовлетворен. По крайней мере, так я понимаю статью до сих пор.
источник