Я пытаюсь понять внутреннюю работу гамильтониана Монте-Карло (HMC), но не могу полностью понять ту часть, когда мы заменяем детерминистическую интеграцию времени предложением Метрополиса-Хастинга. Я читаю замечательную вводную статью Майкла Бетанкура « Концептуальное введение в гамильтониан Монте-Карло », поэтому я буду следовать той же записи, что и в ней.
Фон
Общая цель Марковской цепи Монте-Карло (MCMC) состоит в аппроксимации распределения целевой переменной .q
Идея HMC является введение вспомогательного «импульс» переменный , в сочетании с исходным переменным , смоделированный как «положение». Пара положение-импульс образует расширенное фазовое пространство и может быть описана гамильтоновой динамикой. Совместное распределение можно записать в терминах микроканонического разложения:
,
где представляет параметры на данном энергетическом уровне , также известный как типичный набор . См. Рис. 21 и рис. 22 бумаги для иллюстрации.
Исходная процедура HMC состоит из следующих двух чередующихся этапов:
Стохастический шаг, который выполняет случайный переход между уровнями энергии, и
Детерминированный шаг, который выполняет интегрирование по времени (обычно реализуемое с помощью числовой интеграции с перепрыгиванием) вдоль заданного уровня энергии.
В статье утверждается, что у чехарды (или симплектического интегратора) есть небольшие ошибки, которые приведут к числовому смещению. Таким образом, вместо того, чтобы рассматривать его как детерминированный шаг, мы должны превратить его в предложение Метрополиса-Гастинга (MH), чтобы сделать этот шаг стохастическим, и в результате полученной процедуры будут получены точные выборки из распределения.
Предложение MH выполнит шагов прыжковых операций, а затем перевернет импульс. Предложение будет принято со следующей вероятностью принятия:
Вопросов
Мои вопросы:
1) Почему эта модификация превращения детерминированной временной интеграции в предложение МЗ отменяет числовое смещение, так что сгенерированные выборки точно следуют целевому распределению?
2) С физической точки зрения энергия сохраняется на заданном энергетическом уровне. Вот почему мы можем использовать уравнения Гамильтона:
.
В этом смысле энергия должна быть постоянной везде на типичном множестве, поэтому должно быть равно . Почему существует разница в энергии, которая позволяет нам построить вероятность принятия?H ( q L , - p L )
источник