Я исследую метод автоматической проверки методов Монте-Карло цепей Маркова и хотел бы привести примеры ошибок, которые могут возникнуть при построении или реализации таких алгоритмов. Бонусные баллы, если в опубликованной статье использовался неправильный метод.
Меня особенно интересуют случаи, когда ошибка означает, что цепочка имеет неправильное инвариантное распределение, хотя другие типы ошибок (например, цепочка не эргодическая) также могут представлять интерес.
Примером такой ошибки может быть отсутствие вывода значения, когда Metropolis-Hastings отклоняет предложенный ход.
Ответы:
1. Предельная вероятность и средняя гармоническая оценка
Предельная вероятность определяются как нормализующий константы заднего распределения
Важность этой величины обусловлена той ролью, которую она играет в сравнении моделей с помощью байесовских факторов .
Было предложено несколько методов для аппроксимации этой величины. Raftery et al. (2007) предлагают оценку средней гармоники , которая быстро стала популярной благодаря своей простоте. Идея состоит в использовании отношения
Поэтому, если у нас есть образец с задней стороны, скажем , эта величина может быть аппроксимирована(θ1,...,θN)
Это приближение связано с концепцией выборки значения .
По закону больших чисел, как это обсуждалось в Ниле блоге , мы имеем , что эта оценка является последовательной . Проблема в том, что требуемое для хорошего приближения может быть огромным. Посмотрите блог Нила или блог Роберта 1 , 2 , 3 , 4 для некоторых примеров.N
альтернативы
Есть много альтернатив для аппроксимации . Шопен и Роберт (2008) представляют некоторые важные методы на основе выборки.p(x)
2. Недостаточная длительность работы сэмплера MCMC (особенно при наличии мультимодальности)
Mendoza и Gutierrez-Peña (1999) выводят эталонный априорный / апостериорный коэффициент для двух нормальных средних и представляют пример выводов, полученных с помощью этой модели с использованием реального набора данных. Используя методы MCMC, они получают выборку размером от апостериорного отношения средств которое показано ниже2000 φ
И получите интервал HPD для . После анализа выражения апостериорного распределения легко увидеть, что оно имеет сингулярность в а апостериор должен выглядеть примерно так (обратите внимание на сингулярность в )φ (0.63,5.29) 0 0
Что может быть обнаружено только в том случае, если вы используете пробоотборник MCMC достаточно долго или используете адаптивный метод. HPD, полученный с помощью одного из этих методов, равен как уже сообщалось . Длина интервала HPD значительно увеличивается, что имеет важные последствия при сравнении его длины с частыми / классическими методами.(0,7.25)
3. Некоторые другие вопросы, такие как оценка сходимости, выбор начальных значений, плохое поведение цепочки, можно найти в этой дискуссии Гельмана, Карлина и Нила.
4. Важность выборки
Метод аппроксимации интеграла состоит в умножении подынтегрального выражения на плотность с тем же носителем, который мы можем смоделировать изg
Тогда, если у нас есть выборка из , , мы можем приблизить следующим образомg (x1,...,xN) I
Возможная проблема состоит в том, что у должны быть хвосты, более тяжелые / подобные / чем или требуемое для хорошего приближения может быть огромным Смотрите следующий пример игрушки в R.ф нg f N
источник
Даррен Уилкинсон в своем блоге приводит подробный пример распространенной ошибки в случайной прогулке Метрополис-Гастингс. Я рекомендую прочитать его полностью, но вот версия tl; dr.
Если целевое распределение является положительным (например, гамма-распределения и т. Д. ) В одном измерении, заманчиво отклонить предложения, которые имеют отрицательное значение в этом измерении сразу. Ошибка состоит в том, чтобы отбросить предложения, как будто они никогда не были реализованы, и оценить только коэффициент приемлемости Метрополис-Гастингс (МЗ). Это ошибка, поскольку она сводится к использованию несимметричной плотности предложений.
Автор предлагает применить одно из двух исправлений.
Считайте «негативы» неудачными в принятии (и теряйте немного эффективности).
Используйте правильное соотношение MH в этом случае, которое является
где - плотность цели, а - константа нормализации усеченного предложения случайного блуждания , т.е. .Φ ϕ Φ ( x ) = ∫ ∞ 0 ϕ ( y - x ) d yπ Φ ϕ Φ(x)=∫∞0ϕ(y−x)dy
источник
Очень ясный случай (связанный с приближением предельного правдоподобия, упомянутым в первом ответе), где истинная сходимость является примером проблемы переключения меток в моделях смеси в сочетании с использованием оценки Чиба (1995) . Как указывает Рэдфорд Нил (1999), если цепочка MCMC не сходится правильно, в том смысле, что она исследует некоторые из режимов распределения цели, приближение Монта-Карло Чиба не достигает правильного числового значения.
источник