Мой основной вопрос: как бы вы пробовали неправильный дистрибутив? Имеет ли смысл пробовать неправильный дистрибутив?
Здесь комментарии Сианя как бы касаются вопроса, но я искал некоторые подробности по этому поводу.
Более конкретно для MCMC:
Говоря о MCMC и читая статьи, авторы подчеркивают, что получили правильные апостериорные распределения. Есть знаменитая газета Geyer (1992), в которой автор забыл проверить правильность их апостериорных (в противном случае это отличная статья).
Но предположим, что у нас есть вероятность и неправильное априорное распределение на θ , так что результирующий апостериор также неправильный, и MCMC используется для выборки из распределения. В этом случае, что указывает образец? Есть ли в этом образце полезная информация? Мне известно, что цепь Маркова здесь является либо временной, либо нуль-рекуррентной. Есть ли какие-нибудь положительные результаты, если они не повторяются ?
Наконец, в ответе Нила Джи здесь он упоминает
Вы можете обычно пробовать (используя MCMC) сзади, даже если это неправильно.
Он упоминает, что такая выборка распространена в глубоком обучении. Если это правда, как это имеет смысл?
источник
Ответы:
Выборка из неправильного апостериорного (плотности) не имеет смысла с вероятностной / теоретической точки зрения. Причина этого заключается в том, что функция f не имеет конечного интеграла по пространству параметров и, следовательно, не может быть связана с вероятностной моделью ( Ω , σ , P ) (пространство, сигма-алгебра, вероятностная мера) ).е е ( Ω , σ, Р )
Если у вас есть модель с неправильным априорным положением, которое приводит к неправильному заднему, во многих случаях вы все еще можете взять образец из нее, используя MCMC, например, Metropolis-Hastings, и «задние образцы» могут выглядеть разумно. Это выглядит интригующе и парадоксально на первый взгляд. Однако причина этого заключается в том, что методы MCMC на практике ограничены числовыми ограничениями компьютеров, и, следовательно, все опоры ограничены (и дискретны!) Для компьютера. Затем, при этих ограничениях (ограниченность и дискретность) апостериор в большинстве случаев является правильным.
Существует замечательная ссылка Хоберта и Казеллы, которая представляет пример (немного другой природы), где вы можете построить сэмплер Гиббса для апостериорного, задние сэмплы выглядят совершенно разумными, но апостериорный является неподходящим!
http://www.jstor.org/stable/2291572
Подобный пример недавно появился здесь . На самом деле, Хоберт и Казелла предупреждают читателя, что методы MCMC нельзя использовать для выявления неправильности апостериорной системы, и что это необходимо проверять отдельно, прежде чем применять какие-либо методы MCMC. В итоге:
PS (немного языком в щеку): Не всегда верьте тому, что люди делают в машинном обучении. Профессор Брайан Рипли сказал: «Машинное обучение - это статистика без всякой проверки моделей и предположений».
источник
Предоставление альтернативного, более прикладного, взгляда из превосходного ответа Рода выше -
Так что в принципе я был бы вполне согласен с использованием сгенерированной MCMC выборки из ненадлежащего распределения в прикладной работе, но я бы уделил много внимания тому, как возникло это нарушение и как на него повлияет случайная выборка. , В идеале, случайная выборка не будет затронута этим, как в моем примере с хот-догами, где в разумном мире вы бы никогда не сгенерировали случайное число больше, чем число людей в Сан-Франциско ...
Вам также следует помнить о том факте, что ваши результаты могут быть весьма чувствительны к функции апостериорного значения, которая привела к тому, что она является неправильной, даже если впоследствии вы усекаете ее на некоторое большое количество (или какое-либо изменение, подходящее для вашей модели. ) Вы хотели бы, чтобы ваши результаты были устойчивыми к незначительным изменениям, которые смещают ваш задний план от неправильного к правильному. Это может быть труднее обеспечить, но все это является частью более сложной проблемы, заключающейся в том, чтобы убедиться, что ваши результаты соответствуют вашим предположениям, особенно тем, которые сделаны для удобства.
источник