Насколько я понимаю, при использовании байесовского подхода для оценки значений параметров:
- Апостериорное распределение представляет собой комбинацию предшествующего распределения и распределения правдоподобия.
- Мы моделируем это, генерируя выборку из апостериорного распределения (например, используя алгоритм Метрополиса-Хастинга для генерации значений и принимаем их, если они превышают определенный порог вероятности принадлежности к апостериорному распределению).
- После того, как мы сгенерировали этот образец, мы используем его для аппроксимации апостериорного распределения и таких вещей, как его среднее значение.
Но я чувствую, что должен что-то неправильно понять. Похоже, у нас есть апостериорное распределение, а затем выборка из него, а затем мы используем эту выборку в качестве аппроксимации апостериорного распределения. Но если у нас есть апостериорное распределение для начала, почему мы должны брать из него выборку, чтобы приблизить его?
Да, у вас может быть аналитическое апостериорное распределение. Но ядром байесовского анализа является маргинализация по заднему распределению параметров, чтобы вы могли получить лучший результат прогнозирования как с точки зрения точности, так и с точки зрения возможности обобщения. По сути, вы хотите получить прогнозное распределение, которое имеет следующую форму.
источник