Я пытаюсь реализовать модель гауссовой смеси со стохастическим вариационным выводом, следуя этой статье .
Это программа гауссовой смеси.
Согласно статье, полный алгоритм стохастического вариационного вывода:
И я все еще очень запутался в методе масштабирования до GMM.
Во-первых, я думал, что локальный вариационный параметр - это просто а все остальные - глобальные параметры. Пожалуйста, поправьте меня, если я был неправ. Что означает шаг 6 ? Что я должен сделать, чтобы достичь этого?as though Xi is replicated by N times
Не могли бы вы помочь мне с этим? Заранее спасибо!
Ответы:
Этот учебник ( https://chrisdxie.files.wordpress.com/2016/06/in-depth-variational-inference-tutorial.pdf ) отвечает на большинство ваших вопросов, и, вероятно, будет легче понять, чем оригинальная статья SVI, как В нем подробно рассматриваются все детали реализации SVI (и координатного восхождения VI и выборки Гиббса) для гауссовой модели смеси (с известной дисперсией).
источник
Сначала несколько замечаний, которые помогут мне разобраться в статье о SVI:
В смеси гауссианов наши глобальные параметры - это параметры среднего и прецизионного (обратная дисперсия) параметров для каждого. То есть является естественным параметром для этого распределения, Normal-Gamma видаk μk,τk ηg
с , и . (Бернардо и Смит, Байесовская теория ; обратите внимание, что это немного отличается от четырехпараметрической нормальной гаммы, которую вы обычно видите .) Мы будем использовать для ссылки на вариационные параметры дляη0=2α−1 η1=γ∗(2α−1) η2=2β+γ2(2α−1) a,b,m α,β,μ
Полное условие - это нормальная гамма с параметрами , , , где является предыдущим. ( там также может сбивать с толку; имеет смысл начинать с трюка примененного к и заканчивая достаточным количеством алгебры, оставленной читателю.)μk,τk η˙+⟨∑Nzn,k ∑Nzn,kxN ∑Nzn,kx2n⟩ η˙ zn,k expln(p)) ∏Np(xn|zn,α,β,γ)=∏N∏K(p(xn|αk,βk,γk))zn,k
На этом мы можем выполнить шаг (5) псевдокода SVI с помощью:
Обновление глобальных параметров проще, поскольку каждый параметр соответствует количеству данных или одной из его достаточных статистических данных:
Вот как выглядит предельная вероятность данных на многих итерациях при обучении очень искусственным, легко разделяемым данным (код ниже). На первом графике показана вероятность с начальными, случайными вариационными параметрами и итерациями; каждый последующий - после следующей степени двух итераций. В коде ссылаются на вариационные параметры для .a , b , m α , β , μ0 a,b,m α,β,μ
источник