Я изучаю ограниченную машину Больцмана (RBM) и у меня возникают некоторые проблемы с пониманием логарифмических расчетов вероятности относительно параметров RBM. Несмотря на то, что было опубликовано много исследовательских работ по УОКР, подробных шагов по производным инструментам нет. После поиска в Интернете я смог найти их в этом документе:
- Фишер А. & Игель С. (2012). Введение в ограниченные машины Больцмана. В L. Alvarez et al. (Ред.): CIARP, LNCS 7441, с. 14–36, Springer-Verlag: Берлин-Гейдельберг. ( pdf )
Однако детали этого документа слишком сложны для меня. Может кто-нибудь указать мне хороший учебник / набор лекционных заметок о RBM?
Изменить: @David, запутанный раздел показан ниже (уравнение 29 на странице 26):
references
rbm
Упул
источник
источник
Ответы:
Я знаю, что уже немного поздно, но, возможно, это поможет. Чтобы получить первый член вашего уравнения, необходимо выполнить следующие шаги: Мы предположили, что условная независимость между скрытые единицы, учитывая видимые единицы, существуют. Таким образом, мы можем факторизовать условное совместное распределение вероятностей для скрытых состояний.
источник
На сайте глубокого обучения есть достойное руководство по RBM .
Этот пост в блоге ( Введение в ограниченные машины Больцмана ) написан на более простом языке и очень хорошо объясняет основы RBMS:
Также, возможно, лучшим справочником является курс Джеффа Хинтона « Нейронные сети» на Coursea:
Я не уверен, если вы можете получить доступ к классу и видео после окончания класса, хотя.
источник
Левый оранжевый прямоугольник показывает ожидаемое значение градиента энергии по всем скрытым конфигурациям, учитывая, что какой-то видимый вектор зафиксирован на видимых единицах (ожидание по данным, поскольку он использует выборку из вашего тренировочного набора). Сам термин является произведением (1) вероятности увидеть конкретную скрытую единицу i, учитывая, что некоторый вектор v зажат на видимых единицах и (2) состояние конкретной видимой единицы j.
Правый оранжевый прямоугольник - то же самое, что и левый, за исключением того, что вы делаете то, что находится в левом оранжевом прямоугольнике для каждой возможной видимой конфигурации, а не только тот, который закреплен на видимых единицах (ожидание по сравнению с моделью, поскольку ничего не зафиксировано). на видимых единицах).
источник
Глава 5 курса Уго Ларошеля по машинному обучению ( видео ) - лучшее введение, которое я нашел до сих пор.
Производная от функции потерь не выводится в этих лекциях, но это не сложно сделать (я могу опубликовать просмотр моих расчетов, если это необходимо, но на самом деле это не так сложно). Я все еще ищу хороший учебник по этой теме, но в основном это только статьи. Есть хороший обзор статей в главе 20 книги глубокого обучения Бенджо.
источник