Ограниченные машины Больцмана для регрессии?

13

Я слежу за вопросом, который я задавал ранее по УКР . Я вижу много литературы, описывающей их, но ни одной, которая фактически говорит о регрессии (даже не классификация с помеченными данными). У меня такое ощущение, что он используется только для немаркированных данных. Есть ли ресурсы для обработки регрессии? Или это так же просто, как добавить еще один слой поверх скрытого слоя и запустить алгоритм CD вверх и вниз? Большое спасибо заранее.

regression machine-learning classification neural-networks брокколи
источник

18

Вы правы относительно немаркированных данных. УОКР - это генеративные модели, которые чаще всего используются в качестве учащихся без надзора.

При использовании для построения Deep Belief Network наиболее типичная процедура состоит в том, чтобы просто обучать каждый новый RBM по одному, когда они сложены друг на друга. Таким образом, противоречивая дивергенция не идет вверх и вниз в том смысле, который, я думаю, вы имеете в виду. Он работает только с одним RBM за один раз, используя скрытый слой предыдущего самого верхнего RBM в качестве входных данных для нового самого верхнего RBM. После всего этого вы можете рассматривать стек весов RBM в качестве начальных весов для стандартной нейронной сети с прямой связью и обучаться, используя ваши помеченные данные и обратное распространение, или делать что-то более экзотическое, например, использовать алгоритм пробуждения-сна. Обратите внимание, что мы не использовали никаких помеченных данных до этого последнего шага, что является одним из преимуществ этих типов моделей.

С другой стороны, есть несколько способов использовать RBM для классификации.

Обучите RBM или стек из нескольких RBM. Используйте самый верхний скрытый слой в качестве входных данных для другого контролируемого ученика.
Тренируйте RBM для каждого класса и используйте ненормализованные энергии в качестве входных данных для дискриминационного классификатора.
Тренируйте RBM, чтобы быть моделью плотности соединения P (X, Y). Затем, учитывая некоторый вход x, просто выберите класс y, который минимизирует энергетическую функцию (нормализация здесь не проблема, как в предыдущем примере, поскольку константа Z одинакова для всех классов).
Тренируй дискриминирующую RBM

Я настоятельно рекомендую вам прочитать технический отчет Джеффа Хинтона « Практическое руководство по обучению машин Больцмана с ограничениями ». Он обсуждает некоторые из этих вопросов более подробно, предоставляет бесценные советы, цитирует множество соответствующих статей и может помочь устранить любую другую путаницу, которая может возникнуть.

альт
источник

1

можно ли использовать RBM для регрессии?

оспинатор

Как вы обучаете RBM быть моделью плотности суставов? Предоставляя X и Y в качестве не скрытых входных данных, т.е. вы обучаете его быть P (X, Y | H) (H - скрытый слой)?

AkiRoss

Я сам отвечаю на свой комментарий: да, в «Практическом руководстве по обучению RBM» (Hinton, 2010), 3 метода, описанных выше, подробно объяснены, и в 3-м методе он говорит о наличии «двух наборов видимых». единиц ", где, помимо данных, представлена единица метки softmax для представления класса.

AkiRoss

2

Пожалуйста, ознакомьтесь с реализацией, http://code.google.com/p/matrbm/ . Он имеет функцию классификации rmb fit, которую стоит рассмотреть. Также дайте мне знать, если вы найдете лучшие реализации DBN и RMB для классификации и регрессии.

Дипан Прабху Бабу
источник

0

Я думаю, что одним из способов тестирования нейронных сетей, таких как Restricted Boltzman Machine (RBM), является применение их к новым наборам данных или, как правило, к подмножеству общего набора данных, и просмотр их работы. Вы также можете протестировать модель с перекрестной проверкой. Я использовал популярный программный инструментарий с открытым исходным кодом для машинного обучения (ML), который прост в установке и использовании и позволяет легко тестировать многие типы алгоритмов ML по отдельности с использованием ряда статистических данных регрессии модели ( http: // www. cs.waikato.ac.nz/ml/weka/ ). Это может дать вам быстрый анализ без особого вмешательства, кроме основ работы с программой, хотя в зависимости от того, может быть, это не стоит того, если вам будет сложно отформатировать ваши данные (хотя обычно вы можете, например, google "csv to arff convert online") для одношагового форматирования).

Джейсон Албала
источник

Ограниченные машины Больцмана для регрессии?

Ответы: