сходство
Фундаментально оба типа алгоритмов были разработаны, чтобы ответить на один общий вопрос в приложениях машинного обучения:
Икс1, х2, … , Хп
Икср + 1= х1Икс2, хр + 2= х1Икс3, ...
Как многоуровневое моделирование, так и алгоритмы глубокого обучения отвечают на этот вопрос, предлагая гораздо более разумную модель взаимодействия. И с этой точки зрения они очень похожи.
разница
Теперь позвольте мне понять, в чем заключается большая концептуальная разница между ними. Чтобы дать некоторое объяснение, давайте посмотрим на предположения, которые мы делаем в каждой из моделей:
1
2
Принципиальное отличие происходит от фразы «структура взаимодействий неизвестна» в Deep Learning. Мы можем предположить некоторые априоры в отношении типа взаимодействия, но алгоритм определяет все взаимодействия во время процедуры обучения. С другой стороны, мы должны определить структуру взаимодействий для многоуровневого моделирования (мы учимся изменять только параметры модели впоследствии).
Примеры
Икс1, х2, х3{ х1}{ х2, х3}
Икс1Икс2Икс1Икс3Икс2Икс3
При глубоком обучении, например, в многослойных ограниченных машинах Больцмана ( RBM ) с двумя скрытыми слоями и линейной функцией активации, мы будем иметь все возможные полиномиальные взаимодействия со степенью, меньшей или равной трем.
Общие преимущества и недостатки
Многоуровневое моделирование
(-) необходимо определить структуру взаимодействия
(+) результаты обычно легче интерпретировать
(+) может применять статистические методы (оценить доверительные интервалы, проверить гипотезы)
Глубокое обучение
(-) требует огромного количества данных для обучения (и времени для обучения)
(-) результаты обычно невозможно интерпретировать (предоставляется в виде черного ящика)
(+) экспертных знаний не требуется
(+), будучи хорошо обученным, обычно превосходит большинство других общих методов (не зависит от конкретного приложения)
Надеюсь, это поможет!
Несмотря на то, что этот вопрос / ответ был на месте, я подумал, что было бы полезно уточнить несколько моментов в ответе. Во-первых, фраза, поднятая в качестве основного различия между иерархическими методами и глубокими нейронными сетями: «Эта сеть фиксированная» это неверно. Иерархические методы не более «фиксированы», чем альтернативные нейронные сети. См., Например, статью « Глубокое обучение с иерархическим сверточным факторным анализом», Chen et. и др., Я думаю, вы также обнаружите, что требование определять взаимодействия также больше не является отличительной чертой. По моему опыту, пара моментов, которые не указаны в качестве плюса при иерархическом моделировании, - это значительно уменьшенная проблема переоснащения и способность обрабатывать как очень большие, так и очень маленькие тренировочные наборы. Неприятным моментом является то, что при использовании байесовских иерархических методов доверительные интервалы и проверка гипотез, как правило, не являются статистическими методами, которые будут применяться.
источник