Глубокие нейронные сети - только для классификации изображений?

14

Все примеры, которые я нашел, используя глубокие убеждения или сверточные нейронные сети, используют их для классификации изображений, распознавания разговоров или распознавания речи.

Полезны ли глубокие нейронные сети для классических задач регрессии, где функции не структурированы (например, не расположены в последовательности или сетке)? Если да, можете ли вы привести пример?

юлианский
источник
3
Ваше первое предложение поднимает сверточные нейронные сети. Похоже, вы путаете их с глубокими сетями убеждений. Они не одинаковы, хотя обе являются формами нейронных сетей.
MSalters
1
Я бы согласился с @msalters, но сказал бы, что сети с глубокими убеждениями являются действительно глубокими сетями и имеют ограниченный успех, тогда как сверточные сети больше похожи на гибридно-адаптивные фильтры изображений s в сверточных слоях, за которыми следует мелкий nn.
seanv507
Что вы подразумеваете под "наблюдениями", которые "не структурированы (не расположены в последовательности или сетке)"? Вы имеете в виду, что изображения «структурированы» в том смысле, что отдельные пиксели расположены на сетке? Но тогда это «структурированные» функции, а не «наблюдения» (это будут отдельные изображения)?
говорит амеба: восстанови Монику
Я бы сказал, что все сети Convolution являются глубокими, не все глубокие сети являются сверточными, и аналогично все сети глубоких убеждений являются глубокими, не все глубокие сети являются сетями глубоких убеждений. Действительно, у вас могут быть глубокие сети, которые не являются ни глубокими, ни сверточными, их просто трудно тренировать. Хотя, безусловно, есть возможность для бессмысленных дебатов по терминологии.
Линдон Уайт
Вы не можете применить сверточную сеть к неструктурированным (не в последовательности / сетке и т.д.) данным. Это в принципе не имеет смысла. Сверточная сеть тесно связана с принятием вашего преобразования Фурье - например, для последовательностей, преобразовывающих его из временной области в частотную область.
Линдон Уайт

Ответы:

8

Характеристики изображений, которые делают их пригодными для классификации с помощью глубокой нейронной сети, заключаются в том, что имеется масса функций (возможно, миллионы, если не миллиарды пикселей с RGB, интенсивностью и т. Д.), И если у вас есть точные метки, это не шумные данные. Камеры в наши дни очень хороши, и они ничего не измеряют. Благодаря Интернету у нас теперь есть много точно помеченных изображений. Глубокая сеть может выражать произвольно сложные функции, что является проблемой с шумными данными, потому что вы можете очень легко переопределить шум, поэтому многие методы обучения имеют тенденцию наказывать сложные модели. Однако в случае распознавания изображений истинная функция кажется очень сложной, мы не имеем представления о том, как выглядит функциональная форма, и мы даже не знаем, каковы соответствующие функции во многих случаях.

Это не значит, что вы не можете использовать глубокие сети для изучения функций, не имеющих ничего общего с изображениями. Вам просто нужно быть очень осторожным в отношении недостатков, в основном из-за того, что они очень склонны к переоснащению, а также из-за того, что они требуют больших вычислительных ресурсов и могут занимать много времени на обучение (в наши дни это не такая большая проблема с параллельными SGD и GPU). Другим недостатком является то, что у вас практически нет интерпретируемой модели, что не имеет значения для классификации изображений. Мы просто пытаемся заставить компьютеры распознать разницу между шимпанзе и орангутаном. Человеческое понимание формулы не имеет значения. В других областях, особенно в медицинской диагностике, исследованиях в области политики и т. Д., Вам необходимо или даже может потребоваться понимание человеком.

Адам Акоста
источник
5

Конечно, вы можете использовать глубокие нейронные сети для многих задач, кроме изображения или распознавания речи. Проблема в том, действительно ли вам это нужно.

Глубокие нейронные сети намного мощнее простого MLP, однако они также требуют больше ресурсов и сложнее в разработке. Таким образом, они используются в действительно сложных областях. Вы можете использовать их для решения более простых задач, но обычно более простые модели также дают хорошие результаты.

Использование глубоких нейронных сетей для решения простых задач будет похоже на убийство мух с помощью базуки. Вы наверняка убьете их, но не могли бы вы найти более простой способ?

davidivad
источник
2
Это не ответ. Что легко, что трудно? Прогнозирование фондового рынка / экстраполяция на ограниченных примерах / ... Есть много трудных проблем, хороши ли они для всех?
seanv507
Я не говорил, что глубокие нейронные сети могут решить что угодно. Я имел в виду, что они используются в сложных доменах, где у вас есть огромное количество записей. Я знаю, что они не могут решить все проблемы, но не в этом вопрос. Дело в том, что они могут быть применены к другим проблемам, кроме распознавания изображений / речи, но у них есть недостатки, которые следует учитывать в тех случаях, когда могут применяться другие модели.
Давидивад
5

Я согласен с ответом Давидивада. Но я также считаю, что применение глубоких нейронных сетей к изображениям заключается в том, что собирать изображения (и, что более важно, маркированные изображения) относительно недорого. В других областях сбор данных в больших масштабах может быть очень дорогим, особенно в рамках ограничений типичного промышленного или государственного предприятия. Эта проблема усугубляется тем, что во многих приложениях интересующее явление встречается относительно редко, поэтому будет очень мало примеров, на которых можно было бы поучиться, поэтому даже относительно крупномасштабные усилия по сбору данных могут привести к небольшому количеству членов некоторого класса.

Sycorax говорит восстановить Монику
источник