Ограничена ли способность распознавания образов CNN обработкой изображений?

21

Можно ли использовать сверточную нейронную сеть для распознавания образов в проблемной области, где нет уже существующих изображений, например, путем графического представления абстрактных данных? Это всегда будет менее эффективным?

Этот разработчик говорит, что текущая разработка может пойти дальше, но не в том случае, если существует предел вне распознавания изображений.

dynrepsys
источник
1
Я вижу по крайней мере два вопроса здесь. Как вы думаете о расщеплении? Кроме того, вопрос был бы гораздо более качественным, если бы вы могли расширить то, что вы искали, по названию вопроса.
Эрик Платон
@EricPlaton Немного подтянул. Мой главный вопрос о природе отношений между CNN и изображениями. Что бы вы предложили для второго вопроса?
dynrepsys
Спасибо, вопрос хорош для меня (хотя я должен удалить свой ответ сейчас ~). Что касается второго вопроса, как насчет подхода «в чем подвох»? "Это всегда менее эффективно?" все еще хорошо, если кто-то может придумать контрпример.
Эрик Платон
«Может ли сверточная нейронная сеть использоваться для распознавания образов в проблемной области, где нет уже существующих изображений, скажем, путем графического представления абстрактных данных?» Вы спрашиваете, можем ли мы представить какие-либо данные в виде изображения и применить CNN? Как читать набор данных из 100 объектов и представлять его как изображение 10x10?
rcpinto

Ответы:

10

Сверточные сети (CNN) основаны на математической свертке (например, 2D или 3D свертки), которая обычно используется для обработки сигналов. Изображения являются типом сигнала, и свертка может в равной степени использоваться для звука, вибраций и т. Д. Таким образом, в принципе, CNN могут найти применение для любого сигнала и, возможно, даже больше.

На практике уже существует работа над НЛП (как упомянул Мэттью Грейвс), где некоторые люди обрабатывают текст с помощью CNN, а не рекурсивных сетей. Некоторые другие работы относятся к обработке звука (здесь нет ссылок, но я еще не опубликовал работы).


Исходное содержание: В ответ на первоначальный заглавный вопрос, который изменился сейчас. Возможно, нужно удалить этот .

Исследования противоборствующих сетей (и связанных с ними) показывают, что даже глубокие сети можно легко одурачить , что приведет к тому, что они увидят собаку (или любой другой объект) в том, что кажется случайным шумом, когда человек смотрит на него (в статье есть четкие примеры).

Другая проблема - обобщающая сила нейронной сети. Сверточные сети поразили мир своей способностью обобщать лучше, чем другие методы. Но если в сеть поступают только изображения кошек, она распознает только кошек (и, вероятно, видит кошек повсюду, как показывают результаты состязательной сети). Другими словами, даже КН трудно обобщать слишком далеко от того, чему они научились.

Предел распознавания трудно определить точно. Я бы просто сказал, что разнообразие обучающих данных расширяет границы (я предполагаю, что дальнейшие подробности должны привести к более подходящему месту для обсуждения).

Эрик Платон
источник
5

Простой ответ: «Нет, они не ограничены изображениями»: CNN также используются для обработки естественного языка. (Смотрите здесь для введения.)

Я еще не видел, чтобы они применялись к графическим данным, но я не смотрел; Есть некоторые очевидные вещи, чтобы попробовать, и поэтому я настроен оптимистично, что это сработает.

Мэтью Грейвс
источник
3

Сверточная нейронная сеть может применяться не только для распознавания изображений, но и для анализа и распознавания видео, обработки естественного языка, в играх (например, в Go ) или даже для обнаружения наркотиков путем прогнозирования взаимодействия между молекулами и биологическими белками вики .

Поэтому его можно использовать для решения различных задач, используя сверточные и подвыборочные слои, связанные с более полно связанными слоями. Их легче обучать, потому что они имеют меньше параметров, чем полностью подключенные сети с таким же количеством скрытых устройств. UFLDL

kenorb
источник
3

Сверточную нейронную сеть можно использовать везде, где шаблоны локально коррелированы и переводимы (как в режиме смещения). Это так, потому что CNN содержат фильтры, которые ищут определенные локальные шаблоны везде во входных данных. Вы найдете местные и переводимые шаблоны в картинках, тексте, временных рядах и т. Д.

Не имеет особого смысла использовать CNN, если ваши данные больше похожи на пакет функций с неуместным порядком. В этом случае у вас могут возникнуть проблемы с обнаружением шаблонов, содержащих элементы, которые оказываются дальше друг от друга во входном векторе. Вы не найдете локальные и переводимые шаблоны в ваших данных, если вы можете переупорядочить точки данных входных векторов без потери информации.

BlindKungFuMaster
источник