Может ли одна нейронная сеть обрабатывать распознавание двух типов объектов или она должна быть разбита на две меньшие сети?

9

В частности, встроенный компьютер (с ограниченными ресурсами) анализирует видеоизображение в реальном времени с камеры дорожного движения, пытаясь выбрать хорошие кадры, которые содержат номерные знаки проезжающих автомобилей. Когда табличка обнаружена, кадр передается в библиотеку OCR для извлечения регистрации и дальнейшего ее использования.

В моей стране обычно используются два типа номерных знаков - прямоугольные (типичные) и квадратные - фактически, несколько прямоугольные, но «выше, чем шире», с регистрацией, разделенной на два ряда.

(есть еще несколько типов, но давайте игнорировать их; они составляют небольшой процент и обычно относятся к транспортным средствам, которые находятся вне нашего интереса.)

Из-за ограниченных ресурсов и необходимости быстрой обработки в реальном времени максимальный размер сети (количество ячеек и соединений), которую система может обрабатывать, является фиксированным.

Было бы лучше разделить это на две меньшие сети, каждая из которых распознает один тип регистрационных номеров, или большая отдельная сеть будет лучше обрабатывать два типа?

Научная фантастика
источник

Ответы:

6

Ну, я не знаю, какие функции вы даете своей нейронной сети. Однако в целом я бы пошел с единственной нейронной сетью. Кажется, что у вас нет ограничений в ресурсах для обучения вашей сети, и единственная проблема - это ресурсы во время применения вашей сети.

Дело в том, что, вероятно, две проблемы имеют общие черты (например, оба типа пластин имеют прямоугольную форму). Это означает, что если вы используете две сети, каждая из них должна снова решить одну и ту же подзадачу (общую часть). Если вы используете только одну сеть, то для решения общей части проблемы требуется меньше ячеек / весов, а оставшиеся веса / ячейки можно использовать для лучшего распознавания.

В конце концов, если бы я был на вашем месте, я бы попробовал их обоих. Я думаю, что это единственный способ быть уверенным в том, что является лучшим решением. Говоря теоретически, возможно, что мы не учитываем некоторые факторы.

Дидам я
источник