Распознавание изображений

11

В поисках системы с открытым исходным кодом, которая позволяет в коммерческих целях распознавать изображения на огромной и органично растущей коллекции двумерных изображений, где единственными известными вариациями будут:

  • Масштабирование размера изображения,
  • Угол, на котором картинка-картинка, это взять,
  • Смещения синхронизации цвета, означающие, что из-за неровностей при захвате и рендеринге цвет исходного изображения варьируется от экземпляра к экземпляру,
  • Обрезка фотографии,
  • Добавление водяного знака или текста,
  • Возможные изменения фокуса, означающие, что захват не был в фокусе, не то, что был применен фильтр манипуляции изображения.

Я согласен с необходимостью обучать приложение до тех пор, пока отдача от этого не окупится - это говорит о том, что в долгосрочной перспективе количество двумерных экземпляров вырастет за пределы первоначальных нескольких тысяч до ста тысяч; но это долгосрочно, и я был бы рад, если бы у меня было решение, которое хорошо работает, с обучающим набором из 1000 экземпляров и 10 примеров в каждом.

ОБНОВЛЕНИЕ: лицензия должна быть в состоянии использоваться для коммерческого внутреннего распространения без выпуска исходного кода, даже внутреннего для всех тех, у кого есть бинарный файл. Код никогда не будет продаваться, он будет использоваться только для внутреннего использования, но не каждый пользователь будет иметь доступ к исходному коду, только интерфейс.

просчеты
источник
2
Вы рассматривали OpenCV?
+1 @pwny: Спасибо - так нет, я никогда не пробовал какую-либо систему компьютерного зрения (CV), просто пытался понять, верен ли мой взгляд на проблему. Я бы сказал, из чего состоят изображения, но поскольку это относится к коммерческому предприятию и системе CV, предназначенной только для внутреннего использования, я стараюсь не указывать, что будет обрабатывать система, но с какими проблемами она столкнется. Если OpenCV соответствует текущим требованиям, пожалуйста, опубликуйте его как ответ и попытайтесь связать со связанными документами, которые охватывают предоставленные функциональные требования, если это возможно. Еще раз спасибо!
1
В соответствии с законом об авторском праве не существует понятия «внутреннее распространение». Поэтому большинство лицензий (все, что мне известно) не ограничиваются в этом отношении.
MSalters
+1 @MSalters: Спасибо, у вас есть ссылка на «в соответствии с законом об авторском праве» - это означает, что вы говорите, что это указано в Законе об авторском праве США, хотя, возможно, я просто читаю ваш комментарий.
1
@blunders: Технически, это от TRIPS (Статья 1.3), которая устанавливает, что с юридическим лицом (например, корпорацией) следует обращаться как с физическим лицом.
MSalters

Ответы:

10

Это может быть немного низкого уровня, но OpenCV может предоставить вам инструменты, необходимые для создания такого программного обеспечения для распознавания изображений. Конечно, OpenCV не предоставляет все необходимое из коробки (я думаю, я не профессионал), но он нацелен на то, чтобы обеспечить то, что нужно для компьютерного зрения в реальном времени.

Вы можете начать читать документацию здесь . Некоторые хорошие книги также перечислены на этой странице.

Надеюсь это поможет. Удачи!

pwny
источник
Означает ли лицензия OpenLV GPLV2, что она не может распространяться внутри системы с закрытым исходным кодом? Спасибо!
Где вы видите лицензию GPLV2? В первом абзаце на домашней странице он указан как лицензия BSD.
@deterb: в нижнем колонтитуле, в самом низу страницы.
@deterb: Похоже, что ссылка GPL предназначена для MoinMoin Wiki Engine, используемого для вики для OpenCV, а не OpenCV - спасибо за указание на мою ошибку!
+1 @pwny: Как указывается, OpenCV находится под лицензией BSD, которая указана на домашней странице веб-сайта (кажется, что лицензия GPLV2 нижнего колонтитула не распространяется на OpenCV), также пыталась подтвердить это, загрузив OpenCV и поисковую лицензию поиска в все это файлы; которые возвращаются среди других сторонних лицензий, лицензии, которая, по-видимому, предназначена для OpenCV в форме лицензии BSD, хотя в ней не указано, что это лицензия BSD. В общем, ваш ответ - огромная помощь, и он кажется достаточно хорошим, чтобы двигаться вперед. Спасибо!
2

Просто , чтобы добавить к обсуждению я в настоящее время работает на согласовании изображения , и я нашел OpenCV в ОРБ бесплатно; однако SURF и SIFT - нет. Вы можете посмотреть на этот пример в качестве возможной отправной точки.

motiur
источник
1

Pastec http://www.pastec.io должен соответствовать требованиям исходного вопроса.

Это индекс с открытым исходным кодом и поисковая система для распознавания изображений, выпущенная в рамках LGPL. Это позволяет легко добавлять, удалять и искать подходящие изображения в индексе, используя простой HTTP API. Он основан на OpenCV и использует дескриптор ORB, который в отличие от SURF и SIFT не имеет патентов.

MagSoft
источник