Я был послан здесь с этим вопросом в stackoverflow , пожалуйста, извините, если вопрос приходит слишком конкретно, и это не в манерах здесь :)
Задача - найти в ней стакан со специфической жидкостью. Позвольте мне показать вам фотографии, а затем опишите, чего я пытаюсь достичь и как я пытался достичь до сих пор, в описании под фотографиями.
Картинки : (кажется, мне нужно как минимум 10 репутаций, чтобы публиковать картинки и ссылки, поэтому ссылки придется делать :( в противном случае вы можете посмотреть на вопрос переполнения стека)
Подробное описание : я пытался реализовать алгоритм, который обнаружил бы стекло определенной формы в opencv (стекло может быть преобразовано с другим углом / расстоянием съемки камеры). Будут и другие очки других форм. Стакан, который я ищу, будет также заполнен некоторой цветной жидкостью, которая отличит его от стаканов, содержащих другие цвета.
До сих пор я пытался использовать экстрактор функций SIFT, чтобы найти некоторые элементы в стекле, а затем сопоставить их с другими фотографиями со стеклом в нем.
Этот подход работал только в очень определенных условиях, когда у меня было бы стекло в очень определенной позиции, и фон был бы подобен обучающим изображениям. Проблема также в том, что стекло - это трехмерный объект, и я не знаю, как извлечь из него элементы (может быть, несколько фотографий с разных ракурсов связаны как-то?).
Теперь я не знаю, какой другой подход я мог бы использовать. Я нашел некоторые подсказки по этому поводу (здесь /programming/10168686/algorithm-improvement-for-coca-cola-can-shape-recognition#answer-10219338 ), но ссылки, похоже, не работают.
Другая проблема заключается в обнаружении различных «уровней пустоты» в таком стекле, но я даже не смог правильно найти сам стакан.
Каковы будут ваши рекомендации по подходу в этой задаче? Было бы лучше использовать другой способ, чтобы найти локальный объект 3D-объекта? Или лучше использовать другой подход? Я слышал об алгоритмах «обучения» объекта по множеству фотографий, но я никогда не видел этого на практике.
Любой совет будет очень признателен
источник
Ответы:
Документ, на который есть ссылка в вашей ссылке, кажется, этот.
Особый интерес представляет таблица 1 (включена ниже). Показатели точности не велики, хотя они лучше, чем другие подходы.
источник
Может быть, этот документ поможет вам: http://ai.stanford.edu/~ang/papers/iros09-ScalableLearningObjectDetectionGPU.pdf
Хотя они используют активную стереосистему в дополнение к 2D-изображениям для получения изображений глубины, интересно, как они используют функции на основе патчей, создавая словарь объекта с множеством небольших фрагментов, а затем обучая классификатор. Может быть, вы можете добавить эту функцию, чтобы улучшить уровень обнаружения.
источник
Над этим было проделано много работы, когда речь заходит о программном обеспечении для распознавания лиц. Например, если вы отмечаете в Facebook при пометке фотографий местоположение лиц в штучной упаковке и предлагается вам.
Я видел много литературы по распознаванию лиц на изображениях с использованием нейронных сетей, и быстрый поиск в Google, несомненно, найдет огромное количество информации по этому вопросу. Эти сети принимают пиксели изображения в качестве входных данных. В вашем случае то, как изменяется непрозрачность / свет отражается от стекла, может быть хорошим для определения функций, которые изучит сеть.
Одной из проблем может быть количество фотографий, которые вы должны использовать в качестве обучающих данных, и их предварительная обработка (т. Е. Идентификация лиц самостоятельно). Если это невозможно сделать для достаточного количества изображений, чтобы обучить вашу сеть достаточно хорошо, вам придется искать некоторые ярлыки на этапе обучения. Этот документ имеет отношение к тому, что вы хотите сделать: http://www.ll.mit.edu/publications/journal/pdf/vol04_no2/4.2.5.neuralnetwork.pdf
К счастью, это очень активное поле, и большая часть кода, необходимого для решения этой проблемы, доступна в Интернете.
Как только вы сможете идентифицировать очки на изображениях, вы сможете выполнить дальнейший анализ оттуда.
источник