Алгоритмы компьютерного зрения (как это возможно?)

9

Недавно я наткнулся на компанию, которая создала технологию компьютерного зрения, которая способна автоматически обнаруживать кражи в магазинах и оповещать своих пользователей.

ССЫЛКА НА САЙТ

Просмотр некоторых видеороликов и примеров, предоставленных компанией, заставил меня полностью сбиться с толку и удивиться тому, как, черт возьми, они достигли этой функциональности.

Я понимаю, что никто здесь не сможет сказать мне точно, как это могло быть достигнуто, но кто-нибудь знает - и мог бы указать мне - провести исследования в этой области или, альтернативно, возможно, предоставить подробности относительно того, как что-то подобное может быть реализовано или руководство, где можно начать?

Насколько я понимаю, алгоритмы компьютерного зрения были долгие годы от того, чтобы быть таким сложным. Такое приложение действительно возможно? Кто-нибудь готов рискнуть догадаться, как они этого добились?

Максим Гершкович
источник
2
Это не так сложно. Игры постоянно обнаруживают столкновения между объектами; почему вы не можете обнаружить столкновения между человеком и полкой с предметами, а затем поднять тревогу, когда этот человек идет к двери без оплаты?
Роберт Харви
Точно. Это просто распознавание объектов и обнаружение столкновений. Если они не подключают его к сканеру, его легко можно переместить, переместив объекты над сканером, но немного над ним. Объект, казалось бы, столкнулся со сканером, но на самом деле это не так.
Эндрю Финнелл
В любом случае, ни один из механизмов обнаружения, описанных на веб-сайте (возлюбленная, потеря корзины и самообслуживание), не требует ничего, даже сложного, даже сложного. Они проверяют в очень ограниченном пространстве (счетчик кассира) и могут проверять товары, найденные в корзине, на предмет того, что сканер штрих-кодов действительно сканировал.
Роберт Харви
1
Извините, я в замешательстве. Давайте возьмем пример с пота. У меня есть два предмета, один недорогой, один высокий. Я помещаю дешевую вещь под высокую и сканирую. В этот момент мы можем сравнить то, что было отсканировано в системе POS, с тем, что видно на камере в руке кассира, но для этого требуется, чтобы система была в состоянии «понять, что кладется в сумку», против сотен тысяч потенциальных предметы через камеру предельного качества. Это кажется чрезвычайно сложным. Что мне не хватает?
Максим Гершкович
6
Я думаю, вы слишком много думаете о том, как хорошо это работает. Могу поспорить, что есть приличный уровень ошибок, и, вероятно, очень легко играть в систему. Я рассматриваю это как систему типа осведомителя, где она просто определяет потенциальные места в видео, которые нуждаются в просмотре человеком. Таким образом, неточность хорошо переносится.
Крис

Ответы:

5

Вы дезинформированы о состоянии дел. Несколько лет назад я работал в компании, которая создавала такие системы для самых разных целей. Одна из них была чрезвычайно успешной системой контроля выхода из аэропорта, которая могла легко определить разницу между человеком, идущим по неверному пути по коридору выхода, и такими вещами, как шары в движении или люди, движущиеся в правильном направлении. Распознать объекты на сцене в режиме реального времени непросто, но мы делали это на встроенных процессорах, а не на суперкомпьютерах.

Я не видел там ничего такого, что было бы неправдоподобным несколько лет назад.

Росс Паттерсон
источник
4

На самом деле эта компания использует гибрид компьютерного зрения и ручной проверки в Индии. Это не чисто компьютерное зрение, особенно для таких элементов, как возлюбленная. На самом деле, я знаю одного продавца, у которого проблемы с этой системой, не из-за производительности системы, которую я храню, а из-за пропускной способности видео в Индию. Это ручное кодирование помогает уменьшить количество ошибок и является типичным техническим заданием для некоторых поставщиков.

Майк Макмиллан
источник