Существуют ли какие-либо современные методы создания текстовых задач CAPTCHA (чтобы человеку нужно было набирать правильный текст), которые могут легко обмануть ИИ с помощью некоторых методов визуальной запутывания, но в то же время человек может решить их безо всякой борьбы?
Например, я говорю о простой способности распознавания текста, встроенного в изображение (без учета каких-либо внешних плагинов, таких как flash или java, классификации изображений и т. Д.) И повторного ввода текста, который был написан или что-то подобное.
Я думаю, что добавление шума, градиента, вращение букв или изменение цвета больше не являются надежными методами, поскольку они могут быть быстро сломаны.
Какие-либо предложения или исследования были сделаны?
image-recognition
research
ocr
kenorb
источник
источник
Ответы:
Это интересный вопрос о том, что делает людей уникальными. На эту тему есть хорошая книга Хьюберта Дрейфуса под названием « Что не умеют компьютеры » .
Одна из задач, которую компьютер не может решить (по крайней мере, на данный момент), - ранжирование важных вещей. Например, CAPTCHA просит вас упорядочить случайный список вещей (маленький, пять или шесть предметов) по важности. Это конкретное упражнение требует от ИИ принятия решений (не всегда рациональных) на основе человеческого суждения.
источник
Способ, который мог бы сработать, заключается в использовании оптических иллюзий, таких как тот, в котором две линии по коридору идентичны, но одна кажется более длинной для человеческого глаза, тогда им может быть предложен вопрос с множественным выбором относительно состояния линии, которая наши глаза выглядят длиннее, но для компьютера все та же длина линии. Конечно, всегда существует проблема неспособности людей с нарушениями зрения на основе глаз, но различные иллюзии могут быть использованы, чтобы приспособиться к этому.
пример
источник
Сделайте так, чтобы пользователь отмечал объекты в видео, которые не может решить современный классификатор
Создайте современный классификатор видео. Можно также обучить его на данных видеообучения Google YouTube-8M . Но вы также захотите постоянно кормить его оригинальным видео.
Сделайте так, чтобы классификатор пометил как можно больше объектов. Пусть он изолирует, какие объекты он может распознать как объекты, но какие он не может пометить.
Сделайте так, чтобы он выводил видео, в котором обрисовываются объекты. Предпочтительно GIF-файлы, которые можно легко встраивать в формы.
Для 100 из них спросите 100 пользователей, что это за объект. Если 90% пользователей согласны с названием объекта, добавьте это видео в набор каптч. Назовите это предварительно обученным набором.
Каждый раз, когда пользователь должен пройти аутентификацию, показывайте ему один из выделенных объектов в видео, а не из предварительно обученного набора . Если изображение имеет менее 100 показов, запишите этикетку и дайте пользователю еще один из предварительно обученного набора. Если они понимают это правильно, пропустите их, если нет, дайте им еще один из набора предварительно подготовленных.
После того, как на видео, не прошедшем предварительную подготовку, будет показано более 100 показов, и более 90% пользователей, использующих капчу, согласны, добавьте это видео в набор после обучения.
Со временем медленно удаляйте предварительно обученный набор. Поместите истечения в каждое видео в обученном наборе и удалите их после истечения срока, чтобы они не использовались слишком много раз.
В идеале этот процесс постоянно улучшал бы классификатор видео, сохраняя его на современном уровне и немного опережая другие классификаторы. Возможно, он мог бы также отдать предпочтение менее распространенным словам и объектам и более эзотерическим вещам, чтобы специализировать этот классификатор против других классификаторов.
То же самое можно сделать для маркировки изображений, но полезность классификатора видео, вероятно, будет длиться дольше, учитывая успехи в искусственном интеллекте.
Строго говоря, хотя, за исключением некоторой квантовой хитрости, не существует системы капчи, которая не будет однажды решена внешними системами ИИ.
(edit: о, я только что заметил, что вы специально сказали «текстовая капча». Если это то, что вы имеете в виду, то нет, я не думаю, что в классификации текста осталось много загадок. Компьютеры, вероятно, теперь могут подбирать текст из изображений лучше, чем люди. Но технически, ввод в вышеописанной системе кодирования текстовый.)
источник