Из того, что я понимаю, капчи - это текст, искаженный применением фильтров, шумов и других ошибочных алгоритмов. Поэтому, чтобы выяснить, является ли человек способностью к чтению, вы сравниваете то, что они ответили, с тем, что является известным ответом.
Теперь, читая о ReCaptcha, он говорит, что слова, которые отображаются, это те, которые не могут быть переведены OCR. Кроме того, recaptcha используется для перевода этих изображений. Как он может определить, действительно ли вы правы в своем чтении или просто придумываете что-то?
Если бы он знал, что он сказал, он не был бы использован в резюме в качестве материала для перевода. Если он не знает, что говорит текст, то как он проверяет ваш ответ?
Я предполагаю, что это, вероятно, некоторый вероятностный анализ с огромными размерами выборки, прежде чем он помечает что-либо как переведенное.
Кто-нибудь знает, где ответ на это?
Ответы:
Страницы книги в основном фотографически сканируются, а затем преобразуются в текст с помощью «Оптического распознавания символов» (OCR) и передаются в Интернет в виде изображения с одним словом, известным компьютерной программе за reCAPTCHA, и одним словом, которое не является еще известно.
Затем пользователь вводит оба слова, и если они решают то, для которого известен ответ, система предполагает, что их ответ верен для нового. Затем система передает новое изображение ряду других людей, чтобы с большей уверенностью определить, был ли первоначальный ответ правильным. Следовательно, система - это самосовершенствующийся сервис, который со временем улучшается.
http://www.google.com/recaptcha/learnmore
источник
Вот почему в reCaptcha вы вводите два слова. Одно из слов уже известно, а одно из слов не известно. Пройдете ли вы или не сдадите капчу, зависит только от того, как вы ответите за известное слово. Ваш ответ для другого (неизвестного) слова будет использоваться вместе с другими ответами на то же слово, чтобы превратить его в известное слово.
источник