24

我对 reCAPTCHA 的工作原理有点困惑。我已经使用 ROR 实现了它。

有时即使我只指定两个单词中的一个,它也会返回 true,而有时它会失败。

我真的很困惑,无法理解 reCAPTCHA 的行为。

4

4 回答 4

17

系统只有一个 recaptcha 词是“已知的”——它依赖于执行验证码的用户来告诉系统另一个词是什么,因为它不是机器可读的。

这就是 recaptcha 的“要点”,或者说是额外的好处——它不仅是进行人工测试,而且还是自动化 OCR 失败的大规模群源翻译。

于 2010-07-22T14:25:47.467 回答
15

Recaptcha 显示两个词。一种是计算机扫描仪已扫描并识别的,另一种是计算机扫描仪无法识别的。Recaptcha 检查它知道答案的单词并保存未知单词的响应。这些对未知单词的反应被编译和分析,因此它本质上是由人类而不是由计算机扫描仪“解决”的。

用他们自己的话来说,这里有更多信息:

“但如果计算机无法读取这样的 CAPTCHA,系统如何知道谜题的正确答案?方法如下:OCR 无法正确读取的每个新单词都会与另一个单词一起提供给用户答案是已知的。然后要求用户阅读两个单词。如果他们解决了已知答案的单词,则系统假定他们的答案对于新单词是正确的。然后系统将新图像分配给一个数字其他人以更高的信心确定原始答案是否正确。”

来源 - http://www.google.com/recaptcha/learnmore

于 2010-07-22T14:27:18.377 回答
2

Recaptcha 使用两个词,一个是已知的,一个是未知的(未知词是程序试图帮助破译的词——它可能是从一本旧书或某处扫描出来的!)。所以真的,所有服务都在寻找对已知词的正确答案。如果这是您输入的单词,即使您不为未知单词输入任何内容,它也会成功。如果您输入另一个词(未知词),它将失败。

于 2010-07-22T14:26:42.113 回答
1

我认为这是recaptcha的主要观点。它可以帮助开发人员在人类和机器人之间做出改变,还可以帮助将书籍数字化。

总有两个字。一个更容易阅读。如果你能读懂这个词,那很好,你是人。

第二个词是自动 OCR(识别)对这个词不确定的书的扫描。所以用户正在帮助阅读这个词,以便书籍可以更好地数字化。

于 2010-07-22T14:28:45.827 回答