我对本文的阅读表明,ReCAPTCHA 的一个好处是它可以让人类验证 OCR/数字化书籍中无法识别的单词。它通过在“你是人类吗?”中使用这些词来做到这一点。测试。所以 ReCAPTCHA 用一块石头杀死了两只鸟。伟大的!
但我不明白。如果数字化过程无法识别这个词,那么假设的人类输入的输入是什么,经过验证?这是如何运作的?
我对本文的阅读表明,ReCAPTCHA 的一个好处是它可以让人类验证 OCR/数字化书籍中无法识别的单词。它通过在“你是人类吗?”中使用这些词来做到这一点。测试。所以 ReCAPTCHA 用一块石头杀死了两只鸟。伟大的!
但我不明白。如果数字化过程无法识别这个词,那么假设的人类输入的输入是什么,经过验证?这是如何运作的?
它显示了两个词。其中一个计算机已经知道,另一个则不知道。它假定如果您正确地了解已知的一个,那么您必须知道另一个。
你不知道这两者中的哪一个是已知的,所以理论上你无法欺骗它。此外,它将与多人重播一个单词以获得独立确认,然后将其作为有效答案发送回源(报社、图书扫描组)。
但如果计算机无法读取这样的验证码,系统如何知道谜题的正确答案?方法如下:OCR 无法正确读取的每个新单词与另一个已知答案的单词一起提供给用户。然后要求用户阅读这两个词。如果他们解决了已知答案的问题,则系统假定他们的答案对于新的答案是正确的。然后系统将新图像提供给其他一些人,以更高的信心确定原始答案是否正确。
但如果计算机无法读取这样的验证码,系统如何知道谜题的正确答案?方法如下:OCR 无法正确读取的每个新单词与另一个已知答案的单词一起提供给用户。然后要求用户阅读这两个词。如果他们解决了已知答案的问题,则系统假定他们的答案对于新的答案是正确的。然后系统将新图像提供给其他一些人,以更高的信心确定原始答案是否正确。