0

请看图片:http ://s18.postimg.org/wvwj4yt4l/ashx.jpg

我认为我的图像非常简单,但 tesseract-ocr 无法正确识别它:( 它显示“A§§§SX”,而不是 A9FCCC

请告诉我为什么?tesseract如何才能识别呢?

谢谢

4

1 回答 1

0

基本的 Tesseract 引擎不适用于 CPATCHA 破解。即使文本/字母角度不是完全水平的,它也可以很好地处理来自打印媒体的扫描页面。失真和像素化——在轻微的程度上——也不会是什么大问题。

但是像你链接的那个形状(严重)畸形的字母,将不会被识别。OCR,尤其是 CAPTCHA 破解比下载 Tesseract 二进制文件要复杂得多。如果真的那么容易,所有付费服务都将在一夜之间停业。OCR这个话题太复杂了,我个人不敢碰。

于 2013-06-17T12:38:16.690 回答