5

这是我通过 Tesseract 引擎进行数字识别的 iOS OCR 代码:

Tesseract* tesseract = [[Tesseract alloc] initWithDataPath:@"tessdata" language:@"eng"];

//set the tesseract variables
[tesseract setVariableValue:@"0123456789" forKey:@"tessedit_char_whitelist"];

NSString * temp = @"7";
[tesseract setVariableValue:temp forKey:@"tessedit_pageseg_mode"];

[tesseract setImage:argImage];
[tesseract recognize];
m_convertedText = [[tesseract recognizedText] copy];

使用上面,我得到了一些正确识别的图像。但是有时我得到 5 而不是 8、6 而不是 5 等等。我的输入图像非常完美——二值化后的纯黑白。

还有其他我想指定的 Tesseract 选项吗?我看到有 600 多个选项和非常稀疏的文档。

我能找到的最好的是这个网站,它列出了所有选项,但对于 OCR 初学者来说还不是很清楚。

如果有人使用 tesseract 对数字 OCR 实现了 100% 的准确率,那将非常有帮助。

4

0 回答 0