2

我尝试使用 tess4j(1.1) 为 tesseract 读取图像,但无法读取具有背景图像的数字/字符,因此我对图像应用阈值处理并将图像更改为黑白,但问题仍然相同。

所以我想知道,

是否可以通过使用 tess4j(tesserarct) 读取具有背景颜色或背景图像的字符/数字。如果可能,请尝试提供一些线索。

或者

是否可以通过对字符识别的训练数据进行一些更改来获得结果

对于这种情况,javacv 是唯一可用的选项而不是 tesseract 吗?

我也在寻找神经网络的机会,但似乎需要更多时间。

有什么解决办法吗?

使用 tess4j 的例子是

File imageFile = new File("myimage.jpg");

Tesseract instance = Tesseract.getInstance();

String result = instance.doOCR(imageFile);

System.out.println(result);
4

2 回答 2

1

Tesseract 并不是图像处理的最佳方式。

还有其他更好的选择,如神经网络、模板匹配等。

在任何情况下,都需要清理图像背景,因此可以选择 javacv 进行图像背景清理。

而且直到现在 tesseract 还不能识别数字。所以我认为神经网络是图像文本阅读和使用的不错选择,我可以获得大约 60%+ 的准确度结果。

于 2013-04-30T06:29:31.193 回答
0

尝试使用 Jumio Netswipe SDK 读取信用卡http://jumio.com/products/netswipe/overview/

于 2013-03-16T21:27:42.217 回答