3

我正在尝试从图像中检测阿拉伯数字(阿拉伯数字 - 印度数字)。

尝试过 Tesseract OCR 它对我不起作用(它确实识别阿拉伯单词但不是数字)这是我想从中提取页码的图像(页面顶部)

在此处输入图像描述

我尝试使用 imagemagick 将该图像与较小的已经制作的包含所有书号可能性的小图像进行比较,但它也没有工作,我认为这将花费很多时间。

实用的非复杂解决方案是什么?PS:图片来自安卓手机,会在windows或linux服务器上解析。

4

1 回答 1

0

实际上,Tesseract 不是您问题的有效解决方案,也不是任何商业阿拉伯语 OCR。您需要有一个自定义 OCR 解决方案,您可以对您的样本进行训练并指定您的特殊处理规则。

您仍然可以使用 Tesseract,但可以通过其源代码和培训工具的形式自行构建自定义解决方案。要为阿拉伯语自定义 Tesseract,您可能会发现此链接很有帮助 http://arabicocr.wordpress.com

于 2015-06-29T12:47:20.933 回答