7

我有一个项目需要使用 OCR 扫描某些图像。我知道软件 abbyy Finereader 做得很好(也尝试了一个对我来说几乎完美的试用版),现在我想知道如何将这个软件嵌入到 python 或其他 sripting 语言中,以便我以后可以简单地运行命令行脚本,例如python the_script.py image.jpg将图像作为参数,用它执行 abbyy Finereader 并返回识别的文本...

我在谷歌上找不到方法,没有!?我只发现了这样的东西: https://github.com/mikesname/python-ocrlab/blob/master/ocrsite/ocrlab/nodes/abbyy.py 但无法弄清楚它的真正作用......

或者我需要哪个 abbyy 软件来做到这一点!?识别服务器或 OCR 引擎或其他什么?

非常感谢提前

4

2 回答 2

11

我使用 ABBYY 技术已经超过 15 年了。我曾经在 ABBYY 工作,现在我在WiseTREND工作- 美国主要的 ABBYY 技术 VAR 和集成商之一。

FineReader,即零售盒装产品,专为操作员独立交互使用而设计。该软件包中不提供命令行和 API 自动化。如果您的使用量很小,您可以将 FineReader 企业版用作简单的黑盒,将其设置为热文件夹,然后让您的脚本将图像放入该输入文件夹,等待处理,然后从输出文件夹中提取。

为了更好地自动化和集成,需要使用与 FineReader 不同的产品。

首先,决定您是想要本地软件还是基于云的 OCR。

云 - ABBYY、OCR-IT 和其他一些提供商通过 Web 请求提供 OCR。通常按页付费,无需购买软件。

本地 - 一些软件将在您的服务器上运行,并为您的脚本提供 OCR 功能,作为黑盒或通过直接 API。Recognition Server 是为此考虑的下一个产品。最后,如果您正在开发需要将其分发给众多用户的大型应用程序,或者需要深入的 OCR 控制,那么 Engine SDK 是需要考虑的产品。

如果您想分享更多您希望如何集成 OCR,以及您需要实现哪些数量和功能,我们可以尝试进一步缩小范围。

于 2014-02-20T01:06:55.290 回答
7

我很晚才看到这条消息,但我使用 ABBYY 命令行已有 10 年了。

我更喜欢 ABBYY 8,因为它可以更快地完成同样的工作并且不打开任何 GUI。它带有FineOCR.exe

"C:...\ABBYY FineReader 8\FineOCR.exe" %1 /lang 希腊英语 /send MsWord

它执行 OCR 并打开 MS Word。FineOCR.txt 是一个简单的帮助文件。

关于,ABBYY 11、12(所有版本)有一个FineCmd.exe。使用类似的东西:

"c:...\FineReader\FineCMD.exe" %1 /lang 希腊英语 /send MsWord

它做了 FineOCR 之前所做的事情(但没有 .txt 帮助文件)。

于 2015-12-12T12:44:08.337 回答