问题标签 [abbyy]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
567 浏览

regex - 如何使用正则表达式通过 ABBYY FineReader 改进 OCR

我将 ABBYY FineReader 12 与 Java API 一起用于 OCR 任务,重点是识别几种众所周知的模式(正则表达式)中的 ID。

我在识别相似的字符时遇到了麻烦,例如:有时g's 被误认为9's,0' s 被误认为 ' Os 1' Is 等。

我认为使用正则表达式模式可能有助于克服这一点。我想知道如何将模式文件合并到 OCR 过程中以提高准确性。

我应该使用用户模式文件吗?

或通过添加正则表达式类型字典

0 投票
1 回答
375 浏览

ionic-framework - 如何在 Ionic 4 中集成 ABBYY?

我想ABBYY Real-Time Recognition在我的 Ionic 4 应用程序中集成插件。这是链接

他们的文档非常不完整。也访问了这个cordova npmjs链接,但是在构建 android 应用程序时出错。

无法解析配置 ':app:debugCompileClasspath' 的所有文件。找不到:abbyy-rtr-sdk-1.0:。

任何帮助将不胜感激谢谢!

0 投票
2 回答
966 浏览

c# - 有什么方法可以在 .NET Core 上使用 ABBYY FRE

我正在使用 .NET Core 控制台应用程序开发应用程序。

我需要使用ABBYY FRE在我的项目

我以前开发过 .NET Framework 4.5 应用程序。我使用COM使用 FRE对象使用 FRE。而且效果很好。

但是 .NET Core不能很好地处理COM对象。详情在这里

有没有办法在 .NET Core 上使用 ABBYY FRE???

谢谢你的帮助。

0 投票
0 回答
42 浏览

ocr - 有没有办法将(所有)区域/框自动导出为 jpg/png/图像?

我想从 pdf 文档的每一页导出一个片段,以创建一个更短的文档(实际上是为了方便手动预处理)。我已经用 Abbyy FineReader (12) 将它们“装箱”/“分区”了。

有谁知道如何将这些框/区域导出到图像文件(单独或不)?Ctrl + Shift + C 可能会复制一个区域,但我无法复制每个区域,也无法将区域导出为图像而不是 OCR 化文本。

谢谢你的帮助 !

编辑1 [明确我的目的]:

这就是我想要导出的内容(从 Abbyy FineReader 中的数百页、拳击区或其他可以让我复制和粘贴数百次的工具!):https ://www.noelshack.com/2019-19-5 -1557492079-source.png

...我想在最后得到什么:https ://www.noelshack.com/2019-19-5-1557492079-cible.png

编辑 2:FineReader 英文界面中的适当术语是“区域”,而不是“区域”。“将区域复制为图像”(ctrl+shift+c)是可以的。我想“全部捕获/批量处理”!

编辑3:暂时,我作弊:使用PDF阅读器的“裁剪页面”功能,然后将它们保存为.jpg图像(并在LaTeX下编译这些“裁剪”)。如果有人有其他想法,我很乐意接受!

0 投票
1 回答
5301 浏览

python - “requests.exceptions.HTTPError: 403 Client Error: Forbidden for url: ...”尝试创建 CloudOCR 对象时

首先让我说我不确定我是否正确使用了这个库。

方法#1

我要离开这个页面(这里是Github)。我正在使用这段代码:

这是我得到的错误:

如果我点击错误回溯中的链接,我会看到以下文本:

404 HTTP method GET not supported for /processImage, only method POST supported

方法#2

我正在尝试将本地 PDF 发送到 Cloud OCR 平台。我已经成功使用这里找到的包,如下所示:

我想使用方法#1 实现一个系统。我只是想知道如何做不同的事情来实现这一点。方法 #2 有效的事实表明身份验证不是问题。

0 投票
0 回答
80 浏览

c# - 如何获取源文件的路径?

识别后,我得到IDocument. 该实体有页面。我无法获取页面源文件的路径。

这就是我所拥有的:

我以这种方式加载到处理器中:

where _processor 这个 IFlexiCaptureProcessor

然后我执行识别:

我需要获取本文档每一页的源文件的路径。

但是由于某种原因,源文件的路径是空的。

换句话说,我需要将IImageDocument对象扔给处理器,并且在执行识别时,我想获取一个IDocument对象,让星星知道它们的源文件。

0 投票
1 回答
1071 浏览

c# - 如何在 C# 应用程序中使用 Abbyy Fine Reader Engine 进行 OCR 处理

我目前正在使用 IRONOCR 进行从图像到文本的 ocr 转换,我观察到的结果非常不令人满意。我需要有大约 90% 的准确率,专门用于阿拉伯语。任何人都可以建议我,哪种 OCR 最好用 C# 应用程序实现并获得更好的结果。此外,我想将 ABBYY Finereader 与我的 C# 应用程序集成并检查以获得更好的结果。谁能帮助我将 ABBYY Finereader 集成到我的应用程序中?

/////////////////////使用 IRONOCR///////////////////// /

0 投票
3 回答
263 浏览

java - FineReader 引擎 Java SDK。如何在从 PDF 转换为 DOCX 的过程中忽略图片

我需要找到一种在转换为 DOCX 文件期间忽略 PDF 文档中的图片和照片的方法。

我正在创建 FineReader Engine 的一个实例:

之后,我正在转换一个文档:

结果,它转换了初始 pdf 文档中的所有图像。

0 投票
1 回答
267 浏览

c# - 状态码 403 禁止无法在 wsdl webservice 上使用 postAsync 方法对多部分数据进行编码?

我是网络服务的新手,wsdl我正在开发 abbyy flexicapture 网络服务,以在 fxicapture 中上传文件并在 xml 中获取数据。现在主要问题出现了,当我的代码处于调试模式(即在本地机器上)时,我将获取数据,但是当我将代码发布到远程服务器时,我会在 postAsync 方法编码数据时收到 403 错误。Abbyy flexicapture 分享了一个演示项目https://help.abbyy.com/en-us/flexicapture/12/developer/unattendedexample通过使用该代码我创建了一个 MVC 应用程序,在该应用程序中我成功地从服务器上使用窗口的 flexicapture 获取数据在我的本地机器上进行身份验证。

我正在与您分享我的错误,请查找

Flexicapture 和 Webservice 在远程服务器上的同一个 IIS 上。

在此先感谢,请帮助我。

0 投票
1 回答
84 浏览

machine-learning - 从中文文档中提取数据

workfusion 是否支持使用 OCR 和机器学习从中文文档中提取数据。请指教。

问候, Sunil Prabakar C