问题标签 [finereader]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
109 浏览

sdk - 名片识别看不到变音符号

我正在使用 Finereader 11 的试用版来扫描名片。到目前为止,它忽略了所有变音符号。

我应该以不同的方式初始化引擎吗?我需要指定我想要的语言吗?

0 投票
1 回答
493 浏览

ocr - FineReader - 如何创建/使用自定义词典

我正在尝试创建一个自定义字典以用于 C# 的 Abby FineReader SDK,但我没有成功。

是否有人知道如何在 FineReader 中创建和使用自定义词典?

0 投票
1 回答
130 浏览

dictionary - 如何从 Abby Finereader 中的用户词典创建连字?

我需要从扫描的文档 (pdf) 中识别复杂的化学名称。它们包含特殊字符并以表格格式编写。我还有一个 Excel 文档,其中包含我在扫描过程中可能遇到的所有可能的名称(我会说行,因为没有组合)。有没有办法创建连字(这样 Finereader 会识别整行而不是将其分解成单独的字符)?我尝试创建用户字典,但 Finereader 不会将其视为单行。

0 投票
1 回答
1387 浏览

ocr - 如何下载 Abbyy FineReader 引擎

我们对 Abby Fine Reader 很陌生。我们需要做一些定制来阅读识别的文本。为此,我们尝试下载 Abbyy Fine Reader Engine 跟踪,但该链接始终将我们导航到 Cloud OCR SDK 页面。请帮助我们找到下载 Abbyy FineReader Engine 的方法,以通过 .Net 编程语言进行尝试。

提前致谢。

0 投票
1 回答
295 浏览

ocr - 通过编程自定义 Abbyy FineReader

我们对 Abby Fine Reader 很陌生。当我们使用本产品进行 OCR 时,识别的文本将被传输到文本编辑器窗口。在这里,当涉及到文本窗口时,我们需要通过编程从文本编辑器窗口中读取文本。(请参阅附件)。请建议我们如何通过编程来做到这一点?提前致谢。

在此处输入图像描述

0 投票
1 回答
1476 浏览

python-3.x - 以正确格式将 docx 文件转换为 python

我有一个由 FineReader 创建的 docx 文件(FineReader 获取一个 pdf 文件并使用 pdf 中的文本创建一个文本文件)。现在我想使用 python3 读取文件。我用了:

这就是结果:

这是我在文本编辑器中打开 docx 文件时文本的样子:

知道如何解决此编码问题吗?


顺便提一句。我还尝试了以下方法:

这就是结果:

我试过这个:

并得到:

0 投票
0 回答
242 浏览

windows - 如何在PowerShell中添加异常以等待进程关闭命令?

我在下面有一段简单的代码,它在98%的时间内成功运行了一个 exe。PowerShell 等待FineCmd.exe关闭使用| Out-Null.

注意:FineCmd.exe运行FineReader.exe

但是,有时会FineReader.exe显示一个简单的错误消息框来停止 for 循环。一旦用户手动单击 OK 并关闭FineReader.exe,PowerShell 将继续执行 for 循环。

如何让 PowerShell 执行以下操作:

  1. 意识到发生了错误FineReader.exe
  2. (强制关闭FineReader.exe
  3. 重复发生错误的循环迭代?

整个代码如下:

0 投票
0 回答
567 浏览

regex - 如何使用正则表达式通过 ABBYY FineReader 改进 OCR

我将 ABBYY FineReader 12 与 Java API 一起用于 OCR 任务,重点是识别几种众所周知的模式(正则表达式)中的 ID。

我在识别相似的字符时遇到了麻烦,例如:有时g's 被误认为9's,0' s 被误认为 ' Os 1' Is 等。

我认为使用正则表达式模式可能有助于克服这一点。我想知道如何将模式文件合并到 OCR 过程中以提高准确性。

我应该使用用户模式文件吗?

或通过添加正则表达式类型字典

0 投票
2 回答
966 浏览

c# - 有什么方法可以在 .NET Core 上使用 ABBYY FRE

我正在使用 .NET Core 控制台应用程序开发应用程序。

我需要使用ABBYY FRE在我的项目

我以前开发过 .NET Framework 4.5 应用程序。我使用COM使用 FRE对象使用 FRE。而且效果很好。

但是 .NET Core不能很好地处理COM对象。详情在这里

有没有办法在 .NET Core 上使用 ABBYY FRE???

谢谢你的帮助。

0 投票
0 回答
42 浏览

ocr - 有没有办法将(所有)区域/框自动导出为 jpg/png/图像?

我想从 pdf 文档的每一页导出一个片段,以创建一个更短的文档(实际上是为了方便手动预处理)。我已经用 Abbyy FineReader (12) 将它们“装箱”/“分区”了。

有谁知道如何将这些框/区域导出到图像文件(单独或不)?Ctrl + Shift + C 可能会复制一个区域,但我无法复制每个区域,也无法将区域导出为图像而不是 OCR 化文本。

谢谢你的帮助 !

编辑1 [明确我的目的]:

这就是我想要导出的内容(从 Abbyy FineReader 中的数百页、拳击区或其他可以让我复制和粘贴数百次的工具!):https ://www.noelshack.com/2019-19-5 -1557492079-source.png

...我想在最后得到什么:https ://www.noelshack.com/2019-19-5-1557492079-cible.png

编辑 2:FineReader 英文界面中的适当术语是“区域”,而不是“区域”。“将区域复制为图像”(ctrl+shift+c)是可以的。我想“全部捕获/批量处理”!

编辑3:暂时,我作弊:使用PDF阅读器的“裁剪页面”功能,然后将它们保存为.jpg图像(并在LaTeX下编译这些“裁剪”)。如果有人有其他想法,我很乐意接受!