问题标签 [finereader]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
sdk - 名片识别看不到变音符号
我正在使用 Finereader 11 的试用版来扫描名片。到目前为止,它忽略了所有变音符号。
我应该以不同的方式初始化引擎吗?我需要指定我想要的语言吗?
ocr - FineReader - 如何创建/使用自定义词典
我正在尝试创建一个自定义字典以用于 C# 的 Abby FineReader SDK,但我没有成功。
是否有人知道如何在 FineReader 中创建和使用自定义词典?
dictionary - 如何从 Abby Finereader 中的用户词典创建连字?
我需要从扫描的文档 (pdf) 中识别复杂的化学名称。它们包含特殊字符并以表格格式编写。我还有一个 Excel 文档,其中包含我在扫描过程中可能遇到的所有可能的名称(我会说行,因为没有组合)。有没有办法创建连字(这样 Finereader 会识别整行而不是将其分解成单独的字符)?我尝试创建用户字典,但 Finereader 不会将其视为单行。
ocr - 如何下载 Abbyy FineReader 引擎
我们对 Abby Fine Reader 很陌生。我们需要做一些定制来阅读识别的文本。为此,我们尝试下载 Abbyy Fine Reader Engine 跟踪,但该链接始终将我们导航到 Cloud OCR SDK 页面。请帮助我们找到下载 Abbyy FineReader Engine 的方法,以通过 .Net 编程语言进行尝试。
提前致谢。
python-3.x - 以正确格式将 docx 文件转换为 python
我有一个由 FineReader 创建的 docx 文件(FineReader 获取一个 pdf 文件并使用 pdf 中的文本创建一个文本文件)。现在我想使用 python3 读取文件。我用了:
这就是结果:
这是我在文本编辑器中打开 docx 文件时文本的样子:
知道如何解决此编码问题吗?
顺便提一句。我还尝试了以下方法:
这就是结果:
我试过这个:
并得到:
windows - 如何在PowerShell中添加异常以等待进程关闭命令?
我在下面有一段简单的代码,它在98%的时间内成功运行了一个 exe。PowerShell 等待FineCmd.exe
关闭使用| Out-Null
.
注意:FineCmd.exe
运行FineReader.exe
但是,有时会FineReader.exe
显示一个简单的错误消息框来停止 for 循环。一旦用户手动单击 OK 并关闭FineReader.exe
,PowerShell 将继续执行 for 循环。
如何让 PowerShell 执行以下操作:
- 意识到发生了错误
FineReader.exe
- (强制关闭
FineReader.exe
- 重复发生错误的循环迭代?
整个代码如下:
regex - 如何使用正则表达式通过 ABBYY FineReader 改进 OCR
我将 ABBYY FineReader 12 与 Java API 一起用于 OCR 任务,重点是识别几种众所周知的模式(正则表达式)中的 ID。
我在识别相似的字符时遇到了麻烦,例如:有时g
's 被误认为9
's,0
' s 被误认为 ' O
s 1
' I
s 等。
我认为使用正则表达式模式可能有助于克服这一点。我想知道如何将模式文件合并到 OCR 过程中以提高准确性。
我应该使用用户模式文件吗?
或通过添加正则表达式类型字典?
ocr - 有没有办法将(所有)区域/框自动导出为 jpg/png/图像?
我想从 pdf 文档的每一页导出一个片段,以创建一个更短的文档(实际上是为了方便手动预处理)。我已经用 Abbyy FineReader (12) 将它们“装箱”/“分区”了。
有谁知道如何将这些框/区域导出到图像文件(单独或不)?Ctrl + Shift + C 可能会复制一个区域,但我无法复制每个区域,也无法将区域导出为图像而不是 OCR 化文本。
谢谢你的帮助 !
编辑1 [明确我的目的]:
这就是我想要导出的内容(从 Abbyy FineReader 中的数百页、拳击区或其他可以让我复制和粘贴数百次的工具!):https ://www.noelshack.com/2019-19-5 -1557492079-source.png
...我想在最后得到什么:https ://www.noelshack.com/2019-19-5-1557492079-cible.png
编辑 2:FineReader 英文界面中的适当术语是“区域”,而不是“区域”。“将区域复制为图像”(ctrl+shift+c)是可以的。我想“全部捕获/批量处理”!
编辑3:暂时,我作弊:使用PDF阅读器的“裁剪页面”功能,然后将它们保存为.jpg图像(并在LaTeX下编译这些“裁剪”)。如果有人有其他想法,我很乐意接受!