我想编写一个可以利用 Adobe Acrobat 中的 OCR 功能的 C# 应用程序。我怎么称呼这个?有公共 API 吗?
问问题
3504 次
2 回答
0
我相信这是 Adobe Reader 软件的一部分,无法通过 API 访问。有一个 API 和库可用于根据格式规范构建 PDF 文档,但 OCR 与读者有关,而不是格式。恐怕您要么必须使用另一个库,要么自己实现它。
于 2009-07-03T11:24:20.790 回答
0
没有适用于 .net 的直接 Adobe OCR API。但是,对于您要实现的目标,有一些替代方案。GitHub 上有一个用于 Google 的开源Tesseract OCR 的开源 .Net 包装器: https ://github.com/charlesw/tesseract 。这应该让您在 C# 中具有 OCR 功能。
从文档中:
快速入门
- 通过从包管理器控制台运行添加
Tesseract
NuGet 包。Install-Package Tesseract
- 确保您已安装 Visual Studio 2012 x86 和 x64 运行时
- 从tesseract-ocr下载 tesseract 3.02 的语言数据文件并将它们添加到您的项目中,确保“复制到输出目录”设置为始终。
- 查看示例解决方案
~/Samples/Tesseract.Samples.sln
以获取工作示例
于 2015-06-09T17:45:22.593 回答