4

我们目前正在研究在提交给 OCR 之前提高图像质量的方法。我们目前使用的 OCR 引擎是 Nuance (v15) 的 Scansoft API。我们正在研究领先工具,但后来决定寻找其他地方。与 Lead Tools 相关的许可成本太高了。首先,我们正在寻找简单的图像增强功能,例如:去歪斜、去斑点、去除线条、去除打孔、锐化等。我们正在运行 .NET 和 Java 软件的组合,但首选 Java 解决方案。

4

7 回答 7

4

Kofax 非常适合进行预处理,但对于您所谈论的清理类型,除非图像真的很糟糕,否则可能会过度杀伤力。除非您的专长是图像处理,否则我建议您与执行图像清理和 OCR 的提供商合作,这样您就可以专注于您实际增加的价值。

我们从 ABBYY ( ABBY SDK ) 获得 OCR 开发套件的许可,发现它在图像处理和 OCR 方面都非常出色。API 非常广泛,示例应用程序、帮助和支持令人印象深刻。我绝对推荐看看。

于 2008-09-27T03:31:09.433 回答
1

免责声明:我为 Atalasoft 工作

我们拥有 .NET 的这些功能和运行时免版税许可。

http://www.atalasoft.com/products/dotimage/

我们还有 OCR 组件,包括用于 Abbyy、Tesseract 等的 .NET 包装器以及可搜索的 PDF 生成(PDF 中文本顶部的图像)

于 2008-10-01T17:58:05.290 回答
0

不确定这是否完全符合你们需要的标准,但也许您应该查看一些Paint.Net API。我不知道提取他们的图像处理算法以用于您的项目有多么容易,但我相信他们会做一些您正在寻找的事情。此外,它是一个具有 MIT 许可证的开源项目,因此对于商业用途应该非常友好。

于 2008-09-27T02:02:02.720 回答
0

在 KOFAX.com 上对 KOFAX VRS 的研究

于 2008-09-27T02:06:50.650 回答
0

也许是 JMagick,它是 ImageMagick 的一个开源 Java 接口。它以薄 Java 本机接口 (JNI) 层的形式实现到 ImageMagick API。它是在 LGPL 下获得许可的,因此在许可方面应该不是问题。

http://sourceforge.net/projects/jmagick/

于 2008-09-27T02:21:33.580 回答
0

我建议英特尔为其零成本运行时许可。

于 2008-10-02T14:36:10.010 回答
0

取决于原始图像的数量和质量。托管代码和成像工具包可以工作,但如果您要处理数百万张图像,它并不总是最好的解决方案。对于小批量和紧张的预算,我同意之前的海报,即像Aforge、Paint.NET和其他开源计算机视觉库这样的项目可以解决问题。当然,如果结果没有改善,您就只能靠自己了……至少这可以让您以低成本将所需的一切都放在一个应用程序中。

如果您每月要处理数十万张图像,那么我建议您将流程分成更小的工作流程步骤并调整每个步骤,直到每张图像的成本尽可能接近零。您会发现 OCR 结果一开始上升很快,然后比您预期的更快趋于平稳。(我不是 OCR 的忠实粉丝,但它有它的位置)

我使用Recogniform的商业 Windows 产品在 OCR 之前使用针对各种图像调整的脚本以批处理模式处理和清理图像。如果图像未通过 QC 或被 OCR 引擎拒绝,则会使用使用Atalasoft工具包构建的自定义 .NET 应用程序手动“修复”。批处理一切,只触及失败的部分。

于 2009-01-06T04:30:00.053 回答