我需要在可以识别手写内容的 .NET 应用程序中使用 OCR 组件。我们启动并运行了 MS office 的 MODI 组件,它可以识别打印文本,但不能识别手写内容。
我不介意付钱。
有人有什么建议吗?
非常感谢吉姆
我推荐Pegasus Imaging,我们每天都在使用它,它很棒。对于手写,您有 ICR 模块。
在我的应用程序中,我们需要识别一些用手写文本填写的表格。只要用户使用格式正确的字符,准确性就很好。我使用的 SDK 称为Leadtools。我的应用程序使用 MFC,但它们也有 .NET 类。
大多数 OCR 工具包旨在识别印刷文本,而不是手写文本。我会推荐Atalasoft 的工具包,因为您可以插入各种 OCR 引擎。
识别手写文本的准确性要低得多,也更加困难。它通常被标记为智能字符识别(ICR),我不确定 Atalasoft、Pegasus 或大多数商业产品是否支持 ICR。通过在网格上的一个单元格中写下每个字母来帮助手写识别,就像在 SAT 上填写你的名字一样。您是在谈论自由格式文本还是在网格上书写?
试试tessnet,它是一个基于 tesseract 的开源 .NET OCR 引擎
区分手写文本和草书书写很重要。ICR 一词通常用于指代手写文本。
Accusoft Pegasus 提供了一个 SmartZone ICR .NET SDK,可以让您快速识别文本。随着您可以控制文本的输入方式(例如在表单上等),准确性会越来越好。
同样重要的是要认识到,可用于实时识别的线索(例如在平板电脑上)与扫描图像中的线索完全不同。这就是为什么实时草书识别比事后识别(扫描图像)容易得多的原因。可以读出笔的动作,笔画的顺序对识别很有帮助。