2

我一直在阅读(并尝试)以前的答案中建议的 OCR 程序,但我仍然没有明确的答案来解决我的问题。

我需要识别手写的英文文本。文本将是多行,但每行只有一个或两个单词的长度。这段文字来自不同的人。我可以要求那个人提供一个培训文件(例如,带有字母和 0-9 数字),但我真的不能要求比这更复杂的培训。

我需要将识别集成为另一个(Java)应用程序的一部分,但解决方案不需要是 Java。我可以从 Java 中执行它并从文本文件中获取结果。

有什么建议吗?

我已经测试过 Tesseract(没有训练和训练的坏结果看起来很复杂)。Java OCR 看起来像是完美的解决方案(简单的培训、开源和 Java),但即使使用他们自己的示例也不能很好地工作(有人有更好的经验吗?)。GOCR 似乎不是很活跃。

当然我更喜欢免费的解决方案,但这不是必须的(尽管我看到商业选项的问题是我必须能够将它集成到我自己的应用程序中,该应用程序将作为 SaaS 提供)

4

3 回答 3

3

根据我的经验,即使没有经过培训,ABBYY 也是最好的手写识别之一。(不过,它也可能是最昂贵的之一......)他们有一个用于 Java 的 SDK。

http://www.abbyy.com

免费试用,绝对值得一看!

于 2011-05-26T03:50:08.950 回答
0

我正在寻找手写文本识别软件。到目前为止,唯一比 abby 11 提供更好结果的是 SimpleOCR,它对两者使用相同的文本,这是 ocr 的免费软件,但 HCR 有 14 天的试用期!

于 2012-08-29T03:44:46.637 回答
0

我知道我在将近 6 年后才回答。但如果有人还在寻找,请尝试使用 tensorflow。他们的网站有一个简单的手写数字识别 (MNIST) 示例。您可以使用此示例并将其用于手写字母识别(您需要为此提供训练数据,我使用 NIST 特殊数据库 19 来获取此数据)。

于 2017-01-24T21:10:57.493 回答