5

有没有在数字(1-10)手写方面做得很好的解决方案?我尝试了 tesseract,但我得到的只是垃圾。

理想情况下是 OSS,但商业也可以。

4

2 回答 2

8

OpenCV 现在带有手写数字识别 OCR 示例。你可以参考它:http ://code.opencv.org/projects/opencv/repository/revisions/master/entry/samples/python2/digits.py

它使用 kNN 和 SVM 来训练一些手写数字,然后对其应用 OCR。

下面是kNN训练的输出(误差只有3.5%):

在此处输入图像描述

于 2012-08-04T12:49:41.767 回答
4

我在搜索时看到了你的帖子,它吸引了我进行一些有趣的研究。我将与您和论坛分享我的一些发现:

手写识别(ICR,基于神经网络)和由此产生的 OCR 解决方案的研究真正起步较晚。在过去的十年中已经提出了许多算法,但手写识别仍然是一个挑战!

首先,一些指向免费编程资源的指针(MB,您对您的编程环境或操作系统只字未提,所以我的建议主要涵盖 Windows。)

  1. www.codeproject.com/Articles/143059/Neural-Network-for-Recognition-of-Handwritten-Digi 这是用于在 C# 中识别手写数字的神经网络的页面 这是 Mike O' 在 C# 中的基本返工尼尔的手写数字识别神经网络采用 MFC/C++ 模型。有关 O'Neill 工作的更多信息,请访问:www.codeproject.com/KB/library/NeuralNetRecognition.aspx。

  2. http://asprise.com/product/ocr/selector.php 他们的解决方案是针对 Visual Basic,所以 Windows 是主要的吸引力,但我看到他们支持 Linux、Mac OS 和一些 UNIX 风格。SDK 是免费的!从这里下载:www.asprise.com/product/ocr/download.php?lang=vb

    (我在这个论坛的另一个地方看到了关于 asprise 的积极反馈: Window 7 OCR API

  3. 这是另一个很棒的资源 - 用于测试 OCR 能力的手写数据库,在这里:www.yann.lecun.com/exdb/mnist/index.html 这是 MNIST 手写数字数据库的主页(60,000 个示例,以及一个测试集10,000 个示例)该网站表示,这些数字已经被大小标准化并以固定大小的图像为中心,因此您可以专注于学习技术和模式识别方法来处理现实世界的数据,并最大限度地减少预处理和格式化工作。

    MNIST 是更大的 NIST 数据库的(免费)子集,可在此处(付费)获得:www.nist.gov/srd/nistsd19.cfm

商业解决方案

  1. www.captricity.com/handwriting-ocr-software/ 此解决方案可处理任何自由格式的手写输入。

    该软件可以转换所有静态文档,包括纸质、PDF、传真、efax,以及任何类型的手写和人工标记。他们有“随用随付”模式(免费 10 页)和每月 75 美元的最低付费解决方案。

  2. www.cvisiontech.com/trapeze/general/trapeze.html?lang=eng CVISION 的 Trapeze for Forms 处理来自结构化表单的字段数据内的手写输入。

    它验证信息并将此信息输出到文档数据库中。

一些!

于 2014-01-12T09:45:53.180 回答