问题标签 [ocr]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
225 浏览

colors - OCR:如何找到正确的 ColorMatrix 来定义新颜色?

我现在被困在定义每条线的尺寸上。我要抓取的列表中有各种颜色,最让我不安的是一个选择:

例子

如您所见,我尝试分析的图片是带有绿色文本的白色背景。选择背景为灰色,带有黑色文本。并且每一行都有一个稍微灰色的背景,但我设法用 ColorMatrix 来控制对比度。

仅供参考,我确实有一些其他的 ColorMatrizes,如 Greyscale、Negative、SetContrast、SetBrightness 等。

我的搜索线条的方法确实适用于图片的大部分部分,但选择会阻止它。

所以现在我被卡住了,不知道该怎么办。我google了一个小时,但没有找到解决方案。


我想,也许我可以将背景灰色从选择转换为白色,而不影响文本和灰度图片的其余部分。但我找不到能完成这项工作的 ColorMatrix。

你知道一个或有更好的解决方案吗?

0 投票
1 回答
501 浏览

c# - 使用 Lockbits 搜索黑色像素,但这是随机的吗?

我遇到了 Lockbits 的问题。我正在搜索黑色像素,因为它看起来不正确,所以我使用 WindowPopup 来打印每个像素的颜色,但这就像我的程序正在使用另一张图片一样。

替代文字 http://i208.photobucket.com/albums/bb91/Savaronna/pixel-1.jpg?t=1234874238

我将第一个发现的黑色像素标记为红色。如您所见,还有其他几个像素也应该匹配。我究竟做错了什么?

这是我的剧本,我需要监督吗?

0 投票
1 回答
2269 浏览

c# - OCR:如何比较图像、排序不匹配并快速完成?

我设法将每个字符存储在位图中,并正在寻找一种方法来快速确定它是哪个字符。

因此,我将把每个可能的字符存储到一个 1 和 0 的数组中,并将它们与我刚刚抓取的位图数组进行比较。

我可以做一些简单的检查,比如比较我得到了多少黑色像素,比较尺寸等等,但是所有这些检查都很慢(只是猜测..)。

所以我正在寻找的是一种方法,它从下到上遍历每个像素,或者随机将数组与一组数组进行比较并排序不匹配,直到只剩下一个数组。但是我该如何实现呢?

谢谢你的帮助。

斯文

0 投票
2 回答
1164 浏览

.net - .NET Compact Framework 中的 OCR 图像

.net compact 框架中是否有任何库或代码示例可以将图像转换为文本?我在手机上看到了一个应用程序,你可以拍一张名片的照片,它会自动填写联系人记录,所以我知道这是可能的,但我想知道怎么做。我搜索了谷歌,似乎找不到任何特定于紧凑框架的东西,有没有人有任何想法?谢谢

0 投票
3 回答
1572 浏览

c++ - 基本像素/细胞计数算法

晚安 :)

我目前正在使用 DevIL 库,它允许我加载图像并检查每个像素的 RGB 值。作为一个个人学习项目,我正在尝试为我在 Photoshop 中制作的几张图像编写一个非常基本的 OCR 系统。

我成功地消除了图像中的所有扭曲,留下了文字和数字。我目前不是在寻找从输入中学习的高级神经网络。我想开始相对容易,所以我开始识别单个字符并计算这些字符中的像素。

我有两个问题:

  • 识别单个字符。
  • 最重要的是:我需要一种算法来计算连接像素(相同颜色),而不计算我之前计算过的像素。我没有数学背景,所以这对我来说是最大的问题。

感谢您对此事的任何帮助,谢谢。

编辑:

我已将此问题标记为 C++,因为这是我目前使用的。但是,其他语言的伪代码或易于阅读的代码也可以。

0 投票
5 回答
10882 浏览

.net - OCR 用于识别 .NET 中的笔迹

我需要在可以识别手写内容的 .NET 应用程序中使用 OCR 组件。我们启动并运行了 MS office 的 MODI 组件,它可以识别打印文本,但不能识别手写内容。

我不介意付钱。

有人有什么建议吗?

非常感谢吉姆

0 投票
1 回答
356 浏览

ocr - XSL-FO 的确切位置

当需要 OCR 的精确放置时,我在 XML-FO 页面(通过 FOP 运行)中有一个项目。每当编辑页面(或包含的页面)时,都很难将 OCR 线恢复到位。

FOP 是否可以指定确切的位置。而不是让页面上的先前项目推动项目?

0 投票
2 回答
3122 浏览

c# - 如何使用单层感知器为 ocr 训练网络?

我正在开发一个程序来使用 OCR 技术从图像中识别字符。到目前为止,我使用了一种扫描图像的方法,但现在我必须使用神经网络。请解释什么是单层感知器以及如何使用它来训练网络。

0 投票
2 回答
1691 浏览

nlp - 用于 OCR 的多层感知器

我打算使用经过反向传播训练的多层感知器网络(一个隐藏层,输入用作包含图像中黑白像素的 8x8 位矩阵)。出现以下问题:

  1. 我应该使用哪种类型的学习:批量学习还是在线学习?
  2. 我如何估计隐藏层中正确的节点数?我打算处理英文字母的26个字母。
  3. 我怎样才能停止训练过程,以避免过度拟合?
  4. (不太相关)是否有另一个比 MLP 表现更好的 NN?我知道 MLP 会陷入局部最小值、过度拟合等问题,那么是否有更好的(基于软计算的)方法?

谢谢

0 投票
3 回答
5270 浏览

ocr - 用于文档 OCR/可读性的图像处理/增强算法?

我正在寻找算法、论文或软件来增强传真、来自手机摄像头的图像以及其他类似来源的可读性和 OCR。

我主要对简单的增强感兴趣(例如,你可以使用 ImageMagick 做的事情),但我也对更复杂的技术感兴趣。我已经在与供应商交谈,所以对于这个问题,我主要是在寻找算法或开源软件。

进一步澄清:我不是在寻找 OCR 软件或算法;我正在寻找算法来清理图像,使其看起来对人眼更具可读性,并且可能用于 OCR。