问题标签 [optical-mark-recognition]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
103 浏览

computer-vision - 有没有办法为某些单词“准备”tesseract 或其他 OCR 引擎

有没有办法启动 Tesseract-OCR 或其他引擎来提高对某些单词/形状的敏感性?启动是人类可以提高对某些刺激的敏感性的一种方式,我不确定 OCR 是否会做同样的事情。我知道 facebook/instagram 之类的应用程序可以增加对某些帖子的敏感度或对某些帐户的行为,如果该帐户过去曾表现出这种行为

0 投票
0 回答
284 浏览

algorithm - 用于检测图像对齐标记的查找器图案

我正在寻找一种可以检测图像对齐标记的算法,类似于 QR 码在 3 个角上使用方形标记来对齐和定向的方式。我打算使用此解决方案在标记边界内执行图像标准化。

0 投票
1 回答
136 浏览

tesseract - 正方体 OCR 音高文本

我对光学字符识别软件的一些术语有疑问,特别是 Tesseract OCR 引擎。

我正在阅读一篇关于 Tesseract OCR 引擎的文章,它经常提到一个叫做Fixed pitch text的东西,我不完全确定这意味着什么。我假设音高是一行文本占据的空间,但这在我正在阅读的文章的上下文中并没有真正的意义。

这是使用此措辞的文章中的一句话:

Blob 被组织成文本行,并针对固定间距或比例文本分析行和区域。

我在网上找了一些关于这个的定义,但是大多数关于 OCR 的文章只是使用它而没有任何解释。我猜这意味着这是一个非常简单/常见的术语。

如果有人关心的话,我正在阅读的文章名为“An Overview of the Tesseract OCR Engine”,作者是 Ray Smith。

0 投票
0 回答
93 浏览

python - 使用 PYTHON 在 OPENCV 中旋转纸张以校正角度 - 光学标记识别 (OMR)

我正在开发一个 OMR 软件。我的问题:无论用户拿着智能手机相机的角度如何,都需要直接打印输出

样本

类似的软件使用图片旁边的黑条。

我在这个问题上尝试过但失败的方法:

  • 特征匹配+单应性
  • 匹配模板

你能推荐我应该研究的最准确的关键字来完成这个过程吗?

0 投票
0 回答
11 浏览

computer-vision - 如何将 Cognex In-Sight Micro ISM 1100 连接到 PC?

有人使用过 ISM 1100 吗?我将它与 CIO-MICRO 模块一起使用。我已经通过以太网电缆将它连接到我的电脑。In-Sight Explorer 软件确实检测到了相机,我可以让相机灯闪烁,但是当我尝试连接时,我得到“连接错误。尝试连接到指定的网络地址失败”。CIO-MICRO 过去有时会出现在添加传感器对话框中,但现在不再出现了。如果有人可以帮忙,请我很痛苦

我尝试过 In-Sight Explorer 6.1.0、6.1.3 和 5.5.0