问题标签 [icr]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
2271 浏览

timer - 使用 ATmega328 的 Timer1 上的输入捕捉寄存器来确定信号频率

我正在尝试让 Arduino UNO 读取 64cpr 正交编码器。我特别想使用 Timer1 来测量其中一个编码器信号的频率(以及速度)。

我最终想在一个数组中存储 10 个测量值来计算移动平均滤波器,但一次只做一件事。我首先需要能够测量两个上升沿之间的时钟周期。

这是我到目前为止所得到的。任何帮助或意见表示赞赏:

现在我什至没有跳入 ISR,我不明白。我想我已经正确设置了一切。启用中断。ICES1 应该默认为 0,或者下降沿触发,这很好(只想测量一个周期)。我在端口 B 上选择一个引脚来接收(输入)信号,这应该没问题。从 Atmel 的文档中,我认为 Timer1 已连接。

有什么想法吗?提前致谢!

0 投票
1 回答
2481 浏览

javascript - 使用 javascript 进行手写文本识别

我正在尝试实现一个系统来识别/检测图像中手写文本的单词。我需要识别文本中的单词。但我觉得这是不可能的,因为即使对我来说这些图像也无法阅读。现在我需要的是把单词分开。我只需要弄清楚有一个词。当用户选择一个区域时,系统应该只选择图像中的一个单词。

我的问题是:使用 JavaScript 是否可行?

这是一个示例图像。 在此处输入图像描述

0 投票
0 回答
338 浏览

python-3.x - 如何在Opencv3 python中删除轮廓内的轮廓

我正在为 ICR 使用以下代码行

这给出了轮廓内的轮廓。请建议我如何在 python 中删除它。

0 投票
1 回答
1258 浏览

python - 如何在此图像中找到特定的表单域

在巴西,为医院的每个新生儿(手工)填写标准表格。这种表格被称为“DNV”(葡萄牙语为“Born Alive Declaration”)。还有一种表格叫做“DO”(葡萄牙语为“死亡声明”之后)。在我所在的州,医院向我工作的机构发送了近一百万份这样的表格,在那里我们计算了一个名为“生命统计”的数据库。我正在调查是否可以使工作自动化。由于商业 ICR 解决方案花费大量资金,没有人相信它可以在内部完成,因此它是一个草根项目。

表格的顶部是这样的: 在此处输入图像描述

我得到了从几家医院发送的 100K PDF 文件,并且能够使用一种简单的算法将它们分类为两种类型(DNV 或 DO)中的一种:首先,我找到包含文档类型的黑色矩形(使用cv2.findContours和一些启发式方法)并应用 OCR(pytesseract.image_to_string)。我找到了 20k“死亡声明”(DO)和 80k“生前声明”。

使用类似的算法,我能够对黑色矩形右侧的数字进行 OCR,并将 55k 表单图像与专业打字员根据这些文档填写的数据库中的相应记录链接起来。

现在我想找到日期字段(红色),以便尝试一些机器学习来识别数字 - 该字段在下面突出显示: 在此处输入图像描述

首先,我尝试了一个“模板匹配”算法,使用它作为模板:在此处输入图像描述

这很有效,但前提是模板和表单图像具有相同的比例和角度。该cv2.matchTemplate方法对规模非常敏感。我尝试了使用 SURF 的特征匹配算法,但我很难让它工作(感觉有点矫枉过正)。

由于很容易找到左侧的黑色矩形,我正在考虑一些选项来定位数字:

  • 根据黑色矩形对比例和角度进行归一化并尝试cv2.matchTemplate

  • 试图定位轮廓,使用简化cv2.approxPolyDP并猜测数字位置。

我的问题是:关于如何解决问题的任何建议?如果输入未根据分辨率/角度进行标准化,我可以使用什么其他算法来定位此表单字段?

[更新#1]

给定 (x, y, w, h) 作为左侧黑色矩形的位置和大小,我可以以合理的信心缩小搜索范围。在此处输入图像描述

尝试随机样本,这个公式给了我:

在此处输入图像描述 在此处输入图像描述 在此处输入图像描述

[更新#2]

我刚刚了解到erodedilate,现在他们是我最好的新朋友。

在此处输入图像描述

在此处输入图像描述

顺便说一句,我对计算机视觉一无所知。让我们回到谷歌...

0 投票
1 回答
646 浏览

ocr - 是否可以在 google vision api 中给出文本格式提示?

我正在尝试检测图像中孤立的手写日期。

在此处输入图像描述

在云视觉api中,有没有办法给出关于类型的提示?

示例:唯一存在的文本将是 dd/mm/yy,d,m 和 y 是数字

我唯一发现的是文档中的语言提示。

有时我会得到包含字母的结果,O而不是0.

0 投票
0 回答
43 浏览

parsing - 使用输入图像中的特定区域通过 MS API 进行手写识别

我们能否将输入图像中的特定坐标发送到 MS 手写识别 API,以便识别不是整个图像,而是仅识别图像中的那些特定区域。

0 投票
1 回答
1159 浏览

google-api - 可以指示 Google Vision API 仅检测单个字符还是非英文字符串?

例如,我想检测像“A5b1x”这样手写的编码字符串。所以我要么手动拆分它,以便我拥有每个角色的图像,要么尝试让 Vision 立即识别它。目前两者都不起作用,因为我不确定如何指定它不是一种语言(或指定它是单数字符)。这是我在 Google 计算实例中输入的内容:

“g”的图像没有结果: g

“e”的图像没有结果:e

“fxb3”图像的结果:fxb3

0 投票
0 回答
50 浏览

java - 您将如何根据 Java 中的坐标检测文本?

我试图弄清楚是否有某种库可以根据坐标点的一般位置识别字符。它需要能够检测各种形状、大小、比例、变化等。在这个例子中,它会检测到“FFF”(在这种情况下,大小写对我来说并不重要)。如果您有任何想法,他们将不胜感激!如果您认为这个想法很疯狂且不可行,也请告诉我。谢谢!

0 投票
3 回答
298 浏览

image-processing - 使用傅里叶变换从填充的表格中检测框中的手写字符

我正在尝试从框中提取手写字符。表格的扫描并不一致,因此框的宽度和高度也不是恒定的。

这是表格的一部分。

在此处输入图像描述

我目前的做法:
1. 提取水平线
2. 提取垂直线
3. 结合以上两个图像
4. 查找轮廓(使用opencv)

这种方法给了我大部分的盒子。但是,当方框中填充有“L”或“I”之类的字符时,字符中的垂直线也会作为垂直线提取的一部分被提取。因此轮廓也会变得混乱。
由于盒子是周期性排列的,有没有办法使用快速傅里叶变换提取盒子?

0 投票
1 回答
39 浏览

image-processing - 如何检查图像中的框是否有文字?

我有一个与此类似的表格,其中文本实际上是手写的。我希望能够检查每个字段是否已填写,但不需要了解或识别每个字段的内容。我只需要能够检测到该字段已被填写。

表格示例

人们将不得不用扫描仪扫描页面,程序应该检测这些字段并检查它们是否有任何内容。有没有人有任何想法或知道简单的解决方案。我在考虑使用 ICR 或 OCR,但 OCR 无法检测手写文本,而且 ICR 只有在您付费时才好用,但它太好了。