1

我想在表单识别器中使用的表单有几个复选框。目前,表单识别器的 OCR 引擎似乎没有检测到复选框。是否有解决方法,或者有没有办法训练复选框识别?

我也尝试过在 Windows 和 linux 上使用 tesseract,但我也无法在那里解决它。

复选框是您的标准空心方块。有时他们可能有一个“x”或复选标记。

如果没有解决方案,那么我可能会要求客户从复选框更改为实心圆圈(单选按钮)。我还没有测试过,看看 OCR 会对它们产生什么影响。

编辑:我阅读了表单识别器文档,我看到它明确表示不支持复选框和单选按钮。我想知道是否有人有解决方法?

4

4 回答 4

3

根据定义,OCR 用于“字符识别”(参见此处)。复选框或单选按钮不是字符,因此不会被 OCR 识别。

您仍然可以尝试使用自定义视觉检测器来查找这些项目,但这会有点复杂,因为此服务只会在您的文档中找到这些项目,并且您必须结合 OCR 调用来获取文本,然后尝试匹配文档中的区域以了解哪些文本与哪个组合/单选按钮相关联

于 2019-07-15T09:23:30.173 回答
2

2.1 版中的表单识别器中添加了对复选框的支持(截至 2020 年 9 月的公共预览版)。从公告

复选框/选择标记检测- 表单识别器支持检测和提取选择标记,例如复选框和单选按钮。选择标记在 Layout 中提取,您现在还可以在训练自定义模型 - 使用标签训练中进行标记和训练,以提取选择标记的键值对。

现在在Get Analyze Layout ResultselectionMarks API 响应中有一个对象,它列出了检测到的选择标记及其状态,要么要么。selectedunselected

自 2.1 版起,示例标签工具也添加了对标签复选框和选择标记的支持。

于 2020-09-25T14:41:46.197 回答
1

在表单识别器中,如果表单具有一致的布局,您可以使用新的 GUI 工具标记该区域并将该特定区域传递给 OCR 以尝试改进结果。

于 2020-07-14T07:34:01.800 回答
1

@Ram-msft 建议的方法可以工作,但我发现识别器很难始终如一地挑选出框中的任何单个字符 - 尽管老实说复选框类型框似乎比在框中说数字更好(根据我的经验至少)。

只要您对框内的任何“值”感兴趣(即它不是空的),那么该方法应该会给您合理的结果,直到他们提出真正的解决方案。

于 2020-08-10T14:59:06.643 回答