0

表单识别器是否能够在文档被表单识别器识别工具处理之前预先选择/预先区分文档?

例如,它将能够区分票据或票据,并且只使用票据识别工具。

4

3 回答 3

3

正如其他答案所建议的那样,您可以实现自己的分类器。您可以调用模型,并检查返回值的置信度分数,如果它太低,那么它不是您要处理的文档。

如果您要构建 2 个模型,一个用于票据,一个用于票据,每个模型都提取不同的键/值集,那么 Form Recognize 团队正在开发一个功能来为您找到最合适的表单,请继续关注。

谢谢

-xin(来自 MSFT 表单识别团队)

于 2020-05-15T15:10:14.237 回答
2

Azure 表单识别器是一种认知服务,它使用机器学习技术从表单文档中识别和提取文本、键/值对和表格数据,无论它们是 PNG、JPEG、TIFF 还是 PDF。

使用表单识别器,您无法找到文档类型或区分文档。在提取数据之前,您需要训练任何类型的表单。

出于隔离的目的,您必须使用其他一些服务/工具。例如,Azure 计算机视觉服务可用于查找图像类型。

于 2020-05-15T14:52:54.137 回答
1

不,这不是表单识别器的功能。

例如,您可以使用自定义视觉实现自己的分类器(用于图像文档)

于 2020-05-15T14:44:15.030 回答