问题标签 [azure-form-recognizer]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
718 浏览

azure - 预测期间的 Azure 表单识别器一般错误

我已经使用 azure 表单识别器几个月了,总的来说我对它很满意,但是今天我们遇到了一个问题,它并没有真正暗示问题是什么:

它似乎发生在TIFFPNG但我没有用PDF测试过。在所有情况下,图像质量都非常高,这真的很难解释。

有没有人遇到过这个问题,有解决办法吗?

0 投票
1 回答
121 浏览

form-recognizer - Azure 表单识别器。将 v1.0-preview 自定义模型迁移到 v2.0

我目前正在从表单识别器的 v1.0 预览版迁移到 v2.0,因为它已宣布将于 9 月 15 日弃用。我尝试使用我在 v1.0-preview 中训练的模型分析带有 v2.0 的 pdf,但响应是该模型不存在,所以我想我不能再使用旧模型了。我想知道是否可以将 v1.0-preview 的训练有素的自定义模型迁移到 v2.0,以便我可以使用它们而不必重新训练它们?

我可以看到有一个端点可以将经过训练的模型从一个订阅或区域复制到另一个订阅或区域,但没有提到在版本之间迁移模型。谢谢你。

0 投票
1 回答
842 浏览

python - 使用 Azure 表单识别器提取 PDF 表数据

我正在使用 Azure From Recognizer 处理发票处理项目。所有发票均为 PDF 格式。我正在使用带有标签的自定义表单识别器。我可以从 PDF 中提取一些数据,例如发票编号、发票日期、金额等,但我想使用 Azure 表单识别器从 pdf 中提取表格数据,但它没有正确读取表格。

我已经标记了我需要的单元格,当表中的行数增加时,它会正确读取该列,但它无法将每行的值彼此分开并将整列作为单个值返回。

我试图提供更多示例,但仍然无法检测到正确的表。 有没有办法使用 Azure 表单识别器从 PDF 中正确提取表数据?

扫描表格是我们的应用程序的基本要求,它将决定我们是否使用 Azure 表单识别器来构建我们的应用程序。

请参阅下面的 PDF 表格图像,并希望从所有列中提取所有行数据。 在此处输入图像描述

如果您可以通过一些文档为我们指明正确的方向,那将是有益的。

谢谢

0 投票
1 回答
442 浏览

form-recognizer - 我们什么时候需要使用表单识别器标签工具中的“撰写”选项?

最近发布的 Azure Form Recognizer Labeling 工具 v2.1 预览版具有组合模型的功能,我们什么时候需要使用?任何人都可以为我解释一些用例吗?

0 投票
3 回答
299 浏览

form-recognizer - 错误 2005:尝试从表单识别器获取响应时

目前我正在使用表单识别器 2.1 版预览版来训练自定义模型。我能够在表单识别器标签工具中测试模型并获得输出。当我在程序的标签工具中输入相同的文件时,我收到以下错误。

使用的 GET 请求代码是:

0 投票
1 回答
72 浏览

computer-vision - 使用工具、表单识别器、自定义标签进行标记后,两个字段的准确性较低

我需要帮助识别两个特定字段——信用日期和信用类型。标记后准确率低(训练约 30%),在测试集上甚至更低(约 10%)。

在标记、标记和训练之后,我正在使用自定义标签 API。

我认为由于不同收据中的条目数量不同,这两个字段相对于其他字段出现在不同的位置。

我能做些什么来提高这些字段的准确性吗?

在此处输入图像描述

在此处输入图像描述

0 投票
1 回答
53 浏览

azure - Azure 表单识别器 - 标签变量类型数据 - 接收列表中的数据

在使用 azure 表单识别器时,我有许多用于训练模型的 PDF。目前还好。例如在下面的数据中。正在捕获 **Bill to、Ship to 和 Order Number ** 的值。但是可以有可变数量的项目。如何接收列表中的每个项目值? 在此处输入图像描述

0 投票
1 回答
66 浏览

azure-cognitive-services - 在使用 azure 表单识别器进行医疗处方时,一些键值对(如数量和笔芯数)没有被提取

在使用 azure 表单识别器进行医疗处方时,一些键值对(如数量和笔芯数)没有被提取。

我们怎样才能提取那个东西?或者我们必须使用任何其他机器学习库来做到这一点。

问题是我们有一个表单,我们已经为天蓝色表单识别器创建了 5 个样本。

表格为 .tiff 格式。

不。of refills 通常写成 - n refills, refills n, refills 1,2,3,4,5。

示例:“Odefsey 200-25-25 毫克片剂每天一次口服一粒。#90 个标签,3 个 Refills 需要拆成

Azure 健康文本分析无法识别数量和补充

我们必须从下面的图片中提取笔芯

0 投票
1 回答
565 浏览

c# - 使用 Microsoft Azure 认知服务检测模型:表单识别器

我创建了一个与 Azure 表单识别器配合得很好的自定义模型。

我计划使用多个模型,包括内置模型。我希望能够检测到最适合的模型(例如,如果我扫描收据,它应该使用内置的收据模型,或者如果我以自定义形式扫描,它应该从我拥有的多个模型中选择最适合的模型受过训练)

我目前正在使用(但不限于)C# SDK,我目前正在使用以下代码:

请注意,我StartRecognizeCustomForms带有一个 modelId,所以我必须为每个文档提供一个特定的 modelid。

编辑我发现我可以创建“组合模型” - 但是我看不到任何将内置(收据等)模型包含到这些组合中的方法。

0 投票
2 回答
471 浏览

azure - Azure FormRecognizer 的邮递员发布请求不起作用

我正在尝试按照此处的说明来分析表格。我已经训练了一个模型,并且在我使用 python 代码时它可以工作。现在,我也希望能够得到结果,postman但它不起作用。

你可以在这里看到我的发帖请求: 在此处输入图像描述 在此处输入图像描述

如您所见,我添加了Content-TypeOcp-Apim-Subscription-Keyjson但是,尽管我得到了答案,但我没有得到任何答案status: 202 Accepted

谁能告诉我,我做错了什么?

提前致谢,