问题标签 [form-recognizer]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
464 浏览

c# - Azure 认知服务 {body} 示例

我一直在使用 Azure 认知服务,并一直在使用提供的示例代码来分析表单。我不确定使用什么代码来填充代码的 {body} 部分。任何人都可以分享我应该在 c# 中使用的代码示例吗?我正在使用新的表单识别器 API,但代码与计算机视觉 API 相同。

我已经能够使用 Curl 成功地做到这一点,但不能让它在 C# 中工作

这是我尝试过的...

...

我正在寻找一些可以代替 {body} 的示例代码

0 投票
1 回答
134 浏览

rpa - 表单识别器 Http 请求

我是 Azure 提供的表单识别器(使用 Rest API)的新手,我在发送发布请求时使用 UI 路径(RPA 工具)实现它,我得到的状态代码为零(0)。

0 投票
4 回答
2042 浏览

azure - Azure Form Recognizer boundingBox 结果转换为 XY 坐标

我想将表单识别器“boundingBox”的结果转换为图像坐标以可视化叠加图像和识别的数据。但是,boundingBox 结果看起来不像此图像这样的 XY 坐标位置。 https://i.stack.imgur.com/DOEi5.png

我需要每个boundingBox的左上(X1,Y1)和右下(X2,Y2)计算规则。

我还用认知服务 OCR 和文本识别制定了一些计算规则,但没有关于表单识别器的信息。我试图通过减号或除法找到 XY 坐标规则,但不是我得到的规则。

这是我通过表单识别器的示例图像获得的结果 json 数据。但无法从中找到 boundingBox 规则。

我需要每个boundingBox的左上(X1,Y1)和右下(X2,Y2)计算规则。

感谢团队。

0 投票
2 回答
315 浏览

machine-learning - Formrecognizer 预览:训练模型错误 Payload too large

我正在尝试使用 azure 提供的测试控制台(西欧)在 formrecognizer 预览中训练模型。但我收到错误代码 413 Payload Too Large。错误消息是:无法处理数据集。数据集大小超过大小限制 (4.00MB)。

我提供了一个指向 blob 容器的 SAS-Storage-Url。此 blob 容器包含 5 个 png 文件。每个大小在 2.7 到 3.1 MB 之间,内容类型为 application/png。

从文档中我知道文件大小必须小于 4 Mb。完整数据集(所有训练文件的总和)的大小是否限制为 4 MB?

0 投票
2 回答
150 浏览

azure - Azure 认知服务 - 表单识别器(预览版) - 无法选择位置

我正在尝试为用例创建表单识别器解决方案并获得预览批准。但是从 Azure 门户创建资源时我无法选择位置 在此处输入图像描述

0 投票
1 回答
196 浏览

python-3.x - 列车请求时从表单识别器 API 服务器返回的索引越界错误

当我尝试用 5 个 pdf 训练模型时,我从 API 服务器收到 200 响应,并且所有文档都没有错误并且状态为成功,但响应本身的错误字段返回:{'errorMessage':'Unable提取键/值对。列表索引超出范围'}。看来 API 服务器上可能存在错误。

我已经成功地训练了一个模型并分析了作为样本发票提供的 pdf。而且,我的数据的训练 API 请求返回 200 结果。因此,服务器端似乎确实有问题。可能是由我发送的数据中的某些内容引起的?但是,很明显,我无法访问错误的跟踪。

执行上面的代码(在我的 blob 存储的根容器中使用我的 5 个 pdf)返回:

响应状态码:200 响应正文:{'modelId': 'e6dd8978-dfcc-438b-b0b2-639c13327cdf', 'trainingDocuments': [{'documentName': '.pdf', 'pages': 5, 'errors': [], 'status': 'success'}, {'documentName': '.pdf', 'pages': 4, 'errors': [], 'status': 'success'}, {'documentName': ' .pdf', 'pages': 17, 'errors': [], 'status': 'success'}, {'documentName': '.pdf', 'pages': 7, 'errors': [], ' status': 'success'}, {'documentName': '.pdf', 'pages': 11, 'errors': [], 'status': 'success'}], 'errors': [{'errorMessage' : '无法提取键/值对。列表索引超出范围'

0 投票
1 回答
116 浏览

form-recognizer - 我们可以为多种类型的表单训练一个模型吗?

我正在使用 Microsoft 表单识别器认知服务来训练表单模型。我的问题是我们可以为多种类型的表格训练一个模型吗?推荐吗?我有多种类型的表格,我选择为四种不同类型训练一个模型,它得到了训练,但这是推荐的方法吗?

0 投票
1 回答
207 浏览

performance - 我们如何提高形式识别器模型的准确性?

我正在使用 Microsoft 表单识别器服务。我的表格有点复杂,我尝试为他们训练一个模型。我取得的成绩并不是很好。无论如何我可以提高这个准确性吗?无论如何调整这个模型?我已经使用 5 种相同类型的不同填充形式训练了模型。

0 投票
1 回答
130 浏览

microsoft-cognitive - Microsoft 认知服务表单识别器:当表单中不存在名称时为字段分配名称

我在联合国大会决议中使用表单识别器 api。文档采用非常特定的格式,尽管不是 API 喜欢的传统格式。他们在文档中没有字段名称,但那里肯定有字段。使用 REST API(通过 Python),我可以获取作为键“令牌”的一部分提取的值。

我的问题是:我可以训练模型为这些表单组件分配特定的键吗?

例如,在此示例中,https://undocs.org/en/A/RES/70/204,我想要一些键值对,因为输出将是

  • 决议:A/RES/70/204
  • 机关:大会
  • 日期:2016 年 2 月 23 日
  • 届次:第七十届会议
  • 议程:议程项目 20 (c)
  • 标题 ID:70/204
  • 标题:国际减灾战略
  • 委员会:[关于第二委员会的报告(A/70/472/Add.3)]

我总是可以编写一些解析代码来查看边界框给出的位置并根据它分配键,但想知道 API 中是否有我不知道的功能。

0 投票
2 回答
209 浏览

form-recognizer - 使用表单识别器进行监督学习

我正在尝试使用 Microsoft 的 Form Recognizer API 分析表单,但没有看到我希望的结果。在我的表单上训练模型之后,它生成的键很少是我想要的。有谁知道是否有一种方法可以提高关键识别的准确性?我在想,在作为监督学习的一种形式进行训练时,可能有一些方法可以给出键/值对列表。

是我要解析的表单示例。

我期望“年份”、“制造”、“型号”和“VIN”的键。但是,该模型返回的是“Vehicle”键,其值为“Year”、“Make”、“Model”和“VIN”以及它们的后续值。

我知道我特别询问了监督学习,但对于如何提高表单识别器模型的准确性的任何技术或技巧,我将不胜感激。