问题标签 [form-recognizer]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
270 浏览

azure - 表单识别器“错误”:[“第 1 页:文档无效或超出页面/大小限制。”]

当我使用 Azure 表单识别器提取 pdf 文本时,当我使用 Microsoft 提供的示例数据时,一切都很好。但是当我使用我唯一的 pdf 来训练模型时,我收到以下错误:

响应状态码:200 响应正文:

我使用的培训文件是 5 个 pdf,每个 1 页,格式相似。

这是我的pdf样本: 我的pdf样本

拜托,谁能帮我解决我的问题?谢谢

0 投票
1 回答
72 浏览

microsoft-cognitive - 有没有合适的方法来训练一个没有表格边框的模型?

当我上传文档以进行表单识别时,我得到的结果似乎与文档的结构不一致。它似乎很受欢迎或错过。在我的示例中,有一个包含产品描述、数量、零件编号和价格的网格。只有描述中的第一行与数量、价格和部件号相关。描述的其余行位于响应的其他位置,与第一行无关。

这是报价布局的示例

在此处输入图像描述

我已经上传了完整的文件和一个空白表格,既简单又复杂,有多个页面。这是缺少数据的结果的一部分。

0 投票
1 回答
715 浏览

azure - Azure OCR [打印文本] 未按正确顺序读取收据行

应用目标:读取收据图像,提取商店/组织名称以及支付的总金额。将其输入网络表单以进行自动填写和提交。

发布请求 -"https://*.cognitiveservices.azure.com/vision/v2.0/recognizeText?{params}

获取请求 -https://*.cognitiveservices.azure.com/vision/v2.0/textOperations/{operationId}

但是,当我返回结果时,有时会在行排序中混淆(见下图 [JSON 响应中的类似结果]) Azure 计算机视觉页面​​的屏幕截图

这种混合导致总金额为 0.88 美元

9 份测试收据中有 2 份存在类似情况。

问:为什么它适用于相似和不同的结构化收据,但由于某种原因并非对所有人都一致?另外,任何想法如何解决它?

0 投票
1 回答
243 浏览

azure-cognitive-services - 从 PDF 文件的所需页面中提取文本

我正在尝试使用 Form Recognizer - Azure 认知服务从 pdf 文件中提取文本。我正在使用自定义模型,通过我的模型训练此服务,然后尝试提取数据。

我的 PDF 通常有 1 页以上。但我有兴趣从第一页中提取文本。其余所有页面没有任何重要性。

那么有什么方法可以训练我的系统通过提供页码从选定页面中提取文本?

问候,

马杜

0 投票
1 回答
221 浏览

microsoft-cognitive - 带有 blob 文件的 FormRecognizer C# SDK - 不支持的媒体类型错误

我正在尝试使用 Azure 认知服务的 C# FormRecognizer SDK。我将 pdf 存储在 Azure Blob 中,我需要使用 C# SDK 从这些 pdf 文件中提取文本/表格。

我看到“AnalyzeWithCustomModelAsync”方法将“Stream”作为输入参数,它只接受“FileStream”类型。如果我将“MemoryStream”作为输入参数类型传递,我会收到以下错误:

{"value":{"error":{"code":" UnsupportedMediaType ","message":"对于 HTML 表单数据,多部分请求必须包含媒体类型为 - 'application/pdf' 的文档, 'image/jpeg' 或 'image/png'. "}},"formatters":[],"contentTypes":[],"statusCode":415}

无论如何,我可以直接使用我的 blob 文件,而无需将这些文件保存在本地吗?

问候, 马杜

0 投票
1 回答
182 浏览

microsoft-cognitive - Azure 认知服务 - 无法在表单识别器中选择位置或定价层

我正在尝试创建表单识别器资源并收到欢迎邮件。但是在从 Azure Portal 创建资源时,我无法选择位置。我使用了我在注册时提供的正确订阅 ID。

Azure 表单识别器

0 投票
1 回答
43 浏览

form-recognizer - 创建表单识别器缺少字段

我正在尝试从收到的批准电子邮件的链接中创建表单识别器。但在从 Azure 门户创建资源时,我无法选择位置或定价。我使用的是我在注册时给你的正确订阅 ID。

不同的浏览器(Firefox,Chrome)。不同的 Azure 存储帐户。

0 投票
1 回答
109 浏览

microsoft-cognitive - 表单识别器无法识别没有 : 作为键的字段

我已经使用 Forms Recognizer 好几天了,但无法识别表单中的键。

我想用它来提取学生在测试中给出的答案......是一个例子。

我无法更改学生填写的表格的结构,因为这是一项全国性考试,我无法联系到组织者。

因此,我按照 Microsoft 文档中的建议训练了一个模型,并用它来“阅读”表格,它得到了大部分答案,但这一切都是作为“令牌”键的值

然后我在 excel 上重新创建了结构,但在数字之后使用 : 并训练了另一个模型。我还打印了一些副本并填写以进行测试,表单识别器将数字理解为键。

有谁知道一些方法可以将数字字段识别为没有 : 的键?

0 投票
2 回答
344 浏览

microsoft-cognitive - 表单识别器的内容解析错误

尝试分析作为建筑图纸的 PDF 文件时,我收到以下错误:

我正在使用表单识别器 API,PDF 文件上同时包含文本和绘图符号。我还尝试了标题中的不同内容类型(“multipart/form-data”、“application/pdf”),结果相同。如果我截取 PDF 文件(它是一页)并将其另存为图像,它会成功处理。

表单识别器是否支持这些类型的 PDF 文件?我想知道我是否遗漏了什么或者目前不支持建筑图纸。

编辑:我附上了几个我正在使用的示例绘图文件(混淆识别信息)。Material Legends 文件是我需要从中提取信息的主要文件。对于平面图文件,我只想提取 Key Notes 部分的信息。

进一步澄清我需要提取的数据:我需要计算检测到的关键术语/短语的实例。例如,我需要扫描一个文件以查看其中有多少次包含文本“Restroom”。我同意 Form Recognizer 将它看到的内容放在结果的 Tokens 部分。

材料图例示例 材料图例

平面图示例 平面图

0 投票
1 回答
80 浏览

azure-cognitive-services - 表单识别器中的不同表单模板

我有表单模板,但每个表单的顺序或密钥都是唯一的。例如:姓名在某些形式中具有“姓名”,而在某些形式中具有“申请人姓名”或“名字”。在训练自定义模型时,我可以在一个训练数据集中使用这些不同的模板吗?训练后,模型是否能够识别与表单相关的正确“键”(如姓名/申请人姓名/名字)并提取相关的“对”?