问题标签 [form-recognizer]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
azure - Azure OCR [打印文本] 未按正确顺序读取收据行
应用目标:读取收据图像,提取商店/组织名称以及支付的总金额。将其输入网络表单以进行自动填写和提交。
发布请求 -"https://*.cognitiveservices.azure.com/vision/v2.0/recognizeText?{params}
获取请求 -https://*.cognitiveservices.azure.com/vision/v2.0/textOperations/{operationId}
但是,当我返回结果时,有时会在行排序中混淆(见下图 [JSON 响应中的类似结果])
这种混合导致总金额为 0.88 美元
9 份测试收据中有 2 份存在类似情况。
问:为什么它适用于相似和不同的结构化收据,但由于某种原因并非对所有人都一致?另外,任何想法如何解决它?
azure-cognitive-services - 从 PDF 文件的所需页面中提取文本
我正在尝试使用 Form Recognizer - Azure 认知服务从 pdf 文件中提取文本。我正在使用自定义模型,通过我的模型训练此服务,然后尝试提取数据。
我的 PDF 通常有 1 页以上。但我有兴趣从第一页中提取文本。其余所有页面没有任何重要性。
那么有什么方法可以训练我的系统通过提供页码从选定页面中提取文本?
问候,
马杜
microsoft-cognitive - 带有 blob 文件的 FormRecognizer C# SDK - 不支持的媒体类型错误
我正在尝试使用 Azure 认知服务的 C# FormRecognizer SDK。我将 pdf 存储在 Azure Blob 中,我需要使用 C# SDK 从这些 pdf 文件中提取文本/表格。
我看到“AnalyzeWithCustomModelAsync”方法将“Stream”作为输入参数,它只接受“FileStream”类型。如果我将“MemoryStream”作为输入参数类型传递,我会收到以下错误:
{"value":{"error":{"code":" UnsupportedMediaType ","message":"对于 HTML 表单数据,多部分请求必须包含媒体类型为 - 'application/pdf' 的文档, 'image/jpeg' 或 'image/png'. "}},"formatters":[],"contentTypes":[],"statusCode":415}
无论如何,我可以直接使用我的 blob 文件,而无需将这些文件保存在本地吗?
问候, 马杜
form-recognizer - 创建表单识别器缺少字段
我正在尝试从收到的批准电子邮件的链接中创建表单识别器。但在从 Azure 门户创建资源时,我无法选择位置或定价。我使用的是我在注册时给你的正确订阅 ID。
不同的浏览器(Firefox,Chrome)。不同的 Azure 存储帐户。
microsoft-cognitive - 表单识别器无法识别没有 : 作为键的字段
我已经使用 Forms Recognizer 好几天了,但无法识别表单中的键。
我想用它来提取学生在测试中给出的答案......这是一个例子。
我无法更改学生填写的表格的结构,因为这是一项全国性考试,我无法联系到组织者。
因此,我按照 Microsoft 文档中的建议训练了一个模型,并用它来“阅读”表格,它得到了大部分答案,但这一切都是作为“令牌”键的值
然后我在 excel 上重新创建了结构,但在数字之后使用 : 并训练了另一个模型。我还打印了一些副本并填写以进行测试,表单识别器将数字理解为键。
有谁知道一些方法可以将数字字段识别为没有 : 的键?
microsoft-cognitive - 表单识别器的内容解析错误
尝试分析作为建筑图纸的 PDF 文件时,我收到以下错误:
我正在使用表单识别器 API,PDF 文件上同时包含文本和绘图符号。我还尝试了标题中的不同内容类型(“multipart/form-data”、“application/pdf”),结果相同。如果我截取 PDF 文件(它是一页)并将其另存为图像,它会成功处理。
表单识别器是否支持这些类型的 PDF 文件?我想知道我是否遗漏了什么或者目前不支持建筑图纸。
编辑:我附上了几个我正在使用的示例绘图文件(混淆识别信息)。Material Legends 文件是我需要从中提取信息的主要文件。对于平面图文件,我只想提取 Key Notes 部分的信息。
进一步澄清我需要提取的数据:我需要计算检测到的关键术语/短语的实例。例如,我需要扫描一个文件以查看其中有多少次包含文本“Restroom”。我同意 Form Recognizer 将它看到的内容放在结果的 Tokens 部分。
azure-cognitive-services - 表单识别器中的不同表单模板
我有表单模板,但每个表单的顺序或密钥都是唯一的。例如:姓名在某些形式中具有“姓名”,而在某些形式中具有“申请人姓名”或“名字”。在训练自定义模型时,我可以在一个训练数据集中使用这些不同的模板吗?训练后,模型是否能够识别与表单相关的正确“键”(如姓名/申请人姓名/名字)并提取相关的“对”?