问题标签 [azure-form-recognizer]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
59 浏览

azure-form-recognizer - Azure 表单识别器自定义模型中同一页面上相同标记字段的多个“实例”?

我想知道在处理 Azure 表单识别器自定义模型(带有标签)中相同标签字段的多个实例时是否缺少一些东西?让我们使用以下(非常简化的)文档,例如:

现在,如果我训练一个模型来检测“姓名”、“出生日期”和“公司”,我最终会得到如下结果:

如您所见,NameAzure 表单识别器结果 JSON 中字段的每个“实例”之间没有分隔符。我应该如何以允许我从文档中提取给定字段的每个实例的方式训练和/或处理字段结果?

我尝试的第一件事是从文档中标记标签名称和字段的值并进行培训。例如,Name: John R. SmithName: Ronald Johnson., Esquire在 FOTT 中标记Name为该训练示例的字段。然后,我会将结果拆分为Name:. 这在理论上似乎很好,但在实践中,与仅选择字段值并对其进行培训相比,我的准确度非常低。

0 投票
1 回答
86 浏览

azure - Azure Formrecognizer - 如何通过执行预处理来提高输入图像质量?

默认情况下,Azure FormRecognizer 是否对文件进行任何预处理以提高 OCR 引擎识别的准确性。只是出于好奇,我进行了预处理(如二值 cv2.adaptiveThreshold,使用cv2.fastNlMeansDenoisingcv2.medianBlur对图像进行去噪,在图像包含手写文本时执行细化,最后在向天蓝色发布请求之前对图像执行倾斜校正。我发送了两个请求,一个带有原始图像和预处理图像,令我惊讶的是原始图像结果比预处理图像要好得多。这可能是什么原因..Azure formrecognizer 是否进行任何预处理?关于在哪里的任何想法我做错了吗?

0 投票
1 回答
136 浏览

azure - 无法使用 C# 代码使用表单识别器客户端库从跨多个页面的 pdf 文件中读取相同的表数据

我无法读取跨越下一页的表格数据。我正在使用 c# 代码使用 FormRecognizerClient 并在控制台应用程序中使用经过训练的自定义模型来提取数据。还尝试使用 StartRecognizeInvoicesFromUriAsync ,即使用 FormRecognizerClient 的分析发票,这在上述情况下也失败了。

C# 中的 FormRecognizerClient 也无法识别表中的标题。我正在使用 FormRecognizerClient C# 库代码的以下链接, https: //docs.microsoft.com/en-us/azure/cognitive-services/form-recognizer/quickstarts/client-library?tabs=preview%2Cv2-1&pivots=programming -language-csharp#analyze-invoices

寻求任何帮助。

下面是显示 pdf 格式的图片链接: https ://i.stack.imgur.com/mx5NW.png

0 投票
1 回答
128 浏览

azure - 更改 Azure 表单识别器选择标记的状态

对于具有相似结构的简单表单的智能和自动处理,我在在线编辑器中设置了一个模型,手动标记我需要的字段。

但是,对于某些表单,即使选中了复选框(尽管有时不是很清楚),在标记时,选择标记标签也会自动读取“未选中”。有人知道手动将 selectionmark 标记的状态更改为“已选择”以使我的模型更智能的方法吗?

0 投票
1 回答
195 浏览

azure-cognitive-services - 表单识别器 - 每个环境的模型?

在我们的测试环境中,我们创建了自定义表单识别器模型。有没有办法在 PROD 环境中重用这个模型?生产环境在不同的订阅下。

我找不到以某种方式“导出”模型并将其移动到其他环境的方法。我需要从头开始创建新模型吗?

0 投票
0 回答
47 浏览

azure - 如何使用表单识别器在 PDF 文件中查找页眉和页脚

我有一个 pdf,它有 3 页,每页都有共同的页眉和页脚。如何使用表单识别器认知服务在 pdf 页面中查找页眉和页脚内容。

0 投票
0 回答
115 浏览

ocr - 表单识别器标签工具:表格检测问题

如图 2 所示,标记工具在运行 OCR 后正在检测表结构,但并未检测到整个表。相反,它只采用前 2 列,如图 1 所示。

图 1:

图片

图 2:

图 2

有没有办法让它捕获所有 3 列而不是 2 列?

0 投票
1 回答
1031 浏览

node.js - 如何在 NodeJS 中将 image.png 转换为二进制文件?

我正在尝试使用 Azure Forms Recognizer API,在这里我必须以“[Binary PNG data]”的形式提供正文,如此处所述。连接似乎工作正常,但是我收到了以下回复:

{"error":{"code":"InvalidImage","innerError":{"requestId":"73c86dc3-51a3-48d8-853b-b6411f54c51e"},"message":"输入数据不是有效图像或密码保护。”}}

我使用的是我的本地目录 png,我尝试以多种不同方式对其进行转换,包括:

或者

和许多其他人。它们似乎都不起作用,我总是从我的帖子请求中得到相同的响应。

如果有人可以分享如何将此 png 转换为正确的格式,我将不胜感激。先感谢您

0 投票
1 回答
140 浏览

invoice - 没有从表单识别器预建发票模型中获取行项目

我在这里使用代码提取了发票字段以用于预建发票模型, https: //docs.microsoft.com/en-us/azure/cognitive-services/form-recognizer/quickstarts/client-library?tabs=preview%2Cv2-1&pivots =编程语言csharp#analyze-invoices

但是没有关于如何提取发票行项目的文档。我在这里看到此功能最近于 2021 年 3 月推出 https://docs.microsoft.com/en-us/azure/cognitive-services/form-recognizer/whats-new

谁能指导我如何使用预建模型获取发票行项目?

0 投票
1 回答
180 浏览

form-recognizer - 如何使用 Azure 表单识别器分析多文件表单

我有一个分成 3 个不同 jpg 文件的表单,每个页面一个文件,是否可以指示表单识别器将它们视为一个表单?

我应该先合并到一个文件中吗?哪个是在单个 PDF 文件中合并 3 个不同 jpg 的最佳免费 Java 库?

谢谢你