问题标签 [azure-form-recognizer]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
336 浏览

azure - 将文件上传到 Microsoft Form Recognizer 时出现问题

我在尝试将 PDF 文件发送到 Microsoft 的 Form Recognizer 服务时遇到了一些麻烦。

我需要发送 PDF 文件,而不是发送 PDF 网址位置。根据我的经验,可以使用 base64 发送文件,但微软服务似乎与 base64 格式不兼容。每当我尝试发送文件时,服务器都会响应:

{“错误”:{“代码”:“1000”,“消息”:“输入文件无效。” } }

我需要知道如何将我的 PDF 转换为所需的应用程序/pdf“二进制 PDF 数据”。我找不到任何有关此转换的文档。

表单识别器 API 网页是:https ://brazilsouth.dev.cognitive.microsoft.com/docs/services/form-recognizer-api-v2-1-preview-3/operations/AnalyzeWithCustomForm

在这里您可以找到完整的文档网页:https ://docs.microsoft.com/en-us/azure/cognitive-services/form-recognizer/quickstarts/client-library?tabs=preview%2Cv2-1&pivots=programming-语言-rest-api

谢谢!

0 投票
0 回答
61 浏览

azure - 表单识别器 Azure - 无法获取 TypeError

我使用 Azure 表单识别器。我的培训文档存储在一个存储帐户中:按型号显示 1 个容器。(经典的 :) )

当我进入项目设置上的表单识别器时,我精确地确定了“文件夹路径”(这是我在存储中的容器的名称)。

但是我经常遇到错误“TypeError Failed to Fetch”。(这是随机的,取决于日期!)

知道这可能来自哪里吗?

0 投票
2 回答
103 浏览

azure - 如何减少从识别器使用的网络延迟

谢谢你的时间。我正在使用Azure 认知服务的Azure 表单识别器。它适用于我的大多数用户。不过,对于中国用户,Azure 中国并没有发布这款产品。所以中国用户必须请求 Azure 全局端点,问题就来了:延迟很高,有时会显示为5000ms. 那么有没有办法减少延迟呢?或任何解决方法?

任何建议表示赞赏。谢谢 !

0 投票
1 回答
484 浏览

azure - 表单识别器:一次扫描中的多个文档不适用于带标签的模型

我构建了一个带有标签的自定义模型来读取表单。如果扫描只包含表单的一个实例,则此方法效果很好。但是一旦扫描包含相同类型的几种形式,就会创建一个混搭。(带有示例标签工具的 Azure Form Recognizer v2.1-preview3)

我本来希望在这种情况下,在分析结果/文档结果下的结果 JSON 中会返回几个数组元素(每个检测到的模型实例一个元素)。但情况似乎并非如此。相反,字段部分从第一个实例读取,部分从第二个实例读取。结果是完全错误的。

问题:我是否必须在预处理步骤中将扫描分成单独的文档?这对表单识别器来说不是注定的任务,因为它知道模型。

实际结果:

预期结果:

0 投票
1 回答
130 浏览

azure-cognitive-services - .NET 的 Azure 认知服务表单识别器客户端库中的反序列化问题 - 版本 3.1.0-beta.4

我有一个带有“标签表”的标签模型。此模型适用于最新的 REST API,但不适用于 .NET 客户端库 3.1.0-beta.4。在模型预测“标签表”中的空单元格的情况下,当库反序列化结果时会发生 InvalidOperationException。

异常详情

System.InvalidOperationException:请求的操作需要“Object”类型的元素,但目标元素的类型为“Null”。在 System.Text.Json.JsonElement.EnumerateObject() 在 Azure.AI.FormRecognizer.Models.FieldValue_internal.DeserializeFieldValue_internal(JsonElement 元素) 在 Azure.AI.FormRecognizer.Models.FieldValue_internal.DeserializeFieldValue_internal(JsonElement 元素) 在 Azure.AI.FormRecognizer .Models.FieldValue_internal.DeserializeFieldValue_internal(JsonElement element) at Azure.AI.FormRecognizer.Models.DocumentResult.DeserializeDocumentResult(JsonElement element) at Azure.AI.FormRecognizer.Models.AnalyzeResult.DeserializeAnalyzeResult(JsonElement element) at Azure.AI.FormRecognizer.Models Azure.AI 中的 .AnalyzeOperationResult.DeserializeAnalyzeOperationResult(JsonElement 元素)。1 operation, TimeSpan pollingInterval, CancellationToken cancellationToken) at System.Threading.Tasks.ValueTask1.get_Result() 在 KKELBelegAnalyzer.BelegAnalyzer.AnalyzeBeleg(流流输入)

0 投票
2 回答
206 浏览

azure - 如何为具有相同标签集的不同文档布局训练自定义模型?

我试图了解使用预建发票模型不支持的语言(例如法语)为发票训练自定义模型的最佳方法是什么。

正常情况下,我们将有来自不同供应商的许多不同发票布局,但在所有这些布局中,我们将提取相同的标签集(发票编号、金额、日期、供应商名称等)。

我应该为每个供应商创建一个模型并进行组合吗?如果我这样做,我是否需要为所有供应商培训它,或者它是否适用于未经培训但使用与经过培训的发票相同的措辞的发票?

0 投票
2 回答
93 浏览

azure-form-recognizer - 使用 AKS 注册和部署表单识别器生成的模型

我已经使用 Microsoft 示例标签工具(表单识别器)创建了一个模型,并且想在 AKS 中注册和部署该模型,但找不到如何完成它的步骤。

感谢您的指导。

0 投票
0 回答
40 浏览

c# - 将pdf从任何大小缩放到Letter

我的网络应用程序允许用户上传 pdf 文档,但页面大小有时是随机的。我需要一个 pdf 库,它可以获取(例如)一个 17" x 22" 的文档并将其缩放为 Letter 大小(8.5" x 11")。我查看了许多现有的 PDF 库,但它们不提供此功能。我正在将 pdf 上传到 Azure 表单识别器,它们对 pdf 的大小和分辨率有限制。

0 投票
1 回答
130 浏览

python - 对 FormRecognizer 的请求停留在 notStarted 状态

我使用表单识别器 Web 界面在一些 PDF(5 个自定义标签)上训练了一个自定义模型。

现在我正在尝试使用该azure-ai-formrecognizer包获得新 PDF 的识别结果:

这曾经与包版本 3.1.0b2 和在 v2.1.preview.2 中训练的模型一起工作得很好。现在我有一个在 v2.1.preview.3 中训练的新自定义模型,突然轮询器的响应notStarted持续了几分钟并且没有完成。

对于较旧的模型和不同的 API 版本,请求有时会完成,有时不会。我找不到任何可重现的模式。

0 投票
1 回答
69 浏览

python - Azure 表单识别器撰写模型错误

我正在尝试使用 azure-ai-formrecognizer==3.1.0b1 在 python 3.8.5 中创建组合模型。

我最近重新训练了其中一个子模型,现在当我尝试创建更新的组合模型时收到以下错误:

id 为 f13d268e-336e-4104-9625-ad0a5463dc82 的模型工作正常,但是,当我单独使用它时。这是我可以从https://fott-preview.azurewebsites.net/下载的模型的 json

如您所见,它本身并不是一个组合模型。它以前能够很好地组成。我最近用一些新的训练例子重新训练了它。

有任何想法吗?