“form-recognizer”的相关标签问题

0 投票

1 回答

113 浏览

c# - 表单识别器 API 调用 - 接受错误代码 202

我使用带标签的工具来训练我的模型并获得模型 ID。然后我尝试进行 API 调用（https://westeurope.dev.cognitive.microsoft.com/docs/services/form-recognizer-api-v2-preview/operations/AnalyzeWithCustomForm）并使用此模型 ID 来分析表单但是得到错误代码 202。我的资源（表单识别器认知服务）在西欧。知道我的请求可能有什么问题吗？如果我单击响应中的操作位置，则会看到错误代码 401。

是否有任何地方可以找到 blob 触发的 azure 函数的源代码，以便我可以使用我使用标记工具创建的模型 ID？谢谢。

c#function form-recognizer

2020-02-25T18:45:55.680

0 投票

1 回答

401 浏览

azure-logic-apps - 表单识别器 - 调用分析表单 API 时找不到 404 资源

我使用标注工具训练我的模型并成功生成了modelID。尝试“获取列表自定义模型”时，成功接收到我训练的模型列表，但尝试调用“分析表单”API 时，收到错误消息 404“找不到资源”。还尝试使用逻辑应用程序 - 根据规范传递模型 ID 和链接： https ://something.cognitiveservices.azure.com/formrecognizer/v2.0-preview/custom/models/modelID/analyze

但再次收到错误 404。知道可能出了什么问题吗？谢谢。

azure-logic-apps form-recognizer

2020-02-26T21:55:40.697

0 投票

0 回答

282 浏览

azure-functions - Azure C# 函数调用表单识别器认知服务示例

我使用表单标签工具来创建自定义模型，这是一项非常容易的工作。一段时间以来，我一直在尝试创建一个简单的 azure C# 函数，如果有人能提供帮助，我将不胜感激。我的函数应该非常简单：一个 blob 触发函数，它将调用表单识别器认知服务（使用我已经使用标记工具创建的模型 ID）并将结果存储在 cosmos DB 或表存储帐户中。如果有用的话，我可以分享我的代码。

谢谢和最好的问候。

}

azure-functions azure-cosmosdb azure-table-storage form-recognizer

2020-02-27T15:44:01.923

0 投票

0 回答

25 浏览

form-recognizer - 获取分析表单 API 返回错误 3003

我使用标记工具训练我的模型，获取模型 ID，使用模型 ID 分析文档，当调用 Get analyze API 时收到屏幕截图中显示的错误消息。知道有什么问题吗？

form-recognizer

2020-02-28T16:11:59.720

0 投票

2 回答

455 浏览

microsoft-cognitive - 获取分析表单结果 API 返回错误代码 3003

我使用表单标签工具来训练我的模型。我得到了modelID，成功运行了Analyze Form API，但是当调用get analyze form result时，我得到了错误代码：

3003 “OCR 提取错误：[错误响应代码：FailedToDownloadImage。消息：无法从输入 URL 下载图像..]”

我还没有在用于训练目的的这 5 张图片中的任何一张上测试该模型。相反，我使用了 3 个全新的文档。

知道我怎样才能让它工作吗？

这是我分析的表格 (pdf)

microsoft-cognitive error-code form-recognizer

2020-02-29T23:41:01.187

0 投票

2 回答

109 浏览

azure - 如何将 Microsoft.Azure.CognitiveServices.FormRecognizer v0.8.0-preview API 端点更改为 v.2.0.0？

我目前正在使用OCR 标记工具训练自定义模型（手动标记），我注意到该模型存储在https:///formrecognizer/v2.0-preview/custom/models端点上。

表单识别器 .NET SDK (Microsoft.Azure.CognitiveServices.FormRecognizer v0.8.0-preview) 当前定向到 v1.0.0-endpoint，因为当我对https:///formrecognizer执行 GET 请求时模型 ID 不可用/v2.0-preview/custom/models并且它确实存在于https:///formrecognizer/v1.0-preview/custom/models上。有谁知道如何解决这个问题，而不必重新手动实现 REST API 或等待下一个版本的 nuget 包问世？

任何帮助，将不胜感激！

azure form-recognizer

2020-03-19T04:49:27.287

0 投票

2 回答

204 浏览

azure-cognitive-services - 无法使用 Azure 表单识别器从身份证中提取信息作为键值对

我正在使用 .NET 的表单识别器客户端库从一个国家的国民身份证中提取数据。但似乎无法从卡中获取键值对。我遵循了https://docs.microsoft.com/en-us/azure/cognitive-services/form-recognizer/quickstarts/dotnet-sdk教程。

我发现只有一个键值对，值数组包含所有标签/文本（键和值）。

我是否需要按照另一种方式从身份证中提取信息？我是否需要使用标签工具来训练带有标签的模型？

azure-cognitive-services form-recognizer

2020-03-23T11:01:48.083

0 投票

1 回答

153 浏览

azure-cognitive-services - Azure 表单识别器复制从 PDF 中提取的文本

使用 Azure 表单识别器提取值时，许多值显示为重复。

我已经训练了一个自定义模型来标记适当的键值。我发现 OCR 复制了这些框，因此当我使用示例标记工具进行标记时，我经常将一个框放在另一个框内。我需要选择一个并取消选择另一个，以避免显示重复的值。

当我运行模型来预测许多键的新 PDF 时，我也会得到重复的值。

此外，在检查 Result JSON 时，我可以看到许多 Lines 的Bounded Boxes 嵌套或重叠。也就是说，通常您将拥有一个具有有界框和关联文本的线条，而这些文本又具有在线条的有界框内具有有界框的“单词”。

只是为了澄清一下，在 JSON 中，我看到的线条具有重叠或嵌套的有界框，因此是文本。

关于为什么会这样的任何线索？

azure-cognitive-services form-recognizer

2020-03-28T20:07:11.060

0 投票

1 回答

279 浏览

python - 表单识别器速度问题

我正在使用带有标签的自定义模型（使用示例标签工具创建），并使用此页面底部的“Python Form Recognizer Async Analyze”V2 SDK 代码获取结果。它基本上可以工作，但单页 PDF 文件需要 20 多秒才能获得结果（使用 6 个标签，S0 定价模型）。150 个单页 pdf 文件花了一个多小时。我们还使用表单识别器的 V1 SDK 预览版（无标签）进行了测试，该版本比 V2快得多。

我知道 V2 现在是异步的，但是有什么可以加快表单识别的方法吗？下面是我基本上使用的代码：

python azure-cognitive-services form-recognizer

2020-03-30T21:23:39.353

0 投票

2 回答

277 浏览

python - 表单识别器 V2 / 成本呈爆炸式增长

作为对 ChadZ 的回应，这里是表单识别器的指标，我正在谈论表单识别器指标。在我们的测试中，我们检查目录中的文件并按顺序分析它们，等待每个响应，写入结果，获取下一个文件等等。没有多线程。

看看 4 月 14 日的最大峰值是 15330 次通话。如果我们假设在 4 月 14 日的每个呼叫需要 10 秒（这会很快，通常可能需要一分钟），那么分析需要 153300 秒，即 2555 分钟或 42.58 小时。即使分析只需要 5 秒，那也将超过 20 小时。

当然我可能是错的，但目前最好的逻辑解释是跟踪和计费获取请求。

原帖

我正在使用带有标签的自定义模型（使用示例标签工具创建），并使用本页底部的“Python Form Recognizer Async Analyze”V2 SDK 代码获取结果。虽然 V2 中的异步功能比 V1 慢得多（我在这里描述过），但它似乎也贵得多。

在 post api 调用后获取结果的原始示例代码如下所示：

正如您在原始示例代码中看到的那样，它每 5 秒查看一次以获取结果。

我的问题：在我看来，不仅对分析文档的 api 调用收费，而且对每个获取结果的 get-request 也收费。

自从使用 V2 以来，我们的账单增加了十倍甚至更多。我们目前处于测试阶段，我们通常每月大约有 400-500 个文档，这些文档在 V1 中被正确跟踪和计费。使用 V2 和上面的示例代码，我们现在有 63690 (!!!!!) 呼叫，每个呼叫都计费，成本正在爆炸式增长。

有人可以确认这种行为吗？

就个人而言，我想找回同步操作，其中 api 调用的响应还包含任何文档分析的结果。

不幸的是，这不再起作用了......

python azure-cognitive-services form-recognizer

2020-04-16T20:54:01.807

问题标签 [form-recognizer]

原帖

Reference