问题标签 [form-recognizer]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - 表单识别器 API 调用 - 接受错误代码 202
我使用带标签的工具来训练我的模型并获得模型 ID。然后我尝试进行 API 调用(https://westeurope.dev.cognitive.microsoft.com/docs/services/form-recognizer-api-v2-preview/operations/AnalyzeWithCustomForm)并使用此模型 ID 来分析表单但是得到错误代码 202。我的资源(表单识别器认知服务)在西欧。知道我的请求可能有什么问题吗?如果我单击响应中的操作位置,则会看到错误代码 401。
是否有任何地方可以找到 blob 触发的 azure 函数的源代码,以便我可以使用我使用标记工具创建的模型 ID?谢谢。
azure-logic-apps - 表单识别器 - 调用分析表单 API 时找不到 404 资源
我使用标注工具训练我的模型并成功生成了modelID。尝试“获取列表自定义模型”时,成功接收到我训练的模型列表,但尝试调用“分析表单”API 时,收到错误消息 404“找不到资源”。还尝试使用逻辑应用程序 - 根据规范传递模型 ID 和链接: https ://something.cognitiveservices.azure.com/formrecognizer/v2.0-preview/custom/models/modelID/analyze
但再次收到错误 404。知道可能出了什么问题吗?谢谢。
azure-functions - Azure C# 函数调用表单识别器认知服务示例
我使用表单标签工具来创建自定义模型,这是一项非常容易的工作。一段时间以来,我一直在尝试创建一个简单的 azure C# 函数,如果有人能提供帮助,我将不胜感激。我的函数应该非常简单:一个 blob 触发函数,它将调用表单识别器认知服务(使用我已经使用标记工具创建的模型 ID)并将结果存储在 cosmos DB 或表存储帐户中。如果有用的话,我可以分享我的代码。
谢谢和最好的问候。
}
azure - 如何将 Microsoft.Azure.CognitiveServices.FormRecognizer v0.8.0-preview API 端点更改为 v.2.0.0?
我目前正在使用OCR 标记工具训练自定义模型(手动标记), 我注意到该模型存储在https:///formrecognizer/v2.0-preview/custom/models端点上。
表单识别器 .NET SDK (Microsoft.Azure.CognitiveServices.FormRecognizer v0.8.0-preview) 当前定向到 v1.0.0-endpoint,因为当我对https:///formrecognizer执行 GET 请求时模型 ID 不可用/v2.0-preview/custom/models并且它确实存在于https:///formrecognizer/v1.0-preview/custom/models上。有谁知道如何解决这个问题,而不必重新手动实现 REST API 或等待下一个版本的 nuget 包问世?
任何帮助,将不胜感激!
azure-cognitive-services - 无法使用 Azure 表单识别器从身份证中提取信息作为键值对
我正在使用 .NET 的表单识别器客户端库从一个国家的国民身份证中提取数据。但似乎无法从卡中获取键值对。我遵循了https://docs.microsoft.com/en-us/azure/cognitive-services/form-recognizer/quickstarts/dotnet-sdk教程。
我发现只有一个键值对,值数组包含所有标签/文本(键和值)。
我是否需要按照另一种方式从身份证中提取信息?我是否需要使用标签工具来训练带有标签的模型?
azure-cognitive-services - Azure 表单识别器复制从 PDF 中提取的文本
使用 Azure 表单识别器提取值时,许多值显示为重复。
我已经训练了一个自定义模型来标记适当的键值。我发现 OCR 复制了这些框,因此当我使用示例标记工具进行标记时,我经常将一个框放在另一个框内。我需要选择一个并取消选择另一个,以避免显示重复的值。
当我运行模型来预测许多键的新 PDF 时,我也会得到重复的值。
此外,在检查 Result JSON 时,我可以看到许多 Lines 的Bounded Boxes 嵌套或重叠。也就是说,通常您将拥有一个具有有界框和关联文本的线条,而这些文本又具有在线条的有界框内具有有界框的“单词”。
只是为了澄清一下,在 JSON 中,我看到的线条具有重叠或嵌套的有界框,因此是文本。
关于为什么会这样的任何线索?
python - 表单识别器速度问题
我正在使用带有标签的自定义模型(使用示例标签工具创建),并使用此页面底部的“Python Form Recognizer Async Analyze”V2 SDK 代码获取结果。它基本上可以工作,但单页 PDF 文件需要 20 多秒才能获得结果(使用 6 个标签,S0 定价模型)。150 个单页 pdf 文件花了一个多小时。我们还使用表单识别器的 V1 SDK 预览版(无标签)进行了测试,该版本比 V2快得多。
我知道 V2 现在是异步的,但是有什么可以加快表单识别的方法吗?下面是我基本上使用的代码:
python - 表单识别器 V2 / 成本呈爆炸式增长
作为对 ChadZ 的回应,这里是表单识别器的指标,我正在谈论表单识别器指标。在我们的测试中,我们检查目录中的文件并按顺序分析它们,等待每个响应,写入结果,获取下一个文件等等。没有多线程。
看看 4 月 14 日的最大峰值是 15330 次通话。如果我们假设在 4 月 14 日的每个呼叫需要 10 秒(这会很快,通常可能需要一分钟),那么分析需要 153300 秒,即 2555 分钟或 42.58 小时。即使分析只需要 5 秒,那也将超过 20 小时。
当然我可能是错的,但目前最好的逻辑解释是跟踪和计费获取请求。
原帖
我正在使用带有标签的自定义模型(使用示例标签工具创建),并使用本页底部的“Python Form Recognizer Async Analyze”V2 SDK 代码获取结果。虽然 V2 中的异步功能比 V1 慢得多(我在这里描述过),但它似乎也贵得多。
在 post api 调用后获取结果的原始示例代码如下所示:
正如您在原始示例代码中看到的那样,它每 5 秒查看一次以获取结果。
我的问题:在我看来,不仅对分析文档的 api 调用收费,而且对每个获取结果的 get-request 也收费。
自从使用 V2 以来,我们的账单增加了十倍甚至更多。我们目前处于测试阶段,我们通常每月大约有 400-500 个文档,这些文档在 V1 中被正确跟踪和计费。使用 V2 和上面的示例代码,我们现在有 63690 (!!!!!) 呼叫,每个呼叫都计费,成本正在爆炸式增长。
有人可以确认这种行为吗?
就个人而言,我想找回同步操作,其中 api 调用的响应还包含任何文档分析的结果。
不幸的是,这不再起作用了......