问题标签 [azure-form-recognizer]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

63 问题

0 投票

1 回答

59 浏览

azure-form-recognizer - Azure 表单识别器自定义模型中同一页面上相同标记字段的多个“实例”？

我想知道在处理 Azure 表单识别器自定义模型（带有标签）中相同标签字段的多个实例时是否缺少一些东西？让我们使用以下（非常简化的）文档，例如：

现在，如果我训练一个模型来检测“姓名”、“出生日期”和“公司”，我最终会得到如下结果：

如您所见，NameAzure 表单识别器结果 JSON 中字段的每个“实例”之间没有分隔符。我应该如何以允许我从文档中提取给定字段的每个实例的方式训练和/或处理字段结果？

我尝试的第一件事是从文档中标记标签名称和字段的值并进行培训。例如，Name: John R. Smith我Name: Ronald Johnson., Esquire在 FOTT 中标记Name为该训练示例的字段。然后，我会将结果拆分为Name:. 这在理论上似乎很好，但在实践中，与仅选择字段值并对其进行培训相比，我的准确度非常低。

azure-form-recognizer

2021-01-05T20:51:27.810

0 投票

1 回答

86 浏览

azure - Azure Formrecognizer - 如何通过执行预处理来提高输入图像质量？

默认情况下，Azure FormRecognizer 是否对文件进行任何预处理以提高 OCR 引擎识别的准确性。只是出于好奇，我进行了预处理（如二值化 cv2.adaptiveThreshold，使用cv2.fastNlMeansDenoising和cv2.medianBlur对图像进行去噪，在图像包含手写文本时执行细化，最后在向天蓝色发布请求之前对图像执行倾斜校正。我发送了两个请求，一个带有原始图像和预处理图像，令我惊讶的是原始图像结果比预处理图像要好得多。这可能是什么原因..Azure formrecognizer 是否进行任何预处理？关于在哪里的任何想法我做错了吗？

2021-02-02T06:13:06.660

0 投票

1 回答

136 浏览

azure - 无法使用 C# 代码使用表单识别器客户端库从跨多个页面的 pdf 文件中读取相同的表数据

我无法读取跨越下一页的表格数据。我正在使用 c# 代码使用 FormRecognizerClient 并在控制台应用程序中使用经过训练的自定义模型来提取数据。还尝试使用 StartRecognizeInvoicesFromUriAsync ，即使用 FormRecognizerClient 的分析发票，这在上述情况下也失败了。

C# 中的 FormRecognizerClient 也无法识别表中的标题。我正在使用 FormRecognizerClient C# 库代码的以下链接， https: //docs.microsoft.com/en-us/azure/cognitive-services/form-recognizer/quickstarts/client-library?tabs=preview%2Cv2-1&pivots=programming -language-csharp#analyze-invoices

寻求任何帮助。

下面是显示 pdf 格式的图片链接： https ://i.stack.imgur.com/mx5NW.png

azure azure-cognitive-services form-recognizer azure-form-recognizer

2021-03-01T10:22:10.250

0 投票

1 回答

128 浏览