“form-recognizer”的相关标签问题

0 投票

1 回答

270 浏览

azure - 表单识别器“错误”：[“第 1 页：文档无效或超出页面/大小限制。”]

当我使用 Azure 表单识别器提取 pdf 文本时，当我使用 Microsoft 提供的示例数据时，一切都很好。但是当我使用我唯一的 pdf 来训练模型时，我收到以下错误：

响应状态码：200 响应正文：

我使用的培训文件是 5 个 pdf，每个 1 页，格式相似。

这是我的pdf样本：

拜托，谁能帮我解决我的问题？谢谢

azure form-recognizer

2019-09-25T17:26:46.317

0 投票

1 回答

72 浏览

microsoft-cognitive - 有没有合适的方法来训练一个没有表格边框的模型？

当我上传文档以进行表单识别时，我得到的结果似乎与文档的结构不一致。它似乎很受欢迎或错过。在我的示例中，有一个包含产品描述、数量、零件编号和价格的网格。只有描述中的第一行与数量、价格和部件号相关。描述的其余行位于响应的其他位置，与第一行无关。

这是报价布局的示例

我已经上传了完整的文件和一个空白表格，既简单又复杂，有多个页面。这是缺少数据的结果的一部分。

microsoft-cognitive form-recognizer

2019-09-30T20:17:17.877

0 投票

1 回答

715 浏览

azure - Azure OCR [打印文本] 未按正确顺序读取收据行

应用目标：读取收据图像，提取商店/组织名称以及支付的总金额。将其输入网络表单以进行自动填写和提交。

发布请求 -"https://*.cognitiveservices.azure.com/vision/v2.0/recognizeText?{params}

获取请求 -https://*.cognitiveservices.azure.com/vision/v2.0/textOperations/{operationId}

但是，当我返回结果时，有时会在行排序中混淆（见下图 [JSON 响应中的类似结果]）

这种混合导致总金额为 0.88 美元

9 份测试收据中有 2 份存在类似情况。

问：为什么它适用于相似和不同的结构化收据，但由于某种原因并非对所有人都一致？另外，任何想法如何解决它？

azure microsoft-cognitive azure-cognitive-services form-recognizer

2019-10-17T15:51:57.557

0 投票

1 回答

243 浏览

azure-cognitive-services - 从 PDF 文件的所需页面中提取文本

我正在尝试使用 Form Recognizer - Azure 认知服务从 pdf 文件中提取文本。我正在使用自定义模型，通过我的模型训练此服务，然后尝试提取数据。

我的 PDF 通常有 1 页以上。但我有兴趣从第一页中提取文本。其余所有页面没有任何重要性。

那么有什么方法可以训练我的系统通过提供页码从选定页面中提取文本？

问候，

马杜

azure-cognitive-services form-recognizer

2019-10-22T06:50:43.587

0 投票

1 回答

221 浏览

microsoft-cognitive - 带有 blob 文件的 FormRecognizer C# SDK - 不支持的媒体类型错误

我正在尝试使用 Azure 认知服务的 C# FormRecognizer SDK。我将 pdf 存储在 Azure Blob 中，我需要使用 C# SDK 从这些 pdf 文件中提取文本/表格。

我看到“AnalyzeWithCustomModelAsync”方法将“Stream”作为输入参数，它只接受“FileStream”类型。如果我将“MemoryStream”作为输入参数类型传递，我会收到以下错误：

{"value":{"error":{"code":" UnsupportedMediaType ","message":"对于 HTML 表单数据，多部分请求必须包含媒体类型为 - 'application/pdf' 的文档， 'image/jpeg' 或 'image/png'. "}},"formatters":[],"contentTypes":[],"statusCode":415}

无论如何，我可以直接使用我的 blob 文件，而无需将这些文件保存在本地吗？

问候，马杜

microsoft-cognitive form-recognizer

2019-11-04T09:59:52.740

0 投票

1 回答

182 浏览