azure - Azure 表单识别器表未正确提取

Question

我正在使用https://docs.microsoft.com/en-us/azure/cognitive-services/form-recognizer/quickstarts/curl-train-extract在不使用标签的情况下构建训练模型。

我遇到的问题是当我通过模型运行文件（该文件用于训练模型）时，它没有拾取“表格”部分。我的意思是，没有“表格”节点。

据我所见，它应该能够将其构建为 JSON 的一部分，但它将其分解为超细粒度的 OCR，例如

{
                    "key": {
                        "text": "__Tokens__34",
                        "boundingBox": null,
                        "elements": null
                    },
                    "value": {
                        "text": "2 X 3/4",
                        "boundingBox": [
                            3.1181,
                            3.7292,
                            3.5278,
                            3.7292,
                            3.5278,
                            3.8583,
                            3.1181,
                            3.8583
                        ],
                        "elements": null
                    },
                    "confidence": 1.0
                }

我错过了一面旗帜还是什么？

先感谢您。

score 0 · Accepted Answer

似乎没有标签的火车不会自动检测到该表，您能否分享该表的图像，请删除所有 PII 信息。您还可以尝试使用标签进行训练或使用 Layout API 来查看它是否会自动识别表格。

score 0 · Accepted Answer

0

我有同样的问题，但我注意到它在启用全文时有效

于 2020-07-15T11:32:04.543 回答

azure - Azure 表单识别器表未正确提取

2 回答 2

Related

Reference