0

我正在使用https://docs.microsoft.com/en-us/azure/cognitive-services/form-recognizer/quickstarts/curl-train-extract在不使用标签的情况下构建训练模型。

我遇到的问题是当我通过模型运行文件(该文件用于训练模型)时,它没有拾取“表格”部分。我的意思是,没有“表格”节点。

据我所见,它应该能够将其构建为 JSON 的一部分,但它将其分解为超细粒度的 OCR,例如

{
                    "key": {
                        "text": "__Tokens__34",
                        "boundingBox": null,
                        "elements": null
                    },
                    "value": {
                        "text": "2 X 3/4",
                        "boundingBox": [
                            3.1181,
                            3.7292,
                            3.5278,
                            3.7292,
                            3.5278,
                            3.8583,
                            3.1181,
                            3.8583
                        ],
                        "elements": null
                    },
                    "confidence": 1.0
                }

我错过了一面旗帜还是什么?

先感谢您。

4

2 回答 2

0

似乎没有标签的火车不会自动检测到该表,您能否分享该表的图像,请删除所有 PII 信息。您还可以尝试使用标签进行训练或使用 Layout API 来查看它是否会自动识别表格。

于 2020-07-09T19:33:17.500 回答
0

我有同样的问题,但我注意到它在启用全文时有效

于 2020-07-15T11:32:04.543 回答