1

我遇到了 FormRecognizer 没有表现出我所看到的那样的问题。这是困境

我有一张发票,当通过 https://{endpoint}/formrecognizer/v2.0/layout/analyze 运行时,它识别出发票中的表格并使用“表格”节点生成正确的 JSON。这是其中一部分的示例

 {
                    "rows": 8,
                    "columns": 8,
                    "cells": [
                        {
                            "rowIndex": 0,
                            "columnIndex": 4,
                            "columnSpan": 3,
                            "text": "% 123 F STREET Deer Park TX 71536",
                            "boundingBox": [
                                3.11,
                                2.0733
                            ],
                            "elements": [
                                "#/readResults/0/lines/20/words/0",
                                "#/readResults/0/lines/20/words/1"

                            ]
                        }

当我训练一个没有标签文件的模型时 https://{endpoint}/formrecognizer/v2.0/custom/models 它不会生成一个空的“表”节点,但它会生成(令牌)。这是上面没有“表格”的示例

{
                    "key": {
                        "text": "__Tokens__12",
                        "boundingBox": null,
                        "elements": null
                    },
                    "value": {
                        "text": "123 F STREET",
                        "boundingBox": [
                            5.3778,
                            2.0625,
                            6.8056,
                            2.0625,
                            6.8056,
                            2.2014,
                            5.3778,
                            2.2014
                        ],
                        "elements": null
                    },
                    "confidence": 1.0
                }

我不确定这在哪里表现得不理想,但任何见解都将不胜感激!

4

1 回答 1

0

如果您使用标签文件训练模型,然后调用 FR Analyze(),FR 服务将调用 Layout 服务,该服务在“pageResults”部分返回表格。

于 2020-07-14T00:33:03.140 回答