0

我已经使用 Forms Recognizer 好几天了,但无法识别表单中的键。

我想用它来提取学生在测试中给出的答案......是一个例子。

我无法更改学生填写的表格的结构,因为这是一项全国性考试,我无法联系到组织者。

因此,我按照 Microsoft 文档中的建议训练了一个模型,并用它来“阅读”表格,它得到了大部分答案,但这一切都是作为“令牌”键的值

{
    "key": [
      {
        "text": "__Tokens__",
        "boundingBox": [
          0,
          0,
          0,
          0,
          0,
          0,
          0,
          0
        ]
      }
    ],
    "value": [
      {
        "text": "01",
        "boundingBox": [
          110.1,
          826.6,
          125.6,
          826.6,
          125.6,
          816.8,
          110.1,
          816.8
        ],
        "confidence": 1
      },
      {
        "text": "A",
        "boundingBox": [
          148.2,
          834.4,
          160.6,
          834.4,
          160.6,
          816.8,
          148.2,
          816.8
        ],
        "confidence": 1
      },
      {
        "text": "26",
        "boundingBox": [
          229.4,
          828.6,
          246,
          828.6,
          246,
          816.8,
          229.4,
          816.8
        ],
        "confidence": 1
      },
      {
        "text": "B",
        "boundingBox": [
          268.6,
          834.4,
          277.8,
          834.4,
          277.8,
          816.8,
          268.6,
          816.8
        ],
        "confidence": 1
      }

然后我在 excel 上重新创建了结构,但在数字之后使用 : 并训练了另一个模型。我还打印了一些副本并填写以进行测试,表单识别器将数字理解为键。

{
      "key": [
        {
          "text": "01:",
          "boundingBox": [
            270.4,
            1625.4,
            313,
            1625.4,
            313,
            1600.5,
            270.4,
            1600.5
          ]
        }
      ],
      "value": [
        {
          "text": "A",
          "boundingBox": [
            350.7,
            1620.9,
            368.8,
            1620.9,
            368.8,
            1587,
            350.7,
            1587
          ],
          "confidence": 1
        }
      ]
    },
    {
      "key": [
        {
          "text": "26:",
          "boundingBox": [
            520.2,
            1624.2,
            552.8,
            1624.2,
            552.8,
            1600.5,
            520.2,
            1600.5
          ]
        }
      ],
      "value": [
        {
          "text": "E",
          "boundingBox": [
            604.6,
            1618.8,
            625.8,
            1618.8,
            625.8,
            1587,
            604.6,
            1587
          ],
          "confidence": 1
        }
      ]
    }

有谁知道一些方法可以将数字字段识别为没有 : 的键?

4

1 回答 1

0

除非特别标记为键,否则表单识别器不会将行号视为键,因此它当前不会将它们发现为键。

于 2019-11-22T23:54:10.020 回答