我遇到了 FormRecognizer 没有表现出我所看到的那样的问题。这是困境
我有一张发票,当通过 https://{endpoint}/formrecognizer/v2.0/layout/analyze 运行时,它识别出发票中的表格并使用“表格”节点生成正确的 JSON。这是其中一部分的示例
{
"rows": 8,
"columns": 8,
"cells": [
{
"rowIndex": 0,
"columnIndex": 4,
"columnSpan": 3,
"text": "% 123 F STREET Deer Park TX 71536",
"boundingBox": [
3.11,
2.0733
],
"elements": [
"#/readResults/0/lines/20/words/0",
"#/readResults/0/lines/20/words/1"
]
}
当我训练一个没有标签文件的模型时 https://{endpoint}/formrecognizer/v2.0/custom/models 它不会生成一个空的“表”节点,但它会生成(令牌)。这是上面没有“表格”的示例
{
"key": {
"text": "__Tokens__12",
"boundingBox": null,
"elements": null
},
"value": {
"text": "123 F STREET",
"boundingBox": [
5.3778,
2.0625,
6.8056,
2.0625,
6.8056,
2.2014,
5.3778,
2.2014
],
"elements": null
},
"confidence": 1.0
}
我不确定这在哪里表现得不理想,但任何见解都将不胜感激!