我在联合国大会决议中使用表单识别器 api。文档采用非常特定的格式,尽管不是 API 喜欢的传统格式。他们在文档中没有字段名称,但那里肯定有字段。使用 REST API(通过 Python),我可以获取作为键“令牌”的一部分提取的值。
我的问题是:我可以训练模型为这些表单组件分配特定的键吗?
例如,在此示例中,https://undocs.org/en/A/RES/70/204,我想要一些键值对,因为输出将是
- 决议:A/RES/70/204
- 机关:大会
- 日期:2016 年 2 月 23 日
- 届次:第七十届会议
- 议程:议程项目 20 (c)
- 标题 ID:70/204
- 标题:国际减灾战略
- 委员会:[关于第二委员会的报告(A/70/472/Add.3)]
我总是可以编写一些解析代码来查看边界框给出的位置并根据它分配键,但想知道 API 中是否有我不知道的功能。