我们正在尝试使用表单识别器、OCR 和 labeltool 的容器预览,并且有以下问题:
- 有什么软件可以帮助我们对类似类型的文件进行分类。这将帮助我们对文档进行分类并创建训练数据集
- 有没有办法给模型用户定义的名称。以下是模型查询 API 的输出。很难将其与不同类型的模型联系起来:
{
"modelId": "f136f65b-bb94-493b-a798-a3e8023ea1b5",
"status": "ready",
"createdDateTime": "2020-05-06T21:35:58+00:00",
"lastUpdatedDateTime": "2020-05-06T21:36:06+00:00"
}
我可以看到存储在 \output\subscriptions\global\models 中的模型文件,其中 /output 目录在 docker compose 文件中共享容器。是否可以将此模型导入新容器。
- 模型具有与模型 id 相同的 json 和 gz 文件
- 我还附上 docker compose 文件供您参考
- 有没有办法用模型训练数据微调或更新相同的自定义模型(相同的模型 id)
- 我们也在尝试使用 labeltool,但它只需要 Azure blob 作为输入。是否可以像我们为表单识别器的训练一样提供输入。我们正在努力获得此设置,如果无法解决,我们可能会开始寻找替代方案。