3

关于表单识别器 (FR) 模型管理的几个问题:

背景:我正在使用 FR Labeling 工具来训练模型和 C# Function 应用程序以与 FA 服务交互并分析表单。

  1. 每次训练模型时 - 都会创建一个新实例。新版本不包含对以前版本的任何引用,并且无法在代码中按名称选择模型。可以使用 TrainingCompletedOn 属性查询最新模型,但它不是防故障的,如果 FR 有多个项目,则不能使用。问题:如果正在进行持续开发并且模型不断改进 - 是否有方法(或最佳实践)来管理必须针对哪个模型。
  2. 与第一个 Q 相关——因为 FR 总是创建一个新模型——它最终会得到一大堆仍然处于活动状态的未使用模型。并且由于它们之间没有联系 - 没有安全的方法来执行清理。可以使用 API 删除旧模型,但这是一个手动过程。关于如何管理旧模型版本的任何建议?
  3. 可以将模型导出添加到版本控制并从版本控制部署到其他环境吗?有一个 API 端点可以在 FR 实例之间复制模型,但我想将它保存在版本控制中并从那里部署到环境中。
  4. 关于 Q3 - 在 DevOps 中管理 FR 项目的推荐做法是什么?如何在不同的环境中对工作进行版本控制和部署?

谢谢

4

1 回答 1

0
  1. 每个模型都是独特和独立的。它是不可变的,您需要根据您的测试数据集选择精度最高的模型。
  2. 您可以调用 DELETE api 来删除模型。
  3. 在这一点上没有这样的支持。由于每个模型在创建后无法更改,因此我认为模型的版本控制没有太大价值。
  4. 请参阅#1,您可以使用测试数据集来衡量模型性能。如果模型在一个测试文件上表现不佳,您可以标记该测试文件并将其添加到训练集中,然后训练一个新的(更好的)模型。

-xin(MS 表单识别器团队)

于 2020-08-23T04:55:49.830 回答