1

我正在尝试使用带有标签工具的 Azure 表单识别器来训练和提取图像中的文本。根据文档:

首先,确保所有培训文档的格式相同。如果您有多种格式的表单,请根据通用格式将它们组织到子文件夹中。训练时,您需要将 API 定向到子文件夹。(https://docs.microsoft.com/en-us/azure/cognitive-services/form-recognizer/quickstarts/label-tool#set-up-input-data

就我而言,我有不同格式的图像。我可以创建不同的项目、标记图像、训练它们并获得预期的输出。就我而言,挑战是,如果我采用这种方法,我需要创建不同的项目,分别训练并维护多个模型 ID。

所以我只是想知道有没有什么方法可以将不同的格式作为一个训练模型一起训练?基本上我想知道我们是否可以使用单个模型 ID 从不同格式的图像中提取键值对?

4

2 回答 2

1

这是一些客户要求的功能。我们正在为此制定解决方案,预计将在几个月内推出。目前,我们建议您单独训练模型并维护多个模型 ID。

于 2020-01-13T22:21:54.853 回答
0

如果这些只是几种不同的类型(例如,2-4),并且它们很容易区分,您也可以尝试将它们全部一起训练。但是,要使其工作,您需要标记更多文件,并且结果仍然可能不如单独的模型好。

为了尝试这一点,将每种类型的大致相同数量的图像都放在同一个文件夹中,并一起标记。

如果有许多不同的类型,这不太可能起作用。

于 2020-01-13T22:51:15.393 回答