0

我正在尝试使用示例代码使用 v3 preview构建表单识别器自定义模型:

Uri trainingFileUri = new Uri(sasToken);
var client = new DocumentModelAdministrationClient(
               new Uri(endpoint), new 
               AzureKeyCredential(apiKey));

BuildModelOperation operation = await client.StartBuildModelAsync(trainingFileUri);

Response<DocumentModel> operationResponse = await operation.WaitForCompletionAsync();

sas 令牌用于包含 20 个 pdf 文件的 Blob 容器。当我运行时,我得到了错误

状态:200(正常)错误代码:InvalidRequest

附加信息:AdditionInformation:InvalidRequest:无效请求。

详细信息:ModelBuildError:无法构建模型:找不到任何 OCR 文件进行训练。

生的:

{ "code": "InvalidRequest", "message": "Invalid request.", "details": [ { "code": "ModelBuildError", "message": "Could not build the model: Can\u0027t find any OCR培训文件。” } ] }

SAS 令牌有读、写、列出等权限,所以我不知道为什么客户端找不到任何要训练的文档。有任何想法吗?

4

1 回答 1

1

您链接到的预览 API 不支持没有标签的训练。您将需要一个带标签的数据集来训练模型。

您是否使用表单识别器工作室来标记您的文件?

训练模型需要您的存储帐户包含 3 种类型的文件:

  1. 单个文件 - fields.json
  2. 对于训练数据集中的每个文件,在标记过程中会创建 2 个附加文件
    • {文件名}.labels.json
    • {文件名}.ocr.json

错误消息表明您可能没有标记您的文档。

于 2021-11-12T13:49:10.320 回答