0

当我使用 Azure 表单识别器提取 pdf 文本时,当我使用 Microsoft 提供的示例数据时,一切都很好。但是当我使用我唯一的 pdf 来训练模型时,我收到以下错误:

响应状态码:200 响应正文:

{
    'modelId': '4380f0c6-e073-4a5f-b69e-78e9b7e39c0d',
    'trainingDocuments': [{
        'documentName': 'liste_med_2019_08_15_en - p201.pdf',
        'pages': 1,
        'errors': ['Page 1: Document is either invalid or exceeds the page/size limits.'],
        'status': 'failure'
    }, {
        'documentName': 'liste_med_2019_08_15_en - p202.pdf',
        'pages': 1,
        'errors': ['Page 1: Document is either invalid or exceeds the page/size limits.'],
        'status': 'failure'
    }, {
        'documentName': 'liste_med_2019_08_15_en - p203.pdf',
        'pages': 1,
        'errors': ['Page 1: Document is either invalid or exceeds the page/size limits.'],
        'status': 'failure'
    }, {
        'documentName': 'liste_med_2019_08_15_en - p204.pdf',
        'pages': 1,
        'errors': ['Page 1: Document is either invalid or exceeds the page/size limits.'],
        'status': 'failure'
    }, {
        'documentName': 'liste_med_2019_08_15_en - p205.pdf',
        'pages': 1,
        'errors': ['Page 1: Document is either invalid or exceeds the page/size limits.'],
        'status': 'failure'
    }],
    'errors': [{
        'errorMessage': 'Unable to fit model. No documents clustered.'
    }]
}

我使用的培训文件是 5 个 pdf,每个 1 页,格式相似。

这是我的pdf样本: 我的pdf样本

拜托,谁能帮我解决我的问题?谢谢

4

1 回答 1

1

此处列出了为培训表单识别器 API 提交的文档的一般输入要求。您能否确认您的 5 个 PDF 文档的总大小不超过 4 MB?

于 2019-09-25T17:41:15.023 回答