azure - 表单识别器“错误”：[“第 1 页：文档无效或超出页面/大小限制。”]

Question

当我使用 Azure 表单识别器提取 pdf 文本时，当我使用 Microsoft 提供的示例数据时，一切都很好。但是当我使用我唯一的 pdf 来训练模型时，我收到以下错误：

响应状态码：200 响应正文：

{
    'modelId': '4380f0c6-e073-4a5f-b69e-78e9b7e39c0d',
    'trainingDocuments': [{
        'documentName': 'liste_med_2019_08_15_en - p201.pdf',
        'pages': 1,
        'errors': ['Page 1: Document is either invalid or exceeds the page/size limits.'],
        'status': 'failure'
    }, {
        'documentName': 'liste_med_2019_08_15_en - p202.pdf',
        'pages': 1,
        'errors': ['Page 1: Document is either invalid or exceeds the page/size limits.'],
        'status': 'failure'
    }, {
        'documentName': 'liste_med_2019_08_15_en - p203.pdf',
        'pages': 1,
        'errors': ['Page 1: Document is either invalid or exceeds the page/size limits.'],
        'status': 'failure'
    }, {
        'documentName': 'liste_med_2019_08_15_en - p204.pdf',
        'pages': 1,
        'errors': ['Page 1: Document is either invalid or exceeds the page/size limits.'],
        'status': 'failure'
    }, {
        'documentName': 'liste_med_2019_08_15_en - p205.pdf',
        'pages': 1,
        'errors': ['Page 1: Document is either invalid or exceeds the page/size limits.'],
        'status': 'failure'
    }],
    'errors': [{
        'errorMessage': 'Unable to fit model. No documents clustered.'
    }]
}

我使用的培训文件是 5 个 pdf，每个 1 页，格式相似。

这是我的pdf样本：

拜托，谁能帮我解决我的问题？谢谢

score 1 · Accepted Answer

此处列出了为培训表单识别器 API 提交的文档的一般输入要求。您能否确认您的 5 个 PDF 文档的总大小不超过 4 MB？

azure - 表单识别器“错误”：[“第 1 页：文档无效或超出页面/大小限制。”]

1 回答 1

Related

Reference