当我使用 Azure 表单识别器提取 pdf 文本时,当我使用 Microsoft 提供的示例数据时,一切都很好。但是当我使用我唯一的 pdf 来训练模型时,我收到以下错误:
响应状态码:200 响应正文:
{
'modelId': '4380f0c6-e073-4a5f-b69e-78e9b7e39c0d',
'trainingDocuments': [{
'documentName': 'liste_med_2019_08_15_en - p201.pdf',
'pages': 1,
'errors': ['Page 1: Document is either invalid or exceeds the page/size limits.'],
'status': 'failure'
}, {
'documentName': 'liste_med_2019_08_15_en - p202.pdf',
'pages': 1,
'errors': ['Page 1: Document is either invalid or exceeds the page/size limits.'],
'status': 'failure'
}, {
'documentName': 'liste_med_2019_08_15_en - p203.pdf',
'pages': 1,
'errors': ['Page 1: Document is either invalid or exceeds the page/size limits.'],
'status': 'failure'
}, {
'documentName': 'liste_med_2019_08_15_en - p204.pdf',
'pages': 1,
'errors': ['Page 1: Document is either invalid or exceeds the page/size limits.'],
'status': 'failure'
}, {
'documentName': 'liste_med_2019_08_15_en - p205.pdf',
'pages': 1,
'errors': ['Page 1: Document is either invalid or exceeds the page/size limits.'],
'status': 'failure'
}],
'errors': [{
'errorMessage': 'Unable to fit model. No documents clustered.'
}]
}
我使用的培训文件是 5 个 pdf,每个 1 页,格式相似。
拜托,谁能帮我解决我的问题?谢谢