azure-cognitive-services - 从 PDF 文件的所需页面中提取文本

Question

我正在尝试使用 Form Recognizer - Azure 认知服务从 pdf 文件中提取文本。我正在使用自定义模型，通过我的模型训练此服务，然后尝试提取数据。

我的 PDF 通常有 1 页以上。但我有兴趣从第一页中提取文本。其余所有页面没有任何重要性。

那么有什么方法可以训练我的系统通过提供页码从选定页面中提取文本？

问候，

马杜

score 1 · Accepted Answer

训练模型时，表单识别器 API 目前不支持文档的页面范围。您可能必须使用 3rd 方工具/API 对文档进行预处理，以仅发送您需要训练模型的页面。

1 回答 1