我正在处理相同的 PDF,但像素大小不同。对于各种文档来说都是一样的。
当我使用 Azure 的 OCR 进行处理时,它会返回一个 JSON,其中包括:
"width": 1700,
"height": 2200,
"unit": "pixel",
但是,当我使用读取 PDF 以提取文本的 Camelot(Python 库)进行处理时,它似乎是 600x800 像素。
差异与DPI有关吗?我需要让他们彼此同意处理。
我正在处理相同的 PDF,但像素大小不同。对于各种文档来说都是一样的。
当我使用 Azure 的 OCR 进行处理时,它会返回一个 JSON,其中包括:
"width": 1700,
"height": 2200,
"unit": "pixel",
但是,当我使用读取 PDF 以提取文本的 Camelot(Python 库)进行处理时,它似乎是 600x800 像素。
差异与DPI有关吗?我需要让他们彼此同意处理。