我正在开发一种工具,该工具将识别那些人眼不可读的 PDF 文件(PDF 格式的扫描文档),我的意思是它们可能模糊或不清晰(DPI 较少)。需要这个工具是因为有数百万个文件,而且我们很难一个一个打开文件并确保它是否可读/清晰 我尝试过什么: 我使用了 spire.pdf 库,使用这个库我从中提取图像pdf 并检查每个图像的 DPI 并将其 dpi 与 150 dpi 进行比较,150 DPI 是我们要求的标准 DPI。因此,我从 pdf 中提取图像并将每个图像的 dpi 与标准进行比较,如果图像的 dpi 小于标准,我标记为“图像不清晰” 在上述解决方案之后我面临的问题 PDF中有一些DPI小于150但清晰的图像,还有一些DPI为Good的图像,工具标记为Good但模糊或不清晰。
你们中的任何人是否有相同的要求,或者如果您有任何建议,我将不胜感激。