0

我正在开发一种工具,该工具将识别那些人眼不可读的 PDF 文件(PDF 格式的扫描文档),我的意思是它们可能模糊或不清晰(DPI 较少)。需要这个工具是因为有数百万个文件,而且我们很难一个一个打开文件并确保它是否可读/清晰 我尝试过什么: 我使用了 spire.pdf 库,使用这个库我从中提取图像pdf 并检查每个图像的 DPI 并将其 dpi 与 150 dpi 进行比较,150 DPI 是我们要求的标准 DPI。因此,我从 pdf 中提取图像并将每个图像的 dpi 与标准进行比较,如果图像的 dpi 小于标准,我标记为“图像不清晰” 在上述解决方案之后我面临的问题 PDF中有一些DPI小于150但清晰的图像,还有一些DPI为Good的图像,工具标记为Good但模糊或不清晰。

你们中的任何人是否有相同的要求,或者如果您有任何建议,我将不胜感激。

4

1 回答 1

0

我们可以通过使用我们的PdfViewer库将 PDF 转换为图像文件,然后使用OpenCVSharp开源库识别模糊图像来实现这一要求。请找到下面的示例,该示例从下面说明了相同的内容,

将PDF转换为图像后识别模糊图像

注意:值越小(接近于零),CalculateBlurriness() 的结果就是更清晰的图像。

Syncfusion 没有任何直接支持/直接的解决方案来实现这一要求。这只是识别模糊图像的建议,结果可能因图像文件而异。

于 2021-03-29T13:02:36.697 回答