c# - 以编程方式检查 PDF 可读性

Question

我正在开发一种工具，该工具将识别那些人眼不可读的 PDF 文件（PDF 格式的扫描文档），我的意思是它们可能模糊或不清晰（DPI 较少）。需要这个工具是因为有数百万个文件，而且我们很难一个一个打开文件并确保它是否可读/清晰 我尝试过什么： 我使用了 spire.pdf 库，使用这个库我从中提取图像pdf 并检查每个图像的 DPI 并将其 dpi 与 150 dpi 进行比较，150 DPI 是我们要求的标准 DPI。因此，我从 pdf 中提取图像并将每个图像的 dpi 与标准进行比较，如果图像的 dpi 小于标准，我标记为“图像不清晰” 在上述解决方案之后我面临的问题 PDF中有一些DPI小于150但清晰的图像，还有一些DPI为Good的图像，工具标记为Good但模糊或不清晰。

你们中的任何人是否有相同的要求，或者如果您有任何建议，我将不胜感激。

score 0 · Accepted Answer

我们可以通过使用我们的PdfViewer库将 PDF 转换为图像文件，然后使用OpenCVSharp开源库识别模糊图像来实现这一要求。请找到下面的示例，该示例从下面说明了相同的内容，

将PDF转换为图像后识别模糊图像

注意：值越小（接近于零），CalculateBlurriness() 的结果就是更清晰的图像。

Syncfusion 没有任何直接支持/直接的解决方案来实现这一要求。这只是识别模糊图像的建议，结果可能因图像文件而异。

c# - 以编程方式检查 PDF 可读性

1 回答 1

Related

Reference