2

我正在寻找一种以编程方式检查 pdf cad 绘图、普通 2D 打印并提取所有尺寸以及页面上尺寸位置的方法。我正在寻找能够让我做到这一点的技术。

我正在查看 Leadtools、PDFBox、iText、TET、Adobe SDK 并尝试在它们之间进行一些比较。我对准确识别尺寸/数字和形状特别感兴趣,并且 api 还必须具有提取位置信息的能力。任何过去的经验或对好的/坏的有用的见解将不胜感激!

4

1 回答 1

0

我们可以提供有关您问题的 LEADTOOLS 部分的相关信息,因为它是我们的产品。

如果 PDF 包含实际文本而不仅仅是文本图像,您可以直接提取它而无需通过 OCR。为此,请使用Leadtools.Pdf.PDFDocument.ParsePages() 方法

如果您正在处理包含文本和非文本区域的图像,您可以使用Leadtools.ImageProcessing.Core.AutoZoningCommand来隔离文本区域(区域)并获取它们的坐标。然后,您可以使用我们的 OCR 引擎或您自己的代码。如果您尝试此操作并没有得到满意的结果,可能还有其他高级选项可以帮助您,但我们可能需要查看您正在使用的实际示例。如果您愿意,请将一些示例文件通过电子邮件发送到我们的支持地址,并提及您迄今为止尝试过的内容。

于 2017-04-13T18:16:35.213 回答