0

我希望能够确定 PDF 页面上文本、图像和路径区域的边界框,类似于此处显示的内容:

http://www.windjack.com/products/screenshot/pdfcanscreenshot2.html

查看 PDF 规范,我可以看到如何确定路径和图像的边界框,但我看不到如何到达它们的文本。我是否必须手动计算它,从字体大小等确定字形的高度和宽度,还是有更直接的方法?

4

1 回答 1

2

您可以从“如何从 pdf 文档中获取字符偏移信息?”的解决方案开始。 这将为您提供文档中字符和/或子字符串的 x、y、宽度和高度。从那里开始,更难的部分是将字符组绑定到空间上不同的区域。不能保证页面上的空间分组文本在文件格式的语法中会彼此接近......

于 2009-06-18T02:07:56.583 回答