1

如何获取 PDF 文档的页数?文档也可以有图像,以及不同字体大小的文本。它应该适用于不同的 PDF 文档版本。

答案可以是任何脚本语言,我稍后会将它们移植到 Ruby。

4

2 回答 2

1

使用pyPdf

from pyPdf import PdfFileReader

pdf = PdfFileReader(file("document.pdf", "rb"))
print pdf.getNumPages()

我认为 Ruby 必须有一个具有类似功能的类似库。

于 2009-10-21T16:48:39.153 回答
0

我能想到一个可能会起作用的创可贴解决方案。我将假设您正在开发一个需要此信息的 Web 应用程序/网页。在这种情况下,让浏览器的 adobe reader 插件加载 pdf 文档。然后,使用插件将一些“Javascript for pdf”附加/执行到加载的文档,这将返回页数。可以在此处找到该函数调用的 DOM:

http://www.adobe.com/devnet/acrobat/pdfs/js%5Fapi%5Freference.pdf

此外,您还必须收集这些信息并将其取回。您可能还会发现本指南很有帮助:

http://www.adobe.com/devnet/acrobat/pdfs/Acro6JSGuide.pdf

于 2009-10-21T11:39:38.910 回答