我正在学习使用仅将其手册作为网页发布的软件包,
http://www.orcina.com/SoftwareProducts/OrcaFlex/Documentation/OrcFxAPIHelp/Default_Left.htm#StartTopic=html/Matlab_Introduction.htm
如果可以将网络手册转换为一个 PDF 文件,我会更快地学习该软件包,因为我可以在 Acrobat Pro 中用注释和下划线标记 PDF。我尝试将每个部分打印到一个单独的 PDF 中,然后将它们连接成一个 PDF,但是有超过 100 个部分,所以这很慢。
有没有更好的方法将整个网络手册文档转换为单个 PDF 文件,并且手册内容的顺序正确?
问问题
2282 次
2 回答
1
在 acrobat pro 中,您应该能够直接打开网页,它会为您即时将页面转换为 PDF。
ctrl+shift+O(哦,不是零,并且在 v9 和 vX 中都有效)
我相信你也可以告诉它在一定程度上向外蜘蛛。是的......只是那不起作用。我得到一个空白页。看起来大部分内容都是通过脚本/ajax 类型的东西填充的。
不是编程解决方案,而是解决方案。
wkHTMLToPDF将处理脚本,但我不知道它是否会为你做任何爬虫。
于 2011-02-09T18:40:29.870 回答
0
您应该使用 HTML/XML 解析器屏幕抓取每个页面,将整个文档存储在某个本地数据结构中,然后使用它将内容粘贴到您的 PDF 库中并将文档另存为 PDF。
于 2011-02-09T16:52:32.497 回答