2

我有自动创建的 HTML 文件,我也想将它们保存为 PDF 文件。一种方法是在 Firefox 中打开它们并将它们打印为 pdf 文件。但我不能每次都手动执行此操作,我需要编写脚本。

有没有办法在 linux 中编写 firefox 脚本:

  • 打开一个 HTML 文件。

  • 从打印页面布局中删除所有“额外数据”(时间、URL、页面# 以及默认情况下可能添加到打印页面的任何其他数据)

  • 打印指定名称的文件(与html文件同名,只能为.pdf)

  • 关闭火狐

所有这一切都在批处理模式下,或者通过将 DISPLAY 重定向到 NULL。

其他将 html 转换为 pdf 的程序将无法工作,除非它们是 linux 原生的。(与大多数发行版一起提供)。

4

1 回答 1

0

你可能想用 pycurl 做一个快速而简单的 Python 脚本,它将接受一个 URL 作为参数,然后它应该下载所需的文件和它使用的资产(CSS 等 ...),并用于pandoc转换HTML 转 PDF

这样,您就可以告别 Firefox 添加的“垃圾”,而且,pandoc应该在您的发行版的存储库中。 pandoc是一个 CLI 工具以及一个 Haskell API,因为它是用 Haskell 编写的

于 2013-06-02T15:48:27.617 回答