1

我使用python-pdfkit如下来生成PDF:

pdfkit.from_file(list_of_files, toc=toc, cover=cover, cover_first=True, options=default_options)

我的问题是关于生成的目录:

目录是根据输入文档中的H标签生成的

如果我的 html 文件是这样的:

index1.html

<h1>Title</h1>
...
[content]

index2.html

<h2>Subtitle</h2>
...
[content]

index3.html

<h3>Sub-subtitle</h3>
...
[content]

由于它们是 3 个不同的文件,因此生成的 TOC 为:

Title --------------------- Page x
Subtitle ------------------ Page y
Sub-subtitle -------------- Page z

代替

Title--------------------- Page x
   Subtitle -------------- Page y
      Sub-subtitle ------- Page z

我曾尝试将所有 html 文件合并在一起,但它给我的内部链接带来了很多问题......链接到文件而不是 HTML#IDs会因为一个 HTML 文件全部合并而变得棘手。

知道如何告诉wkhtmltopdf尊重H tags层次结构而不重置每个文件吗?

谢谢!

编辑:

在 wkhtmltopdf github 问题部分进行了一些讨论之后,实现此结果的唯一简单方法是预先解析 HTML 文件以将它们合并在一起。

有关详细信息,请参阅以下链接:https ://github.com/wkhtmltopdf/wkhtmltopdf/issues/4310

4

0 回答 0