wkhtmltopdf - 来自文件列表的 wkhtmltopdf 基于 H 标签生成错误的 TOC

翻译自：https://stackoverflow.com/questions/55362322 2019-03-26T16:47:45.663

608 次

我使用python-pdfkit如下来生成PDF：

pdfkit.from_file(list_of_files, toc=toc, cover=cover, cover_first=True, options=default_options)

我的问题是关于生成的目录：

目录是根据输入文档中的H标签生成的

如果我的 html 文件是这样的：

index1.html

<h1>Title</h1>
...
[content]

index2.html

<h2>Subtitle</h2>
...
[content]

index3.html

<h3>Sub-subtitle</h3>
...
[content]

由于它们是 3 个不同的文件，因此生成的 TOC 为：

Title --------------------- Page x
Subtitle ------------------ Page y
Sub-subtitle -------------- Page z

代替

Title--------------------- Page x
   Subtitle -------------- Page y
      Sub-subtitle ------- Page z

我曾尝试将所有 html 文件合并在一起，但它给我的内部链接带来了很多问题......链接到文件而不是 HTML#IDs会因为一个 HTML 文件全部合并而变得棘手。

知道如何告诉wkhtmltopdf尊重H tags层次结构而不重置每个文件吗？

谢谢！

编辑：

在 wkhtmltopdf github 问题部分进行了一些讨论之后，实现此结果的唯一简单方法是预先解析 HTML 文件以将它们合并在一起。

0 回答 0