我使用python-pdfkit
如下来生成PDF:
pdfkit.from_file(list_of_files, toc=toc, cover=cover, cover_first=True, options=default_options)
我的问题是关于生成的目录:
目录是根据输入文档中的H标签生成的
如果我的 html 文件是这样的:
index1.html
<h1>Title</h1>
...
[content]
index2.html
<h2>Subtitle</h2>
...
[content]
index3.html
<h3>Sub-subtitle</h3>
...
[content]
由于它们是 3 个不同的文件,因此生成的 TOC 为:
Title --------------------- Page x
Subtitle ------------------ Page y
Sub-subtitle -------------- Page z
代替
Title--------------------- Page x
Subtitle -------------- Page y
Sub-subtitle ------- Page z
我曾尝试将所有 html 文件合并在一起,但它给我的内部链接带来了很多问题......链接到文件而不是 HTML#IDs
会因为一个 HTML 文件全部合并而变得棘手。
知道如何告诉wkhtmltopdf
尊重H tags
层次结构而不重置每个文件吗?
谢谢!
编辑:
在 wkhtmltopdf github 问题部分进行了一些讨论之后,实现此结果的唯一简单方法是预先解析 HTML 文件以将它们合并在一起。
有关详细信息,请参阅以下链接:https ://github.com/wkhtmltopdf/wkhtmltopdf/issues/4310