有没有简单的方法可以将整个 Pelican 网站导出为 pdf,按类别排序?
我尝试将站点地图 html 拖到 calibre 中,但这也很糟糕,这是我不想要的。
使用 python 仅从输出文件夹中的 html 页面中提取内容很容易,但是页面不会按类别排序。
我可以使用 pandoc 将 .md 文件转换为 pdf,但我有一个插件从 markdown 创建的 planturl 图像,所以这也不起作用,因为 pdf 没有图形。
有任何想法吗?
Hacky homerolled 解决方案:-我写了 extractDivs.py https://gist.github.com/stevepowell99/335ef06fe2b35b9317ed来遍历输出文件夹,然后从每个帖子中提取文章 div,然后在 pelican 运行后将其放入我的 makefile 中:
python extractDivs.py
pandoc -s -S output/all.html -o output/book.html -c ../pelican-themes/monospace/static/css/main.css
wkhtmltopdf --footer-right [page] --footer-left [section] -R 30 -L 30 -T 30 -B 30 --outline toc ./output/book.html ./output/book.pdf
因此 pandoc 将提取的 div 放入与我引用的 css 相同的单个文件中,然后 wkhtmltopdf 转换为 pdf。
玉。
最好的起点可能是PDF 插件。自述文件只提到了 reST,所以我不确定是否支持 Markdown,但如果不支持,它可能会被扩展。