我在无头模式下使用 libreoffice 将 HTML 转换为各种格式。对于这个问题,为了简单起见,我们将使用 docx。
我使用类似这样的命令:
libreoffice --headless --convert-to docx:"MS Word 2007 XML" --writer document.html
这在大多数情况下都很好用。
HTML 包含几个图像的绝对链接。
<img src="http://myserver.com/image1.jpg" />
当文档转换为 document.docx 时,图像仍然被链接到,而不是嵌入到文档中。当您离线和预览等时,这会导致问题。
有没有一种方法可以告诉 libreoffice 下载图像并将其直接嵌入到文档中,而不仅仅是将它们保留为链接图像?