7

我在无头模式下使用 libreoffice 将 HTML 转换为各种格式。对于这个问题,为了简单起见,我们将使用 docx。

我使用类似这样的命令:

libreoffice --headless --convert-to docx:"MS Word 2007 XML" --writer document.html

这在大多数情况下都很好用。

HTML 包含几个图像的绝对链接。

<img src="http://myserver.com/image1.jpg" />

当文档转换为 document.docx 时,图像仍然被链接到,而不是嵌入到文档中。当您离线和预览等时,这会导致问题。

有没有一种方法可以告诉 libreoffice 下载图像并将其直接嵌入到文档中,而不仅仅是将它们保留为链接图像?

4

2 回答 2

1

LibreOffice 当前(朝向 6.3,但这是自此更改/ 5.2 以来的情况)默认不嵌入图像:

libreoffice --convert-to html test.odt

您可以选择嵌入这样的图像:

libreoffice --convert-to html:'HTML (StarWriter):EmbedImages' test.odt
于 2019-04-17T18:55:25.410 回答
-2

安装 pandoc 后转换为 odt 非常容易。

在相对困难的部分之后:从 odt(甚至 html),您可以通过例如 unoconv 编写 (Open|Libre)Office 脚本

或者你可以喜欢:

abiword --to=doc filename.odt 另请参阅此线程和此博客文章。安装 pandoc 后转换为 odt 非常容易。

在相对困难的部分之后:从 odt(甚至 html),您可以通过例如 unoconv 编写 (Open|Libre)Office 脚本

或者你可以喜欢:

abiword --to=doc filename.odt 另请参阅此线程和此博客文章。

于 2014-06-03T09:07:58.687 回答