1

我一直在尝试将 doc/docx 文件转换为 html,我发现最好的选择是docx4j。谁能帮我用一个直接的命令行来完成这项工作。

我试过:

java -cp docx4j.jar:log4j-1.2.15.jar org.docx4j.samples.CreateHtml [input.docx]

作为回应,我期望 HTML 输出(到控制台或文件)。

4

2 回答 2

6

查看http://dev.plutext.org/svn/docx4j/trunk/docx4j/docs/Docx4j_GettingStarted.html示例目录,我认为

java -cp docx4j.jar:log4j-1.2.15.jar org.docx4j.samples.CreateHtml [input.docx]

应该管用。请注意“入门” > “命令行示例”部分中的以下内容:

如果 docx 中有任何图像,您还需要:

xmlgraphics-commons-1.4.jar
commons-logging-1.1.1.jar

在你的类路径上。

于 2011-03-04T06:21:22.007 回答
1

非常感谢 ax 提供思路,但是该命令给出了 Class missing 错误,因此需要在路径中包含其他 jar 文件。

java -cp docx4j-2.6.0.jar:log4j-1.2.15.jar:xalan-2.7.1.jar:serializer-2.7.1.jar:xml-apis-1.3.04.jar:commons-logging-1.1.1.jar:commons-lang-2.4.jar:commons-io-1.3.1.jar:commons-codec-1.3.jar:xmlgraphics-commons-1.4.jar org.docx4j.samples.CreateHtml input.doc
于 2011-03-04T06:44:45.410 回答