我一直在尝试将 doc/docx 文件转换为 html,我发现最好的选择是docx4j。谁能帮我用一个直接的命令行来完成这项工作。
我试过:
java -cp docx4j.jar:log4j-1.2.15.jar org.docx4j.samples.CreateHtml [input.docx]
作为回应,我期望 HTML 输出(到控制台或文件)。
查看http://dev.plutext.org/svn/docx4j/trunk/docx4j/docs/Docx4j_GettingStarted.html和示例目录,我认为
java -cp docx4j.jar:log4j-1.2.15.jar org.docx4j.samples.CreateHtml [input.docx]
应该管用。请注意“入门” > “命令行示例”部分中的以下内容:
如果 docx 中有任何图像,您还需要:
xmlgraphics-commons-1.4.jar commons-logging-1.1.1.jar
在你的类路径上。
非常感谢 ax 提供思路,但是该命令给出了 Class missing 错误,因此需要在路径中包含其他 jar 文件。
java -cp docx4j-2.6.0.jar:log4j-1.2.15.jar:xalan-2.7.1.jar:serializer-2.7.1.jar:xml-apis-1.3.04.jar:commons-logging-1.1.1.jar:commons-lang-2.4.jar:commons-io-1.3.1.jar:commons-codec-1.3.jar:xmlgraphics-commons-1.4.jar org.docx4j.samples.CreateHtml input.doc