有没有办法在不安装 Microsoft Word 的情况下将简单的 HTML 页面导出到 Word(.doc 格式,而不是 .docx)?
11 回答
如果你说的只有简单的 HTML 页面,可以用 Word 打开。
否则,有一些图书馆可以做到这一点,但我没有使用它们的经验。
我的最后一个想法是,如果您使用的是 ASP.NET,请尝试添加application/msword
到标题中,然后您可以将其保存为 Word 文档(它不是真正的 Word 文档,只有重命名为doc
才能打开的 HTML) .
有一个名为 JODConverter 的工具可以连接到开放式办公室以公开它的文件格式转换器,还有作为 web 应用程序(位于 tomcat 中)发布的版本和命令行工具。我一直在使用 html 并成功转换为 .doc 和 pdf,它在一个相当大的项目中,还没有上线,但我想我会使用它。 http://sourceforge.net/projects/jodconverter/
有一个名为HTMLtoWord的开源项目,它允许用户将格式良好的 HTML (XHTML) 片段作为格式化文本插入到 Word 文档中。
虽然可以制作“.doc”Microsoft Word 文件,但制作“.rtf”文件可能更容易且更便携。
如果您使用 Java,您可以使用我在docx4j 2.8.0中发布的代码将 HTML 转换为真实的 docx 内容。我说“真实”,因为替代方法是创建一个 HTML altChunk,它依赖 Word 进行实际转换(当文档首次打开时)。
请参阅以 ConvertInXHTML 为前缀的各种示例。导入过程需要格式良好的 XML,因此您可能必须先对其进行整理。
好吧,有很多第三方工具可以做到这一点。我不知道它是否比这更简单。
例子:
- http://htmltortf.com/
- http://www.brothersoft.com/windows-html-to-word-2008-56150.html
- http://www.eprintdriver.com/to_word/HTML_to_Word_Doc.html
还发现了一个vbscrit,但我猜这需要你安装 word 。
我从“C#”标签中推测您希望以编程方式实现这一目标。
如果它只是 HTML,您需要做的就是将扩展名更改为 .doc,word 将打开它,就好像它是一个 word 文档一样。但是,如果要包含图像或要运行 javascript,它可能会变得更复杂一些。
我相信open office既可以打开 .html 文件,也可以创建 .doc 文件
您可以使用Libreoffice Writer打开 html 文件。然后您可以从文件菜单导出为 PDF。浏览器也可以将 html 导出为 PDF 文件。
使用此链接导出到 word,但此处的图像不起作用: