5

希望开发将处理文档的服务器端应用程序。源文件多为MS-Word 2003、2007,即Docx的MS版。希望服务器应用程序能够在 linux 或 windows 上运行。想知道在linux下读写MS-Word文件最好的工具或库是什么。兼容性是最重要的考虑因素。必须保留源文档格式,包括表格。

我在这里看到过类似的帖子,但它是特定于 python 的。我不在乎使用什么语言或库,只要它们可用于 windows 和 linux。
必须不需要 MS-Word 才能读取 Word 文件。
我知道 Open Office,但正在寻找与 MS-Word 文件高度兼容的解决方案。也刚刚遇到了这个看起来很有希望的解决方案。aspose.com 有人有使用 Aspose.Words for Java 或类似的 3rd 方包的经验吗?它看起来很有希望,但对于 OEM 订阅来说,它的价格超过 2000 美元。也就是说,如果它按照宣传的方式交付,它可能仍然是最好的解决方案。

谢谢 已经提出了一些建议,但到目前为止还没有符合该法案(或预算)的建议。

4

3 回答 3

5

您是否考虑过使用 b2xtranslator 将二进制 .doc 转换为 .docx。(在 Linux 上,您必须在 Mono 中运行它)

然后您可以使用 POI 或 docx4j 来操作 docx。如果您需要另存为 .doc,则不是解决方案(除非您为此使用 OO)

于 2009-11-17T11:24:28.487 回答
0

好的,我会再回答一次;-)

使用unaconv怎么样

它可以将 OpenOffice 可以读取的任何文档转换为 OpenOffice 可以写入的任何文档。您应该能够使用它来转换 MS-Word 文档或从 ​​MS-Word 文档转换(前提是它们不是我发现开放式办公室不能很好处理的过于复杂)。

唯一需要注意的是,您需要在 linux 服务器上运行一个 OpenOffice 实例,以便 unoconv 与之交互。

于 2009-11-12T12:47:46.983 回答
-1

Mono 最近获得了对 system.io.packaging .net 类的支持,它允许对 docx 文件进行一定程度的操作。如果您想做的事情是添加/删除资源并递归文本,那可能是正确的事情。

于 2009-12-02T17:01:41.400 回答