0

我正在编写一个用于搜索文档内容的应用程序 我已经编写了用于搜索可通过记事本编辑的文档的代码。

我也希望对 docx 文件做同样的事情。经过一些研究,我想出了这两件事

  1. http://www.infoq.com/articles/cracking-office-2007-with-java 这种方法需要我提取 docx 文件,然后搜索 xml 文件,但是这将涉及提取部分的额外开销,坦率地说我不知道如何处理 xml 文件(丢弃属性内容等)

  2. http://www.javadocx.com/download 这个方法允许我将一个 jar 库导入到我的项目中,据说我可以用它创建 docx 文件,我不明白如何使用它打开 docx 文件

谁能推荐我一种替代方法来执行相同的操作或帮助上述两种方法?

4

1 回答 1

1

尝试http://tika.apache.org/或 docx4j 或 POI。

于 2011-07-07T22:45:44.407 回答