1

我想知道是否可以使用 OpenGrok 来索引 PPT、XLS、DOC 等格式。这必须由我自己编程还是已经有这样做的插件/方法?

4

1 回答 1

0

目前没有专门的分析器来从这些类型的文档中提取数据,但是应该可以基于在 Java 中将Microsoft Word 文档读取为纯文本(DOC、DOCX)中列出的 Java 库来实现一个分析器(例如 Apache POI 或 Apache蒂卡)

随时在https://github.com/oracle/opengrok/issues上提交新问题

于 2021-05-14T08:19:53.307 回答