Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我在StandardAnalyzer的帮助下为*.docx文件创建索引,这很好。但是在搜索时,它并没有给出这些 *.docx 文件的结果。
任何帮助或建议将不胜感激!!!
如何将 *.docx 文件转换为可索引(文本)格式?
我们使用 Apache POI 为我们的 *.docx(和其他办公格式)编制索引,这工作得很好!
您可以在这里查看实现:http ://code.google.com/p/gtxcontentconnector/source/browse/#svn%2Ftrunk%2Fcontentconnector-poi-transformer%2Fsrc%2Fmain%2Fjava%2Fcom%2Fgentics%2Fcr %2Flucene%2F索引器%2F变压器