1

我正在使用 apache lucene 为日志文件创建一个文本搜索应用程序。我正在使用下面的代码来索引文件

doc.add(new LongField("modified", file.lastModified(), Field.Store.NO));
doc.add(new TextField("contents", new BufferedReader(new InputStreamReader(fis, "UTF-8"))));
doc.add(new StoredField("filename", file.getCanonicalPath()));

在这里,我为每个文件创建 3 个索引但是在搜索时我只能检索一个索引的值,其他两个索引为空。这是搜索端代码

Document d = searcher.doc(docId);
System.out.println(i+":File name is"+d.get("filename"));
System.out.println(i+":File name is"+d.get("modified"));
System.out.println(i+":File name is"+d.get("contents"));

我得到的输出是

2 total matching documents
0:File name is/home/maclean/NetBeansProjects/LogSearchEngine/src/SimpleSearcher.java
0:File name isnull
0:File name isnull
1:File name is/home/maclean/NetBeansProjects/LogSearchEngine/src/SimpleFileIndexer.java
1:File name isnull
1:File name isnull   

我究竟做错了什么

4

1 回答 1

2

在 Lucene 中,如果要检索某个字段的值,则需要存储该字段。如果未存储字段,则在搜索时其值为null.

对于modified,您已通过传递参数将其明确指定为未存储的字段Field.Store.NO;结果,它的值没有存储在索引中,因此在搜索时返回 null。要存储和检索其值,您需要将构造函数调用更改为:

doc.add(new LongField("modified", file.lastModified(), Field.Store.YES));

对于contents,您使用的构造函数会创建未存储的字段。您需要将其构造函数更改为:

doc.add(new TextField("contents", new BufferedReader(new InputStreamReader(fis, "UTF-8")), Field.Store.YES));

在这些更改之后,您应该能够检索这两个字段。

您可以检索 的值,filename因为您使用的是默认创建存储字段的构造函数。

于 2013-03-08T13:03:34.927 回答