0

我已经检查了 Lucene 索引文件的方式。但我需要索引键值对。就像我在单个文件或少量文件中有许多(单词,句子)组合一样。大多数情况下,它位于单个文件中。

我想根据我用于搜索的单词来搜索句子。我需要与 Java 一起使用的机制是什么?

类似于 Hadoop 中的序列文件。在不解析整个数据的情况下,我们应该能够获得每个可用键的值。

4

1 回答 1

0

我认为您可以将文件分成句子,用 lucene 文档索引每个句子并将文件信息放入文档中。然后您可以搜索一些单词以获取句子和文件信息。

例如。doc.add(new TextField("content", content, Field.Store.YES));

`doc.add(new TextField("fileinfo", fileinfo, Field.Store.YES));`
于 2013-06-20T01:16:42.543 回答