Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我已经检查了 Lucene 索引文件的方式。但我需要索引键值对。就像我在单个文件或少量文件中有许多(单词,句子)组合一样。大多数情况下,它位于单个文件中。
我想根据我用于搜索的单词来搜索句子。我需要与 Java 一起使用的机制是什么?
类似于 Hadoop 中的序列文件。在不解析整个数据的情况下,我们应该能够获得每个可用键的值。
我认为您可以将文件分成句子,用 lucene 文档索引每个句子并将文件信息放入文档中。然后您可以搜索一些单词以获取句子和文件信息。
例如。doc.add(new TextField("content", content, Field.Store.YES));
doc.add(new TextField("content", content, Field.Store.YES));
`doc.add(new TextField("fileinfo", fileinfo, Field.Store.YES));`