0

我只是想建立一个小型索引文件系统(超过 3000 个文本文件和超过 5 GB)。我已经从谷歌或其他地方搜索过结果,但没有得到我想要的。所有结果都与 Lucene 相关,但是我只想在没有任何第三个库的情况下做到这一点,你能给我一些建议或一些例子吗?

4

1 回答 1

0

一个非常基本的解决方案可能是使用倒排索引。这是您读取所有要索引的文档并将找到的单词作为键存储在映射中的位置,值是包含这些单词的文档列表。

文件 1;

这是一个示例文档

文件 2;

这份文件是第二个

你的地图会有;

this -> doc1, doc2
is -> doc1, doc2
an -> doc1
example -> doc1
document -> doc1, doc2
number -> doc2
two -> doc2
于 2013-01-07T11:39:15.817 回答