Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我只是想建立一个小型索引文件系统(超过 3000 个文本文件和超过 5 GB)。我已经从谷歌或其他地方搜索过结果,但没有得到我想要的。所有结果都与 Lucene 相关,但是我只想在没有任何第三个库的情况下做到这一点,你能给我一些建议或一些例子吗?
一个非常基本的解决方案可能是使用倒排索引。这是您读取所有要索引的文档并将找到的单词作为键存储在映射中的位置,值是包含这些单词的文档列表。
文件 1;
这是一个示例文档
文件 2;
这份文件是第二个
你的地图会有;
this -> doc1, doc2 is -> doc1, doc2 an -> doc1 example -> doc1 document -> doc1, doc2 number -> doc2 two -> doc2