比方说,我正在维护很多文档的索引。我想更新新到达数据的索引,使其尽可能实时。我需要查看什么样的索引工具?我看过 Sphinx 和 Lucene,在之前的帖子中,推荐将它们用于实时索引。
Sphinx 中使用的 delta 索引机制看起来是一个非常巧妙的想法。
我的一些问题是
1) 文档到达后多久可以搜索到?2) 索引合并过程的效率如何?(合并增量索引和主索引)
我知道这些是非常普遍的问题,我想知道使用 Sphinx 是否是解决这个问题的正确方法。
Sphinx 具有实时索引,允许动态添加/更新/删除索引。
您可以查看Apache Solr (NRT)和Elastic Search以了解使用 Lucene 的实时实施。你可以看看一些基准。