我有一个大约 500M 文档的 Lucene (4.1) 索引。我尝试在其上构建搜索界面,但遇到了一些性能问题。
最初,我使用MatchAllDocumentsQuery
. 此搜索需要很长时间(大约 10 秒)。我认为这是因为我使用的收集器,它试图找到总点击数TotalHitCountCollector
。
我希望能够对查询进行时间限制,所以我找到了TimeLimitingCollector
. 不幸的是,API 文档有点阴暗。它使用了一个没有太多记录的计数器。
有没有人有使用TimeLimitingCollector
Lucene 4.x 的经验?如果是这样,是否有方法可以估计点击总数?
我阅读了:https ://builds.apache.org/job/Lucene-Artifacts-4.x/javadoc/core/org/apache/lucene/search/TimeLimitingCollector.html和示例,但设置不清楚以及如何将其Counter
与numTicks