Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
通过具有弹性搜索的胡萝卜2插件进行聚类时是否有任何文档限制。
这就像我们可以使用胡萝卜2 最多聚集 10000 个文档,有这样的限制吗?
Carrot2 旨在实时聚集中小型文档集合。典型的范围是几百个文档。Lingo 算法的合理最大值约为 1k 文档,STC 算法应该能够处理最多约 10k 文档。如果您想超越这一点,您可能还想检查 插入 Carrot2 的商业 Lingo3G 算法。
话虽如此,在对搜索结果进行聚类时,搜索引擎首先需要获取所有要聚类的文档的内容,这也可能需要相当长的时间。