1

编辑

Solr 可以做模糊场崩溃吗?IE 折叠具有相似值而不是相同值的字段?

我认为它可以,但现在我不确定,这使得我下面的原始问题无效。

原始问题

对于大量给定的值,我需要确定哪个是最普遍的。所有值的集合都会随着时间而变化,因此我可以预期输出也会随着时间而变化。

我收集 Solr 可以执行“字段折叠”以按给定字段对结果进行分组,并具有相似性的容差。是否有可能,甚至合适,仅使用 Solr 来折叠字段,以获得最常见的值?我们在业务的其他部分使用 Solr,最好利用现有代码而不是自制解决方案。

4

1 回答 1

2

不,solr 不支持模糊折叠。(至少不是基于 wiki 上记录的内容)

Solr 4.0 支持group.func允许您根据FunctionQuery的结果对结果进行分组,因此有可能在某个时间点创建一个函数来获得您想要的大致结果,但是现有的函数都不能满足您的需求.

但是,Solr 确实支持结果聚类,这可能适用于您的用例。聚类是用Carrot 2完成的。如果将胡萝卜使用的字段限制为单个字段,您可能会得到与“模糊聚类”类似的结果,但与字段折叠相比,您对胡萝卜所做的控制要少得多。

对于普通文档,您可能希望通过胡萝卜分析所有字段,例如:

carrot.title=my_title&carrot.snippet=my_title,my_description

但是,例如,如果您有一个manufacturer拼写或标点符号略有变化的字段,则可能只为胡萝卜提供一个字段用于titlesnippet

carrot.title=manufacturer&carrot.snippet=manufacturer
于 2012-06-08T11:38:07.193 回答