我正在尝试创建一个可搜索的名称列表(1M 个名称+),并且需要对名称进行一些松散的匹配。我尝试了几种配置服务器/查询实例的方法,但要么只返回完全匹配,要么我得到大量不适当的结果集,缺少完全匹配。
我是 Solr 的新手,有没有这样做的好例子,或者至少是一个很好的起点,我可以从中工作来实现我需要的东西?
提前谢谢了
我正在尝试创建一个可搜索的名称列表(1M 个名称+),并且需要对名称进行一些松散的匹配。我尝试了几种配置服务器/查询实例的方法,但要么只返回完全匹配,要么我得到大量不适当的结果集,缺少完全匹配。
我是 Solr 的新手,有没有这样做的好例子,或者至少是一个很好的起点,我可以从中工作来实现我需要的东西?
提前谢谢了
看看模糊搜索。它们提供Levenstein 距离,也就是您所说的“松散匹配”。
如果您想搜索类似的发音名称,您还可以检查PhoneticFilterFactory