1

我正在尝试为我的 Lucene.net 应用程序设计一个重复捕获方案。我的问题是很难制作唯一的密钥,因为许多字段都是相同的。我知道唯一不同的字段是 Title 和 Abstract 字段。从中制作密钥的问题是有人可能会稍微更改标题,并且它也会被视为独一无二的。基本上,我正在寻找一种设置阈值的方法,如果它们 95% 匹配,那就是匹配。有没有办法用 Lucene 做到这一点?

4

1 回答 1

1

我不清楚您对唯一键的要求,但您可以查看 Lucene 的 FuzzyQuery 以了解类似条款的匹配情况。查看这些文章:模糊搜索、模糊查询

于 2013-04-22T16:23:29.950 回答