我正在使用以下查询来检测数据库中的重复项。
使用 LINQ 连接效果不佳,因为 X 公司也可能被列为 X 公司,因此我想修改它以检测“接近重复”。
var results = result
.GroupBy(c => new {c.CompanyName})
.Select(g => new CompanyGridViewModel
{
LeadId = g.First().LeadId,
Qty = g.Count(),
CompanyName = g.Key.CompanyName,
}).ToList();
有人可以建议一种我可以更好地控制比较的方法吗?也许通过 IEqualityComparer (虽然我不完全确定在这种情况下会如何工作)
我的主要目标是:
- 列出包含所有重复项(或“接近重复项”)子集的第一条记录
- 为了对我用于重复项的字段和文本比较具有一定的灵活性。