3

我正在尝试执行一个查询,该查询可以返回 5 个条件中的大多数匹配的结果。但如果有一个 5 of 5 匹配,则优先。

为了说明我的问题,已经准备了以下 SQL。

declare @tmp table (
id int identity
,field1 nvarchar(60)
,field2 nvarchar(60)
,field3 nvarchar(60)
,field4 nvarchar(60)
,field5 nvarchar(60)
)

insert into @tmp values
    ('Bob','Jones','Mr','000001','bob@example.com')
insert into @tmp values
    ('Bill','Jones','','000002','bill@example.com')
insert into @tmp values
    ('Sue','Jones','Mrs','000003','jones@example.com')
insert into @tmp values
    ('Adrian','Jones','','000001','jones@example.com')
insert into @tmp values
    ('Bertha','Jones','Mrs','000001','jones@example.com')

select *
from @tmp

declare @key1 nvarchar(60), @key2 nvarchar(60), @key3 nvarchar(60), @key4 nvarchar(60), @key5 nvarchar(60)

select
    @key1 = 'Bertha'
    ,@key2 = 'Jones'
    ,@key3 = 'Mrs'
    ,@key4 = '000001'
    ,@key5 = 'jones@example.com'

select
    *
    ,case when field1 = @key1 then 1 else 0 end as X1
    ,case when field2 = @key2 then 1 else 0 end as X2
    ,case when field3 = @key3 then 1 else 0 end as X3
    ,case when field4 = @key4 then 1 else 0 end as X4
    ,case when field5 = @key5 then 1 else 0 end as X5
from @tmp

如果您查看结果,您可以看到第 3 行和第 4 行在 3 个字段上匹配,但第 5 行在 5 个字段上匹配。因此,这是一个相同的匹配,这就是我想要返回的匹配。

但是,如果没有插入第 5 行,那么第 3 行和第 4 行是最佳匹配,在这种情况下,我希望返回那些。

我一直在努力思考如何最好地做到这一点,如果可以有所作为,我正在使用 SQL Server 2008。

在实际场景中,它们并不像本例那样都是简单的case语句,而是sub-select到其他表中。

我已经研究过 group by 并拥有,但我看不出在这种情况下如何使用它们。

如何在 SQL Server 中跨多个条件进行“最佳”类型匹配?

如果这看起来像页面告诉我的那样“主观”,请说出来,我会删除它。但我不认为这是主观的,因为这是我认为通常要求的 SQL 重复数据删除方案。

4

1 回答 1

2

考虑将您的列滚动x到一个 SUM 中以获得分数。这是您可以从中查询的 CTE(公用表表达式)。

;with mysum AS (
select    *
    ,case when field1 = @key1 then 1 else 0 end as X1
    ,case when field2 = @key2 then 1 else 0 end as X2
    ,case when field3 = @key3 then 1 else 0 end as X3
    ,case when field4 = @key4 then 1 else 0 end as X4
    ,case when field5 = @key5 then 1 else 0 end as X5
from @tmp)

SELECT id, field1, field2, field3, field4, field5, 
       SUM(x5+x4+x3+x2+x1) AS MatchScore 
FROM MySum
GROUP BY id, field1, field2, field3, field4, field5
ORDER BY MatchScore DESC
于 2012-05-09T16:00:53.567 回答