我正在尝试执行一个查询,该查询可以返回 5 个条件中的大多数匹配的结果。但如果有一个 5 of 5 匹配,则优先。
为了说明我的问题,已经准备了以下 SQL。
declare @tmp table (
id int identity
,field1 nvarchar(60)
,field2 nvarchar(60)
,field3 nvarchar(60)
,field4 nvarchar(60)
,field5 nvarchar(60)
)
insert into @tmp values
('Bob','Jones','Mr','000001','bob@example.com')
insert into @tmp values
('Bill','Jones','','000002','bill@example.com')
insert into @tmp values
('Sue','Jones','Mrs','000003','jones@example.com')
insert into @tmp values
('Adrian','Jones','','000001','jones@example.com')
insert into @tmp values
('Bertha','Jones','Mrs','000001','jones@example.com')
select *
from @tmp
declare @key1 nvarchar(60), @key2 nvarchar(60), @key3 nvarchar(60), @key4 nvarchar(60), @key5 nvarchar(60)
select
@key1 = 'Bertha'
,@key2 = 'Jones'
,@key3 = 'Mrs'
,@key4 = '000001'
,@key5 = 'jones@example.com'
select
*
,case when field1 = @key1 then 1 else 0 end as X1
,case when field2 = @key2 then 1 else 0 end as X2
,case when field3 = @key3 then 1 else 0 end as X3
,case when field4 = @key4 then 1 else 0 end as X4
,case when field5 = @key5 then 1 else 0 end as X5
from @tmp
如果您查看结果,您可以看到第 3 行和第 4 行在 3 个字段上匹配,但第 5 行在 5 个字段上匹配。因此,这是一个相同的匹配,这就是我想要返回的匹配。
但是,如果没有插入第 5 行,那么第 3 行和第 4 行是最佳匹配,在这种情况下,我希望返回那些。
我一直在努力思考如何最好地做到这一点,如果可以有所作为,我正在使用 SQL Server 2008。
在实际场景中,它们并不像本例那样都是简单的case语句,而是sub-select到其他表中。
我已经研究过 group by 并拥有,但我看不出在这种情况下如何使用它们。
如何在 SQL Server 中跨多个条件进行“最佳”类型匹配?
如果这看起来像页面告诉我的那样“主观”,请说出来,我会删除它。但我不认为这是主观的,因为这是我认为通常要求的 SQL 重复数据删除方案。