样本数据:
declare @RandomString table (ID int not null,ItemValue varchar(500) not null)
insert into @RandomString(ID,ItemValue) values
(1,'*Test"'),
(2,'?Test*')
declare @SearchCharReplacement table (Original varchar(500) not null,Replacement varchar(500) not null)
insert into @SearchCharReplacement(Original,Replacement) values
('*','`star`'),
('?','`quest`'),
('"','`quot`'),
(';','`semi`')
和UPDATE
:
;With Replacements as (
select
ID,ItemValue,0 as RepCount
from
@RandomString
union all
select
ID,SUBSTRING(REPLACE(ItemValue,Original,Replacement),1,500),rs.RepCount+1
from
Replacements rs
inner join
@SearchCharReplacement scr
on
CHARINDEX(scr.Original,rs.ItemValue) > 0
), FinalReplacements as (
select
ID,ItemValue,ROW_NUMBER() OVER (PARTITION BY ID ORDER BY RepCount desc) as rn
from
Replacements
)
update rs
set ItemValue = fr.ItemValue
from
@RandomString rs
inner join
FinalReplacements fr
on
rs.ID = fr.ID and
rn = 1
产生:
select * from @RandomString
ID ItemValue
----------- -----------------------
1 `star`Test`quot`
2 `quest`Test`star`
它的作用是从未更改的文本(中的顶部选择Replacements
)开始,然后尝试应用任何有效的替换(中的第二个选择Replacements
)。它将根据它产生的任何结果继续应用第二个选择,直到没有新的行产生。这称为递归公用表表达式 (CTE)。
然后我们使用第二个 CTE(这次是非递归的)FinalReplacements
对第一个 CTE 生成的所有行进行编号,将较低的行号分配给最后生成的行。从逻辑上讲,这些行是应用最后一个适用变换的结果,因此将不再包含任何要替换的原始字符。所以我们可以使用第 1 行来对原始表执行更新。
这个查询确实做了比严格必要的工作更多的工作——对于少量的替换字符行,它不太可能效率太低。我们可以通过定义应用替换的单一顺序来清除它。