1

我正在开发一个票务系统,用户可以在其中购买活动门票。对于这些事件信息,我们依赖于不同的供应商提要。这里的问题是每个供应商都会以不同的方式调用每个事件,但会有一些相似之处。

因此,在将任何事件信息插入表格之前,我需要找出是否有任何具有类似节目的事件。如果有任何类似的事件,我们有更多的过滤机制,我们将检查地点、日期等。

为了在第一步找出类似的事件,我正在执行以下操作。

将新事件名称拆分为字符串数组(使用光标)。循环遍历每个项目并找到具有相似名称的事件(使用 like)。并将所有这些记录插入到临时表中。

DECLARE @TmpTable TABLE (ProductHeaderID int, Name varchar(200))

DECLARE @TmpAddress TABLE (AddressId int)

DECLARE @Item Varchar(100)
DECLARE Items CURSOR LOCAL FOR select Item from dbo.SplitString(@ProductHeader,' ')

OPEN Items
FETCH NEXT FROM Items into @Item
WHILE @@FETCH_STATUS = 0
BEGIN

    If dbo.Trim(@Item) <> '-' and dbo.Trim(@Item) <> ' ' and LEN(dbo.Trim(@Item)) > 3
    Begin
        --Print @Item
        Insert into @TmpTable (ProductHeaderID,Name)
            Select ProductHeaderID,Name from Product.ProductHeaderRepository 
            Where Name LIKE '%[^a-z]'+dbo.trim(@Item)+'[^a-z]%'
    End
    FETCH NEXT FROM Items into @Item
END

CLOSE Items
DEALLOCATE Items

SplitString 是一个用户定义的函数,它返回一个表。

ALTER function [dbo].[SplitString] 
(
    @str nvarchar(max), 
    @separator char(1)
)
returns table
AS
return (
with tokens(p, a, b) AS (
    select cast(1 as bigint),  cast(1 as bigint), charindex(@separator, @str)
    union all
    select p + 1,b + 1, charindex(@separator, @str, b + 1) from tokens where b > 0
)
select p-1 ItemIndex,substring(@str, a, case when b > 0 then b-a ELSE LEN(@str) end) AS Item from tokens
);

修剪功能如下

ALTER FUNCTION [dbo].[TRIM](@string VARCHAR(MAX))
RETURNS VARCHAR(MAX)
BEGIN
RETURN LTRIM(RTRIM(@string))
END

但是在性能方面,上面提到的逻辑需要很多时间。仅 4k 条记录就需要 10 多分钟。有人可以帮助我优化上述内容。

4

1 回答 1

0

如果我没记错的话,您可以将 while 循环替换为以下内容:

Insert into @TmpTable (ProductHeaderID,Name)
Select ProductHeaderID,Name from Product.ProductHeaderRepository 
join dbo.SplitString(@ProductHeader,' ') t on Name LIKE '%[^a-z]'+dbo.trim(t.Item)+'[^a-z]%'

这应该可以提高性能。

于 2013-06-29T21:16:30.023 回答