2

我有一张这样的桌子:

account   |   check1          |   check2
1         |   100]200]300     |   101]209]305
2         |   401]502         |   404]511
3         |   600             |   601

我想将记录分成如下内容:

account   |   check1     |   check2
1         |   100        |   101
1         |   200        |   209
1         |   300        |   305
2         |   401        |   404
2         |   502        |   511
.         |     .        |    .
.         |     .        |    .
.         |     .        |    .

如何仅使用 SQL Server执行此操作?

谢谢,

4

2 回答 2

5

首先,您需要一个拆分函数,该函数可以让您确定结果中的顺序。这是一个使用 IDENTITY 列的多语句 TVF

CREATE FUNCTION dbo.SplitStrings
(
    @List       NVARCHAR(MAX),
    @Delimiter  NVARCHAR(255)
)
RETURNS @t TABLE(ID INT IDENTITY(1,1), Item INT)
AS
BEGIN
    INSERT @t(Item) SELECT SUBSTRING(@List, Number, 
        CHARINDEX(@Delimiter, @List + @Delimiter, Number) - Number)
    FROM (SELECT ROW_NUMBER() OVER (ORDER BY [object_id])
        FROM sys.all_objects) AS n(Number)
    WHERE Number <= CONVERT(INT, LEN(@List))
        AND SUBSTRING(@Delimiter + @List, Number, 1) = @Delimiter
    ORDER BY Number OPTION (MAXDOP 1);

    RETURN;
END
GO

(如果您有一个 Numbers 表,您可以使用它而不是子查询,这也将允许您将 WITH SCHEMABINDING 添加到函数的定义中,这提供了潜在的性能优势。)

使用该功能后,根据您提供的数据和所需的结果,这里是示例用法:

DECLARE @x TABLE(account INT, check1 NVARCHAR(1000), check2 NVARCHAR(1000));

INSERT @x SELECT 1, '100]200]300','101]209]305'
UNION ALL SELECT 2, '401]502','404]511'
UNION ALL SELECT 3, '600','601'
UNION ALL SELECT 4, '205]104','304]701'; -- I added this sanity check

SELECT account, check1 = s1.Item, check2 = s2.Item
FROM @x AS x
CROSS APPLY dbo.SplitStrings(x.check1, ']') AS s1
CROSS APPLY dbo.SplitStrings(x.check2, ']') AS s2
WHERE s1.ID = s2.ID
ORDER BY account, s1.ID;

结果:

account  check1  check2
-------  ------  ------
1        100     101
1        200     209
1        300     305
2        401     404
2        502     511
3        600     601
4        205     304
4        104     701

这假设您具有某种验证/强制措施,即 check1 和 check2 列中的相应值将始终具有相同数量的值。它还假设任何 check1 / check2 值都不会超过大约 7,000 个字符(同样,数字表可以帮助使其更加灵活)。

编辑

在 AndriyM 的评论之后,我想回来重新访问它,主要是为了提供上述功能的一个版本,它可以在不使用多语句 TVF 的情况下工作。这使用了 Andriy 的想法 ROW_NUMBER() 可以使用。

CREATE FUNCTION dbo.SplitStrings
(
    @List       NVARCHAR(MAX),
    @Delimiter  NVARCHAR(255)
)
RETURNS TABLE
AS
    RETURN (SELECT Number = ROW_NUMBER() OVER (ORDER BY Number),
        Item FROM (SELECT Number, Item = LTRIM(RTRIM(SUBSTRING(@List, Number, 
        CHARINDEX(@Delimiter, @List + @Delimiter, Number) - Number)))
    FROM (SELECT ROW_NUMBER() OVER (ORDER BY [object_id])
        FROM sys.all_objects) AS n(Number)
    WHERE Number <= CONVERT(INT, LEN(@List))
        AND SUBSTRING(@Delimiter + @List, Number, 1) = @Delimiter
    ) AS y);
GO
于 2012-06-06T05:11:10.107 回答
0

@Aaron Bertrand 对于第二列“check2”中具有空值的记录,如下所示:

Account | Check1      | Check2

001     | 100]200     | ]

002     | 300]400     | Null

003     | 500]600]700 | ]]

您的函数不会像这样返回值:

Account | Check1      | Check2

001     | 100         | 

001     | 200         | 

002     | 300         | Null

002     | 400         | Null

003     | 500         |

003     | 600         | 

003     | 700         |

如何改进函数以处理最后一个分隔符后的空值或空字符串?

于 2012-06-29T13:21:02.917 回答