3

我是一个自学成才、能力模糊的 SQL 用户。对于我正在写的一个观点,我正在尝试开发一个“条件LEFT”字符串拆分命令(大概稍后会被一个“条件RIGHT”加入 - 其中:

  • 如果一个字符串(我们称之为'haystack')包含一个特定的模式(我们称之为'needle'),它将被修剪到该模式的左侧
  • 否则,整个字符串将原封不动地传递。

所以,如果我们的模式是' - ',

  • 'A long string - contains the pattern' 将输出为 'A long string'
  • “没有模式的字符串”将按原样返回。

我没有使用最粗暴的方法来做到这一点,而是试图提出一种避免重复任何子句(例如 if 0 < CHARINDEX,然后 take CHARINDEX- 1 等)的方法,而是利用条件NULLing。

然而——这就是我尝试创造性所得到的——我遇到了一个看似非常基本的绊脚石。请注意下面的代码和结果,让我知道你是否可以复制它 - 因此它是一个错误还是我错过了一些特殊的东西。我已经在 SQL Server 2008 R2 和 2014(两个 Express 版本)上对此进行了测试。

select
    -- ISNULL: returns 'a big old string'
    ISNULL(null, 'a big old string'),

    -- NULLIF: returns NULL
    left(
        'a big old string',
        nullif
        (
            CHARINDEX
            (
                'needle',
                'haystack'
            ), 0
        ) - 1
    ),

    -- combined: returns just 'a' (1st character of ISNULL condition)
    ISNULL(
        left
        (
            'a big old string', -- the input string. In reality, this would be a column alias, etc.
            nullif
            (
                CHARINDEX       -- Search for the splitting pattern
                (
                    'needle',
                    'haystack'
                ), 0            -- If it's not found, return NULL instead of the usual 0
            ) - 1               -- so that this subtraction produces a NULL, not an invalid negative index
        ),
        'a big old string'      -- If the pattern was not found, we should return the input unaltered
    );

/*
---------------- ---- ----
a big old string NULL a

(1 row(s) affected)
*/

为什么这 2 个子句在孤立的情况下按预期工作,但是当我将它们组合在一起时,而不是得到它们的效果的总和,我只得到字符串的第一个字符- ISNULL'a'?

是否有某种隐含CAST的 to varchar(1)?故意cast不做varchar(max)任何改变。这里还能发生什么?

我只是在做一些非常愚蠢的事情吗?因为从这里,我无法弄清楚我做错了什么,所以它看起来真的像一个错误。我希望 2014 年的测试能够证明它是旧 2008 R2 中的一个错误,但是,唉,它们的行为相同(或者更确切地说,不一样)。

在此先感谢您,希望能将我从可能是一个令人困惑的生存危机之夜中解救出来。

4

3 回答 3

5

isnull这是和--之间的区别coalesce,因为 isnull 的第一个参数是 char(1),这将是语句返回值的类型。使用合并,您将获得正确的结果。

为空

返回与 check_expression 相同的类型。如果提供文字 NULL 作为 check_expression,则返回 replacement_value 的数据类型。如果提供了文字 NULL 作为 check_expression 并且没有提供 replacement_value,则返回一个 int。

合并

返回具有最高数据类型优先级的表达式的数据类型。如果所有表达式都不可为空,则结果类型为不可空。

于 2015-07-13T16:48:23.653 回答
3

这个问题有两个部分,首先是ISNULL运算符的性质,它将使用第一个参数的数据类型和长度。一个简单的例子是:

DECLARE @A CHAR(1) = NULL,
        @B VARCHAR(MAX) =  'This is a test';

SELECT TOP 1 Test = ISNULL(@A, @B);

这将返回T并检查执行计划 XML,我们可以看到 to 的隐式"This is a Test"转换CHAR(1)

<ScalarOperator ScalarString="isnull([@A],CONVERT_IMPLICIT(char(1),[@B],0))">
    <Intrinsic FunctionName="isnull">
    <ScalarOperator>
        <Identifier>
        <ColumnReference Column="@A" />
        </Identifier>
    </ScalarOperator>
    <ScalarOperator>
        <Convert DataType="char" Length="1" Style="0" Implicit="true">
        <ScalarOperator>
            <Identifier>
            <ColumnReference Column="@B" />
            </Identifier>
        </ScalarOperator>
        </Convert>
    </ScalarOperator>
    </Intrinsic>
</ScalarOperator>

您的示例不是那么简单,因为您没有像上面那样很好地定义您的类型,但是如果我们确实定义了数据类型:

DECLARE @A VARCHAR(MAX) =  'a big old string',
        @B VARCHAR(MAX) = 'needle',
        @C VARCHAR(MAX) = 'haystack';

SELECT TOP 1 ISNULL(LEFT(@A, NULLIF(CHARINDEX(@B, @C), 0) - 1), @A);

我们得到了预期的结果。所以在幕后发生了其他事情。查询计划并未深入研究常量评估的内部工作原理,但以下内容展示了正在发生的事情:

SELECT  Test = LEFT('a big old string', NULLIF(CHARINDEX('needle', 'haystack'), 0) - 1)
INTO    #T;

SELECT  t.name, c.max_length
FROM    tempdb.sys.columns AS c
        INNER JOIN sys.types AS t
            ON t.system_type_id = c.system_type_id
            AND t.user_type_id = c.user_type_id
WHERE   [object_id] = OBJECT_ID(N'tempdb..#T');

----------------
name        max_length
varchar     1

基本上,通过将SELECT INTO语法与左表达式一起使用,表明当将 NULL 长度传递给LEFT结果数据类型时 a 是VARCHAR(1)但是,情况并非总是如此。如果我只是硬编码NULLLEFT函数中:

SELECT  Test = LEFT('a big old string', NULL)
INTO    #T;

--------------------
name        max_length
varchar     16

然后你得到传递的字符串的长度,但是一个应该优化为相同事物的 case 表达式再次产生长度 1:

SELECT  TOP 1 Test = LEFT('a big old string', CASE WHEN 1 = 1 THEN NULL ELSE 1 END)
INTO    #T;

----------------
name        max_length
varchar     1

我怀疑它与 的默认行为有关VARCHAR,默认长度为 1,例如:

DECLARE @A VARCHAR = 'This is a Test';

SELECT  Value = @A,                                         -- T
        MaxLength = SQL_VARIANT_PROPERTY(@A, 'MaxLength')   -- 1

但我不能告诉你为什么你会看到NULL和的不同行为CASE WHEN 1 = 1 THEN NULL ELSE 1 END。如果您想了解持续评估中发生的情况,我认为您可能需要在 DBA 站点上重新询问,并希望真正的 SQL Server 大师之一能够接受它。

总之,LEFT(<constant>, <constant expression>)其中<constant expression>yieldNULL被隐式类型化为VARCHAR(1),并且这种隐式类型用于ISNULL评估。

对于它的价值,如果您显式键入LEFT函数的结果,那么您会得到预期的结果:

SELECT ISNULL(
            CAST(
                LEFT(
                    'a big old string', 
                    NULLIF(CHARINDEX('needle', 'haystack'), 0) - 1
                    ) 
                AS VARCHAR(MAX))
                , 'a big old string');

另外一点是,当你说你不想重复任何表达式时(如果 0 < CHARINDEX,则取 CHARINDEX - 1 等),有两件事你应该知道,第一是NULLIF(<expression>, <value>)扩展为 case 表达式- CASE WHEN <expression> = <value> THEN NULL ELSE <expression> END,所以是重复的,第二个是这无关紧要,SQL Server 可以识别出这是同一个表达式使用了两次,并且每次使用都会计算一次并引用相同的结果。

于 2015-07-13T17:23:15.697 回答
0

在我看来,你把一件简单的事情复杂化了。

这个 sql 代码应该做你所描述的:

Declare @SomeString varchar(max) = 'asdf asdf - cvbncvbn',
        @Needle varchar(100) = '-'


DECLARE @NeedlePattern varchar(102) = '%' + @Needle + '%'

SELECT CASE WHEN PATINDEX(@NeedlePattern, @SomeString) > 0 THEN
         LEFT(@SomeString, PATINDEX(@NeedlePattern, @SomeString) - LEN(@NeedlePattern)+1)
       ELSE
         @SomeString
       END

在此处查看 sql fiddle

于 2015-07-13T16:51:45.020 回答