3

我正在尝试找到从 SQL 中的 varchar 中删除非数字数据的最佳方法,例如

'(082) 000-0000' to '0820000000' or
'+2782 000 0000' to '0820000000'

困难在于我并不总是确定会出现什么数字格式,如上所示,所以我希望本质上不是数字的所有内容都被删除。

更新:
从你们所说的来看,这是一个小小的峰值:

declare @Num varchar(20)

set @Num = ' + (82) 468 6152 '

--strip nonnumrical data out of @num

print @Num

set @Num = replace(@Num, ' ', '')
set @Num = replace(@Num, '+', '')
set @Num = replace(@Num, '-', '')
set @Num = replace(@Num, '(', '')
set @Num = replace(@Num, ')', '')

print @Num

但是无法正确获取替换 [^0-9] 表达式。

4

4 回答 4

4

如果您使用的是 SQL Server 2005 或更新版本,那么您最好的选择是创建一个用户定义的 CLR 函数并使用正则表达式来删除所有非数字字符。

如果您不想使用 CLR 函数,那么您可以创建一个标准的用户定义函数。这将完成这项工作,尽管它不会那么有效:

CREATE FUNCTION dbo.RemoveNonNumerics(@in VARCHAR(255))
RETURNS VARCHAR(255)
AS
BEGIN
    DECLARE @out VARCHAR(255)

    IF (@in IS NOT NULL)
    BEGIN
        SET @out = ''

        WHILE (@in <> '')
        BEGIN
            IF (@in LIKE '[0-9]%')
                SET @out = @out + SUBSTRING(@in, 1, 1)

            SET @in = SUBSTRING(@in, 2, LEN(@in) - 1)
        END
    END

    RETURN(@out)
END

然后像这样从你的表中选择:

SELECT dbo.RemoveNonNumerics(your_column) AS your_tidy_column
FROM your_table
于 2009-03-10T14:52:13.927 回答
1

看看这篇文章(这是第 8 篇文章 - 第一篇 LONG 文章),它详细介绍了如何在 SQL Server 中使用正则表达式。它不是最快的(在你使用 SQL 之前会这样做),但它提供了一种体面的方法来做到这一点。

于 2009-03-10T14:33:52.303 回答
0

在业务层处理字符串解析要容易得多。但是,使用 T-SQL REPLACE() 函数(假设 MS SQL)。

您可以使用该函数对传入的参数执行一个循环,以从中删除所有非数字字母。

于 2009-03-10T14:33:30.290 回答
0

我发现最有效和最灵活的是使用数字/计数表方法,如 2009 年 3 月 10 日 mwigdahl 的回答所示

即允许列表比您在上面问题底部放置的不允许列表更安全。

你没有说的是你如何处理非整数......你如何处理小数点?

于 2011-01-19T14:05:17.910 回答