1

我刚刚完成了一个项目,我将来自 34 个非规范化数据源的数据聚合到一个规范化 SQL Server 2008 数据库中。

唯一的问题是......来自这些数据源的较大文本字段已经失去了一些保真度,并且现在始终显示 Unicode 控制字符(其中很多)。

这是我用来从制表符分隔的 *.txt 文件之一导入数据的代码:

BULK INSERT MyTabeNameHere
        FROM 'C:\FILE\PATH\HERE\FileNameHere.txt'       
        WITH
        (
            FIELDTERMINATOR = '\t',
            ROWTERMINATOR = '\n',
            FIRSTROW = 2
        )

示例数据可能是:

Lorem ipsum ò dolor sit amet
ááá Lorem ipsum dolor sit amet
Lorem ipsum dolor sit amet
Lorem ipsumû dolor sit amet
Lorem ipsum dolor sit aÆmet

我想通过一个 SQL 函数运行这些数据并输出这个......

所需的输出将是:

Lorem ipsum dolor sit amet
Lorem ipsum dolor sit amet
Lorem ipsum dolor sit amet    
Lorem ipsum dolor sit amet
Lorem ipsum dolor sit amet

提前致谢!

4

1 回答 1

0

在这种情况下,还有其他批量插入选项可能会有所帮助,例如:

DATAFILETYPE = 'widechar' -- and others

或者

CODEPAGE = 'ACP' -- and others

将批量操作从 SQL 2000 移动到 2008时,我不得不放弃对格式文件的使用,并包括 widechar 作为获得正确输出的选项。不过,我对你的困境还不够熟悉,不知道这是否对你有用。

[...] 34 个未标准化的数据源 [...]

正如批量文档所提到的,了解您正在读取的文件类型(ascii、ansi 等)很重要。

于 2012-09-20T14:51:32.920 回答