0

我正在尝试将推文存储在 SQL Server 中,它们是 UTF-8。显然 SQL Server 2012 不会将 UTF-8 存储在 nvarchar 中。相反,SQL Server 建议根据此使用 UCS-2。

我的整个脚本在 Python 3.3 中,试图将一系列 .json 文件转换为单个表格文件,然后批量加载它。

with open(fileName, "a+",encoding='utf-16') as the_file:
    writer = csv.writer(the_file, delimiter='\t', lineterminator='\n')
    for file in os.listdir(input):
        jsonData = open(input+file)
        data = json.load(jsonData)
        for tweetObject in data:
            #parseData here...
            writer.writerow(tweetData)
        jsonData.close()

现在很明显,UCS-2 不是默认编码,那么我从哪里得到它呢?我是否需要对文件中的每一行 UTF-8 进行编码,或者如果我将文件设置为使用 USC-2,它会自动进行编码吗?我在谷歌上看到了大量关于如何解决读取这种编码的问题,但没有看到关于如何使用它进行编码的内容。

如果您有其他建议,我愿意接受。谢谢!

编辑:更新的代码有工作代码!

4

1 回答 1

0

这行得通!

如何在 SQL Server 中使用批量插入写入 UTF-8 字符?

基本上我需要将输入文件转换为 utf-16 并使用 nvarchar 列。

于 2014-09-18T18:40:04.413 回答