sql-server - Python 将 UTF-8 推文编码为 UCS-2 以供 SQL Server 加载

Question

我正在尝试将推文存储在 SQL Server 中，它们是 UTF-8。显然 SQL Server 2012 不会将 UTF-8 存储在 nvarchar 中。相反，SQL Server 建议根据此使用 UCS-2。

我的整个脚本在 Python 3.3 中，试图将一系列 .json 文件转换为单个表格文件，然后批量加载它。

with open(fileName, "a+",encoding='utf-16') as the_file:
    writer = csv.writer(the_file, delimiter='\t', lineterminator='\n')
    for file in os.listdir(input):
        jsonData = open(input+file)
        data = json.load(jsonData)
        for tweetObject in data:
            #parseData here...
            writer.writerow(tweetData)
        jsonData.close()

现在很明显，UCS-2 不是默认编码，那么我从哪里得到它呢？我是否需要对文件中的每一行 UTF-8 进行编码，或者如果我将文件设置为使用 USC-2，它会自动进行编码吗？我在谷歌上看到了大量关于如何解决读取这种编码的问题，但没有看到关于如何使用它进行编码的内容。

如果您有其他建议，我愿意接受。谢谢！

编辑：更新的代码有工作代码！

score 0 · Accepted Answer

这行得通！

如何在 SQL Server 中使用批量插入写入 UTF-8 字符？

基本上我需要将输入文件转换为 utf-16 并使用 nvarchar 列。

sql-server - Python 将 UTF-8 推文编码为 UCS-2 以供 SQL Server 加载

1 回答 1

Related

Reference