我正在尝试将推文存储在 SQL Server 中,它们是 UTF-8。显然 SQL Server 2012 不会将 UTF-8 存储在 nvarchar 中。相反,SQL Server 建议根据此使用 UCS-2。
我的整个脚本在 Python 3.3 中,试图将一系列 .json 文件转换为单个表格文件,然后批量加载它。
with open(fileName, "a+",encoding='utf-16') as the_file:
writer = csv.writer(the_file, delimiter='\t', lineterminator='\n')
for file in os.listdir(input):
jsonData = open(input+file)
data = json.load(jsonData)
for tweetObject in data:
#parseData here...
writer.writerow(tweetData)
jsonData.close()
现在很明显,UCS-2 不是默认编码,那么我从哪里得到它呢?我是否需要对文件中的每一行 UTF-8 进行编码,或者如果我将文件设置为使用 USC-2,它会自动进行编码吗?我在谷歌上看到了大量关于如何解决读取这种编码的问题,但没有看到关于如何使用它进行编码的内容。
如果您有其他建议,我愿意接受。谢谢!
编辑:更新的代码有工作代码!