我的编码有问题。
我的csv 文件(编码 UTF-8):
Id,Title,FullDescription
55408086,注塑产品设计师,• 模具经验是优势• 汽车经验是必须的
和我的python代码(简化):
# -*- coding: utf-8 -*-
import csv
import codecs
with codecs.open('D:\\Downloads\\Train_rev2.csv', 'rb', encoding='utf-8') as csv_file:
data = csv.reader(csv_file, delimiter=',')
data.next()
for row in data:
print (row[0], row[1], row[2])
这打印:
('55408086', '注塑产品设计师', '\xe2\x80\xa2 模具经验是优势\xe2\x80\xa2 汽车经验是必须的')
然后我将数据插入数据库(使用UTF-8 Unicode(utf8)编码的MYSQL),我得到的数据编码错误:
55408086,Injection Moulding Product Designer,• Tooling experience is an advantage • Automotive experience is as must