我正在尝试在 Python pandas 中做一些数据工作,但在写出我的结果时遇到了麻烦。我将我的数据作为 CSV 文件读取,并将每个脚本导出为它自己的 CSV 文件,它工作正常。最近虽然我尝试使用工作表将所有内容导出到 1 个 Excel 文件中,但其中一些工作表给了我一个错误
“'utf8' 编解码器无法解码位置 1 中的字节 0xe9:无效的继续字节”
我什至不知道如何开始查找可能导致导出到 Excel 出现问题的任何字符。不知道为什么它导出到 CSV 就好了:(
相关线路
from pandas import ExcelWriter
data = pd.read_csv(input)
writer = ExcelWriter(output) #output is just the filename
fundraisers.to_excel(writer, "fundraisers")
locations.to_excel(writer, "locations") #error
locations.to_csv(outputcsv) #works
writer.save()
违规数据帧的打印头
Event ID Constituent ID Email Address First Name \ Last Name
f 1 A A 1
F 4 L R C
M 1 1 A D
F 4 A A G
M 2 0 R G
M 3 O O H
M 2 T E H
M 2 A A H
M 2 M M K
F 3 J E K
Location ID raised raised con raised email
a 0 0 0
a 8 0 0
o 0 0 0
o 0 0 0
o 0 0 0
t 5 0 0
o 1 0 0
o 6 a 0
o 6 0 0
d 0 0 0
看着excel表,我确实得到了部分打印出来。名字列及以后的任何内容都是空白的,但事件、组成部分和电子邮件都会打印出来。
编辑:尝试以 utf8 格式读取 csv 失败,但以 latin1 格式读取它。有没有办法指定 to_excel 编码?或者将我的数据帧解码并编码为 utf8?