0

我有一个 CSV 文件。对列进行一些更改后,我想将其导出为新的 CSV 文件。这是我的代码:

gpa_full = pd.read_csv("gpo_full.csv")
gpa_full["held_date"] = gpa_full["held_date"].str.replace("\r", "")
gpa_full["held_date"] = gpa_full["held_date"].str.replace("\t", "")

pandas DataFrame 中的一切都很好,但是在将其转换为 csv 文件后,

gpa_full.to_csv("gpa_full.csv", encoding='utf-8')

我得到了很多这样的额外行: 在此处输入图像描述

line1  line2  members   link   title   url 
1.     1.     Bob, Sharon, Susan, Helen
//www.govinfo.gov/content/pkg/CHRG-106shrg74729/html/CHRG-106shrg74729.htm, Protecting Privacy, url

链接在下一行。更具体地说,成员之后的列的内容都在下一行。

我试图读取 csv 文件以发现问题

pd.read_csv("gpa_full.csv")

我收到错误,它显示:
ParserError:错误标记数据。C 错误:捕获缓冲区溢出 - 可能是格式错误的输入文件。
我怎样才能解决这个问题?谢谢!!!

4

1 回答 1

1

首先尝试导出为 Excel 格式:

gpa_full.to_excel("gpa_full.xlsx", encoding='utf-8')

如果您想要一个 csv 文件,请尝试更改分隔符sep

gpa_full.to_csv("gpa_full.csv", sep='\t', encoding='utf-8')
于 2021-07-14T05:40:26.117 回答