我收到了一个包含购买数据的 csv 文件,但它有一个问题:它有 4 列,全部用逗号分隔,但其中一列有价格,其中有许多值,逗号用作小数分隔符。所以最后当我试图读取文件时,它会将这些行读取为有 5 列并遇到错误。像这样的东西:
transaction id,user id,purchase price,purchase date
1009497,490408,10,41674
1077573,490408,8,95,41676
所以pd.read_csv
能够读取标签,读取第一行,但它停在第二行,因为它认为我给它 5 列而不是 4 列。修复我的数据的最有效方法是什么?无法手动将所有小数分隔符从逗号更改为点。
更新:我正在考虑将每一行读取为字符串,然后计算每行中的逗号,如果它有 4 个逗号,那么我将使用正则表达式将该逗号周围的数据替换为“ . ”而不是“ , ”