我read_csv
用来将 CSV 文件读入 Pandas 数据帧。我的 CSV 文件包含大量小数/浮点数。这些数字使用欧洲十进制表示法编码:
1.234.456,78
这意味着'.' 用作千位分隔符,',' 是小数点。
熊猫 0.8。提供一个read_csv
名为“千”的参数来设置千位分隔符。还有一个额外的论点来提供小数点吗?如果不是,解析欧式十进制数的最有效方法是什么?
目前我正在使用字符串替换,我认为这是一个显着的性能损失。我使用的编码是这样的:
# Convert to float data type and change decimal point from ',' to '.'
f = lambda x: string.replace(x, u',', u'.')
df['MyColumn'] = df['MyColumn'].map(f)
任何帮助表示赞赏。