python - 熊猫将字符串转换为数据框中多列的浮点数

Question

我是熊猫的新手，并试图弄清楚如何将格式化为字符串的多个列转换为 float64。目前我正在做以下事情，但似乎 apply() 或 applymap() 应该能够更有效地完成这项任务......不幸的是，我有点太菜鸟了，无法弄清楚如何做。目前，这些值是格式为字符串的百分比，例如 '15.5%'

for column in ['field1', 'field2', 'field3']:
    data[column] = data[column].str.rstrip('%').astype('float64') / 100

score 12 · Accepted Answer

从 0.11.1 开始（本周发布），replace 有一个新选项可以用正则表达式替换，所以这成为可能

In [14]: df = DataFrame('10.0%',index=range(100),columns=range(10))

In [15]: df.replace('%','',regex=True).astype('float')/100
Out[15]: 
<class 'pandas.core.frame.DataFrame'>
Int64Index: 100 entries, 0 to 99
Data columns (total 10 columns):
0    100  non-null values
1    100  non-null values
2    100  non-null values
3    100  non-null values
4    100  non-null values
5    100  non-null values
6    100  non-null values
7    100  non-null values
8    100  non-null values
9    100  non-null values
dtypes: float64(10)

而且快一点

In [16]: %timeit df.replace('%','',regex=True).astype('float')/100
1000 loops, best of 3: 1.16 ms per loop

 In [18]: %timeit df.applymap(lambda x: float(x[:-1]))/100
1000 loops, best of 3: 1.67 ms per loop

score 2 · Accepted Answer

2

df.applymap(lambda x:float(x.rstrip('%'))/100)

于 2013-05-20T09:28:28.257 回答

score 1 · Accepted Answer

在接受的答案中回答评论：对于特定列，请确保您没有就地进行。

df['Column1'] = df['Column1'].replace('%','',regex=True).astype('float')/100

python - 熊猫将字符串转换为数据框中多列的浮点数

3 回答 3

Related