40

df我有一个名为的DataFrame

  Order Number       Status
1         1668  Undelivered
2        19771  Undelivered
3    100032108  Undelivered
4         2229    Delivered
5        00056  Undelivered

我想将该Status列转换为布尔值(True当状态已交付和状态未交付False时),但如果状态既不是“未交付”也不是“已交付”,它应该被视为NotANumber或类似的东西。

我想使用字典

d = {
  'Delivered': True,
  'Undelivered': False
}

所以我可以很容易地添加其他可以被视为True或的字符串False

4

4 回答 4

58

您可以使用map

In [7]: df = pd.DataFrame({'Status':['Delivered', 'Delivered', 'Undelivered',
                                     'SomethingElse']})

In [8]: df
Out[8]:
          Status
0      Delivered
1      Delivered
2    Undelivered
3  SomethingElse

In [9]: d = {'Delivered': True, 'Undelivered': False}

In [10]: df['Status'].map(d)
Out[10]:
0     True
1     True
2    False
3      NaN
Name: Status, dtype: object
于 2013-07-17T14:41:08.097 回答
16

replace仅替换指定列中的值C2并将结果作为DataFrame类型获取的方法示例。

import pandas as pd
df = pd.DataFrame({'C1':['X', 'Y', 'X', 'Y'], 'C2':['Y', 'Y', 'X', 'X']})

  C1 C2
0  X  Y
1  Y  Y
2  X  X
3  Y  X

df.replace({'C2': {'X': True, 'Y': False}})

  C1     C2
0  X  False
1  Y  False
2  X   True
3  Y   True
于 2017-03-18T07:38:48.947 回答
6

你有你需要的一切。你会很高兴地发现replace

df.replace(d)
于 2013-07-17T14:38:45.590 回答
4

扩展之前的答案:

地图方法解释:

  • Pandas 将在相应的d字典中查找每一行的值,将找到的任何键替换为d.
  • 没有键的值d将被设置为NaN。这可以通过fillna()方法来纠正。
  • 不适用于多列,因为 pandas 通过pd.Series此处的序列化操作。
  • 文档:pd.Series.map
d = {'Delivered': True, 'Undelivered': False}
df["Status"].map(d)

替换方法说明:

  • Pandas 将在相应的d字典中查找每一行的值,并尝试将找到的任何键替换为d.
  • 没有键的值d将被保留。
  • 适用于单列和多列(pd.Seriespd.DataFrame对象)。
  • 文档:pd.DataFrame.replace
d = {'Delivered': True, 'Undelivered': False}
df["Status"].replace(d)

总体而言,replace 方法更健壮,可以更好地控制数据的映射方式以及如何处理缺失值或 nan 值。

于 2020-05-10T19:03:37.560 回答