2

我需要一些帮助来在数据框中形成一个新变量我有一个非常大的数据集,如果我想从另一列中的现有数据中创建一个新变量。这是一个例子。

>>> df
   A  B   
0  a  1  
1  b  2  
2  c  3  
3  a  5  
4  d  6  

我想用 A 中的值 a 和 c 创建一个新列,并将它们命名为 ac,将 b 和 d 命名为 bd 最终结果应该如下所示。将它们从 A 分组,并在新列中为该组指定一个新名称。

>>> df
   A  B   C
0  a  1  ac
1  b  2  bd
2  c  3  ac
3  a  5  ac
4  d  6  bd

/乔纳斯

4

1 回答 1

1
In [4]: mapper = dict(a = 'ac', b = 'bd', c = 'ac', d = 'bd')

In [5]: df['C'] = [ mapper[x] for x in df['A'] ]

In [6]: df
Out[6]: 
   A  B   C
0  a  1  ac
1  b  2  bd
2  c  3  ac
3  a  5  ac
4  d  6  bd
于 2013-06-29T15:01:10.527 回答