5

假设我有一个如下所示的 DataFrame。

      A      B
0    text1   200
1    text2   200
2    text1   400
3    text2   500
4    text1   300
5    text1   600
6    text2   300

我想打印以下输出

     A             B
0    text1,text2   200
2    text1         400
3    text2         500
4    text1,text2   300
5    text1         600

没有顺序,我只想取“A”列的文本标签来匹配“B”列中的值。df.groupby据我所知,这必须完成。无论如何,我的努力还没有成功。希望你能得到我的问题。

4

1 回答 1

9

几乎可以用一个普通的 ol'sum做到这一点:

In [11]: df.groupby('B').sum()
Out[11]:
              A
B
200  text1text2
300  text1text2
400       text1
500       text2
600       text1

您可以使用带有 a的聚合join

In [12]: df.groupby('B').agg(lambda x: ', '.join(x.values))
Out[12]:
                A
B
200  text1, text2
300  text1, text2
400         text1
500         text2
600         text1
于 2013-08-05T11:12:48.263 回答