1

具体来说,假设我有一个这样的 DataFrame:

appid  mac_id  count

1      a        1 

2      b        1

2      c        1

3      d        1

3      e        1

而且我还有一个:

mac_list = ['b', 'd', 'e']

我想将此数据框分组到 appid 和每个组过滤器mac_id(如果它位于mac_list. 最后,每个组的总和(计数)。

对于这个 DataFrame,结果是:

appid   count

1         0

2         1

3         2

我怎样才能用熊猫做到这一点?

4

1 回答 1

7
>>> df = pd.DataFrame({"appid": [1,2,2,3,3], "mac_id": ['a', 'b', 'c', 'd', 'e'], "count": [1,1,1,1,1]})
>>> summer = lambda x: x[x["mac_id"].isin(mac_list)].sum()
>>> df.groupby("appid").apply(summer)["count"]
  18 
appid
1        0
2        1
3        2
Name: count, dtype: object
于 2013-07-12T07:34:12.760 回答