我有一个包含几个不同列的数据框,我想将 df[x] = df[y] 的计数相加。
因此,为了举例说明我正在尝试做的事情,我将使用两个示例列。
想象一个带有 FAVORITE_COLORS 列和 COUNTRY 列的 DF。
我想总结这些的所有不同组合,即英格兰有多少次最喜欢的颜色“蓝色”、“黄色”等,并将其存储在 df 中。
所以我想要的输出是
COUNTRY BLUE YELLOW COLOR...
0 England 1232 3312 Sum
1 Hungary 5543 7661 Sum
2 ETC ETC ETC
当我创建一个只包含匹配项的新 df 时,我尝试使用 pandas groupby 和 count,使用 pythons len(df),但它看起来很麻烦,我无法让它正常工作。
关于如何解决这个问题的任何想法?
提前致谢