假设我们有一个如下的数据框:
df = pd.DataFrame({ 'Col1' : ['a', 'a', 'a', 'a', 'b', 'b', 'c', 'c'],
'col2' : ['0.5', '0.78', '0.78', '0.4', '2', '9', '2', '7',]
})
我计算了 中所有唯一值的行数col1
。Likea
有 4 行,每b
行c
有 2 行,方法是:
df.groupby(['Col1']).size()
我得到的输出为
Col1
a 4
b 2
c 2
dtype: int64
完成此操作后,我想检查 a、b、c 中哪一个具有最大行数(在这种情况下,a
具有最大行数),b
并c
用最大值与他们拥有的行,带有零(两者都有 2 行,b
并且由于 4 是最大行数,c
我想填充2 个更多的零)。最后必须添加零。b
c
我想用零填充它,因为我想在所有变量(a、b、c)上应用一个固定大小的窗口来绘制图形。