2

假设我的数据已经分组,我该如何计算中位数和其他统计数据?

Index  Value  Count
0      6      2
1      2      3
2      9      8

在上面的示例中,我想获得列值的中值/平均值等,同时考虑到列“计数”

实际值为 2,2,2,6,6,9,9,9,9,9,9,9,9,所以我的中位数为 9。

4

1 回答 1

0

IIUC,你可以做到平均水平

print ((df['Value']*df['Count']).sum()/df['Count'].sum())
6.923076923076923

对于中位数,使用np.repeat

print (np.repeat(df['Value'], df['Count']).median())
9.0
于 2020-05-16T23:42:18.617 回答