假设我的数据已经分组,我该如何计算中位数和其他统计数据?
Index Value Count
0 6 2
1 2 3
2 9 8
在上面的示例中,我想获得列值的中值/平均值等,同时考虑到列“计数”
实际值为 2,2,2,6,6,9,9,9,9,9,9,9,9,所以我的中位数为 9。
假设我的数据已经分组,我该如何计算中位数和其他统计数据?
Index Value Count
0 6 2
1 2 3
2 9 8
在上面的示例中,我想获得列值的中值/平均值等,同时考虑到列“计数”
实际值为 2,2,2,6,6,9,9,9,9,9,9,9,9,所以我的中位数为 9。
IIUC,你可以做到平均水平
print ((df['Value']*df['Count']).sum()/df['Count'].sum())
6.923076923076923
对于中位数,使用np.repeat
print (np.repeat(df['Value'], df['Count']).median())
9.0