我已经通过 Pandas 中的 df.describe() 获得了我的数据框的统计信息。
statistics = df.describe()
我想根据计数过滤统计数据框:
main Meas1 Meas2 Meas3 Meas4 Meas5
sublvl Value Value Value Value Value
count 7.000000 1.0 1.0 582.00 97.000000
mean 30 37.0 26.0 33.03 16.635350
我想得到类似的东西:过滤掉所有计数小于 30 的值,并在新数据框中只显示计数 >30 的列(或者给我一个包含所有计数 > 30 的主要列表)。
对于上面的例子,我想要:
main Meas4 Meas5
sublvl Value Value
count 582.00 97.000000
mean 33.03 16.635350
和[Meas4, Meas5]
我努力了
thresh = statistics.columns[statistics['count']>30]
及其变体。