1

因此,给定一个多索引数据框,我想只返回满足多索引中较低索引所有级别条件的行。这是一个小的工作示例:

df = pd.DataFrame({'a': [1, 1, 2, 2], 'b': [1, 2, 3, 4], 'c': [0, 2, 2, 2]})
df = df.set_index(['a', 'b'])

print(df)

出去:

     c
a b   
1 1  0
  2  2
2 3  2
  4  2

现在,我想返回c > 1. 例如,我想做类似的事情

df[df[c > 1]]

出去:

     c
a b   
1 2  2
2 3  2
  4  2

但我想得到

出去:

     c
a b   
2 3  2
  4  2

关于如何以最有效的方式做到这一点的任何想法?

4

1 回答 1

0

我最终使用groupby

df.groupby(level=0).filter(lambda x: all([c > 1 for v in x['c']]))
于 2015-10-21T17:02:30.193 回答