1

我希望能够过滤 DataFrame 并将列列表所在的行保留在选择列表中。

df = DataFrame({'A' : [5,6,3,4], 'B' : [1,2,3,5], 'C': range(4)})

输入:

df
   A  B  C
0  5  1  0
1  6  2  1
2  3  3  2
3  4  5  3

filter_list = [(6,2),(3,3)]

预期结果:

df
   A  B  C
1  6  2  1
2  3  3  2

我尝试过使用 loc 和 map,但我没有找到解决方案。

提前致谢。

4

3 回答 3

3
In [34]: df = DataFrame({'A' : [5,6,3,4], 'B' : [1,2,3,5], 'C': range(4)})

In [35]: df
Out[35]: 
   A  B  C
0  5  1  0
1  6  2  1
2  3  3  2
3  4  5  3

创建元组位置的布尔索引器,然后从框架中选择这些行

In [36]: df.loc[Series(zip(df.A,df.B)).isin([(6,2),(3,3)])]
Out[36]: 
   A  B  C
1  6  2  1
2  3  3  2

在 0.13(即将发布!)中,您可以这样做,文档在这里

In [37]: df.isin({ 'A' : [6,3], 'B' : [2,3] })
Out[37]: 
       A      B      C
0  False  False  False
1   True   True  False
2   True   True  False
3  False  False  False

In [38]: indexer = df.isin({ 'A' : [6,3], 'B' : [2,3] })

In [39]: indexer[['A','B']].all(1)
Out[39]: 
0    False
1     True
2     True
3    False
dtype: bool

In [40]: df.loc[indexer[['A','B']].all(1)]
Out[40]: 
   A  B  C
1  6  2  1
2  3  3  2
于 2013-11-14T15:27:51.160 回答
2

使用适用:

>>> fltr =  df.apply(lambda x: (x["A"], x["B"]) in {(6,2),(3,3)}, axis=1)
# 0    False
# 1     True
# 2     True
# 3    False
# dtype: bool
>>> df[fltr]
   A  B  C
1  6  2  1
2  3  3  2
于 2013-11-14T15:10:45.223 回答
1

一位同事通过创建过滤 DataFrame 为我提供了一个更快的大 DataFrame 解决方案:

from pandas import merge, DataFrame
df = DataFrame({'A' : [5,6,3,4], 'B' : [1,2,3,5], 'C': range(4)})
filter_list = [(6,2),(3,3)]
filter_df = DataFrame(filter_list, columns=['A','B'])
filtr = merge(df, filter_df, on=["A","B"], how="inner")
于 2013-11-14T16:20:52.567 回答