1053

假设我有以下 Pandas 数据框:

df = DataFrame({'A' : [5,6,3,4], 'B' : [1,2,3, 5]})
df

     A   B
0    5   1
1    6   2
2    3   3
3    4   5

我可以根据特定值进行子集化:

x = df[df['A'] == 3]
x

     A   B
2    3   3

但是如何根据值列表进行子集化?- 像这样:

list_of_values = [3,6]

y = df[df['A'] in list_of_values]

要得到:

     A    B
1    6    2
2    3    3
4

3 回答 3

1806

您可以使用以下isin方法:

In [1]: df = pd.DataFrame({'A': [5,6,3,4], 'B': [1,2,3,5]})

In [2]: df
Out[2]:
   A  B
0  5  1
1  6  2
2  3  3
3  4  5

In [3]: df[df['A'].isin([3, 6])]
Out[3]:
   A  B
1  6  2
2  3  3

并获得相反的用途~

In [4]: df[~df['A'].isin([3, 6])]
Out[4]:
   A  B
0  5  1
3  4  5
于 2012-08-23T19:20:12.243 回答
37

您可以使用方法查询

df.query('A in [6, 3]')
# df.query('A == [6, 3]')

或者

lst = [6, 3]
df.query('A in @lst')
# df.query('A == @lst')
于 2021-05-03T05:07:56.943 回答
4

另一种方法;

df.loc[df.apply(lambda x: x.A in [3,6], axis=1)]

isin方法不同,这在确定列表是否包含 column 的函数时特别有用A。例如,f(A) = 2*A - 5作为函数;

df.loc[df.apply(lambda x: 2*x.A-5 in [3,6], axis=1)]

需要注意的是,这种方法比isin方法慢。

于 2021-05-24T15:08:01.140 回答