3

这可能是一个微不足道的查询,但我无法解决。

本质上,我希望能够从下面的数据框中过滤掉嘈杂的推文

<class 'pandas.core.frame.DataFrame'>
Int64Index: 140381 entries, 0 to 140380
Data columns:
text          140381  non-null values
created_at    140381  non-null values
id            140381  non-null values
from_user     140381  non-null values
geo           5493  non-null values
dtypes: float64(1), object(4)

我可以根据不需要的关键字创建一个数据框:

junk = df[df.text.str.contains("Swans")]

但是使用它来查看剩下的内容的最佳方法是什么?

4

2 回答 2

6
df[~df.text.str.contains("Swans")]
于 2013-05-22T10:27:08.493 回答
1

您还可以使用以下两个选项:

选项1:

df[-df.text.str.contains("Swans")]

选项2:

import numpy as np 
df[np.invert(df.text.str.contains("Swans"))]
于 2017-09-05T10:22:40.240 回答