我有一个包含两列的数据框,如下所示,
DT_EX = dt.Frame({'film':['Don','Warriors','Dragon','Chicago','Lion','Don','Chicago','Warriors'],
'gross':[400,500,600,100,200,300,900,1000]})
在第一种情况下,我想过滤其电影是 Don 或 Chicago 的观察结果,如下面的代码所示,
DT_EX[((f.film=="Don") | (f.film=="Chicago")),:]
在一秒钟内,我会为 3 个值应用过滤器,
DT_EX[((f.film=="Don") | (f.film=="Chicago") | (f.film=="Lion")),:]
如果过滤超过 5 或 10 个值,我们应该为这些值做一个逻辑表达式,这肯定是一项耗时的任务。
有什么数据表方法可以更快地完成它吗?就像 R 中有一些%in%
%chin%
过滤选项一样data.table
。