我正在运行安装Python 2.7
的Pandas 0.11.0
库。
我一直在寻找这个问题的答案,所以我希望比我更有经验的人有一个解决方案。
假设我在 df1 中的数据如下所示:
df1=
zip x y access
123 1 1 4
123 1 1 6
133 1 2 3
145 2 2 3
167 3 1 1
167 3 1 2
例如,使用,df2 = df1[df1['zip'] == 123]
然后df2 = df2.join(df1[df1['zip'] == 133])
我得到以下数据子集:
df2=
zip x y access
123 1 1 4
123 1 1 6
133 1 2 3
我想做的是:
1)从df1
定义/连接的行中删除行df2
或者
2)df2
创建后,删除由以下组成df1
的行(差异?)df2
希望所有这些都是有道理的。如果需要更多信息,请告诉我。
编辑:
理想情况下,将创建如下所示的第三个数据框:
df2=
zip x y access
145 2 2 3
167 3 1 1
167 3 1 2
也就是说,一切都来自df1
not in df2
。谢谢!