我知道这里有类似的问题和解决方案,但我似乎没有找到确切的解决方案。
想要找到与“除了一个”列相似的行。
所以,
ColumnA ColumnB ColumnC ColumnD ColumnE
1 John Texas USA 115 5
2 Mike Florida USA 66 1
3 John Texas USA 115 4
4 Justin NewYork USA 22 11
所以我试图得到的逻辑是:
for every entry in the dataframe:
if there exists "another" entry with all Columns similar, apart from ColumnE
AND
the value of ColumnE in First entry found "MINUS" the value of ColumnE in second entry found is "LESS" than "1":
Then append the entry to a new DataFrame
到目前为止,我已经使用 df.loc 和 df.duplicated 到达某个地方。问题和数据有点复杂,所以我可以在这里发布代码。
对此的任何帮助将不胜感激。
谢谢,罗伯