我想在“Nit”上删除重复值,但在日期“Date”为 31-12-2018 时保留
Nit sales date
12345 56 31-12-2018
12345 45 31-06-2018
23346 87 31-12-2018
76553 93 31-12-2018
44556 34 31-06-2018
44556 52 31-12-2018
我想在“Nit”上删除重复值,但在日期“Date”为 31-12-2018 时保留
Nit sales date
12345 56 31-12-2018
12345 45 31-06-2018
23346 87 31-12-2018
76553 93 31-12-2018
44556 34 31-06-2018
44556 52 31-12-2018
我们试试看:
(df.assign(valid_date=df['date']=='31-12-2018')
.sort_values('valid_date', ascending=False)
.drop_duplicates('Nit')
.sort_index()
.drop('valid_date', axis=1)
)
输出:
Nit sales date
0 12345 56 31-12-2018
2 23346 87 31-12-2018
3 76553 93 31-12-2018
5 44556 52 31-12-2018
注意:一个简单的
df[df['date']=='31-12-2018']
可以做你想做的。