我有以下熊猫 DataFrame df:
import pandas as pd
mydictionary = {'id': ['11X', '11X', '22X', '33A'],
'grade': [68, 74, 77, 78],
'checkdate': ["2019-12-26", "2019-12-27", "2019-12-26", "2019-12-25"]}
df = pd.DataFrame(mydictionary)
我想在保留最新条目的同时对值进行排序checkdate并删除重复项。id
预期的结果是这样的:
id grade checkdate
11X 74 2019-12-27
22X 77 2019-12-26
33A 78 2019-12-25
我知道如何对值进行排序:
df.sort_values("checkdate")
另外,我知道如何删除重复项:
df.drop_duplicates(subset=["id"], keep='first', inplace=True)
但是如何把这两件事放在一起呢?