python - 熊猫：独特的数据框

Question

我有一个重复行的 DataFrame。我想获得一个具有唯一索引且没有重复项的 DataFrame。可以丢弃重复的值。这可能吗？这会是一个完成groupby吗？

score 78 · Accepted Answer

78

In [29]: df.drop_duplicates()
Out[29]: 
   b  c
1  2  3
3  4  0
7  5  9

于 2012-09-07T18:37:39.740 回答

score 11 · Accepted Answer

通过阅读split-apply-combine文档示例找到了一种方法。

df = pandas.DataFrame({'b':[2,2,4,5], 'c': [3,3,0,9]}, index=[1,1,3,7])
df_unique = df.groupby(level=0).first()

df
   b  c
1  2  3
1  2  3
3  4  0
7  5  9

df_unique
   b  c
1  2  3
3  4  0
7  5  9

python - 熊猫：独特的数据框

2 回答 2

Related

Reference