python - 使用索引+行匹配从数据框中删除重复项

Question

我有两个pandas DataFrames，我想将它们连接在一起，这样我就可以在外部连接中删除重复项。我的问题是.drop_duplicates()在查找重复项时忽略索引。如果索引不同，则不应重复。如果行索引和列重复，如何删除重复项？我唯一能想到的就是使用df.to_dict()然后创建一个新的 DataFrame（非常低效）。

更新：

根据要求，这里是我的数据示例：

from pandas import *
index1 = ['2012-05-2' + str(i) for i in range(0,6)]
data1 = {'rate': range(0,6)}
a = DataFrame(data1, index1)

index2 = ['2012-05-2' + str(i) for i in range(3,9)]
data2 = {'rate': range(3,9)}
b = DataFrame(data2, index2)

格伦

score 1 · Accepted Answer

1

解决方案：

a.combine_first(b)

谢谢韦斯。

于 2012-05-29T04:43:14.060 回答

python - 使用索引+行匹配从数据框中删除重复项

1 回答 1

Related

Reference