1

我有一个包含重复条目的 pandas 数据框,我想创建一个tsplotusing seaborn. 我调用drop_duplicates数据框(甚至调用reset_index())但是当我要做情节时,我仍然得到

ValueError: Index contains duplicate entries, cannot reshape

有没有理由drop_duplicates不解决这个问题?

编辑 我什至通过duplicated在删除后调用数据框进行检查,并且所有行都显示False. 正如我所料。

我意识到这里没有什么可做的,我只是想看看我是否缺少一些直观的东西。将尝试创建一个小示例在此处显示,但我的数据集相当大

4

1 回答 1

1

drop_duplicates不适用于索引,但适用于数据框中的值!(所以它寻找重复的行,而不是重复的索引)。

但是您在索引上也有相同的功能(请参阅doc):

df.index.drop_duplicates()

使用生成的索引,您可以重新索引。
另一种选择是将索引添加为列并DataFrame.drop_duplicates在该列上使用。
另一种选择是使用 groupby :(df.groupby(level=0).first()并且您适应first您想要对重复行执行的操作)

于 2014-12-05T13:46:11.533 回答