45

这里非常奇怪的错误:我正在使用 pandas 来合并几个数据框。作为合并的一部分,我必须多次调用 reset_index。但是当我这样做时,它会在第二次或第三次使用 reset_index 时意外崩溃。

这是重现错误的最少代码:

import pandas
A = pandas.DataFrame({
    'val' :  ['aaaaa', 'acaca', 'ddddd', 'zzzzz'],
    'extra' : range(10,14),
})
A = A.reset_index()
A = A.reset_index()
A = A.reset_index()

这是回溯的相关部分:

....
    A = A.reset_index()
  File "/usr/local/lib/python2.7/dist-packages/pandas/core/frame.py", line 2393, in reset_index
    new_obj.insert(0, name, _maybe_cast(self.index.values))
  File "/usr/local/lib/python2.7/dist-packages/pandas/core/frame.py", line 1787, in insert
    self._data.insert(loc, column, value)
  File "/usr/local/lib/python2.7/dist-packages/pandas/core/internals.py", line 893, in insert
    raise Exception('cannot insert %s, already exists' % item)
Exception: cannot insert level_0, already exists

知道这里出了什么问题吗?我该如何解决它?

4

2 回答 2

89

检查 frame.py,看起来 pandas 试图插入列“index”或“level_0”。如果其中一个/两个(??)已经被占用,那么它会抛出错误。

幸运的是,有一个“丢弃”选项。AFAICT,这会删除具有相同名称的现有索引并将其替换为新的重置索引。如果你有一个名为“索引”的列,这可能会给你带来麻烦,但我认为否则你没问题。

“固定”代码:

import pandas
A = pandas.DataFrame({
    'val' :  ['aaaaa', 'acaca', 'ddddd', 'zzzzz'],
    'extra' : range(10,14),
})
A = A.reset_index(drop=True)
A = A.reset_index(drop=True)
A = A.reset_index(drop=True)
于 2012-08-30T19:52:44.037 回答
0

您可以使用 :

A.reset_index(drop=True, inplace=True)

于 2021-03-14T03:42:38.443 回答