0

我正在使用 pandas 函数read_csv来读取没有索引列的 CSV。

read_csv("file.csv", header=1)

我期待 PANDAS 会根据文档为每一行生成一个索引

index_col:列号、列名或列号/名称列表,用作生成的 DataFrame 的索引(行标签)。默认情况下,它将不使用任何列对行进行编号,除非数据列比标题多一个,在这种情况下,第一列被视为索引。

但是,在加载它抛出的文件时,

Exception: Reindexing only valid with uniquely valued Index objects

我不知道为什么会这样。是什么导致了这个异常?

我也尝试过传递skiprowsnrows并且发生了同样的异常。

4

1 回答 1

1

问题是该header参数不是True/False类型参数。相反,它指定标题的行号。由于它被指定为1使用第二行作为标题并考虑到该行包含实际数据,因此这些值不一定是唯一的。

将命令更改为

read_csv("file.csv")

或者

read_csv("file.csv", header=0)

解决问题。这是一个“duh”的时刻,但习惯于 RI 错误地认为header=1是指定读取标题。啊。

为了将来参考,例外

Reindexing only valid with uniquely valued Index objects

与不唯一的标头值有关。

于 2012-09-18T19:05:32.283 回答