duplicates - drop_duplicates() 得到了一个意外的关键字参数“ignore_index”

Question

在我的机器上，代码可以正常运行。但是在我朋友的机器上，drop_duplicates() 有一个错误。错误类型与标题相同。

score 2 · Accepted Answer

打开命令提示符，键入pip show pandas以检查 pandas 的当前版本。如果它低于@paulperry 所说的 1.0.0，则输入pip install --upgrade pandas --user （用您的 Windows 帐户名替换用户）

score 0 · Accepted Answer

输入import pandas as pd; pd.__version__并查看您正在使用的 Pandas 版本，并确保它是 >= 1.0 。

score 0 · Accepted Answer

我遇到了与 Wzh 相同的问题——但我正在运行 pandas 1.1.3 版。所以，这不是版本问题。

Ilya Chernov 的评论为我指明了正确的方向。我需要从更复杂的 DataFrame 中的单个列中提取唯一名称列表，以便可以在查找表中使用该列表。这似乎是其他人可能需要做的事情，所以我将使用 GitHub 上提供的示例 csv 文件“iris.csv”来扩展 Chernov 对这个示例的评论。该文件列出了许多鸢尾品种的萼片和花瓣长度。这里我们提取品种名称。

df = pd.read_csv('iris.csv')

# drop duplicates BEFORE extracting the column
names = df.drop_duplicates('variety', inplace=False, ignore_index=True)

# THEN extract the column you want
names = names['variety']
print(names)

这是输出：

0        Setosa
1    Versicolor
2     Virginica
Name: variety, dtype: object

这里的关键思想是在对象仍然是 DataFrame（不更改原始文件）时去掉重复的品种名称，然后提取感兴趣的一列。

duplicates - drop_duplicates() 得到了一个意外的关键字参数“ignore_index”

3 回答 3

Related

Reference