0

在我的机器上,代码可以正常运行。但是在我朋友的机器上,drop_duplicates() 有一个错误。错误类型与标题相同。

4

3 回答 3

2

打开命令提示符,键入pip show pandas以检查 pandas 的当前版本。如果它低于@paulperry 所说的 1.0.0,则输入pip install --upgrade pandas --user (用您的 Windows 帐户名替换用户)

于 2021-04-13T09:45:45.160 回答
0

输入import pandas as pd; pd.__version__并查看您正在使用的 Pandas 版本,并确保它是 >= 1.0 。

于 2020-05-06T14:10:04.360 回答
0

我遇到了与 Wzh 相同的问题——但我正在运行 pandas 1.1.3 版。所以,这不是版本问题。

Ilya Chernov 的评论为我指明了正确的方向。我需要从更复杂的 DataFrame 中的单个列中提取唯一名称列表,以便可以在查找表中使用该列表。这似乎是其他人可能需要做的事情,所以我将使用 GitHub 上提供的示例 csv 文件“iris.csv”来扩展 Chernov 对这个示例的评论。该文件列出了许多鸢尾品种的萼片和花瓣长度。这里我们提取品种名称。

df = pd.read_csv('iris.csv')

# drop duplicates BEFORE extracting the column
names = df.drop_duplicates('variety', inplace=False, ignore_index=True)

# THEN extract the column you want
names = names['variety']
print(names)

这是输出:

0        Setosa
1    Versicolor
2     Virginica
Name: variety, dtype: object

这里的关键思想是在对象仍然是 DataFrame(不更改原始文件)时去掉重复的品种名称,然后提取感兴趣的一列。

于 2020-12-22T20:56:44.977 回答