在我的机器上,代码可以正常运行。但是在我朋友的机器上,drop_duplicates() 有一个错误。错误类型与标题相同。
问问题
4597 次
3 回答
2
打开命令提示符,键入pip show pandas
以检查 pandas 的当前版本。如果它低于@paulperry 所说的 1.0.0,则输入pip install --upgrade pandas --user
(用您的 Windows 帐户名替换用户)
于 2021-04-13T09:45:45.160 回答
0
输入import pandas as pd; pd.__version__
并查看您正在使用的 Pandas 版本,并确保它是 >= 1.0 。
于 2020-05-06T14:10:04.360 回答
0
我遇到了与 Wzh 相同的问题——但我正在运行 pandas 1.1.3 版。所以,这不是版本问题。
Ilya Chernov 的评论为我指明了正确的方向。我需要从更复杂的 DataFrame 中的单个列中提取唯一名称列表,以便可以在查找表中使用该列表。这似乎是其他人可能需要做的事情,所以我将使用 GitHub 上提供的示例 csv 文件“iris.csv”来扩展 Chernov 对这个示例的评论。该文件列出了许多鸢尾品种的萼片和花瓣长度。这里我们提取品种名称。
df = pd.read_csv('iris.csv')
# drop duplicates BEFORE extracting the column
names = df.drop_duplicates('variety', inplace=False, ignore_index=True)
# THEN extract the column you want
names = names['variety']
print(names)
这是输出:
0 Setosa
1 Versicolor
2 Virginica
Name: variety, dtype: object
这里的关键思想是在对象仍然是 DataFrame(不更改原始文件)时去掉重复的品种名称,然后提取感兴趣的一列。
于 2020-12-22T20:56:44.977 回答