计算基本统计数据,我得到以下工作良好:
import pandas as pd
max(df[Price])
min(df[Price])
但是,这将返回一个错误:
mean(df[Price])
NameError: name 'mean' is not defined
我只是想了解其中的逻辑。
这个效果很好:
df[Price].mean()
什么样的统计数据在点之后起作用,哪些必须包裹列?
计算基本统计数据,我得到以下工作良好:
import pandas as pd
max(df[Price])
min(df[Price])
但是,这将返回一个错误:
mean(df[Price])
NameError: name 'mean' is not defined
我只是想了解其中的逻辑。
这个效果很好:
df[Price].mean()
什么样的统计数据在点之后起作用,哪些必须包裹列?
min()并且max()是作为 Python 内置函数提供的函数。
您可以在任何可迭代对象(包括 Pandas 系列)上使用它们,这就是您所做的工作的原因。
Pandas 还提供.min()和.max()作为系列和数据帧的方法,因此例如df["Price"].min()也可以工作。系列函数的完整列表在这里;DataFrame 函数的完整列表在这里。
如果你确实想使用一个名为 的免费函数mean(),例如当你有一些不是 Pandas 系列的东西并且你不想将它转换为一个时,Python 标准库中确实存在一个,但你必须导入它:
from statistics import mean