我有一个格式为 cp= [cars['car_models']=="chevy"] 的数据框如何获得 cp 的平均值?
到处寻找如何做到这一点。谢谢您的帮助
正如@papayawarrior 所说,SFrame 没有平均值。SArrays(float/int 类型)可能有这些。
>>> sf = gl.SFrame({"x":[1,2,3]}) # SFrame with a single column (SArray) x.
>>> sf["x"].mean() # sf["x"] grabs the SArray x, then we take its average.
2.0
如果您想要均方根误差,您还应该有两个 SArray(可能在同一个 SFrame 中)。我不知道什么是“均方根值”。
import graphlab as gl
cars = gl.SFrame({
"car_models": ["chevy", "ford", "chevy"],
"targets": [1, 2, 3],
"predictions": [7, 9, 8]
})
cp = cars[cars["car_models"] == "chevy"]
rmse = gl.evaluation.rmse(cp["targets"], cp["predictions"])
在rmse
这个例子中是 5.522680508593631 。