也许是一个愚蠢的问题,但是..
在R data.table中,如果我想获得一列的平均值,我可以引用一个列向量,并用类似foo$x
的东西计算它的平均值mean(foo$x)
。
我不知道如何使用Python datatable进行此操作。例如,
# imports
import numpy as np
import datatable as dt
from datatable import f
# make datatable
np.random.seed(1)
foo = dt.Frame({'x': np.random.randn(10)})
# calculate mean
dt.mean(foo.x) # error
dt.mean(foo[:, f.x]) # Expr:mean(<Frame [10 rows x 1 col]>) ???
foo[:, dt.mean(f.x)][0, 0] # -0.0971
虽然最后一条语句在技术上有效,但它似乎过于繁琐,因为它首先返回一个 1x1 datatable
,我从中提取唯一的值。我正在努力解决的基本问题是,我不明白python 数据表中是否存在列向量和/或如何引用它们。
简而言之,有没有更简单的方法来计算带有 python 数据的列的平均值?