1

我正在尝试创建一个新列,其中包含另一列的平均值(按组)。当我检查运行该步骤的输出后,所有值都是 nan。

我已经交叉检查了数据以检查是否有任何缺失值或空白等。没有任何问题。我还在 excel 中进行了计算以交叉检查数据,我可以计算每个组的平均值。

XXX["VAR_MEAN1"] = XXX.groupby(['KEY'])['Variable1'].mean()

运行上述代码后我看到的输出:

count   0.000
mean      nan
std       nan
min       nan
25%       nan
50%       nan
75%       nan
max       nan

预期结果(来自 excel):

KEY,MEAN
8Y2657000J8Y5683000C,1217.311538
8Y4007200J8Y5395000B,636.1032999

样本数据

4

1 回答 1

0

尝试先删除变量的空条目:

XXX["VAR_MEAN1"] = (XXX
                      .dropna(subset=['Variable1'])
                      .groupby(['KEY'])['Variable1']
                      .mean()
                   )
于 2018-12-27T05:50:00.290 回答