0

让我们考虑一下我有一个名为 Iris 的数据框,其中名称、sepallength、sepalwidth、petalwidth 和petallength 作为列。我想在一个组中找到 sepallength 的累积计数。

我的代码:

iris['name', 'sepallength', iris.groupby('name').sort('sepallength').sepallength.count()].head(5)

但它显示了错误的结果,我错过了什么?

4

1 回答 1

1

使用cumcount代替count,前一个用于窗口函数,后一个用于聚合。

iris['name', 'sepallength', iris.groupby('name').sort('sepallength').sepallength.cumcount()].head(5)
于 2019-01-08T14:12:41.950 回答