2

刚接触考拉,尝试做一些非常基本的事情。我只是想计算聚合中列中的唯一值。在熊猫中,我会这样做:

df.groupby('columnname').agg({'column_i_want_count_of_unique_values' : pd.Series.nunique})

但是例如ks.Series.nunique不起作用,并且“计数”似乎也没有给出正确的答案。

对于如此简单和常见的事情非常令人沮丧,而且令人讨厌的是,我似乎无法在文档中找到它,因为它自称是移植 pandas 来激发火花。

4

2 回答 2

1

您可以使用该功能nunique

df.groupby('columnname')['column_i_want_count_of_unique_values'].nunique()
于 2021-03-18T07:48:57.233 回答
0

我想正确的语法是:

df.groupby('columnname').agg({'column_i_want_count_of_unique_values' : 'nunique'})

来源:https ://github.com/databricks/koalas/pull/512

于 2021-03-18T07:47:03.890 回答