1

我有一个包含以下内容的数据框(只是一个示例):

Subtype    Cluster
H10N4      59
H10N4      59
H10N4      23
H10N4      59
H3N8       22
H3N8       22
H3N8       44
H3N8       44

我希望能够找出给定子类型有多少个不同的集群。在这种情况下,所需的输出是:

Subtype    # of Clusters
H10N4      2
H3N8       2

我一直在做 Pandas,我.groupby('Subtype')在数据框上应用了 a,但是在我这样做之后,我不确定如何进一步进行。任何帮助,将不胜感激!

4

1 回答 1

2

您可以使用groupby

In [11]: g = df.groupby('Subtype')

然后计算每组中的唯一簇:

In [12]: g.apply(lambda s: len(s['Cluster'].unique()))
Out[12]:
Subtype
H10N4      2
H3N8       2
dtype: int64
于 2013-07-08T15:01:44.453 回答