在下面的代码片段data
中是 apandas.DataFrame
并且indices
是 的一组列data
。在将数据分组后,groupby
我对组的 id 感兴趣,但只对那些大小大于阈值(例如:3)的组感兴趣。
group_ids=data.groupby(list(data.columns[list(indices)])).grouper.group_info[0]
现在,我如何知道哪个组的大小大于或等于 3 知道组的 id?我只想要具有一定大小的组的 ID。
#TODO: filter out ids from group_ids which correspond to groups with sizes < 3