9

我有一个熊猫数据框,其中包含分类列和数字列的混合。默认情况下,df.describe()仅返回数值数据的摘要(用count, mean, std, min, quantiles,描述这些列max

当遍历 df 中的所有列并单独描述它们时,因为[df[c].describe() for c in df.columns] 描述是基于特定列 dtype 返回的;即数字摘要intfloat分类摘要object

有谁知道用count, unique, top,将所有列描述为分类的简洁方法freq

4

2 回答 2

10

以下将所有列转换为object类型,然后描述它们:

df.astype('object').describe()

为了更清晰的视图尝试:

df.astype('object').describe().transpose()
于 2018-02-26T21:54:26.503 回答
9

答案的略短版本:

df.describe(include = 'object')
于 2018-12-04T12:40:36.083 回答