12

有没有一种方法可以将 df.describe() 应用于 DataFrame 中的一个独立列。

例如,如果我有几列并且我使用 df.describe() - 它会返回并描述所有列。根据研究,我知道我可以添加以下内容:

“dtypes 的类似列表:将结果限制为提供的数据类型。要将结果限制为数字类型,请提交 numpy.number。要将其限制为对象列,请提交 numpy.object 数据类型。字符串也可用于select_dtypes 的样式(例如 df.describe(include=['O']))。要选择 pandas 分类列,请使用 'category'"

但是我不太清楚如何用python代码写出来。提前致谢。

4

5 回答 5

42

只需在方括号中添加列名:

df['column_name'].describe()

例子:

在此处输入图像描述

要获得单列

df['1']

要获得几列

df[['1','2']]

要按名称获取单行

df.loc['B']

或按索引:

df.iloc[o]

获取特定字段

df['1']['C']
于 2018-05-10T13:25:52.573 回答
3
import pandas as pd
data=pd.read_csv('data.csv')
data[['column1', 'column2', 'column3']].describe()
于 2020-05-22T12:26:39.193 回答
1
import pandas as pd
data = pd.read_csv("ad.data", header=None)
data[111].describe()

或者例如

lastindice = data[data .columns[-1]]
lastindice.describe()
于 2018-05-04T01:52:21.043 回答
0

将其描述为表

df[['column_name']].describe()

将其描述为数据

df['column_name'].describe()
于 2021-05-03T05:53:10.057 回答
0

在 Pyspark DataFrame 中,您只能像这样描述一列:

df.describe("col1").toPandas()

或像这样的几列:

df.describe(["col1", "col2"]).toPandas()
于 2020-05-20T05:58:33.480 回答