27

我将我的数据框按以下两列分组

df = pd.DataFrame({'a': [1, 1, 3],
                   'b': [4.0, 5.5, 6.0],
                   'c': [7L, 8L, 9L],
                   'name': ['hello', 'hello', 'foo']})
df.groupby(['a', 'name']).median()

结果是:

            b    c
a name            
1 hello  4.75  7.5
3 foo    6.00  9.0

如何访问name结果中位数的字段(在这种情况下hello, foo)?这失败了:

df.groupby(['a', 'name']).median().name
4

4 回答 4

32

as_index = False在 groupby 期间设置

df = pandas.DataFrame({"a":[1,1,3], "b":[4,5.5,6], "c":[7,8,9], "name":["hello","hello","foo"]})
df.groupby(["a", "name"] , as_index = False).median()
于 2014-10-31T05:39:52.823 回答
26

您需要获取索引值,它们不是列。在这种情况下,级别 1

df.groupby(["a", "name"]).median().index.get_level_values(1)

Out[2]:

Index([u'hello', u'foo'], dtype=object)

您还可以传递索引名称

df.groupby(["a", "name"]).median().index.get_level_values('name')

因为这将比传递整数值更直观。

您可以通过调用将索引值转换为列表tolist()

df.groupby(["a", "name"]).median().index.get_level_values(1).tolist()

Out[5]:

['hello', 'foo']
于 2013-10-05T20:03:57.467 回答
5

您还可以reset_index()在 groupby 结果上取回现在可以访问 name 列的数据框。

import pandas as pd
df = pd.DataFrame({"a":[1,1,3], "b":[4,5.5,6], "c":[7,8,9], "name":["hello","hello","foo"]})
df_grouped = df.groupby(["a", "name"]).median().reset_index()
df_grouped.name
 0    hello
 1      foo
 Name: name, dtype: object

如果您对单个列执行操作,则返回将是具有多索引的系列,您可以简单地应用pd.DataFrame到它,然后 reset_index。

于 2013-10-06T00:05:15.170 回答
2

在 group by 之后使用 reset_index() 可以解决问题:

df = pd.DataFrame({'a': [1, 1, 3],
                   'b': [4.0, 5.5, 6.0],
                   'c': ['7L', '8L', '9L'],
                   'name': ['hello', 'hello', 'foo']})
df.groupby(['a', 'name']).median().reset_index().name

结果如下:

 0    hello
 1      foo
 Name: name, dtype: object

如果你想要值的列表,你可以简单地:

df = pd.DataFrame({'a': [1, 1, 3],
                   'b': [4.0, 5.5, 6.0],
                   'c': ['7L', '8L', '9L'],
                   'name': ['hello', 'hello', 'foo']})

df.groupby(['a', 'name']).median().reset_index().name.values

使用值的结果将是一个包含名称列的值的列表。上面的代码返回以下列表作为结果:

array(['hello', 'foo'], dtype=object)
于 2020-03-05T19:02:37.037 回答