0

我在 Kaggle 上使用 Python 进行泰坦尼克号灾难竞赛。数据集 (df) 包含对应于每位乘客的 3 个属性——“性别”(1/0)、“年龄”和“Pclass”(1/2/3)。我想获得与每个 Gender-Pclass 组合相对应的中位年龄。

最终结果应该是一个数据框 -

Gender Class
1      1 
0      2
1      3 
0      1
1      2
0      3

中位年龄稍后计算

我尝试按如下方式创建数据框 -

unique_gender = pd.DataFrame(df.Gender.unique())
unique_class = pd.DataFrame(df.Class.unique())

reqd_df = pd.merge(unique_gender, unique_class, how = 'outer')

但获得的输出是 -

   0
0  3
1  1
2  2
3  0

有人可以帮我获得所需的输出吗?

4

1 回答 1

0

你想要df.groupby(['gender','class'])['age'].median() (根据 JohnE)

于 2016-04-16T06:18:03.413 回答