2

我有dataFrame一份大型问卷,我通过以下方式聚合不同轴上的数据来生成摘要:

df.groupby(group_name).agg([np.mean, np.std, np.count_nonzero])

这会在我的问卷中生成一个包含每个问题的平均值、标准和计数的列。分组中每一列的名称dataFrame是一个元组(original_column_name, function_applied)

问题是,当我输出到 CSV(使用to_csv())时,列名作为元组输出,即('gender', 'mean'), ('gender', 'std')理想情况下我想要类似gender_mean&gender_std

如何在输出到 CSV 之前处理这些列名?

4

1 回答 1

1

在 pandas 0.8.1 中,试试这个:

group_df = df.groupby(group_name).agg([np.mean, np.std, np.count_nonzero])
group_df.rename(None, lambda coltuple: '_'.join(coltuple), False, True)

有关详细信息,请参阅DataFrame 文档

于 2012-08-23T22:33:52.307 回答