我有一个DataFrame
这样的列:
["A_1", "A_2", "A_3", "B_1", "B_2", "B_3"]
我想将各个 A 列和 B 列“折叠”在一个列中并计算它们的平均值。简而言之,在操作结束时,我会得到:
["A", "B"]
其中“A”是所有“A”列的按列平均值,“B”是所有“B”列的平均值。
据我了解,groupby
不适合这项任务,或者我使用不正确:
grouped = data.groupby([item for item in data if "A" not in item])
如果我使用axis=1
,我在调用 mean() 时得到的只是一个空的 DataFrame,如果不是,我没有得到想要的效果。我想避免构建一个单独的 DataFrame 来通过迭代填充手段(例如,通过分别计算手段然后添加它们new_df["A"] = mean_a
)。有没有有效的解决方案?