如何规范化多索引数据框?
假设我有数据框:
d = pd.DataFrame([["a",1,3],["a",2,2],["b",4,4],["b",5,8]],
columns=["name","value1","value2"])
如何计算每个“名称”的标准化值?
我知道如何规范化基本数据框:
d = (d-d.mean(axis=0))/data.std(axis=0, ddof=1)
但我无法将其应用于我的数据框的每个“名称”组
所以我想要的结果是:
name, value1, value2
a -0.5 0.5
a 0.5 -0.5
b -0.5 -1
b 0.5 1
我尝试了 groupby 和多索引数据框,但可能我没有以正确的方式进行操作