给定以下熊猫数据框:
df = pd.DataFrame({'A': ['foo' ] * 3 + ['bar'],
'B': ['w','x']*2,
'C': ['y', 'z', 'a','a'],
'D': rand.randn(4),
})
print df.to_string()
"""
A B C D
0 foo w y 0.06075020
1 foo x z 0.21112476
2 foo w a 0.01652757
3 bar x a 0.17718772
"""
注意没有 bar,w 组合。执行以下操作时:
pv0 = pandas.pivot_table(df, rows=['A','B'],cols=['C'], aggfunc=numpy.sum)
pv0.ix['bar','x'] #returns result
pv0.ix['bar','w'] #key error though i would like it to return all Nan's
pv0.index #returns
[(bar, x), (foo, w), (foo, x)]
只要在“C”列中至少有一个条目,就像 foo,x 的情况一样(它在“C”列中只有一个“z”的值),它将为“的其他列值返回 NaN foo,x 不存在 C'(例如 'a','y')
我想要的是拥有所有多索引组合,即使是那些没有所有列值的数据的组合。
pv0.index #I would like it to return
[(bar, w), (bar, x), (foo, w), (foo, x)]
我可以将 .ix 命令包装在 try/except 块中,但有没有办法让 pandas 自动填充它?