2

pandas DataFrame 对象有一个sort 方法,但 pandas DataMatrix 对象没有。

按索引(日期列)按升序对该 DataMatrix 对象进行排序的最佳方法是什么?

>>> dm
               compound_ret
2/16/2011 0:00  0.006275682
2/15/2011 0:00  0.003098208
2/14/2011 0:00  0.0055039
2/13/2011 0:00  0.011471506
2/12/2011 0:00  0.011853712
2/11/2011 0:00  0.009558739
2/10/2011 0:00  0.014127912
2/9/2011 0:00   0.02042923
2/8/2011 0:00   0.023308062

结果应该是 DataMatrix,其中 2/8/2011 作为第一个条目,2/16/2011 作为最后一个条目。Compound_ret 列中的条目应在排序中遵循其日期。所以结果应该是这样的:

>>>dm_sorted
                  compound_ret
2/8/2011 0:00    0.023308062
2/9/2011 0:00    0.02042923
2/10/2011 0:00  0.014127912
2/11/2011 0:00  0.009558739
2/12/2011 0:00  0.011853712
2/13/2011 0:00  0.011471506
2/14/2011 0:00  0.0055039
2/15/2011 0:00  0.003098208
2/16/2011 0:00  0.006275682
4

2 回答 2

8

实际上,在 0.2 和 0.3 之间,我将sortUp/重命名sortDown为单个sort方法。对于那个很抱歉。

如果可以的话,我绝对建议紧跟熊猫的前沿(https://github.com/wesm/pandas)!此外,考虑将 IPython 用于所有交互工作(http://ipython.scipy.org)——我发现制表符完成和对象的简单自省有助于查找方法和探索文档字符串。

于 2011-06-24T14:08:42.773 回答
0

你试过了吗?至少在我尝试过的 pandas 版本中,DataMatrix继承自DataFrame.

>>> type(dm)
<class 'pandas.core.matrix.DataMatrix'>
>>> dm.sort()
                       compound_ret    
2011-02-08 00:00:00   -0.6986         
2011-02-09 00:00:00    0.1846         
2011-02-10 00:00:00    0.2312         
2011-02-11 00:00:00    1.844          
2011-02-12 00:00:00    0.3662         
2011-02-13 00:00:00    0.1331         
2011-02-14 00:00:00    0.5166         
2011-02-15 00:00:00    1.37           
2011-02-16 00:00:00    0.9346         

>>> dm.sort(ascending=False)                                                    
                       compound_ret    
2011-02-16 00:00:00    0.9346         
2011-02-15 00:00:00    1.37           
2011-02-14 00:00:00    0.5166         
2011-02-13 00:00:00    0.1331         
2011-02-12 00:00:00    0.3662         
2011-02-11 00:00:00    1.844          
2011-02-10 00:00:00    0.2312         
2011-02-09 00:00:00    0.1846         
2011-02-08 00:00:00   -0.6986         
于 2011-04-05T21:44:36.257 回答