1

我正在尝试找到一种快速的方法来转换从关系数据库(从单个 sql 查询)导入的时间序列数据的形式

ticker     date   price      num_tickers num_dates
-------    ----   --------   ----------  ---------
t001       d1     pr001_d1    k           n    
t001       d2     pr001_d2    k           n     
...    
t001       dn     pr001_dn    k           n 
...
t002       d1     pr002_d1    k           n     
t002       d2     pr002_d2    k           n     
... 
t002       dn     pr002_dn    k           n 

...

t00k       d1     pr00k_d1    k           n     
t00k       d2     pr00k_d2    k           n     
... 
t00k       dn     pr00k_dn    k           n 

(我已经包含了最后两列,因此无需遍历数据即可知道代码和日期的数量)

它以以下形式导入 Mathematica

data = {{'t001',d1,pr001d1,k,n},{'t001',d2,pr001d2,k,n},...,{'t001',dn,pr001dn,k,n},
{'t002',d1,pr002d1,k,n},{'t002',d2,pr002d2,k,n},...,{'t002',dn,pr002dn,k,n}
...
{'t00k',d1,pr00kd1,k,n},{'t00k',d2,pr00kd2k,k,n},...,{'t00k',dn,pr00kdn,k,n}}

但我需要它的形式:

tickers = {'t001','t002',...,'t00k'}
dates =   {d1,d2,...,dn}
timeseries ={{pr001_d1,pr002_d1,...,pr00k_d1},
             {pr001_d2,pr002_d2,...,pr00k_d2},
             ...
             {pr001_dn,pr002_dn,...,pr00k_dn}}

我可以通过蛮力循环遍历所有内容来做到这一点,但我知道 Mathematica 有一些非常强大的列表操作功能(我不太熟悉),我希望有人可能知道这样做的巧妙方法。谢谢!

4

1 回答 1

2

您想根据第一个元素(某种标签)拆分数据。使用SplitBy,像这样:

Module[{split=SplitBy[data,First]},
  tickers=split[[All,1,1]];
  dates=split[[1,All,2]];
  timeseries=split[[All,All,3]];]
于 2013-02-25T04:29:24.917 回答