我正在尝试找到一种快速的方法来转换从关系数据库(从单个 sql 查询)导入的时间序列数据的形式
ticker date price num_tickers num_dates
------- ---- -------- ---------- ---------
t001 d1 pr001_d1 k n
t001 d2 pr001_d2 k n
...
t001 dn pr001_dn k n
...
t002 d1 pr002_d1 k n
t002 d2 pr002_d2 k n
...
t002 dn pr002_dn k n
...
t00k d1 pr00k_d1 k n
t00k d2 pr00k_d2 k n
...
t00k dn pr00k_dn k n
(我已经包含了最后两列,因此无需遍历数据即可知道代码和日期的数量)
它以以下形式导入 Mathematica
data = {{'t001',d1,pr001d1,k,n},{'t001',d2,pr001d2,k,n},...,{'t001',dn,pr001dn,k,n},
{'t002',d1,pr002d1,k,n},{'t002',d2,pr002d2,k,n},...,{'t002',dn,pr002dn,k,n}
...
{'t00k',d1,pr00kd1,k,n},{'t00k',d2,pr00kd2k,k,n},...,{'t00k',dn,pr00kdn,k,n}}
但我需要它的形式:
tickers = {'t001','t002',...,'t00k'}
dates = {d1,d2,...,dn}
timeseries ={{pr001_d1,pr002_d1,...,pr00k_d1},
{pr001_d2,pr002_d2,...,pr00k_d2},
...
{pr001_dn,pr002_dn,...,pr00k_dn}}
我可以通过蛮力循环遍历所有内容来做到这一点,但我知道 Mathematica 有一些非常强大的列表操作功能(我不太熟悉),我希望有人可能知道这样做的巧妙方法。谢谢!