1

我想创建一个巨大的 TimeSeries 对象,它将保存 1000 个不同的金融市场数据系列,每个系列存储 1500 个每日数据点。我对 TimeSeries 模块很陌生,对于如何最好地进行它有点困惑。所以几个基本问​​题:

1) 我是否应该使用一个 1000x1500 的巨大 numpy 数组并将其简单地提供给时间序列构造函数 time_series()?

2) 如果我这样做,我将如何按名称索引每个系列(例如“S&P500”或“GOLD”)?我知道我将能够按日期访问数组,但是我是否必须有一个单独的数据结构来将系列名称与其在大数组中的列号链接起来?

3)或者我应该按照文档(http://pytseries.sourceforge.net/core.timeseries.html)中给出的示例使用结构化数据类型?如果是这样,我如何将系列一一附加到时间序列,因为我不想创建一个巨大的非 numpy 结构来一次性提供给 time_series() 构造函数?

关于我在哪里可以获得金融市场和时间序列模块的一些好的例子的建议也将不胜感激。

谢谢。

4

2 回答 2

1

1)我曾经为一小部分(~10K)链接文档实现了一个pagerank算法,因此在计算过程中必须处理一个10Kx10K的矩阵,我记得它的数组numpy实现速度非常快。

2)恕我直言,在外部存储诸如系列名称之类的元数据并没有那么大的伤害..

3) 我没有使用 scikits.timeseries,但肯定会调查它;据我所知,该项目与 numpy 生活在同一个 scipy 轨道上。

于 2009-12-13T00:29:19.497 回答
0

如需这方面的帮助,请查看Quantlib,它是一个对财务工作有用的库,并且有一个活跃的用户邮件列表。

此外,请阅读本书评论以获取名为“Python 中的财务建模”的书。

于 2009-12-13T00:33:12.777 回答