我以原始形式(csv 和二进制)积累了相当多的数据——准确地说是几个月每天 4GB。
我决定加入文明世界并使用数据库来访问数据,我想知道正确的布局是什么;格式非常简单:每次报价几行(出价、要价、时间戳等)x 高达 50 万/天 x 数百种金融工具 x 月数据。
在商品硬件(2 x 1GB RAID 0 SATA,核心 2 @ 2.7GHz)上运行有一个带有 MYISAM 的 MySQL 服务器(我理解这将是此类使用的正确引擎)
数据库的正确布局是什么?表格/索引应该是什么样子?这种情况的一般建议是什么?你会预测什么会让我在此过程中陷入陷阱?
编辑:我的常见用法是提取特定日期和仪器的时间序列信息的简单查询,例如
SELECT (ask + bid) / 2
WHERE instrument='GOOG'
AND date = '01-06-2008'
ORDER BY timeStamp;
编辑:我试图将我的所有数据填充到一个由 timeStamp 索引的表中,但它太慢了 - 因此我认为它需要一个更复杂的方案。