0

我正在计划一个新的副项目,最终将涉及分析我收集的数据。它主要是具有不同数量组件的时间序列数据(想想关系数据库列)。时间序列数据在所涵盖的时间段和测量的频率中会有所不同(因此没有太多的标准化信息可以组合成更少的表格)。时间序列集都不会有太多数据,每个序列最多可能有大约 100,000 个测量值,平均大约有 5000 个测量值(想想行)。我预计至少会有 10,000 组不同的时间序列数据(想想表)。

我预计不必执行许多复杂的查询(即使我这样做了,这个项目也没有时间敏感,因为它实际上只是批处理式分析,所以我可以在从数据库中选择数据后用软件做复杂的事情)所以我也在考虑像MongoDB这样的NoSQL数据库。

谁能告诉我 MySQL 或 MongoDB 是否是更好的选择?如果是 MySQL,是哪个存储引擎?如果两者都没有,你有更好的建议吗?另外,如果桌子的数量从 10,000 增加到 500,000 或更多,这会改变您的答案吗?

4

1 回答 1

3

我想推荐一个名为SciDB.org的新 DBMS 。他们声称它不是典型的 DBMS,因为它更侧重于科学分析处理。它专门针对时间序列数据进行了优化,并且可以进一步优化以在云上运行。

它针对时间序列数据进行了优化,因为它将数据存储在列中,而不是行中,从而允许在时间维度中快速访问。

你应该检查一下。

我用它来分析在几个月的时间内以每秒 2000 个样本进行采样的数据。

于 2012-09-21T19:50:00.080 回答