我正在尝试确定 Amazon SimpleDB是否适合我拥有的数据子集。
我部署了数千个记录数据的自主传感器设备。
每个传感器设备基本上每天每小时四次报告几个值,持续数月和数年。我需要保留所有这些数据以进行历史统计分析。一般是一次写入,多次读取。基于服务器的应用程序定期运行以查询数据以推断其他信息。
今天的数据行,在 SQL 中看起来像这样:
- (id, device_id, utc_timestamp, value1, value2)
我们现有的 MySQL 解决方案不会进一步扩展,有数千万行。我们查询诸如“告诉我昨天所有 value1 的总和”或“告诉我过去 8 小时内 value2 的平均值”之类的内容。我们在 SQL 中执行此操作,但可以很高兴地更改为在代码中执行此操作。SimpleDB 的“最终一致性”对我们来说似乎很好。
我正在阅读我所能阅读的所有内容,并且即将开始尝试使用我们的AWS帐户,但我不清楚各种 SimpleDB 概念(项目、域、属性等)与我们的域有何关系。
SimpleDB 是一个合适的工具吗?通用的方法是什么?
PS:我们主要使用 Python,但在高层次上考虑这一点并不重要。我现在知道boto库。
编辑:
继续为此搜索解决方案我确实遇到了 Stack Overflow 问题什么是存储时间序列数据的最佳开源解决方案?这很有用。