查询数据库或日志文件以获取正常运行时间信息或每个给定时间间隔的请求数是很常见的。
随着您收集越来越多的数据,SQL 查询或日志爬网变得越来越慢(想象一下 1000 万表行/日志行)。
典型问题:
- 过去 x 个月我们处理了多少任务?
- 在过去 X 时间段内,我们的服务可用性如何?
- 过去一小时的平均请求数是否高于过去 1 天的平均值?
我想使用一些键值存储:许多具有不同自动过期的存储桶-因此我们可以查看例如 10 分钟/1 小时/1 天的存储桶并将所有项目相加并自豪地说“在过去 10 分钟内我们处理了 10^6 个请求”。
我确信 MongoDB 或 Redis 在存储桶中提供时间到期 - 我只是有点担心实现是否简单。
你会如何解决这个问题?你知道更好的工具来完成这项任务吗?
(我们的项目是用java和python编写的)