我一直在使用单个 MySQL 数据库来驱动分析仪表板,该仪表板通常会根据大约 1 到 1000 万条记录计算指标和图表。数据集可以在几天内大幅增长。
不用说,下一个版本的仪表板将需要大约 100 倍的数据量,我觉得 MySQL 不足以在很短的时间内报告出这些指标。
新的仪表板要求看起来像..
- 报告将聚合约 100 - 10 亿条记录的指标和图表的能力
- 实时报告“一些”基本指标的能力
- 查看仪表板的最终用户的等待时间非常短
在花了一些时间研究不同的可用数据库技术之后,我得出结论,应该在以下之一之间进行选择:
NoSQL 数据库
- 蒙哥数据库
- 卡桑德拉
列式数据库
- 无限数据库
- 信息亮
我在列式数据库上找到的大部分信息似乎都来自实际致力于开发这些技术的组织。因此,我正在寻找对列式数据库有公正经验的人,并帮助我了解如果我走这条路将面临的一些挑战。此外,我真的应该使用列式数据库吗,或者上面的 NoSQL 数据库之一是否足以满足我的要求?