我想知道您能否告诉我应该为我的场景使用哪些 NoSQL 数据库或技术/工具。我们正在考虑用开源技术替换基于 SQL 服务器分析服务的 OLAP 多维数据集,因为数据变得太大而无法管理,查询需要很长时间才能返回。我们已经按照书中的每一条规则对数据进行分片,通过使用聚合和分区等优化多维数据集的设计,但我们的一些不同计数查询仍然需要 1-2 分钟 :( 我们的事实表的数据大小大约是250GB。并且有 10-12 个维度以星型模式连接。
因此,我们决定尝试使用 Hadoop/HBase/NoSQL dbs 等开源技术,看看它们是否能够以最少的设置和引导来解决我们的 OLAP 场景。
我们对新技术的主要要求是
对于不同的计数查询(< 2 秒),它必须获得极快或即时的结果
支持度量和维度的概念(如在 OLAP 中)。
- 支持类似 SQL 的查询语言,因为我们的许多开发人员都是 SQL 专家。
- 能够连接 Excel/Tableau 以可视化数据。
由于当今开源世界中有如此多的新技术和工具,我希望您能帮助我指出正确的方向。