我有 10 个不同的查询和总共 40 列。在可用的大数据 noSQL 数据库中寻找将执行读取和写入密集型作业(使用 SLA 的多个查询)的解决方案。
尝试使用 HBase,但它的快速仅用于行键(扫描)搜索,对于其他查询(不在行键上运行)查询响应时间非常高。使用不同的行键进行数据复制是快速响应的唯一选择,但对于 10 个查询10 个不同的表不是一个好主意。
请提出替代方案。
你试过德鲁伊吗?它的灵感来自Google BigQuery的前身Dremel。
从文档中:
Druid非常适合需要对单个大数据流进行实时数据摄取的产品。特别是如果您的目标是无停机操作,并且正在基于传入数据流的面向时间的汇总构建您的产品。在谈论查询速度时,重要的是要明确“快速”的含义:使用 Druid 完全有可能(我们已经做到了)实现在数万亿行数据中在不到一秒的时间内运行的查询。