我在这里运行一个小测试/ poc。
我需要每天将几百万行加载到数据库中。而且它不是日志文件数据,我有逗号分隔的行(列),它完全适合关系数据库。
加载后,我需要允许一个非常快速的搜索机制。稍微看了一下google对bigtable的实现以及围绕它的结构,我原本是想用hive和hbase集成的。Hive 因为它的查询能力。加载效果很好,比 RDBMS 性能更好。但是,查询瓶颈(最初是寻找 RDBMS 替代品的原因)也继续存在于 hive 中。
测试 hive 以进行查询并不是真正的出色性能。也许我需要寻找替代品..
还有别的吗?我可以放在 hbase 之上的任何其他工具/解决方案/库吗?甚至没有 hbase ?(我将 hbase 视为 RDBMS 的替代品,转向 dist 计算)
建议请...