我有一个运行 HBase 的集群设置和一个 phoenix 查询服务器。目前我的集群包含一个主节点和 3 个从节点。我要连接的表由 124 列和总共 1600 万行组成。一个简单的COUNT(*)
orDISTINCT "value"
查询大约需要 1-2 分钟,据我了解,这不应该是这种情况 - Phoenix 有多快?为什么这么快?
在上面链接的文档中,对 1 亿行进行全表扫描大约需要 20 秒。而且由于我的表大小要小得多,我不明白为什么我的查询需要这么长时间。我可以做些什么来优化我的查询?我计划使用列族重建我的表(我知道这可以提高性能,但我想知道是否有其他方法可以快速提高性能,因为重建我当前的表将是一项非常艰巨的任务。
我正在使用 Phoenix 4.9 和 HBase 1.2。