0

我有一个在 AWS EMR 中运行的 Apache Hbase 集群。该数据库由一个表组成,其中包含行和列的字符串以及值中的整数。该表很宽,有 50,000 列和大约 75,000 行。所有列都在一个列族下。

rowkey  col1 col2 col3 ... col50000
rowkey1  0    255  456
rowkey2  ..   ...
rowkey3

我想要执行的唯一操作是选择该矩阵的子集 - 选择某些行和列并返回它们。但是,即使选择单行也非常慢 - 返回大约需要 10 秒。文档和案例研究承诺毫秒延迟 - 我做错了什么?

4

0 回答 0