以下是我的问题:
1)您是否尝试将所有数据仅放在行键中?我有非常小的数据行(但数百万行),需要将更多的数据实体组合在一起以使密钥独一无二,所以我的想法是使用我需要存储在 HBase 中的所有内容创建一个复合密钥。您是否尝试过,您认为瓶颈/问题可能是什么?应该考虑什么?我可以想象这将需要更多的 RAM,因为我将有更多的东西放入布隆过滤器中。
2) 我只是想对此进行确认,因为我在这个表格中找不到它。就我获得 HBase 而言,如果我有一个复合键,可以说:key: k1_k2_x
我可以进行范围扫描以获取特定 k1 的所有 k2 条目,例如:scan "t1",{STARTROW=>"k1_"}
但是没有办法使用通配符并以某种方式获取特定 k2 的所有 k1 条目。我需要一个 map/reduce 作业或 Hive 或过滤器,对吧?