可能有很多类似的问题,但他们没有回答我的情况(至少我无法理解这一点)。
可以说,我在 HBase 中有一个包含 4 个列族的表。主要原因是每个列族都有不同的 VERSIONS 属性(非常不同)。
所有族的所有列都不是存储大数据(例如全文),而是平均1KB(长的标识符,一些短字符串,整数等)
我需要以多种方式访问数据:按列族扫描和获取,按版本(特定版本或范围)获取给定行的所有单元格,最后但并非最不重要:获取给定行的所有列的最新版本.
那么,在这种情况下,拥有 4 个列族的缺点是什么?读取效率是否较低,因为它们在不同的存储文件上操作(如果行不在内存中)?