因为 HBase 表是稀疏表,所以 HBase 不仅为每个单元存储值,还存储识别单元所需的所有信息(通常描述为 Key,不要与 RowKey 混淆)。密钥如下所示:
RowKey-ColumnFamily-ColumnQualifier-时间戳
所有这些信息都存储在每个条目中。这就是为什么建议使用 Column Families 和 Column Qualifiers 的短名称来减少额外开销的原因。
我的问题:为什么我需要为每个条目存储 ColumnFamily?据我了解,每个存储文件都属于一个列族。每个存储文件存储一次列族名称还不够吗?这将减少开销,可以使用任意列族名称,并且我们仍然能够识别每个条目的列族。我在这里想念什么?