4

当我使用 HBase 时,我花了很多时间将字节数组转换为 String 或 Long 等类型。为什么 HBase 将值存储为字节数组而不是类型值?

4

2 回答 2

13

我不认为“Hbase 将所有内容存储为 byte[] 因为 BigTable 确实”实际上是一个令人满意的答案。我的 2 美分:

它使我们能够毫不费力地存储任何类型的数据。例如,假设您必须将产品相关数据存储到您的 hbase 表中,例如 ID、品牌、国家/地区、价格等。要存储这些参数中的每一个,您必须提前处理每个参数的各个数据类型这肯定会增加一些开销。与 RDBMS 不同,hbase 在创建表时不会要求所有这些。因此,即使这些参数的数据类型明天发生变化,或者您决定添加一些参数(使用一些新数据类型),您所要做的就是将值包装在 Bytes.ToBytes() 中并将其推送到您的表中。所有这些都使插入更快。

此外,有时以序列化的 byte[] 形式存储值与以本机格式存储相同的值相比可以节省几个字节。当您处理大数据时,这种微小的节省变得非常重要。

长话短说,Hbase 这样做是为了让事情变得更快,让存储更高效,将内部数据结构的开销保持在最低限度。

于 2013-03-28T22:30:00.680 回答
1

HBase 是 Bigtable 的克隆,这就是 Bigtable 所做的。Bigtable 通常不像关系数据库那样存储细粒度的数据,它们存储序列化的对象,通常是协议缓冲区。

您可以尝试使用序列化对象方法,也可以将接口抽象到 HBase 库,以便您只在一个地方转换类型。

于 2012-08-06T19:39:24.737 回答