0

如何在 Hive 中查看不同版本的 Hbase 数据。根据我对使用 HbaseStorageHandler 的理解,Hive 中只有最新版本的 Hbase 数据可用。我的理解是否正确/更新?

有什么方法可以使用 Hive 访问不同版本的 Hbase 数据?

提前致谢 :)

(Hbase-Hive 集成的新手)

4

2 回答 2

1

这取决于hive您使用的版本。在hive1.1 之前,hbase timestamps无法通过hive-hbase集成访问 [1](相关:[2])。所以答案是,您需要hive1.1 或更高版本。希望能帮助到你。

[1] https://issues.apache.org/jira/browse/HIVE-2828

[2] https://issues.apache.org/jira/browse/HIVE-8267

于 2016-02-07T15:08:30.717 回答
0

不是 100% 的答案,而是方向。在正常生活中,HBase 总是与特殊情况有关。

这是稍微过时但非常简单的文章来理解方法: http ://hortonworks.com/blog/hbase-via-hive-part-1/

所以实际上你可以实现任何InputFormatOutputFormat需要的。但这与 MapReduce 齿轮有关。

原则上,Spark 也可以始终依赖 InputFormat,因此问题仅与您的特殊情况有关。

此处描述了另一个好主意:http ://www.slideshare.net/HBaseCon/ecosystem-session-3a 因此,快照可以帮助获取您真正需要的表的状态,然后您可以自由使用任何设备将 Hive 与 HBase 连接如果它遵循标准。

一般来说,基本思想是调整将 Hive 连接到您的 HBase 数据的齿轮,以便它们将所需的版本过滤器应用于您。这不太依赖于版本,因为这个接口非常稳定。

希望这会帮助你。

于 2016-02-08T00:21:25.023 回答