如何在 Hive 中查看不同版本的 Hbase 数据。根据我对使用 HbaseStorageHandler 的理解,Hive 中只有最新版本的 Hbase 数据可用。我的理解是否正确/更新?
有什么方法可以使用 Hive 访问不同版本的 Hbase 数据?
提前致谢 :)
(Hbase-Hive 集成的新手)
如何在 Hive 中查看不同版本的 Hbase 数据。根据我对使用 HbaseStorageHandler 的理解,Hive 中只有最新版本的 Hbase 数据可用。我的理解是否正确/更新?
有什么方法可以使用 Hive 访问不同版本的 Hbase 数据?
提前致谢 :)
(Hbase-Hive 集成的新手)
这取决于hive
您使用的版本。在hive
1.1 之前,hbase
timestamps
无法通过hive-hbase
集成访问 [1](相关:[2])。所以答案是,您需要hive
1.1 或更高版本。希望能帮助到你。
不是 100% 的答案,而是方向。在正常生活中,HBase 总是与特殊情况有关。
这是稍微过时但非常简单的文章来理解方法: http ://hortonworks.com/blog/hbase-via-hive-part-1/
所以实际上你可以实现任何InputFormat
你OutputFormat
需要的。但这与 MapReduce 齿轮有关。
原则上,Spark 也可以始终依赖 InputFormat,因此问题仅与您的特殊情况有关。
此处描述了另一个好主意:http ://www.slideshare.net/HBaseCon/ecosystem-session-3a 因此,快照可以帮助获取您真正需要的表的状态,然后您可以自由使用任何设备将 Hive 与 HBase 连接如果它遵循标准。
一般来说,基本思想是调整将 Hive 连接到您的 HBase 数据的齿轮,以便它们将所需的版本过滤器应用于您。这不太依赖于版本,因为这个接口非常稳定。
希望这会帮助你。