与高延迟的 Hive 相比,Drill 看起来像是一个有趣的工具,用于 ad-hoc 向下钻取查询。
似乎这两者之间应该有一个不错的整合,但我找不到它。
假设今天我所有的工作都是在 Hive/Shark 上完成的,我如何将它与 Drill 集成?
我必须来回切换到 Drill 引擎吗?
我正在寻找类似于 Shark 和 Hive 的集成。
问问题
291 次
1 回答
1
尽管有实施 Drill-Hive 集成的规定,但您的问题似乎有点“过时”。Drill 还有很长的路要走,人们一直在努力尽快完成所有这些工作。
根据他们的路线图,Drill 将首先支持 Hadoop 文件系统实现和 HBase。其次,将支持与 Hadoop 相关的数据格式(例如,Apache Avro、RCFile)。第三,将提供基于 MapReduce 的工具来生成基于列的格式。第四,Drill 表可以注册到 HCatalog 中。最后,Hive 被认为是 DrQL 实现的基础。
有关更多详细信息,请参阅此内容。
于 2013-09-25T18:51:47.597 回答