我正在尝试在分布式模式下设置 apache Drill。我已经有一个主服务器和两个从服务器的 cloudera hadoop 集群。从 apache Drill 上给出的文档来看,它是否可以使用典型的 cloudera 集群设置还不是很清楚。我找不到任何相关的文章。任何形式的帮助将不胜感激。
问问题
4259 次
3 回答
2
我得到了这个与cloudera hadoop发行版一起使用。我已经安装了运行所有服务的 cloudera 集群。
执行以下步骤:
- 在集群的所有节点上安装 apache Drill。
- 在每个节点上运行 Drill/bin/drillbit.sh。
- 使用主机:8047 上的 apache Drill Web 界面为 dfs 配置存储插件。在此处更新 HDFS 配置。
- 运行sqlline:./sqlline -u jdbc:drill:zk=host1:2181,host2:2181,host3:2181(2181是zookeeper使用的端口号。)
于 2015-04-14T23:02:34.770 回答
2
Drill 可以与 Cloudera 一起独立安装在集群的节点上——并且能够查询 HDFS 上的文件。有关安装详细信息,请参阅链接 - https://cwiki.apache.org/confluence/display/DRILL/Deploying+Apache+Drill+in+a+Clustered+Environment
于 2015-02-27T13:46:02.153 回答
1
它可能仅适用于基本的不安全集群,因为 Drill 目前没有经过测试/记录以与 HDFS + Kerberos 集成以实现安全的 Hadoop 集群。投票并查看此票以获取 Drill 安全 HDFS 支持:
于 2015-09-28T12:41:25.760 回答