0

我的笔记本电脑上安装了钻头和动物园管理员。我在笔记本电脑上启动了 HDFS,发现可以查询 HDFS 中的 csv 和 json 文件。现在我想查询位于另一台笔记本电脑中的文件。因此,我在另一台笔记本电脑上启动了 hdfs,当我给出 select * 查询时,它失败了(尽管我可以show files毫无问题地执行查询)。

我得到的错误在保管箱链接中:

https://www.dropbox.com/s/5bgyw4jetweczoj/drill.log?dl=0

两台运行 Ubuntu 的笔记本电脑

阿帕奇钻版本:1.1.0

我有以下问题:

1)是否可以在hadoop集群外的机器上运行drill并查询集群中的hdfs文件?

2)如果是,是否需要额外的配置更改?

4

1 回答 1

1

是的,可以在hadoop集群外的机器上运行drill,查询集群中的hdfs文件。从命令行启动钻壳(sqlline)并指定要连接的zookeeper quorum。请参阅使用 Ad-Hoc 连接进行钻取。您也可以使用 SQuirrel 进行连接。Windows的配置与 Linux 类似。

于 2015-08-20T12:51:48.070 回答