apache - 在从 Drill 查询 HDFS 时需要帮助

Question

我的笔记本电脑上安装了钻头和动物园管理员。我在笔记本电脑上启动了 HDFS，发现可以查询 HDFS 中的 csv 和 json 文件。现在我想查询位于另一台笔记本电脑中的文件。因此，我在另一台笔记本电脑上启动了 hdfs，当我给出 select * 查询时，它失败了（尽管我可以show files毫无问题地执行查询）。

我得到的错误在保管箱链接中：

https://www.dropbox.com/s/5bgyw4jetweczoj/drill.log?dl=0

两台运行 Ubuntu 的笔记本电脑

阿帕奇钻版本：1.1.0

我有以下问题：

1）是否可以在hadoop集群外的机器上运行drill并查询集群中的hdfs文件？

2）如果是，是否需要额外的配置更改？

score 1 · Accepted Answer

是的，可以在hadoop集群外的机器上运行drill，查询集群中的hdfs文件。从命令行启动钻壳（sqlline）并指定要连接的zookeeper quorum。请参阅使用 Ad-Hoc 连接进行钻取。您也可以使用 SQuirrel 进行连接。Windows的配置与 Linux 类似。

apache - 在从 Drill 查询 HDFS 时需要帮助

1 回答 1

Related

Reference