0

我已经成功地将远程配置单元元存储与 apache Drill 连接起来。我能够显示远程 hdfs 的数据库,也能够从数据库中查看表结构。但是在查询数据库时出现错误

Error: SYSTEM ERROR: UnknownHostException: remotename

这是我的 apache hive 配置

{
 "type": "hive",
 "enabled": true,
 "configProps": {
 "hive.metastore.uris": "thrift://myremoteIP:PortofThrift",
 "hive.metastore.warehouse.dir": "/tmp/drill_hive_wh",
 "fs.default.name": "hdfs://IP address of remote:port of hdfs from /",
 "hive.metastore.sasl.enabled": "false"
  }
}

这是成功的查询 jdbc:drill:zk=local> describe data_mcsc_mcsc_bill_info

和结果。

    COLUMN_NAME       |     DATA_TYPE      | IS_NULLABLE  |
+------------------------+--------------------+--------------+
| tran_dt                | CHARACTER VARYING  | YES          |
| tran_tm                | CHARACTER VARYING  | YES          |
| bill_id                | CHARACTER VARYING  | YES          |
| policy_number          | CHARACTER VARYING  | YES          |
| policy_start_date      | CHARACTER VARYING  | YES          |
| policy_end_date        | CHARACTER VARYING  | YES          |
4

1 回答 1

1

需要更多详细信息才能为您的问题提供完整答案。我可以在这里提供一些调试技巧。

  • 验证运行你的 namenode 和 metastore 的机器是否可以从你运行 Drill 的机器上访问。您可以使用 telnet 命令验证是否可以打开套接字。如果这失败了,您有防火墙/连接问题。
  • 通过将 csv 文件放在 HDFS 上并将 HDFS 集群的存储插件配置添加到 Drill 来验证 Drill 可以与您的 HDFS 集群通信。验证您可以从 Drill 中查询文件。如果失败,您可能没有为您的 HDFS 名称节点指定正确的端口,或者可能存在其他一些与 HDFS 相关的问题。

如果这些调试技巧还不够,请订阅 Apache Drill 开发和用户列表。您可以在此处查看有关如何执行此操作的信息http://drill.apache.org/mailinglists/。然后您可以将您的问题发送到用户列表,Drill 团队可以在那里为您的问题提供更多交互式帮助。如果您将问题发送到用户列表,还请包括以下信息:

  • 你的 Drill 版本。
  • 无论您是运行一个钻机集群还是运行一个简单的独立节点。
  • Hive 的版本。
  • 您正在使用的 HDFS 发行版(例如 Big Top、Hortonworks、Cloudera)。
于 2018-01-23T19:25:50.787 回答