在将 hadoop_fdw 痛苦地安装到我们正在运行的 pgsql 9.3.4 中之后,我试图将它连接到 cloudera cluster 5.2.0,但没有成功。
有没有办法调试fdw?创建外部表并从中选择后,我收到一个错误 - 错误:无法连接到 Hive:没有更多数据可读取。
顺便说一句:一些旧版本的 hadoop_fdw 能够使用 url (jdbc://server:port/args),但不是最新版本,只有地址和端口。
在将 hadoop_fdw 痛苦地安装到我们正在运行的 pgsql 9.3.4 中之后,我试图将它连接到 cloudera cluster 5.2.0,但没有成功。
有没有办法调试fdw?创建外部表并从中选择后,我收到一个错误 - 错误:无法连接到 Hive:没有更多数据可读取。
顺便说一句:一些旧版本的 hadoop_fdw 能够使用 url (jdbc://server:port/args),但不是最新版本,只有地址和端口。
Hadoop_fdw 没有成功。hive.c 中可能有一些错误/旧/过时的东西。但是通过更多的努力,我们设法使 jdbc_fdw 与 cloudera jdbc 驱动程序一起工作。步骤如下:
1) 安装 jdbc_fdw 扩展
2)将所有驱动jar文件合并为一个
3)CREATE SERVER cloudera2 FOREIGN DATA WRAPPER jdbc_fdw OPTIONS(drivername 'com.cloudera.hive.jdbc4.HS2Driver',url 'jdbc:hive2://fqdn:10000;user=hive',querytimeout '15', jarfile '/opt/cloudera/combined.jar');
心理笔记:set client_min_messages to debug5;
可以帮助您确定问题出在哪里,例如:找不到驱动程序等