1

我试过使用:

Database.connection("jdbc:hive2://remote_hive:10000/db_name").driver(???).user("admin").password("admin_password")

我应该使用哪个驱动程序连接到蜂巢?

有谁知道是否有一些 API 文档的来源?或者有没有人知道比使用空运行调试更好的方法?

我能找到的最佳链接是https://docs.datastax.com/en/latest-dse/datastax_enterprise/graph/dgl/dglJDBC.html

我只是不知道我应该检查什么......

4

1 回答 1

0

您有几个可能用于 Hive 的 JDBC 驱动程序,但我怀疑其中任何一个都与 Cassandra 打包在一起......

  • 参考当然是Apache 驱动程序在此处记录),但它有一些问题:不完全支持 JDBC API(如该帖子中所述);存在两种风格,一种是“分散的” (依赖于其他几个hive-*.jar库等,等等——参见上面的帖子链接),另一种是所谓的“独立” (仍然依赖于几个hadoop-*.jar和 Apache utils);存在版本兼容性问题,即驱动程序版本必须等于或低于HiveServer2版本
  • 一个不错的替代方案是基于 Simba SDK的Cloudera 驱动程序(详细信息在上面的帖子链接中);但请记住,它是为 Cloudera 发行版设计的,因此它可能与最新的 Apache 版本不一致(并且它可能有自己的错误)
  • 还有许多带有 OEM 许可证的商业 BI 工具(来自 Oracle、IBM、MicroStrategy 等)中捆绑的DataDirect 驱动程序;但除了 cost$ 问题,上次我检查时,它并没有涵盖所有 Hive 连接选项(也许他们现在弥合了差距?)

第一步:下载一个或多个 JDBC 驱动程序。

第二步:与驱动程序“交朋友” ——即检查 CLASSPATH 问题、URL 语法问题等——使用 DBVisualizer 等 JDBC 实用程序(再次参见上面的帖子链接)。

第三步:盈利!

于 2016-07-24T13:27:08.267 回答