1

我正在使用 hadoop-2.2.0 和 hive-0.12。我按照以下步骤尝试连接到 Rstudio 中的 Hive:

library("DBI")
library("rJava")
library("RJDBC")
for(l in list.files('/PATH/TO/hive/lib/')){ .jaddClassPath(paste("/PATH/TO/hive/lib/",l,sep=""))}
for(l in list.files('/PATH/TO/hadoop/')){ .jaddClassPath(paste("/PATH/TO/hadoop/",l,sep=""))}
options( java.parameters = "-Xmx8g" )
drv <- JDBC("org.apache.hive.jdbc.HiveDriver", "/PATH/TO/hive/lib/hive-jdbc.jar")
conn <- dbConnect(drv, "jdbc:hive2://HOST:PORT", USER, PASSWD)

但我收到以下错误:

Error in .jcall(drv@jdrv, "Ljava/sql/Connection;", "connect", as.character(url)[1],  : 
  java.lang.NoClassDefFoundError: org/apache/hadoop/conf/Configuration

任何提示将不胜感激。

4

2 回答 2

1

问题已经解决了。

我在hadoop目录中加载了所有 jar 包,然后我可以连接到 Hive。

于 2014-09-30T05:44:21.377 回答
0

您可以使用 RHIVE 包从 R 简单地连接到 hiveserver2

以下是我使用过的命令。

Sys.setenv(HIVE_HOME="/usr/local/hive") Sys.setenv(HADOOP_HOME="/usr/local/hadoop") rhive.env(ALL=TRUE) rhive.init() rhive.connect("localhost")
于 2015-02-27T11:19:35.417 回答