2

我正在尝试配置一个 5 节点的 cassandra 集群来运行 Spark/Shark 来测试一些 Hive 查询。我已经安装了 Spark、Scala、Shark 并根据 Amplab [在集群上运行 Shark] https://github.com/amplab/shark/wiki/Running-Shark-on-a-Cluster进行了配置。

我能够进入 Shark CLI,当我尝试从我的一个 Cassandra ColumnFamily 表中创建一个外部表时,我不断收到此错误

失败并出现异常 org.apache.hadoop.hive.ql.metadata.HiveException:加载存储处理程序时出错。org.apache.hadoop.hive.cassandra.CassandraStorageHandler

失败:执行错误,从 org.apache.hadoop.hive.ql.exec.DDLTask 返回代码 1

我已经配置了 HIVE_HOME、HADOOP_HOME、SCALA_HOME。也许我将 HIVE_HOME 和 HADOOP_HOME 指向错误的路径?HADOOP_HOME 设置为我的 Cassandra hadoop 文件夹 (/etc/dse/cassandra),HIVE_HOME 设置为 Hadoop1/hive 的解压 Amlad 下载,我还将 HIVE_CONF_DIR 设置为我的 Cassandra Hive 路径 (/etc/dse/hive)。我错过了任何步骤吗?还是我错误地配置了这些位置?请问有什么想法吗?任何帮助将不胜感激。谢谢

4

1 回答 1

1

是的,我明白了。

试试https://github.com/2013Commons/hive-cassandra

whick 正在使用 cassandra 2.0.4、hive 0.11、hadoop 2.0

于 2014-03-13T16:20:38.157 回答