我正在尝试配置一个 5 节点的 cassandra 集群来运行 Spark/Shark 来测试一些 Hive 查询。我已经安装了 Spark、Scala、Shark 并根据 Amplab [在集群上运行 Shark] https://github.com/amplab/shark/wiki/Running-Shark-on-a-Cluster进行了配置。
我能够进入 Shark CLI,当我尝试从我的一个 Cassandra ColumnFamily 表中创建一个外部表时,我不断收到此错误
失败并出现异常 org.apache.hadoop.hive.ql.metadata.HiveException:加载存储处理程序时出错。org.apache.hadoop.hive.cassandra.CassandraStorageHandler
失败:执行错误,从 org.apache.hadoop.hive.ql.exec.DDLTask 返回代码 1
我已经配置了 HIVE_HOME、HADOOP_HOME、SCALA_HOME。也许我将 HIVE_HOME 和 HADOOP_HOME 指向错误的路径?HADOOP_HOME 设置为我的 Cassandra hadoop 文件夹 (/etc/dse/cassandra),HIVE_HOME 设置为 Hadoop1/hive 的解压 Amlad 下载,我还将 HIVE_CONF_DIR 设置为我的 Cassandra Hive 路径 (/etc/dse/hive)。我错过了任何步骤吗?还是我错误地配置了这些位置?请问有什么想法吗?任何帮助将不胜感激。谢谢