0

我已经使用 twitter 的流用户 api 和 spark 流完成了 twitter 流。这在我的本地机器上成功运行。但是当我以本地模式在集群上运行这个程序时。它只是第一次成功运行。后来它给出了以下例外。

"Exception in thread "main" org.apache.spark.SparkException: Found both spark.executor.extraClassPath and SPARK_CLASSPATH. Use only the former."

并且火花类路径已经未设置!我每次都必须创建一个新的检查点目录才能使其成功运行。否则会显示上述异常。

谁能帮我解决这个问题?谢谢 :)

4

2 回答 2

0

尝试使用

#!/bin/bash
HBASE_HOME=/opt/cloudera/parcels/CDH/lib/hbase
SPARK_CLASSPATH="$HBASE_HOME/conf/:$HBASE_HOME/hbase-client.jar:$HBASE_HOME/hbase-protocol.jar:$HBASE_HOME/lib/htrace-core.jar:$HBASE_HOME/lib/htrace-core-3.1.0-incubating.jar"
spark-submit --num-executors 2 --executor-cores 2 --executor-memory 10G  --conf spark.executor.extraClassPath=$SPARK_CLASSPATH your_spark_program.jar --class your_entry_class

最重要的是--conf spark.executor.extraClassPath=$SPARK_CLASSPATH

于 2016-03-26T08:53:33.073 回答
0

曾经面临过类似的问题。设置 SPARK_CLASSPATH 会导致问题,因为它已被贬低。所以不要使用它。

导出 LIB_JARS=dependency/jcodings-1.0.8.jar,dependency.....等
spark-submit --deploy-mode 客户端 --master local --class org.xyz.spark.driver.SomeClass --num-executors 10 --jars ${LIB_JARS}
于 2016-03-31T16:10:38.490 回答