当从终端运行以下简单脚本时,它在 pyspark 中运行良好:
import pyspark
sc = pyspark.SparkContext()
foo = sc.parallelize([1,2])
foo.foreach(print)
但是当在 Rodeo 中运行时,它会产生一个错误,其中最重要的一行是:
Exception: Python in worker has different version 2.7 than that in driver 3.5, PySpark cannot run with different minor versions
完整的错误输出可以在这个链接中找到:http: //pastebin.com/raw/unGuGLhq
我的$SPARK_HOME/conf/spark-env.sh
文件包含以下几行:
export PYSPARK_PYTHON=python3
export PYSPARK_DRIVER_PYTHON=python3
尽管如此,问题仍然存在,并且放入相同的行~/.bashrc
也不能解决问题。
竞技版:1.3.0
火花版本:1.6.1
平台:Linux