我已经下载了graphframes
包(从这里)并将其保存在我的本地磁盘上。现在,我想使用它。所以,我使用以下命令:
IPYTHON_OPTS="notebook --no-browser" pyspark --num-executors=4 --name gorelikboris_notebook_1 --py-files ~/temp/graphframes-0.1.0-spark1.5.jar --jars ~/temp/graphframes-0.1.0-spark1.5.jar --packages graphframes:graphframes:0.1.0-spark1.5
除了新graphframes
包外,所有 pyspark 功能都按预期工作:每当我尝试import graphframes
使用ImportError
. 当我检查时sys.path
,我可以看到以下两条路径:
/tmp/spark-1eXXX/userFiles-9XXX/graphframes_graphframes-0.1.0-spark1.5.jar
和/tmp/spark-1eXXX/userFiles-9XXX/graphframes-0.1.0-spark1.5.jar
,但是这些文件不存在。而且,/tmp/spark-1eXXX/userFiles-9XXX/
目录是空的。
我错过了什么?