我正在尝试将 Apache Zeppelin 上的 graphframes 库与 Spark(pyspark)解释器一起使用,但是,我不断收到错误消息:
ModuleNotFoundError: No module named 'graphframes'
每当我尝试使用from graphframes import *
.
我尝试--packages 'graphframes:graphframes:0.7.0-spark2.4-s_2.11'
在 zeppelin-env.sh 文件中添加指令,尝试使用该z.load('graphframes:graphframes:0.7.0-spark2.4-s_2.11')
函数,并尝试在解释器设置中添加图形框架作为依赖项,但是,这些尝试都没有奏效。
我还尝试将 Spark 存储库添加到 Zeppelin,然后将图形框架的 maven 坐标添加到 zeppelin 上的依赖项部分下的解释器。但是,这也不起作用。
我在 EMR 集群上托管的 zeppelin 0.8.1 上使用带有 scala 2.11 的 spark 版本 2.4。
我可以使用上面提到的 pyspark 和 --packages 指令从终端使用图形框架,所以这似乎是一个与 zeppelin 相关的问题。
我不知道我还能做什么。关于如何让图形框架在 zeppelin 上工作的任何想法?