我已经在 HDInsight 上设置了一个 SPARK 集群,并且正在尝试使用本教程使用GraphFrames。
我已经在集群创建期间使用了自定义脚本来启用 Spark 集群上的GraphX,如此处所述。
当我运行记事本时,
import org.apache.spark.sql._
import org.apache.spark.sql.functions._
import org.graphframes._
我收到以下错误
<console>:45: error: object graphframes is not a member of package org
import org.graphframes._
^
我尝试graphframes
使用以下命令通过 Jupyter 从 spark 终端安装:
$SPARK_HOME/bin/spark-shell --packages graphframes:graphframes:0.1.0-spark1.5
但我仍然无法让它工作。我是 Spark 和 HDInsight 的新手,所以有人可以指出我需要在这个集群上安装什么才能让它工作。