我按照https://medium.com/@faizanahemad/machine-learning-with-jupyter-using-scala-spark-and-python-the-setup-62d05b0c7f56的说明安装了 Apache Toree 。
但是,我无法通过使用内核文件中的 PYTHONPATH 变量在 pySpark 内核中导入包:
/usr/local/share/jupyter/kernels/apache_toree_pyspark/kernel.json。
使用笔记本我可以在 sys.path 和 os.environ['PYTHONPATH'] 中看到所需的 .zip,相关的 .jar 位于 os.environ['SPARK_CLASSPATH'] 但我得到了
导入时“没有名为 graphframe 的模块”:import graphframe。
关于如何导入图框的任何建议?
谢谢你。