我已按照此页面上的说明在 Windows 10、Python 3.8、databricks 版本 9.1 上安装 databricks-connect,以连接到 Azure Databricks 集群:
https://towardsdatascience.com/get-started-spark-with-databricks-and-pyspark-72572179bd03
当我运行时:
databricks-connect test
我收到此错误:
* PySpark is installed at C:\Users\brend\miniconda3\envs\try-databricks-7.3\lib\site-packages\pyspark
* Checking SPARK_HOME
* Checking java version
java version "1.8.0_311"
Java(TM) SE Runtime Environment (build 1.8.0_311-b11)
Java HotSpot(TM) 64-Bit Server VM (build 25.311-b11, mixed mode)
* Skipping scala command test on Windows
* Testing python command
The system cannot find the path specified.
它无限期地挂起。进一步调查显示它挂在对 spark-submit.cmd 的调用中(因此调用了 spark-submit2.cmd)。
我在本地没有任何其他 Spark 安装。
该问题已在 databricks 7.3 和 9.1 上复制
我可以做些什么来进一步诊断问题?