0

在 Databricks 上,如果尚未安装,我想通过 Python Notebook 中的命令安装 Maven 库。

如果它是 Python PyPI 库,我会执行以下操作:

# Get a list of all available library 
library_name_list = dbutils.library.list()
# Suppose the library of interest was "scikit-learn"
if "scikit-learn" not in library_name_list:
  # Install the library 
  dbutils.library.installPyPI("scikit-learn")

如何对 Maven 库“com.microsoft.azure.kusto:spark-kusto-connector:2.0.0”执行相同操作,即检查它是否已安装,如果没有安装?

我可以使用 UI 安装 Maven 库,方法是转到“集群”->“库”->“安装新”->“Maven”。但我想通过脚本以编程方式进行。

4

1 回答 1

0

注意:库实用程序 ( dbutils.library.installPyPI("")) 允许您安装Python 库并创建范围为笔记本会话的环境。

以下是以编程方式从 maven 存储库安装库的步骤:

可以使用 Databricks CLI 在 Azure Databricks 中安装 maven 库。

步骤1:从 maven 坐标,您可以转到 Maven Repository 并选择您要查找的版本并记下依赖项(groupId、artifactId 和 Version)。

在此处输入图像描述

Step2使用 databricks CLI 获取集群 ID。

要获取集群 ID:databricks clusters list

在此处输入图像描述

第3 步:使用以下 Databricks CLI 命令com.microsoft.azure.kusto:spark-kusto-connector:2.0.0在 Databricks 中安装“”。

句法: databricks libraries install --cluster-id "Cluster ID" --maven-coordinates "GroupId:ArtifactId:Version" (i.e.org.jsoup:jsoup:1.7.2)

使用 databricks CLI 安装 maven 库:databricks libraries install --cluster-id "1013-095611-mazes551" --maven-coordinates "com.microsoft.azure.kusto:spark-kusto-connector:2.0.0"

要检查集群上的安装库:databricks libraries list --cluster-id "1013-095611-mazes551"

在此处输入图像描述

有关在 Azure Databricks 中安装包的不同方法,请参阅:如何使用笔记本中的某些命令在 databricks 群集上安装库?

于 2020-11-10T08:52:57.053 回答