0

我在 DataBricks 集群上创建了 DeltaLake 表。而且我能够从外部系统/应用程序访问这些表。尽管我需要始终保持集群正常运行才能访问表数据。问题:

  1. 集群关闭时是否可以访问 DeltaLake 表?

  2. 如果是,那我该如何设置

我试图查找文档。发现“对 DetaBrick 的高级访问”有一些表访问控制。否则禁用。它说:

启用表访问控制将允许用户控制谁可以选择、创建和修改他们创建的数据库、表、视图和函数。

我还找到了这个文档 ,我认为这不是我要求的选项。请建议

4

1 回答 1

0

我找到的解决方案是将所有 Delta Lake 表存储在 Storage Gen2 上。无论 DataBrick 集群如何,这都可以访问外部资源。在读取文件或写入表时,我们将启动并运行集群,其余时间可以关闭它。

来自 Docs:在 databricks 中,我们可以创建两种类型的增量表:托管和非托管。管理的是那些数据存储在 DBFS(Databricks 文件系统)中的文件。而非托管是可以指定外部 ADLS Gen-2 位置的那些。

dataframe.write.mode("overwrite").option("path","abfss://[ContainerName]@[StorageAccount].dfs.core.windows.net").saveAsTable("table")
于 2021-05-21T21:00:19.533 回答