我在 DataBricks 集群上创建了 DeltaLake 表。而且我能够从外部系统/应用程序访问这些表。尽管我需要始终保持集群正常运行才能访问表数据。问题:
集群关闭时是否可以访问 DeltaLake 表?
如果是,那我该如何设置
我试图查找文档。发现“对 DetaBrick 的高级访问”有一些表访问控制。否则禁用。它说:
启用表访问控制将允许用户控制谁可以选择、创建和修改他们创建的数据库、表、视图和函数。
我还找到了这个文档 ,我认为这不是我要求的选项。请建议
我在 DataBricks 集群上创建了 DeltaLake 表。而且我能够从外部系统/应用程序访问这些表。尽管我需要始终保持集群正常运行才能访问表数据。问题:
集群关闭时是否可以访问 DeltaLake 表?
如果是,那我该如何设置
我试图查找文档。发现“对 DetaBrick 的高级访问”有一些表访问控制。否则禁用。它说:
启用表访问控制将允许用户控制谁可以选择、创建和修改他们创建的数据库、表、视图和函数。
我还找到了这个文档 ,我认为这不是我要求的选项。请建议
我找到的解决方案是将所有 Delta Lake 表存储在 Storage Gen2 上。无论 DataBrick 集群如何,这都可以访问外部资源。在读取文件或写入表时,我们将启动并运行集群,其余时间可以关闭它。
来自 Docs:在 databricks 中,我们可以创建两种类型的增量表:托管和非托管。管理的是那些数据存储在 DBFS(Databricks 文件系统)中的文件。而非托管是可以指定外部 ADLS Gen-2 位置的那些。
dataframe.write.mode("overwrite").option("path","abfss://[ContainerName]@[StorageAccount].dfs.core.windows.net").saveAsTable("table")