0

Databricks 无服务器计算 - 我知道这仍处于预览阶段,并且是应要求提供的,并且仅在 AWS 上可用。

这可以用于读写(更新) .delta 表[或者]它是只读的吗?

运行小型查询(本质上是事务性的)是否很好?[或者] 使用 Azure SQL 是否很好?

对于小型查询,Azure SQL ( az sql) 的性能似乎比 Databricks 更快。

由于 Dataricks 在从 .delta 表中查询时必须遍历 Hive Metastore - 这会影响性能吗?

4

1 回答 1

0

根据发行说明(2021 年 6 月 17 日),新的光子执行器已为 SQL 端点打开,它还支持写入 Delta 表(和 Parquet)。

如果您想对一组数据运行大量小查询,那么我会说 Az SQL 交互(或从 Delta 表中获取的 SparkDataFrame 上的操作)应该总是优于直接针对Delta Lake 表,因为后者必须代表您协商版本化 parquet 文件和 Delta Lake 事务日志。

于 2021-09-10T14:54:05.370 回答