6

问题

今天我发现了另一个 Azure 服务,称为Azure Data Explorer (ADX)。很抱歉这样的服务比较,除了ADX,我对所有的都很了解。我觉得有一个很大的功能覆盖,所以想知道 ADX 在 Azure 基础架构中的确切作用。

当 ADX 明显优于 Synapse/Databricks 时,用例是什么?

我对 ADX 的理解

AFAIK,ADX 是一个集群(按小时计费,如 Databricks 或 Synapse,不像 ADLA),它为您处理数据库,并针对大规模流式摄取和即席查询进行了优化。它还支持性能更差但更便宜的外部表(您需要为 Blob/ADLS 存储付费)。

细节

我不明白为什么我们需要 ADX,如果:

  1. Azure Synapse 具有类似的定价模型(集群、每小时),它还支持大规模流式摄取和临时查询。Azure Synapse 支持通过 Polybase 外部表查询 BlobStorage/ADLS。
  2. Databricks 是另一项能够做到这一点的服务。使用 Databricks Ingest 和 Delta Lake - 您可以摄取流式数据并以两种方式使用它们:流式传输和批处理方式。实际上,您可以拥有可以为您处理临时查询的交互式集群。
  3. 此外,如果您想要实时分析 - 使用 Azure 流分析。如果您想要类似 Athena 的体验 - 使用 ADLA(仍然不支持 ADLS gen2)。
4

2 回答 2

7

Azure 数据资源管理器专注于高速、高容量、高方差(大数据的 3 V)。它对流入的此类数据提供超快速的交互式查询。它原生支持 json 和文本,包括全文搜索和索引。

它用于与大量垂直领域中的传感活动和时间序列相关的广泛场景:物联网、API 日志、事务监控和临时数据探索。

Microsoft 提供 ADX 即服务,因为它是 Microsoft 用于其自己的遥测和所有分析解决方案的主要服务,即我们在安全、运营监控、游戏分析、产品洞察使用分析、物联网、联网车辆中提供的服务建立在 ADX 之上。您可以在我们的文档中找到完整列表。为清楚起见,SQL、Synapse、CosmosDB 将其遥测数据存储在 Azure 数据资源管理器中......

SQL DW(AKA Synapse SQL 池)是一个优秀的数据仓库,实现了现代数据仓库模式。ETL->策划数据模型->通过分析服务或 Power BI 加载和服务。
ADX 用于实时分析,可将模式读取 (SOR) 应用于几秒钟前的新鲜数据。

在替换用于日志、时间序列数据库等的基于 SOLR/Lucine 的变体时,将 ADX 视为一个完全托管的平台。

在大型工作负载中试用它,您会发现它比其他替代方案便宜得多,而且功能更强大、性能更佳。

如果您需要帮助,请联系我。

于 2020-06-01T15:57:13.283 回答
1

Azure 数据资源管理器别名 Kusto 专注于大容量数据摄取和几乎实时的查询和分析。它是 Microsoft 为日志和遥测分析而发明的,但也可用于其他目的,例如物联网、传感器数据或 Web 分析。Azure 内部服务(如 Azure Monitor 和 Log Analytics)中使用了相同的技术。

类似的功能可以在 Synapse、Databricks 或 HDInsight 上构建,但我认为这些工具适合更广泛的用例。ADX 的关注点非常狭窄。ADX 确实支持查询 (“KQL”),但对 SQL 的支持非常有限。它适用于仅附加数据,而不适用于更新。它不是数据仓库、数据库或数据湖。

Microsoft 材料指的是 ADX 背后的技术,名称为 Kusto。有关此内容的更多信息,请访问https://docs.microsoft.com/en-us/azure/data-explorer/kusto/concepts/。可以在此博客文章中找到很好的服务比较:https ://vincentlauzon.com/2020/02/19/azure-data-explorer-kusto

于 2020-05-27T19:55:56.320 回答