我正在分析 Azure SQL DW,我遇到了 DWU(数据仓库单元)一词。Azure 网站上的链接仅提及 DWU 的粗略定义。我想了解 DWU 是如何计算的,以及我应该如何相应地扩展我的系统。
我也提到了链接,但它没有涵盖我的问题:
除了您发现的链接之外,了解 Azure SQL DW 将数据存储在称为“分布”的 60 个不同部分中会很有帮助。如果您的 DW 是 DWU100,则所有 60 个分布都连接到一个计算节点。如果您扩展到 DWU200,则 30 个分布将分离并重新附加到第二个计算节点。如果您一直扩展到 DWU2000,那么您将拥有 20 个计算节点,每个节点都附加了 3 个分布。因此,您会看到 DWU 如何衡量 DW 的计算/查询能力。随着您的扩展,您可以在每个计算节点上使用更少的数据进行更多的计算。
更新:对于 Gen2,仍有 60 个发行版,但 DWU 数学有点不同。DWU500c 是一个全尺寸节点(同时扮演计算和控制节点角色),安装了所有 60 个发行版。小于 DWU500c 的规模是非全尺寸的单个节点(这意味着与较大 DWU 上的全尺寸节点相比,内核和 RAM 更少)。DWU1000c 是 2 个计算节点,每个节点安装了 30 个分布,并且有一个单独的控制节点。DWU1500c 是 3 个计算节点和一个单独的控制节点。最大的是 DWU30000c,它是 60 个计算节点,每个节点都安装了一个分布。
我刚刚找到了这个链接,它显示了与 DWU 关系的吞吐量
您还可以查看 dwucalculator。该站点将引导你完成捕获现有工作负载的过程,并就完成 Azure SQL DW 中的工作负载所需的 DWU 数量提出建议。
根据时间和桌子的数量,您可以选择 DWU。
例如:如果 100 个 DWU 需要 15 分钟的时间来处理 3 个表,并且要在 3 分钟内完成相同的操作,您可以选择 500 DWU。