1

我正在将流分析用于简单的数据传递方案。
作业有多个 SQL Server 输出(三个)和一个 EventHub 输入。事件计数很小。问题是我的 SU % Utilization 不断增加。我的临时解决方案是每天重新启动一次或两次 Job。

难道我做错了什么?以下是我的查询示例。我尝试将查询更改为使用 TUMBLINGWINDOW,但得到了相同的结果。

SELECT field_1, field_2, field_3, field_4, field_5
INTO [out-alias-1]
FROM [in-alias]
WHERE field_1 LIKE 'Event1:%' OR field_1 LIKE 'Event2:%';

SELECT field_1, field_3, field_6, field_7, field_8
INTO [out-alias-2]
FROM [in-alias]
WHERE field_1 LIKE 'Event3:%' OR field_1 LIKE 'Event4:%';

SELECT field_1, field_3, field_4, field_9, field_10
INTO [out-alias-3]
FROM [in-alias]
WHERE field_1 NOT LIKE 'Event1:%' AND field_1 NOT LIKE 'Event2:%'
  AND field_1 NOT LIKE 'Event3:%' AND field_1 NOT LIKE 'Event4:%';
4

1 回答 1

0

您可能会在很少甚至没有输入事件的情况下观察到基线 SU % 利用率,因为系统会消耗一定数量的资源。系统消耗的资源量也可能随时间波动。

流单元 (SU) 表示执行 Azure 流分析作业的资源和能力。SU 提供了一种基于 CPU、内存和读写速率的混合度量来描述相对事件处理能力的方法。每个流媒体单元对应大约 1MB/秒的吞吐量。有关详细信息,请参阅流分析关键概念

SU % Utilization 指标是衡量 Azure 流分析作业是否需要扩展的指标。高 SU % Utilization 可能是查询中的大窗口、输入中的大事件、大的无序容差窗口或上述组合的结果。对查询进行分区,或将查询分解为更多步骤,并从 Scale 选项卡添加更多 SU 都是避免这种情况的策略。有关详细信息,请参阅缩放 Azure 流分析作业

于 2015-07-13T17:43:15.923 回答