我的问题主要是理论上的。当我们在 Informatica 工作流中使用聚合器并且不选择排序的输入属性时,我假设聚合器转换根据端口分组对数据进行排序,然后进行聚合。为了提高此操作的性能,通常建议打开 sorted 输入属性,并将排序器转换的输出(使用键 = 按端口分组)传递给聚合器。我的问题是:从地图的角度来看,两种情况下的操作数量相似:对数据进行排序,然后对其进行聚合。那么为什么排序器+聚合器(排序输入)比单个聚合器(无排序输入)运行得快得多?
问问题
7933 次