我有 Azure 数据湖分析作业,它使用 U-SQL 用户定义的运算符处理存储在 Azure 数据湖存储中的大约 380 万条记录。
在第一次运行时,我将并行度设置为 10,而在第二次运行时,我使用了并行度等于 1。令人惊讶的是,我两次执行的工作持续时间是相同的(大约 1.5 小时)。所以看起来我的工作没有触发并行性。是因为我使用了用户定义的运算符吗?我想知道如何确定何时触发并行性以及何时不触发?
我有 Azure 数据湖分析作业,它使用 U-SQL 用户定义的运算符处理存储在 Azure 数据湖存储中的大约 380 万条记录。
在第一次运行时,我将并行度设置为 10,而在第二次运行时,我使用了并行度等于 1。令人惊讶的是,我两次执行的工作持续时间是相同的(大约 1.5 小时)。所以看起来我的工作没有触发并行性。是因为我使用了用户定义的运算符吗?我想知道如何确定何时触发并行性以及何时不触发?