您可以使用 PowerShell 或 Azure 经典 CLI 来扩大/缩小集群。但是您可能需要编写一个脚本来跟踪集群资源使用情况并自动缩减。
这是一个powershell语法
Set-AzureRmHDInsightClusterSize -ClusterName <Cluster Name> -TargetInstanceCount <NewSize>
这是一个 PowerShell 工作流运行手册,可帮助您根据需要自动扩展或缩小 HDInsight 群集的过程
https://gallery.technet.microsoft.com/scriptcenter/Scale-your-HDInsight-f57bb4d8
或者
您可以使用以下选项手动缩放它(即使您的问题是如何自动放大/缩小,我认为这对想要手动放大/缩小的人很有用)
下面是一篇文章的链接,该链接解释了使用 PowerShell 或 Classic CLI 扩展集群的不同方法(请记住:最新的 CLI 不支持扩展功能)
https://docs.microsoft.com/en-us/azure/hdinsight/hdinsight-scaling-best-practices
如果希望 Spark 动态处理它,Azure Databricks 是最佳选择(但它只是 Spark 集群,没有 Hadoop 组件(Hive 除外))。由于 HDInsight - Spark 不是 Azure 托管服务,因此不会解决您的用例。
下面是一个新集群的图像(在 Azure 数据块中)——我突出显示了一个“启用自动缩放选项”,它允许您在执行作业时动态缩放。