我已经设置了一个包含 Spark 流式一步的 EMR 集群,并且我已经配置了EMR managed scaling。
我也使用 spark-submit 在 master 上提交临时 spark 作业。提交作业时集群会扩大规模,但在临时作业完成后不会缩小规模,除非火花流作业被终止。这意味着,集群在集群空闲之前不会缩减(没有在 spark 上运行的作业)。
如何使用 EMR 管理的扩展来缩减集群,并在同一集群上运行火花流?
我已经设置了一个包含 Spark 流式一步的 EMR 集群,并且我已经配置了EMR managed scaling。
我也使用 spark-submit 在 master 上提交临时 spark 作业。提交作业时集群会扩大规模,但在临时作业完成后不会缩小规模,除非火花流作业被终止。这意味着,集群在集群空闲之前不会缩减(没有在 spark 上运行的作业)。
如何使用 EMR 管理的扩展来缩减集群,并在同一集群上运行火花流?