是否可以在同一个 AWS EMR 集群中同时提交和运行 Spark 作业?如果是,那么您能详细说明一下吗?
问问题
1000 次
2 回答
4
--deploy-mode cluster
您应该使用允许您将多个执行部署到集群的标签。这将使纱线为您处理资源和队列。
完整的例子:
spark-submit \
--class org.apache.spark.examples.SparkPi \
--master yarn \
--deploy-mode cluster \ # can be client for client mode
--executor-memory 20G \
--num-executors 50 \
/path/to/examples.jar \
1000
更多细节在这里。
于 2018-05-09T05:45:09.030 回答
2
目前,EMR 不支持并行运行多个步骤。据我所知,此类实验性功能已经实现,但由于某些问题尚未发布。
于 2018-05-10T03:08:25.383 回答