1

因此,我使用 Terraform 将独立集群部署到 Amazon EC2。它使用无密码 ssh 与工作人员通信。

我使用 start master 脚本启动 master,将集群的公共 ip 设置为 ec2 实例的公共 dns。

然后,我使用 start-slaves 脚本启动从属服务器,复制了一个 config/slaves 文件,其中包含可用于运行工作程序的 2 个 EC2 实例的公共 IP 地址。(他们每个人都在与主人相同的位置部署了火花)

在 UI 中,工作人员已注册并运行: 在此处输入图像描述 但是,当我向集群提交任何作业时,它永远无法分配显示消息的资源: 在此处输入图像描述

有谁知道如何解决这个问题?

日志显示工作人员正确启动和注册,并且我提交的任务在可用资源范围内。(已尝试低至 1 个 cpu 核心和 500mb)。

有谁知道为什么任务可能不被接受?

干杯

4

0 回答 0