1

对于 V1.0.0 之前的部署,Admin。可以为每个单独的 OpenPAI 集群启动并保留一个 dev-box 容器。因此管理员。可以在单个主机/VM 上拥有多个 dev-box 容器,用于不同的 OpenPAI 集群部署和管理(例如添加工作者)

基于https://openpai.readthedocs.io/en/release-1.0.0/manual/cluster-admin/installation-guide.html#installation-guide上的 V1.0.0 部署 SOP,将创建和删除devbox 容器在quick-start-kubespray.shquick-start-service.sh脚本中。当在部署的最后一步选择 kubectl 安装在 devbox 主机上时,似乎我们只能有一个 devbox 主机/VM 用于一个 OpenPAI 集群部署和管理。这样,需要为每个 OpenPAI 部署创建开发盒主机/VM。

是否可以有一个 devbox 主机/VM 用于多个集群部署和管理?

4

1 回答 1

1

如果您依赖 quick-start.sh 来部署 openpai,那么主机中可能只有 dev-box 容器。但每次部署后,您都可以手动执行以下步骤,为您之前部署的集群设置特定的控制环境。

  1. 创建一个文件夹并将该文件夹命名为集群名称。
YOUR_VERSION_ID='v1.0.0'
CLUSTER_NAME='example'
mkdir -p ${HOME}/pai-management/${CLUSTER_NAME}
mkdir -p ${HOME}/pai-management/${CLUSTER_NAME}/ansible
mkdir -p ${HOME}/pai-management/${CLUSTER_NAME}/quick-start-config
mkdir -p ${HOME}/pai-management/${CLUSTER_NAME}/openpai
mkdir -p ${HOME}/pai-management/${CLUSTER_NAME}/.kube
  1. 将以下文件复制到文件夹中。注意:文件来自之前的部署

    • Ansible 备份(用于 kubernetes 维护)
cd ${HOME}/pai-management/${CLUSTER_NAME}/ansible/
git clone https://github.com/kubernetes-sigs/kubespray.git
cd kubespray
git checkout release-2.11
cp -rfp ${HOME}/pai-deploy/kubespray/inventory/pai ${HOME}/pai-management/${CLUSTER_NAME}/ansible/kubespray/inventory/${CLUSTER_NAME}
  • Kube 配置备份
cp -rf ${HOME}/pai-deploy/kubespray/inventory/pai/artifacts/admin.conf ${HOME}/pai-management/${CLUSTER_NAME}/.kube
  • OpenPAI 快速启动备份
cp -rf ${HOME}/pai-deploy/quick-start-config/  ${HOME}/pai-management/${CLUSTER_NAME}/openpai
cp -rf ${HOME}/pai-deploy/cluster-cfg -p ${HOME}/pai-management/${CLUSTER_NAME}/openpai
  1. 启动一个 dev-box 并将其命名为集群名称。
sudo docker run -itd \
        -e COLUMNS=$COLUMNS -e LINES=$LINES -e TERM=$TERM \
        -v /var/run/docker.sock:/var/run/docker.sock \
        -v ${HOME}/pai-management/${CLUSTER_NAME}/openpai/quick-start-config/:/quick-start-config \
        -v ${HOME}/pai-management/${CLUSTER_NAME}/openpai/cluster-cfg:/cluster-configuration  \
        -v ${HOME}/pai-management/${CLUSTER_NAME}/.kube:/root/.kube \
        --pid=host \
        --privileged=true \
        --net=host \
        --name=${CLUSTER_NAME} \
        openpai/dev-box:${YOUR_VERSION_ID}
于 2020-06-09T02:49:59.510 回答