1

我对 Docker 很陌生,但已经开始考虑生产设置,因此在使用 Docker Swarm 时需要解决数据持久性的挑战。我决定从创建我的部署基础设施开始(TeamCity 用于构建,NuGet 加上“注册表”[ https://hub.docker.com/_/registry/]用于存储图像)。

我从 TeamCity 开始。显然,这需要数据持久性才能工作。我可以在带有 EBS 驱动器的容器中运行 TeamCity,一切看起来都运行良好 - TeamCity 正在完成设置步骤,我的 TeamCity 驱动器出现在 AWS EBS 中,但随后工作节点 TeamCity 被分配到关闭并且安装过程停止。

以下是我要遵循的所有步骤:

第 1 阶段 - 机器设置:

第 2 阶段 - 在 Master 上配置 Docker Remote:

$ sudo docker run -p 2375:2375 --rm -d -v /var/run/docker.sock:/var/run/docker.sock jarkt/docker-remote-api

第 3 阶段 - 在所有机器上安装 rexray/ebs 插件:

$ sudo docker plugin install --grant-all-permissions rexray/ebs REXRAY_PREEMPT=true EBS_ACCESSKEY=XXX EBS_SECRETKEY=YYY

[我从 AWS 中提取了 XXX 和 YYY 的正确值]

  • 我使用以下方法进行测试:

    $ sudo docker volume create --driver=rexray/ebs --name=delete --opt=size=2

    $ sudo docker 卷 rm 删除

  • 所有三个节点都能够毫无问题地在 AWS EBS 中创建和删除驱动器。

第 4 阶段 - 设置 swarm:

  • 在主服务器上运行:

    $ sudo docker swarm init --advertise-addr eth0:2377

  • 这给出了在每个工作人员上运行的命令,如下所示:

    $ sudo docker swarm join --token XXX 1.2.3.4:2377

  • 这些在工作机器上执行得很好。

第 5 阶段 - 在我的本地计算机上使用 Remote Powershell 设置可视化:

$ $env:DOCKER_HOST="{master IP address}:2375"

$ docker stack deploy --with-registry-auth -c viz.yml viz

viz.yml 看起来像这样:

version: '3.1'

services:
    viz:
        image: dockersamples/visualizer
        volumes:
            - "/var/run/docker.sock:/var/run/docker.sock"
        ports:
            - "8080:8080"
        deploy:
            placement:
                constraints:
                    - node.role==manager
  • 这很好用,让我可以想象我的群体。

第 6 阶段 - 在我的本地计算机上使用远程 Powershell 安装 TeamCity:

$ docker stack deploy --with-registry-auth -c docker-compose.yml infra

docker-compose.yml 看起来像这样:

version: '3'

services:
  teamcity:
    image: jetbrains/teamcity-server:2017.1.2
    volumes:
        - teamcity-server-datadir:/data/teamcity_server/datadir
        - teamcity-server-logs:/opt/teamcity/logs
    ports:
        - "80:8111"

volumes:
  teamcity-server-datadir:
   driver: rexray/ebs
  teamcity-server-logs:
   driver: rexray/ebs
  • [将 NGINX 合并为代理是我待办事项列表的后续步骤。]

  • 我可以看到所需的驱动器都出现在 AWS EBS 中,并且容器出现在我的 swarm 可视化中。

  • 但是,在 TeamCity 中看到进度屏幕一段时间后,包含 TeamCity 实例的工作机器会关闭,并且该过程会突然结束。

  • 我不知道下一步该做什么。我什至不确定在哪里寻找日志。

任何帮助都感激不尽!

干杯,

史蒂夫。

4

3 回答 3

1

我找到了一种为我的服务获取日志的方法。首先这样做列出堆栈创建的服务:

$ sudo docker service ls 

然后执行此操作以查看服务的日志:

$ sudo docker service logs --details {service name}

现在我只需要浏览日志,看看出了什么问题......

于 2018-05-14T18:02:27.313 回答
1

更新

我在日志中发现以下错误:

infra_teamcity.1.bhiwz74gnuio@ip-172-31-18-103    |  [2018-05-14 17:38:56,849]  ERROR - r.configs.dsl.DslPluginManager - DSL plugin compilation failed
infra_teamcity.1.bhiwz74gnuio@ip-172-31-18-103    |  exit code: 1
infra_teamcity.1.bhiwz74gnuio@ip-172-31-18-103    |  stdout: #
infra_teamcity.1.bhiwz74gnuio@ip-172-31-18-103    |  # There is insufficient memory for the Java Runtime Environment to continue.
infra_teamcity.1.bhiwz74gnuio@ip-172-31-18-103    |  # Native memory allocation (mmap) failed to map 42012672 bytes for committing reserved memory.
infra_teamcity.1.bhiwz74gnuio@ip-172-31-18-103    |  # An error report file with more information is saved as:
infra_teamcity.1.bhiwz74gnuio@ip-172-31-18-103    |  # /opt/teamcity/bin/hs_err_pid125.log
infra_teamcity.1.bhiwz74gnuio@ip-172-31-18-103    |
infra_teamcity.1.bhiwz74gnuio@ip-172-31-18-103    |  stderr: Java HotSpot(TM) 64-Bit Server VM warning: INFO: os::commit_memory(0x00000000e2dfe000, 42012672, 0) failed; error='Cannot allocate memory' (errno=12)

这让我觉得这是一个记忆问题。我将使用更好的 AWS 实例再次尝试此操作,看看我的表现如何。

于 2018-05-14T18:25:26.500 回答
0

更新 2

使用更大的 AWS 实例解决了这个问题。:)

然后我发现当容器在我的集群中的主机之间切换时,rexray/ebs 不喜欢它——它复制 EBS 卷,以便每台机器保留一个。我对此的解决方案是在 AWS 中使用 EFS 驱动器并将其挂载到每个可能的主机上。然后我更新了 fstab 文件,以便在每次重新启动时重新安装驱动器。任务完成。现在研究使用反向代理...

于 2018-05-14T20:17:28.580 回答