-1

我有一个盐 2016.11.3 (Carbon) 游乐场,其中有 DigitalOcean 大师和 Azure 中的 4 个奴才(三个 ubuntu 和 1 个窗口)。

过了一会儿 ubuntu minions 没有响应salt -t 30 '*' test.ping但他们在线(我可以 ssh 进入他们)

重新启动 mastersystemctl restart salt-master或 minionssystemctl restart salt-minion似乎会使 minions 恢复一段时间。

检查的东西:

  • Azure 机器进入睡眠状态,仅在外部事件时唤醒✗</li>
  • 两个云之间的网络很慢✗</li>
  • 盐师傅机器太小✗</li>
  • 盐奴不求主人“工作” ✗</li>
  • salt-master 由于某种原因挂起
  • salt-minion 通信错误✔</li>

同样在重新启动后,我从重新添加的节点得到双重响应,但我认为这是一个缓存问题,因为它会在一段时间后消失(缓存失效)。

4

1 回答 1

1

好像是通讯错误。saltstack github repo上有一个较早的 2013 年错误报告有人在评论中指出 AWS 和 Azure 负载均衡器不尊重 TCP keepalives

建议的解决方案:

  1. 每分钟添加一个 cron 来 ping minions
  2. 更改Azure minions 配置文件中的一些 keepalive 设置

到目前为止,解决方案#2 对我有用。

tcp_keepalive: True
tcp_keepalive_idle: 60
于 2017-04-15T11:25:30.973 回答