2

我有一个运行网站的 dcos 集群。该网站在 20 个 docker 实例上运行。当我查看我的应用程序时,我看到我有 24 个实例。其中 2 个实例的状态为已启动但运行状况未知,2 个实例的状态为暂存。以前部署的旧实例我尝试了以下操作:

  • 销毁应用程序(结果:销毁 /azure-tracking-api 时出错:期货在 [10000 毫秒] 后超时)
  • 杀死所有实例(结果:它们都重新启动)

在日志中我没有看到任何重大错误,除了

无法在 scheduler-93d96b66-c66e-4d28-b66-c66e-4d28-b.9.75b9-0a13-4b3b-a29d-8d754239991b-0000(马拉松)的框架 517c75b9-0a13-4b3b-a29d-8d754239991b-0000(马拉松)上终止任务 azure-tracking-api.908a6c3e-8948-11e6-be5a-7e591cfeda59 :42546 因为它是未知的;执行对账

我使用的版本是 0.28.1

我的问题是我可以用几个命令来解决这个问题。我知道如何解决此问题的唯一方法是设置一个新集群。

4

1 回答 1

2

您使用的 Marathon 版本 (1.1.2) 存在丢失任务的已知问题。一旦 DC/OS 1.8 在 Azure 上可用,最好的选择就是升级。作为一种解决方法,目前,您可以使用 Marathon 的HTTP API手动删除任务:

$ curl -X DELETE $MARATHON_URL/v2/apps/azure-tracking-api/tasks/$TASKID?force=true
于 2016-10-04T13:21:12.620 回答