我有一个带有节点池的 kubernetes 集群,作为 Chaos Engineering Initiative 的一部分,我需要重新启动 VM。是否有任何使用 azure 资源图的相同代码?
问问题
2323 次
3 回答
3
当 AKS 节点是规模集时。然后,您需要找到要重新启动的节点资源组、规模集名称和实例 ID。然后重启实例。以下是 CLI 命令:
# get the AKS node resource group name
az aks show -g groupName -n aksName --query nodeResourceGroup
# get the scale set info and all the instance id
az vmss list -g nodeGroupName --query [].name
az vmss list-instances -g nodeGroupName -n vmssName -o table
# restart the instance with the instance Id
az vmss restart -g nodeGroupName -n vmssName --instance-ids n
如果您在 Azure 门户中执行此操作,则步骤相同,但更容易实现。
于 2020-11-05T09:31:59.730 回答
1
您可以在 AKS 群集上安装 Gremlin。这是我写的深入教程:https ://www.gremlin.com/community/tutorials/how-to-install-and-use-gremlin-with-kubernetes/
在 kubernetes 集群上练习混沌工程时,控制攻击的爆炸半径很重要——例如,您将重启多少虚拟机?您要重新启动整个 VM 还是仅重新启动 VM 上的 1 个或多个 pod。
于 2021-01-12T18:51:58.677 回答
0
Chaos 工具包已经有从 scaleset 获取 vm 的代码。代码可以在https://github.com/chaostoolkit-incubator/chaostoolkit-azure/blob/master/chaosazure/vmss/fetcher.py查看。
于 2020-11-13T20:05:00.733 回答