问题标签 [kube-aws]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
kubernetes - coreos kube-aws K8s cluster nodes must have a Tag named "KubernetesCluster" to join
I have been experimenting with the script and it seems that if the cluster (not sure if just nodes or controller and nodes) doesn't have the aws tag "KubernetesCluster" with a unique value in it, the nodes do not seem to be added to the cluster, you get the following error instead as a loop when tailing the nodes journalctl -f
:
Can anyone explain this behaviour?.
Thanks
kubernetes - 如何更新 Kubernetes 集群
我正在使用 coreos 的 Kube-Aws 生成云形成脚本并将其部署为我的堆栈的一部分,我想将我的 kubernetes 集群升级到更新版本。我不介意创建一个新集群,但我介意的是重新创建所有部署/服务等......
有没有办法进行配置并将它们替换/转移到新集群?也许复制整个 etcd 数据?那会有帮助吗?
amazon-web-services - 替换 K8 集群中的 AWS ELB
我使用 kube-aws 在 AWS 中部署了一个 k8 集群。当我部署服务时,会添加一个新的 ELB 以将服务公开到 Internet。我可以使用 ingress-controller 替换 ELB 还是有任何其他方式来公开 ELB 以外的服务?
kubernetes - AWS 上的 Kubernetes:由未知权威签署的证书
我按照本指南https://coreos.com/kubernetes/docs/latest/kubernetes-on-aws-launch.html在 AWS 上使用kube-aws
.
我kube-aws
习惯于v0.9.4-rc2
成功后kube-aws up --s3-uri s3://..
,我尝试使用 获取节点kubectl get nodes
,这就是我收到此错误的时候:
在该kubeconfig
文件中,有一行描述了证书颁发机构:
有谁知道我可能出了什么问题?我怎样才能进一步调试它?
kubernetes - Kube-Aws Kubernetes 控制器污点和 pod 容忍度
我目前正在尝试使用 kube-aws 0-9-6 (1.6.2) 了解控制器上如何以及为什么不安排 pod 在安装干净的堆栈后,查询 kube-system 命名空间我看到以下内容:
现在我们看到一些 Pod 正在运行,而一些 Pod 处于挂起状态。由于以下原因,待处理的 pod 处于待处理状态:
首先查看节点,我看到以下内容:
很好,控制器节点是不可调度的,现在,我想看看为什么 pod 被调度,为什么其他的不被调度。首先看一下我们看到的 kube-apiserver 部署:
首先这不会出现在控制器用户数据中,我想知道它来自哪里,但即使它在那里,这种容忍度满足 NoSchedule 的污点也没有意义
然后,如果我们查看其他处于挂起状态的 pod,我们可以看到以下内容:
这很清楚为什么它们不能被调度并且它们处于挂起状态。它不满足污点。
从现在开始,无论我做什么(除了满足 NoSchedule)。没有什么变化。
将 NoExecute 效果添加到任何挂起的节点不会使它们出现,这是正确的,因为它们不满足任何要求。
我找不到任何理由证明 api-server、controller-manager、proxy 和 scheduler 正在运行而不是挂起(在用户数据中也看不到任何特殊内容)
谁能向我解释发生了什么事?
谢谢
kubernetes - kube-aws 中的网络模式是什么?
我试图找出我们在使用 kube-aws 设置 kubernetes 时可以使用的网络模式。我没有找到任何文件,就像我发现 kops 一样。https://github.com/kubernetes/kops/blob/master/docs/networking.md。你能告诉我什么是新穿梭模式(例如:法兰绒、运河等),或者是否有任何相同的文件。我们可以改变网络模式吗?
谢谢
amazon-web-services - AWS 上的 Kubernetes:“错误:未知标志:--config”
我已经kube-aws
在AWS 上proxy
使用. 当我在 pod 上运行时,我收到此错误:dashboard
CrashLoopBackoff
kubectl logs
这告诉我存在某种版本不匹配,因为应该调用该标志--kubeconfig
。
有没有人见过这个?我不确定如何正确解决它。
amazon-web-services - kubectl 命令超时,没有详细信息
我正在运行一个 Kubernetes 集群,它已经运行了几个月。现在,今天,当我要部署一些更新时,我从服务器收到超时。
运行$ kubectl get nodes
产量
运行$ kubectl get pods --all-namespaces
产量
运行$ kubectl get deployments
产量
运行$ kubectl get svc
产量
运行$ kubectl cluster-info
yield(注意master之后没有输出)
当我为每个命令获得这些超时时,故障排除是不可能的。
我怎样才能从这里继续访问我的服务器?我正在使用kube-aws
和 AWS CloudFormation VPC。
谢谢你的时间。
编辑:
根据请求,我运行$ kubectl get pods -v 7
并在一堆缓存返回后得到了这个:
我也跑了$ kubectl cluster-info dump -v 7
,得到:
编辑 2:
好的,现在我正在接受Unable to connect to the server: EOF
每个请求,我开始感到害怕。这是一个生产集群,我什至无法访问它来尝试进行故障排除。有人对如何进行有提示吗?
编辑 3: 我已经意识到 etcd 集群无法正常工作,2/3 节点不同步。重新启动一个节点使其再次正确加入集群,但第二个节点无法启动服务。未启动的服务有:
- etcdadm-check.service
- etcdadm-save.service
- etcdadm-update-status.service
- 用户@0.service
前三个都给出错误etcdadm-check.service: Control process exited, code=exited status=3
,最后一个给出user@0.service: Start request repeated too quickly.
。
有关如何处理此问题的任何提示?
此外,在恢复第二个 etcd 后,我Unable to connect to the server: x509: certificate signed by unknown authority
在运行任何kubectl
命令时都会得到。这是否意味着数据丢失?我的证书还有半年多的有效期,我没有改变任何东西。
编辑 4:我仍然有 etcd 问题,但此时我按照 camil 的回答中的说明进行操作,将更新结果。但是,我解决了证书无效的问题,只需$ kube-aws render credentials
使用到我的中间根 CA 的正确路径重新运行即可,从而解决了该问题。
kubernetes - Kubernetes 集群突然宕机
昨天,我的 kubernetes 集群突然宕机了,我试图调查如下,但不知道是什么原因:
无法访问 Kube Dashboard,它返回 HTTP ERROR 502
无法访问集群上已部署的应用程序,它还返回 502 错误
无法使用 kubectl 命令,它显示消息:“无法连接到服务器:x509:证书已过期或尚未生效”
有了这个错误,我用谷歌搜索并得到了这篇文章。但我不确定这是否正确。
你能帮忙建议一下吗。
太感谢了。
环境:
- Kubernetes 1.5
- Kube-aws