问题标签 [kube-aws]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
219 浏览

kubernetes - coreos kube-aws K8s cluster nodes must have a Tag named "KubernetesCluster" to join

I have been experimenting with the script and it seems that if the cluster (not sure if just nodes or controller and nodes) doesn't have the aws tag "KubernetesCluster" with a unique value in it, the nodes do not seem to be added to the cluster, you get the following error instead as a loop when tailing the nodes journalctl -f:

Can anyone explain this behaviour?.

Thanks

0 投票
1 回答
162 浏览

kubernetes - 如何更新 Kubernetes 集群

我正在使用 coreos 的 Kube-Aws 生成云形成脚本并将其部署为我的堆栈的一部分,我想将我的 kubernetes 集群升级到更新版本。我不介意创建一个新集群,但我介意的是重新创建所有部署/服务等......

有没有办法进行配置并将它们替换/转移到新集群?也许复制整个 etcd 数据?那会有帮助吗?

0 投票
1 回答
228 浏览

amazon-web-services - 替换 K8 集群中的 AWS ELB

我使用 kube-aws 在 AWS 中部署了一个 k8 集群。当我部署服务时,会添加一个新的 ELB 以将服务公开到 Internet。我可以使用 ingress-controller 替换 ELB 还是有任何其他方式来公开 ELB 以外的服务?

0 投票
2 回答
4971 浏览

kubernetes - AWS 上的 Kubernetes:由未知权威签署的证书

我按照本指南https://coreos.com/kubernetes/docs/latest/kubernetes-on-aws-launch.html在 AWS 上使用kube-aws.

kube-aws习惯于v0.9.4-rc2

成功后kube-aws up --s3-uri s3://..,我尝试使用 获取节点kubectl get nodes,这就是我收到此错误的时候:

在该kubeconfig文件中,有一行描述了证书颁发机构:

有谁知道我可能出了什么问题?我怎样才能进一步调试它?

0 投票
1 回答
374 浏览

kubernetes - Kube-Aws Kubernetes 控制器污点和 pod 容忍度

我目前正在尝试使用 kube-aws 0-9-6 (1.6.2) 了解控制器上如何以及为什么不安排 pod 在安装干净的堆栈后,查询 kube-system 命名空间我看到以下内容:

现在我们看到一些 Pod 正在运行,而一些 Pod 处于挂起状态。由于以下原因,待处理的 pod 处于待处理状态:

首先查看节点,我看到以下内容:

很好,控制器节点是不可调度的,现在,我想看看为什么 pod 被调度,为什么其他的不被调度。首先看一下我们看到的 kube-apiserver 部署:

首先这不会出现在控制器用户数据中,我想知道它来自哪里,但即使它在那里,这种容忍度满足 NoSchedule 的污点也没有意义

然后,如果我们查看其他处于挂起状态的 pod,我们可以看到以下内容:

这很清楚为什么它们不能被调度并且它们处于挂起状态。它不满足污点。

从现在开始,无论我做什么(除了满足 NoSchedule)。没有什么变化。

将 NoExecute 效果添加到任何挂起的节点不会使它们出现,这是正确的,因为它们不满足任何要求。

我找不到任何理由证明 api-server、controller-manager、proxy 和 scheduler 正在运行而不是挂起(在用户数据中也看不到任何特殊内容)

谁能向我解释发生了什么事?

谢谢

0 投票
1 回答
70 浏览

kubernetes - kube-aws 中的网络模式是什么?

我试图找出我们在使用 kube-aws 设置 kubernetes 时可以使用的网络模式。我没有找到任何文件,就像我发现 kops 一样。https://github.com/kubernetes/kops/blob/master/docs/networking.md。你能告诉我什么是新穿梭模式(例如:法兰绒、运河等),或者是否有任何相同的文件。我们可以改变网络模式吗?

谢谢

0 投票
1 回答
411 浏览

amazon-web-services - 更好的 kubernetes 集群框架/工具 - kops vs kube-aws

我将在 AWS 基础设施上创建 Kubernetes 集群。我在kopskube-aws有两个选择。哪个是在 AWS 中创建和管理 k8s 集群的最佳选择?这些工具的优缺点是什么?

我在不同的 AZ 有一个主节点和两个工作节点。

谢谢

0 投票
1 回答
1478 浏览

amazon-web-services - AWS 上的 Kubernetes:“错误:未知标志:--config”

我已经kube-aws在AWS 上proxy使用. 当我在 pod 上运行时,我收到此错误:dashboardCrashLoopBackoffkubectl logs

这告诉我存在某种版本不匹配,因为应该调用该标志--kubeconfig

有没有人见过这个?我不确定如何正确解决它。

0 投票
2 回答
18164 浏览

amazon-web-services - kubectl 命令超时,没有详细信息

我正在运行一个 Kubernetes 集群,它已经运行了几个月。现在,今天,当我要部署一些更新时,我从服务器收到超时。

运行$ kubectl get nodes产量

运行$ kubectl get pods --all-namespaces产量

运行$ kubectl get deployments产量

运行$ kubectl get svc产量

运行$ kubectl cluster-infoyield(注意master之后没有输出)

当我为每个命令获得这些超时时,故障排除是不可能的。

我怎样才能从这里继续访问我的服务器?我正在使用kube-aws和 AWS CloudFormation VPC。

谢谢你的时间。

编辑

根据请求,我运行$ kubectl get pods -v 7并在一堆缓存返回后得到了这个:

我也跑了$ kubectl cluster-info dump -v 7,得到:

编辑 2: 好的,现在我正在接受Unable to connect to the server: EOF每个请求,我开始感到害怕。这是一个生产集群,我什至无法访问它来尝试进行故障排除。有人对如何进行有提示吗?

编辑 3: 我已经意识到 etcd 集群无法正常工作,2/3 节点不同步。重新启动一个节点使其再次正确加入集群,但第二个节点无法启动服务。未启动的服务有:

  • etcdadm-check.service
  • etcdadm-save.service
  • etcdadm-update-status.service
  • 用户@0.service

前三个都给出错误etcdadm-check.service: Control process exited, code=exited status=3,最后一个给出user@0.service: Start request repeated too quickly.

有关如何处理此问题的任何提示?

此外,在恢复第二个 etcd 后,我Unable to connect to the server: x509: certificate signed by unknown authority在运行任何kubectl命令时都会得到。这是否意味着数据丢失?我的证书还有半年多的有效期,我没有改变任何东西。

编辑 4:我仍然有 etcd 问题,但此时我按照 camil 的回答中的说明进行操作,将更新结果。但是,我解决了证书无效的问题,只需$ kube-aws render credentials使用到我的中间根 CA 的正确路径重新运行即可,从而解决了该问题。

0 投票
0 回答
229 浏览

kubernetes - Kubernetes 集群突然宕机

昨天,我的 kubernetes 集群突然宕机了,我试图调查如下,但不知道是什么原因:

无法访问 Kube Dashboard,它返回 HTTP ERROR 502

无法访问集群上已部署的应用程序,它还返回 502 错误

无法使用 kubectl 命令,它显示消息:“无法连接到服务器:x509:证书已过期或尚未生效”

有了这个错误,我用谷歌搜索并得到了这篇文章。但我不确定这是否正确。

你能帮忙建议一下吗。

太感谢了。

环境:

  • Kubernetes 1.5
  • Kube-aws