“rke”的相关标签问题_Stack Overflow中文网

0 投票

1 回答

2769 浏览

kubernetes - (RKE) FATA[0212] [etcd] 无法启动 Etcd 平面：[etcd] Etcd 集群不健康

我正在尝试使用 RKE 设置一个小型 Kubernetes 集群，其中使用 RKE 有 2 个节点。这两个节点是在 VirtualBox 中运行的 Ubuntu 服务器虚拟机，都具有桥接连接。

虚拟机 1 的 ip：xx.xx.xx.61

虚拟机 2 的 ip：xx.xx.xx.67

当我使用 rke up 启动集群时，出现以下错误：

当我随后运行 kubectl --kubeconfig kube_config_cluster.yml 版本等 kubectl 命令时，我收到以下错误：

不确定这些错误是否是由相同的潜在问题引起的。

可能是什么原因造成的，或者我该如何解决这个问题。我可以查看任何特定的日志文件吗？

这就是 cluster.yml 的样子：

2019-07-31T08:57:50.767

0 投票

1 回答

160 浏览

kubernetes - rke etcd 快照有很多错误

我必须备份我的 kubernetes 集群。我选择使用 Rancher rke 进行 Etcd 备份，但是在恢复备份后，我在 Calico、Nginx-ingress-controller、kube-dns 和 ... 等 Pod 上遇到了太多不同的错误。

etcd备份可靠吗？Kubernetes最好的备份工具是什么？

我尝试从以下位置逐步恢复： https ://rancher.com/docs/rancher/v2.x/en/backups/restorations/ha-restoration/#4-restore-database

kubernetes etcd rke

2019-08-28T07:05:56.207

0 投票

3 回答

23683 浏览

path - 如何修复入口 404 默认后端

几个月前我开始使用 Kubernetes，实际上我将我的微服务迁移到我的 Rancher 集群 (RKE)。一切都很好，我的部署很好，服务也很好。我想使用入口。

一切看起来都很好，服务是通过入口找到的，豆荚是通过服务找到的。但是，当我尝试访问该网站时，我有一个来自入口控制器的 404 错误页面。

你可以看到我对两条路径的配置：一个 nginx 和一个 grafana。有人知道我该如何修复它并使用入口来做我的反向代理？

非常感谢你的帮助。

我尝试在没有结果的情况下使用 rewrite-target，并且不推荐使用 add-base-url。

path kubernetes-ingress rancher nginx-ingress rke

2019-08-31T11:39:59.680

0 投票

1 回答

966 浏览

kubernetes - Grafana 仪表板不在 Rancher UI 中显示数据

我在 Rancher UI 中为我的项目启用了监控，它安装成功。但是当我在我的工作量（例如）中单击“转到 grafana”nginx时，它会移动到 Grafana 仪表板，但 Grafana 什么也不显示：0 CPU, 0 memory, 0 networking,...

为什么没有数据？
以及如何知道我的资源（工作负载、服务、pod）的消耗配额？

请看我的截图：

非常感谢

kubernetes grafana prometheus rancher rke

2019-09-22T06:29:57.077

0 投票

1 回答

3701 浏览

kubernetes - 恢复 Rancher 时出错：此集群当前不可用；在 API 准备好之前，与它直接交互的区域将不可用

我正在尝试备份和恢复牧场主服务器（单节点安装），如此处所述。

备份后，我尝试关闭rancher服务器节点，并在新节点上运行一个新的rancher容器（在同一网络，但另一个IP地址），然后我使用备份文件恢复。

恢复后，我登录到rancher UI，它显示以下错误：

所以，我检查了牧场主服务器的日志，它显示如下：

2019-10-05 16:41:32.197641 http：来自 127.0.0.1:38388 的 TLS 握手错误：EOF 2019-10-05 16:41:32.202442 I | http：来自 127.0.0.1:38380 的 TLS 握手错误：EOF 2019-10-05 16:41:32.210378 I | http：来自 127.0.0.1:38376 的 TLS 握手错误：EOF 2019-10-05 16:41:32.211106 I | http：来自 127.0.0.1:38386 的 TLS 握手错误：EOF 2019/10/05 16:42:26 [错误] ClusterController c-4pgjl [user-controllers-controller] 失败：无法启动集群 c-4pgjl 的用户控制器：无法联系服务器：获取https://192.168.94.154:6443/api/v1/namespaces/kube-system?timeout=30s：等待集群代理连接 2019/10/05 16:44:34 [错误] ClusterController c-4pgjl [user-controllers-controller] 失败：无法启动集群 c-4pgjl 的用户控制器：无法联系服务器：获取https://192.168.94.154:6443/api/v1/namespaces/kube-system?timeout=30s：等待集群代理连接 2019/10/05 16:48:50 [错误] ClusterController c-4pgjl [user- controllers-controller] 失败：无法启动集群 c-4pgjl 的用户控制器：无法联系服务器：获取https://192.168.94.154:6443/api/v1/namespaces/kube-system?timeout=30s：等待集群代理连接 2019-10-05 16:50:19.114475 I | mvcc: store.index: 紧凑 75951 2019-10-05 16:50:19.137825 I | mvcc：在 75951 完成预定的压缩（耗时 22.527694 毫秒）2019-10-05 16:55:19.120803 I | mvcc：store.index：紧凑 76282 2019-10-05 16:55:19.124813 I | mvcc：在 76282 完成预定的压缩（耗时 2.746382 毫秒）

之后我查看了master节点的日志，发现rancher代理仍然尝试连接旧的rancher服务器（旧的ip地址），而不是新的，所以集群不可用。

我怎样才能解决这个问题？

kubernetes rancher rke

2019-10-06T00:52:03.197

0 投票

2 回答

5748 浏览

nginx - NodePort 上的 Kubernetes Nginx 入口控制器

我正在由 RKE 管理的 Kubernetes 集群上部署基于 nginx 的入口控制器。（我也直接尝试过没有 RKE）。

在这两种情况下，它都会尝试在主机上使用/绑定到Ports 80和443，但它失败了，因为在security policy所有服务帐户的 pod 中我不允许主机端口。

事实上，我不需要直接在主机上访问入口，但我想在from external上访问ingress controlleras a 。ServiceNodePortLoadBalancer

有没有办法部署Nginx ingress controller不使用任何主机端口。

nginx kubernetes rancher nginx-ingress rke

2019-10-26T19:39:28.823

0 投票

3 回答

3296 浏览

kubernetes - 无法获得作业 rke-network-plugin-deploy-job 的作业完成状态

我在具有以下规格的气隙环境中对 rke 进行了分解：

节点：

3 个控制器和 etcd 2 个工作人员

RKE 版本：v1.0.0

码头工人版本：

操作系统和内核：（Oracle linux 7）

主机类型/提供者：VirtualBox（测试环境）

cluster.yml 文件：

重现步骤：

结果：

kubectl 获取 pods --all-namespaces

kubectl 描述 pod rke-network-plugin-deploy-job-zqhmk -n kube-system

容器日志：docker logs -f 267a894bb999

网络接口

码头工人网络状态

码头工人网络 ls

问题与网络接口有关吗？如果是：我该如何创建它？

kubernetes rancher rke

2020-01-12T08:40:16.520

0 投票

1 回答

5643 浏览

amazon-ec2 - 错误 504 网关超时 nginx-ingress 控制器

我在 EC2 AWS 实例中设置 RKE 集群，但我在尝试设置 nginx 入口控制器时遇到问题，有时在尝试访问它时会出错。我的架构是这样的：

实例 #1 它只是一个在每个节点中执行负载均衡器的 nginx 服务器，#2 和 #3 是一个 RKE 节点都具有这些角色： - controlplane - worker - etcd

我已经部署了两个服务/部署。我试图设置一个 nginx 入口控制器，以根据路径将流量重定向到每个服务，但有时我只是得到 504 Gateway Time-out 而其他一个加载正确。使用 hey 进行小负载测试，我看到几乎 50% 的人得到了 504 错误。状态码分布：【200】102响应【504】98响应

调试 nginx-ingress 控制器我看到其中一个似乎无法访问服务，我认为出于这个原因有时我会收到 504 错误，但我不知道为什么。

Kubernetes 配置：

我的理论是入口控制器无法访问其他节点中的服务，因为我收到了 504 错误，但据我所知，集群中的任何节点都可以访问服务。有人知道这里会发生什么吗？

谢谢，

amazon-ec2 kubernetes nginx-ingress rancher rke

2020-01-27T03:02:12.040

0 投票

0 回答

1625 浏览

docker - RKE - 无法连接到服务器：net/http：TLS 握手超时

我有一个 CentOS vm（用于安装 RKE）和 3 个节点安装的 rancherOS（vmware 版本从这里用于控制平面、etcd 和工作节点）

我收到“已成功构建 Kubernetes 集群”消息，但在编写“kubectl get nodes”命令时出现错误。安装rke后，kubectl命令不起作用，我从官网手动安装。

结果：

结果，当我使用 Rancher 用户运行它时打印此错误：无法连接到服务器：net/http：TLS 握手超时

使用root：来自服务器的错误：etcdserver：请求超时

问题出在哪里？我的 rke 设计正确吗？

RKE（一个 vm Centos）
- controlplane-etcd-worker 节点 (rancherOS)
- controlplane-etcd-worker 节点 (rancherOS)
- controlplane-etcd-worker 节点 (rancherOS)

环境信息

RKE 安装的虚拟机：CentOS - 2CPU / 4GB 内存 RancherOS 安装的虚拟机：2CPU / 4GB 内存

在 RKE 服务器 (CentOS)

在 RancherOS 虚拟机中

docker kubernetes rancher rke rancheros

2020-02-11T12:11:13.153

0 投票

2 回答

5043 浏览

terraform - 为什么 Terraform 看不到我手动安装的提供程序？

我正在尝试将RKE 提供程序安装为Rancher AWS quickstart的一部分。Terraform 文档说插件应该安装在~/.terraform.d/plugins. RKE 文档说插件应该安装在~/terraform.d/plugins/<your_platform>.

为了协调相互冲突的信息，我尝试将二进制文件复制到以下所有位置，但 Terraform 从未见过它们中的任何一个：

在每种情况下，当我运行时terraform init，都会出现以下错误：

作为最后的手段，我可以使用terraform init -plugin-dir=<something>. 但是随后 Terraform 看不到任何自动下载的插件，我必须手动安装所有内容。

是否缺少一些路径变量，或者我未能遵循的其他命名约定？

terraform rancher rke

2020-05-04T20:02:29.977

问题标签 [rke]

码头工人网络状态

Reference