问题标签 [rke]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2769 浏览

kubernetes - (RKE) FATA[0212] [etcd] 无法启动 Etcd 平面:[etcd] Etcd 集群不健康

我正在尝试使用 RKE 设置一个小型 Kubernetes 集群,其中使用 RKE 有 2 个节点。这两个节点是在 VirtualBox 中运行的 Ubuntu 服务器虚拟机,都具有桥接连接。

虚拟机 1 的 ip:xx.xx.xx.61

虚拟机 2 的 ip:xx.xx.xx.67

当我使用 rke up 启动集群时,出现以下错误:

当我随后运行 kubectl --kubeconfig kube_config_cluster.yml 版本等 kubectl 命令时,我收到以下错误:

不确定这些错误是否是由相同的潜在问题引起的。

可能是什么原因造成的,或者我该如何解决这个问题。我可以查看任何特定的日志文件吗?

这就是 cluster.yml 的样子:

0 投票
1 回答
160 浏览

kubernetes - rke etcd 快照有很多错误

我必须备份我的 kubernetes 集群。我选择使用 Rancher rke 进行 Etcd 备份,但是在恢复备份后,我在 Calico、Nginx-ingress-controller、kube-dns 和 ... 等 Pod 上遇到了太多不同的错误。

etcd备份可靠吗?Kubernetes最好的备份工具是什么?

我尝试从以下位置逐步恢复: https ://rancher.com/docs/rancher/v2.x/en/backups/restorations/ha-restoration/#4-restore-database

0 投票
3 回答
23683 浏览

path - 如何修复入口 404 默认后端

几个月前我开始使用 Kubernetes,实际上我将我的微服务迁移到我的 Rancher 集群 (RKE)。一切都很好,我的部署很好,服务也很好。我想使用入口。

一切看起来都很好,服务是通过入口找到的,豆荚是通过服务找到的。但是,当我尝试访问该网站时,我有一个来自入口控制器的 404 错误页面。

你可以看到我对两条路径的配置:一个 nginx 和一个 grafana。有人知道我该如何修复它并使用入口来做我的反向代理?

非常感谢你的帮助。

我尝试在没有结果的情况下使用 rewrite-target,并且不推荐使用 add-base-url。

0 投票
1 回答
966 浏览

kubernetes - Grafana 仪表板不在 Rancher UI 中显示数据

我在 Rancher UI 中为我的项目启用了监控,它安装成功。但是当我在我的工作量(例如)中单击“转到 grafana”nginx时,它会移动到 Grafana 仪表板,但 Grafana 什么也不显示:0 CPU, 0 memory, 0 networking,...

  • 为什么没有数据?
  • 以及如何知道我的资源(工作负载、服务、pod)的消耗配额?

请看我的截图:

在此处输入图像描述 在此处输入图像描述 非常感谢

0 投票
1 回答
3701 浏览

kubernetes - 恢复 Rancher 时出错:此集群当前不可用;在 API 准备好之前,与它直接交互的区域将不可用

我正在尝试备份和恢复牧场主服务器(单节点安装),如此处所述

备份后,我尝试关闭rancher服务器节点,并在新节点上运行一个新的rancher容器(在同一网络,但另一个IP地址),然后我使用备份文件恢复

恢复后,我登录到rancher UI,它显示以下错误:

在此处输入图像描述

所以,我检查了牧场主服务器的日志,它显示如下:

2019-10-05 16:41:32.197641 http:来自 127.0.0.1:38388 的 TLS 握手错误:EOF 2019-10-05 16:41:32.202442 I | http:来自 127.0.0.1:38380 的 TLS 握手错误:EOF 2019-10-05 16:41:32.210378 I | http:来自 127.0.0.1:38376 的 TLS 握手错误:EOF 2019-10-05 16:41:32.211106 I | http:来自 127.0.0.1:38386 的 TLS 握手错误:EOF 2019/10/05 16:42:26 [错误] ClusterController c-4pgjl [user-controllers-controller] 失败:无法启动集群 c-4pgjl 的用户控制器:无法联系服务器:获取https://192.168.94.154:6443/api/v1/namespaces/kube-system?timeout=30s:等待集群代理连接 2019/10/05 16:44:34 [错误] ClusterController c-4pgjl [user-controllers-controller] 失败:无法启动集群 c-4pgjl 的用户控制器:无法联系服务器:获取https://192.168.94.154:6443/api/v1/namespaces/kube-system?timeout=30s:等待集群代理连接 2019/10/05 16:48:50 [错误] ClusterController c-4pgjl [user- controllers-controller] 失败:无法启动集群 c-4pgjl 的用户控制器:无法联系服务器:获取https://192.168.94.154:6443/api/v1/namespaces/kube-system?timeout=30s:等待集群代理连接 2019-10-05 16:50:19.114475 I | mvcc: store.index: 紧凑 75951 2019-10-05 16:50:19.137825 I | mvcc:在 75951 完成预定的压缩(耗时 22.527694 毫秒)2019-10-05 16:55:19.120803 I | mvcc:store.index:紧凑 76282 2019-10-05 16:55:19.124813 I | mvcc:在 76282 完成预定的压缩(耗时 2.746382 毫秒)

之后我查看了master节点的日志,发现rancher代理仍然尝试连接旧的rancher服务器(旧的ip地址),而不是新的,所以集群不可用。

我怎样才能解决这个问题?

0 投票
2 回答
5748 浏览

nginx - NodePort 上的 Kubernetes Nginx 入口控制器

我正在由 RKE 管理的 Kubernetes 集群上部署基于 nginx 的入口控制器。(我也直接尝试过没有 RKE)。

在这两种情况下,它都会尝试在主机上使用/绑定到Ports 80443,但它失败了,因为在security policy所有服务帐户的 pod 中我不允许主机端口。

事实上,我不需要直接在主机上访问入口,但我想在from external上访问ingress controlleras a 。ServiceNodePortLoadBalancer

有没有办法部署Nginx ingress controller不使用任何主机端口。

0 投票
3 回答
3296 浏览

kubernetes - 无法获得作业 rke-network-plugin-deploy-job 的作业完成状态

我在具有以下规格的气隙环境中对 rke 进行了分解:


节点:

3 个控制器和 etcd 2 个工作人员


RKE 版本:v1.0.0


码头工人版本:


操作系统和内核:(Oracle linux 7)


主机类型/提供者:VirtualBox(测试环境)


cluster.yml 文件:


重现步骤:


结果:


kubectl 获取 pods --all-namespaces


kubectl 描述 pod rke-network-plugin-deploy-job-zqhmk -n kube-system


容器日志:docker logs -f 267a894bb999


网络接口


码头工人网络状态

码头工人网络 ls

问题与网络接口有关吗?如果是:我该如何创建它?

0 投票
1 回答
5643 浏览

amazon-ec2 - 错误 504 网关超时 nginx-ingress 控制器

我在 EC2 AWS 实例中设置 RKE 集群,但我在尝试设置 nginx 入口控制器时遇到问题,有时在尝试访问它时会出错。我的架构是这样的:

在此处输入图像描述

实例 #1 它只是一个在每个节点中执行负载均衡器的 nginx 服务器,#2 和 #3 是一个 RKE 节点都具有这些角色: - controlplane - worker - etcd

我已经部署了两个服务/部署。我试图设置一个 nginx 入口控制器,以根据路径将流量重定向到每个服务,但有时我只是得到 504 Gateway Time-out 而其他一个加载正确。使用 hey 进行小负载测试,我看到几乎 50% 的人得到了 504 错误。状态码分布:【200】102响应【504】98响应

调试 nginx-ingress 控制器我看到其中一个似乎无法访问服务,我认为出于这个原因有时我会收到 504 错误,但我不知道为什么。

Kubernetes 配置:

我的理论是入口控制器无法访问其他节点中的服务,因为我收到了 504 错误,但据我所知,集群中的任何节点都可以访问服务。有人知道这里会发生什么吗?

谢谢,

0 投票
0 回答
1625 浏览

docker - RKE - 无法连接到服务器:net/http:TLS 握手超时

我有一个 CentOS vm(用于安装 RKE)和 3 个节点安装的 rancherOS(vmware 版本从这里用于控制平面、etcd 和工作节点)

我收到“已成功构建 Kubernetes 集群”消息,但在编写“kubectl get nodes”命令时出现错误。安装rke后,kubectl命令不起作用,我从官网手动安装。

结果:

结果,当我使用 Rancher 用户运行它时打印此错误:无法连接到服务器:net/http:TLS 握手超时

使用root:来自服务器的错误:etcdserver:请求超时

问题出在哪里?我的 rke 设计正确吗?

  • RKE(一个 vm Centos)

    • controlplane-etcd-worker 节点 (rancherOS)
    • controlplane-etcd-worker 节点 (rancherOS)
    • controlplane-etcd-worker 节点 (rancherOS)

环境信息

RKE 安装的虚拟机:CentOS - 2CPU / 4GB 内存 RancherOS 安装的虚拟机:2CPU / 4GB 内存

在 RKE 服务器 (CentOS)

在 RancherOS 虚拟机中

0 投票
2 回答
5043 浏览

terraform - 为什么 Terraform 看不到我手动安装的提供程序?

我正在尝试将RKE 提供程序安装为Rancher AWS quickstart的一部分。Terraform 文档说插件应该安装在~/.terraform.d/plugins. RKE 文档说插件应该安装在~/terraform.d/plugins/<your_platform>.

为了协调相互冲突的信息,我尝试将二进制文件复制到以下所有位置,但 Terraform 从未见过它们中的任何一个:

在每种情况下,当我运行时terraform init,都会出现以下错误:

作为最后的手段,我可​​以使用terraform init -plugin-dir=<something>. 但是随后 Terraform 看不到任何自动下载的插件,我必须手动安装所有内容。

是否缺少一些路径变量,或者我未能遵循的其他命名约定?