问题标签 [kubernetes-health-check]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1657 浏览

go - 我应该如何在 Kubernetes 中检查我的 go 服务的健康状况?

我在 Kubernetes 的一个 pod 中运行一个用 go 编写的服务。该服务不公开 HTTP 接口;它正在处理队列中的工作。

我可以:

  • 使用可执行的活动检查来查看进程是否正在运行
  • 公开 HTTP 健康检查端点
  • 使用 expvars 公开基本健康数据。

在 go/Kubernetes 中是否有一种通用/惯用的方式来执行此操作?

0 投票
1 回答
1204 浏览

docker - kube-controller-manager 将一个 pod 从关闭节点迁移到另一个健康节点需要多长时间

我的 /etc/kubernetes/config 如下:

/etc/kubernetes/controller-manager 像这样:”

我创建了一个部署:“dep1”,它只有一个 pod,这个 pod 部署在一个健康节点:“test1”,然后在 test1 exec 中:

制造“节点关闭错误”。大约 30 秒前节点:test1 变为 NotReady 状态(kubectl get node在 kubemaster 机器中)。但是在部署五分钟后:dep1 的 pod 转移到另一个节点。所以我有两个问题:

  1. 如何控制一个节点关闭该节点中的 pod 转移到另一个健康节点的时间?

2.-pod-eviction-timeout=10s,这个参数好像没用,因为kubelet宕机了,没有人可以删除那个pod。谢谢!

0 投票
1 回答
2546 浏览

dns - SkyDNS MissingClusterDNS in pods

I installed kubernetes 1.2.4 on 3 REHEL7 servers (no internet access, everything is pushed by ansible).

EDIT: See the end of the question

I've got everything working great excepting the kube-dns example given in documentation. I made several tests, several configuraiton, recreate the entire pods... And I always have this "MissingClusterDNS" error:

As you can see, kube-dns is running:

And kubelete has got correct options

Proof:

But, the DNS pod as a not running container:

And the log is explicit:

If you need more information:

If someone can help me to understand the problem...

Note I'm using https://github.com/kubernetes/kubernetes/tree/release-1.2/cluster/addons/dns rc and svc where I only changed:

  • clusterIp to a valid ip in my kubernetes ip range
  • cluster domain: kubernetes.local
  • cluster dns: 172.16.0.99

EDIT: The problem for the 3/4 kube-dns working comes from certificates. So I can confirm that SkyDNS is working now.

Using cluster-api-tester:

But others problems appear.

  • now "Using kubernetes API nil" instead of the good version
  • the busybox example from kubernetes documentation still won't resolv kubernetes.local

I will more investigate. But I resolved the skydns starting issue. Thanks

0 投票
1 回答
894 浏览

kubernetes - Kubernetes/GCE 入口控制器失败

我是 Kubernetes 的新手,我正在尝试使用 TLS 在 Google Container Engine 上进行 HTTP 负载平衡(使用包含的 GCE 入口控制器)。即使按照谷歌的官方教程,我的错误也是可以重复的。为了便于阅读,我总结了以下过程config.yaml

然后:

(我删除了防火墙规则上的标签,因此它将适用于所有人)。

但是我得到了一个502 Server Error根据文档,这意味着它很可能是自举(但它总是这样)。我可以在控制台上看到后端不健康。

在文档中,为避免这一需求:

  • 防火墙规则(在上面完成)
  • 服务必须以 200 响应(但我在nginx本地测试了图像,并通过通用负载均衡器测试了服务,工作正常)

那么这个错误的原因是什么,我该如何进一步调试呢?

0 投票
2 回答
320 浏览

google-compute-engine - GCE L7 的音源范围是多少?

K8s 文档中,以下源代码范围是硬编码的:130.211.0.0/22. 这是固定的还是我可以使用某些命令(例如gcloudkubectl)来获取它?

我试图检查 K8s 对象,但我没有找到这个源范围以创建文档中指出的防火墙规则。

0 投票
2 回答
189 浏览

amazon-web-services - 在 AWS 中创建 Kubernetes - ap-northeast-2 区域引发错误“请直接指定 AWS_IMAGE(区域无法识别)”

在 AWS 云 ap-northeast-2 区域中创建 Kubernetes 集群会抛出“请直接指定 AWS_IMAGE(区域无法识别)”消息。

尝试通过设置区域“export KUBE_AWS_ZONE="ap-northeast-2a"”。但仍然无法创建。

kubernetes/cluster/aws/config-default.sh

0 投票
3 回答
3056 浏览

kubernetes - 带有查询字符串参数的 Kubernetes 活跃度探测

我查看了文档并浏览了源代码,但我似乎无法弄清楚如何做到这一点。在实现 Kubernetes 活跃度探测时,有什么方法可以将查询字符串参数与路径一起发送?

我发送的字符串,看起来像这样:

变为 URL 编码并以如下方式访问服务器:

因为我在这个特定的 API 上没有这样的路由,所以我得到一个 404,并且 Kube 在分配的超时后获取 Pod。

有没有办法将查询字符串参数定义为活性探针和/或欺骗 URI 编码器以允许查询字符串参数?

0 投票
1 回答
17020 浏览

kubernetes - Kubernetes/Container Engine:TLS 握手超时

大约 7 小时前,我正在使用 kubectl 没有问题。现在(经过几个小时的睡眠,并重新启动我的计算机)所有 kubectl get 命令都给我这个错误:

除了关闭我的计算机之外,我没有做任何事情,因为它起作用了。

由于我是 Kubernetes 和 GCE 的新手,我需要一些关于这可能是什么以及在哪里寻找的提示。

0 投票
1 回答
974 浏览

kubernetes - kubernetes pod 正在使用新 ID 重新启动

我正在使用的 pod 由 kubernetes 管理。当我使用 docker restart 命令重新启动 pod 时,有时 pod 会获得一个新的 id,有时是旧的。当 pod 获得一个新的 id 时,它的状态首先会从 running ->error->crashloopbackoff 开始。谁能告诉我为什么会这样。还有kubernetes多久做一次健康检查

0 投票
7 回答
17798 浏览

kubernetes - 监控 Kubernetes 作业

我有 kubernetes 工作需要不同的时间才能完成。4到8分钟之间。有什么方法可以知道工作何时完成,而不是在最坏的情况下等待 8 分钟。我有一个执行以下操作的测试用例:

问题是,在我在 kubernetes 中提交部署作业的 java 测试中,我等待 8 分钟,即使该作业完成的时间少于那个时间,因为我没有办法从 java 监视作业的状态测试。