问题标签 [kubernetes-health-check]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
750 浏览

kubernetes - 为什么我的 DataDog 实例报告 Kubernetes “no_pod”?

我们在 AWS 中运行 Kubernetes 集群,并使用 dd-agent DaemonSet 在 DataDog 中收集指标。

我们的指标中显示了一个标记为“no_pod”的 Pod,它使用了大量资源,Memory/CPU/NetworkTx/NetworkRX。

对这个 pod 是什么,我如何找到它、杀死它、重新启动它等有什么解释吗?

我找到了似乎定义“no_pod”标签的 dd-agent源代码,但我无法理解它为什么存在,它来自哪里以及如何通过 kubectl 等找到它。

在此处输入图像描述

0 投票
0 回答
254 浏览

docker - 由于活性问题或由于停止请求而导致容器重新启动之间的区别

我正在使用Kubernetes,一个 pod 由不同的容器组成。

当两个特定事件发生时,我需要应用不同的行为:

  1. 容器(无论出于何种原因)出现问题,需要重新启动。当活性探测失败时会发生这种情况
  2. 一个 pod 计划停止。例如,我正在推出一个新版本,kubernetes 终止了前一个版本并启动了新版本

根据我在这两种情况下的理解,kubernetes 调用preStop钩子并发送 a SIGTERM,所以我无法理解我在这两种情况中的哪一种。那正确吗?我错过了什么吗?

谢谢

0 投票
1 回答
1209 浏览

kubernetes - 有什么方法可以添加或删除用于部署的探针

有时人们会在没有活跃度/就绪度探测的情况下创建部署。我们如何为该部署修补探针。我尝试使用 PATCH + "Content-Type:application/strategic-merge-patch+json" 它不起作用。

另一方面,如果我们使用探针创建部署,我们如何删除它?

0 投票
2 回答
3688 浏览

backup - 备份/恢复 Kubernetes 的当前状态(命名空间/Pods/Controllers/etc)

我希望能够获得对集群当前状态的描述,以便将来能够从故障中恢复。除了分别从源代码/cli 重新创建所有服务之外,还有哪些可用的解决方案?

0 投票
2 回答
3515 浏览

kubernetes - 配置 Kubernetes 重启策略

根据文档-

由 Kubelet 重新启动的失败容器,以指数回退延迟重新启动,延迟是同步频率 0、1x、2x、4x、8x 的倍数……上限为 5 分钟,并在成功执行 10 分钟后重置.

有没有办法定义自定义的 RestartPolicy?我想尽可能减少退避延迟并放弃指数行为。

据我所知,您甚至无法配置 RestartPoilcy,更不用说制作一个新的了...

0 投票
1 回答
13316 浏览

docker - 何时使用 Docker HEALTHCHECK 与 livenessProbe / readinessProbe

在 Dockerfile 中指定 HEALTHCHECK 的新功能对于 Kubernetes 探测指令似乎是多余的。关于何时使用什么的任何建议?

0 投票
2 回答
11094 浏览

kubernetes - 如何暂停 Kubernetes 服务

我有一个如下所述的设置 - 所以一个简单的复制控制器、服务和一个在谷歌云上使用 kubernetes 部署的 https 入口。

我需要暂时关闭我的应用程序,以便测试堆栈的其余部分如何反应 - 有什么好方法?

我试过删除服务,但是当我重新创建它时,它不会获取后端服务(复制控制器和 pod 已创建,我可以在内部访问它们,但不能通过入口 - 服务没有看见。

0 投票
1 回答
45 浏览

shell - Kubernetes Replication 控制器删除

我在 AWS EC2 实例上运行了Kunernetes pod复制控制器。如果 Pod 的状态为失败或崩溃,则创建该 Pod 的复制控制器必须在 5 分钟后删除。

基本上我想要的是当我运行命令时:

我想考虑状态列的结果,如果有ClashloopBackOff ,那么必须在 5 分钟后删除这些 pod。

这就是我想要自动化的东西,并期待为此编写一个 shell 脚本。

0 投票
3 回答
10376 浏览

kubernetes - 如何使用 prometheus kubernetes 抓取 pod 级别信息?

我正在尝试使用 prometheus kubernetes 抓取 pod 级别的信息。这是我正在使用的配置:

但我没有看到有关 grafana 的任何信息。我需要对我的应用程序进行任何更改吗? 快照

0 投票
2 回答
2193 浏览

kubernetes - 使用秘密 httpHeaders 定义 livenessProbe

我想用一个值为秘密的 httpHeader 定义一个 livenessProbe。

此语法无效:

如果我将my-secret-keyvalue指定secret为名为 的环境变量MY_SECRET_KEY,则可以使用以下方法:

不幸的是,这不是由于评估报价的方式。如果我curl --fail -H "X-Custom-Header: $MY_SECRET_KEY" http://localhost:8080/healthz直接在容器上键入命令,它就可以工作。

我还尝试了许多单引号组合和转义双引号。

有谁知道解决方法?