问题标签 [kubernetes-health-check]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
kubernetes - Kubernetes 是否具有 webhook 或类似功能?
如果 Kubernetes 杀死一个 pod 以及出于什么原因,例如 DEADLINE_EXCEEDED 或 OOM,我希望网络服务器得到通知。Kubernetes 是否有针对这个或其他一些机制的 webhook 功能,当它做某事时我可以被告知。
scala - 如何使基于 REST 的 Web 应用程序稳定且具有弹性(Kubernetes/Docker)
我有一个属于微服务集群的应用程序,我想确保我的服务稳定且有弹性。
它将始终可用,这一点非常重要。
该应用程序是用 scala 编写的
Web 框架正在发挥作用
在 docker 和 kubernetes 上运行应用程序正在管理集群中的容器。
不使用队列或任何东西,请求来了,得到响应(计算当然返回期货)
我是开发运维领域的新手,我想确保我的服务具有弹性?
kubernetes - 点燃就绪探针
在 Kubernetes 中部署一个 ignite 集群时,我遇到了一个阻止集群成员加入组的问题。如果我使用 readinessProbe 和 livenessProbe,即使延迟低至 10 秒,它们的节点也不会相互连接。如果我删除这些探针,它们会发现彼此就好了。
所以,我的问题是:你能用这些探针来监控节点的健康状况吗?如果可以,什么是合适的设置。最重要的是,无论如何,Ignite 有什么好的、快速的健康检查?
google-cloud-platform - Google Cloud Load Balancing 运行状况检查重置
设置
- 谷歌容器引擎(kubernetes)
- 使用我的 Web 服务器应用程序 (Torando/python) 部署 / pod
- Kubernetes 中 Web 服务器服务的入口 - 它在 GCP 中创建了负载均衡器
- 负载均衡器中的后端服务,后端是 Web 服务器
- 指向后端服务器的前端
- 将自定义域和子域定向到相关后端的主机和路径规则
- 由入口创建的防火墙规则集
所以...
当我创建上述所有内容时,我使用正确的端口和所有内容创建了一个新的TCP健康检查。在它更新几分钟后,一切似乎都正常——负载均衡器中有 3/3 个健康的实例,我的后端通过前端完美地暴露出来。我只需要 TCP 健康检查,而不需要 HTTP。
问题
出于某种原因,几分钟后,健康检查配置不断重置为默认的 HTTP 健康检查,这不起作用,导致网关中断,并且任何请求都返回:Error: Server Error
The server encountered a temporary error and could not complete your request.
Please try again in 30 seconds.
这很奇怪,因为它似乎工作了几分钟,但过了一会儿就坏了 - 为什么???
谢谢
centos - 如何添加kubernetes liveness probe
我正在编写一个简单的 YAML 文件以使用 Centos.6 上的 TCP 端口应用活性探测
- 我从公共存储库中提取了一个 centos:6 图像
- 使用图像启动了一个容器。
- 安装mysql,并启动它来验证一个打开的端口(3306)
- 作为“mysql-test:v0.1”提交到本地存储库
并如下应用一个吊舱
但是,pod 的状态是CrashLoopBackOff,而 work02 上的容器的状态是Exited。
1) 主节点
2)工作节点
kubernetes - 如何定义一个 liveness 命令
下面的 livenessProbe(从示例中提取)运行良好。
但是,我的 livenessProbe 不工作。(pod 不断重启)。YAML 在下面
/home/my_home/check.sh(在运行进程数为 1 或 0 时重新启动 pod)如下,这是预先测试的。
bash - 检查每个节点中指定端口的可用性
我有一个 Kubernetes 集群,其部署的端口范围指定为环境变量。在集群顶部运行的应用程序将通过指定的端口范围接收连接,如果在有另一个传入连接时没有可用的端口,则应用程序将关闭所有当前连接(从用户视角)。
我没有开发这个应用程序并且无法控制它。我只是设置和管理集群以及集群所在的虚拟机,但我还负责找出一种方法来监控范围内端口的可用性,以便可以发送警报。
我尝试过的事情:
我编写了一个脚本(如下)来检查单个 VM 上指定端口范围的可用性。问题是我需要能够在集群向上和向下扩展时连续检查所有虚拟机的端口。
对于处理这样的动态环境,我能想到的唯一想法是在集群中拥有一个类似于我的脚本的端口监控应用程序,它将专门对运行其他应用程序的 VM 执行此监控。
但问题是在远程检查端口时,无论端口是否正在使用,状态都是关闭的。我已经尝试过nc -zv <VM_ip> <port>
,相当于在 nmap 中检查远程端口。端口范围通常在 1.6 万或 3 万之间。
但是,在本地检查端口时ss -pu state all
,不会显示未使用的端口。将出现正在使用的端口,并且它们的状态为“UNCONN”,我假设它是未连接的。
如前所述,此脚本能够检查指定范围内的端口是否正在本地计算机上使用。请注意,我计划将此脚本作为后台进程运行,这就是为什么它处于无限循环中的原因。
grpc - gRPC 健康检查是否应该仅限于 gRPC 服务?
关于gRPC 健康检查,如果 gRPC 服务与同样需要健康检查的其他 HTTP 服务托管在同一端口上,那么响应是否grpc.health.v1.Health.Check
应该仅针对提供的 gRPC 服务,或者也回答其他服务是否合理? 如果是后者,应该使用什么模型的服务名称?
我问的部分原因是已经有一个/healthz
Kubernetes 健康检查的模型,并且我试图弄清楚我们是否需要为 gRPC 健康检查提供一个连字,或者可以对现有的健康检查进行卷积,例如,
这样就可以使用库存的 gRPC 健康检查监视器。
kubernetes - HPA(Horizontal pod autoscaling)是否考虑了多个容器(在一个 pod 中)的 CPU 利用率平均值来扩展 pod?
我想知道,如果 HPA 考虑一个 pod 中多个容器的 CPU 利用率平均值,以便按比例放大/缩小编号。豆荚。例如,如果我为具有 2 个容器的部署(pod)指定如下所示的 HPA。为了使 HPA 扩大规模,是否需要两个容器的 CPU 利用率都达到 80%?换句话说,如果容器 A的 CPU 利用率为 80%,但容器 BCPU 利用率仅为 60%。这是否意味着 pod 不会被 HPA 放大。据我观察,情况就是这样。但我不确定这一点,因为在 kubernetes 文档中没有明确声明。不幸的是,我不是从源代码中找出这一点的最佳开发人员。任何帮助,如果可能的话,将不胜感激。太感谢了。