问题标签 [prometheus-operator]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
kubernetes - 如何通过 promethues 获取 kubernetes 部署 CPU 使用情况
我为我的 kubernetes 构建了一个 promethues,它现在运行良好。可以获取node和container/pod cpu,内存数据,但是不知道怎么获取promethues中的kubernetes CPU Usage。因为在我的应用中,如果 pod 重启,deployment 之前不会获取数据。
kubernetes - 如何在 promql 的一段时间内(比如 30 天)获得 kubernetes 中 pod 的最大 cpu 使用率?
我正在尝试估计资源(cpu)请求和限制值,我想知道最近一个月使用 prometheus 的 pod 的最大 cpu 使用率。
我检查了这个问题,但无法得到我想要的从 Prometheus 查询中的返回值生成范围向量
我试过了,但似乎 max_over_time 并没有超过费率
无效参数“查询”:字符 64 处的解析错误:范围规范必须在度量选择器之前,但在 *promql.Call 之后
prometheus - 从系列结果 PromQL 中省略标签
假设我写了一个这样的基本 PromQL 查询
询问:
kube_deployment_spec_replicas{}
结果:
kube_deployment_spec_replicas{deployment="mydeployment",endpoint="myendpoint",instance="myinstance",job="myjob",namespace="default",pod="mypod",service="myservice"}
有没有一种干净的方法可以从结果时间序列中省略instance
和pod
删除?
期望:
kube_deployment_spec_replicas{deployment="mydeployment",endpoint="myendpoint",job="myjob",namespace="default",service="myservice"}
security - K8S - 使用 Prometheus 以安全的方式监控另一个 prometheus 实例
我已经在集群A (主舞会)上安装了Prometheus 运算符 0.34
(按预期工作)现在我想使用联合选项,我的意思是从位于其他 K8S 集群B上的其他 Prometheus 收集指标
Secnario:
- 在集群中有一个主要的普罗米修斯操作员
v0.34
配置- 我在集群B SLAVE prometheus
2.13.1
配置中
两者都通过 helm 成功安装,我可以通过 localhost 访问port-forwarding
并查看每个集群上的抓取结果。
我做了以下步骤
在操作员(主集群 A)上使用 additionalScrapeconfig
我已将以下内容添加到values.yaml
文件中并通过 helm 更新它。
我采取了如下目标:
在集群 B内的普罗米修斯上(我想从中收集数据)我使用:
kubectl get svc -n monitoring
并获得以下条目:
把EXTERNAL-IP
它放在additionalScrapeConfigs
配置条目中。
现在我切换到集群A
并运行kubectl port-forward svc/mon-prometheus-operator-prometheus 9090:9090 -n monitoring
打开浏览器,localhost:9090
查看图表并单击,Status
然后单击Targets
并通过工作看到新目标federate
现在我的主要问题/差距。(安全和验证)
- 为了能够看到
state
绿色的目标(参见图片),我在集群中配置 prometheus 服务器,B
而不是使用type:NodePort
将type:LoadBalacer
指标暴露在外部,这可能有利于测试,但我需要保护它,如何做到? 如何使 e2e 以安全的方式工作......
tls https://prometheus.io/docs/prometheus/1.8/configuration/configuration/#tls_config
在集群 A(主集群)内,我们将证书用于输出服务,istio
如下所示
我看到文档里面有一个配置选项
但不确定我需要在 prometheus operator config 中使用哪个证书,主 prometheus A 或从 B 的证书?
kubernetes - 如何使用 prometheusOperator.admissionWebhooks.enabled=false 在 GKE 上安装 helm chart prometheus-operator?
我想在 GKE 集群上安装helm
图表。stable/prometheus-operator
我知道需要调整防火墙规则或需要通过设置禁用挂钩prometheusOperator.admissionWebhooks.enabled=false
(有关详细信息,请参阅图表的自述文件)。
但是,如果我安装图表
在 GitLab CI 中,podprometheus-operator
有两个容器,它们保持“待处理”状态 5 分钟。我希望这个相当简单的设置可以在一分钟内完成。
您可以在https://gitlab.com/krichter/prometheus-operator-503/-/jobs/358887366检查集群设置。
在 GKE + istio 上安装 Prometheus 中显示的方法不适用,因为我没有安装 istio。
kubernetes - prometheus 警报规则和配置 ui 工具?
同事们,有人可以建议一些 UI 以便于设置警报 prometeia 和 json 当然很酷,但它不舒服,我认为不仅对我来说。谢谢你。
configuration - 如何为普罗米修斯操作员启用其他配置
根据 Prometheus-operator文档,我们应该能够通过秘密文件轻松提供我们的附加配置。有人真的成功了这一步吗?我有几个问题:
- 这些配置将出现在 prometheus pod 的什么位置?
- 这个配置应该是prometheus配置文件的形式还是只是列出额外的scrape条目
- 我们可以通过提供其他文件(json 配置)
file_sd_configs:
吗?如果可以,如何将这些文件提供到 prometheus 清单文件中?
不管这些问题如何,我都很难添加额外的配置。我基本上遵循了 文档中的确切步骤,这是我的观察结果:
- 这是我的新配置
- 添加新的秘密文件
- 使用附加配置创建 prometheus.yml 文件
- 部署 prometheus.yaml
- 检查日志,没有迹象表明我的新配置
而且,当我登录 prometheus pod 时,我也看不到任何其他配置,当我检查我的 prometheus Web 控制台时,我也看不到任何配置。
kubernetes - 普罗米修斯没有刮掉额外的刮痕
我正在使用 stable/prometheus-operator 图表部署 prometheus。它安装在monitoring
命名空间中。在default
命名空间中,我运行了一个以my-pod
三个副本命名的 pod。这个 pod 在端口 9009 上吐出指标(我已经通过执行 k 端口转发验证了这一点,并验证了 localhost:9009 中显示的指标)。我希望 prometheus-operator 抓取这些指标。所以我将下面的配置添加到values.yaml
然后我使用以下命令安装 prometheus:
然而,当我去/service-discover
我看到
问题
如何配置 prometheus,使其从在默认命名空间中运行的 pod 中抓取指标并在端口 9009 上吐出指标?
akka - 如何更改使用哪个prometheus抓取metrcs的端口号
我有一个复制因子为 3 的 pod。该应用程序将指标放在 port 上9001
。我希望普罗米修斯运营商抓取指标。values.yaml
使用 stable/prometheus-operator helm 图表时,我有以下内容。
使用上面的设置,我可以看到 pod,/target
但它正在尝试从端口2551
和8558
. 我想将这些端口中的一个更改为9001
(我的应用程序吐出指标的实际端口)。我想知道我该怎么做?