问题标签 [prometheus-operator]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
prometheus - Prometheus 保留时间设置为 1 年,但不会将数据保留超过默认 15 天
我最近安装了 Prometheus 并使用 Grafana 进行报告。
在安装过程中设置了 Prometheus,保留时间为 1 年 --storage.tsdb.retention.time=1y \
现在,我们从昨天开始注意到 15 天前的数据不再显示。我的代码有问题吗?1y没有被识别吗?
amazon-web-services - Prometheus 警报管理器不发送警报 k8s
我使用 prometheus 操作员 0.3.4 和警报管理器 0.20,但它不起作用,即我看到警报被触发(在警报选项卡上的 prometheus UI 上),但我没有收到任何电子邮件警报。通过查看日志,我看到以下内容,有什么想法吗?请查看粗体警告也许这就是原因,但不知道如何解决它......
这是我使用的普罗米修斯运营商的掌舵者: https ://github.com/helm/charts/tree/master/stable/prometheus-operator
这是我的配置 yaml
https://codebeautify.org/yaml-validator/cb6a2781
该错误表示它在解析中失败,调用的 pod 名称alertmanager-monitoring-prometheus-oper-alertmanager-0
已启动并正在运行,但是它尝试解析:查找alertmanager-monitoring-prometheus-oper-alertmanager-0.alertmanager-operated.monitoring.svc
不确定为什么...
这是输出kubectl get svc -n mon
更新 这是警告日志
这是kubectl get svc -n mon
azure - Helm 不接受值 YAML
我正在安装prometheus operator,我采用了默认的helm chart并通过以下命令安装它:
使用此图表。
安装成功但是它没有从values.yaml
文件中获取值,我做错了什么?例如,我们看不到警报管理器的两个副本(最小可重复性)
猫值.yaml
yaml 的值位于我执行命令的文件夹中。我正在使用 Helm 3
amazon-web-services - helm 不使用 values.yaml 文件
我使用 helm 安装带有稳定图表的 prometheus 操作符,它按预期完成了所有配置,
这是values.yaml
当我运行helm install mon stable/prometheus-operator -n mon -f values.yaml
一切正常时,我能够看到3
警报管理器实例并在日志中看到版本0.20.0
现在我需要做一些我创建的配置和掌舵图helm create v2chart
将我的配置文件添加到template
图表的文件夹并添加以下内容requirements.yaml
并运行helm dep update ./v2chart
我现在在根目录下的图表文件夹中看到prometheus-operator-8.5.0.tgz
现在在根上运行我运行 helmhelm install mon -f values.yaml . -n mon
它采用默认图表值而不是我的values.yaml
配置(我只看到 1 个版本为 0.19 的警报管理器实例)
我在这里想念什么?
顺便说一句,我看到模板中的配置文件配置正确,但是values.yaml
在安装过程中不需要...
kubernetes - Prometheus 仪表板暴露在入口控制器上
我正在尝试在 k8 集群中设置 Prometheus,能够使用 helm 运行。当我使用外部 IP 将 prometheus-server 公开为 LoadBalancer 服务时访问仪表板。当我尝试将此服务配置为 ClusterIP 并使用入口控制器将其作为后端时,同样不起作用。收到 404 错误,关于如何解决此问题的任何想法?
有了上面的入口定义,url“http://<>/prometheus/被重定向到http://<>/graph/,然后404错误页面被渲染。当 url 调整为 http://<>/prometheus/graph 时,一些 web 控件会在浏览器控制台上呈现很多错误。
kubernetes - Helm 3.0.2 试运行 + stable/prometheus-operator?这应该工作吗?
使用 Helm v3.0.2 + 一个新的 Kubernetes v1.14.9 集群。
仅供参考,我已经添加了稳定的回购:
我认为 Helm 3 与现有图表向后兼容?这是一个例外吗?
prometheus-operator 与 Helm 3 不兼容吗?我必须使用 Helm 2 吗?还是有向后兼容的选项?
nginx - Nginx 入口控制器没有为普罗米修斯提供指标
我正在尝试部署一个可以使用 prometheus 监控的 nginx 入口控制器,但是我遇到了一个问题,即似乎没有像我在网上找到的大多数帖子和文档那样创建指标 pod。
我正在使用 helm 部署入口控制器并使用 CLI 参数来启用指标。
这是我的入口文件
如果这会有所不同,我将使用带有以下命令的 prometheus 操作员舵图。
所有命名空间都已经存在,所以这不应该成为问题,至于我在很多地方看到的开发与监控命名空间,这是可以接受的,所以我使用它来让事情更容易弄清楚发生了什么。
kubernetes - 随着时间的推移自动加入普罗米修斯,没有输出
普罗米修斯:v2.15.2 Kubernetes:v1.14.9
我有一个查询,它准确地显示了在设定时间段内随时间变化的最大值。但我想加入 kube_pod_container 资源中已经设置的指标。
我想知道设置的内容是否接近设置的百分比,显示百分比。
我还有其他使用相同度量结构的示例
jvm_memory_bytes_used{instance="url.instance.com.br"} / jvm_memory_bytes_max{area="heap"} * 100 > 80
但这一个不起作用。
max_over_time(sum(rate(container_cpu_usage_seconds_total{pod="pod-name-here",container_name!="POD", container_name!=""}[1m])) [1h:1s]) / kube_pod_container_resource_requests_cpu_cores * 100 < 70
那么第一个想法是创建一个查询来收集容器在短时间内的最大历史 cpu 使用率:
max_over_time(sum(rate(container_cpu_usage_seconds_total{pod="xpto-92838241",container_name!="POD", container_name!=""}[1m])) [1h:1s])
元素:{}值: 0.25781324101515
如果我们这样执行:
container_cpu_usage_seconds_total{pod="xpto-92838241",container_name!="POD", container_name!=""}
元素: container_cpu_usage_seconds_total{beta_kubernetes_io_arch="amd64",beta_kubernetes_io_instance_type="t3.small",beta_kubernetes_io_os="linux",cluster="teste.k8s.xpto",container="xpto",container_name="xpto",cpu="total ",failure_domain_beta_kubernetes_io_region="sa-east-1",failure_domain_beta_kubernetes_io_zone="sa-east-1c",generic="true",id="/kubepods/burstable/poda9999e9999e999e9-/99999e9999999e9",image="nginx",instance= "kubestate-dev.internal.xpto",job="kubernetes-cadvisor",kops_k8s_io_instancegroup="nodes",kubernetes_io_arch="amd64",kubernetes_io_hostname="ip-99-999-9-99.sa-east-1.compute .internal",kubernetes_io_os="linux",kubernetes_io_role="node",name="k8s_nginx_nginx-99999e9999999e9",namespace="nmpc",pod="pod-92838241",pod_name="pod-92838241",spot="false"}值: 22533.2
现在我们有了配置:
kube_pod_container_resource_requests_cpu_cores{pod="xpto-92838241"}
元素: kube_pod_container_resource_requests_cpu_cores{container="xpto",instance="kubestate-dev.internal.xpto",job="k8s-http",namespace="nmpc",node="ip-99-999-999-99.sa -east-1.compute.internal",pod="pod-92838241"}值: 1
好吧,在我看来,这将是使用这两个指标并使其接近这样的百分比:
max_over_time(sum(rate(container_cpu_usage_seconds_total{pod="xpto-dev-92838241",container_name!="POD", container_name!=""}[1m])) [1h:1s]) / kube_pod_container_resource_requests_cpu_cores * 100 < 70
元素: 无数据 值:
但是这两个指标不交互,我不明白为什么,也没有在文档中找到。
问候
postgresql - 您如何从 postgresql 获取 prometheus 指标?
我在 kube-prometheus 之后将 prometheus 安装到了我的 Kubernetes v1.17 KOPS 集群中,确保设置了--authentication-token-webhook=true
和--authorization-mode=Webhook
prerequisets并指定了kube-prometheus/kube-prometheus-kops.libsonnet配置。
然后,我使用提供的values-production.yaml使用https://github.com/helm/charts/tree/master/stable/postgresql安装了 Postgres ,并具有以下设置:
两种服务都已启动并正常工作,但 prometheus 没有从 Postgres 中发现任何指标。
我的 postgres pod上的容器上的日志metrics
没有错误,monitoring
命名空间中的任何 pod 也没有。
让 Postgres 指标导出器到达 Prometheus 还需要哪些额外步骤?