“prometheus-operator”的相关标签问题

0 投票

1 回答

1843 浏览

prometheus - Prometheus 保留时间设置为 1 年，但不会将数据保留超过默认 15 天

我最近安装了 Prometheus 并使用 Grafana 进行报告。

在安装过程中设置了 Prometheus，保留时间为 1 年 --storage.tsdb.retention.time=1y \

现在，我们从昨天开始注意到 15 天前的数据不再显示。我的代码有问题吗？1y没有被识别吗？

2019-12-18T23:44:23.953

0 投票

1 回答

2484 浏览

amazon-web-services - Prometheus 警报管理器不发送警报 k8s

我使用 prometheus 操作员 0.3.4 和警报管理器 0.20，但它不起作用，即我看到警报被触发（在警报选项卡上的 prometheus UI 上），但我没有收到任何电子邮件警报。通过查看日志，我看到以下内容，有什么想法吗？请查看粗体警告也许这就是原因，但不知道如何解决它......

这是我使用的普罗米修斯运营商的掌舵者： https ://github.com/helm/charts/tree/master/stable/prometheus-operator

这是我的配置 yaml

https://codebeautify.org/yaml-validator/cb6a2781

该错误表示它在解析中失败，调用的 pod 名称alertmanager-monitoring-prometheus-oper-alertmanager-0已启动并正在运行，但是它尝试解析：查找alertmanager-monitoring-prometheus-oper-alertmanager-0.alertmanager-operated.monitoring.svc不确定为什么...

这是输出kubectl get svc -n mon

更新这是警告日志

这是kubectl get svc -n mon

amazon-web-services kubernetes prometheus prometheus-alertmanager prometheus-operator

2019-12-23T19:27:13.527

0 投票

1 回答

97 浏览

azure - Helm 不接受值 YAML

我正在安装prometheus operator，我采用了默认的helm chart并通过以下命令安装它：

使用此图表。

安装成功但是它没有从values.yaml文件中获取值，我做错了什么？例如，我们看不到警报管理器的两个副本（最小可重复性）

猫值.yaml

yaml 的值位于我执行命令的文件夹中。我正在使用 Helm 3

azure kubernetes kubernetes-helm prometheus-alertmanager prometheus-operator

2019-12-24T09:23:47.643

0 投票

1 回答

1358 浏览

amazon-web-services - helm 不使用 values.yaml 文件

我使用 helm 安装带有稳定图表的 prometheus 操作符，它按预期完成了所有配置，

这是values.yaml

当我运行helm install mon stable/prometheus-operator -n mon -f values.yaml
一切正常时，我能够看到3警报管理器实例并在日志中看到版本0.20.0

现在我需要做一些我创建的配置和掌舵图helm create v2chart

将我的配置文件添加到template图表的文件夹并添加以下内容requirements.yaml并运行helm dep update ./v2chart

我现在在根目录下的图表文件夹中看到prometheus-operator-8.5.0.tgz

现在在根上运行我运行 helmhelm install mon -f values.yaml . -n mon

它采用默认图表值而不是我的values.yaml配置（我只看到 1 个版本为 0.19 的警报管理器实例）

我在这里想念什么？

顺便说一句，我看到模板中的配置文件配置正确，但是values.yaml在安装过程中不需要...

amazon-web-services azure prometheus kubernetes-helm prometheus-operator

2019-12-24T15:46:27.227

0 投票

2 回答

1661 浏览

kubernetes - Prometheus 仪表板暴露在入口控制器上

我正在尝试在 k8 集群中设置 Prometheus，能够使用 helm 运行。当我使用外部 IP 将 prometheus-server 公开为 LoadBalancer 服务时访问仪表板。当我尝试将此服务配置为 ClusterIP 并使用入口控制器将其作为后端时，同样不起作用。收到 404 错误，关于如何解决此问题的任何想法？

有了上面的入口定义，url“http://<>/prometheus/被重定向到http://<>/graph/，然后404错误页面被渲染。当 url 调整为 http://<>/prometheus/graph 时，一些 web 控件会在浏览器控制台上呈现很多错误。

kubernetes prometheus kubernetes-ingress nginx-ingress prometheus-operator

2019-12-30T22:47:51.117

0 投票

2 回答

2531 浏览

kubernetes - Helm 3.0.2 试运行 + stable/prometheus-operator？这应该工作吗？

使用 Helm v3.0.2 + 一个新的 Kubernetes v1.14.9 集群。

仅供参考，我已经添加了稳定的回购：

我认为 Helm 3 与现有图表向后兼容？这是一个例外吗？

prometheus-operator 与 Helm 3 不兼容吗？我必须使用 Helm 2 吗？还是有向后兼容的选项？

kubernetes kubernetes-helm prometheus-operator

2019-12-31T04:32:41.527

0 投票

2 回答

2410 浏览

grafana - 如何在使用 grafana 和 prometheus-operator 时配置电子邮件警报

我通过 helm 安装了 prometheus-operator（包括 prometheus/alertmanager/grafana）。然后我通过电子邮件访问 Grafana UI 和配置警报。当我点击发送电子邮件测试时，我收到消息“ SMTP 未配置，请检查您的 grafana.ini 配置文件的 [smtp] 部分”</p>

但我不知道在这种情况下 grafana.ini 可以在哪里改变。

grafana prometheus-alertmanager prometheus-operator

2020-01-02T14:27:05.660

0 投票

1 回答

3775 浏览

nginx - Nginx 入口控制器没有为普罗米修斯提供指标

我正在尝试部署一个可以使用 prometheus 监控的 nginx 入口控制器，但是我遇到了一个问题，即似乎没有像我在网上找到的大多数帖子和文档那样创建指标 pod。

我正在使用 helm 部署入口控制器并使用 CLI 参数来启用指标。

这是我的入口文件

如果这会有所不同，我将使用带有以下命令的 prometheus 操作员舵图。

所有命名空间都已经存在，所以这不应该成为问题，至于我在很多地方看到的开发与监控命名空间，这是可以接受的，所以我使用它来让事情更容易弄清楚发生了什么。

nginx kubernetes kubernetes-helm nginx-ingress prometheus-operator

2020-01-05T17:33:32.030

0 投票

2 回答

1317 浏览

kubernetes - 随着时间的推移自动加入普罗米修斯，没有输出

普罗米修斯：v2.15.2 Kubernetes：v1.14.9

我有一个查询，它准确地显示了在设定时间段内随时间变化的最大值。但我想加入 kube_pod_container 资源中已经设置的指标。

我想知道设置的内容是否接近设置的百分比，显示百分比。

我还有其他使用相同度量结构的示例

jvm_memory_bytes_used{instance="url.instance.com.br"} / jvm_memory_bytes_max{area="heap"} * 100 > 80

但这一个不起作用。

max_over_time(sum(rate(container_cpu_usage_seconds_total{pod="pod-name-here",container_name!="POD", container_name!=""}[1m])) [1h:1s]) / kube_pod_container_resource_requests_cpu_cores * 100 < 70

那么第一个想法是创建一个查询来收集容器在短时间内的最大历史 cpu 使用率：

max_over_time(sum(rate(container_cpu_usage_seconds_total{pod="xpto-92838241",container_name!="POD", container_name!=""}[1m])) [1h:1s])

元素：{}值： 0.25781324101515

如果我们这样执行：

container_cpu_usage_seconds_total{pod="xpto-92838241",container_name!="POD", container_name!=""}

元素： container_cpu_usage_seconds_total{beta_kubernetes_io_arch="amd64",beta_kubernetes_io_instance_type="t3.small",beta_kubernetes_io_os="linux",cluster="teste.k8s.xpto",container="xpto",container_name="xpto",cpu="total ",failure_domain_beta_kubernetes_io_region="sa-east-1",failure_domain_beta_kubernetes_io_zone="sa-east-1c",generic="true",id="/kubepods/burstable/poda9999e9999e999e9-/99999e9999999e9",image="nginx",instance= "kubestate-dev.internal.xpto",job="kubernetes-cadvisor",kops_k8s_io_instancegroup="nodes",kubernetes_io_arch="amd64",kubernetes_io_hostname="ip-99-999-9-99.sa-east-1.compute .internal",kubernetes_io_os="linux",kubernetes_io_role="node",name="k8s_nginx_nginx-99999e9999999e9",namespace="nmpc",pod="pod-92838241",pod_name="pod-92838241",spot="false"}值： 22533.2

现在我们有了配置：

kube_pod_container_resource_requests_cpu_cores{pod="xpto-92838241"}

元素： kube_pod_container_resource_requests_cpu_cores{container="xpto",instance="kubestate-dev.internal.xpto",job="k8s-http",namespace="nmpc",node="ip-99-999-999-99.sa -east-1.compute.internal",pod="pod-92838241"}值： 1

好吧，在我看来，这将是使用这两个指标并使其接近这样的百分比：

max_over_time(sum(rate(container_cpu_usage_seconds_total{pod="xpto-dev-92838241",container_name!="POD", container_name!=""}[1m])) [1h:1s]) / kube_pod_container_resource_requests_cpu_cores * 100 < 70

元素： 无数据 值：

但是这两个指标不交互，我不明白为什么，也没有在文档中找到。

问候

kubernetes prometheus promql prometheus-operator

2020-01-14T18:57:11.843

0 投票

1 回答

669 浏览

postgresql - 您如何从 postgresql 获取 prometheus 指标？

我在 kube-prometheus 之后将 prometheus 安装到了我的 Kubernetes v1.17 KOPS 集群中，确保设置了--authentication-token-webhook=true和--authorization-mode=Webhook prerequisets并指定了kube-prometheus/kube-prometheus-kops.libsonnet配置。

然后，我使用提供的values-production.yaml使用 https://github.com/helm/charts/tree/master/stable/postgresql安装了 Postgres ，并具有以下设置：

两种服务都已启动并正常工作，但 prometheus 没有从 Postgres 中发现任何指标。
我的 postgres pod上的容器上的日志metrics没有错误，monitoring命名空间中的任何 pod 也没有。
让 Postgres 指标导出器到达 Prometheus 还需要哪些额外步骤？

postgresql kubernetes prometheus prometheus-operator

2020-01-22T18:15:42.183

问题标签 [prometheus-operator]

Reference