问题标签 [prometheus-operator]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2171 浏览

grafana - 如何使用 helm chart 将 smtp 设置添加到 prometheus-operator?

我通过 values.yaml 提供 smtp 配置,但 grafana 无法采用此设置

通过 values.yaml 提供 smtp 配置

在 cmd 下使用来安装图表

更新值后,grafana 应该能够发送电子邮件,但我看到http://localhost:3000/admin/settings没有使用 values.yaml 文件提供的值进行更新

0 投票
2 回答
97 浏览

kubernetes - 是否可以在分布式环境中部署 Prometheus Operator?

我所拥有的:Prometheus Operator Helm 图表部署在一个相同的 Kubernetes 集群上,它也是应用程序集群。因此,所有与应用程序相关的 pod、prometheus 导出器 pod、Grafana pod 和 Prometheus 本身都位于同一个集群中。

我想要什么: 我想拆分上述配置是这样一种方式,即我在应用程序集群中存在所有与应用程序相关的以及导出器 pod,同时将 Prometheus 和 Grafana pod 部署到单独的一个(为了没有单点故障)

有没有办法使用 Prometheus Operator 来实现这一点?

0 投票
1 回答
1588 浏览

prometheus - 如何在普罗米修斯的 1 分钟窗口内总结 15 秒的间隔?

我有 prometheus 运算符,它每 15 秒刮一次指标: 在此处输入图像描述

我想“缩小一点”并显示我每 1 分钟的延迟总和。但是,我找不到这样做的查询。rate()我用and尝试了各种选项sum_over_time(),但查询只是出错了。

我还尝试更改此选项:更改 在此处输入图像描述 为 1 m。发生的事情是 4 个 15 秒间隔中的 3 个被省略了。而不是在一分钟内总结我所有的 15 秒结果。

我怎样才能达到预期的结果?

0 投票
2 回答
7530 浏览

kubernetes - prometheus-operator中如何监控外部服务

我正在尝试在 prometheus-operator 中监视外部服务(它是 cassandra 指标的导出器)。我使用 helm 2.11.0 安装了 prometheus-operator。我使用这个 yaml 安装了它:

以及我的 kubernetes 集群上的这些命令:

接下来,根据文章: 如何监控到外部服务

我尝试执行其中描述的步骤。正如建议的那样,我为现有的 Prometheus 创建了带有标签的 Endpoints、Service 和 ServiceMonitor。这是我的 yaml 文件:

在普罗米修斯服务发现页面我可以看到: 服务发现

该服务未激活且所有标签均已删除。我做了很多事情试图解决这个问题,比如设置 targetLabels。尝试重新标记曾经发现的内容,如此处所述:prometheus relabeling 但不幸的是,没有任何效果。可能是什么问题,或者我怎样才能更好地调查它?

0 投票
1 回答
487 浏览

prometheus - 具有副本和持久卷的 Prometheus 不是已经 HA 了吗?

我一直在探索很多选项来让我们的 Prometheus 设置一个高可用的选项。到目前为止,我已将其归结为两个:1. promxy - https://github.com/jacksontj/promxy(为了方便和简单) 2. Thanos - https://thanos.io/getting-started.md/(对于它的超级查询者)

但是,在裸机上,我仍然可以拥有 2 个 Prometheus 实例,并设置上述两个实例中的任何一个以拥有 HA 和可扩展的 Prometheus。

但是在 Kubernetes 上,我有 2 个 Prometheus 副本以持久卷运行并暴露在 NodePort 上,这不是 HA 解决方案吗?

PS:我正在使用 coreos Prometheus 操作符设置 Prometheus

0 投票
1 回答
333 浏览

kubernetes - 如何安装 prometheus operator 并从安装在不同 kubernetes 集群上的远程 Thanos 收集指标

有什么方法可以在 Kubernetes 集群上安装 Thanos 并从不同 Kubernetes 集群上的远程 prometheus 操作员收集指标?如何配置 Thanos 从远程 prometheus 操作员吊舱收集数据?

我在 AWS 上使用 Kubernetes 1.12.8。

0 投票
1 回答
7760 浏览

prometheus - 从原始 Prometheus 规则文件创建 prometheus-operator `PrometheusRule` (CRD)?

像这样的 Prometheus 规则文件:

Kubernetes prometheus-operator 需要额外一层 yaml 配置数据,如下所示:

对于使用前一种原始 Prometheus 规则格式的文件,我可以使用 Prometheuspromtool运行单元测试。(见下面的链接3)

对于使用后者扩展 PrometheusRule 格式的文件,我可以使用kubectl apply -f prometheus_rule_file.yaml将规则加载到我的 prometheus-operator 安装中。

我想以其中一种文件格式编写和维护规则,并能够在 promtool 的单元测试系统中使用相同的规则文件,并将相同的规则加载到 prometheus-operator 安装中。我没有看到一个简单的方法来做到这一点。

有没有一种方法可以让我使用原始 Prometheus 规则格式的规则并将其加载到 prometheus-operator PrometheusRule 中,而无需维护单独的冗余 yaml 文件,也无需编写自定义工具来转换它?

  1. https://prometheus.io/docs/prometheus/latest/configuration/alerting_rules/
  2. https://github.com/coreos/prometheus-operator/blob/master/Documentation/user-guides/alerting.md
  3. https://prometheus.io/docs/prometheus/latest/configuration/unit_testing_rules/
0 投票
2 回答
10067 浏览

kubernetes - 如何在 Prometheus-operator 上重新标记抓取作业?

我第一次尝试使用 prometheus-operator,但仍然在努力解决通过它管理 Prometheus 的差异。

static_configs部署非常简单,编辑规则也是如此,但是在使用 Prometheus-operator时尝试重新标记导出器时我找不到方法。

我过去所做的是自定义prometheus.yml和添加static_configs以包含每个出口商工作名称的标签。

我知道在 Prometheus-operator 的引擎盖下,我们具有与通常相同的设置,但我不确定如何static_config使用操作符从配置中获得相同的结果。

据我所知,我现在必须在与我的出口商相关的服务监视器上设置重新标记,但是我尝试过的所有配置都没有结果:

尝试metricRelabelings按照 issue 1166的描述进行,并StaticConfigs按照issue 1086的描述进行尝试,但没有任何运气。

例如,这是我过去为kubernetes-cadvisorexporter 设置标签的方法static_config,以便我的自定义标签显示在我的 exporter 在摄取时间收集的所有指标上:

relabel_configs在我的每个出口商工作中添加:

这是一个metricRelabelings在 Prometheus-operator 上使用 , 实现相同功能的示例,它仍然不适合我:

我期望实现的是在我的导出器上创建一个静态标签,以便所有指标都带有我在抓取时定义的自定义标签,而不必为我的集群中的所有部署手动定义自定义标签。

提前感谢您的帮助!

0 投票
1 回答
792 浏览

prometheus - 将 Sidecar 部署到 Prometheus

我已尝试部署Prometheus OperatorWithThanos但我无法成功将Thanossidecar 部署到Prometheus pod你能帮我在部署sidecar.

我已经在我的集群中成功部署了Prometheus operator,然后我按照以下命令创建了秘密

然后我Thanos通过以下命令验证了sidecar

其中 prom-op 是我创建的 Prometheus 运算符的名称。

但我看不到 prometheus 吊舱中部署的 thanos sidecar。谁能帮我解决我做错的问题。

0 投票
0 回答
700 浏览

kubernetes - Rancher 集群监控 + Prometheus Operator?

我正在使用 Rancher 管理几个 k8s 集群。我已经使用 Rancher 的集群监控应用程序设置了其中的大部分(因此图形和 grafana 链接显示在 Rancher 中的工作负载监控等下)。

问题:有没有办法将 Rancher 配置为从中提取指标/图表prometheus-operator

我在 Slack 中问过这个问题,但根本没有得到答案或回应。

原因:似乎我可以配置/添加其他配置(configmaps)prometheus-operator,但我无法添加到通过 Rancher 的集群监控应用程序安装的 prometheus。

Rancher 安装了 prometheus-operator,但在应用中说不要碰它(截图) 在此处输入图像描述

编辑:

这就是我一直以来的样子:

additionalScrapeConfigs:[]

https://github.com/rancher/system-charts/blob/dev/charts/rancher-monitoring/v0.0.3/charts/prometheus/values.yaml#L61

storageSpec: {}

https://github.com/rancher/system-charts/blob/dev/charts/rancher-monitoring/v0.0.3/charts/prometheus/values.yaml#L35

与 coreos/prometheus-operator 图表不同:rancher-monitoring app 的答案应该是: