问题标签 [prometheus-blackbox-exporter]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
47 浏览

kubernetes - 没有自动解决 pagerduty 的 Blackbox 警报

我有一个 prometheus >> alertmanager >> pagerduty 设置,我将我的 prod 警报和黑盒端点警报路由到 PagerDuty。

在 PD 中,警报不会自动解决。

这是我的警报管理器配置。

有人可以帮忙吗?

0 投票
1 回答
400 浏览

prometheus - Prometheus 获取停机时间范围的摘要

我正在使用 blackbox_exporter 和 prometheus 监控一些服务。这对于计算服务可用性非常有用,但我在质疑自己是否可以使用 PromQL 获得最近 x 天的停机时间范围的摘要?

例如,如果 probe_success 在下午 1 点到下午 1:30 之间变为 0,然后从下午 3 点到下午 3:15 再次变为 0,我想在 Grafana 中获得这样的列表:

停机时间:

等等。

0 投票
3 回答
398 浏览

prometheus - 如何忽略 Prometheus 中的实例标签

在此处输入图像描述 这是处理的数据流记录的图表。
我在本地系统上运行了我的项目的两个实例。我的 Prometheus 服务器正在从两个实例中抓取值。如果我运行相同的“数据流”(生成这些指标的我的 API 之一)。从这两个实例然后它创建两个图表。因为它们来自两个不同的实例。您可以看到 Dataflow-Product-1 有两个图表。我想要的是来自同一数据流的两个实例的数据应该组合在一个图中。我们可以这样做吗?

这是数据 在此处输入图像描述

在此处输入图像描述

在上面的屏幕截图中,您可以看到 Dataflow-Product-1 有两个图表,其中一个在 15 处运行……而另一个在 10 上,我想要的是在 15 上运行的相同图表应该下降到 10,其他图表不应该产生?什么可以是查询?提前致谢

0 投票
1 回答
129 浏览

kubernetes - 使用 Servicemonitor 通过外部主机名检查服务

我们有一个带有外部 DNS 的设置,可以根据服务注释创建和绑定 dns 条目。

例如,我们有一个警报管理器服务,如下所示:

(缩写)

我想使用带有注解数据的黑盒导出器,所以我们不必在这里手动添加监控,而是依靠 kubernetes 提供信息来监控什么。

为此,我编写了一个 servicemonitor,但它与服务不匹配并调用 blackbox 导出器。

我不明白为什么它不应该与服务匹配。你有什么提示吗?

0 投票
0 回答
26 浏览

kubernetes - 探测 Kubernetes 入口以检查运行状况

我最近部署了一个 promethus blackbox exporter 实例来尝试帮助监控我们集群中的入口状态。为此,我设置了一个使用模块 http_2xx的探测器,该模块工作正常,但并非所有服务都在 / 上返回 200。因此我从某些服务中获得状态代码 404、502 等。关于如何使用黑盒导出器监控集群中入口的健康状况的任何建议?任何帮助表示赞赏

0 投票
2 回答
30 浏览

flask - 如何使用 prometheus-flask-exporter 定期更新指标?

我正在创建一个简单的 Flask webapp,它应该生成一个由 Prometheus 提取的随机指标。我正在使用 prometheus-flask-exporter 库,它使我能够设置指标。

简而言之,我想知道如何在烧瓶内部配置自定义指标,以便它们每隔一段时间从烧瓶应用程序的“/metrics”端点更新。

不是“我多久可以让 prometheus 获取特定指标”

目前我无法在我的烧瓶应用程序中运行循环,因为如果我有一个主类不会运行。

这只是为了概念证明,自定义指标可以是任何东西。

我的应用程序.py:

0 投票
0 回答
4 浏览

prometheus - 如果节点已关闭 - HA 集群中 Prometheus Endpoint 的连接丢失

我在集群中有 2 个节点: Controller-0 Controller-1,

我已经将 Prometheus 部署为 statefullset ,但是当 Any 控件关闭或无法访问时。Statefullset pod 不会在集群中移动活动节点以保持高可用性 (HA)。

如果该节点出现故障/无法访问,则 Promotheus-0 pod 正在运行,与 Prometheus 端点的连接不可用,

任何人都可以让我知道,我们如何解决这个问题。??