问题标签 [prometheus-blackbox-exporter]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
prometheus - 如何标记 Prometheus blackbox_exporter 端点
我有一个带有 Prometheus 的 k8s 集群和一些带有 Web 应用程序的 Pod。我想从这些网络应用程序中收集指标。我为此使用了Prometheus blackbox_exporter。
我配置了服务监视器,部署,由普罗米修斯操作员工作。Prometheus 收集指标,但我无法区分它们。例如,
probe_success{endpoint="http-metrics",instance="10.20.0.105:9115",job="prometheus-blackbox-exporter",namespace="staging",pod="prometheus-blackbox-exporter-66fb58ff97-pd6lk",service="prometheus-blackbox-exporter"}
我应该怎么做才能为每个端点添加额外的标签?
如何将target等标签添加到 probe_success 指标?
服务是
prometheus - Prometheus UI 总是返回 1,即使 blackbox_exporter 手动返回 0
我设置了 Prometheus 和 blackbox 导出器。这里是配置。
我手动检查了 http 站点,它返回了预期的 0。
但如果我在 Prometheus UI 中检查相同的目标,up{instance="http://wiki.itsmwork.com",job="blackbox"} 始终为 1。
我怎样才能确定问题是什么?
prometheus - Prometheus blackbox_exporter 没有跳过 SSL 检查
我在配置中启用了 insecure_skip_verify 参数,但 blackbox_exporter 在 SSL 检查中仍然失败。
kubernetes - prometheus-blackbox-exporter 正在触发误报警报
我们已经使用 Kubernetes 集群中的社区 helm 图表设置了完整的 Prometheus 堆栈 - Prometheus/Grafana/Alertmanager/Node Explorer/Blackbox exporter。监控堆栈部署在其自己的命名空间中,我们的主要软件(由微服务组成)部署在默认命名空间中。警报运行良好,但是黑盒导出器没有正确抓取指标(我猜)并且经常触发误报警报。我们使用最后一个来探测我们的微服务 HTTP liveness/readiness 端点。
我与该问题相关的配置(在 values.yaml 中)如下所示:
这两个警报每小时触发一次,但当时端点是 100% 可访问的。
我们使用默认的 prometheus-blackbox-exporter/values.yaml 文件:
邮件因此看起来是这样的:
另一种类型的电子邮件
我注意到的另一件奇怪的事情是,在 Prometheus UI 中,我没有看到任何 probe_* 指标,如下 所示https://lapee79.github.io/en/article/monitoring-http-using-blackbox-exporter/做错了或错过了做,但收到数百封误报电子邮件非常烦人。
prometheus - Prometheus 的黑盒导出器中的 3 个 ICMP 阶段是什么意思?
当我们通过 BlackBox 导出器探测数据时,Prometheus 中有 3 个 ICMP 阶段。
- 解决
- rtt
- 设置
每个阶段的目的是什么?
这是一个示例数据集:
谢谢
monitoring - Prometheus 使用自定义标头抓取 /metric
我有一个将由 Prometheus 监控的应用程序,但该应用程序需要自定义标头键,例如:
我应该如何处理 prometheus.yml?
monitoring - Prometheus 黑盒探测有用的指标
我有大约 1000 个使用 HTTP 探测的目标。
我想知道目标:
- 过去 10 分钟内 env 的失败率。
- env 在过去 10 分钟内的失败率增加。
- 好奇以下是做什么的:
我已经达到的最接近的是在 10 分钟内通过 env 找到操作: