问题标签 [thanos]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
165 浏览

thanos - Thanos 接收器数据保留 3 小时

在此处输入图像描述我确实设置了 5 个具有 3 小时数据保留时间的 Thanos 接收器副本。我验证了每 2 小时创建的 ULID 文件夹正在创建并在 3 小时后被删除。但是,我的问题是,wal 目录中的数据似乎在不断增加,并且在 3 小时后没有被删除。如果这是预期的行为,我试图在 Thanos 文档中找到有关它的任何信息。我们只提供 20Gi 的 pvc,我们无法将其作为公司成本效益目标的一部分增加。

有什么信息可以让我可以像 ULID 目录一样删除 Thanos Receivers 数据存储中的 wal 目录吗?

预期:wal 目录中的数据文件夹将被删除,就像 ULID 目录在 3 小时后被删除一样。

请给我一些光。谢谢你。

0 投票
0 回答
198 浏览

kubernetes - 两个不同网格之间的 gRPC 连接被重置

我有两个不同的集群(EKS,v1.18),它们有自己的网格(v1.9.0)。

我在集群 A 上有一个 Thanos 部署,在集群 B 上有一个 Prometheus 部署(也运行了 thanos sidecar)。目标是让 thanos 通过内部负载均衡器(ELB 经典)查询远程集群中的这些 sidecar,以代理对每个集群的查询(使用 S3 或类似的块持久性超出此问题的范围)

Gateway、Virtual Service 和 Service 的资源都在集群 B 中,我可以在连接到网络后在本地运行 Thanos,并使用 gRPC 成功连接到集群 B 中的 sidecar。

集群 B 的 FQDN 的 ServiceEntry 已在集群 A 中创建,解析有效,路由正确,但集群 A 中的部署无法连接到集群 B。

Istio sidecars(来自集群 A 中的源工作负载 Thanos)显示连接正在被重置:

我没有在集群 B 的入口网关中看到传入请求(我有一个公共的和一个私有的,我检查了两者以确保)。

我努力了:

  • 使用 DR 强制将 http1.1 升级到 http2
  • 使用 DR 强制禁用 TLS
  • 排除私有 LB CIDR 范围以绕过代理

资源(A 组)

服务入口:

资源(B 组)

网关:

虚拟服务:

服务:

0 投票
0 回答
500 浏览

monitoring - grafana 和 thanos 数据源中的重复时间戳值显示单个时间戳值

Grafana 显示重复的时间戳值,Thanos 显示正确的单个时间戳值。我正在为应用程序 API Thanos 发出一个显示正确值的 curl 请求,但是当我在 grafana 中运行相同的查询时,它显示了两个计数值。我正在使用电报代理来收集普罗米修斯中的指标。

我的整个设置都在 Kubernetes 中运行,并且我正在使用 telegraf statsd 进行应用程序监控。

灭霸仪表板

Grafana 仪表板

电报会议 >>

电报统计配置 >>

和普罗米修斯工作会议>

需要帮助,请分享建议。谢谢

0 投票
0 回答
175 浏览

kubernetes - 普罗米修斯指标在灭霸上不可用

我们正在尝试在灭霸和普罗米修斯的帮助下建立监控平台。我们让 Thanos 运行单独的集群,并且我们有多个 Prometheus 设置,它们通过 remoteWrite 将指标推送到 Thanos 接收器下面是我们在 Prometheus 中使用的 remoteWrite 的配置片段:

以下是 Thanos 接收器进程及其参数:

我们有大约 4 个 Prometheus 实例用完,其中只有两个 Prometheus 实例的指标在 Thanos 上可见。所有 prometheus 实例都具有相同的配置。寻求任何帮助或指导。

0 投票
1 回答
258 浏览

linux - 无法将 bash 脚本作为服务启动 | 灭霸——普罗米修斯

我觉得我尝试了一切,但仍然失败。我正在尝试制作一组​​灭霸、普罗米修斯和格拉法纳。我写了一个脚本,它在终端中就像一个魅力,但无法作为服务启动systemd。我的环境是:

  1. Ubuntu 20.04.2
  2. Docker 20.10.5

我的文件依赖项是这样的:

这是我的脚本内容:

这是我的systemd服务

问题是,如果脚本作为服务启动,它无法运行 prometheus docker 映像,但如果我从终端运行它,它就像魅力一样。其他图像运行正常。我不知道问题出在哪里。任何帮助表示赞赏。先感谢您

编辑


外壳检查输出

这是我启动服务时的错误消息:

0 投票
1 回答
239 浏览

prometheus - Grafana 过滤 Thanos 商店标签| 格拉法纳普罗姆修斯灭霸

我想知道是否有任何方法可以按Thanos+prometheus+Grafana集群中的 Thanos 商店进行过滤。我正在尝试从 Grafana 仪表板查询以从一家商店(我们有 3 家)获取结果。任何帮助表示赞赏,在此先感谢您

0 投票
1 回答
249 浏览

kubernetes - 在特定分辨率下,Thanos 中缺少数据

问题

问题:当在低于某个阈值的分辨率下查询 Thanos 的图形时,当 Prometheus 没有时,Thanos 将返回缺少数据点的数据(见后面的截图)。

设置:一个 Kubernetes 集群。Thanos 的查询器被配置为查询单个 Prometheus 的 sidecar(我这样做是为了测试,以确保这里没有下采样。)查询器在没有--query.auto-downsampling选项的情况下启动。

问题:为什么 Thanos 没有返回 Prometheus 所做的所有数据?


图表

Thanos 查询 12 小时范围,分辨率为 90 秒

Thanos 查询 12 小时范围,分辨率为 90 秒

相同的查询,但在 Prometheus 上

Prometheus 查询 12 小时范围,分辨率为 90 秒

Thanos 查询 6 小时范围,分辨率为 90 秒

Thanos 查询 6 小时范围,分辨率为 90 秒

(我们在 Prometheus 上得到相同的结果)

0 投票
0 回答
32 浏览

prometheus - thanos 查询器是否有一个指标端点,它显示来自商店的所有指标,而不仅仅是 thanos 本身?

我尝试在 thanos 查询器 url 上使用“/metrics”,但我只看到了 thanos 指标。有没有办法使用端点查看商店指标?

0 投票
1 回答
331 浏览

prometheus - 普罗米修斯的灭霸查询器重复数据删除问题

我们是 Prometheus Monitoring 的新手,正面临一个问题。在我们的 Kubernetes 集群上,为了监控我们的 MongoDB 应用程序,我们使用以下设置:

  1. MongoDB 导出器(使用 prometheus-community prometheus-mongodb-exporter Helm Chart 安装),从 MongoDB 应用程序获取指标,将它们转换为 prometheus 可读格式并在 /metrics 端点公开它们。下面的 values.yaml 文件用于覆盖默认图表值。该文件作为参数传递给 helm install -f 命令。

值.yaml:

  1. Prometheus 与 thanos作为 sidecar(使用 bitnami 的 prometheus-operator Helm 图表安装)。我们为 Prometheus 指定了3 个副本,以便为部署的 Prometheus 提供可扩展性。Thanos 作为 sidecar 被用来为部署的 prometheuses 提供 HA。提供了外部标签,以便 Thanos Querier(在第 3 点中提到将使用它对数据进行重复数据删除)。我们正在使用以下 values.yaml 文件来覆盖默认的 prometheus-operator 值。该文件作为参数传递给 helm install -f 命令。

值.yaml:

  1. Thanos Querier(使用 bitnami 的 thanos Helm Chart 安装)查询来自所有 thanos sidecar 的指标,并使用 replicaLabel 参数对从所有 sidecar 接收到的数据进行重复数据删除。此 replicaLabel 参数应与 externalLabels “副本”标签名称匹配。在安装过程中使用 helm ls 命令使用了以下values.yaml 。

值.yaml:

但是数据的重复数据删除并没有发生,因为来自所有副本的相同数据/指标显示在 Thanos UI(附加屏幕截图)中,即使启用了重复数据删除。此外,在 Grafana 的一些指标中,我们收到错误“仅支持返回单个系列/表的查询”,我猜这是因为没有发生重复数据删除。

请帮助我们解决重复数据删除问题。

Thanos UI 中的 Thanos 重复数据删除问题

0 投票
1 回答
33 浏览

prometheus - Prometheus/Thanos -> 我们可以在 Thanos 查询器商店中添加商店特定的 TLS 吗?本质上在同一个存储数组中有 http 和 https

问题:

我添加了两个商店端点。一个是http,另一个是https。对于 https,我添加了 grpc tls 配置,并且我能够在 thanos 中进行身份验证和查看存储,但对于 http。它无法连接。