问题标签 [thanos]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
thanos - Thanos 接收器数据保留 3 小时
我确实设置了 5 个具有 3 小时数据保留时间的 Thanos 接收器副本。我验证了每 2 小时创建的 ULID 文件夹正在创建并在 3 小时后被删除。但是,我的问题是,wal 目录中的数据似乎在不断增加,并且在 3 小时后没有被删除。如果这是预期的行为,我试图在 Thanos 文档中找到有关它的任何信息。我们只提供 20Gi 的 pvc,我们无法将其作为公司成本效益目标的一部分增加。
有什么信息可以让我可以像 ULID 目录一样删除 Thanos Receivers 数据存储中的 wal 目录吗?
预期:wal 目录中的数据文件夹将被删除,就像 ULID 目录在 3 小时后被删除一样。
请给我一些光。谢谢你。
kubernetes - 两个不同网格之间的 gRPC 连接被重置
我有两个不同的集群(EKS,v1.18),它们有自己的网格(v1.9.0)。
我在集群 A 上有一个 Thanos 部署,在集群 B 上有一个 Prometheus 部署(也运行了 thanos sidecar)。目标是让 thanos 通过内部负载均衡器(ELB 经典)查询远程集群中的这些 sidecar,以代理对每个集群的查询(使用 S3 或类似的块持久性超出此问题的范围)
Gateway、Virtual Service 和 Service 的资源都在集群 B 中,我可以在连接到网络后在本地运行 Thanos,并使用 gRPC 成功连接到集群 B 中的 sidecar。
集群 B 的 FQDN 的 ServiceEntry 已在集群 A 中创建,解析有效,路由正确,但集群 A 中的部署无法连接到集群 B。
Istio sidecars(来自集群 A 中的源工作负载 Thanos)显示连接正在被重置:
我没有在集群 B 的入口网关中看到传入请求(我有一个公共的和一个私有的,我检查了两者以确保)。
我努力了:
- 使用 DR 强制将 http1.1 升级到 http2
- 使用 DR 强制禁用 TLS
- 排除私有 LB CIDR 范围以绕过代理
资源(A 组)
服务入口:
资源(B 组)
网关:
虚拟服务:
服务:
kubernetes - 普罗米修斯指标在灭霸上不可用
我们正在尝试在灭霸和普罗米修斯的帮助下建立监控平台。我们让 Thanos 运行单独的集群,并且我们有多个 Prometheus 设置,它们通过 remoteWrite 将指标推送到 Thanos 接收器下面是我们在 Prometheus 中使用的 remoteWrite 的配置片段:
以下是 Thanos 接收器进程及其参数:
我们有大约 4 个 Prometheus 实例用完,其中只有两个 Prometheus 实例的指标在 Thanos 上可见。所有 prometheus 实例都具有相同的配置。寻求任何帮助或指导。
linux - 无法将 bash 脚本作为服务启动 | 灭霸——普罗米修斯
我觉得我尝试了一切,但仍然失败。我正在尝试制作一组灭霸、普罗米修斯和格拉法纳。我写了一个脚本,它在终端中就像一个魅力,但无法作为服务启动systemd
。我的环境是:
Ubuntu 20.04.2
Docker 20.10.5
这是我的脚本内容:
这是我的systemd
服务
问题是,如果脚本作为服务启动,它无法运行 prometheus docker 映像,但如果我从终端运行它,它就像魅力一样。其他图像运行正常。我不知道问题出在哪里。任何帮助表示赞赏。先感谢您
编辑
外壳检查输出
这是我启动服务时的错误消息:
prometheus - Grafana 过滤 Thanos 商店标签| 格拉法纳普罗姆修斯灭霸
我想知道是否有任何方法可以按Thanos+prometheus+Grafana
集群中的 Thanos 商店进行过滤。我正在尝试从 Grafana 仪表板查询以从一家商店(我们有 3 家)获取结果。任何帮助表示赞赏,在此先感谢您
kubernetes - 在特定分辨率下,Thanos 中缺少数据
问题
问题:当在低于某个阈值的分辨率下查询 Thanos 的图形时,当 Prometheus 没有时,Thanos 将返回缺少数据点的数据(见后面的截图)。
设置:一个 Kubernetes 集群。Thanos 的查询器被配置为查询单个 Prometheus 的 sidecar(我这样做是为了测试,以确保这里没有下采样。)查询器在没有--query.auto-downsampling
选项的情况下启动。
问题:为什么 Thanos 没有返回 Prometheus 所做的所有数据?
图表
Thanos 查询 12 小时范围,分辨率为 90 秒
相同的查询,但在 Prometheus 上
Thanos 查询 6 小时范围,分辨率为 90 秒
(我们在 Prometheus 上得到相同的结果)
prometheus - thanos 查询器是否有一个指标端点,它显示来自商店的所有指标,而不仅仅是 thanos 本身?
我尝试在 thanos 查询器 url 上使用“/metrics”,但我只看到了 thanos 指标。有没有办法使用端点查看商店指标?
prometheus - 普罗米修斯的灭霸查询器重复数据删除问题
我们是 Prometheus Monitoring 的新手,正面临一个问题。在我们的 Kubernetes 集群上,为了监控我们的 MongoDB 应用程序,我们使用以下设置:
- MongoDB 导出器(使用 prometheus-community prometheus-mongodb-exporter Helm Chart 安装),从 MongoDB 应用程序获取指标,将它们转换为 prometheus 可读格式并在 /metrics 端点公开它们。下面的 values.yaml 文件用于覆盖默认图表值。该文件作为参数传递给 helm install -f 命令。
值.yaml:
- Prometheus 与 thanos作为 sidecar(使用 bitnami 的 prometheus-operator Helm 图表安装)。我们为 Prometheus 指定了3 个副本,以便为部署的 Prometheus 提供可扩展性。Thanos 作为 sidecar 被用来为部署的 prometheuses 提供 HA。提供了外部标签,以便 Thanos Querier(在第 3 点中提到将使用它对数据进行重复数据删除)。我们正在使用以下 values.yaml 文件来覆盖默认的 prometheus-operator 值。该文件作为参数传递给 helm install -f 命令。
值.yaml:
- Thanos Querier(使用 bitnami 的 thanos Helm Chart 安装)查询来自所有 thanos sidecar 的指标,并使用 replicaLabel 参数对从所有 sidecar 接收到的数据进行重复数据删除。此 replicaLabel 参数应与 externalLabels “副本”标签名称匹配。在安装过程中使用 helm ls 命令使用了以下values.yaml 。
值.yaml:
但是数据的重复数据删除并没有发生,因为来自所有副本的相同数据/指标显示在 Thanos UI(附加屏幕截图)中,即使启用了重复数据删除。此外,在 Grafana 的一些指标中,我们收到错误“仅支持返回单个系列/表的查询”,我猜这是因为没有发生重复数据删除。
请帮助我们解决重复数据删除问题。
prometheus - Prometheus/Thanos -> 我们可以在 Thanos 查询器商店中添加商店特定的 TLS 吗?本质上在同一个存储数组中有 http 和 https
问题:
我添加了两个商店端点。一个是http,另一个是https。对于 https,我添加了 grpc tls 配置,并且我能够在 thanos 中进行身份验证和查看存储,但对于 http。它无法连接。