问题标签 [thanos]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
monitoring - 使用 kubernetes 堆栈部署 prometheus operator 后未创建 Prometheus statefulset
我已经在k8s集群上部署了prometheus operator。Kubernetes堆栈也随之部署。所有CRD文件都创建了但prometheus statefulset没有创建(prometheus-k8s-0没有创建)。
monitoring - 当 Prometheus 出现故障时,所有历史指标都会消失,即使是灭霸加入了
我在我的 k8s 集群上安装了 Prometheus+Thanos,S3 存储桶通过 MinIO 连接到 storegateway。我注意到每次重新创建 Prometheus 副本时,所有历史数据都会从 grafana 仪表板中消失。鉴于 prometheus 正在使用 docker 卷,这是正常的,但 Thanos 查询不应该通过 storegatway 从 s3 存储桶中带来历史数据吗?我在 Grafana 上使用 thanos-query 作为数据源。
kubernetes - 聚合 2 个 PromQL 量规指标,而不包括来自右操作数的额外标签
是否可以聚合 2 个规格指标(即kube_pod_labels
和kube_pod_container_resource_requests_cpu_cores
),以便通过执行查询将两个结果元素组合起来(即所有 pod 标签作为结果元素,request_cpu_cores 作为值)?
查询 cpu 请求值如下所示sum by (namespace, pod) (kube_pod_container_resource_requests_cpu_cores{cluster="my-cluster"})
实际结果:
查询 pod 标签是kube_pod_labels{label_foo="bar"}
实际结果:
我曾尝试使用左关节,但似乎需要按给定标签(pod、命名空间等)进行分组,如https://www.robustperception.io/left-joins-in-promql中所述。
使用multiplication
运算符*
可以获得所需的结果集,但该集仅包含by
子句中指定的标签。示例查询:
示例结果:
我想要获得的是一个包含所有标签的结果集,而不必按任意标签/值进行过滤
加入 2 个查询的期望结果应该是:
amazon-s3 - Thanos 在 S3 中缺少指标
我有 2 个 Prometheus,其边车在 k8s 中运行,可将块上传到 AWS S3 存储桶,本地保留时间设置为 5 天。然后,我的 Thanos Query 将连接到 2 个 sidecar 以获取最近的指标,并连接到 Thanos Store 以从 AWS S3 存储桶中获取较旧的指标。
在我的存储桶上运行 aws s3 ls 后,我发现缺少未上传到 S3 存储桶的指标。
由于在此期间我没有更改任何配置到我的设置,有什么原因吗?
另一个奇怪的事情是,从 S3 存储桶中的文件日期来看,从 7 月 13 日到 7 月 17 日我没有任何块,但存储能够检索这些日期的指标。
kubernetes - 如何将 Kubernetes 服务 TargetPort 定义为字符串?
Thanos 需要在 Service 中将 targetPort 定义为字符串,以便 ServiceMonitor 与之通信。
但是,仅将 targetPort 定义为字符串会导致问题。我相信部署中还需要更多东西。我认为必须在部署中定义 targetPort 'web'。
任何人都可以协助部署的外观吗?
prometheus - 在thanos查询中,prometheus sidecar状态为health,但是我查询时,报错:grpc: the client connection is closing
在thanos查询中,prometheus sidecar状态为health:</p>
但是当我查询时,会报错:
执行查询时出错:扩展系列:代理系列():地址:10.0.66.140:10901 标签集:{prometheus="monitoring/k8s", prometheus_replica="prometheus-k8s-0"} Mint:1633225317596 Maxt:9223372036854775807:从Addr: 10.0.66.140:10901 LabelSets: {prometheus="monitoring/k8s", prometheus_replica="prometheus-k8s-0"} Mint: 1633225317596 Maxt: 9223372036854775807: rpc error: code = Canceled desc = grpc: 客户端连接正在关闭
Thanos 查询 Pods 出现以下错误:
不知道这是什么原因,谁能帮忙提供一些思路。我的对象存储是正常的,prometheus的监控数据已经从sidecar上报到对象存储了。
Thanos查询yaml(省略不必要的内容),未设置资源:
redis - twemproxy 代理是否能够将“memcached”请求转换为“redis”集群?
在我们将 Thanos 查询前端组件集成到我们的架构中时,我们意识到我们可以利用支持的 memcached 缓存系统。然而,由于我们已经管理和支持了一堆 Redis 集群,我们正在考虑使用 twemproxy 代理 Memcached 请求。此代理同时支持 Redis 和 Memcached,但不清楚的是:“twemproxy 能否将 memcached 转换为 redis 请求并实际将 Memcached 请求代理到 Redis 集群?谢谢
prometheus - 如何用示例 Prometheus 数据填充 S3 存储桶?
我有测试环境(最新的Prometheus Agent + Thanos Receive/Query/Store + S3 bucket)。Prometheus Agent 立即将指标转发给 Receiver。我想用 1 年的样本数据填充 S3 存储桶,以进行测试/基准测试。我尝试thanosbench block plan
+thanosbench block gen
注入到 Thanos Receive tsdb.path 但没有运气。不得不做错事。有任何想法吗?
amazon-web-services - 并行工作的新实例显示像 1 这样的舍入值
我正在将一个旧的 prometheus 实例迁移到一个 ecs 环境,其中有 2 个 prometheus 并行运行。它们都查询 jmx_exporter 并返回类似于以下的值:
wl_71_OperatingSystem_system_cpu_load {name = "system_cpu_load", type = "OperatingSystem",} 0.2474420888925268
在我当前的普罗米修斯(一个实例)中,我没有问题,但是在并行工作的新实例中,它会随机显示像 1 或 0.5 这样的圆形值(我知道它不是圆形的,但我希望你能理解我)。奇怪的是,回顾旧的prometheus这些值并没有这样记录。
关于这一切的另一个奇怪的事情是,在普罗米修斯图中,当我放大标记为 1 时的值时,它向我展示了真正的细节!
图表示例:
https://i.imgur.com/CaIp0Fg.png
飞涨:
https://i.imgur.com/VN0hcLx.png
有任何想法吗 ?
prometheus - 在没有 Kubernetes 的情况下使用 Prometheus Thanos
我想安装 Thanos 来制作我的 Prometheus,它安装在 EC2 上。但是灭霸的安装步骤,到处都是 Kubernetes 中提到的边车进程。
有没有办法像代理一样在 EC2 上安装灭霸?任何参考?