问题标签 [google-cloud-monitoring]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
216 浏览

google-cloud-platform - GCP 中 Stackdriver Kubernetes Engine Monitoring 的日志条目指标是什么?

我使用 Google Kubernetes Engine (GKE) 来部署我的服务。在集群中,我启用了Stackdriver Kubernetes Engine Monitoring而不是Legacy Stackdriver LoggingLegacy Stackdriver Monitoring使用旧版监视器,我可以找到名为log entries的日志数量的指标。Stackdriver Kubernetes Engine Monitoring对应的指标名称是什么?

0 投票
1 回答
357 浏览

oauth-2.0 - Stackdriver 登录重定向循环

由于登录页面重定向循环,我无法从 Google Cloud Console 登录 Stackdriver。

这是完整的http请求流程:

请求 3 和 9 是 Stackdriver 的登录页面,如果我只看到 stackdriver 徽标和带有文本的单个链接Log in with Google。我尝试重新启动浏览器(Firefox)并清除所有缓存和站点数据,但行为没有改变。

0 投票
1 回答
122 浏览

policy - 有没有办法让 Stackdriver Alert 更具体?

我正在创建几个指标的监控警报。

我在下面放了 2 个示例:1)数据流作业失败 2)防火墙规则更改或插入了新规则

从中创建基于日志的指标和警报很好。但它非常通用。如何确定特定细节,例如此数据流作业(作业名称)失败或此用户创建的数据流作业失败?防火墙规则也一样,我怎么知道哪条规则被更新了?

如何在警报消息本身中包含有问题的作业名称或精确定位资源?

对于我提供的示例,配置如下 -

防火墙更新指标是使用以下过滤器创建的:

对于数据流失败的作业,度量资源管理器中有可用的度量 - is_failed

0 投票
0 回答
111 浏览

google-cloud-platform - 聚合时是否可以使堆栈驱动程序监视不填充时间序列间隙

我试图通过计算它们的最大值来聚合 2 个在时间上对齐的时间序列(即,这些序列具有相同值的时间段)。

此聚合适用于原始系列具有值的时间段。但是,对于原始序列没有值的时间段(即,两者都有间隙),聚合仍然提供一个值,从而使间隙消失。是否可以避免这种行为并保持聚合结果中的差距?

我正在使用 Metrics Explorer 来构建此查询。查询的来源是一个 StackDriver 指标,我正在使用“max”聚合进行聚合。我将对齐周期设置为 1 m(默认值),对齐器也设置为“max”。没有二次聚合。

0 投票
1 回答
140 浏览

kubernetes - GKE 是在 Anthos 解决方案中默认构建的?获取 Anthos 指标

我在 Google Cloud Platform 中有一个包含 7 个节点和大量服务、节点等的集群。我正在尝试使用 StackDriver Legacy 获取一些指标,因此在 Google Cloud Console -> StackDriver -> Metrics Explorer 中,我列出了所有 Anthos 指标集,但是当我尝试根据该指标创建图表时,它没有显示数据,实际上我在面板中得到的唯一响应no data is available for the selected time frame甚至是更改时间范围和内容。

认为使用 anthos 指标我可以检索有关我的 cronjobs、pod、服务(如初始化失败、作业失败)的信息是否正确?如果是这样,我可以使用 StackDriver Legacy 来做到这一点,或者我需要更新到 StackDriver kubernetes Engine Monitoring ?

0 投票
2 回答
159 浏览

google-cloud-platform - Stackdriver 基于日志的指标不显示日志记录报告的值

我的目标是直接根据日志值建立我的指标。问题是当我将它们显示为图表时,它们看起来像是分布的。如何更改它以显示日志中的值?

记录当前会话

值是分布的

0 投票
1 回答
425 浏览

google-cloud-platform - 如何在 Stackdriver 警报文档中获取 Bigquery 表的名称

我创建了一个 Stackdriver Monitoring 提醒,当我的一个 BigQuery 表在白天的大小增加超过 5% 时,我会向我发送一封电子邮件。警报工作正常,但我想收到有关触发警报的表的信息。

我尝试了几种在GCP 文档中找到的组合,但它们都不适合我。现在我的文档模板如下所示:

有谁知道如何检索表名?

0 投票
1 回答
630 浏览

nginx - GKE NGINX 入口 - Stackdriver 中没有数据

我已经在 GKE 上成功设置了 NGINX 入口。它已经处理了一段时间的交通,所以一切都很好。

但是,它似乎没有向 Stackdriver 报告指标数据。我不确定它是否应该开箱即用,或者我是否必须配置一些东西(也许是这个?:https ://cloud.google.com/monitoring/agent/plugins/nginx )。该插件的说明很清楚,但似乎与 NGINX pod 的布局不兼容(即:无法运行sudo命令、目录结构不同等)。

这是我尝试在 Stackdriver 仪表板中添加图表以显示 NGINX 连接时看到的内容。

Stackdriver 中的活动连接指标

如果有人能阐明我如何让 GKE 部署的 NGINX 入口向 Stackdriver 报告指标,我将不胜感激!:)

干杯,本

0 投票
0 回答
118 浏览

heatmap - 使用stackdriver时如何将grafana中的热图存储桶边界设置为毫秒

我正在尝试使用stackdriver后端为grafana中的请求延迟设置热图。

通过以下查询,我得到了正确的热图,但是桶标签以秒为单位,没有小数点,这意味着有一个 8、4、2 和 1 秒的桶,然后是许多 0 秒的桶。有没有办法切换到 ms 标签?

澄清一下:查询结果中返回的存储桶名称是整数,因此更改可视化中的单位或小数位将无济于事。

在 grafana 编辑器中看到的查询(为了更好的可读性)

目前图表看起来像这样

0 投票
2 回答
1645 浏览

monitoring - 监控 GKE 节点中 CPU 和内存的百分比

我想使用 Stackdriver 监控来监视我的 GKE 节点的 CPU/内存百分比使用情况。

但是,在查看 Stackdriver Monitoring UI 时,似乎没有任何此类选项可用(以百分比表示)。

另一方面,对于(似乎是)绝对内存使用情况,似乎有 2 个极其相似的指标(它们的描述是相同的)。(附截图)。

有谁知道如何提供 GKE 节点上使用的内存和 CPU 的百分比?(不是容器)

在此处输入图像描述

在此处输入图像描述