问题标签 [google-cloud-monitoring]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
97 浏览

google-cloud-monitoring - Stackdriver Uptime Check 给出错误的百分比

Stackdriver 监控的正常运行时间检查给出了错误的百分比(总是 100% 正常运行时间),即使我将视图集中在发生中断的时间段上,有没有办法以 CSV 格式下载信息,所以我可以获得正确的值?

0 投票
1 回答
246 浏览

google-cloud-stackdriver - 基于 GCP 存储桶设置 Terraform stackdriver 警报

我正在尝试通过 terraform 并基于云存储桶条件设置堆栈驱动程序警报策略。因此,每当 GCP 存储桶中有文件时,它应该触发对我们邮件的邮件通知(不使用 SendGrind)。目前,我通过堆栈驱动程序通过 GCP 控制台收到了此邮件通知。但我正在尝试使用 terraform 将其合并。非常感谢任何指导。谢谢

0 投票
1 回答
1040 浏览

google-cloud-platform - Stackdriver API 指标显示许多 429 错误,但未超过配额

本月早些时候,我们在 GCP 上的 3 个项目中启用了 Stackdriver Monitoring。

最近我们发现 Stackdriver API 指标显示了大约 85% 的错误:

在此处输入图像描述

在图表上,这些错误代码是 429:

在此处输入图像描述

我检查了配额,一切似乎都很好:

在此处输入图像描述

下一个指标图告诉我们导致错误的方法:

在此处输入图像描述

使用另一张图“凭据错误”,我发现我们的 GKE 服务帐户发出的 API 请求。我们有 GKE 实例的自定义服务帐户,据我们所知,它具有监控所需的所有权限:

  • roles/logging.logWriter
  • roles/monitoring.metricWriter
  • roles/stackdriver.resourceMetadata.writer(如本期所述)

此外,stackdriver-metadata-agentGKE 集群中的 pod 每分钟都会记录相关错误:

除此之外,我还没有找到任何与该问题相关的日志,而且我无法弄清楚谁每秒向 Stackdriver API 发出 2 个请求,收到 429 错误。

我应该补充一点,以上所有内容都适用于所有 3 个项目。

有人可以建议我们如何解决这个问题吗?

这仍然超出配额吗?如果是,为什么配额的请求指标正常Quota exceeded errors count不包含数据?

我们是否缺少对 GKE 服务帐户的任何权限?

还有什么可以相关的?

提前致谢。

0 投票
1 回答
679 浏览

google-cloud-platform - 如果内存超过 90%,则 GCP 刷新 redis

触发触发器时,有没有办法刷新我的 GCP Redis?

在我的具体情况下,我使用 Google StackDriver 指标来监控并获得通知。我希望当我的 Redis 内存超过 90% 时,它会自动刷新。有没有办法做到这一点?

0 投票
0 回答
26 浏览

stackdriver - Which is the api call for retrieving the events of a policy in Google Stackdriver?

My problem is that I cannot find the api call of the Google Stackdriver for get the events/alerts of a policy I have applied. Does anyone know something relevant with the Stackdriver API ?

0 投票
2 回答
479 浏览

google-cloud-platform - Google 警报策略根据云存储桶对象计数触发问题

我一直在尝试设置警报策略(通过堆栈驱动程序)以在云存储桶中有新对象时获取电子邮件通知。

但这里的问题是,它有时会在一段时间后起作用,而在其他大多数时候,它不会。

当桶中有新文件时(每天多次),我们如何使警报立即触发。

下面是代码:

感谢您的投入!

谢谢

0 投票
0 回答
352 浏览

google-cloud-platform - 如何使用 GCP 日志监控项目创建

我(GCP 管理员用户)有一个 GCP 组织example.com,我想在组织中的某个用户创建 GCP 项目时进行监控。

所以我创建了一个 GCPProject A并去 Stackdriver Loggin 页面搜索日志。但我能找到的所有日志条目都仅限于Project A. 如下所示

但我也想找到Project B由用户 BProject C创建并由用户 C 创建的。

我不确定在哪里设置查看CreateProject所有项目日志的权限。

0 投票
1 回答
683 浏览

google-cloud-platform - GKE:如何提醒内存请求/可分配比率?

我有一个 GKE 集群,我想跟踪请求的总内存与可分配的总内存之间的比率。我能够使用在 Google Cloud Monitoring 中创建图表

两者都crossSeriesReducer设置为REDUCE_SUM以获得整个集群的总和。

然后,当我尝试使用两者的比率(如下)设置警报策略(使用云监控 api)时,我收到此错误

它不喜欢第一个指标是 ak8s_container而第二个指标是 ak8s_node我可以使用不同的指标或某种解决方法来提醒 Google Cloud Monitoring 中的内存请求/可分配比率吗?

编辑:

这是完整的请求和响应

0 投票
1 回答
195 浏览

firebase - Firebase io/database_load 和 io/utilization 指标有什么区别?

我正在尝试了解和优化 Firebase 实时数据库上的流量。我正在 stackdriver 中构建一些仪表板来帮助我,但我找不到任何io/database_load关于io/utilization.

似乎该io/utilization统计数据是 Firebase 控制台在负载图表中使用的统计数据,但我可以使用一些关于如何解释该io/database_load指标的指导。负载指标似乎比利用率指标更频繁地突破 100%。

任何人都可以帮忙吗?

0 投票
1 回答
437 浏览

google-cloud-storage - 监控仪表板上 GCS 存储桶子目录的对象计数

我想知道是否可以为 GCS 存储桶中的子目录的“对象计数”创建图表。理想情况下,我想使用“分组依据”选项。这似乎是不可能的。有没有另一种方法可以为存储桶子目录创建“对象计数”图表?