问题标签 [google-cloud-monitoring]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
341 浏览

stackdriver - StackDriver 错误报告电子邮件通知

在我们的多租户环境中,当我们的用户代码出现异常时,我想设置一个警报通知(例如电子邮件)。我正在考虑使用stackdriver 错误报告 api来发送错误通知。就像是

我该如何设置(使用python api)

  • 为租户 ID/服务 ID 创建警报以向其发送通知。我可以在此步骤中输入用户的联系电子邮件。
  • 使用类似的方式报告租户 ID/服务 ID 的异常client.report_exception()并通知警报机制

其他解决方案:这篇文章建议我使用日志记录和记录错误,创建过滤器并创建警报策略。这将是一个选项,但我觉得它可能很昂贵,因为这意味着对于我们用户的每项服务,它将每隔几秒/分钟运行一次日志搜索查询?我想知道是否有推送方法(与日志拉取方法相比)或者我是否误解了日志记录通知实际上是推送方法?

如果我走错了路,请随时提出更好的方法。

0 投票
4 回答
1156 浏览

stackdriver - 是否可以在本地机器中使用 stackdriver 监控?

我想在我的机器上使用 Stackdriver 监控来收集 cpu 和内存指标,它既不在 GCP 也不在 AWS 上,是否可行?

0 投票
1 回答
207 浏览

istio - 使用 Traffic Director 创建的负载平衡器缺少 Stackdriver 指标

我创建了一个 vpc内部http 负载均衡器 - 使用 GCP 的新 Traffic Director,包括转发规则、url 映射、几个指向 VM 和 NEG 的后端。该解决方案工作正常(端到端) - 但是来自stackdriver的特定负载均衡器指标都没有显示为上述对象(在https://cloud.google.com/monitoring/api/metrics_gcp#gcp-loadbalancing下)。

检查任何 alpha 指标,没有运气。本质上,创建的对象是谷歌对负载均衡器的抽象的一部分,但没有收集任何指标。由于 Traffic Director 本质上是 istio,我还研究了如何获取 istio 指标,似乎获取任何指标的唯一方法是通过https://cloud.google.com/istio/docs/istio-on-gke/overview - 其中很奇怪,因为我只能将流量导向器与虚拟机一起使用。

我希望对流量主管创建的内部负载平衡器有一些可观察性,但没有。

0 投票
2 回答
168 浏览

kubernetes - 在 stackdriver 中监控 kubernetes pod 的准备情况

借助 stackdriver 的 kubernetes 引擎集成,我可以查看我的 pod 和服务的实时信息,包括有多少已准备就绪。但是,我找不到任何方法来监控这一点。

有没有办法设置一个警报策略,如果部署或服务中没有 Pod 准备好触发?我可以设置一个基于日志的指标,但这对于堆栈驱动程序日志记录似乎已经可以访问的信息来说似乎是一种粗略的解决方法。

0 投票
2 回答
1793 浏览

google-bigquery - 如何在日志中查找谁删除了表

我有一个数据集 ID,创建了表。哪些被删除了。我需要检查谁删除了它们以及何时删除。

0 投票
2 回答
602 浏览

java - 如何使用 Http 而不是默认的 gRPC 进行谷歌监控 API

我正在尝试使用 google 监控 API 通过使用 java 客户端库来获取 stackdriver 指标。我的代码如下:

它在本地工作,但由于某些原因,当我在 docker 容器内的 jenkins 中运行它时:

我得到错误:

我假设存在一些与 gRPC 相关的连接问题。那么我该如何使用 http 而不是 gRPC 来实现这个 API 呢?或任何其他建议?

环境细节:

  1. 在 docker 容器 'katalonstudio/katalon:6.1.5' 中运行的代码
  2. 依赖:

    编译'io.cucumber:cucumber-picocontainer:3.0.2' 编译'com.google.code.gson:gson:2.8.5' 编译'org.jdom:jdom2:2.0.6' 编译'jaxen:jaxen:1.1。 6' 编译'org.apache.ant:ant-jsch:1.10.5' 编译'com.google.cloud:google-cloud-monitoring:1.90.0' 编译'io.netty:netty-all:4.1.3.最后'

堆栈跟踪:

0 投票
0 回答
2002 浏览

c# - Grpc.Core.RpcException:状态(状态代码=不可用,详细信息=“传输关闭”)

我正在使用 Google 自定义指标将自定义指标写入云。我的代码如下所示:

当我在我的机器上运行它时,它工作得很好。

当我在生产中运行它时,它运行良好,直到停止。我收到此错误消息:

或类似的错误:

这个错误不时重复。它看起来有 99% 的时间都在工作。

这里有什么问题?如何解决?

0 投票
0 回答
58 浏览

kubernetes - Kubernetes Cluster Autoscaler:自定义指标聚合

我正在运行一个 Google Kubernetes Engine 集群。我在路径中有一个谷歌云自定义指标:

我想创建一个自动扩展规则,该规则将根据调用次数扩展我的部署。

如果custom.googleapis.com|web|NAME|2xx是单个值,则此自动缩放规则运行良好。就我而言,我必须创建一个SUM聚合函数来获取实际值。

在此处输入图像描述

请参阅突出显示的(黄色)部分。

我如何更新我的metricName字段以便对所有值求和?

0 投票
1 回答
152 浏览

google-cloud-monitoring - 控制台中 GCP 监控警报策略的 JSON 模拟

我希望 GCP 在我的一个云功能出现错误时发送警报,该云功能计划使用调度程序定期触发。我进入控制台并创建了一个看起来像这样的策略

控制台中的策略-简而言之,我正在监视云功能错误执行计数。如果错误计数超过 0 1 小时,我应该收到警报。

现在我的问题有两个。

  1. 基于上述条件,我有any time series violates above 0 for 1 hour. 如果我不关闭这些错误(可能是 30 天),即使该功能当前正在成功执行,我仍然会收到正确的警报吗?有没有办法只提醒 if MOST RECENT time series violates above 0 for 1 hour?如果是这样,我怎么能用 JSON 格式写这个?
  2. 上面显示的 GCP 监控警报策略的 JSON 模拟是什么?

我拼凑了可以在文档中找到的信息。这就是我到目前为止所拥有的。

我是 StackExchange 的新手,所以如果我的问题格式不正确,请告诉我。非常感谢您的时间和帮助!

0 投票
1 回答
62 浏览

google-cloud-pubsub - Stackdriver 中的图表与配置阈值之间是否存在差异?

查看Google Cloud API Monitoring 指标,oldest_unacked_message_age 似乎以秒为单位:

old_unacked_message_age

但是,当尝试设置策略并使用右侧图表时,配置阈值中设置的值似乎与 y 轴图表中描绘的阈值指标不同。我认为,由于指标的定义,阈值以秒为单位,但图表的 y 轴单位似乎表明 300 对应于毫秒。

old_unacked_message_age(应该以秒为单位)和图表指标(毫秒)之间的差异