问题标签 [google-cloud-monitoring]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
2779 浏览

google-cloud-platform - 如何在堆栈驱动程序中为每个错误创建警报

云控制台中创建了基于日志的指标后,我想创建警报,以便每次有新的匹配日志条目时都会触发警报。

在尝试创建合适的指标时,最有可能的选项似乎是阈值或变化率,但我认为这两者都不适用于 1 条日志消息 => 1 条警报的策略。

帮助表示赞赏。

0 投票
1 回答
83 浏览

google-cloud-platform - 谷歌云监控:如果发布成功和订阅失败添加警报

我想在 Google Cloud Monitoring 上添加一个警报,这样对于给定的主题和订阅,我想知道是否正在发布一个主题,然后订阅在给定的时间范围内没有以相同或相似的速率得到确认。

我们如何使用 Google Cloud Monitoring 或 StackDriver 中的警报来实现这一点?

我尝试了一种方法,我有两个条件要满足:

  1. 如果发布操作 > 0.016/秒持续 2 分钟(意味着每分钟至少发布一次)
  2. 如果订阅确认 < 0.001/sec 持续 2 分钟(如果 2 分钟内没有订阅确认发生)

然后,警觉。

这里发生的情况是,在低负载期间,如果在 3 分钟内没有发生发布并且发生了发布,则条件 1 和 2 都设置为 true,并且开发人员会收到有关此失败的警报。

那么,设计此类警报的正确方法是什么?

如果我的方法接近我想要的,接下来我想到的问题是,

  1. 有没有办法说从发布的实例开始计算你的两分钟,看看确认条件是否满足。
  2. 或者,有没有办法让警报等待 2-3 分钟以查看事件是否解决,然后向开发人员发送警报。
  3. 或者,有没有一种方法可以计算满足这些条件的出现次数,然后仅在 15 分钟内出现超过 5 或 10 次或类似情况时才发出警报。

对不起,很长的帖子。但是,任何形式的帮助都是值得赞赏的。

0 投票
0 回答
617 浏览

google-cloud-platform - 收集 dropwizard 指标并将其发送到 Stackdriver 的最有效和最直接的方法

我有一个在GKE上运行的基于Dropwizard的应用程序。我已经使用dropwizard metrics support收集了许多特定于应用程序的指标。

我知道它可以通过HTTPJMX、 CSV 、collectd等报告指标。

我想将这些指标发送到 Stackdriver。

想到了三个替代方案:

  1. 使用Stackdriver Monitoring API构建新的指标报告器
  2. 创建新的Stackdriver 监控代理风格
  3. 创建一个收集指标(共享文件或 http 轮询)并将它们发送到 StackDriver 的 sidecar 容器(API?collectd?)

实现这一目标的最有效和最直接的方法是什么?任何帮助表示赞赏。

0 投票
1 回答
1170 浏览

google-cloud-platform - 从 Python 访问 Google PubSub 中的 subscription/num_oustanding_messages 指标

是否可以从 google-cloud-python访问subscription/num_outstanding_messages列出的指标https://cloud.google.com/monitoring/api/metrics#gcp-pubsub ?我已经使用类似的代码成功访问了该num_undelivered_messages指标,但迭代以下查询的结果(成功)总是产生一个空列表。

相关 google-cloud-python 库版本:

0 投票
1 回答
1140 浏览

kubernetes - 如何在 Stackdriver Monitoring 中针对自定义指标设置警报?

当我尝试在 Stackdriver Monitoring 中创建提醒政策时,我的自定义指标未显示在下拉列表中。当我尝试在 Stackdriver Monitoring 信息中心添加图表时,它们会出现。我还需要做些什么来使这些自定义指标具有警报吗?

这些自定义指标是在 Kubernetes 上使用 heapster 创建的。我仍在试用 Stackdriver Premium。

这是创建图表时资源类型列表的屏幕截图。

在此处输入图像描述

这是创建警报策略条件时资源类型列表的屏幕截图。

在此处输入图像描述

0 投票
1 回答
112 浏览

google-cloud-platform - GCP Stackdriver 中的每个受监控资源都需要单独的代理吗?

GCP 中的每个受监控资源都需要单独的代理吗?例如,如果我对 cpu、disk、memory、jvm 等指标感兴趣,我是在我的 GCE 实例中安装单个代理还是多个代理来处理使用 Stackdriver 时监控代理提供的额外指标?

0 投票
1 回答
3835 浏览

google-cloud-platform - 如何使用 Stackdriver 检查 GCE 实例的正常运行时间?

我有哪些选项可以检查 GCE 实例的正常运行时间?

  1. 我是否需要安装监控代理,在监控文档中虽然它只提到了对 GCE 实例上安装的 Apache 服务器的正常运行时间检查,但如果 GCE 实例本身没有启动,我如何检查它是否启动?网络服务器就可以了?
0 投票
1 回答
691 浏览

google-cloud-platform - 如何在谷歌云库中使用代理

我的代码处于具有出口限制的环境中,因此我需要通过代理才能连接到外部世界。谷歌云库是否有能力传递代理并通过它进行连接?

0 投票
1 回答
455 浏览

kubernetes - Stackdriver 自定义指标汇总提醒

我在 Google Compute Engine 和 Stackdriver 上使用 Kubernetes。Kubernetes 指标在 Stackdriver 中显示为自定义指标。我成功地设置了一个带有图表的仪表板,其中显示了一些自定义指标,例如“节点 cpu 预留”。我什至可以设置所有节点 CPU 预留的聚合平均值,以查看我的 Kubernetes 集群 CPU 预留总量是否过高。见截图。

在此处输入图像描述

我的问题是,我似乎无法针对自定义指标的平均值设置警报。我可以在每个节点上设置警报,但这不是我想要的。我还可以设置“组聚合阈值条件”,但自定义指标似乎对此不起作用。请注意“自定义指标”如何不在下拉列表中。

在此处输入图像描述

有没有办法为自定义指标的聚合设置警报?如果没有,当我的 Kubernetes 集群的 CPU 预留太高时,我是否可以通过某种方式发出警报?

0 投票
2 回答
522 浏览

ios - 如何将我的移动设备添加到我的 StackDriver 配置文件?

当我尝试在 Stackdriver 个人资料页面上添加我的移动设备时,只有一个模式显示:“可以从 Cloud Console 移动应用的事件部分注册移动设备。”

我隐约记得以前做过这个(一年多以前,用于相关项目),它工作得很好。今天我合并了几个帐户,我无法再在任何提醒政策中添加“云控制台移动应用”通知方法,因为:“未配置云控制台移动应用通知”。

我能找到的唯一文档告诉我打开移动应用程序上的“事件”部分,但那里没有关于注册设备的内容。我有最新版本的移动应用程序(iOS 上目前为 1.8.4)。此功能是否仍然可用?我错过了什么吗?