问题标签 [google-cloud-monitoring]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
438 浏览

google-cloud-platform - Pod 重新调度时触发的基于日志的指标的指标缺失警报

设置

注意:使用伪代码实例表示法:ObjectType("<name>", | <attr>: <attr-value>]).

我们有一个容器: Container("k8s-snapshots")Pod("k8s-snapshots-0")一个 `StatefulSet("k8s-snapshots", spec.replicas: 1)

我们预计在任何时间点最多运行 1 个 Pod。

我们有一个基于日志Counter Metric("k8s-snapshots/snapshot-created")的过滤器:

我们有一个 Stackdriver 政策:

为了监控是否Container("k8s-snapshots")已停止创建快照。

预期结果

如果没有任何实例Pod("k8s-snapshots-0")记录任何匹配的事件,则会触发警报Metric("k8s-snapshots/snapshot-created")

结果

Policy(Name: "snapshot metric absent")每次都Pod("k8s-snapshots-0")被重新安排。

似乎为每个实例创建了基于日志的主要指标的子指标Pod("k8s-snapshots"),并为每个子指标创建了 Stackdriver 警报。

0 投票
1 回答
796 浏览

stackdriver - 是否可以从 Stackdriver 日志/监控中触发通知(例如 HTTP 500)?

我在 Google Compute Engine 虚拟机上设置了 Stackdriver 日志代理,并从 apache 和其他一些来源收集日志。是否可以在生成 http 500 日志时触发通知?

如果解析 textPayload 以获取通知不是一个选项,是否可以通过修改 fluentid 配置以在上传匹配日志时发送特定标签来完成?

0 投票
1 回答
178 浏览

stackdriver - StackDriver 用户配额

我正在使用 Java 客户端库MetricServiceClient来获取 StackDriver 时间序列。我正在使用用户 oauth 令牌进行身份验证(该用户可以访问多个项目),但似乎在多个项目中存在某种全局配额,因为当我一次只获取一个或两个项目时,我没有限制,但是当我一次获取四个或五个不同的项目,我开始受到如下错误的限制:

io.grpc.StatusRuntimeException: RESOURCE_EXHAUSTED: Insufficient tokens for quota 'DefaultGroup' and limit 'USER-100s' of service 'monitoring.googleapis.com' for consumer 'project_number:764086051850'.

我已经通过交替获取哪些项目来确认这一点,这样我就可以说这不是任何一个项目——它们都开始受到速率限制。另一个奇怪的事情是,错误消息中的 project_number 与我正在获取的任何项目都不对应,甚至没有访问权限——这对我来说毫无意义。

这似乎是每 100 秒请求数的配额,但我在所有项目上都将其设置为 10,000,而且我几乎没有执行那么多请求,正如 Web 控制台中的配额历史图表所证实的那样。

是否真的有一些适用于多个项目的全局配额,如果有,是否有办法解决它?让一个用户访问多个项目对我来说要简单得多,而不必为所有项目制作服务帐户令牌。

0 投票
1 回答
523 浏览

nagios - 谷歌云实例可以支持 Nagios 吗?

我正在尝试在 GCP Linux 实例中安装 Nagios,我很好奇,它是否可以在 GCP 中工作?

0 投票
1 回答
968 浏览

google-cloud-logging - 使用 stackdriver 监控 docker 上的 nginx(gcloud 托管)

为了使用 stackdriver 监控 nginx(作为应用程序),只需将登录引导到 gcploggin 驱动程序就足够了,还是必须安装监控代理?

0 投票
2 回答
52 浏览

google-cloud-datalab - 如何使用 Datalab 实例的监控代理

我需要监控我们所有的 Datalab 实例。我知道通过使用监控代理,我们可以监控具有许多指标的虚拟机,我需要将它安装在实例上。

是否可以将它安装在 Datalab vm 上,因为它是 Chromeos vm?

如果是,如何?

谢谢

0 投票
3 回答
4455 浏览

google-cloud-platform - Stackdriver Monitoring 淹没 collectd uc_update:系统日志中的值太旧

让我先声明一下,我不是 DevOp,所以我在 Linux 管理方面的经验是有限的。

我基本上遵循了这个方法(https://cloud.google.com/monitoring/agent/install-agent)并在我的谷歌计算实例上安装了代理。

一切正常,我在我的堆栈驱动程序帐户中获得了新指标,但是我在我的系统日志中被淹没了

所以我在我的 /opt/stackdriver/collectd/etc/collectd.conf 文件中找到了这个

这是有道理的,除了 stackdriver 之外,我们不会将 collectd 用于其他任何事情。所以找到导致问题的proccessid和stackdriver hostname是一样的就顺理成章了。

接下来我检查了https://collectd.org/faq.shtml

我为 /etc/collectd.conf 和 /opt/stackdriver/collectd/etc/collectd.conf 运行此命令

如您所见,没有重复值。

我的想法已经用完了,有人可以帮忙吗?

谢谢你。

PS 我们正在使用 Debian Stretch 并使用 php 运行 lighttpd。

PS 更多信息这是一个更详细的日志,其中包含错误,您可以查看时间戳

这是 PS 命令的输出

PS grep 命令较少,输出

0 投票
1 回答
763 浏览

google-cloud-platform - Stackdriver Monitoring 对全局资源的限制是什么?

我试图了解 Stackdriver Monitoring 是否适合 IoT 监控,其中包含“全局”资源和设备 ID 作为标签的自定义指标的概念。根据https://cloud.google.com/stackdriver/pricing#stackdriver_monitoring_services

限制是每个收费资源 500 个时间序列,加上每个项目 250 个度量类型。

标签的每个不同值都算作时间序列吗?“全球”是一种收费资源吗?这是否意味着使用此设置我只能使用单个自定义指标监控 500 台设备?

0 投票
1 回答
53 浏览

google-cloud-monitoring - 我可以在 google-cloud-monitoring 中使用 google-cloud-trace 时间吗?

我正在使用谷歌云追踪。它记录了我的 API 执行的时间——运行良好。

是否可以使用谷歌云监控对其进行显式监控?IE,如果我超过阈值设置通知?

0 投票
1 回答
1674 浏览

google-cloud-platform - 如何在 Stackdriver Alerting 中自定义整个电子邮件通知?

目前,创建提醒政策时在文档字段中指定的消息会显示在 Stackdriver 提醒电子邮件的文档字段中。我想用我的自定义内容覆盖整个电子邮件正文。如何使用自定义消息覆盖 Stackdriver Alert 电子邮件的消息正文?有没有其他解决方法可以做到这一点?