问题标签 [google-cloud-monitoring]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
google-cloud-platform - Pod 重新调度时触发的基于日志的指标的指标缺失警报
设置
注意:使用伪代码实例表示法:
ObjectType("<name>", | <attr>: <attr-value>])
.
我们有一个容器:
Container("k8s-snapshots")
在Pod("k8s-snapshots-0")
一个 `StatefulSet("k8s-snapshots", spec.replicas: 1)
我们预计在任何时间点最多运行 1 个 Pod。
我们有一个基于日志Counter
Metric("k8s-snapshots/snapshot-created")
的过滤器:
我们有一个 Stackdriver 政策:
为了监控是否Container("k8s-snapshots")
已停止创建快照。
预期结果
如果没有任何实例Pod("k8s-snapshots-0")
记录任何匹配的事件,则会触发警报Metric("k8s-snapshots/snapshot-created")
。
结果
Policy(Name: "snapshot metric absent")
每次都Pod("k8s-snapshots-0")
被重新安排。
似乎为每个实例创建了基于日志的主要指标的子指标Pod("k8s-snapshots")
,并为每个子指标创建了 Stackdriver 警报。
stackdriver - 是否可以从 Stackdriver 日志/监控中触发通知(例如 HTTP 500)?
我在 Google Compute Engine 虚拟机上设置了 Stackdriver 日志代理,并从 apache 和其他一些来源收集日志。是否可以在生成 http 500 日志时触发通知?
如果解析 textPayload 以获取通知不是一个选项,是否可以通过修改 fluentid 配置以在上传匹配日志时发送特定标签来完成?
stackdriver - StackDriver 用户配额
我正在使用 Java 客户端库MetricServiceClient
来获取 StackDriver 时间序列。我正在使用用户 oauth 令牌进行身份验证(该用户可以访问多个项目),但似乎在多个项目中存在某种全局配额,因为当我一次只获取一个或两个项目时,我没有限制,但是当我一次获取四个或五个不同的项目,我开始受到如下错误的限制:
io.grpc.StatusRuntimeException: RESOURCE_EXHAUSTED: Insufficient tokens for quota 'DefaultGroup' and limit 'USER-100s' of service 'monitoring.googleapis.com' for consumer 'project_number:764086051850'.
我已经通过交替获取哪些项目来确认这一点,这样我就可以说这不是任何一个项目——它们都开始受到速率限制。另一个奇怪的事情是,错误消息中的 project_number 与我正在获取的任何项目都不对应,甚至没有访问权限——这对我来说毫无意义。
这似乎是每 100 秒请求数的配额,但我在所有项目上都将其设置为 10,000,而且我几乎没有执行那么多请求,正如 Web 控制台中的配额历史图表所证实的那样。
是否真的有一些适用于多个项目的全局配额,如果有,是否有办法解决它?让一个用户访问多个项目对我来说要简单得多,而不必为所有项目制作服务帐户令牌。
nagios - 谷歌云实例可以支持 Nagios 吗?
我正在尝试在 GCP Linux 实例中安装 Nagios,我很好奇,它是否可以在 GCP 中工作?
google-cloud-logging - 使用 stackdriver 监控 docker 上的 nginx(gcloud 托管)
为了使用 stackdriver 监控 nginx(作为应用程序),只需将登录引导到 gcploggin 驱动程序就足够了,还是必须安装监控代理?
google-cloud-datalab - 如何使用 Datalab 实例的监控代理
我需要监控我们所有的 Datalab 实例。我知道通过使用监控代理,我们可以监控具有许多指标的虚拟机,我需要将它安装在实例上。
是否可以将它安装在 Datalab vm 上,因为它是 Chromeos vm?
如果是,如何?
谢谢
google-cloud-platform - Stackdriver Monitoring 淹没 collectd uc_update:系统日志中的值太旧
让我先声明一下,我不是 DevOp,所以我在 Linux 管理方面的经验是有限的。
我基本上遵循了这个方法(https://cloud.google.com/monitoring/agent/install-agent)并在我的谷歌计算实例上安装了代理。
一切正常,我在我的堆栈驱动程序帐户中获得了新指标,但是我在我的系统日志中被淹没了
所以我在我的 /opt/stackdriver/collectd/etc/collectd.conf 文件中找到了这个
这是有道理的,除了 stackdriver 之外,我们不会将 collectd 用于其他任何事情。所以找到导致问题的proccessid和stackdriver hostname是一样的就顺理成章了。
接下来我检查了https://collectd.org/faq.shtml
我为 /etc/collectd.conf 和 /opt/stackdriver/collectd/etc/collectd.conf 运行此命令
如您所见,没有重复值。
我的想法已经用完了,有人可以帮忙吗?
谢谢你。
PS 我们正在使用 Debian Stretch 并使用 php 运行 lighttpd。
PS 更多信息这是一个更详细的日志,其中包含错误,您可以查看时间戳
这是 PS 命令的输出
PS grep 命令较少,输出
google-cloud-platform - Stackdriver Monitoring 对全局资源的限制是什么?
我试图了解 Stackdriver Monitoring 是否适合 IoT 监控,其中包含“全局”资源和设备 ID 作为标签的自定义指标的概念。根据https://cloud.google.com/stackdriver/pricing#stackdriver_monitoring_services
限制是每个收费资源 500 个时间序列,加上每个项目 250 个度量类型。
标签的每个不同值都算作时间序列吗?“全球”是一种收费资源吗?这是否意味着使用此设置我只能使用单个自定义指标监控 500 台设备?
google-cloud-monitoring - 我可以在 google-cloud-monitoring 中使用 google-cloud-trace 时间吗?
我正在使用谷歌云追踪。它记录了我的 API 执行的时间——运行良好。
是否可以使用谷歌云监控对其进行显式监控?IE,如果我超过阈值设置通知?
google-cloud-platform - 如何在 Stackdriver Alerting 中自定义整个电子邮件通知?
目前,创建提醒政策时在文档字段中指定的消息会显示在 Stackdriver 提醒电子邮件的文档字段中。我想用我的自定义内容覆盖整个电子邮件正文。如何使用自定义消息覆盖 Stackdriver Alert 电子邮件的消息正文?有没有其他解决方法可以做到这一点?