5

我已经在 GCE 上设置了我的 Kubernetes 1.3.4 集群

export KUBE_ENABLE_CLUSTER_MONITORING=google

这工作得很好,我得到了应用程序日志(出于某种原因在容器引擎部分,但很好)以及 pod 和节点指标。

唯一缺少的是节点内存指标,仅显示 CPU(见截图)

没有内存指标

在堆日志中,我看到大量这样的行

{
 metadata: {
  severity: "ERROR"    
  projectId: "<project-id>"    
  serviceName: "container.googleapis.com"    
  zone: "europe-west1-d"    
  labels: {
   container.googleapis.com/cluster_name: "production"     
   compute.googleapis.com/resource_type: "instance"     
   compute.googleapis.com/resource_name: "fluentd-cloud-logging-production-minion-group-p0w8"     
   container.googleapis.com/instance_id: "6772154497331326454"     
   container.googleapis.com/pod_name: "heapster-v1.1.0-2102007506-23b3e"     
   compute.googleapis.com/resource_id: "6772154497331326454"     
   container.googleapis.com/stream: "stderr"     
   container.googleapis.com/namespace_name: "kube-system"     
   container.googleapis.com/container_name: "heapster"     
  }
  timestamp: "2016-09-13T14:40:08.000Z"    
  projectNumber: "930564692351"    
 }
 textPayload: "E0913 14:40:08.665035       1 gcm.go:179] Error while sending request to GCM googleapi: Error 400: Timeseries 76, point: start is not older than end, for a cumulative metric, invalidParameter
"   
 insertId: "pt5bo7g132r266"   
 log: "heapster"   
}

不确定这是否相关。

有任何想法吗?

4

1 回答 1

1

如果您使用 GCE 而不是 GKE 运行集群您应该安装stackdriver 代理并验证代理用于与 stackdriver 通信的凭据链接

如果您使用的是 linux,则可以通过执行以下命令安装代理:

curl -sSO https://dl.google.com/cloudagents/install-monitoring-agent.sh
sudo bash install-monitoring-agent.sh

您可以运行以下命令检查您的凭据:

sudo cat $GOOGLE_APPLICATION_CREDENTIALS
sudo cat /etc/google/auth/application_default_credentials.json
于 2018-01-24T22:20:46.630 回答