我的一些 AppEngine 项目遇到问题,因为几天后我开始在 Stackdriver Logging 的 vm.syslog 日志中看到很多错误(我注意到它们可能会在运行状况检查到达时发生)。
具体来说有:
- write_gcm: 服务器响应 (CollectdTimeseriesRequest) 包含错误:#012{#012 "payloadErrors": [#012 {#012 "index": 71,#012 "error": {#012 "code": 3,#012 "message ": "预期 4 个标签。找到 0。负载 [values {\n data_source_name: \"value\"\n data_source_type: GAUGE\n value {\n double_value: 694411264\n }\n}\nstart_time {\ n 秒:1513266364\n nanos:618061284\n}\nend_time {\n 秒:1513266364\n nanos:618061284\n}\nplugin:\“processes\”\nplugin_instance:\“all\”\ntype:\“ps_rss \"\n] 资源 [type: \"gce_instance\"\nlabels {\n key: \"instance_id\"\n value: \"xxx\"\n}\nlabels {\n key: \"zone\ "\n 值:\"europe-west2-a\"\n}\n] for project xxx"#012 }#012 }#012 ]#012}
- write_gcm: HTTP 请求不成功 400: {#012 "error": {#012 "code": 400,#012 "message": "Field timeSeries[11].metric.labels[1] has an invalid value of \"health_check_type \": 无法识别的度量标签。",#012 "status": "INVALID_ARGUMENT"#012 }#012}
- write_gcm:与端点交谈时出错。
- write_gcm:wg_transmit_unique_segment 失败。
- write_gcm:wg_transmit_unique_segments 失败。冲洗。
同时,我注意到我在 AppEngine 仪表板中对于相同项目的内存使用量随着时间的推移而增加,达到最大可用量并且实例重新启动,在访问网络时抛出 502 错误该应用程序正在服务的网站。
所有这一切都没有发生在至少 2 周以来没有更新的几个项目上(上述错误或内存增加都没有),但是当使用与其中一个健康的代码库相同的代码库部署时,它确实发生在新创建的实例上项目。此外,在本地运行我的项目时,我没有碰巧看到内存有任何增加。
有人可以温和地告诉我他们是否经历过类似的事情,或者他们是否认为错误和内存增加有关?我最近没有更改我的 yaml 文件进行部署,也没有为运行状况检查指定任何自定义配置(以默认速率在传统模式下运行)。
谢谢你的帮助,尼古拉