1

我在python grpc客户端调用scala grpc服务器时遇到了很多超出期限的错误。

我正在报告来自客户端和服务器的指标,并且服务器报告的时间与客户端报告的时间之间存在很大差异,我认为这不能仅用网络延迟来解释(因为差异很大)。返回的对象大小相似,我认为序列化时间与网络时间相比可以忽略不计。

我已将超时设置为 20 毫秒

我的客户端代码很简单:

self.channel = grpc.insecure_channel(...)
self.stub = MyService_pb2_grpc.MyServiceStub(self.channel)
timeout = 0.02
try:
  start_ms = time.time()
  grpc_res = self.stub.getFoo(Request(...), timeout=timeout)
  end_ms = time.time()
  total_duration_ms = int((end_ms - start_ms) * 1000)
....
except Exception as e:
  status_code = str(e.code()).split('.')[1]
  logger.error('exception ....: %s', status_code) # around 20% deadline exceptions

我的服务器代码平均报告 5 毫秒,客户端代码7ms平均报告,但如前所述,在 20% 超时20ms

有没有办法调试这个问题的根本原因,即较低级别的日志记录等?

4

1 回答 1

3

您可以尝试在环境变量下运行: GRPC_VERBOSITY=DEBUG GRPC_TRACE=all https ://github.com/grpc/grpc/blob/master/doc/environment_variables.md

于 2019-04-03T17:40:23.133 回答