我有一个 Flask 应用程序与 Python gRPC 服务通信,两者都部署在 Google Cloud Run 上。检测应用程序后,我可以在 Google Trace 上看到跟踪,但它们似乎都有不同的跟踪 ID,这意味着跟踪没有在两个服务之间链接在一起。这是我的设置代码,用于在每侧设置 grpc/Flask 仪器跟踪两个服务:
import logging
from opentelemetry import trace
from opentelemetry.exporter.cloud_trace import CloudTraceSpanExporter
from opentelemetry.sdk.trace import TracerProvider
from opentelemetry.sdk.trace.export import SimpleExportSpanProcessor
from opentelemetry.propagators import set_global_textmap
from opentelemetry.tools.cloud_trace_propagator import CloudTraceFormatPropagator
from google.auth.exceptions import DefaultCredentialsError
logger = logging.getLogger(__name__)
def setup_tracing():
"""
Setup Tracing on Google Cloud. The Service Account Roles must have `Cloud Trace Agent`
Role added for traces to be ingested.
"""
trace.set_tracer_provider(TracerProvider())
try:
# If running on Google Cloud, will use instance metadata service account credentials to initialize
trace.get_tracer_provider().add_span_processor(
SimpleExportSpanProcessor(CloudTraceSpanExporter())
)
# Using the X-Cloud-Trace-Context header
set_global_textmap(CloudTraceFormatPropagator())
logger.info("Tracing Setup. Exporting Traces to Google Cloud.")
except DefaultCredentialsError:
# Not running on Google Cloud so will use console exporter
from opentelemetry.sdk.trace.export import ConsoleSpanExporter
trace.get_tracer_provider().add_span_processor(
SimpleExportSpanProcessor(ConsoleSpanExporter())
)
logger.info("Tracing Setup. Exporting Traces to Console.")
在本地,我可以使用 ConsoleSpanExporter 看到两个服务上的跟踪 ID 匹配,但是在 Google Cloud Run 上,它们显然不会在 Google Trace 上产生单独的跟踪,所以我想知道网络是否删除了服务之间的标头或其他东西正在发生,这意味着跟踪 ID 没有被传播?
作为额外说明,我还注意到 Cloud Run 的 Trace/Span ID 前面的负载均衡器没有使用 CloudTraceSpanFormatPropagator() 进行传播,这也使我的日志变得混乱,因为日志没有嵌套在一起用于请求。