3

我在 Google Container Engine (gke) 上的 kubernetes 内运行了许多 python 应用程序作为副本集。除了它们,我还创建了 Datadog DaemonSet,它在集群中的每个节点上启动一个 dd-agent。

现在我想使用代理 dogstatsd 从 python 应用程序记录指标,并尝试新的 Datadog APM。如果我只是安装 ddtrace python 包并像记录的那样使用它,它会填满我的日志

[2017-02-24 14:09:15,199] [5] [ddtrace.writer] [ERROR] cannot send spans: [Errno 110] Connection timed out
[2017-02-24 14:11:23,660] [5] [ddtrace.writer] [ERROR] cannot send spans: [Errno 110] Connection timed out

显然它没有神奇的方法来猜测如何访问 ddagent pod 的端口 8126/7777。

我尝试创建一个公开端口的服务:

---
apiVersion: v1
kind: Service
metadata:
  annotations:
    prometheus.io/scrape: 'true'
  labels:
    app: datadog-statsd
  name: datadog-statsd
spec:
  ports:
  - name: dogstatsd
    port: 8125
    targetPort: dogstatsdport
    protocol: UDP
  - name: ddapm
    port: 8126
    targetPort: ddtraceport
    protocol: TCP
  selector:
    app: dd-agent

但我的 python pod 似乎仍然无法访问,例如os.environ['DATADOG_STATSD_PORT_8126_TCP_ADDR'].._PORT. 它们都已定义,我仍然只是连接超时。如果我连接到 dd-agent pod 并启用 tcpdump,我也看不到端口 8126 等上的任何流量。

dd-agent DaemonSet 的定义如下:

apiVersion: extensions/v1beta1
kind: DaemonSet
metadata:
  name: dd-agent
spec:
  template:
    metadata:
      labels:
        app: dd-agent
      name: dd-agent
    spec:
      containers:
      - image: datadog/docker-dd-agent:latest
        imagePullPolicy: Always
        name: dd-agent
        ports:
          - containerPort: 8125
            name: dogstatsdport
            protocol: UDP
          - containerPort: 8126
            name: ddtraceport
            protocol: TCP
        env:
          - name: API_KEY
            value: .....
          - name: KUBERNETES
            value: "yes"
          - name: SD_BACKEND
            value: docker
          - name: DD_APM_ENABLED
            value: "true"
        volumeMounts:
          - name: dockersocket
            mountPath: /var/run/docker.sock
          - name: procdir
            mountPath: /host/proc
            readOnly: true
          - name: cgroups
            mountPath: /host/sys/fs/cgroup
            readOnly: true
      volumes:
        - hostPath:
            path: /var/run/docker.sock
          name: dockersocket
        - hostPath:
            path: /proc
          name: procdir
        - hostPath:
            path: /sys/fs/cgroup
          name: cgroups
4

2 回答 2

1

因此,在尝试调试时,我删除了部署 + dameonset 和服务并重新创建了它。后来就奏效了......

于 2017-02-27T09:09:46.670 回答
0

您看过Discovering Services文档吗?我建议使用 DNS 进行服务发现而不是环境变量,因为环境变量要求服务以特定顺序出现。

于 2017-05-18T04:21:01.563 回答