我在 Google Container Engine (gke) 上的 kubernetes 内运行了许多 python 应用程序作为副本集。除了它们,我还创建了 Datadog DaemonSet,它在集群中的每个节点上启动一个 dd-agent。
现在我想使用代理 dogstatsd 从 python 应用程序记录指标,并尝试新的 Datadog APM。如果我只是安装 ddtrace python 包并像记录的那样使用它,它会填满我的日志
[2017-02-24 14:09:15,199] [5] [ddtrace.writer] [ERROR] cannot send spans: [Errno 110] Connection timed out
[2017-02-24 14:11:23,660] [5] [ddtrace.writer] [ERROR] cannot send spans: [Errno 110] Connection timed out
显然它没有神奇的方法来猜测如何访问 ddagent pod 的端口 8126/7777。
我尝试创建一个公开端口的服务:
---
apiVersion: v1
kind: Service
metadata:
annotations:
prometheus.io/scrape: 'true'
labels:
app: datadog-statsd
name: datadog-statsd
spec:
ports:
- name: dogstatsd
port: 8125
targetPort: dogstatsdport
protocol: UDP
- name: ddapm
port: 8126
targetPort: ddtraceport
protocol: TCP
selector:
app: dd-agent
但我的 python pod 似乎仍然无法访问,例如os.environ['DATADOG_STATSD_PORT_8126_TCP_ADDR']
和.._PORT
. 它们都已定义,我仍然只是连接超时。如果我连接到 dd-agent pod 并启用 tcpdump,我也看不到端口 8126 等上的任何流量。
dd-agent DaemonSet 的定义如下:
apiVersion: extensions/v1beta1
kind: DaemonSet
metadata:
name: dd-agent
spec:
template:
metadata:
labels:
app: dd-agent
name: dd-agent
spec:
containers:
- image: datadog/docker-dd-agent:latest
imagePullPolicy: Always
name: dd-agent
ports:
- containerPort: 8125
name: dogstatsdport
protocol: UDP
- containerPort: 8126
name: ddtraceport
protocol: TCP
env:
- name: API_KEY
value: .....
- name: KUBERNETES
value: "yes"
- name: SD_BACKEND
value: docker
- name: DD_APM_ENABLED
value: "true"
volumeMounts:
- name: dockersocket
mountPath: /var/run/docker.sock
- name: procdir
mountPath: /host/proc
readOnly: true
- name: cgroups
mountPath: /host/sys/fs/cgroup
readOnly: true
volumes:
- hostPath:
path: /var/run/docker.sock
name: dockersocket
- hostPath:
path: /proc
name: procdir
- hostPath:
path: /sys/fs/cgroup
name: cgroups