我有一个将 Fluentd 作为 sidecar 运行的 pod,它从另一个容器(示例应用程序)收集日志,并且公共卷已安装在两个容器(volumeMounts)上。
示例应用程序代码将 UTC 时间戳写入文件
containers:
- name: sampleApplication
image: ${DOCKER_IMAGE}:${DOCKER_TAG}
args:
- /bin/sh
- -c
- >
i=0;
while true;
do
echo "$i: $(date)" >> /var/log/1.log;
i=$((i+1));
sleep 1;
done
/var/log/1.log 的尾部输出,
2849: Wed Mar 18 03:12:01 UTC 2020
2850: Wed Mar 18 03:12:02 UTC 2020
2851: Wed Mar 18 03:12:03 UTC 2020
2852: Wed Mar 18 03:12:04 UTC 2020
2853: Wed Mar 18 03:12:05 UTC 2020
2854: Wed Mar 18 03:12:06 UTC 2020
FluentD 配置:
fluent.conf: |-
<source>
@type tail
path /var/log/1.log
pos_file /var/log/1.log.pos
refresh_interval 5
rotate_wait 5
time_format %Y-%m-%dT%H:%M:%S.%N%Z
format json
keep_time_key true
tag fluentd_event
</source>
<match **>
@type secure_forward
self_hostname "#{ENV['HOSTNAME']}"
shared_key ****12345678****
secure yes
ca_cert_path /tmp/fluentd/keys/ca_cert.pem
ca_private_key_path /tmp/fluentd/keys/external_ca_key.pem
ca_private_key_passphrase ocpsecureforward
<server>
# This server accepts the fluentD events
host 100.100.100.23
port 24284
</server>
</match>
上面的配置对我很有效,我可以在 fluentD@tail
插件的尾部事件中可视化Kibana
,但我还想实现将基本的 kubernetes 元数据添加到尾部事件中,例如namespace_name
,pod_name
和container_name
. 我已将kubernetes_metadata
插件配置为,
<filter **>
type kubernetes_metadata
kubernetes_url "#{ENV['K8S_HOST_URL']}"
cache_size "#{ENV['K8S_METADATA_CACHE_SIZE'] || '1000'}"
watch "#{ENV['K8S_METADATA_WATCH'] || 'false'}"
bearer_token_file /var/run/secrets/kubernetes.io/serviceaccount/token
ca_file /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
use_journal "#{ENV['USE_JOURNAL'] || 'nil'}"
container_name_to_kubernetes_regexp '^(?<name_prefix>[^_]+)_(?<container_name>[^\._]+)(\.(?
<container_hash>[^_]+))?_(?<pod_name>[^_]+)_(?<namespace>[^_]+)_[^_]+_[^_]+$'
我确实浏览了一些博客,了解到可以从容器日志文件中过滤和添加 kubernetes 元数据,但我没有将 fluentD 作为 DaemonSet 运行。我打算将它作为 sidecar 运行,并使用@tail
插件收集应用程序日志文件并将基本的 kubernetes 元数据添加到事件中。
可以kubernetes_metadata
利用过滤器来实现这一点吗?