我最初的碳存储模式配置设置为 10s:1w、60s:1y,并且可以正常工作几个月。我最近将其更新为 1s:7d、10s:30d、60s、1y。我使用以下 bash 调整了所有耳语文件的大小以反映新的保留模式:
collectd_dir="/opt/graphite/storage/whisper/collectd/"
retention="1s:7d 1m:30d 15m:1y"
find $collectd_dir -type f -name '*.wsp' | parallel whisper-resize.py \
--nobackup {} $retention \;
我已经确认它们已使用带有正确保留和数据点的 Whisper-info.py 进行了更新。我还使用存储模式验证脚本确认了存储模式是有效的。
carbon-cache{1..8}、carbon-relay、carbon-aggregator 和 collectd 服务在耳语调整大小之前已停止,然后在调整大小完成后启动。
但是,在 Grafana 仪表板上签入时,我在 collectd 插件图表上看到具有正确数据点(每秒,但没有数据)的空图表;但是对于提供数据的图表,它每 10 秒(旧保留)而不是 1 秒显示数据和数据点。
/var/log/carbon/console.log 看起来不错,并且 collectd 的耳语文件都具有 carbon 用户访问权限,因此写入时没有权限被拒绝的问题。
在石墨主机上的端口 2003 上运行 ngrep 时,我看到了与中继的连接,以及正在发送的指标。然后,这些指标会被中继到一个包含 8 个缓存的池中,然后再发送到它们的 pickle 端口。
有没有其他人遇到过类似的问题,或者可以帮助我进一步诊断问题?我在这里错过了什么吗?