1

我最初的碳存储模式配置设置为 10s:1w、60s:1y,并且可以正常工作几个月。我最近将其更新为 1s:7d、10s:30d、60s、1y。我使用以下 bash 调整了所有耳语文件的大小以反映新的保留模式:

collectd_dir="/opt/graphite/storage/whisper/collectd/"
retention="1s:7d 1m:30d 15m:1y"

find $collectd_dir -type f -name '*.wsp' | parallel whisper-resize.py \
--nobackup {} $retention \;

我已经确认它们已使用带有正确保留和数据点的 Whisper-info.py 进行了更新。我还使用存储模式验证脚本确认了存储模式是有效的。

carbon-cache{1..8}、carbon-relay、carbon-aggregator 和 collectd 服务在耳语调整大小之前已停止,然后在调整大小完成后启动。

但是,在 Grafana 仪表板上签入时,我在 collectd 插件图表上看到具有正确数据点(每秒,但没有数据)的空图表;但是对于提供数据的图表,它每 10 秒(旧保留)而不是 1 秒显示数据和数据点。

/var/log/carbon/console.log 看起来不错,并且 collectd 的耳语文件都具有 carbon 用户访问权限,因此写入时没有权限被拒绝的问题。

在石墨主机上的端口 2003 上运行 ngrep 时,我看到了与中继的连接,以及正在发送的指标。然后,这些指标会被中继到一个包含 8 个缓存的池中,然后再发送到它们的 pickle 端口。

有没有其他人遇到过类似的问题,或者可以帮助我进一步诊断问题?我在这里错过了什么吗?

4

1 回答 1

0

所以我花了一点时间才弄清楚这一点。它与一些旧响应一样与 local_settings.py 文件无关,但它与 collectd.conf 中的 Interval 函数有关。

许多较早的回复提到您需要在每个插件容器中包含“间隔 1”。我认为由于对每个指标的控制,这会很棒。但是,这会在我的日志中创建配置错误,并破坏指标。在配置的顶层设置“间隔 1”解决了我的问题。

于 2019-07-16T19:08:00.937 回答