1

我们的 Graphite 服务器正面临 CPU 和磁盘瓶颈。主要问题是 %IO 等待时间总是在 40% 的范围内。我们在具有 7.5 GiB RAM 的 RHEL 服务器上的 2 核 CPU 上运行它。(同意,我们的 CPU 配置是原始的,但我们想在升级之前了解为什么会发生以下情况。)

我们的 Graphite 服务器每分钟处理超过 160,000 个数据点。但是磁盘 IO 统计数据显示 40% 的时间花在 IO 等待上。我们的磁盘 CISS 每秒可以写入 160 MiB,但 Graphite 每秒只能使用 2MiB。

有没有人遇到过这个问题?你的发现是什么?您对以上问题有什么建议吗?

非常感谢!

4

1 回答 1

2

我参加聚会有点晚了,可能。我读到旋转磁盘每秒可以执行大约 75-100 次 io 操作(有道理:7200rpm = 每秒 120 转,典型的 9 毫秒延迟......)。因此,如果是这种情况,MAX_UPDATES_PER_SECOND 的默认值 500 对我来说没有意义。

我尝试运行 bonnie++ 来测试我的磁盘性能,它达到了每秒 50 次随机搜索(不是在单用户模式下)。

我正在研究类似的性能问题,并将 MAX_UPDATES_PER_SECOND 值调低到 10。在我们的案例中,大约有 2000 个指标,这意味着每 200 个指标都会写入磁盘,这对我们有用。

于 2016-02-18T16:10:15.540 回答