我们的 cassandra (3.7) 集群上出现了一些奇怪的负载分布。该集群有 13 个节点,具有 16 个内核和 32G 内存,它在 Apache Usergrid(分叉)之后运行。当我们对应用程序施加(人为)压力时,相同的 3 个节点获得了几乎所有的 CPU 负载,其余节点正常运行。我们无法使用 cassandra-stress 工具创建相同的场景,因为所有负载都是均匀分布的。这些节点的日志也没有什么不同。gc 日志似乎也相似(运行 G1 gc 以获得高堆内存)。查询来自 Usergrid,我们没有太多控制权。我需要找到问题的指导。(到目前为止,互联网上没有任何帮助。)我应该去哪里诊断问题?
问问题
458 次