我有一个有四个节点的集群,每个节点都有 70G 数据。当我向集群添加一个新节点时,它总是会警告我关于墓碑问题,如下所示:
WARN 09:38:03 Read 2578 live and 1114 tombstoned cells in xxxtable (see tombstone_warn_threshold).
10000 columns was requested, slices=[-], delInfo={deletedAt=-9223372036854775808,
localDeletion=2147483647, ranges=[FAE69193423616A400258D99B9C0CCCFEC4A9547C1A1FC17BF569D2405705B8E:_-FAE69193423616A400258D99B9C0CCCFEC4A9547C1A1FC17BF569D2405705B8E:!,
deletedAt=1456243983944000, localDeletion=1456243983][FAE69193423616A40EC252766DDF513FBCA55ECDFAF452052E6C95D4BD641201:_-FAE69193423616A40EC252766DDF513FBCA55ECDFAF452052E6C95D4BD641201:!,
deletedAt=1460026357100000, localDeletion=1460026357][FAE69193423616A41BED8E613CD24BF3583FB6C6ABBA13F19C3E2D1824D01EF6:_-FAE69193423616A41BED8E613CD24BF3583FB6C6ABBA13F19C3E2D1824D01EF6:!, deletedAt=1458176745950000, localDeletion=1458176745][FAE69193423616A41BED8E613CD24BF3B06C1306E35B0ACA719D800D254E5930:_-FAE69193423616A41BED8E613CD24BF3B06C1306E35B0ACA719D800D254E5930:!, deletedAt=1458176745556000, localDeletion=1458176745][FAE69193423616A41BED8E613CD24BF3BA2AE7FC8340F96CC440BDDFFBCBE7D0:_-FAE69193423616A41BED8E613CD24BF3BA2AE7FC8340F96CC440BDDFFBCBE7D0:!,
deletedAt=1458176745740000, localDeletion=1458176745][FAE69193423616A41BED8E613CD24BF3E5A681C7ECC09A93429CEE59A76DA131:_-FAE69193423616A41BED8E613CD24BF3E5A681C7ECC09A93429CEE59A76DA131:!,
deletedAt=1458792793219000, localDeletion=
最后需要很长时间才能开始并抛出
java.lang.OutOfMemoryError: Java heap space
以下是错误日志:
信息 20:39:20 ConcurrentMarkSweep GC 在 5859 毫秒内。CMS 老一代:6491794984 -> 6492437040;Par Eden 空间:1398145024 -> 1397906216;Par Survivor Space: 349072992 -> 336156096 INFO 20:39:20 refresh_token 排队刷新:693 (0%) on-heap, 0 (0%) off-heap 信息 20:39:20 池名称 活动 待处理 已完成 已阻止 所有时间已被阻止 信息 20:39:20 log_user_track 的排队刷新:7047 (0%) on-heap, 0 (0%) off-heap 信息 20:39:20 CounterMutationStage 0 0 0 0 0 INFO 20:39:20 排队刷新用户输入框:42819 (0%) on-heap, 0 (0%) off-heap INFO 20:39:20 排队刷新消息:7954 (0%) 堆上,0 (0%) 堆外 信息 20:39:20 ReadStage 0 0 0 0 0 信息 20:39:20 请求响应阶段 0 0 6 0 0 信息 20:39:20 sstable_activity 的排队刷新:6567 (0%) on-heap, 0 (0%) off-heap 信息 20:39:20 ReadRepairStage 0 0 0 0 0 信息 20:39:20 convmsgs 排队刷新:2132 (0%) 堆上,0 (0%) 堆外 信息 20:39:20 突变阶段 0 0 72300 0 0 INFO 20:39:20 sstable_activity 的排队刷新:1791 (0%) on-heap, 0 (0%) off-heap 信息 20:39:20 GossipStage 0 0 23655 0 0 信息 20:39:20 log_user_track 的队列刷新:1165 (0%) on-heap, 0 (0%) off-heap 信息 20:39:20 反熵阶段 0 0 0 0 0 信息 20:39:20 sstable_activity 的排队刷新:2388 (0%) on-heap, 0 (0%) off-heap 信息 20:39:20 CacheCleanupExecutor 0 0 0 0 0 java.lang.OutOfMemoryError:Java 堆空间 将堆转储到 java_pid17155.hprof ...
当我运行时nodetool tpstats
,我看到 MemtableFlushWriter 和 MemtablePostFlush 的任务正在等待很多。
池名称 Active Pending Completed Blocked All time Blocked 反突变阶段 0 0 0 0 0 读取阶段 0 0 0 0 0 请求响应阶段 0 0 8 0 0 突变阶段 0 0 1382245 0 0 读取修复阶段 0 0 0 0 0 八卦舞台 0 0 23553 0 0 缓存清理执行器 0 0 0 0 0 反熵阶段 0 0 0 0 0 迁移阶段 0 0 0 0 0 验证执行器 0 0 0 0 0 提交日志存档器 0 0 0 0 0 杂项阶段 0 0 0 0 0 MemtableFlushWriter 4 7459 220 0 0 MemtableReclaimMemory 0 0 231 0 0 待定范围计算器 0 0 3 0 0 MemtablePostFlush 1 7464 331 0 0 压实执行器 3 3 269 0 0 内部响应阶段 0 0 0 0 0 提示切换 0 0 4 0 0