1
  1. 我在运行 cassandra-0.8.2 的 EC2 上有 12 个节点的 cassandra 集群。在压缩时,我得到了以下异常,导致种子节点宕机。

  2. 下面是异常堆栈跟踪。

错误 [CompactionExecutor:31] 2011-12-16 08:06:02,308 AbstractCassandraDaemon.java(第 139 行)线程中的致命异常 Thread[CompactionExecutor:31,1,main] java.io.IOError: java.io.EOFException: EOF在 org.apache.cassandra.io.sstable.SSTableIdentityIterator.(SSTableIdentityIterator.java:90) 在 org.apache.cassandra.io.sstable.SSTableIdentityIterator.(SSTableIdentityIterator.java:149) 的 778986868 中的 430959023 个字节之后.cassandra.io.sstable.SSTableIdentityIterator.(SSTableIdentityIterator.java:74) 在 org.apache.cassandra.io.sstable.SSTableScanner$KeyScanningIterator.next(SSTableScanner.java:179) 在 org.apache.cassandra.io.sstable。 SSTableScanner$KeyScanningIterator.next(SSTableScanner.java:144) 在 org.apache.cassandra.io.sstable.SSTableScanner.next(SSTableScanner.java:136) 在 org.apache.commons.collections.iterators.Collat​​ingIterator.set(Collat​​ingIterator.java:284) 在 org.apache.commons 的 org.apache.cassandra.io.sstable.SSTableScanner.next(SSTableScanner.java:39) .collections.iterators.Collat​​ingIterator.least(Collat​​ingIterator.java:326) 在 org.apache.commons.collections.iterators.Collat​​ingIterator.next(Collat​​ingIterator.java:230) 在 org.apache.cassandra.utils.ReducingIterator.computeNext(ReducingIterator .java:69) 在 com.google.common.collect.AbstractIterator.tryToComputeNext(AbstractIterator.java:140) 在 com.google.common.collect.AbstractIterator.hasNext(AbstractIterator.java:135) 在 org.apache.commons。 org.apache.commons.collections.iterators 上的 collections.iterators.FilterIterator.setNextObject(FilterIterator.java:183)。FilterIterator.hasNext(FilterIterator.java:94) 在 org.apache.cassandra.db.compaction.CompactionManager.doCompactionWithoutSizeEstimation(CompactionManager.java:569) 在 org.apache.cassandra.db.compaction.CompactionManager.doCompaction(CompactionManager.java: 506) 在 org.apache.cassandra.db.compaction.CompactionManager$1.call(CompactionManager.java:141) 在 org.apache.cassandra.db.compaction.CompactionManager$1.call(CompactionManager.java:107) 在 java.util .concurrent.FutureTask$Sync.innerRun(FutureTask.java:303) at java.util.concurrent.FutureTask.run(FutureTask.java:138) at java.util.concurrent.ThreadPoolExecutor$Worker.runTask(ThreadPoolExecutor.java:886 ) 在 java.lang.Thread 的 java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:908)。运行(Thread.java:662)原因:java.io.EOFException:在 org.apache.cassandra.io.util.FileUtils.skipBytesFully(FileUtils.java:229) 的 org.apache.cassandra.io.util.FileUtils.skipBytesFully(FileUtils.java:229) 的 778986868 中的 430959023 个字节后出现 EOF。 cassandra.io.sstable.IndexHelper.skipIndex(IndexHelper.java:63) 在 org.apache.cassandra.io.sstable.SSTableIdentityIterator.(SSTableIdentityIterator.java:141) ... 23 更多

  • 它说它是由以下原因引起的:java.io.EOFException:
  • 是因为腐败的sstables吗?如果是,那么如何删除或修复这些 sstables?
4

1 回答 1

2

看起来这确实是由损坏的 sstables 引起的(这可能表明存在硬件问题)。我的建议:

  1. 升级到 Cassandra 的最新稳定 0.8.x 版本。这将是 0.8.2 的直接替代品。
  2. 在有问题的机器上运行“nodetool scrub”
  3. 查看http://www.datastax.com/docs/1.0/install/cluster_init -- 我建议每个数据中心使用两个种子节点,但请记住,仅在重启节点时才会咨询种子节点,因此拥有它并不是什么大问题正常运行时一倒
于 2011-12-24T23:30:36.360 回答