9

对于已经在自己的集群上部署 HBase 的人,您是否觉得它对于生产使用足够稳定?您遇到了哪些类型的麻烦或问题?

我确实看到很多公司在生产中使用 HBase ( http://wiki.apache.org/hadoop/Hbase/PoweredBy ),但我很好奇是否需要进行大量维护、修补和防火练习保持 HBase 集群正常运行。

4

1 回答 1

10

HBase 即将通过 HBase-0.20 达到一个重要的里程碑。有一个 alpha 版,很快就会成为一个 RC。它有非常重大的性能改进。据报道,StumbleUpon 使用 HBase 的主干版本为他们的网站提供服务,没有额外的缓存层,其他人也是如此。所以我会说它绝对可以用于生产。

Ryan Rawson(StumbleUpon 的)最近在 nosql 会议上做了一个很好的演讲,主要是关于过去 6 个月的进展情况。如果您不想观看整个内容,可以使用幻灯片。除了性能改进之外,另一个主要的补充是它现在与 zookeeper 集成,因此 master 不再是单点故障。

由于文件格式的限制,HBase 曾经因内存问题的小单元大小而失败。新的自定义文件格式也解决了这个问题,这也提高了性能。

我已经用 HBase 进行了大约一年的试验,我已经准备好将 0.20 用于生产服务,我不太喜欢旧版本。我建议在试验时至少使用 4 或 5 个节点的 devcluster。

我无法真正评论照顾生产集群的感觉,因为我们才刚刚开始生产集群。一个有帮助的方面是邮件列表非常活跃,并且 irc 一直在使用,因此至少有一个非常强大的社区可以提供帮助。

于 2009-06-25T22:06:04.577 回答