以下是我的问题:
- Hbase 在其内部工作中是否使用 Map/Reduce 从 Hadoop 中提取数据?
- HBase 可以与其他框架(例如 Amazon dynamo)一起使用,还是必须将 Hadoop 作为其基础框架?
- Hbase好学吗?
- 设置我可以练习的 HBase 实例的最佳方法是什么?
当您尝试访问其中的单元格或行时,HBase 不使用 map/reduce。基本上,Hadoop 存储数据以便它知道在哪里找到密钥(密钥按字典顺序存储)。您可以在Lars George的这篇文章中查看详细信息。HBase 确实支持 map/reduce,因此您可以将其用作您创建的作业的源或目标。
HBase 需要 Hadoop API 作为框架,但是像 mapr 或 datastax 这样的公司提供了底层 hadoop 框架的替代实现,所以从技术上讲,如果你真的想这样做,你也可以这样做
相对于什么?:) 使用陈词滥调我会说 HBase 易于学习但难以掌握。您可以非常快速地将数据输入和输出 HBase,但需要时间来学习正确设计模式、了解您的使用模式以及它对使用/禁用预写日志、压缩、拆分、运行的影响每个节点上是否有多个区域服务器等。
最简单的可能是下载一个已经安装了 hadoop 的 VM。例如Cloudera 提供的这些