我是 Hadoop 和 Hbase 的新手。我想知道是否有一种方法可以在 hbase 表中的某些选定数据区域上映射减少。我的意思是有没有一种方法可以指定 Map reduce 应该采用的表的哪些区域,而不是采用完整的表并根据区域数拆分任务。一些代码片段会有很大帮助。
非常感谢。
您可以设置处理的开始行和结束行。如果您这样做一次 - 您可以在 HBase Web UI 中获取该区域的开始和停止键。
它可以通过使用接受 scan 作为参数的 TableMapReduceUtil 来完成。在内部(我认为)它调用 setStartRow 和 setStopRow 到 TableInputFormat)
在这里您可以找到示例:
http ://massapi.com/class/org/apache/hadoop/mapreduce/Job.java.html (在页面中搜索 setStartRow) .