我正在看以下场景。我每天都会发送一个数据文件。我将它添加到 HBase 中,名称为 file-yyyyMMdd 格式。所以在一段时间内我有很多数据库,例如
tempdb-20121220
tempdb-20121221
tempdb-20121222
tempdb-20121223
tempdb-20121224
tempdb-20121225
现在我想做的是针对特定日期范围获取列表,如果表匹配该范围,以便我可以创建索引。我正在使用 hbase-0.90.6
就我的研究而言,TableMapReduceUtil.initTableMapperJob 只需要 1 个表名。
TableMapReduceUtil.initTableMapperJob(
tableName, // input HBase table name
scan, // Scan instance to control CF and attribute selection
HBaseIndexerMapper.class, // mapper
null, // mapper output key
null, // mapper output value
job
);
我已经能够获取表列表并循环运行它,但我的想法是我可以遍历所有表,扫描它(或其他东西),以便最终我可以获得用于索引目的的合并/组合结果.
实现这一目标的任何方向都会非常有用。