我的 mapreduce 作业程序是由 python 编写的,我想从 HBase 获取数据作为输入。有没有什么方法可以用 MapReduce 的方式扫描 HBase 表中的数据,比如原生 Java 实现中的 TableMapper/Reducer。我了解到,HappyBase 可以提供一种与 HBase 交互的简单方法,但它只适用于客户端。
问问题
1080 次
1 回答
1
您可以编写一个从 HBase 获取数据的 pig 脚本,然后通过流式传输或如果您使用 jython,则通过UDF集成 python
于 2013-04-03T17:06:53.770 回答