在工作中,我们正在尝试执行以下操作:
- 通过 Amazon 运行 Elastic MapReduce 作业,它将 Hadoop 冻结在 0.20.205 版本
- 将输出写入在 EC2 上运行的 HBase,特别是来自 Cloudera 的 0.92.1-cdh4.0.1
到目前为止,我发现当我在 Hadoop 作业(通过 maven 打包)中使用 Apache HBase 0.92.1 时,我的 WordCount 测试似乎有效。我担心这是意外工作,并且随着我的使用成熟可能会爆炸。
但是,当我在 Hadoop 作业中打包 HBase 0.92.1-cdh4.0.1 时,我得到ClassNotFoundException
:
https://emr-qa.eventbrite.com.s3.amazonaws.com/logs/j-RWJ75VR11SLB/steps/1/stderr
- Apache HBase jar 能否与 CDH Hbase 服务器很好地配合使用?
- 像这样混合版本和软件包是可怕的主意吗?