我对 hadoop 和 hbase 非常陌生,并且在我找到的每个教程中都有一些概念性问题让我感到困惑。
我在我的 win 7 系统上的 ubuntu VM 内的单个节点上运行 hadoop 和 hbase。我有一个 csv 文件,我想将它加载到单个 hbase 表中。
这些列是:loan_number、borrower_name、current_distribution_date、loan_amount
我知道我需要编写一个 MapReduce 作业来将这个 csv 文件加载到 hbase 中。以下教程描述了编写此 MapReduce 作业所需的 Java。 http://salsahpc.indiana.edu/ScienceCloud/hbase_hands_on_1.htm
我缺少的是:
我在哪里保存这些文件以及在哪里编译它们?我应该在运行 Visual Studio 12 的 win 7 机器上编译它,然后将其移动到 ubuntu vm 吗?
我读了这个 SO 问题和答案,但我想我仍然缺少基础知识:Loading CSV File into Hbase table using MapReduce
我找不到任何涵盖这些基本 hadoop/hbase 物流的东西。任何帮助将不胜感激。