最近使用hadoop批量加载将数据放入hbase 首先调用HDFS API将数据写入hadoop hdfs中的文件,总共7000,000行数据,大小为503MB。其次,我使用org.apache.hadoop.hbase.mapreduce.ImportTsv和org.apache.hadoop.hbase.mapreduce.LoadIncrementalHFiles将数据放入 hbase。
我做的最重要的事情是使用bulkload工具将数据放入hbase,完成bulkload后,我发现hbase表是1.96GB。hdfs复制是1。我不知道为什么。