我已经通过nutch将我爬取的数据保存在文件系统为hdfs的Hbase中。然后我通过命令将我的数据(一个 hbase 表)从 hdfs 直接复制到某个本地目录
hadoop fs -CopyToLocal /hbase/input ~/Documents/output
之后,我通过以下命令将该数据复制回另一个 hbase(其他系统)
hadoop fs -CopyFromLocal ~/Documents/input /hbase/mydata
它保存在 hdfs 中,当我list
在 hbase shell 中使用命令时,它显示为另一个表,即“mydata”,但是当我运行scan
命令时,它说没有名为“mydata”的表。
上述程序有什么问题?简单来说:
- 我想使用 hadoop 命令将 hbase 表复制到我的本地文件系统
- 然后,我想通过hadoop命令直接保存在另一个系统的hdfs中
- 最后,我希望表出现在hbase中,并将其数据显示为原始表