0

我想创建一个包含数据库中所有表的所有数据的大表,然后将该表导出到 csv 文件中,然后将该文件导入到 Hbase 中?我的问题是第一步,即如何从所有数据库表中创建大表?我会感谢任何帮助。提前致谢 。

4

3 回答 3

1

如果您希望将所有数据转储到 HBase 或 HDFS,您可以使用 sqoop 将所有表和数据传输到 HBase。将所有数据转换为一张大表可能效率不高或不可行。请注意,不能将 CLOB/BLOB 数据导出到 CVS 文件。

于 2013-04-19T01:00:33.820 回答
1

看看sqoop,可能会有所帮助。

我们使用它将数据从 RDBMS 存储到 Hive 表中。至于 hive,它可以自动创建具有适当列名和类型的表。它还需要split_by用于自定义查询的选项,该选项指定如何将数据拆分为块。

于 2013-04-19T08:59:52.620 回答
0

为什么要这么做?编写 MapReduce 作业并将输出注入 HBase 表。

于 2013-04-18T20:50:34.643 回答