我想创建一个包含数据库中所有表的所有数据的大表,然后将该表导出到 csv 文件中,然后将该文件导入到 Hbase 中?我的问题是第一步,即如何从所有数据库表中创建大表?我会感谢任何帮助。提前致谢 。
问问题
840 次
3 回答
1
如果您希望将所有数据转储到 HBase 或 HDFS,您可以使用 sqoop 将所有表和数据传输到 HBase。将所有数据转换为一张大表可能效率不高或不可行。请注意,不能将 CLOB/BLOB 数据导出到 CVS 文件。
于 2013-04-19T01:00:33.820 回答
1
看看sqoop,可能会有所帮助。
我们使用它将数据从 RDBMS 存储到 Hive 表中。至于 hive,它可以自动创建具有适当列名和类型的表。它还需要split_by
用于自定义查询的选项,该选项指定如何将数据拆分为块。
于 2013-04-19T08:59:52.620 回答
0
为什么要这么做?编写 MapReduce 作业并将输出注入 HBase 表。
于 2013-04-18T20:50:34.643 回答