0

我需要将 RDBMS 表中的数据导入远程 Hive 机器。我怎样才能使用 Sqoop 实现这一点?

简而言之,如何在导入命令中指定 hive 数据库名称和 hive 机器 i/p?

请帮助我使用适当的 sqoop 命令。

4

1 回答 1

1

您应该在sqoop安装了 Hive 的机器上运行该命令,因为sqoop会寻找$HIVE_HOME/bin/hive执行 theCREATE TABLE ...和其他语句。

或者,您可以使用sqoop命令--hive-home行选项来指定 Hive 的安装位置(只是覆盖$HIVE_HOME

要连接到远程 RDBMS:

sqoop import --connect jdbc:mysql://remote-server/mytable --username xxx --password yyy

要导入 Hive:

sqoop import --hive-import

您可以通过查看 http://archive.cloudera.com/cdh/3/sqoop/SqoopUserGuide.html#_literal_sqoop_import_literal">此链接获得更全面的命令列表。

于 2013-01-25T19:20:03.323 回答