1

我有一个场景,每天将数据从 MYSQL 数据库摄取到 hadoop 到一个过时的文件夹中。每天都会编辑几行,并且可能还会有一些架构更改。如果我只对最新的数据和模式感兴趣,我们如何在 hadoop 中处理这个问题

4

1 回答 1

0

是 Sqoop 中增量导入的文档。此外,Sqoop 可以在导入数据时获取表名,因此如果架构更改,Sqoop 命令应该相同。

bin/sqoop 导入 --connect jdbc:mysql://localhost/bigdata --table 小部件 -m 1

于 2013-04-11T03:31:05.233 回答