Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我有一个场景,每天将数据从 MYSQL 数据库摄取到 hadoop 到一个过时的文件夹中。每天都会编辑几行,并且可能还会有一些架构更改。如果我只对最新的数据和模式感兴趣,我们如何在 hadoop 中处理这个问题
这是 Sqoop 中增量导入的文档。此外,Sqoop 可以在导入数据时获取表名,因此如果架构更改,Sqoop 命令应该相同。
bin/sqoop 导入 --connect jdbc:mysql://localhost/bigdata --table 小部件 -m 1