5

我希望在 cron 上运行导入 Hive,并希望只使用

“将数据本地路径'/tmp/data/x'加载到表X中”到表中就足够了。

后续命令会覆盖表中已有的内容吗?还是会追加?

4

2 回答 2

7

这个站点http://wiki.apache.org/hadoop/Hive/LanguageManual是你处理 Hive 的朋友。:)

解决将数据加载到 Hive 的页面是http://wiki.apache.org/hadoop/Hive/LanguageManual/DML 该页面指出

如果使用了 OVERWRITE 关键字,则目标表(或分区)的内容将被删除并替换为 filepath 引用的文件。否则文件路径引用的文件将被添加到表中。请注意,如果目标表(或分区)已经有一个文件,其名称与文件路径中包含的任何文件名冲突 - 那么现有文件将被新文件替换。

在您的情况下,您没有使用OVERWRITE关键字,因此文件将被添加到表中。(除非它们是相同的文件,在这种情况下它们会被覆盖)

于 2011-04-05T06:33:31.510 回答
0

如果使用了 OVERWRITE 关键字,则目标表(或分区)的内容将被删除并替换为 filepath 引用的文件;否则文件路径引用的文件将被添加到表中。

于 2014-07-15T01:58:04.917 回答