我希望在 cron 上运行导入 Hive,并希望只使用
“将数据本地路径'/tmp/data/x'加载到表X中”到表中就足够了。
后续命令会覆盖表中已有的内容吗?还是会追加?
这个站点http://wiki.apache.org/hadoop/Hive/LanguageManual是你处理 Hive 的朋友。:)
解决将数据加载到 Hive 的页面是http://wiki.apache.org/hadoop/Hive/LanguageManual/DML 该页面指出
如果使用了 OVERWRITE 关键字,则目标表(或分区)的内容将被删除并替换为 filepath 引用的文件。否则文件路径引用的文件将被添加到表中。请注意,如果目标表(或分区)已经有一个文件,其名称与文件路径中包含的任何文件名冲突 - 那么现有文件将被新文件替换。
在您的情况下,您没有使用OVERWRITE
关键字,因此文件将被添加到表中。(除非它们是相同的文件,在这种情况下它们会被覆盖)
如果使用了 OVERWRITE 关键字,则目标表(或分区)的内容将被删除并替换为 filepath 引用的文件;否则文件路径引用的文件将被添加到表中。