1

将存储在 HDFS 中的数据加载到 HIVE 时,这些来自 HDFS 的数据是否会被复制到 HIVE 使用的不同格式中?还是它使用原始文件来存储/选择/插入/修改数据?

上下文: LOAD DATA INPATH '/home/user/sample.txt' OVERWRITE INTO TABLE 员工;

HIVE 是否始终使用 /home/user/sample.txt 来存储/选择/插入/修改数据,还是在 HDFS/HBASE 上创建一个占用新空间的新文件?

4

2 回答 2

1

LOAD DATA INPATH除了将 HDFS 文件移动到表的位置之外,什么都不做,“移动”是指 HDFS 的元数据操作。

于 2017-04-03T14:22:13.547 回答
1

文档中对此进行了解释:

如果未指定关键字 LOCAL,则 Hive 将使用文件路径的完整 URI(如果指定),或者将应用以下规则:[...] Hive 会将文件路径寻址的文件移动到表(或分区)中)

于 2017-04-03T14:23:00.427 回答