将存储在 HDFS 中的数据加载到 HIVE 时,这些来自 HDFS 的数据是否会被复制到 HIVE 使用的不同格式中?还是它使用原始文件来存储/选择/插入/修改数据?
上下文: LOAD DATA INPATH '/home/user/sample.txt' OVERWRITE INTO TABLE 员工;
HIVE 是否始终使用 /home/user/sample.txt 来存储/选择/插入/修改数据,还是在 HDFS/HBASE 上创建一个占用新空间的新文件?
LOAD DATA INPATH
除了将 HDFS 文件移动到表的位置之外,什么都不做,“移动”是指 HDFS 的元数据操作。
文档中对此进行了解释:
如果未指定关键字 LOCAL,则 Hive 将使用文件路径的完整 URI(如果指定),或者将应用以下规则:[...] Hive 会将文件路径寻址的文件移动到表(或分区)中)