0
  1. 我使用 R 脚本在 HDFS 中添加了一个 CSV 文件。

  2. 我用新的 CSV/追加数据更新这个 CSV

  3. 在此 CSV 上使用 Hive 中的色调创建表。

  4. 将其更改为外部表。

现在,如果在 hdfs 位置更改数据时,hive 表中的数据会自动更新吗?

4

1 回答 1

2

这就是 Hive 中的外部(以及托管)表的情况。它们不是真正的桌子。您可以将它们视为指向 HDFS 位置的链接。因此,每当您查询外部表时,Hive 都会从您在创建此表时选择的位置读取所有数据。

来自 Hive 文档:

EXTERNAL 表指向任何 HDFS 位置进行存储,而不是存储在配置属性 hive.metastore.warehouse.dir 指定的文件夹中。

于 2016-06-06T14:52:07.100 回答