在使用 hdfs 复制将 orc 文件插入表的文件夹后,如何在使用 hive 查询时更新该 hive 表的数据以查看这些数据。
此致。
如果表未分区,则一旦文件位于 LOCATION 子句中指定的文件夹中的 HDFS 中,则数据应该可用于查询。
如果表是分区的,那么您首先需要运行 ADD PARTITION 语句。
正如belostoky在上面的回答中提到的。如果表没有分区,那么您可以使用更新的数据直接查询您的表但是如果您的表是分区的,您需要首先在配置单元表中添加分区,您可以使用
您可以使用 alter table 语句添加分区,如下所示
ALTER TABLE table1
ADD PARTITION (dt='<date>')
location '<hdfs file path>'
添加分区后,配置单元元存储应该知道更改,因此您需要运行
msck repair table table1
在 Metastore 中添加分区。
完成后,您可以查询您的数据