0

这是我进入 Hive 的处女航。我有多个 Hive 表,例如名称如下的快照:

revenue_20110131
reveue_20110228
revenue_20110331

purchases_qrt1
purchases_qrt2
purchases_qrt3
purchases_qrt4

我有很多这样的快照表。现在,我需要构建一个脚本,该脚本将表名的一部分作为参数,并从所有类似命名的表中读取记录,并将所有这些表中的全部数据导出到单个 ORC 文件中。

如何在 Hive 中执行此操作?我不知道从哪里开始,因为我以前从未在 Hive 上工作过。有人可以帮帮我吗?提前谢谢各位。

4

1 回答 1

1

如果表在其位置有共同的上层子目录,您可以使用上层目录创建新表并在单选中选择所有表。

create table new tbl 
...
location 'upper common directory path here'

然后在选择之前添加这些设置:

set hive.mapred.supports.subdirectories=TRUE;
set mapred.input.dir.recursive=TRUE;
于 2019-06-12T18:35:31.920 回答