0

我有一个通过 oozie 协调器运行的 sqoop 工作。重大升级后,我们不能再使用 hive cli,并被告知使用 beeline。我不知道该怎么做?这是当前的过程:

我有一个配置单元文件:hive_ddl.hql

use schema_name;

SET hive.exec.dynamic.partition=true;
SET hive.exec.dynamic.partition.mode=nonstrict;
SET hive.exec.max.dynamic.partitions=100000;
SET hive.exec.max.dynamic.partitions.pernode=100000;
SET mapreduce.map.memory.mb=16384;
SET mapreduce.map.java.opts=-Xmx16G;
SET hive.exec.compress.output=true;
SET mapreduce.output.compression.codec=org.apache.hadoop.io.compress.SnappyCodec;

drop table if exists 'table_name_stg' purge;

create external table if not exists 'table_name_stg'
(
col1 string,
col2 string,
...
)
row format delimited
fields terminated by '\001'
stored as textfile
location 'my/location/table_name_stg';

drop table if exists 'table_name' purge;

create table if not exists 'table_name'
stored as parquet
tblproperties('parquet.compress'='snappy') as 
select * from schema.tablename_stg

drop table if exists 'table_name_stg' purge;

这很简单,制作一个舞台表,然后用它来制作决赛桌的东西......

然后在 .sh 文件中调用它:

hive cli -f $HOME/my/path/hive_ddl.hql

我对其中的大部分内容都很陌生,不确定直线是什么,也找不到任何示例来说明如何使用它来完成我的 hivecli 的相同事情。我希望它就像以不同方式调用 hive_ddl.hql 文件一样简单,而不必重写所有内容。

任何帮助是极大的赞赏。

4

1 回答 1

0

Beeline 是 hive 中支持的命令行 shell。在您的情况下,您可以在同一个 .sh 文件中用 beeline 命令替换 hive cli。看起来大致像下面给出的那个。

直线 -u hiveJDBCUrl 和 -f test.hql

您可以通过以下链接了解有关直线命令选项的更多信息

https://cwiki.apache.org/confluence/display/Hive/HiveServer2+Clients#HiveServer2Clients-Beeline%E2%80%93CommandLineShell

于 2021-04-28T07:54:50.100 回答