我有一个通过 oozie 协调器运行的 sqoop 工作。重大升级后,我们不能再使用 hive cli,并被告知使用 beeline。我不知道该怎么做?这是当前的过程:
我有一个配置单元文件:hive_ddl.hql
use schema_name;
SET hive.exec.dynamic.partition=true;
SET hive.exec.dynamic.partition.mode=nonstrict;
SET hive.exec.max.dynamic.partitions=100000;
SET hive.exec.max.dynamic.partitions.pernode=100000;
SET mapreduce.map.memory.mb=16384;
SET mapreduce.map.java.opts=-Xmx16G;
SET hive.exec.compress.output=true;
SET mapreduce.output.compression.codec=org.apache.hadoop.io.compress.SnappyCodec;
drop table if exists 'table_name_stg' purge;
create external table if not exists 'table_name_stg'
(
col1 string,
col2 string,
...
)
row format delimited
fields terminated by '\001'
stored as textfile
location 'my/location/table_name_stg';
drop table if exists 'table_name' purge;
create table if not exists 'table_name'
stored as parquet
tblproperties('parquet.compress'='snappy') as
select * from schema.tablename_stg
drop table if exists 'table_name_stg' purge;
这很简单,制作一个舞台表,然后用它来制作决赛桌的东西......
然后在 .sh 文件中调用它:
hive cli -f $HOME/my/path/hive_ddl.hql
我对其中的大部分内容都很陌生,不确定直线是什么,也找不到任何示例来说明如何使用它来完成我的 hivecli 的相同事情。我希望它就像以不同方式调用 hive_ddl.hql 文件一样简单,而不必重写所有内容。
任何帮助是极大的赞赏。