问题标签 [hive-query]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
31 浏览

hadoop - Hive Query:如何使用 group by 和 rank?

我有一张如下表

以 开头的字段avg_是指一年中一个月的平均值。我需要为每个部门找到平均值avg_close最低的年份。

我试图做类似下面的事情

但这只是打印一个部门和一年,如下所示

我是蜂巢的新手,并且玩弄了一些玩具模式。有人可以让我知道解决这个问题的正确方法是什么吗?

蜂巢版本 - 1.1.0

0 投票
1 回答
58 浏览

sql - Hive 嵌套查询左连接

我是 hive 新手,我想实现以下查询

在最后一个左连接之前它工作正常。嵌套查询显然没有在 hive 中授权。

我该如何解决这个问题。

0 投票
2 回答
79 浏览

sql - Hive SQL 逻辑 - case when 语句

我的查询:

期望的输出:

实际输出:

0 投票
1 回答
155 浏览

sql - 从序列中为配置单元中的每个值查找缺失的数字

我有一张如下表-

这里 0 1 和 2 是用户最多可以拥有的固定序列,现在我想要一个作为 N 的标志,其中用户缺少任何序列,否则标志应该是 YI 可以说输出应该像 -

0 投票
1 回答
107 浏览

hive - 用于 Hive 插入查询的 ConvertJsonToSQL

我想将 Json 插入 hive 数据库。

我尝试使用 ConvertJsonToSQL Ni-Fi 处理器将 Json 转换为 SQL。如何PARTITION (....)在查询中使用部分?

我可以这样做还是应该使用 ReplaceText 处理器进行查询?

0 投票
1 回答
43 浏览

sql - Hive 在导出 csv 时抛出 ParseException

运行此代码,我正在尝试导出 csv,但出现以下错误:

ParseException 行 2:3 无法识别表达式规范中 'MIN' '(' 'HIGH' 附近的输入

0 投票
1 回答
101 浏览

hadoop - 使用未运行的 QL 插入配置单元

我想将简单查询插入配置单元表;

我使用以下代码创建表create table t(id int, f1 String, f2 int);并尝试插入insert into t values (1, '123', 1);

创建了一个任务,但没有执行。

我究竟做错了什么?

UPD:来自 GUI 的列表:在此处输入图像描述

1

0 投票
2 回答
1830 浏览

arrays - 如何使用 hive 查询查找 hive json 数组字段的长度

这是 Hive JSON 的关键之一。我想找到"keys"字段的长度。我正在使用get_json_object()方法读取 JSON。

这是我正在做的,但得到错误的方式:

0 投票
1 回答
21 浏览

variables - 在 HiveQL 中使用 hive 变量

我有一个提供 max_processed_date 的查询(它提供单个值),并且该日期用于从 master_table 获取数据。我正在使用 hivevars 来执行此操作,但它直接替换查询而不是首先评估它。

但这表现为select * from master_table where process_date > select max_processed_date from Tab_date where process='X';

hiveql 不支持。是否可以先评估 hivevar 并且可以在 master_table 查询中使用该值?

0 投票
1 回答
22 浏览

sql - Hive : 通过与数据定义记录比较来验证数组中填充数据的质量,并查找填充的数据百分比,数据的质量等级

我有两张桌子。表 t1 定义了元数据。即,理想交易应包含哪些属性值。它还通过数组中记录的顺序来定义属性的重要性顺序。第一个记录是最重要的,它的权重为 1。第二个有 0.9,第 3 - 0.8,第 4 - 0.7 等等....任何高于 10 的都是最不重要的。我需要查找事务表 t2 中填写的数据质量。找出填充属性的百分比以及它们的质量等级。

t1

t2

我正在寻找方法来计算我的 t2 记录的质量排名,如下所示

B123 - (4 个中有 2 个)完成 50%。质量等级 - (0.9+0.7)/4 = 0.4

B456 - (3 个中的 2 个)完成 66.66%。质量等级 - (1+0.8)/3 = 0.6