问题标签 [hive-query]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
hadoop - Hive Query:如何使用 group by 和 rank?
我有一张如下表
以 开头的字段avg_
是指一年中一个月的平均值。我需要为每个部门找到平均值avg_close
最低的年份。
我试图做类似下面的事情
但这只是打印一个部门和一年,如下所示
我是蜂巢的新手,并且玩弄了一些玩具模式。有人可以让我知道解决这个问题的正确方法是什么吗?
蜂巢版本 - 1.1.0
sql - Hive 嵌套查询左连接
我是 hive 新手,我想实现以下查询
在最后一个左连接之前它工作正常。嵌套查询显然没有在 hive 中授权。
我该如何解决这个问题。
sql - Hive SQL 逻辑 - case when 语句
我的查询:
期望的输出:
实际输出:
sql - 从序列中为配置单元中的每个值查找缺失的数字
我有一张如下表-
这里 0 1 和 2 是用户最多可以拥有的固定序列,现在我想要一个作为 N 的标志,其中用户缺少任何序列,否则标志应该是 YI 可以说输出应该像 -
hive - 用于 Hive 插入查询的 ConvertJsonToSQL
我想将 Json 插入 hive 数据库。
我尝试使用 ConvertJsonToSQL Ni-Fi 处理器将 Json 转换为 SQL。如何PARTITION (....)
在查询中使用部分?
我可以这样做还是应该使用 ReplaceText 处理器进行查询?
sql - Hive 在导出 csv 时抛出 ParseException
运行此代码,我正在尝试导出 csv,但出现以下错误:
ParseException 行 2:3 无法识别表达式规范中 'MIN' '(' 'HIGH' 附近的输入
arrays - 如何使用 hive 查询查找 hive json 数组字段的长度
这是 Hive JSON 的关键之一。我想找到"keys"
字段的长度。我正在使用get_json_object()
方法读取 JSON。
这是我正在做的,但得到错误的方式:
variables - 在 HiveQL 中使用 hive 变量
我有一个提供 max_processed_date 的查询(它提供单个值),并且该日期用于从 master_table 获取数据。我正在使用 hivevars 来执行此操作,但它直接替换查询而不是首先评估它。
但这表现为select * from master_table where process_date > select max_processed_date from Tab_date where process='X';
hiveql 不支持。是否可以先评估 hivevar 并且可以在 master_table 查询中使用该值?
sql - Hive : 通过与数据定义记录比较来验证数组中填充数据的质量,并查找填充的数据百分比,数据的质量等级
我有两张桌子。表 t1 定义了元数据。即,理想交易应包含哪些属性值。它还通过数组中记录的顺序来定义属性的重要性顺序。第一个记录是最重要的,它的权重为 1。第二个有 0.9,第 3 - 0.8,第 4 - 0.7 等等....任何高于 10 的都是最不重要的。我需要查找事务表 t2 中填写的数据质量。找出填充属性的百分比以及它们的质量等级。
t1
t2
我正在寻找方法来计算我的 t2 记录的质量排名,如下所示
B123 - (4 个中有 2 个)完成 50%。质量等级 - (0.9+0.7)/4 = 0.4
B456 - (3 个中的 2 个)完成 66.66%。质量等级 - (1+0.8)/3 = 0.6