问题标签 [hive-query]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
106 浏览

java - 在java中从包含JSON的字符串中访问列名

我在java中有一个字符串

如何仅检索列名我的结果必须是包含由制表符分隔的列名的字符串,即

预期产出

0 投票
1 回答
204 浏览

hive - 在 hive 中将列数据分成多列

我有一个包含两个控制器及其版本的设备的示例数据。样本数据如下:

上述数据应采用以下格式:

我使用了以下不起作用的代码:

我得到的输出是:

我不希望每一行都有 Null 值。有人可以帮我编写正确的代码吗?

0 投票
1 回答
2485 浏览

hive - 从文件中直线运行查询

我想在直线中运行查询存储文件。此代码在腻子中工作正常。

当我将 sql 命令保存到 query.hql 或 query.sql 并上传到 hadoop 所在的服务器时,命令不会导出任何内容。我没有错误。

!run query.hql当我直接在直线中运行时,文件中的查询有效。我在文件方法中的查询有什么问题?

0 投票
1 回答
382 浏览

hadoop - 使用查找表将数据插入 Hive 表

有人可以在这种情况下帮助我吗?

如何通过从其他 Hive 表中查找值来将数据插入 Hive 表?

我的 input_source 表如下所示:

我对上述每种类型都有详细的描述。例如:

等等..

在将数据插入结果表期间,我需要读取行并在最终表中键入并插入描述,如下所示:

你能建议实现这一目标吗?

0 投票
2 回答
5348 浏览

hive - 在 hive 中为直方图创建范围箱

我有一个包含students_id 及其年龄的数据集。我希望标记应排列在桶大小为 10 的范围或 bin 中。

同样,我有更多记录的日期。这必须以 10 的 bin 大小排列。

预期输出为:

我在 hive 中尝试了简单的 case 语句。

有什么简单的方法可以让桶大小为 10 的分箱数据?

有人可以帮我写一个简单的代码吗?

0 投票
1 回答
685 浏览

hive - 在 hive 中每周计算一列的总和

testTable在 Hive 中有一个表格(包含 3 年的数据),其中包含以下列:

我必须用这些列创建一个新表:

从开始 order_date 开始的每周。

我被这个困住了。如何以每周汇总的方式对以下数据进行分组。

0 投票
0 回答
377 浏览

hive - 使用 Single Query Hive 获取所有列统计信息

我知道可以使用命令为 Hive 表计算所有列统计信息 -

然后可以通过命令获取特定列级别的统计信息 -

是否可以使用单个命令获取所有列统计信息?

0 投票
1 回答
3597 浏览

apache-spark - drop table 命令不会删除由 spark-sql 创建的配置单元表的路径

我正在尝试删除创建 Spark-Sql 的表(内部)表,某些表是如何被删除的,但表的位置仍然存在。有人可以让我知道该怎么做吗?

我尝试了直线和 Spark-Sql

谢谢

0 投票
2 回答
906 浏览

sql - 在不改变数据类型字符串的情况下计算hive中两列字符串类型的时间差

我正在尝试计算字符串数据类型的行的两列之间的时间差。如果它们之间的时间差小于 2 小时,则选择该行的第一列,否则如果时间差大于 2 小时,则选择该行的第二列。可以通过将列转换为日期时间格式来完成,但我希望结果仅在字符串中。我怎样才能做到这一点?数据如下所示:

col1(字符串类型)
2018-07-16 02:23:00
2018-07-26 12:26:00
2018-07-26 15:32:00

col2(字符串类型)
2018-07-16 02:36:00
2018-07-26 14:29:00
2018-07-27 15:38:00

0 投票
0 回答
2771 浏览

sql - 使用配置单元查询动态地将行旋转到列

我已经实现了以下查询以将 col_nm 从行旋转到列:

以下是看起来正确的输出: 查询结果

我想知道 col_nm 是否获得了新值,有没有办法动态处理它或使旋转通用?