问题标签 [hive-query]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - 在java中从包含JSON的字符串中访问列名
我在java中有一个字符串
如何仅检索列名我的结果必须是包含由制表符分隔的列名的字符串,即
预期产出
hive - 在 hive 中将列数据分成多列
我有一个包含两个控制器及其版本的设备的示例数据。样本数据如下:
上述数据应采用以下格式:
我使用了以下不起作用的代码:
我得到的输出是:
我不希望每一行都有 Null 值。有人可以帮我编写正确的代码吗?
hive - 从文件中直线运行查询
我想在直线中运行查询存储文件。此代码在腻子中工作正常。
当我将 sql 命令保存到 query.hql 或 query.sql 并上传到 hadoop 所在的服务器时,命令不会导出任何内容。我没有错误。
!run query.hql
当我直接在直线中运行时,文件中的查询有效。我在文件方法中的查询有什么问题?
hadoop - 使用查找表将数据插入 Hive 表
有人可以在这种情况下帮助我吗?
如何通过从其他 Hive 表中查找值来将数据插入 Hive 表?
我的 input_source 表如下所示:
我对上述每种类型都有详细的描述。例如:
等等..
在将数据插入结果表期间,我需要读取行并在最终表中键入并插入描述,如下所示:
你能建议实现这一目标吗?
hive - 在 hive 中为直方图创建范围箱
我有一个包含students_id 及其年龄的数据集。我希望标记应排列在桶大小为 10 的范围或 bin 中。
同样,我有更多记录的日期。这必须以 10 的 bin 大小排列。
预期输出为:
我在 hive 中尝试了简单的 case 语句。
有什么简单的方法可以让桶大小为 10 的分箱数据?
有人可以帮我写一个简单的代码吗?
hive - 在 hive 中每周计算一列的总和
我testTable
在 Hive 中有一个表格(包含 3 年的数据),其中包含以下列:
我必须用这些列创建一个新表:
从开始 order_date 开始的每周。
我被这个困住了。如何以每周汇总的方式对以下数据进行分组。
hive - 使用 Single Query Hive 获取所有列统计信息
我知道可以使用命令为 Hive 表计算所有列统计信息 -
然后可以通过命令获取特定列级别的统计信息 -
是否可以使用单个命令获取所有列统计信息?
apache-spark - drop table 命令不会删除由 spark-sql 创建的配置单元表的路径
我正在尝试删除创建 Spark-Sql 的表(内部)表,某些表是如何被删除的,但表的位置仍然存在。有人可以让我知道该怎么做吗?
我尝试了直线和 Spark-Sql
谢谢
sql - 在不改变数据类型字符串的情况下计算hive中两列字符串类型的时间差
我正在尝试计算字符串数据类型的行的两列之间的时间差。如果它们之间的时间差小于 2 小时,则选择该行的第一列,否则如果时间差大于 2 小时,则选择该行的第二列。可以通过将列转换为日期时间格式来完成,但我希望结果仅在字符串中。我怎样才能做到这一点?数据如下所示:
col1(字符串类型)
2018-07-16 02:23:00
2018-07-26 12:26:00
2018-07-26 15:32:00
col2(字符串类型)
2018-07-16 02:36:00
2018-07-26 14:29:00
2018-07-27 15:38:00