问题标签 [apache-hive]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

96 问题

0 投票

0 回答

372 浏览

hive - Hive Float 原语是否可以支持小数点后两个以上的精度？

Hive 仅支持小数点后一位精度。我们可以改变hive中float的精度值吗？如果不是，我们可以覆盖 hive 浮动功能。

但是 hive float 不支持超过 1 的精度值。如何更改 float 的精度值？任何 Hive UDF 吗？我知道 hive 有十进制/双精度值。但是我们需要浮点数来支持更高的精度。

任何建议都会有很大帮助。

hive apache-hive

2017-01-23T11:01:45.940

0 投票

1 回答

3691 浏览

hadoop - 获取所有 Hive 表/数据库创建/删除详细信息（审计日志）

可以说我有一个数据库项目。我创建了一个名为 tab1 的表，然后创建了一个名为 tab2 的表。现在我删除了表 tab1。

我在哪里可以找到显示我已从数据库项目中删除表 tab1 的日志。我想知道丢弃这张桌子的时间、用户等？

编辑

我已在以下内容中检查了审核日志，但在以下任何内容中都找不到我要查找的内容：

Hive Metastore - TBLS、DBS、TRANSACTION 表
Hive 安装日志目录。
hive-site.xml 中提到的 Hive 查询日志路径 - 属性 - “hive.querylog.location”

审核日志将帮助我进行安全级别审核。

2017-02-01T21:47:34.817

0 投票

1 回答

247 浏览

hive - 分析 Apache Hive CLI

此链接Profling Hive CLI提供了有关如何使用 Java 任务控制分析 Hive CLI 的说明。步骤是

创建一个目录来保存分析器输出：mkdir $HOME/profiles
创建一个别名，以便更容易重复： alias debug='HADOOP_CLIENT_OPTS="-XX:+UnlockCommercialFeatures -XX:+FlightRecorder -XX:FlightRecorderOptions=defaultrecording=true,dumponexit=true,dumponexitpath=$HOME/profiles/"'
运行一些 hadoop 客户端命令来分析例如，分析 Hive CLI 启动（以便使用 -e 'exit;'）以及 TRACE 输出： debug hive --hiveconf hive.root.logger=TRACE,console -e 'exit;' 2&>&1 | tee $HOME/profiles/hive_trace.out
归档并收集步骤 1 中使用的目录 tar czvf profile_data.tgz $HOME/profiles

我的问题是

a) 在第 4 步之后，如何使用 java 任务控制来使用收集到的指标

b) 当我使用 2 和 3 中的配置设置启动 hive 时。为什么 Hive 在 java 任务控制台中不可见？

c) 有没有更好的方法来分析 Hive 的组件，例如 hive-exec、hive-metastore？

hive profiling apache-hive java-mission-control

2017-02-08T15:33:07.277

0 投票

1 回答

2707 浏览

hive - 将 Python UDF 与 Hive 一起使用

我正在尝试学习将 Python UDF 与 Hive 一起使用。

我在这里有一个非常基本的 python UDF：

然后我在 Hive 中添加文件：

现在我调用 Hive 查询：

这按预期工作，没有对字段进行任何更改，并且输出按原样打印。

现在，当我通过引入 split 函数来修改 UDF 时，我得到一个执行错误。我如何在这里调试？我做错了什么？

新的 UDF：

hive hiveql apache-hive

2017-02-13T22:23:29.080

0 投票

1 回答

2594 浏览

hadoop - 如何重命名配置单元中的所有分区列

当我尝试重命名现有表中的所有分区列以进行一年的日期范围时 - 这就是我得到的。

hive> ALTER TABLE test.usage PARTITION ('date') RENAME TO PARTITION (partition_date);

FAILED: ValidationFailureSemanticException Partition spec {partition_date=null} contains non-partition columns.

我从这里得到了这个语法：1

hadoop hiveql hadoop-partitioning apache-hive

2017-02-14T18:11:29.683

0 投票

0 回答

574 浏览

apache - 使用 Apache Hive 功能屏蔽和过滤行/列

最近我发现 Hive 中添加了行/列的屏蔽和过滤功能。https://issues.apache.org/jira/browse/HIVE-13125但是仍然没有关于它的文档。在我的研究中，我发现我们可以通过 Apache Ranger 使用此功能。是否可以使用 hive cli 或 beeline 手动配置和使用此功能？

apache hadoop hive apache-hive

2017-02-16T13:50:32.210

0 投票

1 回答

663 浏览

apache - 在不使用滑块的情况下为 LLAP 配置 Apache Hive

Hive 中有一个名为 LLAP 的新功能。在调查过程中，我发现配置 LLAP 非常困难，因此有一个名为 Apache Slider 的组件将对其进行配置。如果没有 Slider，我仍然找不到任何手动配置的文档。https://cwiki.apache.org/confluence/display/Hive/LLAP

apache hive apache-hive tez

2017-02-21T10:16:10.100

0 投票

2 回答

1924 浏览

apache-hive - 在 Beeline (Hive) 中添加本地文件

我正在尝试通过 Beeline 客户端添加本地文件，但是我一直遇到一个问题，它告诉我该文件不存在。

有什么问题？

apache-hive beeline

2017-02-27T22:08:56.873

0 投票

1 回答

778 浏览

hadoop - 删除与分区相关的hdfs文件后无法联系hive表分区

我的 Hadoop 集群在 11:00 对每个数据进行批处理作业。

该作业创建配置单元表分区（例如p_date = 201702，p_domain = 0）并将rdbms数据导入配置单元表分区，如ETL ....（配置单元表不是外部表）

但是作业失败了，我删除了一些 hdfs 文件（分区位置 => p_date=20170228,p_domain=0）以进行重新处理。

这是我的错误，我只是在直线处输入查询删除分区...

当我以这种方式查询“select * from table_name where p_date=20170228,p_domain=0”时，我联系了一个挂起，但是“select * from table_name where p_date=20170228,p_domain=6”是成功的。

我找不到错误日志并且没有出现控制台消息

我怎么解决这个问题？

我希望你能理解我缺乏英语。

hadoop hive hiveql apache-hive

2017-03-01T10:12:58.913

0 投票

3 回答

14999 浏览

struct - 选择 Hive 结构的所有列

我需要从 hive 结构的所有列中选择 *。

Hive 创建表脚本在下面

创建表脚本

select * from table 将每个结构显示为列 select * from table

我的要求是将结构集合的所有字段显示为配置单元中的列。

用户不必单独编写列名。有没有人有UDF来做到这一点？

struct hive udf apache-hive hive-udf

2017-03-16T22:54:20.420

1 2 3 4 5 6 7 8 9 10

问题标签 [apache-hive]

Reference