问题标签 [hive-udf]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
966 浏览

hive - HIVE UDF:RuntimeException 内部错误:找不到未知的 ObjectInspector

我尝试创建一个配置单元 UDF,它返回多个结果。经度和纬度是 UDF 的参数。

当我运行该函数时,出现“FAILED: RuntimeException Internal error: Cannot find ObjectInspector for UNKNOWN”错误。

代码:

0 投票
3 回答
14999 浏览

struct - 选择 Hive 结构的所有列

我需要从 hive 结构的所有列中选择 *。

Hive 创建表脚本在下面

创建表脚本

select * from table 将每个结构显示为列 select * from table

我的要求是将结构集合的所有字段显示为配置单元中的列。

用户不必单独编写列名。有没有人有UDF来做到这一点?

0 投票
1 回答
69 浏览

hadoop - 我的 HiveUDF 中的错误

我正在尝试编写一个 Hive UDF,它检查 Hive 表中的列并将字符串与它连接起来。我的 Hive 表 cityTab 架构和数据:

我写了以下 Hive UDF:

我添加了 jar,创建了一个临时函数并执行如下:

但我看到输出数据没有任何新字符串的连接:

谁能告诉我我在这里犯了什么错误。

0 投票
2 回答
4851 浏览

hadoop - Hive 给出 SemanticException [错误 10014]:运行我的 UDF 时

我有一个执行 GeoIP 查找的配置单元 UDF。

然后我用这个做了一个罐子,在 hive Cli 中运行了以下内容

我将 GeoIP2-Enterprise.mmdb 数据库的位置传递给 udf。它在我的本地系统上运行良好。但是当我用它制作 jar 并在 cli 中运行它时,它给了我一个错误说

我还尝试将参数从 Text 更改为 String,这给了我同样的异常。有人可以告诉我我做错了什么吗?谢谢

编辑:添加以下部分

我在 hive 调试模式下运行它并得到了这个

0 投票
1 回答
552 浏览

hive - 处理 hive udf 中的多行

我怎么能在 hive-udf 中取多行?我需要函数内的一整列name,以便可以将其添加到 UDF 内的 ArrayList 中。以下是列名:

我想获取 UDF 内列中的所有名称。

0 投票
1 回答
352 浏览

hadoop - 使用存储处理程序和 Hive 更新 JDBC 数据库表

我读过使用 Hive JDBC 存储处理程序(https://github.com/qubole/Hive-JDBC-Storage-Handler),可以在不同的数据库(MySQL、Oracle、DB2)上创建 Hive 中的外部表,用户可以使用此处理程序使用 Hive 读取和写入 JDBC 数据库。我的问题在更新中。如果我们使用支持 Hive 更新/删除的 hive.14 并使用存储处理程序将外部表指向 JDBC 数据库表,那么当我们从 Hive 端触发更新查询时,它是否允许我们更新数据库表?

0 投票
1 回答
585 浏览

python - 蜂巢 Python UDF

我正在使用这个 Python UDF 脚本:

在 Putty 中执行以下命令时。

我收到此错误:

原因:org.apache.hadoop.hive.ql.metadata.HiveException: Hive Runtime Error while processing row {"number": "ABC00548","shortdescription":""India Optimizer 中的主数据不一致检查。"}

失败:执行错误,从 org.apache.hadoop.hive.ql.exec.mr.MapRedTask 返回代码 2 已启动 MapReduce 作业:Stage-Stage-1:映射:4 HDFS 读取:0 HDFS 写入:0 FAIL MapReduce CPU 总时间花费:0 毫秒

0 投票
0 回答
161 浏览

hadoop - 安全集群上具有 hbase 连接的 hive udf

我正在尝试编写一个连接到 hbase 表的配置单元 udf。但是,由于安全异常,程序无法访问并抛出以下错误:

javax.security.auth.login.LoginException:无法从用户处获取密码

下面是我正在尝试的代码...

有人可以分享您的想法并帮助我解决问题....

0 投票
1 回答
296 浏览

apache-spark - GenericUDF 的初始化方法被多次调用

我有一个扩展 GenericUDF 的 HiveUDF,当我通过 spark.sql 调用 udf 时,我得到了正确的结果,但初始化的方法被多次调用。

无法理解为什么会这样?

0 投票
2 回答
5540 浏览

hiveql - 用于合并数组的 Hive Aggregate 函数

我需要在 HiveSQL 的 GROUP BY 中合并数组。表架构是这样的:

现在这是我要运行的 SQL:

如果这个 array_merge 函数只保留唯一值,那会更好,但不是必须的。

干杯,K