我一直在考虑如何在 Hive 中做到这一点。
例如,我在日志文件中有一个要提取的特定字段(这在 Hive 中已经可以实现),然后我想将此字段的值映射到其他内容。此映射由编写在 Java 类中的自定义业务逻辑确定。如何在 Hive 中使用这个 Java 类?
我一直在考虑如何在 Hive 中做到这一点。
例如,我在日志文件中有一个要提取的特定字段(这在 Hive 中已经可以实现),然后我想将此字段的值映射到其他内容。此映射由编写在 Java 类中的自定义业务逻辑确定。如何在 Hive 中使用这个 Java 类?
您将需要使用
add jar myjar.jar;
在 hive 脚本中,就像您对包含 UDF 的 jar 所做的那样。我建议将它们全部包装在一个罐子中。
您应该按照此处的说明进行操作: UDF 信息以创建用户定义的函数,该函数可以像 substr、count 或 length 一样调用。