我想为 Hive 编写一个自定义映射器,它是一个 jar 文件。我将如何在查询中使用它?
使用常规语法:
add file myfile.jar
...
map using myfile.jar
似乎不起作用。我得到的错误是:
2013-04-15 22:52:26,207 INFO org.apache.hadoop.hive.ql.exec.ScriptOperator:脚本没有消耗所有输入数据。这被视为错误。2013-04-15 22:52:26,207 信息 org.apache.hadoop.hive.ql.exec.ScriptOperator:设置 hive.exec.script.allow.partial.consumption=true;忽略它。2013-04-15 22:52:26,207 致命的 ExecReducer: org.apache.hadoop.hive.ql.metadata.HiveException: java.io.IOException: Broken pipe
注意:我的 jar 是一个 jruby 文件,用warbler编译成一个 jar 。