hadoop - CDH Hadoop 中用于 Hive/Hue/MapReduce 的 json Serde JAR 的最佳位置

Question

我将Hive/Hue/MapReduce 与 json Serde 一起使用。为了让它工作，我将json_serde.jar复制到每个集群节点上的几个 lib 目录中：

在集群的每次 CDH 更新中，我都必须再次执行此操作。有没有更优雅的方式让集群中的 Serde 分布是自动的并且可以抵抗更新？

score 4 · Accepted Answer

如果使用HiveServer2（Cloudera 5.0+ 中的默认值），则以下配置将在整个集群中运行，而无需将 jar 复制到每个节点。

在您的hive-site.xml配置文件中，或者如果您在“ hive-site.xml 的 HiveServer2 高级配置片段（安全阀） ”配置框中使用 Cloudera Manager

<property>
 <name>hive.aux.jars.path</name>
 <value>/user/hive/aux_jars/hive-serdes-1.0-snapshot.jar</value>
</property>

然后在您的 HDFS 文件系统 (/user/hive/aux_jars) 中创建目录并将 jar 文件放入其中。如果您正在运行 HUE，您可以通过 Web UI 执行此部分，只需单击右上角的文件浏览器。

score 1 · Accepted Answer

这取决于 Hue 的版本以及是否使用 Beeswax 或 HiveServer2：

蜂蜡： https ://issues.cloudera.org/browse/HUE-1127 有一个解决方法HIVE_AUX_JARS_PATH
HiveServer2支持hive.aux.jars.path. hive-site.xmlHiveServer2 不支持 a.hiverc并且 Hue 正在考虑在某个时候提供等价物：https ://issues.cloudera.org/browse/HUE-1066

2 回答 2