我想在我的 Ubuntu 上安装 Hive。我阅读了这篇文章,对我帮助很大。除了第 4 步之外,我完成了所有步骤。我不明白这一步应该做什么。
你能详细解释一下这一步吗?
第 1 步:下载并提取 Hadoop
Step 2 : Set JAVA_HOME path to conf/hadoop-env.sh //这一步是为hadoop设置java路径
第 3 步:conf/core-site.xml:
<configuration>
<property>
<name>fs.default.name</name> //Place your home folder here for using hadoop
<value>hdfs://localhost:9000</value>
</property>
</configuration>
第 4 步:conf/hdfs-site.xml:
<configuration> //This setting for the number of replications of the file or you can add data node for the save the file
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>
第 5 步:conf/mapred-site.xml:
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value> // add your master host in the place of localhost here
</property>
</configuration>
第 6 步:登录 SSH localhost 并格式化一个新的分布式文件系统
bin/hadoop namenode -format
第 7 步:启动 hadoop 守护进程:
bin/start-all.sh
第 8 步:检查端口下方的 NameNode 和 JobTracker
http://localhost:50070/ //master
http://localhost:50030/ //slave
// 最好尝试 ssh 来检查你的工作节点
第 9 步:下载并提取 Hive
第 10 步:设置下面的环境变量。
export HADOOP_HOME=<hadoop-install-dir>
export HIVE_HOME=<hive-install-dir>
export PATH=$HIVE_HOME/bin:$PATH
$HIVE_HOME/bin/hive
第 3 步是否顺利进行?在第 3 步之前,您正在将二进制文件从 SVN 下载到您的机器,第 4 步是使用您的 Hadoop 环境设置二进制文件。
第 4 步建议您执行以下操作:
导出 PATH=$PATH:/usr/src/hive/build/dist/bin/
-> 表示您在 PATH 环境中添加目录 /usr/src/hive/build/dist/bin/。您必须已在此文件夹中安装了 hive -> /usr/src/hive/build/dist/bin/ 因此在您的路径中添加此文件夹(实际上是 Hive 二进制文件)将使您可以在您的机器上运行 Hive。
导出 PATH=$PATH:/usr/src/hive/build/dist/lib/
-> 表示您在 PATH 环境中添加目录 /usr/src/hive/build/dist/lib/。在您的机器上安装 Hive 后,Hive 相关库位于此文件夹 > /usr/src/hive/build/dist/lib/ 中,因此将此目录添加到您的 PATH 中,将有助于 Hive 成功运行。
导出 PATH=$PATH:/usr/local/hadoop/bin
-> 如果你已经在你的机器上运行了 Hadoop,这应该已经设置,否则这个命令只是在你的机器路径中设置 Hadoop Binary 文件夹。
如果您不知道什么是 PATH,只需在 Internet 上查找“Linux 中的 PATH”即可。
这个 PPA使得在 Ubuntu 上安装 Hive 变得非常容易。