刚开始浏览 Hadoop 介绍视频。如何自己练习?有没有推荐的安装在本地练习的方法?
7 回答
我发现下载和安装 Hadoop,通过工作示例来使用它,犯了很多错误并且对实践很好。
如果您说“如何在不使用 HDFS 的情况下将其安装在本地计算机上?”,则通过“在本地安装”,这里有一个很好的指南。
如果您想了解 Hadoop 和 Bigdata,请访问 bigdatauniversity.com。它是免费的,他们提供了有关如何在虚拟机和/或 Amazon 的 Web 服务中本地安装 Hadoop 的说明。BigDataUniversity 提供实验室和说明来帮助指导您的实践。到目前为止,我发现它很有帮助。
最近 Cloudera 推出了一个新的在线平台,您可以在其中尽可能多地使用 Hadoop 及其生态系统。给您 - cloudera.com/live
我已经在 Hadoop 上培训人员 2 年了。这是我的两分钱。
对于学习部分,我会推荐以下资源(正如上面其他人所提到的):
对于练习,传统上人们一直在使用 Hadoop 虚拟机,但这种方法有其缺点:
- VM 的大小非常大,例如 HortonWorks 的 VM 为 9.9 GB。
- 您可能需要将 RAM 升级到 8GB。
- 一些 BIOS 不允许虚拟化。您可能已经更改了 BIOS 设置。
- 某些机器(例如 Office 台式机/笔记本电脑)可能不允许安装。
我和我的学生也面临着这些问题。因此,我们为学生搭建了一个集群来练习 Hadoop、Spark 和相关技术。我们将其命名为CloudxLab.com。
...我喜欢 bigdatauniversity.com,还注意到 MapR、Hortonworks 和 Cloudera 都提供了一个可下载的环境,您可以使用它来熟悉 Hadoop 操作范例。
事实上,如果您正在研究这一点,着眼于在企业范围内使用 Hadoop,那么探索在该级别部署的产品是一个好主意。
我现在有一点机会亲身体验 MapR 的 Hadoop 环境,并且可以称赞它是研究此事的好方法。
---v
我建议https://developer.yahoo.com/hadoop/tutorial/进行 hadoop 自定进度学习。它是一个非常全面的指南,一步一步,从初级到高级。
您可以安装一个包含 Hadoop 的虚拟机,但您可能会遇到一些问题。当我开始学习 Hadoop 时,我首先这样做了,在遇到几个问题(IP、互联网、不同的配置)之后,我决定使用 Linux 安装来学习。
你可以在这里找到一个教程:http: //www.michael-noll.com/tutorials/running-hadoop-on-ubuntu-linux-single-node-cluster/