13

我对学习分布式计算技术很感兴趣。作为一名 Java 开发人员,我可能愿意从Hadoop入手。您能否推荐一些书籍/教程/文章开始?

4

7 回答 7

9

也许您可以先阅读一些与 MapReduce 和分布式计算相关的论文,以更好地了解它。这里有一些我想推荐的:

另一方面,如果您想更好地了解 Hadoop,也许您可​​以开始阅读 Hadoop MapReduce 框架源代码。

于 2010-05-12T12:12:21.790 回答
3

目前,在书本上我会查看 - Hadoop A Definitive Guide。它的作者是 Tom White,他已经在 Hadoop 上工作了很长时间,并在 Cloudera 与 Doug Cutting(Hadoop 创建者)一起工作。

同样在免费方面,UMD 的 Jimmy Lin 写了一本书,名为:Data-Intensive Text Processing with MapReduce。这是最终预生产版本的链接(作者在其网站上提供的链接)。

于 2010-05-12T22:50:23.070 回答
2

Hadoop 不一定是解决所有分布式计算问题的最佳工具。尽管功能强大,但它也有相当陡峭的学习曲线和拥有成本。您可能想澄清您的要求并在 Java 世界中寻找合适的替代方案,例如HTCondorJPPFGridGain(我对那些我没有提及的人表示歉意)。

于 2013-04-06T10:43:45.513 回答
1

MIT 6.824是最好的东西。只阅读与 Hadoop 相关的 google 论文是不够的。如果您想更深入,则需要系统的课程学习。

于 2013-04-04T12:31:15.397 回答
1

以下是来自 Yahoo! 的一些资源!开发者网络

一个教程:

http://developer.yahoo.com/hadoop/tutorial/

入门课程(需要 Siverlight,叹息):

http://yahoo.hosted.panopto.com/CourseCast/Viewer/Default.aspx?id=281cbf37-eed1-4715-b158-0474520014e6

于 2010-05-12T17:37:53.337 回答
1

All Things Hadoop Podcast http://allthingshadoop.com/podcast有一些很好的内容和很好的嘉宾。其中很多都是为开始使用分布式计算而设计的。

于 2010-05-21T05:38:22.830 回答
1

如果你想学习一个比 Hadoop 简单的分布式计算平台,你可以试试 Zillabyte。您只需要了解一些 Ruby 或 Python 即可在该平台上构建应用程序。

正如 LoLo 所说,Hadoop 是一个强大的解决方案,但开始时可能很粗糙。

如需了解分布式计算的材料,请尝试http://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-824-distributed-computer-systems-engineering-spring-2006/syllabus/。该课程还推荐了几种资源。

于 2014-09-25T01:08:14.960 回答