我可以提供一些想法:
1:文档和示例一直是我使用 Hadoop 和相关项目的项目的主要挑战。与 MySQL 相比,通常很难找到可用的功能以及如何使用它们。邮件列表在这方面提供了很大的帮助。学习从批处理和“全表扫描”的角度进行思考也是一种调整,习惯 Map Reduce 编程并非易事,尽管有许多工具可以防止您编写原始 map reduce。
2:很多 Hadoop & Friends 代码库基本上仍然是 alphaware,有时版本之间会发生很大变化。您肯定需要一个测试集群先进行升级,然后看看有什么问题。在升级过程中,API 的剧烈变化并不意外。
3:我没有专门使用memcached,我使用Hadoop进行后端ETL处理,而不是渲染页面。在这里真的帮不了你。
4:了解项目的最佳方式是获取代码并开始查看它。练习使用它一段时间,最终你会发现一些你认为可以做得更好的东西,或者你想要的功能。这是一个参与的好地方。请务必注册开发人员邮件列表,并注意现有的错误列表和功能请求,以查看是否有人已经在从事类似的工作。这些项目中的大多数,您都需要让具有提交权限的人将您的代码放入其中,但这并不太难。阅读您有兴趣参与的特定项目以获取更具体的信息。