我在我的 ubuntu 11.04 上运行了 hadoop 1.0.4,配置了 eclipse 我想制作一个 web 应用程序来运行 hadoop 作业,或者可能是 Cassandra、Hbase 和 Hive 可能是一种方法,但我没有太多时间来彻底学习所有这些,我想尽快完成。有什么建议可以证明最容易上手吗?
1 回答
我不知道这个问题是否真的有资格以目前的形式出现在 SO 上。这就是我最初没有写这篇文章的原因。但是,很多 SO 专家都在那里做出决定(他们可以比我做得更好):)
话虽如此,我还是想根据我的个人经验与大家分享一些事情,以便您朝着正确的道路前进。首先,Hadoop 作业(MapReduce)和 Hive 实际上并不适合 Web 服务用例。它们最适合离线、批处理之类的东西。但是,如果您有实时需求(例如 Web 服务),可以使用 HBase/Cassandra 。
回到你的实际问题。在深入研究 Hadoop、Hive、HBase 等之前,我建议您先掌握一些 Web 服务(如果您也是 Web 服务的新手)。原因是,与 Hadoop、Hive、HBase 等工具相比,Web 服务具有更广泛的适用范围。这些工具特定于某些特定用例,不能在任何地方使用。但是,Web 服务几乎无处不在,并且有许多不同的东西,例如 RDBMS、NoSQL 数据存储等。因此,如果您了解 Web 服务概念,那么您肯定拥有额外的优势。首先,您可以访问以下链接:
- W3Schools 的 Web 服务教程(很好,很简单。将用于快速入门指南的目的)。
- 有关详细教程,您可以访问oracle Web 服务教程。
- IBM developerworks 的这个链接引用了一些非常好的 Web 服务学习资料。
- 您可能会发现这对开始很有帮助(展示如何使用 Eclipse 创建 Web 服务)。
- 而且您显然可以随时使用 Google网络服务教程。
最后一件事。尽管在 Hadoop、Hive、HBase 等方面成为专家并不是强制性的,但对这些概念有一定程度的理解将非常有助于以更好的方式开发您的解决方案。它会让你在正确的方向上准确地思考。
HTH。