我有一门学术课程“中间件”,涵盖了分布式软件系统的不同方面,包括对 [tag:Distributed File system] 等主题的介绍。这还涉及到hbase、hadoop、mapreduce、hiveql、piglatin的介绍。我想知道,我可以有一个尝试整合上述技术的小项目。对于初学者,我知道cloudera提供的vm用于体验hadoop和使用 Eclipse。我正在考虑实现一个接受事件流作为输入的应用程序,分析它并给出输出。
我的机器上有windows / linux,带有i7 procoessor和4Gb Ram。
请让我知道如何开始一切,欢迎对简单示例应用程序提出任何建议。