0

最近在学习hadoop,发现只是读取文本数据和计算字数的例子。或多或少所有示例都具有相同的任务。请帮助我理解它是hadoop的唯一用例吗?请为我提供一些更真实用例的参考资料,或者我可以理解和编写可以使用hadoop的地方。

谢谢

4

1 回答 1

1

我可以尝试概述一些限制自己使用 MapReduce 的方向: a) ETL - 数据转换。这里 hadoop 大放异彩,因为延迟并不重要,但可扩展性是
b) Hive / Pig。在某些情况下,我们实际上需要在大数据集上使用 SQL 或类似 SQL 的功能,但买不起商业 MPP 数据库
c) 不同类型的日志处理。
d) 深度分析——当我们只想在海量数据上运行 java 代码时。Mahaout 在许多情况下用作机器学习库。

于 2012-09-11T08:26:51.600 回答