Hadoop 将中间结果写入本地磁盘,将 reducer 的结果写入 HDFS。HDFS 是什么意思。它在物理上转化为什么
问问题
553 次
2 回答
2
HDFS 是 Hadoop 分布式文件系统。在物理上,它是一个运行在集群的每个节点上的程序,它提供了一个与本地文件系统非常相似的文件系统接口。但是,写入 HDFS 的数据不仅存储在本地磁盘上,而且分布在整个集群的磁盘上。存储在 HDFS 中的数据通常也会被复制,因此相同的数据块可能会出现在集群中的多个节点上。这提供了可靠的访问,因此一个节点的崩溃或忙碌不会阻止某人能够从 HDFS 读取任何特定的数据块。
查看http://en.wikipedia.org/wiki/Hadoop_Distributed_File_System#Hadoop_Distributed_File_System了解更多信息。
于 2012-09-14T01:17:30.020 回答
2
正如 Chase 所指出的,HDFS 是 Hadoop 分布式文件系统。
如果可以的话,我推荐这个关于 HDFS 和 Map/Reduce 框架如何工作的教程和视频,并将作为进入 Hadoop 世界的指南:http: //www.cloudera.com/resource/introduction-to-apache -mapreduce 和 hdfs/
于 2012-09-14T09:49:58.663 回答