我们应该在处理 map-reduce 作业之前从本地/放置文件到 hdfs 吗?当我运行 mapreduce 示例时,我被教导在主节点中格式化 hdfs 并将文件从本地复制到主节点中的 hdfs 空间。
那为什么有些教程说主节点只是将元数据通知给客户端。笔记本电脑(客户端)会将文件块复制到数据节点而不是主节点?例如http://www.youtube.com/watch?v=ziqx2hJY8Hg在 25:50。我基于本教程的理解是文件(按块分割)将被复制到从节点。所以我们不需要从本地 /put 文件复制到主节点。我很困惑。谁能解释文件复制/复制到哪里?