我对如何在 hadoop 中检索数据有些困惑。
mapReduce 是为了从 hadoop 集群(HDFS)中检索数据还是仅限于聚合。
Hadoop支持顺序搜索,比方说hadoop并行处理数据,搜索和遍历每个节点的处理有什么不同呢?
纠正我如果我错了:是否每个节点的块是按顺序读取的,但许多节点在集群中是并行处理的。我的意思是两个作业在两个不同的节点上并行运行,每个作业同时对每个节点的所有相关块进行顺序搜索。例如:Node1:Block A. Block B,Block C Node2:Block D,Block E,Block F 我的假设:Block A-> Block B-> Block C || D座、E座、F座
其中 -> 是顺序的 || 是平行的。
- 假设我想在过去 2 年从公司获得最大福利(现金)的四名员工中搜索一名。搜索和检索将如何在这里工作。