我需要 Hadoop 问题的帮助。
在我的 Java 系统中,我有一个创建n条记录的函数。显然,每条记录都是要写入 Hadoop 文本文件中的一行。
问题是:
如何将所有n条记录保存在同一个 Hadoop 节点中?换句话说,我希望将n条记录视为唯一记录,以确保如果这些记录之一(或其副本之一)在节点上,那么其他n-1条记录当然也在同一个节点。
例如,假设我的函数创建:
record1: 5 los angeles rainy
record2: 8 new york sunny
record3: 2 boston rainy
当我在 Hadoop 的文本文件中附加这三个记录(三行)时,可能会发生 record1 到 node1,record2 到 node2,record3 到 node3。我想知道是否有办法确保所有三个记录都存储在同一个节点上,例如 node2,并且它们不会存储在不同的节点上。
感谢您的关注。