我想编写一个脚本或类似 .xml 文件,它明确定义 Hadoop 集群中的数据节点以存储特定的文件块。例如:假设有 4 个从节点和 1 个主节点(hadoop 集群共有 5 个节点)。有两个文件 file01(size=120 MB) 和 file02(size=160 MB)。默认块大小 =64MB
现在我想在从节点 1 存储两个 file01 块之一,在从节点 2 存储另一个。类似地,从节点 1 的三个文件 02 块之一,从节点 3 的第二个文件块和从节点 4 的第三个文件块之一。所以,我的问题是我该怎么做?
实际上有一种方法:每次更改 conf/slaves 文件以存储文件。但我不想这样做所以,还有另一种解决方案吗?我希望我的观点很清楚。等待您的友好回应..!!!