Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我正在运行一个需要大约 300mb 第三方库的 mapreduce 作业。为了避免在运行作业时将库复制到数据节点的成本。我想知道是否有一种方法/工具可以在作业开始之前将这些库预部署到所有数据节点。
提前致谢。
您可以将其部署到 Hadoop 的分布式缓存中。Pere Ferrera Bertran很好地解释了这一点