3

我在 HDFS 上部署了我的代码,并且有两个基本任务,我无法弄清楚 -

  1. 从 ObjectStore 获取一个 zip 文件到 HDFS,在 HDFS 上解压缩,读取它的内容,删除 zip 和内容。
  2. 在 HDFS 上创建一些内容,将其压缩到 HDFS 上,将其发布到 ObjectStore,然后删除 zip。

在引用资源时,用于在诸如shutil 等python 脚本中进行压缩/解压缩的常规库在HDFS URL 上不起作用。我尝试查找一些允许它的python库,但没有找到。

我得到的最接近的解决方案是这个,但它带有一个公平的警告,即当多个文件压缩在一起时不起作用。有人可以帮助指出上述粗体任务的解决方案吗?

4

0 回答 0