0

我想知道是否可以获得存储在 HDFS 中的每个文件的信息,例如:上次访问日期、修改日期、名称、大小...

我考虑过使用蛇咬与 HDFS 建立脚本连接,然后我想知道是否可以使用 MrJob 模块从每个文件中捕获我需要的信息。

示例:

file_name = os.environ['file']

如果可能的话,帮我解决这个问题。如果他们不知道,我也接受。

4

0 回答 0