Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我想知道是否可以获得存储在 HDFS 中的每个文件的信息,例如:上次访问日期、修改日期、名称、大小...
我考虑过使用蛇咬与 HDFS 建立脚本连接,然后我想知道是否可以使用 MrJob 模块从每个文件中捕获我需要的信息。
示例:
file_name = os.environ['file']
如果可能的话,帮我解决这个问题。如果他们不知道,我也接受。