我正在尝试从 python 程序运行一些 hadoop 命令...
例如,如果从命令行,您可以:
bin/hadoop dfs -ls /hdfs/query/path
它返回 hdfs 查询路径中的所有文件.. 非常类似于 unix
现在我正在尝试基本上从 python 中执行此操作.. 并从中进行一些操作。
exec_str = "path/to/hadoop/bin/hadoop dfs -ls " + query_path
os.system(exec_str)
现在,我正在尝试获取此输出以对其进行一些操作。例如..计算文件数?我查看了 subprocess 模块,但是……这些不是本机 shell 命令。因此不确定我是否可以应用这些概念如何解决这个问题?