我有一个 linux VM,每 4 小时更新一次新的数据文件。这些文件按编号 01 到 10 组织在目录中。
我有一个可执行文件(convert.exe),可以将上传的文件转换为不同的文件类型。
我想开发一个管道来处理文件(convert.exe),然后将它们重定向到另一个目录。
我已经在 linux bash 脚本中对它进行了系列编程。使用以下代码:
for d in $(find /mnt/data01/dpad -mindepth 1 -name "DIR*" -type d); do
#recursively iterate through files
#for those that were modified within the last day (i.e. new files added)
for f in $(find $d -type f -mtime -1); do
#determine appropriate folder for file to move to
newdirname=$(basename $d)
newfilename=$(basename $f)
mono convert.exe $f -o /mnt/convertedfiles/$newdirname/$newfilename
done
done
但是,我想使用我可以访问的处理能力并在多个 CPU 上并行运行它,以获得更多的实时转换方法和结果。
我打算改用 python 并使用snakemake 来分发命令。
我对编程并不陌生,但对命令很python
陌生snakemake
。
只是想知道是否有人可以提供一些关于如何开始这个过程的见解?