所以我有一个批处理文件,它在给定一些输入参数的情况下执行模拟,然后通过 awk、R 和 Python 处理输出数据。目前,输入参数通过一些嵌套的 for 循环传递到模拟中,并且模拟的每次迭代都将一个接一个地运行。我希望并行执行模拟,因为目前有 1,000 多个案例,所以在我看来,我可以让核心 1 处理 sims 1-250,核心 2 处理 sims 251-500 等。
本质上,我想做的是:
- 跨多个内核运行模拟的每个案例
- 每次模拟完成后,开始输出数据处理
我试过使用start /affinity n simulation.exe,但这里的问题是所有的模拟都将同时执行,所以当它进入后处理调用时,它会出错,因为数据还没有生成。有start /w命令,但我不确定这是否会改善模拟。我想到的一个想法是在每次模拟完成后更新一个变量,然后只有在变量达到 n 次运行时才开始后处理。
以下是我现在正在做的事情的摘录:
for %%f in (1 2 3) do (
for %%a in (4 5 6) do (
for %%b in (7 8 9) do (
call :mission %%f %%a %%b
)
)
)
some gawk scripts
some python scripts
some r scripts
go to :exit
:mission
sed -e 's/text1/%1/' -e 's/text2/%2/' -e 's/text3/%3/'
simulation.exe
go to :exit
:exit
这就是我用来测试一些并行处理的方法:
start /affinity 1 C:\Users\614890\R-4.1.1\bin\Rscript.exe test1.R
start /affinity 2 C:\Users\614890\R-4.1.1\bin\Rscript.exe test2.R
start /affinity 3 C:\Users\614890\R-4.1.1\bin\Rscript.exe test3.R
start /affinity 4 C:\Users\614890\R-4.1.1\bin\Rscript.exe test4.R
C:\Users\614890\R-4.1.1\bin\Rscript.exe plotting.R