当我在一台有 4 个进程的计算机上运行我的程序时,它几乎会立即终止。当我尝试在由两台计算机组成的集群中运行它时(集群已经过检查并且没问题),它就是无法完成!
我很久以前在集群中运行过,我记得它比在一台电脑上运行要慢,但它会终止!
这是我的run.sh:
#!/bin/bash
start=100
end=100
for ((i = $start; i <= $end; ++i )) ;
do
mpiexec -f machinefile -n 4 ./test ../../l_matrices/Lmat_755.mtx 1 755 755 $i $i 2 2 0 0
done
我确实检查了每个节点中是否产生了两个进程。
这是我的机器文件:
hostname1.gr:2
hostname2.gr:2
怎么了?