这是我的问题:openBLAS/LAPACK 库(在 Armadillo 库下)是否能够在 MPI 框架下利用并行性?
我担心的是,在使用 运行程序mpirun -np 1 executable
时,由于我特别要求操作系统仅使用一个处理器运行我的程序,我认为 openBLAS/LAPACK 将仅使用一个处理器而不是其他空闲的处理器来乘/加向量/矩阵。我是否限制 openBlas/LAPACK 在不同的处理器上执行多个线程-np 1
?如何使用通过选择的一个处理器上可用的不同内核-np 1?