我有一段 Python 代码,我在其中使用joblib和multiprocessing使部分代码并行运行。我在桌面上运行它没有问题,我可以使用任务管理器查看它使用所有四个内核并并行运行代码。
我最近了解到我可以访问具有 100+ 20 个核心节点的 HPC 集群。集群使用SLURM作为工作负载管理器。
第一个问题是:是否可以在集群上运行并行化的 Python 代码?
如果有可能,
我是否需要更改 Python 代码才能在集群上运行,以及
需要在作业提交文件中放入哪些#SBATCH 指令来告诉它代码的并行化部分应该在四个内核(或者是四个节点)上运行?
我有权访问的集群具有以下属性:
PARTITION CPUS(A/I/O/T) NODES(A/I) TIMELIMIT MEMORY CPUS SOCKETS CORES
standard 324/556/16/896 34/60 5-00:20:00 46000+ 8+ 2 4+