我代表一位从事数值天体物理学工作的朋友询问。
基本上他所做的是模拟一团气体。有有限数量的单元格,并且定义了时间步长,使得气体每一步不能穿过超过一个单元格。每个细胞都具有密度和温度等属性。每个时间步长,这些(和位置)都需要计算。我认为主要是位置问题,因为这主要受细胞之间重力相互作用的影响,所有这些相互作用都会相互影响。
目前他正在一个约 150 个节点的集群上运行它,但我想知道,如果它可以像这样并行化,它是否可以在一些带有 CUDA 的 GPU 上运行得更快?目前,他需要几天时间才能完成模拟。由于 GPU 通常具有约 500 个内核,因此它们似乎可以提供提升。
也许我完全错了。