我正在我的大学建立一个小型的 256 核计算集群,用于流体动力学模拟。我们使用的代码是用 C 和 Fortran 混合编写的,目前在大型超级计算机上运行良好。
在我们的集群开发中,我们有 16 个计算节点,每个节点有 16 个 AMD CPU。我们还有一个 8 核的戴尔盒子,我们想将其用作“头”或“登录”节点。然而,这个盒子是 Intel Xenon。
我们希望 NFS 将每个用户的主目录挂载到登录节点并限制他们对计算节点的访问。这将要求用户通过登录节点上的 mpirun 编译和运行他们的程序。我们的问题是:
- 像这样的混合 CPU 系统有可能吗?或者我们会遇到在 Intel 上编译和在 AMD 上执行的问题吗?
- 如果这是一个问题,是否有解决方法?我们能否以某种方式让用户在仅登录到登录节点时在计算节点上透明地编译他们的代码?
- 在具有头节点的集群中,是否应该仅通过 NFS 挂载共享主目录?或者是否还有其他目录我们也应该在计算和头节点之间共享?
如果那里有一个很好的资源可以提供帮助,我们也会很感激。我们在各个页面上发现了很多建议和想法……如果能指出社区认为信誉良好的内容,那就太好了。(免责声明......我们不是计算机科学家,我们只是普通科学家。)