我使用 starcluster 启动了几个 EC2 实例,并在每个节点上运行相同的管道。
- 我使用 qsub 提交作业而不指定节点。为什么starcluster /SGE将作业分配给已经被占用的节点而不是空节点?
- 这些节点可以互相借用线程和 RAM 吗?
有人可以分享一些关于这些的想法吗?
我使用 starcluster 启动了几个 EC2 实例,并在每个节点上运行相同的管道。
有人可以分享一些关于这些的想法吗?
我不熟悉starcluster
,但我认为它具有与 Maui 调度程序类似的节点分配策略:
http://docs.adaptivecomputing.com/maui/5.2nodeallocation.php
具体来说,请参阅 MINRESOURCE 政策:
http://docs.adaptivecomputing.com/maui/5.2nodeallocation.php#MINRESOURCE
5.2.2.5 最小资源
该算法根据每个节点上配置的资源对节点进行优先级排序。选择那些仍然满足作业资源约束的配置资源最少的节点。
这是 Maui 的默认设置,至少在我完成的安装中,这使它以您描述的方式提交作业。
我会假设它starcluster
的行为类似。