1

服务器场景:

Ubuntu 12.04 LTS
Torque w/ Maui Scheduler
Hadoop

我正在构建一个小型集群(10 个节点)。用户将能够 ssh 到任何子节点(LDAP Auth),但这实际上是不必要的,因为他们想要运行的所有计算作业都可以使用扭矩、hadoop 或其他与调度程序绑定的资源管理器在头节点上提交确保整个节点的优先级和适当的资源分配。一些用户将优先于其他用户。

问题:

您不能强迫用户使用扭矩等批处理系统。如果他们想占用一个节点或头节点上的所有资源,他们可以直接从他们的终端/ssh 会话运行他们的脚本/代码。

解决方案:

我的主要用户或“超级用户”希望我设置远程登录超时,这是他们当前集群用来消除此问题的方法。(我无权访问此集群,因此无法获取配置)。我想在所有处于非活动状态(击键)的远程会话上设置 30 分钟超时,如果它们正在运行进程,我还希望会话与所有作业进程一起被终止。这将消除人们不使用可用的批处理系统/调度程序。

问题:

我怎样才能实现这样的事情?感谢所有的帮助!

4

1 回答 1

0

我经常看到系统管理员通过不允许 ssh 访问节点来解决这个问题(通常使用 TORQUE 中的 pam 模块完成),但还有其他技术。一种是使用pbstools。reaver 脚本可以设置为杀死不属于作业的用户进程(或不应该在这些节点上)。我相信它也可以配置为简单地通知您。一些管理员强行杀死东西,其他人教育用户,这部分取决于你。

一旦您让人们使用作业而不是直接使用 ssh'ing,您可能还想查看 TORQUE 中的cpuset功能。当您尝试让用户使用他们请求的资源量时,它可以帮助您。祝你好运。

编辑:注意到 pam 模块是限制 ssh 访问计算节点的最常见方法之一。

于 2013-08-27T16:45:38.787 回答