5

在Twitter 开源办公室负责人的演讲的幻灯片 25 中,演示者说 Mesos 允许人们甚至可以跟踪和管理 GPU(我假设他的意思是 GPGPU)资源。但我在其他任何地方都找不到关于此的任何信息。有人可以帮忙吗?除了 Mesos,还有其他支持 GPGPU 的集群管理器吗?

4

1 回答 1

5

Mesos 尚未提供对 (GP)GPU 的直接支持,但支持自定义资源类型。如果您--resources="gpu(*):8"在启动 mesos-slave 时指定,那么这将成为向框架提供资源的一部分,框架可以启动声称使用这些资源的任务。一旦某个任务使用了某些 gpu 资源,则只会再次提供剩余的资源,直到该任务完成并且 gpu 资源再次可用。这样,Mesos 资源分配器实际上可以调度您声明的 gpu 资源,并确保只有声明的数量被提供/分配给框架。

Mesos 尚不支持 gpu 隔离,但使用“可插入隔离器模块”,您可以构建自己的 gpu 隔离器来强制 gpu 资源限制。

或者,如果您不想分配单个 gpu 资源,而只想声明某些节点具有 gpus 而其他节点没有,则可以使用--attributes="hasGpu:true"或类似的东西来区分有/没有 gpus 的节点。此信息也会传递到资源提供中的框架,但这些属性不能被正在运行的任务“消耗”,因此它们将始终为该节点提供。

有关更多信息,请参阅https://mesos.apache.org/documentation/attributes-resources/

于 2015-01-12T18:56:30.360 回答