1

我正在使用 Openfaas 在 GPU 上运行一些任务。但是,由于这些任务仅使用 GPU,而 CPU 大部分时间都处于空闲状态,因此 openfaas 不会扩展这些 pod,因此 GKE 不会扩展我们的节点。如何配置 openfaas 以使用 GPU 指标进行扩展?

我的理解是 CPU 使用率当前被发送到 prometheus,然后警报管理器使用它来扩大或缩小 pod。我需要以某种方式做到这一点,以便每当一个 pod 在 1 秒内使用超过 10% 的 GPU 时,然后将其放大。

4

0 回答 0