我正在尝试将 MLFlow 服务器与 GCP 上的 Kubeflow 集群集成。为此,我创建了一个 MLFlow 部署并使用负载均衡器公开它。
机器学习代码作为 Pod 部署在 Kubeflow 集群上。MLflow 服务器 IP:PORT 用于记录参数(例如超参数)和工件(例如模型)。
问题是工件仅记录在 docker 映像(带有机器学习代码的 pod)中。另一方面,在提供 MLflow 服务器 IP:PORT 后,参数日志记录工作得非常好。
我正在尝试将 MLFlow 服务器与 GCP 上的 Kubeflow 集群集成。为此,我创建了一个 MLFlow 部署并使用负载均衡器公开它。
机器学习代码作为 Pod 部署在 Kubeflow 集群上。MLflow 服务器 IP:PORT 用于记录参数(例如超参数)和工件(例如模型)。
问题是工件仅记录在 docker 映像(带有机器学习代码的 pod)中。另一方面,在提供 MLflow 服务器 IP:PORT 后,参数日志记录工作得非常好。