9

我正在尝试在本地网络中的另一台机器上运行 MLFlow,我想寻求一些帮助,因为我现在不知道该怎么做。

我有一个在服务器上运行的 mlflow服务器。mlflow 服务器在服务器上的我的用户下运行,已像这样启动:

mlflow server --host 0.0.0.0 --port 9999 --default-artifact-root sftp://<MYUSERNAME>@<SERVER>:<PATH/TO/DIRECTORY/WHICH/EXISTS>

我的程序应该将所有数据记录到 mlflow 服务器,如下所示:

from mlflow import log_metric, log_param, log_artifact, set_tracking_uri

if __name__ == "__main__":
    remote_server_uri = '<SERVER>' # this value has been replaced
    set_tracking_uri(remote_server_uri)
    # Log a parameter (key-value pair)
    log_param("param1", 5)

    # Log a metric; metrics can be updated throughout the run
    log_metric("foo", 1)
    log_metric("foo", 2)
    log_metric("foo", 3)

    # Log an artifact (output file)
    with open("output.txt", "w") as f:
        f.write("Hello world!")
    log_artifact("output.txt")

参数 get 和 metrics 被传输到服务器而不是工件。为什么呢?

关于 SFTP 部分的注意事项:我可以通过 SFTP 登录并安装了 pysftp 包

4

2 回答 2

4

我想你的问题是你还需要创建实验所以使用 sftp 远程存储

mlflow.create_experiment("my_experiment", artifact_location=sftp_uri)

这为我修好了。

于 2020-02-28T15:27:51.533 回答
2

我不知道我是否会得到我的问题的答案,但我确实以这种方式解决了它。

在服务器上我创建了目录/var/mlruns。我通过这个目录传递给mlflow--backend-store-uri file:///var/mlruns

然后我通过例如sshfs在同一路径下的本地计算机上安装此目录。

我不喜欢这个解决方案,但它现在已经很好地解决了这个问题。

于 2019-12-10T08:50:01.237 回答