问题标签 [mlflow]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
768 浏览

r - R 中的 ML-Flow 安装

我已经在我的 ubuntu 环境中安装了 MLFLOW for R。当我尝试为 mlflow 执行任何命令时,出现以下错误

mlflow_ui() rethrow_call(c_processx_exec, command, c(command, args), stdin, 中的错误:无法启动 processx 进程(系统错误 2,没有这样的文件或目录)@unix/processx.c:573

0 投票
1 回答
716 浏览

python - 如何将 mlflow 与 tensorflow 对象检测 api 集成

我正在尝试将mlflow.tensorflow.autolog()tensorflow object detection api一起使用。将mlflow.tensorflow.autolog()添加到model_main.py 会记录一些参数,例如 mlflow 中的 global_norm/clipped_gradient_norm、global_norm/gradient_norm、global_step/sec、learning_rate_1、loss_1、loss_2。然而,更重要的指标,如 map、precision、recall 并没有记录在 mlfow 中。

0 投票
1 回答
636 浏览

databricks - MLFlow 模型未登录到 Azure Blob 存储

我正在尝试使用 MLFlow 将工件记录到 Azure Blob 存储。虽然记录到 dbfs 工作正常,但当我尝试将其记录到 Azure Blob 存储时,我只看到一个具有相应 runid 的文件夹,但里面没有任何内容。

这就是我所做的-

  1. 从 Azure Databricks 创建一个试验,为其命名,并将工件位置命名为 wasbs://mlartifacts@myazurestorageaccount.blob.core.windows.net/ 。

  2. 在 spark 集群中,在 environemtn 变量部分中传递 AZURE_STORAGE_ACCESS_KEY="ValueoftheKey"

  3. 在笔记本中,使用 mlflow 记录指标、参数,最后使用如下代码段记录模型

当然,在使用它之前,我将实验设置为我将工件存储定义为 azure blob 存储的那个。

我可以从 Databricks 中的 MLFlow UI 中获取指标和参数,但由于我的工件位置是 Azure Blob Storage,我希望模型、.pkl 和 conda.yaml 文件位于 Azure Blob Storage 的容器中,但是当我去的时候要检查它,我只看到一个与实验的运行 ID 对应的文件夹,但里面什么都没有。

我不知道我错过了什么。如果有人需要其他详细信息,我很乐意提供。

请注意,当我使用默认位置(即 dbfs)时,一切正常。

0 投票
0 回答
259 浏览

python - MLFlow 未配置,设置环境变量

第 1 步:在带有 Ubuntu 的 AWS EC2 实例上安装 anaconda(其中还安装了 R 和 python)

步骤 2:使用“conda install -c conda-forge mlflow”命令在 conda 中安装 mlflow(假设 R 和 python 都使用)

第 3 步:根据 MLFlow 文档在 R 中使用 mlflow 并在 python 中导入 mlflow 的 library(mlflow) 命令,但仍然无法运行 MLFlow,因为它为 R & Python 提供了以下错误

用于 R 的 Jupyter Notebook 中的错误代码 R 错误代码 Python笔记本错误代码1 Python笔记本错误代码2

第 4 步:使用 R & Python 存储库中提供的 wine 示例来验证未发生的 MLFlow 日志记录。MLFlow 服务器已启动并正在运行

0 投票
1 回答
747 浏览

keras - MLflow 在每个 epoch 后保存权重

我一直在使用 MLflow 跟踪测试一些小示例,但对于我的用例,我希望在每个 epoch 之后保存权重。有时我会在它们完全完成之前终止运行(我不能使用早期停止),但我现在的经验是权重没有保存到跟踪 ui 服务器。有没有办法在每个时代之后做到这一点?

0 投票
1 回答
303 浏览

google-cloud-platform - 无法在谷歌云平台虚拟机实例上启动 mlflow ui

在命令行上运行 mlflow ui 并单击http://127.0.0.1:5000/后, 我无法访问站点 127.0.0.1 拒绝连接。

我已经在 GCP 和本地计算机上更新了 VPC 网络上的防火墙规则并激活了端口

无法访问此站点127.0.0.1 拒绝连接。

尝试:

  • 检查连接
  • 检查代理和防火墙

ERR_CONNECTION_REFUSED

0 投票
1 回答
221 浏览

node.js - 使用 mlflow 服务器启动服务器时,有没有办法隐藏 mlflow ui 标头?

我想通过使用 iframe 将 mlflow ui 集成到我们的网站,但如果可能的话,隐藏标题。我发现源代码/mlflow/server/js/components/HomeView.js 中有一个环境变量设置: const headerHeight = process.env.HIDE_HEADER === 'true' ? 0 : 60;但是如何通过运行服务器来指定这个环境mlflow server?我试过了HIDE_HEADER=true mlflow server,但这不起作用。或者有没有其他方法可以解决这个问题?

0 投票
1 回答
899 浏览

mlflow - 有没有办法在 MLflow 的实验级别管理权限?

有没有办法在 MLflow 的实验级别管理权限?我们希望有一个共享服务器,但希望能够在实验级别管理权限-例如,管理员可以查看所有实验,user_group1 可以管理实验1-也许不同的组可以查看结果与发布结果。

看起来在数据块中是可能的:https ://docs.databricks.com/administration-guide/access-control/workspace-acl.html#experiment-permissions 但我在开源 APIdocs 中找不到任何东西。

谢谢。

0 投票
1 回答
1598 浏览

mlflow - 如何在 mlflow 命令行中设置 run_name?

MLFlow 版本:1.4.0 Python 版本:3.7.4

我正在运行 UImlflow server...和所有必需的命令行选项。

我正在使用适当的MLproject.yaml文件作为 MLFlow 项目登录到 MLFlow。该项目在 Docker 容器上运行,因此 CMD 如下所示:

mlflow run . -P document_ids=${D2V_DOC_IDS} -P corpus_path=... --no-conda --experiment-name=${EXPERIMENT_NAME}

像这样运行实验会产生空白的 run_name。我知道有一个 run_id 但我也想查看 run_name 并将其设置在我的代码中 - 在命令行中或在我的代码中设置为mlflow.log.....

我看过Is it possible to set/change mlflow run name after run initial creation?但我想以编程方式设置运行名称,而不是在 UI 上手动更改它。

0 投票
1 回答
882 浏览

kubernetes - 将 MLFlow 与 Kubeflow 集成

我正在尝试将 MLFlow 服务器与 GCP 上的 Kubeflow 集群集成。为此,我创建了一个 MLFlow 部署并使用负载均衡器公开它。

机器学习代码作为 Pod 部署在 Kubeflow 集群上。MLflow 服务器 IP:PORT 用于记录参数(例如超参数)和工件(例如模型)。

问题是工件仅记录在 docker 映像(带有机器学习代码的 pod)中。另一方面,在提供 MLflow 服务器 IP:PORT 后,参数日志记录工作得非常好。

这是一个屏幕截图。 在此处输入图像描述