问题标签 [mlflow]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
tensorflow - Mlflow:使用 Tensorflow train_and_evaluate 在评估阶段记录步骤
我正在尝试使用 Mlflow 记录评估期间的步骤,但只能记录最后一步。使用 mlflow.tensorflow.autolog() 我可以在保存检查点时记录一些指标(如丢失),每 100 个步骤在 RunConfig 中定义。但是,我还需要每评估模型 100 步保存一次准确度和 top3error。这是我的代码:
这是模型中使用的 RunConfig:
提前致谢
conda - MLFLOW:使用 conda.yaml 环境时,Shell 未配置错误
使用不带选项的mlflow run
命令时出现以下错误。--no-conda
我已经尝试了错误消息中提供的建议,但没有运气。我尝试使用激活 conda 环境conda activate
,它可以工作。但是,通过 mlflow 使用时它不起作用。有什么方法可以编辑 mlflow 在后台执行的命令吗?
docker - MLflow 1.2.0 定义 MLproject 文件
尝试通过将位于不同位置的 MLproject 和代码指定为 MLproject 文件来运行 mlflow。
我有以下目录结构:
当我从:/root/
我得到:
由于我的MLproject
文件找不到 Python 代码。我把 MLproject 移到了mflow_test
,这很好用。
这是我的 MLproject 入口点:
如何运行mlflow run
并传递 MLproject 并要求它查看不同的文件夹?
我试过了:
我得到:
/entrypoint.sh: line 5: exec: cd: not found
Dockerfile
mlflow - 如何修复“在 MLflow 服务器上显示的 HDFS 上不正确的工件/模型路径”
我使用 mlflow 版本 1.2.0 使用以下命令运行 mlflow 服务器
我从 MLflow 教程快速入门https://www.mlflow.org/docs/latest/quickstart.html运行实验
命令:
记录模型的代码是
在
我通过 webbrowser myhost: myport 访问服务器并检查我运行的运行。
我成功获取了 myhost 的运行信息:myport/#/experiments/0/runs/run_id
在这个页面中,我发现第一层(模型目录)路径是正确的。也就是说,run_id/artifacts/model
正确的路径
但是一旦我单击模型文件夹下的 MLmodel 文件,路径就会出错:我希望看到 run_id/artifacts/model/MLmodel
但实际上它是 run_id/artifacts/MLmodel
错误的路径
mlflow - 使用“mlflow models serve”CLI 为 MLflow 模型提供服务时,如何设置自定义 gunicorn worker 超时?
当使用“pyfunc”后端 ( https://github.com/mlflow/mlflow/blob/master/mlflow/pyfunc/backend.py ) 为 MLflow Python 模型提供服务时,如何设置自定义 gunicorn worker 超时?当为需要很长时间加载的大型模型提供服务时,默认的 60 秒超时可能不够。
python - 使用没有管道的 Kubeflow 保存模型工件
到目前为止,我在我的 jupyterhub 环境中使用 mlflow 进行模型跟踪,我觉得很容易通过调用 run 来跟踪 mlflow 中的工件:
我现在要搬到 Kubeflow,不确定是否可以在不创建管道的情况下在这里做同样的事情。我能找到的是:
有什么方法可以跟踪 Kubeflow 中的 mlflow 等实验吗?
python - 在远程 mlflow 服务器上保存工件
我正在尝试将MLflow
工件存储在正在运行的远程服务器上MLflow
。我正在访问的服务器和正在运行的服务器MLflow
都是谷歌云上的虚拟机。我可以看到MLflow
服务器中的矩阵,但看不到工件。
我尝试了以下方法,但它们都没有起作用:
mlflow server --backend-store-uri /mnt/persistent-disk --default-artifact-root /tmp/ --host=0.0.0.0
- mlflow 服务器 --backend-store-uri /mnt/persistent-disk --default-artifact-root /path/to/folder/with/mlrun --host=0.0.0.0
我还rwx
授予了路径权限,但仍然遇到相同的错误:
python - 在特定模式中指定数据库后端存储创建
在创建 mlflow 跟踪服务器并指定将 SQL Server 数据库用作后端存储时,mlflow 在 dbo 模式中创建一堆表。有谁知道是否可以指定不同的模式来创建这些表?
mlflow - mlflow log_model 需要捕获 runId 以在 mlflow 模型中使用
在 log_model 调用中生成的 runId 需要在 mlflow 模型服务中访问
我正在尝试以最低限度运行 mlflow 来部署自定义模型
迈出的第一步:我使用 log_model 观察保存模型:工件已正式保存在 mlruns
采取的第二步:我能够使用 mlflow 模型服务 -m 运行:观察:服务器在 5000 处启动
采取的第三步:我能够运行 curl 调用来预测观察:预测返回
问题:我如何将 Step1 中生成的 runId 传递给 Step2 即 log_model
请告知上述用例的推荐工作流程(是否需要使用跟踪/mlflow服务器)等。
问题:如何访问上述log_model返回的runId来调用mlflow模型serve -m runs
docker - 无法码头化 mlflow
在对 mlflow 进行 dockerizing 时,由于在 mlflow ui 中创建了 .trash ,因此出现错误,因为“不存在实验”
码头工人撰写: