问题标签 [azureml]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
145 浏览

azure - 使用 Azure-Interpret ExplanationClient 上传模型说明时出错

我们正在尝试使用 Azure 机器学习来解释模型,方法是使用 Azure ML 可解释性库,即azureml-interpretazureml-sdk[explain]。我们的模型是来自 sklearn.ensemble 的 RandomForestRegressor。

我们收到以下错误

我们已经尝试过 - TabularExplainer、MimicExplainer(with DecisionTreeExplainableModel),但它们都导致相同的错误。

0 投票
2 回答
633 浏览

python - Azure ML 环境的自定义 Docker 文件,其中包含 COPY 语句错误,COPY 失败:/path 没有这样的文件或目录

我正在尝试使用 Python 脚本向 Azure ML 提交实验。

正在初始化的环境使用自定义 Dockerfile。

但是 DockerFile 需要一些COPY语句,但这些语句失败如下:

负责构建映像的 Azure 主机环境不包含 Dockerfile 所需的文件,这些文件存在于我启动 python 脚本的本地开发机器中。

我整天都在寻找一种将这些文件添加到环境中的方法,但没有成功。

下面是 Dockerfile 和提交实验的 python 脚本的摘录。

以下是我提交实验的方式:

任何想法?

0 投票
1 回答
64 浏览

azure - 在 Azure 中,ML Pipelines,训练模型时出错

请帮助我使用大型数据集训练模型或不断重新训练模型。

此外,管道对数据集有任何限制吗?如果是这样,限制是多少

错误如下:“用户程序因 ColumnUniqueValuesExceededError 失败:列中唯一值的数量:“消息”大于允许的值。”

我想用二元逻辑回归模型训练模型,数据集包含 3000 个数据点。在创建管道时,它在训练模型步骤失败。

0 投票
1 回答
362 浏览

azure-devops - 使用 azure 管道在 Azure 容器实例中部署 ML 模型时部署超时

我们的代码直到昨天在 Azure ACI 上部署 ML 模型时运行良好,但今天面临部署超时或有时 400(错误响应)。

microsoft datcenters 有什么问题还是有其他问题?

错误如下

"message": "收到来自模型管理服务的错误响应:\n响应代码:400\n标头:{'Date': 'Thu, 06 Aug 2020 21:05:31 GMT', 'Content-Type': 'application/json ','传输编码':'分块','连接':'keep-alive','请求上下文':'appId = cid-v1:2d2e8e63-272e-4b3c-8598-4ee570a0e70d','x-ms -client-request-id': '8aa4dcafb0ec40ef822b55fc4c7a196f', 'x-ms-client-session-id': 'bf2decff-8879-4a9c-bb5f-2fae7034946c', 'api-supported-versions': '1.0, 2018-03 -01-preview, 2018-11-19', 'x-request-time': '0.044', 'Strict-Transport-Security': 'max-age=15724800; includeSubDomains; preload'}\nContent: b'{ "code":"BadRequest","statusCode":400,"message":"请求无效。","details":[{"code":"InvalidOverwriteRequest","message":"无效覆盖请求 - 无法更新容器资源要求、dns名称标签或部署类型. 请删除并重新部署此服务。"}],"correlation":{"RequestId":"8aa4dcafb0ec40ef822b55fc4c7a196f"}}'"

"message": "服务部署轮询到达不成功终端状态,当前服务状态:不健康\n操作 ID:1b6746b3-cdb6-4e0c-a43d-b31b34ac99b2\n更多信息可以使用 '.get_logs()' 找到\n错误:\ n{\n "code": "DeploymentTimedOut",\n "statusCode": 504,\n "message": "部署操作轮询超时。服务创建花费的时间比我们正常的时间要长。我们仍在尝试为 Web 服务实现所需的状态。请检查当前 Web 服务运行状况的 Web 服务状态。您可以从 python SDK 运行 print(service.state) 来检索 Web 服务的当前状态。"\n}"

0 投票
3 回答
8303 浏览

python - 错误:为 azure ML ACI 部署创建 docker 映像时无法卸载“ruamel-yaml”

我正在尝试在 azure ACI 中部署机器学习模型,但在创建 docker 映像时出现以下错误

下面是我的 pip 依赖项的 yml 文件

如果我使用 conda 而不是 pip 那么我会收到以下错误

**谁能帮帮我吗 **

0 投票
1 回答
821 浏览

python - 在 Python Azure Function 中使用 AzureML 时出现“失败异常:OSError:[Errno 30] 只读文件系统”

问题

我正在尝试准备,然后从 Python 中的 Azure 函数向 Azure 机器学习提交一个新实验。因此,我为我的 Azure ML 工作区注册了一个新数据集,其中包含使用dataset.register(.... 但是,当我尝试使用以下代码行创建此数据集时

然后我得到一个Failure Exception: OSError: [Errno 30] Read-only file system ....

想法

  1. 我知道如果可能的话,我不应该从 Azure 函数中写入文件系统。但我实际上不想向本地文件系统写入任何内容。我只想创建数据集作为对我的 blob 存储的引用datastore_path,然后将其注册到我的 Azure 机器学习工作区。但似乎该方法from_delimited_files无论如何都试图写入文件系统(也许是一些缓存?)。
  2. 我也知道有一个临时文件夹,允许在其中写入临时文件。但是,我相信我无法真正控制这种方法在哪里写入数据。我已经尝试在使用函数调用之前将当前工作目录更改为这个临时文件夹os.chdir(tempfile.gettempdir()),但这没有帮助。

还有其他想法吗?我不认为我在做一些特别不寻常的事情......

细节

我正在使用 python 3.7 和 azureml-sdk 1.9.0,我可以毫无问题地在本地运行 python 脚本。我目前使用 Azure Functions 扩展版本 0.23.0(以及用于 CI/CD 的 Azure DevOps 管道)从 VSCode 进行部署。

这是我的完整堆栈跟踪:

0 投票
1 回答
1165 浏览

azure - Azure-ML 部署看不到 AzureML 环境(版本号错误)

我已经很好地遵循了此处概述的文档。

我通过以下方式设置了我的 azure 机器学习环境:

我有一个为推理配置的 score.py 文件(与我遇到的问题无关)......

然后我设置推理配置

我设置了我的计算集群:

一切顺利;然后我尝试部署模型进行推理:

它没有说它找不到环境。更具体地说,我的环境版本是版本 11,但它一直在尝试查找版本号比当前环境高 1 的环境(即版本 12 ):

我尝试手动编辑环境 JSON 以匹配 azureml 尝试获取的版本,但没有任何效果。任何人都可以看到这段代码有什么问题吗?

更新

更改环境的名称(例如,my_inference_env)并将其传递给InferenceConfig似乎是在正确的轨道上。但是,错误现在更改为以下

解决方案

关于 azure ML 环境的使用,下面 Anders 的回答确实是正确的。但是,我得到的最后一个错误是因为我使用摘要值(a sha)而不是图像名称和标签(例如, )来设置容器图像imagename:tag。注意第一个块中的代码行:

我引用了摘要值,但应该将其更改为

一旦我进行了更改,部署就成功了!:)

0 投票
0 回答
171 浏览

automl - 350MB 文件的状态“准备中”超过 2 小时

我已提交在远程计算上运行的 autoML(Standard_D12_v2 - 4 节点集群 28GB,每个 4 核)

我的输入文件大约是 350 MB。

状态为“准备中”超过 2 小时。然后它失败了。

下面是我的 python-Notebook 代码,请帮忙。

0 投票
1 回答
378 浏览

dataset - 无法在数据标签 MLStudio 中设置数据集类型

无法在数据标签项目 MLStudio 中设置数据集类型。

默认数据集文件类型始终显示。我想使用 panda_dataframe。创建数据集时如何将数据集设置为制表器数据集。

另外如何将文件数据集更改为表格数据集我想应用 pandas_dataframe。但它不适用于文件数据集。

在此处输入图像描述

0 投票
1 回答
150 浏览

azure - Azure ML Studio - 如何合并/连接列

我应该使用 Azure ML Studio 中的哪个模块将一些三列合并(连接)到另一列(已经存在)。我正在使用来自 Kaggle 的 SMS Spam Collection Dataset,其中 CSV 文件应仅包含 2 列:v1 和 v2。但是,在某些行中,来自 v2 的部分内容进入了第 2 列、第 3 列和第 4 列。那么,如何将第 2 列、第 3 列和第 4 列合并到(与)列 v2 中?

在此处输入图像描述