问题标签 [azure-machine-learning-service]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
355 浏览

azure - 在 Azure ML 工作区中部署 autoML StackEnsemble 模型时出错

我有一个使用 Azure ML 工作区的 autoML 功能训练的 StackEnsemble 模型。当我尝试将其部署为 Web 服务时,我收到如下错误 (CrashLoopBackOff)。现在,我强烈怀疑它与模型本身/它需要的依赖关系有关。当我将 score.py 中的模型名称交换为另一个模型名称时,它不是 StackEnsemble(带有缩放器),而只是一个普通的 XGBoost,然后创建的服务没有问题。

我有以下问题: - 我如何找出 StackEnsemble 中的模型/算法,以便正确构建容器/依赖项列表?- 有什么方法可以找出那里的实际错误是什么?我的意思是除了创建我的本地容器并在那里调试它......我尝试根据文档使用 service.get_logs() 获取日志,但那里什么都没有,只有最后 5 行没有指出任何问题。

请指教。

0 投票
1 回答
311 浏览

azure-machine-learning-service - 在推理配置中指定环境

我在使用自定义 docker 映像部署模型时遇到问题。部署失败,因为所需的包不在“默认”环境中,我需要指定一个自定义的。("/miniconda/envs/py37/bin/python")

0 投票
1 回答
162 浏览

python - 是否可以将 HyperDriveStep 与时间序列交叉验证一起使用?

我想将堆叠模型部署到 Azure 机器学习服务。该解决方案的架构由三个模型和一个元模型组成。数据是时间序列数据。

我希望模型根据一些时间表自动重新训练。我还想在每次重新训练期间重新调整超参数。

AML 服务提供HyperDriveStep了可在管道中用于自动超参数优化的类。

是否有可能 - 如果可以,如何做到 -HyperDriveStep与时间序列 CV 一起使用?

我检查了文档,但没有找到令人满意的答案。

0 投票
2 回答
132 浏览

azure-machine-learning-service - Azure ML 服务转储日志

使用 AzureML 服务,如何使用 Horovod 在多个节点上为 keras 深度学习转储不同时期的正确损失曲线或准确度曲线?

使用 Horovod 和 AzureML 的 Keras 深度学习的 Loss vs epochs plt 似乎存在问题。

使用 Keras/Horovod(2 个 GPU)和 AMLS SDK 训练 CNN 生成奇怪的图形 在此处输入图像描述 在此处输入图像描述

0 投票
1 回答
490 浏览

azure - 如何在 Azure ML 中重用成功构建的 docker 镜像?

在我们公司,我使用 Azure ML,但遇到以下问题。我用 PyTorch 估计器类指定一个conda_requirements.yaml文件,就像这样(...是占位符,所以我不必输入所有内容):

conda_requirements.yaml (pip 部分的缩短版本)如下所示:

这在 Azure 上成功构建。现在为了在这种情况下重用生成的 docker 映像,我使用custom_docker_image参数传递给

但是现在 Azure 似乎以某种方式再次重建了图像,当我运行实验时它无法安装 Torch。所以它似乎只安装了 conda 依赖项而不是 pip 依赖项,但实际上我不希望 Azure 重建映像。我能以某种方式解决这个问题吗?

我试图以某种方式从我的 Docker 文件构建一个 docker 映像,然后添加到注册表中。我可以进行 az login 并根据https://docs.microsoft.com/en-us/azure/container-registry/container-registry-authentication我也应该能够进行 acr 登录和推送。这不起作用。即使使用来自

然后做一个

不起作用。即使我使用了错误消息,也需要身份验证

成功地。除了如何在使用 Azure ML 时重用 docker 映像之外,如果有人可以向我解释这一点,我也会很高兴。谢谢!

0 投票
3 回答
1193 浏览

python - 无法使用 GPU 在使用 P100-NC6s-V2 计算的 Azure 机器学习服务中训练 NN 模型。因 CUDA 错误而失败

我最近开始使用 azure for ML 并尝试使用机器学习服务工作区。因为我需要使用 GPU 上的图像训练 NN,所以我已经设置了一个工作区,其中计算集为 NC6s-V2 机器。

问题是训练仍然在 CPU 上进行——日志说它无法找到 CUDA。这是运行我的脚本时的警告日志。任何线索如何解决这个问题?

我还在估计器的 conda packages 选项中明确提到了 tensorflow-gpu 包。

这是我的估算器代码,

计算目标是根据 github 上的示例代码制作的:

这是它无法使用 GPU 的警告:

根据日志,它当前正在使用 CPU。任何线索如何解决这里的问题?

0 投票
2 回答
159 浏览

php - 如何将 AzureML(机器学习)与 AzureVM(虚拟机)连接起来?

我们使用 AzureML notebook 通过 ImageAI 进行对象检测。我们在 Azure VM 上放置了一个虚拟机。它有一个 IP(如果需要,可以说 104.45.19.XXX)

我们需要从 AzureVM 上此文件夹中的移动应用程序上传的文件夹中读取一些文件:C:\inetpub\ftproot\

一个示例文件夹是:C:\inetpub\ftproot\ID1 1565636032150 1 - 其中 long 数字是从 1970 年开始的毫秒数,最后 1 是许多图片。

我们尝试通过按钮 Jupyter => [菜单项] Azure => 连接到 Azure => 授予访问权限从 AzureML 进行连接

然后我们得到一个窗口,显示消息:AADSTS90002: Tenant 'null' not found。如果租户没有活动订阅,则可能会发生这种情况。请咨询您的订阅管理员。

1)我们如何从 AzureML 笔记本连接到 AzureVM,因为这种方法应该像我们一样工作:AzureML 和 AzureVM?

2) [可选] 那么我们如何检查正在创建的新文件夹?

谢谢,埃里克

0 投票
4 回答
3191 浏览

azure-machine-learning-service - 如何从 azure 机器学习工作区中删除实验

我使用 python sdk (azureml-sdk) 在我的工作区中创建实验。我现在有很多“测试”实验在我们的工作空间里乱扔垃圾。如何通过 api 或门户网站删除单个实验。我知道我可以删除整个工作区,但是我们不想删除一些好的实验

https://docs.microsoft.com/en-us/azure/machine-learning/service/how-to-export-delete-data#delete-visual-interface-assets表明这是可能的,但我的工作区视图看起来不任何像那里显示的东西

0 投票
1 回答
63 浏览

azure-machine-learning-service - AML 服务 - Web 服务部署和安全问题

关于 Web 服务部署/安全性,我对 Azure ML 服务有疑问。你能帮我解决这些问题吗:

  • 默认情况下,已发布的 Web 服务 URI 是可公开寻址的,无需任何身份验证。保护这些 Web 服务的最佳实践是什么?
  • 从无人参与的流程(如 Web 服务、DevOps 等)进行身份验证时,有哪些用于身份验证的选项/最佳实践?Azure ML 服务似乎不支持托管标识。应用注册?其他?
0 投票
1 回答
352 浏览

python - 从存储帐户安装私有 python 轮子

我在所有 AML 工作区中使用共享存储帐户。我在每个工作区上注册此存储帐户,并在针对 AML 计算时使用它来共享数据和库。要安装一个私有的python wheel,我们目前必须在本地下载包并使用Environment.add_private_pip_wheel上传它并检索包的远程url。我想知道是否有办法在共享存储帐户中传递对包的引用,而不必将其移动到默认工作区存储帐户。

我试图将pip_packages 依赖参数中的完整 blob url(例如https://mystorageaccount.blob.core.windows.net/mypackage.whl )传递给 TensorFlow 估计器类,但实验执行失败并出现 404 错误:指定的url https://mystorageaccount.blob.core.windows.net/mypackage.whl的资源不存在

由于存储帐户已在工作区中注册,因此我希望能够直接(使用上面的代码)从共享存储帐户将私有包安装到 AML 计算中,而无需在本地下载它然后调用 Environment.add_private_pip_wheel 函数。

相反,我收到以下错误并且实验失败:

(来自 -r /azureml-environment-setup/condaenv.kc80np3o.requirements.txt(第 1 行))因为 HTTP 错误 404 客户端错误:指定的资源不存在。对于网址:https ://mystorageaccount.blob.core.windows.net/mypackage.whl ...

CondaValueError:pip 返回错误