问题标签 [azure-machine-learning-service]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
azure - 在 Azure ML 工作区中部署 autoML StackEnsemble 模型时出错
我有一个使用 Azure ML 工作区的 autoML 功能训练的 StackEnsemble 模型。当我尝试将其部署为 Web 服务时,我收到如下错误 (CrashLoopBackOff)。现在,我强烈怀疑它与模型本身/它需要的依赖关系有关。当我将 score.py 中的模型名称交换为另一个模型名称时,它不是 StackEnsemble(带有缩放器),而只是一个普通的 XGBoost,然后创建的服务没有问题。
我有以下问题: - 我如何找出 StackEnsemble 中的模型/算法,以便正确构建容器/依赖项列表?- 有什么方法可以找出那里的实际错误是什么?我的意思是除了创建我的本地容器并在那里调试它......我尝试根据文档使用 service.get_logs() 获取日志,但那里什么都没有,只有最后 5 行没有指出任何问题。
请指教。
azure-machine-learning-service - 在推理配置中指定环境
我在使用自定义 docker 映像部署模型时遇到问题。部署失败,因为所需的包不在“默认”环境中,我需要指定一个自定义的。("/miniconda/envs/py37/bin/python")
python - 是否可以将 HyperDriveStep 与时间序列交叉验证一起使用?
我想将堆叠模型部署到 Azure 机器学习服务。该解决方案的架构由三个模型和一个元模型组成。数据是时间序列数据。
我希望模型根据一些时间表自动重新训练。我还想在每次重新训练期间重新调整超参数。
AML 服务提供HyperDriveStep
了可在管道中用于自动超参数优化的类。
是否有可能 - 如果可以,如何做到 -HyperDriveStep
与时间序列 CV 一起使用?
我检查了文档,但没有找到令人满意的答案。
azure - 如何在 Azure ML 中重用成功构建的 docker 镜像?
在我们公司,我使用 Azure ML,但遇到以下问题。我用 PyTorch 估计器类指定一个conda_requirements.yaml文件,就像这样(...是占位符,所以我不必输入所有内容):
conda_requirements.yaml (pip 部分的缩短版本)如下所示:
这在 Azure 上成功构建。现在为了在这种情况下重用生成的 docker 映像,我使用custom_docker_image
参数传递给
但是现在 Azure 似乎以某种方式再次重建了图像,当我运行实验时它无法安装 Torch。所以它似乎只安装了 conda 依赖项而不是 pip 依赖项,但实际上我不希望 Azure 重建映像。我能以某种方式解决这个问题吗?
我试图以某种方式从我的 Docker 文件构建一个 docker 映像,然后添加到注册表中。我可以进行 az login 并根据https://docs.microsoft.com/en-us/azure/container-registry/container-registry-authentication我也应该能够进行 acr 登录和推送。这不起作用。即使使用来自
然后做一个
不起作用。即使我使用了错误消息,也需要身份验证
成功地。除了如何在使用 Azure ML 时重用 docker 映像之外,如果有人可以向我解释这一点,我也会很高兴。谢谢!
python - 无法使用 GPU 在使用 P100-NC6s-V2 计算的 Azure 机器学习服务中训练 NN 模型。因 CUDA 错误而失败
我最近开始使用 azure for ML 并尝试使用机器学习服务工作区。因为我需要使用 GPU 上的图像训练 NN,所以我已经设置了一个工作区,其中计算集为 NC6s-V2 机器。
问题是训练仍然在 CPU 上进行——日志说它无法找到 CUDA。这是运行我的脚本时的警告日志。任何线索如何解决这个问题?
我还在估计器的 conda packages 选项中明确提到了 tensorflow-gpu 包。
这是我的估算器代码,
计算目标是根据 github 上的示例代码制作的:
这是它无法使用 GPU 的警告:
根据日志,它当前正在使用 CPU。任何线索如何解决这里的问题?
php - 如何将 AzureML(机器学习)与 AzureVM(虚拟机)连接起来?
我们使用 AzureML notebook 通过 ImageAI 进行对象检测。我们在 Azure VM 上放置了一个虚拟机。它有一个 IP(如果需要,可以说 104.45.19.XXX)
我们需要从 AzureVM 上此文件夹中的移动应用程序上传的文件夹中读取一些文件:C:\inetpub\ftproot\
一个示例文件夹是:C:\inetpub\ftproot\ID1 1565636032150 1 - 其中 long 数字是从 1970 年开始的毫秒数,最后 1 是许多图片。
我们尝试通过按钮 Jupyter => [菜单项] Azure => 连接到 Azure => 授予访问权限从 AzureML 进行连接
然后我们得到一个窗口,显示消息:AADSTS90002: Tenant 'null' not found。如果租户没有活动订阅,则可能会发生这种情况。请咨询您的订阅管理员。
1)我们如何从 AzureML 笔记本连接到 AzureVM,因为这种方法应该像我们一样工作:AzureML 和 AzureVM?
2) [可选] 那么我们如何检查正在创建的新文件夹?
谢谢,埃里克
azure-machine-learning-service - 如何从 azure 机器学习工作区中删除实验
我使用 python sdk (azureml-sdk) 在我的工作区中创建实验。我现在有很多“测试”实验在我们的工作空间里乱扔垃圾。如何通过 api 或门户网站删除单个实验。我知道我可以删除整个工作区,但是我们不想删除一些好的实验
https://docs.microsoft.com/en-us/azure/machine-learning/service/how-to-export-delete-data#delete-visual-interface-assets表明这是可能的,但我的工作区视图看起来不任何像那里显示的东西
azure-machine-learning-service - AML 服务 - Web 服务部署和安全问题
关于 Web 服务部署/安全性,我对 Azure ML 服务有疑问。你能帮我解决这些问题吗:
- 默认情况下,已发布的 Web 服务 URI 是可公开寻址的,无需任何身份验证。保护这些 Web 服务的最佳实践是什么?
- 从无人参与的流程(如 Web 服务、DevOps 等)进行身份验证时,有哪些用于身份验证的选项/最佳实践?Azure ML 服务似乎不支持托管标识。应用注册?其他?
python - 从存储帐户安装私有 python 轮子
我在所有 AML 工作区中使用共享存储帐户。我在每个工作区上注册此存储帐户,并在针对 AML 计算时使用它来共享数据和库。要安装一个私有的python wheel,我们目前必须在本地下载包并使用Environment.add_private_pip_wheel上传它并检索包的远程url。我想知道是否有办法在共享存储帐户中传递对包的引用,而不必将其移动到默认工作区存储帐户。
我试图将pip_packages 依赖参数中的完整 blob url(例如https://mystorageaccount.blob.core.windows.net/mypackage.whl )传递给 TensorFlow 估计器类,但实验执行失败并出现 404 错误:指定的url https://mystorageaccount.blob.core.windows.net/mypackage.whl的资源不存在
由于存储帐户已在工作区中注册,因此我希望能够直接(使用上面的代码)从共享存储帐户将私有包安装到 AML 计算中,而无需在本地下载它然后调用 Environment.add_private_pip_wheel 函数。
相反,我收到以下错误并且实验失败:
(来自 -r /azureml-environment-setup/condaenv.kc80np3o.requirements.txt(第 1 行))因为 HTTP 错误 404 客户端错误:指定的资源不存在。对于网址:https ://mystorageaccount.blob.core.windows.net/mypackage.whl ...
CondaValueError:pip 返回错误