问题标签 [azure-machine-learning-workbench]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
azure-machine-learning-studio - 将 Azure ML 部署到自定义 kubernetes
是否可以使用 helm 图表将 Azure ML 生成的映像部署到自我管理的 Kubernetes?我们只想消费图像和模型。
我看到当它部署到 AKS 中的推理集群时,Azure ML 设置了某些 ENV 变量。那么,想了解是否有人在自定义 kubernetes 集群上手动完成了此设置,有哪些挑战?
原因是部署到已经由生产团队管理的集群。
azure - Azure 机器学习管道:如何在失败时重试?
因此,我在这里有一个 Azure 机器学习管道,其中包含许多PythonScriptStep
任务 - 非常基本。
由于网络问题或其他原因,其中一些脚本步骤会间歇性地失败 - 真的没有什么意外。此处的解决方案始终是在 Azure 机器学习工作室的浏览器界面中简单地触发失败实验的重新运行。
尽管我尽了最大努力,但我还是无法弄清楚如何在脚本步骤对象、管道对象或任何其他 AZ ML 相关对象上设置重试参数。这是任何类型的管道中的常见模式:任务失败一次 - 在确定它实际失败之前重试几次。
请问有人给我指点吗?
编辑:一位乐于助人的用户为此建议了一个外部解决方案,它需要一个 Azure 逻辑应用程序来侦听 ML 管道事件并通过 HTTP 请求重新触发失败的管道。虽然这个解决方案可能对某些人有用,但它只会让您陷入另一个设置、调试和维护另一个外部组件的兔子洞。我正在寻找一个简单的“在任务失败时重试”选项,该选项(IMO)必须被纳入 Azure ML 管道框架,并且希望只是记录不佳。
python - 从 Azure 机器学习工作区获取所有现有管道
我使用 azure 机器学习服务 (aml) 来运行 ml 模型。当我转到 AML 的 GUI 时,我可以看到所有现有的管道,但我看不到它们是如何安排的。我需要获取所有已发布的 piplines 和所属的元数据。
如何使用 python sdk 获取有关现有管道的信息?
azure - 在 azure 机器学习中从推理服务器公开普罗米修斯指标
目前,我们正在 azure 机器学习中运行推理服务器。我们希望能够向 prometheus 公开现有指标并创建我们自己的自定义指标,所有这些都将在下面描述
公开现有指标:
我想按状态/平均延迟等细分请求数量...我假设 azure 会在某个地方跟踪它,但我在任何地方都看不到它,即使我想公开它以便普罗米修斯可以刮掉它。
公开自定义指标:
我们的推理代码有许多缓慢的步骤,我们希望能够公开有关此代码每个部分的指标,以便我们可以看到应用程序的哪些部分是瓶颈。
azure - 如何查看我的 azure 机器学习在线端点将具有哪个托管标识
我希望能够从我的在线端点访问 mysql 数据库。为此,我需要能够将密码输入到正在运行的端点中。我想使用本教程中的托管身份从保管库中读取密码。https://docs.microsoft.com/en-us/azure/machine-learning/how-to-access-resources-from-endpoints-managed-identities?tabs=system-identity。他们在文档中提供的命令不起作用,因为它找不到资源:
我还尝试列出端点,然后得到一个空白列表:
此功能似乎没有正确实现,我正在寻找解决方法。UI 中是否有我可以看到我的在线端点将使用的托管标识?