问题标签 [ml-studio]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
68 浏览

azure - 在 Azure ML 工作室中执行 spark 作业

我正在尝试在 azure ML studio 中使用执行 python 脚本来运行一些 spark 脚本。并得到一个错误说 unable to import spark libraries

基本上,我正在尝试使用 ML Studio 为已开发的模型创建 Web 服务。

使用 ML Studio 运行 Spark 作业是否可能或可行?

谁能帮我解决这个问题。

提前致谢。

0 投票
0 回答
319 浏览

r - 在 Azure 机器学习工作室中提取线性回归的特征权重

目前,我们只能通过“可视化”选项查看经过训练的线性回归的特征权重(或系数估计),但无法将其保存为表格或数据集。我正在尝试使用市场组合模型来了解每个媒体变量的增量销售提升,因此我需要保存回归估计。

除了使用“执行 R”模块之外,还有其他解决方法吗?

在此处输入图像描述

0 投票
1 回答
612 浏览

r - 在 Azure ML Studio 中,评分模型不会从 R 模型返回预测值

我在 R 中构建了一个多类 SVM 模型,并使用从 azure 创建 R 模型模块来训练和预测我的测试数据集。这是教练和分数 R 脚本。

培训师 R 脚本:

分数 R 脚本:

请注意,在我的代码中,我对概率值进行了硬编码以简化代码。

这是我在 Azure 中的组件设计:

在此处输入图像描述

当我运行实验时,所有组件都工作正常。但是,在评分模型中,评分数据集端口不显示预测值。它仅显示测试数据集中的特征值。我检查了Score 模型的输出日志,我可以看到该模型很好地预测了测试数据(注意我在 Scores R 脚本中添加了打印命令)。但这还不够,我需要从分数模型返回的预测,以便我可以通过 API 传递它。

有没有人遇到过这个问题?

0 投票
1 回答
365 浏览

azure - 如何防止 Azure ML Studio 在导入数据集时将特征列转换为 DateTime

我在尝试在 Azure ML Studio 中加载数据集时遇到一些问题,该数据集包含一个看起来像 DateTime 的列,但实际上是一个字符串。Azure ML Studio 在内部将这些值转换为 DateTimes,似乎再多的争论也无法说服它实际上是字符串。

这是一个问题,因为在转换过程中值会失去精度并开始显示为重复项,而实际上它们是唯一的。有人知道 ML Studio 是否可以配置为在导入数据集时不推断列的数据类型?

现在,为了更长的(呃)故事:)

我在这里使用公共数据集 - 特别是Kaggle 的纽约市票价预测竞赛。我想看看我是否可以使用 Azure ML Studio 做一个快速而简单的解决方案,但是数据集的唯一键值是表单 2015-01-27 13:08:24.0000003 2015-01-27 13:08:24.0000002 2011-10-06 12:10:20.0000001 等。

在我的实验中导入它们时,键值会转换为 DateTime,使它们不再唯一,即使它们在 csv 中是唯一的。不用说,这会阻止我向 Kaggle 提交任何解决方案,因为我无法唯一地识别行:)。

我尝试了以下方法:

  • 在加载数据集并将列的数据类型设置为字符串后编辑数据集的元数据,但这并没有多大作用,因为精度已经丢失
  • 从 Azure blob 导入数据集,将其转换为 csv,然后将其加载到 Jupyter/Python 中——这给我带来了相同的(重复的)密钥。
  • 正如预期的那样,使用 pandas 在本地加载数据集是可行的。

我已经用 5.5GB 的大train数据集和更易于管理的sample_submission数据集重现了这种行为。

很想知道是否有某种解决方法可以告诉 ML Studio 在加载数据集时不要尝试转换此列。我在这里专门寻找仅限 Azure ML Studio 的解决方案,因为我不想对数据集进行任何预处理。

0 投票
1 回答
51 浏览

azure-machine-learning-studio - 使用 ML Studio API 开发 CD/CI 的最佳实践是什么?

在我们的后端开发过程中,我们有两个环境:测试和生产。我们开发代码,然后将代码推送到测试存储库中。然后在发布日期,我们将所有内容都投入生产。

现在我们要使用 ML Studio,我正在努力为我的 ML Studio 实验设置测试和生产环境。

我用独立的 API 创建了两个相同的实验;一个实验用于测试,另一个实验用于生产。当谈到将训练有素的实验从测试转移到生产环境时,我会将我在测试环境中所做的所有更改都转移到生产环境中,这是一个非常耗时的过程。

您是否知道任何更好的解决方案,以便我们可以部署和测试我们的更改,然后将最新的更改部署到生产中?人们如何在 CD/CI 流程中使用 ML Studio?

附图显示了我现在拥有的设计。如果您能帮助我改进这个过程,我将不胜感激。也许 ML studio 有一些我不知道的功能来管理这个场景。

0 投票
1 回答
207 浏览

azure - ML Studio中Web Service API的主键是否过期?

我从 ML 工作室的一个实验中部署了一个 Web 服务。我测试了 API,一切正常。我在邮递员中对其进行了测试。2 小时后,当我使用相同的 API 发送请求时出现身份验证错误。因此,为了解决这个问题,我重新发布了我的 Web 服务并获得了新的身份验证代码,因此 API 目前可以正常工作。我有两个问题:

1) 主键会在一段时间后自动过期还是从 ML Studio 退出?2) ML Studio API 中第二个密钥的应用是什么?我们在哪里需要第二把钥匙?

0 投票
1 回答
476 浏览

azure-machine-learning-studio - Azure 机器学习工作室将行追加到数据集

我的“实验”是这样的,

实验

我在“Dataset.csv”中有 10 行(不包括标题),在Import Data导入的 CSV 中有 3 行(不包括标题) 。两个 CSV 的架构相同。我希望添加行将 3 行附加到Dataset.csv。

真正的“Dataset.csv”有超过 25,000 行,预计还会增长。因此,使用导出数据生成合并数据集(作为新的 CSV)不是一个可行的解决方案。有什么方法可以为这种情况实现附加吗?

谢谢

更新 1: Dataset.csv 存在于 ML Studios Dataset中。

在此处输入图像描述

0 投票
2 回答
126 浏览

azure - Azure 数据工厂 V2 ML Batch 执行 Web 服务中 GlobalParameters 中的动态内容

我正在尝试在 Azure 数据工厂 V2 中的 ML Batch Execution 模块上使用 GlobalParameters 中的动态内容。

似乎我尝试的一切都出现了同样的错误。请参阅随附的屏幕截图。

尝试做动态内容 globalParameters

这是我能找到的关于这个主题的唯一一点文档......

文件

0 投票
1 回答
620 浏览

python-3.x - 在 Azure ML Studio 中执行 Python 脚本模块失败

我在 Azure ML Studio 中使用 Execute Python Script 模块并编写了最基本的代码:

它失败并出现以下错误:

0 投票
1 回答
515 浏览

python-3.x - 需要在 Azure ML studio 中安装 python 包

我是 Azure ML 工作室的新手,正在尝试运行 python 脚本。

目前我正在研究与文本分析相关的代码,作为其中的一部分,我想获得 SVD 分解的奇异值,如下所示

Azure ML studio 中当前的 scikit learn 版本是 0.17,奇异值是 scikit learn 更高版本的一部分,例如 0.20。

所以我需要将 scikit learn 包升级到 0.20。我尝试下载 scikit learn 0.20 wheel 文件并将其压缩并作为数据集上传到 Azure ML 工作室并在此处连接输入图像描述,但仍然出现如下错误“

AttributeError:“TruncatedSVD”对象没有属性“singular_values_”进程返回非零退出代码1

也已经提到了下面的问题

与 Azure ML 工作室中的升级包相关的 Stackoverflow 问题 如何在 Azure ML 中安装 Python 包?