问题标签 [azure-machine-learning-studio]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
949 浏览

r - 无法在 azure ml 中安装 R 库

我一直在尝试安装一个可以在我的 R 脚本中使用的机器学习包。

我已经将安装程序的压缩包放在一个 zip 文件中,并且正在做

从 R 脚本中。但是,进度指示器只是无限循环,并且没有安装在环境中。

我怎样才能安装这个包?

ada是我要安装的软件包,ada_2.0-3.tar.gz也是我正在使用的文件。

0 投票
1 回答
1445 浏览

python - 用于 Azure ML 中的特征提取的 TfidfVectorizer 和 sublinear_tf 缩放

我正在研究 ML 文档分类问题。有谁知道如何在 Azure ML 中进行 n-gram Tfidf 特征提取和 sublinear_tf 缩放。

过去,我使用 TfidfVectorizer 进行了 inSci-Kit 学习(参见下面的示例),但问题是在 AzureML 中,我无法使用 python 模块明确定义自己的方法或类,并且宁愿不上传压缩代码。

我是 python 人,但如果有等价物,我愿意使用 R。市场上有一个 R 样本,但它依赖于 unigram。

最好的,-阿里

0 投票
1 回答
343 浏览

web-services - Web 服务输入到 SQL 查询到 Azure ML 中的 R

我在 Azure ML 中有以下简单设置。机器学习设置 基本上,Reader 是对 DB 的 SQL 查询,它返回一个名为 Pdelta 的向量,然后将其传递给 R 脚本进行进一步处理,然后将结果返回给 Web 服务。数据库查询很简单 ( SELECT Pdelta FROM ...) 并且工作正常。我也将数据库查询设置为 Web 服务参数。

一切似乎都运行良好,但最后当我将它作为 Web 服务发布并对其进行测试时,它以某种方式要求额外的输入参数。附加参数被调用PDELTA在此处输入图像描述

我想知道为什么会这样,我忽略了什么?我想让这个 Web 服务只要求一个参数——SQL 查询(Delta 查询),然后它会提供 Pdelta。

任何想法或建议将不胜感激!

0 投票
1 回答
127 浏览

azure - Azure 机器学习 - 序列化错误

我试图创建一个预测性网络服务(按照电影推荐教程),但是当我运行预测性实验时出现错误:

模型无法反序列化,因为它可能使用旧的序列化格式进行序列化。请重新训练并重新保存模型。. (错误 0082)

你有什么想法吗?

在此处输入图像描述

0 投票
2 回答
1374 浏览

azure - Azure 机器学习决策树输出

有没有办法在 ML Studio 中获取 Boosted Decision Tree 模块的输出?分析学习树,就像在 Weka 中一样。

0 投票
5 回答
19305 浏览

python - 在 azure ml 中运行笔记本时如何最好地从 azure blob csv 格式转换为 pandas 数据帧

我有许多存储为天蓝色 blob 的大型 csv(制表符分隔)数据,我想从这些数据中创建一个 pandas 数据框。我可以在本地执行以下操作:

但是,在 azure ML 笔记本上运行笔记本时,我无法“保存本地副本”然后从 csv 读取,因此我想直接进行转换(类似于 pd.read_azure_blob(blob_csv) 或只是 pd .read_csv(blob_csv) 将是理想的)。

如果我首先创建一个 azure ML 工作区,然后将数据集读入其中,最后使用https://github.com/Azure/Azure-MachineLearning,我可以获得所需的最终结果(用于 blob csv 数据的 pandas 数据框)-ClientLibrary-Python将数据集作为 pandas 数据框访问,但我更愿意直接从 blob 存储位置读取。

0 投票
1 回答
150 浏览

web-services - Arduino Uno - Web 服务 (AzureML)

我想连接到 AzureML Web 服务。我已经查看了 Arduino 主页和这里的 POST 方法https://iotguys.wordpress.com/2014/12/25/communicating-with-microsoft-azure-eventhub-using-arduino/

这是我的设置方法:

Post 方法基于此: http: //playground.arduino.cc/Code/WebClient

我刚刚添加sprintf(outBuf, "Authorization: Bearer %s\r\n", api_key);到标题中char* api_key = "the ML Web Service API KEY"

此外,与 WebClient 中指定的不同,我使用整个 WebService URI 作为 url,并且不指定页面名称。

这行不通。

我要连接的网络具有 Internet 访问权限。

我究竟做错了什么?

0 投票
1 回答
1700 浏览

r - 如何在 Azure ML 中为 strptime 函数定义当前时区,未知时区“本地时间”

我在 Azure 机器学习的 Execute R 模块中操作的所有这些日期在输出中都写为空白 - 也就是说,这些日期列存在,但这些列中没有值。

包含我正在读入数据框中的日期信息的源变量有两种不同的日期格式。它们如下:

我检查了 AML 中的日志文件,但 AML 找不到本地时区。日志文件特别警告: [ModuleOutput] 1: In strptime(x, format, tz = tz) : [ModuleOutput] 无法识别当前时区 'C': [ModuleOutput] 请设置环境变量 'TZ' [ModuleOutput] [ModuleOutput ] 2:在 strptime(x, format, tz = tz) 中:未知时区'localtime'

我在这里提到了关于为 strptime 设置默认时区的另一个答案

R strptime/as.POSIXct 中的未知时区名称

我更改了代码以明确定义全局环境时间变量。

问题仍然存在 - 结果 AzureML 不会写出这些变量,而是将这些列写成空白。
(此代码在 R studio 中工作,我认为本地时间是从系统中获取的。)

在阅读了有关此问题的两篇博文后,Azure ML 似乎不支持某些日期时间格式:

http://blogs.msdn.com/b/andreasderuiter/archive/2015/02/03/troubleshooting-error-1000-rpackage-library-exception-failed-to-convert-robject-to-dataset-when-running- r-scripts-in-azure-ml.aspx

http://www.mikelanzetta.com/2015/01/data-cleaning-with-azureml-and-r-dates/

因此,我尝试在将其发送到输出流之前将其转换为 POSIXct,我的操作如下:tenantusage$Date1 = as.POSIXct(tenantusage$Date1, "%m/%d/%Y",tz = "EST5EDT "); 租户$Date2 = as.POSIXct(租户$Date2 , "%m/%d/%Y",tz = "EST5EDT");

但是遇到同样的问题。这些变量中的信息拒绝写入输出。Date1 和 Date2 列是空白的。

请指教!

谢谢

0 投票
2 回答
735 浏览

azure-machine-learning-studio - Azure ML 在训练线性或逻辑回归模型期间如何处理分类列?

Azure ML 在训练线性回归模型期间如何处理分类列?线性回归模型采用连续值。但是,即使我没有更改这些分类列中的任何内容,Azure ML 也可以毫无错误地训练线性回归和逻辑回归。所以我想知道 Azure ML 如何在后台处理分类列。谢谢!

0 投票
1 回答
69 浏览

machine-learning - Azure 机器学习:多类分类算法出错

我有训练集测试集(带有标题的 csv 文件),我必须在其中对每个值进行分类。X 列有 118.000 个 uniq 值,而 y1 列只有大约 13000 个,因此将有 13000 个类别。

在此处输入图像描述

从训练集中我只需要Xy1列来训练模型。我需要将 X 值分类为类别之一(从初始单词中找到正常值)。我尝试了所有多重算法,但未能尝试评估模型。

可视化分数模型返回:

在此处输入图像描述

可能是什么问题,它只是返回 -2 代码作为错误和此日志

UPD1:通过项目列模块下的元数据编辑器模块将 y1 列为分类,似乎没有任何改变