0

我们正在尝试创建一个 Azure ML Web 服务,该服务将接收 (.csv) 数据文件,进行一些处理,并返回两个相似的文件。最近添加到 azure ML 平台的 Python 支持非常有用,我们能够成功移植我们的代码,在实验模式下运行它并发布 Web 服务。

使用“批处理”API,我们现在能够将文件从 blob-storage 定向到服务并获得所需的输出。但是,小文件(几 KB)的运行时间比在本地机器上慢得多,更重要的是,对于稍大的输入数据文件(40MB),该过程似乎永远不会返回。在我的本地机器上处理同一文件的时间不到 1 分钟。

我的问题是你是否能看到我们做错了什么,或者是否有办法加快速度。这是实验的 DAG 表示:

实验的 DAG 表示

这是应该设置实验的方式吗?

4

1 回答 1

1

看起来问题出在处理输入表中的时间戳列。成功的解决方法是使用“元数据编辑器”块显式强制将列作为字符串值处理。最终模型现在看起来像这样:

最终模型

于 2015-03-15T09:05:59.840 回答