python - Azure ML 的 Python 支持——速度问题

Question

我们正在尝试创建一个 Azure ML Web 服务，该服务将接收 (.csv) 数据文件，进行一些处理，并返回两个相似的文件。最近添加到 azure ML 平台的 Python 支持非常有用，我们能够成功移植我们的代码，在实验模式下运行它并发布 Web 服务。

使用“批处理”API，我们现在能够将文件从 blob-storage 定向到服务并获得所需的输出。但是，小文件（几 KB）的运行时间比在本地机器上慢得多，更重要的是，对于稍大的输入数据文件（40MB），该过程似乎永远不会返回。在我的本地机器上处理同一文件的时间不到 1 分钟。

我的问题是你是否能看到我们做错了什么，或者是否有办法加快速度。这是实验的 DAG 表示：

实验的 DAG 表示

这是应该设置实验的方式吗？

score 1 · Accepted Answer

看起来问题出在处理输入表中的时间戳列。成功的解决方法是使用“元数据编辑器”块显式强制将列作为字符串值处理。最终模型现在看起来像这样：

最终模型

1 回答 1