我们正在尝试创建一个 Azure ML Web 服务,该服务将接收 (.csv) 数据文件,进行一些处理,并返回两个相似的文件。最近添加到 azure ML 平台的 Python 支持非常有用,我们能够成功移植我们的代码,在实验模式下运行它并发布 Web 服务。
使用“批处理”API,我们现在能够将文件从 blob-storage 定向到服务并获得所需的输出。但是,小文件(几 KB)的运行时间比在本地机器上慢得多,更重要的是,对于稍大的输入数据文件(40MB),该过程似乎永远不会返回。在我的本地机器上处理同一文件的时间不到 1 分钟。
我的问题是你是否能看到我们做错了什么,或者是否有办法加快速度。这是实验的 DAG 表示:
这是应该设置实验的方式吗?