我已尝试按照 此处的文档说明进行操作(请参阅下面的代码),并且管道似乎运行正常。但是,当我在 ML Studio 上查看它时,它说管道已失败,因为容器不存在。
更糟糕的是,如果我登录到 Microsoft Azure 存储资源管理器,默认数据存储似乎以某种方式损坏并显示以下消息:The specified container does not exist.
. 在运行此之前,我能够将文件和文件夹添加到容器中。
我现在已经在两个单独的 ML 实例上进行了尝试。
有谁知道为什么?
我需要保留一些数据,所以我使用了一个OutputFileDatasetConfig
对象,并且我在 Azure ML 计算实例上运行下面的代码。
from azureml.core import Workspace, Dataset, Datastore
from azureml.core.compute.compute import ComputeTarget
import azureml.core
from azureml.core import Workspace, Experiment
from azureml.core.environment import Environment
from azureml.pipeline.core import Pipeline
from azureml.pipeline.steps import PythonScriptStep
from azureml.core.runconfig import RunConfiguration
from azureml.data import OutputFileDatasetConfig
interactive_auth = InteractiveLoginAuthentication(tenant_id=tenant_id)
workspace = Workspace(
subscription_id, resource_group, workspace_name, auth=interactive_auth)
output_datastore = Datastore(
workspace=workspace,
name=resource_manager.get_output_datastore())
output_config = OutputFileDatasetConfig(
destination=(output_datastore, 'DomainConfiguration'))
step1 = PythonScriptStep(
name="Script",
script_name="script.py",
compute_target=compute_target,
source_directory=source_directory,
arguments=[
"--output_configuration",
output_config.as_mount(),
],
allow_reuse=True,
runconfig=runconfig,
)
steps.append(step1)
pipeline = Pipeline(workspace=workspace, steps=steps)
pipeline.validate()
experiment = Experiment(workspace,'ExperimentName')
run = experiment.submit(pipeline, regenerate_outputs=False)