azure-machine-learning-service - 获取自动生成的 OutputFileDatasetConfig 目标

Question

从类成员的OutputFileDatasetConfig文档中，destination

如果设置为 None，我们会将输出复制到路径 /dataset/{run-id}/{output-name} 下的 workspaceblobstore 数据存储区

鉴于我有这样的句柄OutputFileDatasetConfigset destinationto None，我如何在destination不自己重新计算默认值的情况下生成生成的，因为这可能会发生变化。

score 0 · Accepted Answer

如果您不想传递名称和路径，那么在这种情况下，运行详细信息应提供运行 ID，并且可以使用相同的路径创建路径。在理想情况下，您希望传递这些详细信息，如果未通过，推荐的方法是在中间步骤中使用它们，以便 SDK 可以为您处理，如 PythonScriptStep() 所示

from azureml.data import OutputFileDatasetConfig
dataprep_output = OutputFileDatasetConfig()
input_dataset = Dataset.get_by_name(workspace, 'raw_data')

dataprep_step = PythonScriptStep(
    name="prep_data",
    script_name="dataprep.py",
    compute_target=cluster,
    arguments=[input_dataset.as_named_input('raw_data').as_mount(), dataprep_output]
    )

score 0 · Accepted Answer

output = OutputFileDatasetConfig()
src = ScriptRunConfig(source_directory=path,
                  script='script.py',
                  compute_target=ct,
                  environment=env, 
                  arguments = ["--output_path", output])
                  
run = exp.submit(src, tags=tags)

###############INSIDE script.py

mount_point = os.path.dirname(args.output_path)
os.makedirs(mount_point, exist_ok=True)
print("mount_point : " + mount_point)

azure-machine-learning-service - 获取自动生成的 OutputFileDatasetConfig 目标

2 回答 2

Related

Reference