1

从类成员的OutputFileDatasetConfig文档中,destination

如果设置为 None,我们会将输出复制到路径 /dataset/{run-id}/{output-name} 下的 workspaceblobstore 数据存储区

鉴于我有这样的句柄OutputFileDatasetConfigset destinationto None,我如何在destination不自己重新计算默认值的情况下生成生成的,因为这可能会发生变化。

4

2 回答 2

0

如果您不想传递名称和路径,那么在这种情况下,运行详细信息应提供运行 ID,并且可以使用相同的路径创建路径。在理想情况下,您希望传递这些详细信息,如果未通过,推荐的方法是在中间步骤中使用它们,以便 SDK 可以为您处理,如 PythonScriptStep() 所示

from azureml.data import OutputFileDatasetConfig
dataprep_output = OutputFileDatasetConfig()
input_dataset = Dataset.get_by_name(workspace, 'raw_data')

dataprep_step = PythonScriptStep(
    name="prep_data",
    script_name="dataprep.py",
    compute_target=cluster,
    arguments=[input_dataset.as_named_input('raw_data').as_mount(), dataprep_output]
    )
于 2021-09-17T07:44:38.690 回答
0
output = OutputFileDatasetConfig()
src = ScriptRunConfig(source_directory=path,
                  script='script.py',
                  compute_target=ct,
                  environment=env, 
                  arguments = ["--output_path", output])
                  
run = exp.submit(src, tags=tags)

###############INSIDE script.py

mount_point = os.path.dirname(args.output_path)
os.makedirs(mount_point, exist_ok=True)
print("mount_point : " + mount_point)
于 2021-10-26T18:18:58.013 回答