从类成员的OutputFileDatasetConfig
文档中,destination
如果设置为 None,我们会将输出复制到路径 /dataset/{run-id}/{output-name} 下的 workspaceblobstore 数据存储区
鉴于我有这样的句柄OutputFileDatasetConfig
set destination
to None
,我如何在destination
不自己重新计算默认值的情况下生成生成的,因为这可能会发生变化。
从类成员的OutputFileDatasetConfig
文档中,destination
如果设置为 None,我们会将输出复制到路径 /dataset/{run-id}/{output-name} 下的 workspaceblobstore 数据存储区
鉴于我有这样的句柄OutputFileDatasetConfig
set destination
to None
,我如何在destination
不自己重新计算默认值的情况下生成生成的,因为这可能会发生变化。
如果您不想传递名称和路径,那么在这种情况下,运行详细信息应提供运行 ID,并且可以使用相同的路径创建路径。在理想情况下,您希望传递这些详细信息,如果未通过,推荐的方法是在中间步骤中使用它们,以便 SDK 可以为您处理,如 PythonScriptStep() 所示
from azureml.data import OutputFileDatasetConfig
dataprep_output = OutputFileDatasetConfig()
input_dataset = Dataset.get_by_name(workspace, 'raw_data')
dataprep_step = PythonScriptStep(
name="prep_data",
script_name="dataprep.py",
compute_target=cluster,
arguments=[input_dataset.as_named_input('raw_data').as_mount(), dataprep_output]
)
output = OutputFileDatasetConfig()
src = ScriptRunConfig(source_directory=path,
script='script.py',
compute_target=ct,
environment=env,
arguments = ["--output_path", output])
run = exp.submit(src, tags=tags)
###############INSIDE script.py
mount_point = os.path.dirname(args.output_path)
os.makedirs(mount_point, exist_ok=True)
print("mount_point : " + mount_point)