我正在使用步进功能data science SDK using python
。我有一个每天运行的任务,并且在步骤函数的某些步骤中要访问的数据的路径每天都在变化,因为它具有日期参数。
如何在执行 step 函数并使用它时传递 date 参数,以便我可以每天自动访问新数据。
这是我添加到工作流中的一个步骤的示例。
etl_step = steps.GlueStartJobRunStep(
'Extract, Transform, Load',
parameters={"JobName": execution_input['GlueJobName'],
"Arguments":{
'--S3_SOURCE': data_source,
'--S3_DEST': 's3a://{}/{}/'.format(bucket, project_name),
'--TRAIN_KEY': train_prefix + '/',
'--VAL_KEY': val_prefix +'/'}
}
)
我想将日期变量添加到 S3_DEST。如果我使用 execution_input,则类型不是字符串,因此我无法将其连接为路径。