8

我正在尝试向 gcloud ml-engine 提交工作。作为参考,该工作正在使用Google 提供的此示例

它第一次通过,但出现与此问题无关的错误,现在我在纠正错误后尝试重新发出命令:

gcloud ml-engine jobs submit training $JOB_NAME \
                                    --stream-logs \
                                    --runtime-version 1.0 \
                                    --job-dir $GCS_JOB_DIR \
                                    --module-name trainer.task \
                                    --package-path trainer/ \
                                    --region us-east1 \
                                    -- \
                                    --train-files $TRAIN_GCS_FILE \
                                    --eval-files $EVAL_GCS_FILE \
                                    --train-steps $TRAIN_STEPS

, 其中$JOB_NAME= census. 不幸的是,我似乎无法继续重新提交工作,除非我将每个新工作更改$JOB_NAMEcensus2, thencensus3等。

以下是我收到的错误:

ERROR: (gcloud.ml-engine.jobs.submit.training) Project [my-project-name]
is the subject of a conflict: Field: job.job_id Error: A job with this
id already exists.

这部分设计是否无法使用相同的工作名称重新提交,或者我遗漏了什么?

4

2 回答 2

3

就像 Chunck 刚才说的,只需尝试设置JOB_NAME为: JOB_NAME="census_$(date +%Y%m%d_%H%M%S)"

于 2017-04-04T13:57:45.033 回答
2

不确定这是否有帮助,但在Google 的 flowers 示例代码中,通过将日期和时间附加到作业 id 来避免错误,如第 22 行所示,例如,

declare -r JOB_ID="flowers_${USER}_$(date +%Y%m%d_%H%M%S)"
于 2017-03-30T20:12:53.290 回答