0

我有一个包含 727253 个标记图像的多标签数据集。最小的标签出现是 ~15,最大的出现在 200000 左右。模型训练在 ~18 小时前开始,现在失败并显示以下消息:

Unable to deploy model

cancel_lro() got an unexpected keyword argument 'min_nodes'

Pipeline d884756f14314048b7a036f5b07f0fd2 timeout.

自动生成的电子邮件包含以下内容:

Last error message

Please reference 116298312436989152 when reporting errors.

这已经知道了吗?我也选择了免费计划(1小时)来训练。我需要增加这个才能正常工作吗?有没有办法在训练期间查看状态来预测没有结果的大等待时间?(我尝试了 API,但没有百分比或其他类似的东西,仅适用于成品模型。)

提前致谢!

4

1 回答 1

0

这似乎是一个内部错误。主要问题似乎是管道超时。作为超时的一部分,它会尝试进行某种清理,而这种清理似乎有一个错误。

我的建议是重试管道。

于 2019-03-06T19:32:06.213 回答