我有两个在 Google Cloud ML 上训练的模型版本,一个使用 2 个工作人员,一个只使用主节点。但是,在分布式模式下训练后召回率显着下降。我遵循了为大约 2000 个步骤提供的示例示例(工人和主人都参与了这些步骤)
只有大师
RECALL metrics: 0.352357320099
Accuracy over the validation set: 0.737576772753
硕士和2名工人
RECALL metrics: 0.0223325062035
Accuracy over the validation set: 0.770519262982