在数据并行训练上,我猜 GPU 实例对参数服务器不一定有效,因为参数服务器只保留值并且不运行任何计算,例如矩阵乘法。
因此,我认为以下Cloud ML Engine的示例配置(参数服务器使用 CPU,其他使用 GPU)具有良好的性价比:
trainingInput:
scaleTier: CUSTOM
masterType: standard_gpu
workerType: standard_gpu
parameterServerType: standard_cpu
workerCount: 3
parameterServerCount: 4
是对的吗?